多尺度

Generative Powers of Ten是一种利用文本到图像模型生成多尺度一致内容的方法，能够实现对场景的极端语义缩放，例如从森林的广角景观视图到树枝上昆虫的微距拍摄。这种表示方式使我们能够渲染连续缩放视频，或者交互式地探索场景的不同尺度。我们通过一种联合多尺度扩散采样方法实现这一点，该方法鼓励在不同尺度之间保持一致性，同时保留每个单独采样过程的完整性。由于每个生成的尺度都由不同的文本提示指导，我们的方法能够实现比传统的超分辨率方法更深层次的缩放，后者可能难以在完全不同的尺度上创建新的上下文结构。我们在图像超分辨率和外部绘制的替代技术上对我们的方法进行了定性比较，并表明我们的方法在生成一致的多尺度内容方面最为有效。

35 0

多尺度生成模型视频处理

PROMPT - AI导航（prompt.cn）是一个专注于AI领域的网址导航站，致力于为用户提供便捷、高效、智能的在线导航服务。包括AI工具、AI绘画、AI视频、AI语音、AI写作、AI办公、AI设计、AI编程、AI聊天、AI提示词、机器学习、深度学习、自然语言处理、智能推荐等多个领域，共计收录10000+个优质网站。

收录申请免责声明关于我们

引领智能未来，探索无限AI应用

多尺度