视觉生成

Evaluating Text-to-Visual Generation with Image-to-Text Generation提出了一种新的评估指标VQAScore,能够更好地评估复杂的文本到视觉生成效果,并引入了GenAI-Bench基准测试集。VQAScore基于CLIP-FlanT5模型,能够在文本到图像/视频/3D生成评估中取得最佳性能,是一种强大的替代CLIPScore的方案。GenAI-Bench则提供了包含丰富组合语义的实际场景测试文本,可用于全面评估生成模型的性能。

68 0

免费试用基准测试文本生成视觉生成

MagicVideo-V2

MagicVideo-V2是一个集成了文本到图像模型、视频运动生成器、参考图像嵌入模块和帧插值模块的端到端视频生成管道。其架构设计使得MagicVideo-V2能够生成外观美观、高分辨率的视频，具有出色的保真度和平滑性。通过大规模用户评估，它展现出比Runway、Pika 1.0、Morph、Moon Valley和Stable Video Diffusion等领先的文本到视频系统更优越的性能。

46 0

国内精选文本到视频视觉生成视频生成

Fable Prism

Fable Prism 是一款基于人工智能的视觉生成设计工具，帮助用户使用自然语言描述生成插画、logo、产品模型等视觉效果。用户可以详细描述想要生成的视觉效果，包括颜色、风格、物体等，Fable Prism 会根据用户的输入生成独特且富有创意的选项。该平台目前处于抢先体验阶段，需要注册才能使用。

37 0

产品模型人工智能设计文本转图像营销素材

PROMPT - AI导航（prompt.cn）是一个专注于AI领域的网址导航站，致力于为用户提供便捷、高效、智能的在线导航服务。包括AI工具、AI绘画、AI视频、AI语音、AI写作、AI办公、AI设计、AI编程、AI聊天、AI提示词、机器学习、深度学习、自然语言处理、智能推荐等多个领域，共计收录10000+个优质网站。

收录申请免责声明关于我们

引领智能未来，探索无限AI应用

视觉生成