TrailBlazer 是一种基于扩散的视频生成模型,可以通过轨迹控制实现视频的定制。用户可以使用简单的边界框来引导视频中的主体,而无需进行额外的模型训练或在线优化。TrailBlazer ...
VideoDrafter 是一个内容一致的多场景视频生成框架。它利用大型语言模型(LLM)将输入提示转换为包含多场景脚本的综合脚本,脚本包括描述事件、前景 / 背景实体以及相机运动的提示。VideoDrafter 识别脚本中的共同实体,并要求 LLM 对每个实体进行详细描述。然后,将每个实体的描述输入到文本到图像模型中,以生成每个实体的参考图像。最后,通过考虑参考图像、事件描述和相机运动,通过扩散过程生成多场景视频,扩散模型将参考图像作为条件和对齐进行处理,以增强多场景视频的内容一致性。
SoraFlows是一个开源的WebUi视频生成平台。用户只需要输入文本描述,就可以通过Sora模型生成高质量的视频。该平台提供强大的定制化功能,支持多种画面和视角的组合,可用于营销、教育、娱乐等场景。主要优势是简单易用、支持中文,视频效果逼真流畅。目前免费使用,未来可能会推出付费高级功能。
BlipCut AI视频生成器可以通过文字 descriptions 在Discord上免费生成AI视频,无需任何限制。它拥有简洁的界面,用户只需要在Discord的指定频道输入命令,就可以变幻视频文本描述为真实逼真的视频。该工具可广泛应用于视频创作、社交媒体推广、游戏开发等领域,大大提升视频内容的生产效率。
Sora AI Video Generator是一款用于生成AI视频的工具。它可以根据提供的文本内容,自动合成出高质量的视频。该工具具有智能视频编辑、自动配乐、特效添加等功能,可以满足用户在影视制作、广告制作、社交媒体营销等领域的需求。定价方面,请访问官方网站了解详情。
DragNUWA是一款视频生成工具,能够通过直接操作背景或图像,将动作转化为摄像机运动或目标物体运动,生成对应的视频。DragNUWA 1.5基于稳定视频扩散技术,可根据特定路径使图像动起来。DragNUWA 1.0利用文字、图像和轨迹作为三个重要的控制因素,从语义、空间和时间上促进高度可控的视频生成。用户可通过git克隆仓库、下载预训练模型,并在桌面端进行图像拖拽生成动画。
Open-Sora-Plan是一个开源项目,旨在复现OpenAI的Sora(T2V模型),并构建关于Video-VQVAE(VideoGPT)+ DiT的知识。项目由北京大学-兔展AIGC联合实验室发起,目前资源有限,希望开源社区能够贡献力量。项目提供了训练代码,并欢迎Pull Request。