W.A.L.T是一个基于transformer的实景视频生成方法,通过联合压缩图像和视频到一个统一的潜在空间,实现跨模态的训练和生成。它使用了窗注意力机制来提高内存和训练效率。该方法在多个视频和图像生成基准测试上取得了最先进的性能。
Genmo是一个智能创意平台,利用AI让用户轻松创造视频、3D模型、图像等创意作品,实现文字对话的可视化与虚拟世界的构建。
MagicAnimate 是一款使用扩散模型实现的时域一致的人体图像动画工具。它可以通过对人体图像进行扩散模型的运算,实现高质量、自然流畅的人体动画效果。MagicAnimate 具有高度的可控性和灵活性,可以通过微调参数来实现不同的动画效果。它适用于人体动画创作、虚拟角色设计等领域。
DreaMoving是一个基于扩散模型的可控制视频生成框架,用于生成高质量的定制人类舞蹈视频。通过给定目标身份和姿势序列,DreaMoving可以生成一个目标身份的视频,驱动姿势序列在任何地方跳舞。为此,我们提出了一个视频控制网络来进行运动控制,以及一个内容导引器来保留身份信息。该模型易于使用,并可适应大多数风格化扩散模型以生成多样化的结果。
Runway 是一个创意工具平台,提供视频编辑、图像生成、人工智能训练等功能。它可以帮助用户生成视频、编辑图像、训练自定义 AI 模型等。Runway 提供多种 AI 魔法工具,包括视频到视频、文本 / 图像转视频、删除背景和资产管理,最新的动态笔刷支持一抹图像变视频。用户可以根据自己的需求选择适合的工具进行创作。Runway 适用于广泛的创作场景,包括设计、视频制作、音乐、写作等。
Pika是一个视频制作平台,用户可以上传自己的创意想法,Pika会自动生成相关的视频。主要功能有:支持多种创意想法转视频,视频效果专业,操作简单易用。平台采用免费试用模式,定位面向创意者和视频爱好者。
png3D.com 使用了目前最先进的图像 AI 算法,将二维平面图片转换为 3D 图片,3D 感非常强,照片绘画变得栩栩如生!价格:请访问官网获取定价信息。
D-ID APP利用人工智能技术,可以通过上传单张图片生成说话的视频。支持上传自己的语音,对上传图片中的人物进行 Lip Sync。视频效果逼真,提供了三种版本:Lite 免费版本,Pro 每月$29,Advanced 每月$195.99。APP 在图像处理和视频生成方面做得很出色。
RenderNet是一款快速AI图像生成器,基于超快的GPU,运行最稳定的Diffusion模型。通过文本提示,可在几秒钟内生成非凡的AI图像。登录即可获取免费积分。
imagepipeline提供REST API服务,用户可以通过API调用Stable Diffusion等模型来生成AI图像,无需维护GPU服务器。主要功能包括Stable Diffusion图像生成、自定义模型上传、Lora和Controlnets管道组合等。优势是易用、性价比高,无需自建服务端。定价分月付费和企业定制两种。定位是AI创业公司和个人开发者。
Prompt Journey是一个在线平台,用户可以浏览和分享由全球创作者上传的AI生成的图像和提示。该平台展示了各种风格的AI图像,包括生物philic设计、埃及神话、未来主义时尚展示等,以及相应的提示标签。