Sora 是 OpenAI 开发的文本到视频生成模型,能够根据文本描述生成长达1分钟的逼真图像序列。它具有理解和模拟物理世界运动的能力,目标是训练出帮助人们解决需要实物交互的问题的模...
Wild2Avatar是一个用于渲染被遮挡的野外单目视频中的人类外观的神经渲染方法。它可以在真实场景下渲染人类,即使障碍物可能会阻挡相机视野并导致部分遮挡。该方法通过将场景分解为三部分(遮挡物、人类和背景)来实现,并使用特定的目标函数强制分离人类与遮挡物和背景,以确保人类模型的完整性。
UniVG是一款统一多模态视频生成系统,能够处理多种视频生成任务,包括文本和图像模态。通过引入多条件交叉注意力和偏置高斯噪声,实现了高自由度和低自由度视频生成。在公共学术基准MSR-VTT上实现了最低的Fr'echet视频距离(FVD),超越了当前开源方法在人类评估上的表现,并与当前闭源方法Gen2不相上下。
W.A.L.T是一个基于transformer的实景视频生成方法,通过联合压缩图像和视频到一个统一的潜在空间,实现跨模态的训练和生成。它使用了窗注意力机制来提高内存和训练效率。该方法在多个视频和图像生成基准测试上取得了最先进的性能。
GPT-3 Playground是OpenAI的GPT-3 API的网络界面,可能是最早并最为人熟知的提示工程工具。它提供了一个简洁的界面,可以调整GPT-3的不同参数和行为。也可以访问不同大小和价格的GPT模型。他们提供免费的积分,但3个月后到期。
X·Face是一个视频换脸生成工具。它通过人工智能技术,可实现用户上传视频和图片后,将视频中的人脸替换为用户上传的目标人脸,生成带有新身份的视频。这项技术可用于娱乐、教学、商业等多种场景。该产品提供高清生成质量,输出MP4格式视频。用户只需简单几步,即可实现精准的面部识别和替换,无需专业知识和复杂操作。该产品定价合理,面向个人和企业用户。它的优势是使用简单,生成质量高,支持长视频生成。主要功能有人脸识别、人脸跟踪、照片驱动视频生成等。
Sora AI Video Generator是一个使用人工智能技术生成视频的在线平台。用户只需要输入文本描述,它就可以自动生成高质量的视频动画。该平台提供强大的创意工具,使用户无需专业技术就可以创作出精美的视频内容。关键功能包括:支持多种视觉风格选择,视频分辨率高达4K,支持添加背景音乐和文字,一键生成高质量视频等。适用于视频创作者、广告公司、游戏开发者等创意行业,以及个人用户的视频内容生产。