视频生成

W.A.L.T是一个基于transformer的实景视频生成方法,通过联合压缩图像和视频到一个统一的潜在空间,实现跨模态的训练和生成。它使用了窗注意力机制来提高内存和训练效率。该方法在多个视频和图像生成基准测试上取得了最先进的性能。

17 0

Ai图像转视频Ai漫画生成Ai生成写真变分扩散

StreamingT2V

StreamingT2V 是一种先进的自回归技术，可以创建具有丰富动态运动的长视频，没有任何停滞。它确保视频中的时间一致性，与描述性文本紧密对齐，并保持高帧级图像质量。

14 0

免费试用图像质量文本转视频时间一致性

Ctrl-Adapter

Ctrl-Adapter是一个专门为视频生成设计的Controlnet，提供图像和视频的精细控制功能，优化视频时间对齐，适配多种基础模型，具备视频编辑能力，显著提升视频生成效率和质量。

AI技术AI绘画免费试用内容创作

FreeInit

FreeInit是一个简单有效的方法,用于提高视频生成模型的时间一致性。它不需要额外的训练,也不引入可学习的参数,可以很容易地在任意视频生成模型的推理时集成使用。

文本到视频生成一致性视频生成

VLOGGER

VLOGGER是一种从单张人物输入图像生成文本和音频驱动的讲话人类视频的方法，它建立在最近生成扩散模型的成功基础上。我们的方法包括1)一个随机的人类到3D运动扩散模型，以及2)一个新颖的基于扩散的架构，通过时间和空间控制增强文本到图像模型。这种方法能够生成长度可变的高质量视频，并且通过对人类面部和身体的高级表达方式轻松可控。与以前的工作不同，我们的方法不需要为每个人训练，也不依赖于人脸检测和裁剪，生成完整的图像（而不仅仅是面部或嘴唇），并考虑到正确合成交流人类所需的广泛场景（例如可见的躯干或多样性主体身份）。

人体合成免费试用文本到视频视频生成

Drip Art AI

Drip Art AI是一个基于云的强大的Comfy UI后端，为开发者和专业用户提供最新的生成AI技术来生成令人惊叹的图像和视频。只需将您的工作流程和模型拖放到Drip中，我们将解决其他所有问题。

AI云平台图像生成视频生成

VideoGen

VideoGen是一款AI-Powered视频生成工具，可以在几秒钟内创建高质量视频。无需编辑，轻松自动化您的视频内容创作策略。

Text-to-Video Generation

AI内容创作AI动画制作AI视频生成VideoGen

该产品是一种用于评价文本到视频生成质量的工具。它引入了一种新的评价指标，即文本到视频评分（T2VScore）。该评分整合了两个关键标准：（1）文本-视频对齐，用于审查视频在呈现给定文本描述方面的忠实度；（2）视频质量，评估视频的整体制作水平。此外，为了评估提出的指标并促进未来对其的改进，该产品提供了TVGE数据集，收集了对2,543个文本到视频生成视频在这两个标准上的人类判断。对TVGE数据集的实验表明，提出的T2VScore在为文本到视频生成提供更好的评价指标方面表现出优越性。

文本到视频视频生成评价工具

SoraFlows

SoraFlows是一个开源的WebUi视频生成平台。用户只需要输入文本描述,就可以通过Sora模型生成高质量的视频。该平台提供强大的定制化功能,支持多种画面和视角的组合,可用于营销、教育、娱乐等场景。主要优势是简单易用、支持中文,视频效果逼真流畅。目前免费使用,未来可能会推出付费高级功能。

OpenAISora AI Video文本转视频视频生成

MorphStudio

Morph Studio是一个基于人工智能的文本到视频生成平台。它使用先进的算法,可以通过用户提供的文本提示,自动生成高质量的视频。Morph Studio使创作者可以将自己的创意快速实现成动态的视觉内容。它极大地降低了视频制作的门槛,用户无需具备专业技能和昂贵设备,就可以创造出独特的视频作品。此外,Morph Studio还提供了强大的自定义功能,用户可以调整生成视频的长度、分辨率、样式等参数,输出结果更符合自己的需求。总之,这是一款极具创新和颠覆性的人工智能产品。

人工智能国外精选文本到视频自动创作

DreaMoving

DreaMoving是一个基于扩散模型的可控制视频生成框架，用于生成高质量的定制人类舞蹈视频。通过给定目标身份和姿势序列，DreaMoving可以生成一个目标身份的视频，驱动姿势序列在任何地方跳舞。为此，我们提出了一个视频控制网络来进行运动控制，以及一个内容导引器来保留身份信息。该模型易于使用，并可适应大多数风格化扩散模型以生成多样化的结果。

Ai图像转视频内容导引器国内精选姿势序列

Motion-I2V

Motion-I2V是一种全新的框架，用于实现一致且可控的图像到视频生成（I2V）。与以往直接学习复杂图像到视频映射的方法不同，Motion-I2V将I2V分解为两个阶段，并采用显式运动建模。在第一阶段，我们提出了基于扩散的运动场预测器，专注于推断参考图像像素的轨迹。在第二阶段，我们提出了增强的运动增强时间注意力，以增强视频潜在扩散模型中有限的一维时间注意力。该模块可以在第一阶段预测的轨迹的指导下，有效地将参考图像特征传播到合成帧。与现有方法相比，Motion-I2V即使在存在大运动和视角变化的情况下，也能生成更一致的视频。通过为第一阶段训练稀疏轨迹控制网络，Motion-I2V可以支持用户精确控制运动轨迹和运动区域，具有稀疏轨迹和区域注释的控制能力。这比仅依赖文本说明更可控。此外，Motion-I2V的第二阶段自然地支持零样本视频到视频转换。定性和定量比较表明，Motion-I2V在一致且可控的图像到视频生成方面优于先前的方法。

图像生成视频生成运动建模

Show-1

Show-1是一种高效的文本到视频生成模型,它结合了像素级和潜变量级的扩散模型,既能生成与文本高度相关的视频,也能以较低的计算资源要求生成高质量的视频。它首先用像素级模型生成低分辨率的初步视频,然后使用潜变量模型将其上采样到高分辨率,从而结合两种模型的优势。相比纯潜变量模型,Show-1生成的视频文本关联更准确;相比纯像素模型,它的运算成本也更低。

扩散模型文本到视频条件生成视频生成

rembg.pics

rembg.pics是一款使用AI技术去除背景的工具。它可以帮助用户快速去除图片的背景，生成透明背景的图片。同时，它还提供视频生成功能，可以将去除背景后的图片生成为视频。rembg.pics操作简单，效果出色，是您处理图片背景的理想选择。

图片处理背景去除视频生成

MagicVideo-V2

MagicVideo-V2是一个集成了文本到图像模型、视频运动生成器、参考图像嵌入模块和帧插值模块的端到端视频生成管道。其架构设计使得MagicVideo-V2能够生成外观美观、高分辨率的视频，具有出色的保真度和平滑性。通过大规模用户评估，它展现出比Runway、Pika 1.0、Morph、Moon Valley和Stable Video Diffusion等领先的文本到视频系统更优越的性能。

国内精选文本到视频视觉生成视频生成

ai sora tech

AI SORA TECH是一款革命性的内容创作工具，利用先进的视频生成技术，将文本和图像转化为动态视频，并支持视频到视频的创作。它可以根据输入的文本或图像生成整个视频或延长现有视频的长度，满足各种视频制作需求。AI SORA TECH的功能丰富，操作简便，适用于专业人士和初学者。

内容创作图像到视频数字故事讲述文本到视频

W.A.L.T是一个基于transformer的实景视频生成方法,通过联合压缩图像和视频到一个统一的潜在空间,实现跨模态的训练和生成。它使用了窗注意力机制来提高内存和训练效率。该方法在多个视频和图像生成基准测试上取得了最先进的性能。

Ai图像转视频Ai漫画生成Ai生成写真变分扩散

Snowpixel

Snowpixel 是一个能够通过文字生成美丽图片、视频、音乐等作品的平台。用户可以使用自己的数据训练定制模型，为作品增添个性化的风格。Snowpixel 提供了视频生成、音乐生成、图片生成、音频生成、3D 对象生成和像素艺术模型等功能。用户可以在不同的场景下使用 Snowpixel，比如创作个性化作品、定制模型、生成音乐、生成视频等。Snowpixel 的定价灵活，用户可以按需选择付费。

图像生成文字转艺术视频生成音乐生成

W.A.L.T是一个基于transformer的实景视频生成方法,通过联合压缩图像和视频到一个统一的潜在空间,实现跨模态的训练和生成。它使用了窗注意力机制来提高内存和训练效率。该方法在多个视频和图像生成基准测试上取得了最先进的性能。

Ai图像转视频Ai漫画生成Ai生成写真变分扩散

Wookeys AI

Ultimate AI Assistant是一款综合AI助手，可帮助您简化任务，提高工作效率。它提供了生成文本、图像、代码、视频、音频等多种功能，具有高度定制化的AI解决方案。无论您是需要生成创意文案、设计图像、编写代码、制作视频还是创作音乐，Ultimate AI Assistant都能满足您的需求。该产品定价根据功能和使用量而定，详情请访问官方网站。

AI助手付费代码生成图像生成

NullFace

NullFace是一款利用人工智能技术生成匿名面部视频的工具。用户只需分享自己的想法，NullFace即可自动为其生成面部模糊的视频，使用户能够在社交媒体上分享内容而不必曝光个人面部。该工具可自动管理社交媒体渠道，生成观看和收入，无需持续创作内容或成为渠道的焦点。NullFace让用户能够轻松地在线赚取收入，解锁社交媒体的力量。

人工智能匿名社交媒体视频生成

SparseCtrl

SparseCtrl是为了增强对文本到视频生成的控制性而开发的，它能够灵活地结合稀疏信号进行结构控制，只需一个或少量输入。它包括一个额外的条件编码器来处理这些稀疏信号，同时不影响预训练的文本到视频模型。该方法兼容各种形式，包括素描、深度和RGB图像，为视频生成提供更实用的控制，并推动故事板、深度渲染、关键帧动画和插值等应用。大量实验证明了SparseCtrl在原始和个性化文本到视频生成器上的泛化能力。

文本到视频深度渲染稀疏控制视频生成

Sora视频生成器

Sora视频生成器是一个可以通过文本生成高质量AI视频的在线网站。用户只需要输入想要生成视频的文本描述,它就可以使用OpenAI的Sora AI模型,转换成逼真的视频。网站还提供了丰富的视频样例,详细的使用指南和定价方案等。

OpenAI文本转换视频生成

W.A.L.T是一个基于transformer的实景视频生成方法,通过联合压缩图像和视频到一个统一的潜在空间,实现跨模态的训练和生成。它使用了窗注意力机制来提高内存和训练效率。该方法在多个视频和图像生成基准测试上取得了最先进的性能。

Ai图像转视频Ai漫画生成Ai生成写真变分扩散

AI STUDIOS

AI STUDIOS是一款基于AI技术的视频生成工具，能够将文本转化为视频，生成具有逼真感的AI化身，节省视频制作时间和成本。用户只需上传PPT文件，即可自动创建高质量视频，支持自定义AI化身，提供多种模板和字幕生成功能。AI STUDIOS适用于多个领域，如商业、教育、媒体等，是一款高效、易用、可定制的视频生成工具。

AI化身字幕生成文本转化视频生成

VIGGLE

VIGGLE是一款基于JST-1视频-3D基础模型的可控视频生成工具。它可以让任何角色按照您的要求移动。JST-1是第一个具有实际物理理解能力的视频-3D基础模型。VIGGLE的优势在于其强大的视频生成和控制能力,可以根据用户需求生成各种动作和情节的视频。它定位于视频创作者、动画师和内容创作者等专业人群,帮助他们更高效地制作视频内容。目前VIGGLE处于测试阶段,未来可能会推出付费订阅版本。

9 0

AI动画制作人工智能免费试用影视特效

CustomVideo

CustomVideo是一个新颖的框架，旨在生成在多个主题引导下保持身份的视频。该产品首先鼓励多个主题的共同出现，然后通过基本的文本到视频扩散模型设计了一个简单而有效的注意力控制策略，以在扩散模型的潜在空间中解开不同的主题。此外，该产品还通过从给定的参考图像中分割对象并为注意力学习提供相应的对象掩码，帮助模型专注于特定的对象区域。同时，他们还收集了一个多主题文本到视频生成数据集作为全面的基准，其中包括69个个体主题和57个有意义的对。大量的定性、定量和用户研究结果表明，与先前的最先进方法相比，我们的方法具有显著优势。

9 0

多主题文本定制视频生成

Sora

Sora是一个基于大规模训练的文本控制视频生成扩散模型。它能够生成长达1分钟的高清视频,涵盖广泛的视觉数据类型和分辨率。Sora通过在视频和图像的压缩潜在空间中训练,将其分解为时空位置补丁,实现了可扩展的视频生成。Sora还展现出一些模拟物理世界和数字世界的能力,如三维一致性和交互,揭示了继续扩大视频生成模型规模来发展高能力模拟器的前景。

9 0

全球热门变化过程模拟扩散模型文本控制

VideoCrafter

VideoCrafter是一个开源的视频生成和编辑工具箱，用于制作视频内容。它目前包括Text2Video和Image2Video模型。Text2Video模型用于生成通用的文本到视频的转换，Image2Video模型用于生成通用的图像到视频的转换。详情请访问官方网站。

AI视频编辑开源工具视频生成

Stable

Stable Video Diffusion是由Stability AI开发的一款基于AI的视频生成模型。它可以将静态图像转化为视频，为AI驱动的内容创作开辟了新的可能性。该模型适用于广告、教育、娱乐等各个领域，自动化和增强视频制作，提供更大的创造性表达和效率。

Stability ai video generater

创意工具视频生成

Stability AI视频生成器是一款基于人工智能的在线视频生成工具，具有强大的功能和优势。用户可以通过该工具快速创建高质量的视频内容，无需专业技能和复杂的软件。

人工智能在线工具视频生成

Assistive Video

Assistive Video是一款生成视频平台，通过简单地输入您想要看到的内容，将您的想法转化为视频。您还可以上传照片并观看其栩栩如生。Assistive Video目前处于α测试阶段。每次文本转视频生成需要两个积分，图像转视频生成需要一个积分。一旦您用完了每月的计划积分，您可以进行额外的一次性交易购买更多积分。

人工智能国外精选视觉内容视频生成

AnimateLCM

AnimateLCM是一个使用深度学习生成动画视频的模型。它可以仅使用极少的采样步骤就生成高保真的动画视频。与直接在原始视频数据集上进行一致性学习不同,AnimateLCM采用了解耦的一致性学习策略,将图像生成先验知识和运动生成先验知识的萃取进行解耦,从而提高了训练效率并增强了生成的视觉质量。此外,AnimateLCM还可以与Stable Diffusion社区的插件模块配合使用,实现各种可控生成功能。AnimateLCM已经在基于图像的视频生成和基于布局的视频生成中验证了其性能。

AI动画制作GAN控制生成深度学习

sora cand

Sora AI Video Generator是一款用于生成AI视频的工具。它可以根据提供的文本内容，自动合成出高质量的视频。该工具具有智能视频编辑、自动配乐、特效添加等功能，可以满足用户在影视制作、广告制作、社交媒体营销等领域的需求。定价方面，请访问官方网站了解详情。

Stable Video diffusion

AI视频编辑智能编辑视频生成

stable video diffusion是一个基于AI的视频生成平台。用户可以通过文本或图像,将概念转化为引人入胜的视频。平台采用了最先进的深度学习技术,可以高质量生成各类视频内容,包括商业宣传视频、教学视频、演示视频等。优势是生成速度快,质量高,使用简单方便。定价采用创建视频数量的订阅模式。定位面向需要频繁生成高质量视频的企业客户。

全球热门深度学习视频生成

SoraPrompt

SoraPrompt是一种AI模型，可以根据文本指令创建逼真且富有想象力的场景。它利用Sora技术生成视频查询摘要，用于高效的内容分析。SoraPrompt基于最新的openai技术，可以生成各种类型的视频，如水族馆、纽约市、后退慢跑者、篮球爆炸、大溪地等。用户可以根据自己的兴趣和想法与SoraPrompt互动。

人工智能内容分析视频生成

DynamiCrafter_1024

DynamiCrafter是一种文生视频模型,能够根据输入的图像和文本生成约2秒长的动态视频。这个模型经过训练,可以生成分辨率为576x1024的高分辨率视频。主要优势是能够捕捉输入图像和文本描述的动态效果,生成逼真的短视频内容。适用于视频制作、动画创作等场景,为内容创作者提供高效的生产力工具。该模型目前处于研究阶段,仅供个人和研究用途使用。

AI动画制作人工智能免费试用内容创作

MuseV

MuseV是一个基于扩散模型的虚拟人视频生成框架,支持无限长度视频生成,采用了新颖的视觉条件并行去噪方案。它提供了预训练的虚拟人视频生成模型,支持Image2Video、Text2Image2Video、Video2Video等功能,兼容Stable Diffusion生态系统,包括基础模型、LoRA、ControlNet等。它支持多参考图像技术,如IPAdapter、ReferenceOnly、ReferenceNet、IPAdapterFaceID等。MuseV的优势在于可生成高保真无限长度视频,定位于视频生成领域。

优质新品免费试用扩散模型无限长度生成

GenAI Courses

Generative AI Courses是一家提供AI学习课程的在线平台。通过课程学习，用户可以掌握GenAI、AI、机器学习、深度学习、chatGPT、DALLE、图像生成、视频生成、文本生成等技术，并了解2024年AI领域的最新发展。

AI学习付费图像生成文本生成

Elai io

Elai.io是您的一站式自动化AI视频生成平台。通过Elai，您可以在几分钟内使用多样化的数字化人物形象从文本生成视频，无需摄像机、摄影棚和绿幕。Elai具备强大的功能，让您能够自定义AI视频演示，支持多种语言，使用PPT生成视频，提供模板和自动翻译功能，实现声音克隆和AI故事板等。Elai适用于各种应用场景，如解说视频、提升有机流量、人力资源入职培训、电子学习、电子商务、企业沟通、房地产、AI配音、AI新闻生成和卡通形象等。定价根据不同产品选项而定。

AI动画制作PPT转视频场景模板数字化人物形象

VideoGPT

Video GPT是一个基于人工智能的视频生成模型，它可以根据用户的输入生成各种类型的视频。它具有高度的灵活性和创造力，可以生成真实和逼真的视频内容。Video GPT的优势在于其强大的语言理解和视频生成能力，用户可以通过简单的文本输入，快速生成符合需求的视频。Video GPT的定价根据使用情况而定，提供灵活的付费方案。

产品广告人工智能视频生成

Finalframe

Finalframe是一个基于AI的视频剪辑工具。它支持将文本转化为视频,用户只需要输入文字描述,Finalframe就可以自动生成视频素材。该工具还提供了一个非常直观方便的剪辑界面,用户可以通过拖拽、添加、删除等操作,快速剪辑生成想要的视频作品。Finalframe可以大大简化视频制作流程,使用户无需学习专业编辑软件就可以轻松获得高质量的创意视频。

文本转视频视频剪辑视频生成

ApolloAI

ApolloAI是一款人工智能平台，提供AI图像、视频、音乐、语音合成等功能。用户可以通过文本或图片输入生成多种类型的内容，具备商业使用权。定价灵活，提供订阅和一次性购买两种模式。

人工智能免费试用图像生成视频生成

Kandinsky Deforum

Kandinsky Deforum是一种基于Kandinsky扩展和Deforum特性的文本到图像生成模型。该模型可以将文本转换为视频，具有高效、快速、准确的特点。其核心方法包括生成参考帧、对前一帧进行小变换、通过图像到图像方法对结果图像进行扩散处理。Kandinsky Deforum的优势在于可以生成高质量的视频，同时具有良好的可扩展性和灵活性。该产品的定位是为用户提供一种高效、快速、准确的文本到图像生成模型。

DeforumKandinsky文本到图像视频生成

QuickVideo

QuickVideo是一款先进的AI视频生成工具，简化了视频制作流程。使用AI人物形象和配音，快速创建专业级别的工作室品质视频。它包括文本到视频生成、视频个性化、对话式视频机器人等功能。无需相机，只需文本即可制作精美视频。

AI视频编辑工作室品质视频生成

VideoDrafter

VideoDrafter 是一个内容一致的多场景视频生成框架。它利用大型语言模型（LLM）将输入提示转换为包含多场景脚本的综合脚本，脚本包括描述事件、前景 / 背景实体以及相机运动的提示。VideoDrafter 识别脚本中的共同实体，并要求 LLM 对每个实体进行详细描述。然后，将每个实体的描述输入到文本到图像模型中，以生成每个实体的参考图像。最后，通过考虑参考图像、事件描述和相机运动，通过扩散过程生成多场景视频，扩散模型将参考图像作为条件和对齐进行处理，以增强多场景视频的内容一致性。

内容一致大型语言模型视频生成

VideoCrafter2

VideoCrafter2是一个视频生成AI模型,能够根据文本描述生成高质量、流畅的视频。它通过克服数据局限,实现了高质量视频生成的目标。该模型可以生成照片级质量的视频,支持精细的运动控制和概念组合。用户只需要提供文本描述,VideoCrafter2就可以自动生成剧本级别的视频作品,可用于视频创作、动画制作等领域。

Anything in Any Scene

创意工具深度学习视频生成

Anything in Any Scene是一个用于在现有动态视频中无缝插入任何物体的通用框架,强调物理真实性。该框架包含三个关键过程:1) 将真实物体与给定场景视频相结合,确保几何真实性;2) 估计天空和环境光照分布,模拟逼真阴影,增强光照真实性;3) 采用风格迁移网络,提高最终视频输出的逼真度。该框架能生成具有高度几何真实性、光照真实性和逼真度的模拟视频。

物体插入视频生成风格迁移

X·Face

X·Face是一个视频换脸生成工具。它通过人工智能技术,可实现用户上传视频和图片后,将视频中的人脸替换为用户上传的目标人脸,生成带有新身份的视频。这项技术可用于娱乐、教学、商业等多种场景。该产品提供高清生成质量,输出MP4格式视频。用户只需简单几步,即可实现精准的面部识别和替换,无需专业知识和复杂操作。该产品定价合理,面向个人和企业用户。它的优势是使用简单,生成质量高,支持长视频生成。主要功能有人脸识别、人脸跟踪、照片驱动视频生成等。

Ai换脸国内精选视频创作视频生成

SoraWebui

SoraWebui是一个开源的基于OpenAI Sora模型的文本转视频平台。它提供了一个简单易用的界面,用户只需要输入文本就可以一键生成视频。平台开源免费,支持一键部署。SoraWebui的优点是开源免费、使用简单、部署容易。它可以帮助用户快速便捷地将文本内容转化为视频,节省视频制作时间和成本。