Boximator - PROMPT

Boximator是一款由Jiawei Wang、Yuchen Zhang等人开发的智能视频合成工具。它利用先进的深度学习技术，通过添加文本提示和额外的盒子约束，生成丰富且可控制的视频运动。用户可以通过示例或自定义文本来创造独特的视频场景。Boximator与其他方法相比，使用了来自文本提示的附加盒子约束，提供更灵活的运动控制。

数据统计

相关导航

OMG

OMG（Once More Generalization）是一个开源的图像超分辨率工具，它利用深度学习技术来提高图像的分辨率。该项目旨在通过AI模型增强图像质量，使其在放大后仍然保持清晰和细腻。

WSE-3

Cerebras Systems宣布推出其第三代5纳米晶圆级引擎（WSE-3），这是一款专为训练业界最大AI模型而设计的芯片。WSE-3的性能是前代产品WSE-2的两倍，同时保持相同的功耗和价格。该芯片基于5纳米工艺，拥有4万亿晶体管，通过900,000个为AI优化的计算核心，提供125 petaflops的峰值AI性能。

AnimateLCM

AnimateLCM是一个使用深度学习生成动画视频的模型。它可以仅使用极少的采样步骤就生成高保真的动画视频。与直接在原始视频数据集上进行一致性学习不同,AnimateLCM采用了解耦的一致性学习策略,将图像生成先验知识和运动生成先验知识的萃取进行解耦,从而提高了训练效率并增强了生成的视觉质量。此外,AnimateLCM还可以与Stable Diffusion社区的插件模块配合使用,实现各种可控生成功能。AnimateLCM已经在基于图像的视频生成和基于布局的视频生成中验证了其性能。

四维时代人工智能技术开放平台

四维时代人工智能技术开放平台通过深度学习算法,提供小物体建模、大场景建模、SLAM视觉追踪、人工智能视觉识别等数字化服务,实现数字世界与实体世界的高效连接。

Snap Video

Snap视频是一个视频优先的模型,通过延伸EDM框架系统地解决视频生成域中的运动保真度、视觉质量和可扩展性等挑战。该模型利用帧间的冗余信息,提出了一个可伸缩的transformer架构,将空间和时间维度作为一个高度压缩的1D潜在向量,从而有效地进行空间时间联合建模,合成时间连贯性强、运动复杂的视频。这种架构使模型可以高效训练,达到数十亿参数规模,在多项基准测试中取得最优效果。

云从科技AI开放平台

云从科技拥有世界领先、自主可控的核心技术,在人脸识别、3D结构光、跨镜追踪ReID、3D人体重建、语音识别等领域形成从智能感知到认知决策的技术闭环。产品覆盖智慧金融、智慧治理、智慧商业、智慧出行等领域,为企业智能化转型提供支持。

暂无评论

暂无评论...

Boximator翻译站点

数据统计

相关导航

暂无评论

热门网址

热门标签