Boximator是一款由Jiawei Wang、Yuchen Zhang等人开发的智能视频合成工具。它利用先进的深度学习技术,通过添加文本提示和额外的盒子约束,生成丰富且可控制的视频运动。用户可以...
OMG(Once More Generalization)是一个开源的图像超分辨率工具,它利用深度学习技术来提高图像的分辨率。该项目旨在通过AI模型增强图像质量,使其在放大后仍然保持清晰和细腻。
Cerebras Systems宣布推出其第三代5纳米晶圆级引擎(WSE-3),这是一款专为训练业界最大AI模型而设计的芯片。WSE-3的性能是前代产品WSE-2的两倍,同时保持相同的功耗和价格。该芯片基于5纳米工艺,拥有4万亿晶体管,通过900,000个为AI优化的计算核心,提供125 petaflops的峰值AI性能。
AnimateLCM是一个使用深度学习生成动画视频的模型。它可以仅使用极少的采样步骤就生成高保真的动画视频。与直接在原始视频数据集上进行一致性学习不同,AnimateLCM采用了解耦的一致性学习策略,将图像生成先验知识和运动生成先验知识的萃取进行解耦,从而提高了训练效率并增强了生成的视觉质量。此外,AnimateLCM还可以与Stable Diffusion社区的插件模块配合使用,实现各种可控生成功能。AnimateLCM已经在基于图像的视频生成和基于布局的视频生成中验证了其性能。
四维时代人工智能技术开放平台通过深度学习算法,提供小物体建模、大场景建模、SLAM视觉追踪、人工智能视觉识别等数字化服务,实现数字世界与实体世界的高效连接。
Snap视频是一个视频优先的模型,通过延伸EDM框架系统地解决视频生成域中的运动保真度、视觉质量和可扩展性等挑战。该模型利用帧间的冗余信息,提出了一个可伸缩的transformer架构,将空间和时间维度作为一个高度压缩的1D潜在向量,从而有效地进行空间时间联合建模,合成时间连贯性强、运动复杂的视频。这种架构使模型可以高效训练,达到数十亿参数规模,在多项基准测试中取得最优效果。
云从科技拥有世界领先、自主可控的核心技术,在人脸识别、3D结构光、跨镜追踪ReID、3D人体重建、语音识别等领域形成从智能感知到认知决策的技术闭环。产品覆盖智慧金融、智慧治理、智慧商业、智慧出行等领域,为企业智能化转型提供支持。