字节跳动正式进军AI视频生成领域,发布豆包视频生成大模型

AI资讯1周前发布 Prompt
1 0 0

字节跳动正式进军AI视频生成领域,发布豆包视频生成大模型

近日,字节跳动旗下火山引擎在深圳成功举办了一场AI创新巡展,正式宣告进军AI视频生成领域,并发布了豆包视频生成大模型的两款重要产品——豆包视频生成-PixelDance和豆包视频生成-Seaweed。这一举措标志着国内AI大模型领域在视频生成赛道上迎来了新的重要玩家。

在巡展现场,火山引擎总裁谭待亲自展示了这两款视频生成大模型的强大功能。无论是语义理解能力、多个主体运动的复杂交互画面,还是多镜头切换的内容一致性,豆包视频生成大模型均达到了业界领先水平。PixelDance和Seaweed两款模型分别能够生成5秒和10秒的视频,通过高效的DiT融合计算单元,实现了在大动态与运镜中的自由切换,拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力。

谭待表示,视频生成领域存在诸多难关亟待突破,但火山引擎凭借其指令遵循能力、运镜技术等多方面的优势,已经取得了显著进展。他强调,豆包视频生成大模型不仅关注生成视频的时长,更重视应用场景的多样性,致力于满足不同行业的需求。目前,豆包视频生成模型已经适配了电影、电视、电脑、手机等多种设备比例,广泛应用于电商营销、动画教育、城市文旅、微剧本等多个领域。

值得注意的是,豆包视频生成大模型的技术创新不仅体现在多镜头切换的一致性上,还通过深度优化的Transformer结构大幅提升了视频生成的泛化能力。这使得豆包视频生成模型能够生成自然连贯的多拍动作与多主体复杂交互,接近实拍效果。

此外,火山引擎还宣布了豆包大模型的其他重要进展。截至9月,豆包语言模型的日均tokens使用量已超过1.3万亿,相比5月首次发布时增长了十倍。多模态数据处理量也分别达到每天5000万张图片和85万小时语音。这一数据表明,豆包大模型的使用量正在急速增长,并得到了市场的广泛认可。

谭待还透露,豆包视频生成大模型并不打价格战,而是让价格回归合理。他强调,随着企业大规模应用,大模型支持更大的并发流量正成为行业发展的关键因素。火山引擎将继续致力于技术创新和产品优化,以满足不同用户的需求。

目前,新款豆包视频生成模型正在即梦AI内测版小范围测试,未来将逐步开放给所有用户。剪映和即梦AI市场负责人陈欣然表示,AI能够和创作者深度互动,共同创作,带来很多惊喜和启发。即梦AI希望成为用户最亲密和有智慧的创作伙伴,为创作者提供更多便捷和高效的创作工具。

随着科技的不断进步和AI技术的快速发展,AI视频生成领域正迎来前所未有的发展机遇。字节跳动凭借其强大的技术实力和市场影响力,正式进军AI视频生成领域,无疑将为整个行业带来新的活力和创新。未来,我们期待豆包视频生成大模型在更多领域发挥重要作用,为用户带来更加优质的视频创作体验。

© 版权声明

相关文章

暂无评论

暂无评论...