豆包视频生成大模型发布:支持多风格多比例的一致性多镜头生成

慧聪广电网 2024-09-25 09:11 来源：新浪科技

9月24日，火山引擎总裁谭待正式发布豆包视频生成大模型。其特性包括高效的DiT融合计算单元、全新设计的扩散模型训练方法和深度优化的Transformer结构，可以实现更充分地压缩编码视频与文本，支持一致性多镜头生成，能够大幅提升视频生成的泛化能力，谭待表示，豆包视频生成大模型支持多风格多比例的一致性多镜头生成，可应用在电商营销、动画教育、城市文旅、微剧本等领域。

此外，谭待表示，豆包大模型发布以来，使用量爆发式增长。豆包大模型日均tokens使用量超过1.3万亿，日均生成图片5000万张，日均处理语音85万小时。

免责声明:凡注明来源本网的所有作品，均为本网合法拥有版权或有权使用的作品，欢迎转载，注明出处。非本网作品均来自互联网，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。

推荐阅读