豆包视频生成大模型发布:支持多风格多比例的一致性多镜头生成

慧聪广电网 2024-09-25 09:11 来源:新浪科技

9月24日,火山引擎总裁谭待正式发布豆包视频生成大模型。其特性包括高效的DiT融合计算单元、全新设计的扩散模型训练方法和深度优化的Transformer结构,可以实现更充分地压缩编码视频与文本,支持一致性多镜头生成,能够大幅提升视频生成的泛化能力,谭待表示,豆包视频生成大模型支持多风格多比例的一致性多镜头生成,可应用在电商营销、动画教育、城市文旅、微剧本等领域。

此外,谭待表示,豆包大模型发布以来,使用量爆发式增长。豆包大模型日均tokens使用量超过1.3万亿,日均生成图片5000万张,日均处理语音85万小时。

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。