豆包视频生成大模型发布:支持多风格多比例的一致性多镜头生成
9月24日,火山引擎总裁谭待正式发布豆包视频生成大模型。其特性包括高效的DiT融合计算单元、全新设计的扩散模型训练方法和深度优化的Transformer结构,可以实现更充分地压缩编码视频与文本,支持一致性多镜头生成,能够大幅提升视频生成的泛化能力,谭待表示,豆包视频生成大模型支持多风格多比例的一致性多镜头生成,可应用在电商营销、动画教育、城市文旅、微剧本等领域。
此外,谭待表示,豆包大模型发布以来,使用量爆发式增长。豆包大模型日均tokens使用量超过1.3万亿,日均生成图片5000万张,日均处理语音85万小时。