【CCNS & ISBT 2024专稿】 丁文华:人工智能赋能数字创意发展
【慧聪广电网】2024年5月16日,“第32届中国数字广播电视与网络发展年会暨第27届国际广播电视技术讨论会(CCNS & ISBT 2024 )”在风景壮丽的湖北恩施市盛大召开。本次会议以“科技创新引领行业发展”为主题,围绕科技创新与广电高质量发展、媒体深度融合与全媒体传播、有线电视网络整合和5G一体化发展、超高清电视、高新视频、融媒体、元宇宙、人工智能、云计算、大数据、6G等新技术、新应用作报告,为中国广电行业发展赋能。
中国工程院院士丁文华
中国工程院院士丁文华先生在题为《人工智能赋能数字创意发展》的演讲中表示,数字创意产业涉及到计算机科学与技术、信息与通信工程、人工智能等众多学科,技术贯穿产业链端到端整个环节,包含了数字内容的生产、传播和呈现端到端全部环节的核心技术。在他看来,数字创意技术是实现超高清、元宇宙等典型媒体应用的重要支撑。
在本次会议上,丁文华院士详细介绍了数字创意中的数字对象创作体系,它主要由计算机图形和视觉效果引擎及平台技术、基于AI的元宇宙数字对象生成技术和基于大模型的AIGC生成技术组成。
计算机图形和视觉效果引擎及平台技术主要是由计算机图形(CG)技术和计算机视觉(CV)效果引擎组成。现在有众多的支持CG/CV的工具平台,可以实现AI + 知识工程/知识图谱,为生物引擎、化学引擎仿真技术实现提供可能。
基于AI的元宇宙数字对象生成技术主要是指构建数字环境的基本方法、构建数字人的基本方法和构建数字对象的技术支撑平台。比如在大规模数字环境构建中,利用AI在渲染方面增强精度,可达到亚厘米级精度。通过多角度照片替代全身扫描,“已有建模模型+AI” 逼近真人效果,“表情基 + 指定动作基”驱动以及逆向渲染 + 正向渲染 +交互,达成大模型具身交互能力。
在基于大模型的AIGC生成技术方面,他指出,AIGC改变数字内容生成方式。从2014由生成器和判别器组成,主要用于图像生成到2021年的利用“文字-图像”对训练而成,实现跨模态生成,AIGC的技术演进十分迅速。应用场景也从AI作画、AI创作视频到AI Hyper ConNECtion,可以实现从文本到情况,从乐谱到弹奏,从图文到视频等的多维度多场景应用。
丁文华最后指出,现阶段AIGC尚难以替代人类进行视频生产。比如Sora支持最长1分钟的视频生成,类似短视频,在通过多镜头反映视觉语义方面(如蒙太奇手法)仍有很大差距,尚不具备通过视频讲述复杂故事的能力,距离人类创作仍有较大距离。 同时,AIGC发展面临算力、数据、成本等诸多技术挑战,不可否认的是,AI大模型发展速度难以预估,未来充满想象空间。