【CCNS & ISBT 2024专稿】丁文华：人工智能赋能数字创意发展

慧聪广电网 2024-05-16 10:41 来源：慧聪广电网

【慧聪广电网】2024年5月16日，“第32届中国数字广播电视与网络发展年会暨第27届国际广播电视技术讨论会（CCNS & ISBT 2024 ）”在风景壮丽的湖北恩施市盛大召开。本次会议以“科技创新引领行业发展”为主题，围绕科技创新与广电高质量发展、媒体深度融合与全媒体传播、有线电视网络整合和5G一体化发展、超高清电视、高新视频、融媒体、元宇宙、人工智能、云计算、大数据、6G等新技术、新应用作报告，为中国广电行业发展赋能。

中国工程院院士丁文华

中国工程院院士丁文华先生在题为《人工智能赋能数字创意发展》的演讲中表示，数字创意产业涉及到计算机科学与技术、信息与通信工程、人工智能等众多学科，技术贯穿产业链端到端整个环节，包含了数字内容的生产、传播和呈现端到端全部环节的核心技术。在他看来，数字创意技术是实现超高清、元宇宙等典型媒体应用的重要支撑。

在本次会议上，丁文华院士详细介绍了数字创意中的数字对象创作体系，它主要由计算机图形和视觉效果引擎及平台技术、基于AI的元宇宙数字对象生成技术和基于大模型的AIGC生成技术组成。

计算机图形和视觉效果引擎及平台技术主要是由计算机图形（CG）技术和计算机视觉（CV）效果引擎组成。现在有众多的支持CG/CV的工具平台，可以实现AI + 知识工程/知识图谱，为生物引擎、化学引擎仿真技术实现提供可能。

基于AI的元宇宙数字对象生成技术主要是指构建数字环境的基本方法、构建数字人的基本方法和构建数字对象的技术支撑平台。比如在大规模数字环境构建中，利用AI在渲染方面增强精度，可达到亚厘米级精度。通过多角度照片替代全身扫描，“已有建模模型+AI” 逼近真人效果，“表情基 + 指定动作基”驱动以及逆向渲染 + 正向渲染 +交互，达成大模型具身交互能力。

在基于大模型的AIGC生成技术方面，他指出，AIGC改变数字内容生成方式。从2014由生成器和判别器组成，主要用于图像生成到2021年的利用“文字-图像”对训练而成，实现跨模态生成，AIGC的技术演进十分迅速。应用场景也从AI作画、AI创作视频到AI Hyper ConNECtion，可以实现从文本到情况，从乐谱到弹奏，从图文到视频等的多维度多场景应用。

丁文华最后指出，现阶段AIGC尚难以替代人类进行视频生产。比如Sora支持最长1分钟的视频生成，类似短视频，在通过多镜头反映视觉语义方面（如蒙太奇手法）仍有很大差距，尚不具备通过视频讲述复杂故事的能力，距离人类创作仍有较大距离。同时，AIGC发展面临算力、数据、成本等诸多技术挑战，不可否认的是，AI大模型发展速度难以预估，未来充满想象空间。