Sora来了，影视传媒业将发生什么变化？

慧聪广电网 2024-02-27 08:55 来源：媒意见

【慧聪广电网】作为OpenAI发布的首个AI文（图）生成视频模型，横空出世的Sora近日引爆话题量。它可以根据输入的文字提示，仅用寥寥数语就能生成效果逼真的60秒视频，这意味着，OpenAI继文本、图像之后，将其先进的AI技术进一步拓展到了视频领域。从业界到学界都认为，Sora将会深度改变视频相关领域——从影视、传媒到社交平台，内容生产将会发生巨变。

Sora有何本领

OpenAI在官网陆续公布了几十段长短不一的视频，均由Sora根据文字提示生成。

其中第一段视频的文字提示为：一位时尚女性走在充满温暖霓虹灯和动画城市标牌的东京街道上。她穿着黑色皮夹克、红色长裙和黑色靴子，拎着黑色钱包。她戴着太阳镜，涂着红色口红。她走路自信又随意。街道潮湿且反光，在彩色灯光的照射下形成镜面效果。许多行人走来走去。

该视频可以视为Sora的代表作。其展示的信息量极大，从主要人物到背景人物、远处的街景以及地面，看起来十分逼真，镜头切换也非常流畅自然。从全景画面截图可以看到，和主人公同时走动的路人、湿漉漉的地面、眼花缭乱的霓虹灯和招牌，再到特写镜头中女主脸上斑点、脖纹都清晰可见，显得非常真实，还有墨镜里的反射的街景，这些细节都没放过。

随着Sora发布更多的制作精美的作品，不少人感叹：人类都未必拍得出来！马斯克更是两次转发网友评论时写道：“AI增强的人类将创造出最好的作品。”“人类认赌服输。”

Sora还能够根据静态图像生成视频，扩展现有视频或填充缺失的帧。OpenAI说，Sora能深刻地理解语言，不仅理解用户文本提示，还理解所述事物在物理世界中的存在方式。“我们正在教授人工智能理解和模拟运动中的物理世界，目标是训练模型帮助人们解决需要与现实世界交互的问题。”

Sora将带来何种变化

根据OpenAI官方介绍，Sora使用Transformer架构，可根据文本指令创建现实且富有想象力的场景。360创始人周鸿祎对Sora给予了极高的评价，他在社交平台发文：Sora的诞生意味着AGI（通用人工智能）实现可能从10年缩短至一两年。在他看来，Sora只是小试牛刀，它展现的不仅仅是视频制作能力，而是大模型对真实世界有了理解和模拟之后，可能会带来的新的成果和突破。

一些分析人士认为，Sora再次凸显人工智能技术进步对现实生活和传统行业的深远影响，恐将颠覆现存影视产业。例如，Sora推出第二天，主营图像处理、视频制作软件的奥多比公司股价应声下跌超过7%。Sora横空出世让人工智能取代影视传媒行业这一威胁变得更迫近和真切。

相比ChatGPT，Sora有了质的飞跃，且当今视频时代，Sora作为图生视频的利器将助力传媒业降本增效，极大地扩大能力范围和能力边界，给传媒业带来的影响远远超过ChatGPT。从业界到学界，几乎是异口同声认为，Sora将会深度改变视频相关领域，从影视、传媒到社交平台，内容生产将会发生巨变。

Sora面临何种挑战

当然，Sora并非完美，毕竟才刚刚诞生。OpenAI在官网表示，目前Sora模型也有弱点：它可能难以准确模拟复杂场景的物理特性，并且可能无法理解因果关系的具体实例。例如，一个人可能会咬一口饼干，但之后，饼干可能没有咬痕。

同时，该模型还可能混淆提示的空间细节，比如在一个样片中，提示词为“考古学家在沙漠中发现了一把普通的塑料椅子，正小心翼翼地挖掘和除尘”，Sora生成的视频出现了椅子变形、自动行走等诡异的场景。另外，OpenAI还需要花更多精力检查、拦截违反使用政策的文本输入提示，例如极端暴力、色情内容、名人肖像等。

对于传媒从业者来说，则有更大的挑战值得思考：除了对视频内容生产的颠覆，或导致大量人员失业的社会不安的因素外，还有对新闻传播伦理的挑战，模糊了真实与虚拟的边界。

OpenAI在Sora技术报告的标题中写道，视频生成模型是“世界模拟器”。如果世界可以被模拟，那么真与假的边界何在？不少业内人士担心，Sora将为“深度伪造”（Deepfake）技术推波助澜。Sora不但会大规模应用于娱乐内容的生产和传播，同样也必然会给新闻生产带来巨大挑战，我们之前的新闻生产方式和流程会被颠覆，新闻的定义也会发生变化。

随着AI生成内容与现实之间的界限变得越来越模糊，如何确保内容的真实性和透明性成为了一个重要问题。此外，版权、隐私和数据安全等问题也需要得到妥善解决。社会必须面对这些挑战，通过制定相关政策、法律和伦理准则来确保技术的健康发展，同时保护个人和社会的利益不受侵害。

免责声明:凡注明来源本网的所有作品，均为本网合法拥有版权或有权使用的作品，欢迎转载，注明出处。非本网作品均来自互联网，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。