Sora来了,影视传媒业将发生什么变化?

慧聪广电网 2024-02-27 08:55 来源:媒意见

【慧聪广电网】作为OpenAI发布的首个AI文(图)生成视频模型,横空出世的Sora近日引爆话题量。它可以根据输入的文字提示,仅用寥寥数语就能生成效果逼真的60秒视频,这意味着,OpenAI继文本、图像之后,将其先进的AI技术进一步拓展到了视频领域。从业界到学界都认为,Sora将会深度改变视频相关领域——从影视、传媒到社交平台,内容生产将会发生巨变。

Sora有何本领

OpenAI在官网陆续公布了几十段长短不一的视频,均由Sora根据文字提示生成。

其中第一段视频的文字提示为:一位时尚女性走在充满温暖霓虹灯和动画城市标牌的东京街道上。她穿着黑色皮夹克、红色长裙和黑色靴子,拎着黑色钱包。她戴着太阳镜,涂着红色口红。她走路自信又随意。街道潮湿且反光,在彩色灯光的照射下形成镜面效果。许多行人走来走去。

该视频可以视为Sora的代表作。其展示的信息量极大,从主要人物到背景人物、远处的街景以及地面,看起来十分逼真,镜头切换也非常流畅自然。从全景画面截图可以看到,和主人公同时走动的路人、湿漉漉的地面、眼花缭乱的霓虹灯和招牌,再到特写镜头中女主脸上斑点、脖纹都清晰可见,显得非常真实,还有墨镜里的反射的街景,这些细节都没放过。

随着Sora发布更多的制作精美的作品,不少人感叹:人类都未必拍得出来!马斯克更是两次转发网友评论时写道:“AI增强的人类将创造出最好的作品。”“人类认赌服输。”

Sora还能够根据静态图像生成视频,扩展现有视频或填充缺失的帧。OpenAI说,Sora能深刻地理解语言,不仅理解用户文本提示,还理解所述事物在物理世界中的存在方式。“我们正在教授人工智能理解和模拟运动中的物理世界,目标是训练模型帮助人们解决需要与现实世界交互的问题。”

Sora将带来何种变化

根据OpenAI官方介绍,Sora使用Transformer架构,可根据文本指令创建现实且富有想象力的场景。360创始人周鸿祎对Sora给予了极高的评价,他在社交平台发文:Sora的诞生意味着AGI(通用人工智能)实现可能从10年缩短至一两年。在他看来,Sora只是小试牛刀,它展现的不仅仅是视频制作能力,而是大模型对真实世界有了理解和模拟之后,可能会带来的新的成果和突破。

一些分析人士认为,Sora再次凸显人工智能技术进步对现实生活和传统行业的深远影响,恐将颠覆现存影视产业。例如,Sora推出第二天,主营图像处理、视频制作软件的奥多比公司股价应声下跌超过7%。Sora横空出世让人工智能取代影视传媒行业这一威胁变得更迫近和真切。

相比ChatGPT,Sora有了质的飞跃,且当今视频时代,Sora作为图生视频的利器将助力传媒业降本增效,极大地扩大能力范围和能力边界,给传媒业带来的影响远远超过ChatGPT。 从业界到学界,几乎是异口同声认为,Sora将会深度改变视频相关领域,从影视、传媒到社交平台,内容生产将会发生巨变。

Sora面临何种挑战

当然,Sora并非完美,毕竟才刚刚诞生。OpenAI在官网表示,目前Sora模型也有弱点:它可能难以准确模拟复杂场景的物理特性,并且可能无法理解因果关系的具体实例。例如,一个人可能会咬一口饼干,但之后,饼干可能没有咬痕。

同时,该模型还可能混淆提示的空间细节,比如在一个样片中,提示词为“考古学家在沙漠中发现了一把普通的塑料椅子,正小心翼翼地挖掘和除尘”,Sora生成的视频出现了椅子变形、自动行走等诡异的场景。另外,OpenAI还需要花更多精力检查、拦截违反使用政策的文本输入提示,例如极端暴力、色情内容、名人肖像等。

对于传媒从业者来说,则有更大的挑战值得思考:除了对视频内容生产的颠覆,或导致大量人员失业的社会不安的因素外,还有对新闻传播伦理的挑战,模糊了真实与虚拟的边界。

OpenAI在Sora技术报告的标题中写道,视频生成模型是“世界模拟器”。如果世界可以被模拟,那么真与假的边界何在?不少业内人士担心,Sora将为“深度伪造”(Deepfake)技术推波助澜。Sora不但会大规模应用于娱乐内容的生产和传播,同样也必然会给新闻生产带来巨大挑战,我们之前的新闻生产方式和流程会被颠覆,新闻的定义也会发生变化。

随着AI生成内容与现实之间的界限变得越来越模糊,如何确保内容的真实性和透明性成为了一个重要问题。此外,版权、隐私和数据安全等问题也需要得到妥善解决。社会必须面对这些挑战,通过制定相关政策、法律和伦理准则来确保技术的健康发展,同时保护个人和社会的利益不受侵害。

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。