Sora可以根据文本提示创建现实和想象的场景,在输入相应的文字指令后将其转换成高质量的最长60秒的视频内容,大大释放了视频创作的生产力。可以说,Sora让媒介技术惠及普通人的同时也在改写传媒行业的发展规则。
一、巨大颠覆:Sora技术的突破性进展
“文生视频”大模型Sora在技术上实现了两大突破:生成视频时长的加长以及世界模型的搭建。
(一)文生视频:视频时长完美覆盖短视频领域
相较于先前发布的其他多模态大模型,Sora最大的特点就是不仅能将文本语言转化为高质量的视频呈现,还能利用“Diffusion transformer”模型将前期用于训练的海量视频数据转化储存起来,当我们向Sora提供一个新任务时,AI就会从视频数据中提取出包含时间和空间信息的内容,让Sora根据这些信息生成新视频,极大提高了视频创作效率。较业界此前的平均视频生成时长为4秒,Sora将视频生成的时长一次性提升了15倍,最长时长可达60秒,使得其制作的视频直接覆盖了短视频的时长要求,向中视频领域进击。
(二)世界模型:建立世界完整认知
“世界模型”是Sora的重要标签。所谓世界模型就是对真实的物理世界进行建模,使得机器能够像人类一样,对世界产生一种较为全面且准确的认知。通过建构世界模型,Sora生成的视频更加地流畅,自然符合物理世界的逻辑,从而降低了视频模型的训练成本,提升了训练效率。比如Sora官方发布的“一位时尚女性走在街头”的视频中,人物“影子”的处理以及街道的镜面效果符合物理世界的现实认知,增加了视频的真实感。当然,我们也注意到Sora生成的视频也存在一些亟待完善的时空细节,相信随着模型的不断成熟,Sora的时代价值将更加凸显。
二、未来应用:Sora在传媒领域的美好展望
作为生成式AI模型的一颗“新星”,Sora的出现注定将引领科技潮流,给传媒及其相关行业带来深刻颠覆与变革,为数字化时代带来全新的可能性。
(一)秩序重建:推进“人机共生”时代
Sora不仅仅是简单的视频生成工具,更是通过大模型训练构建起了现实世界的模拟器,在此基础上现实与虚拟的界限将愈来愈不明确。专家指出,Sora是“数据驱动的物理引擎”,而这将会在元宇宙发展进程中起关键性作用,从而推动元宇宙进入下一个阶段。目前,Sora可以像《我的世界》游戏中渲染世界及其动态,控制玩家角色。这意味着通过Sora引擎,虚拟空间的全自动搭建正在逐步成为现实,“人机共生”的美好愿景正在徐徐展开。
(二)传媒赋能:拉动传媒行业智能转型
Sora作为AIGC的颠覆性力量,能够为传媒行业的生产实践带来深刻的变革。对传媒机构而言,不仅要在观念上积极拥抱人工智能,更要尽快探索,按照新技术的规律重构采编流程、运营模式和组织架构,培养能够操作驾驭人工智能的复合型传媒人才,利用人工智能技术拉动传媒行业智能化转型升级。
(三)提速增效:重构传媒行业内容生产
在短视频创作领域,Sora模型的应用有望降低短视频制作的综合成本,解决“重制作而轻创作”的共性问题,微短剧制作的重心未来有望回归高质量的剧本内容创作;在广告制作领域,广告公司通过Sora模型生成符合品牌调性的广告视频,显著减少拍摄和后期制作成本;在游戏与动画领域,使用So-ra模型能够直接生成游戏场景和角色动画,减少了3D模型和动画制作成本。而对于直接面向的影视行业,尽管Sora能够提供某些场景下的创意呈现,但却难以把握整个作品的情感价值,因而难以撼动人类创作的主体性地位。它的角色更多的是为创作赋能,这也在一定程度上抬高了影视行业的准入门槛。
三、潜在风险:Sora技术的伦理忧虑
每一种技术都是利弊同在的产物,我们在享受Sora带来的便利的同时,也要注意到其中潜在的伦理安全问题。
(一)深度伪造:传播虚假视频内容
首先,Sora的出现模糊了真实与虚拟的边界,使得技术持有者能够利用计算机深度学习技术实现画面、人物、声音的篡改,降低了深度伪造的成本,而这些难以甄别的视频极有可能被用于传播虚假新闻和违法犯罪。其次,Sora大模型通过文本就能够生成画面的技术若被别有用心之人利用,衍生出低俗暴力内容并进行传播,儿童、青少年将难以避免地接触到这些色情、暴力信息,不利于其身心健康发展。
(二)归属复杂:模糊版权与创作界定
Sora大模型在预训练的过程中广泛吸收了现有的视频数据,进行分析、处理、学习和储存,并在用户有文本指令时输出视频内容。但是使用人工智能模型生成的内容可能会涉及到版权问题,特别是在涉及到原创作品和知识产权的情况下,可能会引发版权纠纷。同时,Sora对于视频的创作能力模糊了创作的边界这一问题,同样亟待学界和业界讨论进一步明晰权责。
(三)职业焦虑:取代传统视频从业者功能
Sora将视频制作的权利下放到普通用户,人人都能够通过输入指令获得相应的视频呈现。传统视频制作从业者的职业身份由此发生“液化”,除了专业的视频行业从业者,越来越多的普通公民参与到视频创作、内容生产的过程中,给视频从业者带来职业焦虑。例如,在视频新闻的创作过程中,Sora能以更快的效率、更短的时间生成视频内容,在此情况下,传统视频行业者需要重新定位自身职业价值,利用人工智能服务于视频创作。
Sora的问世获得了社会各行业的瞩目,面对人工智能技术的不断发展创新,我们要积极地拥抱新技术为传媒行业乃至社会各个行业带来的结构升级与产业变革,推动社会朝着更加智能化、自主化的方向发展,让以Sora为代表的新一代人工智能能够为社会发展正向赋能。
(于晓风,山东大学新闻传播学院副教授,山东大学影视文化艺术传播研究中心执行主任;单译锐,山东大学新闻传播学院2023级硕士研究生)