当前位置:首页 > 科技资讯 > 正文

Sora 2震撼发布:AI视频生成新纪元初现

国庆假期期间,全球AI界被OpenAI发布的“重磅炸弹”震撼。新一代AI视频模型Sora 2及其配套应用Sora App的发布,瞬间点燃了全球创作者和TikTok卖家的热情。尽管需要邀请码才能使用,但社交平台上瞬间充满了寻求邀请码的信息。短短四天内,这款App便在美国区App Store免费榜中登顶,超越了ChatGPT、Google Gemini等头部AI产品,迅速成为海外创作者的新宠。

社交平台瞬间被AI生成的“同人宇宙”刷屏:动漫角色穿越现实街道,游戏角色在都市中穿行,甚至OpenAI CEO山姆·奥尔特曼(Sam Altman)也被网友“玩出花”。他出现在东北炕头吃饭、在阿里会议室讲“闭环”“赋能”,甚至化身外卖骑手穿梭于城市街头。奥尔特曼本人将Sora 2称为“创意领域的ChatGPT 3.5时刻”。从官方演示到用户实测,Sora 2在物理逻辑、画面连贯性、真实感和音画同步等方面实现了质的飞跃,被多家媒体誉为“将AI视频生成推向新高度”。

然而,DoNews在体验后认为:虽然Sora 2强大,但距离“现实不存在了”的预言,还是有一定距离。

01.创造力炸裂,细节仍存“AI感”

Sora App以Sora 2为技术基础,直接内置了对话、音效和背景音乐的自动生成能力,实现音频和视频同步生成。进入Sora App后,主页底部设有功能栏,从左到右依次为「视频推荐」「灵感广场」「生成器」「消息」「个人主页」。很多人将其称为“AI版抖音”,正是因为界面及首页推荐逻辑与之相似——App主页为垂直视频流,用户可上下滑动浏览其他用户发布的内容。

Sora 2震撼发布:AI视频生成新纪元初现 2 AI视频生成 ChatGPT 3.5 娱乐社交平台 第1张

其中,灵感广场用于展示热门作品。由于Sora App生成视频后,提示词会默认成为视频配文,因此热门视频的提示词可直接复制修改后使用。

Sora 2震撼发布:AI视频生成新纪元初现 2 AI视频生成 ChatGPT 3.5 娱乐社交平台 第2张

生成器是用户制作视频的核心功能区,有两点值得注意:一是不支持上传用户自制视频素材,仅能通过AI生成视频;二是不支持单独撰写短视频文案——用户输入的文案会默认作为生成视频的提示词。

生成视频时,有两种特色方式可选:一是图片生成视频,二是Cameo出镜秀。Cameo是每个账号对应的虚拟数字形象,相当于用户的“专属Sora身份标识”。创建Cameo需录制一段个人脸部视频,操作步骤类似支付宝、银行类App的视频认证,验证通过后即可用自己的虚拟形象生成并发布视频。此外,也可使用他人的虚拟数字形象,通过文生视频或图生视频功能创作,但前提是对方将形象设为公开。

DoNews以奥尔特曼的虚拟数字形象和一张图片生成了一段视频,提示词为:“@sama在图片场景里说集美们,耶斯莫拉。”在生成的视频中,Sora结合图片背景为奥尔特曼丰富了台词,台词的补充显示出AI联想的能力,与场景的配合较为自然。然而,并非每次生成都能一次成功。DoNews再次尝试生成奥尔特曼剥猕猴桃的视频时,剥猕猴桃的细节就出现了错误,有明显的AI痕迹。

整体来看,Sora 2在物理世界理解方面确实表现不俗,用户数字人的物理效果和唇型同步效果良好。但涉及到多元素的物体交互时,仍会出现多角色台词错位、物体交互bug的问题,保留了明显的“AI感”。

02.创意ChatGPT时刻未到,娱乐版抖音还差口气

OpenAI在官方声明中,将Sora 2定位为“最先进的视频和音频生成模型”,更明确对比:2024年2月发布的初代Sora是视频领域的“GPT-1时刻”,而Sora 2直接迈入了“GPT-3.5时刻”。从音画同步、人物ID一致性(如Cameo形象复用)到多镜头叙事的技术突破来看,Sora 2确实刷新了AI视频生成的上限。

“Sora 2生成的音频真实感、清晰度把之前的AI音效工具甩开好几条街。”小旭音乐创始人兼CEO、AIGC艺术家小旭的评价点出了Sora 2的核心优势——易用性。它把复杂的视频生成流程简化成“输入提示词+选形象”,尤其是Cameo功能,用户录几秒脸部视频就能克隆专属虚拟形象和声音。

但优势之外,硬伤同样明显。“目前生成的视频时长比较短,只有10秒钟。”此外,分辨率也不太行,App里没法调画质,默认只有480P或360P。在小旭看来,Sora 2是瞄准AI社交去的,并不是一个纯粹的AI工具。

用户车车体验后认为其娱乐性“远不如抖音”:“Sora上的内容更像‘自娱自乐’——每个人生成的视频都是围绕自己的虚拟形象或简单场景。”这种“娱乐性短板”,和Sora 2严格的限制挂钩。为规避版权、肖像权风险,它会直接拒绝生成多数真实名人、影视角色(比如前文提及《后宫甄嬛传》触发版权拦截),甚至普通人物形象的创作也有诸多约束。

综上,Sora 2无疑是一次技术飞跃。然而无论是从其有限的画质与时长、纯AI生成内容导致的同质化倾向还是技术上尚未克服的细节瑕疵来看它距离成为引发创意领域革命的“ChatGPT时刻”以及媲美抖音的娱乐平台仍差一口气。