当前位置:首页 > 科技资讯 > 正文

Project Genie:AI游戏世界的崛起与局限

在投身激动人心的游戏世界之前,先让我们共同思考一个问题:

你们是否也在翘首期盼《GTA 6》的到来?

或许,小雷的期待之情并不孤单。毕竟,《GTA 5》自发布以来已悄然走过十三载春秋,其魅力依旧未减。然而,正当我们沉浸在《GTA 6》的期待中时,大洋彼岸的谷歌DeepMind却悄然掀开了AI游戏世界的神秘面纱。

近日,谷歌在官方博客上宣布,已向部分用户开放体验Project Genie的原型版本,允许用户自由构建自己的可玩游戏世界。

Project Genie:AI游戏世界的崛起与局限 Genie AI游戏 世界模型 通用人工智能 第1张

这一消息不仅令《GTA》开发商R星的母公司Take-Two Interactive股价骤降10%,还导致在线游戏平台Roblox下跌超过12%,而游戏引擎制造商Unity更是惨跌21%。不过,国内厂商网易、腾讯则似乎并未受到太大影响。

借着这股热潮,小雷想和大家深入聊聊这个敢与《GTA 6》争锋的AI究竟是何方神圣,它的体验究竟如何,以及未来的游戏和虚拟世界将走向何方。

一张图,打造无限可能

在探讨技术之前,我们需先明确其震撼之处。

过去,我们制作游戏的流程是怎样的呢?你需要策划撰写剧本,美术绘制贴图,程序员编写代码,最后还需通过引擎进行渲染。

这一过程既漫长又耗资,即便是育碧、EA这样的游戏巨头,也需要持续数十年如一日地投资,而最终成果的效果却难以笃定。

但Project Genie的诞生彻底颠覆了这一逻辑。

Project Genie:AI游戏世界的崛起与局限 Genie AI游戏 世界模型 通用人工智能 第2张

其核心能力可简单概括为:生成即交互

你只需提供一张照片、手绘草图或简单的文字描述,它便能构建出世界和角色。

Project Genie:AI游戏世界的崛起与局限 Genie AI游戏 世界模型 通用人工智能 第3张

随后,你可以设定游戏的操作方式,如走路、骑行、飞行或驾驶。Project Genie会尝试理解物理规律,并直接生成一个可操作的世界:

Project Genie:AI游戏世界的崛起与局限 Genie AI游戏 世界模型 通用人工智能 第4张

没错,就像展示的那样。

一旦世界生成,你就可以直接在其中行动。在Project Genie里,你向前走,路径会实时生成;你转动视角,镜头也会同步调整。整个过程更像是探索一个持续展开的空间。

不满意?那就修改这个世界。

与其他AIGC内容类似,Project Genie生成的世界并非一次性产品。我们还可以在已有世界的基础上继续修改,比如将狗换成粉色气球兔子。

Project Genie:AI游戏世界的崛起与局限 Genie AI游戏 世界模型 通用人工智能 第5张

你甚至可以将现实世界中的图片丢进去,让Project Genie进行二次创作并让其动起来。完成后,还能直接导出为视频,便于保存或分享。

正因为功能如此强大,网友们迅速发挥创意。

在哔哩哔哩上,有UP主上传了一张主播许昊龙的经典照片。在Project Genie的处理下,照片中的炫狗变成了可操控的角色。你可以通过键盘方向键控制它在车库背景里跑动、跳跃,甚至与世界中的物品产生真实接触。

Project Genie:AI游戏世界的崛起与局限 Genie AI游戏 世界模型 通用人工智能 第6张

经典耄耋梗图?给我动起来!

Project Genie:AI游戏世界的崛起与局限 Genie AI游戏 世界模型 通用人工智能 第7张

给它一张《原神》的图,它也能自动生成风之翼的效果,让角色在空中自由驰骋,甚至模拟滑翔效果。

Project Genie:AI游戏世界的崛起与局限 Genie AI游戏 世界模型 通用人工智能 第8张

甚至在推特上,有人随手在纸上画了几个火柴人并标注了波浪线代表水。拍照上传后,Project Genie竟能将这个涂鸦变成一个关卡。火柴人真的能跳过波浪线,甚至不小心掉下去时还会模拟出坠落的效果。

Project Genie的可怕之处在于:

它无需代码和3D建模,仅凭看图就能理解地面、障碍物及角色的动作。

相比之下,国内游戏大厂虽然也没闲着,但方向略显局限。

网易的《逆水寒》天天吹嘘AI NPC的聊天能力;腾讯则忙着让AI在《王者荣耀》里虐菜。然而这些所谓的黑科技本质上还是在用AI赋能游戏,远未达到颠覆游戏创作流程的程度。

未来已来,但尚待成熟

有的读者可能会问:这东西如此神奇,是否意味着游戏公司都要倒闭了?

嗯...那倒也不至于。

尽管看似类似,《Project Genie》与传统游戏如《黑暗之魂》或《王者荣耀》有着本质区别。

传统游戏基于游戏引擎;你按跳跃键时,程序会依据重力参数计算跳跃高度;你扔出铁球时,程序会利用经典物理公式计算下落速度;你打开手电筒时,程序会模拟光照和物体材质来实时渲染效果。

而Project Genie则基于Genie 3、Nano Banana Pro和Gemini. 其核心Genie 3是一个采用自回归生成机制的帧生成模型。它会根据世界描述和用户操作逐帧生成环境状态而非播放预先生成的内容。

Project Genie:AI游戏世界的崛起与局限 Genie AI游戏 世界模型 通用人工智能 第9张

尽管帧生成技术已不新鲜但Genie 3通过学习谷歌庞大数据库里超过二十万小时的游戏视频记住了各种可能性并在玩家操作后生成对应画面。

问题在于Genie 3并不懂物理缺乏可靠逻辑计算而是通过不断猜测拓展世界这导致两个明显问题:

  • 首先是缺乏一致性. 尽管有玩家只能生成一分钟片段的限制但依然存在严重的记忆丢失。如上述许昊龙例子所示角色面部会发生巨大变化。
  • 其次是缺乏逻辑. 在传统游戏中撞到墙会被弹回但在Project Genie世界里角色可能会穿墙或突然消失等。