当前位置:首页 > 科技资讯 > 正文

DeepMind:AI新纪元:从游戏AI到AGI的突破

DeepMind:AI新纪元:从游戏AI到AGI的突破 DeepMind AGI 世界模型 思考型模型 第1张

从逼真AI视频到物理虚拟世界,再到在推理中主动调用工具自我修正的模型——这不是科幻小说,而是DeepMind最新AI工具的惊人能力。

8月13日消息,谷歌DeepMind首席执行官德米斯·哈萨比斯(Demis Hassabis)做客播客节目《Release Notes》,阐述了DeepMind最新技术突破背后的思路与战略布局,其中Genie 3的突破性进展成为核心亮点。

在这场深度对话中,他描绘了一个令人振奋又充满挑战的AI新纪元:从AlphaGo征服围棋,到Deep Think斩获数学奥赛金牌;从生成逼真世界的Genie 3,到即将诞生的“全能模型”,我们正站在通向AGI的关键转折点。然而,即便AI能创造一个完整的虚拟宇宙,它依然可能在国际象棋中违规行棋,这种“参差型智能”的悖论,揭示了人工智能最深层的秘密。

哈萨比斯指出,“思考型模型”是通向通用人工智能(AGI)的必经之路;DeepMind的终极目标是推出融合语言、多媒体、物理推理与生成能力的全能模型(Omni Model),其核心支撑正是世界模型的持续进化,最终实现全面且一致的智能表现,推动AGI安全落地。

此次访谈由谷歌AI Studio产品负责人洛根·基尔帕特里克(Logan Kilpatrick)主持,以下为对话内容实录:

思考型模型:从游戏AI到AGI的演进之路

基尔帕特里克:我们的嘉宾是谷歌DeepMind首席执行官德米斯·哈萨比斯。感谢你的到来,很高兴能一起聊聊过去几个月的发布成果和进展。

哈萨比斯:你好,很高兴来到这里。

基尔帕特里克:我想先谈谈这种前所未有的进展势头。我看到DeepMind近期不断推出各种成果,包括Deep Think、IMO金牌、Genie 3等,还有其他五十个项目。这种飞速推进的势头让人兴奋。你如何看待这种进展与势头?

哈萨比斯:这种情形令人振奋。过去几年,我们一直在积蓄力量,加快发布和研发的节奏,如今正看到这些努力的结果。我认为这是行业一个非常令人兴奋的时刻。几乎每天都有新成果面世,我们团队几乎每天都在发布新东西。

基尔帕特里克:那你是如何看待 Deep Think 的呢?该模型的一个版本已向Gemini应用的订阅用户开放。这种一边推进技术研发、一边让用户直接上手的方式非常美妙。那么,从 Deep Think 的角度来看,你会如何思考?

哈萨比斯:“思考型”模型的出现,可以看作是对我们早期游戏AI工作的一种回溯,比如AlphaGo和AlphaZero。自DeepMind成立以来,我们一直在研发“基于智能体的系统”。如今我们拥有功能强大的多模态模型,既能处理语言,也能理解和整合其他信息。

从机器人到通用助理,Genie 3的多维度潜力

基尔帕特里克:许多人看了Genie 3的演示后感到震撼。它确实和用游戏推动强化学习发展有关。回顾Genie 3,你觉得结果和当初的预期一致吗?

哈萨比斯:Genie 3汇集了多条研究路径与想法。我们想要构建的世界模型,不仅要理解物理结构、材料特性、液体流动,还要理解生物和人类的行为。

AI的能力鸿沟,强大生成力与低级错误并存

基尔帕特里克:这正好能回到我们之前谈到的“参差型智能”问题。我们最近宣布了DeepMind与Kaggle合作推出“游戏竞技场”,让模型在各种游戏中对战并接受测试。你怎么看?

哈萨比斯:这反映了一个更普遍的问题——如今的系统在很多方面都很强大:它们能从文本生成模拟世界,能理解视频,能解数学题、做科研。然而,用过这些聊天机器人的人都知道,它们的能力边界很容易被触碰到。

能力内化VS外部调用:经验驱动的决策

基尔帕特里克:我觉得我们应该现在就着手研究元认知或“元强化学习”。回到“思考趋势”和“游戏趋势”,我们现在似乎“工具”成了新的扩展维度。你觉得给模型配备物理模拟器作为工具会是未来的方向之一吗?

哈萨比斯:工具使用是AI系统最重要的能力之一。思考型系统的核心在于它能在思考过程中主动调用工具。

AGI的综合能力蓝图,语言、多媒体与物理推理一体化

基尔帕特里克:很多开发者现在都会问,模型正在改变人们构建应用的方式。你怎么看这种从“模型”到“系统”的转变?对开发者有什么建议?

哈萨比斯:模型的进化速度非常快。我建议开发者多思考:哪些工具对AI的能力最有价值?然后着手构建这些工具。