当前位置:首页 > 科技资讯 > 正文

AGI 即将到来:只差一到两个技术突破

AGI 即将到来:只差一到两个技术突破  技术突破 DeepMind Hassabis 第1张

2025年12月4日,Axios AI+峰会。在最后的对话中,Axios联合创始人Mike Allen与去年诺贝尔化学奖的获得者、Google DeepMind CEO Demis Hassabis展开了深入的探讨。

当被问及距离AGI(通用人工智能)还有多远时,Hassabis坦诚相告:

我们距离AGI,只差一到两个AlphaGo级别的技术突破。

此言一出,整个AI圈为之震动,因为这一预测具体而明确。然而,这并非凭空臆断,而是基于当前技术进展的理性推理。

关键的是,Hassabis还道出了AI竞赛的核心逻辑:并非比拼谁烧的钱多、谁的GPU多,而是看谁能将研究、工程、产品三者融会贯通。

第一节|AGI快来了?他为何如此断言

Hassabis给出的时间窗口是5到10年内实现AGI。这一判断并非仅仅基于模型参数规模,而是基于以下几个具体进展:

1. 从文本专家到多模态理解系统

Gemini最让Hassabis惊讶的,不是其编写代码或生成文字的能力,而是它竟然能看懂视频,并解读出动作背后的意图。

在测试Gemini时,他播放了电影《搏击俱乐部》的片段。主角在打斗前摘下戒指。Hassabis随口问道:

这个动作有何意义?

Gemini不仅描述了表面的动作,还给出了深度解读:这是抛弃身份、摆脱规则的象征,标志着角色从现实走向极端。Hassabis的评价是:震惊

因为这已经超越了模式识别,开始具备洞察能力。

2. 拥有自己的判断,不再一味迎合

Hassabis特别提到,Gemini做了一件小事,但意义重大。当你指出它错了时,它不会一味迎合,而是会温和地反驳你。

这不仅是简单的对错判断,更是模型在理解上下文、纠正偏差的同时,还能控制语气、平衡表达。Hassabis称赞Gemini的性格:简洁、冷静、自信且不会讨好。

这意味着模型开始摆脱聊天工具的定位,向稳定人格型系统迈进。

3. 从生成内容到打造产品

Gemini现在不仅能一键生成可玩的小游戏(以往需数周开发,现在数小时就能生成完整原型),还能生成前端网页。它不仅能写代码,还知道如何让网页既美观又实用。

这背后是模型对代码结构、设计逻辑、交互体验的整体理解。不仅是生成文字,而是能做出可以直接使用的东西。

当前模型已具备理解能力、判断能力和创造能力。因此,Hassabis说:我们非常接近了,只差一两个AlphaGo级别的技术突破。

第二节|但还不是AGI:差距何在?

尽管这些能力在不断提升,但Hassabis也承认:我们还未达到AGI的标准,当前模型仍存在明显短板。

如果说上一节讲的是它已能做什么,这一节就是它还不能做什么。

1. 不具备持续学习能力

当前大模型不能持续学习,它们只能用训练时的数据一次性学完。这意味着:它不会在使用过程中成长,不会因与用户互动变得更聪明,不像人类那样用经验改正错误。

在线学习和长期记忆系统,是通向AGI的关键突破之一。

2. 无法执行长期规划

尽管模型在单轮推理、代码生成方面越来越强,但它无法执行长链式推理,无法制定和执行一个长期目标。这不是能力不够,而是底层结构未设计为多步决策系统。

AGI需要能完成为期数天的科研任务,适时调整策略,分阶段达成目标。现阶段的模型更像是即时响应系统,而不是目标驱动系统。

3. 智能体系统仍不稳定

谈到Gemini的通用助手目标时,Hassabis强调:我们还不能把整个任务交给它们,并确信它们会完成。现在的智能体还不能在复杂环境中可靠执行多步骤任务。

智能体能否稳健运行,决定了AGI能否落地到实际场景中。

4. 缺乏跨对话的稳定记忆

尽管Gemini有“性格”,但它只在单次对话中保持一致,而非真正拥有个性记忆的智能体。真正的AGI要能:

  • 保持立场一致(前后不自我矛盾)
  • 记住用户长期偏好(记忆与决策协同)
  • 根据上下文调节行为,而非重新开始
AGI 即将到来:只差一到两个技术突破  技术突破 DeepMind Hassabis 第2张
AGI 即将到来:只差一到两个技术突破  技术突破 DeepMind Hassabis 第3张
这需要更底层的架构设计,比如长期记忆网络、目标保留机制,而不只是优化提示词。