当前位置:首页 > 科技资讯 > 正文

AI先驱圆桌对话:通用智能的现状、分歧与未来演进

AI先驱圆桌对话:通用智能的现状、分歧与未来演进 通用人工智能 深度学习 技术预测 人机协作 第1张

2025年11月7日,在伦敦伊丽莎白女王工程奖颁奖典礼结束后,一场汇聚人工智能领域顶尖先驱的圆桌对话,正悄然改写全球对AI未来发展的认知框架。

六位与会者并非普通行业代表,而是塑造这波AI革命浪潮的核心人物:

Geoffrey Hinton、Yoshua Bengio、Yann LeCun:他们被誉为深度学习的三大奠基者;

李飞飞:ImageNet数据集发起人、空间智能研究开创者;

Bill Dally:GPU计算架构的总设计师;

黄仁勋:AI工业化进程的最大推动者。

这是一次极为罕见的思想碰撞与集体对话。

核心议题聚焦于一点:通用人工智能(AGI)是否真的已经来临?

无人提供标准定义,也无人宣告技术彻底成熟。但在持续30分钟的交流中,六位先驱从各自视角传递出同一信号:AGI不再遥不可及,它已开始在现实世界中发挥作用。

Hinton预言:20年内,机器将在辩论中战胜所有人类。

黄仁勋指出:我们今天就在运用AGI级别的智能处理实际工作。

李飞飞强调:在某些领域机器已超越人类,但进化方向未必是人类化。

LeCun则直言:当前大模型不等于真正智能,我们连像猫一样聪明的机器都尚未造出。

分歧背后,隐藏着一个共识:技术范式正在发生根本性转变。

第一节 | 四十年积累:AGI的演进之路

当主持人提问:你人生中那个顿悟时刻是什么?那个引领你走上AI之路的瞬间,六人依次分享了各自的起点。

这些故事跨越数十年,却拼接出一条清晰的时间线:今天的AGI,并非突变产物,而是四十年逐步演化的成果。

Yoshua Bengio回忆,他首次对AI产生浓厚兴趣,是在研究生时期读到Geoff Hinton的早期论文。那时,他突然顿悟:人类智能背后或许存在一套简洁原理,类似物理定律。

正是这一发现,驱使他投身神经网络研究。

几十年后,当ChatGPT问世,他经历第二次震撼:我们究竟在创造什么?我们构建了能理解语言、拥有目标的机器,但如果其目标与人类不一致,后果如何?

于是他彻底转向AI安全与伦理研究,将理解智能转变为约束智能。

Geoffrey Hinton的记忆更为久远。

1984年,我尝试让一个小模型预测句子中的下一个词,它能自主学会单词间关系。那是一个微型语言模型。当时仅有100个训练样本,但我已窥见未来雏形:只要模型能预测下一个词,它就能开始理解世界。

那便是后来所有大语言模型的原型,只是当时缺乏算力与数据。

他停顿后补充:我们耗费40年,才迎来今日成果。

Bill Dally经历了两次关键顿悟。

第一次在90年代末的斯坦福。他思考如何解决内存墙问题,即访问内存的能耗与时间成本远高于计算本身。他构思将计算组织成由数据流连接的内核,从而以更少内存访问完成更多运算。

此想法后来发展为流处理,最终演化为GPU计算。

第二次是2010年的一次早餐。我与吴恩达在斯坦福共进早餐,他提及Google使用1.6万个CPU训练神经网络,让机器从网络图像中识别猫。那一刻,Dally意识到,这不再是实验室幻想,而是一种可规模化的计算模式。他返回NVIDIA,与Brian Catanzaro用48个GPU复现实验。结果让他彻底确信:GPU正是深度学习的核心引擎。

我们必须为深度学习专门设计GPU,他说,那次早餐改变了NVIDIA的方向,也重塑了我的职业生涯。

李飞飞的顿悟源于另一维度:数据。

人类智能在成长初期被海量感官数据淹没,但机器缺乏此环境。

2006至2007年间,她从研究生过渡为年轻教授,尝试了贝叶斯、支持向量机、神经网络等多种算法,但机器仍无法泛化,难以识别新样本。

她与学生最终意识到:缺失的不是算法,而是数据。

于是他们决定做一件当时看似疯狂的事:三年内手工标注1500万张图片,创建ImageNet,涵盖2.2万个类别。该数据集后来成为AI视觉革命的基石,让机器首次获得看懂世界的能力。

她表示:大数据驱动机器学习,这是当今所有AI扩展定律(Scaling Law)的基础。

Yann LeCun是最早的同行者之一。

我本科时就被一个想法吸引:让机器自主学习,而非被动教导。1983年读研时,他首次读到Hinton的论文;两年后,两人在一次午餐相遇,发现思想共鸣。

我自觉太懒或太笨,无法手写智能规则。让机器自组织学习,这才是生命的本质方式。

有趣的是,他与Hinton在80年代末争论:监督学习与无监督学习孰为出路?后来ImageNet的成功令领域暂转向监督学习。但到2016、2017年,他们意识到必须回归自监督学习。这正是当今大语言模型的训练方式。

四十年后,他仍坚持:智能核心在于自我组织,而非指令。

最后,黄仁勋分享。

对我而言,最关键的时刻是意识到芯片设计与深度学习系统的底层逻辑相通。

他解释,自己是首代能用高层抽象和结构化工具设计芯片的工程师。2010年前后,当看到深度学习同样采用框架与结构化方法开发软件时,他突然领悟:这与芯片设计的思维模式高度相似。

或许我们能像扩展芯片设计那样,扩展软件能力。

后来,当多伦多、纽约、斯坦福的研究团队几乎同时联系NVIDIA请求算力支持时,他明白:AI正从理论迈向工程。一旦算法能在单GPU上并行运行,就能扩展至多GPU、多系统、多数据中心。余下仅是工程外推。

六个故事串联,勾勒出AI四十年的演化图谱。

Hinton播下算法种子,Bengio将其转化为科学问题,LeCun赋予其自组织能力,李飞飞为其注入视觉感知,Bill Dally加速其运行,黄仁勋将其锻造为产业引擎。

当然,他们的工作远比此复杂,彼此交织、相互启发,但这六人确实共同奠定了今日AI的基础。

今日的AGI,非突然诞生的天才,而是这群人四十年共同书写的历史进程。

第二节|时间线撕裂:AGI已来还是永不?

四十年前,他们各自踏上AI之路。四十年后,站在同一终点前,他们却眺见迥异的未来。

当主持人抛出问题:我们距离人类水平智能还有多远?

这是所有人无法回避、却从未共识的议题。

随后的几分钟,六人给出六种截然不同的答案。他们探讨的非模型进展或发布速度,而是真正意义上的智能机器——能理解、思考与行动的系统。

LeCun首先开口,直接否定问题前提。

这不会是一个事件。因为能力将在各领域逐步扩展。

或许未来五到十年,我们会在新范式提出上取得重大进展。然后进展会持续,但耗时比预期更长。

他的意图明确:勿等待奇点时刻,AGI是渐进而非突变。

李飞飞提出另一视角:问题不该是AI是否超越人类,而是哪些方面已超越。

机器的部分能力将超越人类智能,有些已然实现。我们中有多少人能识别2.2万物件?翻译百种语言?

她接着说:犹如飞机比鸟飞得更高,但方式截然不同。基于机器的智能将成就诸多强大之事,但人类智能在人类社会中始终占据关键地位。

她的核心是:超越已发生,但非复制或替代。

黄仁勋则全然不同。他未提具体年份,反而当场质疑问题本身。

我们已具备足够通用智能,可在未来几年将技术转化为大量对社会有益的应用。今天我们就在实践。

我认为这并不重要,因此这近乎学术议题。从此刻起,我们将应用此技术,技术会持续优化。

他提供的非预测,而是现实进度:非将来有用,而是现已启用。

Hinton的回答更具体:若你与机器辩论,它将总能胜出。我相信,此景将在20年内出现。

他语气平静,却信息量巨大。这不仅是预测,更是确认:我们正沿此路前行,仅速度问题。

Bill Dally提醒众人:或许问题本身有误。

我们的目标非构建AI以取代人类或更优,而是以AI增强人类。我们旨在补充人类擅长领域。

AI处理擅长事务,人类保留创造力、共情与协作。我们互补而非取代。在他看来,达到人类智能此说法已偏离方向。

Yoshua Bengio最后发言,提出最具争议观点。

我在此表示异议。我看不出任何理由,我们不能在某一时刻构建出近乎全能的人类事务机器。

他提供数据:AI规划能力过去六年呈指数增长。若趋势延续,五年内AI可达工程师水平能力。更关键的是,多家公司正让AI从事AI研究,设计下一代AI系统。这可能催生众多突破。

但他最后强调:我非断言必然发生,我们应保持不可知论,避免宏大声明,因未来存在多种可能。

六种回答,六种时间感知。

LeCun言渐进演化但比预期更久;李飞飞说部分能力已超越;黄仁勋称现在就在用;Hinton给20年预测;Bill Dally质疑问题本身;Bengio又道五年可达工程师水平却充满不确定性。

我们所见非明确路线,而是日益撕裂的时间认知。

对未来的判断,本质反映他们对智能本身理解的差异。

第三节 | 从语言到行动:智能的下一阶段

争论未来之际,他们更关注当下正发生的转变。

过去几年,AI进步集中于语言能力。ChatGPT、DeepSeek等大模型,正助全球用户答疑、撰写摘要与提供方案。

但在此对话中,几位顶级研究者不约而同指出:下一阶段,AI需从语言迈向行动。

✅ 李飞飞是首位指明方向者。

人类智能从不仅依赖语言。我们大脑天生处理空间,能感知、推理、移动与实操。这些是当前AI的薄弱环节。

她指出,现今最强语言模型若执行空间判断任务,结果甚差。这正是她近年研究重点:空间智能。

我们过于专注会说话的机器,却忽视世界是三维的,需身体、方向与动手能力。

✅ LeCun的态度更为清醒。

他在全程对话中反复强调:当前大语言模型范式距真正智能尚远。

我个人不信当前大语言模型范式可推至人类水平智能。我们尚无像猫一样聪明的机器人。我们仍缺重大元素。在他看来,AI进步非仅更多基础设施、数据或投资问题,而是一科学问题:我们如何向下一代AI迈进。

他一直主张方向是:让机器从环境中自主学习,而非依赖人类输入答案。如同婴儿,不靠提示词,而靠观察与试错。

我们不可能给孩子喂数亿对话数据集,但孩子仍学会语言,因他在环境中主动学习。

此即他所说的自监督学习,也是他认为突破当前瓶颈的关键方向。

✅ 黄仁勋将此问题拉回现实场景。

今日AI非仅对话工具,而是开始接手工作。它非更智能搜索引擎,而是能完成任务伙伴。

我们已见AI写代码、诊断疾病、处理财务。这非仅言语,而是在实际协助。

为描述此变,他提出新比喻:过去我们称软件为工具,现今AI是工厂。它实时生成智能,犹如电厂实时发电。我们需要数千亿美元投资这些工厂,以服务建基于智能之上的数万亿美元行业。

这意味着:我们不能再视AI为应答程序,而应视为持续工作、不断输出的生产系统。

我们所见变化是:AI正从说得好转向能做事。

从聊天窗口,走进真实流程;从被动反应,开启主动执行。这非仅功能增强,而是范式变革。

这也解释了为何他们谈论AGI时,不再争论参数规模,而探讨:

AI如何与人类协同工作?

它应处何位置?

它需具何等能力边界?

结语|非何时到来,而是正进行时

这场对话,无人给出AGI标准定义,无人宣告其正式诞生。但几乎每人皆在描述其存在方式。

黄仁勋说:AI工厂已开始运转。

Hinton说:20年内,它将赢下所有辩论。

李飞飞提醒:我们太关注其言语,却忽略其行动。

AGI非某日突然上线的产品,而是正渗透每个组织、每条流程、每个岗位的现实。

对话结束时,主持人言:一年后若再行此对话,世界将已不同。

或许,变革已然启动。

📮参考资料:

https://www.youtube.com/watch?v=0zXSrsKlm5A

https://www.ft.com/content/5f2f411c-3600-483b-bee8-4f06473ecdc0

https://www.theguardian.com/technology/2025/feb/04/ai-godfather-predicts-another-revolution-in-the-tech-in-next-five-years

来源:官方媒体/网络新闻

排版:Atlas

编辑:深思

主编: 图灵

--结束--