当前位置:首页 > 科技资讯 > 正文

AGI落地瓶颈:持续学习能力的缺失与未来展望

神译局,36氪旗下编译团队,聚焦科技、商业、职场与生活,深度解析海外新科技、新观点与新趋势。

编者注:一位资深AI实践者,基于超过百小时的实战经验,揭示了阻碍AGI(通用人工智能)发展的最大障碍——模型缺乏人类的持续学习能力。通过深入剖析“学萨克斯”的悖论与数据瓶颈,作者预测短期变革有限,但未来十年内智能爆发的可能性急剧增加,为火热的讨论带来冷静思考。本文为编译作品。

“事物的发展总是慢于你的预期,然后突然加速。” ——鲁迪格·多恩布什

在我的播客中,关于AGI实现时间表的争论从未停歇。有嘉宾认为还需20年,也有人坚信只需2年。

以下是2025年6月我的一些思考。

持续学习的困境

常有人言:即便AI停滞,现有系统对经济变革的影响力仍远超互联网。

对此我持怀疑态度。当今大语言模型(LLM)虽令人惊叹,但财富500强企业未用它改造工作流程,并非管理层守旧——根本问题在于,人类级别的常规劳动输出本就难以实现。这涉及模型底层能力的缺失。

我自诩为“AI先锋派”,投入超百小时构建LLM小工具。然而,实际操作体验却让我调长了预期时间线。我尝试让LLM像人类一样重写机器转录稿以提升可读性,或从访谈中摘取推特素材,甚至逐段协作撰写文章。这些短周期、语言输入输出的封闭任务,本应是LLM的核心能力范围。但实际表现仅勉强及格(5/10)——当然,这已足够惊艳。

核心问题在于:LLM无法像人类那样持续进步。缺乏持续学习能力是致命伤。虽然多数任务大模型的基线水平已超普通人,但想让模型给出高水平反馈却不可能。模型开箱即用的能力就是天花板,纵使反复调试系统提示词,实际效果也远比不上人类员工积累的经验成长。

人类价值的核心并非原始智力,而是构建语境、反思失误、在实操中持续优化细节的能力。

想象教孩子吹萨克斯:让她试吹→辨音→调整。若换成这种模式:学生首次尝试出错,你会立即打断,写下详细错误分析;下个学生阅读笔记后直接挑战查理·帕克曲目;失败后再优化笔记,教给第三位学生。这样注定行不通。再精妙的提示词,也没法让人光靠文字说明学会萨克斯——而这就是我们“教导”LLM的唯一途径。

虽有强化学习微调(RL fine-tuning),但LLM缺乏人类学习的主动适应性。我的编辑之所以出色,正因他们在工作中能自主发现细节:思考观众偏好、洞察我的兴奋点、优化日常流程。如果每项子任务都需定制强化学习环境,根本无法达成这种成长。

或许未来会有更聪明的模型自建强化学习闭环:我给出高阶反馈,模型自动生成可验证的训练问题,甚至搭建演练环境弥补短板。但这个实现难度极大,且技术泛化性存疑。虽然终有一天模型能像人类一样在工作中自然学习,但未来几年内,我看不出将在线持续学习嵌入现有LLM架构的清晰路径。

计算机操作能力

在采访Anthropic研究员肖托·道格拉斯和特伦顿·布里克顿时,他们预言明年末将出现可靠的计算机操作智能体。

现有计算机操作智能体表现糟糕。他们设想的是截然不同的存在。到明年年底,你只需对AI说“去帮我报税”,它就会自动完成——翻遍你的邮件、亚马逊订单和Slack记录,向供应商追索发票,整理所有收据,区分业务支出,对模糊地带寻求你的确认,最终向国税局提交1040表格。

我对此存疑。我虽非AI研究员不敢妄论技术细节,但基于现有认知,质疑理由如下:

  • 随着任务时长增加,执行链必然延长。AI需完成两小时的计算机操作才能验证结果正确性,这还没算上处理图像视频的额外算力消耗。进度放缓几乎不可避免。

  • “过去十年的模型扩展得益于海量免费互联网文本数据,但这只解决了自然语言处理的问题。想训练出可靠的操作智能体?想象用1980年的文本数据训练GPT-4——就算有算力也白搭。”

推理

先别急着泼冷水。我可不愿像Hackernews上那群被宠坏的孩子,就算得到下金蛋的鹅,也只会抱怨鹅叫太吵。

读过o3或Gemini 2.5的思考轨迹吗?它们确实在推理!拆解问题→揣摩用户需求→审视内心独白→发现方向错误立即调整。而我们竟习以为常:“机器当然会思考推演给出聪明答案,这不就是机器的本职?”

我的预测

概率分布极广(这恰是我坚信概率论的原因)。即便为2028年错位的超级智能(ASI)做准备也完全合理——这结果绝非天方夜谭。

2028年

AI能像称职的总经理那样,一周内搞定我的小企业税务:翻遍各类网站找票据,补全遗漏单据,邮件追讨发票,填表提交国税局全套流程。

2032年

AI在职学习能力媲美人类白领:若雇佣AI视频剪辑师,半年后它就能像人类同事那样,深刻理解我的偏好、频道调性、观众喜好等可操作知识。

AGI落地瓶颈:持续学习能力的缺失与未来展望 AGI 持续学习能力 模型进化 计算机操作 第1张