当前位置：首页 > 科技资讯 > 正文

AGI落地瓶颈：持续学习能力的缺失与未来展望

主机测评网
科技资讯
2026-04-14
425

神译局，36氪旗下编译团队，聚焦科技、商业、职场与生活，深度解析海外新科技、新观点与新趋势。

编者注：一位资深AI实践者，基于超过百小时的实战经验，揭示了阻碍AGI（通用人工智能）发展的最大障碍——模型缺乏人类的持续学习能力。通过深入剖析“学萨克斯”的悖论与数据瓶颈，作者预测短期变革有限，但未来十年内智能爆发的可能性急剧增加，为火热的讨论带来冷静思考。本文为编译作品。

“事物的发展总是慢于你的预期，然后突然加速。” ——鲁迪格·多恩布什

在我的播客中，关于AGI实现时间表的争论从未停歇。有嘉宾认为还需20年，也有人坚信只需2年。

以下是2025年6月我的一些思考。

持续学习的困境

常有人言：即便AI停滞，现有系统对经济变革的影响力仍远超互联网。

对此我持怀疑态度。当今大语言模型（LLM）虽令人惊叹，但财富500强企业未用它改造工作流程，并非管理层守旧——根本问题在于，人类级别的常规劳动输出本就难以实现。这涉及模型底层能力的缺失。

我自诩为“AI先锋派”，投入超百小时构建LLM小工具。然而，实际操作体验却让我调长了预期时间线。我尝试让LLM像人类一样重写机器转录稿以提升可读性，或从访谈中摘取推特素材，甚至逐段协作撰写文章。这些短周期、语言输入输出的封闭任务，本应是LLM的核心能力范围。但实际表现仅勉强及格（5/10）——当然，这已足够惊艳。

核心问题在于：LLM无法像人类那样持续进步。缺乏持续学习能力是致命伤。虽然多数任务大模型的基线水平已超普通人，但想让模型给出高水平反馈却不可能。模型开箱即用的能力就是天花板，纵使反复调试系统提示词，实际效果也远比不上人类员工积累的经验成长。

人类价值的核心并非原始智力，而是构建语境、反思失误、在实操中持续优化细节的能力。

想象教孩子吹萨克斯：让她试吹→辨音→调整。若换成这种模式：学生首次尝试出错，你会立即打断，写下详细错误分析；下个学生阅读笔记后直接挑战查理·帕克曲目；失败后再优化笔记，教给第三位学生。这样注定行不通。再精妙的提示词，也没法让人光靠文字说明学会萨克斯——而这就是我们“教导”LLM的唯一途径。

虽有强化学习微调（RL fine-tuning），但LLM缺乏人类学习的主动适应性。我的编辑之所以出色，正因他们在工作中能自主发现细节：思考观众偏好、洞察我的兴奋点、优化日常流程。如果每项子任务都需定制强化学习环境，根本无法达成这种成长。

或许未来会有更聪明的模型自建强化学习闭环：我给出高阶反馈，模型自动生成可验证的训练问题，甚至搭建演练环境弥补短板。但这个实现难度极大，且技术泛化性存疑。虽然终有一天模型能像人类一样在工作中自然学习，但未来几年内，我看不出将在线持续学习嵌入现有LLM架构的清晰路径。

计算机操作能力

在采访Anthropic研究员肖托·道格拉斯和特伦顿·布里克顿时，他们预言明年末将出现可靠的计算机操作智能体。

现有计算机操作智能体表现糟糕。他们设想的是截然不同的存在。到明年年底，你只需对AI说“去帮我报税”，它就会自动完成——翻遍你的邮件、亚马逊订单和Slack记录，向供应商追索发票，整理所有收据，区分业务支出，对模糊地带寻求你的确认，最终向国税局提交1040表格。

我对此存疑。我虽非AI研究员不敢妄论技术细节，但基于现有认知，质疑理由如下：

随着任务时长增加，执行链必然延长。AI需完成两小时的计算机操作才能验证结果正确性，这还没算上处理图像视频的额外算力消耗。进度放缓几乎不可避免。
“过去十年的模型扩展得益于海量免费互联网文本数据，但这只解决了自然语言处理的问题。想训练出可靠的操作智能体？想象用1980年的文本数据训练GPT-4——就算有算力也白搭。”