当前位置：首页 > 科技资讯 > 正文

吴恩达2025年AI年终总结：工业时代黎明与三把金钥匙

主机测评网
科技资讯
2026-03-12
114

2025年即将画上句号。

关注AI领域的读者都清楚，今年是各大AI巨头激烈竞争的一年，人才争夺与架构调整异常频繁，大模型军备竞赛白热化，AI基础设施建设如火如荼……

在这一年即将结束之际，我们的老朋友——斯坦福大学计算机科学客座教授、前百度AI负责人、前谷歌大脑负责人吴恩达，按照惯例发布了一封信和2025年人工智能领域的年度总结。

吴恩达2025年AI年终总结：工业时代黎明与三把金钥匙吴恩达 AI年终总结智能体数据中心建设第1张

年末寄语：三把金钥匙

元旦假期临近，学生们期待的寒假和春节也即将到来。「永远不要停止学习」是假期前常被提及的建议，尤其是对于那些希望在快速演进、竞争激烈的人工智能领域寻求发展的人。应该做什么、如何做，吴恩达在今年的信中给出了他的见解。

以下是公开信全文：

亲爱的朋友们：

又一年过去了，AI以惊人的速度发展，为所有人——包括刚踏入这个领域的新手——创造了前所未有的软件开发机遇。事实上，许多公司当前最大的挑战之一，就是找不到足够多真正懂AI的工程师。

每年冬季假期，我都会留出时间学习和动手构建项目，希望你们也能这样做。这不仅能帮助我提升现有技能、掌握新知识，也能切实推动你的技术职业生涯。

要真正具备构建AI系统的能力，我建议你做到三点：

系统学习AI课程

持续动手构建AI系统

（可选）阅读研究论文

下面我解释为什么这三点都至关重要。

我常听到一些开发者建议别人：「别学了，直接上手做就行。」这是非常糟糕的建议！除非你已经身处一个经验丰富的AI开发者社群中，否则在没有理解AI基础的情况下贸然动手，很容易导致你重复发明轮子，或者更糟糕的是，把轮子重新发明得一团糟。

举个例子，在面试中，我见过不少候选人：自己重新发明了一套标准的RAG文档切分策略；重复实现了已经成熟的Agentic AI评估方法；写出了结构混乱、难以维护的LLM上下文管理代码。如果他们提前上过几门相关课程，就会更清楚哪些「积木」已经存在于行业中。他们当然仍然可以选择从零实现这些模块，甚至发明出比现有方案更好的方法，但至少能避免浪费数周时间走弯路。

因此，结构化学习至关重要。

而且说实话，我个人觉得上课非常有趣。与其看Netflix，我更愿意随时打开一门优秀AI讲师的课程来学习。

同时，仅仅上课是不够的。有许多重要的经验，只有通过亲手实践才能真正学到。学习飞机是如何运作的理论，对于成为一名飞行员当然非常重要，但从来没有人只靠上课就学会开飞机。在某个时刻，真正坐进驾驶舱是不可或缺的！好消息是：随着高度智能化（highly agentic）的编程助手出现，动手构建的门槛已经比以往任何时候都低。而当你开始学习AI的各种构建模块时，它们常常会激发你对「还能做些什么」的新想法。如果我一时找不到项目灵感，我通常会去上几门课，或者读一些研究论文。这样坚持一段时间后，我总会冒出一大堆新的项目想法。而且，说实话，我觉得「做东西」本身真的很有趣，也希望你能体会到这种乐趣！

最后，并不是每个人都必须这样做，但我发现如今就业市场上最强的一批候选人，几乎都会偶尔阅读研究论文。虽然在我看来，论文比课程难啃得多，但它们包含了大量尚未被翻译成更易理解形式的前沿知识。我会把读论文的优先级排在课程和实践之后，但如果你有机会提升阅读论文的能力，我仍然强烈建议你这样做。（你也可以看看我以前讲过的一段关于如何读论文的视频。）上课和动手构建对我来说很有趣，读论文则更像是一种「磨练」，但从论文中偶尔闪现的洞见，真的令人愉悦。

祝你度过一个美好的寒假，新年快乐。除了学习和创造，也希望你能多花时间陪伴亲人——那同样非常重要！

Love，

Andrew

年终总结：AI工业时代的黎明

2025年无疑是极其精彩的一年。

作为每年的保留节目，吴恩达的年终总结总能带领我们回顾全年最重要的人工智能事件和发展趋势。

2022年，是AI的璀璨之年，生成文本、图像、视频、音乐和代码的系统即将到来，引发了关于创造力未来的讨论。

2023年，是创新与焦虑的一年，生成式AI浪潮席卷各行各业，其不断扩大的能力引发了智能机器可能会使人类过时的担忧。

2024年，是暴风雪般进步的一年，人工智能取得了突破性进展。智能代理系统提升了推理、使用工具和控制桌面应用程序的能力。小型模型迅速普及，其中许多比其前辈更强大且价格更低廉。

2025年，或将被铭记为AI工业时代的黎明。让我们跟随吴恩达的视角，探索2025年最具代表性的AI大事。

吴恩达2025年AI年终总结：工业时代黎明与三把金钥匙吴恩达 AI年终总结智能体数据中心建设第2张

文章链接：https://www.deeplearning.ai/the-batch/issue-333/

思考型模型解决更大的问题

去年年末，OpenAI推出了首个推理模型o1，将一种具备代理能力的推理工作流内嵌其中。今年1月，DeepSeek-R1向世界展示了如何构建这种能力。结果是：数学与编程性能立刻提升，问题回答更准确，机器人能力更强，AI智能体取得快速进展。

吴恩达2025年AI年终总结：工业时代黎明与三把金钥匙吴恩达 AI年终总结智能体数据中心建设第3张

在2025年初，模型只有在被明确提示时才会执行推理策略。如今，大多数新的大语言模型都会默认这样做，从而在广泛任务上显著提升了性能。

最早的一批推理模型通过RL训练，专门用于正确求解数学问题、准确回答科学问题，生成能通过单元测试的代码。例如，o1-preview在AIME 2024上比其非推理前身GPT-4o高出43个百分点，在GPQA Diamond上高出22个百分点；在Codeforces编程题中，其表现位于人类竞技选手的第62百分位，而GPT-4o仅为第11百分位。

当推理模型学会使用诸如计算器、搜索引擎或bash终端等工具时，表现会进一步提升。例如，在一项涵盖100个领域、考察多模态理解与技术专长的高难度测试中，带工具的OpenAI o4-mini达到17.7%的准确率，比不使用工具时高出3个多百分点。

机器人动作模型也通过RL学会推理。例如，通过奖励ThinkAct达成目标位置，使其在机器人任务上的表现相较于不具备思考能力的模型（如OpenVLA）提升了约8%。

推理模型还帮助智能体应对复杂问题。例如，AlphaEvolve使用Google Gemini反复生成、评估并修改代码，最终为现实世界问题产出了更快的算法。其中一个成果是，它提出了一个用于解释微生物耐药性的长期未解问题的假说；人类科学家几乎在同一时间独立提出并验证了相同假说。

推理能力显著提升了LLM的性能，但更优输出也伴随着成本。Gemini 3 Flash在开启推理时运行Artificial Analysis的Intelligence Index基准共消耗1.6亿tokens（得分71），而关闭推理仅消耗740万tokens（得分明显更低，为55）。此外，生成推理tokens会延迟输出，这也给LLM推理服务商带来了更大的性能压力。不过，研究人员正在努力提高效率。Claude Opus 4.5与GPT-5.1在高推理设置下取得了相同的Intelligence Index分数，但前者消耗4800万tokens，后者则消耗8100万tokens。

巨额薪酬吸引顶尖AI人才

领先的AI公司展开了一场激烈的人才争夺战，用堪比职业体育明星级别的薪酬，从竞争对手那里挖走顶尖人才。

7月，Meta发起大规模招聘，为新成立的Meta Superintelligence Labs组建团队，向来自OpenAI、Google、Anthropic等顶级AI公司的研究人员开出高达数亿美元的待遇。作为回应，Meta的竞争对手反过来从Meta及彼此之间挖走关键员工，使AI人才的市场价值被推至前所未有的高度。

吴恩达2025年AI年终总结：工业时代黎明与三把金钥匙吴恩达 AI年终总结智能体数据中心建设第4张

据《华尔街日报》报道，在成功招募Alexandr Wang及其核心团队成员之后，Meta首席执行官Mark Zuckerberg列出了一份「心愿清单」。

为了说服人们跳槽，Zuckerberg甚至亲自登门拜访，有时还会带上自制的汤。这项努力成功招募了包括OpenAI的Jason Wei和Hyung Won Chung在内的人才，两人均为推理模型的核心研究者。

《华尔街日报》称，曾与OpenAI前CTO Mira Murati共同创立Thinking Machines Lab的Andrew Tulloch，最初拒绝了Meta提出的方案，其中包括价值15亿美元的奖金。几个月后，他改变主意，加入了Meta。

Meta还聘请了曾主管Apple AI模型的Ruoming Pang。据彭博社报道，其薪酬方案在数年内累计高达数亿美元。Meta的报价超过了Apple除CEO之外最高层管理者的薪酬，而Apple选择不予匹配。

在这场人员流动中，Microsoft AI CEO Mustafa Suleyman从Google带走了20多名研究人员和工程师，其中包括工程副总裁Amar Subramanya。

Elon Musk的xAI从Meta挖走了十多名AI研究人员和工程师。Musk抨击竞争对手的报价「疯狂」，并强调自己公司「极端以能力为导向」的文化，以及股权更具增长潜力。

随着2026年的到来，AI招聘格局已发生巨大变化。据《华尔街日报》报道，为了抵御猎头挖角，OpenAI提供了比竞争对手更高比例的股票型薪酬，加快了新员工期权的归属进度，并发放高达150万美元的留任奖金。

尽管2025年出现了关于AI泡沫的讨论，但对于计划投入数百亿美元建设AI数据中心的公司来说，高薪是完全理性的选择：如果你愿意在硬件上花这么多钱，为什么不拿出其中一小部分用于支付人才薪酬呢？

数据中心建设狂潮席卷全球

头部AI公司纷纷宣布了庞大的建设计划，预计在未来几年内将豪掷数万亿美元，并消耗数吉瓦（GW）的电力。

仅今年一年，AI行业的资本支出就突破了3000亿美元，其中大部分用于建设处理AI任务的新数据中心。这还仅仅是「前菜」，各大公司正在规划堪称宏伟的蓝图——建设规模堪比小镇、能耗相当于中型城市的设施。据麦肯锡预测，为了建设足够的算力以满足预期的推理和训练需求，这场竞赛的成本到2030年可能高达5.2万亿美元。

吴恩达2025年AI年终总结：工业时代黎明与三把金钥匙吴恩达 AI年终总结智能体数据中心建设第5张

OpenAI：1月，OpenAI启动了与甲骨文（Oracle）、软银（SoftBank）及阿联酋投资公司MGX合作的5000亿美元「星际之门」（Stargate）项目。公司最终宣布计划在全球建设20吉瓦的数据中心产能，并预测需求量将是该数字的5倍。OpenAI CEO萨姆·奥特曼表示，希望最终能实现每周增加1吉瓦的产能。

Meta：2025年在基础设施项目上投入约720亿美元，高管表示该数字在2026年还将大幅上升。其Hyperion项目包括在路易斯安那州农村地区建设一个价值270亿美元、容量为5吉瓦的数据中心。

微软：2025年全球数据中心项目支出达800亿美元，其中包括位于威斯康星州和亚特兰大的设施，它们将通过专用光纤网络连接，作为一个巨大的超级计算机运行。公司还承诺将其在欧洲的云和AI产能扩展至200个数据中心。

亚马逊：预计2025年基础设施支出将达1250亿美元，2026年还将投入更多。其耗资110亿美元的「雷尼尔计划」（Project Rainier）是位于印第安纳州的一个2.2吉瓦数据中心，将运行50万块Amazon Trainium 2芯片。此外，亚马逊计划在2025年至2029年间斥资约140亿美元扩建澳大利亚的数据中心，并在德国投资约210亿美元。

Alphabet（谷歌母公司）：预计2025年基础设施支出高达930亿美元，高于此前预测的750亿美元。公司宣布了一项400亿美元的计划，到2027年在得克萨斯州增加3个数据中心。此外，还承诺在印度投入150亿美元，在德国宣布了约60亿美元的投资，并在澳大利亚、马来西亚和乌拉圭推出了新建或扩建项目。

尽管存在对AI泡沫的担忧，但基础设施建设热潮正在为原本不温不火的经济带来实实在在的增长。哈佛大学经济学家Jason Furman指出，2025年上半年美国GDP的增长几乎全部来自数据中心和AI领域的投资。在此阶段，有证据支持这样一种观点：2025年拉开了新工业时代的序幕。

智能体让代码编写更高效

编程已成为智能体工作流中具有最直接商业价值的应用场景。Claude Code、Google Gemini CLI、OpenAI Codex以及其他应用，将「编程智能体」变成了AI巨头之间竞争最激烈的战场之一。为了留在牌桌上，规模较小的竞争对手也纷纷开发了自己的智能体模型。

当2024年首个开创性的智能体代码生成器Devin问世时，它将SWE-Bench编程挑战基准测试的最高水平（SOTA）从1.96%提升到了13.86%。到了2025年，使用最新大语言模型的编程智能体已能常态化地完成超过80%的同类任务。

吴恩达2025年AI年终总结：工业时代黎明与三把金钥匙吴恩达 AI年终总结智能体数据中心建设第6张

2024年底，推理模型的出现立即提升了编程能力并降低了成本，因为推理能力使智能体能够规划任务，并将具体执行交给成本更低的模型去完成。到2025年底，Gemini 3 Pro、Claude Opus 4.5和GPT-5.2已成为编程和智能体工作流领域的顶尖模型。

Z.ai的GLM-4.5和月之暗面的Kimi K2成为开放权重模型中的热门选择，使自动编程类初创公司得以大幅削减成本。7月发布的Qwen3-Coder提供了一个庞大的4800亿参数模型，该模型在超过5万亿Token的代码数据上进行了训练，性能几近匹敌Claude Sonnet 4。

Anthropic围绕Claude构建了一套智能体框架，打造出了Claude Code应用。该应用在2月一经推出便大受欢迎，确立了智能体编程系统应有的标准。OpenAI随即做出回应，推出了基于其GPT-5系列编程专用版构建的Codex应用。

模型制造商与集成开发环境（IDE）开发者之间展开了一场拉锯战。这导致Anysphere (Cursor)和Cognition AI (Windsurf)等热门IDE提供商开始构建自己的模型。反之，Google也构建了自己的IDE——Antigravity，并于11月首次亮相。

智能体系统不断推高SWE-Bench这一热门编程基准测试的上限，促使研究人员寻找替代的方式来评估其性能。这些努力催生了SWE-Bench Verified、SWE-Bench Pro、LiveBench、Terminal-Bench、𝜏-Bench和CodeClash等新基准。

2025年初，大多数观察家还认为智能体仅擅长生成常规代码、文档和单元测试，而在处理更高阶的战略性问题上，资深人类工程师和产品经理的表现依然更胜一筹。但到了年底，许多公司报告称已开始自动化资深级别的任务。Microsoft、Google、Amazon和Anthropic均表示，他们自身越来越多的代码正由AI生成。

更多细节，请参阅年度总结原文。