近期,各大AI公司纷纷动作频繁,从Meta的FAIR部门裁员到OpenAI的资本重组,再到AWS的大裁员,这一系列动荡表明AI行业正从“无限淘金热”转向残酷的“阵地战”。资本开始重新评估价值,而巨头们在激烈的军备竞赛中也不得不审视成本与效率。
那么,这场“阵地战”是如何打起来的?巨头们手里的牌、背上的包袱,又是怎么来的?
知名科技播客《Acquired》最新一期节目,以谷歌(Google)的AI发展史与战略为主线,巧妙地穿插了其他AI巨头的崛起历程。节目几乎涵盖了当今AI领域大部分的关键人物,为听众系统地梳理出一部简明的AI发展史。
播客地址:https://www.acquired.fm/episodes/google-the-ai-company
本文将结合《Acquired》这期节目的讨论脉络,深入挖掘并征引节目中提及的两本关键著作《In the Plex》与《Genius Makers》(中文版:深度学习革命)中的相关细节,结合当下AI圈现状,对AI的发展历史与大公司战略博弈进行一次深度的复盘。
不同于许多后来者,人工智能并非谷歌在某个阶段才“转向”的风口,而是从诞生之初就是其核心理念。
1998年,Google成立。创始人之一Larry Page将谷歌视为一家人工智能公司,这很大程度上源于他父亲——一位早期就专注于机器学习和人工智能领域的计算机科学教授的影响。
让我们先把时间拨回42年前:1956年。在美国的达特茅斯学院,一群充满激情的科学家们正式提出了“人工智能(Artificial Intelligence)”这个名字。他们乐观地相信,用不了多久,具有人类智慧的机器就将出现。
然而,现实很快给过于乐观的预言泼了冷水。由于计算能力的限制、数据的匮乏以及理论的瓶颈,许多承诺无法兑现,AI研究的资金和热情随之骤减,进入了长达数十年的两次“AI寒冬”。
在那个AI被普遍视为“浪费时间”的年代,Larry Page父亲的坚持就颇具反叛色彩。
Larry Page在2000年就断言:“人工智能将是谷歌的终极版本……如果我们拥有终极搜索引擎,它将理解网络上的一切……这显然就是人工智能……我们正朝着这个方向努力”。
甚至可以说,谷歌赖以起家的PageRank算法,其本身运用统计方法排序网页,就已带有早期AI思想的印记。
“压缩即理解”
谷歌AI故事的一个关键源头,始于2000年末或2001年初的一次午餐闲谈。早期工程师George Herrick向同事Ben Gomes及Noam Shazeer提出了一个理论:压缩数据在技术上等同于理解数据。核心在于,高效压缩并能无损恢复信息的过程,本身就蕴含了对信息的深层理解。
这个想法吸引了天才工程师Noam Shazeer。在当时谷歌自由的工程师文化下,Herrick和Shazeer决定全力探索语言模型和机器理解。尽管并非所有人都看好,但Jeff Dean等人的支持给了他们信心。
他们的研究深入到自然语言的概率模型领域,即预测给定词语序列后,下一个最可能出现的词语序列是什么。这正是现代LLM“Next Token Prediction”思想的早期体现。
这项研究的首个直接成果,就是谷歌搜索中极为实用的“您是不是要找”(Did you mean)拼写纠错功能,由Shazeer主导开发。它不仅改善了用户体验,还通过减少错误查询,为谷歌节省了大量无效计算资源。
随后,他们构建了一个在当时看来相当“大”的语言模型,并将其命名为PHIL(Probabilistic Hierarchical Inferential Learner,概率分层推理学习器)。这个模型很快在谷歌的核心业务中扮演了关键角色。
2003年,PHIL被Jeff Dean用于快速实现AdSense系统,理解网页内容以匹配广告。AdSense一夜之间为谷歌带来了数十亿美元的新收入。
谷歌对语言理解能力的追求,自然延伸到了机器翻译领域。
2007年前后,由Franz Och领导的Google Translate团队构建了一个基于海量N-gram(词语组合)的语言模型。该模型在一个包含两万亿单词的谷歌搜索索引子集上进行了训练。团队凭借巨大的N-gram模型赢得DARPA竞赛,但模型效率极低,翻译一句话需12小时。
Jeff Dean再次介入,他意识到翻译过程可并行化。利用Google强大的分布式计算平台,与团队合作在数月内将翻译时间缩短至100毫秒,成功将其投入生产。这成为谷歌第一个生产环境的“大型”语言模型,进一步激发了将此类技术用于更多场景的想象。
Google Brain诞生
随着Sebastian Thrun全职加入Google并创建Google X部门,他将在斯坦福AI实验室(SAIL)的继任者、另一位杰出学者吴恩达(Andrew Ng)也引入Google兼职。
吴恩达在Google园区偶遇Jeff Dean两人交流起各自在语言模型和深度学习方面的想法。他们很快意识到结合Hinton的理论与Google无与伦比的并行计算能力或许可以真正构建一个前所未有的大规模深度学习模型。
本文由主机测评网于2026-05-08发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260543756.html