当前的人工智能算力竞赛,其宏伟规模已让历史上的阿波罗登月计划与曼哈顿计划黯然失色,堪称一场前所未有的科技狂潮!
Anthropic联合创始人Tom Brown公开指出,AI基础设施的建设投入远超阿波罗与曼哈顿计划,展现出人类科技史上的新高度。
通用人工智能(AGI)的算力需求正以每年高达3倍的惊人速度膨胀,这种增长势头毫无减缓迹象。
到明年,这一趋势依然确定;但2027至2028年间,则面临稍高的不确定性。
Tom Brown或许不如奥特曼、马斯克那般闻名遐迩,但在AI领域,他是一位被严重低估的传奇人物。
尤为特别的是,他依靠自学成才——从线性代数仅获B-成绩的学生,奋力成长为推动通用人工智能突破的核心力量。
在协助OpenAI打造GPT-3后,他与志同道合的同事共同创立了Anthropic,开启了新的征程。
创业初期,他们的前景一片模糊:
OpenAI坐拥十亿美元资金与明星科学家团队;
而Anthropic仅凭七位联合创始人(见下图)艰难起步,连产品形态与成功可能性都无从知晓。
如今,Anthropic的Claude已成为全球开发者的首选工具,引领AI应用新风潮。
在Anthropic,Tom Brown主导着被他称为“人类史上最大规模基础设施建设”的算力竞赛,其广度与深度超越以往任何科技工程。
在硅谷知名孵化器YC的Lightcone Podcast节目中,Tom Brown首次详尽分享了自己的非典型人生旅程,并为年轻工程师献上诚挚建议。
这场访谈全面回顾了Tom Brown的创业与研究之路:
毕业即投身创业,体验“狼性”文化精髓;
在Grouper遭遇挫折后,转向AI领域自学突破;
主动联系Greg Brockman,成功加入OpenAI;
参与GPT-3训练基础设施,亲历缩放定律的威力;
与OpenAI团队分道扬镳,携手创立Anthropic;
推出Claude系列,并在Claude 3.5/3.7版本实现市场逆袭;
打磨Claude Code,意外打造出爆款应用;
负责超大规模算力与硬件基础设施布局;
最终强调:年轻人应勇敢冒险,追随内心使命,而非追逐虚名。
主持人提问:21岁从MIT毕业至今,Tom如何从科技行业新人成长为Anthropic联合创始人?
他深情回顾了自己的成长轨迹。
21岁从MIT计算机专业毕业后,他放弃大厂offer,加入朋友初创公司Linked Language,首次感受“狼性”创业文化的洗礼。
这段毕业即创业的经历彻底重塑了他的心态:
在学校时,我像一只等待喂食的狗,被动完成他人布置的任务;
而在创业公司,我们必须如狼般主动猎食,否则将面临生存危机。
这种转变赋予他直面更大挑战的勇气。
随后,Tom加入移动广告平台Mopub,成为首号工程师。尽管渴望成为“狼”,但当时编程技能薄弱,常感力不从心。这段经历却让他掌握了系统扩展的精髓。
此后,他连续遭遇困境:
首次担任CEO:试图开发“比Heroku更灵活”的DevOps平台,却连自身目标都难以清晰阐述。
第二次涉足约会应用:YC之父Paul Graham将他引荐至Grouper,却遭Tinder降维打击,只能在资金耗尽时靠“每周带团队相亲”苦苦支撑。
对Tom而言,Grouper的吸引力在于:他原本笨拙害羞,渴望有一个在朋友陪伴下安全认识异性的平台。
唯一比他更频繁使用Grouper的人是Greg Brockman,后者几乎每周都在社交平台号召参与。
Greg Brockman:OpenAI联合创始人、现任OpenAI主席
两人因此结为挚友,这也为他日后进入OpenAI奠定了人脉基础。
在Grouper,他身心俱疲:创业的高光令人振奋,但低谷却带来极致痛苦。
回首往事,Tinder的模式显然更优,Grouper的使命已被超越。
业务下滑、收入萎缩,Tom仍招募工程师,推销一个连自己都难以信服的梦想——这种感觉宛如“死亡行军”。
因此,他并未立即投入研究,而是先“游荡”了一段时间。
例如,练习瑜伽、CrossFit,甚至花费三个月打造“艺术车”前往Burning Man艺术节,洗涤一身“职场尘埃”。
他长期犹豫是否转型AI研究:
或许我们这一代将见证颠覆性人工智能的诞生,这可能是人类史上最重大事件;
也许我能贡献绵薄之力。但大学线性代数仅获B-(险些C+)的我,真的有能力吗?
2015年,Tom离开Grouper,但直到一年后才正式加入OpenAI。
当时,进入AI研究领域被视为顶尖学霸的专利。因此,他怀疑自身能力,加之此前创业小成,曾考虑启动新项目。
朋友们听闻他的AI研究计划,均感诧异甚至质疑:“AI安全?听起来像火星人口过剩一样荒诞!”
他们都怀疑Tom是否适合此道。于是他踌躇半年,才逐渐鼓足勇气尝试。
经过三个月休整,他强迫自己进入“隐身学习模式”六个月,以期跻身顶尖实验室。
当时仅有的选择是:DeepMind、谷歌Brain、MIRI(机器智能研究院)。但他缺乏技术积累,唯有自学。
那是2015年,深度学习刚刚兴起,他的主要学习计划包括:
在Coursera自学机器学习课程;
完成Kaggle项目实践;
研读《Linear Algebra Done Right》;
翻阅统计学教材;
甚至用YC校友积分购买GPU,通过SSH远程运行实验。
为加入OpenAI,他主动联系Greg Brockman,毕竟OpenAI当时以研究员团队强大著称。
OpenAI成立当天,Tom即发消息给Brockman:“我线性代数仅B-,但略懂工程与分布式系统。若能协助,即便扫地拖地也在所不惜。”
Greg认为兼具机器学习与分布式系统知识者稀缺,视Tom为奇才。
于是将Tom引荐给Pieter Abbeel,助其制定学习计划。
Pieter Abbeel是加州大学伯克利分校机器人学习教授,于2016年4月26日休假加入OpenAI。
此后,Tom每月跟进学习,终获机遇:OpenAI需构建星际争霸(StarCraft)环境,他遂加入项目。
当时,OpenAI位于旧金山Dandelion巧克力工厂楼上,享有马斯克承诺的十亿美元资金,创业氛围浓郁。
关键转折点来临:他开始负责训练GPT模型的工程系统。
GPT-2仍在TPU上训练,而GPT-3的重大突破在于转向GPU并大幅提升算力。
在OpenAI工作一年后,他短暂加入Google Brain,后又回归OpenAI。
他恰逢GPT-3训练期(2018–2019)。
那时团队已意识到缩放定律的力量:只要方法得当,算力越多,智能越强。
Dario Amodei发表著名缩放定律论文,证实此趋势。
Danny Hernandez的研究显示算法效率提升持续降低成本。
两者叠加,让OpenAI预见未来几年智能将爆炸式增长。
最令他震撼的是:那条直线跨越12个数量级——从小模型到超大模型,全部稳定对齐于同一直线。
如此长的数量级跨度,在其他科学领域前所未见。Tom自此全心投入缩放相关工作。
当时,学界多人批评OpenAI“只会堆砌GPU,手段粗暴、缺乏技术”。甚至有人嘲讽此为“愚蠢但有效”之法。
如今看来,正是这“笨办法”催生了智能飞跃。
Tom历经OpenAI、谷歌DeepMind和Anthropic,堪称美国AI界“三朝元老”。
作为GPT-3团队一员,他为何与OpenAI分道扬镳?
这与Amodei兄妹密切相关。
当时,OpenAI的安全与缩放团队向Daniela、Dario Amodei兄妹汇报。
两支团队协作无间,且共同坚信:
缩放定律必将引发颠覆,最终人类需将部分控制权移交通用人工智能(AGI)。若运气佳,AGI将与人类目标对齐,实现平稳过渡;若运气差,后果可能不堪设想。
因此,必须建立一个能肩负此重任的机构。
这成为他们自立门户的核心动因。
Tom坦言当时不确定这是否对世界最有益。回首往事,证明此为明智之举。
早期加入Anthropic者皆怀“使命”而来。他们本可选择更体面、高薪之地,但选择了Anthropic,因相信此事意义非凡。
这奠定了公司文化基石:前100名员工几乎全为使命驱动。
Anthropic的Linkedin主页介绍
正因如此,即便Anthropic现已扩张至2000余人,办公室政治仍难渗透。若有人觉行为偏离使命,他们会直接指出。
约在ChatGPT发布前9个月,Anthropic推出首款产品Slack机器人Claude 1。
初期,Anthropic犹豫是否发布产品,专注于研究与基础设施。ChatGPT的发布成为催化剂,促使Anthropic推出API与Claude AI。
Claude 3.5 Sonnet特别是Claude Code成为关键转折点,赢得巨大市场认可。
2023年,几乎所有创业者皆用OpenAI。
但至2024年,Claude 3.5尤其是Sonnet版本迅速抢占市场份额。
在编程场景中,份额从个位数飙升至20%、30%,甚至当前80%、90%的创始人更偏爱Claude。
国外某投行LLM报告:https://menlovc.com/perspective/2025-mid-year-llm-market-update/
正如OpenAI未预料ChatGPT爆红,Claude 3.7 Sonnet同样让Anthropic惊讶——它意外解锁了“智能体式编程”能力。
每一次迭代,Claude的新能力都令人惊叹。
YC创业者调研显示,开发者在编程中更偏好Anthropic模型,此倾向远超基准测试所能解释。原因何在?是有意设计还是自然涌现?
Tom认为主因在于——不“刷榜”。
其他大型实验室有专门团队针对基准测试题库优化,以求分数亮眼。但Anthropic无此类团队,反而避免了训练集与测试集的过拟合。
Anthropic内部自有评估指标,但未公开。团队聚焦内部基准优化,同时大量“内部自用”——如让Claude加速工程师工作,此为最高优先级。
近期,Claude Code大获成功。主持人问及其起源,不料Claude Code最初仅是无心之作。
工程师Boris Cherny为辅助团队编码,临时搭建的内部小工具。
起初,Anthropic战略为:只提供API,不涉足应用。他们认为外部创业公司创意无穷,更懂产品。故全力打磨API,让开发者构建应用。
结果Claude Code意外脱颖而出,作为产品,竟比市面竞品更优。
对此,Tom提出“心智切换”理论——将Claude本身视为“用户”对待。
在Linked Language,用户是教师;
在Grouper,用户是纽约单身青年;
在Claude Code,用户既是开发者,也是Claude自身。
因此团队思路是:为Claude配备最适工具与上下文,使其更高效协助人类完成任务。
这是一种“以模型为中心”的思维模式,对Anthropic而言却格外自然。
若今日有“年轻版Tom”——20余岁,欲投身AI领域,搭上快车,你会给予何建议?
Tom的回答是——勇于承担更多风险。
选择那些即便失败,朋友仍觉你酷炫、钦佩的项目。或让你理想中更优秀的自己为之自豪之事。追寻此类目标,而非盲目遵循“安全路径”。
主持人最后提出大学生常见困惑:是否继续学业?未来职业何在?世界将如何演变?
Tom的建议如下:
勿过在意外部标签(如学位、证书、大厂光环)。
内在驱动远胜外在驱动。
若仅为获取文凭或进入FAANG公司(Facebook、Apple、Amazon、Netflix、Google)谋职,那已无意义。
当今世界剧变,“传统路径”不再构成优势。真正价值在于,能否让朋友与你内心皆感“我做成了不起之事”。
参考资料:
https://x.com/slow_developer/status/1957925542663184817
https://x.com/ycombinator/status/1957815586744070653
https://www.youtube.com/watch?v=JdT78t1Offo
https://www.linkedin.com/in/nottombrown/
本文由主机测评网于2025-12-24发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20251212294.html