当前位置：首页 > 科技资讯 > 正文

AI独角兽崛起：技术驱动与确定性革命

主机测评网
科技资讯
2026-04-29
767

AI独角兽崛起：技术驱动与确定性革命 Thinking Machines Lab AI独角兽技术驱动确定性AI 第1张

AI界涌现出一颗璀璨的新星。

在充满变革的AI领域，很少有公司能像Thinking Machines Lab这样，在短短七个月内，凭借尚未发布的产品和实际用户，就获得了全球瞩目的120亿美元（约合人民币850亿元）估值。

这家由前OpenAI首席技术官（CTO）Mira Murati领导的人工智能研究公司，集合了三十多位精英，包括前OpenAI安全研究副总裁及北大女学霸翁荔，不仅成功筹集了20亿美元种子轮融资，还吸引了AMD、英伟达等巨头争相投资，成为OpenAI、Anthropic和Google DeepMind等企业的强劲对手。

不同于传统创业公司“产品先行”的模式，Thinking Machines Lab自诞生起就带着颠覆的基因。其核心团队几乎全员来自OpenAI，涵盖了AI产品落地和核心技术研发等关键领域，这种“顶配阵容”让市场看到了超越OpenAI的可能性。

值得注意的是，公司尚未推出产品，便以技术研究成果为“名片”，通过发布研究博客和学术论文，向行业展示其在多模态基础模型与下一代人机协作领域的布局。这种“技术驱动”的策略，为AI初创公司的发展提供了新范式。

一个“无产品”的独角兽

成立仅七个月、没有产品也没有用户的公司被大佬们争相投资，估值高达120亿美元（约合人民币850亿）。

Thinking Machines Lab正是这样一家神奇的公司。

由前OpenAI首席技术官Mira Murati于2025年2月创立，聚焦多模态基础模型与下一代人机协作的人工智能研究。仅半年时间，就凭借约三十人、三分之二来自OpenAI的豪华团队，完成了由Andreessen Horowitz领投、英伟达与AMD跟投的20亿美元种子轮融资，估值飙升到120亿美元。公司已与Google Cloud达成算力合作，计划在未来几个月内发布包含开源组件的首款产品，帮助研究人员和初创公司定制自己的AI模型。同时，公司正在大规模招募具备AI产品经验的人才，被视为OpenAI、Anthropic和Google DeepMind的有力挑战者。

为什么一家尚未有产品的公司能获得如此高的期待？这得益于“人、卡、势”的三重优势。

人才方面，Thinking Machines Lab拥有顶级初创团队。创始人Mira Murati是前OpenAI CTO，曾成功打造ChatGPT、DALL-E、GPT-4等全球级产品；联合创始人Barret Zoph、John Schulman等同样是Transformer与RLHF路线的核心作者。

对投资机构而言，这支约30人的小分队几乎是一张“全明星期权”：只要他们在未来24个月内取得任何突破性进展，就能直接对标OpenAI的1500亿估值，850亿只是提前折现的估值。

资源方面，大模型竞争已演变为GPU军备赛。官宣当天，Thinking Machines Lab就获得英伟达、AMD的联合注资，一次性锁定数万张H100/H200的配额。在“得显卡者得天下”的共识下，资本宁愿一次性打满估值，也不愿在GPU更加稀缺的6个月后再追高。

趋势方面，2024-2025年，AI估值模型从“收入P/S”迅速转向“生态席位费”：全球能真正从头训练GPT-4级稠密模型的团队不超过5家。Thinking Machines Lab是最后一个由“原OpenAI核心决策层”整体出走的标的。错过这个机会后，下一个同等量级的叙事窗口可能要在3年后才出现。850亿里有一半买的是“席位”，而非产品。

再加上二级市场对AI的FOMO情绪外溢：只要公司放出“我们已能稳定训练100B以上多模态模型”的技术博客，哪怕没有对外API，二级市场也会用OpenAI 1500亿、Anthropic 600亿的锚点做线性插值，将850亿视为合理估值。因此，850亿并非传统意义上的“收入估值”，而是“叙事＋算力＋人才”三位一体的看涨期权定价；如果下一轮产品落地后模型性能或商业化不及预期，估值同样可能迅速回调。

在Thinking Machines Lab的投资人中，英伟达和AMD备受瞩目。

英伟达和AMD投资Thinking Machines Lab，表面看是“投人”，实质是“买入口、锁需求、抢话语权”。将高端GPU直接应用于下一代“杀手级”模型，训练GPT-4.5级以上的多模态稠密模型需要数万张H100/H200。谁先抢到显卡资源，谁就拥有下一个“爆款”入口。

英伟达和AMD通过股权交换资本，将“卖卡”前置为“占股+绑定采购”，一次性锁定未来可能高达3-4万颗高端GPU的需求，避免被“自研芯片”计划截胡。

通过“客户即股东”模式抬高竞品拿卡门槛，英伟达和AMD通过入股Thinking Machines Lab，将稀缺资源优先供给“自己人”，变相延长竞争对手的排队时间，从而延缓别家模型迭代节奏，巩固自身生态话语权。

一篇论文

前几天，Thinking Machines Lab发表了一篇论文，这是少有的论文比产品先行的创业公司。

Thinking Machines开辟了研究博客专栏「Connectionism」（联结主义），发表了第一篇博客文章“Defeating Nondeterminism in LLM Inference”（击败LLM推理中的非确定性）。

文中提到，尽管将温度参数设为0（即采用贪婪采样），LLM的输出仍然可能出现不一致。这种现象在实际应用中普遍存在：即使在相同的输入和模型配置下，多次运行得到的结果也可能不同。

对此，一种流行解释是：这种现象由浮点数的非结合性（即浮点加法不满足结合律）和GPU并行计算中的原子操作竞争条件共同导致。论文将这一观点称为“并发+浮点数”假说。

论文深入研究了LLM推理过程中使用的GPU内核，发现虽然浮点数的非结合性是导致数值差异的根本原因，但并发执行中的原子操作并非LLM推理非确定性的主要来源。提出“批大小变化”理论：作者指出LLM推理中的非确定性主要源于服务器负载的变化导致每次推理时的批大小（batch size）不同。而现有的GPU内核在设计上缺乏“批不变性”（batch invariance），即计算结果会随着批大小的变化而变化。

通过实验展示即使运行相同的矩阵乘法当批大小不同时得到的结果也可能存在显著差异。这表明LLM推理系统在处理不同负载时由于缺乏批不变性导致输出结果不一致。作者提出要解决非确定性问题需确保LLM推理中涉及的关键计算内核（如RMSNorm、矩阵乘法和注意力机制）具备批不变性。具体来说要保证无论批大小如何变化每个样本的归约（reduction）计算顺序都保持一致。

简单来说文章研究的是如何提升模型输出的稳定性和可预测性。

这一点对用户来说至关重要因为这直接关系到用户对AI系统的信任开发者对问题的调试能力系统的公平性与合规性强化学习中的训练一致性用户体验的稳定性以及科学研究的可复现性。

如果同一个问题每次询问AI都得到不同的答案用户会质疑模型的可靠性尤其是在法律、医疗、金融、教育等高风险领域输出的一致性直接影响用户对系统的信任。开发者也需要可复现的模型输出以便稳定地复现bug并进行修复这是软件测试、回归测试和模型评估的基础。

此外如果模型对相同输入给出不同输出可能意味着某些群体或输入被系统性区别对待这在审计、合规和公平性评估中是不可接受的因为必须确保模型行为一致才能判断是否公平。在强化学习中训练时使用的采样策略与推理时必须保持一致否则会导致策略漂移使模型表现下降非确定性还会让“on-policy RL”变成“off-policy RL”从而破坏训练目标。

最重要的是用户也期望AI产品像传统软件一样稳定如果今天问“如何报税”得到一个答案明天又变了用户会感到困惑甚至愤怒对企业来说输出一致性是服务质量的一部分直接影响品牌声誉。科学研究同样需要可复现的实验结果来比较不同模型或算法的优劣如果模型输出每次都不同就无法判断是模型改进带来的提升还是随机波动。因此可预测性和可重复性不是技术细节而是AI系统能否被人类信任、部署和规模化使用的底线要求就像一台每次按键都打出不同字母的键盘无法被信任或改进一样不可复现的AI也无法被真正应用。