当前位置:首页 > 科技资讯 > 正文

月之暗面Kimi K2 Thinking:中国效率再震硅谷

月之暗面Kimi K2 Thinking:中国效率再震硅谷 Kimi Thinking 中国效率 AI成本 硅谷 第1张

  • 月之暗面近期推出了其新一代模型Kimi K2 Thinking,引发了广泛关注。除了它在数学推理和代码理解上的进步,人们还特别关注其背后的训练成本——460万美元。
  • 相较于估值高达5000亿美元的AI巨头OpenAI,中国的初创公司在资源上显然处于劣势,但它们通过创新和效率找到了自己的出路。
  • 月之暗面代表着一种新型的AI力量——它们可能不是最豪华的,但却可能是最高效的;它们不一定拥有最多的资源,但却更懂得如何使资源发挥最大价值。

在10月的最后一个工作日,雪豹财经社走访了月之暗面的北京办公室。我们注意到,月之暗面的会议室都以乐队命名:Pink Floyd、The Rolling Stone、Queen、The Beatles、Radiohead......

阿里有“光明顶”,百度有“昆仑”,它们强调秩序与修炼;而月之暗面则像一支正在排练的乐队,崇尚自由、创新和反叛。摇滚乐在诞生之初,就是一种“低投入门槛”的音乐:它不需要复杂的录音室或昂贵的乐器,一把破吉他、一套架子鼓就能表达强大的力量。

就在那次拜访后一周,11月6日,月之暗面发布了新一代模型“Kimi K2 Thinking”。随之引起热议的,不仅是模型在数学推理和代码理解上的进步,还有其背后的一个数字——460万美元的训练成本。

在大型AI模型动辄需要几千万美元和几亿算力小时的时代,这个数字显得几乎不真实。但它确实发生了——而且,类似的故事正在中国反复上演,它们共同指向一个事实:中国的AI产业正在进入一个高效期:模型越来越强,但花的钱越来越少。

问题是,这意味着什么?

“中国效率”再次震撼硅谷

CNBC关于Kimi K2 Thinking训练成本的报道犹如巨石投入水面,在业界引起了巨大反响。

460万美元,还不到GPT-4训练成本的8%,甚至低于DeepSeek披露的V3训练成本(租赁价,正式训练阶段)560万美元。

在性能上,Kimi K2 Thinking在Humanity‘s Last Exam、BrowseComp等部分权威基准测试中,取得了与GPT-5和Claude 4.5等顶级模型相媲美甚至超越的表现。

长期以来,人们普遍认为AI能力与天价资本支出之间已形成了线性关系:更强大的模型理应对应更庞大的投入。

但Kimi K2和DeepSeek的出现打破了这一逻辑,重新定义了传统认知。

尽管月之暗面的创始团队后来回应称:“这不是官方数据。训练成本很难计算,因为其中很大一部分用于研究和实验。”但在巨大的成本差异面前,这一解释并未削弱业界的惊叹。

Hugging Face联合创始人Thomas Wolf甚至提出了一个灵魂拷问:“我们是否每隔几个月就要经历一次‘DeepSeek时刻’?”

与之形成鲜明对比的是,OpenAI首席执行官山姆·奥尔特曼(Sam Altman)在今年8月表示,未来公司将投入数万亿美元来夯实AI基础设施。而在Kimi K2发布后的两天,甲骨文一笔高达180亿美元的数据中心融资交易的消息公布。

海外媒体开始反思中美两国在AI基础设施投入和发展模式的差异。

CNBC预计,到2027年,美国将在数据中心上投入近7000亿美元,而中国的主要玩家包括阿里巴巴、腾讯、字节跳动和百度,合计预期投入不到800亿美元。也就是说,资本支出差距高达10:1,但系统性能却基本相当。

当美国玩家通过私人信贷和债券市场为庞大的数据中心融资时,中国同行正在靠效率取胜——使用更便宜的芯片、开源模型以及需要更少资本投入的精简基础设施。

据一家国际媒体估算,Kimi K2 Thinking的API价格比OpenAI和Anthropic的同类模型便宜6到10倍,可能对企业的采用模式造成冲击。

Thomas Wolf表示,Kimi K2 Thinking发布后,已成为该平台上最受开发者欢迎的模型。

Kimi K2 Thinking 为何“炸场”?

Kimi K2 Thinking之所以大受欢迎,原因很简单:更聪明且价格更低。

以每百万Token的API调用成本来对比,K2 Thinking的输入和输出成本分别为0.15和2.5美元 ,而GPT-5分别为1.25和10美元。

市场的认知已经被重塑:最实用的模型≠最贵的模型。

...(以下部分保持不变)