
- 月之暗面近期推出了其新一代模型Kimi K2 Thinking,引发了广泛关注。除了它在数学推理和代码理解上的进步,人们还特别关注其背后的训练成本——460万美元。
- 相较于估值高达5000亿美元的AI巨头OpenAI,中国的初创公司在资源上显然处于劣势,但它们通过创新和效率找到了自己的出路。
- 月之暗面代表着一种新型的AI力量——它们可能不是最豪华的,但却可能是最高效的;它们不一定拥有最多的资源,但却更懂得如何使资源发挥最大价值。
在10月的最后一个工作日,雪豹财经社走访了月之暗面的北京办公室。我们注意到,月之暗面的会议室都以乐队命名:Pink Floyd、The Rolling Stone、Queen、The Beatles、Radiohead......
阿里有“光明顶”,百度有“昆仑”,它们强调秩序与修炼;而月之暗面则像一支正在排练的乐队,崇尚自由、创新和反叛。摇滚乐在诞生之初,就是一种“低投入门槛”的音乐:它不需要复杂的录音室或昂贵的乐器,一把破吉他、一套架子鼓就能表达强大的力量。
就在那次拜访后一周,11月6日,月之暗面发布了新一代模型“Kimi K2 Thinking”。随之引起热议的,不仅是模型在数学推理和代码理解上的进步,还有其背后的一个数字——460万美元的训练成本。
在大型AI模型动辄需要几千万美元和几亿算力小时的时代,这个数字显得几乎不真实。但它确实发生了——而且,类似的故事正在中国反复上演,它们共同指向一个事实:中国的AI产业正在进入一个高效期:模型越来越强,但花的钱越来越少。
问题是,这意味着什么?
CNBC关于Kimi K2 Thinking训练成本的报道犹如巨石投入水面,在业界引起了巨大反响。
460万美元,还不到GPT-4训练成本的8%,甚至低于DeepSeek披露的V3训练成本(租赁价,正式训练阶段)560万美元。
在性能上,Kimi K2 Thinking在Humanity‘s Last Exam、BrowseComp等部分权威基准测试中,取得了与GPT-5和Claude 4.5等顶级模型相媲美甚至超越的表现。
长期以来,人们普遍认为AI能力与天价资本支出之间已形成了线性关系:更强大的模型理应对应更庞大的投入。
但Kimi K2和DeepSeek的出现打破了这一逻辑,重新定义了传统认知。
尽管月之暗面的创始团队后来回应称:“这不是官方数据。训练成本很难计算,因为其中很大一部分用于研究和实验。”但在巨大的成本差异面前,这一解释并未削弱业界的惊叹。
Hugging Face联合创始人Thomas Wolf甚至提出了一个灵魂拷问:“我们是否每隔几个月就要经历一次‘DeepSeek时刻’?”
与之形成鲜明对比的是,OpenAI首席执行官山姆·奥尔特曼(Sam Altman)在今年8月表示,未来公司将投入数万亿美元来夯实AI基础设施。而在Kimi K2发布后的两天,甲骨文一笔高达180亿美元的数据中心融资交易的消息公布。
海外媒体开始反思中美两国在AI基础设施投入和发展模式的差异。
CNBC预计,到2027年,美国将在数据中心上投入近7000亿美元,而中国的主要玩家包括阿里巴巴、腾讯、字节跳动和百度,合计预期投入不到800亿美元。也就是说,资本支出差距高达10:1,但系统性能却基本相当。
当美国玩家通过私人信贷和债券市场为庞大的数据中心融资时,中国同行正在靠效率取胜——使用更便宜的芯片、开源模型以及需要更少资本投入的精简基础设施。
据一家国际媒体估算,Kimi K2 Thinking的API价格比OpenAI和Anthropic的同类模型便宜6到10倍,可能对企业的采用模式造成冲击。
Thomas Wolf表示,Kimi K2 Thinking发布后,已成为该平台上最受开发者欢迎的模型。
Kimi K2 Thinking之所以大受欢迎,原因很简单:更聪明且价格更低。
以每百万Token的API调用成本来对比,K2 Thinking的输入和输出成本分别为0.15和2.5美元 ,而GPT-5分别为1.25和10美元。
市场的认知已经被重塑:最实用的模型≠最贵的模型。
...(以下部分保持不变)
本文由主机测评网于2026-05-11发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260544388.html