当前位置:首页 > 科技资讯 > 正文

AI模型成本攀升:订阅模式面临困境

年初,DeepSeek的问世在AI圈内掀起了不小的波澜,其开源和庞大的训练成本让不少人惊叹。然而,随着时间的推移,AI模型的训练成本逐渐降低,但推理费用却如同脱缰野马,一路飙升。

这种变化让不少创业公司看到了商业模式的新希望:以低廉的月费吸引用户,赌未来模型成本会大幅下降。然而,这个看似完美的剧本却隐藏着巨大的陷阱。

TextQL的联合创始人兼CEO丁一帆(Ethan Ding)在其博客中深度剖析了AI公司面临的“囚徒困境”,并给出了建议。文章风趣幽默且深入浅出,值得一读。

AI模型成本攀升:订阅模式面临困境 AI模型成本 订阅模式 推理费用 困境 第1张

博客标题:tokens are getting more expensive

博客链接:https://ethanding.substack.com/p/ai-subscriptions-get-short-squeezed

以下是文章的详细内容。

即便「语言模型未来会便宜 10 倍」的预测成真,也无法拯救 AI 订阅服务免于这场成本挤压。

AI模型成本攀升:订阅模式面临困境 AI模型成本 订阅模式 推理费用 困境 第2张

想象一下你创办了一家公司。

你深知消费者每月最多只愿意为产品支付 20 美元。没问题,你计划以成本价运营,牺牲利润换增长。但接下来的部分才真正有意思:你看过a16z的那张图——LLM成本每年会下降 10 倍。

AI模型成本攀升:订阅模式面临困境 AI模型成本 订阅模式 推理费用 困境 第3张

于是你心想:现在用户月付 20 美元,我刚好打平;等到明年模型成本降价 10 倍,利润率一下冲到 90%,简直是稳赚不赔。亏损只是暂时的,盈利是必然的。

但现实是:18 个月过去了,毛利率几乎跌到历史最低点……

公司们依旧在流血,模型确实变便宜了——GPT-3.5的推理成本比原来低了 10 倍。可不知怎么的,利润不仅没变好,反而更糟了。

用户追求最新技术

GPT-3.5的确比以前便宜了 10 倍。但它现在的吸引力,就像iPhone发布会当天你掏出个翻盖手机——谁还会想用?

每当一个新模型被发布并成为SOTA(最先进技术),99%的需求会立即转向它。用户已经默认了这种节奏,对他们来说,产品理应不断升级。

模型资源消耗激增

以前你在ChatGPT里问一句话,它就回你一句。现在,「深度研究」模式会先花 3 分钟做规划,再用 20 分钟浏览材料,最后还要用 5 分钟把报告润色一遍。O3模型甚至能为了回应一句「你好啊」,跑满 20 分钟。

由于强化学习(RL)和推理阶段计算的爆炸式增长,出现了一个谁也没预料到的现象:AI能完成的任务长度,每 6 个月翻一倍。

Anthropic的尝试

成本挤压的出路

Claude Code的「无上限」套餐实验,是尝试渡过这场风暴的高明手段。他们用尽了方法,但最终还是惨败。

一百亿个token。这相当于一个月内一万两千五百本《战争与和平》的量。怎么做到的?

事实证明,用户变成了API编排者,花着Anthropic的钱,运行着7x24小时不间断的代码转换引擎。从聊天到代理的演变一夜之间就完成了消耗量增加了 1000 倍。

所有人的困境

这让其他所有人都陷入了进退两难的境地。每家AI公司都知道,按使用量计费能救他们。但他们也知道,这同样会杀了他们。

如何避免亏损平仓?

1. 从第一天起就采用按使用量计费

2. 极高的转换成本 ⇒ 高利润率

3. 垂直整合 ⇒ 从基础设施上赚钱

未来之路

尽管「levered beta is all you need」的结论依然成立,但没有计划的「先发」也意味着你会第一个走进创业坟场。

AI模型成本攀升:订阅模式面临困境 AI模型成本 订阅模式 推理费用 困境 第4张