当前位置：首页 > 科技资讯 > 正文

大模型时代的算力博弈：OpenAI的“路由”挑战与机遇

若说Scaling Law是衡量大模型能力提升的标尺，那么“算力成本控制”无疑是大模型行业发展的基石。

年初，DeepSeek在国外开源社区一鸣惊人，它的一个关键优势在于，将同性能模型的推理和训练算力成本降至10%以内。而MoE架构在GPT-4发布后，逐步取代了稠密架构，成为大模型开发商的首选，这主要得益于它能有效降低模型推理的算力成本。

OpenAI伴随GPT-5发布的“路由”功能，初衷是匹配简单问题到低消耗模型，复杂问题到高算力模型，以提升用户体验和算力效率。然而，这却成了AI圈的“降本增笑”事件。尽管OpenAI回滚了GPT-4o，允许用户手动切换模型，但GPT-5的发布确实存在诸多漏洞。

大模型时代的算力博弈：OpenAI的“路由”挑战与机遇大模型算力成本控制路由功能 AI成本悖论第1张

即便近一个月过去了，OpenAI仍未能让所有用户满意。网友吐槽GPT-5无法解决简单问题。虽然大多数用户开始接受OpenAI的宣称，但Sam Altman也无法否认GPT-5的发布确实存在诸多问题。

大模型时代的算力博弈：OpenAI的“路由”挑战与机遇大模型算力成本控制路由功能 AI成本悖论第2张

翻车最直接的原因是路由功能未能良好匹配用户预期与模型能力。那么，为何OpenAI要冒此风险强推路由功能？

01

大模型时代的算力博弈：OpenAI的“路由”挑战与机遇大模型算力成本控制路由功能 AI成本悖论第3张

最直接的原因是，在GPT-5发布前，OpenAI推出了5个以上模型，让用户根据需求选择。模型增多后，即便是重度用户也较难决定哪个最适合当前任务。

对于立志将ChatGPT打造为AI时代超级APP的OpenAI而言，这种状况不可持续，特别是针对大量未接触大模型的普通用户，为他们选择模型是必要之举。

更深层次的原因在于，从算力成本出发，每次大模型询问都需在推理与非推理模式间选择。这种调配效率决定了大模型产品的算力使用效率。

根据研究，推理与非推理模式的算力差异巨大，可能达5-6倍。复杂问题通过技术消耗上万token。在延迟上，差异更为显著，可能是60倍以上。

大模型时代的算力博弈：OpenAI的“路由”挑战与机遇大模型算力成本控制路由功能 AI成本悖论第4张

即便消耗巨大算力和时间，结果准确性差异仅5%左右。为了这5%，消耗多少算力合适？

大模型时代的算力博弈：OpenAI的“路由”挑战与机遇大模型算力成本控制路由功能 AI成本悖论第5张

若默认使用推理模型，路由功能能将10%问题通过非推理模型完成，可降低8%算力成本。对OpenAI这样服务数亿用户且算力紧张的公司，路由功能至关重要。

大模型时代的算力博弈：OpenAI的“路由”挑战与机遇大模型算力成本控制路由功能 AI成本悖论第6张

打造高效路由功能难度极大。外媒报道中，UIUC计算机助理教授表示这可能是亚马逊推荐系统级别的问题，需数年努力和大量专家。

理论上，语义级别路由非最优解。DeepSeek V3.1尝试混合推理与非推理模型，提高效率。新模型思考速度更快，输出长度明显减少。

但新模型也存在问题，如输出中莫名出现“极”bug，中英夹杂更严重。

大模型时代的算力博弈：OpenAI的“路由”挑战与机遇大模型算力成本控制路由功能 AI成本悖论第7张

提高效率的另一面是OpenAI对算力的极度渴求。年初DeepSeek V3和R1的推出引发全球对英伟达等算力供应商的关注，“AI成本悖论”显现。

OpenAI推进Stargate计划，新增数据中心能力。外媒报道OpenAI正物色印度合作伙伴，计划在新德里设立办公室。

“AI成本悖论”推高英伟达和云服务商业绩，对降低模型算力需求的“路由”功能提出更高要求。

本文由主机测评网于2026-04-26发表在主机测评网_免费VPS_免费云服务器_免费独立服务器，如有疑问，请联系我们。
本文链接：https://www.vpshk.cn/20260440621.html