若说Scaling Law是衡量大模型能力提升的标尺,那么“算力成本控制”无疑是大模型行业发展的基石。
年初,DeepSeek在国外开源社区一鸣惊人,它的一个关键优势在于,将同性能模型的推理和训练算力成本降至10%以内。而MoE架构在GPT-4发布后,逐步取代了稠密架构,成为大模型开发商的首选,这主要得益于它能有效降低模型推理的算力成本。
OpenAI伴随GPT-5发布的“路由”功能,初衷是匹配简单问题到低消耗模型,复杂问题到高算力模型,以提升用户体验和算力效率。然而,这却成了AI圈的“降本增笑”事件。尽管OpenAI回滚了GPT-4o,允许用户手动切换模型,但GPT-5的发布确实存在诸多漏洞。
即便近一个月过去了,OpenAI仍未能让所有用户满意。网友吐槽GPT-5无法解决简单问题。虽然大多数用户开始接受OpenAI的宣称,但Sam Altman也无法否认GPT-5的发布确实存在诸多问题。
翻车最直接的原因是路由功能未能良好匹配用户预期与模型能力。那么,为何OpenAI要冒此风险强推路由功能?
最直接的原因是,在GPT-5发布前,OpenAI推出了5个以上模型,让用户根据需求选择。模型增多后,即便是重度用户也较难决定哪个最适合当前任务。
对于立志将ChatGPT打造为AI时代超级APP的OpenAI而言,这种状况不可持续,特别是针对大量未接触大模型的普通用户,为他们选择模型是必要之举。
更深层次的原因在于,从算力成本出发,每次大模型询问都需在推理与非推理模式间选择。这种调配效率决定了大模型产品的算力使用效率。
根据研究,推理与非推理模式的算力差异巨大,可能达5-6倍。复杂问题通过技术消耗上万token。在延迟上,差异更为显著,可能是60倍以上。
即便消耗巨大算力和时间,结果准确性差异仅5%左右。为了这5%,消耗多少算力合适?
若默认使用推理模型,路由功能能将10%问题通过非推理模型完成,可降低8%算力成本。对OpenAI这样服务数亿用户且算力紧张的公司,路由功能至关重要。
打造高效路由功能难度极大。外媒报道中,UIUC计算机助理教授表示这可能是亚马逊推荐系统级别的问题,需数年努力和大量专家。
理论上,语义级别路由非最优解。DeepSeek V3.1尝试混合推理与非推理模型,提高效率。新模型思考速度更快,输出长度明显减少。
但新模型也存在问题,如输出中莫名出现“极”bug,中英夹杂更严重。
提高效率的另一面是OpenAI对算力的极度渴求。年初DeepSeek V3和R1的推出引发全球对英伟达等算力供应商的关注,“AI成本悖论”显现。
OpenAI推进Stargate计划,新增数据中心能力。外媒报道OpenAI正物色印度合作伙伴,计划在新德里设立办公室。
“AI成本悖论”推高英伟达和云服务商业绩,对降低模型算力需求的“路由”功能提出更高要求。
本文由主机测评网于2026-04-26发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260440621.html