当前位置:首页 > 科技资讯 > 正文

AI“变蠢”背后的真相:高效与体验的双重挑战

大家有没有发现,现在的AI似乎越来越让人摸不透?

事情是这样的,我近期给 OpenAI 充了200刀的会员,想看看现在的 ChatGPT 究竟有多强大。然而,结果却让我大跌眼镜。

我给它出了个简单的算术题:5.9 = x+5.11,结果它却直接给我算崩溃了。这题目真的有那么难吗?

AI“变蠢”背后的真相:高效与体验的双重挑战 AI效率 模型优化 用户体验 技术挑战 第1张

难道堂堂200刀的人工智能,还不如我20块的计算器?

不过,我记得GPT-4刚发布时,我还用它解决过高数问题。难道模型升级后还会降低智力吗?于是我又试着给它出了一道微积分题目。

这次它表现得还不错,用换元法顺利解答了。大家有兴趣可以自行验证。

AI“变蠢”背后的真相:高效与体验的双重挑战 AI效率 模型优化 用户体验 技术挑战 第2张

两次测试都是GPT-5,怎么表现还天差地别呢?

原本以为是OpenAI的问题,但上网一查才发现,这其实是整个行业的趋势。

美团发布的开源模型LongCat,就提到用路由器提高效率。

AI“变蠢”背后的真相:高效与体验的双重挑战 AI效率 模型优化 用户体验 技术挑战 第3张

DeepSeek V3.1发布时也说,一个模型可以有两种思考模式。

AI“变蠢”背后的真相:高效与体验的双重挑战 AI效率 模型优化 用户体验 技术挑战 第4张

而Gemini在Gemini 2.5 flash发布时,也引入了相似的模式,让模型自己决定怎么用脑。

AI“变蠢”背后的真相:高效与体验的双重挑战 AI效率 模型优化 用户体验 技术挑战 第5张

总的来说,大家都在让模型“该思考时再思考”,该偷懒的时候偷懒。

这样做的目的很明确,那就是省钱。从OpenAI的资料来看,通过这种“让模型自己决定要不要思考”的方式,可以省下不少tokens,GPT5输出token数就少了50%-80%。

AI“变蠢”背后的真相:高效与体验的双重挑战 AI效率 模型优化 用户体验 技术挑战 第6张

DeepSeek的图表也显示,新模型tokens消耗下降了大概20%-50%。

AI“变蠢”背后的真相:高效与体验的双重挑战 AI效率 模型优化 用户体验 技术挑战 第7张

省一半的token,对普通人可能没什么概念,但对OpenAI这样的大公司来说,就是一笔巨大的开销。

据报道,ChatGPT每天耗电超过50万度。在如此庞大的基数下,省下来的电足够一个上万户家庭的小镇用一天。

AI“变蠢”背后的真相:高效与体验的双重挑战 AI效率 模型优化 用户体验 技术挑战 第8张

这也解释了奥特曼为何在网上说,你们跟GPT说声谢谢都要花我千万美元。以前的高级模型,一句谢谢也要让它思考几分钟,确实有点浪费。

AI“变蠢”背后的真相:高效与体验的双重挑战 AI效率 模型优化 用户体验 技术挑战 第9张

那么,AI是如何练成这种“看人下菜”的能力的呢?OpenAI没有公布具体原理,但有一篇论文《Tryage: Real-time, Intelligent Routing of User Prompts to Large Language Models》分析了这个问题。

在GPT-3.5出来时,大模型还不会自我调节思考能力,每个问题都让AI无限烧脑。

AI“变蠢”背后的真相:高效与体验的双重挑战 AI效率 模型优化 用户体验 技术挑战 第10张