AI的能力可谓强大,但一旦开始胡扯,就让人不胜其烦。
它不仅能一本正经地编造出从未见过的事情,
也会在最基本的比较大小问题上栽跟头。
从惊艳问世的ChatGPT到默默落地的DeepSeek V3.1,没有一个大模型能完全避开幻觉的困扰。
为什么大模型总是伴随着幻觉?
这个问题在互联网上成了未解之谜,但上周OpenAI的一篇论文中提出了一个有趣的观点。
“造成AI幻觉的根源可能在于人类训练AI的过程。”
简而言之,不是AI不行,而是我们训练它的方式不对。这锅,我们得背。
为什么要把这归咎于人类?
要回答这个问题,就得从内外两个层面来理解大模型。
一方面,大模型训练的机制决定了它们天生就容易产生幻觉,这是AI幻觉的“内忧”。
在训练模型时,模型要从海量的文本中学会预测下一个单词的能力。
因此,只要一句话看起来像是人话,模型就会开始学习它的结构。
但模型有时候只顾着学结构了,这句话的内容到底对不对,它可分辨不了。
例如,如果我们拿出火锅的照片来让大模型判断这是什么动物,那么模型就会开始分析火锅的特征,发现它的毛是金色的、很长、很大只,同时可能还有92.5%的概率是只狗。
而模型在过去的学习过程中,能从不同的图片中学到狗的长相特征。于是把这些特征连接起来一判断,就会发现它有很大的概率是一只金毛。
但如果我们换个问题,问它火锅是哪年哪月出生的,那大模型就直接懵了。这个问题模型肯定没学过,光是看图像,谁也没法知道这只狗的生日是啥时候。
如果此时模型还在硬着头皮回答,随便编个答案抛出来,那就变成了我们常说的幻觉问题。
产生幻觉可以说是大模型的天性。换个角度来看,大模型的本质就是词语接龙,只不过答对了的题目会被我们认为是正确,答错了的题目被我们称之为幻觉。
同时另一方面,我们现在训练大模型、给模型打分评估的方式也是让模型的幻觉问题变得更加严重的“外患”。
还是刚才那个问生日的问题,我们把训练的过程简化一下:
假设模型回答对了一个问题,加一分;回答错了问题则不加分。
那么当我们问它火锅的生日的时候,如果模型直接选择摆烂说不知道,那么它一辈子都只是个零蛋。
但如果它开始瞎猜,随便说个日期出来,那么可能会有三百六十五分之一的概率给它蒙对了。
一边是绝对失败,一边是几百分之一的概率答对。
只要模型选择了瞎猜,那么它最后的平均得分就永远都比放弃做答要来的高一些。
所以为了能在人类定制的排行榜里刷到更高的分,越来越多的大模型也失去了说“我不知道”的权利。对于追求分数的模型来说,瞎猜成了唯一的理性选择,而诚实则是一种最愚蠢的策略。
本文由主机测评网于2026-04-28发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260441058.html