当前位置:首页 > 科技资讯 > 正文

AI幻觉:大模型的挑战与未来

AI的能力可谓强大,但一旦开始胡扯,就让人不胜其烦。

它不仅能一本正经地编造出从未见过的事情,

AI幻觉:大模型的挑战与未来 AI幻觉 大模型 OpenAI 模型训练 第1张

也会在最基本的比较大小问题上栽跟头。

AI幻觉:大模型的挑战与未来 AI幻觉 大模型 OpenAI 模型训练 第2张

从惊艳问世的ChatGPT到默默落地的DeepSeek V3.1,没有一个大模型能完全避开幻觉的困扰。

为什么大模型总是伴随着幻觉?

这个问题在互联网上成了未解之谜,但上周OpenAI的一篇论文中提出了一个有趣的观点。

“造成AI幻觉的根源可能在于人类训练AI的过程。”

AI幻觉:大模型的挑战与未来 AI幻觉 大模型 OpenAI 模型训练 第3张

简而言之,不是AI不行,而是我们训练它的方式不对。这锅,我们得背。

为什么要把这归咎于人类?

要回答这个问题,就得从内外两个层面来理解大模型。

一方面,大模型训练的机制决定了它们天生就容易产生幻觉,这是AI幻觉的“内忧”。

在训练模型时,模型要从海量的文本中学会预测下一个单词的能力。

AI幻觉:大模型的挑战与未来 AI幻觉 大模型 OpenAI 模型训练 第4张

因此,只要一句话看起来像是人话,模型就会开始学习它的结构。

但模型有时候只顾着学结构了,这句话的内容到底对不对,它可分辨不了。

例如,如果我们拿出火锅的照片来让大模型判断这是什么动物,那么模型就会开始分析火锅的特征,发现它的毛是金色的、很长、很大只,同时可能还有92.5%的概率是只狗。

AI幻觉:大模型的挑战与未来 AI幻觉 大模型 OpenAI 模型训练 第5张

而模型在过去的学习过程中,能从不同的图片中学到狗的长相特征。于是把这些特征连接起来一判断,就会发现它有很大的概率是一只金毛。

但如果我们换个问题,问它火锅是哪年哪月出生的,那大模型就直接懵了。这个问题模型肯定没学过,光是看图像,谁也没法知道这只狗的生日是啥时候。

AI幻觉:大模型的挑战与未来 AI幻觉 大模型 OpenAI 模型训练 第6张

如果此时模型还在硬着头皮回答,随便编个答案抛出来,那就变成了我们常说的幻觉问题。

产生幻觉可以说是大模型的天性。换个角度来看,大模型的本质就是词语接龙,只不过答对了的题目会被我们认为是正确,答错了的题目被我们称之为幻觉。

AI幻觉:大模型的挑战与未来 AI幻觉 大模型 OpenAI 模型训练 第7张

同时另一方面,我们现在训练大模型、给模型打分评估的方式也是让模型的幻觉问题变得更加严重的“外患”。

还是刚才那个问生日的问题,我们把训练的过程简化一下:

假设模型回答对了一个问题,加一分;回答错了问题则不加分。

那么当我们问它火锅的生日的时候,如果模型直接选择摆烂说不知道,那么它一辈子都只是个零蛋。

但如果它开始瞎猜,随便说个日期出来,那么可能会有三百六十五分之一的概率给它蒙对了。

一边是绝对失败,一边是几百分之一的概率答对。

只要模型选择了瞎猜,那么它最后的平均得分就永远都比放弃做答要来的高一些。

所以为了能在人类定制的排行榜里刷到更高的分,越来越多的大模型也失去了说“我不知道”的权利。对于追求分数的模型来说,瞎猜成了唯一的理性选择,而诚实则是一种最愚蠢的策略。