当前位置：首页 > 科技资讯 > 正文

大模型幻觉：根源、挑战与未来路径

主机测评网
科技资讯
2026-05-10
855

《Science》杂志最新报道揭示，大型语言模型存在一个难以克服的弱点：幻觉问题难以彻底根除。尽管AI制造商试图通过让模型在不确定情况下说「我不知道」来减少幻觉，但这可能会影响到用户的留存与活跃度，从而对商业利益构成威胁。

在OpenAI完成重组并解除上市限制的同一天，《Science》杂志发表了一篇热门文章，暴露了大模型的一个先天致命弱点，这个弱点使得大模型难以完全摆脱幻觉的困扰。

大模型幻觉：根源、挑战与未来路径大模型幻觉评估机制商业影响第1张

文章指出，尽管OpenAI完成了期待已久的重组，但其核心产品仍会出现幻觉。

过去我们常将这类幻觉归咎于训练数据的质量问题，但这个解释并不全面。

上个月，OpenAI与佐治亚理工学院的研究团队在一篇预印本论文中指出：

就像学生在考试中遇到难题时会「蒙」答案一样，大模型在不确定的情况下也会倾向于「猜」，生成看似合理但其实错误的回答，而不是承认自己不知道。

大模型幻觉：根源、挑战与未来路径大模型幻觉评估机制商业影响第2张

论文链接：《大模型为何会产生幻觉》

在不确定时选择「我不知道」，可以显著降低幻觉，但为什么模型设计者没有这样做呢？

研究人员认为，问题主要出在大模型的训练和评估机制上：

在大模型的训练和评估过程中，更倾向于「奖励猜测」，而不是「鼓励承认不确定性」。

但要改变这一点并不容易。

让大模型学会说「我不知道」，也可能动摇AI厂商的商业根基。

例如，有人质疑OpenAI是否会真心让自家模型更重视「真实性」而不是「吸引力」。

这是一个极大的挑战。

如果ChatGPT经常回答「我不知道」，用户可能会流失到竞争对手那里。

大模型幻觉为何难以根除？

「如果把幻觉彻底修好，可能会削弱产品的吸引力」。

谢菲尔德大学的AI研究员魏星曾发文称OpenAI的「反幻觉」方案可能会削弱ChatGPT的市场竞争力。

大模型幻觉：根源、挑战与未来路径大模型幻觉评估机制商业影响第3张

OpenAI的研究人员认为，幻觉并不神秘。他们分析了大模型在预训练阶段可能导致的错误，发现即使训练数据无误，预训练目标也可能使模型产生错误。

大模型幻觉：根源、挑战与未来路径大模型幻觉评估机制商业影响第4张

研究人员进一步指出，幻觉之所以在后续阶段持续存在，是因为主流评估体系的评分方式鼓励模型像学生考试一样去「猜」，而不是诚实地表达不确定性。

OpenAI曾探讨过幻觉难以根除的原因，认为其源头在于预训练的「下一个词预测」：模型通过学习海量文本，掌握如何根据统计规律预测下一个词。

但这种预测方法就像囫囵吞枣，每个语句都没有通过「真/假」标签进行优化。当缺乏标记为错误的示例时，有效语句与无效语句的区分就显得尤为困难，因此会出现幻觉。

以图片识别为例，如果数百万张猫狗照片被标注为「猫」或「狗」，算法便能可靠分类。但如果改为按宠物生日标注照片，由于生日数据本质上随机，无论算法多么先进，此任务必然产生错误。

为什么大模型「刷榜」难杜绝？

OpenAI官方博客在介绍这篇论文时，将幻觉描述为「看似合理却错误的陈述」。

大模型幻觉：根源、挑战与未来路径大模型幻觉评估机制商业影响第5张

博客链接：https://openai.com/zh...

而且幻觉的出现具有不可预知性，它可能以出人意料的方式出现。

比如，你询问一篇论文的标题，它会自信地给出三个不同答案，但都是错误的。

该论文的合著者、OpenAI研究科学家Adam Kalai认为，虽然我们永远不可能做到100%准确，但这并不意味着模型必须要产生幻觉。

解决之道可以在「后训练」阶段，借助人类反馈和其他微调（fine-tuning）方法会引导模型变得更安全、更精确。

阿里云服务器云服务器高防服务器

本文由主机测评网于2026-05-10发表在主机测评网_免费VPS_免费云服务器_免费独立服务器，如有疑问，请联系我们。
本文链接：https://www.vpshk.cn/20260544183.html

大模型幻觉：根源、挑战与未来路径

大模型幻觉为何难以根除？

为什么大模型「刷榜」难杜绝？

Grok两大升级震撼登场：2M上下文与逼真图像生成

中东企业乐舒适登陆港交所：从零突破看中东与香港合作新篇章

大模型幻觉：根源、挑战与未来路径

大模型幻觉为何难以根除？

为什么大模型「刷榜」难杜绝？

Grok两大升级震撼登场：2M上下文与逼真图像生成

中东企业乐舒适登陆港交所：从零突破看中东与香港合作新篇章

相关文章