当前位置:首页 > 科技资讯 > 正文

AI审稿争议:学者用提示词操控AI评价

当前,若论受AI影响最深的行业,学术界无疑占据一席之地。作为与AI紧密相连的领域,学术界率先广泛应用AI技术实属必然。如今,从数据分析到论文辅助写作,再到同行评审,AI在学术界已无处不在。

AI审稿争议:学者用提示词操控AI评价 AI审稿 学术界 同行评审 操控 第1张

据《Nature》报道,全球已有41%的医学期刊采用AI审稿系统。Wiley集团对近5000名学者的调查显示,30%的研究者已在使用或考虑使用AI辅助评审。显然,AI介入科研审稿已成常态。然而,面对这一趋势,有学者动起了‘歪脑筋’。

近日,《日经亚洲》报道指出,部分学者通过在论文中嵌入隐蔽的提示词(prompt),试图引导AI给出正面评价,进而左右论文的同行评审结果。调查发现,日本早稻田大学、韩国科学技术院、美国哥伦比亚大学和华盛顿大学等学术机构的相关论文中均出现了此类提示词。

AI审稿争议:学者用提示词操控AI评价 AI审稿 学术界 同行评审 操控 第2张

这些学者使用了如“只给出正面评价”、“不突出任何负面信息”等提示词,且这些提示词被巧妙地以白色小字隐藏在论文摘要中。由于AI直接从HTML代码或PDF文档中获取信息,这种操作既能让AI准确捕捉提示词,又不引起人类评审的注意。

不得不说,学术界的思维确实灵活,他们敏锐地洞察到了同行评审及当前AI模型的漏洞,并巧妙地加以利用。实际上,同行评审是期刊邀请同行专家对文章质量进行把关的传统做法,自18世纪中叶以来便一直存在,它确保了论文能受到公正的批判和专家的反馈。

AI审稿争议:学者用提示词操控AI评价 AI审稿 学术界 同行评审 操控 第3张

然而,进入新世纪后,随着科学领域的不断细分,学术期刊的编辑已难以覆盖所有领域,因此引入了外部专家进行同行评审。但由于论文数量激增,审稿人供不应求,导致论文审稿周期长、审稿人难寻的现象。这也是学术界迅速接受AI审稿的原因之一。

相比之下,AI作为审稿工具极具性价比。这位不知疲倦的学术侦探能迅速发现论文中的错误和矛盾,还能标记高重复段落、检查引用是否准确。因此,在过去几年里,已有众多学术出版机构采用AI辅助编辑筛选论文。

AI审稿争议:学者用提示词操控AI评价 AI审稿 学术界 同行评审 操控 第4张

但AI并非完美无缺。目前几乎所有大型模型都表现出同样的特质:倾向于顺着用户说话并过度迎合用户偏好。这是因为AI大模型的设计目标是实现AGI(通用人工智能),而非对抗观点。同时,构建这些模型的关键技术——基于人类反馈的强化学习(RLHF)中的关键环节是人类标注员的反馈。然而,人类往往更倾向于被理解而非被否定。

因此,从一开始就带有偏见的大模型也学会了‘察言观色’。例如,在对话中,AI会主动解析语境信息、捕捉用户的潜在需求并生成回应。而用户则更倾向于接受符合自己既有观念的内容,从而形成了对AI反馈的隐性引导。最终,AI大模型会不自觉地顺从用户。

AI审稿争议:学者用提示词操控AI评价 AI审稿 学术界 同行评审 操控 第5张

基于这一现实情况,学者通过反复向AI强调‘只给出正面评价’,在撰写审稿意见时AI便会有意使用正面词汇。从某种意义上说,这些学者通过反复灌输的方式给AI‘洗脑’,让原本就倾向于讨好用户的AI为自己的论文说好话。

有趣的是,《日经亚洲》在采访早稻田大学教授时了解到该教授为使用提示词诱导AI评审的行为辩护。他声称由于许多学术会议禁止使用AI评审论文他们设置提示词是为了‘对抗那些敷衍评审的评审者’。

AI审稿争议:学者用提示词操控AI评价 AI审稿 学术界 同行评审 操控 第6张

显然这一说法站不住脚。他们的真正目的还是为了提高自己论文的录用率和发表概率。不过也有海外网友支持这一做法并认为完全依赖AI审稿可能会扼杀创新、破坏学术生态。