当前位置:首页 > 科技资讯 > 正文

AI审稿占比21%:ICLR 2026的“人机”争议

学术圈再次迎来了令人瞠目的一幕。

一项最新公布的分析显示,在顶级人工智能会议ICLR 2026中,超过五分之一的审稿意见是由大模型一键生成的。

卡内基梅隆大学的Graham Neubig教授利用Pangram Labs的AI文本检测工具EditLens,对ICLR公开的75800条评审意见进行了逐一「验明正身」,结果发现:21%被判定为「完全由AI生成」,另外35%则不同程度地受到了AI的修改,仅剩43%被认为是纯人类撰写。

AI审稿占比21%:ICLR 2026的“人机”争议 ICLR AI审稿 AI生成 学术评审 第1张

这些「AI全包」的评审不仅篇幅更长,给出的分数也更高:

在EditLens的统计中,完全AI生成的评审平均评分为4.43分,而完全人类撰写的则为4.13分;AI评审的平均长度接近3700个字符,比人类评审长出一大截。

许多作者这次面对的,可能是一位「特别健谈、格外慷慨打分」的机器人审稿人。

被AI「占领」的

是谁家的主场?

ICLR(国际学习表征大会)是当今机器学习领域的三大顶级会议之一,与NeurIPS、ICML并称「AI三巨头」。

本届ICLR 2026将于明年4月在巴西里约热内卢举办,投稿量接近两万篇,远超往年。

面对这样的「论文洪流」,审稿人的压力极大,许多人半开玩笑地说自己像是在「批改高考作文」。

让AI来帮忙,其实早已是公开的秘密。

关键的区别在于,这一次是用数据把秘密摊在了阳光下。

EditLens本身就是一篇ICLR 2026的投稿论文,作者提出了一种能识别「人写+AI润色」、「纯AI写作」等细粒度混合文本的检测模型,并宣称在区分人类和AI文本时能达到很高的准确率。

AI审稿占比21%:ICLR 2026的“人机”争议 ICLR AI审稿 AI生成 学术评审 第2张

https://arxiv.org/pdf/2510.03154

Pangram Labs这家公司也专门对外宣传,自己的模型在多种场景下「假阳性率极低」,已经被期刊和高校用来筛查AI写作。

于是,一家做「AI检测器」的公司,用自家模型扫描了全球最重要的AI会议之一的审稿意见,得出的结论是:AI已经大举攻入人类学术评审的心脏地带。

讽刺的是

ICLR刚刚立下「史上最严AI新规」

更戏剧性的是,这次「AI审稿占比21%」的爆料,恰好发生在ICLR颁布史上最严格的LLM规定之后不久。

今年8月,ICLR 2026组委会在官方博客上发布了《大型语言模型使用政策》,给出了两条铁律:无论是否使用大模型,都必须如实写出来;不管用了什么工具,最终责任都算在人身上。

AI审稿占比21%:ICLR 2026的“人机”争议 ICLR AI审稿 AI生成 学术评审 第3张

如果发现作者在论文写作或研究中大量使用LLM却没有披露,可以直接desk reject(拒稿不再审);审稿人如果用AI写评审却不承认,同样有可能连自己的论文一起被拒。

一边是官方高调强调「用AI必须坦白,从严问责」;另一边,是第三方工具在公开页面上给出一行冷冰冰的统计:「Fully AI-generated: 15899 (21%)」。

这种强烈的反差,很难不让人怀疑:有相当一部分审稿人,在政策高压之下,依旧默默把评审任务交给了大模型。

ICLR在舆情爆发后,也只是做出了一个简短的回应:

AI审稿占比21%:ICLR 2026的“人机”争议 ICLR AI审稿 AI生成 学术评审 第4张

作者炸锅

低分、怪评,与「精神病」评论

这届ICLR的评审,已经让不少投稿者心态爆炸。腾讯新闻对ICLR 2026出分做过一篇长文梳理:投稿量猛增到1.9万多篇,平均得分却从去年的5.12掉到4.20,出现了作者人生首次在顶会上收获「0分」的极端情况。

更令人瞠目的是,有评审在意见中使用了「精神病」这样的攻击性词汇,引发社区公愤,最后原始评论被删除,审稿人公开道歉,但坚持认为「对论文问题的判断没错」。

AI审稿占比21%:ICLR 2026的“人机”争议 ICLR AI审稿 AI生成 学术评审 第5张

还有审稿人抱怨,自己经手的论文写得像AI拼出来的,「新术语没定义,引用乱飞,实验稀碎」,让人要花好几个小时才能看懂,结果作者一句撤稿就换会重投。

在这篇报道里,DeepMind研究员Neel Nanda被引用的一句话格外刺耳:同行评审更像一台「随机数生成器」——同一篇论文,换一组审稿人,一半概率被拒。

现在再把这句话和「21%审稿由AI写成」放在一起看,难免让人多想:

如果评审本来就有很大的随机性,再加上一堆看起来严谨实则模板化的AI长评,这台「随机数机」会不会变得更难预测?

其他顶会在干什么?

ICLR不是第一家也不会是最后一家被AI冲击审稿系统的学术机构,只是因为自身是AI顶会而显得格外「魔幻」。

在计算机视觉顶会CVPR 2025中,审稿指南直接写明:大模型在任何阶段都不得用于撰写评审或元评审,属于零容忍政策;

AI审稿占比21%:ICLR 2026的“人机”争议 ICLR AI审稿 AI生成 学术评审 第6张

不负责任的审稿意见可能会被标记为「高度不负责任」,严重时会牵连审稿人自己的投稿被拒。

NeurIPS 2025的态度则更像「谨慎开放」:允许在写论文时使用LLM但要求作出说明;还设立了页面解释如何合规地用AI强调不得把模型生成的引用不加核查地塞进文中。

AI审稿占比21%:ICLR 2026的“人机”争议 ICLR AI审稿 AI生成 学术评审 第7张