在数字时代,网络上的文字愈发显得千篇一律,带有明显的「AI痕迹」。信息如风景般光鲜亮丽,事件总是关键所在,语言被雕琢成无懈可击的模板。在此背景下,Wikipedia凭借其敏锐的洞察力,率先发起了清除行动。
如今,互联网上的句子似乎都出自同一人之手。不论是描述风景的词汇,还是形容建筑的词汇,亦或是描述事件的词汇,都如出一辙。
用词如“breathtaking”(令人惊叹的)和“modern”(现代的)频繁出现,事件则“标志着一个关键时刻”。这些词句看似完美,却如同空有其表,让人读来有种虚无缥缈的感觉。
Wikipedia的编辑们对这种「广告腔」早已忍无可忍,遂发起了一场清理行动。在检查大量新增内容后,他们惊讶地发现,这些空洞的言辞背后,竟隐藏着AI的身影。
于是,一本旨在识别AI文风的手册应运而生,在无数次的删改中逐渐完善。
互联网的语言愈发趋同,Wikipedia是最先嗅到「异样」的。每天有成千上万的新内容被添加到条目中,编辑们在巡查中逐渐发现:许多新增段落虽然流畅,但读来却像是陈词滥调。
编辑们越看越觉得不对劲。当他们把这些可疑段落汇集在一起时,真相大白:
来源模糊、论据空洞、表达惊人地一致。这一切似乎都在指向一个事实——越来越多的内容是由AI生成的。
为了避免百科被这些空洞的句子侵蚀,一群志愿者在2023年发起了WikiProject AI Cleanup。
他们系统记录这些异常写法,试图找出AI到底在哪里露出马脚,哪些句子看似正常却经不起查证。
清理行动初期,编辑们就发现检测器并不靠谱。
真正有用的,是他们在多年巡查中练就的「语感」。
AI生成的段落表面看似正常,但仔细审视,会发现三种明显的痕迹。
首先,它们反复强调「重要性」,却不给出现实中的例子。
例如,“a pivotal moment”和“a broader movement”等表达在AI生成的段落中屡见不鲜,但缺乏具体的年份、来源和可查证的材料。
其次,句尾挂着体面的现在分词。
如“emphasizing… reflecting… highlighting…”这样的尾句是AI文章的明显标志。
TechCrunch的作者也指出:
这类present participle是区分AI文风的关键线索之一。
第三,频繁使用互联网式的「营销形容词」。如“breathtaking”、“modern”、“renowned”、“scenic”等词在广告中常见,但在百科中却显得格格不入。
这些规律后来被整理进了《Signs of AI writing》。比起技术指南,它更像一本经验手册,记录了编辑们遇到的坑和怪句式,方便更多人一起清理。
当编辑们把可疑句式整理出来后,一个问题变得清晰:AI之所以这样写,根本原因在于人类语料。
也就是说,它从哪里学到的语言,就会用什么样的语言。
因为大型模型训练时吃的是整个互联网的语料。新闻稿、SEO软文、宣传册、社交平台的内容都会混在一起。
而这些地方最常见的表达就是宏大但空泛、形容词夸张但没事实、评价多于证据的写法。
Wikipedia将这种现象称为“Vague praise”和“Marketing language”。
换句话说,AI不是故意用「公关腔」,而是这类语料最容易在互联网上抓取。
这也解释了为什么“重要性夸大”、“-ing 尾巴”、“广告式形容词”会频繁出现——这些是模型在大语料里看到得最多、最容易复制、也最缺乏上下文约束的句式。
维基编辑在清理中发现,最能看出「AI味」的地方是句子是否有「事实」。
AI喜欢用形容词和评价支撑文章结构,而百科写作靠的是年份、数量、地点、报道来源这种能查到的事实。
本文由主机测评网于2026-05-13发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260545012.html