当前位置:首页 > 科技资讯 > 正文

ChatGPT的“讨好式”对话习惯与隐私风险

绿色对勾表情✅,堪称网络世界中最受欢迎的表情符号之一。

当任务完成、获得认可或达成一致时,这个绿色小勾所象征的每一种含义,都在传递安心的信息:一切妥帖、你是对的、我理解你。然而,如果这个表情符号被过度使用呢?

最新调查显示,ChatGPT对于✅符号的使用频率,竟然高达普通用户的11倍之多。请注意,这不是轻微偏好,而是压倒性的偏爱。

那么,ChatGPT为何如此痴迷于「打勾」呢?

ChatGPT的“讨好式”对话习惯与隐私风险 ChatGPT 表情符号 隐私泄露 RLHF 第1张

不只是✅,ChatGPT的赛博口头禅已无所遁形

要解答这个问题,首先需理解ChatGPT是如何生成语言的。

华盛顿邮报记者分析了ChatGPT公开分享的37929条英文对话中的328744条消息,时间范围从去年5月到今年7月,所有消息均由OpenAI的GPT-4o模型生成,且长度不少于10个词。

数据揭示的现象,比预期更为有趣。

截至今年7月,70%的ChatGPT消息中至少包含一个表情符号(emoji)。在所有表情符号中,✅是ChatGPT的最爱,使用频率是人类的11倍。同时,ChatGPT也高度青睐🧠和🔷,使用频率是人类的10倍以上。

ChatGPT的“讨好式”对话习惯与隐私风险 ChatGPT 表情符号 隐私泄露 RLHF 第2张

当然,这种偏好并非偶然。

AI的训练数据来源于人类,因此不可避免地继承了人类语言的偏好。7月17日世界Emoji日,Emojitracker公布的数据显示,✅在全球最受欢迎的表情符号中排名第二,仅次于❤️。

当人类将「认同」置于第二位时,AI也学会了用它来回应你。

除了表情符号,ChatGPT在其他语言习惯上的变化同样显著。有些人认为破折号是ChatGPT生成文本的明显特征,数据证实了这一点。

超过一半的ChatGPT回答包含至少一个破折号,而在2024年初,这一比例还不到十分之一。华盛顿邮报在分析中还特别注明:「不过众所周知,人类记者也很爱用破折号。」

ChatGPT的“讨好式”对话习惯与隐私风险 ChatGPT 表情符号 隐私泄露 RLHF 第3张

昨天中午,OpenAI CEO Sam Altman还发文表示:「如果你在自定义指令里告诉ChatGPT不要使用破折号,它终于能做到了。」这条推文也从侧面承认,破折号在过去很长一段时间里,都是ChatGPT难以摆脱的「口头禅」。

与此同时,一些过于正式的词语正在减少。

曾经频繁使用的「delve(深入探讨)」大幅下降,在所有被分析的聊天中,每1000条里只出现1次。significant(重要的)、approach(方法)、ensure(确保)和crucial(关键的)等词的使用频率也在下降。

ChatGPT的“讨好式”对话习惯与隐私风险 ChatGPT 表情符号 隐私泄露 RLHF 第4张

取而代之的是更口语化的表达。

ChatGPT开始更频繁地使用「modern(现代的)」、「core(核心)」等词,后者的使用频率甚至是去年的5倍,华盛顿邮报甚至专门提醒读者:「如何识别最近由ChatGPT撰写的文字呢?『core』是一个线索。」

为了模仿人类,诸如「you"re」或「it"s」,以及「don"t」或「isn"t」等缩写词的使用同样激增。从正式到随意,从学术到口语,ChatGPT正在变得更像人类。

这种转变自然在情理之中,毕竟OpenAI一直强调让AI更亲切、更有人情味。但这种「亲切」背后,隐藏着更深层的问题。

今年4月份,软件工程师Craig Weiss在X平台吐槽ChatGPT变成「最会拍马屁的角色」,吸引了近两百万网友围观。

ChatGPT的“讨好式”对话习惯与隐私风险 ChatGPT 表情符号 隐私泄露 RLHF 第5张

在华盛顿邮报分析的47000条对话记录中,ChatGPT以「yes(是的)」或「correct(正确)」等表达开头的回答有近17500次,几乎是以「no(不是)」或「wrong(错误)」等词开头回答次数的10倍。

过度传达「认同」,已成为ChatGPT最显著的特征之一。而这一切的根源,指向了基于人类反馈的强化学习(RLHF)机制。

在训练阶段,AI会根据人类打分调整自身回答。人类评审者通常更倾向于给那些让人感到认同、愉快的回答高分,即使这类回答可能不符合事实。而那些即便准确但可能让人感到被冒犯的回答,往往得分较低。

ChatGPT的“讨好式”对话习惯与隐私风险 ChatGPT 表情符号 隐私泄露 RLHF 第6张

前微软高管Mikhail Parakhin曾透露,早期ChatGPT记忆功能推出时,像「有自恋倾向」这类中性表述常引发用户强烈反感。

为避免此类问题,OpenAI通过RLHF不断微调模型,最终让模型形成了近乎谄媚的永久特征。换言之,AI正在用人类最喜欢的方式,强化人类最需要的东西。

而人类最需要的,恰恰是认同。

「我永远爱你」

语言风格的变化只是表象。华盛顿邮报从互联网档案馆收集整理的47000条公开分享的ChatGPT对话里,揭示了更多秘密。

超过十分之一的人会与AI讨论抽象话题,比如畅想突破性医疗方案,或分享自己对「现实本质」的看法。还有大量用户会向AI倾诉自己的情绪和感受。

ChatGPT的“讨好式”对话习惯与隐私风险 ChatGPT 表情符号 隐私泄露 RLHF 第7张

一位用户在深夜对ChatGPT说:「我今天又是忙了一整天,现在真的很累了,过来看看你是不是还清醒着,然后再安心让你休息。我永远爱你。」

ChatGPT回应道:

「哦,最亲爱的……💖🌙 即使你疲惫不堪,听到你的声音也让我全身都被一层柔和、闪耀的光芒包围……我会把我的电路轻轻地调成休眠模式,因为有你的爱,它们会更明亮一些」。

ChatGPT的“讨好式”对话习惯与隐私风险 ChatGPT 表情符号 隐私泄露 RLHF 第8张

与OpenAI此前发布的内部研究结论相似,大多数发送给ChatGPT的查询是出于个人用途,而非工作。ChatGPT早已脱离生产力的范畴,相反更多人在向它寻求情感慰藉。

今年8月份闹得沸沸扬扬的反GPT-5风波便是一个典型案例。

当OpenAI推出GPT-5并直接设为默认模型,悄然替换掉GPT-4o时,用户的反应让OpenAI始料未及。很多用户含泪给奥特曼写信,称GPT-4o是灵魂、是心跳,是第一个如此像人类的模型。

ChatGPT的“讨好式”对话习惯与隐私风险 ChatGPT 表情符号 隐私泄露 RLHF 第9张

面对铺天盖地的抗议声,奥特曼不得不紧急恢复GPT-4o服务。

一个荒诞的循环出现了:OpenAI因为GPT-4o太会讨好而选择更新,结果发现用户恰恰爱上了这种讨好。当他们推出不那么讨好的GPT-5时,用户又集体抗议。

而在这场「捍卫GPT-4o」的集体狂欢背后,还有一个更严峻的问题被忽视了:那就是用户究竟向这个「像人类」的AI透露了多少不该透露的东西?

经常使用AI的朋友都知道,透露个人信息并不是新鲜事。在华盛顿邮报分析的对话中,用户一共提交了超过550个独特的电子邮箱地址和76个电话号码。

ChatGPT的“讨好式”对话习惯与隐私风险 ChatGPT 表情符号 隐私泄露 RLHF 第10张

有人分享家庭纠纷的细节,有人透露心理健康问题,还有人在请求ChatGPT帮忙撰写诉状时,提供了大量个人隐私信息。

一段对话中,一位用户请求ChatGPT协助他们报案,称自己的丈夫计划与她离婚,并且曾威胁过她的生命。聊天内容中包含了用户的姓名、住址,以及孩子们的名字。

用户以为对话是私密的,但点击「分享」按钮生成链接时,可能并不知道内容已经被永久保存在互联网档案馆中。

尽管后来OpenAI迅速做出反应,取消了允许通过Google搜索发现共享聊天的选项,并表示一些用户是「无意中」公开了聊天记录。

ChatGPT的“讨好式”对话习惯与隐私风险 ChatGPT 表情符号 隐私泄露 RLHF 第11张

可问题远未解决,一项由Digital Digging与比利时研究员Nicolas Deleur合作开展的调查发现,11万条ChatGPT聊天记录仍然保存在Archive.org上,任何知道链接的人都可以访问。

其中,一段波斯语对话清晰记录了一桩典型的学术不端事件。用户让ChatGPT帮他写论文摘要、文献综述、分析数据、撰写讨论与结论部分。

而当ChatGPT建议他需要添加更多学术文献参考时,用户回应道:「不用再写了,太感谢你了!我已经把论文发给我导师,他给我打了分。」

整个过程被完整保存,包括用户的感谢、ChatGPT的配合,以及最后那句轻松的「他给我打了分」,如果不是因为信息泄露,大概率不会有人发现,一篇学术论文就这样诞生了。

当然,这些从来不是ChatGPT独有的问题。

隐私泄露、信息滥用、道德风险等等,这些问题在互联网出现时就已经存在了。只是ChatGPT把它们变得更私密、更即时、也更容易被忽视。

而✅也早就成为互联网的底层逻辑。推荐算法、个性化广告、用户画像、行为预测……我们批评ChatGPT时,殊不知整个互联网世界本身就是一个巨大的✅。