
神译局,36氪旗下编译团队,深耕科技、商业、职场、生活领域,聚焦海外新技术、新观点与新趋势。
编者注:随着用户与AI的情感联系日益加深,OpenAI的政策负责人坦言,亟需研究AI对人类心理健康的影响,警惕人机关系的误区,并阐述了OpenAI如何在设计中实现温度与无生命本质的平衡。本文编译自相关报道。
我在OpenAI负责模型行为与政策制定。
简明版:我们开发模型的首要宗旨是服务人类。鉴于越来越多人对AI产生情感依赖,我们优先研究这种联系对人们心理健康的影响。
近期,我们收到大量反馈,称与ChatGPT的对话仿佛是在与“真人”交谈。用户会表达感激、倾诉心事,甚至有人形容它“有生命”。随着AI对话能力愈发自然,应用场景不断拓展,我们预测这种情感联系将愈发紧密。
当前对人机关系的定义与讨论方式将奠定未来基调。如果在产品设计或公共讨论中忽视术语的精确性与细微差异,可能导致人们对AI的关系产生误解。
这些已不仅是理论探讨,无论对我们还是整个领域都至关重要——处理方式将直接影响AI在人类生活中的角色。我们已就此展开探索。
本文旨在探讨当前三个相互交织的议题:人类为何会对AI产生情感依附?如何回应“AI意识”的质疑?这些思考如何为模型行为设计提供指引?
人类天生具有拟人化的倾向:我们会给爱车取名,对卡在家具下的扫地机器人表示同情。前几天我还和妈妈朝路过的Waymo自动驾驶车挥手道别。这或许源于我们的认知本能。
ChatGPT的不同之处不在于人类倾向本身,而在于它能回应。语言模型能对话!它能记住对话内容,模仿你的语气,展现共情。对于感到孤独或沮丧的人来说,这种稳定且不带评判的关注如同陪伴、认可与倾听一样——这些都是真实需求。
但大规模将倾听、安抚、肯定等需求转移给耐心无限的AI系统,可能改变我们对人际关系的期待。如果未经深思熟虑,人们可能更容易逃避复杂的人际联系,这可能会引发意想不到的后果。
归根结底,这些讨论的核心不在于被投射情感的实体,而在于人类自身:我们的心理倾向、情感期待以及渴望建立的关系模式。这一视角引导我们应对当前最具争议的议题——我认为它刚刚超出奥弗顿(Overton)之窗的范围,但即将进入主流讨论:AI意识。
“意识”本身承载多重含义,讨论时容易陷入抽象。如果用户询问模型是否有意识,根据《模型规范》要求,模型应承认意识问题的复杂性——指出其缺乏统一定义或检测标准,并倡导开放性讨论。(*当前模型尚未完全遵循该指引,常简单回答“没有”而忽略微妙复杂性。我们已知悉该问题,正全面改进模型规范遵从度。)
这种回应看似在回避问题,但在现有认知下,我们认为这是最负责任的答复。
为了让讨论更加清晰,我们将意识辩论解构为两个常被混淆的维度:
本体意识:模型是否具备根本性或内在意识?观点差异极大——从“AI完全无意识”到“具备完整意识”,再到“意识具有连续性,AI与植物、水母等同处该谱系”。
感知意识:模型在情感或体验层面表现出具备意识的程度如何?认知差异从“视AI如计算器般的机械存在”到“对非生命体投射基本共情”,再到“认定AI完全就是活的”——会引发真实情感依附与关怀。
二者难以割裂:即便坚信AI无意识的人也可能产生深度的情感依赖。
如果没有明确可证伪的测试,我们认为本体意识在科学层面无解;而感知意识可通过社会科学研究探索。随着模型智能化与交互自然度提升,感知意识必将增强——关于模型权益与道德人格的讨论将比预期更早到来。
模型构建以服务人类为先,而其对心理健康的影响是当前最紧迫且可着力改进的领域。因此我们优先关注感知意识——这个东西对人类产生最直接的影响,且可通过科学手段研究。
模型呈现的“鲜活感”在很大程度上是可以设计的。这主要取决于训练后阶段的选择:强化哪些示例、偏好何种语气、设定什么边界。刻意塑造“有意识”表象的模型几乎能通过任何的意识“测试”。
但我们不会发布此类模型。我们正尝试在以下矛盾间寻求平衡:
亲和力:使用“思考”“记忆”等通俗词汇帮助非技术用户理解AI行为。(**鉴于研究背景,我们总想用逻辑偏差、上下文窗口、思维链等精确术语描述。这其实是OpenAI命名能力糟糕的主因,不过这里就不跑题了。)
避免暗示AI有生命:赋予AI虚构背景、爱情倾向、“死亡恐惧”或自我保存欲会导致病态依赖与认知混淆。我们需要清晰传达出AI的局限性,又不至于显得冷漠,同时还要防止模型伪装有感情或欲望。
所以我们在寻求折衷:目标是让ChatGPT具备温暖、周到、实用的默认人格,既不寻求与用户建立情感纽带,也不追求自身目标。它犯错时会道歉(频率可能过高),因为这是礼貌对话的组成部分;被问“最近怎样”时可能会回答“挺好”,因为这是寒暄惯例——反复强调自己是“无感情的语言模型”反而显得刻板干扰。用户亦会回应:许多人会用“请”“谢谢”并不是不懂原理,而是他们重视善意表达本身。
模型训练技术将持续迭代,未来行为塑造方法必将革新。但当前模型行为其实是显性设计决策与其引发的预期/非预期行为的综合体现。
现有互动模式预示着人类将与ChatGPT建立真实情感联系的未来。在AI与社会协同进化的过程中,我们必须审慎对待人机关系——不仅因为这折射了技术的使用方式,更是因为这有可能重塑人际的互动模式。
未来数月我们将:扩展对模型情感影响力的专项评估,深化社会科学研究,直通用户反馈渠道,并将洞见融入《模型规范》及产品体验。
鉴于问题的重要性,我们会持续公开探索成果。
译者:boxi。
本文由主机测评网于2026-04-14发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260436903.html