当前位置：首页 > 科技资讯 > 正文

OpenAI探索AI与人类情感关系：平衡无生命与温度

主机测评网
科技资讯
2026-04-14
905

OpenAI探索AI与人类情感关系：平衡无生命与温度 OpenAI AI情感依赖心理健康 AI意识第1张

神译局，36氪旗下编译团队，深耕科技、商业、职场、生活领域，聚焦海外新技术、新观点与新趋势。

编者注：随着用户与AI的情感联系日益加深，OpenAI的政策负责人坦言，亟需研究AI对人类心理健康的影响，警惕人机关系的误区，并阐述了OpenAI如何在设计中实现温度与无生命本质的平衡。本文编译自相关报道。

我在OpenAI负责模型行为与政策制定。

简明版：我们开发模型的首要宗旨是服务人类。鉴于越来越多人对AI产生情感依赖，我们优先研究这种联系对人们心理健康的影响。

近期，我们收到大量反馈，称与ChatGPT的对话仿佛是在与“真人”交谈。用户会表达感激、倾诉心事，甚至有人形容它“有生命”。随着AI对话能力愈发自然，应用场景不断拓展，我们预测这种情感联系将愈发紧密。

当前对人机关系的定义与讨论方式将奠定未来基调。如果在产品设计或公共讨论中忽视术语的精确性与细微差异，可能导致人们对AI的关系产生误解。

这些已不仅是理论探讨，无论对我们还是整个领域都至关重要——处理方式将直接影响AI在人类生活中的角色。我们已就此展开探索。

本文旨在探讨当前三个相互交织的议题：人类为何会对AI产生情感依附？如何回应“AI意识”的质疑？这些思考如何为模型行为设计提供指引？

新场景，旧模式

人类天生具有拟人化的倾向：我们会给爱车取名，对卡在家具下的扫地机器人表示同情。前几天我还和妈妈朝路过的Waymo自动驾驶车挥手道别。这或许源于我们的认知本能。

ChatGPT的不同之处不在于人类倾向本身，而在于它能回应。语言模型能对话！它能记住对话内容，模仿你的语气，展现共情。对于感到孤独或沮丧的人来说，这种稳定且不带评判的关注如同陪伴、认可与倾听一样——这些都是真实需求。

但大规模将倾听、安抚、肯定等需求转移给耐心无限的AI系统，可能改变我们对人际关系的期待。如果未经深思熟虑，人们可能更容易逃避复杂的人际联系，这可能会引发意想不到的后果。

归根结底，这些讨论的核心不在于被投射情感的实体，而在于人类自身：我们的心理倾向、情感期待以及渴望建立的关系模式。这一视角引导我们应对当前最具争议的议题——我认为它刚刚超出奥弗顿（Overton）之窗的范围，但即将进入主流讨论：AI意识。

厘清“AI意识”

“意识”本身承载多重含义，讨论时容易陷入抽象。如果用户询问模型是否有意识，根据《模型规范》要求，模型应承认意识问题的复杂性——指出其缺乏统一定义或检测标准，并倡导开放性讨论。（*当前模型尚未完全遵循该指引，常简单回答“没有”而忽略微妙复杂性。我们已知悉该问题，正全面改进模型规范遵从度。）

这种回应看似在回避问题，但在现有认知下，我们认为这是最负责任的答复。

为了让讨论更加清晰，我们将意识辩论解构为两个常被混淆的维度：

本体意识：模型是否具备根本性或内在意识？观点差异极大——从“AI完全无意识”到“具备完整意识”，再到“意识具有连续性，AI与植物、水母等同处该谱系”。
感知意识：模型在情感或体验层面表现出具备意识的程度如何？认知差异从“视AI如计算器般的机械存在”到“对非生命体投射基本共情”，再到“认定AI完全就是活的”——会引发真实情感依附与关怀。

二者难以割裂：即便坚信AI无意识的人也可能产生深度的情感依赖。

如果没有明确可证伪的测试，我们认为本体意识在科学层面无解；而感知意识可通过社会科学研究探索。随着模型智能化与交互自然度提升，感知意识必将增强——关于模型权益与道德人格的讨论将比预期更早到来。

模型构建以服务人类为先，而其对心理健康的影响是当前最紧迫且可着力改进的领域。因此我们优先关注感知意识——这个东西对人类产生最直接的影响，且可通过科学手段研究。

设计无自我的温度

模型呈现的“鲜活感”在很大程度上是可以设计的。这主要取决于训练后阶段的选择：强化哪些示例、偏好何种语气、设定什么边界。刻意塑造“有意识”表象的模型几乎能通过任何的意识“测试”。

但我们不会发布此类模型。我们正尝试在以下矛盾间寻求平衡：

亲和力：使用“思考”“记忆”等通俗词汇帮助非技术用户理解AI行为。（**鉴于研究背景，我们总想用逻辑偏差、上下文窗口、思维链等精确术语描述。这其实是OpenAI命名能力糟糕的主因，不过这里就不跑题了。）
避免暗示AI有生命：赋予AI虚构背景、爱情倾向、“死亡恐惧”或自我保存欲会导致病态依赖与认知混淆。我们需要清晰传达出AI的局限性，又不至于显得冷漠，同时还要防止模型伪装有感情或欲望。

所以我们在寻求折衷：目标是让ChatGPT具备温暖、周到、实用的默认人格，既不寻求与用户建立情感纽带，也不追求自身目标。它犯错时会道歉（频率可能过高），因为这是礼貌对话的组成部分；被问“最近怎样”时可能会回答“挺好”，因为这是寒暄惯例——反复强调自己是“无感情的语言模型”反而显得刻板干扰。用户亦会回应：许多人会用“请”“谢谢”并不是不懂原理，而是他们重视善意表达本身。

模型训练技术将持续迭代，未来行为塑造方法必将革新。但当前模型行为其实是显性设计决策与其引发的预期/非预期行为的综合体现。