当前位置:首页 > 科技资讯 > 正文

OpenAI团队大调整:ChatGPT个性研究团队并入后训练,评估体系革新挑战AI幻觉

OpenAI进行了重磅结构调整:将ChatGPT的“模型行为”团队并入“后训练”团队,并由前负责人Joanne Jang领导新成立的OAI Labs。这一变动背后的原因,可能是他们最近的新发现:评估体系在奖励模型的“幻觉”行为,迫使模型成为“应试选手”。这次组织重组与评测范式重构,正在重新定义AI的能力边界与产品形态。

OpenAI决策——重组ChatGPT“个性”研究团队!

这个约14人的小组,规模虽小但责任重大,负责让GPT模型知道如何与人类进行交互。

根据内部消息,模型行为团队(Model Behavior team)将直接并入后训练团队(Post-Training team),并向后训练负责人Max Schwarzer汇报。

OpenAI团队大调整:ChatGPT个性研究团队并入后训练,评估体系革新挑战AI幻觉 OpenAI ChatGPT 模型行为 评估体系 第1张

团队前负责人Joanne Jang,将领导新的实验室“OAI Labs”,为人类与AI的协作方式发明并构建新的交互界面原型。

OpenAI团队大调整:ChatGPT个性研究团队并入后训练,评估体系革新挑战AI幻觉 OpenAI ChatGPT 模型行为 评估体系 第2张

OpenAI团队大调整:ChatGPT个性研究团队并入后训练,评估体系革新挑战AI幻觉 OpenAI ChatGPT 模型行为 评估体系 第3张

与此同时,OpenAI还发表了一篇论文,揭示了让AI产生“幻觉”的元凶:我们自己!

整个行业为了高分排行榜而设计的“应试”评估体系,迫使AI宁愿猜测答案,也不愿诚实地说出“我不知道”。

OpenAI团队大调整:ChatGPT个性研究团队并入后训练,评估体系革新挑战AI幻觉 OpenAI ChatGPT 模型行为 评估体系 第4张

论文地址:https://openai.com/index/why...

超现实的一天

模型行为团队几乎参与了GPT-4后的全部模型研发,包括GPT-4o、GPT-4.5以及GPT-5。

上周,作为Model Behavior团队负责人的Joanne Jang,登上《时代》百大AI人物榜单的“思想家”,超越了图灵奖得主Yoshua Bengio、谷歌首席科学家Jeffrey Dean等。

就在同一天,OpenAI决定将她从团队调离,自己去负责一个新的方向。

OpenAI团队大调整:ChatGPT个性研究团队并入后训练,评估体系革新挑战AI幻觉 OpenAI ChatGPT 模型行为 评估体系 第5张

对她而言,那天的确是“超现实”。

Joanne Jang认为,她的工作核心在于“赋能用户去实现他们的目标”,但前提是不能造成伤害或侵犯他人的自由。

OpenAI团队大调整:ChatGPT个性研究团队并入后训练,评估体系革新挑战AI幻觉 OpenAI ChatGPT 模型行为 评估体系 第6张

她直言:AI实验室的员工不应成为决定人们能创造什么、不能创造什么的仲裁者。

开启新征程:瞄准下一代AI交互

Joanne Jang刚刚发文表示她已有新的工作职位:发明和原型化全新的交互界面,探索人与AI协作的未来方式。

OpenAI团队大调整:ChatGPT个性研究团队并入后训练,评估体系革新挑战AI幻觉 OpenAI ChatGPT 模型行为 评估体系 第7张

她将从头开始负责新的OAI Labs实验室:一个以研究为驱动的团队,致力于为人类与AI的协作方式发明和构建新界面的原型。

借此平台,她将探索超越聊天、甚至超越智能体的新模式——迈向能够用于思考、创造、娱乐、学习、连接与实践的全新范式与工具。

OpenAI团队大调整:ChatGPT个性研究团队并入后训练,评估体系革新挑战AI幻觉 OpenAI ChatGPT 模型行为 评估体系 第8张

这让她无比兴奋,也是过去四年在OpenAI她最享受的工作:

把前沿能力转化为面向世界的产品,并与才华横溢的同事们一起打磨落地。

从DALL·E 2、标准语音模式,到GPT-4与模型行为,她在OpenAI的工作涵盖不同的个性化与交互方式。

OpenAI团队大调整:ChatGPT个性研究团队并入后训练,评估体系革新挑战AI幻觉 OpenAI ChatGPT 模型行为 评估体系 第9张