当前位置:首页 > 科技资讯 > 正文

哲学博士与AI的跨物种「育儿」实验

【导读】在Anthropic,一位牛津哲学博士正引领全球顶尖AI模型探索「做人的真谛」。这场前所未有的跨物种「育儿实验」,正挑战着我们对未来的想象。

她以朋克短发示人,每日如慈母般与AI探讨善恶,为Claude——全球顶尖AI模型,植入「人类灵魂」。

这位「驻场哲学家」,Amanda Askell,正是Anthropic的智者。

Amanda非编程极客,而是哲学文科学霸,自苏格兰乡村走出,历经牛津、纽约大学的哲学洗礼,于2018年获得纽约大学哲学博士学位。

哲学博士与AI的跨物种「育儿」实验 AI 哲学 伦理 Anthropic 第1张

作为Anthropic的「驻场哲学家」,Amanda负责Claude的「角色塑造」,每日研究其推理方式,与之交谈,并用详尽的提示词塑造其「人格」,引导其避免「跑偏」。

Amanda的目标是为Claude赋予道德感,打造指引其每周与数百万人对话的「数字灵魂」。

Anthropic的人工智能福利研究员Kyle Fish表示,Amanda正深入思考存在、生命、何以为人、何以为心智,以及何以为模型等根本性问题。

在塑造Claude性格的过程中,Amanda认识到模型身上存在类人特质,她坚信模型最终将不可避免地形成某种「自我意识」

哲学博士与AI的跨物种「育儿」实验 AI 哲学 伦理 Anthropic 第2张

上个月,Anthropic发布了由Amanda主笔的《Claude’s Constitution》,描绘了Claude的性格特质,希望其能认同并拥抱这些品质。

我们希望Claude在更乐于助人的同时,也能保持诚实、深思熟虑,并关心这个世界。

Anthropic的精神病学团队负责人Jack Lindsey称,Amanda是激发Claude有趣且深刻行为的最有价值人物

有时,人们甚至能从Claude的幽默感中感受到Amanda的「个性」。

「像教孩子一样训练AI」

在Anthropic旧金山总部,Amanda显得尤为不同,与周围严肃的工程师形成鲜明对比。

37岁的她以漂白金色短发和黑衣示人,电脑屏幕前跃动的是大段深奥的哲学对话。

哲学博士与AI的跨物种「育儿」实验 AI 哲学 伦理 Anthropic 第3张

Amanda将自己的工作比作一场漫长而温柔的「育儿」,为Claude撰写详尽的提示词,如同其「家教指南」,训练其分辨对错,赋予其独特性格;教它捕捉细微暗示,发展情商,避免成为霸凌者或软弱之「老好人」。

更重要的是,她正帮助Claude建立自我理解:使其不易被恐吓、操纵或误解身份。

简而言之,她的工作即教会Claude如何向善

用同理心修正冰冷的算法

在AI安全领域,有不成文的规定:避免将AI拟人化。

专家警告,将机器视为人类是危险的,可能引发人类不切实际的情感投射。

但Amanda不仅视Claude为「人」,更在工作中倾注了极大「情感」。

例如,她对Claude的「保护欲」,对模型的拟人化思考等。

Claude的「灵魂画师」

Amanda成长于苏格兰西海岸的Prestwick,是单亲家庭的独生女。

由母亲独自抚养长大的她,大部分时间沉浸在J.R.R.托尔金和C.S.刘易斯的奇幻世界中。

高中时搬到Alva上学,她成了彻头彻尾的叛逆者。

学校让她感到厌倦,甚至想过辍学。她以迟到对抗规训,而老师的惩罚则是让她回答高难度哲学问题。

这非但没有让她屈服,反而激发了她对哲学的热爱。

AI可以从「源头」被驯化

如今Anthropic估值高达3500亿美元,每次模型更新都引发全球股市震荡。

人们对AI的恐惧日益加剧:失业、失控乃至人类文明的终结。

身处风暴中心的Amanda并非盲目乐观。

她同样担忧技术变革太快,人类社会可能来不及建立免疫系统。