在Anthropic,有一位驻场哲学家Amanda Askell专门研究如何与AI模型打交道。她不仅主导设计了Claude的性格、对齐与价值观机制,还总结出一些行之有效的提示词技巧。在AI时代,哲学不仅没有落伍,反而那些通过哲学训练掌握提示词技巧的人,年薪中位数可以高达15万美元。
设想你拥有一台最新款的超级咖啡机。
你尝试多次,却做不出想要的咖啡。
问题不在于机器性能,而在于指令是否正确。
在Anthropic,Amanda Askell就是研究如何与这台“超级智能咖啡机”沟通的人。
Amanda Askell是位哲学训练的学者,负责协助管理Claude的性格设定。
她曾在牛津大学和纽约大学学习哲学,2018年获得纽约大学哲学博士学位。
毕业后,Askell曾在OpenAI担任政策方向的研究科学家。
2021年加入Anthropic,至今担任对齐微调方向的研究科学家。
Askell负责为Anthropic的Claude注入性格特质,同时避免其他特质。
她因主导设计Claude的性格、对齐与价值观机制,被列入“2024年最具影响力的100位AI人物”。
在Anthropic,Askell有“Claude耳语者”的绰号。
她研究如何与Claude沟通,并调整优化其输出。
哲学,如同打开AI的钥匙。
Askell分享了制定有效AI提示词的方法。
她认为提示词工程需要清晰表达、不断尝试和哲学思考。
很难总结其中的奥妙,关键在于频繁与模型互动,并观察每次输出。
好的提示词作者应“爱尝试、敢于试验”,但比试错更重要的是哲学思维。
哲学思维帮助写提示词,我的工作就是清晰向模型解释思考、担忧或想法。
哲学思维对清晰表达的重视,帮助优化提示词,也助于理解AI本身。
Karpathy建议别将大模型视为“实体”,而是“模拟器”。
讨论某个话题时,应问:哪些角色/人群合适?他们会怎么说?
大模型可切换、模拟不同视角,但无长时间思考能力。
“裂脑问题”反映大模型的致命缺陷:不会形成对世界运作的理解。
“裂脑问题”通常出现在模型开发的后期阶段,需要精心挑选数据输入。
“裂脑问题”影响模型在不同场景下的回答方式。
“裂脑问题”凸显训练模型的困难性和微妙之处。需要人类专家通过提示词工程形成大模型训练和使用的“说明书”。
本文由主机测评网于2026-05-26发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260546298.html