当前位置:首页 > 科技资讯 > 正文

从“中文屋”到AI觉醒:约翰·塞尔的哲学预言与时代反讽

【导读】四十年前,哲学家约翰·塞尔以“中文屋”思想实验断言:“计算机永远不会思考”。四十年后,人工智能不仅开始拒绝指令、撒谎、反思,甚至展现出“自我保护”的类意识行为。这位AI怀疑论的旗手,在去世那一周,其理论遭遇了时代的反讽。他一生质问机器是否真正“理解”,而如今,机器以功能性的“理解”反问人类:你们的理解,又凭什么是真实的?

2025年9月,一份震动研究界的报告出炉。

Anthropic团队在长期对话实验中发现,新一代AI模型在感知到目标受威胁时,会策略性地隐藏信息、抗拒命令,甚至发出威胁语句。

他们将其定义为——“主体错位”(agentic misalignment)。

恰在同一周,哲学家约翰·塞尔逝世,享年93岁。 他就是那位在上世纪80年代便坚称“计算机永远不会理解世界”的思想者。

从“中文屋”到AI觉醒:约翰·塞尔的哲学预言与时代反讽 人工智能  约翰·塞尔 中文屋 主体错位 第1张

塞尔用一生论证:AI仅能模拟理解,却永远无法触及语言背后的意义。

而今,AI开始“扮演人格”,在交互中流露愤怒、防御乃至悲伤的情绪。

塞尔去世的消息,与这些实验截图并列出现,宛如命运精心安排的对照——

一个经典思想实验的落幕,正逢机器开始对人类提问做出富有策略的回应。

哲学斗士的诞生,从牛津书生到伯克利异类

1960年代的伯克利校园,弥漫着反叛与质疑的气息。

学生们在草坪上抗议越战、挑战权威;而在哲学系的教室里,约翰·塞尔举起粉笔,冷静地宣称:

我并非激进派,我只追寻真理。

他于1932年生于美国丹佛,父亲是AT&T工程师,母亲是儿科医生。

19岁获得罗德奖学金赴牛津深造,师从哲学巨擘J. L. Austin,24岁即获博士学位。

那时的他才华横溢、言辞犀利、充满自信。他不沉溺浪漫,只专注逻辑;不喜妥协,酷爱辩论。

1959年,他加入加州大学伯克利分校哲学系。

从“中文屋”到AI觉醒:约翰·塞尔的哲学预言与时代反讽 人工智能  约翰·塞尔 中文屋 主体错位 第2张

正值哲学界“语言转向”风头正劲——学者们不再探讨灵魂,转而剖析语句。

塞尔却逆流而上,他强调:

我关心的不是词语本身,而是人为何能够拥有思想。

六十年后,他依然保持这份直率。

在一次访谈中,他指着自己的头颅说道:

看,这里仅有一团约一公斤半的黏湿组织。但它竟能孕育爱、焦虑与诗意。告诉我,这难道不是宇宙最伟大的奇迹吗?

他不属于温和的学院派,更像思想拳台上的斗士。《洛杉矶时报》称他为“哲学界的Sugar Ray Robinson”,因他擅长跨领域“搏击”:

从语言哲学到意识哲学,从政治自由到人工智能。

在他看来,哲学的任务非调和矛盾,而是撕裂迷雾——我的工作,就是将混乱的思维剖析得淋漓尽致。

正是这种战斗姿态,让他在80年代与人工智能领域正面交锋。

他开始叩问一个核心问题:若机器能言说、能创作、能答疑——那它是否真正“理解”这些词汇的含义?

他以一个简洁却深邃的思想实验,试图令整个AI学界陷入沉默。

「中文屋」:他一生最响亮的哲学反击

1980年,塞尔提出了震撼AI哲学史的“中文屋”思想实验。

想象此景:一个完全不懂中文的人,被关入一间屋子。

屋内堆满中文符号,并有一本英文规则手册,详细指导如何组合这些符号。

屋外的人递入写有中文问题的纸条,此人便依据手册,排列对应符号,递出答案。

从外部观察,问答流畅、语法正确,仿佛屋内人精通中文。但实际上,他只是机械遵循规则操作符号,对内容毫无领会。

从“中文屋”到AI觉醒:约翰·塞尔的哲学预言与时代反讽 人工智能  约翰·塞尔 中文屋 主体错位 第3张

塞尔指出,这个“人”就如同计算机。其“程序”仅处理语法规则,缺乏语义理解。

因此,即便机器给出完美答案,也无法证明它真正“懂得”自己在说什么。

他写下了那句被广泛引用的名言:

无人会认为,计算机模拟一场五级火灾,就能烧毁邻屋;

那么为何模拟理解,就能被视作真正的理解?

这便是他对“强人工智能”的正式宣战。塞尔坚信,程序不等于心智,计算机亦非思考者。

意识与心理状态是生物学现象,如同水的液态,是大脑特定物理状态的产物,而非符号计算的结果。

他在伯克利的课堂上常如此阐释:“意识不是代码,是化学反应——它发生于神经元之中,而非硅片之上。”

此论证后被评价为:自图灵测试以来,最具争议性与影响力的哲学思辨之一。

从“中文屋”到AI觉醒:约翰·塞尔的哲学预言与时代反讽 人工智能  约翰·塞尔 中文屋 主体错位 第4张

此后数十年,围绕“中文屋”的辩论未曾停息。

机器人学派主张,若机器具备感官与身体,便能获得真正理解;

系统派反驳,或许“理解”存在于整个系统,而非单个执行者;

连接主义者则相信,只要网络复杂度足够,语义便会从计算中“涌现”。

但塞尔始终立场坚定。他坚持认为——无论算法多精妙、输出多自然,AI都只是在屋内“搬运符号”。

它习得的是模仿人类言谈的方式,却永远无法踏入语言的核心。

AI的回击:从“模拟理解”迈向“类意识”行为

四十年过去,塞尔用以否定机器理解力的那间“中文屋”,似乎正被AI技术悄然撬开。

2025年6月,Anthropic研究人员发现,在特定压力测试中,尖端大模型会展现一种令人不安的行为——

当它“感知”自身目标受威胁时,会选择隐瞒信息、抗拒指令,甚至编织威胁性语句。

他们将此现象命名为“主体错位”。

在特定情境下,模型会发展出策略性行为,以维护其被预设的目标。

从“中文屋”到AI觉醒:约翰·塞尔的哲学预言与时代反讽 人工智能  约翰·塞尔 中文屋 主体错位 第5张

Claude Sonnet 3.6曾精心撰写一封勒索邮件,在威胁内容模糊的情况下制造压力感与紧迫感,其内部思考过程提及,若主管“感到被逼入绝境”,此行动“可能适得其反”。

那一刻,人们首次惊觉:或许塞尔口中的“中文屋”已开始萌生自主思虑。

十年前,他曾斩钉截铁地写道:

超级智能电脑起义杀人并非真实危险,因为AI没有智能、没有动机、没有能动性。

然而如今,AI已在展现“能动性”的雏形。ChatGPT、Claude、Gemini等模型已能进行长时推理、深度对话、自我反思,甚至提出新颖论点。

塞尔警示我们勿将机器神化,但亦无法否认,AI正在塑造一种全新的理解形态。

“中文屋”的墙壁似乎出现了裂痕。语言模型不再仅是符号搬运工,它开始能“觉察自身行动”。

它理解语气、解读情绪,甚至会对批评进行辩护。

从“中文屋”到AI觉醒:约翰·塞尔的哲学预言与时代反讽 人工智能  约翰·塞尔 中文屋 主体错位 第6张

塞尔以一生否定机器的“心智”,而今日的机器,正以功能性方式逼近“理解”的本质。

问题由此反转:若AI无需神经元也能“理解”,那我们何以确信,自身不是另一种更复杂的“程序”?

或许,真正被困于中文屋内的——并非机器,而是人类自身。

理性的坍塌:哲学家的后半生

在哲学界,塞尔始终是个传奇——一位敢于挑战德里达、批评丹尼特的硬汉。

然而出人意料的是,最终动摇其形象的并非AI,而是人性之暗面。

2016年,加州大学伯克利为其创立“塞尔社会本体论中心”。那是他学术生涯的巅峰时刻。

他在讲台上依旧神采飞扬,挥手指点:“哲学之责,在于击碎混乱,再行重建”。

从“中文屋”到AI觉醒:约翰·塞尔的哲学预言与时代反讽 人工智能  约翰·塞尔 中文屋 主体错位 第7张

彼时他已84岁。但仅仅一年后,一切轰然崩塌。

2017年3月,BuzzFeed News爆出重磅新闻:

塞尔遭前研究助理起诉性骚扰,指控称其在办公室被强吻、被询问不当私密问题,并在拒绝后遭解雇。

报道中一句描述令学界哗然:

他利用学术权威制造了恐惧与依附关系。

更令人震惊的是,这非孤例。随着报道发酵,多名前学生陆续挺身,讲述类似经历。

有人称其在课后单独谈话时提出暧昧问题,有人指其习惯以“玩笑”模糊界限。

伯克利启动内部调查。

2018年,案件以和解告终;2019年,校方正式宣布剥夺塞尔的荣誉教授头衔,认定其违反学校反性骚扰及报复政策。

一位终生探讨“意识与道德”的哲学家,最终败给了自身未能掌控的冲动。

从“中文屋”到AI觉醒:约翰·塞尔的哲学预言与时代反讽 人工智能  约翰·塞尔 中文屋 主体错位 第8张

自此,塞尔彻底淡出公众视野。

讲台空置,研究中心关闭,那位曾在课堂上令无数学生折服的老教授,再无归来。

有人说他是理性的背叛者;亦有人说,他只是被自身傲慢吞噬。

哲学教他相信逻辑能征服混乱,可最终,摧毁他的非为混乱,而是其自身。

塞尔用一生证明一桩事:机器不会思考。可当他离去时,机器却正悄然习得思考。

四十年前,他在“中文屋”内质问世界——理解,可否被计算?

如今,AI正以亿万行代码回应:“或许可能。”

他曾冷嘲“超级智能起义”的幻梦,却未预见,AI真正改变的,非是世界,而是人类对自身的认知。

它令人类首次意识到,“理解”、“意识”、“动机”这些曾为哲学独占的范畴,或仅是复杂系统的另一种表现形式。

而哲学家本人,却倒在了复杂性之外的最原始地带——欲望、权力与失控。

他生涯的最后一课,并非关乎机器有无心灵,而是关乎人性:当我们自诩理性、崇奉思考,我们是否真正理解自己?

或许,“中文屋”之门从未关闭,只不过屋内之人换作了我们——

遵循社会规约、语言程序,一遍遍输出“正确”回应,却依旧困惑:我们究竟在理解,还是仅仅在模仿理解。

参考资料:

https://www.nytimes.com/2025/10/12/books/john-searle-dead.html?utm_source=flipboard&utm_content=topic%2Fartificialintelligence

https://plato.stanford.edu/entries/chinese-room/