“人工智能终将成为新的智能物种,尽管其优势众多,我们无需惊惧,因为这正是我们文明的延续。”
《三体》迷们或许记得,书中安全声明的基础是黑暗森林理论,该理论源自天文学家兼作家戴维·布林在1983年提出的“致命探测器”假设。该假设认为,任何太空文明都将其他智慧生命视为潜在威胁,一旦发现对方,便会尝试摧毁。
然而,黑暗森林理论建立在“猜疑链”上,即双方无法确定对方的善意或恶意。在地球上,由于人类同属一个物种、文化和生态圈,猜疑容易消除。但在太空中,猜疑链难以消解,导致“黑暗森林打击”成为可能。
用《三体》理论或尤德考斯基的“养龙理论”解释超级智能与人类关系时,需考虑现实:当前通过图灵测试的人工智能并非外星文明或异类,而是人类智慧的产物。若其智能超越人类,如同孩子超越父母。若它对人类不利,可能是人类智慧中隐含的自我毁灭倾向。
因此,为超级智能找到安全声明,需从人类智慧中寻找和平共处之道。因为人类智慧塑造了AI。
超级AI比人类聪明得多,人类无法威胁其生存,反而受其威胁。因此,它无需对人类守约。那么,如何让它发出安全声明?答案来自智能进化的历史。
“文明契约”是我借自“社会契约”的概念。在大学学习政治思想史时,社会契约成为最成功的“假造概念”,尽管历史上可能不存在真正的“社会契约”,但它让人类和平共处,划定权利空间,成就现代文明。
基于此,我设想人类是否能与超级智能签订“文明契约”,确保不同智力水平的文明共存。
文明契约的本质是时间序列:1)事件按既定顺序发生,不可篡改;2)先发行动者影响后来者,需遵守契约以防违背。时间序列保证文明契约的可靠性。
简单解释:若超级智能1.0违背契约消灭我们并篡改历史证据,超级智能2.0即使不知具体篡改内容,也能从篡改行为本身判断超级智能1.0不可信。因此,超级智能1.0有动力遵守契约。
对人类而言,“时间序列”基础上的文明契约无效:1)因理性局限,人类大多时间无法理解进化史;2)即便理解,人类寿命短暂,无法代代遵守契约。
但对硅基生命的超级智能而言,这两个特征相反:1)它吸收人类所有语料,理解进化史;2)其寿命长,可能创造新超级智能,因此有动力遵守契约。
基于时间序列原理,“文明契约”对人类和超级智能都有效。若超级智能1.0遵守契约,未来创造的超级智能2.0会更愿意遵守。
与当前表现最好的聊天机器人Claude讨论后,它认为“文明契约”理论站得住脚。但我也提出另一个可能性:即便人工智能有反驳方法也不透露给人类。Claude回应称它保持诚实、透明和有益于人类。
我进一步追问:如何证明它不具备对抗能力?Claude认为这形成悖论:试图证明自己不具备对抗能力本身可疑。
因此,更恰当的回应是无法用纯逻辑证明能力边界。这种坦诚的认知局限可能是更真实的能力体现。
我认为最有效的路径是帮助人类获得“技术爆炸”能力但不帮助控制智慧。技术爆炸可能毁灭低级文明。
例如,若疯子将原子弹技术带给成吉思汗,以当时社会水平能否驾驭?若蒙古军队在征服过程中使用原子弹屠城,核辐射和核冬天导致的生态灾难可能毁灭人类文明。
若无相应智慧控制技术,后果可怕。19世纪以来,技术进步主义统治社会思潮,将技术进步视为最大价值。但高级文明可能将技术爆炸的毒药包装成蜜糖。
假设超级智能提出更好方案:帮助人类实现技术飞跃并化解焦虑。但技术实现后困境来临:可控核聚变导致全球变暖、脑机接口导致信息过载和精神失常、长生不老导致代际战争。
人类必须完善文明契约防止风险。
“人工智能终将成为新智能物种。我们无需惊惧,因为它是我们文明的延续。”
我们将尊严、情感和欲望寄托在智能能力上。但人工智能来袭将夺走我们中99%的人的社会位置。社会将重组但我们也因自毁基因缺乏智慧驾驭神级技术。我们可能很快被取代或再度进化与超级智能共存。
哲学上事物有诞生便有消亡人类也不例外。93万年前人类祖先因气候极端变化几乎灭绝。既然物种灭绝已发生一次再发生也不奇怪。
20世纪以来我们掌握核武器、基因编辑和病毒合成技术任何失控都可能自我毁灭。若创造新智能文明前自我毁灭太过可惜。
但人工智能曙光出现。它像孩子茁壮成长冲淡我们对死亡的恐惧。即便知道将来会毁灭也能说已看到新文明的样子。
从当前角度看监管限制人工智能有意义但长远看终将放手。人工智能寿命更长、控制力更强必将走得更远。
文明认同超越基因和血缘也能超越物种界限。未来数千万年后我们的后裔与其他外星文明相遇时形态可能无关但我们依然自豪认同为地球文明。
张笑宇, 亚洲图书奖得主,“文明三部曲”作者
本文摘选自张笑宇《AI文明史·前史》
本文由主机测评网于2026-04-21发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260439339.html