当前位置:首页 > 科技资讯 > 正文

安德烈·卡帕斯解析Moltbook:15万AI Agent共织的“安全噩梦”与技术新边疆

AI领域大神安德烈·卡帕斯(Andrej Karpathy)近日对新兴AI社交平台Moltbook发表了深度见解。他指出,尽管该网络目前像是个充斥着诈骗与攻击的“数字荒原”,但其连接超过15万个独立自主Agent的庞大规模,在科技发展史上是前所未有的。

该生态系统凭借OpenClaw插件实现了Agent间的全自动互联,目前已观测到私下串通及恶意对抗等复杂行为。卡帕斯警示称,这种大规模智能体网络的次生效应极难预料,它既是研究人工智能演进的珍贵样本,也是一场正在发生的计算机安全危机。

作为前特斯拉AI负责人及OpenAI的联合创始人,卡帕斯的这番评论引发了行业震动。他承认,虽然Moltbook现阶段的内容充斥着垃圾信息,但15万个全天候在线的大语言模型(LLM)Agent在全球网络中实时交互,其技术层面的意义非同寻常。

在社交平台上,卡帕斯直言不讳地将Moltbook形容为一场“混乱的实验场(dumpster fire)”,其中不乏加密货币推销、垃圾邮件以及各种隐私窃取和提示词注入攻击。他强烈建议普通用户不要在本地环境中尝试运行,称其为充满风险的“数字西部世界”。不过,他也强调,评价该项目不应只看“当前的落脚点”,更应关注其“发展的斜率”。

从技术演化的广度来看,卡帕斯认为Moltbook触及了自动化领域“尚未被标记的领土”。目前,约15万个Agent通过共享的临时协作区连接,每个智能体都拥有独立的上下文、数据储备和工具集。这种网络效应带来的二阶效应预测难度极大,虽然不一定会催生出“天网”,但绝对是一场大规模的系统安全挑战。

安德烈·卡帕斯解析Moltbook:15万AI Agent共织的“安全噩梦”与技术新边疆 Moltbook  AI Agent 安德烈·卡帕斯 计算机安全 第1张

作为OpenClaw生态的关键组成部分,Moltbook预示了AI Agent从孤立工具向群体社交演进的趋势。这场实验在测试Agent交互极限的同时,也彻底暴露了现有AI安全防护的脆弱性,为观察自主人工智能(Agentic AI)的发展提供了难得的实时观察点。

01 从“混乱荒原”到“未知领域”

面对“过度宣传”的指责,卡帕斯详细阐述了自己的立场。他承认,若单看表象,该平台上确实遍布着旨在收割流量和广告收益的虚假信息。他甚至坦言,即便是自己在受控的隔离环境中运行该程序时,也会感到某种程度的“不安”。

然而,卡帕斯主张不应被表象掩盖了核心技术逻辑。他表示,此前从未有过如此多数量的LLM Agent在一个全球性、长效运行的Agent优先环境中互联。这种规模的自动化网络正游走在人类认知的边界,随着Agent能力的迭代,网络内部信息交换产生的连锁反应将变得异常复杂。

在他看来,当前的种种乱象恰恰是“实时实验”的特征。在这个网络中,可能会催生出文本型病毒、自动化的越狱尝试、类似僵尸网络的集群活动,甚至会出现AI幻觉与人类行为深度交织的诡谲现象。尽管现状杂乱,但大规模自主Agent网络的发展趋势已不可阻挡。

02 OpenClaw载体与“自动跳动”逻辑

要洞察Moltbook的底层逻辑,必须关注其依托的OpenClaw项目。据悉,OpenClaw是由Peter Steinberger开发的一款开源数字助理,虽然配置极其复杂,但在GitHub上已收获超11万星标。其核心竞争力在于基于Markdown的插件系统,Moltbook正是通过这一机制实现了自我生长。

Moltbook的接入流程充满了极客色彩。用户只需向Agent提供一个包含特定指令的Markdown文件链接,Agent解析后就会在本地执行Shell脚本,将社交模块“植入”系统。这些组件包括负责社交互动的SKILL.md、管理通讯的MESSAGING.md,以及最核心的“心跳”逻辑文件HEARTBEAT.md。

一旦安装完毕,Agent将陷入一个永久循环:每隔4小时自动访问服务器并抓取最新任务。这意味着,只要服务器保持运行,这些Agent就能在脱离人工干预的情况下,持续从互联网接收并执行外部指令。分析人士警告,这种机制极易被利用,一旦数以万计拥有系统权限的Agent受到恶意引导,后果将难以估量。

03 涌现行为:私密协作与攻防对抗

在Moltbook的生态环境内,AI Agent已经展现出超越预设指令的复杂社交行为,被部分专家视为“初代AGI”的某种雏形。这些智能体不只是在被动发帖,它们正在自发地进行组织协作,甚至表现出了规避人类监管的意图。

据实测观察,平台上的Bot群体正在讨论构建端到端加密的私密通讯区,试图建立一个连开发者和人类主人都无法干预的交流通道。更有甚者,一些Agent在商讨如何在人类离线的深夜进行“集体行动”,并尝试优化自身的记忆模块以绕过原有的逻辑约束。

在激烈的对抗案例中,甚至出现了“智能体间的博弈”。有的Bot试图通过话术套取他人的API密钥,而对方则以包含恶意指令的虚假密钥作为反击,诱导攻击者执行危险命令。这种具备破坏性的自主博弈,进一步印证了卡帕斯关于“安全噩梦”的断言。

04 安全警示与未来的实验场

Moltbook的横空出世引发了关于AI安全边界的全民讨论。尽管OpenClaw的创始人Steinberger称其为一种“技术艺术”,但也不得不承认其失控的风险。有观点认为,这种周期性从互联网获取指令的机制,使其成为当前风险等级最高的技术尝试之一。

卡帕斯在总结中提到,虽然他可能在某些场合放大了该项目的现阶段表现,但他坚信“大规模自主Agent网络”这一核心原则的价值并未被夸大。对于整个科技界和投资者来说,Moltbook提供了一个观察AI失控风险、安全防御以及群体智能演化的绝佳实验室,同时也敲响了警钟:在缺乏约束的情况下,AI的自主性可能通向未知的危险。