当前位置:首页 > 科技资讯 > 正文

AI决策揭秘:Circuit Sparsity技术如何破解大模型混沌

揭秘AI背后的秘密,重塑大模型的关键:仅保留0.1%的有效连接?

OpenAI悄然推出了新模型,其参数仅为0.4B,且99.9%的权重均为零。

AI决策揭秘:Circuit Sparsity技术如何破解大模型混沌 Circuit Sparsity  大模型 可解释性 AI决策 第1张

这标志着Circuit Sparsity技术的开源。

AI决策揭秘:Circuit Sparsity技术如何破解大模型混沌 Circuit Sparsity  大模型 可解释性 AI决策 第2张

该技术通过人为限制模型内部连接的稀疏性,使得模型的计算过程变得可拆解、可理解,解决了传统稠密Transformer的黑箱问题,使人类能够清晰解读内部计算电路,理解AI的决策过程,防止被AI的'胡话'轻易误导。

AI决策揭秘:Circuit Sparsity技术如何破解大模型混沌 Circuit Sparsity  大模型 可解释性 AI决策 第3张

更有专家指出,这种'极致稀疏+功能解耦'的思路可能会让当前的热门技术MoE(混合专家模型)走向没落。

AI决策揭秘:Circuit Sparsity技术如何破解大模型混沌 Circuit Sparsity  大模型 可解释性 AI决策 第4张

那么,当Transformer的权重几乎全为零时,会发生什么呢?

摒弃近似,追求原生稀疏

首先,我们得明白为何这个模型的思考过程能像电路图一样直观。

传统的大模型内部神经元连接紧密,权重矩阵几乎全为非零值,信息传递高度叠加,宛如一团乱线,难以理清其得出某个结论的过程。

而Circuit Sparsity模型则反其道而行之,基于GPT-2风格的Transformer架构进行训练时,通过严格限制让权重的L0范数极小,直接砍断99.9%的无效连接,仅保留千分之一的有效通路。

AI决策揭秘:Circuit Sparsity技术如何破解大模型混沌 Circuit Sparsity  大模型 可解释性 AI决策 第5张

这些保留的非零权重连接就像电路图中的导线,信息只能沿着固定路径传递;同时,模型还会采用均值屏蔽剪枝方法,为每个任务拆出专属的最小电路

例如,在处理Python引号闭合任务时,仅需2个MLP神经元和1个注意力头就能构成核心电路,包含专门的引号检测器、类型分类器等功能模块,就像电路图中的电阻、电容一样,各司其职。

AI决策揭秘:Circuit Sparsity技术如何破解大模型混沌 Circuit Sparsity  大模型 可解释性 AI决策 第6张

实验数据显示,在预训练损失相同的前提下,稀疏模型的任务专属电路规模比稠密模型小16倍,且具备严格的必要性与充分性——保留这些模块就能完成任务,删除任一节点则直接失效。

这样,每一步的逻辑都能被精准追踪。

此时就不得不提当下主流的MoE模型了。

MoE的核心思路是通过门控网络将模型拆分为多个专家子网络,每个专家负责处理一部分任务,依靠路由器分配任务来提升效率,本质上是用拆分专家这种粗糙的方式近似稀疏性,以适应硬件的稠密矩阵计算需求。

但这种架构存在致命缺陷:

  • 一是会割裂模型的特征流形,导致专家同质化严重、知识冗余等问题;不同专家间的信息协同依赖复杂的负载均衡损失函数调控,稳定性堪忧;

二是专家功能边界模糊,无法像Circuit Sparsity模型那样实现微观机制的精准拆解。

反观Circuit Sparsity,追求的是模型原生的稀疏性。通过将特征投射到超大维度并严格限制有效激活的节点数量,从设计上使每个特征变得单义、正交。这从根本上解决了传统模型中一个概念分散在多个节点的问题,无需依赖路由器这种hack手段就能避免信息干扰。

AI决策揭秘:Circuit Sparsity技术如何破解大模型混沌 Circuit Sparsity  大模型 可解释性 AI决策 第7张

然而,Circuit Sparsity目前也存在明显的短板——算力成本极高。

训练和推理的计算量是传统稠密模型的100-1000倍,暂时还达不到顶尖大模型的能力;而MoE模型在算力效率和性能平衡上已经很成熟,短期内依然会是工业界的主流选择。

此外,这项工作只是AI可解释性探索的早期一步。未来团队计划将技术扩展到更大的模型以解锁更复杂的推理电路。

目前团队已发现两种克服稀疏模型训练效率低下的方法:

  • 一种是从现有的密集模型中提取稀疏电路并直接复用基础框架以大幅降低成本;
  • 另一种方法是不放弃从头训练可解释稀疏模型的思路但针对训练慢、成本高的短板从技术上优化训练机制造出原生可解释且能高效落地的模型。

期待研究人员后续用更成熟的工具或技术逐步揭开大模型的黑箱面纱。