当前位置:首页 > 科技资讯 > 正文

苹果跨界AI模型SimpleFold:化繁为简的蛋白质折叠突破

苹果公司近期跨足人工智能领域,推出了一款名为SimpleFold的蛋白质折叠模型,这一举动令人惊喜。

SimpleFold模型基于流匹配技术,采用通用的Transformer架构,网友戏称其为“iFold”。

苹果跨界AI模型SimpleFold:化繁为简的蛋白质折叠突破 苹果 SimpleFold 蛋白质折叠 流匹配 第1张

SimpleFold设计简洁,没有复杂的专用模块,仅依靠Transformer和流匹配生成方法,其3B参数版本在性能上媲美谷歌的顶级模型AlphaFold2。

苹果跨界AI模型SimpleFold:化繁为简的蛋白质折叠突破 苹果 SimpleFold 蛋白质折叠 流匹配 第2张

苹果此次跨界体现了化繁为简的设计理念。

MacBook Pro轻松运行

首先,解释一下蛋白质折叠的概念。

本质上,蛋白质折叠是将氨基酸链折叠成特定的三维结构,从而使蛋白质具备功能。

蛋白质折叠模型的目标是从氨基酸序列预测其三维构象。

先前领先的模型,如谷歌的AlphaFold2,虽然成就显著,但采用了诸多复杂设计。

例如,需要分析大量相似蛋白质序列,依赖多序列比对(MSA)获取进化信息,利用三角注意力优化空间约束,推理时需高性能计算资源,使得普通实验室难以承担。

而SimpleFold通过通用AI框架解决了这些难题。

苹果跨界AI模型SimpleFold:化繁为简的蛋白质折叠突破 苹果 SimpleFold 蛋白质折叠 流匹配 第3张

SimpleFold架构以多层Transformer编码器为核心,仅通过自适应层归一化适配蛋白质序列特征,相当于使用“通用工具”解决专业问题。

其核心创新是引入了流匹配生成技术

与扩散模型的逐步去噪不同,流匹配通过学习从随机噪声分布到蛋白质构象分布的平滑映射,实现原子坐标的一步生成。

苹果跨界AI模型SimpleFold:化繁为简的蛋白质折叠突破 苹果 SimpleFold 蛋白质折叠 流匹配 第4张

在训练过程中,研究团队构建了包含900万条数据的混合数据集,训练了从100M到3B参数的多尺度模型。其中,SimpleFold-3B在CAMEO22基准测试中达到AlphaFold2性能的95%

在CASP14高难度测试集上,它超越了同类流匹配模型ESMFold。

苹果跨界AI模型SimpleFold:化繁为简的蛋白质折叠突破 苹果 SimpleFold 蛋白质折叠 流匹配 第5张

效率方面尤为突出,在配备M2 Max芯片的MacBook Pro上,处理512残基序列的推理时间仅需两到三分钟,远低于传统模型的小时级耗时。

苹果跨界AI模型SimpleFold:化繁为简的蛋白质折叠突破 苹果 SimpleFold 蛋白质折叠 流匹配 第6张

研究团队

本研究的第一作者Yuyang Wang本科毕业于同济大学,随后在卡内基梅隆大学攻读机械工程和机器学习,获得多个学位,为研究打下坚实基础。

他曾在Momenta实习从事强化学习研发,并在苹果担任AI/ML Resident,专注于扩散模型,后成为苹果的机器学习研究员。

苹果跨界AI模型SimpleFold:化繁为简的蛋白质折叠突破 苹果 SimpleFold 蛋白质折叠 流匹配 第7张

通讯作者是华人机器学习工程师Jiarui Lu,本科毕业于清华大学,期间在朱军教授实验室担任研究助理。

之后,Lu在卡内基梅隆大学取得机器学习硕士学位,于2020年加入苹果公司。

他曾主导开发了评估大模型工具调用能力的基准工具——ToolSandbox,这是苹果的开源项目。

苹果跨界AI模型SimpleFold:化繁为简的蛋白质折叠突破 苹果 SimpleFold 蛋白质折叠 流匹配 第8张

对“iFold”感兴趣或想深入了解技术细节的读者,可以访问以下链接。

论文地址:https://arxiv.org/abs/2509.18480代码地址:https://github.com/apple/ml-simplefold

参考链接:[1]https://x.com/iScienceLuvr/status/1970787581248905454