苹果公司近期跨足人工智能领域,推出了一款名为SimpleFold的蛋白质折叠模型,这一举动令人惊喜。
SimpleFold模型基于流匹配技术,采用通用的Transformer架构,网友戏称其为“iFold”。
SimpleFold设计简洁,没有复杂的专用模块,仅依靠Transformer和流匹配生成方法,其3B参数版本在性能上媲美谷歌的顶级模型AlphaFold2。
苹果此次跨界体现了化繁为简的设计理念。
首先,解释一下蛋白质折叠的概念。
本质上,蛋白质折叠是将氨基酸链折叠成特定的三维结构,从而使蛋白质具备功能。
蛋白质折叠模型的目标是从氨基酸序列预测其三维构象。
先前领先的模型,如谷歌的AlphaFold2,虽然成就显著,但采用了诸多复杂设计。
例如,需要分析大量相似蛋白质序列,依赖多序列比对(MSA)获取进化信息,利用三角注意力优化空间约束,推理时需高性能计算资源,使得普通实验室难以承担。
而SimpleFold通过通用AI框架解决了这些难题。
SimpleFold架构以多层Transformer编码器为核心,仅通过自适应层归一化适配蛋白质序列特征,相当于使用“通用工具”解决专业问题。
其核心创新是引入了流匹配生成技术。
与扩散模型的逐步去噪不同,流匹配通过学习从随机噪声分布到蛋白质构象分布的平滑映射,实现原子坐标的一步生成。
在训练过程中,研究团队构建了包含900万条数据的混合数据集,训练了从100M到3B参数的多尺度模型。其中,SimpleFold-3B在CAMEO22基准测试中达到AlphaFold2性能的95%。
在CASP14高难度测试集上,它超越了同类流匹配模型ESMFold。
效率方面尤为突出,在配备M2 Max芯片的MacBook Pro上,处理512残基序列的推理时间仅需两到三分钟,远低于传统模型的小时级耗时。
本研究的第一作者Yuyang Wang本科毕业于同济大学,随后在卡内基梅隆大学攻读机械工程和机器学习,获得多个学位,为研究打下坚实基础。
他曾在Momenta实习从事强化学习研发,并在苹果担任AI/ML Resident,专注于扩散模型,后成为苹果的机器学习研究员。
通讯作者是华人机器学习工程师Jiarui Lu,本科毕业于清华大学,期间在朱军教授实验室担任研究助理。
之后,Lu在卡内基梅隆大学取得机器学习硕士学位,于2020年加入苹果公司。
他曾主导开发了评估大模型工具调用能力的基准工具——ToolSandbox,这是苹果的开源项目。
对“iFold”感兴趣或想深入了解技术细节的读者,可以访问以下链接。
论文地址:https://arxiv.org/abs/2509.18480代码地址:https://github.com/apple/ml-simplefold
参考链接:[1]https://x.com/iScienceLuvr/status/1970787581248905454
本文由主机测评网于2026-01-03发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://www.vpshk.cn/20260114554.html