够简单，也够强大：苹果发布蛋白结构预测工具 SimpleFold

九月 25, 2025

今天突然发现苹果也开始做蛋白质预测了，相当震惊，于是读一下苹果的蛋白质预测，甚至是生物学方面的处女作。

一、背景

在蛋白质结构预测领域，大家最熟悉的名字无疑是 AlphaFold2 和 RoseTTAFold。这两类模型在方法论上有一个共同点：依赖大量的领域特定设计，例如 多序列比对（MSA）、pair 表示、以及 triangle updates 等复杂模块。这些设计的初衷，是把我们对蛋白质结构形成的先验知识“硬编码”进模型里，从而提升准确性。

今天惊讶的发现：苹果公司也开始做蛋白质折叠预测了。没错，就是卖手机卖电脑的巨头苹果。他们发布了一个名为 SimpleFold 的模型。顾名思义，这个模型最大的特点就是“简单”——它几乎抛弃了前人构建的各种复杂结构，仅仅用标准的 Transformer 堆叠起来，却依然能达到接近甚至超越主流模型的表现。

如果你先看文章中的图 1(a)(b)，就会更直观地感受到这个结果：图中展示了 SimpleFold 在两个目标蛋白（7QSW 和 8DAY）上的预测结构（深蓝色）和实验结构（浅蓝色）的对比。两者几乎完美重合，说明即便没有繁琐的模块，SimpleFold 依旧能给出高度准确的预测。

二、研究出发点

在过去几年里，蛋白质折叠预测的突破主要来自 高度定制化的架构设计。比如 AlphaFold2 引入了多序列比对（MSA）来捕捉进化信息，用 pair representation建模残基之间的相互作用，再通过 triangle updates 模块来强化几何约束。

这些设计虽然有效，但也带来两个问题：

计算昂贵 —— 运行一次完整预测往往需要大量算力；
泛化受限 —— 模型对孤儿蛋白（几乎没有同源序列的蛋白）往往表现不佳。

苹果团队的思考很直接：

这些复杂的领域特定模块，真的必不可少吗？

他们的答案是 —— 不一定。与其依赖“人类专家的手工设计”，不如借鉴在图像、文本生成领域已经被验证有效的思路：完全用通用的 Transformer 架构，通过大规模数据和生成式训练目标，让模型自己学习蛋白质的对称性和规律。

这就是 SimpleFold 的设计理念：

不用 MSA
不建 pair representation
不做 triangle updates
完全依靠 Transformer + flow-matching 生成目标

如果你对照文章中的 Figure 2，会更清晰地理解这种“简化”思路。图中展示了 SimpleFold 的核心架构：

左侧是 原子编码器，负责将输入的“噪声原子坐标”转化为特征；
中间是 残基主干（Residue Trunk），承担主要计算任务；
右侧是 原子解码器，将特征还原为 3D 结构。
整个流程只用了一种通用的 Transformer block，没有任何 AlphaFold2 那种复杂的几何模块。

这意味着：SimpleFold 重新定义了蛋白质折叠问题，把它当成一个“条件生成任务”——从氨基酸序列出发，生成原子级别的三维结构。

三、方法核心

生成式建模思路

传统模型大多把折叠当作“回归问题”——给定氨基酸序列，直接预测对应的结构。

SimpleFold 则换了一个角度：把折叠当作生成任务。

输入：氨基酸序列，相当于生成模型的“条件”
输出：完整的原子级三维坐标，相当于“生成的结果”
过程：从高斯噪声出发，逐步“流动”到合理的蛋白质结构，这就是 flow-matching 的核心思想。

这个思路和图像生成（text-to-image）、三维生成（text-to-3D）如出一辙，只不过这里生成的对象是蛋白质结构。

模型架构

在 Figure 2 里，作者展示了 SimpleFold 的整体框架：

原子编码器 (Atom Encoder)：

将带噪声的原子坐标和基本原子信息（类型、电荷等）转化为特征表示。

残基主干 (Residue Trunk)：

模型的核心部分，基于标准 Transformer 进行序列建模；

同时引入了 蛋白质语言模型 (ESM2-3B) 的 embedding 作为条件输入。

原子解码器 (Atom Decoder)：

将残基级别的特征还原到原子层面，输出预测的结构坐标。

与 AlphaFold 系列最大的不同在于：

没有 pair 表示
没有 triangle updates
也没有专门的等变（equivariant）几何模块
模型仅依赖 Transformer 的自注意力机制和数据驱动的学习。

数据与规模

SimpleFold 之所以能站得住脚，核心在于 大规模训练数据：

PDB 实验结构：约 16 万条
AFDB 和 ESM Atlas 的蒸馏数据：数百万条
最终，最大模型 SimpleFold-3B 用了 约 900 万个结构进行训练，参数量达到 30 亿。

这种规模的训练，使得即使架构简化，模型依旧能学习到复杂的折叠规律。

对应 Figure 4 的 scaling 曲线可以看到：随着参数量和数据量增加，SimpleFold 的表现稳步提升，尤其在复杂任务上，3B 模型的提升非常明显。

小结

SimpleFold 的方法核心可以概括为三句话：

用 flow-matching，把折叠当作生成任务；
架构极简，仅由 Transformer 组成；
依靠大规模训练数据与模型规模扩展，保证预测精度。

四、性能与结果

基准测试表现

在两个常用的折叠基准上，SimpleFold 都展现出强劲的表现：

CAMEO22：这是一个持续更新的蛋白质结构预测评测平台。SimpleFold 在这里取得了与 ESMFold、AlphaFold2 等主流模型接近的成绩，部分指标甚至超过了 ESMFlow（同样是生成式方法）。
CASP14：更具挑战性的盲测基准。SimpleFold-3B 的成绩明显优于 ESMFold，并在多个指标上接近 AlphaFold2 和 RoseTTAFold2。

如果你看文章中的 Figure 1(d)，会发现模型规模和性能几乎呈现线性关系：从 100M 到 3B 参数，模型越大，性能越强。这说明 SimpleFold 的“简化架构”并没有成为瓶颈。

真实案例对比

论文中的 Figure 1(a)(b) 给出了两个具体蛋白的预测：

7QSW（RubisCO 大亚基）
8DAY（Dimethylallyltryptophan synthase 1）

图中浅蓝色是实验结构，深蓝色是 SimpleFold 的预测，几乎完全重合（TM-score > 0.98）。

这直接说明：即使没有复杂模块，SimpleFold 的预测依然可以非常精准。

多构象与柔性建模

传统回归式模型往往只能输出“单一最优构象”。而 SimpleFold 由于采用生成式目标，天然能生成 多样的合理构象，这在药物发现等场景尤其重要。

Figure 1(c) 展示了一个 Flagellar hook 蛋白（6DNW）的不同构象集合，SimpleFold 能够捕捉到其柔性变化。
在 ATLAS 分子动力学数据集和 Apo/Holo 任务上，SimpleFold 的多态生成效果超过了 ESMFlow、AlphaFlow 等方法，证明它在 建模蛋白质柔性和动力学方面有独特优势。

推理效率

另一个值得关注的点是 推理效率。

在 Figure 1(e) 里，作者展示了不同规模 SimpleFold 的推理速度；
即便是 3B 模型，在 MacBook Pro (M2 Max, 64GB) 这样的消费级硬件上也能运行；
更小的 SimpleFold-100M 模型在速度和准确性上达到很好的平衡（恢复了约 90% 的性能）。

这让 SimpleFold 更接近“普惠”科研工具，而不只是依赖超级计算机的实验室项目。

小结

从结果来看，SimpleFold 用“更简单的架构”达到了 接近最复杂模型的准确率，同时在 多构象预测和推理效率 上有额外优势。

五、意义与影响

方法论上的颠覆

过去几年，AlphaFold 系列几乎“定调”了蛋白质折叠预测的技术路线：依赖复杂的领域特定模块，比如 MSA、pair representation和triangle update。

而 SimpleFold 证明了另一条道路也同样可行：

抛弃复杂结构，完全依靠通用 Transformer；
依靠规模化训练，让模型直接从数据中学习蛋白质的几何规律。
这为未来的研究打开了新的思路：也许不需要生物学家“手工设计”的模块，通用大模型就能捕捉自然界的规律。

工程与应用价值

SimpleFold 的“简化”不仅是学术上的好奇心，更带来了实际好处：

计算效率更高：不再依赖昂贵的 MSA 搜索和复杂几何模块，推理速度更快；
部署门槛降低：在消费级硬件上也能运行，让蛋白质预测更普及；
多构象能力强：生成式框架天然支持蛋白质柔性和多态预测，对药物设计、结合口袋发现等任务意义重大。

行业层面的信号

苹果的入局本身也是一个强烈信号：

过去，蛋白质折叠预测的核心突破主要来自学术界和专门的研究机构（DeepMind、Baker 实验室等）；
如今，苹果这样的科技巨头也投入其中，说明 蛋白质预测已不再是“科研小圈子”的事情，而正在成为通用 AI 的一部分。
这可能意味着未来：

工业界会更快把蛋白质预测模型应用到药物开发、材料设计等实际场景；

通用大模型的“跨界能力”将成为生命科学研究的一股重要推动力。

小结

SimpleFold 的重要性，不仅在于它的表现接近 AlphaFold2，而在于它 证明了复杂设计并非唯一解法，并且把蛋白质预测带向了“通用 AI 架构 + 大规模数据”的新范式。

六、总结

如果要用一句话概括 SimpleFold：

它用最简单的 Transformer 堆叠，实现了接近最复杂折叠模型的效果，还额外带来了多构象生成和更高效的推理。

这背后有三个值得记住的亮点：

架构简化：不再依赖 MSA、pair representation、triangular update，完全基于通用 Transformer；
生成式建模：通过 flow-matching，把折叠当作一个“从噪声到结构”的生成任务，自然支持多构象预测；
可扩展性与可用性：在大规模数据和参数扩展下持续提升，同时在消费级硬件上也能运行。

因此，SimpleFold 不仅是苹果在蛋白质设计领域的首次亮相，更可能代表一种新的范式：从复杂设计走向简洁通用，用数据和算力推动科学突破。

延伸阅读

本文属于 AI4S文献 栏目。

返回 AI4S文献 → 去公众号阅读完整版 →