用 AlphaFold 3 搞定双特异性抗体结构建模与优化：从实操到避坑指南

在多特异性抗体（如双抗 BsAb、三抗等）的研发过程中，结构建模一直是个让人头疼的难题。双抗不仅涉及多个抗原结合位点（Paratope）与不同抗原表位（Epitope）的复杂相互作用，还常常引入非天然的接头（Linker）、突变位点（如 Knob-into-Hole 突变）以及异源二聚化界面。

相比于 AlphaFold 2，今年正式推出的 AlphaFold 3 (AF3) 在处理多链复合物、非天然氨基酸修饰、以及离子配体方面有了质的飞跃。本文将结合药物研发的实际流，聊聊如何利用 AlphaFold 3 进行双特异性抗体的结构建模、质量评估以及后续的理性优化。

一、 AlphaFold 3 给双抗建模带来了什么？

在 AF2 时代，要预测一个“双抗-双抗原”复合物，通常需要复杂的 ColabFold 拼接或者多链折叠策略，且对柔性 Linker 和非蛋白质组分的处理非常棘手。AF3 引入了全新的扩散模型（Diffusion Module），直接在原子坐标层面进行去噪生成。

对于双抗研发，AF3 的核心优势体现在：

更精准的界面相互作用：对抗体 CDR 区与抗原表位的非共价相互作用预测精度显著提升。
多链及配体共存：可以同时输入抗体重链、轻链、多种抗原，甚至包含糖基化修饰、小分子、金属离子等。
更自然的柔性区构象采样：对常见的 (GGGGS)n 等 Linker 构象生成更加符合物理规律，减少了不自然的拉伸或碰撞。

二、实操：如何在 AF3 中构建双抗模型输入？

双抗的结构形式繁多，如 BiTE (双特异性 T 细胞衔接系统)、Knob-into-Hole (KiH) 结构、DVD-Ig 等。以下以最经典的 KiH 格式双抗（带共同轻链或两条不同轻链）结合双抗原 的场景为例，介绍输入准备。

1. 序列拆分与实体定义（Entity Definition）

在 AF3 中，你需要明确定义每一个独立的链（Chain）。

假设你的体系包含：

Chain A: 重链 1 (Knob 突变, 结合抗原 A)
Chain B: 重链 2 (Hole 突变, 结合抗原 B)
Chain C: 轻链 1
Chain D: 轻链 2 (如果不是共同轻链)
Chain E: 抗原 A
Chain F: 抗原 B

2. JSON 输入模板示例

在本地运行 AF3 或使用其 Web 平台时，推荐通过 JSON 格式来精确控制。以下是一个抽象的输入配置参考：

[
  {
    "name": "BsAb_Antigen_Complex",
    "sequences": [
      {"protein": {"sequence": "EVQLVESGG...", "id": "A"}}, 
      {"protein": {"sequence": "QVQLQESGP...", "id": "B"}},
      {"protein": {"sequence": "DIQMTQSP...", "id": "C"}},
      {"protein": {"sequence": "DIVMTQSP...", "id": "D"}},
      {"protein": {"sequence": "MNGTEGPN...", "id": "E"}},
      {"protein": {"sequence": "MRPSGTAG...", "id": "F"}}
    ],
    "modelSeeds": [1],
    "dialect": "alphafold3",
    "version": 1
  }
]

3. 特殊结构：ScFv 与 Linker 的处理

如果你的双抗含有 ScFv 结构（如重链 C 端融合一个 ScFv），Linker 的序列（如 GGGGSGGGGSGGGGS）必须直接写在对应 Chain 的序列中。

避坑提示：不要把 Linker 当作独立的 Chain 运行。AF3 需要完整的共价主链信息来约束局部自由度。

三、双抗建模的“三大痛点”与 AF3 应对策略

痛点 1：柔性 Linker 导致的构象塌陷

在预测双抗（特别是 Single-chain Fv 融合蛋白）时，AF3 有时会预测出 Linker 极度弯曲，导致 ScFv 部分“贴”在 Fc 表面。这在热力学上可能存在，但并非工作状态。

对策：
- 分段建模法：先将抗原结合域（Fab/ScFv）与抗原单独拿出来进行高精度建模，锁定结合界面。
- 模板引导（Templates）：在 AF3 运行时，提供已有的 IgG Fc 晶体结构作为 Template（通过 PDB 运行），强行约束 Fc 区域的刚性构象，让 Diffusion 专注于柔性区和界面的生成。

痛点 2：非特异性结合与“假阳性”界面

AF3 的预测本质上是寻找自由能极小值。如果输入的抗原与抗体并没有真实的强亲和力，AF3 有时也会强行“凑”出一个结合界面。

如何识别假阳性？
- 看 iPAE (Interface Predicted Aligned Error)：这是评估界面相对位置置信度最关键的指标。如果抗原与 CDR 区之间的 PAE 普遍大于 15 Å，说明这个结合构象大概率是“人工幻觉”。
- 看 pLDDT：CDR 环区本身的 pLDDT 最好能达到 75 以上。如果 CDR 区在结合抗原后 pLDDT 依然极低（低于 50），说明该区域高度无序，结合模式不可信。

痛点 3：错配（Mispairing）分析

对于没有采用共同轻链的双抗，重链与轻链的交叉错配（Mispairing）是工艺上的主要痛点。

预测策略：可以故意在 JSON 中输入 重链 1 + 轻链 2 以及 重链 2 + 轻链 1。观察 AF3 预测复合物的 pLDDT 和界面接触面积（BSA）。如果错配对的预测得分与正确配对接近，说明该序列在湿实验中极易发生错配，需要引入电荷排斥突变（如 DD-KK 突变）进行优化。

四、基于 AF3 模型的双抗理性优化路径

拿到一个高置信度的 AF3 复合物模型后，如何进行下游的计算优化？由于 AF3 本身不是一个定量计算亲和力自由能差（$\Delta\Delta G$）的工具，我们需要将其与传统计算药化工具结合。

[AF3 高精度建模] 
       │
       ▼ (提取 PDB 结构)
[界面分析 (iPAE / 氢键/ 疏水作用)]
       │
       ├────────────────────────┐
       ▼ (稳定性和亲和力)          ▼ (特异性与防错配)
[FoldX / Rosetta 饱和突变扫描]    [静电相互作用表面设计]
       │
       └────────────────────────┘
       ▼
[候选序列湿实验验证 (SPR/ELISA/SEC-MALS)]

1. 亲和力成熟（Affinity Maturation）

第一步：利用 AF3 预测抗体 CDR-抗原复合物。
第二步：使用 FoldX 或 Rosetta SnugDock / ddG 模块，对预测界面上的 CDR 氨基酸进行饱和突变扫描（In silico Saturation Mutagenesis）。
第三步：筛选出预测能降低结合自由能（$\Delta\Delta G < -1.0 \text{ kcal/mol}$）的突变体。
第四步：将筛选出的突变序列重新输入 AF3。如果 AF3 预测的新模型中，iPAE 进一步降低，且氢键或盐桥数量增加，则该突变极具湿实验验证价值。

2. 半衰期与稳定性优化（pH 敏感型双抗设计）

某些双抗需要具备在酸性内吞体（pH 6.0）中释放抗原、在血浆（pH 7.4）中结合抗原的能力。

在 AF3 中，由于其目前无法直接调节 pH 环境，可以通过人工修改氨基酸质子化状态或组氨酸（Histidine）突变扫描来实现。将 CDR 区接触界面上的特定残基突变为 His，利用 AF3 评估突变后对局部构象的影响。

3. 避免聚集（Aggregation Prong）设计

双抗由于结构复杂，极易发生聚集（Aggregation）。

使用 AF3 预测完整双抗结构。
利用 Spatial Aggregation Propensity (SAP) 算法定位预测结构表面暴露的疏水斑块（Hydrophobic Patches）。
在不破坏结合活性的前提下，引入亲水性突变（如 Asp, Glu, Ser），提升双抗在制剂配方中的溶解度和稳定性。

五、总结与野生避坑经验

别盲信 pLDDT，多看 PAE：抗体 CDR 环由于其天然的柔性，在没有抗原存在时 pLDDT 通常很低。必须在有抗原存在的多链复合物预测中，去观察界面 PAE。
种子数（Seed）的重要性：对于包含长 Linker 的多抗，单次预测（Seed=1）很容易陷入局部最优。建议至少运行 5 到 10 个不同的 Random Seeds，观察构象的多样性。如果多个 Seed 产生的结合界面高度一致，说明预测结果非常稳健。
结合实验反馈：计算折叠模型永远只是工作假设。建议在拿到 AF3 模型后，先做一组**丙氨酸扫描（Alanine Scanning）**湿实验，验证预测的 Epitope 关键残基是否与实验相符，校准模型后再进行大规模突变设计。

AlphaFold 3 的出现，将双抗研发从过去的“盲人摸象”带入了“半理性设计”时代。掌握 AF3 的输入设计与界面评估方法，能让你的大分子药物计算模拟少走很多弯路。