在多特异性抗体(如双抗 BsAb、三抗等)的研发过程中,结构建模一直是个让人头疼的难题。双抗不仅涉及多个抗原结合位点(Paratope)与不同抗原表位(Epitope)的复杂相互作用,还常常引入非天然的接头(Linker)、突变位点(如 Knob-into-Hole 突变)以及异源二聚化界面。
相比于 AlphaFold 2,今年正式推出的 AlphaFold 3 (AF3) 在处理多链复合物、非天然氨基酸修饰、以及离子配体方面有了质的飞跃。本文将结合药物研发的实际流,聊聊如何利用 AlphaFold 3 进行双特异性抗体的结构建模、质量评估以及后续的理性优化。
一、 AlphaFold 3 给双抗建模带来了什么?
在 AF2 时代,要预测一个“双抗-双抗原”复合物,通常需要复杂的 ColabFold 拼接或者多链折叠策略,且对柔性 Linker 和非蛋白质组分的处理非常棘手。AF3 引入了全新的扩散模型(Diffusion Module),直接在原子坐标层面进行去噪生成。
对于双抗研发,AF3 的核心优势体现在:
- 更精准的界面相互作用:对抗体 CDR 区与抗原表位的非共价相互作用预测精度显著提升。
- 多链及配体共存:可以同时输入抗体重链、轻链、多种抗原,甚至包含糖基化修饰、小分子、金属离子等。
- 更自然的柔性区构象采样:对常见的 (GGGGS)n 等 Linker 构象生成更加符合物理规律,减少了不自然的拉伸或碰撞。
二、 实操:如何在 AF3 中构建双抗模型输入?
双抗的结构形式繁多,如 BiTE (双特异性 T 细胞衔接系统)、Knob-into-Hole (KiH) 结构、DVD-Ig 等。以下以最经典的 KiH 格式双抗(带共同轻链或两条不同轻链)结合双抗原 的场景为例,介绍输入准备。
1. 序列拆分与实体定义(Entity Definition)
在 AF3 中,你需要明确定义每一个独立的链(Chain)。
假设你的体系包含:
- Chain A: 重链 1 (Knob 突变, 结合抗原 A)
- Chain B: 重链 2 (Hole 突变, 结合抗原 B)
- Chain C: 轻链 1
- Chain D: 轻链 2 (如果不是共同轻链)
- Chain E: 抗原 A
- Chain F: 抗原 B
2. JSON 输入模板示例
在本地运行 AF3 或使用其 Web 平台时,推荐通过 JSON 格式来精确控制。以下是一个抽象的输入配置参考:
[
{
"name": "BsAb_Antigen_Complex",
"sequences": [
{"protein": {"sequence": "EVQLVESGG...", "id": "A"}},
{"protein": {"sequence": "QVQLQESGP...", "id": "B"}},
{"protein": {"sequence": "DIQMTQSP...", "id": "C"}},
{"protein": {"sequence": "DIVMTQSP...", "id": "D"}},
{"protein": {"sequence": "MNGTEGPN...", "id": "E"}},
{"protein": {"sequence": "MRPSGTAG...", "id": "F"}}
],
"modelSeeds": [1],
"dialect": "alphafold3",
"version": 1
}
]
3. 特殊结构:ScFv 与 Linker 的处理
如果你的双抗含有 ScFv 结构(如重链 C 端融合一个 ScFv),Linker 的序列(如 GGGGSGGGGSGGGGS)必须直接写在对应 Chain 的序列中。
- 避坑提示:不要把 Linker 当作独立的 Chain 运行。AF3 需要完整的共价主链信息来约束局部自由度。
三、 双抗建模的“三大痛点”与 AF3 应对策略
痛点 1:柔性 Linker 导致的构象塌陷
在预测双抗(特别是 Single-chain Fv 融合蛋白)时,AF3 有时会预测出 Linker 极度弯曲,导致 ScFv 部分“贴”在 Fc 表面。这在热力学上可能存在,但并非工作状态。
- 对策:
- 分段建模法:先将抗原结合域(Fab/ScFv)与抗原单独拿出来进行高精度建模,锁定结合界面。
- 模板引导(Templates):在 AF3 运行时,提供已有的 IgG Fc 晶体结构作为 Template(通过 PDB 运行),强行约束 Fc 区域的刚性构象,让 Diffusion 专注于柔性区和界面的生成。
痛点 2:非特异性结合与“假阳性”界面
AF3 的预测本质上是寻找自由能极小值。如果输入的抗原与抗体并没有真实的强亲和力,AF3 有时也会强行“凑”出一个结合界面。
- 如何识别假阳性?
- 看 iPAE (Interface Predicted Aligned Error):这是评估界面相对位置置信度最关键的指标。如果抗原与 CDR 区之间的 PAE 普遍大于 15 Å,说明这个结合构象大概率是“人工幻觉”。
- 看 pLDDT:CDR 环区本身的 pLDDT 最好能达到 75 以上。如果 CDR 区在结合抗原后 pLDDT 依然极低(低于 50),说明该区域高度无序,结合模式不可信。
痛点 3:错配(Mispairing)分析
对于没有采用共同轻链的双抗,重链与轻链的交叉错配(Mispairing)是工艺上的主要痛点。
- 预测策略:可以故意在 JSON 中输入 重链 1 + 轻链 2 以及 重链 2 + 轻链 1。观察 AF3 预测复合物的 pLDDT 和界面接触面积(BSA)。如果错配对的预测得分与正确配对接近,说明该序列在湿实验中极易发生错配,需要引入电荷排斥突变(如 DD-KK 突变)进行优化。
四、 基于 AF3 模型的双抗理性优化路径
拿到一个高置信度的 AF3 复合物模型后,如何进行下游的计算优化?由于 AF3 本身不是一个定量计算亲和力自由能差($\Delta\Delta G$)的工具,我们需要将其与传统计算药化工具结合。
[AF3 高精度建模]
│
▼ (提取 PDB 结构)
[界面分析 (iPAE / 氢键/ 疏水作用)]
│
├────────────────────────┐
▼ (稳定性和亲和力) ▼ (特异性与防错配)
[FoldX / Rosetta 饱和突变扫描] [静电相互作用表面设计]
│
└────────────────────────┘
▼
[候选序列湿实验验证 (SPR/ELISA/SEC-MALS)]
1. 亲和力成熟(Affinity Maturation)
- 第一步:利用 AF3 预测抗体 CDR-抗原复合物。
- 第二步:使用 FoldX 或 Rosetta SnugDock / ddG 模块,对预测界面上的 CDR 氨基酸进行饱和突变扫描(In silico Saturation Mutagenesis)。
- 第三步:筛选出预测能降低结合自由能($\Delta\Delta G < -1.0 \text{ kcal/mol}$)的突变体。
- 第四步:将筛选出的突变序列重新输入 AF3。如果 AF3 预测的新模型中,iPAE 进一步降低,且氢键或盐桥数量增加,则该突变极具湿实验验证价值。
2. 半衰期与稳定性优化(pH 敏感型双抗设计)
某些双抗需要具备在酸性内吞体(pH 6.0)中释放抗原、在血浆(pH 7.4)中结合抗原的能力。
- 在 AF3 中,由于其目前无法直接调节 pH 环境,可以通过人工修改氨基酸质子化状态或组氨酸(Histidine)突变扫描来实现。将 CDR 区接触界面上的特定残基突变为 His,利用 AF3 评估突变后对局部构象的影响。
3. 避免聚集(Aggregation Prong)设计
双抗由于结构复杂,极易发生聚集(Aggregation)。
- 使用 AF3 预测完整双抗结构。
- 利用 Spatial Aggregation Propensity (SAP) 算法定位预测结构表面暴露的疏水斑块(Hydrophobic Patches)。
- 在不破坏结合活性的前提下,引入亲水性突变(如 Asp, Glu, Ser),提升双抗在制剂配方中的溶解度和稳定性。
五、 总结与野生避坑经验
- 别盲信 pLDDT,多看 PAE:抗体 CDR 环由于其天然的柔性,在没有抗原存在时 pLDDT 通常很低。必须在有抗原存在的多链复合物预测中,去观察界面 PAE。
- 种子数(Seed)的重要性:对于包含长 Linker 的多抗,单次预测(Seed=1)很容易陷入局部最优。建议至少运行 5 到 10 个不同的 Random Seeds,观察构象的多样性。如果多个 Seed 产生的结合界面高度一致,说明预测结果非常稳健。
- 结合实验反馈:计算折叠模型永远只是工作假设。建议在拿到 AF3 模型后,先做一组**丙氨酸扫描(Alanine Scanning)**湿实验,验证预测的 Epitope 关键残基是否与实验相符,校准模型后再进行大规模突变设计。
AlphaFold 3 的出现,将双抗研发从过去的“盲人摸象”带入了“半理性设计”时代。掌握 AF3 的输入设计与界面评估方法,能让你的大分子药物计算模拟少走很多弯路。