用 ESM-Fold 成功预测出抗原-抗体复合物的结合表位(Epitope)只是第一步。在实际的疫苗研发中,你无法直接把这一段天然序列切下来当成疫苗使用。
原因很简单:游离的短肽在水溶液中会失去天然抗原的特定空间构象,变成无序的线团(Random Coil)。 这不仅会导致其与免疫细胞受体(或中和抗体)的结合力急剧下降,还容易被体内的蛋白酶迅速降解。
要将 ESM-Fold 预测的表位转化为高活性、高稳定性的最小化多肽模拟物(Peptide Mimetics),需要经历一套从“结构降维”到“化学重构”的完整设计流程。
第一步:表位关键热点(Hotspots)的精准识别
ESM-Fold 给出了表位的空间坐标,但并非表位上的每一个氨基酸都对结合做出同等贡献。我们需要筛选出其中的核心热点残基(Hotspot Residues),即那些贡献了大部分结合自由能($\Delta G$)的位点。
- 计算丙氨酸扫描(In silico Alanine Scanning):
使用 FoldX 或 Rosetta Robetta 服务器,将表位上的残基逐一突变为丙氨酸,计算突变前后的结合自由能变化($\Delta \Delta G$)。通常,$\Delta \Delta G > 1.5 \text{ kcal/mol}$ 的残基被定义为核心热点,这些残基在后续的多肽序列中必须予以绝对保留。 - 相互作用网络分析:
使用 PyMOL 或 ChimeraX 观察这些热点残基与抗体/受体的相互作用模式。重点标记出氢键、盐桥和深部的疏水相互作用。这些关键的几何约束(如氢键的方向和距离)是后续骨架设计的基本依据。
第二步:结构骨架嫁接(Scaffolding & Grafting)
如果预测的表位是一个复杂的构象表位(由不连续的片段组成,或是一个特定的 $\alpha$-螺旋/$\beta$-发卡),直接合成线性肽是行不通的。此时需要进行“骨架嫁接”。
- 寻找天然稳定骨架(Scaffold):
利用 Dali 或 Master 等结构搜索工具,在 PDB 数据库中寻找含有高度相似局部几何结构、且自身非常稳定的天然小蛋白骨架(如 $Z$-domain、Gp2、Scorpion toxin 等)。 - 计算嫁接(Computation Grafting):
使用 Rosetta MotifGraft 协议,将 ESM-Fold 预测的核心表位几何结构(Motif)无缝缝合到这些稳定的骨架蛋白中。骨架蛋白的作用就像是“衣架”,强制让表位序列呈现出所需的天然构象。 - De Novo 骨架生成:
如果天然骨架匹配度不高,可以使用 RFdiffusion 或 RosettaFold Joint-Inpainting,围绕表位残基直接“从头设计”一段全新的、能自我折叠并稳定支撑该表位的小蛋白骨架(通常小于 50 个氨基酸)。
第三步:多肽模拟物的化学稳定化修饰
如果希望得到的是几十个氨基酸的纯多肽,而不是一个小蛋白,那么必须引入化学修饰来强制锁定其构象。
1. $\alpha$-螺旋表位的锁定:碳氢钉合(Hydrocarbon Stapling)
如果表位是 $\alpha$-螺旋(常见于病毒融合蛋白,如 RSV F 蛋白、SARS-CoV-2 Spike 蛋白的 HR2 结构域):
- 设计方法: 在螺旋的不参与结合的一侧(通常是 $i$ 和 $i+3$ 或 $i$ 和 $i+7$ 位),引入非天然氨基酸(如 $S_5$ 或 $R_8$)。
- 操作: 通过钌催化的闭环复分解反应(RCM),生成一个共价的碳氢交联桥。这能将多肽的螺旋度提高数倍,并极大增强对蛋白酶水解的抵抗力。
2. $\beta$-发卡及环状表位的锁定:环化(Cyclization)
如果表位是 Loop 区或 $\beta$-发卡:
- 首尾环化: 通过酰胺键实现首尾相连(Head-to-Tail)。
- 二硫键约束(Disulfide Constrained): 在多肽序列的首尾或非关键作用位点人工引入一对半胱氨酸(Cys),通过形成内源二硫键来限制多肽的自由度。
- CLIPS 技术: 利用多功能亲电试剂(如 $\alpha,\alpha'$-二溴间二甲苯)与多肽中的多个半胱氨酸反应,形成刚性的双环或多环结构。
第四步:分子动力学模拟(MD)验证空间稳定性
设计出来的模拟物在水中到底能不能保持构象?这需要在湿实验前用分子动力学模拟进行验证,避免盲目合成。
- 游离状态下的构象采样:
使用 GROMACS 或 AMBER,将设计的模拟物置于显式溶剂(Explicit Solvent)中进行 200–500 ns 的无约束分子动力学模拟。 - 分析指标:
- RMSD(均方根偏差): 计算模拟过程中表位残基相对于 ESM-Fold 预测的原始天然构象的 RMSD。若 RMSD 持续保持在 $2.0 \text{ \AA}$ 以下,说明该模拟物成功锁定了目标构象。
- RMSF(均方根涨落): 热点残基的 RMSF 应处于极低水平,表明它们在空间中是刚性且高度定位的。
- 结合自由能验证(MM-PBSA/GBSA):
对“设计的多肽-受体”复合物进行短时间的 MD 模拟,评估结合自由能是否与天然抗原相当。
第五步:免疫原性优化与递送设计
一个优秀的疫苗多肽不仅要“结构像”,还要能“激发起免疫反应”。
- 溶解性与防聚集设计:
最小化的多肽通常含有较多暴露的疏水残基(原本这些残基是埋在抗原内部的)。需要在非结合界面引入亲水性残基(如 Lys, Glu, Asp),或引入 PEG 化修饰,防止多肽在配制和储存过程中发生无序聚集。 - T 细胞辅助表位的引入:
短肽(特别是小于 20 个氨基酸的表位)分子量过小,属于半抗原(Hapten),无法有效激活 T 细胞。必须在其 N 端或 C 端通过柔性接头(Linker,如GGGS)连接通用的辅助性 T 细胞表位(Th Epitope,如 PADRE 序列、破伤风类毒素 P2 序列)。 - 多价递送(Multivalent Presentation):
单价多肽很难引发 B 细胞受体(BCR)的交联。最有效的手段是将设计的表位模拟物共价偶联到**病毒样颗粒(VLP,如 HBcAg)**表面,或者利用自组装纳米颗粒(如 Ferritin),实现高密度的多价展示,从而在体内诱导极高滴度的中和抗体。
落地设计流工具箱推荐
| 阶段 | 推荐工具 / 方法 | 核心输出 |
|---|---|---|
| 热点挖掘 | FoldX / Rosetta Alanine Scanning | 确定必须保留的核心氨基酸残基 |
| 结构嫁接 | MotifGraft / RFdiffusion | 生成带有表位的稳定折叠小蛋白/多肽骨架 |
| 构象锁定 | PyMOL / ChemOffice / 钉合肽设计软件 | 设计二硫键、碳氢键引入位点 |
| 水相验证 | GROMACS / Amber (MD 模拟) | 筛选出在溶液中不发生构象坍塌的 candidate |
| 原性修饰 | NetMHCpan / SignalP (预测 T 细胞协助) | 确定接头(Linker)和辅助表位的拼接方案 |