ESM-Fold预测出抗原表位后如何设计高活性的多肽模拟物

用 ESM-Fold 成功预测出抗原-抗体复合物的结合表位（Epitope）只是第一步。在实际的疫苗研发中，你无法直接把这一段天然序列切下来当成疫苗使用。

原因很简单：游离的短肽在水溶液中会失去天然抗原的特定空间构象，变成无序的线团（Random Coil）。 这不仅会导致其与免疫细胞受体（或中和抗体）的结合力急剧下降，还容易被体内的蛋白酶迅速降解。

要将 ESM-Fold 预测的表位转化为高活性、高稳定性的最小化多肽模拟物（Peptide Mimetics），需要经历一套从“结构降维”到“化学重构”的完整设计流程。

第一步：表位关键热点（Hotspots）的精准识别

ESM-Fold 给出了表位的空间坐标，但并非表位上的每一个氨基酸都对结合做出同等贡献。我们需要筛选出其中的核心热点残基（Hotspot Residues），即那些贡献了大部分结合自由能（$\Delta G$）的位点。

计算丙氨酸扫描（In silico Alanine Scanning）：
使用 FoldX 或 Rosetta Robetta 服务器，将表位上的残基逐一突变为丙氨酸，计算突变前后的结合自由能变化（$\Delta \Delta G$）。通常，$\Delta \Delta G > 1.5 \text{ kcal/mol}$ 的残基被定义为核心热点，这些残基在后续的多肽序列中必须予以绝对保留。
相互作用网络分析：
使用 PyMOL 或 ChimeraX 观察这些热点残基与抗体/受体的相互作用模式。重点标记出氢键、盐桥和深部的疏水相互作用。这些关键的几何约束（如氢键的方向和距离）是后续骨架设计的基本依据。

如果预测的表位是一个复杂的构象表位（由不连续的片段组成，或是一个特定的 $\alpha$-螺旋/$\beta$-发卡），直接合成线性肽是行不通的。此时需要进行“骨架嫁接”。

寻找天然稳定骨架（Scaffold）：
利用 Dali 或 Master 等结构搜索工具，在 PDB 数据库中寻找含有高度相似局部几何结构、且自身非常稳定的天然小蛋白骨架（如 $Z$-domain、Gp2、Scorpion toxin 等）。
计算嫁接（Computation Grafting）：
使用 Rosetta MotifGraft 协议，将 ESM-Fold 预测的核心表位几何结构（Motif）无缝缝合到这些稳定的骨架蛋白中。骨架蛋白的作用就像是“衣架”，强制让表位序列呈现出所需的天然构象。
De Novo 骨架生成：
如果天然骨架匹配度不高，可以使用 RFdiffusion 或 RosettaFold Joint-Inpainting，围绕表位残基直接“从头设计”一段全新的、能自我折叠并稳定支撑该表位的小蛋白骨架（通常小于 50 个氨基酸）。

如果希望得到的是几十个氨基酸的纯多肽，而不是一个小蛋白，那么必须引入化学修饰来强制锁定其构象。

如果表位是 $\alpha$-螺旋（常见于病毒融合蛋白，如 RSV F 蛋白、SARS-CoV-2 Spike 蛋白的 HR2 结构域）：

设计方法： 在螺旋的不参与结合的一侧（通常是 $i$ 和 $i+3$ 或 $i$ 和 $i+7$ 位），引入非天然氨基酸（如 $S_5$ 或 $R_8$）。
操作： 通过钌催化的闭环复分解反应（RCM），生成一个共价的碳氢交联桥。这能将多肽的螺旋度提高数倍，并极大增强对蛋白酶水解的抵抗力。

如果表位是 Loop 区或 $\beta$-发卡：

首尾环化： 通过酰胺键实现首尾相连（Head-to-Tail）。
二硫键约束（Disulfide Constrained）： 在多肽序列的首尾或非关键作用位点人工引入一对半胱氨酸（Cys），通过形成内源二硫键来限制多肽的自由度。
CLIPS 技术： 利用多功能亲电试剂（如 $\alpha,\alpha'$-二溴间二甲苯）与多肽中的多个半胱氨酸反应，形成刚性的双环或多环结构。

设计出来的模拟物在水中到底能不能保持构象？这需要在湿实验前用分子动力学模拟进行验证，避免盲目合成。

游离状态下的构象采样：
使用 GROMACS 或 AMBER，将设计的模拟物置于显式溶剂（Explicit Solvent）中进行 200–500 ns 的无约束分子动力学模拟。
分析指标：
- RMSD（均方根偏差）： 计算模拟过程中表位残基相对于 ESM-Fold 预测的原始天然构象的 RMSD。若 RMSD 持续保持在 $2.0 \text{ \AA}$ 以下，说明该模拟物成功锁定了目标构象。
- RMSF（均方根涨落）： 热点残基的 RMSF 应处于极低水平，表明它们在空间中是刚性且高度定位的。
结合自由能验证（MM-PBSA/GBSA）：
对“设计的多肽-受体”复合物进行短时间的 MD 模拟，评估结合自由能是否与天然抗原相当。

一个优秀的疫苗多肽不仅要“结构像”，还要能“激发起免疫反应”。

溶解性与防聚集设计：
最小化的多肽通常含有较多暴露的疏水残基（原本这些残基是埋在抗原内部的）。需要在非结合界面引入亲水性残基（如 Lys, Glu, Asp），或引入 PEG 化修饰，防止多肽在配制和储存过程中发生无序聚集。
T 细胞辅助表位的引入：
短肽（特别是小于 20 个氨基酸的表位）分子量过小，属于半抗原（Hapten），无法有效激活 T 细胞。必须在其 N 端或 C 端通过柔性接头（Linker，如 GGGS）连接通用的辅助性 T 细胞表位（Th Epitope，如 PADRE 序列、破伤风类毒素 P2 序列）。
多价递送（Multivalent Presentation）：
单价多肽很难引发 B 细胞受体（BCR）的交联。最有效的手段是将设计的表位模拟物共价偶联到**病毒样颗粒（VLP，如 HBcAg）**表面，或者利用自组装纳米颗粒（如 Ferritin），实现高密度的多价展示，从而在体内诱导极高滴度的中和抗体。

阶段	推荐工具 / 方法	核心输出
热点挖掘	FoldX / Rosetta Alanine Scanning	确定必须保留的核心氨基酸残基
结构嫁接	MotifGraft / RFdiffusion	生成带有表位的稳定折叠小蛋白/多肽骨架
构象锁定	PyMOL / ChemOffice / 钉合肽设计软件	设计二硫键、碳氢键引入位点
水相验证	GROMACS / Amber (MD 模拟)	筛选出在溶液中不发生构象坍塌的 candidate
原性修饰	NetMHCpan / SignalP (预测 T 细胞协助)	确定接头（Linker）和辅助表位的拼接方案