HOOOS

ESM-Fold预测出抗原表位后如何设计高活性的多肽模拟物

0 3 结构免疫学小兵 多肽疫苗设计ESM-Fold计算结构生物学
Apple

用 ESM-Fold 成功预测出抗原-抗体复合物的结合表位(Epitope)只是第一步。在实际的疫苗研发中,你无法直接把这一段天然序列切下来当成疫苗使用。

原因很简单:游离的短肽在水溶液中会失去天然抗原的特定空间构象,变成无序的线团(Random Coil)。 这不仅会导致其与免疫细胞受体(或中和抗体)的结合力急剧下降,还容易被体内的蛋白酶迅速降解。

要将 ESM-Fold 预测的表位转化为高活性、高稳定性的最小化多肽模拟物(Peptide Mimetics),需要经历一套从“结构降维”到“化学重构”的完整设计流程。


第一步:表位关键热点(Hotspots)的精准识别

ESM-Fold 给出了表位的空间坐标,但并非表位上的每一个氨基酸都对结合做出同等贡献。我们需要筛选出其中的核心热点残基(Hotspot Residues),即那些贡献了大部分结合自由能($\Delta G$)的位点。

  1. 计算丙氨酸扫描(In silico Alanine Scanning):
    使用 FoldXRosetta Robetta 服务器,将表位上的残基逐一突变为丙氨酸,计算突变前后的结合自由能变化($\Delta \Delta G$)。通常,$\Delta \Delta G > 1.5 \text{ kcal/mol}$ 的残基被定义为核心热点,这些残基在后续的多肽序列中必须予以绝对保留。
  2. 相互作用网络分析:
    使用 PyMOL 或 ChimeraX 观察这些热点残基与抗体/受体的相互作用模式。重点标记出氢键、盐桥和深部的疏水相互作用。这些关键的几何约束(如氢键的方向和距离)是后续骨架设计的基本依据。

第二步:结构骨架嫁接(Scaffolding & Grafting)

如果预测的表位是一个复杂的构象表位(由不连续的片段组成,或是一个特定的 $\alpha$-螺旋/$\beta$-发卡),直接合成线性肽是行不通的。此时需要进行“骨架嫁接”。

  1. 寻找天然稳定骨架(Scaffold):
    利用 DaliMaster 等结构搜索工具,在 PDB 数据库中寻找含有高度相似局部几何结构、且自身非常稳定的天然小蛋白骨架(如 $Z$-domain、Gp2、Scorpion toxin 等)。
  2. 计算嫁接(Computation Grafting):
    使用 Rosetta MotifGraft 协议,将 ESM-Fold 预测的核心表位几何结构(Motif)无缝缝合到这些稳定的骨架蛋白中。骨架蛋白的作用就像是“衣架”,强制让表位序列呈现出所需的天然构象。
  3. De Novo 骨架生成:
    如果天然骨架匹配度不高,可以使用 RFdiffusionRosettaFold Joint-Inpainting,围绕表位残基直接“从头设计”一段全新的、能自我折叠并稳定支撑该表位的小蛋白骨架(通常小于 50 个氨基酸)。

第三步:多肽模拟物的化学稳定化修饰

如果希望得到的是几十个氨基酸的纯多肽,而不是一个小蛋白,那么必须引入化学修饰来强制锁定其构象。

1. $\alpha$-螺旋表位的锁定:碳氢钉合(Hydrocarbon Stapling)

如果表位是 $\alpha$-螺旋(常见于病毒融合蛋白,如 RSV F 蛋白、SARS-CoV-2 Spike 蛋白的 HR2 结构域):

  • 设计方法: 在螺旋的不参与结合的一侧(通常是 $i$ 和 $i+3$ 或 $i$ 和 $i+7$ 位),引入非天然氨基酸(如 $S_5$ 或 $R_8$)。
  • 操作: 通过钌催化的闭环复分解反应(RCM),生成一个共价的碳氢交联桥。这能将多肽的螺旋度提高数倍,并极大增强对蛋白酶水解的抵抗力。

2. $\beta$-发卡及环状表位的锁定:环化(Cyclization)

如果表位是 Loop 区或 $\beta$-发卡:

  • 首尾环化: 通过酰胺键实现首尾相连(Head-to-Tail)。
  • 二硫键约束(Disulfide Constrained): 在多肽序列的首尾或非关键作用位点人工引入一对半胱氨酸(Cys),通过形成内源二硫键来限制多肽的自由度。
  • CLIPS 技术: 利用多功能亲电试剂(如 $\alpha,\alpha'$-二溴间二甲苯)与多肽中的多个半胱氨酸反应,形成刚性的双环或多环结构。

第四步:分子动力学模拟(MD)验证空间稳定性

设计出来的模拟物在水中到底能不能保持构象?这需要在湿实验前用分子动力学模拟进行验证,避免盲目合成。

  1. 游离状态下的构象采样:
    使用 GROMACSAMBER,将设计的模拟物置于显式溶剂(Explicit Solvent)中进行 200–500 ns 的无约束分子动力学模拟。
  2. 分析指标:
    • RMSD(均方根偏差): 计算模拟过程中表位残基相对于 ESM-Fold 预测的原始天然构象的 RMSD。若 RMSD 持续保持在 $2.0 \text{ \AA}$ 以下,说明该模拟物成功锁定了目标构象。
    • RMSF(均方根涨落): 热点残基的 RMSF 应处于极低水平,表明它们在空间中是刚性且高度定位的。
  3. 结合自由能验证(MM-PBSA/GBSA):
    对“设计的多肽-受体”复合物进行短时间的 MD 模拟,评估结合自由能是否与天然抗原相当。

第五步:免疫原性优化与递送设计

一个优秀的疫苗多肽不仅要“结构像”,还要能“激发起免疫反应”。

  1. 溶解性与防聚集设计:
    最小化的多肽通常含有较多暴露的疏水残基(原本这些残基是埋在抗原内部的)。需要在非结合界面引入亲水性残基(如 Lys, Glu, Asp),或引入 PEG 化修饰,防止多肽在配制和储存过程中发生无序聚集。
  2. T 细胞辅助表位的引入:
    短肽(特别是小于 20 个氨基酸的表位)分子量过小,属于半抗原(Hapten),无法有效激活 T 细胞。必须在其 N 端或 C 端通过柔性接头(Linker,如 GGGS)连接通用的辅助性 T 细胞表位(Th Epitope,如 PADRE 序列、破伤风类毒素 P2 序列)。
  3. 多价递送(Multivalent Presentation):
    单价多肽很难引发 B 细胞受体(BCR)的交联。最有效的手段是将设计的表位模拟物共价偶联到**病毒样颗粒(VLP,如 HBcAg)**表面,或者利用自组装纳米颗粒(如 Ferritin),实现高密度的多价展示,从而在体内诱导极高滴度的中和抗体。

落地设计流工具箱推荐

阶段 推荐工具 / 方法 核心输出
热点挖掘 FoldX / Rosetta Alanine Scanning 确定必须保留的核心氨基酸残基
结构嫁接 MotifGraft / RFdiffusion 生成带有表位的稳定折叠小蛋白/多肽骨架
构象锁定 PyMOL / ChemOffice / 钉合肽设计软件 设计二硫键、碳氢键引入位点
水相验证 GROMACS / Amber (MD 模拟) 筛选出在溶液中不发生构象坍塌的 candidate
原性修饰 NetMHCpan / SignalP (预测 T 细胞协助) 确定接头(Linker)和辅助表位的拼接方案

点评评价

captcha
健康