HOOOS

如何通过高通量筛选(HTS)优化 mRNA 的 5' UTR,以规避宿主免疫系统的识别?

0 14 RNA探微者 mRNA疫苗高通量筛选5 UTR优化
Apple

在 mRNA 疫苗和疗法的研发中,我们经常面临一个极其棘手的“双向困境”:既要极高的翻译效率,又要极低的免疫原性

虽然化学修饰(如 N1-甲基假尿苷 $m1\Psi$)能显著降低外源 mRNA 被宿主模式识别受体(PRRs)识别的概率,但仅靠核苷酸修饰是不够的。mRNA 的序列特征——特别是 5' 非翻译区(5' UTR) 的一级序列与二级结构,对避免宿主免疫清除及维持翻译稳态起着决定性作用。

单纯依靠人工理性设计(Rational Design)很难穷尽巨大的序列空间。利用高通量筛选(High-Throughput Screening, HTS)大规模平行报告基因分析(MPRA),结合机器学习,已经成为当前工业界筛选“隐形且高效”5' UTR 的主流范式。


一、 宿主免疫系统究竟在“盯”mRNA 的什么?

要通过高通量筛选避开免疫识别,首先要明确筛选的“对立面”是谁。宿主细胞监测外源单链 RNA(ssRNA)和双链 RNA(dsRNA)主要依赖以下几条通路:

  1. 内吞体受体(TLR3, TLR7/8):
    • TLR7/8 偏好识别富含鸟苷(G)或尿苷(U)的单链 RNA 片段。5' UTR 若存在特定的富 U 基序(Motif),极易触发强烈的 I 型干扰素反应。
  2. 细胞质受体(RIG-I, MDA5):
    • RIG-I 主要识别 5' 端未加帽(or 缺少 2'-O 甲基化 Cap 1 结构)的双链或具有特定二级结构的 RNA。
    • MDA5 则识别长双链 RNA。5' UTR 如果容易自我折叠形成稳定的发卡结构(Hairpin),或者在体外转录(IVT)中产生副产物 dsRNA,就会激活 MDA5。
  3. 效应蛋白(PKR, OAS):
    • PKR(蛋白激酶 R) 识别 RNA 的局部双链结构(如 5' UTR 中的紧密茎环结构),活化后会使翻译起始因子 eIF2$\alpha$ 磷酸化,直接锁死整个翻译过程。

因此,5' UTR 优化的终极目标是:消除特异性免疫识别基序,避免形成促炎性的高阶二级结构,同时维持极高的核糖体加载率。


二、 构建百万级 5' UTR 突变库(Library Design)

高通量筛选的第一步是“无中生有”,设计一个包含数万到数百万种可能性的 5' UTR 候选库。目前工业界主要采用以下两种构建策略:

[理性设计/天然源库] + [随机突变/AI生成] ──> 寡核苷酸芯片合成 (Oligo Pool) ──> 克隆至质粒载体
  1. 天然来源与理性设计库:
    • 收集人类基因组中高表达、高稳定性基因的 5' UTR(如 $\beta$-globin、ALAS1、RPL32 等)。
    • 引入系统性突变:改变 Kozak 序列周边碱基、调整 GC 含量、系统性缩短长度等。
  2. 完全合成/深度学习生成库:
    • 使用生成对抗网络(GAN)或变分自编码器(VAE)设计全新的 5' UTR 序列,过滤掉预测有高免疫原性的序列。
    • 在关键调控位置(如靠近 Cap 1 的前 10 个碱基,或靠近起始密码子 AUG 的区域)进行随机简并(N-碱基掺入)合成。

三、 高通量筛选的双轨管线:翻译效率与免疫规避

有了库之后,如何筛选出“高翻译、低免疫”的黄金序列?我们需要建立一套双轨并行筛选系统

轨线 A:基于 MPRA 与多聚核糖体图谱的“高翻译”筛选

翻译效率高意味着可以用更低的 mRNA 剂量达到同等治疗效果,这本身就是最有效的“间接免疫逃逸”手段。

                    [ 5' UTR Library + Reporter (e.g., GFP/Barcoded) ]
                                          │
                                     体外转录 (IVT)
                                          │
                                     转染宿主细胞
                                          │
                                 ┌────────┴────────┐
                         [多聚核糖体裂解]     [流式细胞分选 (FACS)]
                                │                  │
                        Polysome Profiling      按GFP表达量分群
                                │                  │
                         超速离心分级沉降        提取不同组分RNA
                                └────────┬─────────┘
                                         │
                                 下一代测序 (NGS)
                                         │
                             计算每个UTR的翻译富集倍数 (TE)
  1. 构建报告系统: 将 5' UTR 突变库连接到报告基因(如绿色荧光蛋白 GFP,或带有唯一条形码 Barcode 的转录本)。
  2. 多聚核糖体分级(Polysome Profiling):
    • 将 mRNA 库转染到细胞(如树突状细胞 DC 或肝细胞)中,孵育一定时间。
    • 裂解细胞,利用蔗糖密度梯度超速离心,将正在翻译的 mRNA 按结合核糖体的数量进行分级。
    • 结合核糖体数量越多(处于 Heavy Polysome 组分)的 mRNA,说明其 5' UTR 的翻译起始效率越高。
  3. NGS 计数定量: 提取重度多聚核糖体组分中的 RNA,进行高通量测序,计算每种 5' UTR 序列在高效翻译组分中的富集倍数。

轨线 B:基于报告细胞系的“低免疫”筛选

为了直接监测哪些 5' UTR 序列能够避开宿主免疫系统的识别,研发人员会引入特异性的免疫通路报告系统。

  1. 干涉素通路报告细胞系(如 HEK-Blue IFN-$\alpha/\beta$ 细胞):
    • 这类细胞的基因组中集成了受 I 型干扰素(IFN)刺激反应元件(ISRE)启动子控制的报告基因(如分泌型胚胎碱性磷酸酶 SEAP)。
    • 将不同 UTR 组分的 mRNA 分池转染细胞,通过检测上清液中 SEAP 的活性,快速评估该组 mRNA 激活干扰素通路的强弱。
  2. 单细胞 RNA 测序(scRNA-seq)与条形码技术联合应用:
    • 将带有 Barcode 的 5' UTR 库转染免疫细胞(如人外周血单核细胞 PBMCs)。
    • 运行单细胞测序,一方面读取每个细胞内表达的 UTR 条形码,另一方面读取该细胞的转录组(重点看 ISGs——干扰素刺激基因的表达丰度)。
    • 如果某个细胞内某种 5' UTR 的丰度极高,但该细胞的 CXCL10IFIT1OAS1 等炎症因子指标依然处于基线水平,说明该 5' UTR 成功实现了“隐形”。

四、 筛选数据清洗与多维特征过滤

海量 NGS 测序数据产生后,通过生物信息学与机器学习模型,我们需要提炼出规避宿主免疫识别的黄金法则。

1. 二级结构自由度($\Delta G$)的动态平衡

高通量筛选数据表明,5' UTR 的最小自由能(MFE, $\Delta G$)不能走极端:

  • 不能太稳定($\Delta G$ 过负,如 $< -30\text{ kcal/mol}$): 极易形成稳定的发卡结构,虽然可能避免了某些单链 TLR 识别,但会卡住核糖体扫描(Scanning),且极易激活 PKR,引起细胞自我封锁。
  • 不能太松散: 容易暴露特定单链 Motif 从而被 TLR7 捕获。
  • 最佳区间: 筛选通常指向一个弱二级结构区($\Delta G$ 介于 $-10$ 到 $-20\text{ kcal/mol}$ 之间),在常温下易于解链,同时不暴露出促炎性的特定空间环。

2. 碱基偏好性(Base Bias)与 Motif 剔除

通过对筛选出的低免疫原性 5' UTR 进行 Motif 分析,算法会自动生成“黑名单”:

  • 绝对避免 AU/U 碱基富集区(AREs): 任何连续 4 个以上的 U 或者是类似 UUAUUUAUU 的非规则序列必须在 5' UTR 中被完全剔除。
  • 控制 CpG 岛: 5' UTR 中的非甲基化 CG 二核苷酸(CpG)极易被 TLR9 或其他胞质传感器识别,必须在序列设计中将其“同义替换”或直接删去。

3. 起始密码子周边的“空间防护”

高通量筛选还揭示了 Kozak 序列(如 GCCACCAUGG)前后的微妙平衡。在不降低翻译效率的前提下,通过微调 Kozak 序列上游的 3-5 个碱基,使其不与 5' 端帽子结构发生空间回折,能有效降低被 RIG-I 捕获的概率。


五、 总结

利用高通量筛选优化 5' UTR,本质上是将分子生物学规律、大规模并行湿实验与干实验算法深度整合的过程。

通过合成百万级的候选库,结合多聚核糖体测序(Polysome-seq)干涉素通路报告筛查,研发人员可以在短短数周内剔除掉那些会拉响细胞警报的“危险序列”,最终锁合极少数既能像内源 mRNA 一样高效翻译、又能完美绕过 TLRs、RIG-I 和 PKR 监视的“隐形”5' UTR,为下一代更安全、更低剂量、更少副作用的 mRNA 疫苗与疗法奠定坚实的分子内核。

点评评价

captcha
健康