如何通过高通量筛选（HTS）优化 mRNA 的 5' UTR，以规避宿主免疫系统的识别？

在 mRNA 疫苗和疗法的研发中，我们经常面临一个极其棘手的“双向困境”：既要极高的翻译效率，又要极低的免疫原性。

虽然化学修饰（如 N1-甲基假尿苷 $m1\Psi$）能显著降低外源 mRNA 被宿主模式识别受体（PRRs）识别的概率，但仅靠核苷酸修饰是不够的。mRNA 的序列特征——特别是 5' 非翻译区（5' UTR） 的一级序列与二级结构，对避免宿主免疫清除及维持翻译稳态起着决定性作用。

单纯依靠人工理性设计（Rational Design）很难穷尽巨大的序列空间。利用高通量筛选（High-Throughput Screening, HTS）与大规模平行报告基因分析（MPRA），结合机器学习，已经成为当前工业界筛选“隐形且高效”5' UTR 的主流范式。

一、宿主免疫系统究竟在“盯”mRNA 的什么？

要通过高通量筛选避开免疫识别，首先要明确筛选的“对立面”是谁。宿主细胞监测外源单链 RNA（ssRNA）和双链 RNA（dsRNA）主要依赖以下几条通路：

内吞体受体（TLR3, TLR7/8）：
- TLR7/8 偏好识别富含鸟苷（G）或尿苷（U）的单链 RNA 片段。5' UTR 若存在特定的富 U 基序（Motif），极易触发强烈的 I 型干扰素反应。
细胞质受体（RIG-I, MDA5）：
- RIG-I 主要识别 5' 端未加帽（or 缺少 2'-O 甲基化 Cap 1 结构）的双链或具有特定二级结构的 RNA。
- MDA5 则识别长双链 RNA。5' UTR 如果容易自我折叠形成稳定的发卡结构（Hairpin），或者在体外转录（IVT）中产生副产物 dsRNA，就会激活 MDA5。
效应蛋白（PKR, OAS）：
- PKR（蛋白激酶 R） 识别 RNA 的局部双链结构（如 5' UTR 中的紧密茎环结构），活化后会使翻译起始因子 eIF2$\alpha$ 磷酸化，直接锁死整个翻译过程。

因此，5' UTR 优化的终极目标是：消除特异性免疫识别基序，避免形成促炎性的高阶二级结构，同时维持极高的核糖体加载率。

二、构建百万级 5' UTR 突变库（Library Design）

高通量筛选的第一步是“无中生有”，设计一个包含数万到数百万种可能性的 5' UTR 候选库。目前工业界主要采用以下两种构建策略：

[理性设计/天然源库] + [随机突变/AI生成] ──> 寡核苷酸芯片合成 (Oligo Pool) ──> 克隆至质粒载体

天然来源与理性设计库：
- 收集人类基因组中高表达、高稳定性基因的 5' UTR（如 $\beta$-globin、ALAS1、RPL32 等）。
- 引入系统性突变：改变 Kozak 序列周边碱基、调整 GC 含量、系统性缩短长度等。
完全合成/深度学习生成库：
- 使用生成对抗网络（GAN）或变分自编码器（VAE）设计全新的 5' UTR 序列，过滤掉预测有高免疫原性的序列。
- 在关键调控位置（如靠近 Cap 1 的前 10 个碱基，或靠近起始密码子 AUG 的区域）进行随机简并（N-碱基掺入）合成。

三、高通量筛选的双轨管线：翻译效率与免疫规避

有了库之后，如何筛选出“高翻译、低免疫”的黄金序列？我们需要建立一套双轨并行筛选系统。

轨线 A：基于 MPRA 与多聚核糖体图谱的“高翻译”筛选

翻译效率高意味着可以用更低的 mRNA 剂量达到同等治疗效果，这本身就是最有效的“间接免疫逃逸”手段。

                    [ 5' UTR Library + Reporter (e.g., GFP/Barcoded) ]
                                          │
                                     体外转录 (IVT)
                                          │
                                     转染宿主细胞
                                          │
                                 ┌────────┴────────┐
                         [多聚核糖体裂解]     [流式细胞分选 (FACS)]
                                │                  │
                        Polysome Profiling      按GFP表达量分群
                                │                  │
                         超速离心分级沉降        提取不同组分RNA
                                └────────┬─────────┘
                                         │
                                 下一代测序 (NGS)
                                         │
                             计算每个UTR的翻译富集倍数 (TE)

构建报告系统： 将 5' UTR 突变库连接到报告基因（如绿色荧光蛋白 GFP，或带有唯一条形码 Barcode 的转录本）。
多聚核糖体分级（Polysome Profiling）：
- 将 mRNA 库转染到细胞（如树突状细胞 DC 或肝细胞）中，孵育一定时间。
- 裂解细胞，利用蔗糖密度梯度超速离心，将正在翻译的 mRNA 按结合核糖体的数量进行分级。
- 结合核糖体数量越多（处于 Heavy Polysome 组分）的 mRNA，说明其 5' UTR 的翻译起始效率越高。
NGS 计数定量： 提取重度多聚核糖体组分中的 RNA，进行高通量测序，计算每种 5' UTR 序列在高效翻译组分中的富集倍数。

轨线 B：基于报告细胞系的“低免疫”筛选

为了直接监测哪些 5' UTR 序列能够避开宿主免疫系统的识别，研发人员会引入特异性的免疫通路报告系统。

干涉素通路报告细胞系（如 HEK-Blue IFN-$\alpha/\beta$ 细胞）：
- 这类细胞的基因组中集成了受 I 型干扰素（IFN）刺激反应元件（ISRE）启动子控制的报告基因（如分泌型胚胎碱性磷酸酶 SEAP）。
- 将不同 UTR 组分的 mRNA 分池转染细胞，通过检测上清液中 SEAP 的活性，快速评估该组 mRNA 激活干扰素通路的强弱。
单细胞 RNA 测序（scRNA-seq）与条形码技术联合应用：
- 将带有 Barcode 的 5' UTR 库转染免疫细胞（如人外周血单核细胞 PBMCs）。
- 运行单细胞测序，一方面读取每个细胞内表达的 UTR 条形码，另一方面读取该细胞的转录组（重点看 ISGs——干扰素刺激基因的表达丰度）。
- 如果某个细胞内某种 5' UTR 的丰度极高，但该细胞的 CXCL10、IFIT1、OAS1 等炎症因子指标依然处于基线水平，说明该 5' UTR 成功实现了“隐形”。

四、筛选数据清洗与多维特征过滤

海量 NGS 测序数据产生后，通过生物信息学与机器学习模型，我们需要提炼出规避宿主免疫识别的黄金法则。

1. 二级结构自由度（$\Delta G$）的动态平衡

高通量筛选数据表明，5' UTR 的最小自由能（MFE, $\Delta G$）不能走极端：

不能太稳定（$\Delta G$ 过负，如 $< -30\text{ kcal/mol}$）： 极易形成稳定的发卡结构，虽然可能避免了某些单链 TLR 识别，但会卡住核糖体扫描（Scanning），且极易激活 PKR，引起细胞自我封锁。
不能太松散： 容易暴露特定单链 Motif 从而被 TLR7 捕获。
最佳区间： 筛选通常指向一个弱二级结构区（$\Delta G$ 介于 $-10$ 到 $-20\text{ kcal/mol}$ 之间），在常温下易于解链，同时不暴露出促炎性的特定空间环。

2. 碱基偏好性（Base Bias）与 Motif 剔除

通过对筛选出的低免疫原性 5' UTR 进行 Motif 分析，算法会自动生成“黑名单”：

绝对避免 AU/U 碱基富集区（AREs）： 任何连续 4 个以上的 U 或者是类似 UUAUUUAUU 的非规则序列必须在 5' UTR 中被完全剔除。
控制 CpG 岛： 5' UTR 中的非甲基化 CG 二核苷酸（CpG）极易被 TLR9 或其他胞质传感器识别，必须在序列设计中将其“同义替换”或直接删去。

3. 起始密码子周边的“空间防护”

高通量筛选还揭示了 Kozak 序列（如 GCCACCAUGG）前后的微妙平衡。在不降低翻译效率的前提下，通过微调 Kozak 序列上游的 3-5 个碱基，使其不与 5' 端帽子结构发生空间回折，能有效降低被 RIG-I 捕获的概率。

五、总结

利用高通量筛选优化 5' UTR，本质上是将分子生物学规律、大规模并行湿实验与干实验算法深度整合的过程。

通过合成百万级的候选库，结合多聚核糖体测序（Polysome-seq）和干涉素通路报告筛查，研发人员可以在短短数周内剔除掉那些会拉响细胞警报的“危险序列”，最终锁合极少数既能像内源 mRNA 一样高效翻译、又能完美绕过 TLRs、RIG-I 和 PKR 监视的“隐形”5' UTR，为下一代更安全、更低剂量、更少副作用的 mRNA 疫苗与疗法奠定坚实的分子内核。

如何通过高通量筛选（HTS）优化 mRNA 的 5' UTR，以规避宿主免疫系统的识别？

一、 宿主免疫系统究竟在“盯”mRNA 的什么？

二、 构建百万级 5' UTR 突变库（Library Design）

三、 高通量筛选的双轨管线：翻译效率与免疫规避