在分子生物学和基因治疗领域,高通量筛选(High-Throughput Screening, HTS)早就不再局限于“转录因子(TF)-靶启动子”这种经典的蛋白质-DNA相互作用模式。
随着大规模并行报告基因分析(MPRA)、CRISPR 饱和突变(Tiling Screen)以及高通量测序技术的融合,筛选的维度已经全面向非编码RNA(ncRNA)的精细结构以及**基因组中的顺式作用元件(Cis-regulatory elements)**延伸。
除了转录因子,以下几类非编码RNA及调控区域同样是高通量筛选的极佳赛道,且在基础研究和工业转化(如mRNA疫苗设计、AAV基因治疗)中具有极高价值。
一、 非编码RNA(ncRNA)维度的筛选对象
非编码RNA虽然不翻译成蛋白质,但其二级结构、修饰位点以及与其他生物大分子的相互作用,决定了复杂的细胞命运。
1. lncRNA 的功能核心结构域(Functional Domains)
长链非编码RNA(lncRNA)动辄数kb,但真正起调控作用的往往只是其中的某一段保守基序(Motif)或二级结构域。
- 筛选方案:
- CRISPR 铺路筛选(CRISPR Tiling Screen):针对候选 lncRNA 的全长DNA序列,设计密集的 sgRNA 库进行敲除或激活(CRISPRi/a),通过表型筛选找出哪些特定区段的突变会导致表型丢失。
- 高通量片段文库(Fragment Library):将 lncRNA 切割成不同长度的重叠片段,构建到表达载体中,通过高通量递送与表型富集,直接定位其活性结构域(Minimal functional unit)。
2. miRNA 海绵(Sponge)与 circRNA 的靶向结合位点
微小RNA(miRNA)通过结合靶mRNA来抑制其翻译。竞争性内源RNA(ceRNA,如某些lncRNA和环状RNA circRNA)可以通过“海绵吸附”来解除这种抑制。
- 筛选方案:
- 合成海绵文库:利用高通量DNA合成技术,构建包含不同突变、不同间距的 miRNA 结合位点(MRE)文库。
- 双荧光报告系统结合高通量测序:通过流式细胞术(FACS)分选不同荧光强度的细胞,利用测序评估不同序列对 miRNA 的吸附效率,筛选出超强吸附能力的“人工miRNA海绵”,用于肿瘤治疗研究。
3. 核酶(Ribozymes)与核糖开关(Riboswitches)
这些是具有催化活性或配体结合能力的RNA结构元件,广泛用于合成生物学中的基因电路控制。
- 筛选方案:
- HT-SELEX 与序列突变库:在体外合成含有随机序列的核糖开关文库,加入小分子配体后,利用选择性剪切或结合特异性进行多轮富集。
- 高通量RNA测序(Kinetic RNA-seq):在单次反应中并行评估数十万个核酶变体的催化速率,筛选出对特定环境信号(如温度、pH、小分子代谢物)高度敏感的控制元件。
二、 启动子及其他顺式调控区域的筛选对象
在转录控制和翻译控制层面,除了转录因子的结合,DNA/RNA本身的序列特征和局部结构同样决定了表达强度和特异性。
1. 核心启动子与增强子文库(MPRA 方案)
这是目前基因治疗领域最热门的方向之一。天然的组织特异性启动子往往体积过大,不利于装入 AAV 等载体,或者特异性/强度不足。
- 筛选方案(Massively Parallel Reporter Assay, MPRA):
- 人工合成调控元件(CREs):将已知的增强子核心 motif、转录因子结合位点进行高通量的随机排列组合,拼接上独特的 DNA Barcode 和报告基因。
- 体内/体外筛选:将质粒/病毒库导入特定细胞系或动物体内(如小鼠肝脏、心脏),提取 RNA 并对 Barcode 进行深度测序。
- 产出:直接筛选出体积小、强度高、且极具组织特异性的人工合成启动子(Synthetic Promoters)。
2. 5' UTR 与 3' UTR 元件(翻译调控与稳定性)
非翻译区(UTR)决定了 mRNA 的寿命和翻译效率,这在 mRNA 疫苗和药物研发中是绝对的核心机密。
- 5' UTR 内置核糖体进入位点(IRES)与 uORF(上游开放阅读框):
通过高通量合成突变库,筛选能够在线粒体或特定应激条件下,绕过经典扫描机制高效启动翻译的 5' UTR 序列。 - 3' UTR 与 RNA 结合蛋白(RBP)结合位点及多聚腺苷酸化位点(APA):
构建包含不同 RBP 结合 motif 的 3' UTR 突变库,利用高通量测序监测其在细胞内的降解动力学,筛选出能显著延长 mRNA 半衰期的超稳结构。
3. 剪接调控元件(Splicing Regulatory Elements, SREs)
内含子与外显子交界处的剪接供体/受体位点,以及外显子/内含子剪接增强子(ESE/ISE)或抑制子(ESS/ISS),直接控制着选择性剪接。
- 筛选方案(Minigene Reporter Screen):
- 构建包含目标剪接区域及条形码的核心小基因(Minigene)文库。
- 导入细胞后,通过 RT-PCR 和高通量测序(Isoform-seq),定量分析每个突变体对剪接异构体(Isoforms)比例的影响。
- 应用:针对罕见病(如脊髓性肌萎缩症 SMA)筛选能够改变异常剪接的反义寡核苷酸(ASO)靶点或小分子剪接改良剂。
4. 染色质绝缘子(Insulators)
绝缘子可以阻止增强子对非靶启动子的错误激活,并防止异染色质诱导的基因沉默。
- 筛选方案:
- 在报告基因与增强子之间插入随机 DNA 候选文库。
- 通过高通量筛选阻断报告基因表达、或维持报告基因长期稳定表达(抗沉默)的克隆。
- 筛选出高效的绝缘子元件,用于构建更加安全、表达稳定的转基因载体。
三、 总结:如何选择技术路线?
针对上述不同对象,筛选方案的底层逻辑可以归纳为以下三类:
| 筛选对象 | 推荐高通量方案 | 核心检测技术 | 主要应用场景 |
|---|---|---|---|
| lncRNA / 顺式调控元件 | CRISPR Tiling Screen | 富集/表型筛选 + sgRNA-seq | 功能结构域定位、疾病靶点发现 |
| 合成启动子 / UTRs | MPRA (Massively Parallel Reporter Assay) | DNA/RNA Barcode 测序 | 基因治疗启动子优化、mRNA 疫苗设计 |
| RNA 结构/配体结合 | HT-SELEX / In vitro RNA-seq | 亲和纯化 + 深度测序 | 核酸药物(Aptamer)研发、生物传感器 |
在实际操作中,将生物信息学预测(如利用深度学习预测启动子强度或 RNA 二级结构)与上述高通量筛选实验(Wet-lab)相结合,形成“计算预测 - 高通量筛选 - 机器学习优化”的闭环,是目前前沿实验室效率最高的研发范式。