捕获建库方法怎么选?看这个就够了

 

背景介绍:

高通量测序技术的发展,带来的是测序成本的慢慢降低。但是这并不意味着对测序之后得到的极其庞大的数据量的分析工作也随之变得简单。恰恰相反,更高的测序深度导致测序的数据量越来越大,分析工作也是愈加困难。于是近年来测序技术的发展出现了两个极端的方向,一个是大而全的全基因组测序(Whole Genome Sequencing),另一种就是小而精的靶向捕获测序(Target Capture Sequencing)。

image.png 

图1. 靶向捕获测序示意图

与全基因组测序相比,捕获测序可以针对感兴趣的区域进行分离与富集,不仅检测灵敏度更高,而且大大降低后续的数据分析工作。举例来说,外显子组区域仅占全基因组的1%左右,但却包含了绝大部分的已知致病突变,将外显子区域分离出来后单独进行测序,后续的分析就能降低99%的工作量,极大的加快分析的速度。不仅如此,在遗传突变、肿瘤筛查等领域,靶向捕获所能达到的灵敏度也是全基因组测序完全无法实现的。由于捕获测序在测序前就对基因的目标区域进行了分离与富集,目标区域的大幅减少可实现5000×甚至更高的测序深度。测序深度的提高意味着更高的灵敏度(能够检测低频率的变异),其检测极限低至0.1%。因此,在精准医疗时代,小而精的靶向捕获测序似乎更受科学家的偏爱。  

那说了这么多,如何才能将我们的感兴趣的区域捕获出来呢?

l 常见的捕获手段

常见的目标区域捕获方法主要有三种,杂交捕获(Hybrid Capture)、分子倒置探针(Molecular Inversion Probes)以及多重PCR(Multiplex Polymerase Chain Reaction)。

1、杂交捕获

杂交捕获根据核酸分子碱基互补杂交原理,针对目标区域设计特异探针并将探针合成在固相或液相芯片上,然后打断基因组DNA,加上测序接头后与探针杂交,将基因组DNA目标区域捕获下来,回收目标DNA片段,直接构建高通量测序文库。一般来说,杂交捕获根据探针的状态不同分为固态杂交和液态杂交。前者以罗氏公司的NimbleGen为代表,后者以Agilent SureSelect为代表。

a. 固态杂交: 本质就是芯片,芯片上布满了探针,将制备好的文库与芯片上的探针杂交,洗脱未结合的片段,回收被探针富集的DNA片段。探针长度为50-105bp不等。其探针密度和序列都可以自己设置(一般来说,针对一个区段的探针密度越大,其捕获成功率越高)。

image.png 

图2. Roche NimbleGen捕获技术流程示意图

b.液态杂交:探针存在于液相种,探针携带生物素。当探针与目标区段杂交之后,通过链亲和素修饰的磁珠将探针吸附,未被捕获的片段扔掉。之后通过变性可以将探针和目标区段分开,然后利用磁珠将所有空探针吸附丢弃,目标区段捕获完成。

image.png 

图3. Agilent SureSelect捕获技术流程示意图

优点:捕获的区段大,均一性好。

缺点:特异性差。因为样本是随机打断,捕获时候可能与部分目的区段杂交,导致含有部分目的区段的片段被捕获。

2、分子倒置探针

分子倒置探针(MIP)技术优势是特异性好而且捕获完成后的片段直接完成了建库(杂交捕获后还需要构建测序文库,主要是添加Index和测序接头)。其原理是设计一个口袋状探针,探针结构如图所示,H1和H2能和目标区段退火,然后利用DNA聚合酶将探针缺口补齐,同时添加DNA连接酶,将缺口处磷酸二酯键连接,即可构成一个完整的环状探针。然后通过外切酶将游离的探针消化,完整的探针包括目标区段的序列,利用通用序列(H1、H2之间序列)作为后续文库构建的引物(可添加index和测序引物),扩增产物可以直接作为二代测序文库。

image.png 

4.分子倒置探针示意图(From Wikipedia)

image.png 

图5. MIP捕获技术流程示意图(From Wikipedia)

优点:特异性高

缺点:捕获效率不高。

 

3、多重PCR

目前多重PCR捕获是目前应用比较广泛的,比较适合大规模样本。本文主要以Life公司和Illumina公司的两种方法做介绍:

Ion Ampliseq(Thermo Fisher)

Ion Ampliseq关键之处在于引物设计,该公司设计的引物可以满足1000-2000重单管反应并且不产生引物二聚体和非特异性产物。

image.png 

6. Ion Ampliseq技术流程示意图

优点:方法简单,起始量低至10ng,在PCR产物以及石蜡样本中有明显优势。

难点:引物池是需要丰富的引物设计经验,目前只有thermo做的好,并且将经验做成了软件,登陆www.ampliseq.com提交序列即可。

 

 

Illuminna Trueseq(Illumina)

针对目标区段设计两段探针,探针和DNA双链中的一条链杂交,通过DNA聚合酶和DNA连接酶的作用,将探针中间的缺口补齐。上下游探针携带有通用序列,之后利用携带通用序列的建库引物(index和测序引物等)进行扩增以后即完成建库。

image.png 

图7. Illumina Trueseq技术流程示意图

优点:保证多个扩增子扩增效率的一致性

难点:连接反应操作繁琐,并且对起始模板浓度要求比较高。

l 三种捕获技术比较

综上,目前常见的三种捕获建库方法中:杂交捕获的区段大,且均一性好,但是有些含有部分目的区段的片段也可能被捕获,导致特异性差;分子倒置探针特异性比较高,但同时高特异性会影响捕获的效率;而多重PCR优势在于操作简单,自己设计引物即可,但是难点也在引物设计:如何保证扩增的特异性,如何避免引物二聚体等。详情见下表:

表 三种捕获测序技术对比分析

image.png 

参考文献:

Mamanova L, Coffey AJ, Scott CE. Target-enrichment strategies for next-generation sequencing. Nat Methods. 2010 Feb;7(2):111-8.

 

往期精彩推送(建议添加超链接直达往期推送):

1、多重PCR技术要点全解析

2、划重点!NGS中DNA建库方法全面解析

3、一文全面解析NGS接头的奥秘

 

 

l 相关产品

产品类别

产品名称

产品货号

产品规格

促销价(元)

DNA建库试剂盒

Hieff NGS® MaxUpⅡ DNA Library Prep Kit

12200ES24/96

24/96 T

4540/16496

多重PCR

Hieff® Multiplex PCR Kit

13279ES60/76

100/500 T

875/3165

Hieff® Multiplex PCR Master Mix

13280ES60/76

50/200 T

875/3165

 

 

400-6111-883