高通量测序技术的飞速发展,测序通量大幅增加,要求上游样本处理尽可能简单快速,以提高NGS整个流程的工作效率。文库构建,尤其是DNA文库构建是二代测序建库技术的基础,其他的建库方法都以该方法为基础发展而来。DNA建库方法是分子生物学的实验原理,其本质就是在待测片段两端加上接头的过程,目前DNA建库方法按照接头连接方式不同可分为五类:
TA克隆连接接头建库是目前应用广泛的建库技术,简单描述就是:将提取好的DNA片段化,在进行末端修复和加A尾,然后连接上接头(adapter),最后通过PCR扩增(可选),中间再穿插着纯化/分选步骤就完成了文库的构建。在这里,提前合成好的带T尾接头和末端带A的目的片段在DNA连接酶的作用下通过TA克隆方式连接(图1)。
图1. TA克隆连接接头建库法流程图
TA克隆连接接头可以有效保留样本几乎所有基因组信息,非常有利于未知拷贝数的和基因组变异的检测,是全基因组测序和外显子测序的主要建库手段,目前市面上有很多试剂盒供应,直接应用试剂盒建库,操作简单,2.5-3.5h就可获得稳定高品质文库。
Swift建库方案是Swift BioSciences公司独有的NGS建库技术,基本步骤与TA克隆连接接头建库方法类似,是由TA克隆连接接头的方法发展而来。主要通过两步法在插入片段两端引入P5和P7接头序列,末端修复之后,先在3,端连接带P7的接头,再在5,端连接带P5的接头,最后通过PCR扩增(可选)完成文库构建(见图3)。Swift法建库主要宣传优势是文库转化效率高,特别是针对cfDNA样本的建库实验。但此方法操作比较繁琐,新手很难达到其官方宣传的建库效率。
图2. Swift法建库流程图
转座酶法建库技术的核心是Tn5转座子,Tn5转座子是一段含有若干抗性基因和编辑转座酶基因的DNA片段,是一种细菌转座子,最早在大肠杆菌中发现。NGS文库构建即把DNA样本片段化或筛分成指定长度的目标序列,再加上寡核苷酸接头P5、P7(和条形码Barcode),用于后续测序上机。传统建库方式需经过DNA片段化、末端修复、接头连接、文库扩增、多次纯化分选等步骤,耗时较长,将Tn5用于测序文库构建时,可将DNA片段化、末端修复、接头连接等多步反应转变为1步反应,极大缩短建库时间,提高工作效率。
Tn5用于NGS建库的体外转座要素包含:转座子的末端序列、靶DNA、转座酶(Tnp)和Mg2+(激活剂),转座法建库形成的文库结构如下:
图3. 转座法建库文库结构
将P5、P7端部分接头序列(Adapter 1/2)+转座子末端序列设计合成供体DNA,Tnp识别转座子末端形成带有P5、P7端部分接头的Tn5转座复合体(见下图4)。该复合体识别受体DNA的靶序列(Target site),切断受体DNA,并插入携带的供体DNA,形成一端带有P5部分接头Adapter 1,一端带有P7部分接头Adapter 2的DNA,之后通过PCR加上Barcode以及接头其余部分,形成含P5端与P7端完整接头的DNA文库。
图4. Tn5转座系统用于文库构建
转座系统具有快速“剪切、粘贴”、“复制、粘贴”的功能,已被创新应用于NGS领域,如ATAC-Seq(Assay for Transposase-Accessible Chromatin with highthroughput sequencing,利用高通量测序检测转座酶易接近的染色质),LIANTI(Linear Amplification via Transposon Insertion,通过转座子的线性放大),单倍体分型,结构变异检测等,不仅高效简便,有效缩短NGS样本建库时间,实现规模化快速测序,提高测序分辨率,同时能够被灵活改造,应用于更多的技术创新。
扩增子建库是指利用PCR反应在待测DNA片段两端加上接头的方法,原理相对比较简单,只需要两轮PCR和两步纯化就可以得到目标区域的文库(如图5),其中第一步是含通用序列的引物与目标区域结合,第二步通过PCR反应连接测序接头,使得构建的文库可以用于上机测序(图6)。
图5.扩增子建库的操作步骤
图 6.扩增子建库的两次PCR反应
与其它建库方法对比,扩增子建库通过定制引物Panel完成文库构建。在临床背景下,扩增子建库方法可以针对疾病目标基因进行捕获,提高目标基因检测的覆盖度和测序深度,解释临床结果。相对于其他建库方法来说,扩增子方法建库可以通过单次测序反应检测更多患者样本,后期生信分析的任务大大减少,得到的数据更易于储存和管理。
但是此方法的应用还受到一些限制:
1)PCR扩增子建库应用于全外显子或全基因组建库时,由于设计出的引物不能完全扩增出所有的待测片段会导致最终的文库覆盖率较低。
2)当扩增子之间有重叠时,为了避免重叠部分产生的短扩增子的优势扩增的影响,需要有两个或多个引物池,这样就会导致试验流程复杂且增加成本。
3)多重PCR反应中容易出现引物二聚体的积累,引物二聚体由彼此杂交的引物分子组成,多重PCR反应中多对引物的存在大大提高了引物二聚体的形成机会,而引物二聚体的扩增会大量消耗引物本身和体系中其他的原料,甚至有抑制所需DNA序列扩增的效果。
平末端连接接头的方法基于Ion Torrent平台。与Illumina平台类似,Ion Torrent平台的文库构建目的也是在片段化好的DNA片段两端加上特定接头,该方法一般包括4个步骤:DNA样本片段化、末端修复,连接adapter(PI和A/P1和X),选择性回收DNA片段,文库PCR富集,纯化PCR产物(见图7)。
图7.平末端接头连接建库方法流程图(Ion Torrent平台)
在这里需要注意的是:在Ion Torrent平台构建好的文库通过油包水PCR种到测序柱子上,文库中的X或A接头是测序起始端,而P1接头是是连到测序珠子的这一端。与Illumina通过采集荧光信号记录记录碱基序列的方法不同,Ion Torrent的测序是通过微环境中pH值短暂的下降被pH电极检测到并且把测得的值传给计算机记录。
综上,NGS建库可以按照接头加入目的片段的不同分为5种,其中TA克隆连接接头建库法应用广泛,适用于绝大多数样本建库,是目前商业化建库方式的主流;Swift法与TA克隆连接接头法类似,操作上相对繁琐,P5接头和P7接头是分两步连接上的;转座酶法只需1h 40min即可完成文库构建,可以节省大量的人力,但是在应用上只适用于cDNA和全基因组等文库的构建,且转座酶本身具有偏好性,对后续的测序质量会有一定的影响;PCR扩增子建库是捕获建库的一种,适用于临床背景下靶向基因的研究,平末端连接接头建库适用于Ion Torrent平台,Ion Torrent市场占有率相对较低,所以此建库方法应用范围相对较少(见下表)。
表 NGS 5种建库方法比较
翌圣生物长期致力于NGS的研发和生产,成功推出了高通量测序上游样本文库制备的完整产品线,不仅提供性价比高的NGS建库试剂盒,还可以根据客户的需求定制开发相关产品。