首页/ 产品解读 / 新闻详情

干货分享|文库“特异”决策者——接头奥秘的揭示


近些年来,测序仪型号更迭,不断刷新测序通量的纪录。测序通量的大幅增加,意味着更多的样本需要混合上机,这样的话,我们如何在茫茫数据中找到对应样本匹配的数据呢?人们想到了一种文库构建时在接头上添加“接头暗号”的方法,在测序完成之后根据“接头暗号”对样本进行分离。这里的接头暗号就是样本标签“Index/Barcode”。本文以illumina接头展开讲解,MGI接头下回见分晓。

 

1609813656835688.png

 
接头概述
 

接头的本质是一段短的碱基序列,基本包括三个部分:与flow-cell上面寡核苷酸相同或互补的片段P5/P7;测序时测序引物结合部分R1/R2;用于区分不同样本的Index。接头是待测DNA片段与Flow-cell连接的桥梁,目的片段连接接头后可以在flow-cell上扩增再测序。

图片.png
图1. 两端添加接头的DNA插入片段

 

 
接头分类
 
 
 

接头的分类方法主要有两种,一是按照Index的位置,二是按照否匹配PCR-free建库。

1. 根据Index位置可以将接头分为单端Index接头和双端Index接头。

单端Index接头指的是仅在P5端或P7端存在Index(一般在P7端),双端Index接头指的在P5和P7端均存在Index。Index的数目直接影响最终上机能混合的样本数目,双端Index比单端Index能容纳更多数目的样本,近年来为了满足一次能测量更多的样本的需求,双端带Index的接头被广泛使用。

图片.png

图2. 接头按照Index位置分为单端Index接头和双端Index接头,两种接头示意图

2. 根据接头是否匹配PCR-free建库可以将接头分为长接头和短接头。
长接头又称为完整接头,包括P5/P7+Index序列+Read 1/2,完整接头通过TA克隆的方式连接到DNA片段之后,可不进行PCR扩增反应直接上机测序(DNA量足够上机测序时可直接上机,当DNA量不够时还需进行PCR扩增使得产物达到一定的量方可上机测序)。短接头通过TA克隆方式连接到DNA片段上后,必须与包含P5/P7和Index序列的引物进行PCR扩增,扩增产物才是包含完整接头的DNA片段。也就是说短接头最终一定要通过PCR扩增形成完整接头才能上机测序。

图片.png

图3. 左边为Illumina早期推出的短接头,不包含Index;右边为长接头,是Illumina目前标准通用接头样式
 
UDI、UMI接头拓展
 
测序过程中,为了增加上样通量,一般在面临大量样本同时测序时,会选择双端Index。目前常用的双端Index策略是将少数几种Index排列组合,最终实现更多样本的区分,但这种方式一直存在接头交叉污染的可能,常规的双端Index组合标记的文库分子,有1%的错误分配率是无法被识别剔除的。

Illumina为了进一步提升通量与扩增效率,降低测序成本,为Novaseq等高通量型测序仪引入了阵列式流动槽(PFCT)和排他性扩增(ExAmp)成簇技术,但无意间却放大了Index hopping的样本标签错配现象。

图片.png

图4. Illumina不同仪器型号采取Non-patterned Flow Cell或Patterned Flow Cell模式图

为了弥补HiSeq3000/4000、HiSeq X Series及NovaSeq等测序平台凸显的标签跳跃问题,Illumina提出在文库的两端都带上独特标签(UDI)的策略,可以进行双侧校验,剔除标签错配的接头。采用双端唯一Index分析数据时,可以将Index错误分配率降低到0.01%,与之前常规的Index排列组合方法对比,Index hopping降低了两个数量级。

图片.png

图5. UDI接头Index排列组合效果图

此外,在低频和极低频突变检测中,避免假阳性是液体活检格外关注的重要一环。应用分子标签UMI技术(其作用是冻结DNA片段扩增前的状态),生信人员就能区分不同来源的DNA模板,分辨哪些是PCR扩增及测序过程中的随机错误造成的假阳性突变,哪些是患者真正携带的突变,从而过滤掉背景噪音,实现低频和极低频突变的准确检测。
UMI接头包含P5 Index、P7 Index和UMI元件,其中,UMI分子标签可以设计为完全随机的核苷酸链、部分简并核苷酸链或者固定核苷酸链。根据UMI标签所在的位置,又可以将UMI接头分为单端UMI(10 nt)接头(UMI标签紧随P7端Index)和双端UMI(5-8 nt)接头(UMI标签位于插入片段两端)。

图片.png

图6. UMI接头结构示意图
 

Index互补Yes or No?
 
 
Illumina接头根据接头设计的长短、下游应用和建库操作不同,分为短接头和长接头。其中,采用短接头测序时,i7 Index不分测序平台,都需要反向互补,i5 Index需要根据选择的测序平台决定是否需要反向互补(Miniseq,Nextseq,Hiseq 3000/4000,Hiseq X等平台需要反向互补)。采用长接头测序时,i7 Index在任何测序平台都不需要反向互补,i5 Index反向互补与否同短接头i5 Index保持一致。

表1. 接头Index测序方向汇总

1609813510382330.png

如上所述,Illumina平台接头包括长接头、短接头、UDI接头和UMI接头。在文库构建过程中,接头发挥着至关重要的作用,既决定了文库的完整性,又决定了文库的特异性,接头Index作为样本的“身份证”,可区分不同来源的DNA模板,1对1的编号,既满足多样本的协同操作,也便于生信后期对下机数据进行拆分。

 

 
产品推荐
 

产品类型

名称

货号

短接头

Hieff NGS® 96 Single Index Primer Kit for Illumina®

12611/2ES02

Hieff NGS® 384 Dual Index Primer Kit for Illumina®

12613/4ES02

长接头

Hieff NGS® Complete Adapter Kit for Illumina®

12615/6/7/8ES04/16

UDI 短接头

Hieff NGS® Stubby UDI Primer for Illumina

12404/5/6/7ES01

Hieff NGS® RNA Stubby UDI Primer for Illumina

12408/9/10/11ES01


HB201120

400-6111-883