构建基因文库是整个高通量测序(NGS)过程中尤为关键的一步,基因文库的质量将直接影响后续测序工作。接头(Adapter)是NGS文库构建环节不可或缺的关键部分,其中包含的 Index 序列用于区分不同样本,使得单次测序或单个 Flow Cell 通道中允许多个样本混合测序。随着测序通量和测序需求的增加,接头种类上从单端Index、双端组合型index接头到UDI接头,甚至达到上千种index 种类,包装形式上也从传统的管式接头到适配自动化建库的板式包装接头延伸。与此同时,兼容市面上主流的Illumina&MGI平台的通用接头也层出不穷,完美解决不同应用场景下的NGS接头需求。
接头的常见类型
根据样本身份证Index位置可以将接头分为单端Index接头和双端Index接头
单端Index接头:指的是仅在P5端或P7端存在Index(一般在P7端);
双端Index接头:指的在P5和P7端均存在Index。比单端Index能容纳更多数目的样本,被广泛使用。
根据接头是否匹配PCR-free建库可以将接头分为长接头和短接头
长接头又称为完整接头:以Illumina平台接头为例,包括P5/P7+Index序列+Read 1/2,完整接头通过TA克隆的方式连接到DNA片段之后,可以直接上机测序(但是当DNA量不够时还需进行PCR扩增使得产物达到一定的量方可上机测序);
短接头又叫不完整接头:通过TA克隆方式连接到DNA片段上后,必须与短接头互补的引物进行PCR扩增,有完整的文库结构后才能上机测序。
Index作为接头中的重要组成部分,简单来说Index是混合样本中不同样本的“身份证”,其本身就是一段碱基序列,一般长6nt或8nt。通过对这种“身份证”的识别,就可以在混合样本中对单个样本的数据进行识别。Index的选择通常需满足两个原则:碱基平衡和荧光信号平衡。
碱基平衡,指的是Index的复杂度和平衡度,是多个Index之间的平衡。组合的原则是:同一组index中的A/T/C/G四种碱基都需要包含,且这4种碱基的比例接近,各占25%左右。
荧光信号平衡,是指在不能保证碱基平衡的情况下,选择保证荧光信号的平衡。在Illumina平台中的4通道测序仪中,dG/dT使用绿色荧光标记,dC/dA使用红色荧光标记。测序时每个循环里绿色和红色两种荧光信号都必须存在以保证测序顺利进行。因此在选择Index时需要考虑绿色信号和红色信号的平衡。
双端index之CDI接头:Combined Dual Index,一对多的接头,即可以根据一定的要求对两端的index进行组合,最终形成的是双端index文库
双端index之UDI&UDB接头:减少index hopping和mis-assignment
两端index成组设计,双端唯一,两端可交叉验证。采用双端唯一index分析数据时,可以将index错误分配率降低到0.01%,与之前常规的index排列组合方法对比,index hopping降低了两个数量级。使用UDI接头可以大幅度降低illumina测序过程中因为机器测序或者实验过程中引入的交叉污染,从而尽可能避免测序数据“张冠李戴”的现象。但其实并非UDI接头可以防止交叉,而是发生序列交叉了之后,可以丢弃这部分数据。
图4.UDI接头index排列组合效果图
UMI接头:低频突变检测、绝对定量的利器
UMI接头包含P5 Index、P7 Index和UMI元件,其中,UMI分子标签可以设计为完全随机的核苷酸链、部分简并核苷酸链或者固定核苷酸链。根据UMI标签所在的位置,又可以将UMI接头分为单端UMI(10 nt)接头(UMI标签紧随P7端Index)和双端UMI(5-8 nt)接头(UMI标签位于插入片段两端)。
在UDI接头结构的基础上引入UMI标签,通过对原始DNA分子片段进行标记,能够验证测序结果在原始DNA序列上的一致性,分辨出检测到的突变是真实的低频突变还是来源于测序错误和PCR扩增错误,从而过滤掉背景噪音,实现低频突变的准确检测。
图5.UMI接头相关结构和产品信息
板式包装接头
采用自动化设备来进行高通量NGS样本建库,传统的管式包装接头已经无法满足需求。为了更好的匹配当前的自动化设备,针对Illumina和MGI平台分别开发了由96微孔板包装的384 UDI接头试剂盒。其中,Illumina平台为完整型长接头,MGI平台为截短型接头。板式包装接头搭配自动化建库试剂盒,可以完美解决当前的手动建库试剂盒与自动化平台的兼容性问题!
图6.板式包装接头试剂盒和稳定性数据
接头产品选择指南
产品类别 |
接头类型 |
产品名称 |
Index 种类 |
货号 |
|
Illumina平台 |
管式包装 |
单端index完整长接头 |
Hieff NGS® Complete Adapter Kit for Illumina®,Set1/Set2 |
96种 |
13519-13520ES |
双端Index CDI接头-DNA |
Hieff NGS® 384 CDI Primer for Illumina®,Set1/Set2 |
384种 |
12412-12413ES |
||
双端Index CDI接头-RNA |
Hieff NGS® RNA 384 CDI Primer for Illumina®,Set1/Set2 |
384种 |
12414-12415ES |
||
双端Index UMI接头 |
Hieff NGS® Dual UMI UDI Adapter Kit for Illumina®,Set1/Set2 |
96种 |
13370-13371ES |
||
转座酶接头引物 |
Hieff NGS® Tagment Index Kit for Illumina® |
384种 |
12416ES |
||
板式包装 |
单端index完整长接头 |
Hieff NGS® Complete Adapter Kit for Illumina(板式) |
96种 |
13585ES |
|
双端Index UDI长接头 |
Hieff NGS® Full UDI Adapter Kit for Illumina® Set1-Set4(板式) |
384种 |
12333-12336ES |
||
双端Index UDI接头 |
Hieff NGS® Stubby UDI Primer Kit for Illumina® Set1/Set2/Set3/Set4(/Set5-Set8/Set9-Set12板式) |
1152种 |
12327-12332ES |
||
管式包装 |
通用PE adapter |
Hieff NGS® C177P1 PE Adapter for Illumina® |
- |
12939ES |
|
MGI平台 |
管式包装 |
单端index完整长接头 |
Hieff NGS® Complete Adapter Kit for MGI,Set1/Set2/Set3 |
96种 |
13361-13362ES |
双端Index UMI接头 |
Hieff NGS® Dual UMI UDB Adapter Kit for MGI®,Set1/Set2 |
96种 |
13367-13368ES |
||
板式包装 |
单端index完整长接头 |
Hieff NGS® Complete Adapter Kit for MGI® |
96种 |
13585ES |
|
双端Index UDB接头 |
Hieff NGS® Unique Dual Barcode Adapter Kit for MGI®,Set1/Set2/Set3/Set4 |
384种 |
13536-13539ES |
||
通用接头(Illumina&MGI) |
板式包装 |
双端Index UDI接头 |
Hieff NGS® Universal Stubby UDI Primer Kit |
96种 |
12323ES |