近些年来,测序仪型号更迭,不断刷新测序通量的纪录。测序通量的大幅增加,意味着更多的样本需要混合上机,这样的话,我们如何在茫茫数据中找到对应样本匹配的数据呢?人们想到了一种文库构建时在接头上添加“接头暗号”的方法,在测序完成之后根据“接头暗号”对样本进行分离。这里的接头暗号就是样本标签“Index/Barcode”。本文以illumina接头展开讲解,MGI接头下回见分晓。
接头的本质是一段短的碱基序列,基本包括三个部分:与flow-cell上面寡核苷酸相同或互补的片段P5/P7;测序时测序引物结合部分R1/R2;用于区分不同样本的Index。接头是待测DNA片段与Flow-cell连接的桥梁,目的片段连接接头后可以在flow-cell上扩增再测序。
接头的分类方法主要有两种,一是按照Index的位置,二是按照否匹配PCR-free建库。
单端Index接头指的是仅在P5端或P7端存在Index(一般在P7端),双端Index接头指的在P5和P7端均存在Index。Index的数目直接影响最终上机能混合的样本数目,双端Index比单端Index能容纳更多数目的样本,近年来为了满足一次能测量更多的样本的需求,双端带Index的接头被广泛使用。
图2. 接头按照Index位置分为单端Index接头和双端Index接头,两种接头示意图
Illumina为了进一步提升通量与扩增效率,降低测序成本,为Novaseq等高通量型测序仪引入了阵列式流动槽(PFCT)和排他性扩增(ExAmp)成簇技术,但无意间却放大了Index hopping的样本标签错配现象。
图4. Illumina不同仪器型号采取Non-patterned Flow Cell或Patterned Flow Cell模式图
图5. UDI接头Index排列组合效果图
图6. UMI接头结构示意图
表1. 接头Index测序方向汇总
产品类型 |
名称 |
货号 |
短接头 |
12611/2ES02 |
|
Hieff NGS® 384 Dual Index Primer Kit for Illumina® |
12613/4ES02 |
|
长接头 |
12615/6/7/8ES04/16 |
|
UDI 短接头 |
Hieff NGS® Stubby UDI Primer for Illumina |
12404/5/6/7ES01 |
Hieff NGS® RNA Stubby UDI Primer for Illumina |
12408/9/10/11ES01 |