cfDNA 甲基化建库必看!单链 vs 双链方法大比拼
10699
2026-02-27
摘要:一文读懂 cfDNA 单链与双链甲基化建库的核心差异
背景
u cfDNA 是血浆中游离的 DNA 片段,反映细胞更新状态,其甲基化测序可解析组织来源(TOO)、染色质结构等关键信息,是液体活检的重要技术手段。
u cfDNA 存在非随机片段化特征:核小体保护区域免受核酸酶降解,且该区域甲基化水平显著高于开放染色质,因此 cfDNA 整体甲基化水平高于基因组 DNA。
u dsDNA 建库需通过酶促末端修复将 cfDNA 的不规则末端补平为平末端,此过程会引入新合成的未甲基化核苷酸,可能降低片段末端的 CpG 甲基化水平;而 ssDNA 建库省略该步骤,可直接连接接头并保留天然末端特征。
二、技术路线
样本制备
从全血中提取血浆 cfDNA,使用 Qubit 荧光计和 Agilent TapeStation 进行定量和片段大小检测。(推荐翌圣生物cat#18382ES)以1 ng cfDNA 为起始量,分别构建两种文库:dsDNA 文库构建(推荐翌圣生物cat#12214ES),ssDNA 文库构建(推荐翌圣生物cat#12221ES),均扩增11 个循环。
测序与数据处理
1. 文库在 Illumina NextSeq® 2000 测序,采用 2×66 bp 读长;通过 SeqPrep2、bwa-meth、Picard 等工具完成接头修剪、序列比对、重复序列标记。
2. 用 MethylDackel 提取 CpG 位点甲基化信息,设置最小测序深度、最小比对质量、20为筛选阈值。
核小体相关甲基化分析
基于 NucPosDB 的核小体图谱,将其调整为 1 bp 中点分辨率,用 bedtools 计算 CpG 位点到核小体中心的距离,分析甲基化与核小体位置的关联。
组织来源(TOO)推断
1. 采用 Loyfer 等的人正常细胞甲基化图谱(GSE186458),选取 13 种 cfDNA 相关组织(如血管内皮、粒细胞、肝细胞等)作为参考。
2. 用非负最小二乘法(NNLS) 进行 TOO 推断,按70% 训练 / 30% 测试进行 100 次随机迭代,以决定系数(R²) 和均方误差(MSE) 评估推断效果。
末端修剪校正实验
对 dsDNA 测序读段分别修剪20 bp和40 bp,重新分析甲基化水平和 TOO 推断效果,对比不同修剪长度的校正作用。
三、结果分析
本研究通过两个 cfDNA 提取物的配对文库验证,得到以下关键结果,核心文库基础数据见下表:

表 1 两种建库方法的文库基础特征
图1 GC位点甲基化水平
结果显示
dsDNA 文库存在显著的甲基化分布偏差
Ø dsDNA 文库的 CpG 甲基化水平从读段~40 bp开始逐步下降,反向模板读段 3' 端出现急剧的甲基化丢失;而 ssDNA 文库在整个读段中保持均匀的甲基化水平。
Ø 核小体层面:dsDNA 文库在核小体二联体下游出现链特异性的低甲基化,与末端修复补平 5' 突出端引入未甲基化胞嘧啶的机制一致;ssDNA 文库则在核小体二联体两侧呈对称的甲基化分布。
dsDNA 文库全局甲基化水平显著降低
Ø 末端修复导致 dsDNA 文库在核小体相控区域的全局 CpG 甲基化水平降低约 5–7%,该偏差叠加在核小体核心区固有的甲基化低谷之上。
dsDNA 文库降低 TOO 推断的准确性
Ø dsDNA 文库因引入未甲基化胞嘧啶,高甲基化 CpG 位点的占比被低估,部分甲基化位点的丰度异常升高;而 ssDNA 文库能保留核小体保护区域的高甲基化特征,更贴合 cfDNA 原生状态。
Ø TOO 推断中,ssDNA 文库在高信息度 CpG 子集(甲基化率 <0.2 或> 0.8、<0.1 或 > 0.9)中始终表现出更高的 R²和更低的 MSE;而无生物学信息的未甲基化对照 CpG 位点,两种文库的推断效果无显著差异。
读段末端修剪可部分校正甲基化偏差,但存在权衡
Ø 对 dsDNA 读段进行 20/40 bp 末端修剪后,甲基化水平向 ssDNA 文库趋近,TOO 推断的 R² 提升、MSE 降低,40 bp 修剪可基本恢复 dsDNA 甲基化的保真度(需将 ssDNA 数据降采样至相同深度)。
Ø 修剪的弊端:显著降低独特测序覆盖度,并丢失片段末端坐标,导致片段组学分析的关键信息缺失。
四、总结
Ø dsDNA 甲基化双链建库中的酶促末端修复步骤是导致 cfDNA 甲基化水平低估的关键因素。
Ø ssDNA 甲基化单链建库因省略末端修复步骤,能保留 cfDNA 的天然末端特征和甲基化图谱,更准确地反映原生 cfDNA 的生化状态,是 cfDNA 甲基化测序分析的更优选择。
产品推荐
|
产品名称 |
产品货号 |
产品应用 |
|
Hieff® Superfast DNA Methylation Bisulfite Kit |
12228ES |
柱式法甲基化转化 |
|
Hieff® Mag Superfast DNA Methylation Bisulfite Kit |
12229ES |
磁珠法甲基化转化 |
|
Hieff NGS® Methyl-seq ssDNA library Prep kit for Illumina® V2 |
12221ES |
单链甲基化文库构建Illumina |
|
Hieff NGS® Methyl-seq ssDNA library Prep kit for MGI® V2 |
12226ES |
单链甲基化文库构建MG |
|
Hieff NGS® dsDNA Methyl Library Prep Kit for Illumina® |
12214ES |
双链甲基化文库构建 |
|
Hieff® UltraShear |
12218ES |
甲基化片段化酶 |
|
Hieff Canace® Uracil+ High-Fidelity DNA polymerase mix |
12928ES |
甲基化转化后PCR扩增 |
参考文献
[ 1] GROTH T E, MISHIN A A, RAO V, et al. End-repair causes methylation underestimation in cell-free DNA sequencing libraries[EB/OL]. bioRxiv Preprint, 2025[2025-12-17]. https://doi.org/10.64898/2025.12.15.694439.





