靶向捕获相关概念

cfDNA片段长度

cfDNA片段长度约170bp 参考文献 Lengthening and shortening of plasma DNA in hepatocellular carcinoma patients
image

中靶率(on target rate)

液相杂交捕获是一种容错型富集方法,无法做到100%中靶(On target)。在测序下机数据中,总存在一定比例的脱靶数据(Off target),即非靶向区域数据,若该部分数据占比过多,会造成有效利用数据减少。通常使用碱基或者读长片段来计算中靶率,中靶率代表了靶向捕获区域范围内的碱基数或读长片段数占有效测序下机数据中碱基总数或读长片段总数的比例。本次评估中使用碱基数作为评估标准,即%中靶=中靶的碱基数/总有效碱基数。

覆盖度(coverage)

覆盖度评估包括读长深度(Read depth)以及完整性(completeness)。需要评估并明确平均以及最小覆盖深度、覆盖均一性以及超过最小覆盖深度的目标区域碱基比例的阈值。需要评估产品宣传检测区域的覆盖度或者完整度比例。
平均覆盖深度(average coverage depth)
覆盖深度指被测序的DNA片段比对(mapping)到基因组靶向区域的次数,平均覆盖深度指整个检测区域中,各靶向区域覆盖深度的均值,靶向区域被覆盖的越深,其测序结果的可靠性和灵敏度越高。当评估检测所使用的适合的覆盖深度,可以使用标准品或者前期特征化的样本来进行深度定义,即适当平均深度条件下,额外的测序深度覆盖度不能显著的提高测序的准确性。

覆盖均一性(coverage uniformity)

在液相杂交捕获体系中,针对不同GC含量、碱基重复性区域等,探针经过捕获以及PCR扩增后会产生不同程度的数据偏好性,体现在不同目标区域检测到的覆盖深度不完全相同,标准差与平均数的比值越小,说明探针的捕获均一性越好。
ps:GC含量高的区域经常会降低覆盖均一性。

Fold80

芯片捕获区 80%的区域可以达到平均深度的所需要增加的数据量; 一般经验上要求Fold-80要小于2。
一个比较直观的示意图如下:
image
Evenness of coverage can be evaluated by the fold80 measure which represents the amount of additional sequencing needed to have 80% of all targets covered at the currently observed mean. It is computed as the mean coverage divided by the 20th percentile. Smaller values indicate tighter coverage distributions. Left, large fold80 values correspond to a wide distribution and uneven coverage; Right, small values correspond to a narrow distribution and even coverage.

同样Twist也提供了一个比较详细的介绍说明
image
CD: desired coverage
CM: the mean coverage actually observed in the experiment.
引自: TWIST: The Importance of Coverage Uniformity Over On-Target Rate for Efficient Targeted NGS

-------------本文结束感谢您的阅读-------------