文献全文%20for%20human%20genome%20sequencing.pdf)
二代测序(NGS)已被广泛应用于识别基因变异及其相关性研究与疾病。然而,由于人类的复杂性,测序数据的分析仍然具有挑战性文库制备、测序和分析过程中引入的遗传变异和混淆错误。本文比较开创性的开发了一种方法,synthetic DNA spike-ins—termed ‘sequins’ (sequencing spike-ins),直接添加到DNA中样品库准备前。sequins可以用来测量技术偏差,并作为内部定量以及整个流程的定性控制。sequins可以用于全基因组测序和靶向测序。在实验开始阶段将sequins添加到人类DNA样本中,然后按照生物信息学步骤分离sequins和样本衍生的测序reads,并评估检测的诊断性能。
由于sequins是参考人类 DNA 序列合成的镜像序列,因此可以轻松的和人类基因组序列进行区分,同时由于序列的镜像,可以最大可能的保证分子动力学的相似性,使得sequins可以模拟在整个实验中,各个环节引入的错误。