NGS-Dev-使用UMI的低频变异检测的性能预估模型.md

在我们之前的文章《深度和检测限测算》中,我们介绍了在进行一个产品开发的时候,我们应该如何比较合理的确定产品特定检测限下的预期测序深度。
但是这个方法对于UMI的测序数据可能会没有那么友好,因为在使用UMI时,并不是单纯的要求深度高,而且对于Dup簇也有了一些额外的要求,比如一个Dup簇里面的read必须满足一定的标准我们才能认为这是一个有效的支持。
所以直观的,

  • 在没有UMI的时候,我们初始DNA投入量越高,其实越好,因为特定数据量下,初始投入越高,dup率越低,所以我们的有效深度越高。
  • 在使用UMI的时候,如果我们的DNA投入量越高,最终的dup率越低,则会导致所有Dup簇都是单条reads支持,那么这时候,我们就不能发挥Dup簇内部矫正的优势,可能得不到满足特定要求的支持突变的Dup簇,反而会导致性能下降。

所以在此介绍一种最近考虑的性能测算方案。
我们不在基于模型,而是充分发挥计算机的优势,对整个实验-测序的环节进行模拟。通过指定的实验指标,进行多次模拟寻找数据的性能表现。

相关代码实现,参考仓库: https://github.com/BGITumorBI/PerformanceMetricsModels

-------------本文结束感谢您的阅读-------------