Database-ENCODE-人类基因组_黑名单 发表于 2024-01-09 | 分类于 知识沉淀 , 数据库 高通量测序检测基因组变异的过程依赖准确的基因组注释和绘图。而在组装困难的区域存在底层注释的不一致(T2T基因组的到来也许可以有效的缓解这个问题带来的影响)。但是在hg19和38的人类基因组中,相对于实际的基础基因组序列,参考序列中的重复区会由于区域的特殊性出现测序数据的富集或测序数据中模板的代表性不 ... 阅读全文 »
NGS-Dev-使用UMI的低频变异检测的性能预估模型.md 发表于 2024-01-08 | 分类于 NGS , 肿瘤检测 , 模拟评估 在我们之前的文章《深度和检测限测算》中,我们介绍了在进行一个产品开发的时候,我们应该如何比较合理的确定产品特定检测限下的预期测序深度。但是这个方法对于UMI的测序数据可能会没有那么友好,因为在使用UMI时,并不是单纯的要求深度高,而且对于Dup簇也有了一些额外的要求,比如一个Dup簇里面的read必 ... 阅读全文 »
机器学习中的距离计算 发表于 2024-01-05 | 分类于 machine_learning 距离定义:基础知识在机器学习中,我们经常需要计算样本之间的差异,进而评价个体的相似性和类别等信息。特征空间中两个样本之间的距离就是两个样本相似性的一种反映。常见的分类和聚类算法,如k近邻、k-means、层次聚类等、等都会选择一种距离或相似性的度量方法。根据数据特性的不同,可以采用不同的度量方法。一 ... 阅读全文 »
Windows下的Linux子系统 - 基于WSL 发表于 2023-12-27 | 分类于 环境配置 WSL是windows原生的一个子系统插件,可以更便捷的在Windows电脑上进行Linux环境的相关开发、测试工作。 阅读全文 »
Python-包-pyscafford.md 发表于 2023-12-25 | 分类于 Tobeinsert pyscaffoldpyscaffold-github 安装并创建项目1234567891011# 安装pip install pyscaffoldpython3 -m pip install --upgrade setuptools wheel # 用于对代码进行打包python3 -m pip ... 阅读全文 »
GO-Start 发表于 2023-11-14 | 分类于 编程拾慧 , GO 初始入门可以参考菜鸟教程 ,整体比较系统,也是入门参考的文档,涉及的相关字面内容,在此不进行赘述。仅记录一些,相比python、perl而言的个性化特点。 基础语法记录用的比较多,教程中也没有展开介绍,列在这,后续有需要的情况下,酌情补充。 key_word 示例 说明 break ... 阅读全文 »
数据模拟软件 VarBen 发表于 2023-10-17 | 分类于 NGS , software , Linux 随着NGS在分子诊断中变异(体系和胚系)检测的应用普及。临床NGS检测产品的检测范围越来越大,带来的一个优势是可以识别更多基因中的变异;但是同时也使性能验证面临巨大的挑战。临床方法学验证过程中很难获得真实样本,能同时具有大量关注且能够被检测到频率也合适的变异。所以大多数实验室都是通过对具有已知变异的 ... 阅读全文 »
Software-数据模拟-DWGSIM 发表于 2023-10-17 | 分类于 NGS , software , Linux 随着NGS在分子诊断中变异(体系和胚系)检测的应用普及。临床NGS检测产品的检测范围越来越大,带来的一个优势是可以识别更多基因中的变异;但是同时也使性能验证面临巨大的挑战。临床方法学验证过程中很难获得真实样本,能同时具有大量关注且能够被检测到频率也合适的变异。所以大多数实验室都是通过对具有已知变异的 ... 阅读全文 »