注释软件的转录本选择

简介

临床检测过程中,面对的一个比较复杂的问题,就是转录本的选择。

转录本的选择

转录本的选择需要结合相关预期临床用途。
目前华大相关产品的转录本选择方案参考文档:
[肿瘤产品转录本选择管理规程](TJ-SOP-RI-129 A0 肿瘤产品转录本选择管理规程.pdf)
文档仍在准备受控阶段,后续确定终板需要进行更新。

转录本切换评估方案

构建结构注释bed文件

首先基于新的转录本,构建一个描述基因结构的bed文件。该文件应该包含所关注的转录本结构区域。

  • 在NCBI上下载对应版本的基因结构注释结果文件*gff格式。
  • 使用 /jdfstj1/B2C_COM_P1/Research_and_Development/Database/Transtript_choose/5.1.1NCBI/gff2bed.pl 脚本将将gff格式的结构文件转化为bed文件(NCBI.gff2bed.bed)。
  • 使用bedtools对产品检测范围进行结构注释。需要基于捕获区间分别对新旧转录本获取该文件。
1
2
3
4
5
6
7
8
# 对原始bed进行排序
bedtools sort -i BedPrePare/Pancancer_v2.bed > BedPrePare/Pancancer_v2.sort.bed
# 对原始bed区域进行合并
bedtools merge -i BedPrePare/Pancancer_v2.sort.bed > BedPrePare/Pancancer_v2.merge.bed
# 基于结构文件对原始bed区域进行注释
bedtools intersect -a BedPrePare/Pancancer_v2.merge.bed -b NCBI.gff2bed.bed -wb | cut -f1-3,7-10 > BedPrePare/Pancancer_v2.anno.bed
# 评估相关基因的覆盖情况
bedtools intersect -b BedPrePare/Pancancer_v2.merge.bed -a NCBI.gff2bed.bed -wao > BedPrePare/Pancancer_v2.covercheck.bed
  • 对现有产品的新旧转录本文件进行比较。确定差异检测范围
    • 获得两套转录本区域(该区域指和检测范围区间交集为基础)之间的交集
    1
    bedtools  intersect -a Pancancer_v2.anno.Oldtrans.bed  -b Pancancer_v2.anno.Newtrans.bed  > old_new.overlap.bed
    • 获得切换转录本后减少的区域
    1
    bedtools  subtract -a Pancancer_v2.anno.Oldtrans.bed -b Pancancer_v2.anno.Newtrans.bed >  old.subtract.new.bed
    • 切换转录本后增加的区域
    1
    bedtools  subtract -a Pancancer_v2.anno.Newtrans.bed -b Pancancer_v2.anno.Oldtrans.bed   >  new.subtract.old.bed
  • 接受替换的标准

针对就转录本进行替换时,需要额外补充如下评估内容

  1. 更换转录本后,由于转录本涵盖区间发生改变,需要将更换后,不会提报的范围反馈解读。基于临床历史检测结果的变异进行汇总统计。确认是否会影响致病变异位点的输出。
  2. 核查新旧转录本特异性区域,对应的公共数据库交集区域,确定更换转录本对公共数据库变异范围产生的影响。
    针对肿瘤检测相关产品可参考数据库如下:

备注

由于部分原始下载文件中,染色体编号常规命名和常规使用命名方式可能会存在出入; 因此在下游处理过程中需要对染色体编号进行转换,转换关系如下:
NCBI获取染色体编号和NC编码之间的对应关系

Molecule name GenBank sequence RefSeq sequence Unlocalized sequences count
Chromosome 1 CM000663.1 = NC_000001.10 2
Chromosome 2 CM000664.1 = NC_000002.11 0
Chromosome 3 CM000665.1 = NC_000003.11 0
Chromosome 4 CM000666.1 = NC_000004.11 2
Chromosome 5 CM000667.1 = NC_000005.9 0
Chromosome 6 CM000668.1 = NC_000006.11 0
Chromosome 7 CM000669.1 = NC_000007.13 1
Chromosome 8 CM000670.1 = NC_000008.10 2
Chromosome 9 CM000671.1 = NC_000009.11 4
Chromosome 10 CM000672.1 = NC_000010.10 0
Chromosome 11 CM000673.1 = NC_000011.9 1
Chromosome 12 CM000674.1 = NC_000012.11 0
Chromosome 13 CM000675.1 = NC_000013.10 0
Chromosome 14 CM000676.1 = NC_000014.8 0
Chromosome 15 CM000677.1 = NC_000015.9 0
Chromosome 16 CM000678.1 = NC_000016.9 0
Chromosome 17 CM000679.1 = NC_000017.10 4
Chromosome 18 CM000680.1 = NC_000018.9 1
Chromosome 19 CM000681.1 = NC_000019.9 2
Chromosome 20 CM000682.1 = NC_000020.10 0
Chromosome 21 CM000683.1 = NC_000021.8 1
Chromosome 22 CM000684.1 = NC_000022.10 0
Chromosome X CM000685.1 = NC_000023.10 0
Chromosome Y CM000686.1 = NC_000024.9 0

竞品公司的转录本信息

世和
燃石基因转录本-part1
燃石基因转录本-part2

-------------本文结束感谢您的阅读-------------