注释软件的转录本选择

简介

临床检测过程中,面对的一个比较复杂的问题,就是转录本的选择。

转录本的选择

转录本的选择需要结合相关预期临床用途。
目前华大相关产品的转录本选择方案参考文档:
肿瘤产品转录本选择管理规程
文档仍在准备受控阶段,后续确定终板需要进行更新。

转录本切换评估方案

构建结构注释bed文件

首先基于新的转录本,构建一个描述基因结构的bed文件。该文件应该包含所关注的转录本结构区域。

  • 在NCBI上下载对应版本的基因结构注释结果文件*gff格式。

  • 使用 /jdfstj1/B2C_COM_P1/Research_and_Development/Database/Transtript_choose/5.1.1NCBI/gff2bed.pl 脚本将将gff格式的结构文件转化为bed文件(NCBI.gff2bed.bed)。

  • 使用bedtools对产品检测范围进行结构注释。需要基于捕获区间分别对新旧转录本获取该文件。

1
2
3
4
5
6
7
8
9
10
11
# 对原始bed进行排序
bedtools sort -i BedPrePare/Pancancer_v2.bed > BedPrePare/Pancancer_v2.sort.bed

# 对原始bed区域进行合并
bedtools merge -i BedPrePare/Pancancer_v2.sort.bed > BedPrePare/Pancancer_v2.merge.bed

# 基于结构文件对原始bed区域进行注释
bedtools intersect -a BedPrePare/Pancancer_v2.merge.bed -b NCBI.gff2bed.bed -wb | cut -f1-3,7-10 > BedPrePare/Pancancer_v2.anno.bed

# 评估相关基因的覆盖情况
bedtools intersect -b BedPrePare/Pancancer_v2.merge.bed -a NCBI.gff2bed.bed -wao > BedPrePare/Pancancer_v2.covercheck.bed
  • 对现有产品的新旧转录本文件进行比较。确定差异检测范围

    • 获得两套转录本区域(该区域指和检测范围区间交集为基础)之间的交集

      1
      bedtools  intersect -a Pancancer_v2.anno.Oldtrans.bed  -b Pancancer_v2.anno.Newtrans.bed  > old_new.overlap.bed
    • 获得切换转录本后减少的区域

      1
      bedtools  subtract -a Pancancer_v2.anno.Oldtrans.bed -b Pancancer_v2.anno.Newtrans.bed >  old.subtract.new.bed
    • 切换转录本后增加的区域

      1
      bedtools  subtract -a Pancancer_v2.anno.Newtrans.bed -b Pancancer_v2.anno.Oldtrans.bed   >  new.subtract.old.bed
  • 接受替换的标准

针对就转录本进行替换时,需要额外补充如下评估内容

  1. 更换转录本后,由于转录本涵盖区间发生改变,需要将更换后,不会提报的范围反馈解读。基于临床历史检测结果的变异进行汇总统计。确认是否会影响致病变异位点的输出。
  2. 核查新旧转录本特异性区域,对应的公共数据库交集区域,确定更换转录本对公共数据库变异范围产生的影响。
    针对肿瘤检测相关产品可参考数据库如下:

备注

由于部分原始下载文件中,染色体编号常规命名和常规使用命名方式可能会存在出入; 因此在下游处理过程中需要对染色体编号进行转换,转换关系如下:

NCBI获取染色体编号和NC编码之间的对应关系
|Molecule name | GenBank sequence | |RefSeq sequence|Unlocalized sequences count|
|-|-|-|-|-|
|Chromosome 1|CM000663.1|=|NC_000001.10|2|
|Chromosome 2|CM000664.1|=|NC_000002.11|0|
|Chromosome 3|CM000665.1|=|NC_000003.11|0|
|Chromosome 4|CM000666.1|=|NC_000004.11|2|
|Chromosome 5|CM000667.1|=|NC_000005.9|0|
|Chromosome 6|CM000668.1|=|NC_000006.11|0|
|Chromosome 7|CM000669.1|=|NC_000007.13|1|
|Chromosome 8|CM000670.1|=|NC_000008.10|2|
|Chromosome 9|CM000671.1|=|NC_000009.11|4|
|Chromosome 10|CM000672.1|=|NC_000010.10|0|
|Chromosome 11|CM000673.1|=|NC_000011.9|1|
|Chromosome 12|CM000674.1|=|NC_000012.11|0|
|Chromosome 13|CM000675.1|=|NC_000013.10|0|
|Chromosome 14|CM000676.1|=|NC_000014.8|0|
|Chromosome 15|CM000677.1|=|NC_000015.9|0|
|Chromosome 16|CM000678.1|=|NC_000016.9|0|
|Chromosome 17|CM000679.1|=|NC_000017.10|4|
|Chromosome 18|CM000680.1|=|NC_000018.9|1|
|Chromosome 19|CM000681.1|=|NC_000019.9|2|
|Chromosome 20|CM000682.1|=|NC_000020.10|0|
|Chromosome 21|CM000683.1|=|NC_000021.8|1|
|Chromosome 22|CM000684.1|=|NC_000022.10|0|
|Chromosome X|CM000685.1|=|NC_000023.10|0|
|Chromosome Y|CM000686.1|=|NC_000024.9|0|

竞品公司的转录本信息

世和
燃石基因转录本-part1
燃石基因转录本-part2

-------------本文结束感谢您的阅读-------------