简介
临床检测过程中,面对的一个比较复杂的问题,就是转录本的选择。
转录本的选择
转录本的选择需要结合相关预期临床用途。
目前华大相关产品的转录本选择方案参考文档:
肿瘤产品转录本选择管理规程
文档仍在准备受控阶段,后续确定终板需要进行更新。
转录本切换评估方案
构建结构注释bed文件
首先基于新的转录本,构建一个描述基因结构的bed文件。该文件应该包含所关注的转录本结构区域。
在NCBI上下载对应版本的基因结构注释结果文件*gff格式。
使用 /jdfstj1/B2C_COM_P1/Research_and_Development/Database/Transtript_choose/5.1.1NCBI/gff2bed.pl 脚本将将gff格式的结构文件转化为bed文件(NCBI.gff2bed.bed)。
使用bedtools对产品检测范围进行结构注释。需要基于捕获区间分别对新旧转录本获取该文件。
1 | 对原始bed进行排序 |
对现有产品的新旧转录本文件进行比较。确定差异检测范围
获得两套转录本区域(该区域指和检测范围区间交集为基础)之间的交集
1
bedtools intersect -a Pancancer_v2.anno.Oldtrans.bed -b Pancancer_v2.anno.Newtrans.bed > old_new.overlap.bed
获得切换转录本后减少的区域
1
bedtools subtract -a Pancancer_v2.anno.Oldtrans.bed -b Pancancer_v2.anno.Newtrans.bed > old.subtract.new.bed
切换转录本后增加的区域
1
bedtools subtract -a Pancancer_v2.anno.Newtrans.bed -b Pancancer_v2.anno.Oldtrans.bed > new.subtract.old.bed
接受替换的标准
针对就转录本进行替换时,需要额外补充如下评估内容
- 更换转录本后,由于转录本涵盖区间发生改变,需要将更换后,不会提报的范围反馈解读。基于临床历史检测结果的变异进行汇总统计。确认是否会影响致病变异位点的输出。
- 核查新旧转录本特异性区域,对应的公共数据库交集区域,确定更换转录本对公共数据库变异范围产生的影响。
针对肿瘤检测相关产品可参考数据库如下:
备注
由于部分原始下载文件中,染色体编号常规命名和常规使用命名方式可能会存在出入; 因此在下游处理过程中需要对染色体编号进行转换,转换关系如下:
NCBI获取染色体编号和NC编码之间的对应关系
|Molecule name | GenBank sequence | |RefSeq sequence|Unlocalized sequences count|
|-|-|-|-|-|
|Chromosome 1|CM000663.1|=|NC_000001.10|2|
|Chromosome 2|CM000664.1|=|NC_000002.11|0|
|Chromosome 3|CM000665.1|=|NC_000003.11|0|
|Chromosome 4|CM000666.1|=|NC_000004.11|2|
|Chromosome 5|CM000667.1|=|NC_000005.9|0|
|Chromosome 6|CM000668.1|=|NC_000006.11|0|
|Chromosome 7|CM000669.1|=|NC_000007.13|1|
|Chromosome 8|CM000670.1|=|NC_000008.10|2|
|Chromosome 9|CM000671.1|=|NC_000009.11|4|
|Chromosome 10|CM000672.1|=|NC_000010.10|0|
|Chromosome 11|CM000673.1|=|NC_000011.9|1|
|Chromosome 12|CM000674.1|=|NC_000012.11|0|
|Chromosome 13|CM000675.1|=|NC_000013.10|0|
|Chromosome 14|CM000676.1|=|NC_000014.8|0|
|Chromosome 15|CM000677.1|=|NC_000015.9|0|
|Chromosome 16|CM000678.1|=|NC_000016.9|0|
|Chromosome 17|CM000679.1|=|NC_000017.10|4|
|Chromosome 18|CM000680.1|=|NC_000018.9|1|
|Chromosome 19|CM000681.1|=|NC_000019.9|2|
|Chromosome 20|CM000682.1|=|NC_000020.10|0|
|Chromosome 21|CM000683.1|=|NC_000021.8|1|
|Chromosome 22|CM000684.1|=|NC_000022.10|0|
|Chromosome X|CM000685.1|=|NC_000023.10|0|
|Chromosome Y|CM000686.1|=|NC_000024.9|0|