相关数据库-GnomAD

gnomAD 是什么

gnomAD(Genome Aggregation Database)是当前最常用的人群频率数据库之一,整合了大规模外显子组和全基因组测序数据。
在变异解读中,gnomAD 的主要作用是回答一个问题:某个变异在人群中到底有多常见
对于 ACMG 判定来说,这通常直接影响:

  • 是否支持良性证据(如 BA1、BS1)
  • 是否支持致病证据(如 PM2,强调“在人群中极罕见/未见”)

版本与参考基因组

gnomAD 常见版本:

  • v2.1.1:基于 GRCh37(历史项目和部分流程仍在使用)
  • v3.1.x:基于 GRCh38,主要是全基因组数据
  • v4.x:基于 GRCh38,外显子数据规模显著增加
    实操建议:
  • 你的注释坐标版本必须和 gnomAD 版本匹配(GRCh37 对 v2;GRCh38 对 v3/v4)
  • 不要把不同版本的频率直接横向比较后得出绝对结论

常用字段说明(解读最常看)

以变异层面为主,常见字段如下:

  • AC(Allele Count):变异等位基因计数
  • AN(Allele Number):可评估等位基因总数
  • AF(Allele Frequency):总体等位基因频率,AF = AC / AN
  • nhomalt:纯合变异个体数量(对高外显率显性病有参考意义)
  • popmax / AF_popmax:各人群中最高频率(做阈值判断经常比 overall AF 更保守)
  • filter:过滤标记(如非 PASS 位点要谨慎)
    群体分层(不同版本命名略有差异)常见包括:
  • AFR(非洲)
  • AMR(美洲混合)
  • EAS(东亚)
  • SAS(南亚)
  • NFE(非芬兰欧洲)
  • FIN(芬兰)
  • ASJ(阿什肯纳兹犹太)等

在 ACMG 里的典型用法

1) BA1 / BS1(支持良性)

如果变异在人群中的频率明显高于某单基因疾病在该遗传模式下可接受的最大致病频率,通常支持良性证据。
很多流程优先看 AF_popmax,避免被总体频率稀释。

2) PM2(支持致病)

如果变异在人群数据库中未见或极低频,可作为 PM2 的支持信息之一。
注意 PM2 一般不是单独定案证据,需要结合功能、共分离、文献、临床表型等证据共同判定。

3) 遗传模式相关判断

  • 常染色体显性高外显率疾病:对人群频率通常更敏感
  • 常染色体隐性疾病:携带者频率可能较高,阈值策略需要单独设计

推荐查询流程(实操)

  1. 确认变异坐标版本(GRCh37/GRCh38)
  2. 在 gnomAD Browser 检索变异(基因+HGVS 或 chr-pos-ref-alt)
  3. 记录 AFAF_popmaxAC/ANnhomaltfilter
  4. 判断是否存在明显人群偏倚(特定族群高频)
  5. 结合疾病患病率、遗传模式、外显率,映射到 BA1/BS1/PM2 规则
  6. 在报告中保留“版本号+查询日期+关键字段截图/文本”

常见误区

  • 只看 overall AF,忽略 AF_popmax
  • 不区分 GRCh37 和 GRCh38,导致错位查询
  • 把“未收录”当“绝对不存在”
  • 忽略测序覆盖和 calling 能力差异(某些区域低覆盖)
  • 看到低频就直接给 PM2,而不结合疾病机制和其他证据

建议在报告中固定记录的内容

  • gnomAD 版本(例如 v2.1.1 / v4.1)
  • 参考基因组版本(GRCh37 / GRCh38)
  • 查询字段:AF、AF_popmax、AC/AN、nhomalt、filter
  • 查询日期与链接
  • 用于 ACMG 的阈值依据(团队 SOP 或文献来源)

参考链接

-------------本文结束感谢您的阅读-------------