常用数据库 - OMIM

OMIM 全称叫做 Online Mendelian Inheritance in Man 是一个不断更新的人类孟德尔遗传病的数据库。数据库主要记录人类基因变异和表型性状之间的关系。每日更新,并免费对外提供。OMIM 由约翰·霍普金斯大学医学院 McKusick-Nathans 遗传医学研究所在 Ada Hamosh 博士的指导下撰写和编辑。

发展背景

OMIM的发展历史悠久,最早由 Dr. Victor A. McKusick 在20世纪60年代早期发起,作为孟德尔性状和疾病 (Mendelian traits and disorders)的目录,命名为人类孟德尔遗传 (Mendelian Inheritance in Man,MIM)。

在1966年到1998年间,MIM出版了12个版本。在线版的OMIM是1985年由美国国家医学图书馆 (National Library of Medicine)和约翰·霍普金斯大学 (Johns Hopkins)威廉·H·韦尔奇医学图书馆 (William H. Welch Medical Library)合作创建的。从1987年开始在互联网上广泛使用。1995年,美国国家生物技术信息中心 (NCBI)参与了OMIM的万维网开发。

至今(2024.02)为止,已经收录了17,216个基因。

MIM Number Prefix Autosomal X Linked Y Linked Mitochondrial Totals
Gene descriptio 16,359 769 51 37 17,216
Gene and phenotype, combined 21 0 0 0 21
Phenotype description, molecular basis known 6,380 386 5 34 6,805
Phenotype description or locus, molecular basis unknown 1,389 110 4 0 1,503
Other, mainly phenotypes with suspected mendelian basis 1,639 100 3 0 1,742
Totals 25,788 1,365 63 71 27,287

并仍然以每个月几十个基因的速度在进行增长,OMIM数据库记录了从1995年至今每个月的更新记录

内容介绍

MIM编号

数据库中的每一条记录,都会有一个唯一的由6位数字组成的OMIM编号,不同数字开头的编号含义不同,其中:

  1. 数字1和2 开头的,代表常染色体上的相关位点和表型(1995年之前创建的)
  2. 数字3开头的,代表X染色体上的相关位点和表型
  3. 数字4开头的,代表Y染色体上的相关位点和表型
  4. 数字5开头的,代表线粒体上的相关位点和表型
  5. 数字6开头的,代表常染色体上的相关位点和表型(1995 年之后创建的)
    参考自MIM [FAQ](https://www.omim.org/help/faq)

对于等位基因,每一条记录都有一个唯一的MIM编号,由点号分隔的两部分构成,点号之前是突变位点对应的OMIM编号,点号之后是一个由4位数字构成的唯一ID, 用来记录等位基因。以EGFR为例,该基因对应的MIMID为131550 ,同时含有131550.0001131550.0002131550.0003131550.0004131550.0005131550.0006131550.0007 几个不同的等位基因型。

MIM编号的前缀含义

  • 开头
    记录以”
    ”开头,主要记录基因的相关信息,比如 *131550

  • 以 # 开头
    条目号之前的数字符号 (#)表示它是描述性条目,通常是表型,并不代表唯一的基因座。使用数字符号的原因在条目的第一段中给出。与表型相关的任何基因的讨论位于第一段中描述的另一个条目中。比如: #616069#211980

  • 以 + 开头
    条目编号前的加号 (+) 表示该条目包含已知序列和表型的基因的描述。

  • 以 % 开头
    条目号之前的百分号 (%) 表示该条目描述了已确认的孟德尔表型或表型基因座,但其潜在分子基础尚不清楚

  • 以 ^ 开头
    条目号之前的插入符号 (^) 表示该条目不再存在,因为它已从数据库中删除或移至指示的另一个条目

  • 没有符号前缀
    条目号之前没有符号通常表示对表型的描述,尽管怀疑该表型的孟德尔基础,但尚未明确确定,或者该表型与另一个条目中的表型的区别尚不清楚

MIM库内各字段内容介绍

Inheritance

显示内容 含义
AR - Autosomal recessive 常染色体隐性遗传
AD - Autosomal dominant 常染色体显性遗传
DR - Digenic recessive 双基因隐性
IC - Isolated cases 孤立的案例
SMu - Somatic mutation 体细胞突变
Mu - Multifactorial 多因素
PD - Pseudoautosomal dominant 假常染色体显性遗传
PR - Pseudoautosomal recessive 假常染色体隐性遗传
DD - Digenic dominant 双基因显性
ICB - Inherited chromosomal imbalance 遗传性染色体失衡
Mi - Mitochondrial 线粒体
SMo - Somatic mosaicism 体细胞镶嵌
XL - X-linked X连锁
XLD - X-linked dominant X连锁显性
XLR - X-linked recessive X连锁隐形
YL - Y-linked Y连锁

Phenotype mapping key

该字段记录了疾病的研究进展情况,仅通过连锁图谱定位,或是已经有充分的​分子基础进展等。在查询表格中,会标注数字编号(鼠标悬停会有提示),在这里列出可能出现的4种编号对应的含义

key 说明
1 该疾病已根据其与基因的关联被放置在图上,但潜在的缺陷尚不清楚。
2 该疾病已通过连锁被放置在图谱上;尚未发现突变
3 该疾病的分子基础已知;基因中发现了突变
4 多个基因缺失或重复综合征;多个基因被删除或重复导致表型。
-------------本文结束感谢您的阅读-------------