MOL2(扩展名常用 .mol2)出自 Tripos SYBYL 体系,用分段关键字组织小分子数据:除坐标与键以外,常含 sybyl 原子类型、部分电荷、残基/子结构标签等,利于 分子对接 前处理与 分子动力学(molecular dynamics,MD) 力场赋值。与纯 Molfile(见 fileformat-molfile.md)列定义不一一对应;与批量带表性质的 SDF(fileformat-sdf.md)相比,MOL2 更强调单分子细分字段与力场语义。
段末注释:MD 指基于牛顿力学的原子轨迹模拟;对接与 MD 前处理常需一致的原子类型与电荷约定。
插图约定:示意图见 ./fileformat-mol2/文件名.png。
1. 主要分段(概念)
| 分段关键字 | 典型内容 |
|---|---|
@MOLECULE |
分子名、原子数、键数、子结构数等 |
@ATOM |
原子 ID、(x,y,z)、sybyl 类型、亚结构名、电荷等 |
@BOND |
键端点 ID、键类型编码 |
@SUBSTRUCTURE |
(可选)子结构或残基分组,蛋白–配体复合物拆分时便于标记 |

2. 科学意义(酶改造/对接)
- 原子类型与电荷与 AMBER、GAFF 等力场对接脚本输入强相关;同一配体从 Molfile 导入后再赋类型,有时会与软件原生 MOL2 导出存在细微差别。
- 不同程序写入的 MOL2 列顺序或可选列可能略有差异,应以使用软件文档为准,解析时优先用 Open Babel、RDKit(若支持)等库而非手写分列。
3. 何时选用 MOL2
| 场景 | 建议 |
|---|---|
| 只需拓扑 + 坐标、最大化兼容 | Molfile 或 SDF |
| 高通量 + 活性字段 | SDF |
| 对接/MD 管线明确要求 sybyl 列或惯用 MOL2 | MOL2 |
4. 小结 Checklist
- MOL2 非 Molfile 的超集简单映射,勿盲拷列到 PDB。
- 酶–蛋白整体坐标仍以 PDB/mmCIF 存档;配体可单独 MOL2 复现对接。
- 与
fileformat-molfile.md、fileformat-sdf.md搭配阅读,按流水线选格式。
参考与延伸阅读
- Tripos / SYBYL 及所用工具(Open Babel、MOE 等)用户手册中的 MOL2 列定义
- Open Babel(含 MOL2 互转)
- RDKit(部分版本/扩展对 MOL2 支持,以实现为准)