缩写体例:缩写首次出现写「中文全称(English,ABB)」,段末 段末注释 释义;后文沿用缩写。
改造或筛选聚合酶时,先把「测什么」定义清楚,比盲目高通量更重要。本篇按「从物化本质 → 工程常用读数 → 与文库筛选的衔接」组织,便于和后文的筛选脉络、开源数据、蛋白质语言模型(Protein Language Model,PLM) 等方法类文章对照阅读。
段末注释:PLM 为在序列上预训练、用于嵌入或突变打分的模型族,详见 酶改造-04/05。
1. 为什么要分层看指标
- 体内/体外:体外单指标领先不代表克隆扩增或测序建库整条链路最优;必要时在接近真实应用场景的条件下复测。
- 单一 vs 组合:延伸速度快的酶不一定保真度高;热稳定提升可能伴随延伸动力学变化。工程上常写成多目标权衡或加权评分。
- 可重复性:缓冲液离子强度、pH、dNTP/Mg²⁺ 浓度、模板二级结构、引物设计都会影响读数;论文与内部 SOP 应记录完整反应体系。
2. 稳态动力学:kcat、Km 与 kcat/Km
本节符号来自 米氏方程(Michaelis–Menten kinetics) 框架下的稳态近似;k_cat、K_m 为国际生化命名常用符号(非英文短语缩写,但沿用斜体与下标规范)。
| 符号 | 含义(直观) | 对聚合酶的意义 |
|---|---|---|
| k_cat | 单位时间内每个活性中心转化的底物分子数(催化周转数,catalytic turnover number) | 与延伸速率、链延伸效率相关;受 脱氧/核糖核苷三磷酸(dNTP/NTP) 掺入与易位步骤限制 |
| K_m | 半最大反应速度时的底物浓度(米氏常数) | 对 dNTP 的亲和力与 表观 K_m(K_m,app) 依赖于聚合酶、模板序列与错配状态 |
| k_cat/K_m | 内在催化效率(特异性常数范畴) | 比较正确与错误掺入时,可与其他实验一起用于描述底物选择性 |
段末注释:dNTP 为 DNA 聚合酶底物(dATP/dTTP/dCTP/dGTP 等);NTP 为 RNA 聚合酶底物;K_m,app 为表观米氏常数,因实验条件而异。
实践提示:全基因组聚合酶常报告在标准模板/引物下的相对活性;与 DeepEnzyme 等预测 k_cat 的模型对接时,需核对训练数据的底物定义(见系列数据汇总篇)。
3. 保真度(Fidelity)
保真度描述错配掺入倾向,是聚合酶(尤其用于测序、合成、扩增)的核心指标。
常见层面包括:
- 体外错配率 / 错误掺入频率:凝胶、质谱或基于测序的误差估计;可区分布局序列语境。
- 与前延伸态(pre-insertion)/校对(proofreading):部分家族聚合酶带 3’→5’ 外切活性,保真度需分项讨论「合成」与「校对」贡献。
- 读序或扩增场景下的表观错误:文库复杂度、PCR 循环数、扩增偏倚会使「测序错误」与「酶错误」混淆,需对照阴性对照与已知突变标准品。
工程上常把保真度与延伸速率、processivity 放在一张雷达图或 Pareto 前沿上做筛选排序。
4. 持续合成能力(Processivity)
Processivity:酶在从模板解离之前能连续掺入的核苷酸数目(或延伸长度分布的表征)。
- 高持续合成能力有利于长片段扩增、均一覆盖;可能与DNA/RNA 结合域、辅助因子有关。
- 常用引物延伸凝胶、单分子或停流等方法估计;不同课题组定义(平均延伸长度 vs 分布尾部)需对齐。
5. 延伸速率与链置换/解旋需求
- 延伸速率(nt/s 或 kb/min):与温度、盐浓度、dNTP 浓度强相关;比较时需固定模板复杂度。
- 耐热 DNA 聚合酶常在升高退火/延伸温度下测活性,指标要与热稳定曲线联合报告。
- 具有链置换活性的酶在等温扩增、某些测序化学中有独立评价维度。
6. 热稳定性与储存稳定性
| 类型 | 常见读数 |
|---|---|
| T_m(解链温度,melting temperature) | 圆二色谱(Circular Dichroism,CD)、差示扫描荧光(Differential Scanning Fluorimetry,DSF) 等,对结构变化敏感 |
| 长时间孵育残留活性 | 在目标温度下保温处理前后,比较相对活性或 定量 PCR(quantitative PCR,qPCR) 的 Cq(定量循环阈值) |
| 冻融与制剂 | 工业场景常单独验证 |
段末注释:CD 测二级结构含量变化;DSF 用染料报告解链过程得 T_m;qPCR 以扩增曲线 Cq 间接反映酶活或模板量,需与标准曲线对照。
热稳定提升往往利于自动化、野外检测、长读长测序前处理等,但可能改变精细动力学,需要回测第 2~5 节指标。
7. 底物谱与拓展化学
- 天然 dNTP vs 修饰核苷酸(标记、阻断、RNA 底物库等):修饰底物掺入效率与停顿位点常独立表征。
- RNA 聚合酶 / 逆转录酶另有一套起始复合物、暂停与终止相关指标,可与 DNA 聚合酶类比但不等同。
8. 与高通量筛选、机器学习标签的衔接
- 回归标签:相对活性、Tm 变化、log₁₀(错误率) 等。
- 分类标签:某一温度下「有/无」条带、生长互补等离散表型。
- 排序标签:文库内部丰度变化(需注意 PCR/克隆偏差与归一化)。
同一批实验尽量共享对照亲本酶与批次校准样,便于跨轮次合并数据训练模型。
9. 延伸阅读
- 酶动力学与命名惯例可参考生化教科书与 BRENDA 中参数释义。
- 系列文章:筛选方法发展脉络、开源训练数据汇总、PLMs 与通用表征。