引物设计相关工具-MP-Ref(MFEprimer 生态)

MP-Ref 属于 MFEprimer 系列在网页端的产品形态之一:面向基于参考基因组的多重 PCR 初代引物布局,在 Graph-Expanding 框架下于扩增设计步骤中纳入特异性交叉二聚体等约束,并预载大量参考基因组,服务目标富集、STR 旁侧引物、毛细管电泳多重重等管线。MFEprimer-3.0 论文描述的是通用 PCR 引物质控(QC) 内核;MP-Ref 在其上强调面板级兼容与预置基因组场景。

文献与官方资源

类型 说明
MFEprimer-3.0 论文 Wang K, Li H, Xu Y, et al. MFEprimer-3.0: quality control for PCR primers. Nucleic Acids Res. 47(Web Server issue):W105–W113 (2019). DOI 10.1093/nar/gkz351 · PMC6602485
主站 https://www.mfeprimer.com/
v3.0 说明 https://www.mfeprimer.com/old-versions/mfeprimer-3.0/
源码 quwubin/MFEprimer-3.0
MulD(NGS 靶标富集示例) https://mfeprimer3.igenetech.com/muld
经典多重设计 本站 引物设计-03.软件-MPprimer.md

应用场景

  • 多重 PCR / 面板设计:在参考序列已知的条件下,需要批量候选引物QC 后入池,并控制交叉二聚体非特异扩增
  • 自动化流水线:CLI 输出 JSON,嵌入「Primer3 → MFEprimer-3.0 → 决策/重设计」循环。
  • MP-Ref 网页:强调预载参考基因组Graph-Expanding,适合不想自建全库索引的用户(具体功能以官网当前版本为准)。
  • 不适合:期望单工具从零生成所有候选且无外部设计步骤(MFEprimer 核心是 QC,不是 Primer3 替代品)。

使用帮助

部署形态

方式 说明
在线(MFEprimer / MP-Ref) 浏览器提交引物序列;默认人类 GRCh37/hg19 等以页面说明为准;有条目数/速率限制。
命令行 MFEprimer-3.0 本地安装,可换自建基因组库,适合批量与自动化。
MP-Ref 以网页服务为主;与早期可下载的 v1–v3 形态可能不同,以官方说明为准。

输入与输出

  • 输入(QC 核心)
    • 候选 引物序列(FASTA 或每行一条);
    • 模板/数据库:在线默认人类等;CLI 可指定路径与错配策略;
    • 可选:结合位点 SNP 等(论文功能列表)。
  • 输出
    • Query 注释HairpinSelf/Cross dimer潜在扩增子列表与详情;
    • JSON 分区结构便于程序解析(论文与 GitHub)。

资源与环境

  • 算力:大基因组 k-mer 索引 + 错配扩展检索,库越大时间与内存越高;建议 SSD、充足 RAM。
  • 版本:参考基因组 版本号(hg19/hg38 等)直接影响特异性结论,需在项目中固定并记录

功能与算法原理(MFEprimer-3.0)

在设计流水线中的角色

典型流程:Primer3 等生成候选 → MFEprimer-3.0 QC(扩增子、发夹/二聚体、3′ 稳定性、可选 SNP)→ 决策模块(DMM) 接受或拒绝 → 多重场景加 交叉二聚体非特异扩增 约束,常迭代扩充合格池。

1. 特异性:k-mer 结合位点检索

  • 建库:基因组按 k-mer(示例 k=9)索引。
  • 查询:对引物 3′ 端 k-mer 生成「允许 1 个错配」的变体集合,将模糊匹配转为多次精确匹配3′ 最后一碱基不允许错配,降低可延伸的假阳性结合。
    记引物 3′ 端 k-mer 为 (q = b_1 b_2 \ldots b_k)((b_k) 为延伸端,不允许替换)。在至多 1 个错配且错配只能出现在 (b_1,\ldots,b_{k-1}) 时,需向索引发起的精确查询集合
    $$
    \mathcal{Q}(q) = {q} \cup \bigcup_{j=1}^{k-1} \bigcup_{x \neq b_j,, x \in {\mathrm{A,C,G,T}}} q^{(j\leftarrow x)}
    $$
    其中 (q^{(j\leftarrow x)}) 表示将第 (j) 位改为 (x) 的 k-mer。于是
    $$
    |\mathcal{Q}(q)| = 1 + 3(k-1) = 3k - 2
    $$
    每次在基因组 k-mer 索引上精确命中即对应一个潜在结合位点;再结合延伸方向与产物长度模型筛出「可扩增」的潜在扩增子(论文与实现细节以 NAR / GitHub 为准)。
    MFEprimer-3.0:3′ k-mer 变体集与索引查询管线(科研风格示意图,与下节 Mermaid 同源)
1
2
3
4
5
flowchart LR
P[引物 3' k-mer q] --> V["变体集 Q(q)<br>1 + 3(k-1) 次精确查"]
V --> Ix[k-mer 基因组索引]
Ix --> H[候选结合位点]
H --> Amp[扩增子模型 / 长度过滤]

2. 二聚体与发夹

思路修改自 AutoDimer:两序列步进重叠打分,记录高风险构型,并结合 ΔG 衡量稳定性。
对给定重叠对齐,双链区可用最近邻模型累加 (\Delta G^\circ);发夹则对茎环结构估计 (\Delta G^\circ_{\text{hairpin}})。若
$$
\Delta G^\circ \le \Delta G^\circ_{\max}
$$
则判为不可接受(阈值由 DMM/参数表给出)。

3. 多重 PCR 筛选策略

  • 每靶多候选 → 逐对 QC;
  • 过滤强 self-dimer / hairpin / 非特异扩增
  • 已入池引物cross-dimer
  • DMM 阈值随应用可调。
    决策模块(DMM,示意):对每个候选引物对 (\pi) 计算布尔或分级判据向量 (\mathbf{c}(\pi)=(c_1,\ldots,c_r))(特异性、hairpin、dimer、3′ 稳定性、SNP 等),当
    $$
    \mathbf{c}(\pi) \succeq \boldsymbol{\theta}
    $$
    (分量均优于阈值 (\boldsymbol{\theta}))时接受 (\pi) 入池;多重场景还需对所有已选引物集合 (S) 满足
    $$
    \forall p,q \in S,\ \text{cross-dimer}(p,q) \text{ 可接受}
    $$
    具体为 AND 规则还是加权评分,以程序配置为准。

配图(文献原图页面)

图号 内容(据期刊) 官方页面
Figure 1 工作流程 / 模块总览(以图题为准) OUP NAR — article(文内 Figure 1)
Figure 2–3 特异性、二聚体或界面示例(以图题为准) 同上(页面内图表)
PMC 全文与图表:PMC6602485

局限性

  • 非设计器:不替代 Primer3;需上游生成候选。
  • 库依赖:特异性完全依赖数据库完整性、版本与注释;新物种/宏基因组片段可能覆盖不足。
  • 启发式检索:k-mer + 错配规则在极端重复序列上仍可能漏检或误报,需实验交叉验证。
  • MP-Ref / 在线:功能与配额以官网为准,长期 URL/服务可能变更。

参考资料

  1. Wang K, et al. Nucleic Acids Res. 2019;47(W1):W105–W113. https://doi.org/10.1093/nar/gkz351
  2. MFEprimer
  3. MFEprimer-3.0 GitHub
  4. MulD
-------------本文结束感谢您的阅读-------------