引物设计相关工具-MP-Ref（MFEprimer 生态）

MP-Ref 属于 MFEprimer 系列在网页端的产品形态之一：面向基于参考基因组的多重 PCR 初代引物布局，在 Graph-Expanding 框架下于扩增设计步骤中纳入特异性、交叉二聚体等约束，并预载大量参考基因组，服务目标富集、STR 旁侧引物、毛细管电泳多重重等管线。MFEprimer-3.0 论文描述的是通用 PCR 引物质控（QC）内核；MP-Ref 在其上强调面板级兼容与预置基因组场景。

文献与官方资源

类型	说明
MFEprimer-3.0 论文	Wang K, Li H, Xu Y, et al. MFEprimer-3.0: quality control for PCR primers. Nucleic Acids Res. 47(Web Server issue):W105–W113 (2019). DOI 10.1093/nar/gkz351 · PMC6602485
主站	https://www.mfeprimer.com/
v3.0 说明	https://www.mfeprimer.com/old-versions/mfeprimer-3.0/
源码	quwubin/MFEprimer-3.0
MulD（NGS 靶标富集示例）	https://mfeprimer3.igenetech.com/muld
经典多重设计	本站 `引物设计-03.软件-MPprimer.md`

应用场景

多重 PCR / 面板设计：在参考序列已知的条件下，需要批量候选引物经 QC 后入池，并控制交叉二聚体与非特异扩增。
自动化流水线：CLI 输出 JSON，嵌入「Primer3 → MFEprimer-3.0 → 决策/重设计」循环。
MP-Ref 网页：强调预载参考基因组与 Graph-Expanding，适合不想自建全库索引的用户（具体功能以官网当前版本为准）。
不适合：期望单工具从零生成所有候选且无外部设计步骤（MFEprimer 核心是 QC，不是 Primer3 替代品）。

使用帮助

部署形态

方式	说明
在线（MFEprimer / MP-Ref）	浏览器提交引物序列；默认人类 GRCh37/hg19 等以页面说明为准；有条目数/速率限制。
命令行	MFEprimer-3.0 本地安装，可换自建基因组库，适合批量与自动化。
MP-Ref	以网页服务为主；与早期可下载的 v1–v3 形态可能不同，以官方说明为准。

输入与输出

输入（QC 核心）
- 候选 引物序列（FASTA 或每行一条）；
- 模板/数据库：在线默认人类等；CLI 可指定路径与错配策略；
- 可选：结合位点 SNP 等（论文功能列表）。
输出
- Query 注释、Hairpin、Self/Cross dimer、潜在扩增子列表与详情；
- JSON 分区结构便于程序解析（论文与 GitHub）。

资源与环境

算力：大基因组 k-mer 索引 + 错配扩展检索，库越大时间与内存越高；建议 SSD、充足 RAM。
版本：参考基因组 版本号（hg19/hg38 等）直接影响特异性结论，需在项目中固定并记录。

功能与算法原理（MFEprimer-3.0）

在设计流水线中的角色

典型流程：Primer3 等生成候选 → MFEprimer-3.0 QC（扩增子、发夹/二聚体、3′ 稳定性、可选 SNP）→ 决策模块（DMM） 接受或拒绝 → 多重场景加 交叉二聚体 与 非特异扩增 约束，常迭代扩充合格池。

1. 特异性：k-mer 结合位点检索

建库：基因组按 k-mer（示例 k=9）索引。
查询：对引物 3′ 端 k-mer 生成「允许 1 个错配」的变体集合，将模糊匹配转为多次精确匹配；3′ 最后一碱基不允许错配，降低可延伸的假阳性结合。
记引物 3′ 端 k-mer 为 (q = b_1 b_2 \ldots b_k)（(b_k) 为延伸端，不允许替换）。在至多 1 个错配且错配只能出现在 (b_1,\ldots,b_{k-1}) 时，需向索引发起的精确查询集合为
$$
\mathcal{Q}(q) = {q} \cup \bigcup_{j=1}^{k-1} \bigcup_{x \neq b_j,, x \in {\mathrm{A,C,G,T}}} q^{(j\leftarrow x)}
$$
其中 (q^{(j\leftarrow x)}) 表示将第 (j) 位改为 (x) 的 k-mer。于是
$$
|\mathcal{Q}(q)| = 1 + 3(k-1) = 3k - 2
$$
每次在基因组 k-mer 索引上精确命中即对应一个潜在结合位点；再结合延伸方向与产物长度模型筛出「可扩增」的潜在扩增子（论文与实现细节以 NAR / GitHub 为准）。

flowchart LR
  P[引物 3' k-mer q] --> V["变体集 Q(q)<br>1 + 3(k-1) 次精确查"]
  V --> Ix[k-mer 基因组索引]
  Ix --> H[候选结合位点]
  H --> Amp[扩增子模型 / 长度过滤]

2. 二聚体与发夹

思路修改自 AutoDimer：两序列步进重叠打分，记录高风险构型，并结合 ΔG 衡量稳定性。
对给定重叠对齐，双链区可用最近邻模型累加 (\Delta G^\circ)；发夹则对茎环结构估计 (\Delta G^\circ_{\text{hairpin}})。若
$$
\Delta G^\circ \le \Delta G^\circ_{\max}
$$
则判为不可接受（阈值由 DMM/参数表给出）。

3. 多重 PCR 筛选策略

每靶多候选 → 逐对 QC；
过滤强 self-dimer / hairpin / 非特异扩增；
与已入池引物做 cross-dimer；
DMM 阈值随应用可调。
决策模块（DMM，示意）：对每个候选引物对 (\pi) 计算布尔或分级判据向量 (\mathbf{c}(\pi)=(c_1,\ldots,c_r))（特异性、hairpin、dimer、3′ 稳定性、SNP 等），当
$$
\mathbf{c}(\pi) \succeq \boldsymbol{\theta}
$$
（分量均优于阈值 (\boldsymbol{\theta})）时接受 (\pi) 入池；多重场景还需对所有已选引物集合 (S) 满足
$$
\forall p,q \in S,\ \text{cross-dimer}(p,q) \text{ 可接受}
$$
具体为 AND 规则还是加权评分，以程序配置为准。

配图（文献原图页面）

图号	内容（据期刊）	官方页面
Figure 1	工作流程 / 模块总览（以图题为准）	OUP NAR — article（文内 Figure 1）
Figure 2–3	特异性、二聚体或界面示例（以图题为准）	同上（页面内图表）
PMC 全文与图表：PMC6602485。

局限性

非设计器：不替代 Primer3；需上游生成候选。
库依赖：特异性完全依赖数据库完整性、版本与注释；新物种/宏基因组片段可能覆盖不足。
启发式检索：k-mer + 错配规则在极端重复序列上仍可能漏检或误报，需实验交叉验证。
MP-Ref / 在线：功能与配额以官网为准，长期 URL/服务可能变更。

参考资料

Wang K, et al. Nucleic Acids Res. 2019;47(W1):W105–W113. https://doi.org/10.1093/nar/gkz351
MFEprimer
MFEprimer-3.0 GitHub
MulD