5003.大模型-架构-ProteinMPNN-0.概述与训练框架

发表于 2026-06-11 | 分类于 LLM

ProteinMPNN 架构与训练全景：骨架图输入、顺序无关自回归目标、Encoder-Decoder MPNN 结构框架与约 1.68M 参数组成；与 RFdiffusion pipeline 及 MPNN 抽象对照。

5003.大模型-架构-Diffusion-Example-1.蛋白序列离散扩散数值例题

发表于 2026-06-11 | 分类于 LLM

用长度 L=4 的玩具肽段手算 MASK 吸收态离散扩散的一步训练与 motif inpainting 采样；对照 Example-0 连续 DDPM，说明蛋白序列如何用转移矩阵构造 x_t 与交叉熵监督。

发表于 2026-06-11 | 分类于 LLM

用 2 维向量手算完整走一遍 DDPM 前向构造与单步训练：采样 x₀、t、ε，计算 x_t，MSE 预测噪声，以及从 ε 反解 x₀；澄清「前向随机」与「监督从哪来」。

发表于 2026-06-11 | 分类于 LLM

过平滑（Oversmoothing）的直观解释、谱域/消息传递成因、分子图与知识图谱等场景、残差/JK/PairNorm 等缓解方案，以及与过挤压、表示坍缩、专家坍缩的异同。

发表于 2026-06-11 | 分类于 LLM

专家坍缩（Expert Collapse / Routing Collapse）的直观解释、成因、典型场景、缓解方案，以及与模式坍缩、表示坍缩、Dead ReLU 等近似概念的异同对照。

发表于 2026-06-11 | 分类于 LLM

LLM 概念解析系列导读：面向有机器学习基础的生物信息学读者，用直观解释、成因、场景、方案与近似概念对照，补充架构长文中的术语缺口。

发表于 2026-06-11 | 分类于 LLM

DeepSeek 系列架构全景：MLA、DeepSeekMoE、DSA 与 V4 混合注意力；R1 推理训练范式；版本迭代史（LLM→V2→V3→R1→V3.2→V4）及生物信息学部署选型。

发表于 2026-06-11 | 分类于 LLM

扩散模型所需的概率论基础：样本空间与集合、随机变量、高斯分布、条件概率、期望方差、KL 散度、马尔可夫链、重参数化、噪声日程与信噪比、得分函数与 ELBO；每节配概念示意图。

发表于 2026-06-11 | 分类于 LLM

大模型架构范式全景：按序列混合机制、训练目标、结构归纳偏置与规模路由四维梳理 Transformer、SSM/Hyena、GNN、扩散、MoE 等代表实现，并给出生物信息学选型地图与本目录系列导读。

发表于 2026-06-11 | 分类于 LLM

潜扩散 LDM、SE(3)/E(3) 等变扩散、RFdiffusion 与 Chroma 式条件设计；分子 3D 与 designability 评估。