5003.大模型-架构-ProteinMPNN-0.概述与训练框架 发表于 2026-06-11 | 分类于 LLM ProteinMPNN 架构与训练全景:骨架图输入、顺序无关自回归目标、Encoder-Decoder MPNN 结构框架与约 1.68M 参数组成;与 RFdiffusion pipeline 及 MPNN 抽象对照。 阅读全文 »
5003.大模型-架构-Diffusion-Example-1.蛋白序列离散扩散数值例题 发表于 2026-06-11 | 分类于 LLM 用长度 L=4 的玩具肽段手算 MASK 吸收态离散扩散的一步训练与 motif inpainting 采样;对照 Example-0 连续 DDPM,说明蛋白序列如何用转移矩阵构造 x_t 与交叉熵监督。 阅读全文 »
5003.大模型-架构-Diffusion-Example-0.前向训练数值例题 发表于 2026-06-11 | 分类于 LLM 用 2 维向量手算完整走一遍 DDPM 前向构造与单步训练:采样 x₀、t、ε,计算 x_t,MSE 预测噪声,以及从 ε 反解 x₀;澄清「前向随机」与「监督从哪来」。 阅读全文 »
5003.LLM概念解析-02.过平滑 发表于 2026-06-11 | 分类于 LLM 过平滑(Oversmoothing)的直观解释、谱域/消息传递成因、分子图与知识图谱等场景、残差/JK/PairNorm 等缓解方案,以及与过挤压、表示坍缩、专家坍缩的异同。 阅读全文 »
5003.LLM概念解析-01.专家坍缩 发表于 2026-06-11 | 分类于 LLM 专家坍缩(Expert Collapse / Routing Collapse)的直观解释、成因、典型场景、缓解方案,以及与模式坍缩、表示坍缩、Dead ReLU 等近似概念的异同对照。 阅读全文 »
5003.LLM概念解析-0.系列导读 发表于 2026-06-11 | 分类于 LLM LLM 概念解析系列导读:面向有机器学习基础的生物信息学读者,用直观解释、成因、场景、方案与近似概念对照,补充架构长文中的术语缺口。 阅读全文 »
5003.大模型-架构-DeepSeek-0.概述 发表于 2026-06-11 | 分类于 LLM DeepSeek 系列架构全景:MLA、DeepSeekMoE、DSA 与 V4 混合注意力;R1 推理训练范式;版本迭代史(LLM→V2→V3→R1→V3.2→V4)及生物信息学部署选型。 阅读全文 »
5003.大模型-架构-Diffusion-Math-0.概率与扩散数学基础 发表于 2026-06-11 | 分类于 LLM 扩散模型所需的概率论基础:样本空间与集合、随机变量、高斯分布、条件概率、期望方差、KL 散度、马尔可夫链、重参数化、噪声日程与信噪比、得分函数与 ELBO;每节配概念示意图。 阅读全文 »
5003.大模型-架构-0.大模型架构范式综述 发表于 2026-06-11 | 分类于 LLM 大模型架构范式全景:按序列混合机制、训练目标、结构归纳偏置与规模路由四维梳理 Transformer、SSM/Hyena、GNN、扩散、MoE 等代表实现,并给出生物信息学选型地图与本目录系列导读。 阅读全文 »
5003.大模型-架构-Diffusion-5.潜空间扩散与结构生成实践 发表于 2026-06-11 | 分类于 LLM 潜扩散 LDM、SE(3)/E(3) 等变扩散、RFdiffusion 与 Chroma 式条件设计;分子 3D 与 designability 评估。 阅读全文 »