Searchable concept handbook

AIGC 与 LLM 数学概念手册

系统整理 AIGC 与 LLM 相关的数学与模型概念:每个概念先讲直觉,再给数学形式,接到模型中的具体位置,最后指出常见误区和诊断线索。

先读这个:AIGC 的数学不是按课本顺序出现的

真实模型不会先问你“是否学完线性代数”,它会直接把 token 变成 \(X\in\mathbb{R}^{B\times T\times d}\),把 attention 写成 \(\operatorname{softmax}(QK^\top/\sqrt{d_k})V\),再用 cross entropy、KL、score matching、policy gradient 或 DPO loss 更新参数。 因此,这里不把内容写成“学习计划”,而是把概念整理成可查阅手册:看到一个术语,可以马上知道它的直觉、数学形式、模型位置和常见误解。

先直觉每个概念先解释它在模型里解决什么问题,而不是先背抽象定义。
再形式给出变量、shape、概率来源、期望采样源和公式推导。
接模型说明它在 Transformer、Diffusion、LoRA、RLHF 或 DPO 中出现在哪里。
最小例子用伪代码、toy distribution 或小型可视化检查机制是否真的理解。

概念索引:面向查阅与学习的系统手册

每张卡片都按同一结构组织:直觉解释、数学形式、模型中的位置、常见误区。可以用关键词检索,也可以按数学与模型模块筛选。

正在载入概念索引...

每篇教程的写作模板

每个主题都以同一套结构展开,保证读者能从直觉走到公式和实践。

1. 这个主题解决什么问题?先给模型中的具体场景,例如 attention 需要衡量 token 相关性。
2. 为什么 AIGC/LLM 需要它?说明它连接到训练、推断、压缩、对齐或评测。
3. 通俗解释用最小直觉解释,不先堆符号。
4. 数学定义定义变量、shape、概率来源和期望采样源。
5. 关键公式推导写出每步使用的数学工具,例如链式法则或变量替换。
6. 在模型中的位置定位到 Transformer block、diffusion sampler、reward model 等。
7. 最小代码或伪代码让读者能把公式映射成实际计算。
8. 常见误区区分训练目标与采样过程、post-training 与 post-processing。
9. 练习题让读者检查推导、shape、边界条件和失败模式。
10. 延伸阅读指向教材、论文、官方代码或可复现实验。

查阅方式:按问题反查概念

这页的使用方式不是从第一章一路读到最后,而是在遇到论文公式、代码变量、训练故障或评测指标时,快速定位相关概念。

看到公式看不懂

先搜公式里的对象:例如 \(D_{KL}\)、ELBO、score、policy gradient。读“数学形式”确认变量和期望来源,再看“模型中的位置”。

代码 shape 对不上

先搜 Tensor、Shape、Matrix Multiplication、Attention、KV Cache。重点看每个概念对应的轴含义和常见误区。

训练不稳定

先搜 Gradient、AdamW、Learning Rate Schedule、Gradient Clipping、Mixed Precision、Conditioning、Normalization。

生成质量不对

先搜 Sampling、Temperature、Top-p、Diffusion、Guidance、Mode Collapse、Latent Space、Denoising Objective。

对齐指标漂移

先搜 Preference Data、Reward Model、KL-constrained RL、DPO、Reward Hacking、Win-rate。

评测是否可信

先搜 Benchmark、Confidence Interval、Bootstrap、P-value、Multiple Comparison、Calibration、OOD。

每个概念的阅读顺序

  • 先看直觉解释:确认这个概念解决什么具体问题。
  • 再看数学形式:找出变量、shape、采样源、目标函数或约束。
  • 接到模型位置:判断它出现在训练、推断、采样、压缩、对齐还是评测中。
  • 最后看误区:避免把训练 loss 当采样过程、把指标当真实质量、把 decoding 当 post-training。

延伸阅读

先用教材补基础,再用论文和官方实现校正直觉;不要只看二手总结。

数学与深度学习基础

  • Deep Learning, Goodfellow/Bengio/Courville:概率、优化、表示学习的基础框架。
  • Mathematics for Machine Learning:线性代数、微积分、概率与优化的机器学习入口。
  • CS231n / CS224n:从计算图、反向传播、attention 到 NLP 建模。

LLM 与 Transformer

  • Attention Is All You Need:Transformer 的基本结构。
  • GPT-style language modeling papers:next-token prediction、scaling 与预训练实践。
  • LoRA、Adapter、MoE 与 KV cache 相关论文:理解高效微调与推断系统。

生成模型

  • Auto-Encoding Variational Bayes:VAE 与 reparameterization。
  • Generative Adversarial Nets:GAN 的分布匹配博弈。
  • DDPM、Score-based SDE、Latent Diffusion、Flow Matching:现代视觉生成主线。

对齐与评测

  • RLHF / PPO、InstructGPT:reward model 与 KL-constrained optimization。
  • Direct Preference Optimization:从 preference pair 直接训练 policy。
  • 现代 benchmark 与 human evaluation 论文:关注 paired comparison、置信区间和 judge bias。