技术笔记

LeetCode 热题 100 07/2026 · Python 题解与复杂度分析 · 100 道 Hot100 题目的题意、分析、复杂度与 Python 解法
按官方 LeetCode 热题 100 学习计划整理哈希、双指针、滑动窗口、数组、矩阵、链表、二叉树、图论、回溯、二分、栈、堆、贪心和动态规划题。每题给出自写题意摘要、解题思路、 Python 3 代码注释和复杂度分析，便于系统复盘算法不变量。
LeetCode Hot100 Python 算法题
视频生成技术 07/2026 · Video VAE 到 Wan / LTX · Video VAE、DiT、Flow Matching、Wan、LTX、VACE、IC-LoRA 与音视频生成
Video VAE latent tokens 决定视频生成可扩展性：它们把高维像素视频压到可训练的时空 latent space，让 DiT 与 Flow Matching 能在更低成本下建模运动、镜头和语义。 Wan 与 LTX 因此走向两条路线：Wan 更偏向高质量生成、角色动画和统一编辑，LTX 更偏向高压缩、蒸馏、多尺度超分、IC-LoRA 和联合音视频生产工作流。
视频生成 Wan LTX 音视频生成
图像生成技术 07/2026 · 数据、训练、RL 与蒸馏 · FLUX、Qwen-Image、Z-Image 的数据治理、训练、RL 与蒸馏
训练现代图像生成模型，关键不只是 DiT 主干。FLUX / FLUX.2、 Qwen-Image / Qwen-Image-2.0 和 Z-Image 的差异，更多体现在数据治理、 caption/OCR 系统、编辑对构造、VAE latent 保真度、多阶段训练、奖励后训练、 GRPO、OPD、Prompt Enhancer 和 few-step distillation。
图像生成数据治理文字渲染 RLHF
生成模型加速技术 07/2026 · 采样、缓存、量化与 serving · 采样、attention kernels、KV cache、量化、serving 与分布式训练
生成模型加速要先定位瓶颈：compute、memory bandwidth、串行采样深度、调度、 cache 和通信往往限制在不同层面。这里用公式、伪代码和交互实验串起 FlashAttention、KV cache、PagedAttention、continuous batching、量化、 speculative decoding、diffusion samplers 与 caches、token reduction、 LoRA/QLoRA、ZeRO/FSDP 和 sparse architectures。
模型加速 KV Cache 量化 Serving
$覆盖模型目标、训练、采样和对齐的生成模型推导技术笔记$
生成模型原理介绍 06/2026 · 概率建模到采样过程 · 从概率建模一路接到训练、采样和对齐
从概率模型出发，不同生成范式可以统一理解为目标函数、采样过程和后训练约束的组合。这里从目标函数到采样过程推导 VAE、VQ-VAE/VQGAN、GAN、diffusion、 Flow Matching、MeanFlow、autoregressive models，以及 RLHF/PPO、DPO、 GRPO、DDPO、Flow-DPO 等后训练方法。
生成模型 ELBO 训练与采样 RL 对齐
$从 teacher trajectory 到 fast student sampler 的生成模型蒸馏技术图$
生成模型蒸馏技术介绍 06/2026 · teacher trajectory 到 fast student sampler · 从经典 KD 到 trajectory、consistency、DMD2、LADD 与 Self-Forcing
生成式蒸馏不是经典 KD 的 logits 模仿。核心问题是怎样把 teacher 的生成轨迹、 score/velocity 信息和少步采样行为压进 fast student sampler。这里用训练和推理伪代码、交互机制实验串联 trajectory distillation、guided distillation、consistency、 DMD/DMD2、ADD/LADD、rectified-flow shortcuts、Self Forcing 和 Self-Forcing++。
Diffusion 蒸馏快速生成

Jinyang Zhang

技术笔记