Blogs

  1. RAEv2:Representation Autoencoder 的三个关键改进

    RAEv2:Representation Autoencoder 的三个关键改进

  2. Seedance 2.0:视频生成从单次出片走向多模态创作引擎

    Seedance 2.0:视频生成从单次出片走向多模态创作引擎

  3. MeanFlow:一步生成不是蒸馏,而是学习平均速度场

    MeanFlow:一步生成不是蒸馏,而是学习平均速度场

  4. Mean Mode Screaming:为什么 1000 层 Diffusion Transformer 会被 token 均值拖垮

    Mean Mode Screaming:为什么 1000 层 Diffusion Transformer 会被 token 均值拖垮

  5. Flow-OPD:把多任务奖励对齐改写成 Flow Matching 的 on-policy 蒸馏

    Flow-OPD:把多任务奖励对齐改写成 Flow Matching 的 on-policy 蒸馏

  6. Edit2Restore:把图像复原改写成少样本图像编辑

    Edit2Restore:把图像复原改写成少样本图像编辑

  7. Code as Agent Harness:把代码看成 Agent 的运行底座

    Code as Agent Harness:把代码看成 Agent 的运行底座

  8. AsymFlow:把 latent flow 拉回 pixel space 的低秩速度参数化

    AsymFlow:把 latent flow 拉回 pixel space 的低秩速度参数化

  9. SHARP:单张照片在一秒内变成可实时渲染的 3D Gaussian 场

    SHARP:单张照片在一秒内变成可实时渲染的 3D Gaussian 场

  10. Follow the Mean:把参考样本变成 Flow Matching 的控制信号

    Follow the Mean:把参考样本变成 Flow Matching 的控制信号

  11. LPM 1.0:从 talking head 到实时对话角色 Performance Model

    LPM 1.0:从 talking head 到实时对话角色 Performance Model

  12. Self-Flow:把表征学习塞回 Flow Matching 训练目标里

    Self-Flow:把表征学习塞回 Flow Matching 训练目标里

  13. 为什么 RoPE 对外推友好

    RoPE 外推友好性完整解析

  14. Self-Forcing 到 Self-Forcing++:让自回归视频扩散按推理方式训练

    Self-Forcing 到 Self-Forcing++:让自回归视频扩散按推理方式训练

  15. noao-vlm-2 数据集与评估系统分析

    数据集与评估系统分析

  16. noao-vlm-1 架构详细分析

    nanoVLM 模型架构与数据流转分析

  17. noao-vlm-0 train.py 详细分析

    train.py 详细分析

  18. noao-chat-7-nonochat 多卡训练指南

    LLM 多卡训练完全指南

  19. noao-chat-6-训练评估指南

    LLM 模型评估验证完全指南

  20. noao-chat-5-训练四阶段数据报告

    nanochat 项目四阶段训练数据完全报告

  21. noao-chat-4-rl阶段训练

    LLM RL 训练完整解析

  22. noao-chat-3-sft阶段训练

    LLM SFT 训练完整解析

  23. noao-chat-2-mid阶段训练

    nonochat - LLM Mid 训练完整解析

  24. noao-chat-1-base阶段训练

    nonochat - LLM Base 训练完整解析

  25. noao-chat-0-项目总体介绍

    nanochat 项目深度分析

  26. Efficient Rectified Flow for Image Fusion

    [Paper Reading] Efficient Rectified Flow for Image Fusion(RFfusion)论文解读

  27. 3Blue1Brown 线性代数笔记

    3Blue1Brown 线性代数笔记(几何直觉)

  28. 线性代数的常见概念集合

    一、向量与向量空间相关(定义 + 几何直觉)

  29. DiT4SR: Taming Diffusion Transformer for Real-World Image Super-Resolution

    [Paper Reading] 基于 Diffusion Transformer 的真实世界超分辨率方法 DiT4SR

  30. Dual Prompting Image Restoration with Diffusion Transformers

    [Paper Reading] 基于扩散 Transformer 的双重提示图像复原 (DPIR)

  31. FLOAT:在 motion latent 里用 Flow Matching 生成可控 talking portrait

    FLOAT:在 motion latent 里用 Flow Matching 生成可控 talking portrait

  32. Stable Video-Driven Portraits

    [Paper Reading]:Stable Video-Driven Portraits — 基于 DiT 的高保真视频驱动人像生成

  33. moco 论文摘要

    MoCo: Momentum Contrast for Unsupervised Visual Representation Learning

  34. 小于1000的正整数立方和pair

    找出所有满足 \(a^3+b^3=c^3+d^3\)的小于1000的正整数组合

  35. 什么是deep learning

    前言