Flow-Matching-Formula

Steven 收录于类别 Diffusion/Flow 和系列 Diffusion/Flow系列

2026-03-04 2026-03-27 约 4148 字预计阅读 19 分钟

系列 -

1 推导图

graph LR;
    A[Flow Matching] --> B("条件概率\边际概率")
    A[Flow Matching] --> C("条件速度场\边际速度场")
    A[Flow Matching] --> D("速度调度器变换")
    A[Flow Matching] --> E("高斯路径下边际速度场的参数化(速度\x_0\x_1\score之间的转换)")
    A[Flow Matching] --> F("边际概率的计算(微分同胚\推前映射\变量替换)")
    A[Flow Matching] --> G("条件引导")

2 关键公式推导

2.1 联合概率密度与边际概率密度

随机向量 $X, Y$ $X, Y$ ，联合PDF $p_{X,Y}(x,y)$ $p_{X, Y} (x, y)$ 满足边际化性质：
- $p_X(x) = \int p_{X,Y}(x,y) dy$
- $p_Y(y) = \int p_{X,Y}(x,y) dx$

2.2 条件概率密度与贝叶斯法则

条件 PDF 定义： $p_{X \mid Y}(x \mid y) = \frac{p_{X,Y}(x,y)}{p_Y(y)}$ （要求 $p_Y(y) > 0$ ）

2.3 条件概率密度和边际概率密度

z：样本数据，x：采样数据
条件概率路径： $p_{t|Z}(x|z)$ （生成 $Z=z$ 时的条件路径）；
边际概率路径： $p_t(x) = \int p_{t|Z}(x|z) p_Z(z) dz$ ；

2.4 条件期望与全期望性质

条件期望 $\mathbb{E}[X \mid Y = y] = \int x p_{X \mid Y}(x \mid y) dx$ ，是“给定 $Y = y$ 时，最小二乘意义下最接近 $X$ 的函数”；
全期望性质（Tower Property）： $\mathbb{E}[\mathbb{E}[X \mid Y]] = \mathbb{E}[X]$ ——多层期望可简化为单层期望，是后续边际速度场推导的关键工具。

全期望性质： 记 $\mu(Y) = \mathbb{E}[X \mid Y]$ （给定 $Y$ 时 $X$ 的条件期望），它是 $Y$ 的函数（随机变量）。

内层 $\mathbb{E}[X \mid Y]$ ：对 $X$ 取平均。在 $Y$ 固定为某值 $y$ 时，用条件分布 $p_{X|Y}(x|y)$ 算期望，即 $\mathbb{E}[X \mid Y=y] = \int x\, p_{X|Y}(x|y)\, dx$ 。因此内层的结果是 $Y$ 的函数 $\mu(Y)$ 。
外层 $\mathbb{E}[\mathbb{E}[X \mid Y]] = \mathbb{E}[\mu(Y)]$ ：对 $Y$ 取平均。用 $Y$ 的边际分布 $p_Y(y)$ 对 $\mu(y)$ 求期望，即 $\int \mu(y)\, p_Y(y)\, dy$ 。
右边 $\mathbb{E}[X]$ ：对 $(X,Y)$ 的联合（或等价地对 $X$ 的边际）取平均，即 $\int x\, p_X(x)\, dx = \iint x\, p_{X,Y}(x,y)\, dx\, dy$ 。

因此：先对 $X$ 在“给定 $Y$ ”下求期望，再对 $Y$ 求期望，等于直接对 $X$ 求期望；全期望性质说的是“先条件后边际”与“直接边际”一致。

2.5 条件速度场和边际速度场

条件速度场： $u_t(x|z)$ 由条件路径 $p_{t|Z}(x|z)$ 唯一确定（满足连续性方程，生成该路径）；线性条件流时为 $u_t(x|z) = \frac{z-x}{1-t}$ （从当前 $x$ 指向目标 $z$ ）；
边际速度场： $u_t(x) = \int u_t(x|z)\, p_{Z|t}(z|x)\, dz = \int u_t(x|z)\, \frac{p_{t|Z}(x|z)\, p_Z(z)}{p_t(x)}\, dz = \mathbb{E_z}[u_t(x|Z) \mid X_t=x]$ （第二式将后验 $p_{Z|t}(z|x)$ 用贝叶斯展开；末式为条件期望形式，便于理解和计算）。
边际速度场具体计算公式: $u_t(x) \approx \frac{ \sum_{k=1}^K u_t(x\mid z^{(k)}) \cdot \underbrace{p_{t\mid Z}(x\mid z^{(k)})}_{\text{权重}w_k} }{ \sum_{k=1}^K w_k }$ 其中 $z^{(k)} \sim p_Z(z)$

边际速度场数学推导：把期望换成可计算形式

边际速度场数学推导：把期望换成可计算形式你要的积分：

u_t(x) = \int u_t(x\mid z)\,\color{red}{p_{Z\mid t}(z\mid x)}\,dz

把贝叶斯代入：

\color{red}{p_{Z\mid t}(z\mid x)} = \frac{p_{t\mid Z}(x\mid z)\,p_Z(z)}{p_t(x)}

所以：

u_t(x) = \int u_t(x\mid z) \cdot \frac{p_{t\mid Z}(x\mid z)\,p_Z(z)}{p_t(x)} dz

把分母提出来：

u_t(x) = \frac{1}{p_t(x)} \int u_t(x\mid z)\,p_{t\mid Z}(x\mid z)\,\color{red}{p_Z(z)}\,dz

注意红色部分：

\int (\cdots) \color{red}{p_Z(z)} dz = \mathbb{E}_{z\sim p}\big[\,\cdots\,\big]

所以：

u_t(x) = \frac{1}{p_t(x)}\; \mathbb{E}_{z\sim p}\big[\,u_t(x\mid z)\,p_{t\mid Z}(x\mid z)\,\big]

分母 $p_t(x)$ 也能写成期望

p_t(x) = \int p_{t\mid Z}(x\mid z)\,p_Z(z)\,dz

也是对 $p(z)$ 的期望：

p_t(x) = \mathbb{E}_{z\sim p}\big[\,p_{t\mid Z}(x\mid z)\,\big]

合起来：重要采样公式 把两个期望合并：

u_t(x) = \frac{\;\mathbb{E}_{z\sim p}\big[\,u_t(x\mid z)\cdot p_{t\mid Z}(x\mid z)\,\big]\;} {\;\mathbb{E}_{z\sim p}\big[\,p_{t\mid Z}(x\mid z)\,\big]\;}

离散化：变成加权平均 期望用样本平均近似：

\mathbb{E}[\cdots] \approx \frac{1}{K}\sum_{k=1}^K (\cdots)

代入：

u_t(x) \approx \frac{ \sum_{k=1}^K u_t(x\mid z^{(k)}) \cdot \underbrace{p_{t\mid Z}(x\mid z^{(k)})}_{\text{权重}w_k} }{ \sum_{k=1}^K w_k }

其中 $z^{(k)} \sim p_Z(z)$

2.6 微分同胚&推前映射

todo

2.7 条件引导

通过预测score计算速度场：

u_t(x|y) = a_t x + b_t \nabla \log p_{t|Y}(x|y). \tag{4.87}

2.7.1 分类器引导

p_{t|Y}(x|y) = \frac{p_{Y|t}(y|x) p_t(x)}{p_Y(y)}. \tag{4.88}

\underbrace{\nabla \log p_{t|Y}(x|y)}_{\text{条件分数}} = \underbrace{\nabla \log p_{Y|t}(y|x)}_{\text{分类器}} + \underbrace{\nabla \log p_t(x)}_{\text{无条件分数}}, \tag{4.89}

\tilde{u}_t^{\theta,\phi}(x|y) = a_t x + b_t \bigl( \nabla \log p_{Y|t}^\phi(y|x) + \nabla \log p_t^\theta(x) \bigr) = u_t^\theta(x) + b_t \nabla \log p_{Y|t}^\phi(y|x), \tag{4.90}

\tilde{u}_t^{\theta,\phi}(x|y) = u_t^\theta(x) + b_t w \nabla \log p_{Y|t}^\phi(y|x), \tag{4.91}

2.7.2 无分类器引导

\underbrace{\nabla \log p_{Y|t}(y|x)}_{\text{分类器}} = \underbrace{\nabla \log p_{t|Y}(x|y)}_{\text{条件分数}} - \underbrace{\nabla \log p_t(x)}_{\text{无条件分数}}, \tag{4.92}

$\nabla \log p_{t|Y}(x|y) = \frac{u_t^\theta(x|y) - a_t x}{b_t}$ ， $\nabla \log p_t(x) = \frac{u_t^\theta(x|\emptyset) - a_t x}{b_t}$ 。代入上式：

\tilde{u}_t^\theta(x|y) = u_t^\theta(x|\emptyset) + b_t w\,\frac{u_t^\theta(x|y) - u_t^\theta(x|\emptyset)}{b_t} = (1-w)\, u_t^\theta(x|\emptyset) + w\, u_t^\theta(x|y).

目录

目录

Flow-Matching-Formula

1 推导图

2 关键公式推导

2.1 联合概率密度与边际概率密度

2.2 条件概率密度与贝叶斯法则

2.3 条件概率密度和边际概率密度

2.4 条件期望与全期望性质

2.5 条件速度场和边际速度场

2.6 微分同胚&推前映射

2.7 条件引导

2.7.1 分类器引导

2.7.2 无分类器引导

相关内容

目录

Flow-Matching-Formula

1 推导图

2 关键公式推导

2.1 联合概率密度与边际概率密度

2.2 条件概率密度与贝叶斯法则

2.3 条件概率密度和边际概率密度

2.4 条件期望与全期望性质

2.5 条件速度场和边际速度场

2.6 微分同胚&推前映射

2.7 条件引导

2.7.1 分类器引导

2.7.2 无分类器引导

相关内容

Analytic Diffusion Studio — 技术文档索引

Analytic Diffusion Studio — 项目总览

smalldiffusion 技术文档索引

smalldiffusion 项目总览

Flow Matching Guide and Code: Discrete Flow Matching