graph LR;
A[Flow Matching] --> B("条件概率\边际概率")
A[Flow Matching] --> C("条件速度场\边际速度场")
A[Flow Matching] --> D("速度调度器变换")
A[Flow Matching] --> E("高斯路径下边际速度场的参数化(速度\x_0\x_1\score之间的转换)")
A[Flow Matching] --> F("边际概率的计算(微分同胚\推前映射\变量替换)")
A[Flow Matching] --> G("条件引导")
- 随机向量 X,Y,联合PDF pX,Y(x,y) 满足边际化性质:
- pX(x)=∫pX,Y(x,y)dy
- pY(y)=∫pX,Y(x,y)dx
- 条件 PDF 定义:pX∣Y(x∣y)=pY(y)pX,Y(x,y)(要求 pY(y)>0)
- z:样本数据,x:采样数据
- 条件概率路径:pt∣Z(x∣z)(生成 Z=z 时的条件路径);
- 边际概率路径:pt(x)=∫pt∣Z(x∣z)pZ(z)dz;
- 条件期望 E[X∣Y=y]=∫xpX∣Y(x∣y)dx,是“给定 Y=y 时,最小二乘意义下最接近 X 的函数”;
- 全期望性质(Tower Property):E[E[X∣Y]]=E[X]——多层期望可简化为单层期望,是后续边际速度场推导的关键工具。
全期望性质:
记 μ(Y)=E[X∣Y](给定 Y 时 X 的条件期望),它是 Y 的函数(随机变量)。
- 内层 E[X∣Y]:对 X 取平均。在 Y 固定为某值 y 时,用条件分布 pX∣Y(x∣y) 算期望,即 E[X∣Y=y]=∫xpX∣Y(x∣y)dx。因此内层的结果是 Y 的函数 μ(Y)。
- 外层 E[E[X∣Y]]=E[μ(Y)]:对 Y 取平均。用 Y 的边际分布 pY(y) 对 μ(y) 求期望,即 ∫μ(y)pY(y)dy。
- 右边 E[X]:对 (X,Y) 的联合(或等价地对 X 的边际)取平均,即 ∫xpX(x)dx=∬xpX,Y(x,y)dxdy。
因此:先对 X 在“给定 Y”下求期望,再对 Y 求期望,等于直接对 X 求期望;全期望性质说的是“先条件后边际”与“直接边际”一致。
- 条件速度场:ut(x∣z) 由条件路径 pt∣Z(x∣z) 唯一确定(满足连续性方程,生成该路径);线性条件流时为 ut(x∣z)=1−tz−x(从当前 x 指向目标 z);
- 边际速度场:ut(x)=∫ut(x∣z)pZ∣t(z∣x)dz=∫ut(x∣z)pt(x)pt∣Z(x∣z)pZ(z)dz=Ez[ut(x∣Z)∣Xt=x](第二式将后验 pZ∣t(z∣x) 用贝叶斯展开;末式为条件期望形式,便于理解和计算)。
- 边际速度场具体计算公式:
ut(x)≈∑k=1Kwk∑k=1Kut(x∣z(k))⋅权重wkpt∣Z(x∣z(k))
其中
z(k)∼pZ(z)
边际速度场数学推导:把期望换成可计算形式
你要的积分:
ut(x)=∫ut(x∣z)pZ∣t(z∣x)dz把贝叶斯代入:
pZ∣t(z∣x)=pt(x)pt∣Z(x∣z)pZ(z)所以:
ut(x)=∫ut(x∣z)⋅pt(x)pt∣Z(x∣z)pZ(z)dz把分母提出来:
ut(x)=pt(x)1∫ut(x∣z)pt∣Z(x∣z)pZ(z)dz注意红色部分:
∫(⋯)pZ(z)dz=Ez∼p[⋯]所以:
ut(x)=pt(x)1Ez∼p[ut(x∣z)pt∣Z(x∣z)]
分母 pt(x) 也能写成期望
pt(x)=∫pt∣Z(x∣z)pZ(z)dz也是对 p(z) 的期望:
pt(x)=Ez∼p[pt∣Z(x∣z)]
合起来:重要采样公式
把两个期望合并:
ut(x)=Ez∼p[pt∣Z(x∣z)]Ez∼p[ut(x∣z)⋅pt∣Z(x∣z)]
离散化:变成加权平均
期望用样本平均近似:
E[⋯]≈K1k=1∑K(⋯)代入:
ut(x)≈∑k=1Kwk∑k=1Kut(x∣z(k))⋅权重wkpt∣Z(x∣z(k))其中
z(k)∼pZ(z)
todo
通过预测score计算速度场:
ut(x∣y)=atx+bt∇logpt∣Y(x∣y).(4.87)pt∣Y(x∣y)=pY(y)pY∣t(y∣x)pt(x).(4.88)条件分数∇logpt∣Y(x∣y)=分类器∇logpY∣t(y∣x)+无条件分数∇logpt(x),(4.89)u~tθ,ϕ(x∣y)=atx+bt(∇logpY∣tϕ(y∣x)+∇logptθ(x))=utθ(x)+bt∇logpY∣tϕ(y∣x),(4.90)u~tθ,ϕ(x∣y)=utθ(x)+btw∇logpY∣tϕ(y∣x),(4.91)分类器∇logpY∣t(y∣x)=条件分数∇logpt∣Y(x∣y)−无条件分数∇logpt(x),(4.92)∇logpt∣Y(x∣y)=btutθ(x∣y)−atx,∇logpt(x)=btutθ(x∣∅)−atx。代入上式:
u~tθ(x∣y)=utθ(x∣∅)+btwbtutθ(x∣y)−utθ(x∣∅)=(1−w)utθ(x∣∅)+wutθ(x∣y).