目录

Diffusion-Flow-Formula

  • 动力学:仅漂移,无随机项

    dXt=ut(Xt)dt. \color{#4a9eff} \mathrm{d}X_t = u_t(X_t)\,\mathrm{d}t.
  • 密度演化:(Fokker–Planck):XtptX_t \sim p_t

    tpt=(utpt). \color{#4a9eff} \partial_t p_t = -\nabla \cdot (u_t\, p_t).
  • 动力学:漂移 μt\mu_t + 扩散系数 σt\sigma_t

    dXt=μt(Xt)dt+σtdWt. \color{#4a9eff} \mathrm{d}X_t = \mu_t(X_t)\,\mathrm{d}t + \sigma_t\,\mathrm{d}W_t.
  • 密度演化(Fokker–Planck):XtptX_t \sim p_t

    tpt=(μtpt)+σt22Δpt. \color{#4a9eff} \partial_t p_t = -\nabla \cdot (\mu_t\, p_t) + \frac{\sigma_t^2}{2}\,\Delta p_t.

  • 时间 t[0,T]t \in [0,T]X0pdataX_0 \sim p_{\mathrm{data}}XTX_T 近似噪声(如标准高斯)。通式:

    dXt=ft(Xt)dt+gtdWt. \color{#4a9eff} \mathrm{d}X_t = f_t(X_t)\,\mathrm{d}t + g_t\,\mathrm{d}W_t.
    • 常见取法(如 VP-SDE):ft(x)=βt2xf_t(x) = -\frac{\beta_t}{2}xgt=βtg_t = \sqrt{\beta_t},即 (todo) dXt=βt2Xtdt+βtdWt. \color{#4a9eff} \mathrm{d}X_t = -\frac{\beta_t}{2}\,X_t\,\mathrm{d}t + \sqrt{\beta_t}\,\mathrm{d}W_t.
  • 密度 ptp_t 满足 Fokker–Planck(ftμtf_t \equiv \mu_tgtσtg_t \equiv \sigma_t):

    tpt=(ftpt)+gt22Δpt. \color{#4a9eff} \partial_t p_t = -\nabla \cdot (f_t\, p_t) + \frac{g_t^2}{2}\,\Delta p_t.
  • XTπX_T \sim \pi 采样得到 X0pdataX_0 \sim p_{\mathrm{data}},形式为(Wˉt\bar{W}_t 为反向时间布朗运动):

    dXt=[ft(Xt)gt2logpt(Xt)]dt+gtdWˉt. \color{#4a9eff} \mathrm{d}X_t = \left[ f_t(X_t) - g_t^2\,\nabla \log p_t(X_t) \right]\mathrm{d}t + g_t\,\mathrm{d}\bar{W}_t.
    • 漂移由 ftf_t 改为 ftgt2logptf_t - g_t^2\,\nabla\log p_t;扩散系数仍为 gtg_t
    • logpt\nabla\log p_tscore,通常用网络 sθ(x,t)s_\theta(x,t) 拟合。
    • 采样时从 XTX_T 出发,沿反向时间积分上式得到 X0X_0

  • t[0,T] 或 [0,1]t \in [0,T] \text{ 或 } [0,1] ,时间从 00TT,通式:

    dXt=ut(Xt)dt \color{#4a9eff} \mathrm{d}X_t = u_t(X_t)\,\mathrm{d}t
  • 密度 ptp_t 满足 Fokker–Planck:

    tpt=(utpt). \color{#4a9eff} \partial_t p_t = -\nabla \cdot (u_t\, p_t).
  • 沿同一动力学反向积分即可:时间从 TT00,等价于 dXt=ut(Xt)dtt 从 T 减到 0. \color{#4a9eff} \mathrm{d}X_t = -u_t(X_t)\,\mathrm{d}t \quad \text{($t$ 从 $T$ 减到 $0$)}. 或令 τ=Tt\tau = T - t,则 dXτdτ=uTτ(Xτ)\frac{\mathrm{d}X_\tau}{\mathrm{d}\tau} = -u_{T-\tau}(X_\tau)。无随机项,故反向 = 前向速度场取反

以下均对同一前向时间方向,使转换后的 SDE/ODE 与原来的 ODE/SDE 有相同的边际分布族 ptp_t

  • 已知前向 ODE dXt=uttarget(Xt)dt\mathrm{d}X_t = u_t^{\mathrm{target}}(X_t)\,\mathrm{d}t 及其边际 ptp_t。与之ptp_t 的 SDE 为:

    dXt=[uttarget(Xt)+σt22logpt(Xt)]dt+σtdWt. \color{#4a9eff} \mathrm{d}X_t = \left[ u_t^{\mathrm{target}}(X_t) + \frac{\sigma_t^2}{2}\,\nabla \log p_t(X_t) \right]\mathrm{d}t + \sigma_t\,\mathrm{d}W_t.
    • 任取 σt0\sigma_t \geq 0σt0\sigma_t \equiv 0 时退化为原 ODE。
    • 即:在 Flow 的漂移上加扩散 σtdWt\sigma_t \,\mathrm{d}W_t,并加修正漂移 σt22logpt\frac{\sigma_t^2}{2}\nabla\log p_t,使边际 ptp_t 不变。
  • 采样时可用该 ODE 替代 SDE,得到相同 ptp_t无随机性的轨迹。
  • 已知前向 SDE dXt=μt(Xt)dt+σtdWt\mathrm{d}X_t = \mu_t(X_t)\,\mathrm{d}t + \sigma_t\,\mathrm{d}W_t 及其边际 ptp_t。与之同 - ptp_t 的确定性 ODE(概率流 ODE)为: dXt=[μt(Xt)σt22logpt(Xt)]dt. \color{#4a9eff} \mathrm{d}X_t = \left[ \mu_t(X_t) - \frac{\sigma_t^2}{2}\,\nabla \log p_t(X_t) \right]\mathrm{d}t.
    • 前向扩散 SDE dXt=ftdt+gtdWt\mathrm{d}X_t = f_t\,\mathrm{d}t + g_t\,\mathrm{d}W_t,对应概率流 ODE 为 dXt=[ft(Xt)gt22logpt(Xt)]dt. \color{#4a9eff} \mathrm{d}X_t = \left[ f_t(X_t) - \frac{g_t^2}{2}\,\nabla \log p_t(X_t) \right]\mathrm{d}t.

  • 前向

    出发点目标公式
    Flow 前向 ODE 漂移 uttargetu_t^{\mathrm{target}},边际 ptp_tptp_tDiffusion 前向 SDEdXt=[uttarget+σt22logpt]dt+σtdWt \color{#4a9eff} \mathrm{d}X_t = \big[u_t^{\mathrm{target}} + \frac{\sigma_t^2}{2}\nabla\log p_t\big]\mathrm{d}t + \sigma_t\,\mathrm{d}W_t
    Diffusion 前向 SDE 漂移 ftf_t、扩散 gtg_t,边际 ptp_tptp_tFlow 前向 ODE(概率流)dXt=[ftgt22logpt]dt \color{#4a9eff} \mathrm{d}X_t = \big[f_t - \frac{g_t^2}{2}\nabla\log p_t\big]\mathrm{d}t
  • 反向:Diffusion 反向 SDE 已在上文给出(ftgt2logpt+gtdWˉt\color{#4a9eff} f_t - g_t^2\nabla\log p_t + g_t\,\mathrm{d}\bar{W}_t);若用概率流 ODE 做反向,则对上述概率流 ODE 做时间反向(漂移取反)即可,且与“反向 SDE 对应的概率流 ODE”一致(同一 ptp_t)。


  • 符号utu_t = Flow 速度场;ft,gtf_t,g_t = 扩散 SDE 漂移与扩散系数;μt,σt\mu_t,\sigma_t = 一般 SDE 漂移与扩散;logpt\nabla\log p_t = score,常用 sθ(x,t)s_\theta(x,t) 拟合。
    类别方向动力学密度方程
    Flow (ODE)前向dXt=ut(Xt)dt\color{#4a9eff} \mathrm{d}X_t = u_t(X_t)\,\mathrm{d}ttpt=(utpt)\partial_t p_t = -\nabla\cdot(u_t p_t)
    Flow (ODE)反向dXt=ut(Xt)dt\color{#4a9eff} \mathrm{d}X_t = -u_t(X_t)\,\mathrm{d}t同上(时间反向)
    Diffusion (SDE)前向dXt=ft(Xt)dt+gtdWt\color{#4a9eff} \mathrm{d}X_t = f_t(X_t)\,\mathrm{d}t + g_t\,\mathrm{d}W_ttpt=(ftpt)+gt22Δpt\partial_t p_t = -\nabla\cdot(f_t p_t) + \frac{g_t^2}{2}\Delta p_t
    Diffusion (SDE)反向dXt=[ftgt2logpt]dt+gtdWˉt\color{#4a9eff} \mathrm{d}X_t = \big[f_t - g_t^2\nabla\log p_t\big]\mathrm{d}t + g_t\,\mathrm{d}\bar{W}_t与前向 ptp_t 在反向时间一致
    ODE→SDE(同 ptp_tdXt=[uttarget+σt22logpt]dt+σtdWt\color{#4a9eff} \mathrm{d}X_t = \big[u_t^{\mathrm{target}} + \frac{\sigma_t^2}{2}\nabla\log p_t\big]\mathrm{d}t + \sigma_t\,\mathrm{d}W_t
    SDE→ODE(同 ptp_tdXt=[μtσt22logpt]dt\color{#4a9eff} \mathrm{d}X_t = \big[\mu_t - \frac{\sigma_t^2}{2}\nabla\log p_t\big]\mathrm{d}t

前文中的 Flow(ODE)Diffusion(SDE) 均为连续时间 t[0,T]t \in [0,T]。实际实现(如 DDPM)多为离散时间 t{0,1,,T}t \in \{0,1,\ldots,T\}。下面给出离散形式及其与连续形式的对应与极限关系。

类型时间状态动力学描述
离散过程t=0,1,,Tt = 0,1,\ldots,T(整数步)x(0),x(1),,x(T)x^{(0)}, x^{(1)}, \ldots, x^{(T)}转移核 q(x(t)x(t1))\color{#4a9eff} q(x^{(t)} \mid x^{(t-1)}) 或确定性映射 x(t)=Ft(x(t1))\color{#4a9eff}x^{(t)} = F_t(x^{(t-1)})
连续过程t[0,T]t \in [0,T](实数)XtX_tSDE dXt=μtdt+σtdWt\color{#4a9eff}\mathrm{d}X_t = \mu_t\,\mathrm{d}t + \sigma_t\,\mathrm{d}W_t 或 ODE dXt=utdt\color{#4a9eff} \mathrm{d}X_t = u_t\,\mathrm{d}t

离散过程无“密度演化 PDE”,只有转移概率/映射多步边际(如 q(x(t)x(0))q(x^{(t)} \mid x^{(0)}));连续过程有 Fokker–Planck / 连续性方程

  • 与连续 SDE 的对应:当步数 TT \to \inftyβt\beta_t 按连续时间 t/Tt/T 设计时,离散链在适当缩放下收敛到连续 VP-SDE 等形式(见 6.4)。

  • 前向(数据 → 噪声):马尔可夫链,单步转移为高斯

    q(x(t)x(t1))=N(x(t); αtx(t1), βtI),αt=1βt. \color{#4a9eff} q(x^{(t)} \mid x^{(t-1)}) = \mathcal{N}\big(x^{(t)};\ \sqrt{\alpha_t}\, x^{(t-1)},\ \beta_t \mathbf{I}\big), \qquad \alpha_t = 1 - \beta_t.

    多步边际(给定 x(0)x^{(0)}):

    q(x(t)x(0))=N(x(t); αˉtx(0), (1αˉt)I),αˉt=s=1tαs. \color{#4a9eff} q(x^{(t)} \mid x^{(0)}) = \mathcal{N}\big(x^{(t)};\ \sqrt{\bar\alpha_t}\, x^{(0)},\ (1-\bar\alpha_t)\mathbf{I}\big), \qquad \bar\alpha_t = \prod_{s=1}^{t}\alpha_s.
  • 反向(噪声 → 数据):无闭式,用网络拟合

    pθ(x(t1)x(t))=N(x(t1); μθ(x(t),t), β~tI), \color{#4a9eff} p_\theta(x^{(t-1)} \mid x^{(t)}) = \mathcal{N}\big(x^{(t-1)};\ \mu_\theta(x^{(t)}, t),\ \tilde\beta_t \mathbf{I}\big),

    其中 μθ\mu_\theta 由 score / 噪声预测 ϵθ\epsilon_\theta 表出,β~t=βt(1αˉt1)/(1αˉt)\tilde\beta_t = \beta_t(1-\bar\alpha_{t-1})/(1-\bar\alpha_t)

  • 与连续 ODE 的对应TT \to \inftyΔt0\Delta t \to 0 时,离散欧拉步收敛到 ODE dXt=ut(Xt)dt\mathrm{d}X_t = u_t(X_t)\,\mathrm{d}t

  • 前向:每步确定性映射

    x(t)=Ft(x(t1)),t=1,,T. \color{#4a9eff} x^{(t)} = F_t(x^{(t-1)}), \qquad t = 1,\ldots,T.

    例如欧拉步:x(t)=x(t1)+Δtut(x(t1))x^{(t)} = x^{(t-1)} + \Delta t\, u_t(x^{(t-1)}),其中 Δt=1/T\Delta t = 1/Tutu_t 为速度场。

  • 反向:若 FtF_t 可逆,则

    x(t1)=Ft1(x(t)). \color{#4a9eff} x^{(t-1)} = F_t^{-1}(x^{(t)}).

    若由 ODE 离散化得到(如 x(t)=x(t1)+Δtut(x(t1))x^{(t)} = x^{(t-1)} + \Delta t\, u_t(x^{(t-1)})),则反向为 x(t1)=x(t)Δtut(x(t))\color{#4a9eff} x^{(t-1)} = x^{(t)} - \Delta t\, u_t(x^{(t)})或用 ut(x(t1))u_t(x^{(t-1)}) 的近似.

将离散步 k{0,1,,T}k \in \{0,1,\ldots,T\} 对应到连续时间 t[0,1]t \in [0,1]:令 tk=k/Tt_k = k/TΔt=1/T\Delta t = 1/T。记离散状态为 x(k)x^{(k)},若存在连续时间过程 XtX_t,则约定在 t=tkt = t_kXtkX_{t_k}x(k)x^{(k)} 对应(可理解为对 x(k)x^{(k)} 做常数或线性插值得到 Xt(T)X_t^{(T)},再讨论 TT \to \infty 的极限)。

  • 离散前向(DDPM): x(k)=1βkx(k1)+βkεk,εkN(0,I) \color{#4a9eff} x^{(k)} = \sqrt{1-\beta_k}\, x^{(k-1)} + \sqrt{\beta_k}\,\varepsilon_k, \qquad \varepsilon_k \sim \mathcal{N}(0, \mathbf{I})
  • 连续前向为(VP-SDE,时间 t[0,1]t \in [0,1]): dXt=β(t)2Xtdt+β(t)dWt. \color{#4a9eff} \mathrm{d}X_t = -\frac{\beta(t)}{2}\,X_t\,\mathrm{d}t + \sqrt{\beta(t)}\,\mathrm{d}W_t.

离散前向(DDPM):

x(k)=1βkx(k1)+βkεk,εkN(0,I), i.i.d. \color{#4a9eff} x^{(k)} = \sqrt{1-\beta_k}\, x^{(k-1)} + \sqrt{\beta_k}\,\varepsilon_k, \qquad \varepsilon_k \sim \mathcal{N}(0, \mathbf{I}),\ \text{i.i.d.}

单步增量可写为

x(k)x(k1)=(1βk1)x(k1)+βkεk. \color{#4a9eff} x^{(k)} - x^{(k-1)} = \big(\sqrt{1-\beta_k} - 1\big)\, x^{(k-1)} + \sqrt{\beta_k}\,\varepsilon_k.

βk\beta_k 较小时,1βk1βk/2\color{#4a9eff} \sqrt{1-\beta_k} \approx 1 - \beta_k/2,故

x(k)x(k1)βk2x(k1)+βkεk. \color{#4a9eff} x^{(k)} - x^{(k-1)} \approx -\frac{\beta_k}{2}\, x^{(k-1)} + \sqrt{\beta_k}\,\varepsilon_k.

时间与系数缩放:为在 TT \to \infty 时得到非平凡连续极限,需要:

  • 每步漂移量约为 O(Δt)O(\Delta t),即 βk2x(k1)\color{#4a9eff} -\frac{\beta_k}{2}x^{(k-1)}Δt\Delta t 同阶;
  • 每步噪声的方差约为 O(Δt)O(\Delta t),这样在 [0,1][0,1] 上累积方差为 O(1)O(1),极限为布朗运动。

连续时间调度 β(τ)\beta(\tau)τ[0,1]\tau \in [0,1],令

βk=β(tk)Δt=β(k/T)T,tk=kT. \color{#4a9eff} \beta_k = \beta(t_k)\,\Delta t = \frac{\beta(k/T)}{T}, \qquad t_k = \frac{k}{T}.
  • 漂移项:βk2x(k1)=β(tk)2Tx(k1)\color{#4a9eff} -\frac{\beta_k}{2}\, x^{(k-1)} = -\frac{\beta(t_k)}{2T}\, x^{(k-1)},即每步漂移 =β(tk)2x(k1)Δt= \color{#4a9eff} -\frac{\beta(t_k)}{2}\, x^{(k-1)}\,\Delta t
  • 噪声项:βkεk=β(tk)/Tεk\color{#4a9eff} \sqrt{\beta_k}\,\varepsilon_k = \sqrt{\beta(t_k)/T}\,\varepsilon_k,单步方差 =β(tk)/T=β(tk)Δt= \color{#4a9eff} \beta(t_k)/T = \beta(t_k)\,\Delta t

k=1,,Tk = 1,\ldots,T 累加并令 TT \to \infty(在适当正则性下):

  • 漂移和 kβ(tk)2x(k1)Δt0tβ(s)2Xsds\color{#4a9eff} \sum_{k} -\frac{\beta(t_k)}{2}\, x^{(k-1)}\,\Delta t \to \int_0^t -\frac{\beta(s)}{2}\, X_s\,\mathrm{d}s
  • 噪声和 kβ(tk)Δtεk\color{#4a9eff} \sum_{k} \sqrt{\beta(t_k)\,\Delta t}\,\varepsilon_k 在分布意义下收敛到 0tβ(s)dWs\color{#4a9eff} \int_0^t \sqrt{\beta(s)}\,\mathrm{d}W_s(独立同分布、方差为 Δt\Delta t 的随机项在 TT\to\infty 下收敛到布朗运动的随机积分)。

因此连续极限为(VP-SDE,时间 t[0,1]t \in [0,1]):

dXt=β(t)2Xtdt+β(t)dWt. \color{#4a9eff} \mathrm{d}X_t = -\frac{\beta(t)}{2}\,X_t\,\mathrm{d}t + \sqrt{\beta(t)}\,\mathrm{d}W_t.

即前文中的 ft(x)=β(t)2x f_t(x) = -\frac{\beta(t)}{2}xgt=β(t)g_t = \sqrt{\beta(t)}。若将时间区间取为 [0,T][0,T],则可将 β(t)\beta(t) 写为 β(t/T)\beta(t/T) 或直接使用 tt 上的调度。

反向的对应:离散反向的均值 μθ\mu_\theta 由 score / ϵθ\epsilon_\theta 给出;在连续极限下,ptp_t 的 score logpt\nabla\log p_t 与离散的 ϵθ\epsilon_\theta 通过 x(t)=αˉtx(0)+1αˉtϵx^{(t)} = \sqrt{\bar\alpha_t}\,x^{(0)} + \sqrt{1-\bar\alpha_t}\,\epsilon 相联系。连续反向 SDE 的漂移为 ftgt2logptf_t - g_t^2\,\nabla\log p_t,与离散中“用 ϵθ\epsilon_\theta 估计 ϵ\epsilon 再代入 μ~t\tilde\mu_t”在 TT\to\infty 下一致。

  • 离散前向(欧拉离散化): x(k)=x(k1)+Δtuk(x(k1)),Δt=1T. \color{#4a9eff} x^{(k)} = x^{(k-1)} + \Delta t\, u_{k}(x^{(k-1)}), \qquad \Delta t = \frac{1}{T}.
  • 连续前向为(ODE,时间 t[0,1]t \in [0,1]): dXt=ut(Xt)dt. \color{#4a9eff} \mathrm{d}X_t = u_t(X_t)\,\mathrm{d}t.

离散前向(欧拉离散化):

x(k)=x(k1)+Δtuk(x(k1)),Δt=1T. \color{#4a9eff} x^{(k)} = x^{(k-1)} + \Delta t\, u_{k}(x^{(k-1)}), \qquad \Delta t = \frac{1}{T}.

这里 uku_k 为第 kk 步的速度场(可与连续时间 tk=k/Tt_k = k/T 对应,即 uk(x)=u(tk,x)u_k(x) = u(t_k, x))。等价于

x(k)x(k1)Δt=uk(x(k1)). \color{#4a9eff} \frac{x^{(k)} - x^{(k-1)}}{\Delta t} = u_k(x^{(k-1)}).

这正是 ODE dXtdt=ut(Xt)\frac{\mathrm{d}X_t}{\mathrm{d}t} = u_t(X_t)欧拉格式。在 ut(x)u_t(x) 关于 xx Lipschitz、关于 tt 连续等标准条件下,对 x(0)=X0x^{(0)} = X_0 做线性插值得到的 Xt(T)X_t^{(T)}(满足 Xk/T(T)=x(k)X_{k/T}^{(T)} = x^{(k)})在 TT \to \infty 时一致收敛到 ODE 的解 XtX_t,即

dXt=ut(Xt)dt. \color{#4a9eff} \mathrm{d}X_t = u_t(X_t)\,\mathrm{d}t.

反向:离散反向为 x(k1)=x(k)Δtuk(x(k))\color{#4a9eff} x^{(k-1)} = x^{(k)} - \Delta t\, u_k(x^{(k)})(或用 x(k1)x^{(k-1)} 的近似),即连续 ODE 反向 dXt=ut(Xt)dt\color{#4a9eff} \mathrm{d}X_t = -u_t(X_t)\,\mathrm{d}t 的欧拉离散化;TT \to \infty 时同样收敛到连续反向 ODE。

  • 对比表

    离散过程缩放 / 条件连续极限
    DDPM 前向 x(k)=1βkx(k1)+βkεk\color{#4a9eff} x^{(k)} = \sqrt{1-\beta_k}x^{(k-1)} + \sqrt{\beta_k}\varepsilon_kβk=β(k/T)/T\color{#4a9eff} \beta_k = \beta(k/T)/TTT\to\inftydXt=β(t)2Xtdt+β(t)dWt\color{#4a9eff} \mathrm{d}X_t = -\frac{\beta(t)}{2}X_t\,\mathrm{d}t + \sqrt{\beta(t)}\,\mathrm{d}W_t
    离散 Flow x(k)=x(k1)+Δtuk(x(k1))\color{#4a9eff} x^{(k)} = x^{(k-1)} + \Delta t\, u_k(x^{(k-1)})Δt=1/T\color{#4a9eff} \Delta t = 1/Tuk=u(k/T,)\color{#4a9eff} u_k = u(k/T, \cdot)TT\to\inftydXt=ut(Xt)dt\color{#4a9eff} \mathrm{d}X_t = u_t(X_t)\,\mathrm{d}t
  • 离散 Diffusion 的漂移来自 1βk1βk/2\color{#4a9eff} \sqrt{1-\beta_k}-1 \approx -\beta_k/2噪声来自 βkεk\color{#4a9eff} \sqrt{\beta_k}\,\varepsilon_k;取 βk=O(1/T)\color{#4a9eff} \beta_k = O(1/T) 使单步漂移与噪声方差均为 O(1/T)O(1/T),从而极限为连续 SDE。

  • 离散 Flow 的步长 Δt=1/T\color{#4a9eff} \Delta t = 1/T 直接对应 ODE 的 dt\color{#4a9eff} \mathrm{d}t,欧拉格式收敛性为标准数值分析结论。


类别离散形式连续形式
Diffusion 前向q(x(t)x(t1))=N(αtx(t1),βtI)\color{#4a9eff} q(x^{(t)} \mid x^{(t-1)}) = \mathcal{N}(\sqrt{\alpha_t}x^{(t-1)}, \beta_t \mathbf{I})q(x(t)x(0))=N(αˉtx(0),(1αˉt)I)\color{#4a9eff} q(x^{(t)} \mid x^{(0)}) = \mathcal{N}(\sqrt{\bar\alpha_t}x^{(0)}, (1-\bar\alpha_t)\mathbf{I})dXt=ftdt+gtdWt\color{#4a9eff} \mathrm{d}X_t = f_t\,\mathrm{d}t + g_t\,\mathrm{d}W_ttpt=(ftpt)+gt22Δpt\color{#4a9eff} \partial_t p_t = -\nabla\cdot(f_t p_t) + \frac{g_t^2}{2}\Delta p_t
Diffusion 反向pθ(x(t1)x(t))\color{#4a9eff} p_\theta(x^{(t-1)} \mid x^{(t)}),均值 μθ\color{#4a9eff} \mu_\theta、方差 β~t\color{#4a9eff} \tilde\beta_tdXt=[ftgt2logpt]dt+gtdWˉt\color{#4a9eff} \mathrm{d}X_t = [f_t - g_t^2\nabla\log p_t]\,\mathrm{d}t + g_t\,\mathrm{d}\bar{W}_t
Flow 前向x(t)=Ft(x(t1))\color{#4a9eff} x^{(t)} = F_t(x^{(t-1)})x(t)=x(t1)+Δtut(x(t1))\color{#4a9eff} x^{(t)} = x^{(t-1)} + \Delta t\, u_t(x^{(t-1)})dXt=ut(Xt)dt\color{#4a9eff} \mathrm{d}X_t = u_t(X_t)\,\mathrm{d}ttpt=(utpt)\color{#4a9eff} \partial_t p_t = -\nabla\cdot(u_t p_t)
Flow 反向x(t1)=Ft1(x(t))\color{#4a9eff} x^{(t-1)} = F_t^{-1}(x^{(t)})x(t1)=x(t)Δtut()\color{#4a9eff} x^{(t-1)} = x^{(t)} - \Delta t\, u_t(\cdot)dXt=ut(Xt)dt\color{#4a9eff} \mathrm{d}X_t = -u_t(X_t)\,\mathrm{d}t

下面由 随机微分方程(SDE) 出发,推导其密度 ptp_t 所满足的 Fokker–Planck 方程(也称 Kolmogorov 前向方程)。先在一维情形写出完整推导,再给出高维形式。

考虑(可先设一维 XtRX_t \in \mathbb{R}):

dXt=μt(Xt)dt+σtdWt. \color{#4a9eff} \mathrm{d}X_t = \mu_t(X_t)\,\mathrm{d}t + \sigma_t\,\mathrm{d}W_t.

其中 μt(x)\mu_t(x) 为漂移,σt0\sigma_t \geq 0 为扩散系数(可与 xx 有关,下面为书写简单取仅与 tt 有关),WtW_t 为标准布朗运动。

XtX_t 有密度 pt(x)p_t(x),目标是得到 ptp_t 满足的 PDE。

对任意光滑紧支撑函数 φ(x)\varphi(x),Itô 引理给出:

dφ(Xt)=(μt(Xt)φ(Xt)+σt22φ(Xt))dt+σtφ(Xt)dWt. \color{#4a9eff} \mathrm{d}\varphi(X_t) = \left( \mu_t(X_t)\,\varphi'(X_t) + \frac{\sigma_t^2}{2}\,\varphi''(X_t) \right)\mathrm{d}t + \sigma_t\,\varphi'(X_t)\,\mathrm{d}W_t.

对时间取期望,dWt\mathrm{d}W_t 项均值为 0,故

ddtE[φ(Xt)]=E[μt(Xt)φ(Xt)+σt22φ(Xt)]. \color{#4a9eff} \frac{\mathrm{d}}{\mathrm{d}t}\,\mathbb{E}[\varphi(X_t)] = \mathbb{E}\left[ \mu_t(X_t)\,\varphi'(X_t) + \frac{\sigma_t^2}{2}\,\varphi''(X_t) \right].

用密度写开:E[φ(Xt)]=φ(x)pt(x)dx\mathbb{E}[\varphi(X_t)] = \int \varphi(x)\,p_t(x)\,\mathrm{d}x,且

E[μt(Xt)φ]=μt(x)φ(x)pt(x)dx,E[φ(Xt)]=φ(x)pt(x)dx. \color{#4a9eff} \mathbb{E}[\mu_t(X_t)\,\varphi'] = \int \mu_t(x)\,\varphi'(x)\,p_t(x)\,\mathrm{d}x, \qquad \mathbb{E}[\varphi''(X_t)] = \int \varphi''(x)\,p_t(x)\,\mathrm{d}x.

于是

φ(x)tpt(x)dx=μt(x)φ(x)pt(x)dx+σt22φ(x)pt(x)dx. \color{#4a9eff} \int \varphi(x)\,\partial_t p_t(x)\,\mathrm{d}x = \int \mu_t(x)\,\varphi'(x)\,p_t(x)\,\mathrm{d}x + \frac{\sigma_t^2}{2}\int \varphi''(x)\,p_t(x)\,\mathrm{d}x.

对右边两项做分部积分(边界项在紧支撑或无穷远处为 0):

  • μtφptdx=φx(μtpt)dx\int \mu_t\,\varphi'\,p_t\,\mathrm{d}x = -\int \varphi\,\partial_x(\mu_t\,p_t)\,\mathrm{d}x
  • φptdx=φxxptdx\int \varphi''\,p_t\,\mathrm{d}x = \int \varphi\,\partial_{xx} p_t\,\mathrm{d}x(即 φΔptdx\int \varphi\,\Delta p_t\,\mathrm{d}x 在一维为 φptdx\int \varphi\,p_t''\,\mathrm{d}x)。

代入得

φtptdx=φx(μtpt)dx+σt22φxxptdx. \color{#4a9eff} \int \varphi\,\partial_t p_t\,\mathrm{d}x = -\int \varphi\,\partial_x(\mu_t\,p_t)\,\mathrm{d}x + \frac{\sigma_t^2}{2}\int \varphi\,\partial_{xx} p_t\,\mathrm{d}x.

φ\varphi 任意,得弱形式:对任意光滑紧支撑 φ\varphi

φ(tpt+x(μtpt)σt22xxpt)dx=0. \color{#4a9eff} \int \varphi\,\left( \partial_t p_t + \partial_x(\mu_t\,p_t) - \frac{\sigma_t^2}{2}\,\partial_{xx} p_t \right)\mathrm{d}x = 0.

φ\varphi 任意,被积函数(在分布意义下)为 0,即

tpt=x(μtpt)+σt22xxpt=(μtpt)+σt22Δpt. \color{#4a9eff} \partial_t p_t = -\partial_x(\mu_t\,p_t) + \frac{\sigma_t^2}{2}\,\partial_{xx} p_t = -\nabla\cdot(\mu_t\,p_t) + \frac{\sigma_t^2}{2}\,\Delta p_t.

一维时 (μtpt)=x(μtpt)\nabla\cdot(\mu_t p_t) = \partial_x(\mu_t p_t)Δpt=xxpt\Delta p_t = \partial_{xx} p_t;高维时 \nabla\cdot 为散度,Δ\Delta 为拉普拉斯算子,推导相同(对 φ(Xt)\varphi(X_t) 用高维 Itô 公式,再分部积分)。

dXt=μt(Xt)dt+σtdWt,XtRd, \color{#4a9eff} \mathrm{d}X_t = \mu_t(X_t)\,\mathrm{d}t + \sigma_t\,\mathrm{d}W_t, \qquad X_t \in \mathbb{R}^d,

其中 WtW_tdd 维布朗运动,σt\sigma_t 为标量或矩阵,在标量扩散系数 σt\sigma_t 且与 xx 无关时,密度 pt(x)p_t(x) 满足

tpt=(μtpt)+σt22Δpt. \color{#4a9eff} \partial_t p_t = -\nabla \cdot (\mu_t\, p_t) + \frac{\sigma_t^2}{2}\,\Delta p_t.

若扩散系数为矩阵 GtG_tdXt=μtdt+GtdWt\mathrm{d}X_t = \mu_t\,\mathrm{d}t + G_t\,\mathrm{d}W_t),则扩散项为 12i,j(GtGt)ijijpt\frac{1}{2}\sum_{i,j}(G_t G_t^\top)_{ij}\,\partial_{ij} p_t;当 Gt=σtIG_t = \sigma_t \mathbf{I} 时仍为 σt22Δpt\frac{\sigma_t^2}{2}\Delta p_t

  • SDE dXt=μtdt+σtdWt\mathrm{d}X_t = \mu_t\,\mathrm{d}t + \sigma_t\,\mathrm{d}W_tFokker–Planck tpt=(μtpt)+σt22Δpt\partial_t p_t = -\nabla\cdot(\mu_t p_t) + \frac{\sigma_t^2}{2}\Delta p_t 一一对应:给定 SDE 可推出 ptp_t 满足的 PDE;反之,若 ptp_t 满足该 PDE 且与 SDE 的初始分布一致,则 ptp_t 即为该 SDE 解的边际密度。
  • 推导路径:SDE → Itô 引理(对 φ(Xt)\varphi(X_t))→ 取期望并分部积分 → Fokker–Planck

相关内容