布朗运动(Brownian motion)、随机微分方程(SDE)与扩散方程

总结了布朗运动的三种描述视角及其内在联系:

  • 物理视角:通过朗之万方程描述受力与涨落,利用涨落耗散定理连接微观动力学与热力学平衡。
  • 数学视角:随机微分方程 (SDE) 理论,利用伊藤引理处理维纳过程的不可微性。
  • 统计视角:从拉格朗日观点的粒子运动推导出欧拉观点的概率演化,即福克-普朗克方程 (FPE)。

1. 朗之万(Langevin)方程

如何描述布朗运动?朗之万给出了一个从牛顿力学出发的视角(对应于爱因斯坦从微观随机游走的统计和宏观渗透压的联立),给出了一个介观尺度的方程,粒子受到的力分为耗散项加上涨落项:

md2xdt2=γdxdt耗散项+ξ(t)涨落项m\frac{\mathrm{d^2}x}{\mathrm{d}t^2}=\underbrace{-\gamma\frac{\mathrm{d}x}{\mathrm{d}t}}_{\text{耗散项}} + \underbrace{\xi(t)}_{\text{涨落项}}

其中 ξ(t)\xi(t)白噪声,满足

均值 E[ξ(t)]ξ(t)=0自相关函数 Rξ(t1,t2)ξ(t1)ξ(t2)=2γkBTδ(t1t2)\begin{aligned} \text{均值~} \mathbb{E}[\xi(t)] && \langle\xi(t) \rangle &= 0 \\ \text{自相关函数~} \mathbb{R}_\xi(t_1,t_2) && \langle\xi(t_1)\xi(t_2)\rangle&= 2 \gamma k_B T\delta(t_1-t_2) \end{aligned}

2. 涨落耗散定理(Fluctuation-Dissipation Theorem, FDT)

系统损失能量的速率(耗散)必须精确等于系统从环境中获得能量的速率(涨落)。

假设系统没有涨落项,则系统很快趋于静止,变为绝对零度;假设系统没有耗散项,方程两边积分可得 v(t)=v(0)\langle v(t)\rangle=v(0) ,方程两边平方后求积分:

(v(t))2=(v(0)+1m0tξ(t) ⁣dt)2    (v(t))2=(v(0))2+2v(0)m0tξ(t) ⁣dt+(1m0tξ(t) ⁣dt)2    (v(t))2=(v(0))2+1m20t0tξ(t1)ξ(t2) ⁣dt1 ⁣dt2    (v(t))2=(v(0))2+2γkBTtm2  (这里假装γ不是耗散系数)\begin{aligned} \left( v(t)\right)^2&= \left(v(0)+\frac{1}{m}\int_0^t\xi(t)\,\mathop{}\!\mathrm{d}t\right)^2 \\ \implies\left( v(t)\right)^2&= \left( v(0)\right)^2 + \frac{2v(0)}{m}\int_0^t\xi(t)\,\mathop{}\!\mathrm{d}t+\left(\frac{1}{m}\int_0^t\xi(t)\,\mathop{}\!\mathrm{d}t\right)^2 \\ \implies\langle \left( v(t)\right)^2\rangle &= \left( v(0)\right)^2 + \frac{1}{m^2}\int_0^t\int_0^t \langle\xi(t_1)\xi(t_2)\rangle\,\mathop{}\!\mathrm{d}t_1 \mathop{}\!\mathrm{d}t_2 \\ \implies\langle \left( v(t)\right)^2\rangle &= \left( v(0)\right)^2 + \frac{2 \gamma k_B Tt}{m^2} ~~\text{(这里假装γ不是耗散系数)} \end{aligned}

也就是说粒子动能的期望会随着时间的增加而增加,最终艺术就是爆炸。

所以一个有涨落的系统必定伴随有耗散。他们其实是同一个东西的一体两面。想象一堆人挤着你,你会时不时获得一个随机的速度,当你想向前时就会受到正相关于速度的阻力。用类似推导理想气体压力的方式,可以推导出阻力和速度成正比。

具体的定量关系如何推导呢?即,知道 ξ(t1)ξ(t2)=2Dδ(t1t2)\langle\xi(t_1)\xi(t_2)\rangle= 2 D\delta(t_1-t_2) 怎么知道 DDγ\gamma 的关系呢?首先求解(积分因子法)朗之万方程,得到

v(t)=v(0)eγt/m+1m0teγ(ts)/mξ(s) ⁣dsv(t) = v(0)e^{-\gamma t/m} + \frac{1}{m}\int_0^te^{-\gamma (t-s)/m}\xi(s) \,\mathop{}\!\mathrm{d}s

取二阶矩

(v(t))2=(v(0))2e2γt/m+1m20t0teγ(2tt1t2)/mξ(t1)ξ(t2) ⁣dt1 ⁣dt2    (v(t))2=(v(0))2e2γt/m+2Dm20te2γ(tt2)/m ⁣dt2    (v(t))2=(v(0))2e2γt/m+2Dm2m2γ(1e2γt/m)\begin{aligned} \langle \left( v(t)\right)^2\rangle &= \left( v(0)\right)^2e^{-2\gamma t/m} + \frac{1}{m^2}\int_0^t\int_0^t e^{-\gamma (2t-t_1-t_2)/m}\langle\xi(t_1)\xi(t_2)\rangle\,\mathop{}\!\mathrm{d}t_1 \mathop{}\!\mathrm{d}t_2 \\ \implies \langle \left( v(t)\right)^2\rangle &= \left( v(0)\right)^2e^{-2\gamma t/m} + \frac{2 D}{m^2}\int_0^t e^{-2\gamma (t-t_2)/m}\,\mathop{}\!\mathrm{d}t_2 \\ \implies \langle \left( v(t)\right)^2\rangle &= \left( v(0)\right)^2e^{-2\gamma t/m} + \frac{2 D}{m^2}\cdot \frac{m}{2\gamma}\left( 1 - e^{-2\gamma t/m}\right) \end{aligned}

tt→∞ ,在热平衡下,速度应该满足麦克斯韦-玻尔兹曼分布,即:

v2=kBTm\langle v_\infty^2 \rangle = \frac{k_\text{B}T}{m}

v2=kBTm=2Dm2m2γ    D=γkBT\langle v_\infty^2 \rangle = \frac{k_\text{B}T}{m} = \frac{2 D}{m^2}\cdot \frac{m}{2\gamma} \\ \implies D = \gamma k_B T

3. 随机微分方程

3.1. 维纳过程(Wiener process)

由于白噪声 ξ(t)\xi(t) 不存在普通函数意义,微分方程没有经典解,想要描述布朗运动需要引入维纳过程。Wiener 过程是数学上严格定义的标准布朗运动。

维纳过程 W(t)W(t) 是一个连续时间随机过程,满足以下条件:

  • 初始值: W(0)=0W(0)=0
  • 独立增量:
 0t0<t1<...<tn,W(t1)W(t0),W(t2)W(t1),,W(tn)W(tn1) 相互独立\forall~ 0\le t_0<t_1<...<t_n,\\ W(t_1​)−W(t_0​),W(t_2​)−W(t_1​),…,W(t_n​)−W(t_{n−1}​) ~\text{相互独立}
  • 增量服从正态分布: W(t)W(s)N(0,ts),t>sW(t)-W(s)\sim\mathcal{N}(0,t-s),t>s
  • 连续样本路径:几乎处处 tW(t)t\mapsto W(t) 是连续函数。

因此具有以下性质:

  • 均值与方差: E[W(t)]=0,Var[W(t)]=t\mathbb{E}[W(t)]=0,\mathrm{Var}[W(t)]=t
  • 协方差: Cov[W(t),W(s)]=min(t,s)\mathrm{Cov}[W(t),W(s)]=\mathrm{min}(t,s)
  • 马尔可夫性:未来增量只依赖当前值,不依赖过去路径。
  • 自相似性: W(ct)=dcW(t)W(ct) \stackrel{d}{=} \sqrt{c}W(t) (同分布意义下)
  • 连续但不可微:几乎所有样本路径在任何点都不可微。

3.2. 二次变差 (Quadratic Variation)

接下来需要求得 dW(t)\mathrm{d}W(t)dt\mathrm{d}t 之间的关系,在概率意义下(均方收敛) (dWt)2=dt(dW_t)^2 = dt ,思路是 W(dt)N(0,dt)E[dW(t)2]=dtW(\mathrm{d}t)\sim\mathcal{N}(0,\mathrm{d}t)\Rightarrow\mathbb{E}[\mathrm{d}W(t)^2]=\mathrm{d}t ,如下。

假设我们有一个时间区间 [0,t][0, t] ,我们把它切成 nn 个极小的片段(类似于黎曼积分的切分): 0=t0<t1<<tn=t0 = t_0 < t_1 < \dots < t_n = t 每个小区间长度为 Δt=tn\Delta t = \frac{t}{n}

我们定义的二次变差 [X,X]t[X, X]_t 是路径增量平方的和:

Qn=i=0n1(Xti+1Xti)2Q_n = \sum_{i=0}^{n-1} (X_{t_{i+1}} - X_{t_i})^2

对普通光滑函数(黎曼积分),根据中值定理, ΔXiX(ti)Δt\Delta X_i \approx X'(t_i) \Delta t 。那么当 nn \to \infty (即 Δt0\Delta t \to 0 )时,这个和显然趋向于 0。

对于布朗运动 WtW_tΔWiN(0,Δt)\Delta W_i \sim N(0, \Delta t) 。这意味着:

E[ΔWi]=0E[(ΔWi)2]=ΔtVar[(ΔWi)2]=E[(ΔWi)4](E[(ΔWi)2])2=3(Δt)2(Δt)2=2(Δt)2E[\Delta W_i] = 0 \\ E[(\Delta W_i)^2] = \Delta t \\ Var[(\Delta W_i)^2] = E[(\Delta W_i)^4] - (E[(\Delta W_i)^2])^2 = 3(\Delta t)^2 - (\Delta t)^2 = 2(\Delta t)^2

E[Qn]=i=0n1E[(ΔWi)2]=i=0n1Δt=ntn=tE[Q_n] = \sum_{i=0}^{n-1} E[(\Delta W_i)^2] = \sum_{i=0}^{n-1} \Delta t = n \cdot \frac{t}{n} = t

不管切得多细,所有增量平方的和的期望值恒等于总时间 tt

Var[Qn]=i=0n1Var[(ΔWi)2]=i=0n12(Δt)2=n2(tn)2=2t2nVar[Q_n] = \sum_{i=0}^{n-1} Var[(\Delta W_i)^2]= \sum_{i=0}^{n-1} 2(\Delta t)^2 = n \cdot 2(\frac{t}{n})^2 = \frac{2t^2}{n}

取极限 ( L2L^2 收敛)当分割数 nn \to \infty 时:

Var[Qn]=2t20Var[Q_n] = \frac{2t^2}{\infty} \to 0

结论:虽然 QnQ_n 是一个随机变量,但随着切分越来越细,它的方差趋于 0,而均值稳定在 tt 。这意味着,在概率意义下(均方收敛):

limn(ΔWi)2=t\lim_{n \to \infty} \sum (\Delta W_i)^2 = t

3.3. 伊藤引理 (Itô’s Lemma)

证明了 (dW)2=dt(dW)^2 = dt ,就可以推导 SDE 的链式法则了。假设有一个随机过程 XtX_t ,满足 SDE:

dXt=μdt+σdWtdX_t = \mu dt + \sigma dW_t

我们要看它的函数 f(Xt)f(X_t) 是怎么演化的。

  1. 泰勒展开

    我们将 f(Xt+dXt)f(X_t + dX_t)XtX_t 处展开:

df=f(Xt)dXt+12f(Xt)(dXt)2+16f(Xt)(dXt)3+df = f'(X_t)dX_t + \frac{1}{2}f''(X_t)(dX_t)^2 + \frac{1}{6}f'''(X_t)(dX_t)^3 + \dots
  1. 代入 dX_t 并扔掉高阶项

    dXt=μdt+σdWdX_t = \mu dt + \sigma dW 代入 (dXt)2(dX_t)^2 这一项:

(dXt)2=(μdt+σdWt)2=μ2(dt)2+2μσ(dt)(dWt)+σ2(dWt)2=σ2dt\begin{aligned} (dX_t)^2 &= (\mu dt + \sigma dW_t)^2 \\ &= \mu^2 (dt)^2 + 2\mu\sigma (dt)(dW_t) + \sigma^2 (dW_t)^2 \\ &= \sigma^2 dt \end{aligned}
  1. 得到伊藤公式把这个结果放回泰勒展开式,忽略更高阶项:df(Xt)=f(Xt)dXt+12f(Xt)(σ2dt)df(X_t) = f'(X_t)dX_t + \frac{1}{2}f''(X_t)(\sigma^2 dt)整理一下,把 dXtdX_t 展开,按 dtdtdWtdW_t 分组,最终得到:
df(Xt)=(μf(Xt)+12σ2f(Xt))dt+σf(Xt)dWt\boxed{df(X_t) = \left( \mu f'(X_t) + \frac{1}{2}\sigma^2 f''(X_t) \right) dt + \sigma f'(X_t) dW_t}

解释:

  • 路径是分形的: (dWt)2=dt(dW_t)^2 = dt 说明布朗运动的路径有着“无限的长度,但有限的二次变分”。如果你去量布朗运动曲线的长度,你会发现它是无穷大。它在任何微小的尺度上都在剧烈震荡。
  • 凸性带来漂移 (Jensen 不等式):伊藤修正项 12σ2f(Xt)\frac{1}{2}\sigma^2 f''(X_t) 本质上反映了函数的凸性 (Convexity)。

3.4. 伊藤积分 (Itô Calculus) vs 斯特拉托诺维奇积分 (Stratonovich Calculus)

在物理模型中一般认为不存在真正的白噪声,现实中的噪声都有一个极短的(非零的)相关时间 τ\tau (Colored Noise)。如果我们先把噪声当成光滑的(有相关性的),取区间的中点用普通微积分算,然后让 τ0\tau \to 0 取极限,得到的结果就是 Stratonovich 形式。3.3用泰勒展开的推导隐藏了取左端点的前提,直接得到了伊藤积分。这里就展开不细说了。

伊藤积分 (Itô Calculus)

  • 取点规则: 取区间的左端点(过去的值)。
  • 特点: 具有非预见性 (Non-anticipating)。这一刻的决策只依赖于过去的信息,不知道未来。
  • 优点: 数学性质极好,计算期望值方便(鞅性质)。
  • 领域: 金融学的首选(买股票不能看明天的价格)。

斯特拉托诺维奇积分 (Stratonovich Calculus)

  • 取点规则: 取区间的中点。
  • 特点: 它看起来依然保留了传统微积分的链式法则(没有那个奇怪的伊藤修正项)。
  • 优点: 在物理上更“真实”。
  • 领域: 物理学的首选。

两种噪声类型:

  • 情况一:加性噪声 (Additive Noise)

    方程形式:

    dXt=γXtdt+σ常数dWtdX_t = -\gamma X_t dt + \underbrace{\sigma}_{\text{常数}} dW_t

    这里的噪声系数 σ\sigma 是一个常数(或者只与时间 tt 有关,与 XX 无关)。根据转换公式,漂移修正项是 12σσ=0\frac{1}{2}\sigma' \sigma = 0 。结论: 对于加性噪声,Itô 和 Stratonovich 是一样的。爱因斯坦和郎之万当年不用纠结这个问题,就是因为他们处理的主要是这种情况。

  • 情况二:乘性噪声 (Multiplicative Noise)

    这是复杂系统(如湍流、种群动力学、金融、活性物质)中常见的情况。方程形式:

    dXt=f(Xt)dt+g(Xt)依赖位置dWtdX_t = f(X_t) dt + \underbrace{g(X_t)}_{\text{依赖位置}} dW_t

    这里的噪声强度取决于系统的状态 XtX_t 。比如:如果你在一个充满障碍物的环境里游泳,你在空旷处受到的扰动大,在狭窄处受到的扰动小。你的 g(X)g(X) 是变化的。此时 g(X)0g'(X) \neq 0 。修正项 12g(X)g(X)0\frac{1}{2}g'(X)g(X) \neq 0 。这时候,两者的物理预测会不同。

3.5. 分布(Distributions)意义

白噪声 ξ(t)\xi(t) 严格来说不是普通函数,所以 dW/dt\mathrm{d}W/\mathrm{d}t 在常规意义下不存在。但是可以将 ξ(t)\xi(t) 定义为一种作用在测试函数上的线性泛函:

0Tϕ(t)ξ(t) ⁣dt:=0Tϕ(t) ⁣dWt\int_0^T\phi(t)\xi(t)\,\mathop{}\!\mathrm{d}t := \int_0^T\phi(t)\,\mathop{} \!\mathrm{d}W_t

这里 ϕ(t)\phi(t) 是任意“测试函数”(平滑可积函数)。

从这个角度重写 SDE之前的微分形式:

dXt=μ(Xt)dt+σ(Xt)dWtdX_t = \mu(X_t) dt + \sigma(X_t) dW_t

现在两边同时除以 dtdt (在广义函数意义下):

dXtdt=μ(Xt)+σ(Xt)ξ(t)\frac{dX_t}{dt} = \mu(X_t) + \sigma(X_t) \cdot \xi(t)

这就是郎之万最开始写下的方程。(还得是这样看着舒服)

但是分布乘积在数学上是定义不良 (Ill-defined) 的。Itô 和 Stratonovich 其实就是对 “如何定义这个乘积” 给出的两种不同规则。

4. 扩散方程

现在从介观回到宏观尺度。可以由SDE推出福克-普朗克方程 (Fokker-Planck Equation, FPE)。

核心映射关系

  • SDE (微观/拉格朗日视角): 描述一个粒子怎么走。

    dXt=μ(Xt)dt+σ(Xt)dWtdX_t = \mu(X_t) dt + \sigma(X_t) dW_t
  • FPE (宏观/分布/欧拉视角):
    描述这群粒子在 tt 时刻出现在位置 xx 的概率密度 p(x,t)p(x,t) 怎么变。

p(x,t)t=x[μ(x)p(x,t)]漂移/对流项+122x2[σ2(x)p(x,t)]扩散项\frac{\partial p(x,t)}{\partial t} = \underbrace{-\frac{\partial}{\partial x}[\mu(x)p(x,t)]}_{\text{漂移/对流项}} + \underbrace{\frac{1}{2}\frac{\partial^2}{\partial x^2}[\sigma^2(x)p(x,t)]}_{\text{扩散项}}

4.1. 福克-普朗克方程 (Fokker-Planck Equation, FPE)

推导如下:

任取一个紧支集的 f(Xt)f(X_t) ,根据伊藤引理:

df(Xt)=(μ(Xt)f(Xt)+12σ(Xt)2f(Xt))dt+σ(Xt)f(Xt)dWt(更一般的情况可以写为μ(Xt,t)σ(Xt,t)df(X_t) = \left( \mu(X_t) f'(X_t) + \frac{1}{2}\sigma(X_t)^2 f''(X_t) \right) dt + \sigma(X_t) f'(X_t) dW_t \\ (更一般的情况可以写为\mu(X_t,t)和\sigma(X_t,t))

求期望:

dE[f(Xt)]=E[μ(Xt)f(Xt)+12σ(Xt)2f(Xt)]dt+E[σ(Xt)f(Xt)dWt]\mathrm{d}\mathbb{E}[f(X_t)]=\mathbb{E}[\mu(X_t) f'(X_t) + \frac{1}{2}\sigma(X_t)^2 f''(X_t)]\mathrm{d}t+\mathbb{E}[\sigma(X_t) f'(X_t) dW_t]

其中,随机项的期望为0,因为根据塔式性质 (Tower Property):

E[f(Xt)ΔWt]=E[E[f(ti)(Wti+1Wti)Fti]]=E[f(ti)E[(Wti+1Wti)Fti]]=E[f(ti)0]   (独立增量性)=0\begin{aligned} \mathbb{E}[f(X_t) \Delta W_t]&=\mathbb{E}\left[\,\mathbb{E}[f(t_i)\cdot(W_{t_{i+1}}-W_{t_i})\mid\mathcal{F_{t_i}}]\,\right] \\ &= \mathbb{E}\left[\,f(t_i)\cdot\mathbb{E}[(W_{t_{i+1}}-W_{t_i})\mid\mathcal{F_{t_i}}]\,\right] \\ &= \mathbb{E}\left[\,f(t_i)\cdot0\,\right] ~~~(独立增量性)\\ &= 0 \end{aligned}

因此去掉随机项:

ddtE[f(Xt)]=E[μ(Xt)f(Xt)+12σ(Xt)2f(Xt)]ddtf(x)ρ(x,t) ⁣dx=[μ(x)f(x)+12σ(x)2f(x)]ρ(x,t) ⁣dxf(x)tρ(x,t) ⁣dx=[μ(x)f(x)+12σ(x)2f(x)]ρ(x,t) ⁣dx(f,g):=f(x)g(x)dx(tρ(,t),f)=(μρ(,t),f)+(12σ()2ρ(,t),f)由于紧支集(tρ(,t),f)=(x[μρ(,t)],f)+(122x2[σ()2ρ(,t)],f)由于f是任意函数tρ(x,t)=x[μ(x)ρ(x,t)]+122x2[σ(x)2ρ(x,t)]\begin{aligned} &\frac{\mathrm{d}}{\mathrm{d}t}\mathbb{E}[f(X_t)]=\mathbb{E}[\mu(X_t) f'(X_t) + \frac{1}{2}\sigma(X_t)^2 f''(X_t)] \\ &\Longleftrightarrow \frac{\mathrm{d}}{\mathrm{d}t}\int f(x) \rho(x,t)\,\mathop{}\!\mathrm{d}x = \int [\mu(x) f'(x) + \frac{1}{2}\sigma(x)^2 f''(x)] \rho(x,t)\,\mathop{}\!\mathrm{d}x \\ &\Longleftrightarrow \int f(x) \frac{\partial}{\partial t}\rho(x,t)\,\mathop{}\!\mathrm{d}x = \int [\mu(x) f'(x) + \frac{1}{2}\sigma(x)^2 f''(x)] \rho(x,t)\,\mathop{}\!\mathrm{d}x \\ &\xLeftrightarrow{(f,g):=\int f(x) g(x) dx} \left(\frac{\partial}{\partial t}\rho(\cdot,t),f\right) = \left(\mu\rho(\cdot,t),f'\right)+\left(\frac{1}{2}\sigma(\cdot)^2\rho(\cdot,t),f''\right)\\ &\xLeftrightarrow{由于紧支集} \left(\frac{\partial}{\partial t}\rho(\cdot,t),f\right) = \left(-\frac{\partial}{\partial x}[\mu\rho(\cdot,t)],f\right)+\left(\frac{1}{2}\frac{\partial^2}{\partial x^2}[\sigma(\cdot)^2\rho(\cdot,t)],f\right) \\ &\xLeftrightarrow{由于f是任意函数} \frac{\partial}{\partial t}\rho(x,t) = -\frac{\partial}{\partial x}[\mu(x)\rho(x,t)]+\frac{1}{2}\frac{\partial^2}{\partial x^2}[\sigma(x)^2\rho(x,t)] \end{aligned}

4.2. 概率流 (Probability Current)

FPE 本质上是一个 连续性方程 (Continuity Equation),体现了概率守恒(粒子不会凭空消失)。可以将方程改写为:

pt+Jx=0\frac{\partial p}{\partial t} + \frac{\partial J}{\partial x} = 0

其中 J(x,t)J(x,t) 是概率流密度:

J(x,t)=μ(x,t)p(x,t)x(σ2(x,t)2p(x,t))J(x,t) = \mu(x,t)p(x,t) - \frac{\partial}{\partial x}\left( \frac{\sigma^2(x,t)}{2} p(x,t) \right)

直觉: 总通量 = 随波逐流带来的通量 ( μp\mu p ) + 浓度梯度导致的扩散通量 (菲克定律项)。

4.3. 稳态解与玻尔兹曼分布

当时间 tt \to \infty ,系统达到热平衡(稳态),分布不再变化,即 pt=0\frac{\partial p}{\partial t} = 0 。这意味着概率流 JJ 为常数。对于封闭系统(两端无穷远概率为0), J=0J=0

γ\gamma 很大(或质量 m0m \to 0 )时,惯性项 mv˙m\dot{v} 被忽略,可以得到过阻尼朗之万方程(忽略惯性项 mx¨m\ddot{x} ,近似为 0=γx˙U(x)+ξ0 = -\gamma \dot{x} - U'(x) + \xi ),做一个简单的变量替换(同第二大节作比较),就可以得到玻尔兹曼分布:

p(x)=NeU(x)kBTp(x)=\mathcal{N}e^{-\frac{U(x)}{k_{\mathrm{B}}T}}

对于完整的朗之万方程,

{dxdt=vmdvdt=γvU(x)+ξ(t)\begin{cases} \frac{\mathrm{d}x}{\mathrm{d}t} = v \\ m\frac{\mathrm{d}v}{\mathrm{d}t} = -\gamma v - U'(x) + \xi(t) \end{cases}

可以推出麦克斯韦-玻尔兹曼分布 (Maxwell-Boltzmann Distribution):

peq(x,v)=Z1exp(E(x,v)kBT)=Z1exp(mv22kBT)麦克斯韦速度分布exp(U(x)kBT)玻尔兹曼位置分布p_{eq}(x, v) = \mathcal{Z}^{-1} \exp\left( -\frac{E(x,v)}{k_B T} \right) = \mathcal{Z}^{-1} \underbrace{\exp\left( -\frac{mv^2}{2k_B T} \right)}_{\text{麦克斯韦速度分布}} \cdot \underbrace{\exp\left( -\frac{U(x)}{k_B T} \right)}_{\text{玻尔兹曼位置分布}}

推导如下:

4.3.1. 构建二维相空间动力学 (Langevin Equation)

对于一个完整的(包含惯性)粒子,状态由位置 xx 和速度 vv 共同决定。朗之万方程写作一个一阶微分方程组:

{dx=vdtmdv=[γvU(x)]确定性力dt+2γkBT噪声强度 σ0dWt\begin{cases} \mathrm{d}x = v \,\mathrm{d}t \\ m\mathrm{d}v = \underbrace{[-\gamma v - U'(x)]}_{\text{确定性力}} \mathrm{d}t + \underbrace{\sqrt{2\gamma k_B T}}_{\text{噪声强度 } \sigma_0} \mathrm{d}W_t \end{cases}

为了套用通用的 SDE 形式 dX=μdt+σdW\mathrm{d}\mathbf{X} = \boldsymbol{\mu} \mathrm{d}t + \boldsymbol{\sigma} \mathrm{d}\mathbf{W} ,我们定义状态向量 X=[xv]\mathbf{X} = \begin{bmatrix} x \\ v \end{bmatrix} 。方程组改写为:

d[xv]=[vγmv1mU(x)]漂移向量 μdt+[02γkBTm]扩散向量 σdWt\mathrm{d} \begin{bmatrix} x \\ v \end{bmatrix} = \underbrace{\begin{bmatrix} v \\ -\frac{\gamma}{m} v - \frac{1}{m}U'(x) \end{bmatrix}}_{\text{漂移向量 } \boldsymbol{\mu}} \mathrm{d}t + \underbrace{\begin{bmatrix} 0 \\ \frac{\sqrt{2\gamma k_B T}}{m} \end{bmatrix}}_{\text{扩散向量 } \boldsymbol{\sigma}} \mathrm{d}W_t

注意:位置 xx 的演化是完全确定的( dx=vdt\mathrm{d}x = v \mathrm{d}t ),没有直接受到噪声冲击,所以扩散向量的第一项是 0。速度 vv 受到噪声冲击,系数除以了质量 mm

4.3.2. 多维福克-普朗克方程 (Multidimensional FPE)

对于多维 SDE dXi=μidt+jσijdWj\mathrm{d}X_i = \mu_i \mathrm{d}t + \sum_j \sigma_{ij} \mathrm{d}W_j ,其对应的 FPE 为:

pt=ixi(μip)+12i,j2xixj(Dijp)\frac{\partial p}{\partial t} = -\sum_i \frac{\partial}{\partial x_i} (\mu_i p) + \frac{1}{2} \sum_{i,j} \frac{\partial^2}{\partial x_i \partial x_j} (D_{ij} p)

其中扩散张量 Dij=(σσT)ijD_{ij} = (\boldsymbol{\sigma}\boldsymbol{\sigma}^T)_{ij} 。在本例中,扩散张量 D\mathbf{D} 为:

D=[02γkBTm][02γkBTm]=[0002γkBTm2]\mathbf{D} = \begin{bmatrix} 0 \\ \frac{\sqrt{2\gamma k_B T}}{m} \end{bmatrix} \begin{bmatrix} 0 & \frac{\sqrt{2\gamma k_B T}}{m} \end{bmatrix} = \begin{bmatrix} 0 & 0 \\ 0 & \frac{2\gamma k_B T}{m^2} \end{bmatrix}

可以看到,只有 vvv-v 分量有扩散项。

4.3.3. Klein-Kramers 方程 (Klein-Kramers Equation)

μ\boldsymbol{\mu}D\mathbf{D} 代入 FPE 公式,我们得到描述概率密度 p(x,v,t)p(x, v, t) 演化的方程:

pt=x(vp)+1mv(U(x)p)哈密顿/可逆部分+γmv(vp)+γkBTm22pv2耗散+涨落/不可逆部分\frac{\partial p}{\partial t} = \underbrace{-\frac{\partial}{\partial x}(v p) + \frac{1}{m}\frac{\partial}{\partial v}(U'(x) p)}_{\text{哈密顿/可逆部分}} + \underbrace{\frac{\gamma}{m}\frac{\partial}{\partial v}(v p) + \frac{\gamma k_B T}{m^2}\frac{\partial^2 p}{\partial v^2}}_{\text{耗散+涨落/不可逆部分}}

这个方程就叫 Klein-Kramers 方程。物理意义非常清晰,它被拆分成了两部分:

  • 前两项(无 γ\gamma ):对应经典的哈密顿力学演化(Liouville Equation)。如果你令 γ=0\gamma=0 (无摩擦无噪声),概率流就像不可压缩流体一样在相空间流动,熵不变。
  • 后两项(含 γ\gamma ):对应耗散和布朗运动。正是这两项负责把系统带向热平衡。

4.3.4. 验证稳态解 (Stationary Solution)

我们想证明当 tt \to \infty 时, pt=0\frac{\partial p}{\partial t} = 0 的解就是 麦克斯韦-玻尔兹曼分布:

peq(x,v)=Z1exp[1kBT(12mv2+U(x))]p_{eq}(x, v) = \mathcal{Z}^{-1} \exp\left[ -\frac{1}{k_B T} \left( \frac{1}{2}mv^2 + U(x) \right) \right]

为了方便求导,记总能量 H(x,v)=12mv2+U(x)H(x,v) = \frac{1}{2}mv^2 + U(x) ,则 peqeβHp_{eq} \propto e^{-\beta H} (其中 β=1kBT\beta = \frac{1}{k_B T} )。利用链式法则,我们有:

  • peqx=βHxpeq=βU(x)peq\frac{\partial p_{eq}}{\partial x} = -\beta \frac{\partial H}{\partial x} p_{eq} = -\beta U'(x) p_{eq}
  • peqv=βHvpeq=β(mv)peq\frac{\partial p_{eq}}{\partial v} = -\beta \frac{\partial H}{\partial v} p_{eq} = -\beta (mv) p_{eq}

我们将这些代入 Klein-Kramers 方程的右边,看是否每一部分都消掉了。

第一部分:哈密顿项(可逆流)

vpx+U(x)mpv= v[βU(x)p]+U(x)m[βmvp]= βvU(x)pβvU(x)p= 0\begin{aligned} & -v \frac{\partial p}{\partial x} + \frac{U'(x)}{m} \frac{\partial p}{\partial v} \\ =~& -v \left[ -\beta U'(x) p \right] + \frac{U'(x)}{m} \left[ -\beta mv p \right] \\ =~& \beta v U'(x) p - \beta v U'(x) p \\ =~& 0 \end{aligned}

这验证了经典的哈密顿动力学本身就能维持能量守恒分布(Liouville 定理)。位置导致的漂移和速度导致的漂移完美抵消。

第二部分:Langevin 项(耗散+扩散)

这部分形式上看起来就是关于速度 vv 的一个一维 FPE。我们把它提取出来:

Ldissp=γm[v(vp)+kBTm2pv2]\mathcal{L}_{diss} p = \frac{\gamma}{m} \left[ \frac{\partial}{\partial v}(v p) + \frac{k_B T}{m} \frac{\partial^2 p}{\partial v^2} \right]

这看起来很像前面推导过的过阻尼 FPE。我们把 v\frac{\partial}{\partial v} 提出来:

Ldissp=γmv[vp+kBTmpv]\mathcal{L}_{diss} p = \frac{\gamma}{m} \frac{\partial}{\partial v} \left[ v p + \frac{k_B T}{m} \frac{\partial p}{\partial v} \right]

peqp_{eq} 的导数 peqv=mvkBTpeq\frac{\partial p_{eq}}{\partial v} = -\frac{mv}{k_B T} p_{eq} 代入中括号内:

[]=vpeq+kBTm(mvkBTpeq)=vpeqvpeq=0\begin{aligned} [\dots] &= v p_{eq} + \frac{k_B T}{m} \left( -\frac{m v}{k_B T} p_{eq} \right) \\ &= v p_{eq} - v p_{eq} \\ &= 0 \end{aligned}

括号内为 0,这说明在稳态下,速度空间中的概率流(Probability Current in v-space)消失了。结论既然哈密顿部分之和为 0,耗散扩散部分之和也为 0,那么:

peqt=0\frac{\partial p_{eq}}{\partial t} = 0

证毕。

这解释了为什么最终分布可以写成 P(x)×P(v)P(x) \times P(v) 的形式:因为耗散项只作用在 vv 上,它驱使速度分布趋向于高斯分布(麦克斯韦分布);而哈密顿项负责混合 xxvv ,确保 xx 分布也要符合由温度 TT 决定的玻尔兹曼因子。

布朗运动(Brownian motion)、随机微分方程(SDE)与扩散方程

https://psu.monster/post/2025/5684a2739062

作者

psu

发布于

2025-11-26

更新于

2025-11-27

许可协议

评论

Your browser is out-of-date!

Update your browser to view this website correctly.&npsb;Update my browser now

×