跳转至

Mermin-Wagner 定理

Mermin-Wagner 定理说明了低维系统中连续对称性和长程有序之间的张力。它最常见的表述是:

对于具有短程相互作用、连续对称性的体系,在 \(d\le 2\) 维、有限温度下,连续对称性不能自发破缺。

更具体地说,二维各向同性 Heisenberg 模型、二维连续 \(O(N)\) 模型、二维 Bose 系统中的全局 \(U(1)\) 对称性,都不能在有限温度下出现真正的连续对称性破缺长程序。这个结论背后的物理原因是:低维系统里的长波 Goldstone 模涨落太强,会把试图形成的有序方向冲散。

它不排除所有相变。二维 Ising 模型可以有有限温相变,因为 Ising 是离散 \(\mathbb Z_2\) 对称性;二维 XY 模型可以有 BKT 相变,因为低温相没有真正长程序,而是准长程序。

Goldstone 模的物理图像

Mermin-Wagner 定理的直观核心是 Goldstone 模。若一个连续全局对称性发生自发破缺,基态不是孤立的一个点,而是一整族连续等价的方向。系统可以沿着这族等价方向缓慢转动,几乎不需要能量。这个软方向对应的低能激发就是 Goldstone 模。

以 XY 模型为例,低温下局域自旋方向可以写成角度场

\[ \theta(x). \]

整体把所有角度同时平移

\[ \theta(x)\to\theta(x)+\theta_0 \]

不改变能量。若角度只在空间中非常缓慢地变化,能量代价来自梯度:

\[ H_{\rm sw} \simeq \frac{\rho_s}{2} \int d^dx\,(\nabla\theta)^2. \]

因此长波模式的能量随动量 \(k\) 变小而迅速降低。傅里叶空间中,每个模式的涨落量级为

\[ \langle |\theta_k|^2\rangle \sim \frac{T}{\rho_s k^2}. \]

这说明 \(k\to0\) 的模式非常容易被热涨落激发。维度越低,小 \(k\) 模式的相空间越少,但每个模式的涨落越强;二者竞争后,红外积分

\[ \int\frac{d^dk}{k^2} \]

\(d\le2\) 发散。也就是说,试图建立的全局有序方向会被长波角度涨落不断扭曲,最终无法在热力学极限中保持非零磁化。

这个图像也解释了为什么离散对称性不同。Ising 低温相只有两个离散真空,不能在两个真空之间做任意小的连续转动。低能涨落不是无质量的角度波,而是 domain wall 或局域翻转,通常有有限能量代价。因此二维 Ising 不受 Mermin-Wagner 定理限制,可以有真正长程序。

Goldstone 与 Higgs 的一句区分

有时会听到 Goldstone 模和 Higgs 机制一起出现。这里需要区分全局对称性和局域规范对称性。

连续全局对称性,自发破缺会产生独立的无质量 Goldstone 模。例如普通 XY 或 Heisenberg 磁体的低温自旋波,就是这种意义下的软模式。

局域规范对称性,情况不同。Goldstone 自由度会被规范场吸收,成为规范场的纵向分量,使规范玻色子获得质量;剩下的振幅方向可能对应 Higgs 模。严格说,不是 Goldstone 模“自己变重”,而是它不再作为独立低能激发出现。

本节讨论的 Mermin-Wagner 定理针对的是短程相互作用、低维、连续 全局 对称性体系。因此这里真正起作用的是无质量 Goldstone 模带来的红外涨落。

3D XY 与 3D Ising 的低温关联函数

三维中,连续对称性可以在有限温下自发破缺,因为

\[ \int\frac{d^3k}{k^2} \]

在红外端不发散。此时 XY 和 Ising 都可以有低温长程序,但它们的连通关联函数仍然不同。

对 3D XY 低温相,完整关联函数趋向于有序分量:

\[ G(r)=\langle \mathbf S(r)\cdot\mathbf S(0)\rangle \to m^2. \]

减去常数背景后,连通关联函数仍会有 Goldstone 模带来的幂律尾巴:

\[ G_c(r) =G(r)-m^2 \sim \frac{1}{r^{d-2}} = \frac{1}{r} \qquad (d=3). \]

动量空间中对应

\[ \chi_k\sim \frac{1}{k^2}, \qquad k\to0. \]

有限尺寸系统中最小非零动量 \(k_{\min}\sim 2\pi/L\),所以低温 Goldstone 模会使最低动量响应出现

\[ \chi_{k_{\min}}\sim L^2 \]

这样的强尺寸依赖。

对 3D Ising 低温相,离散对称性破缺后没有 Goldstone 模。连通关联函数一般是指数衰减:

\[ G_c(r)\sim \frac{e^{-r/\xi}}{r^{(d-1)/2}} \]

或在粗略讨论中写作指数衰减。它同样有

\[ G(r)\to m^2, \]

但减去 \(m^2\) 后没有连续对称性带来的长程幂律尾巴。

这点对 Monte Carlo 很实用。若低温相有连续对称性,看到小动量结构因子或低 \(k\) susceptibility 随 \(L\) 明显增长,并不一定表示还在临界点;它可能只是 Goldstone 模的普通低温效应。离散对称性模型中,这类低温红外增强通常不会以同样方式出现。

从随机行走回返看低维涨落

还有一个有用的直觉:Mermin-Wagner 定理中的红外发散,和随机行走在低维中容易回返有关。

普通随机行走在 \(d=1,2\) 中是 recurrent 的:它会不断回到原点附近;在 \(d\ge3\) 中是 transient 的:它有非零概率远离原点而不再回来。这个事实和格林函数

\[ G(r) \sim \int\frac{d^dk}{(2\pi)^d} \frac{e^{ik\cdot r}}{k^2} \]

的红外性质密切相关。

自旋波传播子也是 \(1/k^2\)。当低维随机行走反复回访同一区域时,可以直观理解为低维空间不足以“稀释”长波涨落;涨落不断累积,最终破坏连续长程序。高维中随机行走更容易逃逸,长波涨落的累计效应较弱,因此连续对称性破缺可以稳定存在。

这个类比不是严格证明,但非常有助于记忆维度边界:短程连续对称性在 \(d\le2\) 被强红外涨落破坏,而在 \(d>2\) 可以形成真正长程序。

定理说的是什么

考虑一个具有连续对称性的序参量,例如

\[ \mathbf m = \frac1V\int d^dx\,\boldsymbol\phi(x), \]

其中 \(\boldsymbol\phi\)\(O(N)\) 向量场。若连续对称性自发破缺,在热力学极限中应该存在

\[ \lim_{h\to0^+}\lim_{V\to\infty} \langle \mathbf m\rangle_h \ne 0. \]

这里 \(h\) 是用来选定方向的外场。Mermin-Wagner 定理说,在 \(d\le2\) 的短程相互作用系统中,上式对连续对称性不成立:

\[ \lim_{h\to0^+}\lim_{V\to\infty} \langle \mathbf m\rangle_h =0. \]

核心机制来自长波涨落。低维中,小动量模式的积分

\[ \int \frac{d^dk}{k^2} \]

在红外端发散。这个发散正是定理的关键。

经典版本的物理证明

先看最直观的经典版本。以二维 XY 模型为例:

\[ H=-J\sum_{\langle ij\rangle} \cos(\theta_i-\theta_j). \]

低温下相邻角度差较小,可以展开为 spin-wave 理论:

\[ H_{\rm sw} \simeq \frac{\rho_s}{2} \int d^dx\,(\nabla\theta)^2. \]

这里 \(\rho_s\) 是 stiffness。傅里叶变换后:

\[ \theta(x) = \frac1{\sqrt V}\sum_k \theta_k e^{ikx}, \]

哈密顿量变成

\[ H_{\rm sw} = \frac{\rho_s}{2}\sum_k k^2|\theta_k|^2. \]

由能均分或高斯积分可得

\[ \langle |\theta_k|^2\rangle = \frac{T}{\rho_s k^2}. \]

这说明长波模式 \(k\to0\) 的角度涨落非常大。

真正决定有序的是角度差的涨落:

\[ \langle [\theta(x)-\theta(0)]^2\rangle = \frac{2T}{\rho_s} \int\frac{d^dk}{(2\pi)^d} \frac{1-\cos(kx)}{k^2}. \]

\(d=1\) 中,这个积分随距离线性增长:

\[ \langle [\theta(x)-\theta(0)]^2\rangle \sim \frac{T}{\rho_s}|x|. \]

\(d=2\) 中,它对数增长:

\[ \langle [\theta(x)-\theta(0)]^2\rangle \sim \frac{T}{\pi\rho_s}\ln\frac{|x|}{a}. \]

若序参量写为

\[ S^+(x)=e^{i\theta(x)}, \]

那么高斯变量给出

\[ \left\langle e^{i[\theta(x)-\theta(0)]} \right\rangle = \exp\left[ -\frac12 \langle [\theta(x)-\theta(0)]^2\rangle \right]. \]

因此:

  • \(d=1\),关联函数指数衰减。
  • \(d=2\),spin-wave 理论给出代数衰减。

二维中具体为

\[ \langle S^+(x)S^-(0)\rangle \sim \left(\frac{a}{|x|}\right)^\eta, \]

其中

\[ \eta=\frac{T}{2\pi\rho_s}. \]

代数衰减意味着没有真正的常数长程极限:

\[ \lim_{|x|\to\infty} \langle S^+(x)S^-(0)\rangle =0. \]

这就排除了

\[ \langle S^+\rangle\ne0. \]

这个推导非常有启发性:先假设低温存在一个有序方向,然后研究围绕该方向的 Goldstone 涨落,最后发现低维中的长波涨落发散,导致有序本身不自洽。

一般连续对称模型的经典图像

这里讨论一般 \(O(N)\) 模型的经典图像。

\(O(N)\) 模型,若自发选择某个方向,可以把场写成纵向分量和横向 Goldstone 模:

\[ \boldsymbol\phi(x) \simeq \left( \pi_1(x),\cdots,\pi_{N-1}(x), \sqrt{m^2-\boldsymbol\pi^2(x)} \right). \]

低能有效哈密顿量为

\[ H_{\rm sw} = \frac{\rho_s}{2} \int d^dx \sum_{a=1}^{N-1} (\nabla \pi_a)^2. \]

每个横向 Goldstone 模都有传播子

\[ \langle |\pi_a(k)|^2\rangle \sim \frac{T}{\rho_s k^2}. \]

横向涨落总量为

\[ \langle \boldsymbol\pi^2\rangle \sim (N-1)\frac{T}{\rho_s} \int\frac{d^dk}{(2\pi)^d}\frac1{k^2}. \]

红外积分在 \(d\le2\) 发散。若横向涨落无限大,原先假设的固定有序方向就会被破坏。因此短程连续对称性不能在低维有限温下真正自发破缺。

Bogoliubov 不等式的证明骨架

上面的 spin-wave 推导给出物理图像。更严格的证明常用 Bogoliubov 不等式。量子形式可以写为

\[ \frac12 \langle \{A,A^\dagger\}\rangle \, \langle [[C,H],C^\dagger]\rangle \ge T \left| \langle [C,A]\rangle \right|^2. \]

这里 \(A,C\) 是可选择的算符,\(T\) 是温度。经典系统中也有对应的泊松括号版本。证明的思想是利用 Cauchy-Schwarz 不等式,把某个序参量和长波涨落联系起来。

以 Heisenberg 磁体为例,哈密顿量可写为

\[ H = -\sum_{ij}J_{ij}\mathbf S_i\cdot\mathbf S_j -h\sum_i S_i^z. \]

选择 Fourier 分量

\[ S_k^\alpha = \sum_j e^{ik r_j}S_j^\alpha. \]

合适地取

\[ C=S_k^+, \qquad A=S_{-k}^-, \]

或针对反铁磁序选择带 ordering wavevector 的版本,可以让交换子

\[ \langle [C,A]\rangle \]

与磁化或交错磁化成正比。

另一方面,双交换子

\[ \langle [[C,H],C^\dagger]\rangle \]

在小 \(k\) 下由短程交换相互作用给出

\[ \langle [[C,H],C^\dagger]\rangle \lesssim {\rm const}\times k^2 +{\rm const}\times h. \]

于是 Bogoliubov 不等式会给出类似约束:

\[ m^2 \lesssim \frac{1} { \frac1V\sum_k \frac1{k^2+h} }. \]

\(d\le2\),热力学极限中

\[ \frac1V\sum_k\frac1{k^2+h} \to \int\frac{d^dk}{(2\pi)^d}\frac1{k^2+h} \]

\(h\to0\) 时红外发散。因此右边趋于零,得到

\[ m=0. \]

这个推导的关键细节是:短程相互作用使双交换子在小 \(k\) 下最多像 \(k^2\);连续对称性使序参量和横向长波模耦合;低维中的 \(1/k^2\) 积分发散。

量子版本

量子 Mermin-Wagner 定理说:对于具有连续对称性和足够短程相互作用的量子自旋或玻色体系,在 \(d\le2\) 维、有限温度下,不能自发破缺连续对称性。

量子版本和经典版本的区别在于:

  • 经典证明直接研究热涨落。
  • 量子证明要处理非对易算符,因此常用 Bogoliubov 不等式、Duhamel 内积或反射正性等工具。

但红外机制相同。有限温量子系统在长波、低频区域仍会有强烈的横向涨落。Bogoliubov 不等式把假设的磁化强度 \(m\) 与低动量求和联系起来:

\[ m^2 \int\frac{d^dk}{(2\pi)^d} \frac1{k^2+h} \le {\rm const}. \]

\(d\le2\)\(h\to0\) 时,积分发散,所以

\[ m=0. \]

这说明有限温二维量子 Heisenberg 模型不能有真正的自发磁化或 Néel 长程序。需要注意,量子系统在 \(T=0\) 时等价于多一个虚时方向的量子临界问题,因此二维量子 Heisenberg 反铁磁体可以在零温有 Néel 序;这不违反定理,因为定理限制的是有限温。

不适用和容易误解的情况

Mermin-Wagner 定理有明确适用条件,下面几类情况需要分开看。

第一,离散对称性不受限制。二维 Ising 模型只有 \(\mathbb Z_2\) 对称性,没有 Goldstone 模,因此可以在有限温发生普通二阶相变。

第二,长程相互作用可能绕开定理。若相互作用衰减太慢,小 \(k\) 下的刚度不再给出简单 \(k^2\) 行为,红外积分结构会改变。

第三,有限尺寸系统可以看起来有序。Monte Carlo 中若 \(L\) 不够大,相关长度可能超过系统尺寸,观测量会显示很强的有序迹象。定理讨论的是热力学极限。

第四,二维 XY 模型低温相有准长程序:

\[ \langle S^+(r)S^-(0)\rangle\sim r^{-\eta}. \]

它没有真正的

\[ \langle S^+\rangle\ne0, \]

但关联函数也不是指数衰减。这正是 BKT 相变的入口。

长程相互作用版本

短程条件是 Mermin-Wagner 定理的关键。更一般地,证明常要求交换相互作用的二阶矩足够好,例如有类似

\[ \sum_r |J(r)|\,r^2<\infty \]

的收敛条件。这个条件保证小动量展开仍然由 \(k^2\) 控制,从而保留

\[ \int\frac{d^dk}{k^2} \]

这个红外发散结构。

若相互作用是幂律衰减:

\[ J(r)\sim \frac1{r^\alpha}, \]

情况会变得更细。\(\alpha\) 越大,相互作用越接近短程;\(\alpha\) 越小,远距离耦合越强,长波涨落越容易被压制。Patrick Bruno 对一维和二维 Heisenberg/XY 系统给出了强化版本:对单调递减相互作用,若

\[ \alpha\ge 2D, \]

则有限温铁磁或反铁磁长程序仍被排除;对振荡相互作用,还有不同的阈值条件。

若用长程统计物理里常见记号

\[ J(r)\sim \frac1{r^{d+\sigma}}, \]

\(\alpha=d+\sigma\)。Bruno 的单调情形条件 \(\alpha\ge2D\)\(D=d\) 时对应

\[ \sigma\ge d. \]

这和自旋波红外积分

\[ \int\frac{d^dk}{k^\sigma} \]

给出的直觉边界一致:当 \(\sigma\ge d\) 时,红外涨落仍然足够强,可以摧毁连续长程序;当 \(\sigma<d\) 时,定理不再排除长程序,具体是否有序要看模型和缺陷物理。

因此更准确的说法是:

  • 短程二维连续对称性:有限温不能真正自发破缺。
  • 衰减足够快的长程相互作用:仍可能满足 Mermin-Wagner 型排除结论。
  • 衰减足够慢的长程相互作用:定理的红外发散条件失效,低维连续对称性长程序可能出现。

这也是长程模型有趣的原因之一。它们不是简单地给短程模型加一个微扰尾巴,而是可能改变低动量传播子、红外涨落强度和相变类型。

小结

Mermin-Wagner 定理可以浓缩为一句话:

低维短程系统中,连续对称性一旦试图自发破缺,就会产生无质量 Goldstone 模;这些长波模在 \(d\le2\) 的热涨落红外发散,从而摧毁真正长程序。

经典 spin-wave 证明展示了物理机制;Bogoliubov 不等式给出更严格的控制;量子版本说明这个结论对有限温低维量子系统同样成立。