跳转至

CNN 识别量子相变

CNN 不只用于自然图像,也可以用于量子多体构型数据。核心思想是:

把 Monte Carlo 构型看成图像或多通道图像,让 CNN 自动学习相结构。

为什么 CNN 适合格点构型

卷积层利用局部结构:

\[ y_{c,h,w} = \sum_{c',u,v} K_{c,c',u,v} x_{c',h+u,w+v}. \]

如果物理构型定义在空间格点上,局域关联、畴结构、缺陷和涨落都可以表现为空间模式。CNN 可以从这些模式中学习区分不同相。

QMC 构型

量子 Monte Carlo 可能生成 \((d+1)\) 维构型:

空间维度 + 虚时间维度

例如:

\[ \alpha(x,y,\tau). \]

直接把完整时空构型输入网络通常很大,因此需要压缩。

视频式压缩

一种做法是把虚时间方向看成视频帧:

  1. 保留初始切片 \(|\alpha(0)\rangle\)
  2. 将虚时间分成 \(N\) 段。
  3. 保存相邻切片差:
\[ \Delta|\alpha_i\rangle = |\alpha(\tau_{i+1})\rangle - |\alpha(\tau_i)\rangle. \]

最终得到 \(N+1\) 个通道,作为 CNN 输入。

网络结构

典型结构:

多通道构型
  -> Conv
  -> activation
  -> Conv
  -> flatten
  -> Linear
  -> Linear
  -> softmax

两相分类时输出两个概率:

\[ (P_1,P_2), \qquad P_1+P_2=1. \]

三相分类时输出三个概率。

Bose-Hubbard 模型

一个典型例子是 Bose-Hubbard 模型:

\[ H = -t\sum_{\langle i,j\rangle} (b_i^\dagger b_j+h.c.) + {U\over2}\sum_i n_i(n_i-1). \]

\(t/U\) 控制 hopping 和相互作用强度。体系可以发生 Mott 绝缘体到超流体的相变。

CNN 可以在深处两相的数据上训练,然后扫过参数区域。若输出概率在临界点附近快速变化,说明网络捕捉到了相变特征。

未知中间相

如果只用两个端点相训练,测试时中间区域可能出现模型“不确定”:

\[ P_1\approx P_2. \]

这不一定是坏事。它可能提示存在未训练过的中间相,例如超固体相。

拓扑量回归

CNN 也可以做回归,例如预测 winding number:

\[ W^2=W_x^2+W_y^2. \]

这说明 CNN 不只学局部图像特征,也可能通过多层卷积和全连接层提取非局域信息。

与传统方法比较

方法 特点 是否需要人工序参量
传统物理分析 明确、可解释 通常需要
PCA 线性、简单 不一定
CNN 非线性、自动提取局域模式 不一定

CNN 的价值不是替代物理理解,而是作为特征探测器,帮助发现构型数据中的模式。