CNN 识别量子相变¶

CNN 不只用于自然图像，也可以用于量子多体构型数据。核心思想是：

把 Monte Carlo 构型看成图像或多通道图像，让 CNN 自动学习相结构。

为什么 CNN 适合格点构型¶

卷积层利用局部结构：

\[ y_{c,h,w} = \sum_{c',u,v} K_{c,c',u,v} x_{c',h+u,w+v}. \]

如果物理构型定义在空间格点上，局域关联、畴结构、缺陷和涨落都可以表现为空间模式。CNN 可以从这些模式中学习区分不同相。

量子 Monte Carlo 可能生成 \((d+1)\) 维构型：

空间维度 + 虚时间维度

例如：

\[ \alpha(x,y,\tau). \]

直接把完整时空构型输入网络通常很大，因此需要压缩。

一种做法是把虚时间方向看成视频帧：

\[ \Delta|\alpha_i\rangle = |\alpha(\tau_{i+1})\rangle - |\alpha(\tau_i)\rangle. \]

最终得到 \(N+1\) 个通道，作为 CNN 输入。

典型结构：

多通道构型
  -> Conv
  -> activation
  -> Conv
  -> flatten
  -> Linear
  -> Linear
  -> softmax

两相分类时输出两个概率：

\[ (P_1,P_2), \qquad P_1+P_2=1. \]

三相分类时输出三个概率。

一个典型例子是 Bose-Hubbard 模型：

\[ H = -t\sum_{\langle i,j\rangle} (b_i^\dagger b_j+h.c.) + {U\over2}\sum_i n_i(n_i-1). \]

\(t/U\) 控制 hopping 和相互作用强度。体系可以发生 Mott 绝缘体到超流体的相变。

CNN 可以在深处两相的数据上训练，然后扫过参数区域。若输出概率在临界点附近快速变化，说明网络捕捉到了相变特征。

如果只用两个端点相训练，测试时中间区域可能出现模型“不确定”：

\[ P_1\approx P_2. \]

这不一定是坏事。它可能提示存在未训练过的中间相，例如超固体相。

CNN 也可以做回归，例如预测 winding number：

\[ W^2=W_x^2+W_y^2. \]

这说明 CNN 不只学局部图像特征，也可能通过多层卷积和全连接层提取非局域信息。

CNN 的价值不是替代物理理解，而是作为特征探测器，帮助发现构型数据中的模式。