Spins, Qubits, and Linear Operators for Measurement¶
约 3032 个字 1 张图片 预计阅读时间 15 分钟
Stern-Gerlach Experiment¶
Stern-Gerlach 实验研究的是: 带有磁矩的原子束经过非均匀磁场时会如何偏转。
实验装置可以概括为:
- 先用 collimator 把银原子束压窄成一束很细的粒子流
- 再让它穿过一个沿
z方向、且强度随位置变化的非均匀磁场 - 最后原子打到玻璃探测屏上,观察落点分布
磁场通常写成
这里关键不只是有磁场,而是磁场有梯度,因此原子会受到与
相关的力,从而在 z 方向发生偏转。
如果把自旋想成一个经典小磁针,那原子束经过磁场后,按直觉似乎应该在屏上形成连续分布。
但 Stern 和 Gerlach 实际观察到的是:
- 打开电磁铁后,银原子束分裂成了两条清晰的分支
- 屏上只出现两个离散落点区域,而不是一整片连续条纹
这说明沿 z 方向测量时,自旋只给出两个离散结果,通常记作:
或者对应地理解为“spin up / spin down”。
如果把第一台仪器后的探测屏拿掉,只保留其中一束,再把它送入第二台同样沿 z 方向的 Stern-Gerlach 仪器中,结果是:
-
光束不会再次分裂
-
它只会沿原来的那一支继续前进
这表示第一次测量之后,粒子已经被制备到了某个确定的 z 方向自旋本征态中。对同一方向重复测量,结果是确定的。
如果把第二台仪器旋转,让磁场梯度改为沿 x 方向,情况就不同了:
-
原来从
z方向筛出来的单束原子,进入第二台后会再次分裂成两束 -
且这两束的强度相等
也就是说,一个确定的 $|+z\rangle$ 态,在 x 方向测量时会得到两个结果,概率各为 1/2。
这可以记成
这正是量子态叠加的典型表现。
如果自旋只是经典意义下“只有两个值”的量,那我们可能会把它理解为一个集合,例如 {0,1}。这种描述只具有布尔逻辑,无法解释:
-
为什么同方向重复测量不再分裂
-
为什么换一个测量方向后又会重新分裂
-
为什么两个输出束恰好是等强的
因此,自旋不是经典 bit。
更合适的描述是:
-
自旋态属于一个二维复向量空间 \(\mathbb{C}^2\)
-
\(|+z\rangle, |-z\rangle\) 可以看成这空间中的一组基
-
\(|+x\rangle, |-x\rangle\) 是另一组基
-
同一个态在不同基下展开系数不同,于是对应不同测量结果的概率分布
所以每个自旋 1/2 系统都可以编码一个 qubit。
可以把经典 bit 的两个状态表示成二维空间中的两个正交单位向量:
对经典 bit 来说,系统只能处在 \(|0\rangle\) 或 \(|1\rangle\) 之一,不会同时处在两者的叠加态里。但在量子力学中,这两个态可以叠加,于是我们把它们提升为 $ \mathbb{C}^2 $中的一组基。
因此一个一般的 qubit 状态可以写成
并满足归一化条件
这里的归一化来自概率解释: 测到 \(|0\rangle\) 与 \(|1\rangle\) 的概率之和必须为 1。
同一个态也常写成
这里多乘上一个\(e^{i\phi}\)不改变模长,因为\(|e^{i\phi}|=1\)。因此,我们可以把一个 qubit 的状态用 Bloch 球面上的一个点来表示,其中 \(\theta\) 是极角, \(\phi\) 是方位角。
这样就能把一个纯态表示成 Bloch 球面上的一个点。
为什么是 \(\theta/2\) 而不是 \(\theta\)
这样写可以保证 \(|0\rangle\) 与 \(|1\rangle\) 之间的相对相位只由 \(\phi\) 参数控制。如果直接写成 \(\cos\theta |0\rangle + e^{i\phi}\sin\theta |1\rangle\),那么 \(( \theta,\phi )\) 与 \(( \pi-\theta,\pi+\phi )\) 会只差一个整体相位 \(e^{i\pi}=-1\),从而对应同一个量子态,这样映射就不是一一对应了。
需要注意的是, Bloch 球上的几何表示并不直接保持正交关系。例如
但在 Bloch 球上, \(|0\rangle\) 和 \(|1\rangle\) 只是被画成方向相反的两个单位向量。
Linear Operators and Matrices¶
这里直接给出几条结论:
-
矩阵是测量的工具,它是一个线性算子。
-
矩阵的特征值就是测量结果
-
矩阵的特征向量就是测量后粒子坍缩到的状态
在线性代数里,一个算子本质上就是“把向量映射到另一个向量的规则”。如果这个规则记作 \(A\),那么
表示它把向量空间 \(V\) 中的一个态映射到另一个态。
所谓线性,就是它必须满足:
也就是说,先做线性组合再作用算子,和先分别作用再线性组合,结果一样。
这件事很重要,因为量子态本身允许叠加。如果算子不保持线性,那它就没法和量子叠加原理兼容。
在量子力学中,我们特别关注厄米算子(Hermitian operator)。一个算子 \(A\) 是厄米的,如果它满足
这里 \(A^\dagger\) 是 \(A\) 的共轭转置。厄米算子有几个重要性质:
-
它的特征值都是实数,因此可以对应实际测量结果
这里用线代I中学过的知识就知道,\(A |X\rangle = \lambda |X\rangle\),经过变换我们可以得到\(\langle X|A|X\rangle = \lambda \langle X|X\rangle = \lambda^* \langle X|X\rangle\),因此\(\lambda = \lambda^*\),说明\(\lambda\)是实数.
-
不同特征值对应的特征向量是正交的,因此可以形成一个完备的基底
所有用来测量的矩阵都是厄米的,因为测量结果必须是实数!
如果系统当前处于状态 \(|\psi\rangle\),现在去测量某个可观测量 \(L\),并且 \(\lambda\) 是 \(L\) 的一个本征值,对应本征态为 \(|\lambda\rangle\),那么测到结果 \(\lambda\) 的概率为
这就是 Born rule 在离散本征态情形下的写法。这里 \(\langle\lambda|\psi\rangle\) 表示“把态 \(|\psi\rangle\) 投影到测量基底 \(|\lambda\rangle\) 上得到的概率振幅”,而其模平方才是真正的测量概率。
我们知道一个矩阵的代数重数是它的特征值的重数,而几何重数是对应特征值的线性无关特征向量的个数。对于厄米矩阵来说,代数重数和几何重数总是相等的,因此它们都是可对角化的。
更具体地说,如果矩阵 \(A\) 有一组线性无关的特征向量
以及对应的特征值
满足
那么把这些特征向量按列排成矩阵
就有
其中
这也等价于写成
在原来的基底下,算子写成矩阵 \(A\);但如果换到由特征向量组成的新基底下,它就变成了对角矩阵 \(D\)。所以对角化的本质其实就是换基。
Pauli Matrices¶
在我看来,泡利矩阵的计算初衷就是,对于自旋方向真的是\(+z\)的态,我们希望它在\(\sigma_z\)上的测量结果是\(+1\),
而对于自旋方向真的是\(-z\)的态,我们希望它在\(\sigma_z\)上的测量结果是\(-1\).因此我们就可以通过定义
\(\sigma_z\)的矩阵表示来满足这个要求。对于\(\sigma_x\)和\(\sigma_y\)也是同样的道理。
之前已经知道,沿 \(z\) 方向测量自旋时,两个本征态分别是
对应的测量结果是 \(+1\) 和 \(-1\)。因此在 \(\{|0\rangle,|1\rangle\}\) 这组基底下,算子 \(\sigma_z\) 的矩阵元为
这里也用到了归一化条件
如果一个自旋态写成
那么:
- \(|\alpha|^2\) 是测得自旋向上,也就是测得 \(\sigma_z = +1\) 的概率
- \(|\beta|^2\) 是测得自旋向下,也就是测得 \(\sigma_z = -1\) 的概率
如果把 Stern-Gerlach 仪器旋转到 \(x\) 方向,那么测量结果仍然只有 \(\pm 1\)。于是可以定义两个新的本征态:
实验告诉我们,若先制备出 \(|r\rangle\) 态,再去沿 \(z\) 方向测量,会以相等概率分裂成两束。因此在
中必须有
相位可以通过坐标轴选取吸收掉,通常直接取为 \(0\),于是
再利用正交归一条件
可以得到
现在要求 \(\sigma_x\) 在这两个态上的作用满足
解出来就是
用类似但稍复杂一些的方式,可以得到
它对应本征值 \(\pm 1\) 的本征态可以写成
于是
这三者统称为 Pauli matrices。
从推导中可以看出,这三个矩阵的基都是基于 \(\sigma_z\) 的本征态 \(|0\rangle,|1\rangle\) 构造出来的。
由于自旋测量和空间方向有关,可以把三者合起来写成一个三维算子向量
这里要区分两种“向量”:
- 我们生活的空间是三维实空间,方向 \(\hat{x},\hat{y},\hat{z}\) 是空间方向
- 量子态 \(|\psi\rangle\) 属于二维复向量空间,这是态空间
如果要沿任意方向
测量自旋,对应的算子就是
可以验证,它的特征值仍然是
任意纯态都可以写成
它对应的三维 Bloch 向量为
也就是说:
- 态空间里的 qubit 可以用 Bloch 球面上的一个点表示
- 这个点的方向,正好对应“沿哪个方向测量时更像是自旋向上态”
因而 Pauli 矩阵、Stern-Gerlach 测量和 Bloch 球三者其实是在描述同一件事的不同侧面。
