物理学中的群论 · 入门篇 第三章:转动变换群

from 专栏 物理学中的群论 · 入门篇

话题:

物理学, 数学, 量子物理, Frank-Hua, 物理学中的群论-·-入门篇

正文:

bg-img

物理人学群论,归根结底还是为了物理服务的,而群论在物理学中最主要的应用之一就是关于 时空对称性 的讨论:包括空间平移对称性、空间转动对称性、空间反演对称性、时间平移对称性与时间反演对称性等等。每一种对称性都对应一种时空变换,而每一种变换都可以构成一种群,其中空间反演变换和时间反演变换都可以由前几章的有限群描述,但是空间平移变换、空间转动变换以及时间平移变换都是 连续变换 ,需要新的理论。

因此从这一章开始讨论可描述连续变换的「连续」群,其中包含无穷多个连续的群元。但正如物理人学高数的时候默认「函数」就是「光滑函数」一样1,我们只关心一种「性质良好」的连续群—— Lie群 。正如物理人不关心光滑函数的定义一样,在初学阶段也没有必要纠结Lie群的具体定义2,只需要通过一些具体例子来感受就好3。甚至为了进一步简化,我们将局限于讨论 矩阵Lie群 ——也就是群元均为 矩阵的Lie群,这将大大降低理解难度。初学者暂时把Lie群当作连续群的代名词即可,本文末补充了矩阵Lie群的严格定义。

〇、代数知识补充

这里讨论的矩阵都默认为 型的方阵。

1. 矩阵的幂与矩阵指数

类似于实数的幂运算,可以定义 矩阵的幂运算 另外自然地规定 为单位矩阵。受实数的指数函数可以由幂级数 定义的启发,我们也可以自然地由矩阵幂运算来构造 矩阵的指数运算 ,即 所以 矩阵 的指数 也只不过是另一个 矩阵。矩阵指数在Lie群理论中有着重要的作用。

2. Levi-Civita记号

类似于Kronecker delta ,可以定义一个三元记号[4],称为(三维) Levi-Civita记号 即当下标与 相差一个偶置换时为 ,相差一个奇置换时为 ,若不构成置换则为 。这个记号可以将一些表达式大大简化。

3. Lie代数

一般语境下「代数」一词指的就是一个数学分支「代数学」,但实际上「代数」也指一种特定的代数结构。这里我们关注一种特殊的代数:

  • Lie代数 。设有一个复数域 上的矢量空间 ,其中的元素由 等标记。此时我们再给这个集合附加一种称为 Lie括号的二元运算 ,即任意给定矢量 ,可以得到另一个矢量,记作 ;如果Lie括号满足下列条件,那么称附加了Lie括号的矢量空间 为一个 Lie代数
  1. 对于任意 以及任意 ,有 ;同理,对于任意 以及任意 ,有 ,即Lie括号是一个 双线性运算 [5];
  2. 对于任意 ,满足 ,即Lie括号是 反对称的
  3. 对于任意 ,满足 ,该等式又称为 Jacobi恒等式 [6];

但这个定义有点抽象,那不如举一个物理人熟悉的例子:

  • 三维欧式空间 中矢量的叉乘。 矢量一般由粗体 表示,我们熟悉的叉乘一般记作 ;若给定一个空间直角坐标系,将矢量表示为分量形式[7]: ,则其叉乘为 。不难验证,叉乘运算满足上述Lie代数运算的条件;所以定义了叉乘的三维欧式空间就是一个Lie代数。

在矩阵Lie群的相关讨论中,Lie代数一般都是以矩阵为元素的矢量空间。由于矩阵自带一个矩阵乘法运算,我们可以自然地由矩阵乘法构造出一个运算 称为 对易子 (commutator);不难验证,这一运算满足Lie括号的三条性质,所以定义了对易子运算的矩阵空间就成了一个Lie代数。

4. BCH公式

Baker–Campbell–Hausdorff公式 (简称BCH公式):对于任意同阶矩阵 ,有

其中 为前文定义的对易子,这个公式主要是用于说明对易子 可以用于计算矩阵指数的乘积,所以不需要去记这个公式的具体形式;这一性质在Lie群理论中有重要的应用。

一、二维转动群

首先考虑最简单的一种转动群—— 二维转动群 ,其由二维平面 上所有的转动变换组成。不难想到,描述一个转动变换有两种观点:第一,认为参考系(坐标系)不动,而体系(矢量)发生转动,此谓 主动观点 ;第二,认为体系(矢量)不动,而参考系(坐标系)转动,此乃 被动观点 。仿照大多数教材的习惯,本文采用主动观点。

考虑二维平面中任意一个矢量[8] ,经过一个逆时针转动 角的转动变换后,矢量变为 ,如图所示


二维平面中的转动变换

由图中几何关系,不难证明 因此,对于任意矢量 ,经转动变换后将变为 ,其中矩阵 称为 二维转动矩阵 。显然,二维转动变换由一个参数 标记(这种标记方法称为转动矩阵的 参数化 ),且可由转动矩阵 完全表示。不难验证,所有的转动矩阵满足:

  • 对于矩阵乘法运算,任意给定两个转动矩阵 ,则 也是一个转动矩阵;
  • 由矩阵乘法的性质,
  • 对于 ,此时 为单位矩阵(对应不做转动),则
  • 对于任意转动矩阵 ,存在另一个转动矩阵 满足

由以上四条性质不难看出, 若将矩阵乘法作为群乘法,则所有二维转动矩阵构成一个群 。利用转动变换不改变矢量长度的性质,可得 ,可得 ,即转动矩阵是一个正交矩阵;又由于正交矩阵行列式为 ,而显然 ,则二维转动矩阵均为行列式为 的二阶正交矩阵。因此, 我们将二维转动矩阵群记作 ,其中「 」表示「正交[9]」,「 」表示行列式为 [10]。二维转动矩阵群 是一种 矩阵Lie群

另外,通过将 作Taylor展开,不难证明 矩阵可以表达为简洁的矩阵指数形式 为了便于讨论,不妨将 的取值范围扩展至 。对于两个矩阵 ,显然其对易子为 ,将对易子作为Lie括号,则所有 矩阵构成一个Lie代数。由于其与 Lie群直接相关,这个Lie代数通常记作 [11],或直接称为 Lie群 的Lie代数 。而根据BCH公式,有
即两个转动的合成等价于转动角之和的一个转动。

二、三维转动变换

现在讨论相对复杂的情形——由三维空间 中所有三维转动变换矩阵构成的 三维转动群 。同样采用主动观点,考虑 中任意一个矢量 ,经过一个转动变换后,矢量变为

1. 三维转动变换的几何

相较于二维平面中的转动,三维空间中的转动更为复杂,我们用 轴角参数化 来标记特定的转动:首先选取一个单位矢量 (满足 )作为转轴方向,再取一个实数 作为绕该转轴转过的角度(按右手螺旋定则确定转动正方向),则这组参数(实际共三个独立变量)可以完全确定一个三维转动,如下图所示:


三维空间转动的轴角参数化

所以转动后矢量可以表示为 。为了得到 之间的具体关系,我们直接利用几何中的结论—— Rodrigues旋转公式 [12]: 显然, 之间仍相差一个线性变换,即存在矩阵 ,使得 ;为得到转动矩阵的具体形式,令 则Rodrigues旋转公式可化为 可以证明,上式可等价地表达为矩阵指数的形式(为证明该结果,只需注意到 ,从而可以将矩阵指数中的级数与三角函数的Taylor展开相比较)
与二维转动相同,所有三维转动矩阵的集合也构成一个群,其单位元为单位矩阵 ,称为 三维转动群 ;并且三维转动群同样满足 (代入以上矩阵指数形式可以直接验证)。因此我们 将三维转动群对应地称为 是最典型的Lie群之一,也是在物理学中应用最广泛的Lie群。

2. 三维转动群及其Lie代数

的形式不难看出, ,其中 ,即 按照习惯,一般定义矢量矩阵 ,则 。此时 的矩阵指数形式化为 可以验证,三个 矩阵满足对易关系
。显然在此对易子运算下,三个基矢 张成的矢量空间 构成一个Lie代数,称为 Lie群 的Lie代数,记作 ,三个基矢 称为 的生成元 。在 的例子中,我们可以明显地看出Lie群与Lie代数之间的关系,以及为什么要引入Lie代数:根据BCH公式,对于任意两个转动矩阵 ,其乘积为 而其中所有运算都可以化归为对易子 的线性组合;因此,一旦求得 Lie代数生成元的对易关系,就能依据上式对应地计算任意两个 群元的乘积。

三、Lie群与Lie代数关系的推广

前两部分主要讨论了二维转动群 与三维转动群 ,从纯粹的几何关系出发推导出了两种群矩阵的具体表达式;并且绕开所有极限和近似导出了两种群的矩阵指数形式,从而构造出两类Lie代数

这里不加证明地给出,对于任意一个 阶复矩阵Lie群 , 其对应的Lie代数为[13] (其中 表示所有 阶复矩阵的集合) Lie代数为所有满足以下性质的矩阵 的集合:对于任意实数 矩阵 为矩阵Lie群 中群元 。或者可以简单地理解为 这是一个非常重要的概念,Lie群与Lie代数这两个从定义看起来毫无关系的概念,就这么通过指数运算联系在了一起。结合BCH公式不难理解这一结果:只要给定Lie代数的Lie括号(物理中用到的一般都是对易子),就能代入BCH公式计算群乘法。并且在后续章节中需要计算Lie群的表示时,只需要从Lie代数对易关系出发,首先构造出Lie代数的表示,就可根据以上矩阵指数关系,进一步得到Lie群的表示。


最后补充一下矩阵Lie群的严格定义[14]:首先将所有 阶复矩阵的集合记作 ,将所有 可逆复矩阵的集合记作 ,显然 构成一个群。给定一个 中的矩阵序列 ,考虑其中每一个元素组成的一系列数列 ,如果每个这样的数列都分别收敛于一个常数 ,即 则称 矩阵序列 收敛 ,且其收敛于矩阵 称为该 矩阵序列的极限 。有了这一定义,我们就可以给出矩阵Lie群的严格定义:[15]

  • 给定 的一个子群 ,如果对于 中任意一个收敛的矩阵序列 (即 的极限矩阵 要么属于 要么不可逆,则称子群 是一个矩阵Lie群。

不难验证,本文定义的 均满足矩阵Lie群的上述定义。

[4]: 参考:
[5]: 这一条看着很复杂,其实就是Lie括号对两个输入都是线性的,而且这个性质在量子力学中计算各种对易关系的时候可以直接用
[6]: 这一条看着很重要,但其实物理里面用不上
[7]: 本文均使用Einstein求和约定
[8]: 上标T表示转置,即将矢量视为列向量
[9]: orthogonal
[10]: special
[11]: 这是哥特体的小写英文字母,专门用于表示Lie代数,LaTeX代码为\mathfrak
[12]: 推导很简单,具体可参考:
[13]: 参考:
[14]: 没什么用,主要是说明一下这玩意存在一个可以理解的严格定义
[15]: Hall, Brian C., and Brian C. Hall. Lie groups, Lie algebras, and representations. Springer New York, 2013.

  

评论:

梁以: 是不是这么理解:三维旋转可以用3乘3矩阵表示,旋转的复合就是矩阵按顺序相乘。但矩阵很复杂,乘法也不好算。我们可以把矩阵变成成几个简单矩阵组合的指数形式,把乘法变成对易计算,在某些情况下计算会简单一些。直接算乘法就是李群,指数形式就是李代数。感觉有点像傅里叶变换里时域和频域的关系🤔

Frank Hua -> 梁以: 基本可以这么理解👍 不过从物理的角度,介绍Lie代数的主要目的还是引出量子力学中的角动量,这部分内容后面的文章会写[调皮] (1 赞)

梁以 -> Frank Hua: 很期待[可怜] (1 赞)

fhw -> Frank Hua: 博主,有木有PDF版本😝

Frank Hua -> fhw: 可能全部写完之后会整理一份吧 敬请期待[调皮] (1 赞)

fhw -> Frank Hua: 已经关注您了👍😝

Frank Hua: 时隔一年多,终于更了被催更最多的一篇( (3 赞)

流年: 写得很好 (1 赞)

fhw -> 流年: 全靠知乎博主友友,了解这些高端数学物理知识了

椒盐: 终于更了🧡 (1 赞)

一文: 请教一下,电磁学中有群论的应用吗

知乎用户: 感谢作者👍

Guan: 是手机版本的显示问题吗,公式不清晰😱