虚数 i 到底是个什么东西? - 持续低熵 的回答

问题描述

话题:

数学, 代数, 虚数, 复变函数, 复数(数学)

回答:

在很多人的理解当中,i 解释为-1的平方根。这当然没有错,但很多时候其实不得要领。 如果你要做解代数方程之类的事情,那的确应该把 i 视为-1的平方根。 但现实中运用复数的很多场景最好不要把理解的出发点放在“i是-1平方根”。 否则你要想通为什么 i 会出现其实没那么容易或直接。比如对于理解傅里叶分析或薛定谔方程中的 i 就是这样。

考虑到实用需求,我建议把 i 命名为“复旋数”。

我简单解释一下。

平面上所有的旋转变换保持二维空间(平面)中的内积。这里的“内积”就是所有向量长度和向量间夹角信息的总称。这应该足够直观,毕竟旋转保持长度和夹角嘛。上述内容可以推广到任意维数乃至无穷维。

我们可以把内积的概念推广到复线性空间 (即线性组合时用复数的线性空间)。 这种复数版本的内积的学名叫埃尔米特内积,应用非常广泛,从傅里叶分析到量子力学都要用。 最简单的情况:一维复线性空间可以等同于二维平面,这个时候一维的埃尔米特内积实际上就是复数的模。众所周知,如果你把复数视为一对实数,这不是别的正好是二维实向量的内积。

好,如果你接受埃尔米特内积是复数版本内积的合理定义,那自然希望研究保持它的线性变换。这些叫做酉变换。显然,酉变换可以类比为复数版本的“旋转”。

旋转变换是可以依赖于角度连续变化的。 旋转时你可以只转一个小角度,而且角度想要多小都可以。 注意:这里的变换和变化指的是完全不同的东西。“变换”指的是一个固定的旋转变换可以把不同的向量映射为相应的新向量。而这里的“变化”指的是: 我们可以考虑一组旋转变换,这组旋转变换被一个变化的变量所参数化(即该变量每取一个值就有一个不同的旋转变换)。 比如说我们同时考虑平面上所有的旋转,那么这些旋转就是一组旋转变换,被角度这个变量所参数化。

既然我们可以让(一组)旋转变换依赖于一个变化的参数,我们自然要问这一组旋转变换相对于这个参数的变化率是多少?也就是说我们要求导数。求导数会得什么?简单的代数运算告诉我们会得到一个反对称矩阵。“反对称矩阵”是这样的矩阵:交换行列会使原来的矩阵添上一个负号。 总结一下:旋转变换的导数是反对称矩阵。

对酉变换我们可以做完全类似的事情,毕竟它们类比为旋转变换的复数版本。 计算酉变换的变化率我们会得到什么呢?得到“反埃尔米特矩阵”。 这指的是这样的复数矩阵:交换行列并且把矩阵元换为复共轭后,会等于原来的矩阵添上一个负号。

上面两个自然段可以简洁总结为: 无穷小的旋转是反对称矩阵;无穷小的酉变换是反埃尔米特矩阵。

好,现在我们可以理解 i 可以做什么事情。取一个实数,乘上 i 就得到一个纯虚数。实数和纯虚数都可以看成一乘一矩阵,分别是一乘一“实对称”矩阵和一乘一“反埃尔米特”矩阵。推广到高维。 给你一个实对称矩阵将它乘上 i,我们就得到一个反埃尔米特矩阵。所以 i 可以将实对称矩阵转化为无穷小“复旋转”(酉变换)。也就是说它是在无穷小层面上实现了对“复旋转”的与实数观点有关的描述。

这其实就是在自然科学工程技术中 i 出现的最多数情况。因为欧拉公式,傅里叶分析,薛定谔方程中的 i 都是这么来的。 以后我会解释为什么。 -- 见 自然对数的底 e 有什么自然意义?, 见 傅里叶分析之掐死教程(完整版)

  

评论:

知乎用户:

以前逛知乎,最大的痛苦就是每个词汇都能看懂,但是连在一起就不知道是什么意思了。

现在情况毕竟是好多了,连词汇都看不懂了[惊喜] (134 赞)

瑞克 -> 知乎用户: 俺也一样[惊喜]

十六夜咲夜 -> 知乎用户: 不是理科生?

紫色黄昏: 嗯,大学白读了,看不懂 (78 赞)

昂首的兔子:

我感觉我复变函数白学了,老师以前都没把内积的含义讲明白就开始秀操作了,还得是寿公这里的理解到位。
把一个数学概念诠释成“信息的总和”,充分体现了文理双修的人看东西真的透彻[赞同]有点想回去重学一遍 (76 赞)

知乎用户 -> 昂首的兔子:

我本科的时候上复变函数的课感觉就是嗯算,现在就记得留数定理,反而是线性代数的课讲了一些比较概念的东西
比如(满足特定条件的)函数其实可以被视为线性空间中的向量,傅立叶变换可以提供该空间中的一组基底 (9 赞)

吹角连营八百里: 感觉寿公将会靠键政积攒的人气给知乎数学话题带来一波流量。 (57 赞)

绿光游骑兵: 惊了,寿公居然解答数学问题了 (54 赞)

五月龙舟 -> 绿光游骑兵:

是啊是啊。
问题这是寿公? (1 赞)

大巧不工: 见地,看法,思考都不是护城河,掌握数学,才是真正的与其他人拉开距离的关键之一。[酷][酷][酷] (36 赞)

喷道万古如长夜 -> 大巧不工: 老哥细说[好奇]

槐序初二 -> 喷道万古如长夜:

他的意思是
数学学好了大火都看不懂吧[大哭][大哭][大哭]

fang:

寿公讲讲群表示论和量子力学呗,想听

讲讲环论也行

带数太好玩辣 (26 赞)

集异璧 -> fang: 寿公在互联网上做数学科普的,讲那玩意干嘛,饭都要一口一口的吃,搞科普可不能在沙子上建大楼。

博宇 -> 集异璧: 代数本来就是数学的基础啊,到是寿公这样直接上来就讲i有点迷惑

jkllp: 寿公也行需要编辑几条公式,能简洁很多[思考] (18 赞)

末影Ender -> jkllp: 多一条公式,少一半读者( (34 赞)

小飞 -> 末影Ender: 当公式数达到33条以上时,读者数约等于零 (8 赞)

末影Ender -> 小飞: 你是懂半衰期的

xander: 寿公的数理文同样精彩,还好我是一个对文科感兴趣的理科生[捂脸]两边都能看个7788 (16 赞)

路过 -> xander: 我也算是,不过这篇我看不懂[语塞]学的不够多 (1 赞)

知乎用户:

这里有一个经典问题,即C和R^2到底有什么区别。事实上两者作为拓扑空间是没有区别的(典范同构义,R^2取积拓扑),将C视作R-
线性空间(x+iy)亦没有区别。

这两点直接导致很多人不明白C上的奇妙性质从何而来,因为他们对赋范线性空间的第一印象要么是几何角度(拓扑和度量),要么是R-
线性空间角度(因为大部分人学线性代数例子很少是复数域的),从这两个侧面看自然没有任何区别。

真正发生区别的是,C自身上有结合的乘法,这使C自身成为一个域,进而可以考虑C作为C-
赋范线性空间的结构。在这里发生了明显的不同,因为在赋范线性空间里可以考虑微分(寿公所指“变化率”),如果视C为C-
赋范线性空间,那么函数的微分就是复数(即是一个复数x+iy,或者说两个“相互独立”的实数),这是复可微;但如果视C为R-
赋范线性空间,那么微分是一个二阶矩阵(四个“相互独立”的实数),而这与将R^2视为R-
赋范线性空间没有任何区别。因此,复可微“独立变量”少两个,条件更强一些,表现在几何上,就不是所有的无穷小线性变换,而是无穷小的“旋转”,几何意味更强,性质更好。

当然,实际处理的时候,复数总是视为两个实数,这样方便计算很多。因此我们可以迫使复可微写成矩阵形式,然后比较上文两种微分的矩阵元素,立刻得到大名鼎鼎的柯西-
黎曼方程,这表明那少去的两个“独立变量”正是被该方程限制的,而复变函数与复可微的极好性质,也正系于这一关键方程。[潜水] (14 赞)

知乎用户 -> 知乎用户: 到位了[赞同]

萌新 -> 知乎用户: 通畅了