首页 > 代码库 > Hurwitz 1,2,4,8 平方和定理
Hurwitz 1,2,4,8 平方和定理
我们都熟悉复数的乘法:如果 $z_1=x_1+iy_1,z_2=x_2+iy_2$ 是两个复数,则 $|z_1z_2|=|z_1|\cdot|z_2|$,写开来就是
\[ (x_1^2+y_1^2)(x_2^2+y_2^2)=(x_1x_2-y_1y_2)^2+(x_1y_2+x_2y_1)^2.\]
1748 年 Euler 发现了如下的 4 平方和等式:
\[(x_1^2+x_2^2+x_3^2+x_4^2)(y_1^2+y_2^2+y_3^2+y_4^2)=z_1^2+z_2^2+z_3^2+z_4^2.\]
其中
\[\left\{\begin{align*}&z_1=x_1y_1-x_2y_2-x_3y_3-x_4y_4,\\&z_2=x_1y_2+x_2y_1+x_3y_4-x_4y_3,\\&z_3=x_1y_3+x_3y_1-x_2y_4+x_4y_2,\\&z_4=x_1y_4+x_4y_1+x_2y_3-x_3y_2.\end{align*}\right.\]
4 平方和等式说的是在 Hamilton 四元数体中范数仍然是乘性的。1848 年 Caley 发现了八元数,从而导出了类似的 8 平方和等式,当然具体写出来会很复杂,这里就按下不说了。
一般地,如果能在 $n$ 维欧式空间 $\mathbb{R}^n$ 上定义向量之间的乘法:\[\mathbb{R^n}\times\mathbb{R^n}\rightarrow\mathbb{R^n}:(v,w)\rightarrow v\times w.\]使得 $v\times w$ 对两个分量 $v,w$ 都是线性的,而且乘积的范数等于范数的乘积:$|v\times w|=|v|\cdot |w|$(这里 $|\cdot|$ 是通常的欧式范数),则我们就得到了一个 $n$ 平方和等式。
在接下来的 50 年里,人们一直致力于寻找可能的 16 平方和等式,但是都失败了,于是开始怀疑是否没有这样的等式成立。终于在 1898 年 Hurwitz 证明了这样的结论:
[Hurwitz 平方和定理】设 $x=(x_1,\ldots,x_n)$, $y=(y_1,\dots,y_n)$ 为 $\mathbb{R}^n$ 中的向量。如果存在关于 $x,y$ 的双线性函数 $z_1(x,y),\ldots,z_n(x,y)$ 使得等式
\[(x_1^2+\cdots+x_n^2)(y_1^2+\cdots+y_n^2)=z_1^2+\cdots+z_n^2\]
恒成立, 那么 $n=1,2,4,8$。
正如前面说过的,Huiwitz 平方和定理说的是在实数域 $\mathbb{R}$,复数域 $\mathbb{C}$,四元数 $\mathbb{H}$ 和八元数 $\mathbb{O}$ 中,元素的(欧式)范数和向量的乘法是相容的,而在其它维数的 $\mathbb{R}^n$ 上是不可能定义与欧式范数相容的向量乘法的。
Hurwitz 本人的证明是纯线性代数的,线性代数的证明较为初等,不过步骤略长。1943 年 Eckmann 用有限群表示论的方法给了一个漂亮的证明。不过本文将采用线性代数的方法。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Hurwitz 定理的证明
解决问题的第一步是将问题转化为矩阵方程。设 $z=(z_1,\ldots,z_n)$,则 $z$ 关于 $y$ 是线性的,因此存在 $n$ 阶矩阵 $A$ 满足 $z=yA$,当然矩阵 $A$ 和 $x$ 有关。于是 Hurwitz 定理中的等式变成\[(x_1^2+x_2^2+\cdots+x_n^2)yy‘=yAA‘y‘.\]由于 $y$ 是不定元,因此\[AA‘=(x_1^2+\cdots+x_n^2)I_n.\]
进一步,由于 $A$ 关于 $x$ 也是线性的,因此设 $A=A_1x_1+\cdots+A_nx_n$,则
\[AA‘=\sum_{i=1}^nA_iA_i‘x_i^2+\sum_{1\leq i<j\leq n}(A_iA_j‘+A_jA_i‘)x_ix_j.\]
从而我们得到一组矩阵方程
\[A_iA_i‘=I_n,\quad A_iA_j‘+A_jA_i‘=0 \quad \text{for}\ i\ne j.\]
进一步可以把 $A_n$ 归一化为单位矩阵:令 $Q_i=A_iA_n^{-1}$,于是 $Q_1,\ldots,Q_{n-1}$ 满足
\[Q_i‘=-Q_i,\quad Q_i^2=-I_n,\quad Q_iQ_j=-Q_jQ_i\quad\text{for}\ i\ne j.\]
显然 $n$ 必须是偶数(奇数阶反对称矩阵行列式都是 0),而 $n=2$ 的时候结论是成立的,所以下面我们都假定 $n>2$,于是 $n$ 的可能值为 $4,6,8,\cdots.$
接下来这个引理是一个独立的结论,你可以忘掉前面的那些推导,来考虑一个新问题:设 $r$ 是偶数,$X_1,\ldots,X_r$ 是 $r$ 个 $n$ 阶的实可逆矩阵,两两反交换:当 $i\ne j$ 时有 $X_iX_j+X_jX_i=0$。考虑全体形状如下的矩阵:
\[S=\left\{M\ |\ M=X_1^{e_1}X_2^{e_2}\cdots X_r^{e_r},\ e_i=0,1\right\}.\]
并定义 $X_1^0X_2^0\cdots X_r^0=I_n$。这样的矩阵一共有 $2^r$ 个,我们要证明
引理 1:$S$ 中的全体 $2^r$ 个矩阵是线性无关的,从而 $2^r\leq n^2$。
条件中的 $r$ 是偶数看起来是个奇怪的限制,但是在证明中确实要用到。
引理的证明: 用反证法:首先利用 $X_i$ 之间的反交换性不难看出对任何 $i$ 和 $M\in S$ 有 $X_iM=\pm MX_i$。
假设 $S$ 中的矩阵之间存在线性关系\[ a_1M_1+a_2M_2+\cdots+a_kM_k=0.\quad (\ast)\]显然 $k\geq 2$。我们可以设这个线性关系是所有可能的线性关系中长度最小的(即 $S$ 中任何少于 $k$ 个的矩阵都线性无关),从而每个系数 $a_i$ 都不是 0。任取一个 $X_i$,如果 $X_i$ 和某个 $M_j$ 交换,譬如说和 $M_1$ 交换: $X_iM_1=M_1X_i$,则在 $(\ast)$ 两边用 $X_i$ 做共轭:
\[ a_1X_iM_1X_i^{-1}+a_2X_iM_2X_i^{-1}+\cdots+a_kX_iM_kX_i^{-1}=0,\]
得到\[ a_1M_1+a_2‘M_2+\cdots+a_k‘M_k=0.\]
这里每个 $a_j‘=\pm a_j(2\leq j\leq k)$,正负号的决定规则是如果 $X_iM_j=M_jX_i$ 则 $a_j‘=a_j$,否则 $a_j‘=-a_j$。将这个等式与 $(\ast)$ 相减得到
\[(a_2-a_2‘)M_2+\cdots+(a_k-a_k‘)M_k=0.\]
这样我们就得到一个长度小于 $k$ 的线性关系,因此必须对每个 $j$ 都有 $a_j=a_j‘$,从而对每个 $M_j$ 都有 $X_iM_j=M_jX_i$,即 $X_i$ 只要与 $M_1$ 交换,就必定与 $M_1,\ldots,M_k$ 全体都交换,这样我们就发现了一个非常关键的信息
每个 $X_i$ 要么与 $M_1,\ldots,M_k$ 都交换,要么与 $M_1,\ldots,M_k$ 都反交换。
现在对 $M=X_1^{e_1}X_2^{e_2}\cdots X_r^{e_r}\in S$,定义向量 $e(M)=(e_1,\ldots,e_r)$,这里每个 $e_i=0,1$。又定义向量 $\delta(M)=(\delta_1,\ldots,\delta_r)$,其中若 $X_iM=MX_i$ 则 $\delta_i=1$,否则 $\delta_i=-1$。根据我们上一段的分析, $\delta(M_1)=\cdots=\delta(M_k)$。我们接下来要说明 $\delta(M)$ 这个向量可以唯一确定 $e(M)$ ,从而 $e(M_1)=\cdots=e(M_k)$,即 $M_1=\cdots=M_k$,这当然与 $M_1,\cdots,M_k$ 互不相同矛盾,从而说明 $S$ 中的 $2^r$ 个矩阵是线性无关的。
设 $w(M)$ 为 $e(M)$ 的分量中 1 的个数,则 $\delta_i=(-1)^{w(M)+e_i}$ 。这一点是逐个情况分析得到的:若 $w(M)$ 是偶数,则与 $M$ 交换的 $X_i$ 恰好是不在 $M$ 表达式中出现的那些(即对应 $e_i=0$ 的那部分 $X_i$);若 $w(M)$ 是奇数则情况相反,与 $M$ 交换的 $X_i$ 恰好是出现在 $M$ 表达式中的那些(对应 $e_i=1$ 的那部分 $X_i$)。
于是 $\delta_1\delta_2\cdots\delta_r=(-1)^{r\cdot w(M)+w(M)}=(-1)^{w(M)}$,这里就要用到 $r$ 是偶数这个条件。于是
\[(-1)^{e_i}=\delta_i(\delta_1\delta_2\cdots\delta_r).\]
由于 $e_i$ 只取两个值 0,1,因此我们可以通过 $\delta(M)$ 解出每个 $e_i$ 的值来,这就完成了引理的证明。
最后我们来回到 Hurwitz 定理的证明。回忆我们已经得到的结论:找到了 $n-1$ 个两两反交换的矩阵 $B_1,\ldots,B_{n-1}$,而且每个 $B_i=-B_i‘$,$B_l^2=-I_n$,我们知道这时 $n$ 一定是偶数,从而 $n-1$ 是奇数。为了应用引理我们需要去掉一个矩阵 $B_{n-1}$,矩阵 $B_1,\ldots,B_{n-2}$ 满足引理条件,因此 $2^{n-2}\leq n^2$,从而 $n=4,6,8$。
还有一个 $n=6$ 的情况需要排除。为此只要证明如下的辅助结论:
引理 2:设 $n$ 维欧式空间中两个线性变换 $A,B$ 满足 \[A=-A‘, B=-B‘, A^2=B^2=-I_n,AB=-BA,\]则 $n$ 是 4 的倍数。
证明:对空间中任何非零向量 $v$,容易验证四个向量 $v,Av,Bv,ABv$ 是两两正交的,因此线性无关,从而它们张成一个 4 维的子空间 $W$,而且 $W$ 是 $\{A,B\}$ 的不变子空间。考虑 $W$ 的正交补空间 $W^\bot$,则 $W^\bot$ 也是 $A,B$ 的不变子空间,因此同理可以找到一个 4 维的 $\{A,B\}$ 的不变子空间 $W_1\subset W^\bot$,如此继续下去就把整个空间分成了若干个 4 维子空间的直和,因此整个空间的维数 $n$ 是 4 的倍数。
Hurwitz 1,2,4,8 平方和定理