Hamiton-Cayley 定理
Hamiton-Cayley 定理是线性代数中比较有名的定理,它的证法有很多,一般线性代数的书都会使用纯代数的方法证明。Artin书中的证法非常有趣,他使用了纯分析的办法证明,该方法简单直接,也具有足够的一般性,可以很轻松的推广到一般特征值有关的问题。
Hamiton-Cayley 定理 是指,若 \(f(x)\) 是矩阵 \(A\) 的特征多项式,那么必定有 \(f(A) = 0\) 。
如果 \(A\) 有 \(n\) 个不同的特征值,该定理几乎是显而易见的。因为若 \(\lambda\) 是 \(A\) 的特征值, \(v\) 是对应的特征向量,那么 \(\lambda^k\) 是 \(A^k\) 的特征值, \(v\) 是对应的特征向量。 \(A\) 有 \(n\) 个不同的特征值,那么也就有 \(n\) 个线性独立的特征向量, 他们构成了这个向量空间的一组基。从而 \(f(A)v_k = 0\) , \(k=1,2,\cdots,n\) ,从而 \(f(A) = 0\) 。
那么现在问题是证明,对于一般的情形,即特征值有重根的情况,该定理是成立的。
证明的关键是在于,对于有重根的特征多项式,可以使用一个没有重根的特征多项式逼近。
连续性
首先我们需说明多项式的连续性和根的连续性,简单来说有如下命题成立:
根的连续性
为了避免无限维空间的引入,我们在论及多项式的收敛性是,总认为多项式序列的次数不超过一给定值。下列说的多项式均是复数域的首一多项式。
1.设 \(p_k(t)\) 是一个次数小于 \(n\) 的收敛于 \(p(t)\) 多项式序列,其收敛性是作为有限维线性空间自然定义的。那么每个多项式 \(p_k\) 的根 \(\alpha_{k,\nu}\) 可以通过合理编号使之收敛于 \(p_k\) 对应的根 \(\alpha_\nu\) 。
2.假设符号与上一致,若多项式 \(p_k\) 的根 \(\alpha_{k,\nu}\) 收敛于多项式 \(p(t)\) 的根 \(\alpha_\nu\) ,则多项式 \(p_k(t)\) 收敛于 \(p_k\) 。
因为多项式的系数总是根的连续函数,所以 2 是显然的。1 的证明麻烦一点。首先任取 \(p(t)\) 的一个根 $α_1 $ ,然后找离 \(\alpha_1\) 最近的根,假设也为 \(\alpha_{k,1}\) 。于是
\begin{equation} |\alpha_1 - \alpha_{k,1}|^n \leq |(\alpha_1 - \alpha_{k,1})(\alpha_1 - \alpha_{k,2}) \cdots (\alpha_1 - \alpha_{k,n})| = |p_k(\alpha_1)| \end{equation}
上式右边趋于0,左边也将趋于0。 从而找到了一个可以被逼近的根。于是可以做因式分解:
\begin{align} p_k(t) = (t- \alpha_{k,1})q_k(t) \\\ p(t) = (t-\alpha_1)q(t) \end{align}
那么直接做多项式除法可以发现 \(q_k(t) \to q(t)\) ,并且二者的次数要小于 \(n\) 从而可以归纳证得。上述的证明只考虑了多项式的次数等于 \(n\) 的情形,若小于 \(n\) ,证明是类似的。
矩阵的特征多项式
对于矩阵 \(A\) 的多项式有下列事实成立。
1.总有矩阵 \(A_k\) 收敛于 \(A\) 使得每个 \(A_k\) 的特征多项式的根各不相同。将 \(A\) 上三角化,那么它的对角元素便是所有的特征值,于是只要让 \(A_k\) 做相同的共轭变换,让对角元素各不相同并趋于 \(A\) 上三角化后的对角元即可。
2.\(A_k\) 收敛于 \(A\) ,那么 \(A_k\) 对应的特征多项式也将收敛于 \(A\) 的特征多项式; 对应的根也将收敛到对应的值。结合上节的定理,这是显然的。
Hamiton-Cayley 定理的最终证明
对于一般的多项式 \(A\) 总可以用 \(A_k\) 来收敛逼近,保证 \(A_k\) 的特征根各不相同。那么 \(p_k(A_k) = 0\) 。且 \(p_k(t) \to p(t)\) 。从而 \(p_k(A_k)\) 收敛于 \(p(A)\) ,从而 \(p(A)= 0\) 。
另一个小应用
上面的方法可以非常实用,比如 \(\mathrm{det}\ \mathrm{e}^ A = \mathrm e^{\mathrm{tr} A}\) 。若特征值各不相同,由于 \(\mathrm{e}^A\) 的特征值为 \(\mathrm e^\lambda\) 。从而 \(\mathrm{det} \ \mathrm{e}^ A = \mathrm{e}^{\lambda_1} \mathrm{e}^{\lambda_2} \cdots \mathrm{e}^{\lambda_n} = \mathrm{e}^{\mathrm{tr} A}\) . 若特征有重根使用上述类似的技术可以得到相同的结果。