说在前面

这篇博客中仅仅引入了循环子空间的概念,遗留了很多问题没得到解决。这些问题会在这篇博客中得到解决。一个矩阵的有理标准形虽然不能得到与特征值、特征向量有关的内容,但是在分解期间只涉及到了加法和乘法,不会出现扩充数域的现象。可以说,有理标准形能得到一类相似矩阵更朴素的信息.

循环分解

设$V$是$\mathbb{F}$上的$n$维线性空间,$\mathscr{A}$是$V$的线性变换,则 \[
V=\bigoplus_{i=1}^r\mathbb{F}\big[\mathscr{A}\big]\alpha_i\] 其中,$\mathbb{F} [\mathscr{A}] \alpha_i\neq{0}$为$\alpha_i\in{V}$生成的循环子空间.

注意,这里的直和告诉我们,$\alpha_1,\alpha_2,\cdots,\alpha_r$线性无关.

这里我们会用到这篇博客里提到的导子。其实,这一节也可以看成导子性质的补充.

循环分解的证明

如果$V$本身是一个相对于$\mathscr{A}$的循环空间,那么证明结束。现在讨论另一种情况.

讨论导子时我们了解到,存在$\alpha_1\in{V}$使得
\[
P_{\text{min }\mathscr{A}}(\lambda)=P_{\text{min }\mathscr{A},\alpha_1}(\lambda)
\]

设$W_1=\mathbb{F}[\mathscr{A}]\alpha_1$。又可以选取$\alpha_2$使得
\[
P_{\text{cond }W_1,\mathscr{A}}(\lambda)=P_{\text{cond }W_1,\mathscr{A},\alpha_2}(\lambda)
\]

注意到${0}\subset{W_1}$,此时有
\[
P_{\text{min }\mathscr{A},\alpha_1}(\lambda)=P_{\text{cond }{0},\mathscr{A},\alpha_1}(\lambda)|P_{\text{cond }W_1,\mathscr{A},\alpha_2}(\lambda)
\]

因此$P_{\text{cond }W_1,\mathscr{A},\alpha_2}(\lambda)$是$\alpha_2$的最小零化子。令$W_2=\mathbb{F}[\mathscr{A}]\alpha_1+\mathbb{F}[\mathscr{A}]\alpha_2$。现在证明子空间的和为直和。

对于$\alpha\in W_1\cap\mathbb{F}[\mathscr{A}]\alpha_2$,可以设 \[ \alpha=P(\mathscr{A})\alpha_2 \] 而
\[
P_{\text{cond }W_1,\mathscr{A},\alpha_2}(\lambda)|P(\lambda)
\]

故$P(\lambda)$是一个零化多项式,因此$\alpha=0$。这说明,子空间的和为直和。因此得到了子空间的直和
\[
W_2=\mathbb{F}[\mathscr{A}]\alpha_1\oplus\mathbb{F}[\mathscr{A}]\alpha_2
\]

如果$W_2\neq{V}$,那么又取$\alpha_3$使得
\[
P_{\text{cond }W_2,\mathscr{A}}(\lambda)=P_{\text{cond }W_2,\mathscr{A},\alpha_3}(\lambda)
\]
得到子空间
\[
W_3=\mathbb{F}[\mathscr{A}]\alpha_1\oplus\mathbb{F}[\mathscr{A}]\alpha_2\oplus\mathbb{F}[\mathscr{A}]\alpha_3
\]

如此继续下去,如果$W_k\neq{V}$,则可继续选择$\alpha_{k+1}$等,直到得到
\[
V=\mathbb{F}[\mathscr{A}]\alpha_1\oplus\mathbb{F}[\mathscr{A}]\alpha_2\oplus\cdots\oplus\mathbb{F}[\mathscr{A}]\alpha_r
\]

此即循环分解。导子的性质保证这个向量的选择可以进行下去。

不变因子与极小多项式

这一节我们来探讨一下上一节中得到的各个若干多项式。设$\alpha_k$对应的多项式为$m_k(\lambda)$。那么,根据导子的唯一性,这些多项式都是唯一的(被$\mathscr{A}$唯一决定),而且已经得到了$m_k|m_{k-1}$这一关系。也就是说,对于指定的有限维度线性空间$V$和线性变换$\mathscr{A}$,(在顺序上)唯一决定了一组多项式$m_1,m_2,\cdots,m_r$。这组多项式称为$\mathscr{A}$的不变因子

上面的证明中已经解释,$m_k$是$\alpha_k$的最小零化子。那么对于整个循环子空间$\mathbb{F}[\mathscr{A}]\alpha_k$又是怎样? 对于$\alpha\in\mathbb{F}[\mathscr{A}]\alpha_k$,可以设
\[
\alpha = P(\mathscr{A})\alpha_k
\] 那么
\[
m_k(\mathscr{A})\alpha=m_k(\mathscr{A})P(\mathscr{A})\alpha_k=0
\]
也就是说,$m_k$也是$\mathscr{A}$限制在$\mathbb{F}[\mathscr{A}]\alpha_k$的极小多项式(次数不能再低,否则就不再是$\alpha_k$的零化子).

有理标准形与特征多项式

对域$\mathbb{F}$上任一方阵$A$,存在域$\mathbb{F}$上的可逆方阵$P$使得 \[ B=P^{-1}AP=\text{diag}(C(m_1),\cdots,C(m_r)) \] 其中,$C(m_k)$是$m_k$的友阵,$m_k$是由$A$决定的线性变换$x\mapsto{Ax}$决定的线性变换的不变因子.

方阵$B$即为方阵$A$的有理标准形.

这篇博客里我们指出,对于循环子空间$W=\mathbb{F}[\mathscr{A}]\alpha$,$\mathscr{A}$限制在$W$上的矩阵$A_W=C(m)$。这时我们选取了一组$W$上的循环基。现在,我们已经把一个线性空间分解成若干个循环子空间的直和,如果我们选择每个子空间的一组循环基,即得到有理标准形.

设$k_i=\text{deg }m_i$,则在对于基
\[
\alpha_1,\mathscr{A}\alpha_1,\cdots,\mathscr{A}^{k_1-1}\alpha_1,\cdots,\alpha_r,\mathscr{A}\alpha_r,\cdots,\mathscr{A}^{k_r-1}\alpha_r
\] 而言,$\mathscr{A}$的方阵表示即为
\[
A=\text{diag}(C(m_1),\cdots,C(m_r))
\]

这里的$P$即为由这组基构成的矩阵。计算特征多项式不难发现有
\[
f=m_1m_2\cdots m_r
\]

一些补充

根据$f$和不变因子的关系,不难得到三条结论:

  1. $V$是循环空间当且仅当$f=m$。也就是说,极小多项式和特征多项式相等

  2. $m|f$且$m$和$f$有相同的不可约因子(尽管次数可能不同)。也就是说,对于$f$可以唯一分解成不可约因子[ f=p_1^{d_1}\cdots p_s^{d_s} ] 那么一定有正整数$r_1,\cdots,r_s$使得
    \[
    m=p_1^{r_1}\cdots p_s^{r_s}
    \]
    其中$0<r_i\leq d_i$.

  3. 循环分解也成了Cayley-Hamilton的证明。因为$m|f$,所以特征多项式$f$一定是零化多项式.

循环分解的实例

求矩阵
\[
A=\begin{pmatrix}
0&-1&2&0 \\
-1&0&-2&0 \\
0&0&-5&0 \\
1&1&-2&1
\end{pmatrix}
\]
的有理标准形,对$\mathbb{R}^4$进行循环分解

这是线性变换$\mathscr{A}:x\mapsto{Ax}$在$\varepsilon_1,\varepsilon_2,\varepsilon_3,\varepsilon_4$下的方阵表示.

可以算出$f$的特征多项式和极小多项式为
\[ f(\lambda)=(\lambda-1)^2(\lambda+1)(\lambda+5) \\
m(\lambda)=(\lambda-1)(\lambda+1)(\lambda+5)
\]

这时其实已经完成了分解。因为不变因子已经被确定,也就是说,
\[
m_1=\lambda^3+5\lambda^2-\lambda-5 \\
m_2=\lambda-1
\]

那么有理标准形就有
\[
B=\left(\begin{array}{c c c|c}
0&0&\textbf{5}&0 \\
1&0&\textbf{1}&0 \\
0&1&\textbf{-5}&0 \\
\hline
0&0&0&\textbf{1}
\end{array}\right)
\]

接下来我们要求可逆矩阵$P$。首先讨论子空间$\mathbb{R}[\mathscr{A}]\alpha_2$。对于$m_2=\lambda-1$,只需要取$A$属于特征值$1$的特征向量即可。不妨直接取$\alpha_2=(0,0,0,1)^T$.

对于另一个循环空间的生成元$\alpha_1$,只需要保证$\alpha_1,\mathscr{A}\alpha_1,\mathscr{A}^2\alpha_1,\alpha_2$线性无关(秩为$4$),从而构成循环基,不妨取$\alpha_1=(1,1,1,1)^T$。此时$A\alpha_1=(1,-3,-5,1)^T$,$A^2\alpha_1=(-7,9,25,9)^T$。此时就得到矩阵
\[
P=\begin{pmatrix}
1&1&-7&0 \\
1&-3&9&0 \\
1&-5&25&0 \\
1&1&9&1
\end{pmatrix}
\]


\[
\mathbb{R}^4=\mathbb{R}[\mathscr{A}]{}(1,1,1,1)^T\oplus\mathbb{R}[\mathscr{A}] {}(0,0,0,1)^T
\]

最后解释一下选择$\alpha_1$和$\alpha_2$的合理性(虽然完全可以验证$P^{-1}AP=B$)。已经知道,$m_k$一定是$\alpha_k$的最小零化子。对于$\alpha_2$,考虑 $ (A-I)\alpha_2=0 $ 即可。这刚好要求$\alpha_2$是$\mathscr{A}$关于特征值$1$下的特征向量。对于$\alpha_1$,因为$m=\lambda^3+5\lambda^2-\lambda-5$是最小零化子,所以$\alpha_1$,$\mathscr{A}\alpha_1$,$\mathscr{A}^2\alpha_1$必须线性无关,否则就说明此时$m_1$不是$\alpha_1$的最小零化子,这与$\mathbb{R}[\mathscr{A}]\alpha_1$的性质矛盾.