线性空间的循环分解
说在前面
这篇博客中仅仅引入了循环子空间的概念,遗留了很多问题没得到解决。这些问题会在这篇博客中得到解决。一个矩阵的有理标准形虽然不能得到与特征值、特征向量有关的内容,但是在分解期间只涉及到了加法和乘法,不会出现扩充数域的现象。可以说,有理标准形能得到一类相似矩阵更朴素的信息.
循环分解
设$V$是$\mathbb{F}$上的$n$维线性空间,$\mathscr{A}$是$V$的线性变换,则 其中,$\mathbb{F} [\mathscr{A}] \alpha_i\neq\{0\}$为$\alpha_i\in{V}$生成的循环子空间.
注意,这里的直和告诉我们,$\alpha_1,\alpha_2,\cdots,\alpha_r$线性无关。
这里我们会用到这篇博客里提到的导子。其实,这一节也可以看成导子性质的补充。我们会用到下面一个基本事实:设$U \subset W \subset V$,则有
这是因为,对于任意的$\alpha \in V$,我们有$P_{\text{cond }U,\mathscr{A}}(\lambda)\alpha \in U \subset W$,因此$P_{\text{cond }U,\mathscr{A}}(\lambda) \in I(W,\mathscr{A})$.
从此还能得到的一个结论是$I(U,\mathscr{A}) \subset I(W,\mathscr{A})$. 在学习了交换代数,特别是Krull维度相关的内容,就会对这里有不一样的理解。但是这已经远远超出这篇博客的范围。
循环分解的证明
如果$V$本身是一个相对于$\mathscr{A}$的循环空间,那么证明结束。现在讨论另一种情况.
讨论导子时我们了解到,存在$\alpha_1\in{V}$使得
设$W_1=\mathbb{F}[\mathscr{A}]\alpha_1$,并为方便起见设$W_0=0$. 又可以选取$\beta_2 \in V \setminus W_1$使得
我们自然希望,$R_2(\lambda)$的“地位”和$P_{\text{min }\mathscr{A},\alpha_1}(\lambda)$ 类似。对此,我们断言,可以调整$\beta_2$至某$\alpha_2$,使得$R_2(\lambda)=P_{\text{min }\mathscr{A},\alpha_2}(\lambda)$. 证明此断言后,我们可以用类似的办法继续寻找后面的多项式,最终得到结论。
首先,$R_2(\mathscr{A})\beta_2=Q_1(\mathscr{A})\alpha_1$. 我们首先感兴趣的是$Q_1$和$R_2$的关系。对此,设
则立刻得到$R_2(\mathscr{A})\beta_2=R_2(\mathscr{A})h_1(\mathscr{A})\alpha_1+r_1(\mathscr{A})\alpha_1$. 令
则
这也说明了$R_2(\lambda)=P_{\text{cond }W_1,\mathscr{A},\beta_2}(\lambda)=P_{\text{ cond }W_1,\mathscr{A},\alpha_2 }(\lambda)$. 这是由导子的定义决定的
由于$W_0 \subset W_1$, 我们又有
注意到$P_{\text{cond }W_0,\mathscr{A},\alpha_2}(\lambda)=P_{\text{min }\mathscr{A},\alpha_2}(\lambda)$. 从而我们可以整理成
对于上式我们可以写成
从此可以得到
若$r_1 \ne 0$, 则$P_{\text{min }\mathscr{A},\alpha_1}(\lambda)|[g(\lambda)r_1(\lambda)]$. 从而
因此$\deg r_1(\lambda) \ge \deg R_2(\lambda)$,这与$r_1(\lambda)$的定义相矛盾,故我们一定有$r_1(\lambda)=0$. 因此$R_2(\mathscr{A})\alpha_2=0$,从而$P_{\text{min }\mathscr{A},\alpha_2}(\lambda)|R_2(\lambda)$,这说明$R_2(\lambda)=P_{\text{min }\mathscr{A},\alpha_2}(\lambda)$. 我们的断言得到了证明.
令$W_2=\mathbb{F}[\mathscr{A}]\alpha_1+\mathbb{F}[\mathscr{A}]\alpha_2$。现在证明子空间的和为直和。
对于$\alpha\in W_1\cap\mathbb{F}[\mathscr{A}]\alpha_2$,可以设 而
故$P(\lambda)$是一个零化多项式,因此$\alpha=0$。这说明,子空间的和为直和。因此得到了子空间的直和
如果$W_2\neq{V}$,那么又取$\beta_3$使得
按照上面的办法,我们可以将$\beta_3$调整为我们想要的$\alpha_3$,这里需要注意的是,我们需要写
从而按照同样的办法证明$r_1=r_2=0$.
调整至$\alpha_1$后,我们得到子空间
如此继续下去,如果$W_k\neq{V}$,则可继续选择$\alpha_{k+1}$等,直到得到
此即循环分解。导子的性质保证这个向量的选择可以进行下去。$V$是有限维的,所以这个过程总会结束。
不变因子与极小多项式
这一节我们来探讨一下上一节中得到的各个若干多项式。设$\alpha_k$对应的多项式为$m_k(\lambda)$。那么,根据导子的唯一性,这些多项式都是唯一的(被$\mathscr{A}$唯一决定),而且已经得到了$m_k|m_{k-1}$这一关系。也就是说,对于指定的有限维度线性空间$V$和线性变换$\mathscr{A}$,(在顺序上)唯一决定了一组多项式$m_1,m_2,\cdots,m_r$。这组多项式称为$\mathscr{A}$的不变因子。
上面的证明中已经解释,$m_k$是$\alpha_k$的最小零化子。那么对于整个循环子空间$\mathbb{F}[\mathscr{A}]\alpha_k$又是怎样? 对于$\alpha\in\mathbb{F}[\mathscr{A}]\alpha_k$,可以设
那么
也就是说,$m_k$也是$\mathscr{A}$限制在$\mathbb{F}[\mathscr{A}]\alpha_k$的极小多项式(次数不能再低,否则就不再是$\alpha_k$的零化子).
有理标准形与特征多项式
对域$\mathbb{F}$上任一方阵$A$,存在域$\mathbb{F}$上的可逆方阵$P$使得 其中,$C(m_k)$是$m_k$的友阵,$m_k$是由$A$决定的线性变换$x\mapsto{Ax}$决定的线性变换的不变因子.
方阵$B$即为方阵$A$的有理标准形.
在这篇博客里我们指出,对于循环子空间$W=\mathbb{F}[\mathscr{A}]\alpha$,$\mathscr{A}$限制在$W$上的矩阵$A_W=C(m)$。这时我们选取了一组$W$上的循环基。现在,我们已经把一个线性空间分解成若干个循环子空间的直和,如果我们选择每个子空间的一组循环基,即得到有理标准形.
设$k_i=\text{deg }m_i$,则在对于基
而言,$\mathscr{A}$的方阵表示即为
这里的$P$即为由这组基构成的矩阵。计算特征多项式不难发现有
一些补充
根据$f$和不变因子的关系,不难得到三条结论:
$V$是循环空间当且仅当$f=m$。也就是说,极小多项式和特征多项式相等。
$m|f$且$m$和$f$有相同的不可约因子(尽管次数可能不同)。也就是说,对于$f$可以唯一分解成不可约因子 那么一定有正整数$r_1,\cdots,r_s$使得
其中$0<r_i\leq d_i$。
循环分解也成了Cayley-Hamilton的证明。因为$m|f$,所以特征多项式$f$一定是零化多项式。
循环分解的实例
求矩阵
的有理标准形,对$\mathbb{R}^4$进行循环分解
这是线性变换 $\mathscr{A}:x\mapsto{Ax}$在$\varepsilon_1,\varepsilon_2,\varepsilon_3,\varepsilon_4$下的方阵表示.
可以算出$f$的特征多项式和极小多项式为
这时其实已经完成了分解。因为不变因子已经被确定,也就是说,
那么有理标准形就有
接下来我们要求可逆矩阵$P$。首先讨论子空间$\mathbb{R}[\mathscr{A}]\alpha_2$。对于$m_2=\lambda-1$,只需要取$A$属于特征值$1$的特征向量即可。不妨直接取$\alpha_2=(0,0,0,1)^T$.
对于另一个循环空间的生成元$\alpha_1$,只需要保证$\alpha_1,\mathscr{A}\alpha_1,\mathscr{A}^2\alpha_1,\alpha_2$线性无关(秩为$4$),从而构成循环基,不妨取$\alpha_1=(1,1,1,1)^T$。此时$A\alpha_1=(1,-3,-5,1)^T$,$A^2\alpha_1=(-7,9,25,9)^T$。此时就得到矩阵
且
最后解释一下选择$\alpha_1$和$\alpha_2$的合理性(虽然完全可以验证$P^{-1}AP=B$)。已经知道,$m_k$一定是$\alpha_k$的最小零化子。对于$\alpha_2$,考虑 $ (A-I)\alpha_2=0 $ 即可。这刚好要求$\alpha_2$是$\mathscr{A}$关于特征值$1$下的特征向量。对于$\alpha_1$,因为$m=\lambda^3+5\lambda^2-\lambda-5$是最小零化子,所以$\alpha_1$,$\mathscr{A}\alpha_1$,$\mathscr{A}^2\alpha_1$必须线性无关,否则就说明此时$m_1$不是$\alpha_1$的最小零化子,这与$\mathbb{R}[\mathscr{A}]\alpha_1$的性质矛盾.