线性空间的循环分解以及矩阵的有理标准形(附实例)

February 3, 2020
线性代数/Linear Algebra

说在前面

这篇博客中仅仅引入了循环子空间的概念, 但是遗留了很多问题没得到解决. 这些问题会在这篇博客中得到解决. 一个矩阵的有理标准形虽然不能得到与特征值、特征向量有关的内容, 但是在分解期间只涉及到了加法和乘法, 不会出现扩充数域的现象. 可以说, 有理标准形能得到一类相似矩阵更朴素的信息.

循环分解

设$V$是$\mathbb{F}$上的$n$维线性空间, $\mathscr{A}$是$V$的线性变换, 则 $V=\bigoplus_{i=1}^r\mathbb{F}\big[\mathscr{A}\big]\alpha_i$ 其中, $\mathbb{F} [\mathscr{A}] \alpha_i\neq\{0\}$为$\alpha_i\in{V}$生成的循环子空间.

注意, 这里的直和告诉我们, $\alpha_1,\alpha_2,\cdots,\alpha_r$线性无关.

这里我们会用到这篇博客里提到的导子. 其实, 这一节也可以看成导子性质的补充.

循环分解的证明

如果$V$本身是一个相对于$\mathscr{A}$的循环空间, 那么证明结束. 现在讨论另一种情况.

讨论导子时我们了解到, 存在$\alpha_1\in{V}$使得 [ P_{\text{min }\mathscr{A}}(\lambda)=P_{\text{min }\mathscr{A},\alpha_1}(\lambda) ]

设$W_1=\mathbb{F}[\mathscr{A}]\alpha_1$. 又可以选取$\alpha_2$使得 [ P_{\text{cond }W_1,\mathscr{A}}(\lambda)=P_{\text{cond }W_1,\mathscr{A},\alpha_2}(\lambda) ]

注意到$\{0\}\subset{W_1}$, 此时有 [ P_{\text{min }\mathscr{A},\alpha_1}(\lambda)=P_{\text{cond }\{0\},\mathscr{A},\alpha_1}(\lambda)|P_{\text{cond }W_1,\mathscr{A},\alpha_2}(\lambda) ]

因此$P_{\text{cond }W_1,\mathscr{A},\alpha_2}(\lambda)$是$\alpha_2$的最小零化子.

令$W_2=\mathbb{F}[\mathscr{A}]\alpha_1+\mathbb{F}[\mathscr{A}]\alpha_2$. 现在证明子空间的和为直和.

对于$\alpha\in W_1\cap\mathbb{F}[\mathscr{A}]\alpha_2$, 可以设 [ \alpha=P(\mathscr{A})\alpha_2 ] 而 [ P_{\text{cond }W_1,\mathscr{A},\alpha_2}(\lambda)|P(\lambda) ]

故$P(\lambda)$是一个零化多项式, 因此$\alpha=0$. 这说明, 子空间的和为直和. 因此得到了子空间的直和 $$ W_2=\mathbb{F}[\mathscr{A}]\alpha_1\oplus\mathbb{F}[\mathscr{A}]\alpha_2 $$

如果$W_2\neq{V}$, 那么又取$\alpha_3$使得 [ P_{\text{cond }W_2,\mathscr{A}}(\lambda)=P_{\text{cond }W_2,\mathscr{A},\alpha_3}(\lambda) ] 得到子空间 $$ W_3=\mathbb{F}[\mathscr{A}]\alpha_1\oplus\mathbb{F}[\mathscr{A}]\alpha_2\oplus\mathbb{F}[\mathscr{A}]\alpha_3 $$

如此继续下去, 如果$W_k\neq{V}$, 则可继续选择$\alpha_{k+1}$等, 直到得到 $$ V=\mathbb{F}[\mathscr{A}]\alpha_1\oplus\mathbb{F}[\mathscr{A}]\alpha_2\oplus\cdots\oplus\mathbb{F}[\mathscr{A}]\alpha_r $$

此即循环分解. 导子的性质保证这个向量的选择可以进行下去.

不变因子与极小多项式

这一节我们来探讨一下上一节中得到的各个若干多项式. 设$\alpha_k$对应的多项式为$m_k(\lambda)$. 那么, 根据导子的唯一性, 这些多项式都是唯一的(被$\mathscr{A}$唯一决定), 而且已经得到了$m_k|m_{k-1}$这一关系. 也就是说, 对于指定的有限维度线性空间$V$和线性变换$\mathscr{A}$, (在顺序上)唯一决定了一组多项式$m_1,m_2,\cdots,m_r$. 这组多项式称为$\mathscr{A}$的不变因子.

上面的证明中已经解释, $m_k$是$\alpha_k$的最小零化子. 那么对于整个循环子空间$\mathbb{F}[\mathscr{A}]\alpha_k$又是怎样? 对于$\alpha\in\mathbb{F}[\mathscr{A}]\alpha_k$, 可以设 [ \alpha = P(\mathscr{A})\alpha_k ] 那么 [ m_k(\mathscr{A})\alpha=m_k(\mathscr{A})P(\mathscr{A})\alpha_k=0 ] 也就是说, $m_k$也是$\mathscr{A}$限制在$\mathbb{F}[\mathscr{A}]\alpha_k$的极小多项式(次数不能再低, 否则就不再是$\alpha_k$的零化子).

有理标准形与特征多项式

对域$\mathbb{F}$上任一方阵$A$, 存在域$\mathbb{F}$上的可逆方阵$P$使得 [ B=P^{-1}AP=\text{diag}(C(m_1),\cdots,C(m_r)) ] 其中, $C(m_k)$是$m_k$的友阵, $m_k$是由$A$决定的线性变换$x\mapsto{Ax}$决定的线性变换的不变因子.

方阵$B$即为方阵$A$的有理标准形.

这篇博客里我们指出, 对于循环子空间$W=\mathbb{F}[\mathscr{A}]\alpha$, $\mathscr{A}$限制在$W$上的矩阵$A_W=C(m)$. 这时我们选取了一组$W$上的循环基. 现在, 我们已经把一个线性空间分解成若干个循环子空间的直和, 如果我们选择每个子空间的一组循环基, 即得到有理标准形.

设$k_i=\text{deg }m_i$, 则在对于基 [ \alpha_1,\mathscr{A}\alpha_1,\cdots,\mathscr{A}^{k_1-1}\alpha_1,\cdots,\alpha_r,\mathscr{A}\alpha_r,\cdots,\mathscr{A}^{k_r-1}\alpha_r ] 而言, $\mathscr{A}$的方阵表示即为 [ A=\text{diag}(C(m_1),\cdots,C(m_r)) ]

这里的$P$即为由这组基构成的矩阵. 计算特征多项式不难发现有 [ f=m_1m_2\cdots m_r ]

一些补充

根据$f$和不变因子的关系, 不难得到三条结论:

  1. $V$是循环空间当且仅当$f=m$. 也就是说, 极小多项式和特征多项式相等

  2. $m|f$且$m$和$f$有相同的不可约因子(尽管次数可能不同). 也就是说, 对于$f$可以唯一分解成不可约因子[ f=p_1^{d_1}\cdots p_s^{d_s} ] 那么一定有正整数$r_1,\cdots,r_s$使得 [ m=p_1^{r_1}\cdots p_s^{r_s} ] 其中$0<r_i\leq d_i$.

  3. 循环分解也成了Cayley-Hamilton的证明. 因为$m|f$, 所以特征多项式$f$一定是零化多项式.

循环分解的实例

求矩阵 [ A=\begin{pmatrix} 0&-1&2&0 \\
-1&0&-2&0 \\
0&0&-5&0 \\
1&1&-2&1 \end{pmatrix} ] 的有理标准形, 对$\mathbb{R}^4$进行循环分解

这是线性变换$\mathscr{A}:x\mapsto{Ax}$在$\varepsilon_1,\varepsilon_2,\varepsilon_3,\varepsilon_4$下的方阵表示.

可以算出$f$的特征多项式和极小多项式为 [ f(\lambda)=(\lambda-1)^2(\lambda+1)(\lambda+5) \\
m(\lambda)=(\lambda-1)(\lambda+1)(\lambda+5) ]

这时其实已经完成了分解. 因为不变因子已经被确定, 也就是说, [ m_1=\lambda^3+5\lambda^2-\lambda-5 \\
m_2=\lambda-1 ]

那么有理标准形就有 [ B=\left(\begin{array}{c c c|c} 0&0&\textbf{5}&0 \\
1&0&\textbf{1}&0 \\
0&1&\textbf{-5}&0 \\
\hline 0&0&0&\textbf{1} \end{array}\right) ]

接下来我们要求可逆矩阵$P$. 首先讨论子空间$\mathbb{R}[\mathscr{A}]\alpha_2$. 对于$m_2=\lambda-1$, 只需要取$A$属于特征值$1$的特征向量即可. 不妨直接取$\alpha_2=(0,0,0,1)^T$.

对于另一个循环空间的生成元$\alpha_1$, 只需要保证$\alpha_1,\mathscr{A}\alpha_1,\mathscr{A}^2\alpha_1,\alpha_2$线性无关(秩为$4$), 从而构成循环基, 不妨取$\alpha_1=(1,1,1,1)^T$. 此时$A\alpha_1=(1,-3,-5,1)^T$, $A^2\alpha_1=(-7,9,25,9)^T$. 此时就得到矩阵 [ P=\begin{pmatrix} 1&1&-7&0 \\
1&-3&9&0 \\
1&-5&25&0 \\
1&1&9&1 \end{pmatrix} ]

且 $$ \mathbb{R}^4=\mathbb{R}[\mathscr{A}]{}(1,1,1,1)^T\oplus\mathbb{R}[\mathscr{A}] {}(0,0,0,1)^T $$

最后解释一下选择$\alpha_1$和$\alpha_2$的合理性(虽然完全可以验证$P^{-1}AP=B$). 已经知道,$m_k$一定是$\alpha_k$的最小零化子. 对于$\alpha_2$, 考虑 $ (A-I)\alpha_2=0 $ 即可. 这刚好要求$\alpha_2$是$\mathscr{A}$关于特征值$1$下的特征向量. 对于$\alpha_1$, 因为$m=\lambda^3+5\lambda^2-\lambda-5$是最小零化子, 所以$\alpha_1$, $\mathscr{A}\alpha_1$, $\mathscr{A}^2\alpha_1$必须线性无关, 否则就说明此时$m_1$不是$\alpha_1$的最小零化子, 这与$\mathbb{R}[\mathscr{A}]\alpha_1$的性质矛盾.


如果您或您的朋友在Pocket等网站阅读本文, 建议使用“阅读原文”功能, 否则可能无法看到由Mathjax生成的数学公式

线性空间的准素分解以及矩阵的准素标准形(附实例)

February 8, 2020
线性代数/Linear Algebra

线性变换不变子空间的导子及其性质

January 28, 2020
线性代数/Linear Algebra 多项式/Polynomial

线性空间的循环子空间与简单应用

January 22, 2020
线性代数/Linear Algebra
comments powered by Disqus