1. 程式人生 > >從一道常見習題的自然延伸談起

從一道常見習題的自然延伸談起

forall 自然 參考 strong 並且 例如 所有 相關性 等於

以下是復旦高代教材復習題六的第 19 題或高代白皮書的例 6.18:

習題 1 設 $A,B,C$ 均為 $n$ 階復方陣, 滿足 $C=AB-BA$, $AC=CA$ 和 $BC=CB$, 求證: $C$ 的特征值全為零.

這道題目有多種證法, 其中利用特征值理論進行證明是最直接的方法, 例如大家可以參考復旦高代白皮書例 6.18 的兩種證法. 第一種證法是純代數的方法, 利用了矩陣跡的相關性質以及 Newton 公式, 通過 $C$ 的特征值的冪次計算出了其特征多項式. 這種方法最簡單並且可以只要求 $C$ 與 $A,B$ 中的任意一個乘法可交換即可. 第二種證法是純幾何的證法, 利用了如下基本事實: 若兩個矩陣乘法可交換, 那麽一個矩陣的特征子空間一定是另一個矩陣的不變子空間, 這也是線性變換理論中的重要結論. 當然, 上述習題還有其他的證法, 比如下面的證法三利用了 Jordan 標準型理論來進行證明.

習題 1 的證法三 註意到上述習題的條件和結論在同時相似關系下不改變, 故不妨從一開始就假設 $C$ 是 Jordan 標準型 $J=\mathrm{diag}\{J_1,J_2,\cdots,J_k\}$, 其中 $\lambda_1,\lambda_2,\cdots,\lambda_k$ 是 $C$ 的全體不同特征值, $J_i$ 是對應於特征值 $\lambda_i$ 的根子空間的分塊, 即所有屬於特征值 $\lambda_i$ 的 Jordan 塊拼成的分塊對角陣. 由 $AC=CA$, $BC=CB$ 以及高代白皮書的例 6.66 可知, $A=\mathrm{diag}\{A_1,A_2,\cdots,A_k\}$, $B=\mathrm{diag}\{B_1,B_2,\cdots,B_k\}$ 都是分塊對角陣且與 $C$ 有著相同的分塊方式. 再由 $C=AB-BA$ 可得 $J_i=A_iB_i-B_iA_i\,(1\leq i\leq k)$, 兩邊同時取跡即得 $\lambda_i=0$, 從而 $k=1$ 且 $C$ 的特征值全為零. $\Box$

上述三種證法都證明了 $C$ 是一個冪零矩陣. 一個自然延伸的問題是, $C$ 的冪零指數 $N=\min\{r\in\mathbb{Z}^+\mid C^r=0\}$ 等於多少? 如果不能給出 $N$ 的確切數值, 那麽 $N$ 的最佳上界是多少呢? 由 Cayley-Hamilton 定理可知 $C^n=0$, 從而 $N\leq n$. 下面我們先來證明, $C$ 的冪零指數 $N$ 嚴格小於 $n$.

引理 2 記號和假設同習題 1, 則 $C$ 的冪零指數嚴格小於其階數 $n$.

證明 用反證法來證明結論. 設 $C$ 的冪零指數等於 $n$, 則 $C$ 的特征多項式和極小多項式都等於 $\lambda^n$, 從而 $C$ 的 Jordan 標準型為 $J_n(0)$. 沿用證法三的記號和討論, 不妨設 $C=J_n(0)$, 則由 $A,B$ 都與 $C$ 乘法可交換以及高代白皮書的例 7.23 可知, 存在多項式 $f(\lambda),g(\lambda)$, 使得 $A=f(C),B=g(C)$, 從而 $C=AB-BA=f(C)g(C)-g(C)f(C)=0$, 矛盾. $\Box$

為了得到 $C$ 的冪零指數的最佳上界, 我們先證明如下引理.

引理 3 記號和假設同習題 1, 設 $f(\lambda)=\sum\limits_{i=0}^ma_i\lambda^m$ 為 $m$ 次多項式.

(i) 對任意的 $k\geq 1$, $AB^k-B^kA=kB^{k-1}C$, 其中約定 $B^0=I_n$;

(ii) $Af(B)-f(B)A=f‘(B)C$;

(iii) 若 $B$ 適合 $f(\lambda)$, 即 $f(B)=0$, 則 $C^m=0$.

證明 (i) 對 $k$ 進行歸納, 當 $k=1$ 時, 結論顯然成立. 設 $k-1$ 時結論成立, 即有 $AB^{k-1}-B^{k-1}A=(k-1)B^{k-2}C$, 則 $$\begin{align*}AB^k-B^kA&=AB^k-B^{k-1}AB+B^{k-1}AB-B^kA\\ &=(AB^{k-1}-B^{k-1}A)B+B^{k-1}(AB-BA)\\ &=(k-1)B^{k-2}CB+B^{k-1}C=kB^{k-1}C.\end{align*}$$

(ii) 由 (i) 可知, $Af(B)-f(B)A=\sum\limits_{i=0}^ma_i(AB^i-B^iA)=\sum\limits_{i=1}^ma_iiB^{i-1}C=f‘(B)C$.

(iii) 由 (ii) 及 $f(B)=0$ 可得 $f‘(B)C=0$, 再由 (ii) 可得 $Af‘(B)-f‘(B)A=f‘‘(B)C$, 從而 $f‘‘(B)C^2=Af‘(B)C-f‘(B)AC=Af‘(B)C-f‘(B)CA=0$. 同理不斷地做下去, 最後可得 $f^{m}(B)C^m=0$, 註意到 $f^{m}(B)=m!a_mI_n$, 故 $C^m=0$. $\Box$

習題 1 的證法四 在引理 3 (iii) 中, 取 $f(\lambda)=|\lambda I_n-B|$ 為 $B$ 的特征多項式, 則由 Cayley-Hamilton 定理可知 $f(B)=0$, 故由 (iii) 可知 $C^n=0$, 即 $C$ 是冪零陣. $\Box$

命題 4 記號和假設同習題 1, 設 $m$ 是 $A,B$ 的極小多項式次數的最小值, 則 $C^m=0$. 特別地, $C$ 的冪零指數 $N\leq m$, 並且存在例子使得等號成立.

證明 不妨設 $B$ 的極小多項式 $m(\lambda)$ 的次數為 $m$, 它小於等於 $A$ 的極小多項式的次數. 在引理 3 (iii) 中代入 $m(\lambda)$, 即可得到 $C^m=0$. 我們舉例說明這樣的 $m$ 可以等於冪零指數. 設 $A=\begin{pmatrix} 0 & 0 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 0 \end{pmatrix}$, $B=\begin{pmatrix} 0 & 0 & 1 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{pmatrix}$, $C=AB-BA=\begin{pmatrix} 0 & 0 & 0 \\ 0 & 0 & 1 \\ 0 & 0 & 0 \end{pmatrix}$. 容易驗證 $C$ 與 $A,B$ 都乘法可交換, $A,B$ 的極小多項式都是 $\lambda^2$, 並且 $C$ 的冪零指數就等於 2. $\Box$

一般來說, $C$ 的冪零指數是很難確定的. 例如, 若 $A,B$ 乘法可交換, 則 $C=0$, 此時 $C$ 的冪零指數等於 1, 但 $A,B$ 的極小多項式次數的最小值可以等於 $n$. 因此命題 4 說明: $A,B$ 的極小多項式次數的最小值只是冪零指數的最佳上界而已. 接下去我們考慮習題 1 的一個變形, 令 $C=\mu B$, 其中 $\mu$ 是非零復數. 在這種情形下, $C$ 與 $B$ 乘法可交換, 但並不要求 $AC=CA$ 成立, 所以下面的討論跟上面的討論並沒有太多的關聯. 這個變形是一道常見的考研試題, 也是 2009 年第一屆全國大學生數學競賽預賽的一道代數試題 ($\mu=1$ 的情形).

習題 5 設 $A,B$ 均為 $n$ 階復方陣, 滿足 $AB-BA=\mu B$, 其中 $\mu$ 為非零復數. 求證: $B$ 的特征值全為零, 並且 $A,B$ 有公共的特征向量.

證明 註意到習題 1 的證法一只利用了 $BC=CB$ 這一條件, 所以作為證法一的特例, 馬上可以得到 $B$ 的特征值全為零. 設 $V_0$ 為 $B$ 屬於特征值零的特征子空間, 容易驗證 $V_0$ 是 $A$-不變子空間. 考慮 $A$ 在 $V_0$ 上的限制, 這個線性變換一定存在特征向量 $\alpha$, 於是 $\alpha$ 就是 $A,B$ 公共的特征向量. $\Box$

我們同樣可以考慮習題 5 自然延伸的問題, 那就是 $B$ 的冪零指數的最佳上界是多少呢? 因為習題 1 和習題 5 在條件上有差別, 所以命題 4 的結論並不適用於習題 5, 故我們轉而證明如下結論.

命題 6 記號和假設同習題 5, 設 $A$ 有 $k$ 個不同的特征值, 則 $B^k=0$. 特別地, $B$ 的冪零指數 $N\leq k$.

證明 我們利用 $A$ 的 Jordan 標準型來進行證明. 任一復數 $z=a+bi$ 都等同於復平面上的點 $(a,b)$, 規定實部的權重大於虛部的權重, 故可對全體復數進行實部加虛部的字典排序. 對 $A$ 乘以 $1/\mu$ 不改變命題 6 的條件和結論, 故不妨設 $\mu=1$. 註意到命題 6 的條件和結論在同時相似關系下不改變, 故不妨從一開始就假設 $A$ 是 Jordan 標準型 $J=\mathrm{diag}\{J_1,J_2,\cdots,J_k\}$, 其中 $\lambda_1>\lambda_2>\cdots>\lambda_k$ 是 $A$ 的全體不同特征值, $J_i$ 是對應於特征值 $\lambda_i$ 的根子空間的分塊, 即所有屬於特征值 $\lambda_i$ 的 Jordan 塊拼成的分塊對角陣. 設 $B=(B_{ij})_{k\times k}$ 為對應的分塊, 則由 $AB-BA=B$ 可得 $J_iB_{ij}=B_{ij}(J_j+I)$. 註意到 $J_i$ 的特征值全為 $\lambda_i$, $J_j+I$ 的特征值全為 $\lambda_j+1$, 若 $i\geq j$, 則 $\lambda_i\leq \lambda_j<\lambda_j+1$, 故 $J_i$ 與 $\lambda_j+I$ 沒有公共的特征值, 由高代白皮書的例 6.63 可知 $B_{ij}=0$; 若 $i<j$ 但 $\lambda_i\neq \lambda_j+1$, 則同樣有 $B_{ij}=0$. 因此, 若存在非零的塊 $B_{ij}$, 則一定滿足 $i<j$ 且 $\lambda_i=\lambda_j+1$. 由於 $\lambda_1,\lambda_2,\cdots,\lambda_k$ 都是互異的, 故在 $B$ 的第 $i$ 分塊行中, 非零的塊 $B_{ij}$ 最多只有一個, 比如一個最差的情形就是非零的塊全部集中在上次對角線上. 利用矩陣 $B$ 中非零塊的稀疏性 (上述性質), 由分塊矩陣的乘法不難驗證 $B^k=0$. $\Box$

例 7 將 $AB-BA=\mu B$ 改寫為 $AB=B(A+\mu I_n)$, 取矩陣 $A=\begin{pmatrix} 0 & 0 \\ 0 & 1 \end{pmatrix}$. 當 $\mu=1$ 時, 取 $B=\begin{pmatrix} 0 & 0 \\ 1 & 0 \end{pmatrix}$, 則命題 6 中的 $k=2$ 就等於 $B$ 的冪零指數, 即達到了最佳上界; 而當 $\mu=2$ 時, 滿足上述條件的矩陣 $B=0$, 這個結論比命題 6 的結論 $B^2=0$ 來的更強. 因此, 對應於不同的 $\mu$, $A$ 的不同特征值的個數並非都是 $B$ 的冪零指數的最佳上界. 下面我們來做一點改進, 使得上界達到最佳.

命題 8 設 $R(A)$ 是 $A$ 的譜集, 令 $$m=\max\limits_{\lambda\in R(A)}\{s(\lambda)\in\mathbb{Z}^+\mid \lambda+j\mu\in R(A)\,(\forall\,0\leq j<s(\lambda)),\,\,\lambda+s(\lambda)\mu\not\in R(A)\},$$ 則 $B^m=0$. 特別地, $B$ 的冪零指數 $N\leq m$.

證明 由 Jordan 標準型理論可知, 存在 $\mathbb{C}^n$ 的一組基 $\{e_1,e_2,\cdots,e_n\}$, 使得 $A$ 在這組基下的表示矩陣為 Jordan 標準型 $J=\mathrm{diag}\{J_{r_1}(\lambda_1),J_{r_2}(\lambda_2),\cdots,J_{r_k}(\lambda_k)\}$. 對特征值 $\lambda_1$ 而言, 我們有 $$Ae_1=\lambda_1e_1,Ae_2=e_1+\lambda_1e_2,\cdots,Ae_{r_1}=e_{r_1-1}+\lambda_1e_{r_1}.$$ 設 $s_1=s(\lambda_1)$, 即滿足 $\lambda_1+j\mu\in R(A)\,(\forall\,0\leq j<s_1),\,\,\lambda_1+s_1\mu\not\in R(A)$, 我們只要證明 $B^{s_1}e_j=0\,(\forall\,1\leq j\leq r_1)$, 則 $B^me_i=0\,(1\leq i\leq n)$, 從而 $B^m=0$ 成立. 在關系式 $(*)$ $AB=B(A+\mu I_n)$ 的兩邊右乘 $e_1$, 可得 $ABe_1=(\lambda_1+\mu)Be_1$. 再在關系式 $(*)$ 的兩邊右乘 $Be_1$, 可得 $AB^2e_1=(\lambda_1+2\mu)B^2e_1$. 不斷這樣做下去, 最後可得 $AB^{s_1}e_1=(\lambda_1+s_1\mu)B^{s_1}e_1$, 但 $\lambda_1+s_1\mu$ 不是 $A$ 的特征值, 故 $B^{s_1}e_1=0$. 在關系式 $(*)$ 的兩邊右乘 $e_2$, 可得 $ABe_2=(\lambda_1+\mu)Be_2+Be_1$. 再在關系式 $(*)$ 的兩邊右乘 $Be_2$, 可得 $AB^2e_2=(\lambda_1+2\mu)B^2e_2+B^2e_1$. 不斷這樣做下去, 最後可得 $AB^{s_1}e_2=(\lambda_1+s_1\mu)B^{s_1}e_2+B^{s_1}e_1=(\lambda_1+s_1\mu)B^{s_1}e_2$, 但 $\lambda_1+s_1\mu$ 不是 $A$ 的特征值, 故 $B^{s_1}e_2=0$. 重復上述討論, 最終可得 $B^{s_1}e_j=0\,(\forall\,1\leq j\leq r_1)$ 成立. $\Box$

由定義可知, 命題 8 中的 $m$ 小於等於 $A$ 的不同特征值的總個數, 因此命題 8 提供的上界比命題 6 提供的上界更加精確. 例 7 的 $\mu=2$ 的例子中, $m=1$ 就是 $B$ 的冪零指數, 這也說明命題 8 給出的是最佳上界.

命題 6 是復旦大學數學學院 16 級高等代數 II 期中考試第五大題的推廣, 命題 6 的證明由 16 級陳傑新同學給出, 命題 8 的證明由 16 級朱民哲同學給出.

從一道常見習題的自然延伸談起