线性变换的特征值与特征向量
设$\mathscr{A}$是数域$\mathbb{F}$上的$n$维线性空间$V$的线性变换,若存在$\alpha \neq 0, \lambda \in \mathbb{F}$,使
$$ \mathscr{A}(\alpha) = \lambda \alpha $$
则称$\lambda$为$\mathscr{A}$的一个特征值,称$\alpha$是$\mathscr{A}$的属于特征值$\lambda$的一个特征向量
用通俗的语言解释特征向量,其实就是在线性空间$V$中存在某些特殊的向量,这些向量经过线性变换之后得到的向量方向不变,长度可能会进行伸缩
线性变换$\mathscr{A}$与矩阵表示$A$的特征值和特征向量的关系
- $\lambda$是$\mathscr{A}$的一个特征值$\Leftrightarrow$ $\lambda$是$A$的一个特征值
- $\alpha$是$\mathscr{A}$的属于特征值$\lambda$的一个特征向量$\Leftrightarrow$ $\alpha$的坐标$(x_1,x_2,...,x_n)^T$是$A$的属于特征值$\lambda$的特征向量
例1
设线性变换$\mathscr{A}:\mathbb{C}^3\to \mathbb{C}^3$定义为
$$ \forall X=(x,y,z)^T,\mathscr{A}(X)=\begin{bmatrix}x+y\\x+y\\2z\end{bmatrix} $$
求线性变换$\mathscr{A}$的特征值与特征向量
解:由题可知,线性变换$\mathscr{A}$很容易可以写成矩阵的表示形式,即
$$ \mathscr{A}(X)=\begin{bmatrix}x+y\\x+y\\2z\end{bmatrix}=AX=A\begin{bmatrix}x\\y\\z\end{bmatrix}\\ \Rightarrow A = \begin{bmatrix}1&1&0\\1&1&0\\0&0&2\end{bmatrix} $$
于是问题转为求矩阵$A$的特征值与特征向量,解得
$$ \lambda_1=\lambda_2=2,\alpha_1=(1,1,0)^T,\alpha_2=(0,0,1)^T\\ \lambda_3=0,\alpha_3=(1,-1,0)^T $$
不同基下线性变换的特征值与特征向量的关系
定理:相似矩阵有相同的特征值
线性变换在不同基下的矩阵表示的特征值保持不变,特征向量不同,但是存在关系,具体关系如下
若$\xi=(x_1,x_2,...,x_n)^T$是$n$阶矩阵$A$属于特征值$\lambda$的特征向量,$B=P^{-1}AP$,则$P^{-1}\xi$是B的属于特征值$\lambda$的特征向量
特征子空间
设$\lambda_i$是$\mathscr{A}\in \mathcal{L}(V)$的特征向量($\mathcal{L}(V)$表示线性空间$V$上的全体线性变换的集合),则
$$ V_{\lambda_i}=\{\alpha\mid \mathscr{A}(\alpha)=\lambda_i\alpha\} $$
是$V$的子空间,$V_{\lambda_i}$称为$\mathscr{A}$的特征子空间,$\dim(V_{\lambda_i})$称为$\lambda_i$的几何重数
- 代数重数:设矩阵$A$的特征值$\lambda_i$的重根数为$p_i$,则称$p_i$为$\lambda_i$的代数重数
- 几何重数:设$\lambda_i$为矩阵$A$的特征值,且$\dim(V_{\lambda_i})=q$,则称$q_i$为$\lambda_i$的几何重数。且有$q_i≤p_i$
线性变换的不变子空间
设$\mathscr{A}$是线性空间$V$的线性变换,$W$是$V$的子空间,如果对于任意向量$\alpha \in W$都有$\mathscr{A}(\alpha)\in W$,则称$W$是$\mathscr{A}$的不变子空间。并且$\mathscr{A}$可以看作子空间$W$上的一个线性变换,称为$\mathscr{A}$在$W$上的限制,记做$\mathscr{A}|_W$,而且
$$ \mathscr{A}|_W(\alpha)=\mathscr{A}(\alpha), \forall \alpha \in W $$
图示说明如下
不变子空间的判定定理
$\mathscr{A}\in \mathcal{L}(V)$,$W$是$V$的一个子空间,$\alpha_1,\alpha_2,...,\alpha_m$是$W$的一个基,若
$$ \mathscr{A}(\alpha_i)\in W, i=1,2,...,m $$
则$W$是$\mathscr{A}$的不变子空间
方针准对角化与不变子空间的关系
tips:准对角矩阵也叫分块对角矩阵
设$\mathscr{A}$是线性空间$V$的线性变换,则$V$可以分解为$\mathscr{A}$的不变子空间的直和
$$ V = W_1 \oplus W_2 $$
的充分必要条件是$\mathscr{A}$在$V$的某个基下的矩阵是准对角矩阵
$$ \text{diag}\{A_1,A_2\} $$
其中$A_i$为$\mathscr{A}|_{W_i}$在相应基下对应的矩阵
证明:
(充分性)设$V$可以分解为$\mathscr{A}$的不变子空间的直和$V=W_1\oplus W_2$
取$W_1$的基$\alpha_1,\alpha_2,...,\alpha_r$,$W_2$的基$\alpha_{r+1}, \alpha_{r+2}, \alpha_n$
则$\alpha_1,\alpha_2,...,\alpha_r,\alpha_{r+1},...,\alpha_{n}$为$V$的基
$$ \because W_i为\mathscr{A}的不变子空间\\ \therefore \mathscr{A}(\alpha_j)\in W_1,\ j=1,2,...,r\\ \mathscr{A}(\alpha_j)\in W_2,\ j=r+1,r+2,...,n\\ \Rightarrow \mathscr{A}(\alpha_j)=\sum_{i=1}^r a_{ij}\alpha_i,\ j=1,2,...,r\\ \mathscr{A}(\alpha_j)=\sum_{i=1}^r a_{ij}\alpha_i,\ j=r+1,r+2,...,n $$
故$\mathscr{A}$在基$\alpha_1, \alpha_2,...,\alpha_r,\alpha_{r+1},...,\alpha_n$下的矩阵为$\begin{bmatrix}A_1\\&A_2\end{bmatrix}$
(必要性)设$\mathscr{A}$在$V$的某个基$\alpha_1,\alpha_2,...,\alpha_r,\alpha_{r+1},...,\alpha_n$下的矩阵为准对角矩阵$\text{diag}\{A_1,A_2\}$
令$W_1=\mathcal{L}\{\alpha_1,\alpha_2,...,\alpha_r\}$,$W_2=\mathcal{L}\{\alpha_{r+1}, \alpha_{r+2},...,\alpha_n\}$
则$W_1,W_2$为$\mathscr{A}$的不变子空间,且$W_1+W_2=\mathcal{L}\{\alpha_1,\alpha_2,...,\alpha_r,\alpha_{r+1},...,\alpha_n\}=V$
又$\dim(V)=\dim(W_1)+\dim(W_2)$,故$V=W_1\oplus W_2$
注:上述定理可以推广到$s$个情况
即设$\mathscr{A}\in \mathcal{L}(V)$,则$V$可以分解为$\mathscr{A}$的不变子空间的直和$V=W_1\oplus W_2\oplus ···\oplus W_s$
方阵的相似对角化
定理:矩阵$A$可对角化的充要条件是$A$的每一个特征值的几何重数等于代数重数
例2
设$A^2=E$,试证:$A$的特征值只能是$+1$或$-1$
证明:设$\lambda$是矩阵$A$的任一特征值,其对应的特征向量为$\alpha$,即有$A\alpha=\lambda\alpha$,那么有$A^2\alpha=\lambda^2\alpha$,又$A^2=E$,于是可得$(\lambda^2-1)\alpha=0$,注意到$\alpha\neq0$,从而有$\lambda^2=1$,因此$A$的特征值只可能是$+1$或$-1$
例3
设$A^2=A$,试证:$A$的特征值只可能是$0$或$1$
证明:设$\lambda$是矩阵$A$的任一特征值,其对应的特征向量为$\alpha$,即有$A\alpha=\lambda\alpha$,那么有$A^2\alpha=\lambda^2\alpha$,又$A^2=A$,于是可得$(\lambda^2-\lambda)\alpha=0$,注意到$\alpha\neq0$,从而有$\lambda^2=\lambda$,因此$A$的特征值只可能是$0$或$1$
例4
求矩阵$A=\begin{bmatrix}0&1&0\\-4&4&0\\-2&1&2\end{bmatrix}$的特征值与特征向量
解:$A$的特征多项式
$$ |\lambda E-A|=\begin{bmatrix}\lambda&-1&0\\4&\lambda-4&0\\2&-1&\lambda-2\end{bmatrix}=(\lambda-2)^3 $$
$A$的特征值$\lambda_1=\lambda_2=\lambda_3=2$
当$\lambda=2$时,特征矩阵
$$ \lambda E-A=\begin{bmatrix}2&-1&0\\4&-2&0\\2&-1&0\end{bmatrix}\to\begin{bmatrix}2&-1&0\\0&0&0\\0&0&0\end{bmatrix} $$
对应于特征值$\lambda=2$的线性无关特征向量为:$\alpha_1=[1,2,0]^T,\alpha_2=[0,0,1]^T$,于是属于特征值$\lambda=2$的全部特征向量为$k_1\alpha_1+k_2\alpha_2$,其中$k_1,k_2$不全为$0$