线性变换的特征值与特征向量
设 $\mathscr {A}$ 是数域 $\mathbb {F}$ 上的 $n$ 维线性空间 $V$ 的线性变换,若存在 $\alpha \neq 0, \lambda \in \mathbb {F}$,使
$$ \mathscr{A}(\alpha) = \lambda \alpha $$
则称 $\lambda$ 为 $\mathscr {A}$ 的一个特征值,称 $\alpha$ 是 $\mathscr {A}$ 的属于特征值 $\lambda$ 的一个特征向量
用通俗的语言解释特征向量,其实就是在线性空间 $V$ 中存在某些特殊的向量,这些向量经过线性变换之后得到的向量方向不变,长度可能会进行伸缩
线性变换 $\mathscr {A}$ 与矩阵表示 $A$ 的特征值和特征向量的关系
- $\lambda$ 是 $\mathscr {A}$ 的一个特征值 $\Leftrightarrow$ $\lambda$ 是 $A$ 的一个特征值
- $\alpha$ 是 $\mathscr {A}$ 的属于特征值 $\lambda$ 的一个特征向量 $\Leftrightarrow$ $\alpha$ 的坐标 $(x_1,x_2,...,x_n)^T$ 是 $A$ 的属于特征值 $\lambda$ 的特征向量
例 1
设线性变换 $\mathscr {A}:\mathbb {C}^3\to \mathbb {C}^3$ 定义为
$$ \forall X=(x,y,z)^T,\mathscr{A}(X)=\begin{bmatrix}x+y\\x+y\\2z\end{bmatrix} $$
求线性变换 $\mathscr {A}$ 的特征值与特征向量
解:由题可知,线性变换 $\mathscr {A}$ 很容易可以写成矩阵的表示形式,即
$$ \mathscr{A}(X)=\begin{bmatrix}x+y\\x+y\\2z\end{bmatrix}=AX=A\begin{bmatrix}x\\y\\z\end{bmatrix}\\ \Rightarrow A = \begin{bmatrix}1&1&0\\1&1&0\\0&0&2\end{bmatrix} $$
于是问题转为求矩阵 $A$ 的特征值与特征向量,解得
$$ \lambda_1=\lambda_2=2,\alpha_1=(1,1,0)^T,\alpha_2=(0,0,1)^T\\ \lambda_3=0,\alpha_3=(1,-1,0)^T $$
不同基下线性变换的特征值与特征向量的关系
定理:相似矩阵有相同的特征值
线性变换在不同基下的矩阵表示的特征值保持不变,特征向量不同,但是存在关系,具体关系如下
若 $\xi=(x_1,x_2,...,x_n)^T$ 是 $n$ 阶矩阵 $A$ 属于特征值 $\lambda$ 的特征向量,$B=P^{-1} AP$,则 $P^{-1}\xi$ 是 B 的属于特征值 $\lambda$ 的特征向量
特征子空间
设 $\lambda_i$ 是 $\mathscr {A}\in \mathcal {L}(V)$ 的特征向量($\mathcal {L}(V)$ 表示线性空间 $V$ 上的全体线性变换的集合),则
$$ V_{\lambda_i}=\{\alpha\mid \mathscr{A}(\alpha)=\lambda_i\alpha\} $$
是 $V$ 的子空间,$V_{\lambda_i}$ 称为 $\mathscr {A}$ 的特征子空间,$\dim (V_{\lambda_i})$ 称为 $\lambda_i$ 的几何重数
- 代数重数:设矩阵 $A$ 的特征值 $\lambda_i$ 的重根数为 $p_i$,则称 $p_i$ 为 $\lambda_i$ 的代数重数
- 几何重数:设 $\lambda_i$ 为矩阵 $A$ 的特征值,且 $\dim (V_{\lambda_i})=q$,则称 $q_i$ 为 $\lambda_i$ 的几何重数。且有 $q_i≤p_i$
线性变换的不变子空间
设 $\mathscr {A}$ 是线性空间 $V$ 的线性变换,$W$ 是 $V$ 的子空间,如果对于任意向量 $\alpha \in W$ 都有 $\mathscr {A}(\alpha)\in W$,则称 $W$ 是 $\mathscr {A}$ 的不变子空间。并且 $\mathscr {A}$ 可以看作子空间 $W$ 上的一个线性变换,称为 $\mathscr {A}$ 在 $W$ 上的限制,记做 $\mathscr {A}|_W$,而且
$$ \mathscr{A}|_W(\alpha)=\mathscr{A}(\alpha), \forall \alpha \in W $$
图示说明如下
不变子空间的判定定理
$\mathscr {A}\in \mathcal {L}(V)$,$W$ 是 $V$ 的一个子空间,$\alpha_1,\alpha_2,...,\alpha_m$ 是 $W$ 的一个基,若
$$ \mathscr{A}(\alpha_i)\in W, i=1,2,...,m $$
则 $W$ 是 $\mathscr {A}$ 的不变子空间
方针准对角化与不变子空间的关系
tips:准对角矩阵也叫分块对角矩阵
设 $\mathscr {A}$ 是线性空间 $V$ 的线性变换,则 $V$ 可以分解为 $\mathscr {A}$ 的不变子空间的直和
$$ V = W_1 \oplus W_2 $$
的充分必要条件是 $\mathscr {A}$ 在 $V$ 的某个基下的矩阵是准对角矩阵
$$ \text{diag}\{A_1,A_2\} $$
其中 $A_i$ 为 $\mathscr {A}|_{W_i}$ 在相应基下对应的矩阵
证明:
(充分性)设 $V$ 可以分解为 $\mathscr {A}$ 的不变子空间的直和 $V=W_1\oplus W_2$
取 $W_1$ 的基 $\alpha_1,\alpha_2,...,\alpha_r$,$W_2$ 的基 $\alpha_{r+1}, \alpha_{r+2}, \alpha_n$
则 $\alpha_1,\alpha_2,...,\alpha_r,\alpha_{r+1},...,\alpha_{n}$ 为 $V$ 的基
$$ \because W_i 为 \mathscr {A} 的不变子空间 \\ \therefore \mathscr {A}(\alpha_j)\in W_1,\ j=1,2,...,r\\ \mathscr {A}(\alpha_j)\in W_2,\ j=r+1,r+2,...,n\\ \Rightarrow \mathscr {A}(\alpha_j)=\sum_{i=1}^r a_{ij}\alpha_i,\ j=1,2,...,r\\ \mathscr {A}(\alpha_j)=\sum_{i=1}^r a_{ij}\alpha_i,\ j=r+1,r+2,...,n $$
故 $\mathscr {A}$ 在基 $\alpha_1, \alpha_2,...,\alpha_r,\alpha_{r+1},...,\alpha_n$ 下的矩阵为 $\begin {bmatrix} A_1\\&A_2\end {bmatrix}$
(必要性)设 $\mathscr {A}$ 在 $V$ 的某个基 $\alpha_1,\alpha_2,...,\alpha_r,\alpha_{r+1},...,\alpha_n$ 下的矩阵为准对角矩阵 $\text {diag}\{A_1,A_2\}$
令 $W_1=\mathcal {L}\{\alpha_1,\alpha_2,...,\alpha_r\}$,$W_2=\mathcal {L}\{\alpha_{r+1}, \alpha_{r+2},...,\alpha_n\}$
则 $W_1,W_2$ 为 $\mathscr {A}$ 的不变子空间,且 $W_1+W_2=\mathcal {L}\{\alpha_1,\alpha_2,...,\alpha_r,\alpha_{r+1},...,\alpha_n\}=V$
又 $\dim (V)=\dim (W_1)+\dim (W_2)$,故 $V=W_1\oplus W_2$
注:上述定理可以推广到 $s$ 个情况
即设 $\mathscr {A}\in \mathcal {L}(V)$,则 $V$ 可以分解为 $\mathscr {A}$ 的不变子空间的直和 $V=W_1\oplus W_2\oplus・・・\oplus W_s$
方阵的相似对角化
定理:矩阵 $A$ 可对角化的充要条件是 $A$ 的每一个特征值的几何重数等于代数重数
例 2
设 $A^2=E$,试证:$A$ 的特征值只能是 $+1$ 或 $-1$
证明:设 $\lambda$ 是矩阵 $A$ 的任一特征值,其对应的特征向量为 $\alpha$,即有 $A\alpha=\lambda\alpha$,那么有 $A^2\alpha=\lambda^2\alpha$,又 $A^2=E$,于是可得 $(\lambda^2-1)\alpha=0$,注意到 $\alpha\neq0$,从而有 $\lambda^2=1$,因此 $A$ 的特征值只可能是 $+1$ 或 $-1$
例 3
设 $A^2=A$,试证:$A$ 的特征值只可能是 $0$ 或 $1$
证明:设 $\lambda$ 是矩阵 $A$ 的任一特征值,其对应的特征向量为 $\alpha$,即有 $A\alpha=\lambda\alpha$,那么有 $A^2\alpha=\lambda^2\alpha$,又 $A^2=A$,于是可得 $(\lambda^2-\lambda)\alpha=0$,注意到 $\alpha\neq0$,从而有 $\lambda^2=\lambda$,因此 $A$ 的特征值只可能是 $0$ 或 $1$
例 4
求矩阵 $A=\begin {bmatrix} 0&1&0\\-4&4&0\\-2&1&2\end {bmatrix}$ 的特征值与特征向量
解:$A$ 的特征多项式
$$ |\lambda E-A|=\begin{bmatrix}\lambda&-1&0\\4&\lambda-4&0\\2&-1&\lambda-2\end{bmatrix}=(\lambda-2)^3 $$
$A$ 的特征值 $\lambda_1=\lambda_2=\lambda_3=2$
当 $\lambda=2$ 时,特征矩阵
$$ \lambda E-A=\begin{bmatrix}2&-1&0\\4&-2&0\\2&-1&0\end{bmatrix}\to\begin{bmatrix}2&-1&0\\0&0&0\\0&0&0\end{bmatrix} $$
对应于特征值 $\lambda=2$ 的线性无关特征向量为:$\alpha_1=[1,2,0]^T,\alpha_2=[0,0,1]^T$,于是属于特征值 $\lambda=2$ 的全部特征向量为 $k_1\alpha_1+k_2\alpha_2$,其中 $k_1,k_2$ 不全为 $0$