特征向量与特征值
- 什么是特征向量
- 三维空间的旋转
- 矩阵和线性变换
- 特征向量
- 二维线性变换不一定有特征向量
- 一个特征值可能不止一个特征向量
- 特征基
这是关于3Blue1Brown "线性代数的本质"的学习笔记。
什么是特征向量
线性变换过程中,大多数向量离开了其自己张成的空间(也就是通过原点和向量尖端的直线),不过,有些向量的确留在了其张成的空间,这意味着矩阵对它的作用仅仅是拉伸或压缩而已,这些特殊的向量就是变换的特征向量;每个特征向量都有一个相关的值,被称为特征值,这个值是衡量变换中拉伸或压缩比例的因子。
负的特征值意味着线性变换使得空间发生了翻转,而特征向量停留在它张成的直线上,并未发生旋转。
三维空间的旋转
矩阵和线性变换
对于任意一个线性变换,矩阵的列是变换后的基向量。
对于线性变换,较少用坐标系来理解它,更好的方法是求出它的特征向量和特征值。
特征向量
求解矩阵A的特征向量和特征值,就是求解使得这个等式成立的向量 v ⃗ \vec{v} v和数 λ \lambda λ。
为了求解图4中的特征向量和特征值,可以对其做变换:
A v ⃗ = λ v ⃗ ( A − λ I ) v ⃗ = 0 ⃗ \begin{aligned} A\vec{v}=\lambda\vec{v} \\ (A-\lambda I)\vec{v}=\vec{0} \end{aligned} Av=λv(A−λI)v=0
对于上式的求解,可以求:
d e t ( A − λ I ) = 0 det(A-\lambda I)=0 det(A−λI)=0
由前面学习的行列式知识我们知道,当且仅当矩阵代表的变换将空间压缩到更低的维度时,其矩阵的行列式为零,也就存在一个非零向量,使得矩阵和它的乘积为零向量。
如图5所示,假设有一个矩阵,列为 [ 2 , 1 ] T [2,1]^{T} [2,1]T和 [ 2 , 3 ] T [2,3]^{T} [2,3]T,考虑每个对角元素都减去某个变量 λ \lambda λ,想象一下,逐渐调整 λ \lambda λ的值。当 λ \lambda λ的值改变时,矩阵本身发生改变,因此行列式也在改变。我们的目标在于找一个 λ \lambda λ使得这个行列式为零。也就是调整后的变换将空间压缩到一个更低的维度上。在这个例子中, λ \lambda λ等于1时恰到好处。
即,当 λ \lambda λ等于1时,A减去 λ \lambda λ乘以单位阵将空间压缩到一条直线上。这意味着存在一个非零向量 v ⃗ \vec{v} v,使得A减去 λ \lambda λ乘以单位阵的结果乘以 v ⃗ \vec{v} v等于零向量。
也就是说向量 v ⃗ \vec{v} v是A的一个特征向量。
二维线性变换不一定有特征向量
旋转90°的线性变换没有特征向量,因为每个向量都发生了旋转并离开了其张成的空间。
而且如果要求特征值的话,也一定无实数解,如图10所示。
一个特征值可能不止一个特征向量
一个简单的例子就是将所有向量拉伸2倍的线性变换,其变换矩阵如下:
[ 2 0 0 2 ] \begin{bmatrix} 2 & 0\\ 0 & 2 \end{bmatrix} [2002]
这个变换的唯一特征值是2,但平面内每个向量都属于这个特征值的特征向量。因为每个向量在变换后都没有离开其张成的空间。
特征基
如果我们的基向量恰好是特征向量,会发生什么?
比如说,将 i ⃗ \vec{i} i变为原来的-1倍, j ⃗ \vec{j} j变为原来的2倍,这个变换对应的矩阵为
[ − 1 0 0 2 ] \begin{bmatrix} -1 & 0\\ 0 & 2 \end{bmatrix} [−1002]
注意:它们的倍数-1和2,也就是 i ⃗ \vec{i} i和 j ⃗ \vec{j} j的特征值,位于矩阵的对角线上,而其余元素均为0。除了对角元素以外其他元素均为0的矩阵被称为对角矩阵,其所有基向量都是特征向量,矩阵的对角元素就是它们所属的特征值。