前言
《线性空间》定义了空间,这章节来研究空间与空间的关联性
函数
函数是一个规则或映射,将一个集合中的每个元素(称为自变量)映射到另一个集合中的唯一元素(称为因变量)。
一般函数从 “A” 的每个元素指向 “B” 的一个函数
它不会有一个 “A” 的元素指向多于一个 “B” 的元素,所以一对多在函数是不允许的(“f(x) = 7 或 9” 是不允许的)
但多于一个 “A” 的元素可以指向同一个 “B” 的元素(多对一是允许的)
- 单射的意思是 “A” 的每个元素都有 它独有的在 “B” 的相对元素。单射也称为 “一对一”。但可以有些 “B” 的元素没有相对的 “A” 的元素。单射存在可逆函数,使得B对A单射
- 满射,每个(所有) “B” 的元素都有至少一个相对的 “A” 的元素(可能多于一个)。
- 双射,单射和满射都成立。
线性空间的同构
- 同构映射具有反身性、对称性与传递性。
- 内积空间同构,还需要满足内积不变, ∀ α , β ∈ V , 有 ( σ ( α ) , σ ( β ) ) = ( α , β ) \forall \alpha,\beta \in V, 有(\sigma(\alpha),\sigma(\beta)) = (\alpha, \beta) ∀α,β∈V,有(σ(α),σ(β))=(α,β)
使用单射,满射满足性线空间性质的称为同态(了解下)
线性变换
把上述同构定义中的 V ′ V' V′换成 V V V,即 V V V空间通过双射函数到 V V V空间的映射。称为“自同构”。如果是“单射”或者“满射”函数映射,则称为“自同态”。也称叫“线性变换”。
线性变换(linear transformation)是线性空间V到其自身的线性映射
线性变换的矩阵
从公式可得,因为最终值是不变的,如果基组选取不同,A矩阵会变动
线性变换不同基下的矩阵
由上面的关系式可以看出,若选定不同的基,则同一个线性变换在不同基下面的矩阵是不同的,但是这两个矩阵之间存在着一种特殊的关系
矩阵 A A A和矩阵 B B B 之间的这种关系为相似关系,即同一个线性变换在不同基下的矩阵是相似的。即有相似矩阵的性质
矩阵的相似对角化
上面讲述了线性变换在不同基下的矩阵之间的关系,知道了线性变换在不同基下的矩阵是相似的。进而我们可以通过选取不同的基,使得线性变换在这组基下的矩阵的形式最简单,由于对角矩阵具有良好的性质,因此我们希望通过选取合适的基,使得线性变换在这组基下的矩阵是对角矩阵。怎么找到对角矩阵 Λ \Lambda Λ?
Λ = P − 1 A P \Lambda = P^{-1}AP Λ=P−1AP
A是已知 φ \varphi φ,问题等价于寻找一个可逆矩阵P
反过来,若 A A A是可相似对角化,那么 A A A是否有n个线性无关的特征向量呢?
综上,矩阵 A A A可相似对角化的充分必要条件是矩阵 A A A有n个线性无关的特征向量
求相似对角化矩阵
- 已知: Λ = P − 1 A P , { ε } P = { η } \Lambda = P^{-1}AP, \{\varepsilon\}P = \{\eta\} Λ=P−1AP,{ε}P={η}, P是过渡矩阵
- 假设 { ε } \{\varepsilon\} {ε}是欧式空间的标准正交基组,已矩阵A
- 验证充分必要条件:矩阵 A A A有n个线性无关的特征向量
- 将n个线性无关的特征向量,组建新的基组{ β \beta β}
- 为了更方便的计算,我们将基组{ β \beta β},施密特正交化,求出标准正交基本组{ η \eta η}
- 根据 { ε } P = { η } \{\varepsilon\}P = \{\eta\} {ε}P={η}得 P = { η } P=\{\eta\} P={η}
- 代入公式 Λ = P − 1 A P \Lambda = P^{-1}AP Λ=P−1AP,得对角矩阵 Λ \Lambda Λ
具体计算过程:实对称矩阵的对角化
对于n维线性空间V上的线性变换A,如果能够找到一个基{ a 1 , a 2 , . . . a n a_1,a_2,...a_n a1,a2,...an}使得在此基下的矩阵A是对角矩阵,那么称A是可对角化。但是如果A不能对角化呢?我们便退而求其次,找到一个基{ a 1 , a 2 , . . . a n a_1,a_2,...a_n a1,a2,...an}使得在此基下的矩阵A是分块对角矩阵。
不变子空间
A \Alpha A是线性变换
- Im A \operatorname{Im} A ImA 是指线性变换 A 的值域(Image),也被称为像空间或范围。它表示所有通过该线性变换 A 映射到的向量的集合。
- Ker A \operatorname{Ker} A KerA是指线性变换A的核空间(Kernel),也被称为零空间(Null Space)。它表示所有在该线性变换下映射到零向量的向量的集合。
- A的特征子空间(Eigenspace)是指在线性变换A下与给定特征值 λ {\lambda} λ相对应的所有特征向量构成的子空间 V λ {V_\lambda} Vλ。
一些重要不变子空间
-
Im A \operatorname{Im} A ImA或V空间本身
- 任取 a ∈ V , A a ∈ V a \in V, Aa \in V a∈V,Aa∈V
- A a ∈ Im A , A ( A a ) ∈ Im A Aa \in \operatorname{Im} A, A(Aa) \in \operatorname{Im} A Aa∈ImA,A(Aa)∈ImA
-
Ker A \operatorname{Ker} A KerA或0空间
-
A的特征子空间
假设V在A线性变化下,有一特征值为 λ {\lambda} λ,对应特征向量组成的空间为A的特征子空间,记 V λ {V_\lambda} Vλ.
- 任取 a ∈ V λ , A a = λ a ∈ V λ a \in V_{\lambda},Aa=\lambda a \in V_{\lambda} a∈Vλ,Aa=λa∈Vλ
-
设B也是V上的线性变换,如果A和B可交换,那么 Im B , Ker B , B \operatorname{Im} B,\operatorname{Ker} B,B ImB,KerB,B的特征子空间 是A-子空间
-
V上的线性变换A的不变子空间的和与交仍是A的不变子空间.
- a ∈ A 1 − , b ∈ A 2 − , a + b ∈ A 1 − ⊕ A 2 − a \in A_1-, b \in A_2-, a+b \in A_1- \oplus A_2- a∈A1−,b∈A2−,a+b∈A1−⊕A2−
- A ( a + b ) = A a + A b ∈ A − ⊕ B − A(a+b) = Aa + Ab \in A- \oplus B- A(a+b)=Aa+Ab∈A−⊕B−
线性变换在不变子空间上的限制
不变子空间与线性变换的矩阵化简
把基本不变子空间W分成 ( ε w , ε o t h r e r ) (\varepsilon_w,\varepsilon_{othrer}) (εw,εothrer),又因为 A 1 A_1 A1是W的线性变化,在 ε w \varepsilon_w εw下必是 ε w A 1 \varepsilon_wA_1 εwA1.即当仅仅当矩阵满足以下形状
( A 1 A 2 0 A 3 ) \begin{pmatrix} A_1 & A_2\\ 0 & A_{3} \end{pmatrix} (A10A2A3)
才能满足需求。
即:V的线性变换A可分块对角矩阵化的充要条件是 V可分解为A的不变子空间的直和
Hamilton-Cayley定理与值和分解
即将特征多项式
f ( λ ) = | λ I − A ∣ f(\lambda)=|\lambda I-A| f(λ)=|λI−A∣
再根据多项式因式分解得
f ( λ ) = f 1 ( λ ) f 2 ( λ ) . . . f n ( λ ) = 0 f(\lambda)=f_1(\lambda)f_2(\lambda)...f_n(\lambda) = 0 f(λ)=f1(λ)f2(λ)...fn(λ)=0
其中 f 1 ( λ ) f 2 ( λ ) . . . f n ( λ ) f_1(\lambda)f_2(\lambda)...f_n(\lambda) f1(λ)f2(λ)...fn(λ)互为素数
V = Ker f ( λ ) = Ker f 1 ( λ ) ⨁ Ker f 2 ( λ ) ⨁ . . . ⨁ Ker f n ( λ ) V=\operatorname{Ker}f(\lambda)=\operatorname{Ker}f_1(\lambda) \bigoplus \operatorname{Ker}f_2(\lambda)\bigoplus...\bigoplus\operatorname{Ker}f_n(\lambda) V=Kerf(λ)=Kerf1(λ)⨁Kerf2(λ)⨁...⨁Kerfn(λ)
将 f ( λ ) f(\lambda) f(λ)进一步分解
f ( λ ) = ( λ − λ 1 ) r 1 ( λ − λ 2 ) r 2 . . . ( λ − λ n ) r n f(\lambda)=(\lambda-\lambda_1)^{r_1}(\lambda-\lambda_2)^{r_2}...(\lambda-\lambda_n)^{r_n} f(λ)=(λ−λ1)r1(λ−λ2)r2...(λ−λn)rn
再线性变换A代入得
V = Ker ( ( A − λ 1 I ) r 1 ) ⨁ Ker ( ( A − λ 2 I ) r 2 ) ⨁ . . . ⨁ Ker ( ( A − λ n I ) r n ) V=\operatorname{Ker}((A-\lambda_1 I)^{r_1}) \bigoplus \operatorname{Ker}((A-\lambda_2I)^{r_2})\bigoplus...\bigoplus\operatorname{Ker}((A-\lambda_n I)^{r_n}) V=Ker((A−λ1I)r1)⨁Ker((A−λ2I)r2)⨁...⨁Ker((A−λnI)rn)
其中 Ker ( ( A − λ n I ) r n ) , n = 1 , 2... s \operatorname{Ker}((A-\lambda_n I)^{r_n}), n=1,2...s Ker((A−λnI)rn),n=1,2...s,称为根子空间
对角矩阵中的每个分块矩阵,对应着不同特征值 λ \lambda λ对应的空间
主要参考
《单射、满射和双射》
《高等代数】线性空间的同构》
《线性同构与欧氏空间同构》
《什么是矩阵对角化》
《浅谈线性变换和矩阵之间的关系》
《浅谈矩阵的相似对角化(一)》
《线性代数(实对称矩阵的对角化)》
《不变子空间》
《【高等代数(丘维声著)笔记】6.8线性变换的不变子空间》