矩阵是数字或 “元素” 的矩形阵列。当矩阵 A A A 有 m m m 行 n n n 列,则是一个 m × n m\times n m×n 的矩阵。如果矩阵的形状相同,则它们可以相加。矩阵也可以乘上任意常数 c c c。以下是 A + B A+B A+B 和 2 A 2A 2A 的例子,它们都是 3 × 2 3\times2 3×2 的矩阵: [ 1 2 3 4 0 0 ] + [ 2 2 4 4 9 9 ] = [ 3 4 7 8 9 9 ] , 2 [ 1 2 3 4 0 0 ] = [ 2 4 6 8 0 0 ] \begin{bmatrix}1&2\\3&4\\0&0\end{bmatrix}+\begin{bmatrix}2&2\\4&4\\9&9\end{bmatrix}=\begin{bmatrix}3&4\\7&8\\9&9\end{bmatrix},\kern 10pt2\begin{bmatrix}1&2\\3&4\\0&0\end{bmatrix}=\begin{bmatrix}2&4\\6&8\\0&0\end{bmatrix} 130240 + 249249 = 379489 ,2 130240 = 260480 矩阵的加法和向量的加法一样,每次处理一个元素。我们也可以将列向量看成是只有一列的矩阵( n = 1 n=1 n=1)。 − A -A −A 可以看成是 c c c 乘矩阵 A A A( c = − 1 c=-1 c=−1),它与 A A A 中全部元素的符号都相反。 A A A 加上 − A -A −A 是零矩阵,它的全部元素均为零。这些是基础知识,下面将考虑矩阵的乘法。
一、第一种方法:单个元素的计算
第 i i i 行第 j j j 列的元素记为 a i j a_{ij} aij 或 A ( i , j ) A(i,j) A(i,j),第一行的 n n n 个元素分别记为 a 11 , a 12 , ⋯ , a 1 n a_{11},a_{12},\cdots,a_{1n} a11,a12,⋯,a1n。左下角的元素是 a m 1 a_{m1} am1,右下角的元素是 a m n a_{mn} amn。行的数字 i i i 从 1 1 1 到 m m m,列的数字 j j j 从 1 1 1 到 n n n。
若矩阵 A A A 和 B B B 可以相乘时,这里总共讨论 4 4 4 种方法求 A B AB AB。矩阵 A A A 和 B B B 相乘需要满足如下条件:
A B AB AB 可以相乘: 若 A A A 有 n n n 列,则 B B B 必须由 n n n 行
当 A A A 是 3 × 2 3\times2 3×2 的矩阵时, B B B 可以是 2 × 1 2\times1 2×1(向量)、 2 × 2 2\times2 2×2(方阵)或 2 × 20 2\times20 2×20 的矩阵,必须是 2 2 2 行,但是不可以是 3 × 2 3\times2 3×2 的矩阵。 A A A 乘数 B B B 的每一列。 第一种矩阵相乘的方法是点积的方式,矩阵的乘法遵守以下法则: 矩阵乘法的基础法则 A B 乘 C 等于 A 乘 B C ( 2.4.1 ) \pmb{矩阵乘法的基础法则}\kern 10ptAB\,乘\,C\,等于\,A\,乘\,BC\kern 10pt(2.4.1) 矩阵乘法的基础法则AB乘C等于A乘BC(2.4.1)括号可以在 A B C ABC ABC 之间安全移动, ( A B ) C = A ( B C ) (AB)C=A(BC) (AB)C=A(BC),线性代数也是基于这个法则。
假设 A A A 是 m × n m\times n m×n 的矩阵, B B B 是 n × p n\times p n×p 的矩阵,它们可以相乘,乘积 A B AB AB 是 m × p m\times p m×p 的矩阵。 ( m × n ) × ( n × p ) = ( m × p ) , [ m rows n c o l u m n s ] [ n r o w s p columns ] = [ m rows p columns ] (\pmb m\times n)\times(n\times \pmb p)=(\pmb m\times \pmb p),\kern 10pt\begin{bmatrix}\pmb{m\,\,\textrm{rows}}\\n\,\,columns\end{bmatrix}\begin{bmatrix}n\,\,rows\\\pmb{p\,\textrm{columns}}\end{bmatrix}=\begin{bmatrix}\pmb{m\,\,\textrm{rows}}\\\pmb{p\,\textrm{columns}}\end{bmatrix} (m×n)×(n×p)=(m×p),[mrowsncolumns][nrowspcolumns]=[mrowspcolumns]一行乘一列是一种极端的情况, 1 × n 1\times n 1×n 乘 n × 1 n\times 1 n×1 的结果是 1 × 1 1\times1 1×1,这个数字就是点积。
任何情况下 A B AB AB 中的元素都是点积, A B AB AB 左上角的元素 ( 1 , 1 ) (1,1) (1,1) 是 ( A 的行 1 ) ⋅ ( B 的列 1 ) (A\,的行\,1)\cdot(B\,的列\,1) (A的行1)⋅(B的列1)。这就是第一种计算方法,是矩阵乘法常用的方法。计算 A A A 的每一行和 B B B 的每一列的点积。 1. A B 的行 i 列 j 元素是 ( A 的行 i ) ⋅ ( B 的列 j ) 1.\kern 8ptAB\,的行\,i\,列\,j\,元素是\kern 10pt(A\,的行\,i)\cdot(B\,的列\,j) 1.AB的行i列j元素是(A的行i)⋅(B的列j)Figure 2.8 是 4 × 5 4\times5 4×5 矩阵 A A A 的第二行 ( i = 2 ) (i=2) (i=2), 5 × 6 5\times6 5×6 矩阵 B B B 的第三列 ( j = 3 ) (j=3) (j=3),它们的点积在 A B AB AB 的行 2 2 2 列 3 3 3。矩阵 A B AB AB 的行数与 A A A ( 4 4 4 行)相同,列数与 B B B( 6 6 6 列)相同。
【例1】当且仅当方阵(Square matrices)的大小相同时,它们才可以相乘: [ 1 1 2 − 1 ] [ 2 2 3 4 ] = [ 5 6 1 0 ] \begin{bmatrix}1&\kern 7pt1\\2&-1\end{bmatrix}\begin{bmatrix}2&2\\3&4\end{bmatrix}=\begin{bmatrix}5&6\\1&0\end{bmatrix} [121−1][2324]=[5160]第一个点积是 1 ⋅ 2 + 1 ⋅ 3 = 5 1\cdot2+1\cdot3=5 1⋅2+1⋅3=5,其它三个点积可以通过同样的方法计算。每个点积需要两次乘法,总共是 8 8 8 次。
如果 A A A 和 B B B 都是 n × n n\times n n×n 的方阵,则 A B AB AB 也是 n × n n\times n n×n 的方阵,它包含 n 2 n^2 n2 次点积,即 A A A 的行数乘 B B B 的列数。每一个点积需要 n n n 次乘法,所以计算 A B AB AB 总共需要 n 3 n^3 n3 次乘法。当 n = 100 n=100 n=100 时,需要 10 0 3 = 1000000 100^3=1000000 1003=1000000 次乘法;当 n = 2 n=2 n=2 时,需要 2 3 = 8 2^3=8 23=8 次乘法。
目前有人找到只需要 7 7 7 次(会有额外的加法)的方法。但是比较难以处理,所以目前仍认为正常的科学计算需要 n 3 n^3 n3 次。
【例2】假设 A A A 是一个行向量( 1 × 3 1\times3 1×3), B B B 是一个列向量( 3 × 1 3\times1 3×1),则 A B AB AB 是 1 × 1 1\times1 1×1(仅有一个点积,一个元素)。若反过来相乘, B A BA BA(一列乘一行)则会得到一个完整的 3 × 3 3\times3 3×3 矩阵,这样的乘法也是允许的! 列乘行 ( n × 1 ) ( 1 × n ) = ( n × n ) [ 0 1 2 ] [ 1 2 3 ] = [ 0 0 0 1 2 3 2 4 6 ] \begin{matrix}列乘行\\(n\times1)(1\times n)=(n\times n)\end{matrix}\kern 10pt\begin{bmatrix}0\\1\\2\end{bmatrix}\begin{bmatrix}1&2&3\end{bmatrix}=\begin{bmatrix}0&0&0\\1&2&3\\2&4&6\end{bmatrix} 列乘行(n×1)(1×n)=(n×n) 012 [123]= 012024036 一行乘一列是内积(inner product),这是点积的另一个名称。一列乘一行是外积(outer product)。这是一些矩阵乘法的极端情况。
二、第二和第三种方法:行和列
在大图(big picture)中, A A A 乘 B B B 的每一列,结果是 A B AB AB 的一列,该列是 A A A 列的组合。 A B \pmb{AB} AB 的每一列都是 A \pmb A A 列的线性组合。这是矩阵乘法的列图像: 2. 矩阵 A 乘 B 的每一列 A [ b 1 ⋯ b p ] = [ A b 1 ⋯ A b p ] 2.\kern 8pt矩阵\,A\,乘\,B\,的每一列\kern 10ptA[b_1\cdots\, b_p]=[Ab_1\cdots\,Ab_p] 2.矩阵A乘B的每一列A[b1⋯bp]=[Ab1⋯Abp]行图像则相反, A A A 的每一行乘整个矩阵 B B B 是 A B AB AB 的一行。 A B \pmb{AB} AB 的每一行都是 B \pmb B B 行的线性组合: 3. A 的每一行乘矩阵 B [ A 的行 i ] [ 1 2 3 4 5 6 7 8 9 ] = [ A B 的行 i ] 3.\kern 8ptA\,的每一行乘矩阵\,B\kern 10pt[A\,的行\,i]\begin{bmatrix}1&2&3\\4&5&6\\7&8&9\end{bmatrix}=[AB\,的行\,i] 3.A的每一行乘矩阵B[A的行i] 147258369 =[AB的行i]消元法中用到的是行运算( E 乘 A E\,乘\,A E乘A), A A − 1 AA^{-1} AA−1 中用到的是列运算。“行-列图像” 有行与列的点积,手算矩阵时经常使用点积:有 m n p mnp mnp 次乘法/加法 步骤。 A B = ( m × n ) ( n × p ) = ( m × p ) , + m p 次点积,每次点积需要 n 个步骤 ( 2.4.2 ) AB=(m\times n)(n\times p)=(m\times p),+\kern 7ptmp\,次点积,每次点积需要\,n\,个步骤\kern 5pt(2.4.2) AB=(m×n)(n×p)=(m×p),+mp次点积,每次点积需要n个步骤(2.4.2)
三、第四种方法:列乘行
矩阵的第四种乘法是列乘行,然后将其相加: 4. A 的列 1 至列 n ,乘 B 的行 1 至行 n ,将全部矩阵相加 4.\kern 8ptA\,的列\,1\,至列\,n,乘\,B\,的行\,1\,至行\,n,将全部矩阵相加 4.A的列1至列n,乘B的行1至行n,将全部矩阵相加 A A A 的列 1 1 1 乘 B B B 的行 1 1 1, A A A 的列 2 , 3 2,3 2,3 乘 B B B 的行 2 , 3 2,3 2,3,然后相加: [ col 1 col 2 col 3 ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ] [ row 1 ⋯ row 2 ⋯ row 3 ⋯ ] = ( col 1 ) ( row 1 ) + (col 2)(row 2)+(col 3)(row 3) \begin{bmatrix}\pmb{\textrm{col}\,1}&\pmb{\textrm{col\,2}}&\pmb{\textrm{col\,3}}\\\pmb \cdot&\pmb\cdot&\pmb\cdot\\ \pmb\cdot&\pmb\cdot&\pmb\cdot\end{bmatrix}\begin{bmatrix}\pmb{\textrm{row\,1}}&\pmb\cdots&\\\pmb{\textrm{row\,2}}&\pmb\cdots\\\pmb{\textrm{row\,3}}&\pmb\cdots\end{bmatrix}=\pmb{(\textrm {col\,1})(\textrm{row\,1})+\textrm{(col\,2)(row\,2)+(col\,3)(row\,3)}} col1⋅⋅col2⋅⋅col3⋅⋅ row1row2row3⋯⋯⋯ =(col1)(row1)+(col2)(row2)+(col3)(row3)当 A A A 和 B B B 均是 2 × 2 2\times2 2×2 的矩阵时 A B = [ a b c d ] [ E F G H ] = [ a E + b G a F + b H c E + d G c F + d H ] AB=\begin{bmatrix}\pmb a&b\\\pmb c&d\end{bmatrix}\begin{bmatrix}\pmb E&\pmb F\\G&H\end{bmatrix}=\begin{bmatrix}\pmb{aE}+bG&\pmb{aF}+bH\\\pmb{cE}+dG&\pmb{cF}+dH\end{bmatrix} AB=[acbd][EGFH]=[aE+bGcE+dGaF+bHcF+dH] A 的列乘 B 的行,再相加 A B = [ a c ] [ E F ] + [ b d ] [ G H ] ( 2.4.3 ) A\,的列乘\,B\, 的行,再相加\kern 10ptAB=\begin{bmatrix}\pmb a\\\pmb c\end{bmatrix}\begin{bmatrix}\pmb E&\pmb F\end{bmatrix}+\begin{bmatrix}b\\d\end{bmatrix}\begin{bmatrix}G&H\end{bmatrix}\kern 6pt(2.4.3) A的列乘B的行,再相加AB=[ac][EF]+[bd][GH](2.4.3) A A A 的列 k k k 乘 B B B 的行 k k k 得到一个矩阵,令 k = 1 , 2 , ⋯ , n k=1,2,\cdots,n k=1,2,⋯,n,然后将所有的矩阵相加得到 A B AB AB。
如果 A B AB AB 是 ( m × n ) ( n × p ) (m\times n)(n\times p) (m×n)(n×p),则 n n n 个矩阵都是列与行相乘的 m × p m\times p m×p 矩阵。该方法同样需要 m n p mnp mnp 次乘法,只是顺序不同。
四、矩阵运算法则
矩阵运算遵循以下六个法则,还有一个法则是不正确的。矩阵可以是方形的也可以是矩形的。下面是三个加法法则: A + B = B + A ( 交换律 commutative law ) c ( A + B ) = c A + c B ( 分配律 distributive law ) A + ( B + C ) = ( A + B ) + C ( 结合律 associative law ) \begin{matrix}\kern20ptA+B=B+A\kern 17pt&\kern 10pt(交换律\,\textrm{commutative\,\,law})\\c(A+B)=cA+cB&\kern 3pt(分配律\,\textrm{distributive\,\,law})\\A+(B+C)=(A+B)+C&(结合律\,\textrm{associative\,\,law})\end{matrix} A+B=B+Ac(A+B)=cA+cBA+(B+C)=(A+B)+C(交换律commutativelaw)(分配律distributivelaw)(结合律associativelaw)另外三个法则是乘法法则,注意 A B = B A AB=BA AB=BA 通常来说都是错误的: A B ≠ B A ( 交换律通常不成立 ) A ( B + C ) = A B + A C ( 左分配律 ) ( A + B ) C = A C + B C ( 右分配律 ) A ( B C ) = A ( B C ) ( A B C 的结合律 ) ( 不需要括号 ) \begin{matrix}AB\neq BA&\kern 40pt(交换律通常不成立)\\A(B+C)=AB+AC&(左分配律)\\(A+B)C=AC+BC&(右分配律)\\A(BC)=A(BC)&\kern 81pt(ABC的结合律)(不需要括号)\end{matrix} AB=BAA(B+C)=AB+AC(A+B)C=AC+BCA(BC)=A(BC)(交换律通常不成立)(左分配律)(右分配律)(ABC的结合律)(不需要括号)当 A A A 和 B B B 不是方阵时, A B AB AB 和 B A BA BA 的大小不同,也不可能相等(假设可以相乘)。对于方阵,绝大部分情况都有 A B ≠ B A AB\neq BA AB=BA: A B = [ 0 0 1 0 ] [ 0 1 0 0 ] = [ 0 0 0 1 ] , 但是 B A = [ 0 1 0 0 ] [ 0 0 1 0 ] = [ 1 0 0 0 ] AB=\begin{bmatrix}0&0\\1&0\end{bmatrix}\begin{bmatrix}0&1\\0&0\end{bmatrix}=\begin{bmatrix}0&0\\0&1\end{bmatrix},\,但是\,BA=\begin{bmatrix}0&1\\0&0\end{bmatrix}\begin{bmatrix}0&0\\1&0\end{bmatrix}=\begin{bmatrix}1&0\\0&0\end{bmatrix} AB=[0100][0010]=[0001],但是BA=[0010][0100]=[1000] A I = I A AI=IA AI=IA 是成立的,所有的方阵与 I I I 相乘都满足交换律,与 c I cI cI 也一样。只有这些矩阵的乘法顺序才可交换。
法则 A ( B + C ) = A B + A C A(B+C)=AB+AC A(B+C)=AB+AC 可以一次证明一列。对于第一列 A ( b + c ) = A b + A c A(\boldsymbol b+\boldsymbol c)=A\boldsymbol b+A\boldsymbol c A(b+c)=Ab+Ac,这个是所有事情的关键 —— 线性。
法则 A ( B C ) = ( A B ) C A(BC)=(AB)C A(BC)=(AB)C 表示可以先乘 B C BC BC 也可以先乘 A B AB AB,这个法则很有用,是矩阵乘法的关键。
当 A = B = C A=B=C A=B=C 且为方阵时, ( A (A (A 乘 A 2 ) A^2) A2) 等于 ( A 2 (A^2 (A2 乘 A ) A) A)。它们的乘积都是 A 3 A^3 A3。矩阵的幂 A p A^p Ap 和数字的运算法则一致: A p = A A A ⋯ A ( p 个因子 ) ( A p ) ( A q ) = A p + q ( A p ) q = A p q A^p=AAA\cdots A\,(p\,个因子)\kern 8pt(A^p)(A^q)=A^{p+q}\kern 8pt(A^p)^q=A^{pq} Ap=AAA⋯A(p个因子)(Ap)(Aq)=Ap+q(Ap)q=Apq这是指数的一般法则, A 3 A^3 A3 乘 A 4 A^4 A4 是 A 7 A^7 A7, A 3 A^3 A3 的 4 4 4 次方是 A 12 A^{12} A12。当 p p p 和 q q q 是零或负数时,这个法则任然成立。假设 A A A 有 − 1 -1 −1 次方 —— 逆矩阵 A − 1 A^{-1} A−1。 A 0 = I A^0=I A0=I 是单位矩阵,类似 2 0 = 1 2^0=1 20=1。
对于数字 a − 1 = 1 / a a^{-1}=1/a a−1=1/a,对矩阵来说逆矩阵写成 A − 1 A^{-1} A−1(不是 I / A I/A I/A,除了MATLAB)。除了 a = 0 a=0 a=0 以外的数都有倒数,但是对于矩阵 A A A 有没有逆矩阵是线性代数的核心问题。
五、分块矩阵与分块乘法
矩阵可以被分割成块(blocks,小一些的矩阵)。下面是一个 4 × 6 4\times6 4×6 的矩阵,分割成 2 × 2 2\times2 2×2 的块,本例中每个块都是单位矩阵 I I I: 4 × 6 的矩阵分成 2 × 2 的分块矩阵 得到 2 × 3 个分块矩阵 A = [ 1 0 1 0 1 0 0 1 0 1 0 1 1 0 1 0 1 0 0 1 0 1 0 1 ] = [ I I I I I I ] \begin{matrix}4\times6\,的矩阵分成\\2\times2\,的分块矩阵\\\kern 20pt得到\,2\times3\,个分块矩阵\end{matrix}\kern 15ptA=\left[\begin{array}{cc|cc|cc}1&0&1&0&1&0\\0&1&0&1&0&1\\\hline1&0&1&0&1&0\\0&1&0&1&0&1\end{array}\right]=\begin{bmatrix}I&I&I\\I&I&I\end{bmatrix} 4×6的矩阵分成2×2的分块矩阵得到2×3个分块矩阵A= 101001011010010110100101 =[IIIIII]如果 B B B 也是 4 × 6 4\times6 4×6 的矩阵,且大小匹配,则可以对 A + B A+B A+B 匹配的方块相加。
将 b \boldsymbol b b 放在 A A A 旁边就变成增广矩阵, [ A b ] \begin{bmatrix}A&\boldsymbol b\end{bmatrix} [Ab] 有两个大小不一样的方块,这也是分块矩阵,左乘上消元矩阵得到 [ E A E b ] \begin{bmatrix}EA&E\boldsymbol b\end{bmatrix} [EAEb]。只要形状匹配,那么分块相乘就没有问题。 分块乘法 : 如果 A 的分块可以乘 B 的分块,那么 A B 就可以分块相乘。 A 的列分割必须和 B 的行分割相匹配。 [ A 11 A 12 A 21 A 22 ] [ B 11 B 21 ] = [ A 11 B 11 + A 12 B 21 A 21 B 11 + A 22 B 21 ] ( 2.4.4 ) \pmb{分块乘法}:如果\,A\,的分块可以乘\,B\,的分块,那么\,AB\,就可以分块相乘。A\,的列分割必须和\,B\,的行分割相匹配。\\\begin{bmatrix}A_{11}&A_{12}\\A_{21}&A_{22}\end{bmatrix}\begin{bmatrix}B_{11}\\B_{21}\end{bmatrix}=\begin{bmatrix}A_{11}B_{11}+A_{12}B_{21}\\A_{21}B_{11}+A_{22}B_{21}\end{bmatrix}\kern 15pt(2.4.4) 分块乘法:如果A的分块可以乘B的分块,那么AB就可以分块相乘。A的列分割必须和B的行分割相匹配。[A11A21A12A22][B11B21]=[A11B11+A12B21A21B11+A22B21](2.4.4)若每个分块都是数字( 1 × 1 1\times1 1×1 的矩阵),这种特殊情况就是矩阵的乘法,它们是一致的。上式所有的 A A A 都要放在 B B B 之前,因为 A B AB AB 与 B A BA BA 是不同的。
重点: 当对矩阵进行分块时,经常更容易看出它们如何作用的。如上例中分块矩阵是单位矩阵 I I I 就比原来的 4 × 6 4\times6 4×6 的矩阵更清晰。
【例3】(重要的特殊情况)将矩阵 A A A 每列分成一块,共 n n n 列,矩阵 B B B 每行分成一块,共 n n n 行,则 A B AB AB 的分块乘法就是列乘行相加: 列乘行 [ ∣ ∣ a 1 ⋯ a n ∣ ∣ ] [ − b 1 − ⋯ − b n − ] = [ a 1 b 1 + ⋯ + a n b n ] ( 2.4.5 ) \pmb{列乘行}\kern 10pt\begin{bmatrix}|& &|\\a_1&\cdots&a_n\\|& &|\end{bmatrix}\begin{bmatrix}-&b_1&-\\&\cdots\\-&b_n&-\end{bmatrix}=\begin{bmatrix}a_1b_1+\cdots+a_nb_n\end{bmatrix}\kern 15pt(2.4.5) 列乘行 ∣a1∣⋯∣an∣ −−b1⋯bn−− =[a1b1+⋯+anbn](2.4.5)这就是第四种矩阵乘法。下面是具体的例子: [ 1 4 1 5 ] [ 3 2 1 0 ] = [ 1 1 ] [ 3 2 ] + [ 4 5 ] [ 1 0 ] = [ 3 2 3 2 ] + [ 4 0 5 0 ] = [ 7 2 8 2 ] \begin{bmatrix}1&4\\1&5\end{bmatrix}\begin{bmatrix}3&2\\1&0\end{bmatrix}=\begin{bmatrix}1\\1\end{bmatrix}\begin{bmatrix}3&2\end{bmatrix}+\begin{bmatrix}4\\5\end{bmatrix}\begin{bmatrix}1&0\end{bmatrix}=\begin{bmatrix}3&2\\3&2\end{bmatrix}+\begin{bmatrix}4&0\\5&0\end{bmatrix}=\begin{bmatrix}7&2\\8&2\end{bmatrix} [1145][3120]=[11][32]+[45][10]=[3322]+[4500]=[7822]总结:通常使用行乘列求矩阵的乘积,要 4 4 4 个点积( 8 8 8 次乘法)。列乘行得到两个完整的矩阵(同样是 8 8 8 次乘法)。
【例4】(用分块消元)假设 A A A 的第一列是 1 , 3 , 4 1,3,4 1,3,4,要将 3 , 4 3,4 3,4 变成 0 , 0 0,0 0,0,需要减去主元行的 3 3 3 倍和 4 4 4 倍。这些行运算就是消元矩阵 E 21 E_{21} E21、 E 32 E_{32} E32: E 21 = [ 1 0 0 − 3 1 0 0 0 1 ] , E 31 = [ 1 0 0 0 1 0 − 4 0 1 ] E_{21}=\begin{bmatrix}\kern 7pt1&0&0\\-3&1&0\\\kern 7pt0&0&1\end{bmatrix},\kern 5ptE_{31}=\begin{bmatrix}\kern 7pt1&0&0\\\kern 7pt0&1&0\\-4&0&1\end{bmatrix} E21= 1−30010001 ,E31= 10−4010001 分块的思想就是用一个矩阵矩阵 E E E 完成上面的两次消元,该矩阵将第一列的主元 a = 1 a=1 a=1 下面的数字全部变成 0 0 0: E = [ 1 0 0 − 3 1 0 − 4 0 1 ] 乘 [ 1 x x 3 x x 4 x x ] 得到 [ 1 x x 0 y y 0 z z ] E=\begin{bmatrix}\kern 7pt\pmb1&0&0\\\pmb{-3}&1&0\\\pmb{-4}&0&1\end{bmatrix}乘\begin{bmatrix}\pmb1&x&x\\\pmb3&x&x\\\pmb4&x&x\end{bmatrix}得到\begin{bmatrix}\pmb1&x&x\\\pmb0&y&y\\\pmb0&z&z\end{bmatrix} E= 1−3−4010001 乘 134xxxxxx 得到 100xyzxyz 使用逆矩阵,分块矩阵 E E E 可以对整个列消元(将被消元部分看成一块)。假设矩阵有 4 4 4 块 A , B , C , D A,B,C,D A,B,C,D,通过分块消去 C C C: 分块消元 [ I 0 − C A − 1 I ] [ A B C D ] = [ A B 0 D − C A − 1 B ] ( 2.4.6 ) \pmb{分块消元}\kern 10pt\left[\begin{array}{c|c}I&0\\\hline-CA^{-1}&I\end{array}\right]\left[\begin{array}{c|c}A&B\\\hline C&D\end{array}\right]=\left[\begin{array}{c|c}A&B\\\hline0&D-CA^{-1}B\end{array}\right]\kern 15pt(2.4.6) 分块消元[I−CA−10I][ACBD]=[A0BD−CA−1B](2.4.6)消元法从第二行减去第一行 [ A B ] \begin{bmatrix}A&B\end{bmatrix} [AB] 左乘 C A − 1 CA^{-1} CA−1(以前是 c / a c/a c/a),使得块 C C C 变为了 0 0 0 块,块 D D D 变为 S = D − C A − 1 B S=D-CA^{-1}B S=D−CA−1B 。
分块消元是一次处理一列,主元方块是 A A A,最后的方块是 D − C A − 1 B D-CA^{-1}B D−CA−1B,如同 d − c b / a d-cb/a d−cb/a,这个称为舒尔补(Schur complement)。
六、主要内容总结
- A B AB AB 的 ( i , j ) (i,j) (i,j) 元素是 ( A 的行 i ) ⋅ ( B 的列 j ) (A的行\,i)\cdot(B的列\,j) (A的行i)⋅(B的列j)。
- m × n m\times n m×n 的矩阵乘 n × p n\times p n×p 的矩阵会有 m n p mnp mnp 次乘法。
- A A A 乘 B C BC BC 等于 A B AB AB 乘 C C C(非常重要)。
- A B AB AB 也是这 n n n 个矩阵的和: ( A 的列 j ) ⋅ ( B 的行 j ) (A的列\,j)\cdot(B的行\,j) (A的列j)⋅(B的行j)。
- 当分块矩阵的形状能正确匹配时,就可以使用分块乘法。
- 分块消元会产生舒尔补 D − C A − 1 B \,D-CA^{-1}B D−CA−1B。
七、例题
【例5】一个图形(或网络)有 n n n 个节点。它的邻接矩阵(adjacency matrix) S S S 是 n × n n\times n n×n。它是一个 0 − 1 0-1 0−1 矩阵,当节点 i i i 与 节点 j j j 有边相连时 S i j = 1 S_{ij}=1 Sij=1。
无向图的邻接矩阵是方阵且对称,边的两个方向均可以行走 \bold{无向图的邻接矩阵是方阵且对称,边的两个方向均可以行走} 无向图的邻接矩阵是方阵且对称,边的两个方向均可以行走矩阵 S 2 S^2 S2 有一个很有用的解释, S i j 2 S^2_{ij} Sij2 是节点 i i i 与节点 j j j 之间长度为 2 \pmb 2 2 的路径的个数。上图中节点 2 2 2 与节点 3 3 3 之间长度为 2 2 2 的路径有两个:经过 1 1 1 的路径 2 − 1 − 3 2-1-3 2−1−3,经过 4 4 4 的路径 2 − 4 − 3 2-4-3 2−4−3。节点 1 1 1 到节点 1 1 1 长度为 2 2 2 的路径也是 2 2 2 个: 1 − 2 − 1 1-2-1 1−2−1 和 1 − 3 − 1 1-3-1 1−3−1。 S 2 = [ 2 1 1 2 1 3 2 1 1 2 3 1 2 1 1 2 ] , S 3 = [ 2 5 5 2 5 4 5 5 5 5 4 5 2 5 5 2 ] S^2=\begin{bmatrix}\pmb 2&1&1&2\\1&3&\pmb 2&1\\1&2&3&1\\2&1&1&2\end{bmatrix},\kern 10ptS^3=\begin{bmatrix}2&\pmb 5&5&2\\5&4&5&5\\5&5&4&5\\2&5&5&2\end{bmatrix} S2= 2112132112312112 ,S3= 2552545555452552 你可以找到 5 5 5 条节点 1 1 1 到节点 2 2 2 长度为 3 3 3 的路径吗?
共 5 5 5 条: 1 − 2 − 1 − 2 , 1 − 2 − 3 − 2 , 1 − 2 − 4 − 2 , 1 − 3 − 1 − 2 , 1 − 3 − 4 − 2 1-2-1-2,1-2-3-2,1-2-4-2,1-3-1-2,1-3-4-2 1−2−1−2,1−2−3−2,1−2−4−2,1−3−1−2,1−3−4−2。
为什么 S N S^{N} SN 可以计算出两个节点之间长度为 N N N 的所有路径数呢?我们从 S 2 S^2 S2 开始看某一元素的点积: ( S 2 ) i j = ( S 的行 i ) ⋅ ( S 的列 j ) = S i 1 S 1 j + S i 2 S 2 j + S i 3 S 3 j + S i 4 S 4 j ( 2.4.7 ) (S^2)_{ij}=(S的行\,i)\cdot(S的列\,j)=S_{i1}S_{1j}+S_{i2}S_{2j}+S_{i3}S_{3j}+S_{i4}S_{4j}\kern 20pt(2.4.7) (S2)ij=(S的行i)⋅(S的列j)=Si1S1j+Si2S2j+Si3S3j+Si4S4j(2.4.7)若存在两步的路径 i → 1 → j i\rightarrow 1\rightarrow j i→1→j,第一个乘法得到 S i 1 S 1 j = ( 1 ) ( 1 ) = 1 S_{i1}S_{1j}=(1)(1)=1 Si1S1j=(1)(1)=1,若不存在 i → 1 → j i\rightarrow1\rightarrow j i→1→j 的路径,那么要么 i → 1 i\rightarrow1 i→1 不存在,要么就是 1 → j 1\rightarrow j 1→j 不存在,此时 S i 1 S 1 j = 0 S_{i1}S_{1j}=0 Si1S1j=0。
( S 2 ) i j (S^2)_{ij} (S2)ij 会将所有的两步路径 i → k → j i\rightarrow k\rightarrow j i→k→j 的个数累加起来,得到总路径数。同样, S N − 1 S S^{N-1}S SN−1S 会计算 N N N 步路径数, S N − 1 S^{N-1} SN−1 表示从 i i i 到 k k k 的 ( N − 1 ) (N-1) (N−1) 步的路径数, S S S 表示从 k k k 到 j j j 的那一步路径数。矩阵乘法非常适合计算图形的路径,也可以看成公司内员工之间同相的频道个数。
【例6】下面有三个矩阵,什么时候 A B = B A AB=BA AB=BA ?什么时候 B C = C B BC=CB BC=CB ?什么时候 A ( B C ) = ( A B ) C A(BC)=(AB)C A(BC)=(AB)C ?给出矩阵元素 p , q , r , z p,q,r,z p,q,r,z 要满足的条件。 A = [ p 0 q r ] , B = [ 1 1 0 1 ] , C = [ 0 z 0 0 ] A=\begin{bmatrix}p&0\\q&r\end{bmatrix},\kern 5ptB=\begin{bmatrix}1&1\\0&1\end{bmatrix},\kern 5ptC=\begin{bmatrix}0&z\\0&0\end{bmatrix} A=[pq0r],B=[1011],C=[00z0]如果 p , q , r , 1 , z p,q,r,1,z p,q,r,1,z 都是 4 × 4 4\times4 4×4 的块而不是数字,答案还一样吗?
解: 首先, A ( B C ) = ( A B ) C A(BC)=(AB)C A(BC)=(AB)C 是永远正确的,该等式中括号并不需要,但是矩阵的顺序不能变。
通常情况下 A B ≠ B A AB\neq BA AB=BA A B = [ p p q q + r ] , B A = [ p + q r q r ] AB=\begin{bmatrix}p&p\\q&q+r\end{bmatrix},\kern 5ptBA=\begin{bmatrix}p+q&r\\q&r\end{bmatrix} AB=[pqpq+r],BA=[p+qqrr]若要求 A B = B A AB=BA AB=BA,则需要满足 q = 0 , p = r q=0,p=r q=0,p=r。
B C = C B BC=CB BC=CB 是一个巧合: B C = [ 0 z 0 0 ] , C B = [ 0 z 0 0 ] BC=\begin{bmatrix}0&z\\0&0\end{bmatrix},\kern 5ptCB=\begin{bmatrix}0&z\\0&0\end{bmatrix} BC=[00z0],CB=[00z0]若 p , q , r , z p,q,r,z p,q,r,z 均是 4 × 4 4\times 4 4×4 的块, 1 1 1 变为 I I I,那么所有所有的乘积也是一样的,所有答案也一样。