从正交基到内积的代数形式
flyfish
在标准正交基下,所有基向量的长度(模)是相等的,并且它们的长度是1。这就是为什么称之为“标准正交基”。
详细解释
-
正交性:
正交基要求不同的基向量彼此正交,即对于不同的基向量 e i \mathbf{e}_i ei 和 e j \mathbf{e}_j ej(当 i ≠ j i \neq j i=j 时):
e i ⋅ e j = 0 \mathbf{e}_i \cdot \mathbf{e}_j = 0 ei⋅ej=0
这意味着它们之间的夹角为 9 0 ∘ 90^\circ 90∘,或者说它们是互相垂直的。 -
归一化(单位长度):
标准正交基不仅要求向量正交,还要求每个基向量的长度为1。即:
∥ e i ∥ = 1 对于所有的 i . \|\mathbf{e}_i\| = 1 \quad \text{对于所有的} \ i. ∥ei∥=1对于所有的 i.
这里的“长度”是指向量的模,即:
∥ e i ∥ = e i ⋅ e i . \|\mathbf{e}_i\| = \sqrt{\mathbf{e}_i \cdot \mathbf{e}_i}. ∥ei∥=ei⋅ei.
所以,在标准正交基中,每个基向量的内积与其自身等于1,表示它们的长度为1。
两个基向量的长度可以不相等吗?
如果两个基向量的长度不相等,或者某些基向量的长度不是1,那么这些向量就不是标准正交基,而是正交基。正交基允许向量之间有不同的长度,但是如果要构成标准正交基,每个基向量的长度必须是1。
举个例子
-
标准正交基(长度为1):
在三维空间中,标准正交基为:
e 1 = ( 1 , 0 , 0 ) , e 2 = ( 0 , 1 , 0 ) , e 3 = ( 0 , 0 , 1 ) , \mathbf{e}_1 = (1, 0, 0), \quad \mathbf{e}_2 = (0, 1, 0), \quad \mathbf{e}_3 = (0, 0, 1), e1=(1,0,0),e2=(0,1,0),e3=(0,0,1),
这里每个向量的长度都是1。 -
非标准正交基(长度不相等):
假设我们有两个正交向量 e 1 = ( 1 , 0 ) \mathbf{e}_1 = (1, 0) e1=(1,0) 和 e 2 = ( 0 , 2 ) \mathbf{e}_2 = (0, 2) e2=(0,2),它们是正交的,因为:
e 1 ⋅ e 2 = 1 × 0 + 0 × 2 = 0 , \mathbf{e}_1 \cdot \mathbf{e}_2 = 1 \times 0 + 0 \times 2 = 0, e1⋅e2=1×0+0×2=0,
但它们的长度不相同:
∥ e 1 ∥ = 1 2 + 0 2 = 1 , ∥ e 2 ∥ = 0 2 + 2 2 = 2. \|\mathbf{e}_1\| = \sqrt{1^2 + 0^2} = 1, \quad \|\mathbf{e}_2\| = \sqrt{0^2 + 2^2} = 2. ∥e1∥=12+02=1,∥e2∥=02+22=2.
这是一个正交基,但不是标准正交基,因为 e 2 \mathbf{e}_2 e2 的长度为 2,不是 1。
标准正交基中的每个基向量的长度都是1,并且它们是正交的。
正交基中的向量可以有不同的长度,但它们依然是正交的。
在标准正交基下, e i ⋅ e j \mathbf{e}_i \cdot \mathbf{e}_j ei⋅ej 的结果要么是 1 1 1,要么是 0 0 0,
1. 正交性
正交基要求基向量彼此正交。
正交的定义是:
当 i ≠ j i \neq j i=j 时,两个基向量的内积为 0 0 0:
e i ⋅ e j = 0 , 当 i ≠ j . \mathbf{e}_i \cdot \mathbf{e}_j = 0, \quad \text{当 } i \neq j. ei⋅ej=0,当 i=j.
这意味着在几何上, e i \mathbf{e}_i ei 和 e j \mathbf{e}_j ej 是两两垂直的,没有任何重叠。
几何解释:
- 内积的几何定义是:
e i ⋅ e j = ∥ e i ∥ ∥ e j ∥ cos θ , \mathbf{e}_i \cdot \mathbf{e}_j = \|\mathbf{e}_i\| \|\mathbf{e}_j\| \cos\theta, ei⋅ej=∥ei∥∥ej∥cosθ,
其中 θ \theta θ 是两个向量的夹角。 - 如果 e i \mathbf{e}_i ei 和 e j \mathbf{e}_j ej 垂直,则 θ = 9 0 ∘ \theta = 90^\circ θ=90∘,而 cos 9 0 ∘ = 0 \cos 90^\circ = 0 cos90∘=0。因此:
e i ⋅ e j = 0 , 当 i ≠ j . \mathbf{e}_i \cdot \mathbf{e}_j = 0, \quad \text{当 } i \neq j. ei⋅ej=0,当 i=j.
2. 归一化
标准正交基不仅要求基向量彼此正交,还要求每个基向量的长度为 1 1 1(即单位向量)。
这意味着对于任意基向量 e i \mathbf{e}_i ei,有:
∥ e i ∥ = 1. \|\mathbf{e}_i\| = 1. ∥ei∥=1.
几何解释:
- 一个向量的长度(模)定义为:
∥ e i ∥ = e i ⋅ e i . \|\mathbf{e}_i\| = \sqrt{\mathbf{e}_i \cdot \mathbf{e}_i}. ∥ei∥=ei⋅ei. - 如果基向量是单位向量,则有:
e i ⋅ e i = 1. \mathbf{e}_i \cdot \mathbf{e}_i = 1. ei⋅ei=1.
因此:
e i ⋅ e i = 1 , 当 i = j . \mathbf{e}_i \cdot \mathbf{e}_i = 1, \quad \text{当 } i = j. ei⋅ei=1,当 i=j.
3 为什么 e i ⋅ e j \mathbf{e}_i \cdot \mathbf{e}_j ei⋅ej 只有两种情况?
基于以上两点(正交性和归一化),可以总结出以下性质:
-
如果 i = j i = j i=j(即两个基向量是同一个向量),由于它们的长度为 1,且内积相当于计算其自身的模平方,因此:
e i ⋅ e j = 1. \mathbf{e}_i \cdot \mathbf{e}_j = 1. ei⋅ej=1. -
如果 i ≠ j i \neq j i=j(即两个基向量是不同的向量),由于它们彼此正交,所以内积为 0 0 0:
e i ⋅ e j = 0. \mathbf{e}_i \cdot \mathbf{e}_j = 0. ei⋅ej=0.
这就是为什么 e i ⋅ e j \mathbf{e}_i \cdot \mathbf{e}_j ei⋅ej 的结果只能是 1 1 1 或 0 0 0 的原因。
4. 实例验证
以三维欧几里得空间为例,标准正交基为:
e 1 = ( 1 , 0 , 0 ) , e 2 = ( 0 , 1 , 0 ) , e 3 = ( 0 , 0 , 1 ) . \mathbf{e}_1 = (1, 0, 0), \quad \mathbf{e}_2 = (0, 1, 0), \quad \mathbf{e}_3 = (0, 0, 1). e1=(1,0,0),e2=(0,1,0),e3=(0,0,1).
计算内积:
- e 1 ⋅ e 1 = 1 × 1 + 0 × 0 + 0 × 0 = 1 \mathbf{e}_1 \cdot \mathbf{e}_1 = 1 \times 1 + 0 \times 0 + 0 \times 0 = 1 e1⋅e1=1×1+0×0+0×0=1.
- e 1 ⋅ e 2 = 1 × 0 + 0 × 1 + 0 × 0 = 0 \mathbf{e}_1 \cdot \mathbf{e}_2 = 1 \times 0 + 0 \times 1 + 0 \times 0 = 0 e1⋅e2=1×0+0×1+0×0=0.
- e 2 ⋅ e 3 = 0 × 0 + 1 × 0 + 0 × 1 = 0 \mathbf{e}_2 \cdot \mathbf{e}_3 = 0 \times 0 + 1 \times 0 + 0 \times 1 = 0 e2⋅e3=0×0+1×0+0×1=0.
可以看到, e i ⋅ e j \mathbf{e}_i \cdot \mathbf{e}_j ei⋅ej 满足定义。
5. 为什么标准正交基这么重要?
- 在标准正交基下,内积公式变得极其简单:
u ⋅ v = ∑ i = 1 n u i v i , \mathbf{u} \cdot \mathbf{v} = \sum_{i=1}^n u_i v_i, u⋅v=i=1∑nuivi,
因为只有 i = j i = j i=j 的项才会保留,所有 i ≠ j i \neq j i=j 的项都为 0 0 0。
准备工作
-
向量表示:
假设向量空间是 n n n-维欧几里得空间,且 { e 1 , e 2 , … , e n } \{\mathbf{e}_1, \mathbf{e}_2, \dots, \mathbf{e}_n\} {e1,e2,…,en} 是这个空间的一组标准正交基(正交归一基)。
即满足:
e i ⋅ e j = { 1 当 i = j , 0 当 i ≠ j . \mathbf{e}_i \cdot \mathbf{e}_j = \begin{cases} 1 & \text{当 } i = j, \\ 0 & \text{当 } i \neq j. \end{cases} ei⋅ej={10当 i=j,当 i=j. -
向量表示公式:
对于任意向量 u \mathbf{u} u 和 v \mathbf{v} v,我们可以分别用基向量展开:
u = u 1 e 1 + u 2 e 2 + ⋯ + u n e n = ∑ i = 1 n u i e i , \mathbf{u} = u_1 \mathbf{e}_1 + u_2 \mathbf{e}_2 + \dots + u_n \mathbf{e}_n = \sum_{i=1}^n u_i \mathbf{e}_i, u=u1e1+u2e2+⋯+unen=i=1∑nuiei,
v = v 1 e 1 + v 2 e 2 + ⋯ + v n e n = ∑ i = 1 n v i e i , \mathbf{v} = v_1 \mathbf{e}_1 + v_2 \mathbf{e}_2 + \dots + v_n \mathbf{e}_n = \sum_{i=1}^n v_i \mathbf{e}_i, v=v1e1+v2e2+⋯+vnen=i=1∑nviei,
其中 u i u_i ui 和 v i v_i vi 分别是 u \mathbf{u} u 和 v \mathbf{v} v 在基向量 e i \mathbf{e}_i ei 上的分量。 -
内积的几何定义:
两个向量的内积定义为:
u ⋅ v = ∥ u ∥ ∥ v ∥ cos θ , \mathbf{u} \cdot \mathbf{v} = \|\mathbf{u}\| \|\mathbf{v}\| \cos\theta, u⋅v=∥u∥∥v∥cosθ,
其中 ∥ u ∥ \|\mathbf{u}\| ∥u∥ 和 ∥ v ∥ \|\mathbf{v}\| ∥v∥ 分别是向量的长度, θ \theta θ 是它们之间的夹角。
我们需要将这个几何定义转化为代数形式。
推导过程
1. 将内积展开为基向量的组合
我们先利用线性代数中的分配律和基向量展开式,把 u ⋅ v \mathbf{u} \cdot \mathbf{v} u⋅v 写成:
u ⋅ v = ( ∑ i = 1 n u i e i ) ⋅ ( ∑ j = 1 n v j e j ) . \mathbf{u} \cdot \mathbf{v} = \left( \sum_{i=1}^n u_i \mathbf{e}_i \right) \cdot \left( \sum_{j=1}^n v_j \mathbf{e}_j \right). u⋅v=(i=1∑nuiei)⋅(j=1∑nvjej).
根据内积的分配律:
u ⋅ v = ∑ i = 1 n ∑ j = 1 n ( u i v j ) ( e i ⋅ e j ) . \mathbf{u} \cdot \mathbf{v} = \sum_{i=1}^n \sum_{j=1}^n (u_i v_j) (\mathbf{e}_i \cdot \mathbf{e}_j). u⋅v=i=1∑nj=1∑n(uivj)(ei⋅ej).
2. 利用正交基的性质
在标准正交基下,我们有以下性质:
e i ⋅ e j = { 1 当 i = j , 0 当 i ≠ j . \mathbf{e}_i \cdot \mathbf{e}_j = \begin{cases} 1 & \text{当 } i = j, \\ 0 & \text{当 } i \neq j. \end{cases} ei⋅ej={10当 i=j,当 i=j.
这意味着当 i ≠ j i \neq j i=j 时, ( e i ⋅ e j ) = 0 (\mathbf{e}_i \cdot \mathbf{e}_j) = 0 (ei⋅ej)=0,只有 i = j i = j i=j 时,内积才有贡献。
因此,上式中 i ≠ j i \neq j i=j 的所有项都为零,剩下的只有 i = j i = j i=j 的项:
u ⋅ v = ∑ i = 1 n u i v i ( e i ⋅ e i ) . \mathbf{u} \cdot \mathbf{v} = \sum_{i=1}^n u_i v_i (\mathbf{e}_i \cdot \mathbf{e}_i). u⋅v=i=1∑nuivi(ei⋅ei).
由于基向量是单位向量( e i ⋅ e i = 1 \mathbf{e}_i \cdot \mathbf{e}_i = 1 ei⋅ei=1),所以:
u ⋅ v = ∑ i = 1 n u i v i . \mathbf{u} \cdot \mathbf{v} = \sum_{i=1}^n u_i v_i. u⋅v=i=1∑nuivi.
最终结果
我们得到了内积的代数形式:
u ⋅ v = ∑ i = 1 n u i v i . \mathbf{u} \cdot \mathbf{v} = \sum_{i=1}^n u_i v_i. u⋅v=i=1∑nuivi.
正交基的性质简化了内积的计算。
公式 u ⋅ v = ∑ i = 1 n u i v i \mathbf{u} \cdot \mathbf{v} = \sum_{i=1}^n u_i v_i u⋅v=∑i=1nuivi 表示两个向量在每个维度上的投影积之和。
代数形式与几何意义一致,体现了内积是“投影长度与对应分量积的总和”。
使用分配律来展开向量 u \mathbf{u} u 和 v \mathbf{v} v 的内积过程
-
对加法的分配律:对于任意三个向量 a \mathbf{a} a, b \mathbf{b} b, c \mathbf{c} c,有
( a + b ) ⋅ c = a ⋅ c + b ⋅ c , (\mathbf{a} + \mathbf{b}) \cdot \mathbf{c} = \mathbf{a} \cdot \mathbf{c} + \mathbf{b} \cdot \mathbf{c}, (a+b)⋅c=a⋅c+b⋅c,
以及
a ⋅ ( b + c ) = a ⋅ b + a ⋅ c . \mathbf{a} \cdot (\mathbf{b} + \mathbf{c}) = \mathbf{a} \cdot \mathbf{b} + \mathbf{a} \cdot \mathbf{c}. a⋅(b+c)=a⋅b+a⋅c. -
标量乘法的结合律:对于任意向量 a \mathbf{a} a, b \mathbf{b} b 和标量 k k k,有
( k a ) ⋅ b = k ( a ⋅ b ) = a ⋅ ( k b ) . (k\mathbf{a}) \cdot \mathbf{b} = k(\mathbf{a} \cdot \mathbf{b}) = \mathbf{a} \cdot (k\mathbf{b}). (ka)⋅b=k(a⋅b)=a⋅(kb).
现在,用这些性质来详细地展开 u ⋅ v \mathbf{u} \cdot \mathbf{v} u⋅v。
假设 u \mathbf{u} u 和 v \mathbf{v} v 分别在标准正交基下表示为:
u = u 1 e 1 + u 2 e 2 + ⋯ + u n e n , \mathbf{u} = u_1 \mathbf{e}_1 + u_2 \mathbf{e}_2 + \dots + u_n \mathbf{e}_n, u=u1e1+u2e2+⋯+unen,
v = v 1 e 1 + v 2 e 2 + ⋯ + v n e n . \mathbf{v} = v_1 \mathbf{e}_1 + v_2 \mathbf{e}_2 + \dots + v_n \mathbf{e}_n. v=v1e1+v2e2+⋯+vnen.
那么, u ⋅ v \mathbf{u} \cdot \mathbf{v} u⋅v 可以写成:
u ⋅ v = ( u 1 e 1 + u 2 e 2 + ⋯ + u n e n ) ⋅ ( v 1 e 1 + v 2 e 2 + ⋯ + v n e n ) . \mathbf{u} \cdot \mathbf{v} = (u_1 \mathbf{e}_1 + u_2 \mathbf{e}_2 + \dots + u_n \mathbf{e}_n) \cdot (v_1 \mathbf{e}_1 + v_2 \mathbf{e}_2 + \dots + v_n \mathbf{e}_n). u⋅v=(u1e1+u2e2+⋯+unen)⋅(v1e1+v2e2+⋯+vnen).
接下来,我们使用分配律来展开这个表达式。首先,将 u \mathbf{u} u 看作一个整体,应用第一个分配律:
u ⋅ v = ( u 1 e 1 + u 2 e 2 + ⋯ + u n e n ) ⋅ ( v 1 e 1 + v 2 e 2 + ⋯ + v n e n ) \mathbf{u} \cdot \mathbf{v} = (u_1 \mathbf{e}_1 + u_2 \mathbf{e}_2 + \dots + u_n \mathbf{e}_n) \cdot (v_1 \mathbf{e}_1 + v_2 \mathbf{e}_2 + \dots + v_n \mathbf{e}_n) u⋅v=(u1e1+u2e2+⋯+unen)⋅(v1e1+v2e2+⋯+vnen)
= ( u 1 e 1 ) ⋅ ( v 1 e 1 + v 2 e 2 + ⋯ + v n e n ) + ( u 2 e 2 ) ⋅ ( v 1 e 1 + v 2 e 2 + ⋯ + v n e n ) + ⋯ + ( u n e n ) ⋅ ( v 1 e 1 + v 2 e 2 + ⋯ + v n e n ) . = (u_1 \mathbf{e}_1) \cdot (v_1 \mathbf{e}_1 + v_2 \mathbf{e}_2 + \dots + v_n \mathbf{e}_n) + (u_2 \mathbf{e}_2) \cdot (v_1 \mathbf{e}_1 + v_2 \mathbf{e}_2 + \dots + v_n \mathbf{e}_n) + \dots + (u_n \mathbf{e}_n) \cdot (v_1 \mathbf{e}_1 + v_2 \mathbf{e}_2 + \dots + v_n \mathbf{e}_n). =(u1e1)⋅(v1e1+v2e2+⋯+vnen)+(u2e2)⋅(v1e1+v2e2+⋯+vnen)+⋯+(unen)⋅(v1e1+v2e2+⋯+vnen).
然后,再次应用分配律到每个项上,比如对第一项:
( u 1 e 1 ) ⋅ ( v 1 e 1 + v 2 e 2 + ⋯ + v n e n ) = u 1 v 1 ( e 1 ⋅ e 1 ) + u 1 v 2 ( e 1 ⋅ e 2 ) + ⋯ + u 1 v n ( e 1 ⋅ e n ) . (u_1 \mathbf{e}_1) \cdot (v_1 \mathbf{e}_1 + v_2 \mathbf{e}_2 + \dots + v_n \mathbf{e}_n) = u_1 v_1 (\mathbf{e}_1 \cdot \mathbf{e}_1) + u_1 v_2 (\mathbf{e}_1 \cdot \mathbf{e}_2) + \dots + u_1 v_n (\mathbf{e}_1 \cdot \mathbf{e}_n). (u1e1)⋅(v1e1+v2e2+⋯+vnen)=u1v1(e1⋅e1)+u1v2(e1⋅e2)+⋯+u1vn(e1⋅en).
由于 e i ⋅ e j = δ i j \mathbf{e}_i \cdot \mathbf{e}_j = \delta_{ij} ei⋅ej=δij,即当 i = j i=j i=j 时为 1,否则为 0,我们可以简化上面的表达式:
u 1 v 1 ( e 1 ⋅ e 1 ) + u 1 v 2 ( e 1 ⋅ e 2 ) + ⋯ + u 1 v n ( e 1 ⋅ e n ) = u 1 v 1 ⋅ 1 + u 1 v 2 ⋅ 0 + ⋯ + u 1 v n ⋅ 0 = u 1 v 1 . u_1 v_1 (\mathbf{e}_1 \cdot \mathbf{e}_1) + u_1 v_2 (\mathbf{e}_1 \cdot \mathbf{e}_2) + \dots + u_1 v_n (\mathbf{e}_1 \cdot \mathbf{e}_n) = u_1 v_1 \cdot 1 + u_1 v_2 \cdot 0 + \dots + u_1 v_n \cdot 0 = u_1 v_1. u1v1(e1⋅e1)+u1v2(e1⋅e2)+⋯+u1vn(e1⋅en)=u1v1⋅1+u1v2⋅0+⋯+u1vn⋅0=u1v1.
同样的方法可以应用于其他项,最后得到:
u ⋅ v = u 1 v 1 + u 2 v 2 + ⋯ + u n v n = ∑ i = 1 n u i v i . \mathbf{u} \cdot \mathbf{v} = u_1 v_1 + u_2 v_2 + \dots + u_n v_n = \sum_{i=1}^n u_i v_i. u⋅v=u1v1+u2v2+⋯+unvn=i=1∑nuivi.
这样,通过分配律得到了 u ⋅ v \mathbf{u} \cdot \mathbf{v} u⋅v,得到了内积的代数形式。