文章目录
- 1. ℓ 1 \ell_1 ℓ1-范数的定义
- 2. 对偶范数的定义
- 3. ℓ ∞ \ell_{\infty} ℓ∞-范数的定义
- 4. ℓ 1 \ell_1 ℓ1-范数和 ℓ ∞ \ell_{\infty} ℓ∞-范数的对偶关系
- 5. 凸函数的定义
- 6.证明无穷范数是凸函数
- 第一步:展开左边的表达式
- 第二步:应用三角不等式
- 第三步:取最大值
- 7.证明 ℓ 1 \ell_1 ℓ1-范数是凸函数
1. ℓ 1 \ell_1 ℓ1-范数的定义
给定一个向量 x = ( x 1 , x 2 , … , x n ) ∈ R n x = (x_1, x_2, \dots, x_n) \in \mathbb{R}^n x=(x1,x2,…,xn)∈Rn,它的 ℓ 1 \ell_1 ℓ1-范数定义为:
∥ x ∥ 1 = ∑ i = 1 n ∣ x i ∣ 。 \|x\|_1 = \sum_{i=1}^n |x_i|。 ∥x∥1=i=1∑n∣xi∣。
即 ℓ 1 \ell_1 ℓ1-范数是向量的所有分量的绝对值之和。
示例
例如,给定向量 x = ( 3 , − 4 , 1 ) x = (3, -4, 1) x=(3,−4,1),其 ℓ 1 \ell_1 ℓ1-范数为:
∥ x ∥ 1 = ∣ 3 ∣ + ∣ − 4 ∣ + ∣ 1 ∣ = 3 + 4 + 1 = 8 。 \|x\|_1 = |3| + |-4| + |1| = 3 + 4 + 1 = 8。 ∥x∥1=∣3∣+∣−4∣+∣1∣=3+4+1=8。
2. 对偶范数的定义
在向量空间中,范数的对偶范数定义如下:
给定一个范数 ∥ ⋅ ∥ \|\cdot\| ∥⋅∥,其对偶范数 ∥ ⋅ ∥ ∗ \|\cdot\|_* ∥⋅∥∗定义为:
∥ y ∥ ∗ = sup { y ⊤ x : ∥ x ∥ ≤ 1 } , \|y\|_* = \sup \{ y^{\top} x : \|x\| \leq 1 \}, ∥y∥∗=sup{y⊤x:∥x∥≤1},
即对偶范数是所有满足 ∥ x ∥ ≤ 1 \|x\| \leq 1 ∥x∥≤1的 x x x向量上内积 y ⊤ x y^{\top} x y⊤x的最大值。
3. ℓ ∞ \ell_{\infty} ℓ∞-范数的定义
对于 ℓ 1 \ell_1 ℓ1-范数,按照上述对偶范数的定义,其对偶范数是 ℓ ∞ \ell_{\infty} ℓ∞-范数。
给定一个向量 x = ( x 1 , x 2 , … , x n ) ∈ R n x = (x_1, x_2, \dots, x_n) \in \mathbb{R}^n x=(x1,x2,…,xn)∈Rn,它的 ℓ ∞ \ell_{\infty} ℓ∞-范数定义为:
∥ x ∥ ∞ = max i ∣ x i ∣ 。 \|x\|_{\infty} = \max_{i} |x_i|。 ∥x∥∞=imax∣xi∣。
即 ℓ ∞ \ell_{\infty} ℓ∞-范数是向量中绝对值最大的分量。
示例
例如,给定向量 x = ( 3 , − 4 , 1 ) x = (3, -4, 1) x=(3,−4,1),其 ℓ ∞ \ell_{\infty} ℓ∞-范数为:
∥ x ∥ ∞ = max ( ∣ 3 ∣ , ∣ − 4 ∣ , ∣ 1 ∣ ) = 4 。 \|x\|_{\infty} = \max(|3|, |-4|, |1|) = 4。 ∥x∥∞=max(∣3∣,∣−4∣,∣1∣)=4。
4. ℓ 1 \ell_1 ℓ1-范数和 ℓ ∞ \ell_{\infty} ℓ∞-范数的对偶关系
对于任何向量空间中的范数 ∥ ⋅ ∥ \|\cdot\| ∥⋅∥,其对偶范数 ∥ ⋅ ∥ ∗ \|\cdot\|_* ∥⋅∥∗满足:
∥ x ∥ 1 = sup { y ⊤ x : ∥ y ∥ ∞ ≤ 1 } , \|x\|_1 = \sup \{ y^{\top} x : \|y\|_{\infty} \leq 1 \}, ∥x∥1=sup{y⊤x:∥y∥∞≤1},
∥ x ∥ ∞ = sup { y ⊤ x : ∥ y ∥ 1 ≤ 1 } 。 \|x\|_{\infty} = \sup \{ y^{\top} x : \|y\|_1 \leq 1 \}。 ∥x∥∞=sup{y⊤x:∥y∥1≤1}。
因此, ℓ 1 \ell_1 ℓ1-范数的对偶范数是 ℓ ∞ \ell_{\infty} ℓ∞-范数,而 ℓ ∞ \ell_{\infty} ℓ∞-范数的对偶范数是 ℓ 1 \ell_1 ℓ1-范数。
5. 凸函数的定义
一个函数 f : R n → R f : \mathbb{R}^n \to \mathbb{R} f:Rn→R是凸的,当且仅当对于任意 x , y ∈ R n x, y \in \mathbb{R}^n x,y∈Rn和 λ ∈ [ 0 , 1 ] \lambda \in [0, 1] λ∈[0,1],有:
f ( λ x + ( 1 − λ ) y ) ≤ λ f ( x ) + ( 1 − λ ) f ( y ) 。 f(\lambda x + (1 - \lambda) y) \leq \lambda f(x) + (1 - \lambda) f(y)。 f(λx+(1−λ)y)≤λf(x)+(1−λ)f(y)。
我们需要验证,对于 f ( x ) = ∥ x ∥ ∞ f(x) = \|x\|_{\infty} f(x)=∥x∥∞而言,上述不等式是成立的。
6.证明无穷范数是凸函数
设 f ( x ) = ∥ x ∥ ∞ = max i = 1 , … , n ∣ x i ∣ f(x) = \|x\|_{\infty} = \max_{i=1, \dots, n} |x_i| f(x)=∥x∥∞=maxi=1,…,n∣xi∣。我们要证明,对于任意的 x , y ∈ R n x, y \in \mathbb{R}^n x,y∈Rn和 λ ∈ [ 0 , 1 ] \lambda \in [0, 1] λ∈[0,1],有
∥ λ x + ( 1 − λ ) y ∥ ∞ ≤ λ ∥ x ∥ ∞ + ( 1 − λ ) ∥ y ∥ ∞ 。 \| \lambda x + (1 - \lambda) y \|_{\infty} \leq \lambda \| x \|_{\infty} + (1 - \lambda) \| y \|_{\infty}。 ∥λx+(1−λ)y∥∞≤λ∥x∥∞+(1−λ)∥y∥∞。
第一步:展开左边的表达式
根据 ℓ ∞ \ell_{\infty} ℓ∞-范数的定义,
∥ λ x + ( 1 − λ ) y ∥ ∞ = max i = 1 , … , n ∣ λ x i + ( 1 − λ ) y i ∣ 。 \| \lambda x + (1 - \lambda) y \|_{\infty} = \max_{i=1, \dots, n} | \lambda x_i + (1 - \lambda) y_i |。 ∥λx+(1−λ)y∥∞=i=1,…,nmax∣λxi+(1−λ)yi∣。
第二步:应用三角不等式
利用三角不等式证明无穷范数是凸函数,对于任意 i i i,我们有
∣ λ x i + ( 1 − λ ) y i ∣ ≤ ∣ λ x i ∣ + ∣ ( 1 − λ ) y i ∣ 。 | \lambda x_i + (1 - \lambda) y_i | \leq | \lambda x_i | + | (1 - \lambda) y_i |。 ∣λxi+(1−λ)yi∣≤∣λxi∣+∣(1−λ)yi∣。
再进一步拆分,可以得到
∣ λ x i ∣ + ∣ ( 1 − λ ) y i ∣ = λ ∣ x i ∣ + ( 1 − λ ) ∣ y i ∣ 。 | \lambda x_i | + | (1 - \lambda) y_i | = \lambda | x_i | + (1 - \lambda) | y_i |。 ∣λxi∣+∣(1−λ)yi∣=λ∣xi∣+(1−λ)∣yi∣。
因此,对于每个 i i i都有
∣ λ x i + ( 1 − λ ) y i ∣ ≤ λ ∣ x i ∣ + ( 1 − λ ) ∣ y i ∣ 。 | \lambda x_i + (1 - \lambda) y_i | \leq \lambda | x_i | + (1 - \lambda) | y_i |。 ∣λxi+(1−λ)yi∣≤λ∣xi∣+(1−λ)∣yi∣。
第三步:取最大值
我们需要将上面的不等式应用到所有分量,并取最大值:
max i = 1 , … , n ∣ λ x i + ( 1 − λ ) y i ∣ ≤ max i = 1 , … , n ( λ ∣ x i ∣ + ( 1 − λ ) ∣ y i ∣ ) 。 \max_{i=1, \dots, n} | \lambda x_i + (1 - \lambda) y_i | \leq \max_{i=1, \dots, n} \left( \lambda | x_i | + (1 - \lambda) | y_i | \right)。 i=1,…,nmax∣λxi+(1−λ)yi∣≤i=1,…,nmax(λ∣xi∣+(1−λ)∣yi∣)。
利用最大值的性质,可以分开最大操作:
max i = 1 , … , n ( λ ∣ x i ∣ + ( 1 − λ ) ∣ y i ∣ ) ≤ λ max i = 1 , … , n ∣ x i ∣ + ( 1 − λ ) max i = 1 , … , n ∣ y i ∣ 。 \max_{i=1, \dots, n} \left( \lambda | x_i | + (1 - \lambda) | y_i | \right) \leq \lambda \max_{i=1, \dots, n} | x_i | + (1 - \lambda) \max_{i=1, \dots, n} | y_i |。 i=1,…,nmax(λ∣xi∣+(1−λ)∣yi∣)≤λi=1,…,nmax∣xi∣+(1−λ)i=1,…,nmax∣yi∣。
即
∥ λ x + ( 1 − λ ) y ∥ ∞ ≤ λ ∥ x ∥ ∞ + ( 1 − λ ) ∥ y ∥ ∞ 。 \| \lambda x + (1 - \lambda) y \|_{\infty} \leq \lambda \| x \|_{\infty} + (1 - \lambda) \| y \|_{\infty}。 ∥λx+(1−λ)y∥∞≤λ∥x∥∞+(1−λ)∥y∥∞。
结论
我们已经证明,对于任意 x , y ∈ R n x, y \in \mathbb{R}^n x,y∈Rn和 λ ∈ [ 0 , 1 ] \lambda \in [0, 1] λ∈[0,1],有
∥ λ x + ( 1 − λ ) y ∥ ∞ ≤ λ ∥ x ∥ ∞ + ( 1 − λ ) ∥ y ∥ ∞ 。 \| \lambda x + (1 - \lambda) y \|_{\infty} \leq \lambda \| x \|_{\infty} + (1 - \lambda) \| y \|_{\infty}。 ∥λx+(1−λ)y∥∞≤λ∥x∥∞+(1−λ)∥y∥∞。
因此, ℓ ∞ \ell_{\infty} ℓ∞-范数 ∥ x ∥ ∞ \|x\|_{\infty} ∥x∥∞是一个凸函数。
7.证明 ℓ 1 \ell_1 ℓ1-范数是凸函数
我们使用三角不等式来证明 ℓ 1 \ell_1 ℓ1-范数是凸的。
对于任意 x , y ∈ R n x, y \in \mathbb{R}^n x,y∈Rn和 λ ∈ [ 0 , 1 ] \lambda \in [0, 1] λ∈[0,1],我们有
∥ λ x + ( 1 − λ ) y ∥ 1 = ∑ i = 1 n ∣ λ x i + ( 1 − λ ) y i ∣ 。 \| \lambda x + (1 - \lambda) y \|_1 = \sum_{i=1}^n |\lambda x_i + (1 - \lambda) y_i|。 ∥λx+(1−λ)y∥1=i=1∑n∣λxi+(1−λ)yi∣。
根据三角不等式,
∣ λ x i + ( 1 − λ ) y i ∣ ≤ λ ∣ x i ∣ + ( 1 − λ ) ∣ y i ∣ 。 |\lambda x_i + (1 - \lambda) y_i| \leq \lambda |x_i| + (1 - \lambda) |y_i|。 ∣λxi+(1−λ)yi∣≤λ∣xi∣+(1−λ)∣yi∣。
因此,
∥ λ x + ( 1 − λ ) y ∥ 1 = ∑ i = 1 n ∣ λ x i + ( 1 − λ ) y i ∣ ≤ ∑ i = 1 n ( λ ∣ x i ∣ + ( 1 − λ ) ∣ y i ∣ ) 。 \| \lambda x + (1 - \lambda) y \|_1 = \sum_{i=1}^n |\lambda x_i + (1 - \lambda) y_i| \leq \sum_{i=1}^n \left( \lambda |x_i| + (1 - \lambda) |y_i| \right)。 ∥λx+(1−λ)y∥1=i=1∑n∣λxi+(1−λ)yi∣≤i=1∑n(λ∣xi∣+(1−λ)∣yi∣)。
将右侧的求和符号展开,我们得到:
∥ λ x + ( 1 − λ ) y ∥ 1 ≤ λ ∑ i = 1 n ∣ x i ∣ + ( 1 − λ ) ∑ i = 1 n ∣ y i ∣ = λ ∥ x ∥ 1 + ( 1 − λ ) ∥ y ∥ 1 。 \| \lambda x + (1 - \lambda) y \|_1 \leq \lambda \sum_{i=1}^n |x_i| + (1 - \lambda) \sum_{i=1}^n |y_i| = \lambda \|x\|_1 + (1 - \lambda) \|y\|_1。 ∥λx+(1−λ)y∥1≤λi=1∑n∣xi∣+(1−λ)i=1∑n∣yi∣=λ∥x∥1+(1−λ)∥y∥1。
这表明 ∥ x ∥ 1 \|x\|_1 ∥x∥1满足凸函数的定义,因此 ℓ 1 \ell_1 ℓ1-范数是一个凸函数。