🍍原文:Review on Watermarking Techniques Aiming Authentication of Digital Image Artistic Works Minted as NFTs into Blockchains
1 半脆弱和可逆水印
鲁棒性好的水印技术通常会产生非常低透明度。正如前面所述,由于透明度在处理数字艺术品时是一个非常重要的特性,因此鲁棒性好的水印可能不是 NFT 认证的最好选择。
不过通过脆弱 f r a g i l e \mathsf{fragile} fragile 、半脆弱 s e m i _ f r a g i l e \mathsf{semi\_fragile} semi_fragile 甚至是可逆 r e v e r s i b l e \mathsf{reversible} reversible 水印技术,可以实现非常透明的水印。这些技术主要有:
- 基于空间域的方法,比如:扩展频谱 ( S S ) \mathsf{(SS)} (SS)、最低有效位 ( L S B ) \mathsf{(LSB)} (LSB) 技术;
- 基于变换域的方法,比如:离散余弦变换 ( D C T ) \mathsf{(DCT)} (DCT)、离散小波变换 ( D W T ) \mathsf{(DWT)} (DWT) 技术;
半脆弱 s e m i _ f r a g i l e \mathsf{semi\_fragile} semi_fragile 水印技术能够容忍一定程度上的非恶意修改,例如图像格式的转换,比如将数字图像从 JPEG 格式转换为 PNG 格式。但是,如果是出于欺诈目的而进行的大幅度的扭曲,比如图像的水平翻转,这将会导致水印的丢失,数字作品将无法再被验证。
可逆 r e v e r s i b l e \mathsf{reversible} reversible 水印的设计目标是能够通过正确的密钥来移除水印,以此来恢复原始的艺术作品。这种技术在 NFT 领域尤其引人注目,因为在这个领域中,保持图像质量是至关重要的。我们将在接下来的章节中详细说明如何实现这一功能。
2 基于空间域的方法
扩展频谱 S p r e a d S p e c t r u m \mathsf{Spread\ Spectrum} Spread Spectrum 和最低有效位 L S B \mathsf{LSB} LSB 技术广泛应用于生成透明水印,以实现认证目的。这些方法可以被定制为区域性的,从而能够识别出哪些区域遭受了篡改。
2.1 扩展频谱技术
扩展频谱是在空间域上进行的加法操作,最终生成加了水印的图像:
I W = I + α b W I_{W}=I+\alpha bW IW=I+αbW
其中 I I I 是一个原始的图片或者视频帧, W W W 是与 I I I 大小相同的水印图像。 α \alpha α 是根据所需鲁棒性和透明度设计的缩放参数, b b b 是一个 a n t i p o d a l b i t \mathsf{antipodal\ bit} antipodal bit 反极性位 ∈ { − 1 , + 1 } \in \{−1,+1\} ∈{−1,+1}。
水印图像 W W W 是由白噪声构成的,它在频率域中产生了宽广的频谱信号。反极性位 b b b 用于在水印信号认证中传递一个比特的信息。
在一些情况下, b b b 可以被丢弃,只留下加权水印信号,即:
I W = I + α W I_{W}=I+\alpha W IW=I+αW
在其他情况下,想要嵌入更多的比特,可以使用更复杂的水印信号,这种信号由原始图像相同维度的伪随机序列的加权和组成。这些伪随机序列可以被进一步优化以提高它们的正交性。无论在哪种情况下,权重 α \alpha α 都可以根据预定的鲁棒性和透明度之间的平衡关系进行计算。
下图展示了,通过应用复杂的多比特扩展频谱技术,实现了非常好的透明度效果:
(a) 是原始的 L e n n a \mathsf{Lenna} Lenna 图像;(b) 通过文献 [4] 所述的多比特技术,在 L e n n a \mathsf{Lenna} Lenna 图像中嵌入了 10 位水印,而这样做几乎不影响其视觉感知,保持了极高的透明度;(c) 是原图与水印图像之间差异的放大视图,以增强对比度和可观察性。
2.2 LSB 技术和可逆水印
水印的嵌入过程涉及修改图像像素的最后 K K K 个最低有效位。例如,对最后两位的修改通常微乎其微,因此实现了极其透明的嵌入。此外,LSB 嵌入技术还可以利用异或 X O R \mathsf{XOR} XOR 运算的性质来实现可逆。
以每像素最后一位进行 LSB 嵌入为例,工作原理如下:假定一个秘密密钥 I K I_K IK,它是一个与原始图像 I I I 尺寸相同的 1 位图像。
通过对每个像素的最后一位执行异或 ⊕ \oplus ⊕ 操作,嵌入的水印 W W W 可以表示为:
W ( i ) = I K ( i ) ⊕ I ( i ) W(i) = I_K(i) \oplus I(i) W(i)=IK(i)⊕I(i)
随后,图像中每个像素的最后一位被水印 W ( i ) W(i) W(i) 所替换,产生加了水印的图像 I W I_W IW,如下图所示。这一过程使得数字图像能够通过既定协议进行验证。
(a) 是原始的 L e n n a \mathsf{Lenna} Lenna 图像;(b) 嵌入了单位水印的 L e n n a \mathsf{Lenna} Lenna 图像,在本例中水印为全零,通过 LSB 技术实现,对视觉感知几乎没有影响;(c) 这三幅图像之间的差异,经过 100 倍放大以便更清晰地观察。
更重要的是,借助秘密密钥 I K I_K IK,先前修改的原图像的最后几位信息可以被完全复原:
I ( i ) = W ( i ) ⊕ I K ( i ) I(i) = W(i) \oplus I_K(i) I(i)=W(i)⊕IK(i)
通过将加了水印的图像 I W I_W IW 的每个像素的最后一位 I W ( i ) I_W(i) IW(i),恢复为原始图像 I I I 的相应位 I ( i ) I(i) I(i),可以完全恢复出原始图像。这一特性有助于增强 NFT 市场的安全性。
LSB 技术不仅限于修改最后一位,还可以用于修改更多的位,这样会降低图像的透明度,同时增加可嵌入的信息量。需要注意的是,LSB 是一种相当敏感的技术,图像的任何改动都可能导致水印的损坏。然而,这种敏感性在认证协议和服务中是可以接受的,因为它有助于提升 NFT 市场的安全性和认可度。
3 基于频率域的方法
在频率域内,结合人类感知的频率模型来嵌入水印是一种有效的方法。这种技术能够依据人类感知的模型来精细调整透明度,从而显著降低水印嵌入对视觉的影响,与空间域技术相比尤为如此。在实现这一目标时,最广泛应用的转换方法包括离散余弦变换 D C T \mathsf{DCT} DCT 和小波变换 D W T \mathsf{DWT} DWT。多种策略通过修改频率域中的特定系数来嵌入水印,这些策略的详细研究可参见文献 [2]。
本节参考文献
- [2] Yu X, Wang C, Zhou X. Review on semi-fragile watermarking algorithms for content authentication of digital images. Future Internet. 2017;9:56
- [4] Mayer J. Optimization of Multibit Watermarking. Watermarking Book. London, UK: Intechopen; 2012