王子馳,馮國瑞,張新鵬
(1. 上海大學(xué)通信與信息工程學(xué)院,上海 200444; 2. 深圳大學(xué)深圳媒體信息內(nèi)容安全重點(diǎn)實(shí)驗(yàn)室,廣東 深圳 518060)
圖像隱寫旨在將秘密信息嵌入數(shù)字圖像中以實(shí)現(xiàn)隱蔽通信。隱寫分析則根據(jù)隱寫修改引起的載體數(shù)據(jù)統(tǒng)計(jì)異常來判斷可疑圖像中是否含有秘密信息[1]。近年來二者均得到快速發(fā)展。圖像隱寫采用的載體類型主要包括兩種:自然圖像(對(duì)真實(shí)場景拍攝的成像)[2]和生成圖像(利用深度學(xué)習(xí)技術(shù)生成)[3]。其中,自然圖像為真實(shí)世界的客觀描述,而生成圖像則是可能場景的合理呈現(xiàn)。
借助元宇宙進(jìn)行隱蔽通信的研究是圖像隱寫的一個(gè)重要分支。非同質(zhì)化代幣(NFT,non-fungible token)是元宇宙中用于表示數(shù)字資產(chǎn)的唯一加密“貨幣”令牌,可用于買賣[4]。在NFT中國(NFTCN)平臺(tái)[5]上,用戶可自由創(chuàng)作、交易、分享和收藏NFT數(shù)字藝術(shù)作品(目前均為數(shù)字圖像)。NFTCN平臺(tái)上的數(shù)字藝術(shù)作品被稱為NFT圖像。NFT圖像的內(nèi)容既非真實(shí)世界的客觀描述,也非可能場景的合理呈現(xiàn),而是虛擬空間的自主定義。本文旨在利用NFT圖像進(jìn)行隱寫。
NFTCN平臺(tái)與推特、微博、微信等社交網(wǎng)絡(luò)不同,該平臺(tái)不會(huì)對(duì)上傳的圖像進(jìn)行預(yù)處理,即下載的圖像與上傳版本完全一致。因此,NFTCN平臺(tái)是理想的隱寫信道,利用其進(jìn)行隱寫時(shí)無須考慮信息嵌入的魯棒性。所有隱寫方案均可保證將含密圖像上傳至NFTCN平臺(tái)后,在下載的圖像中正確提取秘密信息。此外,NFT圖像的多樣性為隱寫提供了天然屏障。NFT圖像為數(shù)字藝術(shù)作品,由用戶自行創(chuàng)作,其內(nèi)容多種多樣,在數(shù)據(jù)空間分布較廣。此種情形下幾乎所有包含語義的圖像內(nèi)容可視為“正?!保凑FT圖像的范圍覆蓋較廣,這為秘密信息的隱藏提供了極大便利。為了保證原創(chuàng),上傳的NFT圖像不能與其他作品相同或高度相似,從而保證了NFT圖像的多樣性。因此,在NFT圖像上進(jìn)行隱寫有較大的可行性與應(yīng)用價(jià)值,但目前還未有以NFT圖像為載體的隱寫方法。
本文提出了一種用于NFT圖像的隱寫方法。由于圖像紋理細(xì)節(jié)有利于掩蓋隱寫的修改痕跡,首先對(duì)NFT圖像的高頻與邊緣輪廓部分進(jìn)行增強(qiáng),使增強(qiáng)后的圖像更適合隱寫,將增強(qiáng)后的圖像作為隱寫的載體圖像。之后將增強(qiáng)前圖像看作增強(qiáng)后圖像的相似版本,以增強(qiáng)前圖像為參考,確定載體圖像每個(gè)像素加1或減1的傾向修改方向,據(jù)此對(duì)隱寫失真代價(jià)函數(shù)進(jìn)行優(yōu)化,調(diào)整載體各像素的修改代價(jià)以滿足確定的傾向修改方向,進(jìn)一步提升隱寫抗檢測性。最后利用主流隱寫編碼框架在載體圖像中進(jìn)行信息嵌入。
有研究者通過增強(qiáng)載體圖像提高隱寫抗檢測性。文獻(xiàn)[6]利用Gamma變換對(duì)載體圖像進(jìn)行增強(qiáng)。與之不同,本文對(duì)高頻與邊緣輪廓增強(qiáng)。除載體增強(qiáng)外,本文還提出了針對(duì)NFT圖像的代價(jià)優(yōu)化方法。以增強(qiáng)圖像與原始圖像的差異為參考,調(diào)整載體像素代價(jià)值,進(jìn)一步提高了NFT圖像隱寫的抗檢測性。本文的主要貢獻(xiàn)如下。
1) 提出了針對(duì)NFT圖像的載體增強(qiáng)方法。通過對(duì)圖像高頻與邊緣輪廓進(jìn)行增強(qiáng),增加了像素值的隨機(jī)性。上述操作使隱寫的修改痕跡被掩蓋在像素值的隨機(jī)性中,從而使隱寫分析工具難以區(qū)分隱寫修改痕跡與增強(qiáng)引起的隨機(jī)性。
2) 提出了針對(duì)NFT圖像的代價(jià)優(yōu)化方法。以增強(qiáng)圖像與原始圖像的差異為參考,確定載體圖像各像素加1或減1的傾向修改方向,據(jù)此調(diào)整載體像素代價(jià)值,進(jìn)一步提高了NFT圖像隱寫的抗檢測性。
NFT圖像隱寫的相關(guān)工作包括圖像隱寫與圖像隱寫分析。
目前最有效的數(shù)字圖像隱寫框架通過最小化含密圖像在預(yù)定義失真代價(jià)函數(shù)下的加性失真來保證隱寫安全[7],其中失真代價(jià)函數(shù)為圖像各像素分配一個(gè)代價(jià)值以衡量修改風(fēng)險(xiǎn)。之后通過最優(yōu)隱寫編碼如STC(syndrome trellis coding)[8]或SPC(steganographic polar code)[9]來實(shí)現(xiàn)最小化加性失真嵌入。有許多適用于數(shù)字圖像的失真代價(jià)函數(shù),WOW(wavelet obtained weights)[10]將圖像各方向定向殘差加和的倒數(shù)作為像素的失真代價(jià)值;UNIWARD(universal wavelet relative distortion)[11]將一組小波方向?yàn)V波器在像素或DCT系數(shù)變化前后的改變量作為失真代價(jià);HILL (high-pass,low-pass, and low pass)[12]采用聚集修改位置策略來提高抗檢測性;MiPOD(minimi- zing the power of optimal detector)[13]根據(jù)似然比檢驗(yàn)求解最佳檢測器,通過求解非線性代數(shù)方程得到像素的修改概率,并反推各像素的失真代價(jià)。也有運(yùn)用深度學(xué)習(xí)技術(shù)設(shè)計(jì)的隱寫失真函數(shù),
UT-GAN(U-Net ternary embedding with generat- ive adversarial network)[14]利用U-Net網(wǎng)絡(luò)[15]將載體圖像轉(zhuǎn)換為像素修改概率圖。
有研究者對(duì)已有隱寫失真函數(shù)進(jìn)行優(yōu)化。文獻(xiàn)[16]通過多次嵌入,根據(jù)對(duì)抗性樣本的反向梯度方向決定代價(jià)值的傾向修改方向。Denemark等[17]將同一場景中的多幅圖像作為邊信息來優(yōu)化JPEG失真函數(shù)。Chen等[18]通過放大局部紋理,在保持圖像原有特性的同時(shí)突出紋理區(qū)域。Zhang等[19]通過將像素的聯(lián)合失真拆分為單個(gè)失真來考慮像素修改后對(duì)其鄰域像素的影響。Zhou等[20]將多種性能相近的失真函數(shù)賦予的代價(jià)值差別較大的像素稱作“爭議像素”,通過對(duì)爭議像素賦予較高的修改概率來融合多種失真函數(shù)。文獻(xiàn)[21]則利用維納濾波構(gòu)造參考圖像,并據(jù)此確定代價(jià)值的傾向修改方向。Li等[22]改進(jìn)參考圖像的構(gòu)造方法,采用去塊效應(yīng)濾波器構(gòu)造參考圖像。除自然圖像外,也有針對(duì)非自然圖像的失真函數(shù),如紋理合成圖像[23]、虹膜圖像[24]、表情圖像[25]、增強(qiáng)圖像[26]等。本文將針對(duì)NFT圖像提出新的失真代價(jià)函數(shù)優(yōu)化策略。
主流的圖像隱寫分析采用機(jī)器學(xué)習(xí)方法檢測秘密信息的存在性,主要分為人工特征隱寫分析與深度學(xué)習(xí)隱寫分析。
人工特征隱寫分析主要研究隱寫操作引起的圖像統(tǒng)計(jì)特性變化,首先提取圖像特征,之后訓(xùn)練分類器進(jìn)行檢測。主要捕捉隱寫對(duì)載體像素修改造成的圖像統(tǒng)計(jì)特性變化,需要抑制圖像內(nèi)容、放大隱寫噪聲。目前已有許多隱寫分析特征提取方法,如SPAM(subtractive pixel adjacency matrix)[27]、SRM(spatial rich model)[28]、PSRM(projections of spatial rich model)[29]、maxSRMd2(selection-channel-aware rich model)[30]、SCRMQ1(spatial color rich model)[31]、TLBP(threshold local binary pattern)[32]等。大多數(shù)隱寫分析特征為高維特征,主要采用集成分類器[33]進(jìn)行訓(xùn)練。集成分類器由若干個(gè)子分類器組成,其中子分類器采用Fisher線性分類判決。各子分類器從高維空間中以一定步長隨機(jī)抽取若干維特征進(jìn)行訓(xùn)練,取訓(xùn)練誤差最小的子分類器。實(shí)際檢測時(shí)各子分類器投票給出最終決策。
深度學(xué)習(xí)方法的出現(xiàn)在很大限度上改變了隱寫分析研究方向。文獻(xiàn)[34]用多個(gè)高通濾波器獲取圖像殘差,將殘差送入CNN進(jìn)行訓(xùn)練得到TLU-CNN。Li等[35]采用不同的高通濾波器分別訓(xùn)練3個(gè)子網(wǎng)絡(luò),再通過全連接層整合。文獻(xiàn)[36]提出了一種深度殘差網(wǎng)絡(luò)結(jié)構(gòu)來避免啟發(fā)式地設(shè)計(jì)網(wǎng)絡(luò)以提高隱寫分析網(wǎng)絡(luò)的開發(fā)效率。文獻(xiàn)[37]考慮利用已有網(wǎng)絡(luò)在不重新訓(xùn)練其參數(shù)的情況下對(duì)不同大小的圖像進(jìn)行隱寫分析。文獻(xiàn)[38]利用聯(lián)邦學(xué)習(xí)技術(shù)實(shí)現(xiàn)隱寫分析,多個(gè)參與者共同訓(xùn)練一個(gè)隱寫分析網(wǎng)絡(luò),彼此僅共享網(wǎng)絡(luò)模型信息,不共享訓(xùn)練參數(shù)。
本文采用上述的部分隱寫分析方法檢驗(yàn)隱寫抗檢測性,并與現(xiàn)有隱寫方案進(jìn)行對(duì)比。
本文提出了一種NFT圖像的隱寫方法,其框架如圖1所示,對(duì)一幅給定的原始NFT圖像Xo,首先將其高頻與邊緣輪廓部分進(jìn)行增強(qiáng),以豐富圖像中有利于掩蓋隱寫修改痕跡的細(xì)節(jié)部分,從而使增強(qiáng)后的圖像Xc更適合隱寫。將Xc作為載體,利用現(xiàn)有的失真代價(jià)函數(shù)為Xc的各像素分配失真代價(jià)值ρu。之后對(duì)ρu進(jìn)行優(yōu)化,根據(jù)Xo與Xc像素的差異確定Xc各像素加1或減1的傾向修改方向,并根據(jù)此差異調(diào)整Xc各像素的修改代價(jià)以滿足確定的傾向修改方向,得到可進(jìn)一步提升隱寫抗檢測性的失真代價(jià)值ρv。最后利用主流隱寫編碼框架在Xc中嵌入秘密信息m,得到含密圖像Xs。下面分別對(duì)本文所提方法的4個(gè)主要過程進(jìn)行介紹。
圖1 本文所提方法框架Figure 1 Architecture of the proposed method
由于圖像紋理細(xì)節(jié)有利于掩蓋隱寫的修改痕跡,本文首先對(duì)原始NFT圖像Xo的高頻與邊緣輪廓部分進(jìn)行增強(qiáng),使增強(qiáng)后的圖像Xc更適合隱寫,將Xc作為隱寫的載體圖像。
首先在Xo中添加輕微的高斯噪聲z~N(0, 0.000 1),以在不影響NFT圖像正常的創(chuàng)作、交易、分享和收藏等功能的條件下豐富圖像的高頻成分,得到圖像Xt。可證明在圖像中添加參數(shù)分別為μ與σ2(σ> 0)的高斯噪聲N(μ,σ2)后,圖像的峰值信噪比(PSNR,peak signal to noise ratio)為
證明過程見附錄。加入噪聲z~N(0, 0.000 1)后,所得圖像Xt相對(duì)于圖像Xo的峰值信噪比為40 dB,即圖像保持了較高質(zhì)量。因此添加輕微高斯噪聲的操作不影響圖像內(nèi)容及其在元宇宙中的正常使用。由于NFT圖像不同于自然圖像,其內(nèi)容為用戶自主定義,因此只要不影響正常使用,添加噪聲等操作在NFT圖像中可被允許。
之后對(duì)圖像Xt的邊緣輪廓部分進(jìn)行增強(qiáng),進(jìn)一步豐富有利于掩蓋隱寫修改痕跡的細(xì)節(jié)部分。采用Sobel算子計(jì)算圖像像素值的梯度,將梯度方向變化較大的區(qū)域作為邊緣,即圖像Xt第(i,j)個(gè)像素處的梯度值g(i,j)為
其中,gh(i,j)與gv(i,j)分別為水平與垂直方向的梯度值,分別由式(3)與式(4)計(jì)算得到,Gh與Gv分別為gh(i,j)與gv(i,j)對(duì)應(yīng)的梯度矩陣。
由于隱寫算法的修改幅度通常為1±且集中于紋理較為復(fù)雜的邊緣輪廓區(qū)域,本文對(duì)圖像Xt中定位好的邊緣輪廓部分進(jìn)行隨機(jī)的加減1操作,最終得到增強(qiáng)后的載體圖像Xc。即隱寫信息嵌入的對(duì)象為增強(qiáng)后的載體圖像,而不是原始的NFT圖像。圖像高頻與邊緣輪廓部分由于隨機(jī)性強(qiáng)、難以預(yù)測,歷來為隱寫與隱寫分析雙方關(guān)注的重點(diǎn)。盡管部分隱寫分析特征是從紋理區(qū)域來構(gòu)造特征模型的,增強(qiáng)載體圖像邊緣輪廓仍有利于提高隱寫抗檢測性,這是由于邊緣輪廓增強(qiáng)后,其像素值的隨機(jī)性增強(qiáng)。上述過程使隱寫過程中對(duì)邊緣輪廓像素的修改痕跡被掩蓋在邊緣輪廓的隨機(jī)性中。隱寫分析工具難以區(qū)分隱寫修改痕跡與增強(qiáng)引起的隨機(jī)性,即增強(qiáng)載體圖像邊緣輪廓可使隱寫分析難以從紋理區(qū)域構(gòu)造準(zhǔn)確的特征模型。
本文將增強(qiáng)后的圖像Xc=[xc(1),xc(2) ,…,xc(n)]T∈{0, 1,…, 255}n×1作為隱寫載體,采用STC隱寫編碼框架嵌入秘密信息m=[m(1),m(2),…,m(k)]T∈{0, 1}k×1。由最小化加性失真框架[8-9]可知,在含有n個(gè)像素的Xc中嵌入k比特信息的理論最小失真D為
參數(shù)λ用于使修改概率的信息熵等于需要嵌入的信息量k,如式(10)所示。
即在最小化加性失真框架下需要設(shè)計(jì)失真代價(jià)函數(shù)來為載體各像素賦予修改代價(jià)。目前已有許多適用于數(shù)字圖像的失真代價(jià)函數(shù),本文利用現(xiàn)有隱寫方法得到各像素的代價(jià)值ρu,之后對(duì)ρu進(jìn)行優(yōu)化。
設(shè)圖像Xo與Xc像素的差異為?=[δ(1),δ(2),…,δ(n)]T,即δ(i)=xc(i)?xo(i)。首先利用改進(jìn)的Sigmod(·)函數(shù)Ψ(·)調(diào)整像素差異取值,如式(11)所示。
其中,參數(shù)α> 0用于調(diào)節(jié)函數(shù)值域的變化速度。式(11)用于將像素殘差的取值限定在?0.5到0.5之間,并將調(diào)整后殘差的絕對(duì)值作為調(diào)整隱寫代價(jià)值的幅度。原始Sigmod(·)函數(shù)值域?yàn)?~1,并關(guān)于(0, 0.5)中心對(duì)稱。當(dāng)殘差取值為0時(shí),表示載體圖像與原始圖像像素?zé)o差異,此時(shí)不應(yīng)修改隱寫代價(jià)值。將Sigmod(·)函數(shù)值減去0.5,使值域關(guān)于(0, 0)中心對(duì)稱,以滿足隱寫代價(jià)優(yōu)化所需,則初始代價(jià)ρu可由式(12)~式(15)進(jìn)行優(yōu)化。
1) 對(duì)安全要素的設(shè)計(jì)和生態(tài)意義的考慮不足,多數(shù)未能做到瀕水景觀環(huán)境的藝術(shù)、技術(shù)與安全因素三者的有機(jī)統(tǒng)一[14];
即初始狀態(tài)下xc(i)的加1與減1的代價(jià)值與分別等于與,若xc(i) >xo(i),減小使xc(i)進(jìn)行加1修改的概率大于減1修改,從而使修改后的xc(i)遠(yuǎn)離xo(i)。這是由于增強(qiáng)后的圖像Xc比原始圖像Xo更適合隱寫,因此當(dāng)隱寫過程中需要修改圖像像素值時(shí),應(yīng)朝著遠(yuǎn)離Xo的方向修改。反之,若xc(i) 最小化加性失真理論給出了固定嵌入量下的理論最小失真界限,STC則提供了逼近上述理論界限的實(shí)際編碼方法。信息嵌入過程如式(16)所示。其中D(Xc,Xs)為含密圖像Xs相對(duì)于載體圖像Xc的Y失真,失真度量方式由失真函數(shù)決定。即在m的陪集C(m)中尋找與Xc距離最近的碼字作為含密對(duì)象,即尋找加性失真最小的嵌入方案。 陪集C定義如式(17)所示,H∈{0,1}k×n為校驗(yàn)矩陣。STC將秘密信息看作線性碼的伴隨式,而線性碼由H確定。 陪集中所有碼字r均滿足Hr=m,即陪集中的所有碼字左乘校驗(yàn)矩陣均可得到秘密信息。因此提取過程很簡單,如式(18)所示,將含密圖像Xs左乘C的校驗(yàn)矩陣H即可得到秘密信息。 上述過程中的載體增強(qiáng)與代價(jià)優(yōu)化方法均針對(duì)NFT圖像設(shè)計(jì),不適用于一般圖像。對(duì)于載體增強(qiáng),本文通過添加輕微高斯噪聲以及隨機(jī)修改圖像邊緣部分,對(duì)圖像高頻與邊緣輪廓進(jìn)行增強(qiáng)。此操作不屬于正常的圖像處理,在自然圖像中屬于異常行為,可被隱寫分析工具判為含密。而NFT圖像內(nèi)容本身就具有自定義性,幾乎所有包含語義的圖像內(nèi)容可視為“正?!保灰挥绊懯褂?,添加噪聲等操作在NFT圖像中可被允許,其不能成為秘密信息存在的證據(jù)。因此,本文提出的載體增強(qiáng)方法為針對(duì)NFT圖像設(shè)計(jì)。對(duì)于代價(jià)優(yōu)化,本文以增強(qiáng)圖像與原始圖像的差異為參考,確定載體圖像各像素加1或減1的傾向修改方向,據(jù)此調(diào)整載體像素代價(jià)值。一般圖像隱寫雖也有代價(jià)優(yōu)化的方法,但其思想為使載體圖像像素值朝著靠近參考圖像像素值的方向調(diào)整像素代價(jià)值。而本文朝著遠(yuǎn)離參考圖像像素值的方向調(diào)整載體像素代價(jià)值。這是由于增強(qiáng)后的載體圖像比參考圖像更適合隱寫。因此,本文提出的代價(jià)優(yōu)化方法也是針對(duì)NFT圖像設(shè)計(jì)的。 本節(jié)首先介紹實(shí)驗(yàn)環(huán)境,之后確定方法參數(shù)取值,再進(jìn)行消融實(shí)驗(yàn),最后用隱寫分析工具檢驗(yàn)本方法的有效性。 (1)圖像庫 由于本文方法是針對(duì)NFT圖像設(shè)計(jì)的,因此未采用隱寫領(lǐng)域常用的自然圖像庫。實(shí)驗(yàn)采用NFTCN平臺(tái)[5]下載的1 000幅不同尺寸的彩色NFT圖像(大多數(shù)尺寸為400×400,此外主要包括400×500、400×533,以及400×560等),作為原始圖像Xo;采用2.1節(jié)所述方法進(jìn)行增強(qiáng)后得到對(duì)應(yīng)的1 000幅載體圖像即Xc。本文方法隱寫信息嵌入與隱寫分析的對(duì)象均為增強(qiáng)后的載體圖像,而不是NFTCN平臺(tái)直接下載的圖像。 (2)隱寫方法 用于獲取初始代價(jià)ρu的隱寫方法為HILL、MiPOD,以及針對(duì)視覺增強(qiáng)圖像設(shè)計(jì)的隱寫失真函數(shù)DFEI[26],所有嵌入過程均采用STC編碼的模擬嵌入器[39]完成。嵌入率分別設(shè)定為 0.1 bit/pixel、0.2 bit/pixel、0.3 bit/pixel、0.4 bit/pixel、0.5 bit/pixel,嵌入完成后即可得到含密圖像Xs。NFTCN平臺(tái)上的圖像數(shù)量還較少,未搜集到大量的NFT圖像,因此本實(shí)驗(yàn)未采用基于深度學(xué)習(xí)的UT-GAN等隱寫方法。 (3)隱寫分析方法 用于檢驗(yàn)隱寫抗檢測性的隱寫分析特征采用SPAM[27]、maxSRMd2[30]、SCRMQ1[31]、TLBP[32]。并采用集成分類器訓(xùn)練及測試特征。即采用上述隱寫分析方法分別提取1 000幅增強(qiáng)的載體圖像Xc以及對(duì)應(yīng)的含密圖像Xs的特征。其中,將特征集的一半作為訓(xùn)練集,另一半作為測試集。評(píng)價(jià)分類性能的指標(biāo)為測試誤差PE,如式(19)所示。 其中,PFA與PMD分別為虛警率(將正常圖像Xc判斷為含密圖像Xs的概率)與漏檢率(將含密圖像Xs判斷為正常圖像Xc的概率)。PE越小表示隱寫分析性能越好,隱寫抗檢測性越差。通常0 ≤PE≤ 0.5,PE= 0.5代表隨機(jī)猜測,即分類器完全無法區(qū)分正常圖像特征與含密圖像特征。為了消除隨機(jī)性,實(shí)驗(yàn)所有的測試誤差數(shù)據(jù)均為獨(dú)立測試10次的平均值。 式(11)中參數(shù)α用于調(diào)節(jié)函數(shù)值域的變化速度,對(duì)代價(jià)優(yōu)化的效果起到了重要作用,本節(jié)討論其取值。將本文方法用于1 000幅增強(qiáng)后的載體圖像Xc中嵌入秘密信息。嵌入率為0.3 bit/pixel與0.5 bit/pixel的條件下,不同α值下的測試誤差PE如圖2所示。 圖2 不同α值下的測試誤差PEFigure 2 Values of PE with different α 參數(shù)α取值越大表示對(duì)初始代價(jià)的調(diào)整幅度越大,調(diào)整幅度過大反而會(huì)降低隱寫抗檢測性。由圖3可看出嵌入率0.3 bit/pixel與0.5 bit/pixel的情況下,測試誤差PE均在α= 0.5時(shí)達(dá)到最大,即隱寫抗檢測性最好。因此參數(shù)α的取值定為0.5。 本文方法在現(xiàn)有最小化加性失真隱寫框架的基礎(chǔ)上加入了載體增強(qiáng)與代價(jià)優(yōu)化兩個(gè)環(huán)節(jié)。為驗(yàn)證二者均能提高隱寫抗檢測性,本文首先采用HILL在1 000幅原始圖像Xo中嵌入信息,記為“HILL-o”;之后采用HILL在1 000幅增強(qiáng)后的載體圖像Xc中嵌入信息,記為“HILL-c”,即僅采用本文方法中的載體增強(qiáng)策略;最后采用經(jīng)過代價(jià)優(yōu)化的HILL在1 000幅增強(qiáng)載體Xc中嵌入信息,記為“HILL-p”,即同時(shí)采用本文方法中的載體增強(qiáng)與代價(jià)優(yōu)化策略。三者在隱寫分析特征SPAM與maxSRMd2檢測下的抗檢測性對(duì)比如圖3所示。 由圖3可看出HILL-c與HILL-p方案對(duì)應(yīng)的PE值均高于HILL-o方案,大多數(shù)情況下HILL-p方案對(duì)應(yīng)的PE值高于HILL-c方案。即在現(xiàn)有隱寫方法HILL的基礎(chǔ)上,本文方法中的載體增強(qiáng)與代價(jià)優(yōu)化策略均能進(jìn)一步提升隱寫抗檢測性。因此相比于直接采用現(xiàn)有隱寫方法在原始NFT圖像中嵌入信息,本文方法更適用于多樣化的NFT圖像。本文方法為除自然圖像與生成圖像以外的第3類載體(即NFT圖像)提供了針對(duì)性的隱寫方法。 圖3 不同嵌入策略抗檢測性對(duì)比Figure 3 Undetectability comparison of different embedding strategies against 本文方法的兩個(gè)策略均提升了隱寫抗檢測性。圖4與圖5展示了本文方法與現(xiàn)有隱寫方案的抗檢測性對(duì)比,對(duì)應(yīng)的具體數(shù)值如表1所示。MiPOD-o與DFEI-o表示分別采用MiPOD與DFEI在1 000幅原始圖像Xo中嵌入信息,MiPOD-p與DFEI-p則分別表示采用經(jīng)過代價(jià)優(yōu)化的MiPOD與DFEI在1 000幅增強(qiáng)后的載體圖像Xc中嵌入信息。 表1 隱寫方法抗檢測性對(duì)比數(shù)值(PE)Table 1 Undetectability comparison between steganographic schemes using PE 圖4 本文方法與現(xiàn)有隱寫方案抗檢測性對(duì)比1Figure 4 Undetectability comparison between proposed method and existing steganographic schemes against 1 由圖4與圖5可看出,所有情況下本文方法對(duì)應(yīng)的PE值均明顯高于直接在NFT圖像上使用HILL、MiPOD、DFEI隱寫。例如,本文方法優(yōu)化后的HILL,對(duì)嵌入率為0.3 bit/pixel的情況,在SPAM與maxWSRMd2特征下PE值分別提高了5.5%與11.1%;在TLBP與SCRMQ1特征下,分別提高了9.0%與14.0%。對(duì)MiPOD與0.3 bit/pixel情況,則在4個(gè)特征下分別提高了7.2%、9.1%、13.7%,以及19.4%。而對(duì)于針對(duì)增強(qiáng)圖像設(shè)計(jì)的隱寫方法DFEI,嵌入率為0.3 bit/pixel的情況在4個(gè)特征下分別提高了4.5%、7.5%、2.8%,以及12.3%。此外,可看出抗檢測性的提升量與嵌入率呈正相關(guān)趨勢。這是因?yàn)榍度肼实蜁r(shí)PE值距離理論界限50%較近,提升空間小。 圖5 本文方法與現(xiàn)有隱寫方案抗檢測性對(duì)比2Figure 5 Undetectability comparison between proposedmethod and existing steganographic schemes against 2 整體上看,對(duì)于HILL、MiPOD、DFEI隱寫方案,本文方法可分別將PE值平均提升8.7%、9.2%,以及6.2%(所有嵌入率與隱寫分析特征情況平均值)。因此本文方法應(yīng)用于NFT圖像時(shí)的抗檢測性優(yōu)于現(xiàn)有的數(shù)字圖像隱寫方案,即本文方法適用于NFT圖像。 針對(duì)NFT圖像,本文基于最小化加性失真框架提出了一種新的隱寫方法。首先將原始NFT圖像的高頻與邊緣輪廓部分進(jìn)行增強(qiáng),以得到更適合隱寫的載體。增強(qiáng)操作不影響圖像內(nèi)容及其在元宇宙中的創(chuàng)作、交易、分享和收藏等正常使用。之后根據(jù)增強(qiáng)前后圖像像素的差異對(duì)隱寫失真代價(jià)函數(shù)進(jìn)行優(yōu)化。實(shí)驗(yàn)結(jié)果表明本文提出的載體增強(qiáng)與代價(jià)優(yōu)化策略均能提升隱寫抗檢測性。應(yīng)用于NFT圖像時(shí),本文方法的抗檢測性優(yōu)于直接使用現(xiàn)有的數(shù)字圖像隱寫方案。未來待NFT圖像數(shù)量較為可觀后,可充分利用神經(jīng)網(wǎng)絡(luò)強(qiáng)大的擬合與學(xué)習(xí)能力,設(shè)計(jì)深度學(xué)習(xí)的NFT圖像隱寫方法。 附錄 定理在圖像中添加參數(shù)分別為μ與σ2(σ> 0)的高斯噪聲N(μ,σ2)后,圖像的峰值信噪比為 證明已知高斯噪聲N(μ,σ2)的概率密度函數(shù)f(x)為 則加入該噪聲后,圖像的均方誤差(MSE,mean squared error))為 其中, 則, 因此,圖像的峰值信噪比為2.4 信息嵌入
3 實(shí)驗(yàn)結(jié)果
3.1 實(shí)驗(yàn)環(huán)境
3.2 參數(shù)尋優(yōu)
3.3 消融實(shí)驗(yàn)
3.4 抗檢測性對(duì)比
4 結(jié)束語