單 盛
(安徽電子信息職業(yè)技術(shù)學(xué)院軟件工程學(xué)院,安徽 蚌埠 233000)
數(shù)字圖像的高質(zhì)量發(fā)展決定了其對像素的分解程度越來越高,為促進數(shù)字媒體時代視頻的觀賞性,對圖像進行相關(guān)的融合處理十分必要[1]。現(xiàn)階段,以多尺度變換為基礎(chǔ)的圖像融合取得了較好的效果,但在實際的融合處理中,主要還是以線性濾波器作為融合工具,將待融合的圖像經(jīng)小波變換后,轉(zhuǎn)化為由線性尺度空間構(gòu)成的圖像單元[2]。這種融合方式可以在某種程度上降低圖像信息的丟失,但存在一個比較明顯的弊端:在對圖像進行多尺度分解時,分解過程的精細化程度直接影響圖像邊緣信息的完整性,一旦分解層數(shù)小于模糊邊緣信息密度值,會導(dǎo)致邊緣的定位出現(xiàn)混亂,影響圖像中物體輪廓的識別效果,最終造成扭曲、模糊等問題[3]。由此可知,線性尺度空間上的圖像融合對高質(zhì)量圖像的融合效果更理想,但對含有非線性特征的圖像的處理效果難以滿足實際需求[4]。面對這一問題,許多研究者就圖像融合處理方法作出了相關(guān)研究。蔣鈺婷等[5]利用多輸入細胞神經(jīng)網(wǎng)絡(luò)上下文隱馬爾可夫模型對非線性特征識別的精確性,實現(xiàn)圖像分解層次的劃分,融合圖像具有較高的畫質(zhì),但對源圖像的目標(biāo)定位存在一定誤差,因此容易出現(xiàn)逆向融合的問題。高元浩等[6]提出了一種基于特征自適應(yīng)融合的圖像融合算法,實現(xiàn)了特征信息的有效融合,但對源圖像中的模糊信息,難以實現(xiàn)有效篩選。李致金等[7]結(jié)合參數(shù)自適應(yīng)脈沖耦合神經(jīng)網(wǎng)絡(luò),對圖像信息的提取優(yōu)勢和卷積稀疏算法的高聚類屬性,提高了多聚焦圖像的融合效果,但在個別指標(biāo)上仍存在一定的提升空間。何金等[8]在云計算環(huán)境下進行圖像尺度空間融合,分析了不同尺度空間下的低頻及高頻子帶系數(shù),融合得到處理后的圖像,但在實際應(yīng)用中該方法對多重壓縮后的圖像處理易出現(xiàn)信息丟失的問題。綜上所述,對圖像中非線性特征融合方法的進一步研究具有重要的現(xiàn)實意義。
基于此,本文設(shè)計了一種數(shù)字媒體視頻圖像多尺度空間融合算法,通過對源圖像進行多尺度空間分解,提高了圖像輪廓及信息的分析精度,實現(xiàn)高質(zhì)量融合處理,并通過實驗驗證了該方法的有效性,為現(xiàn)代數(shù)字媒體的發(fā)展提供了技術(shù)支持。
對圖像進行融合處理前,要明確源圖像對信息的壓縮情況,現(xiàn)代數(shù)字媒體的視頻圖像主要以矢量化圖像的形式存在[9],這種圖像形式?jīng)Q定了圖像的放縮處理不會出現(xiàn)失幀[10]。因此,對圖像小波域非均勻分塊壓縮進行感知時,設(shè)置源矢圖像的矢量化表示形式為x∈rn×1,那么圖像的單位正交矩陣可以表示為R∈rn×n。以此為基礎(chǔ),對源圖像矢量化信息x轉(zhuǎn)化為k稀疏形式[11],圖像的單位正交矩陣可以表示為
式中:v為圖像適矢量信息x的加權(quán)系數(shù)序列,并存在v∈rn×1,由此可以得出源圖像中的非零元素近似數(shù)為k?n個。
利用壓縮感知理論[12],將k稀疏的x信息進行非自適應(yīng)投影,考慮到圖像的異構(gòu)屬性,本文使用m=O(klogn)個線性投影實心對其進行精確重構(gòu),其計算方式為
通過該方式,壓縮感知只需存貯ma×a2大小測量矩陣內(nèi)的圖像信息,提高了圖像信息的采集效果。
變換源圖像,變換域中每一個點都攜帶著圖像空間域原始信息,以實現(xiàn)完整的壓縮信息感知。本文通過小波多尺度變換的方式,將單元塊轉(zhuǎn)換為小波域[14],實現(xiàn)源圖像壓縮感知的采樣,在此基礎(chǔ)上的圖像融合可提高圖像空間重構(gòu)的精度,改善傳統(tǒng)重構(gòu)中存在的信息丟失問題。
將待融合圖像xi∈rn×n(i=1,2,…,k)分別進行離散小波變換(Discrete Wavelet Transformation,DWT)[15],并設(shè)置離散級別為l,對應(yīng)的DWT 分解系數(shù)為
式中:γ為DWT變換算子,存在γ∈rn×n。
為降低DWT 分解系數(shù)對信息采集結(jié)果的影響,在設(shè)置基帶的基礎(chǔ)上,對不同等級的分解系數(shù)進行個性化管理,將基帶轉(zhuǎn)化為由{H,V,D}3 個子帶組成的復(fù)合體。對第l級分解第j個子帶系數(shù),可將其劃分為bl×bl個子塊,其在第j∈{H,V,D}個子帶系數(shù)上的第i塊矢量化小波多尺度域壓縮信息可以表示為
由上述方式獲得完整的源圖像小波多尺度域壓縮信息,為后續(xù)的圖像融合提供可靠的數(shù)據(jù)基礎(chǔ)。
本文在完整源圖像信息以及多尺度融合規(guī)則的基礎(chǔ)上,融合信息中顯示的梯度幅值、區(qū)域能量以及匹配度,實現(xiàn)圖像的融合處理。
計算圖像信息匹配度,將分塊區(qū)域內(nèi)積能量作為依據(jù),設(shè)置目標(biāo)值降低圖像中噪聲對融合圖像質(zhì)量的干擾。設(shè)定一個滑動窗口,窗口大小即為圖像的融入層數(shù),其與融合效果的優(yōu)劣直接相關(guān)。在窗口中計算每個多尺度域的梯度變化幅值,并以域梯度幅值與相鄰尺度域的梯度幅值內(nèi)積作為區(qū)域能量的表示方式,計算其總和。按照該方式,逐個計算每個區(qū)域能量,區(qū)域能量越相近,表明其對應(yīng)的匹配度越高。將匹配度作為圖像融合的系數(shù),搭建關(guān)于整個圖像的融合規(guī)則,具體算法如下:
(1)利用梯度公式計算M×N窗口下源圖像多尺度域的梯度幅值,水平方向和垂直方向的梯度幅值分別為
(2)結(jié)合(1)得到的梯度結(jié)果,計算域內(nèi)的內(nèi)積能量。內(nèi)積能量主要是指域中心的內(nèi)積能量。以(i,j)為中心,范圍為(M,N)的尺度域中心的內(nèi)積能量為
(3)計算圖像尺度域之間的相關(guān)度。為了提高計算結(jié)果的可靠性,以壓縮信息乘積之和與內(nèi)積能量之和的比值作為計算依據(jù)。其中,顯著性度量特征為窗口區(qū)域的內(nèi)積能量,那么融合域的相關(guān)度為
式中:D(m,n)為圖像D在(m,n)點的壓縮值;G(m,n)為圖像G在(m,n)點的壓縮值。
(4)結(jié)合多尺度域加分結(jié)果對相關(guān)度進行處理,確定融合系數(shù)的權(quán)值。假設(shè)融合后圖像為F,則F的取值為
通過上述方式,實現(xiàn)圖像的高質(zhì)量融合,最大限度保留源圖像中的信息。
為了測試本文多聚焦圖像融合算法的實際應(yīng)用效果,設(shè)計實驗進行測試。采用Intel Core i7 處理器、16 GB 內(nèi)存、1 TB 硬盤作為實驗的硬件配置,以The MNISTDatabase 數(shù)據(jù)集作為實驗對象,隨機抽取其中60%的圖像進行算法訓(xùn)練,設(shè)置最大迭代次數(shù)為5 000 次,初始學(xué)習(xí)率為0.1,學(xué)習(xí)率變化因子為0.2,訓(xùn)練完成后,以剩余40%的圖像作為測試集進行測試。以其中較有代表性的一張圖像作為示例,分別采用文獻[5-7]中的方法作為對照組,測試4種方法對圖像的融合效果。本文多聚焦圖像融合實驗的原圖如圖1所示。
圖1 多聚焦融合原圖
除了直觀地對比不同方法的融合圖像外,為更加客觀地對融合結(jié)果的質(zhì)量進行定量評價,本文設(shè)計了3 個常用的源圖相似度性能指標(biāo)和2 個單圖清晰度評價指標(biāo),作為融合效果評價的標(biāo)準(zhǔn),具體的指標(biāo)如下:
(1)互信息:對融入圖像包含的源圖像信息量的描述?;バ畔⒌闹翟礁?,表明融合圖像中包含的信息量越多,相應(yīng)的融合效果也就越好。
(2)邊緣保持度:對融合圖像中邊緣信息保留完整度的描述。邊緣保持度越高,表明融合圖像中保留了越多的源圖像邊緣信息量。
(3)相似度:對融合圖像與源圖像一致性的描述。相似度越高,表明融合圖像中保持了越多源圖像中的最大梯度特征。
(4)信息熵:對融合圖像中包含信息量規(guī)模的描述。在圖像不失真的前提下,不考慮其他引入噪聲的信息熵越高,表明圖像的融合效果越好。
(5)平均梯度:對融合圖像清晰度的描述。平均梯度越高,表明融合圖像包含了越豐富的層次結(jié)構(gòu),對應(yīng)的圖像清晰度也就越高。
采用4種方法對多聚焦圖像進行融合處理,并對比融合效果。具體的圖像融合結(jié)果如圖2所示。
圖2 不同方法的融入效果對比圖
由圖2 可知,文獻[5]方法的融合圖像中整體存在較為明顯的虛假輪廓,并且這種輪廓覆蓋了整個圖像,表明在對左右聚焦進行融合的過程中,出現(xiàn)了反向融合,非聚焦像素成為了主要構(gòu)成;文獻[6]方法的融合圖像中右側(cè)邊緣附近存在一定程度的虛假輪廓,表明其針對左側(cè)聚焦圖像的融合效果并不理想;文獻[7]方法的融合圖像中左側(cè)邊緣附近存在一定程度的虛假輪廓,表明其針對右側(cè)聚焦圖像的融合過程出現(xiàn)了反向融合,導(dǎo)致模糊圖像作為融合主體被使用;本文方法的融合圖像實現(xiàn)了虛假輪廓的有效抑制,整體清晰。這是因為本文方法對源圖像進行了多尺度分解,圖像的相似度劃分更加合理,區(qū)域的配合度更高,獲得的融合結(jié)果也就更加理想。
對比4 個融合圖像的評價指標(biāo),其結(jié)果如表1所示。
表1 多聚焦圖像融合結(jié)果評價指標(biāo)對比表
由表1可知,在文獻[5]方法的融合結(jié)果中,分解層數(shù)較少,對圖像的處理效果相對較差,與其他方法相比,5 個評價指標(biāo)均處于最低值;文獻[6]方法的融合效果與文獻[5]相比有明顯提升,在分解程度上為5 層,對圖像的融合深度更深,處理精度也更高,對應(yīng)的指標(biāo)結(jié)果表現(xiàn)出明顯優(yōu)勢;文獻[7]方法的分解結(jié)果同樣為5 層,數(shù)據(jù)指標(biāo)與文獻[6]接近,與上文的圖像分析結(jié)果一致;相比之下,本文方法的融合效果評價指標(biāo)具有明顯的優(yōu)勢,對源圖像的分解層數(shù)高于另外3 種對比方法。這種更多尺度的分解最明顯的表現(xiàn)是融合后圖像的平均梯度大大提升,表1 中的結(jié)果顯示9.436,高于文獻[5]方法近1/3,因此圖像具有更高的清晰度。另外4個指標(biāo)也均高于對照組,表明本文設(shè)計的圖像融合方法能夠?qū)崿F(xiàn)高質(zhì)量的圖像處理。
為進一步驗證本文方法的優(yōu)越性,設(shè)定分解層數(shù)固定為5層,重復(fù)上述實驗5次,對比不同方法在融合圖像時耗費的時間,得到結(jié)果如表2所示。
表2 不同方法的運行時間結(jié)果對比
由表2 可知,在多次重復(fù)實驗下,本文方法在處理圖像時,持續(xù)保持較低的運行時間,平均為4.3 s,而文獻[5-7]方法的平均運行時間分別為11.22 s、15.86 s、9.32 s。由此表明,本文設(shè)計的圖像融合方法能夠快速地實現(xiàn)圖像處理,滿足現(xiàn)實的需求。
圖像融合本質(zhì)上是借助融合系統(tǒng)或手段,對融合圖像進行信息綜合的一種形式,利用圖像在波段上的互補關(guān)系,通過傳感器等對具有更加優(yōu)質(zhì)信息的圖像進行整合,最終統(tǒng)一到同一圖像或綜合圖像上,并將其特征更加清晰地展示,為后期的觀察或進一步處理提供更加精確和全面的判斷依據(jù)。本文提出的數(shù)字媒體視頻圖像多尺度空間融合算法是目前圖像融合方法中的主要方法之一,可以劃分為多尺度變換一類,實現(xiàn)了圖像中不同尺度信息的全面提取,因此融合效果更好。通過本文的研究,希望為數(shù)字媒體的視頻圖像高質(zhì)量發(fā)展提供幫助。