傅建明,王冬慶
(1. 江西科技學(xué)院,江西 南昌 330098;2. 江西師范大學(xué)計(jì)算機(jī)信息工程學(xué)院,江西 南昌 330224)
現(xiàn)階段,多媒體領(lǐng)域?qū)D像信息的存儲(chǔ)和傳輸提出了更高的要求,也為現(xiàn)有的有限帶寬帶來(lái)了嚴(yán)峻的考驗(yàn)。高質(zhì)量的數(shù)字視覺(jué)圖像占用硬盤(pán)容量大,嚴(yán)重影響其存儲(chǔ)和傳輸,圖像壓縮過(guò)程是解決此問(wèn)題的關(guān)鍵性技術(shù)。因此圖像壓縮技術(shù)受到了越來(lái)越多的關(guān)注[1]。在此背景下,機(jī)器視覺(jué)技術(shù)[2,3]在圖像中應(yīng)用逐漸廣泛,機(jī)器視覺(jué)圖像壓縮就是用最少的代碼或符號(hào)表示出圖像的主要信息和內(nèi)容。但是在圖像的壓縮過(guò)程其質(zhì)量會(huì)受到影響,導(dǎo)致圖像細(xì)節(jié)信息丟失或特征模糊。
針對(duì)此問(wèn)題,目前相關(guān)專(zhuān)家對(duì)圖像壓縮開(kāi)展相應(yīng)研究。鄭鐵[4]等人首先在單邊高斯預(yù)測(cè)器的幫助下預(yù)測(cè)圖像像素點(diǎn)以此消除圖像的空間相關(guān)性,其次運(yùn)用格型濾波器選取出各個(gè)譜帶中的最優(yōu)濾波器,從而生成預(yù)測(cè)誤差,最終依據(jù)格型濾波器自身特性簡(jiǎn)化濾波器篩選經(jīng)過(guò),以此簡(jiǎn)化圖像編碼,完成圖像壓縮,實(shí)現(xiàn)機(jī)器視覺(jué)圖像壓縮。趙輝[5]等人首先構(gòu)建正則化約束項(xiàng)構(gòu)建優(yōu)化模型,其次通過(guò)分裂Bregman迭代將圖像壓縮問(wèn)題劃分成多個(gè)子問(wèn)題,獲取每個(gè)子問(wèn)題答案,并將所有問(wèn)題答案結(jié)合生成最終的壓縮結(jié)果,實(shí)現(xiàn)機(jī)器視覺(jué)圖像壓縮。
以上兩種方法在圖像壓縮過(guò)程中忽略了對(duì)圖像的分塊預(yù)處理,導(dǎo)致圖像的公共位圖得出的結(jié)果不準(zhǔn)確,極可能忽略部分像素點(diǎn),存在壓縮效果差以及峰值信噪比低的問(wèn)題。為了解決上述方法中存在的問(wèn)題,提出基于煙花算法的機(jī)器視覺(jué)圖像分塊壓縮方法。
本文機(jī)器視覺(jué)圖像壓縮的前提是對(duì)圖像分塊壓縮,為了確保壓縮效果,利用圖像的自適應(yīng)方法進(jìn)行分塊[6,7]。
為了完美表示出機(jī)器視覺(jué)圖像的紋理以及邊緣等特征結(jié)構(gòu),同時(shí)也能很好地調(diào)控分塊的復(fù)雜度,需要在圖像稀疏變換[8]前計(jì)算出圖像像素的灰度差值,并將其視為圖像分塊的依據(jù),則圖像像素灰度差的平均值計(jì)算公式為
(1)
自適應(yīng)分塊算法[9,10]是通過(guò)四叉樹(shù)算法實(shí)現(xiàn)的,即通過(guò)機(jī)器視覺(jué)圖像的紋理變化將圖像劃分成等大的圖像塊,高效完成平坦區(qū)域和復(fù)雜區(qū)域的劃分,從而得出機(jī)器視覺(jué)圖像的自適應(yīng)分塊,圖像分塊流程圖如圖1所示。
圖1 機(jī)器視覺(jué)圖像自適應(yīng)分塊流程
根據(jù)圖像分塊流程圖可知,分塊過(guò)程中需要計(jì)算出分塊閾值,將分塊閾值標(biāo)記為P,由于P是由機(jī)器視覺(jué)圖像中鄰近像素點(diǎn)之間灰度差平均值得出的,則表達(dá)式為
(2)
基于圖1的流程,結(jié)合式(1)和式(2)完成圖像的自適應(yīng)分塊。
利用BTC方法處理分塊圖像的R、G、B通道,生成位圖Ro、Go和Bo,則機(jī)器視覺(jué)分塊圖像中位于點(diǎn)(i,j)的初始公位圖元素點(diǎn)的表達(dá)式為
(3)
將初始公共位圖AM的元素β集合生成向量S,其表達(dá)式為
S=(β1,β2,…,βN)
(4)
根據(jù)式(3)和式(4)即可計(jì)算出初始公共位圖AM,為了生成最優(yōu)公共位圖,需要提前對(duì)向量S進(jìn)行初始化處理[11],為保證初始化后的向量S不會(huì)對(duì)其余元素產(chǎn)生影響,只能選用W-plane算法完成初向量S的初始化處理,通過(guò)對(duì)子圖像的預(yù)處理得出最優(yōu)公共位圖以此加強(qiáng)最終的壓縮效果。
經(jīng)過(guò)分塊處理后的子圖像每個(gè)像素點(diǎn)均存在對(duì)應(yīng)的散射點(diǎn),因此對(duì)分塊機(jī)器視覺(jué)圖像的壓縮就即為對(duì)像素點(diǎn)的壓縮,而位圖就是由單個(gè)像素組成的,因此分塊圖像壓縮實(shí)質(zhì)上就是對(duì)位相的壓縮。
對(duì)分塊圖像預(yù)處理并生成初始化的向量S后,使用煙花算法優(yōu)化向量S,進(jìn)而獲取相應(yīng)的位圖以及量化值,在煙花算法[12,13]中通過(guò)均方誤差[14]得出所需評(píng)價(jià)函數(shù),進(jìn)而求解出煙花算法的適應(yīng)度值,其計(jì)算公式為
H(Xi)=
(5)
式中,U和J均代表公共位圖元素的位置標(biāo)記,Xi代表煙花個(gè)體,Eij代表煙花個(gè)體相應(yīng)的位圖在點(diǎn)(i.j)的值,bRJ、bGJ、bGJ、bRU、bGU和bBU均代表煙花個(gè)體相應(yīng)的量化值,Rij代表分塊圖像權(quán)重與通道R在點(diǎn)(i.j)處的灰度值,Gij代表分塊圖像權(quán)重與通道G在點(diǎn)(i.j)處的灰度值,Bij代表分塊圖像權(quán)重與通道B在點(diǎn)(i.j)處的灰度值。
煙花算法在開(kāi)始計(jì)算前需要將煙花種群進(jìn)行初始化處理,則初始化后的煙花種群表達(dá)式為
(6)
式中,t(1,l)代表維度為l的二進(jìn)制向量,e代表初始化的煙花數(shù)量。
經(jīng)過(guò)初始化處理后的煙花種群即可將煙花根據(jù)行數(shù)進(jìn)行排列得出完整的位圖Eh,進(jìn)而求解出各個(gè)煙花相應(yīng)的量化值,其表達(dá)式為
(7)
式中,w代表位圖Eh值為1的元素?cái)?shù)量。
根據(jù)式(5)計(jì)算出的適應(yīng)度值,求解出各個(gè)煙花的爆炸火花個(gè)數(shù)以及爆炸半徑,其計(jì)算公式分別為:
(8)
式中,I代表固定常數(shù),χ代表機(jī)器視覺(jué)的最小量,Ymax代表適應(yīng)度的最大值,Ymin代表適應(yīng)度的最小值。
煙花算法中對(duì)于每個(gè)煙花來(lái)說(shuō)其爆炸范圍的數(shù)量以及爆炸半徑任意生成的,從而得出爆炸范圍的火花元素計(jì)算公式為
(9)
其中,h代表煙花算法的爆炸范圍,ri代表爆炸火花點(diǎn)在點(diǎn)i處的元素,Li代表煙花個(gè)體在點(diǎn)i處的元素。
根據(jù)式(9)即可獲取爆炸范圍內(nèi)的爆炸火花。
高斯變異火花的獲取也必須提前計(jì)算出每個(gè)煙花中高斯變異火花各處的元素值,其計(jì)算公式為
qi=|Li-1|
(10)
式中,qi代表高斯變異火花點(diǎn)i的元素值。
根據(jù)式(9)和(10)得出爆炸火花以及高斯變異火花,在煙花以及上述兩種火花中選取出適應(yīng)度最小的火花視為新生代煙花種群。
不斷重復(fù)上述步驟,直到完成迭代,將適應(yīng)度最小的煙花視為向量S的最優(yōu)值,在最優(yōu)向量S上得出與之對(duì)應(yīng)的完整位圖以及6個(gè)量化值,進(jìn)而得出效果最佳的壓縮圖像。
經(jīng)過(guò)煙花算法的機(jī)器視覺(jué)圖像壓縮僅僅是針對(duì)位圖的壓縮[15],因此還需要將分塊圖像進(jìn)行重構(gòu)[16,17],在完整位圖以及6個(gè)量化值的幫助下得出子圖像塊的重構(gòu)公式為
(11)
通過(guò)以上步驟完成機(jī)器視覺(jué)圖像的分塊像素點(diǎn)壓縮。
為了驗(yàn)證基于煙花算法的機(jī)器視覺(jué)圖像分塊壓縮方法整體的應(yīng)用性能,采用提出方法、文獻(xiàn)[4]提出的基于格型遞歸最小二乘濾波器組的高光譜圖像壓縮方法以及文獻(xiàn)[5]提出的基于結(jié)構(gòu)組全變分模型的圖像壓縮方法設(shè)計(jì)對(duì)比實(shí)驗(yàn),完成壓縮效果以及峰值信噪比的仿真測(cè)試,測(cè)試結(jié)果如下所示。
機(jī)器視覺(jué)圖像壓縮可以在保證圖像數(shù)據(jù)完整的基礎(chǔ)上占用最小的系統(tǒng)空間,所以經(jīng)過(guò)壓縮后的圖像較原圖像對(duì)比其圖像清晰度較低,但壓縮過(guò)強(qiáng)會(huì)導(dǎo)致圖像數(shù)據(jù)不完整,根據(jù)這一標(biāo)準(zhǔn),隨機(jī)選取一幅機(jī)器視覺(jué)圖像,利用提出方法、文獻(xiàn)[4]提出的基于格型遞歸最小二乘濾波器組的高光譜圖像壓縮方法以及文獻(xiàn)[5]提出的基于結(jié)構(gòu)組全變分模型的圖像壓縮方法對(duì)實(shí)驗(yàn)圖像實(shí)現(xiàn)壓縮方法,現(xiàn)已知三種圖像的壓縮比例一致,將三種方法的壓縮結(jié)果進(jìn)行比較,清晰度越高即內(nèi)容數(shù)據(jù)越完整,即壓縮效果最好,實(shí)驗(yàn)結(jié)果如圖2所示。
圖2 不同方法的圖像壓縮效果對(duì)比
根據(jù)圖2的不同方法處理結(jié)果可知,提出方法壓縮后的圖像清晰度沒(méi)有發(fā)生改變,這主要是因?yàn)樵摲椒ㄔ趫D像壓縮過(guò)程中對(duì)圖像實(shí)現(xiàn)了預(yù)處理,保證公共位圖的計(jì)算精度,進(jìn)而確保壓縮過(guò)程中不會(huì)遺漏任何像素點(diǎn),從而保證圖像的信息完整,以此優(yōu)化了圖像壓縮效果。文獻(xiàn)方法經(jīng)過(guò)壓縮后的圖像清晰度均有所降低,這是因?yàn)閳D像經(jīng)過(guò)重新編碼和重構(gòu)將多余數(shù)據(jù)和色彩等無(wú)用排除,僅僅留下必要數(shù)據(jù)導(dǎo)致的。
峰值信噪比RPSN是衡量圖像壓縮性能最有效的指標(biāo)之一,壓縮圖像的峰值信噪比可直接反映出壓縮圖像的逼真度,進(jìn)而高效評(píng)價(jià)出圖像質(zhì)量,峰值信噪比的公式如下所示
(12)
式中,κ代表壓縮圖像的行向像素點(diǎn)數(shù)量,λ代表代表壓縮圖像的列向像素點(diǎn)數(shù)量,F(xiàn)(i,j)代表原始圖像在點(diǎn)(i,j)的分辨率值,F(xiàn)′(i,j)代表壓縮圖像在點(diǎn)(i,j)的分辨率值。
由于部分壓縮后的圖像無(wú)法用人眼識(shí)別圖像壓縮的好壞,此時(shí)可用峰值信噪比RPSN進(jìn)行評(píng)價(jià),峰值信噪比RPSN實(shí)質(zhì)上是在客觀的角度,衡量原始圖像以及壓縮后圖像的逼真程度,通常情況下逼真度較好時(shí)峰值信噪比RPSN均大于30dB,當(dāng)壓縮后的圖像RPSN越大,則說(shuō)明圖像清晰度越高,即保證壓縮要求的情況下與原始圖像越相似。在同一實(shí)驗(yàn)環(huán)境下利用三種方法對(duì)多組圖像進(jìn)行壓縮,且每張圖像的質(zhì)量和像素點(diǎn)均不相同,通過(guò)式(12)計(jì)算出每種方法壓縮結(jié)果的峰值信噪比,從而得出最佳壓縮方法,實(shí)驗(yàn)結(jié)果如表1所示。
表1 三種壓縮圖像方法應(yīng)用下的峰值信噪比/dB
根據(jù)實(shí)驗(yàn)結(jié)果可知,提出方法下的每組實(shí)驗(yàn)圖像其峰值信噪比均遠(yuǎn)遠(yuǎn)大于30dB,說(shuō)明提出方法壓縮后的圖像清晰度較高,本文壓縮圖像信噪比與其余兩種方法相比均高出許多,而結(jié)構(gòu)組全變分模型的圖像壓縮方法只有部分壓縮圖像的峰值信噪比大于30dB,說(shuō)明該方法壓縮效果不穩(wěn)定,最終呈現(xiàn)的圖像逼真度較低,從而證明了提出方法壓縮性能強(qiáng)。
圖像壓縮可大大降低圖像所需存儲(chǔ)空間,但部分圖像壓縮后的會(huì)出現(xiàn)圖像數(shù)據(jù)不完整等問(wèn)題,為此,提出基于煙花算法的機(jī)器視覺(jué)圖像分塊壓縮方法,對(duì)機(jī)器視覺(jué)圖像分塊預(yù)處理,在此基礎(chǔ)上利用煙花算法對(duì)圖像實(shí)時(shí)壓縮處理,實(shí)現(xiàn)機(jī)器視覺(jué)圖像分塊壓縮,解決了壓縮效果差以及峰值信噪比低的問(wèn)題,最大程度保留了圖像信息。