田鵬義,周 輝,許定根
(中國人民解放軍裝備學院昌平士官學校測控通信系,北京102200)
隨著科學技術(shù)的發(fā)展,尤其是網(wǎng)絡(luò)的普及,人們對數(shù)據(jù)壓縮的要求越來越高,而網(wǎng)絡(luò)上傳輸?shù)拇蟛糠质菆D像信息,故人們對圖像的壓縮技術(shù)提出了更高的要求.傳統(tǒng)的圖像采樣方法均遵循著名的奈奎斯特采樣定理:采樣速率至少必須是信號最高頻率的兩倍.采樣之后,再把冗余的信息丟棄掉,這樣一方面對采樣端提出了較高的要求,另一方面造成了資源的浪費.為了解決上述問題,Donoho與Candes等人于2004年提出了壓縮感知原理(compressed sensing,CS)[1],它是一種與傳統(tǒng)的數(shù)據(jù)采樣方法不同的新型感知采樣模式.壓縮感知理論指出:只要信號是可壓縮的或在某個域是稀疏的,那么就可以利用不相關(guān)的矩陣直接將這樣的信號投影到低維空間上,再利用這些少量的投影優(yōu)化問題,并以高概率重構(gòu)信號.實驗證明,這種方法給傳感器網(wǎng)絡(luò)信號的采集、存儲和處理帶來了新的機遇.在傳統(tǒng)的壓縮技術(shù)中,神經(jīng)網(wǎng)絡(luò)壓縮也是我們經(jīng)常用到的壓縮方法,它可以根據(jù)矩陣中的一部分數(shù)據(jù)來預測另一部分數(shù)據(jù),且效果理想.如果利用神經(jīng)網(wǎng)絡(luò)壓縮技術(shù)來處理測量矩陣,會得到“化學反應(yīng)”,提高壓縮率的同時,對信號的傳輸質(zhì)量不會產(chǎn)生太大的影響.
壓縮感知理論指出,只要信號在正交空間下具有稀疏性或可壓縮性[2],就可以利用隨機投影得到的少量觀測值采集信號,并通過某種優(yōu)化算法即可重構(gòu)該信號.
設(shè)信號x∈RN是N×1維列向量,在正交基或緊框架Ψ∈RN×N下是稀疏的,即信號x在正交基Ψ上僅有K(K<<N)個非零系數(shù)(或遠大于零的系數(shù)),則:
其中:s表示稀疏系數(shù),ψ為信號x的稀疏基.通過變換可知
采用一個與正交基Ψ不相關(guān)的觀測矩陣Φ∈RM×N(M <<N)對信號的稀疏系數(shù)s進行測量,得到觀測向量y∈RM:
其中:A稱為測量矩陣(AM×N=φψΤ).可以看到,壓縮感知將信號x從N維降為M維觀測信號Y.顯然采樣后信號的維數(shù)降低了.要想根據(jù)M測量值恢復信號其實是一個病態(tài)問題,Chen,Donoho和Saunders提出了利用L1范數(shù)下的最優(yōu)化問題求解的精確或近似逼近,即:
由于s=ψTx,可將式(3)的最優(yōu)化問題轉(zhuǎn)化為:
求解稀疏系數(shù)估計s-,再做反變換,就可以得到重構(gòu)后的信號.常用的求解方法有基追蹤BP(Basis Pursuit)、匹配追蹤法MP(Matching Pursuit)和正交匹配追蹤法OMP(Orthogonal Matching Pursuit)等[3-4].
從壓縮感知的過程中可以看出,要想在接收端恢復出原始信號,需要傳輸整個測量矩陣,而測量矩陣仍然有可壓縮的空間,如果能對該矩陣進一步壓縮、傳輸,則會改善傳輸效率,獲得理想的信道傳輸能力.
神經(jīng)網(wǎng)絡(luò)[5]作為一種有效的智能信息處理技術(shù),能依據(jù)數(shù)據(jù)本身的內(nèi)在聯(lián)系建模,具有良好的非線性逼近能力和對雜亂信息的綜合處理能力,成為探索人類智能奧秘的有力工具.由于神經(jīng)網(wǎng)絡(luò)具有很強的非線性逼近能力和自學習、自適應(yīng)等特性,它不需要建立復雜的非線性系統(tǒng)的顯式關(guān)系和數(shù)學模型,可以克服傳統(tǒng)定量預測方法的許多局限以及面臨的挑戰(zhàn),同時也能避免許多人為因素的影響.
BP學習算法是訓練人工神經(jīng)網(wǎng)絡(luò)的基本方法,也是一個非常重要且經(jīng)典的學習算法,其實質(zhì)是求解誤差函數(shù)的最小值問題,利用它可以實現(xiàn)多層前饋神經(jīng)網(wǎng)絡(luò)權(quán)值的調(diào)節(jié).BP模型是神經(jīng)網(wǎng)絡(luò)模型中使用最廣泛的一類.從結(jié)構(gòu)上講,BP網(wǎng)絡(luò)是一種分層型的典型多層網(wǎng)絡(luò),具有輸入層、隱含層和輸出層,層與層之間多采用全連接的方式.同一層單元之間不存在相互連接.其結(jié)構(gòu)如圖1所示.
圖1 BP網(wǎng)絡(luò)結(jié)構(gòu)
BP網(wǎng)絡(luò)可被看成是一個從輸入到輸出的高度非線性映射,這對于樣本集合輸入:輸入x(RM)和輸出y(RN),可以被認為存在某一映射g,使g(xi)=yi,i=1,2,…,p.現(xiàn)要求有一個映射f,使得在某種意義下(通常是最小二乘意義下)f是g的最佳逼近.
BP神經(jīng)網(wǎng)絡(luò)被廣泛的運用在時間序列的預測上,所謂預測,是指通過一些已知歷史數(shù)據(jù)對未來未知數(shù)據(jù)的取值進行估計,設(shè)有時間序列{xi},其中歷史數(shù)據(jù)xn,xn+1,…,xn+m,對未來n+m+k(k>0)時刻的取值進行預測,即預測xn+m+k的某種非線性函數(shù)關(guān)系:
用神經(jīng)網(wǎng)絡(luò)進行預測,即用神經(jīng)網(wǎng)絡(luò)通過一組數(shù)據(jù)xn,xn+1,…,xn+m來擬合函數(shù)f,得出未來n+m+k(k>0)時刻數(shù)據(jù)的預測值.
BP神經(jīng)網(wǎng)絡(luò)壓縮的基本思想是:把一組輸入模式通過少量的隱含層單元映射到一組輸出模式,并使輸出模式盡可能等于輸入模式.當隱含層的單元數(shù)比輸入模式數(shù)少時,就意味著隱含層更能有效地表現(xiàn)輸入模式,并把這種表現(xiàn)傳輸?shù)捷敵鰧?在這個過程中,輸入層和隱含層的變換可以看成壓縮編碼的過程,而隱含層與輸出層的變換可以看成解碼過程.
單獨使用神經(jīng)網(wǎng)絡(luò)算法也可以對圖像進行壓縮——壓縮原始的數(shù)據(jù),可以獲得一個較理想的壓縮率,完成圖像的傳輸;如果使用神經(jīng)網(wǎng)絡(luò)算法對測量矩陣進行壓縮——壓縮“壓縮后的數(shù)據(jù)”,則會進一步提高壓縮率,改進傳輸效率.
在傳統(tǒng)的CS理論算法中,對圖像進行離散(DCT變換)、觀測(高斯隨機矩陣),得到觀測值矩陣,然后直接傳遞觀測值矩陣,在文件接收端,利用相關(guān)算法(正交匹配追蹤算法)和觀測值矩陣恢復出原始圖像.這樣做需要傳輸整個的觀測值矩陣,傳輸效率有待提高.
如果把觀測值矩陣一分為二,利用其中一部分數(shù)據(jù)與神經(jīng)網(wǎng)絡(luò)算法去預測另一部分數(shù)據(jù),那么在傳輸?shù)倪^程中只需要傳遞這一部分觀測值矩陣與網(wǎng)絡(luò)節(jié)點,接收方可以根據(jù)接收到的數(shù)據(jù)預測出另一半觀測值矩陣,進而得到整個矩陣.這樣做提高了壓縮率,改進了傳輸效率.
本文提出算法實現(xiàn)如下:
發(fā)送端:
步驟1:對圖像進行DCT變換,達到信息稀疏的目的,得到稀疏矩陣;
步驟2:選擇合適的觀測矩陣對稀疏矩陣進行測量,得到測量值矩陣;
步驟3:把測量值矩陣分成元素數(shù)相等的兩個矩陣P、T;
步驟4:以P作為輸入層,T作為輸出層,進行網(wǎng)絡(luò)訓練,得出訓練節(jié)點,傳輸P與訓練節(jié)點;接收端:
步驟5:利用P和訓練節(jié)點推測出T;
步驟6:用P和T組成新的矩陣,此矩陣即為“恢復的稀疏值矩陣”,利用OMP算法對原始圖像進行恢復.
用Matlab對圖像cameraman和woman進行仿真,兩幅圖大小為均256×256,首先用常用的壓縮感知方法對該圖像進行壓縮,以0.6為采樣率DCT為離散基,對該圖像cameraman進行離散變換,然后用高斯隨機矩陣作為觀測矩陣,得到觀測值,利用OMP算法(正交匹配追蹤算法)對原始圖像進行恢復,對woman用0.8的采樣率進行采樣變換,如圖2所示.
圖2 利用OMP算法進行壓縮
從圖2中可以看出,圖形的大體輪廓還是比較清楚,但是壓縮率較小,圖像的傳輸效率較低.
利用本文算法:由于神經(jīng)網(wǎng)絡(luò)算法對數(shù)據(jù)有進一步的壓縮,我們可以在采樣的時候相應(yīng)提高采樣率,采樣率與傳統(tǒng)壓縮感知采樣率相同,得到觀測值矩陣進行拆分,拆分成同樣大小的矩陣,以一個作為輸入,另一個作為輸出,對BP神經(jīng)網(wǎng)絡(luò)進行訓練,然后再對圖像進行還原,得到圖像如圖3所示.
圖3 利用本文算法壓縮與恢復的圖像
表1 兩種方法的比較
由表1可知,兩種方法恢復圖像效果相似,但本文的算法提高了壓縮率,優(yōu)化了傳輸效率.本文方法的峰值信噪比與傳統(tǒng)的壓縮感知傳輸方法信噪比相當,這正好印證了兩種方法的視覺效果相似,采用BP神經(jīng)網(wǎng)絡(luò)算法對觀測舉證進行預測,對需傳輸?shù)臄?shù)據(jù)量進行了進一步的壓縮,使得壓縮率有了很大的提高,可以改進圖像的傳輸效率,并且達到高壓縮率的同時,峰值信噪比與傳統(tǒng)的壓縮感知方法近似,滿足傳輸?shù)囊?
本文研究了在壓縮感知基礎(chǔ)上,利用BP神經(jīng)網(wǎng)絡(luò)算法對觀測值矩陣進行壓縮,用一部分的觀測值矩陣和神經(jīng)網(wǎng)絡(luò)節(jié)點預測另一部分的觀測值矩陣,然后再把兩部分矩陣結(jié)合起來,得到原始的觀測值矩陣,最后采用OMP算法對圖像進行還原.通過仿真驗證此方法的可行性,能夠準確地預測觀測序列,在恢復圖像理想情況的效果下,進一步壓縮需要傳輸?shù)挠^測數(shù)據(jù)的長度,減少傳輸數(shù)據(jù)量,提高傳輸效率.
[1]Donoho D L.Compressed sensing[J].IEEE Transactions on In.formation Theory,2006,52(4):1289-1306.
[2]戴瓊海,付長軍,季向陽.壓縮感知研究[J].計算機學報,2011,34(3):425-434.
[3]文再文,印臥濤,劉歆,等.壓縮感知和稀疏優(yōu)化簡介[J].運籌學學報,2012,16(3):49-64.
[4]練秋生,肖瑩.基于小波樹結(jié)構(gòu)和迭代收縮的圖像壓縮感知算法研究[J].電子與信息學報,2011,33(4):967-971.
[5]張健,楊震,季云云.基于神經(jīng)網(wǎng)絡(luò)的壓縮感知觀測序列建模[J].南京郵電大學學報(自然科學版),2012,32(3):40-44.