何苗,王保云,盛偉,孔艷
(云南師范大學(xué)信息學(xué)院,昆明 650500)
稀疏表示遙感圖像分類方法綜述
何苗,王保云,盛偉,孔艷
(云南師范大學(xué)信息學(xué)院,昆明650500)
信號的稀疏表示是目前計算機(jī)視覺領(lǐng)域中的研究熱點,在對稀疏表示遙感圖像分類方法進(jìn)行綜述的基礎(chǔ)上,主要分析和總結(jié)稀疏表示中的稀疏系數(shù)求解方法、字典學(xué)習(xí)方法及分類方法方面的內(nèi)容,并指出稀疏表示遙感圖像分類方法需要進(jìn)一步研究的問題。
稀疏表示;遙感圖像分類;稀疏系數(shù)求解;字典學(xué)習(xí)
云南省教育廳科學(xué)研究基金(No.2014Y145)、云南省哲學(xué)社會科學(xué)規(guī)劃項目(No.QN2015067)、云師大博士啟動基金(No.01000205020503064)
隨著遙感技術(shù)的不斷發(fā)展,遙感圖像被廣泛地應(yīng)用于多個領(lǐng)域,如民用、軍事等多個重要的領(lǐng)域。在航天技術(shù)和傳感器技術(shù)的迅猛發(fā)展的推動下,衛(wèi)星遙感呈現(xiàn)出“三高”和“三多”的發(fā)展趨勢[1]。這一發(fā)展趨勢致使遙感圖像成為了名副其實的大數(shù)據(jù)。面對海量的數(shù)據(jù),如何有效地、快速地對其進(jìn)行處理成為當(dāng)前計算機(jī)領(lǐng)域及遙感應(yīng)用領(lǐng)域的研究熱點。遙感圖像的分類是遙感應(yīng)用中較為關(guān)鍵的環(huán)節(jié)之一,尤其是軍事應(yīng)用領(lǐng)域中對目標(biāo)的檢測與識別,均需對目標(biāo)圖像進(jìn)行分類。遙感圖像相比一般的自然圖像較為復(fù)雜,不僅信息量大,而且空間結(jié)構(gòu)復(fù)雜、數(shù)據(jù)維度較高,傳統(tǒng)的圖像處理及分類方法難以對其實現(xiàn)較好的分類效果,在一定程度上限制了遙感圖像的應(yīng)用。
近年來,隨著壓縮感知理論的快速發(fā)展,信號的稀疏表示在其推動下得到了廣泛應(yīng)用。稀疏表示具有避免“維數(shù)災(zāi)難”、簡化復(fù)雜信號的處理、精確恢復(fù)信號及良好的抗噪能力的優(yōu)勢,將其應(yīng)用于遙感圖像的處理受到了眾多國內(nèi)外學(xué)者的關(guān)注。在稀疏表示理論框架下,一個信號可以通過一個給定的過完備字典中盡可能少的原子線性組合表示。已有研究表明,稀疏表示模型與人類的視覺感知系統(tǒng)原理極其相似,因此,稀疏表示被廣范地應(yīng)用到圖像處理的各個領(lǐng)域,如圖像去噪[2]、圖像恢復(fù)[3]、圖像理解[4]等計算機(jī)視覺領(lǐng)域。關(guān)于圖像分類的應(yīng)用,2009年,John Wright等人[5]首次成功地將稀疏表示應(yīng)用于人臉識別中,對受噪聲污染的數(shù)據(jù)取得了較好的分類識別效果。就遙感圖像處理而言,其應(yīng)用主要集中在圖像去噪[6]、超分辨率遙感圖像重構(gòu)[7]、多光譜遙感圖像分類[8]、SAR圖像目標(biāo)識別[9]等方面。基于稀疏表示的遙感圖像分類方法的流程如圖1所示,研究主要集中在遙感圖像的特征提取、字典的構(gòu)建與學(xué)習(xí)、稀疏系數(shù)的求解、分類判別準(zhǔn)則四方面。
圖1 基于稀疏表示的遙感圖像分類方法流程
基于上述分析,本文主要對稀疏表示遙感圖像分類方法進(jìn)行了分析和研究,并同時闡述常用的遙感圖像特征提取方法、稀疏表示中的稀疏系數(shù)求解方法和字典學(xué)習(xí)方法。
遙感圖像的特征提取主要集中在光譜特征提取和紋理特征提取兩方面。
1.1光譜特征提取方法
光譜特征是圖像中目標(biāo)物的顏色及灰度或者波段間的亮度比等,它通過原始波段的點運算獲得。光譜特征的特點是,它對應(yīng)于每個像素,但與像素的排列等空間結(jié)構(gòu)無關(guān)[10]。光譜特征是一種地物區(qū)別于另一種地物的本質(zhì)特征,是組成地物成分、結(jié)構(gòu)等屬性的反映,正常情況下不同地物具有不同的光譜特征,在一些特殊情況下會出現(xiàn)“同物異譜、同譜異物”現(xiàn)象,因此根據(jù)地物光譜特征可以對遙感圖像進(jìn)行特征提取[11]。光譜特征主要分為一階統(tǒng)計特征和二階統(tǒng)計特征。常用的光譜特征提取方法有主成分分析法(Principal Component Analysis,PCA)、核主成分分析法、櫻帽變換法、典型分析方法、基于遺傳算法的特征提取算法等。
1.2紋理特征提取方法
紋理是圖像的重要特征之一,它反映了圖像灰度的性質(zhì)及其空間關(guān)系,是圖像中一個重要而又難以描述的特性[12]。遙感圖像具有較為豐富和復(fù)雜的紋理結(jié)構(gòu),在對圖像進(jìn)行特征提取之前需要對其進(jìn)行紋理分析,這是保證特征有效提取的關(guān)鍵。常用的紋理特征提取方法有灰度共生矩陣法(Gray Level Co-occurrence Matrix,GLCM)、Laws紋理能量法、空間自相關(guān)函數(shù)法、傅里葉變換法、Gabor濾波器方法、小波變換及小波包變換法等。
在遙感圖像的分類中,稀疏系數(shù)的求解是分類依據(jù)的關(guān)鍵所在。由于稀疏表示的求解中存在NP-Hard問題,國內(nèi)外諸多學(xué)者已經(jīng)對稀疏表示模型的求解算法作了大量深入的研究。就目前的研究現(xiàn)狀而言,稀疏系數(shù)求解算法大致可分為兩大類:貪婪算法和凸優(yōu)化算法。
2.1貪婪算法
貪婪算法的主要思想是通過特定的度量準(zhǔn)則從字典中逐一選擇最有用的原子來逼近原數(shù)據(jù)(信號)。常見的貪婪算法有:匹配追蹤算法(Matching Pursuit, MP)、正交匹配追蹤算法(Orthogonal Matching Pursuit, OMP)、正規(guī)化正交匹配追蹤算法(Regularized Orthogonal Matching Pursuit,ROMP)、多候選集OMP(Multicandidate OMP,MOMP)算法、梯度正交匹配追蹤算法(Stagewise Orthogonal Matching Pursuit,StOMP)、壓縮采樣匹配追蹤算法(Compressive Sampling Matching Pursuit,CoSaMP)等。
2.2凸優(yōu)化算法
凸優(yōu)化算法的主要思想是將非凸的范數(shù)松弛到上進(jìn)行求解,然后用非線性規(guī)劃法來逼近原組合優(yōu)化問題。常用的凸優(yōu)化算法有:基追蹤算法(Basis Pursuit, BP)、梯度投影算法、L1_Magic算法、SL0算法、FOCUSS算法、LASSO算法等。
稀疏表示中字典的構(gòu)造同樣是遙感圖像分類中的重要研究內(nèi)容,字典的構(gòu)建是圖像能否進(jìn)行稀疏表示的前提條件,而如何有效的構(gòu)建字典是提高分類精度的關(guān)鍵。一般而言,稀疏表示中要求字典具有過完備性,即字典中的原子個數(shù)要遠(yuǎn)遠(yuǎn)大于樣本的維度,這樣既能保證樣本維數(shù)不是很高又能實現(xiàn)字典中原子對信號的線性稀疏表示。對于字典的研究,過完備字典的構(gòu)建大致可分為三類:直接用訓(xùn)練樣本構(gòu)建的字典、分析類字典和學(xué)習(xí)類字典。
直接用訓(xùn)練樣本構(gòu)建字典通常存在以下缺點:樣本不充足,不能構(gòu)成過完備字典,導(dǎo)致分類精度不高;冗余的信息對原信號不能進(jìn)行有效地表達(dá)從而導(dǎo)致分類精度的降低。鑒于此,字典的構(gòu)造主要集中在分析類字典和學(xué)習(xí)類字典。
3.1分析類字典
分析類字典是基于解析式的字典構(gòu)造方法,它是通過一定的數(shù)學(xué)函數(shù)對給定的信號進(jìn)行建模,然后依據(jù)該模型設(shè)計相應(yīng)的表示方法。常見的分析類字典主要有傅里葉變換字典、離散余弦變換字典(DCT字典)、小波變換字典等。該類字典的構(gòu)建主要是通過將原信號轉(zhuǎn)換到頻率域上進(jìn)行處理,其原理簡單,計算不復(fù)雜。但是對于較為復(fù)雜的遙感圖像,該類字典不能較好地適應(yīng)信號的變換,原子的表示能力不是很強(qiáng)。
3.2學(xué)習(xí)類字典
學(xué)習(xí)類字典是基于機(jī)器學(xué)習(xí)的字典構(gòu)造方法,它是通過對練樣本進(jìn)行學(xué)習(xí)得到,能對各種特征的圖像進(jìn)行有效的表示,具有良好的適應(yīng)習(xí)性,同時,結(jié)構(gòu)性較弱,但計算復(fù)雜度較高。學(xué)習(xí)類字典主要包括MOD算法、K-SVD算法、ODL算法等。學(xué)習(xí)類字典是稀疏表示字典設(shè)計中較為新的研究,它對信號稀疏表示模型求解算法的研究有著深遠(yuǎn)的影響。相比之下,學(xué)習(xí)類字典比分析類字典更具有優(yōu)越性,通過學(xué)習(xí),可以在一些實際信號的處理應(yīng)用中得到最優(yōu)的結(jié)果。
在字典和稀疏系數(shù)求解完之后,最后的處理就是分類準(zhǔn)則的設(shè)定,既分類器的設(shè)計?;谙∈璞硎镜倪b感圖像分類中,在對訓(xùn)練樣本提取特征向量,通過字典學(xué)習(xí)算法得到具有自適應(yīng)能力的過完備字典之后,需對測試樣本進(jìn)行同樣的特征向量處理,在過完備字典上進(jìn)行稀疏系數(shù)的求解。求解完稀疏表示系數(shù)之后可根據(jù)一定的準(zhǔn)則進(jìn)行分類判斷,目前研究中較為常見的分類準(zhǔn)則有:最小重構(gòu)誤差分類判斷準(zhǔn)則和最大分類系數(shù)判斷準(zhǔn)則。稀疏表示的分類原理如圖2所示,根據(jù)系數(shù)表示分類的判別準(zhǔn)則,設(shè)計稀疏表示的分類器,實現(xiàn)遙感圖像的分類。
圖2 稀疏表示分類原理
目前,稀疏表示理論已成為國內(nèi)外的研究熱點,Dohono和Candes等人提出的壓縮感知理論推動了稀疏表示在各領(lǐng)域的應(yīng)用。近年來,稀疏表示在遙感圖像處理中的應(yīng)用引起了諸多學(xué)者的關(guān)注,尤其是在遙感圖像的分類和去噪等方面的研究已經(jīng)取得了一定的進(jìn)展。關(guān)于稀疏表示理論的研究,學(xué)者們主要集中在過完備字典的構(gòu)建、字典學(xué)習(xí)算法、稀疏表示求解算法以及分類識別中分類準(zhǔn)則的判定方面,已有的研究成果推動了稀疏表示在遙感圖像分類中的發(fā)展,但是遙感圖像與其它的自然圖像有所不同,還存在很多問題需要進(jìn)行深入的研究。據(jù)此總結(jié)存在的問題并作展望:(1)遙感圖像具有較復(fù)雜的空間結(jié)構(gòu),其信息含量較豐富、數(shù)據(jù)維度較高、內(nèi)部結(jié)構(gòu)不平穩(wěn),這些數(shù)據(jù)的特性既能體現(xiàn)稀疏表示的優(yōu)勢,也能加大稀疏表示的難度,因為稀疏表示可以較好的處理高維數(shù)據(jù),避免“維數(shù)災(zāi)難”,但數(shù)據(jù)量較大、結(jié)構(gòu)較復(fù)雜會造成字典學(xué)習(xí)和稀疏系數(shù)求解的算法更加耗時耗能。如何針對遙感圖像進(jìn)行算法的改進(jìn)和優(yōu)化,減少計算時間,提高算法效率是需要進(jìn)一步研究的問題。(2)稀疏表示中要求字典具有過完備性,當(dāng)選取的訓(xùn)練樣本不充足時,會導(dǎo)致字典沒有完備性,從而影響分類效果。如何構(gòu)建有效的過完備字典是稀疏表示用于分類需要深入研究的問題。針對這一問題,可以考慮借鑒壓縮感知理論中的低秩矩陣分解原理來構(gòu)建字典。(3)遙感圖像分類中,提取有效的特征向量也是分類成功的關(guān)鍵,就目前的特征提取方法而言,空間特征與光譜信息的提取利用是相互獨立的,如何有效對其進(jìn)行融合同樣需要深入研究。可通過提取不同的特征向量構(gòu)建不同的特征字典,基于機(jī)器學(xué)習(xí)的方法融合特征,提高字典的表示能力。(4)“混合像元”、“同物異譜”、“異物同譜”等問題一直是遙感圖像處理中的難點,如何通過多源數(shù)據(jù)構(gòu)建字典,對系數(shù)求解的結(jié)果進(jìn)行數(shù)據(jù)融合也是需要深入研究的問題。
[1]李德仁.論21世紀(jì)遙感與GIS的發(fā)展[J].測繪與空間地理信息,2002,25(4):127-131.
[2]Rosten E,Porter R,Drummond T.Faster and Better:a Machine Learning Approach to Corner Detection[J].IEEE Transactions on Pattern Analysis&Machine Intelligence,2010,32(1):105-19.
[3]張小洪,楊丹.使用梯度相關(guān)矩陣行列式的角點檢測算法[J].中國圖象圖形學(xué)報,2009,14(08):1601-1608.
[4]Mokhtarian F,Suomela R.Curvature Scale Space for Robust Image Corner Detection[C].Pattern Recognition,International Conference on.IEEE Computer Society,1998:1819-1819.
[5]Wright,J.,Yang,A.Y.,Ganesh,A.,etc.Robust Face Recognition via Sparse Representation[J].Ieee Transactions on Pattern Analysis and Machine Intelligence,Feb,2009,31(2):210-227.
[6]夏琴,邢帥,馬東洋,莫德林,李鵬程,葛忠孝.遙感衛(wèi)星影像K-SVD稀疏表示去噪[J].遙感學(xué)報,2016,03:441-449.
[7]管超.基于稀疏表示理論的圖像超分辨率重構(gòu)算法研究[D].上海交通大學(xué),2012.
[8]宋相法,焦李成.基于稀疏表示及光譜信息的高光譜遙感圖像分類[J].電子與信息學(xué)報,2012,34(2):268-272.
[9]韓萍,王歡.結(jié)合KPCA和稀疏表示的SAR目標(biāo)識別方法研究[J].信號處理,2013,29(12):1696-1701.
[10]杜培軍.遙感原理與應(yīng)用[M].中國礦業(yè)大學(xué)出版社,2006.
[11]駱玉霞,陳煥偉.遙感圖像的特征提取與選擇研究[J].信息記錄材料,2002,3(2):22-26.
[12]張克軍.遙感圖像特征提取方法研究[D].西北工業(yè)大學(xué),2007.
Sparse Representation;Remote Sensing Images Classification;Solution of Sparse Coefficient;Dictionary Learning
Survey on Remote Sensing Images Classification Based on Sparse Representation
HE Miao1,WANG Bao-yun2,SHENG Wei3,KONG Yan4
(School of Information Technology and Science,Yunnan Normal University,Yunnan,Kunming 650500)
Currently,sparse representation of the signal is a research focus in the computer vision.Summaries the sparse representation of remote sensing images classification methods,and mainly analyzes and reviews three aspects of content about solution of sparse coefficient,dictionary learning and classification.In addition,points out that sparse representation of remote sensing images classification is supposed to be study in the future.
1007-1423(2016)32-0067-04
10.3969/j.issn.1007-1423.2016.32.015
何苗(1990-),女,云南曲靖人,在讀研究生,碩士,研究方向為稀疏表示、圖像處理
王保云(1977-),男,云南玉溪人,博士,講師,研究方向為機(jī)器學(xué)習(xí)、圖像處理
2016-11-01
2016-11-05