鄧 旭,徐 新,董 浩
(武漢大學 電子信息學院,武漢 430072)(*通信作者電子郵箱xinxu@whu.edu.cn)
隨著遙感技術的迅速發(fā)展,遙感數據日益增加并廣泛應用于環(huán)境監(jiān)測、災情探測與防治、地物分類等方面[1]。其中合成孔徑雷達成像具有全天時、全天候、高分辨率、大幅面的成像特點,被廣泛應用于礦場資源探測、災情探測與防治、土地規(guī)劃、軍事目標識別等[2-3]。傳統(tǒng)的單極化合成孔徑雷達(Synthetic Aperture Radar, SAR)圖像可視化方法直接對強度信息進行壓縮,進而形成灰度圖像,但是人眼對顏色的分辨能力遠遠大于灰度,可以分辨多達幾千種的顏色色調和亮度,但只能分辨幾十種灰度。圖像偽彩色增強將灰度圖像變換為偽彩色圖像,將人眼不能區(qū)分的灰度差別顯示為顏色差異,從而利于圖像的目視解譯和信息提取,因此可以通過偽彩色增強實現極化SAR圖像的可視化。
國內外學者對此作了很多研究,提出了多種單極化SAR的偽彩圖編碼方法,將灰度數據轉換為顏色信息[4]。偽彩圖編碼方法大致可以分為以下四種。
第1種直接對單極化SAR進行處理,分為基于空間域和頻率兩大類[5-13]:基于空間域實現偽彩色編碼的包括密度分層法、灰度級彩色變換法、互補色編碼法、像素自身變換法和連續(xù)顏色編碼方法等;基于頻率域的方法主要有頻率濾波法。如:文獻[10]提出了一種基于K均值聚類的紅外線算法,該算法通過K均值聚類算法實現灰度圖像的聚類,然后根據偽彩色編碼的節(jié)點對聚類結果進行偽彩色編碼;文獻[11]提出了基于小波分析和偽彩色的遙感圖像增強;文獻[12]提出了基于梯度的非線性偽彩色編碼方法,計算出圖像的梯度場并確定閾值,從而進行編碼;文獻[13]基于多閾值大津法直方圖分割提出了在HIS(Hue,Intensity,Saturation)彩色空間對SAR數據進行空間編碼的方法;文獻[14]提出了基于Roberts梯度和HIS色彩空間的偽彩色編碼算法。
第2種是顏色遷移方法。該方法通過把一幅圖像的顏色特征傳遞給另外一幅圖像,使得目標圖像具有與參考圖像相似的顏色信息。如:文獻[15]提出了一種基于直方圖映射和分層遷移的灰度圖像上色算法,將給定的顏色信息圖像和需要遷移的灰度形狀圖像轉換到正交空間,得到兩幅圖像的灰度直方圖;然后利用顏色圖像的顏色信息為灰度圖像上色得到過渡圖像,參照灰度直方圖將過渡圖像和顏色圖像進行分層處理;之后提取出過渡圖像的形狀信息和顏色圖像的顏色信息;最后實現顏色圖像到灰度圖像的上色過程。文獻[16]提出了基于放縮系數和均值的多參數顏色遷移方法。文獻[17]提出了一種基于顏色傳遞和小波降噪、多尺度圖像分割的彩色化增強方法。文獻[18]提出了一種對單極化SAR圖像的彩色增強方法,該方法首先通過偽彩色編碼將SAR圖像變?yōu)檫^渡圖像,然后在顏色遷移過程中運用保持細節(jié)的顏色遷移方法保留了SAR圖像的細節(jié)信息,然后通過改變各通道系數的方式進行色調調整,使得SAR圖像與光學圖像有著相同的顏色信息。
第3種方法將單極化SAR圖像與對應的光學圖像融合實現偽彩色編碼。如文獻[19]提出一種基于單極化SAR圖像紋理特征的Contourlet變換融合方法,對SAR圖像提取灰度共生矩陣紋理特征,然后通過相關性得到重要特征圖,接著通過HSV(Hue, Saturation, Value)變換提取光學圖像的強度分量,然后將其與強度分量進行Contourlet變換融合,得到偽彩色圖像。文獻[20]提出了一種基于Shearlet變換的多源遙感影像融合方法,利用變換,設計了基于改進型的脈沖耦合神經網絡的高頻系數融合和基于區(qū)域能量的低頻系數融合規(guī)則。
第4種方法將深度神經網絡用于偽彩色編碼,將單極化SAR圖像利用神經網絡進而實現顏色編碼[21-22]。如文獻[22]利用深度神經網絡將單極化SAR圖像轉換為全極化SAR圖像,實現偽彩色編碼。這些方法各有優(yōu)缺點,如彩色空間編碼方法,會隨著研究區(qū)域的不同得到差異較大的結果;密度分層方法保持圖像原始信息較好且簡單,但是由于彩色數目有限,生成的偽彩圖對地物區(qū)分性不好,即灰度相近的地物類別顏色差異不大;顏色遷移方法需要有一幅參考圖像;與光學圖像融合的方法需要相關的光學圖像;而神經網絡的方法比較復雜。
通過分析上述已有的單極化SAR圖像編碼方法,可以發(fā)現存在的主要問題有:1)大部分方法是利用單極化SAR圖像的灰度信息,進行直接或者間接轉換得到偽彩圖,目視效果有所改善,但是丟失了很多細節(jié)信息,灰度相似的地物差異不大;2)由于單極化SAR圖像目標地物的物理散射特性和噪聲問題,所以生成的偽彩圖地物區(qū)分性不強;3)有的方法實現過程復雜或需要一定的條件。
針對以上問題,提出了單極化SAR圖像的顏色特征編碼方法。該方法綜合考慮了單極化SAR圖像噪聲問題和物理散射特性,對單極化SAR圖像的特征進行編碼,將特征轉換在RGB(Red,Green,Blue)顏色空間,保留了更多的細節(jié)信息,獲取更多的顏色信息,更利于目視和解譯,并將其用來實現單極化SAR圖像的分類。用兩組TerraSAR-X單極化SAR數據進行了方法驗證。
實驗數據1 佛山地區(qū)TerraSAR-X單極化SAR數據,獲取時間2008年5月,距離向和方位向為1.25 m,圖像大小為2 000×2 000,包括3類地物,分別是水域、耕地、建筑,其中標記為黑色的為不參與精度評價的區(qū)域。
圖1 佛山實驗數據
實驗數據2 武漢地區(qū)TerraSAR-X單極化SAR數據,獲取時間2008年9月,距離向和方位向的分辨率均為3.0 m,圖像大小為2 000×1 800,包括4類地物,分別為建筑、水田、河流、耕地,其中標記為黑色的為不參與精度評價的區(qū)域。
圖2 武漢實驗數據
本文提出的顏色特征編碼方法對單極化SAR圖像的特征進行顏色編碼。該顏色特征編碼方法首先對單極化SAR圖像提取紋理特征,包括灰度共生矩陣和直方圖統(tǒng)計特征;然后用隨機森林對特征進行重要性排序并將特征顏色編碼成顏色特征圖;最后按重要性排序從高到低,每3組顏色特征圖組合成偽彩圖。
紋理特征是單極化SAR圖像分類的重要特征,實驗算法所用到的紋理特征包括灰度共生矩陣和直方圖統(tǒng)計特征。
灰度共生矩陣是一種常用的紋理提取方法[23]。灰度共生矩陣通過計算圖像鄰近像元灰度級之間的二階聯(lián)合條件概率密度P(i,j,d,q)來表示紋理,該概率密度函數表示在給定的空間距離和方向上,以灰度級i為起點出現灰度級j的概率。
用數學公式表示則為:
P(i,j)={[(x,y),(x+Dx,y+Dy)];
f(x,y)=i;
f(x+Dx,y+Dy)=j;
x=0,1,2,…,Nx-1;
y=0,1,2,…,Ny-1}
(1)
其中:i,j=0,1,2,…,L-1;x,y是影像中的像素坐標;L為影像的灰度級數;Nx,Ny分別為影像的行列數。
算法用到了灰度共生矩陣中的6個特征,包括均值、均一性、對比度、熵、不相似度和同質性[24]。
灰度直方圖反映的是圖像灰度的統(tǒng)計特性,表達了圖像中取不同灰度值的像素點個數在圖像中所占的比例,是圖像中最基本的信息[25]。圖像直方圖的定義可以用式(2)來表示:
H(i)=ni/N;i=0,1,…,L-1
(2)
其中:i表示灰度級,L表示灰度級的級數,ni表示灰度級為i的像素的個數,N表示的是圖像的總像素點。直方圖的橫坐標是灰度級,縱坐標表示區(qū)域內出現該灰度級所占的概率。
一般不直接將直方圖作為特征,而是對直方圖進行統(tǒng)計得到統(tǒng)計特征。算法所用到的直方圖特征有均值、均方差、標準差系數、中值、中方差、斜度、能量、熵、峰度、歐氏距離均值10個。
實驗采用的特征是灰度紋理特征和直方圖特征,用滑動窗口提取,該窗口以每個像素點為中心,其中計算灰度共生矩陣時采用的參數如下:0°、45°、90°和135°四個方向,灰度級為8級,所以特征為4個方向的灰度共生矩陣特征共24維,直方圖統(tǒng)計特征10維,原始幅度圖像特征1維,總35維,其中灰度共生矩陣8個特征是常用的幾個特征,10個直方圖特征也是常用的。
在佛山地區(qū)數據和武漢地區(qū)數據中對每一類地物隨機采樣14 000個樣本點,利用隨機森林進行訓練,得到特征重要性,對35維特征進行特征重要性排序。圖3(a)和3(b)分別表示的是佛山地區(qū)數據和武漢地區(qū)數據的特征重要性,橫坐標是35維特征對應的標號,縱坐標是特征的重要性。
圖3 特征重要性
從圖3(a)中可以看出佛山地區(qū)數據的35維特征重要性差別較小,沒有特別突出的特征,因此生成的偽彩圖區(qū)分性差別較弱;從圖3(b)可以看出武漢地區(qū)數據的35維特征重要性差異較大,因此生成的偽彩圖的區(qū)分性較強。
將上述35維特征每一維量化到0到255,然后對每一個灰度級賦予一個RGB顏色,形成RGB顏色特征圖,對該顏色特征圖通過目視判斷對地物的區(qū)分性。
圖4和圖5分別是佛山地區(qū)數據、武漢地區(qū)數據中方向為0的灰度共生矩陣的4個特征的顏色特征圖:圖4(a)和圖5(a)是方向為0的不相似性特征對應的顏色特征圖;圖4(b)和圖5(b)是方向為0的對比度特征對應的顏色特征圖;圖4(c)和圖5(c)是方向為0的熵對應的顏色特征;圖4(d)和圖5(d)是方向為0的同質性對應的顏色特征圖。
圖4 佛山數據的顏色特征圖
從圖4中可以看出佛山地區(qū)數據的4個紋理特征的顏色特征圖目視效果非常好,可以區(qū)分對應的3類地物。
從圖5中可以看出武漢地區(qū)數據4個紋理特征的顏色特征圖不能區(qū)分出建筑,其他3類地物可以區(qū)分出來,因此用這些特征單獨進行分類是不能區(qū)分出全部地物的。
總的來說,從圖4和圖5中可以看出特征變成顏色特征圖后地物之間差異明顯,顏色信息豐富,目視效果很好,有助于判斷該特征是否可以區(qū)分相關的地物。
對特征的重要性進行排序,然后按重要性排序先后每3維特征分別為R、G、B通道生成偽彩圖,第34維和第35維只有2張所以不能生成偽彩圖并且特征重要性太低,將其舍棄,所以用前33維特征生成11張偽彩圖。
圖6和圖7分別是佛山地區(qū)數據、武漢地區(qū)數據生成的偽彩圖。
圖6 佛山數據生成的偽彩圖
圖6(a)到圖6(k)表示的是佛山數據對應生成的11張偽彩圖,其中圖6(a)的圖片名稱1-3表示的是排序前三的特征組合而成的第一張偽彩圖,圖6(b)到圖6(k)的圖片名稱都是類似的含義。圖7(a)到圖7(k)表示的是武漢地區(qū)數據對應生成的11張偽彩圖,其中圖7(a)的圖片名稱1-3表示的是排序前三的特征組合而成的第一張偽彩圖,圖7(b)到圖7(k)的圖片名稱都是類似的含義。附上原始幅度圖作為對比。
首先對佛山地區(qū)數據生成的偽彩圖進行分析。通過與原始幅度圖的對比,人工判讀所有偽彩圖均能解譯出三類地物。特征的重要性基本一樣,生成的偽彩圖對地物的區(qū)分能力差別不大。對于武漢地區(qū)的數據,通過與原始幅度圖的對比發(fā)現:第1張偽彩圖7(a)可以區(qū)分4類地物來,即河流、水田、耕地、建筑;第2張偽彩圖不能區(qū)分建筑和耕地;第3張偽彩圖只能區(qū)分2類地物,不能區(qū)分水田和河流,也不能區(qū)分建筑和耕地;從第4張到最后第11張偽彩圖都不能區(qū)分河流和水田。
從兩組數據的偽彩圖對地物的區(qū)分性來說,特征重要性前3的顏色特征圖組合成的偽彩圖明顯區(qū)分開了所有的地物,而且是所有偽彩圖中地物區(qū)分性最好的,因此兩組數據均采用第一張偽彩圖進行分割,顏色特征編碼方法對單極化SAR地物分類是有明顯的效果的。
2.5.1 偽彩圖質量評價標準
接下來從圖像的統(tǒng)計特性、清晰度、信息量三個方面對圖像質量進行客觀評價[26]。
1)圖像統(tǒng)計特性的評價指標。
均值和標準差是圖像的兩個最基本的統(tǒng)計特性。均值是圖像像素值的灰度平均,反映的是圖像的平均亮度。公式如下:
(3)
標準差反映了灰度的離散程度。公式如下:
(4)
其中:M、N是圖像的行數和列數,F(x,y)是點(x,y)處的灰度值。
2)基于彩色空間的平均梯度是圖像紋理變化的特征,具有對微小細節(jié)的反應能力,用來評價圖像的清晰程度。偽彩色圖像的平均梯度值越大,表達能力就越強,如式(5)所示:
(5)
3)信息熵是度量圖像信息量的一個重要指標,公式如下:
(6)
圖7 武漢數據生成的偽彩圖
2.5.2 偽彩圖結果分析
表1和圖8是佛山地區(qū)的偽彩圖的質量評價指標和圖像結果。表2和圖9是武漢地區(qū)的偽彩圖的質量評價各項指標和圖像結果。其中基于HIS的偽彩色編碼[5]是提出算法的對比算法。將各項指標和原圖的對比,對結果進行評價。
表1 佛山的偽彩色編碼方法評價
從表1和圖8中可以看出基于HIS的編碼生成的偽彩圖與原灰度圖的均值很接近,而提出的顏色特征編碼生成的偽彩圖均值低很多,亮度適中,在細節(jié)保持度即梯度上不如對比的方法,信息熵比原圖和對比方法都好,且不同的地物之間顏色差別明顯,每類地物可分性更好。
圖8 兩種算法的佛山數據偽彩色圖
結合表2和圖9,可以看出基于HIS的編碼生成的偽彩圖與原灰度圖的均值接近,而提出的顏色特征編碼生成的偽彩圖均值低很多,亮度適中,在細節(jié)保持度上不如對比的方法,但提出的信息熵比原圖和對比方法都好,提出方法的目視效果優(yōu)于對比方法,表現在:1)將水田和河流完全區(qū)分開;2)不同地物間顏色差別明顯,有助于各類地物。
圖9 兩種算法的武漢數據偽彩色圖
Tab. 2 Evaluation of Wuhan pseudo-color encoding method
結合2組數據的結果,可以說明提出的顏色特征編碼算法是有效的,有助于提高單極化SAR圖像的可視化效果。
基于顏色特征編碼方法的分類算法流程如圖10所示,在提取特征后,對顏色特征編碼方法產生的偽彩圖進行目視判斷,選出地物區(qū)分性最好的進行統(tǒng)計區(qū)域合并(Statistical Region Merging, SRM)分割,另一方面對所有的偽彩圖用隨機森林進行分類,最后在SRM分割得到的超像素區(qū)域內,對隨機森林得到的結果進行相對多數投票,得到最后的分類結果。SRM算法是一種圖像統(tǒng)計模型,主要用在RGB彩色圖像上[27],分類器是隨機森林[28]。
圖10 本文算法流程
表3和圖11是佛山地區(qū)數據的分類精度評價和分類結果圖,表4和圖12是武漢地區(qū)數據的分類精度評價和分類結果圖。其中:對比方法1的特征為紋理特征,分類器為隨機森林;對比方法2是基于HIS的偽彩色編碼方法生成的偽彩圖提出的分類流程。所用的評價方法中每一類地物的分類精度是生產精度,即對生產者分類精度的一個度量,平均精度表示的是總體精度,表示所有涉及到的所有像元分類的正確性。
表3 佛山數據的分類精度對比 %
圖11 佛山數據的分類結果對比
在表3中對比方法2在SRM分割Q值為64時分類精度最高,所以只列出了該分類精度。結合表3和圖11可以看出當SRM的Q值從1到256變化時,提出的算法整體分類精度變化不大,在89.0%左右波動,綜合考慮Q取64時提出的分類算法分類結果最好。與對比方法1的結果相比,提出的算法整體提高了10個百分點,河流的分類精度提高了5個百分點,建筑提高了12個百分點,耕地提高了10個百分點。其中建筑物分類效果非常好,只有小部分被錯分為耕地;耕地分類精度也不錯,有小部分被錯分為建筑物;河流有很小一部分被分為建筑。建筑物與耕地互相錯分的原因可能是建筑物區(qū)域也是有綠地的,不全是建筑。河流被錯分為建筑的原因應該是河流內有輪船等在單極化SAR成像上與建筑物同樣呈現高亮的物理特性。與對比方法2結果對比,對比方法1在武漢地區(qū)的分類精度低一些,但提出的算法整體分類精度高了8.2個百分點,在每個類別的分類精度上除了耕地之外其他兩類精度明顯較高,效果更佳。
圖12 武漢數據的分類結果對比
%
在表4中對比方法2在SRM分割Q值為256時分類精度最高,所以只列出了該分類精度。結合表4和圖12,可以看出當SRM的Q值從1到256變化時,提出的分類算法整體分類精度直線上升,從81%增加到88.8%,在Q=256的時候整體分類效果和各個類別分類效果最好。與對比方法1的結果相比,提出的分類算法整體提高了6個百分點,河流的分類精度提高了3.7個百分點,建筑提高了2.8個百分點,耕地提高了8.7個百分點,水田提高了10.8個百分點。其中:將一部分建筑錯分為耕地,導致建筑的分類精度不高;水田有一部分被分為耕地,有一部分被分為河流,原因是水田構成復雜,有水也有地,在單極化SAR成像上會呈現復雜的特性,一部分與耕地的紋理特性相似,一部分與河流的物理特性相似,導致區(qū)分水田困難,因此分類精度不高;河流也有一部分被錯分為水田,原因相同。與對比方法2的結果相比,對比方法1在佛山地區(qū)的分類精度低一些,但提出的算法整體分類精度高了1個百分點,在每個類別的分類精度上除了建筑之外其他3類精度基本一致,但是在建筑上提出的算法效果明顯優(yōu)于對比方法2,因此兩組數據的結果說明了提出的顏色特征編碼方法比基于HIS的顏色編碼對分類更有效,更有益于單極化SAR的目視和解譯。
本文對單極化SAR圖像提出了一種顏色特征編碼方法,并對生成的偽彩圖進行分類實驗,結果表明了可以增加顏色細節(jié)信息,更有利于目視解譯和分類。不足之處如下:采用的特征不夠廣泛,只采用了紋理特征和幅度特征,不確定其他類型特征是否適合該編碼方法;SRM分割參數的選擇是由分類實驗結果實現的,沒有具體的優(yōu)選方法,在數據非常大的情況下實現難度大;特征優(yōu)化選擇采用的是隨機森林方法,可以采用特征選擇方法。
針對提出的算法存在的問題,下一步可以:擴大特征的類別范圍,進行大量實驗,驗證提出的編碼方法的可擴展性;采用具體的分割指標進行分割尺度優(yōu)選;嘗試其他方法進行特征優(yōu)化;改進產生顏色特征圖的方法。