張帆,閆敏超,倪軍,項德良
1.北京化工大學(xué)信息科學(xué)與技術(shù)學(xué)院,北京 100029;2.北京化工大學(xué)人工智能交叉研究中心,北京 100029
合成孔徑雷達(dá)(synthetic aperture radar,SAR)作為一種主動式的微波成像傳感器,具有全天候成像的能力,并具有一定的穿透性,可以獲取地面物體的反向散射信息及無人區(qū)的關(guān)鍵信息,廣泛應(yīng)用在土地利用、土地覆蓋分類等領(lǐng)域(張紅 等,2014)。深度學(xué)習(xí)方法因具有強大的數(shù)據(jù)分析和特征自動提取能力,在遙感圖像地物分類任務(wù)中展現(xiàn)出卓越性能,成為SAR 數(shù)據(jù)分析領(lǐng)域的研究熱點。在網(wǎng)絡(luò)結(jié)構(gòu)的不斷演變中,卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)、堆疊自動編碼器(stacked autoencoder,SAE)、深度信念網(wǎng)絡(luò)(deep belief network,DBN)、遞歸神經(jīng)網(wǎng)絡(luò)(recursive neural network,RNN)和生成對抗網(wǎng)絡(luò)(generative adversarial network,GAN)等成為深度學(xué)習(xí)中有效和重要的基礎(chǔ)結(jié)構(gòu)類型(王俊 等,2018)。其中,CNN 具有提取更具判別性和不變性特征的優(yōu)勢,有助于去除SAR 圖像中存在的斑點噪聲(李亞飛和董紅斌,2018)。隨著深度網(wǎng)絡(luò)模型的不斷發(fā)展,CNN 在SAR 圖像分類方面取得了極大的成功。
在特征學(xué)習(xí)的過程中,除了每個像素點具有的特征信息外,圖像中包含的空間信息對類別的正確識別也有顯著影響(湯玲英 等,2018)。對此,已經(jīng)提出了一種集成像素坐標(biāo)信息的雙路神經(jīng)網(wǎng)絡(luò)(conditional random field network,CRF-NET),在遙感圖像土地覆蓋分類中取得了一定的分類效果(Zhang 等,2021)。然而,除了位置信息外,還可以利用更多的上下文和語義線索來實現(xiàn)多層次空間特征關(guān)聯(lián)。Han等人(2020)利用神經(jīng)網(wǎng)絡(luò)提取語義特征,并將其作為條件隨機場(conditional random field,CRF)模型的高階勢函數(shù)集成到新型能量函數(shù)中,在CRF 框架內(nèi)增加類別感知度,以從不同的角度提供互補信息;Wang等人(2019)將條件隨機場框架嵌入到網(wǎng)絡(luò)模型中,充分利用亞像素、像素和超像素的互補特性,對應(yīng)構(gòu)造了CRF 能量函數(shù)中的一元勢、二元勢和高階勢函數(shù),有效地將位置、上下文和語義信息集成為強大表征特征以提高分類性能?;谝陨蠁l(fā),本文對已提出的CRF-NET 進一步改進,引入高階語義特征的概念,增加具有方位修正性的鄰域信息提取支路,構(gòu)建多分支神經(jīng)網(wǎng)絡(luò)以融合不同類型的空間特征。
此外,在傳統(tǒng)的圖像分類過程中不難發(fā)現(xiàn),相近地理區(qū)域內(nèi)的土地覆蓋類型往往是相同的(趙斐等,2019),將相同地物目標(biāo)的類別進行統(tǒng)一可以有效避免散斑噪聲的影響。為此,本文引入了超像素約束模塊。超像素可以自適應(yīng)地描述不同大小和形狀的局部結(jié)構(gòu)信息,且很好地保持對象邊界。對于多分支網(wǎng)絡(luò)輸出的預(yù)分類結(jié)果,依據(jù)超像素分割情況取勻質(zhì)區(qū)域內(nèi)的像素點進行類別約束,可以有效平滑相鄰像素之間的特異性和相似性,提高分類結(jié)果的可靠性。
針對目前極化合成孔徑雷達(dá)(polarimetric synthetic aperture radar,PolSAR)地物分類方法普遍存在數(shù)據(jù)特征表征能力弱的問題,本文提出一種由高階條件隨機場模型引導(dǎo)的圖像分類網(wǎng)絡(luò),總體流程示意圖如圖1 所示,主要包含數(shù)據(jù)預(yù)處理、多分支特征提取和超像素約束3個模塊。
圖1 高階CRF多分支網(wǎng)絡(luò)流程圖Fig.1 The flowchart of multi-branch network based on high-order CRF model
與光學(xué)彩色圖像和高光譜圖像不同,PolSAR 數(shù)據(jù)并非真正意義上的圖像,而是探測區(qū)域?qū)Πl(fā)射電磁波的反應(yīng),主要體現(xiàn)后向散射系數(shù)。PolSAR 數(shù)據(jù)中包含豐富的地物信息,但原始的散射特征并不能從散射機制上解譯不同目標(biāo)之間的可區(qū)分性,例如,一個分辨單元內(nèi)可以包含許多地物類型的散射回波,且往往有不同的相位值。因此直接利用極化散射特征獲得的分類結(jié)果往往并不理想。極化目標(biāo)分解是一種有效描述地物極化信息的方法,可以依據(jù)真實的地物空間分布,將混合散射機制拆分為幾種互不相關(guān)的單一模型分量,在降低數(shù)據(jù)復(fù)雜性的同時提取更具純凈度和抗干擾性的特征。多種獨立的散射分量從不同的方面解釋了目標(biāo)的幾何分布特征和物理散射機制,能夠提供更加豐富的地表覆蓋信息。在眾多經(jīng)典方法中,Yamaguchi 四分量分解模型(Yamaguchi 等,2005)充分考慮了復(fù)雜地形的反射不對稱性,利用非相干分解方式將數(shù)據(jù)分解為奇次散射、偶次散射、體散射和螺旋散射,廣泛應(yīng)用于分析非對稱自然區(qū)域和人造建筑。因此,在進行特征提取之前,首先將原始SAR 數(shù)據(jù)進行Yamaguchi四分量分解處理,分解模型表示為
在遙感圖像分類領(lǐng)域,傳統(tǒng)的分類方式使用統(tǒng)計學(xué)習(xí)算法獨立地分析每個像素的特征信息,為像元分配不同的預(yù)定義標(biāo)簽實現(xiàn)分類(滑文強 等,2019)。然而,PolSAR 數(shù)據(jù)中包含大量的空間上下文信息,單純提取像素級特征往往會忽略這部分關(guān)鍵信息而導(dǎo)致分類結(jié)果不準(zhǔn)確。
CRF(Lafferty等,2001)是一種后驗概率圖模型,通常用于將原始空間信息整合到圖像分類問題中。CRF 模型的本質(zhì)是在不同的基團上定義勢函數(shù),根據(jù)基團包含變量個數(shù)的不同,可分為一階勢函數(shù)、二階勢函數(shù)以及高階勢函數(shù)。具有高階勢函數(shù)的CRF模型能夠更好地集成位置—上下文—語義線索,增加像素點之間的空間依賴性,有效克服特征識別度低的問題。因此,針對分類結(jié)果中存在的場景錯分、地物邊界模糊的問題,在已完成模型CRF-NET 的基礎(chǔ)上,設(shè)計了多分支特征提取網(wǎng)絡(luò),進一步融合全局及局部空間特征。網(wǎng)絡(luò)結(jié)構(gòu)模型及參數(shù)設(shè)計分別如圖2和表1所示。
表1 多分支網(wǎng)絡(luò)參數(shù)Table 1 Multi-branch network parameters
圖2 高階CRF多分支網(wǎng)絡(luò)流程圖Fig.2 Multi-branch feature extraction network
對應(yīng)于CRF能量函數(shù)項,表達(dá)式示意為
式中,c 表示像素點k所在的基團,即方位修正像素塊,xk和xm分別表示像素點k的特征向量和其所在像素塊的平均特征向量,ωm和θm分別為權(quán)重系數(shù)和迭代參數(shù)。具體而言,像素的有效鄰域信息即為所在基團,如圖3 所示,紅框表示中心像素,黑框內(nèi)為其3 × 3的鄰域區(qū)間,不同的顏色及對應(yīng)序號表示不同的分割區(qū)域。
圖3 方位修正像素塊示意圖Fig.3 Schematic diagram of azimuth correction pixel block
卷積模型通常以像素塊作為輸入,并利用該區(qū)域內(nèi)的全部信息確定中心像素的最終類別。然而在大部分像素與中心像素屬于不同類別的情況下,分類結(jié)果可能與真實類別存在誤差。如圖3 所示,中心點為“1”類,處于邊界位置,其鄰域不可避免地包含其他地物信息,無法準(zhǔn)確表達(dá)原始類別特征。因此,本文引入了方位修正的概念。
對于分解后的散射特征,取每個分辨單元的3 × 3 鄰域作為初始值,依據(jù)超像素分割結(jié)果,將與中心點不屬于同一地物類型的像素特征值歸零,并隨機取中心像素所在的均質(zhì)區(qū)域內(nèi)像素點進行數(shù)據(jù)填充,如圖3 右圖所示。區(qū)別于傳統(tǒng)的二維卷積輸入,具有方位修正性的像素塊可以將邊界信息進行修正,避免不同地物目標(biāo)之間邊緣模糊的問題。
高階勢函數(shù)也建模為CNN 層,設(shè)計二維卷積神經(jīng)網(wǎng)絡(luò)用于提取修正后的鄰域特征信息,如圖2 中“卷積支路2”所示。利用像素塊代替獨立像素點進行信息交互,實現(xiàn)類似效果。在網(wǎng)絡(luò)末端將3 種特征值進行加和融合,表達(dá)式為
式中,F(xiàn)C(?)表示全連接操作,Conv1d(?)表示一維卷積操作,Conv2d(?)表示二維卷積操作,fp,fc,fn,fh分別表示像素特征、坐標(biāo)特征、鄰域特征和多級高階融合特征。最后,將多級高階融合特征fh輸入到softmax分類器中得到預(yù)分類結(jié)果。
盡管上述多分支提取模型可以學(xué)習(xí)到不同層次的空間特征,提供互補信息,但仍然不能進一步還原地物目標(biāo)的局部結(jié)構(gòu)。這是因為在CNN 的基礎(chǔ)架構(gòu)下,輸入數(shù)據(jù)多為一維向量或規(guī)則矩陣,無法結(jié)合地物目標(biāo)的不規(guī)則形態(tài)信息。而超像素能夠靈活地適應(yīng)目標(biāo)邊界,呈現(xiàn)更加詳細(xì)的局部空間信息。為此,本文設(shè)計了超像素約束模塊,對預(yù)分類結(jié)果進行對象級改進,以建立像素級數(shù)據(jù)和對象級數(shù)據(jù)間的尺度關(guān)聯(lián)。具體步驟為:依據(jù)超像素的分割結(jié)果,計算每個最小超像素單元內(nèi)所有像素點的后驗概率均值,取分配概率最大的類別對預(yù)分類結(jié)果進行修正,鼓勵連通區(qū)域的類別一致性。表達(dá)式為
式中,argmax{?}表示獲取最大元素索引值的函數(shù),mean[?]表示求取平均值操作,δ(?)表示類別判別模塊,Si和Li分別表示第i個超像素集合及其類別標(biāo)簽,Pj(y|X)表示該超像素中第j個像素點的預(yù)分類概率值,L 為類別標(biāo)簽向量。由于PolSAR 數(shù)據(jù)與光學(xué)遙感圖像之間存在顯著的數(shù)據(jù)類型差別,為了更好地保留邊緣信息,平衡過分割和欠分割,本文采用自適應(yīng)—極化線性迭代聚類方法來生成超像素(Xiang等,2017)。
本節(jié)針對不同數(shù)據(jù)集設(shè)計了兩組實驗來評估不同采樣策略下模型的分類性能,采用總精度、平均精度和Kappa 系數(shù)作為評估標(biāo)準(zhǔn)??紤]到網(wǎng)絡(luò)不穩(wěn)定性對分類結(jié)果的影響,將每個實驗重復(fù)10 次,取平均值作為最終展示結(jié)果。
本文所有實驗均在同一環(huán)境配置下進行。操作系統(tǒng)為Windows 10,Intel Core i7-10700K @3.80 GHz CPU,NVIDIA GeForce GTX 1080Ti GPU,Tensor-Flow2.0.0,Python3.6.9。
為了驗證本文方法的有效性,對兩組極化SAR數(shù)據(jù)的分類結(jié)果進行了分析。
1)Flevoland 數(shù)據(jù)集,由美國航空航天局噴氣推進實驗室AIRSAR(AIRborne Synthetic Aperture Radar)系統(tǒng)于1989 年8 月在荷蘭中部采集獲得,廣泛用于地物分類算法的性能評估。圖4(a)展示了其偽彩色圖,尺寸為750 × 1 024 像素。圖4(b)為其對應(yīng)的真值地物圖,包含了11 種不同的土地覆蓋類別,標(biāo)記樣本量總數(shù)為68 188。
圖4 Flevoland數(shù)據(jù)集中的Pauli圖像及標(biāo)簽圖信息Fig.4 Pauli image and ground truth information of Flevoland dataset((a)Pauil RGB image;(b)ground truth map;(c)random sampling map;(d)spatial disjoint sampling map)
2)San Francisco 數(shù)據(jù)集,由NASA/JPL AIRSAR系統(tǒng)于美國獲得的L波段數(shù)據(jù),空間分辨率為10 m,由900 × 1 024 像素組成。圖5(a)展示了其偽彩色圖,圖5(b)為其對應(yīng)的真值地物圖,共涵蓋了5種不同的地物類別,標(biāo)記樣本量總數(shù)為830 536。
圖5 San Francisco數(shù)據(jù)集中的Pauli圖像及標(biāo)簽圖信息Fig.5 Pauli image and ground truth information of San Francisco dataset((a)Pauil RGB image;(b)ground truth map;(c)random sampling map;(d)spatial disjoint sampling map)
一些新的趨勢表明(Paoletti 等,2019;Liang 等,2017),隨機采樣方法可能會使訓(xùn)練集和測試集的樣本位置分布十分相似,如圖4(c)和圖4(b)所示,導(dǎo)致二者空間相鄰像素之間出現(xiàn)高度相關(guān)性,使網(wǎng)絡(luò)模型單純地“記憶”分類方式,從而提高精度。出于模型泛化性考慮,這種情況的分類結(jié)果一定程度上并不能體現(xiàn)網(wǎng)絡(luò)模型的真實分類性能(H?nsch 等,2017)。為此,本實驗同時采用離散隨機采樣和空間不相交采樣方法,從標(biāo)記樣本中抽取大約1%的數(shù)據(jù)作為訓(xùn)練樣本,剩余數(shù)據(jù)為測試集,對兩種實驗結(jié)果進行對比分析。
對于空間不相交采樣,取樣方法為:在每類區(qū)域中隨機初始化種子點,并依據(jù)采樣率增長為1 個或多個離散矩陣,直至像素點總數(shù)等于該類別所需訓(xùn)練樣本數(shù)。矩陣邊長分別從[3,5,7,9]中隨機選取。兩種采樣策略的訓(xùn)練集分別如圖4(c)和圖4(d)以及圖5(c)和圖5(d)所示。
為了驗證所提出算法的有效性,選取以下方法進行對比實驗。1)二維卷積神經(jīng)網(wǎng)絡(luò)(CNN2D),主要由二維卷積函數(shù)和全連接函數(shù)組成(Chen 和Tao,2018);2)三維卷積神經(jīng)網(wǎng)絡(luò)(CNN3D),主要由三維卷積函數(shù)和全連接函數(shù)組成(Yang 等,2018);3)支持向量機(support vector machine,SVM),一種傳統(tǒng)的機器學(xué)習(xí)方法(Zhang 等,2017);4)全卷積網(wǎng)絡(luò)(fully convolutional network,F(xiàn)CN),采用卷積函數(shù)實現(xiàn)從圖像像素到類別標(biāo)簽的變換(趙泉華 等,2020);5)CRF-NET,融合像素特征和坐標(biāo)特征的雙分支分類神經(jīng)網(wǎng)絡(luò)(Zhang 等,2021)。
對于使用線性核函數(shù)的SVM 算法,計算效率與支持向量數(shù)量n和特征維度d相關(guān),浮點運算數(shù)(floating point operations,F(xiàn)LOPs)為N(d×n)。對于CNN2D、CNN3D、FCN、CRF-NET 以及高階CRF 多分支網(wǎng)絡(luò)模型這5 種深度學(xué)習(xí)方法,浮點運算數(shù)N主要由卷積層和全連接層的數(shù)量和參數(shù)決定(He 和Sun,2015),具體為
2.4.1 基于Flevoland數(shù)據(jù)集的實驗結(jié)果
針對應(yīng)用最為廣泛的Flevoland 數(shù)據(jù)集進行兩種采樣策略下的分類實驗,并對不同的算法進行對比和分析。
1)隨機采樣。在隨機采樣條件下,具體精度結(jié)果及分類展示圖分別如表3 和圖6 所示。從表3 中的數(shù)據(jù)可知,在11 種類別中,除了“油菜籽”以外,本文方法均可以達(dá)到100%的分類準(zhǔn)確率。其次,以“草地”為關(guān)注重點,對于沒有引入坐標(biāo)信息的CNN2D、CNN3D、SVM 和FCN,均無法將其正確分類,而本文方法在CRF-NET 的基礎(chǔ)上又將精度進一步提升。進一步分析發(fā)現(xiàn),盡管CRF-NET 也可以將總精度提升至99%以上,然而,由圖6(g)及圖6(h)對比可以看出,后者可以更好地將不同地物類別的特征分隔開來,形成明顯的邊界線并緊密聚類。同時,由表2中的時間復(fù)雜度可知,高階CRF 模型并無明顯增加運算成本,證明了此方法已經(jīng)將分類精度和計算效率做出了較好平衡,可以在標(biāo)記樣本僅為1%的情況下實現(xiàn)高效地地物分類。
表2 算法復(fù)雜度對比Table 2 Comparison of algorithm complexity
表3 Flevoland數(shù)據(jù)集隨機采樣分類精度Table 3 The classification accuracy of random sampling on Flevoland dataset /%
圖6 Flevoland數(shù)據(jù)集隨機采樣分類結(jié)果圖Fig.6 The classification maps of random sampling on Flevoland dataset((a)Pauli RGB image;(b)ground truth map;(c)CNN2D;(d)CNN3D;(e)SVM;(f)FCN;(g)CRF-NET;(h)ours)
除去精度結(jié)果以外,訓(xùn)練效果也是評估分類性能的有效方式。圖7 展示了不同算法的訓(xùn)練結(jié)果可視圖,該圖像通過t-SNE 降維工具(van der Maaten 和Hinton,2008)將模型提取到的最終高維特征值映射到二維空間而獲得。從可視化結(jié)果圖中能夠看出,CRF-NET 和本文算法在不同類別特征之間均具有明顯的可區(qū)分性,在有限且獨立的鄰域空間內(nèi)高度聚集,且無顏色交叉的情況出現(xiàn)。進一步對比圖7(e)(f),可以發(fā)現(xiàn)后者的特征空間分布則更為緊湊,表明本文算法的特征區(qū)分性能更好。而其他算法在特征提取過程中,不同類別之間具有明顯的交雜現(xiàn)象出現(xiàn),表示在這些網(wǎng)絡(luò)模型的數(shù)據(jù)分析過程中,無法進行良好的特征區(qū)分,從表3 可以看出,這些算法的分類結(jié)果與CRF-NET 和本文方法相比,精度較低。
圖7 Flevoland數(shù)據(jù)集隨機采樣訓(xùn)練結(jié)果可視圖Fig.7 The viewable training results of random sampling on Flevoland dataset((a)CNN2D;(b)CNN3D;(c)SVM;(d)FCN;(e)CRF-NET;(f)ours)
圖8 給出了所有神經(jīng)網(wǎng)絡(luò)模型的損失函數(shù)在Flevoland數(shù)據(jù)集中的變化情況。隨著網(wǎng)絡(luò)訓(xùn)練次數(shù)的不斷增加,相較于只利用像素級特征和簡單利用空間特征的CNN2D、CNN3D、SVM和FCN方法,本文算法明顯加快了收斂速度。這表明,此方法在針對PolSAR 數(shù)據(jù)進行分級特征學(xué)習(xí)后,不同類別的特征表達(dá)能力及可區(qū)分性顯著增強,證實了本文方法可以在標(biāo)記樣本匱乏的情況下有效減小過擬合風(fēng)險,并提高網(wǎng)絡(luò)模型的類別辨識度。
圖8 Flevoland數(shù)據(jù)集隨機采樣損失函數(shù)變化圖Fig.8 The loss function graph of random sampling on Flevoland dataset
2)空間不相交采樣。在空間不相交采樣條件下,具體分類結(jié)果如表4 所示。與隨機采樣相比,所有方法的分類精度均有所降低,但本文方法仍然保持97.54%的總精度,明顯高于其他方法。與表3展示的均勻隨機采樣結(jié)果進行對比,可以看出在不相交采樣情況下,由于樣本中不攜帶如圖4(c)所示的樣本之間的空間相交信息,不同算法的分類精度均呈現(xiàn)明顯下降,特別是在CRF-NET 中,總分類精度下降超過了14%。而本文算法在結(jié)合了方位修正信息及超像素空間約束后,分類精度只下降了約2%左右,能夠在標(biāo)記樣本分布不均的情況下也保持較好的分類精度。
表4 Flevoland數(shù)據(jù)集空間不相交采樣分類精度Table 4 The classification accuracy of spatially disjoint sampling on Flevoland dataset /%
圖9 展示了不同方法對應(yīng)的分類結(jié)果圖,可以看出,本文方法的地物邊界更加清晰,誤分類情況更少,整體分類效果明顯優(yōu)于其他方法,且只有此方法可以將數(shù)據(jù)含量最少的“草地”完全正確分類。由圖9(g)和圖9(h)對比可以看出,在加入修正鄰域信息和超像素特征約束后,不同地物目標(biāo)之間的分類混雜現(xiàn)象得到了極大改善。
圖9 Flevoland數(shù)據(jù)集空間不相交采樣分類結(jié)果圖Fig.9 The classification maps of spatially disjoint sampling on Flevoland dataset((a)Pauli RGB image;(b)ground truth map;(c)CNN2D;(d)CNN3D;(e)SVM;(f)FCN;(g)CRF-NET;(h)ours )
圖10 展示了損失函數(shù)變化圖,與圖8 進行對比可以看出,盡管CRF-NET 在隨機采樣條件下能夠獲得較好的網(wǎng)絡(luò)收斂效果,但是在不相交采樣策略中,由于樣本的空間分布不均衡,導(dǎo)致CRF-NET 網(wǎng)絡(luò)的收斂明顯變?nèi)?,同時也增加了不穩(wěn)定因素。而本文算法在多級特征相互學(xué)習(xí)的情況下,并沒有受到樣本空間因素的制約,依然保持著穩(wěn)定的收斂速度。
圖10 Flevoland數(shù)據(jù)集空間不相交采樣損失函數(shù)變化圖Fig.10 The loss function graph of spatially disjoint sampling on Flevoland dataset
2.4.2 基于San Francisco數(shù)據(jù)集的實驗結(jié)果
第2個實驗分析了San Francisco地區(qū)的數(shù)據(jù),作為對比實驗增加結(jié)果可靠性。
1)隨機采樣。隨機采樣條件下的具體分類精度及結(jié)果展示圖分別如表5和圖11所示。
表5 San Francisco數(shù)據(jù)集隨機采樣分類精度Table 5 The classification accuracy of random sampling on San Francisco dataset /%
圖11 San Francisco數(shù)據(jù)集隨機采樣分類結(jié)果圖Fig.11 The classification maps of random sampling on San Francisco dataset((a)Pauli RGB image;(b)ground truth map;(c)CNN2D;(d)CNN3D;(e)SVM;(f)FCN;(g)CRF-NET;(h)ours )
對比2.4.1 節(jié)的實驗,分析表5 中的數(shù)據(jù)可知,在樣本含量更多的San Francisco 數(shù)據(jù)集上,每種方法的分類效果均有下降。所有對比算法的總精度均降低9%以上,其中,F(xiàn)CN總精度降低率高達(dá)24%,而本文方法的總精度保持在98%以上,展現(xiàn)出良好的模型泛化能力。在3 種“城市”類型中,未融入坐標(biāo)特征信息的CNN2D、CNN3D、SVM 和FCN 方法均無法很好地將“密集城市”、“發(fā)達(dá)地區(qū)”和“非密集城市”這3 種相似類別區(qū)分開,且非密集城市的分類效果最差,精度均不高于10%。
對應(yīng)圖11(c)—(f),可以看出類間錯分現(xiàn)象十分嚴(yán)重。而本文方法在CRF-NET 的基礎(chǔ)上進一步提升了模型辨別能力,將最難區(qū)分的“非密集城市”類別精度提高了10%,增加到了91.34%。同時,由圖11(g)(h)對比可得,本文方法的分類結(jié)果地物邊界線更加準(zhǔn)確,形態(tài)輪廓更加清晰。
圖12 展示了Sanfrancisco 數(shù)據(jù)集在隨機采樣下的訓(xùn)練結(jié)果可視圖,由圖12(e)與圖12(a)—(d)的對比可以看出,CRF-NET 已經(jīng)將同類型特征進行了有效聚合。在此基礎(chǔ)上,由圖12(f)可以觀察到,本文方法進一步優(yōu)化了聚合程度,使得不同類型特征之間幾乎沒有重疊。
圖12 San Francisco數(shù)據(jù)集隨機采樣訓(xùn)練結(jié)果可視圖Fig.12 The viewable training results of random sampling on San Francisco dataset((a)CNN2D;(b)CNN3D;(c)SVM;(d)FCN;(e)CRF-NET;(f)ours)
圖13 展示了隨機采樣條件下不同神經(jīng)網(wǎng)絡(luò)模型的損失函數(shù)變化圖。由圖中可以看出,本文算法的損失函數(shù)平穩(wěn)下降,在不同數(shù)據(jù)集上展示出優(yōu)秀的泛化能力。同時,觀察CNN2D、CNN3D 和FCN 方法的曲線變化趨勢可以看出,這3 種算法的損失函數(shù)值下降緩慢,在網(wǎng)絡(luò)迭代次數(shù)為200時依舊在0.5以上,出現(xiàn)了因提取信息過于片面、無法充分學(xué)習(xí)類別特征而導(dǎo)致的網(wǎng)絡(luò)參數(shù)難以調(diào)優(yōu)的問題。與此同時,CRF-NET 與本文方法均可以將損失函數(shù)降低至0.2 左右,且后者的網(wǎng)絡(luò)收斂程度更高、下降速度更快,證明了多級空間特征的融合可以有效增強網(wǎng)絡(luò)模型對不同類型特征的感知能力,進一步提高數(shù)據(jù)可分性。
圖13 San Francisco數(shù)據(jù)集隨機采樣損失函數(shù)變化圖Fig.13 The loss function graph of random sampling on San Francisco dataset
2)空間不相交采樣。在空間不相交采樣情況下,分類精度結(jié)果如表6 所示。由表5 和表6 比較可得,對于San Francisco 數(shù)據(jù)集,兩種采樣策略對于分類結(jié)果影響較小,所有方法的總精度變化范圍均在5%以下。其中,只有SVM 的精度變化呈略微上升狀態(tài),其余方法均存在不同程度的精度下降。結(jié)合2.4.1 節(jié)的實驗結(jié)果可知,空間不相交采樣方式對于深度神經(jīng)網(wǎng)絡(luò)影響較大,而對于以SVM 代表的傳統(tǒng)機器學(xué)習(xí)方式則影響較小。
表6 San Francisco數(shù)據(jù)集空間不相交采樣分類精度Table 6 The classification accuracy of spatially disjoint sampling on San Francisco dataset /%
本文針對PolSAR 小樣本分類中的類塊間邊界模糊和類塊內(nèi)噪聲問題,提出一種多分支PolSAR 分類的深層網(wǎng)絡(luò)模型。該方法受高階CRF 一元勢、二元勢和高階勢聯(lián)合優(yōu)化的啟發(fā),分別針對像素極化特征、全局空間特征和鄰域空間特征設(shè)計了卷積分支進行特征學(xué)習(xí),通過多特征聯(lián)合學(xué)習(xí)以提升模型的小樣本分類性能。此外,為了進一步優(yōu)化分類效果,在后處理階段引入超像素約束模塊用于劃分異構(gòu)區(qū)域邊界,將同一地物類型的勻質(zhì)區(qū)域進行類別統(tǒng)一,有效建立了像素級和對象級數(shù)據(jù)間的尺度關(guān)聯(lián)。
為了進一步限制空間先驗信息的引入,在實驗環(huán)節(jié)增加了空間不相交采樣方式進行訓(xùn)練樣本選擇,并與包含一定空間先驗信息的隨機采樣方式進行對比分析。實驗結(jié)果表明,融合極化特征和多種空間特征的高階CRF 模型可以更好地區(qū)分地物散射組成,極大提高了類別感知度。相較于只利用像素級特征或簡單利用空間特征的網(wǎng)絡(luò)模型,能夠從不同的角度提供互補特征,進一步克服了地物目標(biāo)空間形態(tài)信息丟失和邊緣輪廓變形的問題。但是,本文實驗結(jié)果僅針對Flevoland 數(shù)據(jù)集和San Francisco 數(shù)據(jù)集進行分析,存在一定的片面性,網(wǎng)絡(luò)模型的遷移性有待考量,后續(xù)將考慮結(jié)合因果學(xué)習(xí)方法構(gòu)建更加穩(wěn)健的鑒別性特征,開展跨場景分類研究,進一步豐富PolSAR分類技術(shù)的應(yīng)用場景。