張偉濤,王 敏,郭 交
(1.西安電子科技大學(xué)電子工程學(xué)院,陜西西安 710071;2.西北農(nóng)林科技大學(xué)機械與電子工程學(xué)院,陜西楊凌 712100)
農(nóng)作物分類在農(nóng)業(yè)遙感監(jiān)測中起著重要的作用,是進一步監(jiān)測農(nóng)作物生長及產(chǎn)量的前提。因此,農(nóng)作物分類對于指導(dǎo)農(nóng)業(yè)生產(chǎn)、合理分配農(nóng)業(yè)資源、保障國家糧食安全具有重要意義。
隨著遙感技術(shù)及其理論的不斷進步和發(fā)展,已廣泛應(yīng)用于農(nóng)作物普查、生長監(jiān)測、產(chǎn)量預(yù)測和災(zāi)害評估等農(nóng)業(yè)領(lǐng)域。偏振合成孔徑雷達(Polarimatric Synthetic Aperture Radar,PolSAR)作為微波遙感系統(tǒng)中一種主動遙感技術(shù),具有其他遙感技術(shù)無法比擬的優(yōu)勢,其工作條件不受天氣和氣候限制。近年來,農(nóng)作物分類研究大多采用單時相PolSAR 數(shù)據(jù),然而,由于不同農(nóng)作物間相同的長勢狀況,單一時相的PolSAR 圖像很難識別出不同的農(nóng)作物類別,尤其是在播種時期。因此,有必要采集多時相PolSAR 數(shù)據(jù)用于農(nóng)作物分類,從而提高分類精度。
由于對多時相全極化PolSAR 數(shù)據(jù)進行極化特征分解后的數(shù)據(jù)直接分類會出現(xiàn)所謂的“維數(shù)災(zāi)難”問題,因此,對多時相數(shù)據(jù)極化分解后的特征進行降維成為一項重要的工作。主成分分析法(Principle Component Analysis,PCA)和局部線性嵌入法(Locally Linear Embedded,LLE)是解決“維數(shù)災(zāi)難”問題常用的特征壓縮方法。PCA 是一個線性的數(shù)據(jù)處理方法,但實際工程中大多數(shù)問題都是非線性的;LLE 可以自動從高維數(shù)據(jù)中提取非線性的低維特征,但對異常值非常敏感。近年來,隨著深度學(xué)習(xí)的發(fā)展,出現(xiàn)了一些成熟的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)(如自編碼器、稀疏自編碼器),在特征壓縮和圖像分類方面都具有良好的性能。然而,稀疏自編碼器的稀疏性在提取有效分類特征時并沒有得到充分的利用,并且常見的傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)和支持向量機(Supper Vector Machine,SVM)分類器在分類時也不能獲取到壓縮特征的多尺度信息。基于上述缺點,農(nóng)作物分類性能不能達到實際應(yīng)用水平。
為了利用多時相PolSAR 數(shù)據(jù)對農(nóng)作物進行分類并且解決“維數(shù)災(zāi)難”的問題,首先采用了一種非負(fù)性約束稀疏自編碼器(Sparse Auto-Encoder with Non-negativity Constraints,NC-SAE)網(wǎng)絡(luò)進行特征降維,提取有效的極化特征信息。然后,構(gòu)建了一個多尺度特征分類網(wǎng)絡(luò)(Multi-scale Feature Classification Network,MSFCN)實現(xiàn)農(nóng)作物的分類識別,大幅提高了農(nóng)作物的分類精度。
全極化合成孔徑雷達用于接收目標(biāo)的后向散射信號,以HH、HV、VH 和VV 這4 種組合方式測量幅值和相位,其中H 為水平模式,V 為垂直模式。采集的每個像素的散射信息用一個2×2 的復(fù)矩陣表示,這些復(fù)數(shù)關(guān)系到入射電場和散射電場:
式中:為垂直發(fā)射和水平接收的極化散射因子,同理可定義式中其他參數(shù)。
通過對散射矩陣矢量化可以得到目標(biāo)特征向量,由于PolSAR 數(shù)據(jù)是復(fù)對稱數(shù)據(jù),符合后向散射互易定理,可以將近似等于,因此,偏振散射矩陣可以重寫為Lexicographic 散射向量:
式中:上標(biāo)*為復(fù)數(shù)的共軛。
NC-SAE 是在自編碼器的基礎(chǔ)上發(fā)展而來,是數(shù)據(jù)表征的無監(jiān)督學(xué)習(xí)算法,其目的是使輸出值盡可能接近輸入值。單層自編碼器網(wǎng)絡(luò)的基本結(jié)構(gòu)由3 部分組成:編碼器、激活層、解碼器。自編碼器網(wǎng)絡(luò)采用最速下降法進行網(wǎng)絡(luò)訓(xùn)練,最終實現(xiàn)目標(biāo)函數(shù)的最小化,其目標(biāo)函數(shù)為輸入與輸出之間的重構(gòu)誤差,表示如下:
式中:為訓(xùn)練樣本數(shù);()為第個樣本的輸入數(shù)據(jù);()為第個樣本的重構(gòu)輸出。
NC-SAE 是在自編碼器的目標(biāo)函數(shù)上增加2 個約束項進行實現(xiàn)。第一個約束項為稀疏約束:
該約束使網(wǎng)絡(luò)訓(xùn)練過程具有較快的收斂速度。稀疏約束項的目的是通過限制隱藏層的激活神經(jīng)元個數(shù)來增加網(wǎng)絡(luò)的稀疏性,通常使用KL(Kullback-Leibler)散度函數(shù)表示。
可以看出:當(dāng)(稀疏參數(shù))和ˉ(平均激活值)趨于相等時,趨于0;當(dāng)兩者相差越大時,較大。第2 個約束項為非負(fù)性約束,其有利于避免網(wǎng)絡(luò)訓(xùn)練過程中的過擬合現(xiàn)象,計算式如下:
式中:為權(quán)值;為層數(shù)。
綜上所述,NC-SAE 的目標(biāo)函數(shù)表示如下:
式中:為非負(fù)性約束項的系數(shù);為稀疏約束項的系數(shù)。
采用最速下降法更新式(8)目標(biāo)函數(shù)中的權(quán)重和偏置,計算式如下:
式中:為迭代次數(shù);為學(xué)習(xí)率。
采用誤差反向傳播算法計算式(9)中的偏導(dǎo)數(shù)。在解碼過程時,目標(biāo)函數(shù)對權(quán)值的偏導(dǎo)數(shù)為
式中:(·)為(·)的偏導(dǎo)數(shù)。
(·)是一個sigmoid 函 數(shù),一般選 取logsig 函數(shù),如下所示:
此時,式(10)可表示為
然后,對編碼過程的偏導(dǎo)數(shù)求解如下:
編碼過程和解碼過程目標(biāo)函數(shù)對偏置的導(dǎo)數(shù)計算如下:
提出的MSFCN 的網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示,其主要包括3 個部分:多尺度特征提取、特征融合、分類。首先,利用卷積層中多個不同大小的卷積核提取不同尺度的特征信息;然后,將獲取的不同尺度的特征信息使用concat 層進行融合作為分類層的輸入數(shù)據(jù);最后,采用softmax 層進行分類。因此,MSFCN不僅利用卷積層中的不同卷積核提取多尺度特征信息,而且可以捕捉到特征圖之間的細(xì)微差別。
圖1 多尺度特征分類網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Architecture of MSFCN
使用的實驗數(shù)據(jù)由歐洲航天局提供,主要用于評估所提方法的分類性能。實驗區(qū)域位于加拿大薩斯克切溫省東南部的Indian Head 小鎮(zhèn),是一個約為14 km×19 km 的矩形區(qū)域。該區(qū)域共包含14 種不同類型的農(nóng)作物和一個“非農(nóng)作物”類別,“非農(nóng)作物”類別可能是城鎮(zhèn)、道路或天然植被區(qū)等非農(nóng)作物地物。實驗區(qū)域各農(nóng)作物數(shù)據(jù)的具體信息見表1。
表1 研究區(qū)農(nóng)作物類型及其信息統(tǒng)計Tab.1 Information statistics of crops in the study area
實驗所用的PolSAR 數(shù)據(jù)是利用歐空局發(fā)射的Radarsar-2 衛(wèi)星采集的真實數(shù)據(jù),通過模擬還未發(fā)射的Sentinel-1 系統(tǒng)參數(shù)而生成的仿真數(shù)據(jù)。數(shù)據(jù)采集時間分別是2009 年4 月21 日、5 月15 日、6 月8日、7 月2 日、7 月26 日、8 月19 日和9 月12 日,這7 個時間段的PolSAR 數(shù)據(jù)幾乎涵蓋了實驗區(qū)域所有農(nóng)作物的從播種到收割的整個生長周期。對單個時相的PolSAR 數(shù)據(jù)使用極化特征分解方法進行特征分解,可以獲得36 維特征。因此,7 個時相的Pol-SAR 數(shù)據(jù)一共可以獲得252 維特征信息。
為了對分類結(jié)果進行精確的評估與分析,使用整體分類精度(Overall Accuracy,OA)和Kappa 系數(shù)進行結(jié)果對比。其中,整體分類精度OA 表示正確分類的樣本數(shù)與樣本總數(shù)之比,具體計算式如下:
式中:為分類正確的樣本數(shù);為所有樣本的總數(shù)。
Kappa 系數(shù):常見計算分類精度的算法,來源于一致性檢驗,用于評價分類算法的分類性能,它是衡量預(yù)測輸出與地面真實值一致性的標(biāo)準(zhǔn),有效避免了因某一類目標(biāo)地物分類精度高而導(dǎo)致整體分類精度高,進而誤以為模型分類效果好的情況。整體分類精度僅涉及正確預(yù)測的樣本數(shù),與之不同的是,Kappa 系數(shù)考慮了位于混淆矩陣非對角線上的各種缺失和誤分類樣本,其計算式如下:
式中:為整體分類精度;為待分類目標(biāo)的樣本總數(shù);為待分類目標(biāo)的類別數(shù);為分類算法的混淆矩陣;Z為混淆矩陣第行所有列的值之和;為混淆矩陣第列所有行的值之和。
本文對提出的特征降維方法、分類網(wǎng)絡(luò)與傳統(tǒng)的降維方法和分類方法進行了比較分析。首先利用所提的NC-SAE 以及傳統(tǒng)的LLE、PCA、S-SAE等特征降維方法,對極化分解后的252 維特征進行降維,從而獲得9 維特征;然后將降維后的9 維特征分別輸入SVM、CNN 和MSFCN 分類器進行分類,每個分類器的訓(xùn)練樣本選擇總樣本的1%。
不同分類器的分類結(jié)果和誤差如圖2 所示。對于CNN 和MSFCN 分類網(wǎng)絡(luò),其輸入樣本尺寸也會影響農(nóng)作物的分類性能,因此,對不同輸入樣本大小下的分類結(jié)果也進行了比較,整個實驗結(jié)果見表2。
結(jié)合圖2 和表2 中的分類結(jié)果,得出如下結(jié)論:
表2 不同方法的分類精度統(tǒng)計Tab.2 Classification accuracy of different methods
圖2 不同分類器的分類結(jié)果和誤差Fig.2 Classification results by different classifiers
1)與傳統(tǒng)的LLE、PCA 降維方法相比,使用NC-SAE 和S-SAE 降維方法獲取的特征信息進行分類的農(nóng)作物總體分類精度提高了6% 以上,雖然NC-SAE 和S-SAE 的分類精度幾乎相同,但是這2個自編碼器的網(wǎng)絡(luò)結(jié)構(gòu)不同。提出的NC-SAE 是一個單層網(wǎng)絡(luò),而S-SAE 是將3個自編碼器依次連接而成的三層網(wǎng)絡(luò),因此,NC-SAE 的計算復(fù)雜度更低。
2)比較不同分類器的分類性能,由圖2 可以清楚地看出MSFCN 的分類效果比其他分類網(wǎng)絡(luò)更好。同時,由表2 可以得出,MSFCN 網(wǎng)絡(luò)的整體分類精度OA 比SVM 和CNN 分別高21%和12%。
3)CNN 和MSFCN 網(wǎng)絡(luò)的輸入大小對分類性能也有一定的影響,增大輸入大小可以顯著提高農(nóng)作物的分類精度。通過實驗證明,建議在實際應(yīng)用中選擇中等大小尺寸35×35。
4)分析農(nóng)作物分類的整個實驗過程,通過對比表2 中的結(jié)果可以得出,所提出的NC-SAE 與MSFCN 結(jié)合的方法可以獲得最好的分類性能。
本文構(gòu)建了一種新的MSFCN 用于完成對多時相PolSAR 數(shù)據(jù)的分類。為了解決維數(shù)災(zāi)難問題,提出了一種改進的自編碼器NC-SAE,用于對多時相PolSAR 數(shù)據(jù)的極化散射特征降維。與此同時,利用歐空局提供的Sentinel-1 系統(tǒng)模擬多時相PolSAR 數(shù)據(jù)和實驗區(qū)域的地面真實值對所提方法進行分類性能評估。與傳統(tǒng)的分類方法SVM 和CNN 相比,最終分類結(jié)果表明:對于多時相PolSAR 數(shù)據(jù)的農(nóng)作物分類,所提方法MSFCN 網(wǎng)絡(luò)的分類性能最優(yōu)。
此外,對于提出的多時相PolSAR 數(shù)據(jù)農(nóng)作物分類方法,還可以進行進一步的研究。首先,對于NC-SAE 的超參數(shù),直接使用S-SAE 方法的經(jīng)驗值,但不一定是NC-SAE 方法在特征降維時的最優(yōu)值,因此,NC-SAE 最優(yōu)值的選取值得后續(xù)繼續(xù)研究;其次,使用了2 個階段(特征壓縮和作物分類)實現(xiàn)對多時相農(nóng)作物數(shù)據(jù)的分類,對此也可以進行優(yōu)化,研究出更簡便的方法,即使用一個獨立網(wǎng)絡(luò)實現(xiàn)多時相PolSAR 數(shù)據(jù)的農(nóng)作物分類,將進一步簡化分類過程,減少計算量。