王歡歡 徐麗華
(浙江農(nóng)林大學(xué)環(huán)境與資源學(xué)院,浙江 臨安 311300)
正確地識別植物是利用和保護(hù)城市森林資源的基礎(chǔ)和依據(jù)[1]。隨著遙感技術(shù)的快速發(fā)展,如何從海量的數(shù)據(jù)中選擇有效的波段進(jìn)行植物種類識別成了亟待解決的問題。因此,波段的選擇、數(shù)據(jù)的降維處理成為了未來研究的重點(diǎn)之一。Martin Herold、Nirmal Keshava、曹建農(nóng)等人分別利用B距離法、基于可分性的迭代選擇波段方法、馬爾科夫網(wǎng)等方法對波段進(jìn)行降維,并有效的對數(shù)據(jù)進(jìn)行了壓縮[2-4]。而在植物種類識別方面,目前主要是以實驗室獲得的葉片高光譜反射率及一些相關(guān)的化學(xué)物理參數(shù)(葉片葉綠素含量、水分含量等)為基礎(chǔ)數(shù)據(jù)[5],運(yùn)用不同的數(shù)學(xué)方法對其進(jìn)行分析研究,確定不同植被的識別特征。Gong、Chaichoke Vaiphasa、Zhang等人分別利用小波變換、對數(shù)變換、歸一化變換及一些相關(guān)的物理化學(xué)參數(shù)等對葉片光譜反射率進(jìn)行分析,并得到了較為理想的分類結(jié)果,能夠很好地區(qū)分不同樹種的類型[6-8]。而國內(nèi)學(xué)者,如宮鵬、傅銀貞、浦瑞良、丁麗霞等人利用光譜微分法、變量相關(guān)法、方差法、包絡(luò)線去除法對不同樹種進(jìn)行了識別,均得到了較好的結(jié)果[9-12]。在植物波譜的研究方面大多數(shù)學(xué)者都是單純的用數(shù)學(xué)方法提取最佳波段進(jìn)行植被識別,本研究將基于通道劃分,將波段信息進(jìn)行降維,進(jìn)行植物反射波譜的分類研究。
基于47種杭州城市常見植物的400~2 500 nm的反射波譜,根據(jù)各個波段間的相關(guān)性劃分了23個波譜區(qū)間,根據(jù)新的波譜反射率對原始波譜進(jìn)行變換得到了新波譜,采用自組織競爭神經(jīng)網(wǎng)絡(luò)法對原始波譜和新波譜分別進(jìn)行識別。結(jié)果表明,自組織競爭神經(jīng)網(wǎng)絡(luò)法可以將波譜曲線相似的植物聚為一類,且23個通道劃分的結(jié)果顯示,識別植物的最佳波段大部分位于紅光波段和近紅外波段內(nèi),通道劃分后的新波譜以較少的數(shù)據(jù)保留了植物之間的差異,實現(xiàn)了數(shù)據(jù)的壓縮,為高光譜數(shù)據(jù)的降維提供了一種參考。
波譜數(shù)據(jù)的采集地點(diǎn)位于浙江農(nóng)林大學(xué)以及周邊地帶。共采集了包括木本植物、草本植物在內(nèi)的47種杭州城市常見植物。數(shù)據(jù)采集時每種植物選取5株,每株采集一片向陽面的成熟葉片,共計235個葉片樣本。數(shù)據(jù)采集在晴朗的天氣下進(jìn)行,選擇生長茂盛的、無病害的植物進(jìn)行葉片采集,并放在保鮮袋里,迅速帶到室內(nèi)測量光譜反射率。葉片的采集為不同日期時,選擇天氣晴朗的相同時間段進(jìn)行收集,減少氣候和時間差異對數(shù)據(jù)的影響。光譜數(shù)據(jù)的測量采用ASD FieldSpecPro FR野外光譜輻射儀。測量光譜波段范圍為350~2 500 nm,共 2 151 個波段。由于350~400 nm光譜反射率不穩(wěn)定,出現(xiàn)了大幅度的波動,因此,本研究選用400~2 500 nm的光譜。為了提高光譜測量的準(zhǔn)確性和穩(wěn)定性,利用該光譜儀配套的植物高密度探頭進(jìn)行光譜測量,每測完1片樹葉進(jìn)行一次標(biāo)準(zhǔn)白板的校正,每個葉片測量5條光譜。每種植物共測得25條光譜,取其平均值作為該植物的光譜反射率值。采集的植物種類見表1。
表1 杭州市典型植物采樣類型及名稱
相關(guān)系數(shù)矩陣也叫相關(guān)矩陣。設(shè)(x1,x2,x3……,xn)是一個n維隨機(jī)變量,任意xi與xj的相關(guān)系數(shù)ρij(i,j=1,2,3……n)構(gòu)成的n階矩陣稱為該隨機(jī)向量的相關(guān)系數(shù)矩陣,記作R,即:
(1)
(2)
式中:cov(xi,xj)為xi、xj的協(xié)方差;σxi為xi的標(biāo)準(zhǔn)差。
相關(guān)系數(shù)反映的是相鄰元素之間的相關(guān)性大小。相關(guān)系數(shù)越高,元素之間的相關(guān)性越大,相似程度越高;相關(guān)系數(shù)越小,元素之間的相關(guān)性就越小,相似程度就低。一般認(rèn)為,相關(guān)系數(shù)在0.3以下為無相關(guān),0.3~0.5表示低度相關(guān),0.5~0.8表示中等相關(guān),0.8以上表示高度相關(guān)[13]。
對于相關(guān)系數(shù)矩陣R,以矩陣R的對角線為基礎(chǔ),提取出m個對稱矩陣Di,k∈(1,n)且m個對稱矩陣中的所有元素都不小于某個固定值a,Di即為通道區(qū)間。即:
(3)
式中:i∈(1,m),k∈(1,n),Di為通道區(qū)間,R為相關(guān)系數(shù)矩陣。
根據(jù)確定的通道區(qū)間對原始光譜數(shù)據(jù)進(jìn)行壓縮。本項研究采用的是章皖秋等人對城市典型地物反射波譜分辨率進(jìn)行分析時采用的重采樣及擴(kuò)展的公式。章皖秋等[14]人利用該公式對城市地物反射波譜進(jìn)行壓縮降維,并且得到了較好的研究結(jié)果。
原始反射率光譜按照公式(4)進(jìn)行變換。
(4)
式中:B為通道個數(shù),B∈(1,2,…,2 100);b為該通道劃分中的第b個通道,b通道的波譜寬度為[λ1,λm],b∈(1,2,…,B);b=[λ1,λm];Rλ為第b個通道的波譜反射率的平均值;RBb為第b個通道的新波譜,由原始波譜重采樣得到RB=[RB1…RBb…RBB]構(gòu)成了通道數(shù)B下的新波譜。
波譜重采樣采用的是積分法求平均值,它可以代表樣本的平均指標(biāo),能夠反映波譜區(qū)間內(nèi)各光譜反射率數(shù)據(jù)的平均特征。波譜降維后光譜曲線的分辨率降低,維數(shù)變少,為了新光譜的分類結(jié)果與原始反射光譜的分類結(jié)果具有可比性,將新光譜按公式(5)擴(kuò)展新波譜,使原始波譜具有相同維數(shù)[14]。
(5)
式中:λ=401,…,2 500 nm。
本研究采用自組織競爭神經(jīng)網(wǎng)絡(luò)對重采樣之后的新波譜和原始波譜分別進(jìn)行植物的分類識別。自組織競爭人工神經(jīng)網(wǎng)絡(luò)是一種無教師學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型,它模擬人類生物神經(jīng)系統(tǒng)的適應(yīng)過程,利用競爭的原則來進(jìn)行信息處理,指導(dǎo)網(wǎng)絡(luò)的學(xué)習(xí),網(wǎng)絡(luò)通過自身的訓(xùn)練,自動對輸入模式進(jìn)行識別分類。
波譜分辨率越高,各相鄰波段之間的相似性越高,通道間相關(guān)性就越大,會增加數(shù)據(jù)量和冗余度,難以包容植物反射波譜的合理擺動。為了減少數(shù)據(jù)之間的冗余,根據(jù)公式(1)、公式(2)計算2 100個波段之間的相關(guān)系數(shù)矩陣,見圖2。
圖2顏色的深淺代表了相關(guān)系數(shù)的大小,顏色越淺說明相關(guān)系數(shù)越大,波段之間的相關(guān)性就越高,所包含的信息相似程度就越高。反之,顏色越深代表相關(guān)系數(shù)越小,所包含的的信息差異性越大。圖2中的對角線代表了各波段與本身的相關(guān)系數(shù),是一條代表相關(guān)系數(shù)都為1的連續(xù)象元。而對角線的周圍是一系列連續(xù)的、顏色淺的小矩陣,這些矩陣對應(yīng)著一系列連續(xù)、相關(guān)性高的波譜區(qū)間。并且隨著波段間隔的增大,相關(guān)系數(shù)矩陣圖中的顏色逐漸變暗,相關(guān)系數(shù)逐漸變小,說明波段之間的相關(guān)性隨波段之間間隔的增大而減小。波段間隔越大,所代表的信息差異性越大,因此相關(guān)性越小。同一波段區(qū)間內(nèi)各波段之間的相關(guān)性高,所代表的信息相似。因此可采用定量方法,將這些高相關(guān)的連續(xù)的波譜區(qū)間作為通道提取出來。
根據(jù)計算出的各波段之間的相關(guān)系數(shù),在matlab中按照公式(3)編寫的相關(guān)程序,把高度相關(guān)的波段區(qū)間作為通道提取出來。
根據(jù)相關(guān)系數(shù)大于0.8的為高度相關(guān),故分別選用2個值a=0.8、a=0.9 為臨界點(diǎn)劃分波段區(qū)間。當(dāng)a=0.8時,得到14個波譜區(qū)間;當(dāng)a=0.9時,得到23個波譜區(qū)間。表2~3分別為a=0.8、a=0.9時劃分的通道區(qū)間。
表2 a=0.8時劃分的14個波譜通道 nm
表3 a=0.9時劃分的23個波譜通道 nm
通過表2~3的對比分析可以看出,當(dāng)劃分為14個波譜通道時,波譜區(qū)間的寬度較寬,數(shù)據(jù)壓縮嚴(yán)重;而當(dāng)劃分為23個波譜區(qū)間時,波譜區(qū)間的寬度相對變窄。根據(jù)前人的研究,20 nm的波譜寬度用于識別植物樹種是較為理想的[16],14個波譜通道劃分法的通道區(qū)間大部分都遠(yuǎn)大于20 nm,而23個波譜通道劃分法的通道區(qū)間波譜寬度大部分在20 nm左右,所以23個通道劃分法較14個通道劃分法要合理。因此,本項研究選用了23個通道劃分的方法。
在劃分的23個通道內(nèi),波譜寬度越窄說明這些波段越能更好的對不同植物進(jìn)行識別,更能夠有效的區(qū)分不同植物之間的波譜差異。其中有11個通道的波譜寬度較窄,分別為:490~509、642~676、677~683、684~688、689~705、706~725、726~741、1 331~1 354、1 355~1 370、1 371~1 383、1 384~1 416。1個通道位于綠光波段內(nèi),6個通道位于紅光波段內(nèi),4個通道位于近紅外波段內(nèi)。說明能夠有效識別并區(qū)分不同植物的波段大部分位于紅光波段和近紅外波段內(nèi)。23個波譜通道的劃分將原分辨率為1 nm的波譜有效的進(jìn)行了降維,減少數(shù)據(jù)之間的重復(fù),用較少的數(shù)據(jù)量表達(dá)了更多的信息。
合理的波譜通道應(yīng)該不僅對數(shù)據(jù)進(jìn)行了壓縮,而且還保留了植物之間的差異性,本項研究將從植物之間的差異性對波譜通道劃分的合理性進(jìn)行檢驗。
根據(jù)通道劃分的結(jié)果,依據(jù)公式(4)、(5)對原始波譜進(jìn)行波譜重采樣及擴(kuò)展得到1個新的光譜,設(shè)計1個自組織競爭人工神經(jīng)網(wǎng)絡(luò)。學(xué)習(xí)率為0.1,最大迭帶次數(shù)定為 2 000。其中競爭層節(jié)點(diǎn)個數(shù)的選擇將最終決定植物的分類結(jié)果,因此,從實際出發(fā),認(rèn)為這些樣本至少分為4個期望類:針葉類木本植物、闊葉類木本植物、竹類植物和草本植物,然后根據(jù)分類結(jié)果與樣本特征對每一類再逐漸細(xì)分。實驗中分別嘗試了4個類別、5個類別、6個類別3種分類方法,從而設(shè)定網(wǎng)絡(luò)競爭層神經(jīng)元個數(shù),分別為4個,5個,6個,利用神經(jīng)網(wǎng)絡(luò)對數(shù)據(jù)進(jìn)行分類,分析數(shù)據(jù)特征。通過對比分析可知,分為6類時效果最佳,表4分別為6個神經(jīng)元時的新波譜和原始波譜分類結(jié)果展示。
表4 6個神經(jīng)元分類結(jié)果
由表4可知,新光譜的分類結(jié)果對植物種類有很好的識別聚類效果,雖然沒有把針葉類木本植物、闊葉類木本植物、竹類植物和剩余的草本植物精確地分出來,但是這些植物都以小類別的方式被聚集在六大類中,且六大類植物中的每一類都具有相似性與差異性,可以在分類基礎(chǔ)上對樣本再進(jìn)行逐層細(xì)分。因此,自組織競爭神經(jīng)網(wǎng)絡(luò)法可以對植物進(jìn)行有效的識別。新光譜的分類結(jié)果與原始波譜的分類結(jié)果相似,都能很好的將相似的植物波譜分為一類。對比2種分類結(jié)果,有3類的分類結(jié)果完全相同,只有短梗冬青、苦櫧、女貞在分類結(jié)果中出現(xiàn)了變化,女貞在新光譜分類結(jié)果中與石楠、木犀、木蓮、大葉冬青、枸骨分為一類,這6種植物都是闊葉樹種,且葉片都是革質(zhì),所以女貞被分到這一類更為合理。而短梗冬青和苦櫧在2種分類結(jié)果中雖然被分到了不同類別,但是,這兩類都屬于常綠闊葉樹種,因而對分類結(jié)果影響不大。所以,綜上來看,新波譜的分類結(jié)果與原始波譜的分類結(jié)果相似,并且更具有合理性。
為了更直觀的觀察通道劃分后的植物種類識別結(jié)果,將通道劃分后的分類結(jié)果以波譜曲線的方式表達(dá)出來,如圖3~8所示。可以看出通道劃分后的新波譜仍能夠很好的識別植物,并且將波譜曲線相似的植物分到了同一類。
通過原始波譜與新波譜分類結(jié)果的對比可以看出,23通道組較少的數(shù)據(jù)保留了原始光譜反射數(shù)據(jù)的主要信息,確保了不同植物之間反射率的差異,進(jìn)而確保了不同植物之間的可分性;在降低信息冗余的同時并未降低信息量,且23個波譜通道劃分下的自組織競爭神經(jīng)網(wǎng)絡(luò)法能夠很好的將形狀相似的波譜劃分到一起。
1) 本項研究分析了47種不同植物的實測光譜曲線,以波段間的相關(guān)性作為衡量波段間相似程度的標(biāo)準(zhǔn)來劃分通道區(qū)間,并通過神經(jīng)網(wǎng)絡(luò)法對通道劃分的結(jié)果進(jìn)行了檢驗。
2) 通道劃分的結(jié)果顯示,23個通道中11個波譜通道寬度較窄,能夠較好地區(qū)分植物的光譜信息;且11個波譜通道大部分位于紅光波段或近紅外波段內(nèi),為識別植物的最佳波段。23個通道劃分的光譜以較少的數(shù)據(jù)保留了400~2 500 nm不同植物之間的差異,減少了數(shù)據(jù)的冗余,有效的對原始波譜數(shù)據(jù)進(jìn)行了降維;在降維的同時并未減少信息量且降維后的新波譜在植物識別方面效果更佳。自組織競爭神經(jīng)網(wǎng)絡(luò)法能夠較好的將形狀相似的植物波譜曲線聚為一起,能將主要的植物有效的自動識別出來。
3) 本項研究結(jié)果可為高光譜數(shù)據(jù)的降維和植物識別的波段選擇提供參考,但由于受到樣本質(zhì)量、數(shù)量、波譜特征的影響,因此,如何選擇有效波段來區(qū)別不同植物仍是目前研究的一個重點(diǎn)問題。
[1] 劉旭升,張曉麗.森林植被遙感分類研究進(jìn)展與對策[J].林業(yè)資源管理,2004(1):61-64.
[2] Herold M, Roberts D A, Gardner M E, et al. Spectrometry for urban area remote sensing:Development and analysis of a spectral library from 350 to 2400 nm[J]. Remote Sensing of Environment, 2004, 91(3): 304-319.
[3] Keshava N. Distance metrics and band selection in hyperspectral processing with applications to material identification and spectral libraries[J]. Geoscience and Remote Sensing, IEEE Transactions on, 2004, 42(7): 1552-1565.
[4] 曹建農(nóng),李德仁,關(guān)澤群.用馬爾科夫網(wǎng)對多光譜遙感圖像進(jìn)行波段最優(yōu)融合[J].測繪學(xué)報,2005,34(1):46-52.
[5] 王志輝.高光譜遙感在森林樹種識別中的應(yīng)用[D].杭州:浙江農(nóng)林大學(xué),2011:2-3.
[6] Gong P, Pu R, Yu B. Conifer species recognition: An exploratory analysis of in situ hyperspectral data[J]. Remote Sensing of Environment, 1997, 62(2): 189-200.
[7] Vaiphasa C, Ongsomwang S, Vaiphasa T, et al. Tropical mangrove species discrimination using hyperspectral data: a laboratory study[J]. Estuarine Coastal and Shelf Science, 2005, 65(1/2): 371-379.
[8] Zhang J, Rivard B, Sánchez-Azofeifa A, et al. Intra-and inter-class spectral variability of tropical tree species at La Selva, Costa Rica: Implications for species identification using HYDICE imagery[J]. Remote Sensing of Environment, 2006, 105(2): 129-141.
[9] 宮鵬, 浦瑞良. 不同季相針葉樹種高光譜數(shù)據(jù)識別分析[J]. 遙感學(xué)報, 1998, 2(3): 211-217.
[10] 傅銀貞,汪小欽.基于光譜測量的南方典型樹種反射光譜特征分析[J].廈門理工學(xué)院學(xué)報,2009,17(3):37-41.
[11] 浦瑞良,宮鵬.高光譜遙感及其應(yīng)用[M].北京:高等教育出版社,2000:3-4.
[12] 崔瑩瑩,舒清態(tài),人工神經(jīng)網(wǎng)絡(luò)在林業(yè)中的應(yīng)用現(xiàn)狀與趨勢[J].西林林業(yè)大學(xué)學(xué)報,2013(5):98-103
[13] 張彥.社會統(tǒng)計學(xué):原理與方法[M].修訂版.南京:南京大學(xué)出版社,2003:215-216.
[14] 章皖秋,騰麗,張王菲,等.城市典型地物反射波譜分辨率研究[J].遙感信息,2008(2):21-24, 50.
[15] 聞新,周露,李翔,等.MATLAB神經(jīng)網(wǎng)絡(luò)仿真與應(yīng)用[M].北京:科學(xué)出版社,2003:300-303.