邱 琳,林 輝,臧 卓,孫 華,莫登奎
(中南林業(yè)科技大學(xué) 林業(yè)遙感信息工程研究中心,湖南 長沙 410004)
基于均值置信區(qū)間帶的濕地植被高光譜特征波段選擇
邱 琳,林 輝,臧 卓,孫 華,莫登奎
(中南林業(yè)科技大學(xué) 林業(yè)遙感信息工程研究中心,湖南 長沙 410004)
以東洞庭湖苔草、泥蒿、蘆葦、辣蓼與柳樹5種典型濕地植被為研究對(duì)象,采用基于均值置信區(qū)間估計(jì)原理篩選特征波段,并結(jié)合Manhattan距離法檢驗(yàn)植被識(shí)別的效果。研究結(jié)果表明:(1)剔除5種濕地植被類型中兩兩植被置信區(qū)間帶重合率大的波段,得到光譜特征差異顯著的特征波段,為680、760、870、1 570、2 030 nm。(2)5種植被類型的光譜反射率Manhattan距離值分別為0.126 8、0.113 4、0.113 9、0.263 9、0.235 0,同種植被的Manhattan距離值顯著小于異種植被。(3)通過對(duì)苔草、泥蒿、蘆葦、辣蓼與柳樹5種植被光譜反射率(R)進(jìn)行數(shù)學(xué)變換發(fā)現(xiàn),采用LOG(1/R)變換后的Manhattan值分別為0.945 6、0.609 9、0.525 6、0.952 8、1.036 5,顯著大于d(R)與 d[LOG(1/R)]變換方法后的Manhattan值,表明LOG(1/R)變換方法對(duì)這5種植被的識(shí)別效果優(yōu)于d(R)與 d[LOG(1/R)]方法。
高光譜特征波段;濕地植被;置信區(qū)間;東洞庭湖
濕地是地球表面重要的生態(tài)系統(tǒng)之一,如何高效監(jiān)測及進(jìn)行濕地信息提取意義重大[1]。濕地植被是濕地生態(tài)系統(tǒng)的重要組成部分,自然也成了研究的重點(diǎn)。
近年來,隨著高光譜技術(shù)的不斷發(fā)展,其硬件設(shè)備已經(jīng)日趨成熟,這使得遙感數(shù)據(jù)的光譜分辨率大幅提高,同時(shí)有效提高了地物識(shí)別能力[2]。很多學(xué)者利用高光譜數(shù)據(jù)進(jìn)行地物識(shí)別并取得了較好的結(jié)果[3-4],如2005年宮鵬等人[5]使用實(shí)測的高光譜數(shù)據(jù)識(shí)別幾種主要的針葉樹種,證明了高光譜數(shù)據(jù)識(shí)別樹種的能力較強(qiáng);2010年王志輝等[6]利用實(shí)測的4個(gè)樹種葉片光譜,通過計(jì)算歐式距離平均值,有效識(shí)別了4個(gè)樹種。高光譜數(shù)據(jù)雖然能精細(xì)識(shí)別不同地物間的差異,但數(shù)據(jù)量巨大給數(shù)據(jù)處理和分析帶來困難[7],因此不同地物間敏感波段的選擇成為了高光譜數(shù)據(jù)運(yùn)用的重要環(huán)節(jié)[8-9]。2005年劉秀英等[10]利用地物光譜儀對(duì)杉木、雪松、小葉樟和桂花4個(gè)樹種進(jìn)行高光譜數(shù)據(jù)測量,證明了特征波段對(duì)樹種的識(shí)別有效可行。2009年張睿等[11]提出了一種基于一對(duì)一多類策略的支持向量機(jī)遞歸特征約減算法(SVM-RFE),并利用該算法有效篩選出特征波段。結(jié)合光譜反射率均值置信區(qū)間估計(jì)進(jìn)行高光譜特征選擇,是近些年由陳永剛等[12]提出的一種波段選擇方法,利用該方法有效識(shí)別了雷竹、柏木和無患子3種植被。
濕地植被由于受水分影響較大,基于實(shí)測高光譜數(shù)據(jù)均值置信區(qū)間的方法,是否適用于濕地植被的識(shí)別,能否獲得前人研究中同樣的效果還未有具體的研究。為深入探討此方法在濕地植被識(shí)別中的效果及可推廣性,此次研究根據(jù)均值置信區(qū)間進(jìn)行波段選擇,結(jié)合Manhattan距離法做進(jìn)一步的研究。
研究區(qū)為湖南東洞庭湖,地處湖南省東北部岳陽市境內(nèi),位于長江中下游荊江江段南側(cè),北緯 28°59′~ 29°38′, 東 經(jīng) 112°43′~ 113°15′。 于2011年9月20日至9月28日對(duì)東洞庭湖典型濕地植被進(jìn)行野外實(shí)地高光譜數(shù)據(jù)采集。
1.2 觀測對(duì)象
選取的觀測對(duì)象是東洞庭湖典型的5種濕地植被,即苔草Carex、泥蒿Artemisia、蘆葦Phragmites communis、辣蓼Polygonum hydropiper及柳樹Salix babylonica。
1.3.1 試驗(yàn)設(shè)計(jì)
采集苔草、泥蒿、蘆葦、柳樹與辣蓼5種植被的冠層高光譜數(shù)據(jù),求得每種植被30組試驗(yàn)樣本的均值,對(duì)光譜反射率(R)進(jìn)行一階微分d(R)、倒數(shù)的對(duì)數(shù)LOG(1/R)及其一階微分d[LOG(1/R)]變換[13],剔除兩兩植被類型均值置信區(qū)間帶重合率高的波段,實(shí)現(xiàn)有效降維,同時(shí)優(yōu)選出能識(shí)別5種濕地植被的特征波段,最后利用Mahanttan距離評(píng)價(jià)識(shí)別的效果。
1.3.2 試驗(yàn)儀器
高光譜測定采用美國 ASD 公司的 Field Spec 3 背掛式野外高光譜輻射儀,光譜范圍為350~2 500 nm,其中 350~1 000 nm 和 1000~2 500 nm 的光譜分辨率分別為3 nm 和10 nm,光譜采樣間隔分別為1.4 nm 和 2 nm,數(shù)據(jù)輸出時(shí)重采樣間隔為1 nm,光纖前視場角為25°。
1.3.3 數(shù)據(jù)采集
所有的光譜測定均選擇在晴朗無云、無風(fēng)、光照條件較好時(shí)進(jìn)行,測定時(shí)間為10:00~14:00(太陽高度角大于45°),此時(shí)陽光幾乎直射。高光譜數(shù)據(jù)采集時(shí),必須保持探頭垂直向下。為使數(shù)據(jù)具有代表性,采集的樣點(diǎn)地均勻分布于東洞庭湖。5種植被各采集40條數(shù)據(jù),共采集數(shù)據(jù)200條(如表1所示)。
表1 采集的數(shù)據(jù)Table 1 Collected data
1.4.1 數(shù)據(jù)預(yù)處理
首先采用S.Golay函數(shù)進(jìn)行平滑濾波處理[14],消除光譜曲線上存在的噪聲毛刺。由于光譜儀在近紅外區(qū)間的光譜分辨率為10 nm,本研究將光譜數(shù)據(jù)全部重采樣成10 nm,重采樣后的數(shù)據(jù)在一定程度上降低了可見光波譜的分辨率,同時(shí)抑制了高頻噪聲對(duì)數(shù)據(jù)的影響[15],降低數(shù)據(jù)處理的難度。最后對(duì)光譜反射率(R)進(jìn)行一階微分變換d(R)、倒數(shù)的對(duì)數(shù)變換LOG(1/R)及其一階微分變換d[LOG(1/R)],得到的結(jié)果如圖1~4所示。
1.4.2 數(shù)據(jù)降維
研究主要采用基于反射率均值置信區(qū)間方法[12]對(duì)濕地植被高光譜數(shù)據(jù)進(jìn)行降維處理。其基本原理如下:
根據(jù)統(tǒng)計(jì)學(xué)原理,如果樣本容量足夠大時(shí),所有隨機(jī)分布的均值皆收斂于正態(tài)分布[16]。在1-α置信水平下,波段i光譜反射率均值μi置信區(qū)間與置信水平α的關(guān)系為式(1)所示。
圖1 反射率Fig.1 Ref l ectivity
圖2 一階微分Fig.2 First order differential of ref l ectivity
圖3 倒數(shù)的對(duì)數(shù)Fig.3 The reciprocal of the logarithm
圖4 倒數(shù)對(duì)數(shù)的一階微分Fig.4 The fi rst derivative for the reciprocal of the logarithm
式中:為第i個(gè)波段n次測量的光譜反射率的平均值;Si為樣本標(biāo)準(zhǔn)差;α為顯著性水平。光譜
特征選擇是從原始特征中按照應(yīng)用要求抽取出一個(gè)特征子集,能夠有效描述光譜特征的獨(dú)特信息并實(shí)現(xiàn)降維[17]。所有波段(350~2 500 nm)的光譜反射率均值置信區(qū)間構(gòu)成了置信區(qū)間帶。基于光譜反射率均值置信區(qū)間帶篩選植被特征波段的原理如圖5所示。
圖5 原理圖Fig.5 Vegetation characteristics of band
從圖5可以看出,波段區(qū)間[a,b]與[c,d]中,兩植被光譜反射率值置信區(qū)間帶重合率高,不適用于植被識(shí)別,故剔除。通過剔除均值置信區(qū)間帶重疊率高的波段,篩選出最佳的植被區(qū)分波段,同時(shí)達(dá)到降維的目的。
運(yùn)用均值置信區(qū)間帶的特征選擇方法,分別求得5種植被4種變換方法的置信區(qū)間帶,結(jié)果如圖6~9所示。
圖6 反射率Fig.6 Ref l ectivity
圖7 一階微分Fig.7 The fi rst derivative of the ref l ectivity
圖8 倒數(shù)的對(duì)數(shù)Fig.8 The reciprocal of the logarithm
圖9 倒數(shù)對(duì)數(shù)的一階微分Fig.9 The fi rst derivative for the reciprocal of the logarithm
從圖6、圖8可以看出,5種典型濕地植被類型中,辣蓼與其它4種植被類型差異顯著,最易被區(qū)分;苔草與蘆葦?shù)墓庾V值差異較小,光譜曲線的置信區(qū)間帶幾乎重合,不易區(qū)分;5種植被的R值及l(fā)og(1/R)值較為分散,識(shí)別效果較好,其中l(wèi)og(1/R)變換后的值識(shí)別效果最佳。圖7、圖9表明:5種植被的d(R)與 d[log(1/R)]值的置信區(qū)間重合率較高,識(shí)別效果相對(duì)較差,不利于特征波段的選擇。
分析5種植被的置信區(qū)間帶數(shù)據(jù),剔除5種植被類型中兩兩植被置信區(qū)間帶重合率超過95%的波段,得出特征波段為680、760、870、1 570、2 030 nm(其中680、760、870、1 570、2 030 nm表示的是10 nm間隔重采樣后的中心波長位置)。
運(yùn)用Manhattan距離法評(píng)價(jià)特征波段對(duì)5種植被的識(shí)別效果,分別計(jì)算5種植被的Manhattan距離值(如表2所示)。
由表2分析可知,苔草、泥蒿、蘆葦、辣蓼與柳樹5種植被,同種植被的Manhattan值與異種植被的Manhattan距離值比較可發(fā)現(xiàn),同種植被的Manhattan距離值顯著小于異種植被,如表2中標(biāo)記為#的數(shù)據(jù)所示。同時(shí)可發(fā)現(xiàn):兩種植被之間的Manhattan距離值,不管是以哪種植被為檢驗(yàn)樣本,哪種植被為試驗(yàn)樣本,計(jì)算結(jié)果都較為接近,如表2帶*符號(hào)所示,表明本研究的方法較為可靠。
分析表2辣蓼的數(shù)據(jù)可發(fā)現(xiàn),辣蓼與苔草、泥蒿、蘆葦、柳樹的Manhattan距離值顯著大于其它4種植被,如表2中第4行數(shù)據(jù)及帶**符號(hào)的數(shù)據(jù)所示。其中0.653 9**小于該行其它值,是因?yàn)?.653 9是辣蓼檢驗(yàn)樣本與試驗(yàn)樣本的Manhattan值,屬于同種植被的Manhattan距離,0.889 4、0.757 3、0.952 8、0.900 0是辣蓼與其它植被,即異種植被的Manhattan值??傊鞭づc其它4種植被的Manhattan距離值大,說明辣蓼與其它植被差異大,容易區(qū)分。
表2 5種植被特征波段Manhattan距離值Table 2 Manhattan distance values of five vegetation characteristic bands
此次研究通過對(duì)5種植被的4種數(shù)學(xué)變換數(shù)據(jù)比較分析發(fā)現(xiàn),各植被經(jīng)過LOG(1/R)變換方法的Manhattan距離值均顯著大于其它變換方法,如表2中加粗標(biāo)記的數(shù)據(jù),表明經(jīng)過LOG(1/R)變換后的5種植被之間的差異最大,識(shí)別效果最佳,原始光譜反射率(R)次之。d(1/R)與d(LOG(1/R))變換,由于引入了大量噪聲,降低了信噪比,5種植被的Manhattan距離值小,識(shí)別效果較差。
通過均值置信區(qū)間估計(jì)優(yōu)選特征波段,運(yùn)用Manhattan距離法檢驗(yàn)特征波段,并區(qū)分不同植被的效果,其結(jié)果表明所選擇的波段能很好地識(shí)別5種典型濕地植被類型,主要結(jié)論有:
(1)提出了一種基于均值置信區(qū)間帶篩選東洞庭湖5種典型植被類型間最佳波段的方法,通過這種方法能有效選擇出識(shí)別東洞庭湖5種典型植被的特征波段,達(dá)到了高光譜降維的目的。
(2)同一植被類型的檢驗(yàn)樣本和光譜基準(zhǔn)數(shù)據(jù)(植被試驗(yàn)樣本)之間的Manhattan距離顯著小于不同植被類型間的Manhattan距離,說明Manhattan距離法可以有效識(shí)別不同濕地植被類型。
(3)通過對(duì)實(shí)測光譜反射率進(jìn)行了一階微分、倒數(shù)的對(duì)數(shù)等變換以更好地進(jìn)行高光譜數(shù)據(jù)降維及分類,其中倒數(shù)的對(duì)數(shù)變換方法對(duì)于濕地植被而言識(shí)別效果最好,一階微分則不利于特征波段的選擇。
[1] 孫 巖.濕地植物高光譜特征分析與物種識(shí)別模型構(gòu)建[D].北京:清華大學(xué),2008.
[2] Salehia B, Zoej M J V. Remote Sens[J]. Environ., 2002,36:332-337.
[3] 譚炳香.高光譜遙感森林類型識(shí)別及其郁閉度定量估測研究[D].北京:中國林業(yè)科學(xué)研究院,2006:1-130.
[4] 吳 見,彭道黎.高光譜遙感林業(yè)信息提取技術(shù)研究進(jìn)展[J].光譜學(xué)與光譜分析,2011,31(9):2305-2312.
[5] 宮 鵬,浦瑞良,郁 彬.不同季相針葉樹種高光譜數(shù)據(jù)識(shí)別分析[J].遙感學(xué)報(bào),1998,2(3):211-217.
[6] 王志輝,丁麗霞.基于葉片高光譜特性分析的樹種識(shí)別[J].光譜學(xué)與光譜分析,2010,30(7):1825-1829.
[7] 童慶禧,張 兵,鄭蘭芬.高光譜遙感——原理、技術(shù)與應(yīng)用[M].北京:高等教育出版社,2006:6.
[8] 劉秀英,臧 卓,孫 華,等.基于高光譜數(shù)據(jù)的杉木和馬尾松識(shí)別研究[J].中南林業(yè)科技大學(xué)學(xué)報(bào),2011,31(11):30-33.
[9] 張良培,鄭蘭芬,童慶禧. 利用高光譜對(duì)生物變量進(jìn)行估計(jì)[J].遙感學(xué)報(bào), 1997, 1(2):111.
[10] 劉秀英,林 輝,熊建利,等.森林樹種高光譜波段的選擇[J].遙感信息,2005,(4):41-44.
[11] 張 睿,馬建文.一種SVM-RFE高光譜數(shù)據(jù)特征選擇算法[J].武漢大學(xué)學(xué)報(bào),2009,34(7):834-837.
[12] 陳永剛,丁麗霞,葛宏立,等.基于反射率均值置信區(qū)間帶的高光譜特征波段選擇與樹種識(shí)別[J].光譜學(xué)與光譜分析,2011, 31(9):2462-2466.
[13] 盧艷麗,白由路,楊俐蘋,等.基于高光譜的土壤有機(jī)質(zhì)含量預(yù)測模型的建立與評(píng)價(jià)[J].中國農(nóng)業(yè)科學(xué),2007,40(9):1989.
[14] 蔡天凈,唐 瀚.Savitzky-Golay 平滑濾波器的最小二乘擬合原理綜述[J].數(shù)字通信,2011,(1):63-68.
[15] 浦瑞良,宮 鵬.高光譜遙感及其應(yīng)用[M].北京:高等教育出版社,2000:144-174.
[16] Lipschutz S, Lipson M. Schaum’s Outline of Theory and Problems of Probability: Schaum’s Outline Series,2000.
[17] 蘇紅軍, 杜培軍. 高光譜數(shù)據(jù)特征選擇與特征提取研究[J].遙感技術(shù)與應(yīng)用,2006, 21(4): 288-293.
Hyper-spectral characteristic band selection for wetland vegetation based on mean conf i dence interval
QIU Lin, LIN Hui, ZANG Zhuo, SUN Hua, MO Deng-kui
(Research Center of Forest Remote Sensing & Information Engineering , Central South University of Forestry & Technology,Changsha 410004 , Hunan , China)
By taking fi ve kinds of typical wetland vegetations (Carex, Artemisia mud, reeds, Polygonum and willow) in the East Dongting Lake as the studied objects, the characteristic bands of the tested vegetations were picked out using conf i dence interval estimation principle. The vegetation identif i cation effects were examined by employing Manhattan distance method. The results show that (1) After removed the high repetition rate bands of two-two vegetation conf i dence interval, the center wavelength of the characteristic bands were obtained being 680, 760,870, 1 570, 2 030 nm; (2) The Manhattan distance of the spectral ref l ectance values for Carex, Artemisia mud, reeds, Polygonum and willow were 0.126 8, 0.113 4, 0.113 9, 0.263 9, 0.235 0, the same plant species’ Manhattan distance values were signif i cantly less than the values of heterogeneous vegetations; (3) Through mathematical manipulation of the ref l ectivity of Carex, Artemisia mud, reeds, Polygonum and willow,the Manhattan values transformed by LOG (1/R) method were: 0.945 6, 0.609 9, 0.525 6, 0.952 8, 1.036 5, they were signif i cantly greater than that by d (R) and d [LOG (1 / R)] transformation methods. It is found that the recognition effect of LOG (1/R) transformation method for the fi ve vegetations is better than d (R) and d [LOG (1/R)] methods.
hyper-spectral characteristic band; wetland vegetation; conf i dence interval; East Dongting Lake
S771.8
A
1673-923X(2013)01-0041-05
2012-10-15
國家重大專項(xiàng)項(xiàng)目(E0305/1112/02):“高分濕地資源應(yīng)用監(jiān)測示范”;“十二五”國家高技術(shù)研究發(fā)展計(jì)劃(863計(jì)劃)課題(2012AA102001):“數(shù)字化森林資源監(jiān)測關(guān)鍵技術(shù)研究”;林業(yè)公益性行業(yè)科研專項(xiàng)(201104028):“林分結(jié)構(gòu)與生長模擬技術(shù)研究”;湖南省高校科技成果產(chǎn)業(yè)化培育項(xiàng)目(11CY019)
邱 琳(1988-),女,江西吉安人, 碩士研究生,研究方向:林業(yè)遙感和地理信息系統(tǒng);E-mail:609556486@qq.com
林 輝(1965-),女,湖北黃崗人,教授,博士,博士生導(dǎo)師,主要從事森林經(jīng)理學(xué)、遙感技術(shù)與地理信息系統(tǒng)的教學(xué)與科研工作
[本文編校:謝榮秀]