王春磊,晁 暉,孫 迪
(1.河北聯(lián)合大學(xué)信息工程學(xué)院,河北唐山063009;2.北京市第三十五中學(xué),北京100031)
葉綠素濃度是海洋中重要的水質(zhì)參數(shù),其不僅與海洋生態(tài)系統(tǒng)初級(jí)生產(chǎn)力的研究密切相關(guān),而且對(duì)于海洋-大氣系統(tǒng)中碳循環(huán)、環(huán)境監(jiān)測(cè)、赤潮災(zāi)害監(jiān)測(cè)等的研究以及漁業(yè)管理都具有重要意義。海洋遙感可以實(shí)現(xiàn)大面積、實(shí)時(shí)、同步、連續(xù)及密集的海洋探測(cè),彌補(bǔ)了傳統(tǒng)方法對(duì)個(gè)別點(diǎn)、離散區(qū)域、不同時(shí)間、不同地點(diǎn)觀測(cè)的不足。因此我們可以通過(guò)遙感獲取海洋的葉綠素濃度信息,為海洋水體富營(yíng)養(yǎng)化監(jiān)測(cè)和評(píng)價(jià)提供新方法。
本文利用萊州灣海域32組2007年6月至9月現(xiàn)場(chǎng)ASD實(shí)測(cè)的遙感反射率以及對(duì)應(yīng)點(diǎn)的葉綠素濃度,研究其反射光譜特征建立遙感反演葉綠素濃度模型,為估算本海域的葉綠素濃度提供參考。
其中:RN(λi)是歸一化的水體反射率,R(λi)是原始的水體反射率,n是400~880 nm波段之間的波段數(shù)。
圖1 采樣點(diǎn)示意圖
圖2 歸一化后的實(shí)測(cè)光譜特征曲線
根據(jù)圖2可知,原始的水體反射率經(jīng)過(guò)歸一化處理之后,曲線變得相對(duì)集中,有效地抑制和消除了由于環(huán)境因素不同而對(duì)光譜曲線造成的整體性抬高或降低;同時(shí),也使光譜曲線的波峰和波谷變得更加明顯和突出。波谷出現(xiàn)在660 nm左右,波峰出現(xiàn)在560 nm左右,其中在690 nm附近形成熒光峰。
浮游植物在400 nm~800 nm太陽(yáng)光的激發(fā)下,在685 nm附近產(chǎn)生熒光效應(yīng)[1-2],它是浮游植物光合作用和生理狀態(tài)最有效的探針之一。葉綠素?zé)晒庑?yīng)為解決二類(lèi)水體葉綠素反演提供了很好的研究方向。根據(jù)水色組分的光譜特性研究結(jié)果,熒光攜帶了大量葉綠素信息而很少有其他水色信息的干擾,用熒光算法反演葉綠素有較高的反演精度。熒光位于紅光波段,受大氣氣溶膠的影響要比藍(lán)光和綠光波段小很多,大氣對(duì)熒光的影響較小。因此,通過(guò)水體反射率或遙感反射率光譜中提取太陽(yáng)光激發(fā)的葉綠素?zé)晒庑盘?hào)估算表層葉綠素濃度是目前水色遙感研究的熱點(diǎn)和新的發(fā)展方向[3-4]。
葉綠素?zé)晒夥宓奈恢秒S著葉綠素濃度的增加向長(zhǎng)波方向移動(dòng),Gitelson[5]對(duì)“紅移”現(xiàn)象的研究表明,當(dāng)葉綠素濃度小于3 mg/m3時(shí),熒光峰的位置大致在683 nm處;當(dāng)葉綠素濃度增加到10 mg/m3時(shí),熒光峰慢慢移動(dòng)到685 nm處;而當(dāng)葉綠素濃度大于100 mg/m3時(shí),熒光峰的位置在688 nm左右;達(dá)到300 mg/m3時(shí),熒光峰到達(dá)705 nm甚至更遠(yuǎn)。本次采集的數(shù)據(jù)葉綠素濃度范圍0.68 mg/m3~9.5 mg/m3,熒光峰波段大致在680 nm~700 nm之間,與Giteslon的研究基本一致。目前的熒光法主要有歸一化熒光高度法和基線熒光高度法。
歸一化熒光高度法的基本原理是通過(guò)685nm附近的熒光峰值的輻射率R685除以560 nm附近的反射峰Rmax或675 nm附近吸收谷的輻射率,得到歸一化熒光高度(Normalized Fluorescence Height,NFH),然后建立NFH與葉綠素濃度的關(guān)系模型。
基線熒光高度法是使用熒光峰左右兩側(cè)通道(λ1、λ3)的離水輻亮度的連線為基線,計(jì)算熒光通道(λ2)的離水輻亮度在基線之上的高度,稱(chēng)為基線熒光高度(Fluorescence Line Height,F(xiàn)LH),公式如下(3),葉綠素濃度的反演公式為(4):
式中:λ2為中心波長(zhǎng);λ1、λ3為選定的基線波長(zhǎng);L1、L2、L3為相應(yīng)波段對(duì)應(yīng)的輻亮度值。C為海面葉綠素濃度(單位:mg/m3);FLH為熒光基線高度值(單位:mW/(cm2·sr·nm));a,b,k為系數(shù)。
左側(cè)的基線波段選擇λ1為665 nm,基線右側(cè)λ3的選取為709 nm,這個(gè)波段兩側(cè)吸收和反射相對(duì)穩(wěn)定,避開(kāi)了730 nm水汽吸收波段和760 nm氧吸收波段以及更長(zhǎng)波段時(shí)懸浮泥沙的影響;λ2的選取為逐個(gè)點(diǎn)遙感反射率在665~709 nm區(qū)間的極值。
tere kümün ?ɡd?r(??ɡed?r)tere tuqai ü (那個(gè)人昨天就把那件事說(shuō)了)
結(jié)合實(shí)測(cè)的光譜曲線,采集所有點(diǎn)在560 nm附近的反射峰,以685 nm作為熒光峰進(jìn)行歸一化熒光法研究,建立NFH(560)同葉綠素濃度的相關(guān)關(guān)系,運(yùn)用Curveexpert曲線自動(dòng)優(yōu)化搜索,結(jié)合標(biāo)準(zhǔn)差最優(yōu),發(fā)現(xiàn)NFH與葉綠素濃度的線性關(guān)系最為符合(圖3)。通過(guò)選定的基線波段和熒光波段,利用基線熒光高度算法計(jì)算得到了32個(gè)基于實(shí)測(cè)的遙感反射率射率光譜的熒光峰高度FLH,與對(duì)應(yīng)的葉綠素濃度進(jìn)行擬合,結(jié)果如圖4:
圖3 NFH線性模型及預(yù)測(cè)
圖4 FLH線性模型及預(yù)測(cè)
支持向量機(jī)(SVM)是Vapnik等人提出的新型機(jī)器學(xué)習(xí)方法[6-7],它建立在統(tǒng)計(jì)學(xué)習(xí)理論的VC維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小原理基礎(chǔ)上,根據(jù)有限樣本信息在模型的復(fù)雜性和學(xué)習(xí)能力之間尋求最佳折衷,以期獲得最好的推廣能力[8-9]。由于SVM具有良好的推廣特性,目前已成功地應(yīng)用于函數(shù)逼近、信息融合等領(lǐng)域[10]。本文主要采用支持向量機(jī)在函數(shù)擬合中的應(yīng)用:
擬合給定數(shù)據(jù)點(diǎn)集,使函數(shù)(6)最小
懲罰函數(shù)采用ε—不靈敏損失函數(shù):
函數(shù)擬合可以表示為一個(gè)最優(yōu)問(wèn)題:
其中ε表示逼近精度ξi≧0和≧0為松弛因子,式中的第二項(xiàng)是對(duì)超出逼近精度樣本的懲罰,常數(shù)控制對(duì)錯(cuò)分樣本懲罰的程度。采用對(duì)偶理論,將其轉(zhuǎn)化為二次規(guī)劃問(wèn)題:
求解該二次規(guī)劃問(wèn)題,可得:
引入高斯核函數(shù)
其中σ是尺度函數(shù),它的取值決定擬合函數(shù)的支持度和平滑性,σ的選擇隨散亂數(shù)據(jù)點(diǎn)分布自適應(yīng)改變,散亂點(diǎn)集X的分布可以用參數(shù)Q(X)描述:
其中Ω是包圍散亂點(diǎn)集X的區(qū)域。選擇σ使Q(X)/σ=常數(shù),這樣就能保證每個(gè)節(jié)點(diǎn)函數(shù)局部擬合質(zhì)量,從而提高全局?jǐn)M合的性能。參數(shù)γ>0表示擬合誤差在代價(jià)函數(shù)中的權(quán)系數(shù)。γ越大,擬合誤差權(quán)重越大,擬合函數(shù)越逼近樣本點(diǎn)。當(dāng)γ→∞,代價(jià)函數(shù)退化為均方誤差,此時(shí)擬合函數(shù)嚴(yán)格經(jīng)過(guò)樣本點(diǎn)。即γ→∞ 表示對(duì)樣本點(diǎn)進(jìn)行插值,而γ≠∞表示對(duì)樣本點(diǎn)最佳逼近。因此選擇取決于給定散亂數(shù)據(jù)點(diǎn)的誤差和實(shí)際需要的逼近程度,這些散亂數(shù)據(jù)點(diǎn)的測(cè)量誤差可以由測(cè)量?jī)x器和測(cè)量方法等先驗(yàn)知識(shí)決定。實(shí)驗(yàn)步驟如下:
(1)特征選擇和數(shù)據(jù)縮放:本文采用R(678)/R(479)、R(600)/R(479)、R(600)/R(571)、NFH和FLH作為輸入,建立其與葉綠素濃度的對(duì)應(yīng)關(guān)系,以32個(gè)點(diǎn)作為訓(xùn)練樣本建立判別函數(shù),8個(gè)樣本點(diǎn)作為驗(yàn)證。分別對(duì)訓(xùn)練數(shù)據(jù)和驗(yàn)證數(shù)據(jù)的特征值進(jìn)行縮放,縮放后的范圍為[-1,1],目標(biāo)值不進(jìn)行縮放;
(2)參數(shù)選取:首選選擇SVM中的核函數(shù)進(jìn)行選擇,實(shí)驗(yàn)中選用的是使用最為廣泛的徑向基核函數(shù)(RBF),然后利用交叉驗(yàn)證和網(wǎng)格選參的方法進(jìn)行支持向量回歸機(jī)算法中的3個(gè)參數(shù)進(jìn)行選優(yōu),分別是懲罰參數(shù)C,RBF核函數(shù)中的參數(shù)λ,精度參數(shù)ε。實(shí)驗(yàn)中通過(guò)對(duì)不同的C=[2-1,20,21,22,23,24,25,26],λ =[20,2-1,2-2,2-3,2-4,2-5,2-6,2-7,2-8],和ε =[2-8,2-7,2-6,2-5,2-4,2-3,2-2,2-1]進(jìn)行5-折交叉驗(yàn)證的均方誤差(MSE)估計(jì),選取使MSE最小的那組參數(shù)作為最終建模的最優(yōu)參數(shù);
③構(gòu)建模型及結(jié)果評(píng)價(jià):根據(jù)選取的最優(yōu)參數(shù),訓(xùn)練樣本數(shù)據(jù),結(jié)合支持向量回歸機(jī)算法進(jìn)行模型訓(xùn)練,構(gòu)建回歸模型;根據(jù)模型訓(xùn)練構(gòu)建的模型,對(duì)驗(yàn)證樣本數(shù)據(jù)進(jìn)行結(jié)果檢驗(yàn),并選擇評(píng)價(jià)指標(biāo)對(duì)驗(yàn)證結(jié)果進(jìn)行評(píng)價(jià),實(shí)驗(yàn)中選取的評(píng)價(jià)指標(biāo)為均方誤差(MSE)和相關(guān)系數(shù)平方(R2)。
參量選取:懲罰參數(shù)C 64;核函數(shù)-高斯核函數(shù)參數(shù)0.015625;精度參數(shù)0.5。網(wǎng)格選優(yōu)的最優(yōu)參數(shù)對(duì)應(yīng)的訓(xùn)練精度0.920607;訓(xùn)練樣本數(shù)32;驗(yàn)證樣本8;特征數(shù)2;驗(yàn)證結(jié)果評(píng)價(jià):訓(xùn)練模型評(píng)價(jià)R2=0.851362;均方誤差0.861364;預(yù)測(cè)R2=0.8307。
表1 熒光模型及SVM擬合誤差評(píng)價(jià)
本文建立了萊州灣葉綠素濃度反演的新方法,對(duì)32組實(shí)測(cè)光譜水體反射率歸一化后根據(jù)葉綠素的熒光特征建立NFH和FLH反演模型,以及結(jié)合光譜拐點(diǎn)值的比值模型和熒光模型建立SVM算法,用剩下8條光譜曲線進(jìn)行模型驗(yàn)證。發(fā)現(xiàn)NFH和FLH模型中FLH誤差較小,SVM算法則達(dá)到最小??隙死萌~綠素?zé)晒馓匦蕴綔y(cè)葉綠素濃度的有效性,同時(shí)說(shuō)明了SVM采用結(jié)構(gòu)風(fēng)險(xiǎn)最小化準(zhǔn)則的特性能有效地對(duì)葉綠素光譜特性進(jìn)行擬合,并在二類(lèi)水體葉綠素濃度反演、水質(zhì)監(jiān)測(cè)等方面有良好的應(yīng)用前景,并為以后利用NFH和FLH組合來(lái)反演葉綠素濃度提供參考。
[1] 朱延彬,吳燕燕.天然葉綠素?zé)晒馓匦匝芯浚跩].光譜學(xué)與光譜分析,1995,15(2):5-8.
[2] Neville R A,Gower JFR.Passive remote sensing of phytoplankton via chlorophyll-alpha florescence[J].Journal ofGeophysicalResearch.1977,82 (24):3487-3493.
[3] Maxwell K.,Johnson G.N.Chlorophyll fluorescence-a practical guide[J].Journal of Experimental Botany.2000,51:659-668.
[4] Xing X G,Zhao D Z,etc.An overview of Remote Sensing of Chlorophyll Fluorescence[J].Ocean Science Journal,2007,Vol.42,No.1:49-59.
[5] Gitelson AA.Algorithms for Remote Sensing of phytoplankton pigments in land waters[J].Advanced Space Research,1993,13:197-201.
[6]Vapnik V.The Nature of Statistical Learning Theory[M].New York:Springer,1995.
[7]Vapnik V.Statistical Learning Theory[M].New York:Wilcy,1998.
[8]崔偉東,周志華,李星.支持向量機(jī)研究[J].計(jì)算機(jī)工程與應(yīng)用.2001,37(1):57-61.
[9] Snykons JA,etc.Sighted least squares support vectormachines:robustness and sparse approximation[J].Neurocomputing,2002;48:85-105.
[10] 閻輝,張學(xué)工,李衍達(dá).支持向量機(jī)與最小二乘法關(guān)系研究[J].清華大學(xué)學(xué)報(bào)(自然科版).2001,41(9):77-80.