• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      特征變量選擇結(jié)合SVM的耕地土壤Hg含量高光譜反演

      2022-01-26 01:59:44郭云開張思愛王建軍謝曉峰
      測繪工程 2022年1期
      關(guān)鍵詞:波段特征提取光譜

      郭云開,張思愛,王建軍,章 瓊,謝曉峰

      (1.長沙理工大學(xué) 交通運輸工程學(xué)院,長沙 410076; 2.長沙理工大學(xué) 測繪遙感應(yīng)用技術(shù)研究所,長沙 410076; 3.清遠(yuǎn)市土地整理中心,廣東 清遠(yuǎn) 511518;4.廣州城建職業(yè)學(xué)院 建筑工程學(xué)院,廣州 510925)

      隨著工業(yè)化城鎮(zhèn)化的快速發(fā)展,土壤重金屬污染問題變得日益顯著[1-2]。汞作為一種毒性極強的金屬,對環(huán)境與生態(tài)系統(tǒng)的持續(xù)性、嚴(yán)重性危害已引起全球性的關(guān)注。傳統(tǒng)的土壤重金屬含量監(jiān)測方法精度高,但費時費力且難以實現(xiàn)大面積重金屬含量動態(tài)監(jiān)測[3-5]。高光譜技術(shù)具有無損、高效、低成本等優(yōu)點,為快速獲取土壤重金屬信息提供有效手段,引起國內(nèi)外學(xué)者對土壤重金屬高光譜反演的廣泛研究。

      Kooristra L等通過對萊茵河區(qū)域進行土壤重金屬Zn,Cd含量反演,發(fā)現(xiàn)偏最小二乘回歸模型能夠獲得較好的精度[6]。涂宇龍等通過主成分分析(PCA)與皮爾森相關(guān)系數(shù)(PCC)提取重金屬銅元素的特征波段,并運用逐步回歸法進行建模,發(fā)現(xiàn)PCA特征提取能有效提升土壤Cu含量預(yù)測精度[7]。滕靖等通過對西范坪礦區(qū)土壤Cu元素進行研究,利用逐步回歸法和皮爾遜相關(guān)系數(shù)分別提取土壤Cu的特征波并組成特征變量集,取得較好的預(yù)測效果[8]。袁自然等利用競爭性自適應(yīng)重加權(quán)算法進行光譜粗選,并通過PSO -SVM對土壤砷(As)含量估算研究,結(jié)果表明,基于優(yōu)化后的SVM模型預(yù)測精度具有明顯提高[9]。

      雖然對于土壤重金屬已有大量研究,但由于土壤重金屬與原始光譜反射率敏感性弱,且光譜數(shù)據(jù)冗余等因素,導(dǎo)致反演精度不高,對數(shù)據(jù)進行降維在一定程度上能有效提高模型精度。不同特征變量提取方法所得變量有所不同,其模型精度也會受到影響[10]。目前,已有研究中光譜特征變量提取方式和反演模型都有待進一步改進。

      文中針對土壤重金屬光譜特征弱和光譜數(shù)據(jù)冗余問題,以湖南省衡東縣某工業(yè)區(qū)周邊耕地為對象開展土壤重金屬Hg的高光譜估算模型研究。首先對原始光譜數(shù)據(jù)進行預(yù)處理,利用一階微分(FD)、二階微分(SD)、倒數(shù)對數(shù)(RL)和多元散射校正(MSC)進行光譜變換,分別與重金屬Hg元素進行相關(guān)性分析選取最優(yōu)變換光譜,再利用迭代保留信息變量法((Iteratively Retains Informative Variables,IRIV)、皮爾森相關(guān)系數(shù)(PCC)和隨機蛙跳算法(Random frog)進行光譜特征選取,分別建立SVM與GWO-SVM土壤重金屬Hg含量高光譜反演模型,找出最優(yōu)反演路徑,提高預(yù)測精度。

      1 數(shù)據(jù)與方法

      1.1 研究區(qū)概況與數(shù)據(jù)獲取

      衡東縣位于衡陽市東北部地區(qū)中心城鎮(zhèn),地貌主要以丘陵為主,氣候溫和濕潤,雨量充沛,交通便利,地理位置優(yōu)越。近年來,隨著農(nóng)業(yè)生產(chǎn)結(jié)構(gòu)調(diào)整,形成以茶油、油菜為主的多個產(chǎn)業(yè)種植帶。此外,研究區(qū)工業(yè)發(fā)達,具有大量工業(yè)企業(yè),且以化工、重金屬等產(chǎn)業(yè)為主,使當(dāng)?shù)厣鷳B(tài)環(huán)境受到了嚴(yán)峻挑戰(zhàn)。因此,對研究區(qū)耕地土壤重金屬污染情況的研究已迫在眉睫。本次試驗研究于2019年6月進行,每個樣本實地采集以“S”型曲線確定5個土壤樣點,共采集88個樣本。土壤樣本采集過程中,對土壤樣品進行密封、標(biāo)記等處理。實驗分析前,將土壤樣品在陽光下自然風(fēng)干,研磨并剔除土壤中雜質(zhì),最后使用100目尼龍篩過濾。對每個土壤樣本分別通過化學(xué)方法測定土壤重金屬Hg含量和使用AvaField-3波譜儀(波段范圍為300~2 500 nm)進行土壤高光譜采集。土壤Hg含量的描述性統(tǒng)計結(jié)果如表1所示。

      表1 土壤Hg含量描述性統(tǒng)計

      1.2 數(shù)據(jù)預(yù)處理與相關(guān)性分析

      光譜采集過程中易受儀器噪聲、水分、環(huán)境等因素影響,導(dǎo)致光譜曲線含有較多噪聲,影響土壤重金屬預(yù)測精度[11]。本次研究去除邊緣噪聲較大的土壤光譜波段300~400 nm和2 300~2 500 nm,并對原始光譜數(shù)據(jù)(400~2 300 nm)進行SG平滑處理,通過10 nm重采樣(RS)對光譜信息進行數(shù)據(jù)降維,采用FD、SD、RL和MSC等光譜變換處理,使土壤光譜特征更明顯。運用SPSS軟件對以上光譜數(shù)據(jù)與土壤重金屬Hg含量進行相關(guān)性分析,如圖1所示。RS與Hg的相關(guān)性總體呈正相關(guān)且相關(guān)性不明顯,RL則呈負(fù)相關(guān)且相關(guān)性略有提高,F(xiàn)D和SD與Hg的相關(guān)性 900 nm波段以后普遍較低。綜上可見,F(xiàn)D光譜變換相關(guān)性提升效果最佳,在580~1 030 nm、1 800~2 080 nm波段相關(guān)性總體較好,且在1 810 nm相關(guān)性值最高為0.394。因此,文中選取FD變換光譜作為后續(xù)特征波段提取研究。

      1.3 研究方法

      1.3.1 迭代保留信息變量法

      IRIV是一種新型的特征變量提取方法,利用變量的隨機組合進而考慮到變量之間的相互作用,將變量劃分為強信息變量、弱信息變量、無信息變量和干擾信息變量[12-13]?;静襟E主要將m個樣本n維變量的一階微分變換光譜數(shù)據(jù)轉(zhuǎn)換為含有相同數(shù)量的0和1矩陣X,其中1和0表示變量是否用于建模,通過交叉驗證均方根誤差(RMSECV)去評估包含任意變量i和未包含i在模型中的重要性?;诿總€變量的重要性程度進行算法迭代,直到只剩下強信息變量和弱信息變量的新變量子集P。通過對變量集P進行反向消除策略,最終獲得最優(yōu)特征變量。

      圖1 光譜數(shù)據(jù)與Hg元素相關(guān)性分析

      1.3.2 隨機蛙跳算法

      隨機蛙跳是一種對高維變量數(shù)據(jù)進行特征選擇的新方法,其利用少量變量迭代進行建模,并輸出每個變量選擇的可能性,根據(jù)不同需求選取可能性較大的變量作為特征變量[14]。其主要步驟如下:

      1)隨機初始化包含Q個變量,得到一個變量集V0。

      2)通過初始變量集V0提出一個包含Q*個變量的候選變量集V*,根據(jù)一定的概率選擇V*作為V1,并利用V1替換V0。通過循環(huán)此步驟,直至完成N次迭代結(jié)束。

      3)計算每個變量的選擇概率,該概率可以用作變量重要性的度量。

      1.3.3 皮爾森相關(guān)系數(shù)

      皮爾森相關(guān)系數(shù)(PCC)是一種普遍使用的線性相關(guān)系數(shù),一般使用r表示。它能夠反映兩個變量X和Y的線性相關(guān)程度,其r值為-1~1之間,絕對值越大表明相關(guān)性越強。其算式表達如下:

      (1)

      1.3.4 灰狼算法優(yōu)化支持向量機

      支持向量機是Vapnik提出的一種基于統(tǒng)計學(xué)理論的新型的機器學(xué)習(xí)方法,其常用于小樣本的非線性問題[15]。灰狼優(yōu)化算法(Grey Wolf Optimizer,GWO)是Mirjalili等受灰狼捕食啟發(fā)在2014年提出的一種新型群體智能優(yōu)化算法[16]。文中采用GWO算法對SVM懲罰因子c和核函數(shù)參數(shù)g進行尋優(yōu),灰狼優(yōu)化算法利用狼群嚴(yán)格的等級制度(α,β,δ和ω),不斷更新各等級狼群位置尋找獵物,獲取全局最優(yōu)解。其算法步驟流程如下:

      1)初始化參數(shù):狼群數(shù)量n=20,最大迭代次數(shù)N=400,設(shè)定懲罰因子c和核函數(shù)參數(shù)g的取值范圍。

      2)隨機生成灰狼群,每頭狼個體位置受參數(shù)c和g影響,通過對訓(xùn)練集學(xué)習(xí)計算每頭狼相應(yīng)的適應(yīng)度值,利用適應(yīng)度值對狼群進行等級劃分,并對狼群位置進行更新。

      3)計算每頭狼在新位置的適應(yīng)度值,并與上一次迭代最優(yōu)適應(yīng)度值比較,選取最優(yōu)值,超過最大迭代次數(shù)時結(jié)束,選取全局最優(yōu)位置即為參數(shù)c和g的最優(yōu)值,否則返回第二步繼續(xù)尋優(yōu)。

      4)利用尋優(yōu)后的參數(shù)c和g進行SVM的回歸預(yù)測。

      1.4 模型精度評價與研究技術(shù)路線

      采用決定系數(shù)(R2)、均方根誤差(RMSE)和平均絕對誤差(MAE)3個指標(biāo)對兩種預(yù)測模型進行精度評價。其中決定系數(shù)R2越大,模型的預(yù)測效果越好,RMSE和MAE越小,說明預(yù)測值與實測值越接近,其模型魯棒性越高。文中研究技術(shù)路線如圖2所示。

      圖2 研究技術(shù)路線流程

      2 試驗分析

      2.1 特征波段選取

      由于高光譜數(shù)據(jù)信息波段多,數(shù)據(jù)冗余問題嚴(yán)重影響反演精度,為避免數(shù)據(jù)冗余并提高模型反演精度,文中使用IRIV、Random Frog和PCC 3種特征提取方法對FD變換光譜進行波段提取。

      IRIV算法中的交叉驗證次數(shù)為5,最大主因子為10,共有190個光譜波長變量,隨著迭代次數(shù)的增加,保留的變量會相應(yīng)的減少,其迭代保留變量數(shù)如圖3所示。本次研究共進行6次迭代,在第7次迭代時趨于飽和,每次迭代所保留變量數(shù)分別是190、82、42、25、21和20,再對剩余變量進行反向消除,最后篩選獲得16個與重金屬Hg的最優(yōu)光譜特征變量,其中強信息變量為5個,均為近紅外變量(1 040 nm、1 990 nm、2 220 nm、2 240 nm、2 280 nm),弱信息變量為11個,其中可見光變量2個(600 nm、620 nm),近紅外變量9個(1 000 nm、1 090 nm、1 560 nm、1 590 nm、1 610 nm、1 620 nm、1 730 nm、2 100 nm、2 110 nm)。

      Random Frog算法根據(jù)每個變量具有不同的選擇概率對光譜變量進行提取,其變量選擇概率如圖4所示,變量數(shù)在120左右(對應(yīng)光譜波段1 590 nm),選擇概率達到最高。本次研究通過提取選擇可能性排名前10的光譜變量作為特征波段,其全部集中在近紅外波段(1 030 nm、1 040 nm、1 320 nm、1 340 nm、1 590 nm、1 780 nm、1 940 nm、1 960 nm、2 080 nm和2 180 nm)。

      利用皮爾森相關(guān)系數(shù)對重金屬Hg含量與一階微分變換光譜進行相關(guān)性分析如圖5所示,當(dāng)顯著性水平P<0.05和P<0.01時,其相關(guān)系數(shù)在0.208和0.273時為顯著相關(guān)和極顯著相關(guān)。文中通過選取顯著性水平P<0.01的光譜變量作為特征波段,在1 810 nm處達到最大相關(guān)值0.394;其特征波段為690 nm、740 nm、770 nm、790 nm、810 nm、840 nm、880 nm、900 nm、920 nm、970 nm、1 010 nm、1 020 nm、1 030 nm、1 520 nm、1 530 nm、1 540 nm、1 810 nm、1 870 nm、1 880 nm、1 900 nm、1 910 nm、1 920 nm、1 930 nm、1 940 nm、1 970 nm、2 000 nm、2 040 nm、2 050 nm、2 080 nm和2 200 nm。

      圖3 IRIV迭代保留變量數(shù)

      圖4 Random Frog特征波段提取

      圖5 Hg含量與FD變換光譜相關(guān)性

      2.2 SVM回歸預(yù)測

      本次試驗利用3種特征提取方法分別提取土壤重金屬Hg含量光譜特征波段,通過以上研究可得,IRIV、Random Frog和PCC分別提取16、10和30個特征波段用于建模。本次實驗共采集88個樣本,其中選取60個作為建模樣本,其余28個作為驗證樣本,利用特征波段作為光譜參量,建立SVM土壤重金屬含量反演模型。采用決定系數(shù)、均方根誤差和平均絕對誤差綜合評價兩種模型性能,如表2所示。其中基于PCC特征提取的建模集R2為0.835,RMSE為0.091,MAE為0.018,驗證集R2為0.833,RMSE為0.086,MAE為0.017,模型預(yù)測效果最好;基于Random Frog特征提取的建模集R2為0.804,RMSE為0.094,MAE為0.017,驗證集R2為0.654,RMSE為0.118,MAE為0.018,模型預(yù)測效果相對較差;基于IRIV特征提取的建模集R2為0.767,RMSE為0.097,MAE為0.018,驗證集R2為0.778,RMSE為0.093,MAE為0.018,模型預(yù)測效果較好;SVM模型實測值與預(yù)測值散點圖如圖6(a)、圖6(c)、圖6(e)所示。

      2.3 GWO-SVM回歸預(yù)測

      通過對一階微分變換光譜進行IRIV、Random Frog和PCC特征波段提取,利用特征波段作為自變量,土壤重金屬含量作為因變量,建立GWO-SVM回歸模型,建模結(jié)果如表3所示。其中基于IRIV特征提取的建模集R2為0.908,RMSE為0.090,MAE為0.019,驗證集R2為0.894,RMSE為0.082,MAE為0.016,模型預(yù)測效果最佳;基于Random Frog特征提取的建模集R2為0.859,RMSE為0.085,MAE為0.018,驗證集R2為0.856,RMSE為0.080,MAE為0.015,模型預(yù)測精度相對較低;基于PCC特征提取的建模集R2為0.864,RMSE為0.086,MAE為0.017,驗證集R2為0.876,RMSE為0.078,MAE為0.015,模型預(yù)測效果較好。相較于SVM回歸模型,GWO-SVM模型在IRIV和Random Frog特征提取的驗證集模型R2分別提高0.116和0.202,RMSE和MAE相應(yīng)降低;在PCC特征波段提取的驗證集模型R2略有提升,RMSE和MAE相應(yīng)降低。GWO-SVM模型估測結(jié)果如圖6(b)、圖6(d)、圖6(f)所示,從圖中可知,其實測值與預(yù)測值趨勢基本一致,說明經(jīng)過灰狼算法優(yōu)化后的支持向量機模型預(yù)測精度與穩(wěn)定性得到明顯改善,滿足實際預(yù)測要求。

      表2 SVM回歸模型驗證系數(shù)

      表3 GWO-SVM回歸模型驗證系數(shù)

      3 討 論

      本次實驗主要針對耕地土壤重金屬Hg含量高光譜估算研究,通過重金屬Hg含量與變換光譜數(shù)據(jù)進行相關(guān)性分析可得,一階微分光譜變換與Hg元素相關(guān)性整體最優(yōu),這是由于微分技術(shù)能夠較好去除光譜曲線漂移現(xiàn)象和部分線性的背景干擾,更好地提高光譜與重金屬之間敏感光譜特征參數(shù)[17]。 對比3種特征波段提取方法,IRIV的復(fù)雜程度較高且運算時間較長,在波段數(shù)量上,IRIV、Random Frog和PCC方法分別提取16、10和30個特征波段,在很大程度上減少數(shù)據(jù)冗余。此外,對比3種方法提取下的光譜特征波段,主要分布在近紅外波段,少量在可見光波段,說明Hg元素的光譜敏感波段主要分布在近紅外波段。在模型上,通過灰狼算法對支持向量機的核函數(shù)g和懲罰因子c進行優(yōu)化,對比未優(yōu)化的支持向量機回歸模型,在一定程度上提高回歸模型的預(yù)測精度和穩(wěn)定性。在建模結(jié)果上,基于IRIV特征提取下的GWO-SVM模型建模效果最優(yōu),其驗證集R2為0.894,RMSE為0.082,MAE為0.016。說明IRIV特征提取能夠有效去除無信息變量和干擾信息變量保留強信息變量和弱信息變量,降低模型誤差,提高模型預(yù)測精度。綜上可得,IRIV結(jié)合GWO-SVM模型能夠快速準(zhǔn)確預(yù)測土壤重金屬含量。

      (a)IRIV-SVM

      (b)IRIV-GWO-SVM

      (c)Random-Frog-SVM

      (d)Random-Frog-GWO-SVM

      (e)PCC-SVM

      (f)PCC-GWO-SVM

      4 結(jié) 論

      文中以湖南省衡東縣某工業(yè)區(qū)周邊耕地為研究對象,通過對光譜數(shù)據(jù)與土壤Hg元素進行相關(guān)性分析,使用不同特征提取方法進行光譜特征提取,采用SVM與GWO-SVM分別構(gòu)建土壤重金屬Hg含量高光譜反演模型。結(jié)果表明:1)通過對原始光譜進行不同光譜變換處理,發(fā)現(xiàn)一階微分光譜變換后土壤光譜特征更明顯,與土壤重金屬Hg的相關(guān)性更高,在1 810 nm波段相關(guān)性值最高為0.394。2)通過IRIV、Random Frog和PCC方法分別提取16、10和30個特征波段,在很大程度上減少光譜數(shù)據(jù)冗余并保留有效變量信息,增強模型穩(wěn)定性,提高模型預(yù)測精度。(3)對比兩種模型,經(jīng)過灰狼算法優(yōu)化后的支持向量機在不同特征提取下的建模結(jié)果明顯優(yōu)于支持向量機模型,其中IRIV結(jié)合GWO-SVM模型精度最高。說明灰狼算法能夠有效增強支持向量機性能,提高模型穩(wěn)定性與預(yù)測精度,研究可為同類地區(qū)反演土壤重金屬含量提供新的參考。

      猜你喜歡
      波段特征提取光譜
      春日暖陽
      基于三維Saab變換的高光譜圖像壓縮方法
      基于Daubechies(dbN)的飛行器音頻特征提取
      電子制作(2018年19期)2018-11-14 02:37:08
      Bagging RCSP腦電特征提取算法
      M87的多波段輻射過程及其能譜擬合
      星載近紅外高光譜CO2遙感進展
      日常維護對L 波段雷達的重要性
      西藏科技(2015年4期)2015-09-26 12:12:58
      基于MED和循環(huán)域解調(diào)的多故障特征提取
      苦味酸與牛血清蛋白相互作用的光譜研究
      鋱(Ⅲ)與PvdA作用的光譜研究
      佳木斯市| 南安市| 成武县| 万载县| 南江县| 郑州市| 郎溪县| 保康县| 丹棱县| 昭通市| 布拖县| 合山市| 江门市| 清涧县| 中江县| 留坝县| 铜川市| 南充市| 龙山县| 通州市| 江华| 乌兰察布市| 兴安盟| 盘山县| 深泽县| 梁河县| 长泰县| 汾西县| 都兰县| 安阳县| 张北县| 汕尾市| 二连浩特市| 济源市| 睢宁县| 皮山县| 祁门县| 浪卡子县| 双辽市| 阳东县| 酒泉市|