沈蘭芝,高懋芳,閆敬文,姚艷敏
(1. 汕頭大學工學院,廣東汕頭515063;2. 中國農業(yè)科學院農業(yè)資源與農業(yè)區(qū)劃研究所/農業(yè)農村部農業(yè)遙感重點實驗室,北京100081)
土壤有機質(Soil Organic Matter,SOM)是土壤肥力的重要指標,不僅能為作物提供養(yǎng)分,改善土壤物理性質,還具有保水和保肥的作用[1]。因此,SOM 的快速、準確估測對糧食產量提高、農業(yè)可持續(xù)發(fā)展具有重要意義。傳統(tǒng)的SOM 估測方法一般成本高,比較耗時、費力,并且估測結果還具有一定滯后性,很難滿足當前生產管理的需要。高光譜分析技術的發(fā)展,給土壤研究帶來了許多新的方法。很多國內外研究者利用土壤光譜信息進行土壤屬性的反演研究,越來越多的建模方法被用于SOM 高光譜建模中,且模型精度較高[3-12]。土壤光譜信息不僅與SOM 含量、氧化鐵含量等土壤化學組分以及土壤含水量有關,而且與土壤的顆粒大小、形狀、密度等物理性質有關[2]。司海清等[3-4]通過對不同顆粒大小土樣及不同含水率土樣進行光譜數據測量,對光譜數據進行平滑濾波去噪,并對平滑后的數據進行3 種光譜數據變換:反射率R、反射率一階導數R′和反射率倒數對數log(1/R),然后運用偏最小二乘回歸(Partial Least Square Regression,PLSR)等方法建立SOM 含量估測模型,表明土壤顆粒大小對土壤反射率有著十分明顯的影響,且不同建模方法對模型的結果有明顯影響。孫小香等[5]采用全波段原始光譜進行對數、倒數對數、一階導數、二階導數變換數據結合3 種建模方法:PLSR、BP 神經網絡和支持向量機(Support Vector Machine,SVM)構建不同的山地紅壤全氮含量高光譜估測模型,表明全波段建立的土壤高光譜全氮含量估測模型中,精度由高到低依次為SVM>BP 神經網絡>PLSR。盧艷麗等[6]采用樣本光譜數據敏感波段建立線性回歸來估測SOM 含量。王永敏等[7]采用小波分析法去除土壤樣本光譜數據部分噪音并通過光譜一階導數變換結合回歸分析法建立SOM 估測模型,研究表明與未采用小波分析法建立的模型相比,模型的判定系數提高了0.207。張銳、李兆富等[8]通過小波包和局部最相關算法建立SOM 估測模型,決定系數可達0.781。徐夕博等[9]通過PCA(Principal Component Analysis)將實測高光譜數據降維為6 個主成分,結合多元逐步線性回歸(MLR)和BP 神經網絡,對建立的SOM 估測模型進行了進一步分析。喬娟峰等[10]運用土壤原始反射率R、倒數對數log(1/R)、去包絡線(CR)等5 種光譜變換數據基于全波段和顯著性波段利用PLSR建立SOM 含量估測模型,研究表明選擇顯著性波段CR 模型作為所研究區(qū)域的SOM 含量估測模型更簡潔、科學。
由于測量儀器、測量方法及測量環(huán)境等影響,土壤的光譜反射率數據必然存在噪聲。并且,高光譜數據具有波段多、數據量大,數據冗余的特點,增加了數據處理與建模的工作量和復雜度。因此,在建模前選擇合適的操作對數據進行預處理,如去噪、降維、數據形式變換等,對模型精度的提高至關重要。前述研究在建模前或多或少都進行了一些數據預處理。但在實驗室進行土壤樣品光譜測量反演SOM 時,不同研究者對土壤樣本處理方式不盡相同,且在測得土壤樣本的光譜數據后,對光譜數據的預處理方式也不盡相同,使研究結果缺少可比性。除此之外,不同算法的模型對模型的估測結果影響也很大。
文章嘗試對同一批土壤樣本不同光譜數據預處理下的模型進行模型估測效果比對,所包含的數據預處理有數據降維、數據去噪和光譜數據形式變換,并且選用PLSR 和支持向量回歸(Support Vector Regression,SVR)作為模型研究對象,來比對不同數據預處理對這兩種模型的影響,以期為高光譜SOM 估測的相關研究提供技術支撐。
該文研究區(qū)域為吉林省伊通縣,位于吉林省中南部,東經124°49′~125°46′、北緯43°3′~43°38′。土樣采樣時間為 2017 年 4 月 21—23 日。土壤采樣點按照 1 km×1 km 網格點布設,采樣深度0~5 km,涉及的土地利用類型為玉米耕地。調查區(qū)屬于黑土區(qū),土壤類型包括草甸土、黑土、白漿土、水稻土4 種。使用采集器在樣點處垂直采集1 個直徑10 cm、深5 cm 的原狀土,放入大鋁盒中,盡量保持原狀土樣,用于室內土樣光譜測量。每個樣點用采集器各采集3 個土樣,3 個土樣位置成三角形,相距10 m 左右,深度為0~5 cm,各放入直徑5.5 cm、高3.5 cm 的小鋁盒中,用于測定樣點的SOM 含量及其他
土壤參數。
圖1 土樣室內光譜測量工作圖Fig.1 Chart of indoor Soil Sample Spectral measurement
野外土樣采集當天,采用ASD FieldSpec 4 High-RS 高光譜儀,對放置在直徑10 cm、高5 cm 鋁盒中的原狀土樣進行室內光譜測量(圖1)。ASD 的波長范圍為350~2 500 nm,光譜分辨率為3 nm@700 nm、8 nm@1 400/2 100 nm。 測 量 時 50 W 的 鹵素燈放置于土樣一側,光源入射角度為60(天頂角30),距離土樣為30 cm。探頭垂直距離土樣15 cm。每個土樣測量4 次光譜(每次測量前將大鋁盒轉動90 度,共轉動3 次),每次測量自動采集10 條光譜曲線,算術平均后作為該次的光譜曲線。每次測量前進行標準白板校正。
采用ViewSpecPro 軟件對室內原始光譜數據進行斷點修正(GAP 窗口取值5×5)和光譜平均,設置光譜分辨率為1 nm,共2151 個波段。去除350~400 nm 因設備不穩(wěn)定引起的噪聲。再將室內光譜數據重采樣成與Hymap 機載高光譜影像(2017 年4 月30 日至5 月1 日獲?。┕庾V分辨率相同(400~905 nm 光譜分辨率為15 nm,880~2 500 nm 光譜分辨率為18 nm),共獲得135 個波段,213 條室內光譜曲線。
研究表明,SOM 含量增加會使土壤光譜反射率降低[13-14]??紤]到樣本質量,該文根據上述研究結論刪除數據較異常的15 個樣本,剩余的198 個樣本按4∶1 的比例用于模型的建立與驗證。將198 個樣本按SOM 含量從小到大排列,從第5 個開始,每隔4 個樣本挑選1 個,總計40 個作為驗證樣本,其他158 個作為建模訓練樣本。各樣本集SOM 含量統(tǒng)計信息見表1。
表1 樣本SOM 含量統(tǒng)計Table 1 Sample SOM content statistics
該研究共設有192 組實驗。原始土壤光譜數據經不同預處理(即經不同去噪處理,不同形式數據變化和不同降維處理)得到SOM 含量估測模型的建模數據,之后經不同建模方法進行建模。其中,去噪處理有4 種:無去噪處理、S-G 平滑濾波去噪、小波包去噪以及S-G 平滑與小波包結合去噪。數據變化有8 種:原始光譜數據R、倒數1/R、對數log(R)、倒數對數log(1/R)、一階導數R′、倒數一階導數(1/R)′、對數一階導數(log(R))′、倒數對數一階導數(log(1/R))′。降維處理有3 種:無降維處理、敏感波段降維和PCA 降維。建模方法有2 種:SVR 和PLSR。不同預處理及建模方法的組合方式共4×8×3×2=192 種,每種組合設為一組實驗。最終從SVR 和PLSR 兩種模型中分別選出幾種估測結果較具代表性的組合操作,分析其預處理組合對估測模型的影響。整個實驗中涉及的所有算法都通過Python 編程語言在Python3.7 軟件上編程實現。
高光譜儀器采集數據時受環(huán)境的影響,采集的數據一般會包含噪聲。此外,高光譜儀器采集光譜數據的波長范圍大、波段數據多,如果將采集到的所有波段作為模型的輸入,數據量大,計算速度慢,因此有必要采取合適的操作對模型輸入數據進行去噪及降維處理等預處理。
2.2.1 S-G 平滑濾波去噪
平滑濾波是光譜分析中常用的數據預處理方法之一。S-G 濾波是一種在時域內基于局域多項式最小二乘擬合的濾波方法,也是一種移動窗口的加權平均算法,但是其加權系數不是簡單的常數窗口,而是通過在滑動窗口內對給定高階多項式的最小二乘擬合得出[15]。其設計思想是通過反復迭代處理,使得重建后的曲線逐漸逼近原始曲線的上包絡線[16]。用S-G 方法進行平滑濾波去噪,可以提高光譜的平滑性,并較低噪聲的干擾。S-G 濾波表達式可表示為:
2.2.2 小波包去噪
Daubechies 等研究表明小波包可以同時顧及信號的高頻和低頻成分,并能實現各個頻段有用信息的有效提取,去噪效果好[18-19]。采用小波包去噪時,小波基函數和信號的
式(2)中,σ為高頻信號d 中所有系數絕對值的中位數除0.6745,N為d 中數據個數。該閾值由Donoho 提出,是噪聲系數的最大值。該文選取tar/2 做為噪聲信號的去噪閾值。
2.2.3 S-G 平滑與小波包結合去噪
研究中所用的S-G 平滑與小波包結合去噪是將光譜數據經S-G 平滑濾波后再進行小波包去噪。所用到的對應參數設置同前述設置,即S-G 平滑濾波的濾波窗口大小設置為101,擬合多項式階次設置為5。小波包去噪仍然選用db2 小波基函數進行兩層小波包分解,去噪閾值為tar/2。
2.2.4 光譜數據變換
共 8 種光譜變換數據,R、1/R、log(R)、log(1/R)、R′、(1/R)′、(log(R))′和(log(1/R))′。由于光譜儀采集的是離散型數據,故用如下公式近似計算一階導數光譜數據:分層數選擇都尤為重要。小波包去噪將原始信號分解為高頻信號和低頻信號,高頻信號反應噪聲細節(jié)部分,低頻信號反應原始信號的近似。該文選用db2 小波基函數進行兩層小波包分解,通過軟閾值函數對信號分解后葉子層的高頻信號節(jié)點d 進行閾值去噪,然后對閾值去噪后的信號進行信號重構。閾值確定公式為:
式(3)中,R′(λi)為波長λi處的反射率一階導數值,R(λi+1)為波長λi+1處的反射率,R(λi)為波長λi處的反射率。
2.2.5 敏感波段降維
將經去噪處理且經形式變換的光譜數據與對應SOM 含量做相關性分析,選出決定系數R2(即相關系數R的平方值)大于等于0.25 的波段作為每條光譜曲線的敏感波段。相關系數r的計算公式:
式(4)中,ri為第i個波段的光譜數據與土壤SOM 的相關系數,xni為第n個樣本的第i個波段所對應的光譜數據值,為第i個波段所對應的光譜數據的平均值,yn為第n個樣本的SOM 含量,為所有樣本SOM 含量的平均值。
2.2.6 PCA 降維
PCA 是一種較常使用的降維方法,已廣泛應用于高光譜遙感領域。PCA 變換的目的是通過線性變換,找到一組最優(yōu)的單位正交向量基(即主成分),用線性組合來重構與原樣本均方差的誤差最小的一種變換方法[20]。在PCA 中,數據從原來的坐標系轉換到了新的坐標系,新坐標的選擇是由數據本身決定的。第一個新坐標軸選擇的是原始數據中方差最大的方向,第二個新坐標軸的選擇與第一個坐標軸正交且具有最大方差的方向。以此類推依次選擇坐標軸來組成最優(yōu)單位正交向量基。大部分方差都包含在最前面的幾個新坐標軸中。該文實驗中每條光譜曲線共有波段135 個,選最終估測精度最高所對應的維數25 作為最優(yōu)PCA 降維數。
2.3.1 SVR
支持向量機SVM 是20 世紀90 年代中期發(fā)展起來的基于統(tǒng)計學習理論的一種機器學習方法,通過使用非線性映射算法,將低維輸入空間線性不可分的樣本轉化為高維特征空間使其線性可分;也通過尋求結構化風險最小來提高學習機泛化能力,實現經驗風險和置信范圍的最小化,從而達到在統(tǒng)計樣本量較少的情況下,亦能獲得良好統(tǒng)計規(guī)律的目的。SVM 是一種監(jiān)督學習算法,通常用于模式識別、分類以及回歸分析。SVR 即將SVM 用于回歸分析。
2.3.2 PLSR
偏最小二乘回歸法PLSR 是一種新型的多元統(tǒng)計數據分析方法,它主要研究的是多因變量對多自變量的回歸建模,特別當各變量內部高度線性相關時,用偏最小二乘回歸法更有效。另外,偏最小二乘回歸較好地解決了樣本個數少于變量個數等問題。偏最小二乘法集主成分分析、典型相關分析和多元線性回歸分析3 種分析方法的優(yōu)點于一身。它與主成分分析法都試圖提取出反映數據變異的最大信息,但主成分分析法只考慮一個自變量矩陣,而偏最小二乘法還有一個“響應”矩陣,因此具有估測功能。
2.3.3 精度評定方法
該文中采用的模型精度評價參數包括訓練集決定系數R2t、驗證集決定系數R2v、 訓練集均方根誤差(Root-Mean-Square Error of Training Set,RMSET)、驗證集均方根誤差(Root-Mean-Square Error of Verification Set,RMSEV)和相對分析誤差(Residual Prediction Deviation,RPD)。R2越大,模型的相關性越高。RMSET和RMSEV的值應盡量小,二者越接近,模型的估測精度越高、穩(wěn)定性越高。RPD 一般分為3 類:當RPD ≥2.0 時,說明該模型適合于利用高光譜數據估測土壤有機質含量;1.4 <RPD <2.0 時,認為可以通過別的建模方法來提高模型的可靠性;RPD ≤1.4 時,說明該模型不可靠[21]。
式(5)給出訓練集均方根誤差RMSET的計算公式,驗證集均方根誤差RMSEV計算公式與RMSET計算公式一致。
式(5)中,yit為第i個樣本的SOM 含量真實值,yip為第i個樣本的SOM 含量估測值,n為訓練集中樣本個數。
式(6)給出相對分析誤差RPD 的計算公式:
式(6)中,SD 為驗證集樣本SOM 含量標準差。
基于SVR 的SOM 估測模型中,預處理去噪處理為小波包去噪、降維處理為PCA 降維、光譜數據變換為R′的模型建模效果相對最好。表2 給出無預處理和預處理為小波包去噪、PCA 降維且光譜數據變換為R′的基于SVR 的SOM 估測結果精度。圖2 給出基于SVR 的無預處理SOM 含量估測結果散點圖。圖3 給出基于SVR 的預處理為光譜數據R′小波包去噪PCA 降維的SOM 含量估測結果散點圖。圖3 所對應RMSEV、R2V 和 RPD 的值分別為0.359、0.475 和1.337,而不經任何預處理(即無去噪處理、無降維處理,無光譜數據變換處理)的SVR 模型所對應的RMSEV、R2V 和 RPD 的值分別為 0.439、0.264 和1.091。相比不經預處理的SVR 估測模型而言,經預處理為小波包去噪、PCA 降維且數據變換為R′的SVR 估測模型的R2V提高了 0.211,RPD 提高了 0.246。
表2 基于SVR 的無預處理估測結果與預處理下結果最優(yōu)的SOM 含量估測結果Table 2 SOM content estimation model results of without pretreatment and the optimal results in pretreatment based on SVR
圖2 基于SVR 的無預處理SOM 含量估測結果(a)為訓練集估測結果散點圖,(b)為驗證集估測結果散點圖Fig.2 SOM content estimation results without pretreatment based on SVR
研究表明,同種去噪處理且同種光譜變換數據下,PCA 降維效果大多略優(yōu)于無降維效果,而敏感波段降維效果基本都略差于無降維效果。由于該研究中各預處理下的SVR估測模型精度都不算太高且其他預處理下的SVR 模型估測結果未顯示出明顯規(guī)律,此處不再列舉。
圖3 基于SVR 的預處理為光譜數據R′小波包去噪PCA 降維的SOM 含量估測結果(a)為訓練集估測結果散點圖,(b)為驗證集估測結果散點圖Fig.3 SOM content estimation results in spectral data R′ wavelet packet denoising and PCA dimensionality reduction based on SVR
基于PLSR 的SOM 估測模型中,預處理去噪處理為小波包去噪、降維處理為PCA 降維、光譜數據變換為(1/R)′的模型建模效果相對最好。表3 給出無預處理和經預處理小波包去噪、PCA 降維且光譜數據變換為(1/R)′的基于PLSR 的SOM 估測結果精度。圖4 給出無預處理下基于PLSR 的SOM 含量估測結果散點圖。圖5 給出預處理下基于PLSR的光譜數據(1/R)′小波包去噪PCA 降維SOM 含量估測模型估測結果散點圖。圖5 所對應RMSEV、R2V 和RPD 的值分別為0.280、0.713 和0.712,而不經任何預處理的PLSR 模型所對應的RMSEV、R2V 和RPD 的值分別為1.200、0.007 和0.400。相比不經數據預處理的PLSR 估測模型而言,經小波包去噪、PCA 降維且數據變換為(1/R)′的PLSR 估測模型的R2V提高了0.706,RPD 提高了0.312。不經數據預處理的PLSR 模型,訓練集和驗證集估測結果相差較大。
表3 基于PLSR 的無預處理與預處理下結果最優(yōu)SOM 含量估測模型結果Table 3 SOM content estimation model results of without pretreatment and the optimal results in pretreatment based on PLSR
圖4 基于PLSR 的無預處理SOM 含量估測結果(a)為訓練集估測結果散點圖,(b)為驗證集估測結果散點圖Fig.4 SOM content estimation results without pretreatment based on PLSR
圖5 基于PLSR 的預處理為光譜數據(1/R)′小波包去噪PCA 降維的SOM 含量估測結果(a)為訓練集估測結果散點圖,(b)為驗證集估測結果散點圖Fig.5 SOM content estimation results in spectral data( 1/R)′ wavelet packet denoising and PCA dimensionality reduction based on PLSR.
研究表明,同種去噪處理且同種光譜變換數據下,敏感波段降維效果優(yōu)于無降維效果,PCA 降維效果優(yōu)于敏感波段降維效果。表4 給出基于PLSR 的小波包去噪處理下不同降維處理下光譜數據1/R 的SOM 含量估測結果比對。圖6 給出基于PLSR 的預處理為光譜數據1/R 小波包去噪無降維處理的SOM 含量估測結果散點圖。圖7 給出基于PLSR 的預處理為光譜數據1/R 小波包去噪敏感波段降維的SOM 含量估測結果散點圖。圖8 給出基于PLSR 的預處理為光譜數據1/R 小波包去噪PCA 降維的SOM 含量估測結果散點圖。實驗結果表明,在無降維操作時,模型訓練結果出現嚴重的過擬合問題,訓練集與驗證集的均方根誤差值RMSE 相差0.742;在敏感波段降維下,過擬合現象有所緩解,訓練集與驗證集的均方根誤差值RMSE 相差0.113;在PCA 降維下,過擬合現象基本消除,訓練集與驗證集的均方根誤差值RMSE 相差0.051。說明預處理中的降維操作能有效改善模型過擬合現象,提高模型估測精度及穩(wěn)定性。其他去噪處理或光譜變換數據下的結果類似,此處不再一一列出。
表4 基于PLSR 的預處理為小波包去噪不同降維處理下光譜數據1/R 的SOM 含量估測結果比對Table 4 The comparison of SOM content estimation results in spectral data 1/R different dimensionality reduction and wavelet packet denoising based on PLSR
圖6 基于PLSR 的預處理為光譜數據1/R 小波包去噪無降維操作的SOM 含量估測結果(a)為訓練集估測結果散點圖,(b)為驗證集估測結果散點圖Fig.6 SOM content estimation results in spectral data 1/R wavelet packet denoising and without dimensionality reduction based on PLSR
圖7 基于PLSR 的預處理為光譜數據1/R 小波包去噪敏感波段降維的SOM 含量估測結果(a)為訓練集估測結果散點圖,(b)為驗證集估測結果散點圖Fig.7 SOM content estimation results in spectral data 1/R wavelet packet denoising and sensitive band reduction based on PLSR
圖8 基于PLSR 的預處理為光譜數據1/R 小波包去噪PCA 降維的SOM 含量估測結果(a)為訓練集估測結果散點圖,(b)為驗證集估測結果散點圖Fig.8 SOM content estimation results in spectral data 1/R wavelet packet denoising and PCA dimensionality reduction based on PLSR
此外,部分光譜變換數據在同種降維操作下進行去噪處理后,模型估測精度也有所提高。比如,在不降維處理下,光譜數據R 經S-G 平滑濾波去噪后,模型RPD 比無去噪處理提高了0.186;光譜數據R 經小波包去噪后,模型RPD 比無去噪處理提高了0.175;光譜數據R 經S-G 平滑濾波和小波包結合去噪后,模型RPD 比無去噪處理提高了0.114。而部分光譜變換數據在同種降維操作下進行去噪處理后,模型估測精度反而降低。比如,在敏感波段降維處理下,光譜數據R 經S-G 平滑濾波去噪后,模型RPD 比無去噪處理降低了0.011;光譜數據R 經小波包去噪后,模型RPD 與無去噪處理值一樣;光譜數據R 經S-G 平滑濾波和小波包結合去噪后,模型RPD 比無去噪處理降低了0.110。
總體而言,各光譜變換數據在無降維操作和敏感波段降維操作下的估測精度都較低,RPD 值大都小于1.4。相比而言,在PCA 降維操作下的估測精度都有較大提高,RPD 值基本都大于1.4,R2v值可達0.713,此時,PLSR 模型估測精度較高且模型最穩(wěn)定。
表5 給出基于SVR 與基于PLSR 的無預處理和預處理下結果最優(yōu)的SOM 含量高光譜估測模型結果對比。從表5 可看出,在不經數據預處理時,基于SVR 的SOM 含量估測模型結果優(yōu)于基于PLSR 的SOM 含量估測模型結果;而在經預處理后,基于PLSR 的SOM含量估測模型結果反優(yōu)于基于SVR 的SOM 估測模型結果。原因于SVR 是機器學習中的典型分類回歸算法,雖是一種非線性回歸方法,在解決非線性問題上優(yōu)于線性方法,但其對模型輸入數據的要求也比較高,且樣本數量也應盡可能地多。實驗所用的高光譜數據獲取時受較多外界因素影響,數據質量比較差,可能在訓練模型時出現過擬合現象,所以導致模型即使在預處理后估測精度雖有提高但還是比較低。而PLSR 是線性回歸方法的代表之一,在樣本數較少條件下優(yōu)勢發(fā)揮比較明顯,再加上小波包去噪等提高了數據質量,所以在該實驗中模型估測精度較SVR 模型估測精度要高。
表5 基于SVR 與基于PLSR 的SOM 高光譜估測模型結果對比Table 5 The comparison of SOM content estimation results based SVR and PLSR
此外,在經預處理后,基于SVR 的SOM 含量估測模型結果和基于PLSR 的SOM 含量估測模型結果較不經預處理結果精度都有較明顯的提升,說明合適的數據預處理可以顯著提高高光譜SOM 含量模型估測精度及穩(wěn)定性。并且預處理中,都是在小波包去噪PCA 降維下,基于SVR 的光譜數據R′的SOM 含量估測精度最高,基于PLSR 的光譜數據(1/R)′的SOM 含量估測精度最高,說明小波包去噪和PCA 降維結合可有效去除光譜數據部分噪聲,提高土樣光譜數據質量。
以吉林省伊通縣土樣為研究對象,采集213 份土壤樣本,對土樣的光譜數據和SOM含量進行測量和分析,采用SVR 和PLSR 方法建立不同數據預處理下的SOM 含量的估測模型,并用驗證樣本對吉林伊通土樣SOM 含量高光譜估測模型進行驗證,得到以下結論:(1)在該研究所涉及的數據預處理下,基于SVR 的SOM 含量估測模型中,預處理為小波包去噪、PCA 降維、R′光譜數據變換的建模效果最好。(2)基于PLSR 的SOM 含量估測模型中,預處理為小波包去噪、PCA 降維、(1/R)′光譜數據變換的建模效果最好。(3)基于PLSR 的SOM 含量估測模型下,同種去噪處理且同種光譜變換數據下,敏感波段降維估測效果優(yōu)于無降維處理,PCA 降維估測效果優(yōu)于敏感波段降維處理。(4)合適的數據預處理,尤其是小波包去噪和PCA 降維相結合,可有效改善光譜數據質量、提高SOM 含量估測模型精度及穩(wěn)定性。(5)當光譜數據經過數據預處理小波包去噪、數據變換(1/R)′及PCA 降維后,再使用PLSR 方法可較高精度地估測吉林伊通地區(qū)SOM 含量。