李錦昌,何洪源,趙雪珺,王曉賓,呂銣麟,胡益滔
(1.中國人民公安大學(xué) 偵查學(xué)院,北京 100038;2.上海市刑事科學(xué)技術(shù)研究院 上海市現(xiàn)場物證重點實驗室,上海 200083)
土壤營養(yǎng)元素氮(N)、磷(P)、鉀(K)常見于肥料當(dāng)中,用于提高土壤的肥力和農(nóng)作物產(chǎn)量。施肥欠缺會因土壤肥力下降而限制作物的生長,施肥過量會造成土壤富營養(yǎng)化等環(huán)境問題[1-2]。因此,農(nóng)業(yè)中對于土壤中氮磷鉀含量的控制是土壤分析的關(guān)鍵因素,也是土壤信息化管理和土壤環(huán)境監(jiān)測的前提條件。土壤中營養(yǎng)元素含量傳統(tǒng)的檢測以化學(xué)方法為主,包括凱氏定氮法、氫氧化鈉-鉬銻抗分光光度法和醋酸銨萃取-火焰光度法等[3]。由于這些方法存在分析過程復(fù)雜、檢測周期長、成本高以及實驗中產(chǎn)生的廢液還會因處理不當(dāng)造成環(huán)境污染等缺點。近年來,光譜技術(shù)以快速性、準(zhǔn)確性和無損性的特性[4],已成為土壤中營養(yǎng)元素含量檢測技術(shù)研究和應(yīng)用的熱點問題。光譜技術(shù)檢測土壤營養(yǎng)元素含量的流程見圖1。
圖1 光譜技術(shù)檢測土壤營養(yǎng)元素含量流程圖Fig.1 Flow chart of spectroscopic technology for detectingsoil nutrient element content
本文介紹了近年來國內(nèi)外采用可見-近紅外光譜(Vis-NIRS)、激光誘導(dǎo)擊穿光譜(LIBS)、X射線熒光光譜(XRF)和高光譜遙感(HRS)4種常見的光譜技術(shù)結(jié)合化學(xué)計量學(xué)方法檢測土壤營養(yǎng)元素含量的研究現(xiàn)狀,并對未來研究進(jìn)行了展望。
利用光譜技術(shù)檢測土壤中營養(yǎng)元素時,為了消除非目標(biāo)因素對結(jié)果的影響,通常會對原始光譜數(shù)據(jù)進(jìn)行預(yù)處理來達(dá)到降噪的目的,以提升實驗結(jié)果的準(zhǔn)確性。常用光譜數(shù)據(jù)預(yù)處理方法主要有以下幾種。
SG平滑由Savizky和Golay在1946年提出[5],本質(zhì)上該方法是對移動窗口平均法的改進(jìn)。SG平滑利用多項式最小二乘擬合,計算出窗口內(nèi)中心點關(guān)于其周圍點的加權(quán)平均和。在土壤研究領(lǐng)域中會有效地去除土壤光譜中的高頻噪聲信號,從而突出氮磷鉀在土壤光譜中的信息。郭志新等[6]在利用可見-近紅外光譜技術(shù)研究杉木林土壤中氮磷鉀含量時將采集到的光譜進(jìn)行了SG平滑,很大程度上消除了光譜噪聲信號。
數(shù)學(xué)變換包括導(dǎo)數(shù)和對數(shù)變換。導(dǎo)數(shù)變換分為一階導(dǎo)數(shù)法(FD)和二階導(dǎo)數(shù)法(SD),導(dǎo)數(shù)變換可以很好地去除土壤光譜中基線漂移的影響,呈現(xiàn)出土壤光譜的輪廓變化,提供比原始光譜更高的分辨率,但要求原始光譜應(yīng)具有較高的信噪比。朱琦等[7]對采集的光譜進(jìn)行一階導(dǎo)數(shù)處理,從而解決了紅外光譜分析時出現(xiàn)的譜圖偏移或漂移的現(xiàn)象。對數(shù)變換可以增強光譜差異,還能有效地減小噪聲對目標(biāo)物光譜波段的影響。高會等[8]進(jìn)行了對不同有效磷含量的土壤高光譜反射率包括對數(shù)變換在內(nèi)的一系列數(shù)學(xué)變換,得到了變換形式中(lnR)′對有效磷的估算效果最佳。
由于土壤顆粒粒徑存在差異,表面分布不均,從而產(chǎn)生對原始光譜干擾的散射現(xiàn)象。針對該現(xiàn)象采取的處理方法稱為散射校正法,包括多元散射校正(MSC)和變量標(biāo)準(zhǔn)化(SNV)。MSC常用于校正散射現(xiàn)象對土壤原始光譜數(shù)據(jù)的影響,減少基線漂移。SNV則類似于MSC,但SNV更適用于樣本光譜差異較大的條件下進(jìn)行前處理。Ramrio等[9]通過對原始光譜進(jìn)行SNV處理,使得可見-近紅外光譜在預(yù)測土壤有效磷和有效鉀的結(jié)果更加準(zhǔn)確?;谕寥拦庾V數(shù)據(jù)的常見光譜預(yù)處理方法的原理與作用見表1。
表1 光譜預(yù)處理方法Table 1 Pre-processing methods for spectroscopy
由于采集的光譜數(shù)據(jù)存在譜峰重疊造成的光譜信息冗余、特征吸收峰不明顯等缺點[8],因此需要尋找對模型起關(guān)鍵作用的有效波長來代替全譜建立預(yù)測模型。特段波長提取方法可以有效提高光譜技術(shù)分析結(jié)果的準(zhǔn)確性。土壤光譜中常用的特征波段提取方法包括以下幾種。
連續(xù)投影算法(SPA)是通過對光譜數(shù)據(jù)投影映射選取原始數(shù)據(jù)中的少數(shù)波長,盡可能多地概括樣本光譜信息,最大程度避免信息重疊[24]。朱淑鑫等[25]提出了結(jié)合SPA和K均值算法對高光譜特征波段進(jìn)行選擇,結(jié)果表明可以有效地減低數(shù)據(jù)冗余的情況。
無信息變量消除算法(UVE)是基于PLS回歸系數(shù)建立的波長選擇算法,用于消除無用信息變量,降低模型復(fù)雜程度。Li等[26]分別利用SPA和UVE兩種方法提取特征波長,最終證明UVE提取得到的特征變量結(jié)合模型時預(yù)測效果更好。
主成分分析(PCA)可用于對土壤營養(yǎng)元素的光譜數(shù)據(jù)信息矩陣進(jìn)行壓縮,即將光譜信息矩陣分解得到主成分載荷矩陣和得分矩陣,然后再使用樣本集的主成分對應(yīng)其相應(yīng)的得分作圖[27]。Terra等[28]利用PCA對光譜數(shù)據(jù)進(jìn)行降維,得到了中紅外光譜和近紅外光譜對土壤樣品預(yù)測的分布情況。
隨機青蛙(Radom frog)是一種基于青蛙覓食過程而創(chuàng)建的一種智能優(yōu)化算法。何東健等[29]采用隨機蛙跳算法進(jìn)行特征波長的選擇,結(jié)果表明該方法可以很好地選取特征波長,有效去除冗余信息且建模結(jié)果很好。
競爭性自適應(yīng)重加權(quán)算法(CARS)是模仿了達(dá)爾文進(jìn)化論中的“適者生存”原則,可以有效找到最優(yōu)變量組合的一種算法。而穩(wěn)定競爭性自適應(yīng)加權(quán)抽樣法(sCARS) 是在CARS的基礎(chǔ)上將穩(wěn)定性同時納入考慮中,將變量的穩(wěn)定性作為變量建模能力的指標(biāo),剔除冗余信息[30]。Sara等[13]采用CARS對LIBS、Vis-NIRS檢測土壤中磷含量的光譜數(shù)據(jù)集進(jìn)行特征提取,結(jié)果表明CARS在篩選關(guān)鍵波長上十分有效?;谕寥拦庾V數(shù)據(jù)的光譜特征常見提取方法總結(jié)見表2。
表2 光譜特征提取方法Table 2 Spectral feature extraction methods
基于樣本的光譜數(shù)據(jù)和已知信息建立預(yù)測模型,通過獲得未知土壤樣本的光譜數(shù)據(jù),依照建立的預(yù)測模型,可以預(yù)測出未知土壤樣本中營養(yǎng)元素的準(zhǔn)確含量。目前,基于土壤光譜數(shù)據(jù)所建立的預(yù)測模型以線性回歸模型的偏最小二乘法為主。隨著研究人員對更高預(yù)測精度的要求,更多非線性模型也引入到了土壤數(shù)據(jù)研究中,并在檢測土壤營養(yǎng)元素含量時有著較好的預(yù)測效果。光譜技術(shù)在檢測土壤營養(yǎng)元素含量的研究日趨成熟。
為評估模型的預(yù)測能力,通常會從決定系數(shù)(R2)、相關(guān)系數(shù)(r)、性能偏差比(RPD)、均方根誤差(RMSE)等方面來比較不同標(biāo)定方法的預(yù)測精度。通常好的預(yù)測模型具有較高的R2、RPD值和較低的RMSE值。RPD的區(qū)分范圍沒有明確規(guī)定,一般由研究人員會自行確立一個界定范圍以區(qū)別不同RPD值模型預(yù)測能力。Qi等[10]利用SSR/SST(即R2值)和RPD值作為模型預(yù)測土壤中氮磷鉀元素含量的評估標(biāo)準(zhǔn),即通過SSR/SST>0.5和RPD>2來評判最佳的模型預(yù)測能力。
可見-近紅外光譜(Vis-NIRS) 是基于電磁輻射與物質(zhì)之間的相互作用,波長范圍在400~2 500 nm之間??梢妳^(qū)(400~700 nm)主要由分子的電子躍遷控制,近紅外區(qū)(700~2 500 nm)主要由中紅外區(qū)分子振動的泛頻和組合頻控制。由于土壤中各個組分與吸收的輻射相聯(lián)系,因此可提供樣品的定性和定量信息[36]。
Mouazen等[37]通過PLSR建立了土壤有效磷含量的預(yù)測模型,發(fā)現(xiàn)Vis-NIRS預(yù)測磷含量是可行的,隨后研究了不同光譜數(shù)據(jù)處理方法來提高預(yù)測模型的準(zhǔn)確性。袁石林等[11]以浙江省潮化鹽土為研究對象,利用Vis-NIRS檢測了6組120個土壤樣品中總氮(TN)和總磷(TP)的含量,分別建立了PLS和LS-SVM的預(yù)測模型,結(jié)果發(fā)現(xiàn)在預(yù)測總磷方面LS-SVM方法要比PLS好。李雪瑩等[38]以青島市三個不同地區(qū)的180份土壤樣品為研究對象,基于Vis-NIRS結(jié)合PLSR對土壤中TN、TP、TK建立了預(yù)測模型。結(jié)果為TN和TP校正集和驗證集的R2均在0.9以上,RPD值均高于2,表明模型對土壤中TN、TP、預(yù)測能力較好。吳茜等[12]以云南省玉溪水稻土為研究對象,基于Vis-NIRS結(jié)合BPNN對土壤有效氮磷鉀含量進(jìn)行了預(yù)測,得到rp分別為0.90,0.82和0.94。Qi等[10]研究對比了原始光譜和22種光譜預(yù)處理方法,結(jié)合PLSR、LS-SVM和BPNN三種模型對土壤中營養(yǎng)元素含量進(jìn)行了預(yù)測,最終得出BPNN+MSC是預(yù)測鉀的最優(yōu)方法,RPD值為2.23,R2為0.81;SG+LG/PLS-R是預(yù)測磷的最優(yōu)方法,RPD值為1.47,R2為0.95。
激光誘導(dǎo)擊穿光譜(LIBS)是一種原子發(fā)射光譜技術(shù),可以對樣品中多元素成分進(jìn)行快速現(xiàn)場定量檢測。通過超短脈沖激光聚焦樣品表面形成等離子體,進(jìn)而對等離子體發(fā)射光譜進(jìn)行分析以確定樣品的物質(zhì)成分及含量[39]。
在土壤研究中,LIBS通過結(jié)合化學(xué)計量學(xué)方法可用于測定氮磷鉀的常量和微量元素。Erler等[31]使用基于LIBS的手持儀器,采用多元回歸方法估計農(nóng)田土壤中的常見組分(氮、磷、鉀、鈣、鎂等),測定的結(jié)果表明鉀的預(yù)測效果最好,而對于磷和氮的預(yù)測效果較差。Sara等[13]利用LIBS和 Vis-NIRS 對印度農(nóng)田的147份土壤樣品對可浸出磷、奧森磷、草酸可浸出磷和總磷進(jìn)行了檢測。建立了PLSR模型,結(jié)合區(qū)間偏最小二乘回歸(iPLS)和競爭自適應(yīng)重加權(quán)抽樣(CARS)確定了土壤中磷的特征波段。結(jié)果表明,在幾乎所有模型建立和預(yù)測土壤磷庫方面,LIBS比Vis-NIRS結(jié)果好。猜測可能是由于磷的譜線強度可能會受到土壤中其他金屬元素的影響,且建議應(yīng)當(dāng)建立多元的定量模型以提高預(yù)測相關(guān)系數(shù)(R2)。Xu等[40]將LIBS與偏最小二乘回歸法(PLSR)相結(jié)合,同時測定了土壤的pH值、陽離子交換容量(CEC)、土壤有機質(zhì)(SOM)、TN、TP、TK、速效磷(AP)和土壤有機質(zhì)(SOM),結(jié)果表明基于全LIBS光譜下對上述土壤參數(shù)都有較好的預(yù)測能力,特別是對土壤中TP的預(yù)測,RPD值達(dá)到了1.993。
在X射線熒光光譜(XRF)中,利用原級X射線光子或其它微觀粒子以一定能量(在1~115 keV)范圍激發(fā)待測物質(zhì)中的原子,使之產(chǎn)生次級的特征X射線(X光熒光)來進(jìn)行物質(zhì)成分分析和研究。在土壤檢測中,通過便攜式X射線熒光光譜在現(xiàn)場初篩后再進(jìn)行實驗室檢測,可以避免盲目的大量采樣[41]。
Towett等[42]采用總X射線熒光光譜法(TXRF)對南非44個地區(qū)的700份土壤樣品進(jìn)行了檢測,結(jié)果顯示磷和鉀都得到較好的預(yù)測效果。Said等[43]使用隨機森林(RF)對便攜式XRF檢測的光譜數(shù)據(jù)進(jìn)行分析,來預(yù)測鉀(K)、磷(P)、鎂(Mg)和鈣(Ca)的含量。結(jié)果表明鉀的預(yù)測效果最佳,R2為0.83。說明便攜式XRF結(jié)合數(shù)據(jù)分析方法,可快速、低成本、準(zhǔn)確地分析土壤鉀的含量。Tiago等[22]證明了XRF對關(guān)鍵土壤肥力屬性的測量中利用多元回歸模型分析是有效的,其中磷和鉀均得出的預(yù)測結(jié)果為RPD>1.54和R2>0.61。最近,關(guān)于XRF與其他技術(shù)(如可見光和近紅外光譜)數(shù)據(jù)融合使用的研究也開始流行起來。Javadi等[32]檢驗了可見-近紅外光譜和X射線熒光光譜數(shù)據(jù)融合技術(shù)的潛力,以提高實踐中對關(guān)鍵土壤屬性的估計精度。探究了數(shù)據(jù)融合在可見近紅外光譜和XRF測定土壤屬性的潛力,結(jié)果表明基于CNN建模方法測定含磷土壤屬性的效果最好。
高光譜遙感(HRS)是指利用固定的電磁波波段獲取地物的連續(xù)光譜信息,與反映地物空間分布的影像相結(jié)合,從而可以同時對土壤表面狀況與其性質(zhì)的空間信息進(jìn)行監(jiān)測的一種技術(shù)。近地傳感高光譜因其成本低,操作省時省力,且具備大范圍監(jiān)測的應(yīng)用潛力,故在土壤研究中得到廣泛關(guān)注[44-45]。
Malley和Williams[46]于1997年利用HRS對湖泊沉積物中的重金屬元素進(jìn)行了定量反演,取得了較好的預(yù)測精度。在此之后HRS才被廣泛應(yīng)用于土壤營養(yǎng)元素檢測中。徐麗華等[47]通過斷點擬合和消除包絡(luò)線的預(yù)處理方法,分別選取了4個相關(guān)系數(shù)較大的波段作為總磷和總氮的特征波段,在基于特征譜線下建立的預(yù)測模型表現(xiàn)出較高的預(yù)測精度,R2分別為0.842和0.622。陶培峰等[21]通過對土壤原始反射率光譜進(jìn)行了數(shù)學(xué)變換、MSC等變換,利用多元逐步回歸(SMLR)、PLSR和BPNN三種分析方法建立了高光譜預(yù)測模型,結(jié)果表明PLSR和BPNN模型的預(yù)測能力更好。Li等[11]利用高光成像系統(tǒng)在900~1 700 nm光譜范圍內(nèi)檢測了土壤樣品中的TN含量,并對不同的特征光譜提取方法(UVE和SPA)和預(yù)測模型(PLS和ELM(極限學(xué)習(xí)機))進(jìn)行了比較,結(jié)果表明UVE-ELM模型可獲得相對較好的結(jié)果,rp、RMSEP和RPD分別為 0.940 8,0.007 5 和2.97。Patel等[48]結(jié)合深度學(xué)習(xí)算法,利用高光譜數(shù)據(jù)估算了土壤和尿素肥料混合樣品的豐度,結(jié)果表明該算法可有效提高數(shù)據(jù)的光譜分解精度,也說明HRS可用于農(nóng)田土壤肥力狀況的評價。
目前,可見-近紅外光譜、激光誘導(dǎo)擊穿光譜、X射線熒光光譜和高光譜遙感已廣泛用于土壤營養(yǎng)元素含量的檢測工作中。利用化學(xué)計量學(xué)方法對測得的光譜數(shù)據(jù)進(jìn)行處理已成為研究熱點,利用SG平滑處理可有效減小噪聲干擾,MSC和SNV可有效消除土壤中不均勻介質(zhì)產(chǎn)生的散射。光譜預(yù)處理方法從單一化向多樣化發(fā)展,再到多種方法并用,有研究者采用SG+MSC+FD或SG+LG等組合的方法校準(zhǔn)光譜數(shù)據(jù)以提高預(yù)測模型的準(zhǔn)確度。還有應(yīng)用SPA、CARS和GA和隨機蛙跳等方法對目標(biāo)元素的特定波長進(jìn)行選擇。近些年,建模方法從采用PLSR線性回歸模型轉(zhuǎn)向了復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型,如CNN、DBN、BPNN等模型的復(fù)雜度更高,泛化能力更強,在測量土壤營養(yǎng)元素含量有更好的預(yù)測效果。
研究發(fā)現(xiàn),四類光譜技術(shù)雖然已在土壤營養(yǎng)元素含量的研究中得到普遍使用,但大部分工作還是針對特定地域或地區(qū)進(jìn)行的分析,盡管得到了較為理想的預(yù)測模型,但模型的通用性會受到一定限制。在未來的工作中,隨著便攜式光譜檢測儀器的不斷發(fā)展,可以實地采樣測量獲得數(shù)據(jù)信息。為了適應(yīng)復(fù)雜的土壤類型和大面積土壤營養(yǎng)元素含量的測定,研究人員還要不斷優(yōu)化建模方法,提高模型的泛化能力。進(jìn)一步擴大采樣范圍,建立大規(guī)模的土壤光譜數(shù)據(jù)庫,將其應(yīng)用到農(nóng)業(yè)或地質(zhì)科學(xué)研究中,不僅通過與傳統(tǒng)的土壤剖面分類圖結(jié)合起來完成數(shù)字化土壤分類,從而實現(xiàn)對不同土壤層級進(jìn)行快速有效分析;還可與光譜數(shù)據(jù)的化學(xué)計量學(xué)模型相結(jié)合,對各類作物提供施肥建議,更好地為發(fā)展精準(zhǔn)農(nóng)業(yè)服務(wù)。