李名偉 朱慶輝 夏曉蒙 劉 鶴 黃東巖
(1.吉林大學(xué)生物與農(nóng)業(yè)工程學(xué)院, 長春 130022; 2.吉林大學(xué)工程仿生教育部重點實驗室, 長春 130022)
土壤有機質(zhì)(Soil organic matter,SOM)是指存在土壤中的所有含碳的有機物質(zhì),主要包括動植物殘體、土壤微生物及其分解和合成的各種有機物,是土壤固相部分的重要組成成分[1-2]。土壤有機質(zhì)的含量僅占土壤組成的5%左右,但對改善土壤的物理性質(zhì),促進土壤中營養(yǎng)元素的分解,提高土壤肥力都有極為重要的作用[3]。掌控土壤有機質(zhì)含量的動態(tài)變化,根據(jù)土壤性狀調(diào)節(jié)作物的施肥量,高效地利用各類農(nóng)業(yè)資源,是實現(xiàn)精準(zhǔn)農(nóng)業(yè)和促進農(nóng)業(yè)可持續(xù)發(fā)展的重要內(nèi)容之一。
目前,測量土壤有機質(zhì)含量的方法主要有灼燒法、濕燒法、重鉻酸鉀容量法等[4-5]。其基本原理都是根據(jù)有機碳的含量測定有機質(zhì),是一種碳成分直接測定法。其中,重鉻酸鉀容量法因技術(shù)原理簡單、測量結(jié)果準(zhǔn)確且成本較低而被廣泛使用[6]。但是該方法需要在化學(xué)實驗室中進行,且存在耗時耗力、操作復(fù)雜和造成污染等問題。近年來,隨著近紅外光譜技術(shù)的發(fā)展,光譜測定土壤有機質(zhì)的方法得到了廣泛的關(guān)注和研究[7]。近紅外光譜有快速、無損和高效等特點,可以實時測量大量土壤樣本的參數(shù),適用于精準(zhǔn)農(nóng)業(yè)[8-10]。然而,土壤有機質(zhì)的光譜受土壤水分、氧化鐵、質(zhì)地等因素的影響[11-13]。
土壤氣體是土壤的組成部分之一,是由土壤中生物活性和氣體轉(zhuǎn)移之間的平衡引起的[14]。土壤中氣體和揮發(fā)性有機化合物的釋放與微生物活動有關(guān),并會不同程度地影響土壤中生物的生活[15-16]。在微生物的降解過程中,養(yǎng)分和能量的供應(yīng)底物在土壤中產(chǎn)生許多揮發(fā)性有機化合物和氣體[17-19]。土壤中的揮發(fā)性有機化合物和氣體與土壤有機質(zhì)存在相關(guān)性,利用這種相關(guān)性可以通過人工嗅覺技術(shù)檢測土壤氣味從而測算出土壤有機質(zhì)含量。
人工嗅覺技術(shù)是一種綜合性檢測技術(shù),融合了傳感器技術(shù)、信號處理、計算機科學(xué)、模式識別和深度學(xué)習(xí)等,其工作原理是模擬人體嗅覺功能對被測氣體進行感知、分析和識別。由多種氣體傳感器融合而成的傳感器陣列和模式識別方法組成的人工嗅覺系統(tǒng),被認(rèn)為是檢測復(fù)雜氣體的有效手段。人工嗅覺系統(tǒng)不是直接得出監(jiān)測氣體的具體成分或特性,而是生成樣本氣體的“指紋圖譜”,借助合理的模式識別算法,實現(xiàn)對樣本氣體的準(zhǔn)確分類。目前,人工嗅覺技術(shù)被廣泛應(yīng)用在食品安全、醫(yī)療分析和環(huán)境檢測等領(lǐng)域[20-23],且在土壤特性和土壤有機質(zhì)檢測方面也有些研究。例如,ANDRZEJ等[24]采用電子鼻對不同濕度的土壤進行了分類,LAVANYA等[25]利用電子鼻檢測了土壤中透明質(zhì)酸和游離脂肪酸的含量;文獻[26-27]利用單種傳感器陣列的人工嗅覺系統(tǒng)實現(xiàn)了對土壤有機質(zhì)含量的檢測,由于采用單種傳感器陣列,不能全面反映土壤中氣體的響應(yīng),土壤有機質(zhì)含量的檢測精度和響應(yīng)時間有待提高。
針對上述問題,本文提出一種基于人工嗅覺技術(shù)的多傳感器陣列檢測土壤有機質(zhì)含量的檢測方法。土壤有機質(zhì)在厭氧環(huán)境中產(chǎn)生氣態(tài)烴、硫化氫、氨和醛類等揮發(fā)性氣體,土壤中的揮發(fā)性氣體與土壤有機質(zhì)存在相關(guān)性。將土壤樣本放在集氣瓶中密封48 h,采用10種不同類型的氧化物半導(dǎo)體式氣體傳感器構(gòu)建傳感器檢測陣列,搭建基于人工嗅覺的土壤有機質(zhì)檢測系統(tǒng),以此系統(tǒng)獲取土壤樣本中氣體的響應(yīng)曲線。提取響應(yīng)曲線的響應(yīng)面積、最大值、平均微分系數(shù)、方差、平均值和最大梯度等6個特征構(gòu)建人工嗅覺特征空間,采用BP神經(jīng)網(wǎng)絡(luò)算法(Back propagation neural network,BPNN)、支持向量機回歸算法(Support vector machine regression,SVR)和偏最小二乘回歸算法(Partial least squares regression,PLSR)依據(jù)人工嗅覺特征空間建立土壤有機質(zhì)含量的預(yù)測模型,從而利用人工嗅覺技術(shù)實現(xiàn)對土壤有機質(zhì)含量的檢測。
土壤采樣區(qū)域為吉林省,位于中國東北地區(qū)中部,如圖1所示。
吉林省位于中緯度歐亞大陸的東側(cè),屬于溫帶大陸性季風(fēng)氣候,年平均氣溫在-5~8.6℃,年平均降雨量為400~600 mm。土壤類型以暗棕壤、黑鈣土、白漿土、草甸土、黑土、風(fēng)沙土、新積土和水稻土為主,以水稻、玉米、大豆為主要糧食作物。頻繁的耕作導(dǎo)致土壤退化,施用化肥可有效提高作物產(chǎn)量,成為農(nóng)業(yè)生產(chǎn)不可或缺的選擇。
2019年秋季在圖1所示130個采樣點共采集土壤樣本130份。由于土壤的不均一性,使各個體都存在著一定程度的變異,為了盡可能還原土壤樣本在田間的實際狀態(tài),采用對角線布點法進行土樣采集,每個采樣點采集9份土樣,采樣深度為0~20 cm。將得到的9份土樣混合,按四分法每個采樣點保留1份土壤樣品(1 kg)。根據(jù)試驗的需求,將130份土壤樣品在溫度23℃下自然風(fēng)干后,將土壤碾碎并過0.25 mm的篩網(wǎng)處理。將樣品分為2份,分別用于化學(xué)氧化法和人工嗅覺系統(tǒng)檢測其土壤有機質(zhì)含量?;瘜W(xué)氧化法采用重鉻酸鉀法[28],是標(biāo)準(zhǔn)的土壤有機質(zhì)測定方法(GB 9834—88)[29],此方法測得土壤有機質(zhì)含量為實際值。人工嗅覺系統(tǒng)所用土壤樣品通過噴施蒸餾水使各樣品的相對濕度維持在55%,每份土壤樣本稱取80 g置于250 mL的密閉集氣瓶內(nèi),最后將集氣瓶在黑暗房間里存放48 h,部分密封后的土壤樣品如圖2所示。
試驗所采用裝置為基于人工嗅覺的土壤有機質(zhì)檢測系統(tǒng),如圖3所示。該系統(tǒng)由傳感器陣列(安裝在封閉的反應(yīng)室)、信號處理電路、NI數(shù)據(jù)采集卡和便攜式計算機組成。傳感器陣列是整個系統(tǒng)的核心部件,由10個不同型號的氧化物半導(dǎo)體式氣體傳感器組成,如圖4所示。每個傳感器的型號和可測量的氣體類型,如表1所示。信號處理電路主要負(fù)責(zé)傳感器的供電、對傳感器數(shù)據(jù)的處理,傳感器陣列與信號處理電路之間通過FFC軟線連接。數(shù)據(jù)采集卡通過杜邦線與信號處理電路連接,用于對傳感器數(shù)據(jù)的采集,并將采集的數(shù)據(jù)通過USB數(shù)據(jù)線輸入計算機來顯示、存儲。
表1 氣體傳感器型號及參數(shù)Tab.1 Gas sensor model and parameters
在高耗氧條件下,土壤有機物在微生物作用下分解的最終產(chǎn)物為二氧化碳、水、硝酸鹽、硫酸鹽和磷酸鹽,增加了土壤的耗氧量和二氧化碳含量。在厭氧條件下,土壤有機質(zhì)的分解促進了氣態(tài)烴(CH4、C2H4、C2H6、C3H8等)、硫化氫、氨和醛類物質(zhì)的形成[30]。本文將土壤樣本在集氣瓶中密封48 h,使其在厭氧環(huán)境中產(chǎn)生氣態(tài)烴、硫化氫、氨和醛類等揮發(fā)性氣體。利用氣體傳感器的特異性和交叉靈敏性等特點,選擇10個對土壤在厭氧環(huán)境下產(chǎn)生氣體有響應(yīng)的不同型號氣體傳感器組成傳感器陣列,對土壤樣本產(chǎn)生的揮發(fā)性氣體進行檢測。
氣體傳感器的基本測量電路如圖5a所示,且每個氣體傳感器均由電阻器RS和RH組成。其中,RS為傳感器電阻器,其電阻RS隨測量氣體的濃度變大而變?。籖H是加熱電阻器。傳感器正常工作需要加熱器電壓VH和回路電壓VC,VH作用于RH,可以為RS提供適合的工作溫度;VC則是用于測定與傳感器串聯(lián)的負(fù)載電阻器RL上的回路輸出電壓VRL。VH和VC的電壓均設(shè)置為(5±0.2) V。加熱電阻器RH為固定值且電阻RH較小,為確保傳感器工作溫度,每個傳感器的RH都采用單獨供電,其供電電路如圖5b所示。負(fù)載電阻器RL與傳感器電阻器RS串聯(lián),可通過回路輸出電壓VRL反映出傳感器的響應(yīng)(傳感器電阻RS的變化),RS的計算公式為
(1)
式中RL——電阻器RL的電阻
數(shù)據(jù)采集卡為NI(National Instruments)公司生產(chǎn)的多功能I/O設(shè)備USB-6210,該采集卡集成了16路16位模擬輸入(AI)端口,最大采樣速率為250 kS/s;分別集成了4路數(shù)字輸入(DI)和數(shù)字輸出(DO)端口,并具有2個32位計數(shù)器。采用NI公司開發(fā)的LabVIEW軟件和DAQ驅(qū)動,開發(fā)了一套數(shù)據(jù)采集系統(tǒng),其軟件界面如圖6所示。圖中,DAQ助手模塊用于設(shè)置數(shù)據(jù)采集卡的參數(shù),本文選用Ai1~Ai10共10個AI采集端口,采集方式為連續(xù)測量,采集頻率為10 Hz。
工作時,先打開系統(tǒng)電源,使傳感器預(yù)熱15 min;然后用空氣泵以2 L/min的流速抽取潔凈空氣清洗裝有傳感器陣列的反應(yīng)室,清洗時間為1 min;使用20 mL的注射器抽取集氣瓶頂部的土壤氣體,注射到反應(yīng)室中;啟動LabVIEW檢測程序,開始采集數(shù)據(jù),采集時間為2 min。完成一次采樣后,使用空氣泵以2 L/min的流速清洗反應(yīng)室,其余樣本數(shù)據(jù)的采集重復(fù)上述過程。
基于人工嗅覺的土壤有機質(zhì)檢測系統(tǒng)搭建完成后,還需測試傳感器陣列的響應(yīng)效果。測試所用儀器主要包括土壤有機質(zhì)檢測系統(tǒng)、多種標(biāo)準(zhǔn)氣體、YQAr-01L型標(biāo)準(zhǔn)氣體減壓閥,圖7為標(biāo)準(zhǔn)氣體罐。標(biāo)準(zhǔn)氣體類型及參數(shù)如表2所示。
表2 標(biāo)準(zhǔn)氣體類型及參數(shù)Tab.2 Standard gas types and parameters
試驗時,先打開土壤有機質(zhì)檢測系統(tǒng)電源,使傳感器預(yù)熱15 min;然后啟動LabVIEW檢測程序,利用NI數(shù)據(jù)采集卡采集傳感器陣列在空氣中的響應(yīng)數(shù)據(jù)30 s,接著打開標(biāo)準(zhǔn)氣體氣閥,以0.8 L/min的流速將標(biāo)準(zhǔn)氣體通入反應(yīng)室,通氣時間為30 s,然后用止氣夾封閉反應(yīng)室,采集時間為3 min;最后用空氣泵以2 L/min的流速抽取潔凈空氣清洗反應(yīng)室,清洗時間為1 min,完成一次標(biāo)準(zhǔn)氣體響應(yīng)測試。每種標(biāo)準(zhǔn)氣體測試3次,取平均值。
為消除傳感器在采集時產(chǎn)生的噪聲對數(shù)據(jù)處理的不利影響,采用一維中值濾波算法對響應(yīng)曲線進行平滑處理,并設(shè)置平滑點數(shù)為25。為提高后期數(shù)據(jù)處理效率,選取測量開始后的前40 s數(shù)據(jù)用作處理分析。本研究提取響應(yīng)面積Vrav、最大值Vmax、平均微分系數(shù)Vmdc、方差Vvv、平均值Vmean和最大梯度Vmgv這6個特征構(gòu)建特征空間。其中,Vrav、Vmdc、Vvv和Vmgv計算公式為
(2)
(3)
(4)
(5)
式中Xi——傳感器采集的第i個數(shù)據(jù),V
Δt——相鄰2個采樣點的間隔時間,取0.1 s
N——采樣數(shù)據(jù)的總數(shù)量
Xjmax——采集數(shù)據(jù)中最大值,V
X0——采集數(shù)據(jù)的初始響應(yīng)值,V
j——采集數(shù)據(jù)中最大值所對應(yīng)的時間,s
氣體傳感器陣列由10個傳感器構(gòu)成,每個傳感器的響應(yīng)曲線提取6個特征值,因此,共提取60個特征參數(shù),形成一個130×60的人工嗅覺特征空間。由于6種特征值的量綱和數(shù)量級不同,需對各特征數(shù)據(jù)進行無量綱化處理,本研究采用z-score方法實現(xiàn)數(shù)據(jù)的標(biāo)準(zhǔn)化,以消除量綱的影響,其公式為
z=(x-u)/s
(6)
式中z——標(biāo)準(zhǔn)化后的數(shù)據(jù)
x——原始數(shù)據(jù)
u——樣本平均值
s——樣本標(biāo)準(zhǔn)差
預(yù)測模型的建立需要劃分訓(xùn)練集和測試集,訓(xùn)練集用來估計模型中的參數(shù),使模型能夠反映現(xiàn)實,進而預(yù)測未來或其他未知的信息;測試集用來評估模型的預(yù)測性能。訓(xùn)練集和測試集的合理劃分有利于提高所建立模型的預(yù)測能力,本研究采用Kennard-Stone方法設(shè)置訓(xùn)練集和測試集比為3∶1。
為提高本文檢測方法的檢測精度,采用PLSR、BPNN和SVR 3種算法建立人工嗅覺特征空間與土壤有機質(zhì)含量之間的預(yù)測模型,以找出最優(yōu)的關(guān)系模型。
偏最小二乘回歸是一種統(tǒng)計學(xué)方法,與主成分回歸有關(guān)系,但不是尋找響應(yīng)變量和自變量之間最大方差的超平面,而是通過投影分別將預(yù)測變量和觀測變量投影到一個新空間,來尋找一個線性回歸模型。此算法集主成分分析、典型相關(guān)分析和多元線性回歸分析3種分析方法的優(yōu)點于一身,當(dāng)變量之間存在高度線性相關(guān)時,PLSR可以建立一個較高精度的預(yù)測模型。本研究使用留一交叉驗證法尋找主成分因子,通過交叉驗證的均方根誤差驗證模型的穩(wěn)健性[31]。
BP神經(jīng)網(wǎng)絡(luò)(BPNN)是一種按誤差反向傳播訓(xùn)練的多層前饋網(wǎng)絡(luò),在結(jié)構(gòu)上包括輸入層、隱含層和輸出層3部分,每個部分之間依靠權(quán)值和閾值連接[32]?;镜腂PNN算法是通過信號的前向傳播和誤差的反向傳播2個過程來反復(fù)修正各單元權(quán)值,以此無限地逼近目標(biāo)值。隱含層神經(jīng)元數(shù)對BP神經(jīng)網(wǎng)絡(luò)的性能影響較大。若隱含層神經(jīng)元數(shù)較少,則網(wǎng)絡(luò)不能充分描述輸出和輸入變量之間的關(guān)系;相反,若隱含層神經(jīng)元數(shù)較多,則會導(dǎo)致網(wǎng)絡(luò)的學(xué)習(xí)時間變長,甚至?xí)霈F(xiàn)過擬合的問題。一般地,確定隱含層神經(jīng)元數(shù)的方法是在經(jīng)驗公式的基礎(chǔ)上,對比隱含層不同神經(jīng)元數(shù)對模型性能的影響,從而進行選擇。本研究采用3層網(wǎng)絡(luò)構(gòu)建BPNN模型,隱含層最優(yōu)神經(jīng)元數(shù)計算公式為
(7)
式中h——隱含層神經(jīng)元數(shù)
n——輸入節(jié)點數(shù)
m——輸出節(jié)點數(shù)
α——1~10的正整數(shù)
n為建模的特征向量數(shù)量,m為預(yù)測因變量數(shù)量,本文只對有機質(zhì)含量作預(yù)測,所以m為1。此外,神經(jīng)元激活函數(shù)、訓(xùn)練迭代次數(shù)和目標(biāo)誤差等的設(shè)置也會影響模型效果,但通常都是被設(shè)置為固定值。
SVR是一種基于支持向量機(Support vector machine,SVM)的回歸技術(shù),是為了利用SVM解決回歸擬合方面的問題在SVM分類的基礎(chǔ)上引入ε不敏感損失函數(shù)提出的[33]。該模型使用徑向基函數(shù)(Radial basis function,RBF)作為核函數(shù)將數(shù)據(jù)轉(zhuǎn)移到更高維度,然后找到最佳函數(shù)(f(x)或超平面),該函數(shù)與目標(biāo)的偏離不超過ε,其原理如圖8所示。SVR的泛化能力主要受懲罰因子C和核參數(shù)g(RBF核函數(shù)中的方差)的影響,并且C大于零。本文為了優(yōu)化SVR模型,采用網(wǎng)格搜索法和5-折交叉驗證法,并結(jié)合交叉驗證均方誤差(Mean square error of cross-validation,MSECV)來確定參數(shù)組合(C,g)的值。MSECV越小,參數(shù)C和g越適用于該模型。
為了評估上述模塊的質(zhì)量和可靠性,采用決定系數(shù)(Coefficient of determination,R2)、均方根誤差(Root mean square error,RMSE)和絕對平均誤差(Absolute mean error,MAE)作為性能指標(biāo)。R2越接近1表明模型的擬合效果越好;RMSE用于表征模型預(yù)測值和測量值之間誤差,MAE為其平均絕對誤差,RMSE和MAE越小,表明模型的預(yù)測精度越高。
氧化物半導(dǎo)體式氣體傳感器在長時間未通電時,不管有沒有對象氣體存在,傳感器電阻RS在通電數(shù)秒鐘后都會突然急劇下降,然后逐漸上升并達(dá)到一個穩(wěn)定的水平。在預(yù)熱過程中發(fā)生的這種反應(yīng)被稱之為“初始動作”。因此,在測試試驗開始前,需要對傳感器陣列進行預(yù)熱。
3.1.1硫化氫響應(yīng)測試結(jié)果
傳感器陣列響應(yīng)測試按照1.3節(jié)的試驗方法進行。圖9為傳感器陣列對不同濃度硫化氫的響應(yīng)曲線。從圖9中可以看出,除了傳感器S5,其余傳感器對硫化氫均有響應(yīng)。在低濃度硫化氫中,傳感器S1、S2和S6響應(yīng)非常強烈,S8響應(yīng)也很明顯,其余傳感器響應(yīng)不太明顯;在高濃度硫化氫中,傳感器S1、S2、S6、S8響應(yīng)十分強烈,除了傳感器S5,其余傳感器較低濃度時響應(yīng)明顯。
3.1.2氨氣響應(yīng)測試結(jié)果
圖10為傳感器陣列對不同濃度氨氣的響應(yīng)曲線。從圖10中可以看出,傳感器陣列對氨氣均有響應(yīng),且隨著氨氣濃度的增大,傳感器響應(yīng)曲線呈上升趨勢;傳感器S5對低濃度氨氣響應(yīng)不明顯,但隨著氨氣濃度的增加,其響應(yīng)曲線呈明顯上升趨勢,說明傳感器陣列對氨氣濃度的變化響應(yīng)明顯。
3.1.3甲烷響應(yīng)測試結(jié)果
圖11為傳感器陣列對不同濃度甲烷的響應(yīng)曲線。從圖11中可以看出,傳感器S1、S2、S5對甲烷幾乎沒有響應(yīng),傳感器S1、S2在高濃度甲烷中響應(yīng)曲線有些下降,是受通氣時高濃度甲烷氣流的影響,導(dǎo)致傳感器電阻產(chǎn)生變化;傳感器S6響應(yīng)曲線呈下降趨勢,且對高低濃度的甲烷響應(yīng)不明顯;其余傳感器皆對不同濃度的甲烷氣體有明顯響應(yīng),其中傳感器S7、S8、S10響應(yīng)最為明顯。
從傳感器陣列對不同濃度、種類標(biāo)準(zhǔn)氣體的響應(yīng)曲線可以看出,傳感器S5只對高濃度氨氣響應(yīng),傳感器S1、S2對甲烷幾乎沒有響應(yīng),其余傳感器對不同濃度、種類的標(biāo)準(zhǔn)氣體皆有響應(yīng)且響應(yīng)結(jié)果不同,且隨著標(biāo)準(zhǔn)氣體濃度的增大傳感器陣列的響應(yīng)曲線也隨之上升,測試表明傳感器陣列具有較高的特異性和一定的交叉敏感性,為人工嗅覺系統(tǒng)的組建奠定了基礎(chǔ)。
采用重鉻酸鉀法得出了130個土樣土壤有機質(zhì)的含量,結(jié)果如表3所示,采用Kennard-Stone方法設(shè)置訓(xùn)練集和測試集之比為3∶1,即訓(xùn)練集和測試集各有97、33個樣本。在訓(xùn)練集中,土壤有機質(zhì)質(zhì)量比為13.26~50.55 g/kg,標(biāo)準(zhǔn)差為7.63 g/kg,變異系數(shù)為24.44%;而測試集中,土壤有機質(zhì)質(zhì)量比為12.19~53.53 g/kg,標(biāo)準(zhǔn)差為8.48 g/kg,變異系數(shù)為27.41%。研究區(qū)域中采集的土壤有機質(zhì)含量和樣本的變異系數(shù)變化趨勢較大,有利于提高模型的預(yù)測能力[34]。測試集中土壤有機質(zhì)質(zhì)量比的范圍完全覆蓋了訓(xùn)練集中土壤有機質(zhì)質(zhì)量比的范圍,有利于提高模型的泛化能力。
表3 土壤樣本的有機質(zhì)含量Tab.3 Organic matter content of soil samples
為了充分?jǐn)M合數(shù)據(jù),本研究采用留一交叉驗證法尋找主成分因子(Principal component factor,PCF),通過交叉驗證的均方根誤差(Root mean square error of cross validation,RMSECV)驗證模型的穩(wěn)健性,得到圖12所示RMSECV和PCF的關(guān)系圖。從圖12中可以看出,當(dāng)PCF數(shù)量為3、4個時,均方根誤差最小;且較少的PCF數(shù)量可以降低模型的復(fù)雜性,因此本研究采用4個PCF建立了PLSR模型。
利用已確定的PCF和人工嗅覺特征空間劃分的訓(xùn)練集建立PLSR模型,并采用測試集對模型進行驗證,如圖13所示。利用訓(xùn)練集建立的模型,其R2=0.8102 6,RMSE為3.499 2 g/kg,MAE為2.688 g/kg(圖13a),測試集的R2=0.808 78,RMSE為3.678 4 g/kg,MAE為3.107 9 g/kg(圖13b)。試驗結(jié)果表明,PLSR算法建立的模型,其訓(xùn)練集和測試集的R2大于0.80,RMSE和MAE均小于3.7 g/kg,模型具有一定的泛化能力。
采用Matlab 9.7.0.1190202(R2019b)中的神經(jīng)網(wǎng)絡(luò)工具箱建立BPNN模型。在BPNN建模中,隱含層采用S型傳遞函數(shù)tansig,輸出層采用線性傳遞函數(shù)purelin,并采用feedforwardnet函數(shù)創(chuàng)建前向傳播神經(jīng)網(wǎng)絡(luò)。將訓(xùn)練迭代次數(shù)設(shè)置為1 000,學(xué)習(xí)率設(shè)置為0.01,目標(biāo)誤差設(shè)置為0.001,用train函數(shù)將訓(xùn)練集代入神經(jīng)網(wǎng)絡(luò)。
為了選擇合適的隱含層神經(jīng)元數(shù)h,在以上確定的h取值范圍內(nèi),選取程序運行10次對應(yīng)決定系數(shù)的平均值作為評價指標(biāo),結(jié)果如表4所示。R2越大,表明模型的準(zhǔn)確性和泛化能力越好。當(dāng)h為8時,R2平均值為0.849 31,最大值為0.893 48,均為最大。因此,模型參數(shù)確定為60-8-1(60個輸入量,8個隱含層神經(jīng)元,1個輸出量),其訓(xùn)練集和測試集的預(yù)測結(jié)果如圖14所示。
表4 隱含層神經(jīng)元數(shù)對BPNN模型性能的影響Tab.4 Effect of number of hidden layer neurons on performance of BPNN model
試驗結(jié)果表明,BPNN算法建立的模型,其訓(xùn)練集的R2=0.893 48,RMSE為2.534 5 g/kg,MAE為1.899 2 g/kg(圖14a),測試集的R2=0.871 79,RMSE為3.161 4 g/kg,MAE為2.415 4 g/kg(圖14b),模型具有較好的擬合效果。
SVR模型的泛化能力主要受懲罰因子C和核參數(shù)g的影響,為了提高模型的預(yù)測精度,采用網(wǎng)格搜索法和5-折交叉驗證法,并結(jié)合交叉驗證均方誤差選擇參數(shù)組合(C,g)的值。圖15分別用等高線和3D視圖(MSECV經(jīng)mapminmax函數(shù)處理為0~1間的數(shù))顯示選定的支持向量回歸參數(shù)的結(jié)果,C和g的最佳值分別為128和0.001 953 1,MSECV為26.479 7 g/kg。
利用優(yōu)化后的C和g構(gòu)建SVR模型,得到如圖16所示結(jié)果。為觀察該模型的預(yù)測效果,本研究使用測試集對其進行檢驗。結(jié)果顯示,訓(xùn)練集R2=0.925 57,RMSE為2.112 4 g/kg,MAE為1.056 9 g/kg(圖16a);測試集R2=0.919 57,RMSE為2.425 4 g/kg,MAE為2.138 9 g/kg(圖16b)。這表明,網(wǎng)格搜索法和5-折交叉驗證法選擇的組合(C=128,g=0.001 953 1)具有良好的預(yù)測性能。
許多回歸模型均有較高的預(yù)測精度,如MLR、SVR和RBF等。為了選擇合適的預(yù)測模型,以提高土壤有機質(zhì)嗅覺檢測模型的泛化能力,采用BPNN、SVR和PLSR這3種算法分別對人工嗅覺特征空間的訓(xùn)練集和測試集進行測試。從圖13a、14a、16a可以看出,在PLSR、BPNN、SVR 3個訓(xùn)練集中,SVR的預(yù)測效果最好(R2最大,RMSE和MAE最小),BPNN次之,PLSR最差。但R2均大于0.81,表明3個模型具有較好的預(yù)測能力。
利用測試集對已經(jīng)訓(xùn)練完成的BPNN、SVR和PLSR模型進行測試,得到圖13b、14b、16b中的預(yù)測結(jié)果。為了進行更直接的比較,在圖17中繪制了不同模型的預(yù)測結(jié)果,并在表5中列出了相關(guān)預(yù)測性能。從圖17中可以看出樣本12、13、22在3種模型的預(yù)測值與實際土壤有機質(zhì)含量均有較大差異。原因可能是訓(xùn)練集中一個或幾個樣本的人工嗅覺測量過程中產(chǎn)生了誤差,這可能是由于操作不當(dāng)、人工嗅覺裝置本身的誤差或溫度、濕度等外部因素造成的。
從測試集的預(yù)測結(jié)果中可以看出(表5),3個模型的R2均大于0.80,表明所有模型都有較好的預(yù)測能力。因此,在3種算法中,SVR的預(yù)測精度最好,其次是BPNN,PLSR也獲得了較好的預(yù)測性能。SVR和BPNN比PLSR具有更高的預(yù)測性能,可能是因為土壤有機質(zhì)含量與人工嗅覺特征空間存在一定程度的非線性關(guān)聯(lián),而支持向量回歸機和BPNN比PLSR更適合非線性回歸。SVR的表現(xiàn)比BPNN好,主要原因可能是支持向量回歸機的模型學(xué)習(xí)能力更強,因為它使用了一組最佳參數(shù)組合(C,g)。
表5 PLSR、BPNN和SVR模型的SOM預(yù)測性能Tab.5 SOM prediction performance of PLSR, BPNN and SVR models
(1)采用10種不同類型的氧化物半導(dǎo)體式氣體傳感器構(gòu)建傳感器陣列,實現(xiàn)了利用人工嗅覺系統(tǒng)對土壤有機質(zhì)含量的檢測。采用不同濃度的硫化氫、氨氣和甲烷等標(biāo)準(zhǔn)氣體對傳感器陣列進行了響應(yīng)測試,從傳感器陣列對不同濃度、種類標(biāo)準(zhǔn)氣體的響應(yīng)曲線可以看出,傳感器S5只對高濃度氨氣響應(yīng),傳感器S1、S2對甲烷幾乎沒有響應(yīng),其余傳感器對不同濃度、種類的標(biāo)準(zhǔn)氣體皆有響應(yīng)且響應(yīng)結(jié)果不同,這體現(xiàn)了氣體傳感器陣列較高的特異性和一定的交叉敏感性,且隨著標(biāo)準(zhǔn)氣體濃度的增大傳感器陣列的響應(yīng)曲線也隨之增大。
(2)對比分析了PLSR、BPNN和SVR 3種算法在基于多傳感器人工嗅覺系統(tǒng)的土壤有機質(zhì)含量檢測方法的檢測精度。采用此3種算法建立人工嗅覺特征空間與土壤有機質(zhì)含量之間的關(guān)系模型,以R2、RMSE和MAE作為性能指標(biāo),將3種模型的預(yù)測能力進行比較。結(jié)果表明,3種模型對土壤有機質(zhì)含量均有較好的預(yù)測能力,其中SVR顯示出最大的精度和最小的RMSE和MAE。這種表現(xiàn)在一定程度上可能是由于土壤有機質(zhì)含量和人工嗅覺特征空間之間的非線性相關(guān)性,以及支持向量回歸機較強的學(xué)習(xí)能力。因此,支持向量回歸模型可以作為評估土壤有機質(zhì)含量的有效工具。
(3)試驗結(jié)果表明,人工嗅覺系統(tǒng)給測定土壤有機質(zhì)含量提供了支持,該方法穩(wěn)健有效,且為預(yù)測和簡化土壤有機質(zhì)含量的測定提供了依據(jù)。