陳 穎,楊 惠,肖春艷,趙學(xué)亮,,李 康,龐麗麗,史彥新,劉崢瑩,李少華
1. 燕山大學(xué)電氣工程學(xué)院河北省測試計(jì)量技術(shù)及儀器重點(diǎn)實(shí)驗(yàn)室,河北 秦皇島 066004 2. 河南理工大學(xué)資源與環(huán)境學(xué)院,河南 焦作 454000 3. 中國地質(zhì)調(diào)查局水文地質(zhì)環(huán)境地質(zhì)調(diào)查中心,自然資源部地質(zhì)環(huán)境監(jiān)測工程技術(shù)創(chuàng)新中心,河北 保定 071051 4. 河北先河環(huán)??萍脊煞萦邢薰?,河北 石家莊 050035
土壤重金屬污染問題一直備受人們廣泛關(guān)注,土壤重金屬不易被分解,且易于累積,不僅會隨著食物鏈進(jìn)入人體,危害人體健康,更會影響生態(tài)系統(tǒng)的平衡。目前土壤中重金屬元素的檢測方法有紫外可見分光光度法[1]、原子吸收光譜法[2]、電感耦合等離子體質(zhì)譜法[3]、化學(xué)消解法[4]等。這些傳統(tǒng)檢測方法存在檢測速度慢、操作復(fù)雜、易造成污染、精度低等問題,而本實(shí)驗(yàn)采用XRF法對土壤重金屬元素進(jìn)行檢測,具有檢測速度快、精度高、操作簡單等優(yōu)點(diǎn),可同時(shí)對土壤中多種元素進(jìn)行檢測,能更好的滿足實(shí)驗(yàn)的需求[5]。
近幾年,深度卷積神經(jīng)網(wǎng)絡(luò)及XRF法已經(jīng)得到了快速的發(fā)展,被廣泛地應(yīng)用在生物學(xué)、地質(zhì)學(xué)、食品學(xué)、醫(yī)學(xué)以及合金材料等領(lǐng)域。Chen等[6]采用一種由數(shù)據(jù)驅(qū)動(dòng)的閾值策略的小波去噪方法,并將該方法應(yīng)用于檢測除風(fēng)機(jī)軸承旋轉(zhuǎn)機(jī)械故障中,具有很好的實(shí)用性; Ng W等[7]建立卷積神經(jīng)網(wǎng)絡(luò)分類模型,結(jié)合近紅外光譜根據(jù)土壤中微塑料的濃度將采集的土壤樣本分類為不同的污染等級,提高了分類的準(zhǔn)確性; 李靈巧等[8]采用深度卷積網(wǎng)絡(luò)模型,對藥品近紅外光譜進(jìn)行分析研究,建立不同廠商、不同藥品的分類模型,將該模型與多種淺層神經(jīng)網(wǎng)絡(luò)分類模型相對比,通過大量實(shí)驗(yàn)數(shù)據(jù)驗(yàn)證,該方法可以對不同廠商、不同藥品的近紅外光譜數(shù)據(jù)進(jìn)行準(zhǔn)確可靠的分類預(yù)測。目前人們將卷積神經(jīng)網(wǎng)絡(luò)算法實(shí)際多用于人臉識別、語音識別和檢測以及圖片處理分類等領(lǐng)域,卷積神經(jīng)網(wǎng)絡(luò)是被認(rèn)為學(xué)習(xí)圖像內(nèi)容的最佳技術(shù)之一,通過查閱文獻(xiàn)可知基于深度卷積神經(jīng)網(wǎng)絡(luò)模型在近紅外光譜處理領(lǐng)域研究較多,而在X射線熒光光譜處理以及對土壤中重金屬元素含量預(yù)測方面應(yīng)用較少。
本文提出基于深度卷積神經(jīng)網(wǎng)絡(luò)-X射線熒光光譜法對土壤中重金屬Zn元素含量預(yù)測模型,將X射線熒光光譜法與深度卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合,通過粉末壓片法制作土壤壓片,采集土壤熒光光譜數(shù)據(jù),結(jié)合箱型圖、熵權(quán)法、多元散射校正、Savitzky-Golay平滑去噪法以及線性本底法對光譜數(shù)據(jù)進(jìn)行預(yù)處理,根據(jù)卷積神經(jīng)網(wǎng)絡(luò)對圖數(shù)據(jù)處理的優(yōu)越表現(xiàn),將獲取的一維光譜數(shù)據(jù)向量,采用構(gòu)建光譜數(shù)據(jù)矩陣的方式來進(jìn)行處理,將同一含水率下、同一重金屬濃度下的5組平行光譜數(shù)據(jù)向量轉(zhuǎn)化為二維光譜信息矩陣的形式,以此作為深度卷積神經(jīng)網(wǎng)絡(luò)模型的輸入,同時(shí)探究了不同學(xué)習(xí)率、不同迭代次數(shù)下該預(yù)測模型的預(yù)測性能,并與BP,ELM和PLS等模型相對比,為土壤中重金屬Zn元素含量的精確預(yù)測提供了新思路。
儀器: CIT-3000SYB能量色散X熒光分析儀(四川新先達(dá)測控技術(shù)有限公司),艾澤拉小型研磨機(jī)(艾澤拉有限公司),瑞紳葆PrepP-01 100T XRF用大噸位壓片機(jī)(瑞紳葆分析技術(shù)上海有限公司),電動(dòng)攪拌器,佰輝電熱鼓風(fēng)干燥箱,不同規(guī)格土壤篩等。
試劑: Zn標(biāo)準(zhǔn)溶液,去離子水,工業(yè)酒精等。
實(shí)驗(yàn)土壤樣本取自河北省保定市周邊村莊,由于土壤表層易受雨水沖刷,風(fēng)力遷移等自然條件的影響,會導(dǎo)致表層土壤重金屬元素含量的流失,而重金屬元素由于長時(shí)間的沉積會富集在土壤表層下具有診斷意義的亞表層,故采用網(wǎng)格法布點(diǎn)采集地面10~40 cm處土壤作為實(shí)驗(yàn)樣本,去除土壤雜質(zhì),采用粉末壓片法來制作土壤壓片,放入研磨機(jī)中研磨并過200目篩,再置于烘干箱中烘至恒重,確保去除土壤中水分。配置100,200,400,600和800 mg·kg-1等5個(gè)不同重金屬濃度的Zn元素重金屬溶液,將其與烘干過篩后的土壤均勻混合攪拌,由于華北平原土壤的含水率區(qū)間在10%~25%之間,故將Zn標(biāo)準(zhǔn)溶液采用加去離子水及烘干標(biāo)液法來控制土壤壓片的含水率在10%~25%之間。當(dāng)含水率在10%~15%之間時(shí),制備的土壤壓片表面平滑,可用于熒光光譜的采集,當(dāng)含水率在15%以上時(shí),制備的土壤壓片粘連,表面不平整,無法進(jìn)行檢測,故采用樣品盒代替壓片進(jìn)行測試[9]。
在X射線熒光光譜采集之前先將能譜儀預(yù)熱5 min以保持儀器正常穩(wěn)定工作,然后將制作好的土壤壓片放入能譜儀樣品腔中進(jìn)行檢測,檢測時(shí)間為2 min,即可獲得含有多種重金屬元素的土壤熒光光譜數(shù)據(jù)。
本研究主要以檢測土壤中重金屬元素Zn為主,通過XRF法獲得土壤壓片原始光譜數(shù)據(jù),由重金屬元素Zn的特征X射線標(biāo)定其特征峰位置,熒光強(qiáng)度為標(biāo)定特征峰的凈峰面積。將光譜數(shù)據(jù)進(jìn)行預(yù)處理,包括異常光譜數(shù)據(jù)剔除、樣品盒數(shù)據(jù)校正、光譜去噪、本底扣除等操作,將同一濃度、同一含水率下的5組平行光譜數(shù)據(jù)向量轉(zhuǎn)化為二維光譜信息矩陣形式,以此來作為深度卷積神經(jīng)網(wǎng)絡(luò)的輸入,提高了預(yù)測模型對土壤中重金屬元素Zn含量的預(yù)測精度,并將深度卷積神經(jīng)網(wǎng)絡(luò)預(yù)測模型與BP,ELM,PLS三種預(yù)測模型進(jìn)行對比,驗(yàn)證了該模型的優(yōu)越性。
在光譜數(shù)據(jù)獲取過程中,由于周圍環(huán)境因素、人為因素等導(dǎo)致光譜數(shù)據(jù)出現(xiàn)異常,使后期模型預(yù)測結(jié)果誤差較大,故在建立模型之前需要對光譜數(shù)據(jù)進(jìn)行異常值剔除操作。本實(shí)驗(yàn)采用箱型圖去除異常光譜數(shù)據(jù),利用箱型圖可以很直觀識別光譜數(shù)據(jù)中的異常點(diǎn),數(shù)據(jù)點(diǎn)在Q1—Q3之間為正常光譜數(shù)據(jù),數(shù)據(jù)點(diǎn)高于上限或是低于下限為極端異常值,應(yīng)予以剔除,數(shù)據(jù)點(diǎn)在Q3至上限之間或在下限與Q1之間為溫和值,不予剔除。取五組光譜數(shù)據(jù)進(jìn)行檢測,由圖1可知第二組光譜數(shù)據(jù)有一個(gè)異常數(shù)據(jù)點(diǎn)為7.636,應(yīng)予以剔除。
圖1 異常值剔除Fig.1 Outlier rejection
在土壤壓片樣本制作過程中,在含水率區(qū)間10%到25%之間設(shè)置10個(gè)等含水率梯度,當(dāng)采用含水率大于15%的土壤進(jìn)行壓片時(shí),在10 MPa壓力下,壓片易粘連變形,導(dǎo)致土壤壓片檢測面不平整,無法進(jìn)行測量,故用樣品盒代替土壤壓片進(jìn)行測量。由圖2(a)光譜曲線可知,在同一濃度,同一含水率條件下,采用樣品盒土壤測得的熒光光譜曲線相比于壓片測得的熒光光譜曲線中Zn元素的特征峰波峰下降,波寬變窄,相應(yīng)的凈峰面積減少,所以需對樣品盒光譜數(shù)據(jù)進(jìn)行校正,減少測量誤差。首先對同一重金屬濃度,同一含水率條件下4個(gè)壓片數(shù)據(jù)進(jìn)行處理,通過熵權(quán)法根據(jù)光譜數(shù)據(jù)的變異程度,利用信息熵對每一個(gè)壓片數(shù)據(jù)指標(biāo)的權(quán)重進(jìn)行修正,使得壓片指標(biāo)權(quán)重更為客觀,以此來獲得平均壓片光譜數(shù)據(jù)[10]。再通過多元散射校正來對樣品盒數(shù)據(jù)進(jìn)行校正,以平均壓片光譜數(shù)據(jù)作為理想光譜數(shù)據(jù),對樣品盒光譜數(shù)據(jù)進(jìn)行修正,由圖2(a)和(b)所示,經(jīng)校正后的樣品盒數(shù)據(jù)更貼近土壤壓片數(shù)據(jù),可以有效地消除土壤樣品顆粒大小,裝填密度等不同引起的散射影響,有效的提高光譜的信噪比[11]。
圖2 土壤樣品盒光譜校正圖(a): 校正前光譜對比; (b): 校正后光譜對比Fig.2 Soil sample box spectral correction chart(a): Spectrum comparison before correction;(b): Comparison chart of corrected spectrum
由于測量環(huán)境和能譜儀在采集光譜,獲取光譜以及傳輸光譜的過程中,受到各種噪聲的干擾[12],影響光譜數(shù)據(jù)的分析,因此要對光譜進(jìn)行去噪處理,本實(shí)驗(yàn)采用5點(diǎn)2次Savitzky-Golay卷積平滑去噪法來對光譜進(jìn)行處理,該方法操作簡單,功能強(qiáng)大,在光譜去噪處理中被廣泛應(yīng)用。圖3(a)為去噪處理后光譜數(shù)據(jù)對比圖,經(jīng)過處理后提高了光譜的平滑性,降低了光譜噪聲的干擾。另外利用X射線熒光光譜法快速檢測樣品時(shí),X射線與樣品間相互作用產(chǎn)生的相干及非相干散射、康普頓散射等,會導(dǎo)致X射線信號峰生成本底,產(chǎn)生基線漂移現(xiàn)象,為此在光譜解析前必須扣除本底,本研究采用線性本底法有效地扣除了光譜本底,圖3(b)為扣除本底后光譜對比圖。
圖3 土壤光譜數(shù)據(jù)處理(a): 土壤光譜去噪對比; (b): 本底扣除對比Fig.3 Processing of soil spectral data(a): Comparison of soil spectral denoising;(b): Background deduction comparison
由于深度卷積神經(jīng)網(wǎng)絡(luò)特殊的深度學(xué)習(xí)結(jié)構(gòu),需先對光譜數(shù)據(jù)進(jìn)行歸一化處理,再將提取歸一化后的光譜數(shù)據(jù)向量轉(zhuǎn)化為二維光譜信息矩陣,以適應(yīng)卷積層的操作要求,充分發(fā)揮深度卷積神經(jīng)網(wǎng)絡(luò)預(yù)測模型的表達(dá)能力。取道址范圍100~700區(qū)間內(nèi)600個(gè)光譜數(shù)據(jù)點(diǎn)作為模型的輸入,共取245組光譜即(245×600),輸出為土壤中重金屬Zn元素的含量值,由于卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的特殊性,實(shí)驗(yàn)過程中,對同一含水率、同一重金屬濃度下測得5組平行光譜數(shù)據(jù),即以5組平行光譜數(shù)據(jù)構(gòu)建光譜信息矩陣,對應(yīng)輸出一個(gè)土壤中重金屬Zn元素含量預(yù)測值。如此就將245×600的光譜數(shù)據(jù)轉(zhuǎn)化為49×5×600形式,對應(yīng)輸出49組土壤重金屬Zn元素的含量,圖4為深度卷積神經(jīng)網(wǎng)絡(luò)預(yù)測模型結(jié)構(gòu)圖。
本研究采用三層深度卷積神經(jīng)網(wǎng)絡(luò)預(yù)測模型,三層卷積核尺寸都設(shè)置為3×1、步長設(shè)置為1×1,卷積核個(gè)數(shù)每層依次為16,32和64,模型使用ReLU激活函數(shù)激活,池化層采用最大池化方式,池化步長設(shè)置為2×1以減少數(shù)據(jù)的維度,提高訓(xùn)練效率。在全連接層和輸出層之間加入Dropout層,防止過擬合,使用ADAM優(yōu)化器對預(yù)測模型進(jìn)行優(yōu)化[13]。首先將總光譜數(shù)據(jù)劃分為39個(gè)訓(xùn)練集和10個(gè)測試集,通過樣本LOSS,MAE,MRE以及MSE來評價(jià)預(yù)測模型的好壞,預(yù)測模型的LOSS越小,代表預(yù)測值與真實(shí)值之間差異越小,模型的魯棒性越好。本次研究采用LOSS,MAE和MRE等三項(xiàng)指標(biāo)來確定三層卷積神經(jīng)網(wǎng)絡(luò)最優(yōu)的學(xué)習(xí)率及迭代次數(shù),如表1所示。
圖4 深度卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.4 Structure of deep convolutional neural network
表1 卷積神經(jīng)網(wǎng)絡(luò)參數(shù)Table 1 Convolutional neural network parameters
由表1數(shù)據(jù)可以發(fā)現(xiàn),在深度卷積神經(jīng)網(wǎng)絡(luò)預(yù)測模型中,當(dāng)固定模型迭代次數(shù)次η=2 000時(shí),學(xué)習(xí)率ε=10-3時(shí),模型的預(yù)測效果最好,同理固定模型學(xué)習(xí)率ε=10-3時(shí),迭代次數(shù)η=3 000時(shí),模型的預(yù)測效果最好,因此,當(dāng)深度卷積神經(jīng)網(wǎng)絡(luò)預(yù)測模型的學(xué)習(xí)率ε=10-3,迭代次數(shù)次η=3 000時(shí),模型的LOSS,MAE和MRE都最小,模型具有較好的預(yù)測效果,預(yù)測模型的MSE為5.466×10-7、RMSE為7.393×10-4、R2為0.955 9,通過預(yù)測模型計(jì)算的Zn含量預(yù)測效果如圖5(a)和(b)所示。
將基于深度卷積神經(jīng)網(wǎng)絡(luò)預(yù)測模型與淺層神經(jīng)網(wǎng)絡(luò)預(yù)測模型進(jìn)行對比分析,對比模型包括BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型、ELM預(yù)測模型、以及PLS預(yù)測模型,通過MSE,RMSE以及R2來分析比較基于深度卷積神經(jīng)網(wǎng)絡(luò)預(yù)測模型的好壞,對比結(jié)果如表2所示。
由表2可以發(fā)現(xiàn),深度卷積神經(jīng)網(wǎng)絡(luò)的MSE以及RMSE分別達(dá)到5.466×10-7和7.393×10-4,相比于淺層神經(jīng)網(wǎng)絡(luò)預(yù)測模型,深度卷積神經(jīng)網(wǎng)絡(luò)預(yù)測模型預(yù)測的重金屬Zn元素的含量值要更加精確,另外卷積神經(jīng)網(wǎng)絡(luò)預(yù)測模型的決定系數(shù)為0.958 3,相比于BP,ELM和PLS三種預(yù)測模型,曲線的擬合程度也比另外三種預(yù)測模型效果要好,因此利用深度卷積神經(jīng)網(wǎng)絡(luò)-X射線熒光光譜法對土壤中重金屬Zn元素含量預(yù)測具有較好的準(zhǔn)確性和精確度,具有可行性。
圖5 Zn元素含量預(yù)測圖(a): 四種預(yù)測模型測試集數(shù)據(jù)對比;(b): 3-CNN訓(xùn)練集數(shù)據(jù)對比Fig.5 Zn element content prediction chart(a): Data comparison of four prediction model test sets;(b): 3-CNN training set data comparison
表2 預(yù)測模型對比Table 2 Comparison of prediction models
通過粉末壓片法制作土壤壓片,采用XRF法獲得土壤X射線熒光光譜數(shù)據(jù),利用箱型圖、熵權(quán)法、多元散射校正、Savitzky-Golay平滑去噪法以及線性本底法等對土壤X射線熒光光譜數(shù)據(jù)進(jìn)行處理,并建立基于深度卷積神經(jīng)網(wǎng)絡(luò)-X射線熒光光譜法的預(yù)測模型來對土壤中重金屬Zn元素含量進(jìn)行預(yù)測,可以得到如下結(jié)論:
(1) 采用熵權(quán)法,根據(jù)采集到的光譜數(shù)據(jù)的差異性客觀分配權(quán)重,以此獲得平均壓片光譜數(shù)據(jù),再結(jié)合多元散射校正,將平均壓片光譜數(shù)據(jù)作為理想光譜數(shù)據(jù)來對樣品盒光譜數(shù)據(jù)進(jìn)行校正,減少了預(yù)測模型的預(yù)測誤差,使預(yù)測結(jié)果更加精確。
(2) 研究分析了在不同學(xué)習(xí)率、不同迭代次數(shù)等條件下,預(yù)測模型的預(yù)測性能,確定了深度卷積神經(jīng)網(wǎng)絡(luò)預(yù)測模型最優(yōu)的學(xué)習(xí)率為10-3以及最優(yōu)的迭代次數(shù)為3 000。
(3) 根據(jù)卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)結(jié)構(gòu),采用構(gòu)建光譜信息矩陣的方式,將同一含水率、同一重金屬濃度下5組平行光譜數(shù)據(jù)向量轉(zhuǎn)化成二維光譜信息矩陣的形式能更好的適應(yīng)卷積層的操作要求,利用卷積神經(jīng)網(wǎng)絡(luò)局部連接、權(quán)值共享、卷積池化操作以及多層結(jié)構(gòu)特點(diǎn),能有效提取土樣壓片X射線熒光光譜數(shù)據(jù)的局部特征,充分發(fā)揮了卷積神經(jīng)網(wǎng)絡(luò)預(yù)測模型的表達(dá)能力。
(4) 將深度卷積神經(jīng)網(wǎng)絡(luò)預(yù)測模型與BP預(yù)測模型、ELM預(yù)測模型、PLS預(yù)測模型進(jìn)行對比,通過預(yù)測模型的MSE,RMSE和R2可知基于XRF-CNN的預(yù)測模型具有很好的精確度和準(zhǔn)確性。
在土壤重金屬污染中,Zn元素只是重金屬污染所包含元素之一,該預(yù)測模型的建立對土壤中其他重金屬如Cr,Cd,As,Pb等元素含量的預(yù)測也具有重要的借鑒意義,為未來土壤污染中重金屬元素的定量檢測提供了相應(yīng)的技術(shù)支持。