林曉梅,黃玉濤,林京君,陶思宇,車長金
1. 長春工業(yè)大學電氣與電子工程學院,吉林 長春 130012 2. 長春工業(yè)大學機電工程學院,吉林 長春 130012
土壤是維持人類生存和生活的重要組成部分。隨著工業(yè)化程度的不斷提高,工業(yè)生產(chǎn)中產(chǎn)生的重金屬廢棄物也越來越多,并在土壤中不斷累積,對土壤造成很嚴重的污染。同時這些重金屬還會通過動植物進入食物鏈,最終進入人體,對身體健康造成很大的影響[1]。因此,提高土壤重金屬定量分析的精確度和穩(wěn)定性意義重大。
在檢測土壤成分含量的過程中,常用的方法有原子吸收分光光度法、X射線熒光光譜法、電感耦合等離子體質(zhì)譜法和中子活化法等。激光誘導等離子體技術(LIBS)是一種成分含量分析光譜技術[2]。相對于以上幾種檢測方法,LIBS技術具有無需制樣、檢測時間短、可多元素同時檢測等優(yōu)勢[3],被逐漸應用于土壤定性、定量分析領域。Ramli Muliadi等[4]用LIBS技術檢測土壤中的Cs元素,檢測限為0.3 ppm。Edilene C Ferreira等[5]用人工神經(jīng)網(wǎng)絡對Cu元素的定標曲線進行校準,使Cu的檢測限降到2.3 ppm。Li等[6]通過把電火花放電和LIBS技術相結合,進行土壤中Cr等元素的檢測,把光譜的信噪比提高了2~3倍。谷艷紅等[7]把CF-LIBS與LIBS技術相結合,提高了土壤中Cr元素含量分布的準確度。這些研究側重于檢測技術的結合和樣品檢出限的提高,但對樣品精確度和穩(wěn)定性的研究較少。由于土壤的基體效應較大[8],會對定量分析產(chǎn)生很大影響,降低LIBS的分析精度。本工作主要研究了偏最小二乘法(PLS)和最小二乘支持向量機(LSSVM)算法在提高土壤精確度和穩(wěn)定性檢測方面的效果。
首先研究了能量和延時對譜線強度和信噪比的影響,同時為了降低土壤基體效應對譜線的影響,提高LIBS的重復性和檢測精度,在最佳實驗條件下,分析對比了PLS和LSSVM算法對定標模型的影響。通過擬合系數(shù),均方根誤差和平均相對誤差等參數(shù)對結果進行評價,得到最佳的定標模型。
實驗裝置如圖1所示。用輸出波長為1 064 nm,脈沖寬度為8 ns,脈沖頻率為1~10 Hz的Nd∶YAG激光器(Nimma-400型,中國鐳寶光電)作為光源。激光經(jīng)過焦距為150 mm的聚焦透鏡,將能量聚焦在樣品表面,使樣品激發(fā)產(chǎn)生等離子體,等離子體的光譜信號經(jīng)光纖探頭耦合至具有CCD的四通道光譜儀(Avaspec-ULS2048CL-4-EVO型,荷蘭Avantes)進行分光等處理。實驗中用三維移動平臺(YMC400,中國江云光電)來控制樣品的移動,激光器與光譜儀由數(shù)字延時發(fā)生器(BNC575,美國Berkeley Nucleonics Corp)同步控制,觸發(fā)信號為激光器的調(diào)Q信號。光譜儀的探測延時為0.9 μs。為了降低因能量波動對實驗帶來的影響,取不同位置光譜的平均值作為實驗最終譜線。
圖1 實驗系統(tǒng)原理圖Fig.1 Schematic diagram of the experimental system
實驗中所用的樣品由標準土壤樣品GBW07403和結晶狀的Cu(NO3)2混合而成。先將混合好的樣品反復研磨,再對樣品進行烘干處理。取5 g樣品放入模具中,用壓片機施加30 MPa的壓強,持續(xù)30 min,壓制成直徑30 mm,厚度3 mm的圓餅形薄片。壓制好的樣品如圖2所示,樣品濃度如表1所示。
偏最小二乘法(PLS)是一種多元線性回歸方法,通過提取元素濃度和譜線強度的主成分,實現(xiàn)多因變量對多自變量的回歸建模。最小二乘支持向量機(LSSVM)是基于支持向量機(SVM)發(fā)展而來的機器學習方法,把SVM中的不等式
圖2 實驗樣品圖Fig.2 Pictures of experimental samples
表1 樣品中Cu元素的濃度Table 1 Certified concentration (Wt%) of Cu in the samples
約束替換為等式約束,訓練過程的復雜度大大降低,并且能夠較好地解決高維度和非線性的問題[9]。在LSSVM算法中,把徑向基函數(shù)作為核函數(shù),用留一驗證法進行參數(shù)尋優(yōu)。該模型的優(yōu)化問題可以表示為
(1)
式(1)中,w為權向量,ei為誤差向量,λ為正則化參數(shù),用來平衡最優(yōu)超平面與最小偏差量,該式的約束條件為
yi[wTφ(xi)+b]=1-ei,i=1,…,N
(2)
式(2)中,b為偏差向量,φ(xi)為核空間映射函數(shù),提取原始空間中的數(shù)據(jù)特征,把原始樣本數(shù)據(jù)映射到高維空間中進行處理。
最終可得LSSVM回歸模型為
(3)
式(3)中,αi為Lagrange乘子,k(x,xi)為滿足mercer條件下的核函數(shù)。
本實驗對每種濃度樣品取9組數(shù)據(jù),其中6組作為訓練集,3組作為預測集,建立定標摸型。并對數(shù)據(jù)進行Lorenz擬合,用預測集的偏離程度驗證兩種算法在降低基體效應和自吸收效應方面的效果。
實驗檢測了樣品在190~557 nm范圍內(nèi)的光譜數(shù)據(jù)[10]。由于土壤中Cu元素的特征譜線受附近譜線的影響較大,因此對比各特征譜線受影響程度,選擇Cu Ⅰ 324.75 nm和Cu Ⅰ 327.40 nm兩條較好的特征譜線進行分析。對Cu Ⅰ 324.75 nm譜線產(chǎn)生影響的是Ti Ⅱ 324.86 nm譜線,由于選取的GBW07403標準土樣含Ti量很低,且衰減很快,因此把Ti Ⅱ 324.86 nm對Cu Ⅰ 324.75 nm的影響忽略不計。綜合光譜強度和美國原子光譜數(shù)據(jù)庫(NIST)的部分參數(shù),選擇Cu Ⅰ 324.75 nm譜線作為Cu的分析線。兩條Cu線的參數(shù)對比如表2所示。由于Cu在土壤中屬于微量元素,而Fe是土壤中的基體元素,含量相對穩(wěn)定,因此選擇Fe Ⅰ 393.26 nm作為內(nèi)標元素。
表2 Cu Ⅰ 324.75 nm與Cu Ⅰ 327.40 nm的參數(shù)對比Table 2 Comparison of the parameters of Cu Ⅰ 324.75 nm and Cu Ⅰ 327.40 nm
2.2.1 激光能量對特征譜線的影響
激光誘導產(chǎn)生等離子體的過程中,激光能量的大小會對特征譜線和信噪比(SNR)產(chǎn)生影響[11]。Cu Ⅰ 324.75 nm的譜線強度和信噪比隨激光能量的變化如圖3所示。由圖可以看出,能量在30~90 mJ之間,譜線強度和信噪比隨能量的增加而增加。分析認為在此過程中,等離子體密度不斷增加,并逐漸達到臨界值。激光能量在到達90 mJ后,譜線強度和信噪比開始趨于平緩。這是由于過高的能量使等離子體產(chǎn)生屏蔽效應,對后沿激光產(chǎn)生一定程度的散射,激光能量不能完全到達樣品表面。因此,選擇90 mJ作為本實驗使用的最佳能量。
圖3 激光能量對譜線強度和SNR的影響Fig.3 The influence of laser energy onthe spectral intensity and SNR
2.2.2 采集延時對特征譜線的影響
在等離子體光譜信號的采集過程中,采集延時對光譜強度和信噪比會產(chǎn)生很大的影響[12]。具體變化如圖4所示,采集延時在0 ns時,光譜的信噪比比較低。推測等離子體產(chǎn)生初期,由于韌致輻射和復合輻射的作用,信號光譜會有很高的背景噪聲。隨著采集延時的不斷增加,韌致輻射和復合輻射的逐漸衰減,并且衰減速度比原子發(fā)射光譜的衰減速度快,因此,采集延時在0~1 000 ns時,信噪比逐漸增加并達到最高值。采集延時在1 000 ns之后,由于等離子體不斷冷卻擴散,使得譜線強度和信噪比不斷降低。因此,選擇1 000 ns作為本次使用的最佳采集延時。后續(xù)實驗均在最佳能量和最佳延時條件下進行。
圖4 采集延時對譜線強度和SNR的影響Fig.4 The influence of delay time onthe spectral intensity and SNR
2.3.1 基于內(nèi)標法的定標模型
內(nèi)標法是最常用來的定量分析方法之一,尤其是土壤的基體效應比較明顯,內(nèi)標法可以在一定程度上抑制基體效應,降低實驗環(huán)境變動對譜線的影響[13]。在用內(nèi)標法做定標模型時,把每個濃度的樣品各采集9組數(shù)據(jù),以其中6組數(shù)據(jù)做訓練集,3組數(shù)據(jù)做預測集。把訓練集和預測集的全部數(shù)據(jù)擬合在一起,通過擬合系數(shù)R2來觀察模型的擬合效果。擬合結果如圖5所示。由圖可知,訓練集的均方根誤差(RMSEC)為3.448 8 Wt%,預測集的均方根誤差(RMSEP)為1.280 7 Wt%,表明該模型的精確度較低。平均相對誤差(ARE)為13.340 0%,說明該模型的穩(wěn)定性不高,而且從擬合系數(shù)可以看出,擬合效果還有待提高,特別是濃度在2 Wt%和4 Wt%時,預測集濃度出現(xiàn)大幅度的偏離。
圖5 基于內(nèi)標法的定標模型Fig.5 Calibration model based on internal standard method
2.3.2 基于PLS的定標模型
偏最小二乘法是一種常用的數(shù)學優(yōu)化方法,可以在一定程度上降低土壤基體效應帶來的誤差,對定標模型進行校準。用實驗采集的所有數(shù)據(jù)建立實際濃度與預測濃度之間的關系曲線。擬合結果如圖6所示。由圖可以看出,定標曲線的R2有了很大幅度的提高,提高到了0.985 1,RMSEC和RMSEP均有了很大程度的降低,降低到了0.1 Wt%量級,大大提高了模型的精確度。同時該模型的ARE降低到了7.455 6%,說明該模型的穩(wěn)定性有了一定的提升,但仍然無法滿足實驗要求,需要進一步優(yōu)化。
圖6 基于PLS的定標模型Fig.6 Calibration model based on PLS
2.3.3 基于LSSVM的定標模型
PLS算法的引入雖然在一定程度上提高了模型的精確度和穩(wěn)定性,但提高程度仍然不夠,因此引入了LSSVM算法來對定標模型進行校準。校準結果如圖7所示。從圖中可以看出,定標曲線的R2有了明顯的提高,提高到了0.997 6,擬合效果較好。同時,RMSEC和RMSEP分別下降到了0.018 7 Wt%和0.149 1 Wt%,ARE下降到了2.137 0%。相比于內(nèi)定標法和PLS,LSSVM的RMSE和ASE均得到了很大程度的降低,模型的穩(wěn)定性和精確度都得到大幅度的提高,基本消除了因基體效應和自吸收效應給實驗結果帶來的影響。具體對比結果如表3所示。
圖7 基于LSSVM的定標模型Fig.7 Calibration model based on LSSVM
表3 內(nèi)標法、PLS和LSSVM數(shù)據(jù)對比Table 3 Internal standard method, PLS and LSSVM data comparison
實驗首先對激光能量和采集延時進行優(yōu)化,選取最佳能量為90 mJ,最佳延時為1 000 ns,在此最佳實驗條件下分別利用內(nèi)標法、PLS和LSSVM對土壤中的Cu元素建立定標模型。對比可以看出,內(nèi)標法定標模型的穩(wěn)定性和精確度都很不理想,擬合系數(shù)R2只有0.870 1,RMSEC和RMSEP分別為3.448 8 Wt%和1.280 7 Wt%。說明實驗結果波動性較大,而ARE高達13.340 0%,說明模型穩(wěn)定性較差,很難實現(xiàn)定標曲線的精確校準。用PLS建立的定標模型,R2提高到了0.985 1,RMSEC和RMSEP分別降低為0.111 4 Wt%和0.251 1 Wt%,和內(nèi)標法相比精確度有了很大的提高。ARE相比于內(nèi)標法雖然也有了很大降低,但是模型的穩(wěn)定性依然較差,無法滿足實驗要求。而用LSSVM建立的定標模型,與內(nèi)標法和PLS相比,模型的精確度和穩(wěn)定性都有很好的提高。R2提高到0.997 6,RMSEC和RMSEP分別下降到0.018 7 Wt%和0.149 1 Wt%。同時,ARE與內(nèi)標法的相比提高了6.24倍,說明LSSVM的穩(wěn)定性較好,能夠滿足實驗要求,適合用以提高定標模型的精確度和穩(wěn)定性。