江曉宇 李福生 王清亞 郝 軍 徐木強(qiáng) 羅 杰
(1.東華理工大學(xué)核資源與環(huán)境國(guó)家重點(diǎn)實(shí)驗(yàn)室, 南昌 330013;2.東華理工大學(xué)核技術(shù)應(yīng)用教育部工程研究中心, 南昌 330013;3.長(zhǎng)江大學(xué)資源與環(huán)境學(xué)院, 武漢 430100)
能量色散X射線熒光(Energy dispersive X-ray fluorescence, EDXRF)光譜儀是一種間接定量分析儀器,可對(duì)多種重金屬元素進(jìn)行快速同步分析[1],除了能無(wú)損檢測(cè)外,EDXRF因其體積小、質(zhì)量輕、分析速度快及準(zhǔn)確度高而廣泛應(yīng)用于野外現(xiàn)場(chǎng)分析中[2-3]。近幾年,EDXRF已經(jīng)成為地質(zhì)、鋼鐵、石油、環(huán)境和醫(yī)學(xué)等領(lǐng)域的首選儀器[4]。在獲取X射線熒光光譜的過程中,儀器本身(如SSD探測(cè)器和采集板)產(chǎn)生的統(tǒng)計(jì)漲落所帶來(lái)的噪聲干擾以及X射線管出射譜中連續(xù)軔致輻射造成的背景干擾噪聲是高頻信號(hào),基線變化是低頻信號(hào)?;€問題是一個(gè)相對(duì)復(fù)雜的問題,理論上很難研究出一種完美的方法來(lái)處理基線問題。通常直線用于連接信號(hào)峰的兩端,以直線為基線,在此基礎(chǔ)上進(jìn)一步計(jì)算峰面積或峰高。如果直線不符合實(shí)際基線,則計(jì)算就會(huì)產(chǎn)生誤差。
近年來(lái),研究人員提出了各種基線校正方法,例如小波變換[5-7]、多項(xiàng)式擬合[8-9]、傅里葉變換[10-13]、形態(tài)學(xué)[14]和懲罰最小二乘[15]。其中,懲罰最小二乘算法因其在光譜背景扣除中的高效率和簡(jiǎn)便性而被廣泛采用。1922年,懲罰最小二乘由WHITTAKER[16]首次提出,并用作數(shù)據(jù)平滑,隨后研究人員在懲罰最小二乘算法的基礎(chǔ)上進(jìn)行了很多改進(jìn)[17-21]。雖然改進(jìn)的基于懲罰最小二乘算法的基線校正方法在近紅外光譜領(lǐng)域取得了一些良好的實(shí)驗(yàn)效果,但在X射線光譜分析領(lǐng)域的具體應(yīng)用效果還有待進(jìn)一步研究和探討。
本文選擇5種懲罰最小二乘(或其改進(jìn))算法,結(jié)合PLS技術(shù)分別對(duì)土壤樣品中的鉛、砷元素建立X射線熒光光譜定量分析模型,并對(duì)比分析模型的相關(guān)指標(biāo),選取最適合X射線熒光光譜基線校正的算法,然后采用選好的PLS模型分別與神經(jīng)網(wǎng)絡(luò)(BP)[22-24]和支持向量機(jī)(SVR)[25-27]所建立的模型進(jìn)行對(duì)比分析,以選擇較優(yōu)的土壤中X射線熒光光譜定量分析模型,以期為土壤污染調(diào)查分析提供技術(shù)支持,也為懲罰最小二乘算法在X射線光譜領(lǐng)域的研究應(yīng)用提供理論基礎(chǔ)。
主要儀器:TS-XH4000型便攜式X射線熒光光譜儀,浙江泰克松德能源科技有限公司;SDD探測(cè)器,能量分辨率為125 eV,美國(guó)Amptek公司;球磨儀,江蘇宜興丁蜀浩強(qiáng)機(jī)械設(shè)備有限公司;樣品杯(聚乙烯),尺寸為Φ3 cm×1 cm,單開口,帶固定麥拉膜的頸圈;麥拉膜,厚3.6 μm,寬7.6 cm,美國(guó)Chemplex公司。
本實(shí)驗(yàn)中,共計(jì)樣品89個(gè),其中野外采集土壤樣品30個(gè)(江西省鄱陽(yáng)湖地區(qū)),另外59個(gè)為國(guó)家土壤標(biāo)準(zhǔn)樣品,其中20個(gè)水系沉積物標(biāo)準(zhǔn)物質(zhì)(GSD)和39個(gè)土壤標(biāo)準(zhǔn)物質(zhì)(GSS系列),樣品來(lái)源多樣,且基本覆蓋了全國(guó)大部分土壤質(zhì)地。樣品采集和制備方法嚴(yán)格按照土壤環(huán)境質(zhì)量標(biāo)準(zhǔn)(GB 15618—2018)中的技術(shù)規(guī)范執(zhí)行。將采集的土壤樣品自然風(fēng)干,除去土壤樣品中沙石、草屑、動(dòng)物碎片等明顯的異物,使用四分法取2份,1份用于實(shí)驗(yàn)分析,1份備用。將國(guó)家標(biāo)準(zhǔn)認(rèn)證樣品和實(shí)驗(yàn)分析的土壤樣品均勻填入瑪瑙缽體中,在球磨儀上研磨5 min后,取出粉末過200目篩子。將處理后的土壤樣品使用便攜式XRF分析儀在管壓35 keV、電流40 μA和時(shí)間90 s下,采集土壤X射線熒光光譜數(shù)據(jù),測(cè)量時(shí)每個(gè)樣本測(cè)量3次,3次移動(dòng)不同位置,取平均值作為光譜數(shù)據(jù),共獲取樣品在0~45 keV范圍內(nèi)共2 048個(gè)通道的光譜信息。
Kennard-Stone(K-S)算法[28]作為樣本劃分方法將光譜原始數(shù)據(jù)的69個(gè)樣品作為訓(xùn)練集,20個(gè)樣品作為預(yù)測(cè)集。
1.3.1懲罰最小二乘算法
假設(shè)y為原始光譜信號(hào),長(zhǎng)度為N。用z表示擬合基線的向量,長(zhǎng)度也為N。則懲罰最小二乘方法中z對(duì)y的保真度F為
(1)
式中yi——y在通道i時(shí)的信號(hào)強(qiáng)度
zi——z在通道i時(shí)的信號(hào)強(qiáng)度
ωi——權(quán)重
ωi可以表示為對(duì)角線矩陣W
(2)
擬合的基線z的粗糙度R表示為
(3)
對(duì)于原始數(shù)據(jù)保真度和擬合基線數(shù)據(jù)粗糙度之間的平衡,采用保真度權(quán)重和平滑參數(shù)來(lái)調(diào)節(jié),可以描述為
Q=F+λR=W‖y-z‖2+λ‖Dz‖2
(4)
式中D——2階差分矩陣
λ——平滑參數(shù)
Q——綜合變量,表示原始基線與擬合基線保真度與粗糙度間的平衡
z=(W+λDTD)-1Wy
(5)
因此,式(2)、(5)是懲罰最小二乘算法的基本形式。該算法的核心思想是如何選擇合適的平滑參數(shù)λ和權(quán)重向量W。其中,加權(quán)方案一直受到大家的關(guān)注和重視。一般來(lái)說,非峰值區(qū)域的權(quán)重應(yīng)接近于1,峰值區(qū)域的權(quán)重應(yīng)接近于零。
1.3.2算法實(shí)現(xiàn)
根據(jù)實(shí)驗(yàn),所有基于懲罰最小二乘(或者改進(jìn))算法的程序都在計(jì)算機(jī)上使用Matlab 2016b編寫。懲罰最小二乘(或者改進(jìn))算法的基本實(shí)現(xiàn)步驟為:
(1)輸入原始X射線熒光光譜數(shù)據(jù)y。
(2)加載最優(yōu)參數(shù):最大迭代次數(shù)Itermax、平滑參數(shù)λ和初始化權(quán)重ω。
(3)迭代次數(shù)從t=1開始,對(duì)權(quán)重ω進(jìn)行初始化ω1=[1,1,…,1],則權(quán)重矩陣W為對(duì)角矩陣,Wt=1=diag(1,1,…,1)。
(4)將初始權(quán)重ω1代入式(5),通過懲罰最小二乘擬合基線數(shù)據(jù)zt。
(5)計(jì)算X射線熒光光譜與擬合基線之間的殘差信號(hào)d=y-z,標(biāo)準(zhǔn)差σ和估計(jì)權(quán)重ω。
(6)判斷是否滿足迭代終止條件或者達(dá)到最大迭代次數(shù),若不滿足轉(zhuǎn)步驟(5),否則轉(zhuǎn)至步驟(7)。
(7)迭代終止,輸出最優(yōu)基線z并計(jì)算校正后的光譜y。
采集到的土壤原始X射線熒光光譜數(shù)據(jù)包含儀器操作、土壤背景和散射效應(yīng)等引起的噪聲和無(wú)關(guān)信息,因此在對(duì)光譜數(shù)據(jù)進(jìn)行操作之前,需要對(duì)光譜進(jìn)行平滑去噪處理,有助于消除干擾因素。以國(guó)家土壤標(biāo)準(zhǔn)物質(zhì)GSS-7為例,采用信噪比(SNR)作為去噪效果評(píng)價(jià)指標(biāo),去噪處理采用以下方法:樣品顆粒分布不均勻及顆粒粒徑產(chǎn)生的散射影響,使用多元散射校正法(MSC)消除。光譜平滑去噪采用小波變換進(jìn)行處理,小波基函數(shù)選取sym4,計(jì)算不同分解層數(shù)下的SNR,結(jié)果見表1。可以看出,光譜信號(hào)在分解層數(shù)為7層時(shí),去噪效果最好,效果見圖1,其信噪比為19.712 7 dB。
表1 sym4小波函數(shù)在不同分解層數(shù)時(shí)的去噪結(jié)果
以國(guó)家土壤標(biāo)準(zhǔn)物質(zhì)GSS-7為例,5種基線校正方法擬合得到基線如圖2所示。從圖2中可以看出,DRPLS算法對(duì)基線有較好的擬合效果,所得的估計(jì)基線能夠更好地?cái)M合本底,估計(jì)基線與X射線熒光光譜的真實(shí)基線最為接近,可以精確擬合土壤實(shí)際光譜目標(biāo)元素特征峰附近的基線,且基線校正后的本底扣除最為明顯。而ASLS、ARPLS和LRSPLS算法所得估計(jì)基線存在著不同程度的位置偏低現(xiàn)象,從而低估了土壤樣品實(shí)際光譜的基線,而這一現(xiàn)象也間接證明了ASLS、ARPLS和LRSPLS的加權(quán)方案總是受到實(shí)際光譜噪聲的影響。另外,AIRPLS算法的估計(jì)基線沿著底部信號(hào)中間穿過,而不是沿著X射線熒光光譜真實(shí)基線的底部,這將造成校正后光譜向下凹起,進(jìn)而導(dǎo)致譜強(qiáng)度偏小,小峰無(wú)法識(shí)別,從而影響對(duì)X射線熒光光譜的后續(xù)分析,特別是定量分析結(jié)果的準(zhǔn)確性。
為了更具體地比較不同方法對(duì)實(shí)測(cè)光譜信號(hào)擬合的效果,刪去校正后光譜特征峰區(qū)域的數(shù)據(jù),然后求取信號(hào)方差。方差越小,說明校正后信號(hào)的基線越平緩,擬合效果越好,去除特征峰后信號(hào)的方差如表2所示。
由表2可以看出,與其他4種方法相比,DRPLS算法在土壤樣品實(shí)測(cè)數(shù)據(jù)中得到的方差最小,為1.52×10-3,說明DRPLS算法在樣品非特征峰區(qū)的基線不會(huì)太高或太低,校正后的基線最平緩,波動(dòng)最小,擬合效果最好。綜上所述,該方法可以有效地去除XRF譜的基線,為后續(xù)定量分析模型的精度提高提供了保障。
表2 去除特征峰后信號(hào)的方差
利用原始數(shù)據(jù)和使用5種處理方法對(duì)土壤樣品X射線熒光光譜進(jìn)行基線校正處理后的光譜數(shù)據(jù)繪制校準(zhǔn)曲線,分別基于PLS建模,進(jìn)行鉛和砷元素的定量分析,結(jié)果見圖2和表3。由表3可以看出:不同算法基線校正處理對(duì)PLS模型精度的影響差異明顯,6種光譜基線校正方法中,鉛的預(yù)測(cè)集R2最大為0.982,最小為0.912;RMSECV和RMSEP最大分別為0.233 mg/kg和0. 239 mg/kg,最小分別為0.113 mg/kg和0.056 mg/kg。圖2表示2種元素的5種基線校正方法的校正效果,從圖2和表2中均可看出,AIRPLS的效果最差,經(jīng)基線扣除后的RMSECV和RMSEP 最大,且低于無(wú)基線處理的PLS模型。圖2b的DRPLS基線校正的結(jié)果表明,經(jīng)基線校正處理后,原始光譜的基線有較明顯改善。根據(jù)表2和表3可以看出,DRPLS基線校正后的模型訓(xùn)練集和預(yù)測(cè)集R2、RMSECV和RMSEP均有提高,且主成分?jǐn)?shù)也減少,改善了模型的精度。結(jié)合表2、3和圖2并從多個(gè)指標(biāo)綜合考慮,相比較其他幾種基線校正方法,可以得出DRPLS基線校正處理方法對(duì)PLS模型精度改善最好,但也可以看出不是所有的懲罰最小二乘基線校正算法均對(duì)PLS模型精度有改善,有可能對(duì)模型產(chǎn)生負(fù)影響。
表3 基線校正后的結(jié)果
為了驗(yàn)證該最優(yōu)算法在不同模型中對(duì)定量分析的影響,將鉛和砷元素作為定量分析對(duì)象,用本實(shí)驗(yàn)所用便攜式X射線熒光光譜儀對(duì)土壤樣品(共89個(gè))進(jìn)行檢測(cè),每個(gè)樣品測(cè)量3次,對(duì)應(yīng)的計(jì)數(shù)率取平均值,與其相應(yīng)的標(biāo)準(zhǔn)值(CRMs)進(jìn)行PLS、BP和SVR建模,以模型決定系數(shù)(R2)和預(yù)測(cè)均方根誤差(RMSEP)作為評(píng)價(jià)標(biāo)準(zhǔn),對(duì)不同模型建模的預(yù)測(cè)結(jié)果進(jìn)行評(píng)價(jià)。
評(píng)估最佳PLS、BP和SVR模型的實(shí)際預(yù)測(cè)能力是利用預(yù)測(cè)集中的20個(gè)未知樣本進(jìn)行的。采用DRPLS對(duì)土壤重金屬鉛和砷的光譜基線校正后進(jìn)行PLS、BP和SVR建模,20個(gè)預(yù)測(cè)集預(yù)測(cè)值與實(shí)測(cè)值的擬合結(jié)果見圖3~5。鉛和砷的預(yù)測(cè)值和實(shí)測(cè)值的R2和RMSEP見表4,通過對(duì)比分析R2和 RMSEP,可以得出DRPLS-SVR具有最佳回歸效果,鉛和砷的R2分別為0.998和0.993,RMSEP分別為0.015 mg/kg和0.596 mg/kg,相比較于無(wú)任何基線校正處理,SVR不僅在精度方面有較大的提升,比DRPLS-BP在時(shí)間性能方面也有所提高,且與DRPLS-PLS相比具有更好的泛化性能和預(yù)測(cè)效果。
表4 2種重金屬的預(yù)測(cè)值和實(shí)測(cè)值的擬合結(jié)果
綜上所述, SVR比PLS模型和BP模型更適用于土壤重金屬濃度的測(cè)定,因?yàn)镾VR模型具有較高的準(zhǔn)確性。
經(jīng)DRPLS基線校正處理后結(jié)合SVR建模的預(yù)測(cè)值與實(shí)測(cè)值(均值,n=3)的結(jié)果如表5所示,從表5可以看出,DRPLS基線校正后鉛和砷的預(yù)測(cè)值和實(shí)測(cè)值的相對(duì)標(biāo)準(zhǔn)偏差(RSD)范圍分別為0.56%~4.35%、0.61%~4.85%,未經(jīng)處理相對(duì)標(biāo)準(zhǔn)偏差范圍為0.67%~15.1%、1.16%~13.5%,基線校正后的元素相對(duì)標(biāo)準(zhǔn)偏差均小于10%,相對(duì)誤差(RE)基本小于5%??梢姴捎肈RPLS基線校正預(yù)處理后,建立的SVR模型對(duì)2種重金屬元素具有良好的預(yù)測(cè)效果。優(yōu)化后方法實(shí)測(cè)值與標(biāo)準(zhǔn)值也更接近,符合土壤環(huán)境監(jiān)測(cè)技術(shù)規(guī)范里的要求,所以,采用算法處理后的儀器擁有更好的精密度和準(zhǔn)確性,儀器檢測(cè)水平得到極大提升。
表5 DRPLS背景扣除前后SVR建模的預(yù)測(cè)結(jié)果與實(shí)際值
此外,DRPLS基線校正算法能在去除基線漂移的同時(shí)保留光譜的有效信息,從而提升了光譜定量分析的準(zhǔn)確性,進(jìn)一步驗(yàn)證了該算法可以有效應(yīng)用于實(shí)際X射線熒光光譜處理,并取得了較好的效果。
(1)研究選取了89個(gè)土壤樣本,采用手持式XRF儀獲取土壤重金屬原始光譜,并對(duì)原始光譜采用sym4小波基進(jìn)行小波變換平滑去噪處理。結(jié)果表明,在分解層數(shù)為7層時(shí),去噪效果最好,信噪比最高,達(dá)到了19.712 7 dB。
(2)對(duì)比了土壤重金屬光譜的無(wú)基線校正處理以及ASLS、LRSPLS、ARPLS、AIRPLS、DRPLS等基線校正方法的處理效果。結(jié)果表明,與其他5種方法相比,DRPLS算法在土壤光譜中的方差最小,為0.001 52,說明DRPLS算法校正后的基線波動(dòng)最小,擬合效果最好。
(3)采用DRPLS算法基線校正后的光譜分別采用 PLS、BP和SVR進(jìn)行定量建模分析,結(jié)果顯示SVR回歸得到的建模效果最好,鉛和砷預(yù)測(cè)值和實(shí)測(cè)值的R2分別達(dá)到0.998和0.993。