袁 備,徐送寧,寧日波,李 倩,韓艷麗
(沈陽理工大學(xué) 理學(xué)院,沈陽 110159)
對于物質(zhì)含量的定量分析是LIBS(激光誘導(dǎo)擊穿光譜)技術(shù)的重要應(yīng)用,進一步提高LIBS光譜定量分析精度是LIBS技術(shù)進入實際應(yīng)用的關(guān)鍵。近年來基于梯度下降法的BP-ANN(誤差反向傳播神經(jīng)網(wǎng)絡(luò))具有較強的預(yù)測功能,有利于減弱基體效應(yīng)的影響,在光譜分析中具有重要的應(yīng)用價值和前景[1-3],逐漸被國外的一些研究者用于LIBS定量分析中。Inakollu等[4]將BP-ANN與傳統(tǒng)一元定標方法進行對比研究,發(fā)現(xiàn)大部分情況下BP-ANN性能更好。在光譜分析中,特征提取方法對定量分析結(jié)果起著重要作用[5-7]。傳統(tǒng)的峰值強度、譜峰面積、譜峰半高寬等方法應(yīng)用較為廣泛,但這些光譜特征提取方法存在明顯缺陷;峰值強度為特征信息雖然處理簡單,但數(shù)據(jù)單一,對譜線信息表征不足,且峰值強度由于儀器及實驗環(huán)境引起的變化較大,穩(wěn)定性較差;譜峰面積及半高寬作為特征值在出現(xiàn)峰重疊時提取困難,易引起計算誤差,且計算量較大。許多研究者在光譜特征提取方法上做了大量工作,孫蘭香等[8]將BP-ANN應(yīng)用于不同種類鋼中的Mn和Si定量分析研究并與普通內(nèi)標法做對比,表明BP-ANN應(yīng)用于LIBS定量分析能有效減小基體效應(yīng)和譜線間干擾對定量分析的影響,從而提高了LIBS的檢測精度。Sirven等[9]利用激光誘導(dǎo)擊穿光譜檢測三種摻Cr的土壤樣品,用主元分析法和BP-ANN對不同土壤樣品進行辨識,發(fā)現(xiàn)BP-ANN在實況分析、抗噪聲干擾和抗光譜波擾方面呈現(xiàn)更強的辨識能力;之后利用BP-ANN對樣品進行定量分析,獲得了近4%~5%的相對標準差。
本文基于銅合金的激光誘導(dǎo)擊穿光譜數(shù)據(jù),選取合金中待檢測Pb元素405.78nm和基體Cu元素406.27nm特征譜線作為定量分析譜線,分別采用主元提取法和峰值強度提取法得到定量分析的數(shù)據(jù)樣本,而后利用BP-ANN建立定量分析的模型,研究不同特征提取方式對光譜定量分析精度的影響。
實驗裝置如圖1所示。主要包括調(diào)Q脈沖Nd:YAG固體激光器、光譜儀、衰減器、三維精密移動平臺和數(shù)據(jù)采集計算機。Nd:YAG固體激光器激光波長為1064nm,脈寬為8ns,頻率2Hz,激光通過衰減器衰減后穩(wěn)定在100mJ。光柵光譜儀(Andor公司)光柵參數(shù)1800,檢測范圍為390~410nm,積分時間為15μs。激光經(jīng)過衰減器與100mm焦距平凸透鏡聚焦在樣品表面。實驗樣品放置在三維精密移動平臺上,光譜儀探頭距離靶點約15cm,與激光束夾角45°,等離子體輻射光由光譜照明系統(tǒng)經(jīng)光纖耦合到光譜儀。實驗通過計算機中Andor-Solis軟件操控ICCD(Intensified Charge-Coupled Device)進行采集信號延時和門寬的設(shè)定,將激光脈沖發(fā)出的時刻作為延時零點。使用增強型電荷耦合器件對光譜儀中的分光信號進行處理和增強,增益水平設(shè)置為0。
圖1 實驗裝置圖
實驗采用原冶金部的銅合金光譜標準樣品(編號:ByG1906-2;牌號:HBP59-1 鉛黃銅)作為標定樣品,樣品中Pb的含量如表1[10]所示。
采用LIBS實驗系統(tǒng)獲取合金樣品的光譜數(shù)據(jù),激光脈沖對一個樣品點連續(xù)采集20次光譜數(shù)據(jù),前十次激光脈沖用于祛除樣品表面雜質(zhì),選取后10次的光譜數(shù)據(jù)作為定量分析所用。每個樣品采集20個不同位置的光譜數(shù)據(jù),共計產(chǎn)生樣本光譜數(shù)目為200。圖2為采集樣品譜線圖,選擇Pb元素405.78nm靈敏線作為分析線。
圖2 原始樣品光譜圖
由圖2可知,分析線附近干擾線較少,距離分析線較遠的譜線干擾較小可選擇忽略,同時為使模型能對基體效應(yīng)實現(xiàn)矯正,從光譜圖中截取405.4~406.84nm作為最終分析光譜,每個樣本共計158個數(shù)據(jù)點,其中406.27nm特征譜峰為基體元素Cu特征譜線。
2.1.1 隨機平均化
在光譜采集過程中,由于儀器、能量、脈寬、溫度、氣壓等各種實驗條件會不可避免的產(chǎn)生隨機波動,造成光譜的最終測量結(jié)果同理想光譜產(chǎn)生浮動偏差,極大地增加了從光譜中提取有效且準確的樣品含量信息的難度,使光譜分析精度降低。因此為使最終的分析光譜樣本能更大程度地反應(yīng)光譜理想信息,減小光譜隨機波動的影響,同時保證樣本的相互獨立性,采用無放回隨機平均化方法對原始光譜進行預(yù)處理:將每個樣品所得到的全部200個光譜數(shù)據(jù)作為一個集合R,從集合R中每次隨機無放回的取出10個光譜進行平均化處理,得到一個待分析的樣本放入集合F中;對每個樣品的光譜數(shù)據(jù)集合進行20次此過程,則每個樣品最終可得到20個樣本,6個樣品共可得到120個供后期光譜定量分析使用的樣本集F。同一樣品隨機平均化預(yù)處理前后譜線浮動情況如圖3所示。利用隨機平均化前后Pb405.78nm譜線峰值強度的波動情況作為衡量實驗誤差的標準。
由圖3可知,平均預(yù)處理前,上下波動為400,相對偏差為9.8%;平均預(yù)處理后,上下波動為104,相對偏差為2.6%。
2.1.2 譜線歸一化
在利用BP-ANN對LIBS定量分析建立定標曲線時,為提高模型訓(xùn)練速度,對數(shù)據(jù)進行優(yōu)化處理。本文采用單位向量化方法(將光譜數(shù)據(jù)看作一個多維空間中的向量)對120個光譜樣本進行單位向量化,相當于將120個多維向量進行單位向量化,在不造成譜線形狀失真的情況下達到數(shù)據(jù)歸一化的目的,圖4為歸一化后光譜樣本譜線。
圖3 平均預(yù)處理前后Pb譜線強度變化情況
由圖4可以看出,歸一化的譜線在保留光譜特性的情況下縮減了強度范圍,降低了后期訓(xùn)練的計算難度。
2.1.3 主元提取方法提取特征
PCA(主元提取方法)基本思想是采用一種數(shù)學(xué)降維的方法,找出幾個綜合變量來代替原來的眾多變量,使這些綜合變量能盡可能多地代表原來變量的信息量,且彼此互不相關(guān),以達到合理地簡化變量的目的。PCA的算法步驟如下。
(1)數(shù)據(jù)集Xmxn;
(2)按列計算數(shù)據(jù)集X的均值Xmeaxn,然后令Xnew=X-Xmean;
(3)求解矩陣Xnew的協(xié)方差矩陣,并將其記為Cov;
(4)計算協(xié)方差矩陣Cov的特征值和相應(yīng)的特征向量;
(5)將特征值按照從大到小的排序,選擇其中較大的K個,然后將其對應(yīng)的K個特征向量分別作為列向量組成特征向量矩陣Wnxk;
(6)計算XnewWnxk,即將數(shù)據(jù)集Xnew投影到選取的特征向量上,XnewWnxk即為降低維數(shù)后的新數(shù)據(jù)集。
對歸一化樣本光譜應(yīng)用主元分析方法提取足以代表光譜信息的主元個數(shù),
根據(jù)貢獻率的計算
圖4 歸一化后譜線圖
由圖5可知,當選取主元個數(shù)大于2后,貢獻率增加逐漸緩慢。為檢驗主元提取方法對光譜主要特征提取結(jié)果質(zhì)量,分別通過提取的兩個主元及Pb 405.78nm和Cu 406.27nm的峰值強度對六個樣品含量進行分類,分類結(jié)果如圖6所示。
由圖6可以看出,利用主元分類相對于利用峰值強度分類具有更顯著的類別區(qū)分度,表明主元特征提取在噪聲降低和信息提取程度上具有更明顯的優(yōu)勢。
圖5 貢獻率隨主元選取個數(shù)的變化情況
圖6 不同特征提取方式含量分類結(jié)果
為減弱過擬合效應(yīng),考慮應(yīng)盡量降低模型的復(fù)雜度,因此將BP-ANN的輸入神經(jīng)元確定為2個,隱含層神經(jīng)元數(shù)量為3個,輸出神經(jīng)元個數(shù)為1,激活函數(shù)為tansig,訓(xùn)練函數(shù)采用trainlm。采用上述經(jīng)過輸入優(yōu)化的網(wǎng)絡(luò)對LIBS進行定量分析。將樣品H1-1至H1-5的100個主成分樣本作為訓(xùn)練集對模型進行訓(xùn)練,得到定標模型;將樣品H1-6的20個樣本作為測試集,用來評估主元提取BP-ANN模型(PCA-BP-ANN)對LIBS定量分析所得結(jié)果的優(yōu)劣,定標模型如圖7a所示。為檢驗主元提取方法對LIBS定量分析結(jié)果的優(yōu)化情況,選擇圖4中405.78nm附近的兩條譜線(Pb 405.78nm和Cu 406.3nm)的峰值強度作為輸入向量,將樣品H1-1至H1-5的共計100個樣本作為訓(xùn)練集對模型進行訓(xùn)練,并將樣品H1-6的20個樣本作為測試集用來檢驗?zāi)P偷挠行?定標模型如圖7b所示。
圖7 兩種特征提取方法下網(wǎng)絡(luò)訓(xùn)練結(jié)果
由圖7可以看出,兩種特征提取方式利用BP-ANN訓(xùn)練后均有較好的相關(guān)系數(shù),分別為0.989和0.987,說明BP-ANN方法對光譜進行分析時表現(xiàn)良好。圖8為兩種不同特征提取方式最終建立的定標曲線用于檢測訓(xùn)練集之外的樣品含量時所得測量值的離散圖。
圖8 兩種定標模型檢測結(jié)果離散情況示意圖
由圖8可以直觀地看出,主元提取的加入對于最終測量的穩(wěn)定性和精度都有很大提高。對于未參加訓(xùn)練的樣品H1-6,BP-ANN模型的檢測值相對偏差為2.3%;而PCA-BP-ANN模型的檢測值相對偏差僅為0.3%,表明主元提取方法的使用能夠大大增加BP-ANN模型的泛化能力及精確度。產(chǎn)生這種結(jié)果的原因可能是:對Pb特征譜峰405.78nm及基體元素Cu譜峰406.27nm來說,單純的峰值強度難以表征譜線的全部信息且峰值變化波動較大,使測試結(jié)果偏差較大;相對于選擇峰值強度,主元提取方法提取整段光譜的主元,雖然輸入層神經(jīng)元個數(shù)仍為2個,但卻是綜合整段光譜的信息,而不再僅僅取決于峰值點強度,因此能夠提高數(shù)據(jù)的抗干擾能力,使LIBS檢測精度提高,檢測誤差降低。
在利用LIBS對銅合金中Pb元素進行的定量分析中,分別采用主元提取方法和峰值強度法提取特征,結(jié)合BP-ANN方法建立了定標模型,得到的相關(guān)系數(shù)(R2)均表現(xiàn)良好,分別為0.989、0.986。利用建立的定標模型對未參加訓(xùn)練的測試集樣本進行定量檢測,其中利用峰值強度模型的平均相對檢測偏差為2.3%,而主元提取模型平均相對檢測偏差為0.3%,偏差明顯降低,證明在LIBS定量分析中不同的特征選取方法會直接影響最終的檢測結(jié)果。主元提取的方法由于光譜信息利用率較高和一定的降噪作用,對光譜數(shù)據(jù)波動的抗干擾能力較強,因此能夠更大程度的提高激光誘導(dǎo)擊穿光譜定量分析結(jié)果的精度與穩(wěn)定性。