• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    激光誘導(dǎo)擊穿光譜(LIBS)結(jié)合字典學(xué)習(xí)對(duì)氣溶膠光譜數(shù)據(jù)篩選方法的研究

    2024-01-13 13:47:12李雨亭陳靖陳文杰袁茼珊王啟璇
    關(guān)鍵詞:譜線氣溶膠字典

    李雨亭 韋 中* 陳靖 陳文杰 袁茼珊 王啟璇 蔣 焱 丁 宇

    (1.南京信息工程大學(xué) 江蘇省大數(shù)據(jù)分析技術(shù)重點(diǎn)實(shí)驗(yàn)室,南京 210044;2.南京信息工程大學(xué) 江蘇省大氣環(huán)境與裝備技術(shù)協(xié)同創(chuàng)新中心,南京 210044;3.南京信息工程大學(xué) 江蘇省氣象能源利用與控制工程技術(shù)研究中心,南京 210044)

    氣溶膠是氣體介質(zhì)中細(xì)小的固態(tài)或液態(tài)顆粒的懸浮體系[1],在大氣輻射收支平衡、氣候變化、以及環(huán)境污染研究等方面起著重要作用[2]。因此,利用有效的手段測(cè)量和分析氣溶膠的元素組成具有重要意義。激光誘導(dǎo)擊穿光譜(LIBS)是一種新興的元素含量分析技術(shù)[3],具備多元素分析和原位測(cè)量等技術(shù)優(yōu)勢(shì)[4],已廣泛應(yīng)用于氣溶膠以及顆粒物檢測(cè)等實(shí)際應(yīng)用場(chǎng)景[5-9]。然而,由于氣溶膠中離散顆粒物的空間分布不均勻[10],導(dǎo)致發(fā)射的激光脈沖無(wú)法每次均能擊中離散的顆粒,從而產(chǎn)生大量的無(wú)效光譜。這些無(wú)效的光譜數(shù)據(jù)將會(huì)對(duì)后續(xù)的定量分析產(chǎn)生不利的影響,通常需要研究人員耗費(fèi)大量的時(shí)間進(jìn)行剔除。因此,在LIBS應(yīng)用于氣溶膠分析時(shí),迫切需要尋求一種方法來(lái)篩選有效光譜數(shù)據(jù),從而改善后續(xù)定量分析等研究的效果。

    近年來(lái),研究人員針對(duì)氣溶膠光譜數(shù)據(jù)篩選開(kāi)展了大量研究。CARRANZA等[11]發(fā)現(xiàn)由于氣溶膠中顆粒的采樣率較低,將采集到的全部光譜數(shù)據(jù)進(jìn)行平均可能會(huì)限制特征譜線的信噪比。故提出一種條件數(shù)據(jù)分析法來(lái)篩選光譜數(shù)據(jù),通過(guò)比較特征譜線的強(qiáng)度與相鄰無(wú)特征連續(xù)光譜區(qū)域的發(fā)射強(qiáng)度,若兩者比值高于閾值,則識(shí)別為有效數(shù)據(jù)。篩選過(guò)的數(shù)據(jù)信噪比比未篩選的信噪比高出70%到150%。BUCKLEY等[12]采用LIBS檢測(cè)焚化爐中有毒金屬顆粒物的濃度,對(duì)采集到的光譜數(shù)據(jù)用條件數(shù)據(jù)分析法篩選。與全部光譜取平均值相比,采用篩選后的數(shù)據(jù)進(jìn)行研究可以提高檢測(cè)的靈敏度,得到更低的檢出限(LOD)。LITHGOW等[13]通過(guò)計(jì)算元素譜線的峰基比(Peak-to-base,P/B)對(duì)城市環(huán)境中含金屬的PM2.5濃度進(jìn)行研究,與絕對(duì)峰值法相比,P/B可以減少等離子體能量變化對(duì)研究的影響。CARRANZA等[14]對(duì)比了P/B和信噪比法(SNR)的可靠性,隨著閾值增加,無(wú)效光譜的誤判率隨之降低。此外,與P/B相比,SNR為光譜分析提供了更可靠的評(píng)價(jià)方法。YAO等[15]提出一種新的光譜篩選方案——標(biāo)準(zhǔn)差法(SD),通過(guò)對(duì)比SD法、SNR法和絕對(duì)峰值法對(duì)光譜數(shù)據(jù)的識(shí)別性能,得出SD法不僅可以更準(zhǔn)確地區(qū)分光譜數(shù)據(jù),且其閾值能適應(yīng)檢測(cè)條件的發(fā)生。

    綜上所述,SNR、SD等方法都屬于閾值篩選法,這類算法雖然可以簡(jiǎn)便地對(duì)數(shù)據(jù)進(jìn)行篩選,但是它只關(guān)注于單個(gè)特征值,通常忽略數(shù)據(jù)的整體分布。因此,本文提出一種結(jié)合字典學(xué)習(xí)的氣溶膠光譜數(shù)據(jù)篩選方法(K-SVD-SVM)。其中字典學(xué)習(xí)以K-SVD算法為基礎(chǔ),結(jié)合SVM實(shí)現(xiàn)對(duì)有效光譜數(shù)據(jù)的篩選。研究中,使用準(zhǔn)確率(Accuracy)、精確率(Precision)、召回率(Recall)、精確率和召回率的調(diào)和平均(F1)來(lái)評(píng)估模型的性能。

    1 實(shí)驗(yàn)部分

    1.1 裝置

    本實(shí)驗(yàn)采用液體霧化的實(shí)驗(yàn)方式,實(shí)驗(yàn)裝置如圖1所示,由激光器、延時(shí)發(fā)生器、反射鏡、聚焦透鏡、光纖、光譜儀、氣溶膠發(fā)生器、樣品和計(jì)算機(jī)組成。激光光源為輸出波長(zhǎng)1 064 nm的Nd:YAG激光器(Dawa 200,Beamtech),脈沖能量200 mJ、重復(fù)頻率2 Hz。激光脈沖經(jīng)反射鏡反射,被透鏡(f=150 mm)聚焦到NaCl氣溶膠氣團(tuán)內(nèi)。誘導(dǎo)擊穿產(chǎn)生的等離子體被水平放置的光纖探針收集并耦合進(jìn)入光譜儀(Avantes,AvaSpec-ULS2048-2-USB2,198 ~ 400 nm、分辨率0.07 nm;AvaSpec-ULS4096CL-EVO,400~938 nm、分辨率0.3 nm)。

    圖1 實(shí)驗(yàn)裝置圖Figure 1 Experimental device diagram.

    1.2 樣品制備

    本實(shí)驗(yàn)利用去離子水將氯化鈉稀釋制備成7種不同濃度梯度的NaCl溶液作為實(shí)驗(yàn)樣品,如表1所示。NaCl溶液經(jīng)氣溶膠發(fā)生器霧化為氣溶膠樣品。首先,對(duì)NaCl溶液(10%)采集5 000條光譜,用于定性分析以評(píng)估分類算法的性能。再對(duì)7種不同濃度的NaCl氣溶膠樣本額外各采集500條光譜,總計(jì)獲得3 500 條光譜,用于定量分析。

    表1 標(biāo)準(zhǔn)樣品中Na濃度Table 1 Concentration of Na in standard samples

    1.3 算法介紹

    1.3.1 字典學(xué)習(xí)

    字典學(xué)習(xí)(Dictionary learning)是一種受到人類大腦的啟發(fā)而發(fā)展起來(lái)的機(jī)器學(xué)習(xí)技術(shù),旨在從高維數(shù)據(jù)中學(xué)習(xí)一組稀疏表示的基向量[16]。這一技術(shù)模擬了人類大腦如何從復(fù)雜的輸入數(shù)據(jù)中提取有用信息的過(guò)程。

    K-SVD(K-singular value decomposition)是一種用于字典學(xué)習(xí)的經(jīng)典算法,旨在從數(shù)據(jù)中學(xué)習(xí)一組基向量的字典,以便能夠有效地表示和重構(gòu)輸入數(shù)據(jù)[17]。從數(shù)學(xué)角度看,稀疏表示是針對(duì)不確定方程組Xm×n=Dm×K·SK×m求解提出的。其中,X(大小為m行n列)是訓(xùn)練樣本集,D(大小為m行K列)是字典矩陣,S(大小為K行m列)是稀疏表示。K-SVD算法的核心思想是最小化重構(gòu)誤差且保證稀疏矩陣S盡可能稀疏,目標(biāo)函數(shù)如下:

    其中,si為訓(xùn)練樣本xi的稀疏表示,T是稀疏閾值。

    K-SVD算法步驟如下[18]:

    1)初始化字典D0:每個(gè)基向量從標(biāo)準(zhǔn)正態(tài)分布中隨機(jī)初始化。

    2)稀疏表示:字典D固定,計(jì)算每個(gè)數(shù)據(jù)樣本的稀疏表示S。本實(shí)驗(yàn)采用Lasso算法加入L1正則化來(lái)獲得稀疏表示,對(duì)每個(gè)訓(xùn)練樣本單獨(dú)求稀疏表示:

    3)字典更新:稀疏表示S固定,通過(guò)最小化重構(gòu)誤差,更新字典D中的基向量,是K-SVD算法的關(guān)鍵步驟。目標(biāo)函數(shù)可轉(zhuǎn)化為:

    4)迭代:重復(fù)步驟2和步驟3,直到達(dá)到最大迭代次數(shù)或滿足收斂容忍度的條件。

    1.3.2 性能評(píng)估參數(shù)

    關(guān)于分類算法的性能評(píng)估,評(píng)估參數(shù)是:準(zhǔn)確率(Accuracy)、精確率(Precision)、召回率(Recall)、召回率與精確率的調(diào)和平均(F1),計(jì)算公式如下[19]:

    其中,TP(True positive)為正確的正例個(gè)數(shù),即樣本為正且預(yù)測(cè)為正。FP(False positive)為錯(cuò)誤的正例個(gè)數(shù),即樣本為正但預(yù)測(cè)為反。TN(True negative)為正確的反例個(gè)數(shù),即樣本為反且預(yù)測(cè)為反。FN(False negative)為錯(cuò)誤的反例個(gè)數(shù),即樣本為反但預(yù)測(cè)為正。F1表示Precision與Recall同樣重要,可較為全面地評(píng)估一個(gè)分類算法的性能。

    2 結(jié)果與討論

    2.1 定性分析

    光譜中的波長(zhǎng)及其對(duì)應(yīng)的強(qiáng)度是用來(lái)表征被實(shí)驗(yàn)樣品中元素含量的重要信息。如圖2所示,參考美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究(NIST)數(shù)據(jù)庫(kù)可知,本實(shí)驗(yàn)激發(fā)的NaCl溶液的特征譜線主要包含Na Ⅰ 589.59 nm、Cl Ⅰ 821.20 nm、O I 777.19nm、N Ⅰ 746.83 nm、H Ⅰ 656.28 nm等。如圖3所示,不同濃度的NaCl氣溶膠光譜中Na的強(qiáng)度有明顯差異,隨著濃度的增加,Na和Cl的譜線強(qiáng)度均呈上升趨勢(shì)。

    圖2 NaCl氣溶膠樣品典型光譜Figure 2 Typical spectra of NaCl aerosol samples.

    圖3 不同濃度NaCl氣溶膠樣品的代表性LIBS光譜對(duì)比圖Figure 3 The comparison of representative LIBS spectra of aerosol samples with different concentrations of NaCl.

    2.2 分類算法的性能評(píng)估

    本文首先對(duì)兩種常規(guī)的閾值篩選法(SD和SNR)的分類性能進(jìn)行評(píng)估。SD值是特征譜線強(qiáng)度與周?chē)舾牲c(diǎn)的標(biāo)準(zhǔn)偏差,SD值越大,說(shuō)明一組數(shù)據(jù)的離散程度越大,即峰值越明顯。SNR值是特征譜線強(qiáng)度與相鄰無(wú)特征連續(xù)背景強(qiáng)度的SD之比。由于閾值篩選法是通過(guò)判斷SD值或SNR值是否達(dá)到閾值來(lái)進(jìn)行光譜篩選,因此需要選定一條特征譜線。由于Na I 589.59 nm譜線的波峰較為明顯,而且受附近譜線干擾較小,因此選取Na 589.59 nm作為閾值篩選法的特征譜線,計(jì)算不同閾值對(duì)應(yīng)的評(píng)估性能,如圖4所示。

    圖4 閾值法性能指標(biāo)隨閾值變化圖Figure 4 Variation of performance indexes of threshold method with threshold value.

    由圖4可知,無(wú)論采用何種閾值法,精確率都隨著閾值的增加而升高,而召回率都隨著閾值的增加而降低,F1隨著閾值的增加先升高后降低。導(dǎo)致這一現(xiàn)象的原因可能是,閾值越大,篩選條件越嚴(yán)苛,故誤判(FP)少,精確率高;漏報(bào)(FN)多,召回率低。當(dāng)F1取到最大值時(shí),表示此閾值下的分類性能最佳。使用SD法的情況下,當(dāng)閾值取到116時(shí),F1值為最大值0.84,模型性能最優(yōu),此時(shí)準(zhǔn)確率為91.2%。使用SNR法的情況下,當(dāng)閾值取到14時(shí),模型性能最優(yōu),F1值為最大值0.82,此時(shí)準(zhǔn)確率為89.7%。

    雖然閾值篩選法可以簡(jiǎn)便地對(duì)光譜數(shù)據(jù)進(jìn)行篩選,但是它沒(méi)有考慮光譜數(shù)據(jù)的分布和統(tǒng)計(jì)特性,導(dǎo)致了對(duì)數(shù)據(jù)的不準(zhǔn)確分類。因此,本節(jié)采用字典學(xué)習(xí)中的K-SVD算法結(jié)合SVM(K-SVD-SVM)對(duì)光譜數(shù)據(jù)進(jìn)行篩選,將原始光譜數(shù)據(jù)的8 190個(gè)數(shù)據(jù)點(diǎn)作為字典學(xué)習(xí)的輸入,總樣本的70%作為訓(xùn)練集,30%作為測(cè)試集。在使用K-SVD方法進(jìn)行數(shù)據(jù)降維時(shí),字典矩陣基向量的數(shù)量會(huì)對(duì)識(shí)別率產(chǎn)生影響,當(dāng)基向量數(shù)較少時(shí),字典矩陣不能充分反映訓(xùn)練樣本的信息,當(dāng)基向量數(shù)較大時(shí),則會(huì)占用大量的計(jì)算資源。將字典矩陣基向量數(shù)分別設(shè)置為1~8,計(jì)算每個(gè)基向量數(shù)對(duì)應(yīng)的Accuracy、Precision、Recall、和F1,實(shí)驗(yàn)結(jié)果如圖5所示。

    圖5 性能指標(biāo)隨字典基向量數(shù)變化圖Figure 5 Performance index changes with the number of base vectors of the dictionary.

    由圖5可知,當(dāng)基向量數(shù)小于3時(shí),性能指標(biāo)均呈上升趨勢(shì)。由于基向量數(shù)越多,字典矩陣能表征的光譜信息越全面,故識(shí)別率越高。當(dāng)基向量數(shù)大于3時(shí),性能指標(biāo)均基本不變。分析其原因,含有3個(gè)基向量的字典矩陣已經(jīng)能表征大部分光譜信息,冗余的基向量只會(huì)浪費(fèi)計(jì)算資源,故將字典基向量數(shù)設(shè)置為3。

    將學(xué)習(xí)得到的字典矩陣結(jié)合Lasso算法對(duì)測(cè)試集求稀疏表示,稀疏表示構(gòu)成的矩陣作為SVM分類算法的輸入量,得到的分類結(jié)果混淆矩陣如圖6所示?;煜仃囍庇^地表示了算法對(duì)光譜數(shù)據(jù)分類的性能,矩陣塊顏色越深表示該分類樣本數(shù)越多,顏色越淺表示該分類樣本數(shù)越少。沿混淆矩陣對(duì)角線的值表示正確分類的樣本數(shù)量,而對(duì)角線以外的值表示錯(cuò)誤分類的樣本數(shù)量。由圖6可知,TP為375,FP為28,TN為1067,FN為30,根據(jù)公式計(jì)算可得準(zhǔn)確率、精確率、召回率、F1值分別為96%、95%、95%、0.95。

    圖6 光譜數(shù)據(jù)的分類混淆矩陣Figure 6 Classification confusion matrix of spectral data.

    較之前的閾值篩選法相比,該方法的分類性能有了明顯提高,F1值從SD法的0.84和SNR法的0.82提高到0.95,準(zhǔn)確率從SD法的91.2%和SNR法的89.7%提升到96%。通過(guò)K-SVD算法對(duì)原始光譜數(shù)據(jù)進(jìn)行特征提取,從高維空間得到稀疏表示,再結(jié)合SVM分類模型可以有效地實(shí)現(xiàn)光譜數(shù)據(jù)的快速識(shí)別。

    2.3 定量分析

    采用K-SVD-SVM方法對(duì)7種不同濃度的氣溶膠樣品進(jìn)行篩選后,使用結(jié)合遺傳算法的極限學(xué)習(xí)機(jī)方法(GA-ELM)開(kāi)展定量分析,同時(shí)將未篩選的全部原始光譜數(shù)據(jù)輸入定量模型進(jìn)行對(duì)比,進(jìn)一步驗(yàn)證K-SVD-SVM方法的有效性。定量模型的性能評(píng)估參數(shù)是:均方根誤差(RMSE)、相關(guān)系數(shù)(R2)。RMSE是預(yù)測(cè)值與真實(shí)值之間差異的平方和的均方根,RMSE越小說(shuō)明GA-ELM模型的準(zhǔn)確率越高。R2值越接近1,表示回歸的擬合度越高。

    2.3.1 全部原始光譜定量分析

    總樣本包括如表1所示的7個(gè)不同濃度的NaCl氣溶膠樣本,每個(gè)濃度500條光譜數(shù)據(jù)。為確保訓(xùn)練集能夠包含最低和最高濃度的樣本,選取濃度為1%、5%、10%、18%的NaCl氣溶膠樣本的全部原始光譜數(shù)據(jù)作為訓(xùn)練集,其余光譜數(shù)據(jù)作為測(cè)試集。將訓(xùn)練集輸入GA-ELM算法建立定量預(yù)測(cè)模型,并對(duì)測(cè)試集進(jìn)行濃度預(yù)測(cè),結(jié)果如圖7所示。測(cè)試集預(yù)測(cè)結(jié)果的RMSE=0.0303,R2=0.8726。圖中預(yù)測(cè)結(jié)果的誤差棒較大,可能是由于未經(jīng)處理的原始光譜含有大量無(wú)效光譜,這將對(duì)定量分析等研究產(chǎn)生不利影響。因此,需要采用K-SVD-SVM方法對(duì)原始數(shù)據(jù)進(jìn)行篩選。

    圖7 全部原始數(shù)據(jù)測(cè)試集的預(yù)測(cè)效果Figure 7 Prediction effects of all raw data test sets.

    2.3.2 采用K-SVD-SVM篩選的光譜定量分析

    采用K-SVD-SVM對(duì)各樣本的原始數(shù)據(jù)進(jìn)行篩選,剔除無(wú)效光譜數(shù)據(jù)。選取濃度為1%、5%、10%、18%的NaCl氣溶膠樣本的有效光譜數(shù)據(jù)作為訓(xùn)練集,篩選出的其余光譜數(shù)據(jù)作為測(cè)試集。將訓(xùn)練集輸入GA-ELM算法建立定量預(yù)測(cè)模型,并對(duì)測(cè)試集進(jìn)行濃度預(yù)測(cè),結(jié)果如圖8所示。測(cè)試集預(yù)測(cè)結(jié)果的RMSE=0.0187,R2=0.9809。由圖8可知,有效光譜的預(yù)測(cè)結(jié)果誤差棒較小,反映了預(yù)測(cè)值的離散程度較小。

    圖8 篩選出的有效光譜測(cè)試集的預(yù)測(cè)效果Figure 8 Prediction effects of the selected effective spectral test set.

    兩種方法的定量分析對(duì)比結(jié)果如表2所示。對(duì)采用K-SVD-SVM方法篩選過(guò)的有效光譜數(shù)據(jù)進(jìn)行濃度預(yù)測(cè),GA-ELM模型的預(yù)測(cè)性能有了明顯提高,RMSE由全光譜建模的0.030 3優(yōu)化到0.015 3,表明篩選后的數(shù)據(jù)預(yù)測(cè)值與真實(shí)值之間差異的平方和均方根更小,預(yù)測(cè)準(zhǔn)確率更高。R2由0.872 6提升到0.979 5,表明篩選后的數(shù)據(jù)回歸擬合度更高。此外,篩選后的數(shù)據(jù)預(yù)測(cè)值的誤差棒明顯小于原始光譜的預(yù)測(cè)值誤差棒。

    表2 定量分析對(duì)比結(jié)果Table 2 Comparative results of quantitative analysis

    3 結(jié)論

    提出了一種結(jié)合字典學(xué)習(xí)的氣溶膠光譜數(shù)據(jù)篩選方法——K-SVD-SVM。將該方法與SD法和SNR法進(jìn)行對(duì)比。結(jié)果表明,當(dāng)字典基向量數(shù)設(shè)置為3時(shí),模型性能最優(yōu),準(zhǔn)確率、精確率、召回率和F1值分別為96%、95%、95%、0.95。而SD法的最優(yōu)準(zhǔn)確率為91.2%,SNR法最優(yōu)準(zhǔn)確率為89.7%。結(jié)果表明,K-SVD-SVM方法可以篩選出有效光譜數(shù)據(jù),且在性能方面優(yōu)于閾值篩選法。進(jìn)一步地,采用K-SVD-SVM方法對(duì)7種不同濃度的氣溶膠樣品進(jìn)行篩選后,將有效數(shù)據(jù)輸入GA-ELM模型開(kāi)展定量分析,同時(shí)將未篩選的原始光譜數(shù)據(jù)輸入定量模型進(jìn)行對(duì)比。未篩選的原始數(shù)據(jù)測(cè)試集RMSE和R2分別是0.030 3和0.872 6,篩選光譜后,分別提升至0.018 7和0.980 9。結(jié)果表明,K-SVD-SVM方法有著較好的分類性能,且采用此方法篩選出的有效數(shù)據(jù)可以為氣溶膠中元素定量分析提供數(shù)據(jù)支撐。

    猜你喜歡
    譜線氣溶膠字典
    開(kāi)心字典
    家教世界(2023年28期)2023-11-14 10:13:50
    開(kāi)心字典
    家教世界(2023年25期)2023-10-09 02:11:56
    基于HITRAN光譜數(shù)據(jù)庫(kù)的合并譜線測(cè)溫仿真研究
    氣溶膠傳播之謎
    氣溶膠中210Po測(cè)定的不確定度評(píng)定
    鐵合金光譜譜線分離實(shí)驗(yàn)研究
    四川盆地秋季氣溶膠與云的相關(guān)分析
    鍶原子光鐘鐘躍遷譜線探測(cè)中的程序控制
    我是小字典
    正版字典
    讀者(2016年14期)2016-06-29 17:25:50
    任丘市| 土默特左旗| 南雄市| 太仆寺旗| 伊川县| 盐亭县| 香河县| 黄冈市| 鹤岗市| 北宁市| 项城市| 怀来县| 南江县| 墨玉县| 白水县| 南江县| 资溪县| 安化县| 白银市| 张家川| 斗六市| 泽州县| 江川县| 辰溪县| 武安市| 华安县| 壶关县| 黔西县| 彰武县| 抚州市| 沙坪坝区| 沿河| 天水市| 望谟县| 湟中县| 青阳县| 庐江县| 女性| 新乐市| 共和县| 龙川县|