許鋮,李芳,陳鋒,張登,鄧凡,郭連波
(1 武漢工程大學(xué)機(jī)電工程學(xué)院光學(xué)信息與模式識(shí)別湖北省重點(diǎn)實(shí)驗(yàn)室,武漢 430205)
(2 華中科技大學(xué) 武漢光電國(guó)家研究中心,武漢 430074)
(3 華中科技大學(xué) 光學(xué)與電子信息學(xué)院,武漢 430074)
鈦及鈦合金是20 世紀(jì)50年代發(fā)展起來的一種密度小、強(qiáng)度高、耐蝕耐熱性好的金屬材料,因其獨(dú)特的優(yōu)點(diǎn),近年來被廣泛用于航空航天、醫(yī)療衛(wèi)生、交通運(yùn)輸和高端制造等重要領(lǐng)域[1-4]。不同種類的鈦合金由于性能存在差異適用于不同領(lǐng)域,即使是同牌號(hào)的鈦合金在混淆使用時(shí)也易造成嚴(yán)重后果。例如TC4(Ti-4Al-4V,鈦-6 鋁-4 釩)鈦合金,自20 世紀(jì)中期開始作為醫(yī)療植入物廣泛應(yīng)于用醫(yī)療領(lǐng)域,而當(dāng)其中Al 元素含量過高時(shí),會(huì)對(duì)人體造成不可逆轉(zhuǎn)的損害。在國(guó)家一級(jí)標(biāo)準(zhǔn)物質(zhì)的分類中,TC4 鈦合金按照元素含量被分為GBW02503~GBW02508 六種編號(hào)不同的種類,故用于醫(yī)療領(lǐng)域的鈦合金通常是Al 含量較低的TC4-1(GBW02503,Al 元素含量3.90%)或TC4-2(GBW02504,Al 元素含量4.67%),而非Al 含量較高的TC4-5(GBW02507,Al 元素含量6.78%)或TC4-6(GBW02508,Al 元素含量7.03%)。因此,對(duì)外表十分相似而性能存在差異的鈦合金進(jìn)行快速精準(zhǔn)分類識(shí)別具有十分重要的研究和應(yīng)用價(jià)值。
目前,鈦合金的分類檢測(cè)方法種類繁多,但存在著各自的局限?,F(xiàn)有檢測(cè)方法主要分為消解法和非消解法兩類。消解法包括滴定法、原子吸收光譜法等,在測(cè)試過程中需要對(duì)樣品進(jìn)行破壞性處理,無法做到微損檢測(cè)。而非消解法如X 射線熒光光譜分析、火花光譜直讀法等,則對(duì)環(huán)境要求十分苛刻(如需要真空環(huán)境等),且部分檢測(cè)方法的激發(fā)源存在輻射,對(duì)人體存在損害。因此,探尋一種新型的鈦合金快速分類識(shí)別檢測(cè)方法成為當(dāng)前的研究熱點(diǎn)。
激光誘導(dǎo)擊穿光譜[5-7](Laser-induced Breakdown Spectroscopy,LIBS)技術(shù),又稱激光探針技術(shù),是一種新型的基于原子發(fā)射光譜的元素分析技術(shù)。其原理是利用激光燒蝕樣品產(chǎn)生等離子體,然后采集等離子體的光譜用以定性定量分析。LIBS 技術(shù)具有快捷、實(shí)時(shí)、原位、微損、多元素同時(shí)分析等優(yōu)點(diǎn),可以檢測(cè)任何物態(tài)(氣態(tài)[8]、固態(tài)、液態(tài)[9])的樣品,近年來廣泛應(yīng)用于冶金工業(yè)成分分析[10]、環(huán)境監(jiān)控與保護(hù)[11]、農(nóng)業(yè)與食品安全檢測(cè)[12-13]等領(lǐng)域。2011年美國(guó)發(fā)射的好奇號(hào)火星探測(cè)器和2020年中國(guó)發(fā)射的天問一號(hào)火星探測(cè)器均裝備了LIBS 系統(tǒng)對(duì)火星執(zhí)行勘探任務(wù)。
LIBS 技術(shù)的獨(dú)特優(yōu)勢(shì)使其獲得了國(guó)內(nèi)外研究人員的關(guān)注[14-16]。SUNGHO S 等[17]利用LIBS 系統(tǒng)收集鋁合金、銅合金、不銹鋼和鑄鋼的光譜,之后對(duì)全光譜數(shù)據(jù)進(jìn)行主成分分析(Principal Component Analysis,PCA),結(jié)果中除對(duì)銅合金的最高分類結(jié)果為94.7%外,其余均達(dá)到100%的分類準(zhǔn)確度;ABERKANE S M等[18]將LIBS 與K 最鄰近(K-Nearest Neighbor,KNN)、支持向量機(jī)(Support Vector Machines,SVM)以及人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)結(jié)合,對(duì)鋅基合金進(jìn)行快速精確分類研究,均獲得優(yōu)秀的結(jié)果;OLLILA A M 等[19]在對(duì)各種地質(zhì)樣本進(jìn)行分類時(shí),使用LIBS 系統(tǒng)結(jié)合偏最小二乘判別分析(Partial Least Squares Discrimination Analysis,PLS-DA),最終結(jié)果擁有接近100 %的分類準(zhǔn)確度;劉凱等[20]對(duì)4 種塑料樣品識(shí)別時(shí),利用PCA 對(duì)通過LIBS 獲取的數(shù)據(jù)進(jìn)行處理,精確地識(shí)別出聚對(duì)苯二甲酸乙二醇酯(Polyethylene Terephthalate,PET),但是對(duì)另外三種材料稍有混淆;郭連波等[21]利用LIBS 技術(shù)測(cè)量鋼鐵中釩、鈦元素的含量,運(yùn)用基本定標(biāo)法和內(nèi)定標(biāo)法建立了鋼鐵樣品中V 和Ti 含量的光譜分析定標(biāo)曲線,采用效果更好的內(nèi)定標(biāo)法時(shí),V 和Ti 的擬合相關(guān)系數(shù)R2分別達(dá)到0.9952 和0.9921,對(duì)檢測(cè)樣品中V 和Ti 元素的測(cè)定相對(duì)誤差均可降低到4.0%以下;周中寒等[22]利用基于光纖激光器的LIBS 系統(tǒng)(Fiber-LIBS)對(duì)6 種不同牌號(hào)的鋁合金進(jìn)行分類研究,結(jié)果顯示經(jīng)過SVM 訓(xùn)練后的分類模型可以使得分類準(zhǔn)確度達(dá)到99.83 %。
通過前期文獻(xiàn)調(diào)研可以發(fā)現(xiàn),研究者們對(duì)于合金分類的研究主要集中于不同種類、不同牌號(hào)的合金,對(duì)同牌號(hào)鈦合金的LIBS 分類研究鮮見報(bào)道,因此本文采用KNN 算法結(jié)合LIBS 技術(shù),實(shí)現(xiàn)對(duì)同牌號(hào)鈦合金的快速精準(zhǔn)分類。
使用的LIBS 裝置的示意圖如圖1 所示。樣品被放置在Y110TA150 電控位移平臺(tái)上,每次采集光譜后,樣品可以隨位移平臺(tái)移動(dòng),避免激光束在同一位置重復(fù)燒蝕。位移平臺(tái)的每次移動(dòng),都要確保每個(gè)燒蝕坑之間間隔0.5 mm,并燒蝕出一個(gè)20×20 的點(diǎn)矩陣。激光光源采用北京鐳寶(Beamtech)光電技術(shù)有限公司生產(chǎn)的調(diào)Q 開關(guān)Nd:YAG 激光器(Nimma-400,波長(zhǎng):532 nm,脈沖持續(xù)時(shí)間:8 ns,最大重復(fù)頻率:10 Hz)。激光輸出后被45°反射鏡反射,并透過石英透鏡(焦距:150 mm)后聚焦到樣品表面。激發(fā)產(chǎn)生的等離子發(fā)射光用采集頭(深圳青銳科技有限公司,SPECC100)收集,采集頭內(nèi)置一個(gè)焦距為50 mm、直徑為2.54 cm 的紫外熔融石英平凸透鏡,用于將等離子體光輻射耦合進(jìn)光纖。并通過光纖傳輸至六通道光譜儀(Avantes,AvaSpec-ULS4096CL-EVO,光譜范圍:196~874 nm,最小門寬:9 μs,分辨率:0.07~0.12 nm)。激光器和光譜儀由數(shù)字延遲發(fā)生器(Stanford Research Systems,DG645)進(jìn)行觸發(fā)控制,整個(gè)實(shí)驗(yàn)在開放式環(huán)境中進(jìn)行。后期進(jìn)行數(shù)據(jù)處理與模型訓(xùn)練的計(jì)算機(jī)為華碩筆記本電腦,處理器型號(hào):Intel(R)Core(TM)i7-8750H CPU @ 2.20 GHz,內(nèi)存16 GB。
圖1 實(shí)驗(yàn)裝置示意圖Fig.1 Diagram of experimental setup
使用的實(shí)驗(yàn)樣品牌號(hào)為TC4(Ti-6Al-4V)鈦合金,具體為標(biāo)樣TC4-1(GBW02503)、TC4-2(GBW02504)、TC4-3(GBW02505)、TC4-5(GBW02507)與控樣TC4KY 五種樣品。在采集光譜前,每份樣品都進(jìn)行打磨處理并用酒精清洗,以去除表面雜質(zhì)和氧化層。樣品實(shí)物如圖2 所示,每種樣品的元素含量如表1 所示。每種樣品采集400 幅,共獲得2 000 幅鈦合金的LIBS 光譜。
圖2 TC4(Ti-4Al-4V)鈦合金實(shí)物圖Fig.2 Picture of TC4 titanium alloy
表1 鈦合金編號(hào)及元素含量Table 1 Titanium alloy number and element content
1.3.1 能量?jī)?yōu)化
激光燒蝕樣品表面時(shí),激光功率密度與LIBS 光譜質(zhì)量緊密相關(guān),因此需要對(duì)激光能量、離焦量等實(shí)驗(yàn)參數(shù)進(jìn)行優(yōu)化。離焦量?jī)?yōu)選為-1 mm,能量?jī)?yōu)化時(shí)所采用的延時(shí)根據(jù)前期實(shí)驗(yàn)的經(jīng)驗(yàn)選取2 μs。依據(jù)前期文獻(xiàn)調(diào)研與經(jīng)驗(yàn)[23],在進(jìn)行激光能量?jī)?yōu)化時(shí),選取表2 中的6 條譜線。以五點(diǎn)尋峰法獲取峰值強(qiáng)度并將其平均值作為信號(hào),選取譜線附近無譜線干擾的背景計(jì)算信噪比,通過峰值強(qiáng)度與信噪比的大小與變化趨勢(shì)來決定最佳能量強(qiáng)度。信噪比計(jì)算公式為
式中,S為選取譜線的峰值強(qiáng)度均值,N為選取的背景范圍內(nèi)所有數(shù)據(jù)的標(biāo)準(zhǔn)差。
表2 為選取譜線的波長(zhǎng)、躍遷幾率Ak、下能級(jí)能量E1與上能級(jí)能量E2。
表2 譜線波長(zhǎng)、躍遷幾率及能級(jí)能量Table 2 Spectral wavelength,transition probability and energy level
每次調(diào)整單位脈沖能量強(qiáng)度后,在樣品TC4-1 上進(jìn)行5×5 的矩陣掃描激發(fā),獲得25 幅LIBS 光譜。每幅光譜在特征處使用五點(diǎn)尋峰法獲得其峰值,再計(jì)算信噪比,最終獲得25 幅光譜的峰值和信噪比的均值與誤差,繪制出如圖3 所示的峰值強(qiáng)度與信噪比隨單位脈沖能量變化的折線圖。
圖3 峰值強(qiáng)度與信噪比隨單位脈沖能量的變化Fig.3 The change of peak intensity and signal to noise ratio with unit pulse energy
如圖3 所示,橫軸為單發(fā)激光脈沖能量強(qiáng)度,縱軸(左)為特征處的峰值強(qiáng)度,縱軸(右)為信噪比。黑色實(shí)線為峰值強(qiáng)度與單發(fā)激光脈沖能量之間的關(guān)系,藍(lán)色虛線為信噪比與單發(fā)激光脈沖能量之間的關(guān)系??梢钥闯觯弘S著單發(fā)激光脈沖能量的增加,峰值強(qiáng)度和信噪比也隨之提高,當(dāng)單發(fā)激光脈沖能量大小為80 mJ時(shí),大多特征處的峰值強(qiáng)度最高且信噪比最大,故選取80 mJ 作為單脈沖輸出能量,在此條件下,功率密度為3.18×1010W/cm2。
1.3.2 延時(shí)優(yōu)化
光譜儀的觸發(fā)延時(shí)對(duì)光譜質(zhì)量亦有著很大的影響。延時(shí)過短時(shí),韌致輻射導(dǎo)致的光譜背景較大,光譜質(zhì)量較差;延時(shí)過長(zhǎng)時(shí),等離子體已經(jīng)逸散,此時(shí)采集的光譜難以與背景區(qū)分,所以對(duì)延時(shí)進(jìn)行優(yōu)化顯得十分重要。仍然以樣品TC4-1 鈦合金為例進(jìn)行延時(shí)優(yōu)化。
在單脈沖能量為80 mJ 的激光作用下,每次調(diào)整采集延時(shí)后,對(duì)TC4-1 樣品進(jìn)行5×5 的矩陣掃描,并進(jìn)行光譜累加。特征譜線選擇與能量?jī)?yōu)化過程時(shí)所選相同。計(jì)算峰值和信噪比的均值與誤差,通過兩種參數(shù)的大小與變化趨勢(shì)來決定最佳觸發(fā)延時(shí)。
實(shí)驗(yàn)結(jié)果如圖4 所示,橫軸為觸發(fā)延時(shí),縱軸(左)為峰值強(qiáng)度,縱軸(右)為信噪比。黑色實(shí)線為峰值強(qiáng)度與觸發(fā)延時(shí)之間的關(guān)系,藍(lán)色虛線為信噪比與觸發(fā)延時(shí)之間的關(guān)系??梢钥闯觯弘S著觸發(fā)延時(shí)的增加,峰值強(qiáng)度逐漸降低,而多數(shù)特征處的信噪比在2 μs 時(shí)會(huì)達(dá)到峰值,之后開始逐漸下降。所以最終采用的光譜儀觸發(fā)延時(shí)為2 μs。
圖4 峰值強(qiáng)度與信噪比隨觸發(fā)延時(shí)的變化Fig.4 The change of peak intensity and signal to noise ratio with trigger delay
優(yōu)化后的全譜圖如圖5 所示,通過全譜可以觀測(cè)到樣品中各元素的發(fā)射光譜。
圖5 TC4-1 全譜圖Fig.5 TC4-1 full spectrum
在前期研究中,使用不同的分類算法對(duì)不同牌號(hào)的金屬材料進(jìn)行了分類研究。其中無監(jiān)督算法的Kmeans 效果極差,分類準(zhǔn)確度僅56.05%;有監(jiān)督算法中,決策樹的分類準(zhǔn)確度為88.4%,樸素貝葉斯分類(Naive Bayes Classifier,NBC)的結(jié)果為98.6 %,KNN 和SVM 的結(jié)果為100%,但KNN 的訓(xùn)練速度略快于SVM。本文中的研究樣品為同牌號(hào)的鈦合金,與前期研究有一定相似度,故選取KNN 作為本次研究中訓(xùn)練模型的算法。KNN 是一種經(jīng)典的分類算法,非常適合LIBS 光譜的快速分類研究及應(yīng)用[24]。KNN 的原理是通過識(shí)別未知點(diǎn)X附近K個(gè)已知點(diǎn)的類別,來決定X屬于哪一個(gè)種類。本文中使用的是MATLAB 中的機(jī)器學(xué)習(xí)與深度學(xué)習(xí)APP Classification Learner 來實(shí)現(xiàn)分類。
首先對(duì)原始LIBS 光譜進(jìn)行分類處理,對(duì)鈦合金樣品采集的2 000 幅LIBS 光譜按照3∶1 的比例劃分訓(xùn)練集與測(cè)試集,共獲得訓(xùn)練集1 500 幅LIBS 光譜與測(cè)試集500 幅LIBS 光譜。基于快捷、簡(jiǎn)便的思想,結(jié)合前期研究,選取Classification Learner 已有模板中的加權(quán)KNN 對(duì)訓(xùn)練集進(jìn)行分類梳理。加權(quán)KNN 參數(shù):K值過小會(huì)導(dǎo)致整體模型變得復(fù)雜,容易發(fā)生過擬合,K值過大則相反,會(huì)使模型變簡(jiǎn)單,同時(shí)對(duì)現(xiàn)有訓(xùn)練集的訓(xùn)練誤差增大,故優(yōu)先選取K值為中間值10 的加權(quán)KNN;加權(quán)KNN 的距離度量是歐氏距離,是最常用的距離度量;加權(quán)KNN 與其他模板最大的不同是其距離權(quán)重為兩點(diǎn)之間反距離的平方,即兩點(diǎn)之間歐式距離越大,其權(quán)重越小且變小的幅度遠(yuǎn)大于距離權(quán)重為反距離時(shí)的情況。訓(xùn)練集分類時(shí),進(jìn)行十折交叉驗(yàn)證,即:將訓(xùn)練集分為十組,使用其中一組數(shù)據(jù)驗(yàn)證其余九組數(shù)據(jù)訓(xùn)練出的模型,最終通過十次結(jié)果的平均正確率來對(duì)算法精度進(jìn)行估算,從而避免過擬合現(xiàn)象出現(xiàn)。最終獲得如圖6 所示的混淆矩陣。綠色框中的數(shù)字代表分類正確的光譜,紅色框中的數(shù)字代表分類錯(cuò)誤的光譜,白色框?yàn)槲捶诸愬e(cuò)誤的部分。
圖6 原光譜的訓(xùn)練集進(jìn)行加權(quán)KNN 分類后的混淆矩陣與測(cè)試集分類結(jié)果的混淆矩陣Fig.6 Confusion matrix of training set of original spectrums after weighted KNN classification and confusion matrix of test set classification result
從圖6 中的混淆矩陣可以計(jì)算出,訓(xùn)練集交叉驗(yàn)證準(zhǔn)確率為81.40%,1 500 幅訓(xùn)練集光譜中有1 221 幅分類正確。其中TC4KY 因其元素含量與4 種標(biāo)樣之間并無線性關(guān)系,故是容易產(chǎn)生分類錯(cuò)誤的一種樣品;而TC4-1、TC4-2 與TC4-3 三種樣品之間,由于其元素濃度接近,也是容易分類錯(cuò)誤的幾組樣品。將測(cè)試集的數(shù)據(jù)代入分類模型,獲得的最終結(jié)果為:測(cè)試集分類準(zhǔn)確度84.20%,500 幅測(cè)試集光譜中有421 幅分類正確,模型訓(xùn)練所用時(shí)間為1 232.41 s。
通過分析可知,采用原始數(shù)據(jù)與加權(quán)KNN 直接進(jìn)行分類存在兩方面的不足,一是分類準(zhǔn)確度不高,測(cè)試集的分類準(zhǔn)確度只有84.20%;二是訓(xùn)練時(shí)間過長(zhǎng),總時(shí)長(zhǎng)達(dá)二十多分鐘。因此,從數(shù)據(jù)與模型兩個(gè)方面進(jìn)行優(yōu)化,進(jìn)而提高分類準(zhǔn)確度,減少分類模型的訓(xùn)練時(shí)間。
數(shù)據(jù)的優(yōu)化主要從三個(gè)方面進(jìn)行:1)通過數(shù)據(jù)篩選,剔除劣質(zhì)光譜,進(jìn)而避免其對(duì)結(jié)果帶來的影響;2)通過數(shù)據(jù)歸一化,減少實(shí)驗(yàn)環(huán)境和實(shí)驗(yàn)參數(shù)波動(dòng)的影響;3)通過主成分分析,進(jìn)行數(shù)據(jù)降維,提高分類準(zhǔn)確率并減少模型訓(xùn)練時(shí)間。
數(shù)據(jù)的篩選是通過在元素濃度適中的Al、V、Fe 三種元素的LIBS 譜線中,選取如表3 中的10 處峰值高、信噪比大的譜線,由于譜線的波動(dòng)近似趨近于正態(tài)分布,所以在這些波長(zhǎng)處使用3σ 法進(jìn)行異常值剔除,最終剩余1 866 幅光譜。為方便實(shí)施模型訓(xùn)練時(shí)的十折交叉驗(yàn)證,隨機(jī)選取1400 幅光譜為訓(xùn)練集,剩余466 幅光譜為測(cè)試集。
表3 光譜篩選用特征譜線Table 3 Characteristic lines for spectral screening
最大值和最小值對(duì)于數(shù)據(jù)歸一化的結(jié)果有很大影響,而剔除異常值時(shí)已將數(shù)據(jù)過大和過小的光譜篩去,確保了歸一化的效果,所以剩余的每張光譜進(jìn)行歸一化后,結(jié)果預(yù)計(jì)會(huì)顯著提升。歸一化公式為
式中,min(X)為光譜中峰值強(qiáng)度最小值,man(X)為其中峰值強(qiáng)度最大值。
在此基礎(chǔ)上,進(jìn)一步研究發(fā)現(xiàn)原光譜共有24 564 個(gè)維度,冗余數(shù)據(jù)很多,嚴(yán)重降低了分類模型的訓(xùn)練速度,對(duì)于分類結(jié)果的準(zhǔn)確度也有很大影響,故需要對(duì)數(shù)據(jù)進(jìn)行降維處理。PCA 通過正交變換將一組可能存在相關(guān)性的n維變量轉(zhuǎn)換為一組線性不相關(guān)的k維變量,重新構(gòu)造出來的k維特征稱為主成分,在包含了原n維數(shù)據(jù)的主要信息的同時(shí),數(shù)據(jù)將獲得有效的降維處理,精簡(jiǎn)了數(shù)據(jù)。在保證總解釋方差高于98%的情況下,選取解釋方差前20 維的特征,輸入Classification Learner 重新進(jìn)行分類模型訓(xùn)練。圖7 為數(shù)據(jù)處理之后分類結(jié)果的混淆矩陣。
圖7 數(shù)據(jù)處理后的光譜訓(xùn)練集進(jìn)行加權(quán)KNN 分類后的混淆矩陣與測(cè)試集分類結(jié)果的混淆矩陣Fig.7 Confusion matrix of weighted KNN classification for spectral training set after data processing and confusion matrix of test set classification result
從圖7 中的混淆矩陣可以算出,訓(xùn)練集交叉驗(yàn)證準(zhǔn)確率為94.00%,1 400 幅訓(xùn)練集光譜中有1 316 幅分類正確。原本最易分類錯(cuò)誤的TC4KY,其分類準(zhǔn)確度大幅度提高。而因TC4-1 與TC4-2 之間的元素濃度最為接近,所以最后的主要分類錯(cuò)誤集中在TC4-1 與TC4-2 之間。將測(cè)試集的數(shù)據(jù)代入分類模型,獲得的最終結(jié)果為:測(cè)試集分類準(zhǔn)確度95.92%,466 幅測(cè)試集光譜中有447 幅分類正確,模型訓(xùn)練時(shí)間為84.76 s。
分類結(jié)果大幅度優(yōu)化,測(cè)試集準(zhǔn)確度提升至95%以上,模型訓(xùn)練時(shí)間縮小至原數(shù)據(jù)結(jié)果的6.88%。對(duì)于TC4-1 和TC4-2 之間因元素濃度接近而容易混淆的問題,將通過模型參數(shù)的更改進(jìn)行進(jìn)一步優(yōu)化。
KNN 模型可以優(yōu)化的參數(shù)主要有臨近點(diǎn)數(shù)K、距離度量、距離權(quán)重三種。臨近點(diǎn)數(shù)K是KNN 的核心參數(shù)。在樣品的元素濃度相近時(shí),其數(shù)據(jù)點(diǎn)在圖像上的表現(xiàn)往往是糾纏在一起的,不易區(qū)分。而通過選擇合適的K值可解決此問題,進(jìn)而大幅度提升分類結(jié)果的準(zhǔn)確性。對(duì)于本文出現(xiàn)的TC4-1 與TC4-2 之間的混淆問題,可以通過增加K值,擴(kuò)大鄰點(diǎn)選擇范圍,進(jìn)而提高分類準(zhǔn)確度。由于K值過高時(shí),結(jié)果將不會(huì)出現(xiàn)大幅波動(dòng),所以最優(yōu)K值將在1 到100 范圍內(nèi)選擇。距離度量為兩點(diǎn)之間的距離計(jì)算方式,不同的距離度量下,兩點(diǎn)之間的數(shù)據(jù)不同,因此,將在最常用的歐氏距離與最適合高維數(shù)據(jù)的余弦相似度中選取最優(yōu)者。距離權(quán)重則從等距離、反距離及反距離平方中選出。圖8 為三種參數(shù)的優(yōu)化結(jié)果。
圖8 中,橫坐標(biāo)為臨近點(diǎn)數(shù)K,六條線分別為兩種距離度量與三種距離權(quán)重的組合,縱坐標(biāo)為最終結(jié)果測(cè)試集的準(zhǔn)確率??梢钥闯?,隨著臨近點(diǎn)數(shù)的增加,測(cè)試集準(zhǔn)確度也隨之增加,并在K> 20 后增幅趨于平緩。而在距離度量與距離權(quán)重的六種組合中,當(dāng)K值足夠大時(shí),選取余弦相似度和反距離平方相結(jié)合時(shí)結(jié)果最好。最終選擇K= 100、距離度量為余弦相似度、距離加權(quán)為反距離平方,結(jié)果由95.92%提高至99.14%。其KNN 分類結(jié)果的混淆矩陣具體如圖9 所示。
圖8 三種參數(shù)的優(yōu)化結(jié)果Fig.8 Optimization results of three parameters
圖9 最終分類結(jié)果的訓(xùn)練集混淆矩陣與測(cè)試集分類結(jié)果的混淆矩陣Fig.9 Training set confusion matrix of final classification result and confusion matrix of test set classification result
將測(cè)試集的數(shù)據(jù)代入分類模型,最終結(jié)果為:訓(xùn)練集交叉驗(yàn)證準(zhǔn)確率98.64%,1 400 幅訓(xùn)練集光譜中僅有19 幅分類錯(cuò)誤;測(cè)試集分類準(zhǔn)確度99.14%,466 幅測(cè)試集光譜中僅有4 幅分類錯(cuò)誤;模型訓(xùn)練時(shí)間為83.97 s。
表4 為運(yùn)用不同算法獲得的最優(yōu)結(jié)果。可以看出KNN 依舊是進(jìn)行同牌號(hào)鈦合金分類的最優(yōu)算法。KNN 優(yōu)化前后的效果對(duì)比如表5 所示。實(shí)驗(yàn)結(jié)果表明,在經(jīng)過數(shù)據(jù)與分類模型的優(yōu)化之后,訓(xùn)練集交叉驗(yàn)證準(zhǔn)確率提高了17.24%,測(cè)試集分類準(zhǔn)確度達(dá)到了99.14%,提高了14.94%,分類模型訓(xùn)練時(shí)間減少了93.19%,意味著采用KNN 算法結(jié)合LIBS 技術(shù)對(duì)同牌號(hào)鈦合金快速分類結(jié)果非常理想。
表4 不同算法間的結(jié)果對(duì)比Table 4 Comparison of results between different algorithms
表5 優(yōu)化結(jié)果對(duì)比Table 5 Comparison of optimization results
使用LIBS 技術(shù)采集TC4 鈦合金樣品的光譜,通過對(duì)數(shù)據(jù)進(jìn)行篩選、歸一化、PCA 降維的處理,在大幅縮短訓(xùn)練時(shí)間的基礎(chǔ)上,提高了分類的準(zhǔn)確性;通過對(duì)分類模型參數(shù)的優(yōu)化(優(yōu)化后參數(shù)為:K=100,余弦相似度,反距離平方),最終穩(wěn)定將分類準(zhǔn)確度提升至99%左右。分類研究的最終結(jié)果表明:在開放式環(huán)境中,基于LIBS 技術(shù)原位、微損、快捷、實(shí)時(shí)、多元素同時(shí)檢測(cè)等優(yōu)點(diǎn),通過采用數(shù)據(jù)處理與模型優(yōu)化相結(jié)合的方法,將分類模型的訓(xùn)練時(shí)間降低至83.91 s,分類的準(zhǔn)確度提升至99.14%,實(shí)現(xiàn)了對(duì)于鈦合金的快速原位微損的分類分析。本研究證明了LIBS 技術(shù)在同牌號(hào)鈦合金快速精準(zhǔn)分類領(lǐng)域具有良好的應(yīng)用前景。