王彥飛 朱悉銘2)? 張明志 孟圣峰 賈軍偉柴昊 王旸 寧中喜2)?
1) (哈爾濱工業(yè)大學(xué), 哈爾濱 150001)
2) (工信部“航天等離子體推進(jìn)”重點(diǎn)實(shí)驗(yàn)室, 哈爾濱 150001)
3) (北京東方計(jì)量測(cè)試研究所, 北京 100086)
光譜診斷在等離子體刻蝕、材料處理、等離子體設(shè)備和工藝開發(fā), 以及航天等離子體推進(jìn)等領(lǐng)域得到了廣泛的應(yīng)用.光譜診斷依賴的碰撞輻射模型會(huì)受到碰撞截面等基礎(chǔ)物理數(shù)據(jù)所含偏差的影響, 導(dǎo)致診斷結(jié)果出現(xiàn)誤差.針對(duì)這一問(wèn)題, 本文開發(fā)了一種基于前饋神經(jīng)網(wǎng)絡(luò)的等離子體光譜解算方法.通過(guò)對(duì)比新方法與以往常用的最小二乘診斷方法的誤差特性, 發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)診斷方法能夠通過(guò)辨識(shí)光譜向量的主要特征, 減小基礎(chǔ)數(shù)據(jù)偏差向診斷結(jié)果的傳遞.對(duì)實(shí)驗(yàn)光譜數(shù)據(jù)的分析進(jìn)一步印證了這一點(diǎn).本文還對(duì)神經(jīng)網(wǎng)絡(luò)算法對(duì)抗基礎(chǔ)數(shù)據(jù)偏差的機(jī)理進(jìn)行了分析.這種方法在等離子體參數(shù)在線監(jiān)測(cè)、成像監(jiān)測(cè)海量數(shù)據(jù)處理等領(lǐng)域具有良好的應(yīng)用前景.
隨著集成電路中半導(dǎo)體器件集成密度和復(fù)雜度的不斷提高, 半導(dǎo)體器件的尺寸不斷縮小, 對(duì)刻蝕、材料處理等工藝流程的加工精度提出了日益嚴(yán)苛的要求.在上述工藝中, 實(shí)時(shí)監(jiān)測(cè)刻蝕速率、掌握加工進(jìn)程, 對(duì)于保證加工精度、提高產(chǎn)品良率、控制加工成本有重要的意義, 是更高水平的新制程工藝開發(fā)中不可或缺的手段[1?3].等離子體發(fā)射光譜診斷是一種非浸入式的監(jiān)測(cè)方法, 能夠在不干擾等離子體的前提下實(shí)時(shí)原位地監(jiān)測(cè)等離子體特征參數(shù), 被廣泛地應(yīng)用于等離子體設(shè)備開發(fā)、運(yùn)行狀態(tài)監(jiān)測(cè)和等離子體加工工藝流程開發(fā)中[4?8]; 憑借不易受高能離子束流轟擊和復(fù)雜電磁場(chǎng)干擾的優(yōu)點(diǎn), 等離子體發(fā)射光譜診斷在航天等離子體推進(jìn)領(lǐng)域也得到了廣泛應(yīng)用[9,10].
對(duì)等離子體發(fā)射光譜進(jìn)行量化分析的基礎(chǔ)是碰撞輻射模型.該模型通過(guò)求解等離子體中激發(fā)態(tài)粒子的速率平衡方程, 將發(fā)射光譜特性與等離子體密度、電子溫度等特征參數(shù)建立聯(lián)系.光譜診斷就是找尋模型預(yù)測(cè)結(jié)果與待測(cè)等離子體發(fā)射光譜的最佳逼近, 獲取待測(cè)等離子體特征參數(shù)的過(guò)程.研究人員在這一領(lǐng)域開展了大量的研究工作.有研究者在氯、氧等離子體中混入氖、氬、氪、氙等示蹤氣體, 通過(guò)監(jiān)測(cè)這些稀有氣體的發(fā)射光譜, 實(shí)現(xiàn)對(duì)氯、氧等離子體中電子能量分布函數(shù)和電子溫度的監(jiān)測(cè)[11?13].發(fā)射光譜方法在材料表面處理等離子體設(shè)備中的等離子體動(dòng)力學(xué)過(guò)程研究中的應(yīng)用也得到了發(fā)展[14?16].研究人員面向使用氬、氮、氙、氪等工質(zhì)的感性、容性耦合射頻等離子體, 介質(zhì)阻擋放電以及霍爾推力器等多種放電形式等離子體中電子溫度、等離子體密度、氣體溫度等特征參數(shù)監(jiān)測(cè)需求, 開展了一系列研究[17?19].
碰撞輻射模型對(duì)等離子體中激發(fā)、電離等物理過(guò)程速率的描述依賴于碰撞截面等基礎(chǔ)物理數(shù)據(jù).碰撞截面的主要來(lái)源有兩個(gè): 一是通過(guò)實(shí)驗(yàn)方法測(cè)量; 二是從第一性原理出發(fā), 基于量子力學(xué)和原子物理學(xué)相關(guān)理論計(jì)算得到.在當(dāng)前技術(shù)條件下, 通過(guò)實(shí)驗(yàn)測(cè)量所能獲得的數(shù)據(jù)較為有限[20?23].由于信噪比、測(cè)量系統(tǒng)標(biāo)定等方面的問(wèn)題, 上述測(cè)量工作中普遍存在一定的測(cè)量誤差.理論計(jì)算方面, 由于求解過(guò)程中涉及到碰撞體系中任意兩電子坐標(biāo)的相互糾纏, 求解過(guò)程需要使用多級(jí)展開的方法對(duì)體系進(jìn)行描述, 并進(jìn)行適當(dāng)?shù)慕財(cái)嗵幚? 這對(duì)截面計(jì)算結(jié)果的準(zhǔn)確性產(chǎn)生了一定的限制[24?26].在這一背景下, 有部分研究人員通過(guò)向模型中引入調(diào)整因子對(duì)碰撞輻射模型使用的速率系數(shù)進(jìn)行修正[11,27,28].然而, 由于等離子體中各種物理反應(yīng)過(guò)程眾多, 且相互耦合, 難以通過(guò)有限的實(shí)驗(yàn)對(duì)描述這些反應(yīng)過(guò)程的截面數(shù)據(jù)進(jìn)行恰當(dāng)?shù)男拚? 導(dǎo)致截面數(shù)據(jù)所含偏差通過(guò)碰撞輻射模型向診斷結(jié)果傳遞, 給等離子體光譜診斷工作帶來(lái)了困難.
近年來(lái), 機(jī)器學(xué)習(xí)方法在物理領(lǐng)域得到了廣泛的應(yīng)用.經(jīng)過(guò)訓(xùn)練的神經(jīng)網(wǎng)絡(luò), 可構(gòu)建起不同物理量間的映射關(guān)系.憑借在特征辨識(shí)方面具有的優(yōu)勢(shì), 這一方法在診斷監(jiān)測(cè)[29,30]、天體活動(dòng)研究[31,32]、地球物理科學(xué)[33,34]、理論計(jì)算[35]等方面的應(yīng)用得到了發(fā)展.常用的機(jī)器學(xué)習(xí)方法包括前饋神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、殘差神經(jīng)網(wǎng)絡(luò)等[35,36].前饋神經(jīng)網(wǎng)絡(luò)是一種神經(jīng)元分層排列、各層神經(jīng)元只與前一層中的神經(jīng)元連接、層間不存在反饋的神經(jīng)網(wǎng)絡(luò), 具有較強(qiáng)的多維映射能力[35], 適合解決光譜診斷這類問(wèn)題.
本文以稀有氣體放電為例, 基于前饋神經(jīng)網(wǎng)絡(luò)開發(fā)了一種能夠辨識(shí)等離子體光譜特征, 減小截面數(shù)據(jù)偏差向診斷結(jié)果傳遞的光譜診斷方法.分析了以往常用的最小二乘擬合診斷方法與新方法的誤差特性.并通過(guò)解算實(shí)驗(yàn)光譜數(shù)據(jù), 進(jìn)一步驗(yàn)證了基于神經(jīng)網(wǎng)絡(luò)的診斷方法對(duì)抗基礎(chǔ)數(shù)據(jù)偏差的能力.
本文的章節(jié)安排為: 第2 節(jié)介紹文中使用的碰撞輻射模型, 第3 節(jié)介紹實(shí)驗(yàn)設(shè)置, 第4 節(jié)闡述使用的光譜解算方法和誤差分析方法, 第5 節(jié)介紹神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程和驗(yàn)證結(jié)果, 對(duì)比最小二乘和神經(jīng)網(wǎng)絡(luò)兩種診斷方法的誤差特性, 并比較兩種方法解算實(shí)驗(yàn)光譜數(shù)據(jù)的性能, 第6 節(jié)對(duì)全文進(jìn)行總結(jié).
本文的研究工作以一個(gè)稀有氣體(氬、氪、氙)碰撞輻射模型為基礎(chǔ)開展[10,18,19].碰撞輻射模型是描述等離子體中激發(fā)態(tài)粒子數(shù)密度分布的動(dòng)力學(xué)模型.模型利用碰撞截面、速率系數(shù)等信息描述激發(fā)、電離、輻射等物理過(guò)程的速率, 通過(guò)構(gòu)建和求解激發(fā)態(tài)粒子產(chǎn)生-損失速率平衡方程, 獲得激發(fā)態(tài)粒子的密度分布和譜線強(qiáng)弱信息.
本文使用的碰撞輻射模型中考慮了以下動(dòng)力學(xué)過(guò)程.
1)電子碰撞激發(fā)過(guò)程:
2)電子碰撞電離過(guò)程:
3)電子碰撞電離激發(fā)過(guò)程:
4)離子轟擊激發(fā)和電離激發(fā)過(guò)程:
在(1)—(7)式中, e 代表電子,X代表稀有氣體原子,X+代表稀有氣體離子,X+h表示高能稀有氣體離子, 上角標(biāo)“ * ”表示該粒子處于激發(fā)態(tài),product 表示反應(yīng)的其他產(chǎn)物.除這些過(guò)程外, 模型中還考慮了激發(fā)態(tài)的自發(fā)輻射躍遷、亞穩(wěn)態(tài)自吸收過(guò)程、電荷交換過(guò)程和粒子的遷移和擴(kuò)散過(guò)程導(dǎo)致的壁面淬熄.
考慮這些過(guò)程, 激發(fā)態(tài)x的速率平衡方程寫為這里R表示反應(yīng)速率; “col”, “rad”和“abs”分別指碰撞、輻射和自吸收過(guò)程.K是由于壁面淬熄導(dǎo)致的損失率; 下標(biāo)y指的是x之外的能級(jí), 其中包括原子和離子基態(tài)能級(jí)(y 碰撞過(guò)程反應(yīng)速率Rcol的計(jì)算需要使用速率系數(shù)Q, 計(jì)算公式為 這里σ表示碰撞過(guò)程的截面;E和m是電子能量和質(zhì)量;E0是反應(yīng)的閾值能量;g(E)是能量分布函數(shù). 輻射和自吸收項(xiàng)則由下式給出: 式中,A是自發(fā)輻射的愛因斯坦系數(shù),Γ是逃跑因子. 最后, 稀有氣體原子由擴(kuò)散導(dǎo)致的壁面淬熄頻率由下式給出: 式中,D代表擴(kuò)散系數(shù),R代表等離子體尺度,v0為平均速度,χ01= 2.405. 將電子溫度、電子密度等參數(shù)連同截面等基礎(chǔ)數(shù)據(jù)代入, 聯(lián)立求解方程(8)—(11), 可以得到激發(fā)態(tài)密度和等離子體發(fā)射光譜.本文以氙等離子體為例開展研究, 碰撞輻射模型求解所使用截面數(shù)據(jù)的詳細(xì)描述和模型的實(shí)驗(yàn)驗(yàn)證見文獻(xiàn)[10]. 本節(jié)對(duì)診斷實(shí)驗(yàn)使用的裝置和測(cè)量方案進(jìn)行介紹.實(shí)驗(yàn)中使用的裝置如圖1 所示.放電裝置為一個(gè)考夫曼型等離子體源, 由空心陰極、環(huán)形釤鈷磁鐵、筒形陽(yáng)極和石英筒組成.環(huán)形磁鐵按同性磁極相對(duì)的方式排布, 在等離子體源內(nèi)形成會(huì)切磁場(chǎng)位形.筒形陽(yáng)極直徑90 mm, 長(zhǎng)86 mm, 側(cè)面開有一8 mm 寬的窗口, 用于光譜采集.筒形陽(yáng)極外安裝一個(gè)石英玻璃筒, 避免電離室內(nèi)氣體從窗口泄漏. 實(shí)驗(yàn)中使用的朗繆爾探針為直徑0.3 mm 的鎢絲和陶瓷管制成的端面探針.光譜采集系統(tǒng)由Horiba FHR-1000 型光譜儀和Synapse CCD 探測(cè)器組成, 在400—1000 nm 波段的光譜分辨率優(yōu)于0.05 nm.實(shí)驗(yàn)前使用鹵鎢燈校準(zhǔn)光譜采集系統(tǒng)的光譜響應(yīng).采集光譜時(shí), 光譜儀狹縫設(shè)置為20 μm,光探針垂直于等離子體源軸線布置.實(shí)驗(yàn)中, 使用步進(jìn)電機(jī)驅(qū)動(dòng)朗繆爾探針和光探針沿等離子體源軸向運(yùn)動(dòng), 實(shí)現(xiàn)對(duì)等離子體源軸線上9 個(gè)不同測(cè)點(diǎn)處光譜和探針?lè)蔡匦缘牟杉?實(shí)驗(yàn)時(shí)陰極供氣流量為5 sccm (1 sccm = 1 mL/min), 電流為7 A.本文使用的實(shí)驗(yàn)裝置與文獻(xiàn)[37]使用的裝置相同. 圖1 考夫曼電離室結(jié)構(gòu)及測(cè)量實(shí)驗(yàn)方案Fig.1.Structure of the Kaufmann discharge chamber and the scheme of measurement. 本節(jié)介紹數(shù)據(jù)分析方法.首先介紹基于最小二乘擬合的光譜診斷方法, 之后介紹基于前饋神經(jīng)網(wǎng)絡(luò)的光譜診斷方法, 最后對(duì)兩種光譜診斷方法進(jìn)行了比較. 首先對(duì)基于最小二乘擬合的光譜診斷方法進(jìn)行介紹.碰撞輻射模型可看作如(12)式所示的, 以等離子體參數(shù)向量P為自變量, 以發(fā)射光譜向量I為因變量的函數(shù), 而光譜診斷則可視為已知發(fā)射光譜向量I, 利用碰撞輻射模型F求參數(shù)向量P的過(guò)程.由于碰撞輻射模型較為復(fù)雜, 涉及到多種非線性過(guò)程, 方程(12)無(wú)法直接求解.研究人員常使用最小二乘擬合方法, 由待測(cè)光譜I*與模型預(yù)測(cè)光譜I構(gòu)建誤差函數(shù), 迭代找尋待測(cè)光譜的最佳逼近, 來(lái)獲得待測(cè)光譜對(duì)應(yīng)的等離子體參數(shù).圖2 給出了這一方法的流程. 圖2 基于最小二乘的光譜診斷方法流程Fig.2.Diagram of optical emission spectroscopy based on least square method. 表1 本文研究中選用的氙譜線表Table 1.Xenon spectral lines used in this work. 使用光譜中各譜線相對(duì)強(qiáng)度診斷等離子體參數(shù)的方法因?yàn)椴恍枰獙?duì)測(cè)量系統(tǒng)進(jìn)行絕對(duì)標(biāo)定, 在實(shí)踐中得到了普遍應(yīng)用[38?40].不失一般性, 本文使用如(13)式所示的, 利用所選譜線組中所有譜線對(duì)該組譜線強(qiáng)度總和作歸一化的正規(guī)化方法(比和法), 獲得表征譜線相對(duì)強(qiáng)弱關(guān)系的向量R: 本文以電子溫度和電子密度為待診斷參數(shù), 以刻蝕和材料處理中涉及的典型非平衡等離子體參數(shù)范圍為例進(jìn)行研究(電子溫度5—10 eV, 電子密度5 × 1010—6 × 1011cm–3).在發(fā)射光譜方法常用的波長(zhǎng)范圍內(nèi), 選擇了光譜診斷中常用的, 相對(duì)較強(qiáng)的16 條氙原子和氙離子譜線進(jìn)行研究, 所選譜線見表1. 所選譜線構(gòu)成的光譜向量I= [I1,I2, ···,I16]經(jīng)比和法正規(guī)化后得到比和向量R= [R1,R2, ···,R16].由比和向量構(gòu)建的誤差函數(shù)為 使用萊文伯格·馬夸特(Levenberg-Marquardt)方法尋找目標(biāo)Te-ne范圍中誤差函數(shù)E的最小值.該值所對(duì)應(yīng)的等離子體參數(shù)即為最小二乘方法的診斷結(jié)果. 基于前饋神經(jīng)網(wǎng)絡(luò)建立的光譜診斷方法流程和使用的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖3 所示.輸入層由16 個(gè)神經(jīng)元組成, 對(duì)應(yīng)本文所選的16 條譜線; 輸出層由兩個(gè)神經(jīng)元組成, 對(duì)應(yīng)電子溫度和電子密度2 個(gè)待測(cè)等離子體參數(shù).本文選用一種雙隱層結(jié)構(gòu)(兩個(gè)隱藏層分別含有10 個(gè)和5 個(gè)神經(jīng)元)和一種三隱層結(jié)構(gòu)(三個(gè)隱藏層分別含有12 個(gè)、8 個(gè)和4 個(gè)神經(jīng)元)的網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行訓(xùn)練.隱藏層使用S函數(shù)(Sigmoid)進(jìn)行激活, 其表達(dá)式為 圖3 基于前饋神經(jīng)網(wǎng)絡(luò)的光譜診斷方法流程Fig.3.Diagram of optical emission spectroscopy based on feedforward neural network. 訓(xùn)練神經(jīng)網(wǎng)絡(luò)所使用的數(shù)據(jù)集由碰撞輻射模型生成.考慮到本文使用的碰撞輻射模型在實(shí)驗(yàn)驗(yàn)證中存在10%—15%的偏差[10], 這里通過(guò)向模型所使用的截面數(shù)據(jù)上引入–30%—30%的均勻分布隨機(jī)偏差, 模擬模型基礎(chǔ)數(shù)據(jù)上可能存在的偏差,生成含有偏差的光譜構(gòu)成訓(xùn)練集.參考其他使用神經(jīng)網(wǎng)絡(luò)開展的研究工作常用的方案, 對(duì)于兩種網(wǎng)絡(luò)結(jié)構(gòu), 使用模型生成數(shù)據(jù)集中80%的數(shù)據(jù)作為訓(xùn)練集, 并使用誤差反向傳播方法進(jìn)行1000 次迭代;使用20%的數(shù)據(jù)作為測(cè)試集, 對(duì)訓(xùn)練結(jié)果進(jìn)行評(píng)估.我們希望通過(guò)使用這種帶有偏差的光譜數(shù)據(jù)對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練, 使網(wǎng)絡(luò)能夠?qū)Φ入x子體發(fā)射光譜的特征進(jìn)行辨識(shí), 降低基礎(chǔ)數(shù)據(jù)偏差對(duì)診斷結(jié)果的影響. 分別利用由碰撞輻射模型和光譜測(cè)量實(shí)驗(yàn)獲得的數(shù)據(jù), 對(duì)前文介紹的最小二乘和神經(jīng)網(wǎng)絡(luò)兩種光譜診斷方法進(jìn)行比較和誤差特性分析.一方面,使用碰撞輻射模型, 設(shè)定電子溫度和電子密度并輸入碰撞輻射模型生成光譜數(shù)據(jù)向量I0.分別使用最小二乘診斷方法和神經(jīng)網(wǎng)絡(luò)診斷方法對(duì)得到的光譜I0進(jìn)行診斷得到診斷結(jié)果.并使用誤差半徑和偏心距, 通過(guò)分析兩種診斷方法獲得結(jié)果的誤差特性對(duì)診斷方法進(jìn)行比較.另一方面, 通過(guò)第3 節(jié)介紹的實(shí)驗(yàn), 可獲得考夫曼等離子體源電離室內(nèi)的光譜數(shù)據(jù)向量IExp以及對(duì)應(yīng)位置處朗繆爾探針測(cè)量的電子溫度和電子密度分別使用最小二乘診斷方法和神經(jīng)網(wǎng)絡(luò)診斷方法對(duì)得到的光譜IExp進(jìn)行解算, 并將兩種方法獲得的診斷結(jié)果與探針測(cè)得的進(jìn)行比較, 進(jìn)而對(duì)兩種診斷方法進(jìn)行比較.誤差半徑和偏心距的定義如圖3 所示. 這里定義由第i條光譜獲得的診斷結(jié)果對(duì)應(yīng)的點(diǎn)與真實(shí)值對(duì)應(yīng)的點(diǎn)間的距離為該點(diǎn)對(duì)應(yīng)的誤差半徑ri, 距離真實(shí)值最遠(yuǎn)點(diǎn)的誤差半徑為最大誤差半徑rmax, 所有診斷結(jié)果對(duì)應(yīng)的誤差半徑的平均值為平均誤差半徑rmean; 所有測(cè)量結(jié)果平均值與真實(shí)值對(duì)應(yīng)的點(diǎn)間的距離定義為偏心距l(xiāng).診斷方法獲得的診斷結(jié)果的誤差半徑r和偏心距l(xiāng)越小, 診斷結(jié)果越接近設(shè)定值. 圖4 誤差半徑及偏心距定義(真實(shí)值)Fig.4.Definition of error radius and eccentricity. 本節(jié)分為3 個(gè)部分.首先介紹本文開發(fā)的光譜診斷神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和驗(yàn)證結(jié)果; 之后分析和討論最小二乘和神經(jīng)網(wǎng)絡(luò)光譜診斷方法的誤差特性, 并使用4.3 節(jié)中定義的誤差半徑和偏心距對(duì)兩種方法進(jìn)行比較; 最后, 對(duì)比兩種診斷方法解算實(shí)驗(yàn)數(shù)據(jù)的表現(xiàn). 本文訓(xùn)練神經(jīng)網(wǎng)絡(luò)所使用的數(shù)據(jù)由碰撞輻射模型生成.生成訓(xùn)練集使用的Te-ne組合由51 個(gè)Te和47 個(gè)ne值兩兩組合而成, 共計(jì)2397 種.所涵蓋的參數(shù)范圍為Te= 5—10 eV,ne= 5 × 1010—6 × 1011cm–3.誤差引入方案為對(duì)所選的16 條譜線涉及的15 個(gè)譜線上能級(jí), 使用–30%—30%范圍內(nèi)的60 個(gè)隨機(jī)數(shù)作為相對(duì)偏差, 引入每個(gè)上能級(jí)對(duì)應(yīng)的截面數(shù)據(jù).以上述2397 種Te-ne組合作為碰撞輻射模型輸入?yún)?shù), 配合900 種誤差引入方案, 形成包含2397 × 900 組數(shù)據(jù)的光譜數(shù)據(jù)集, 用于訓(xùn)練神經(jīng)網(wǎng)絡(luò). 考慮到光譜向量向等離子體參數(shù)的映射屬于回歸問(wèn)題, 本文使用均方誤差作為損失函數(shù).圖5所示的是使用兩種數(shù)據(jù)正規(guī)化方法和兩種神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)時(shí), 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練情況.圖中縱坐標(biāo)表示訓(xùn)練時(shí)的均方誤差, 由每步迭代中的網(wǎng)絡(luò)輸出值與訓(xùn)練目標(biāo)值作均方差得到.由圖5 可見, 在本文所選網(wǎng)絡(luò)結(jié)構(gòu)和正規(guī)化方法中, 雙隱層網(wǎng)絡(luò)結(jié)構(gòu)搭配比和正規(guī)化方法有最快的收斂速度和最小的殘差. 圖6 所示的是電子溫度和電子密度的訓(xùn)練目標(biāo)和神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果的對(duì)應(yīng)關(guān)系.可以看出, 無(wú)論是對(duì)訓(xùn)練集還是測(cè)試集, 使用雙隱層網(wǎng)絡(luò)搭配比和正規(guī)化方法訓(xùn)練得到的網(wǎng)絡(luò)都可以較好地預(yù)測(cè)電子溫度和密度信息.網(wǎng)絡(luò)預(yù)測(cè)結(jié)果在電子溫度5—7 eV, 電子密度1 × 1011—3 × 1011cm–3的參數(shù)范圍內(nèi)誤差較大, 不過(guò)整體上Te的預(yù)測(cè)結(jié)果與目標(biāo)值間偏差均小于1%,ne的網(wǎng)絡(luò)預(yù)測(cè)結(jié)果與目標(biāo)值誤差均小于3%.在5.3 節(jié)對(duì)神經(jīng)網(wǎng)絡(luò)診斷方法和最小二乘診斷方法的對(duì)比分析中, 使用雙隱層網(wǎng)絡(luò)結(jié)構(gòu)搭配比和正規(guī)化方法訓(xùn)練的網(wǎng)絡(luò)進(jìn)行討論. 首先就基礎(chǔ)數(shù)據(jù)偏差對(duì)最小二乘方法的影響進(jìn)行探討.這里使用未含偏差的碰撞輻射模型生成待測(cè)光譜, 使用帶有偏差的模型對(duì)其進(jìn)行最小二乘擬合, 模擬實(shí)際診斷中基礎(chǔ)數(shù)據(jù)存在偏差的情形,以揭示模型所使用基礎(chǔ)數(shù)據(jù)上存在的偏差對(duì)最小二乘診斷方法的影響.進(jìn)行最小二乘擬合時(shí), 電子溫度和電子密度作為擬合參數(shù), 其他等離子體參數(shù)設(shè)置為與生成待測(cè)光譜時(shí)相同的值. 圖7 所示的是在向氙等離子體光譜診斷中經(jīng)常使用的881.941 nm 譜線對(duì)應(yīng)的上能級(jí)的截面數(shù)據(jù)中分別引入5%, 15%和30%的偏差時(shí), 待測(cè)光譜與使用最小二乘方法得到的最佳擬合的對(duì)比.生成圖中待測(cè)光譜的參數(shù)設(shè)定值為電子溫度=7.5 eV, 電子密度= 2 × 1011cm–3. 圖5 使用不同網(wǎng)絡(luò)結(jié)構(gòu)和數(shù)據(jù)正規(guī)化方法獲得的均方誤差隨迭代次數(shù)的變化Fig.5.Variation of mean square error with the number of iterations using different network structures and data normalization methods. 圖6 網(wǎng)絡(luò)預(yù)測(cè)結(jié)果與訓(xùn)練目標(biāo)的對(duì)應(yīng)關(guān)系 (a)電子溫度的對(duì)應(yīng)關(guān)系; (b)電子密度的對(duì)應(yīng)關(guān)系; (c)電子溫度的預(yù)測(cè)誤差;(d)電子密度的預(yù)測(cè)誤差Fig.6.Corresponding relationship between the network prediction result and the training target: (a) Corresponding relationship of the electron temperature; (b) corresponding relationship of the electron density; (c) prediction error of the electron temperature;(d) prediction error of the electron density. 圖7 使用最小二乘方法獲得的擬合結(jié)果(為保證圖的可讀性, 對(duì)離子譜線強(qiáng)度進(jìn)行了放大處理, 并將擬合所得光譜的波長(zhǎng)進(jìn)行了偏置)Fig.7.Fitting results obtained by the least square method (in order to improve the readability of the image, the intensity of the ion spectral line is amplified, and a bias is introduced into the wavelength of the fitting spectrum). 圖7 (a)是向擬合使用的模型中引入5%的偏差時(shí), 待測(cè)光譜與光譜的對(duì)比情況.圖中藍(lán)色譜線為使用設(shè)定參數(shù)和代入模型生成的待測(cè)光譜;紅色譜線為使用最小二乘擬合得到的最佳擬合光譜.圖7(d)中紅圈所示的是引入5%偏差時(shí)擬合結(jié)果與待測(cè)光譜譜線歸一化強(qiáng)度的比值.可以看出此時(shí)譜線擬合的最大殘差為3%; 診斷結(jié)果為電子溫度Te= 7.4 eV, 電子密度ne= 1.9 × 1011cm–3.圖7(b)和圖7(e)為向擬合所用模型引入15%偏差時(shí)的結(jié)果, 此時(shí)譜線擬合的最大殘差為9%; 診斷結(jié)果為電子溫度Te= 7.2 eV, 電子密度ne=1.8 × 1011cm–3.圖7(c)和圖7(f)是向擬合所用模型引入30%偏差時(shí)的結(jié)果, 此時(shí)譜線擬合的最大殘差為22%; 診斷結(jié)果為電子溫度Te= 7 eV, 電子密度ne= 1.5 × 1011cm–3. 可見, 基礎(chǔ)數(shù)據(jù)所含偏差導(dǎo)致最小二乘方法的擬合存在殘差, 并使得診斷結(jié)果與參數(shù)設(shè)定值間產(chǎn)生偏差.基礎(chǔ)數(shù)據(jù)的偏差大小與最小二乘方法的擬合殘差和診斷結(jié)果偏差大小呈正相關(guān).從上述例子還可以發(fā)現(xiàn), 向一條譜線引入的偏差會(huì)導(dǎo)致所有譜線的擬合結(jié)果存在殘差.這是最小二乘方法的特性使然: 由于等離子體中各種物理反應(yīng)過(guò)程的強(qiáng)耦合作用, 尋找所有譜線均方誤差最小的過(guò)程, 會(huì)導(dǎo)致單條譜線的偏差向其他譜線傳遞.導(dǎo)致實(shí)踐中難以鎖定偏差的根源來(lái)自哪些譜線, 無(wú)法通過(guò)實(shí)驗(yàn)獲得恰當(dāng)?shù)恼{(diào)整因子.這正是使用調(diào)整因子方法進(jìn)行光譜診斷的困難. 之后通過(guò)對(duì)比兩種光譜診斷方法的誤差半徑和偏心距, 對(duì)兩種方法的誤差特性進(jìn)行比較.在本文所研究的參數(shù)范圍內(nèi), 選擇Te和ne各11 個(gè)值作為設(shè)定值使用碰撞輻射模型生成待測(cè)光譜數(shù)據(jù).對(duì)這11 × 11 個(gè)Te-ne組合的每個(gè)點(diǎn), 使用一組均勻分布在–30%—30%間的60 個(gè)隨機(jī)數(shù)作為偏差值, 依次作用于碰撞輻射模型中的15 個(gè)能級(jí)截面,得到包含121 × 15 × 60 組待測(cè)光譜的數(shù)據(jù)集.對(duì)于這組待測(cè)光譜, 分別使用基于最小二乘擬合和神經(jīng)網(wǎng)絡(luò)的診斷方法得到診斷結(jié)果.使用4.3 節(jié)中定義的誤差半徑和偏心距, 對(duì)最小二乘診斷方法和神經(jīng)網(wǎng)絡(luò)診斷方法得到的結(jié)果進(jìn)行評(píng)價(jià). 圖8 (a)最小二乘方法診斷結(jié)果的平均誤差半徑; (b) 神經(jīng)網(wǎng)絡(luò)方法診斷結(jié)果的平均誤差半徑Fig.8.(a) Average error radius of the diagnosis result of the least square method; (b) average error radius of the diagnosis result of the neural network method. 圖9 (a)最小二乘方法診斷結(jié)果的最大誤差半徑; (b) 神經(jīng)網(wǎng)絡(luò)方法診斷結(jié)果的最大誤差半徑Fig.9.(a) The maximum error radius of the diagnosis result of the least square method; (b) the maximum error radius of the diagnosis result of the neural network method. 圖10 (a)最小二乘方法結(jié)果的偏心距; (b) 神經(jīng)網(wǎng)絡(luò)方法結(jié)果的偏心距Fig.10.(a) Eccentricity of the diagnosis result of the least square method; (b) the eccentricity of the diagnosis result of the neural network method. 圖8 和圖9 分別給出兩種診斷方法診斷結(jié)果的平均誤差半徑和最大誤差半徑.圖10 所示的是兩種診斷方法診斷結(jié)果的偏心距.可以看出, 在本文討論的參數(shù)范圍內(nèi), 最小二乘方法診斷結(jié)果的平均誤差半徑在0.60%—15.88%之間, 最大誤差半徑在1.0%—26.70%之間, 偏心距在0.0007%—0.28%之間; 而神經(jīng)網(wǎng)絡(luò)方法診斷結(jié)果的平均誤差半徑在0.06%—0.71%之間, 最大誤差半徑在0.31%—2.08%之間, 偏心距在0.05%—0.79%之間.總體上, 神經(jīng)網(wǎng)絡(luò)診斷方法結(jié)果的誤差半徑明顯小于最小二乘方法獲得的誤差半徑; 在偏心距方面, 神經(jīng)網(wǎng)絡(luò)方法獲得的結(jié)果與最小二乘方法基本相當(dāng), 兩種方法獲得的偏心距均在1%以下. 在本文討論的等離子體參數(shù)空間內(nèi), 兩種方法獲得的誤差半徑和偏心距的分布有所不同.對(duì)于最小二乘診斷方法, 在電子密度高于1011cm–3時(shí), 診斷結(jié)果的誤差半徑和偏心距普遍比電子密度低于1011cm–3時(shí)大; 而神經(jīng)網(wǎng)絡(luò)診斷方法獲得的誤差半徑和偏心距分布較為平緩, 呈現(xiàn)中間高兩邊低的分布特性. 可見, 截面數(shù)據(jù)上的偏差向診斷結(jié)果的傳遞量的大小與電子溫度密度參數(shù)范圍也有關(guān)系, 這可能是由不同參數(shù)條件下, 等離子體中各種動(dòng)力學(xué)過(guò)程此消彼長(zhǎng)導(dǎo)致的: 被引入截面偏差的過(guò)程在激發(fā)態(tài)粒子產(chǎn)生或損失中的占比會(huì)隨著等離子體參數(shù)的變化而改變.當(dāng)被引入截面偏差的過(guò)程在激發(fā)態(tài)產(chǎn)生或損失中占據(jù)主導(dǎo)地位時(shí), 截面數(shù)據(jù)上的偏差便會(huì)對(duì)激發(fā)態(tài)密度產(chǎn)生更大的影響, 進(jìn)而導(dǎo)致最終的診斷結(jié)果出現(xiàn)更大的偏差.以后的工作中還將針對(duì)這一問(wèn)題開展更深入的研究. 本節(jié)對(duì)神經(jīng)網(wǎng)絡(luò)和最小二乘兩種光譜診斷方法解算實(shí)驗(yàn)采集的光譜數(shù)據(jù)的性能進(jìn)行比較.圖11所示的是兩種光譜診斷方法獲得的電子密度和電子溫度與朗繆爾探針?biāo)媒Y(jié)果的對(duì)比.圖11(a)和圖11(b)分別給出了電子密度和電子溫度的對(duì)比結(jié)果.圖11(c)和圖11(d)分別給出了兩種光譜方法獲得的電子密度和電子溫度相對(duì)于朗繆爾探針?biāo)媒Y(jié)果的誤差.可以看出, 整體上, 電離室內(nèi)電子密度隨著測(cè)點(diǎn)位置遠(yuǎn)離陰極, 呈現(xiàn)逐漸下降的趨勢(shì).這是由于隨著測(cè)點(diǎn)遠(yuǎn)離陰極, 陰極發(fā)射的電子沿電離室徑向逐漸擴(kuò)散, 軸線上的電子密度因而逐漸減小.受到電離室內(nèi)會(huì)切型磁場(chǎng)的影響, 電子在磁尖端附近存在一定的聚集效應(yīng), 導(dǎo)致6 號(hào)位置處電子密度有所抬升. 同時(shí), 由于電離室筒形的陽(yáng)極結(jié)構(gòu), 電場(chǎng)沿電離室軸線遠(yuǎn)離陰極的方向逐漸減弱, 電子獲能隨之變差, 導(dǎo)致電子溫度隨著測(cè)點(diǎn)遠(yuǎn)離陰極位置呈減小的趨勢(shì).由圖10(c)和圖10(d)可以看出, 在解算實(shí)驗(yàn)光譜時(shí), 神經(jīng)網(wǎng)絡(luò)方法的誤差均小于最小二乘方法.神經(jīng)網(wǎng)絡(luò)方法獲得的結(jié)果相對(duì)于朗繆爾探針?biāo)@結(jié)果的誤差不超過(guò)5%, 而最小二乘方法在部分測(cè)點(diǎn)處的誤差超過(guò)了50%. 圖11 (a)考夫曼離子源中電子密度的診斷結(jié)果; (b)考夫曼離子源中電子溫度的診斷結(jié)果; (c)最小二乘方法和神經(jīng)網(wǎng)絡(luò)方法獲得的電子密度結(jié)果的相對(duì)誤差; (d)最小二乘方法和神經(jīng)網(wǎng)絡(luò)方法獲得的電子溫度結(jié)果的相對(duì)誤差.“探針”、“最小二乘”和“神經(jīng)網(wǎng)絡(luò)”分別表示由朗繆爾探針、最小二乘方法和神經(jīng)網(wǎng)絡(luò)方法獲得的診斷結(jié)果Fig.11.(a) Diagnostic results of ne in Kaufman ion source; (b) diagnostic results of Te in Kaufman ion source; (c) relative error of ne by least-square method and neural network method; (d) relative error of Te by least-square method and neural network method.“探針”, “最小二乘”, “神經(jīng)網(wǎng)絡(luò)” denotes the diagnostic results obtained by Langmuir probe, least-square diagnostic method and neural network diagnostic method, respectively. 從本文的研究結(jié)果可以發(fā)現(xiàn): 1)由于等離子體中各種物理反應(yīng)過(guò)程眾多, 相互耦合作用強(qiáng), 最小二乘法會(huì)使截面數(shù)據(jù)偏差在不同譜線間傳遞, 導(dǎo)致無(wú)法從擬合光譜與待測(cè)光譜得到的誤差向量中鎖定誤差的來(lái)源.這給利用調(diào)整因子修正模型的方法帶來(lái)了困難.2)神經(jīng)網(wǎng)絡(luò)方法能夠辨識(shí)等離子體發(fā)射光譜的特征, 進(jìn)而減弱部分譜線存在的偏差對(duì)整體診斷結(jié)果的影響.從本文的研究結(jié)果來(lái)看,截面數(shù)據(jù)偏差向診斷結(jié)果的傳遞量平均可由最小二乘方法的70%減小至神經(jīng)網(wǎng)絡(luò)方法的7%, 即神經(jīng)網(wǎng)絡(luò)方法可以減少60%以上的誤差傳遞量.3)本文基于前饋神經(jīng)網(wǎng)絡(luò)開發(fā)的診斷方法能夠?qū)菇孛鏀?shù)據(jù)上存在的偏差.從5.3 節(jié)中兩種診斷方法解算實(shí)驗(yàn)光譜數(shù)據(jù)的結(jié)果對(duì)比來(lái)看, 神經(jīng)網(wǎng)絡(luò)診斷方法所得結(jié)果的誤差明顯小于最小二乘擬合方法. 神經(jīng)網(wǎng)絡(luò)方法不僅可用于電子溫度密度的診斷, 在利用分子轉(zhuǎn)動(dòng)譜測(cè)量氣體溫度、使用絕對(duì)光強(qiáng)方法測(cè)量激發(fā)態(tài)密度等問(wèn)題的求解中同樣具有良好的應(yīng)用前景.此外, 使用神經(jīng)網(wǎng)絡(luò)方法分析等離子體發(fā)射光譜所消耗的時(shí)間要遠(yuǎn)小于基于最小二乘擬合的光譜診斷方法, 能夠?qū)崟r(shí)在線處理光譜數(shù)據(jù).使其在刻蝕、材料處理等的等離子體加工工藝流程, 以及空間等離子體裝置工作時(shí)對(duì)等離子體參數(shù)的在線監(jiān)測(cè)上也具有良好的應(yīng)用前景. 本文基于前饋神經(jīng)網(wǎng)絡(luò)發(fā)展了新的等離子體光譜診斷方法.通過(guò)對(duì)比新方法和以往常用的基于最小二乘擬合的診斷方法在截面數(shù)據(jù)存在偏差時(shí)的誤差特性, 發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)診斷方法在對(duì)抗基礎(chǔ)數(shù)據(jù)偏差方面有更好的性能.對(duì)實(shí)驗(yàn)測(cè)量光譜的解算結(jié)果也證實(shí)了神經(jīng)網(wǎng)絡(luò)方法在這方面具有的優(yōu)勢(shì).這種診斷方法在氣體溫度、激發(fā)態(tài)密度測(cè)量中具有較好的應(yīng)用前景, 還可推廣到等離子體刻蝕、材料處理等工藝流程的等離子體參數(shù)的在線監(jiān)測(cè)中, 有望進(jìn)一步提高測(cè)量的實(shí)時(shí)性和監(jiān)測(cè)精度. 感謝Maxime Bezanilla 先生對(duì)本文工作的啟發(fā).3 診斷實(shí)驗(yàn)
4 數(shù)據(jù)分析方法
4.1 基于最小二乘擬合的光譜診斷方法
4.2 基于前饋神經(jīng)網(wǎng)絡(luò)的光譜診斷方法
4.3 診斷方法的比較
5 結(jié)果與討論
5.1 神經(jīng)網(wǎng)絡(luò)訓(xùn)練及驗(yàn)證
5.2 最小二乘診斷方法和神經(jīng)網(wǎng)絡(luò)診斷方法誤差特性的對(duì)比
5.3 診斷方法的考核實(shí)驗(yàn)
6 結(jié) 論