中圖分類號(hào):057
隨著核技術(shù)的不斷發(fā)展,伽馬能譜核素識(shí)別技術(shù)在核設(shè)施運(yùn)維、環(huán)境輻射監(jiān)測(cè)、核應(yīng)急、放射性廢物管理等領(lǐng)域扮演著越來越重要的角色。傳統(tǒng)伽馬能譜核素識(shí)別技術(shù)以能譜中的全能峰結(jié)構(gòu)為分析對(duì)象,流程上主要由能譜平滑(去噪)、尋峰、基底扣除、峰擬合、核素庫匹配等步驟組成[-2],其在處理例如高純鍺(HPGe)探測(cè)器采集的高分辨率伽馬能譜時(shí),因能譜中全能峰清晰可辨,準(zhǔn)確性尚可,而在處理如NaI(TI)等探測(cè)器采集的低能量分辨率伽馬能譜時(shí),會(huì)因能譜展寬、全能峰重疊等不利因素而使核素識(shí)別精度顯著降低。由于大量的現(xiàn)場(chǎng)就地核素識(shí)別測(cè)量中往往采用更便攜易用的 NaI(Tl) 探測(cè)器,傳統(tǒng)峰分析法的弊端尤為凸顯,尤其是進(jìn)行多核素快速識(shí)別時(shí),其準(zhǔn)確率往往低于 50% ,該難題長期困擾著此領(lǐng)域的研究與應(yīng)用人員。另一些核素識(shí)別方法,如逐道最小二乘法、能譜重建法雖在一定程度上可彌補(bǔ)峰分析法的不足,但這些方法在標(biāo)準(zhǔn)譜獲取、響應(yīng)矩陣構(gòu)建等方面均有較嚴(yán)格要求,只能在少數(shù)
文獻(xiàn)標(biāo)志碼:A
特定條件下使用,應(yīng)用范圍非常有限[3-5] 。
人工智能理論與方法的興起,使得提高NaI(TI)等低能量分辨率探測(cè)器的伽馬能譜核素識(shí)別精度成為可能。目前,人工智能算法主要分為非人工神經(jīng)網(wǎng)絡(luò)類和人工神經(jīng)網(wǎng)絡(luò)類(artificialneuralnetwork,ANN)兩種,前者包括主成分分析(principalcomponentanalysis,PCA)、支撐向量機(jī)(supportvectormachine,SVM)等,后者包括全連接神經(jīng)網(wǎng)絡(luò)(fullyconnectednetwork,F(xiàn)CN)、卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)等。
基于非ANN算法的核素識(shí)別技術(shù),研究人員已開展研究包括:霍勇剛等[提出了基于模式識(shí)別的放射性核素快速識(shí)別方法,對(duì)CdZnTe探測(cè)器獲取的 γ 能譜,核素識(shí)別準(zhǔn)確率達(dá)到 93% ;張江梅等[7通過支持向量機(jī)對(duì)CdZnTe探測(cè)器獲取的伽馬能譜進(jìn)行核素識(shí)別,識(shí)別準(zhǔn)確率達(dá)到 94% ; LI等[8提出了基于序貫貝葉斯的核素快速識(shí)別方法,能滿足不同測(cè)量條件下對(duì) 137Cs 和 60Co 兩種目標(biāo)核素的識(shí)別需求。
基于ANN算法的核素識(shí)別技術(shù),研究人員已開展的研究包括:QI等[9]利用4層FCN實(shí)現(xiàn)了NaI(TI)探測(cè)器對(duì)14種核素的單核素識(shí)別,對(duì)模擬數(shù)據(jù)集的識(shí)別率達(dá) 99.87% (低計(jì)數(shù)下為98.63% ); Kim 等[°]基于3層FCN對(duì)塑料閃爍體探測(cè)器獲取的單核素能譜進(jìn)行解析,對(duì)4種核素的識(shí)別準(zhǔn)確率可達(dá)到 99% ,但其應(yīng)用場(chǎng)景必須與訓(xùn)練場(chǎng)景完全一致(源、探測(cè)器位置均保持不變);Kamuda等[]使用模擬能譜測(cè)試了3層FCN驅(qū)動(dòng)的 NaI(Tl) 探測(cè)器伽馬能譜自動(dòng)核素識(shí)別技術(shù),可在29種核素范圍內(nèi)實(shí)現(xiàn)準(zhǔn)確的單核素識(shí)別,但測(cè)量條件同樣必須與訓(xùn)練時(shí)完全相同。
上述各類人工智能算法盡管在特定條件下均展現(xiàn)出優(yōu)于傳統(tǒng)核素識(shí)別方法的優(yōu)勢(shì),但也反映出各自的固有缺陷。具體來說,對(duì)于非ANN算法,其數(shù)據(jù)降維、特征壓縮性能較強(qiáng),但細(xì)節(jié)特征提取能力不足,且非線性映射本領(lǐng)較弱,因此多數(shù)研究僅能實(shí)現(xiàn)對(duì)高分辨率探測(cè)器(如HPGe、CdZnTe探測(cè)器)、高計(jì)數(shù)能譜的1\~2種核素的識(shí)別,難以應(yīng)用于NaI(TI)能譜、低計(jì)數(shù)條件下的多核素識(shí)別任務(wù);相反,ANN算法的細(xì)節(jié)特征提取和非線性映射能力較強(qiáng),但數(shù)據(jù)降維、壓縮能力弱,表現(xiàn)為對(duì)能譜噪聲、溫漂、變形等因素高度敏感,因此已有基于ANN的核素識(shí)別研究為降低上述因素影響,均將模型訓(xùn)練和應(yīng)用限制在固定不變的場(chǎng)景下,即放射源位置、探測(cè)器位置、源距探測(cè)器距離等條件在訓(xùn)練、測(cè)試、應(yīng)用時(shí)始終嚴(yán)格不變,這顯然嚴(yán)重制約了相應(yīng)算法的普適性、通用性,顯著降低了研究的實(shí)用價(jià)值和應(yīng)用潛力。
鑒于非ANN算法和ANN算法單獨(dú)應(yīng)用時(shí)在核素識(shí)別任務(wù)上的缺陷以及其性能呈現(xiàn)互補(bǔ)的特點(diǎn),本文將兩種算法結(jié)合,提出一種混合模型,融合數(shù)據(jù)降維、細(xì)節(jié)特征提取和非線性映射性能于一體,從而提高處理 NaI(TI)能譜時(shí)的抗噪聲和復(fù)雜核素識(shí)別能力。
目前,非ANN與ANN的混合模型在其他領(lǐng)域有成功應(yīng)用案例,而在核素識(shí)別方向使用較少,僅CHEN等[12]通過對(duì) NaI(Tl) 探測(cè)器實(shí)測(cè)能譜進(jìn)行K-L變換再輸人2層FCN進(jìn)行解析,在固定測(cè)量條件下實(shí)現(xiàn)了一定效果的核素快速識(shí)別,但性能仍有較大提升空間。
1 材料與方法
1.1 通用數(shù)據(jù)集構(gòu)建
數(shù)據(jù)集是人工智能算法實(shí)施的前提和基礎(chǔ)。為此,本文采用實(shí)測(cè)和計(jì)算機(jī)蒙特卡羅模擬兩種方式構(gòu)建NaI(TI)伽馬能譜數(shù)據(jù)集,用于后續(xù)PCA-FCN模型的訓(xùn)練、測(cè)試和驗(yàn)證。
在構(gòu)造數(shù)據(jù)集時(shí)采用了隨機(jī)化策略,以生成高通用性能譜數(shù)據(jù),覆蓋實(shí)際中可能出現(xiàn)的能譜多樣化形態(tài)特征,使得經(jīng)訓(xùn)練的模型可用于多樣化測(cè)量場(chǎng)景而不只限于特定的固定場(chǎng)景,有效提升了其應(yīng)用潛力。
具體來說,模擬能譜時(shí),放射源位置(即其三維坐標(biāo)值)在NaI(TI)探測(cè)器前方一定區(qū)域內(nèi)隨機(jī)設(shè)置,放射源核素種類在某個(gè)核素集合內(nèi)隨機(jī)選取,放射源活度在一定區(qū)間內(nèi)取隨機(jī)值,源粒子數(shù)在一定區(qū)間內(nèi)取隨機(jī)值,同時(shí)NaI(TI)探測(cè)器尺寸、能量分辨率均在一定范圍內(nèi)隨機(jī)設(shè)置以涵蓋常見情形。另外,放射源發(fā)出的伽馬射線的能量還以特定方式偏移以模擬實(shí)際中存在的探測(cè)器“溫漂”效應(yīng)。
本文旨在建立該方法的框架,因此作為新方法的探索,對(duì)上述各類區(qū)間進(jìn)行如下簡化設(shè)置,以適當(dāng)限制參數(shù)遍歷空間大小,后續(xù)使用者可按實(shí)際需求對(duì)各區(qū)間范圍進(jìn)行改變或拓展以滿足應(yīng)用要求。具體設(shè)置如下:模擬能譜時(shí),放射源位置限制在探測(cè)器正前方 3m×3m×3m 空間內(nèi),如圖1所示,這符合常見情況下進(jìn)行伽馬源探測(cè)的實(shí)際空間尺寸;受實(shí)驗(yàn)室條件所限,現(xiàn)有 57Co?60Co 、54Mn 和 22Na 共4 種點(diǎn)源,在該集合內(nèi)隨機(jī)抽取任意個(gè)數(shù)(1\~4個(gè))核素作為放射源;放射源活度區(qū)間設(shè)置為 [10,1000]kBq ,這是一般常見豁免源的活度范圍;測(cè)量時(shí)長區(qū)間設(shè)置為[30,300]s,這符合一般采用便攜式核素識(shí)別儀進(jìn)行現(xiàn)場(chǎng)就地測(cè)量的時(shí)長范圍,粒子數(shù)按放射源實(shí)際活度和測(cè)量時(shí)長的乘積來確定區(qū)間上下限。
實(shí)測(cè)能譜時(shí),使用的NaI(Tl)探測(cè)器尺寸為?5.08cm×5.08cm ,設(shè)置能譜道數(shù)為1024。為了提高計(jì)數(shù)率,放射源位置(即其二維坐標(biāo)值,高度固定)在 NaI(Tl) 探測(cè)器前方 1.2m×0.6m (考慮鏡像,等價(jià)于前方 1.2m×1.2m )的范圍內(nèi)均勻分布的20個(gè)點(diǎn),如圖2所示。放射源的組合為4種單源和多源組合成的共15( 種方案。因此,實(shí)測(cè)能譜的總數(shù)為300個(gè)。
同時(shí),模擬時(shí) NaI(Tl) 探測(cè)器尺寸在 ?2.54 cm×2.54cm,?5. 08cm×5. 08cm,?7. 62cm×7. 62 cm 3 種常見規(guī)格中隨機(jī)選取,能譜展寬采用式(1)設(shè)置:
式中, FWHM 是全能峰半高寬; E 為沉積能量,keV;a 取值為[1.80,2.57],使得生成的 γ 能譜的能量分辨率在 [7%,10%] 區(qū)間,這同樣符合常規(guī)NaI(TI) 探測(cè)器的實(shí)際分辨率范圍。
為模擬實(shí)際測(cè)量時(shí) γ 能譜因溫度變化而發(fā)生的道址漂移,在能量沉積 E 上添加線性隨機(jī)漂移 ΔE :
ΔE=αE+β
式中, αβ 取值區(qū)間根據(jù)實(shí)測(cè)能譜的道址漂移程度確定, α 取值 [-0.045,0.045]; β 取值[-9.250,9.250]。采用上述線性漂移公式的原因在于伽馬能譜漂移一般包含能量零點(diǎn)漂移和增益漂移兩部分,其中能量零點(diǎn)漂移(系數(shù) β )由多道基線漂移造成,一般與能量無關(guān),而增益漂移(系數(shù) α )是由溫度變化帶來的脈沖增益,通常與能量成正比。
本文還做了探測(cè)場(chǎng)景的簡化,測(cè)量空間中無屏蔽體和散射體,后續(xù)使用者可按需在實(shí)測(cè)或模擬時(shí)在空間中添加屏蔽體和散射體等。
本文使用FLUKA軟件生成伽馬模擬譜,利用其DETECT卡記錄NaI(TI)晶體中的伽馬射線能量沉積,為了提高精度,使用PRECISIO參數(shù);能譜總道數(shù)設(shè)置為1024道(與實(shí)測(cè)時(shí)一致);上述模擬在96個(gè)Intel(R)Xeon(R)Platinum8160 CPU構(gòu)成的服務(wù)器平臺(tái)上完成。
1. 2 PCA-FCN模型
1. 2.1 PCA算法原理
PCA是一種經(jīng)典的降維算法,可以高效地將高維數(shù)據(jù)壓縮至低維空間并盡可能保留原始信息。針對(duì)本研究采用的1024道伽馬能譜數(shù)據(jù),PCA算法實(shí)施過程如下。
考慮 n 個(gè)伽馬能譜 {xi|xi∈R1024 ; i=1,2,… |n 構(gòu)成的 n×1024 階數(shù)據(jù)矩陣,見公式(3):
式中, n 為樣本數(shù);能譜道數(shù)(即維數(shù))為1024。對(duì)X 做歸一化、中心化等預(yù)處理后計(jì)算 X 的協(xié)方差矩陣 R ,如公式(4)對(duì) R 進(jìn)行特征值分解:
Re=λe
特征向量 ei 按特征值 λi 大小降序排列 (λ1 ?λ?2?λ?3?…?λ?1024) ,即可得到第1至第1024個(gè)主成分,第 i 個(gè)主成分對(duì)總數(shù)據(jù)方差的貢獻(xiàn)率為:
經(jīng)PCA降維后,能譜 x 的第 i 維分量(即在第i 個(gè)主成分方向的投影)為:
實(shí)際應(yīng)用中,一般可選擇PCA的前 ?m 個(gè)分量進(jìn)行數(shù)據(jù)重建以實(shí)現(xiàn)對(duì)原始數(shù)據(jù)的降維、壓縮與信息提取??梢??m 是PCA算法待優(yōu)化的關(guān)鍵參數(shù),具體優(yōu)化過程見下文。
1. 2. 2 PCA-FCN混合模型
本文在混合模型的ANN算法部分選擇了FCN模型,這不僅是因?yàn)榇饲敖^大多數(shù)基于ANN的核素識(shí)別研究采用了FCN模型,另一主要原因則是前置的PCA算法顯著降低了數(shù)據(jù)維數(shù)和噪聲影響,使得后續(xù)無需采用更復(fù)雜的ANN模型例如CNN等(CNN更擅長高維、高噪聲數(shù)據(jù))來實(shí)現(xiàn)非線性映射。
最終,PCA-FCN混合模型架構(gòu)如圖3所示。
其中FCN使用3層神經(jīng)網(wǎng)絡(luò),輸人層對(duì)應(yīng)PCA模型的輸出,第一、二層為隱藏層,其神經(jīng)元數(shù)為模型待優(yōu)化參數(shù),輸出層神經(jīng)元數(shù)與待識(shí)別核素?cái)?shù)相等(本文中為4);第一、二層激勵(lì)函數(shù)選用ReLU(RectifiedLinearUnit,線性整流函數(shù)),以增強(qiáng)模型非線性映射能力,輸出層激勵(lì)函數(shù)選用Sigmoid函數(shù),使得輸出層各神經(jīng)元取值范圍在[0,1]內(nèi),其值代表所對(duì)應(yīng)核素的存在概率,應(yīng)用時(shí)設(shè)置篩選閾值,當(dāng)輸出層第i個(gè)神經(jīng)元的值超過閾值時(shí)代表第 i 個(gè)核素存在。
在圖3的結(jié)構(gòu)中,能譜通過PCA將維度降為Ωm 之后輸入神經(jīng)網(wǎng)絡(luò)(即輸入層神經(jīng)元個(gè)數(shù)等于m ),神經(jīng)網(wǎng)絡(luò)第1、2、3層的神經(jīng)元個(gè)數(shù)分別為 n )p 和4(核素4種),則最終輸出層第 ξl 個(gè)神經(jīng)元的值 Yι 可以表示為:
式中, yi 為輸入層第 i 個(gè)神經(jīng)元值 :(204號(hào) wji(1) 為連接輸人層第 i 個(gè)神經(jīng)元和第一層第 j 個(gè)神經(jīng)元的權(quán)重( j=1,2,…,n) ; wkj(1) 為連接第一層第 j 個(gè)神經(jīng)元和第二層第 k 個(gè)神經(jīng)元的權(quán)重( k= 1,2,…,p) ; wlk(2) 為連接第二層第 k 個(gè)神經(jīng)元和第三層(輸出層)第 l 個(gè)神經(jīng)元的權(quán)重; bj(1) 為第一層第 j 個(gè)神經(jīng)元的偏置值; bk(2) 為二層第 k 個(gè)神經(jīng)元的偏置值; bl(3) 為第三層(輸出層)第 ξl 個(gè)神經(jīng)元的偏置值。
ReLU函數(shù)形式如下:
y=max(0,x)
式中, x 代表神經(jīng)網(wǎng)絡(luò)中上一層神經(jīng)元的加權(quán)和,當(dāng) x 大于0時(shí),輸出等于 x 本身;當(dāng) x 小于或等于0時(shí),輸出為O。因此,這種特性使得ReLU函數(shù)能夠引入非線性。
Sigmoid函數(shù)形式如下:
當(dāng) x 的值較大時(shí)(正值),輸出接近于1;當(dāng) x 的值較?。ㄘ?fù)值)時(shí),輸出接近于0。輸出被視為輸入樣本屬于某一類的概率,在本文中代表能譜中含有某一核素的概率。
1. 2.3 性能評(píng)估指標(biāo)
為準(zhǔn)確評(píng)價(jià)模型的核素識(shí)別性能,衡量其核素識(shí)別率、誤識(shí)別率和漏識(shí)別率的綜合表現(xiàn),本文采用人工智能分類任務(wù)領(lǐng)域的經(jīng)典指標(biāo):平均精度 Ap (average precision)和 F1 分?jǐn)?shù)[13-14],其定義如下。
對(duì)于核素識(shí)別問題,可能的識(shí)別結(jié)果列于表1。
對(duì)所有核素,統(tǒng)計(jì)上述矩陣中各值,從而可以得到總的預(yù)測(cè)精度 P (precision)和召回率 R (recall),計(jì)算公式為:
P,R 值隨前述識(shí)別閾值的改變而變化,從而可得到 P-R 變化曲線,而平均精度 Ap 值就是 P-R 曲線下的面積,可用積分表示為:
F1 分?jǐn)?shù)則是一個(gè)權(quán)衡了識(shí)別靈敏度和抗噪聲能力的性能因子,對(duì)核素識(shí)別任務(wù)同樣關(guān)鍵,其定義如下:
Ap?F1 均在[0,1]間取值,指示了模型的平均核素識(shí)別率和誤識(shí)別率,值越接近1,表示模型性能越好。
1. 2.4 PCA-FCN模型的優(yōu)化
PCA主成分個(gè)數(shù)、FCN第一、二層神經(jīng)元數(shù)一般被稱為模型的超參數(shù),為實(shí)現(xiàn)超參數(shù)優(yōu)化,本文采用網(wǎng)格搜索策略,即在特定區(qū)間內(nèi)對(duì)各超參數(shù)進(jìn)行網(wǎng)格式搜索,通過比較被搜索模型的 Ap?F1 值以尋找最優(yōu)超參數(shù)。
人工智能模型中神經(jīng)元個(gè)數(shù)參數(shù)一般以2的次方模式進(jìn)行設(shè)置,由于伽馬能譜道數(shù)為1024、待識(shí)別核素?cái)?shù)為4,因此PCA主成分個(gè)數(shù)和FCN各層神經(jīng)元數(shù)的搜索區(qū)間均為 。根據(jù)慣例,選擇 70% 的數(shù)據(jù)用于模型訓(xùn)練,剩余 30% 的數(shù)據(jù)用于性能測(cè)試,以比較得到的 Ap?F1 值并實(shí)現(xiàn)參數(shù)優(yōu)化。
1.3 實(shí)測(cè)驗(yàn)證實(shí)驗(yàn)
實(shí)現(xiàn)模型優(yōu)化后,開展實(shí)測(cè)驗(yàn)證實(shí)驗(yàn)。用于性能驗(yàn)證的實(shí)測(cè)能譜的獲取方法與構(gòu)建數(shù)據(jù)集時(shí)類似,即采用隨機(jī)化策略,在1.1節(jié)所述區(qū)間內(nèi)變化放射源個(gè)數(shù)、放射源位置和測(cè)量時(shí)長,最終得到300個(gè)實(shí)測(cè)待識(shí)別能譜
開展性能驗(yàn)證時(shí),同步將PCA-FCN模型與FCN模型、PCA模型以及傳統(tǒng)的全能峰分析方法進(jìn)行對(duì)比,直觀顯示模型性能的優(yōu)劣。其中PCA模型實(shí)際為PCA-SVM聯(lián)合模型,因?yàn)镻CA本身不具備分類功能,實(shí)際應(yīng)用中一般將PCA與其它傳統(tǒng)分類算法結(jié)合使用。對(duì)比同樣采用 性能指標(biāo),用于對(duì)比的各個(gè)模型的超參數(shù)同樣取最優(yōu)值,具體優(yōu)化過程與1.2.4節(jié)類似,故略去。
2 結(jié)果與討論
2.1構(gòu)建的通用數(shù)據(jù)集
本文通過實(shí)驗(yàn)測(cè)量和蒙特卡羅模擬最終構(gòu)建了10000個(gè)伽馬能譜樣本的數(shù)據(jù)集。圖4展示了單種核素(以 54Mn 為例)在不同源位置、不同能量分辨率、不同活度和不同測(cè)量時(shí)長下的能譜,圖5則展示了混合核素情況,另外圖6展示了模擬產(chǎn)生的能譜“溫漂”效應(yīng)。圖4和圖5顯示數(shù)據(jù)集覆蓋了不同測(cè)量條件下的多樣化能譜形態(tài)特征,從而為拓展模型的通用性奠定了基礎(chǔ),使得無需要求訓(xùn)練與應(yīng)用時(shí)放射源位置、探測(cè)器能量分辨率和測(cè)量時(shí)長等條件完全一致。
2.2 優(yōu)化的PCA-FCN模型
PCA主成分個(gè)數(shù)、FCN第一、二層神經(jīng)元數(shù)量變化時(shí) Ap 和 F1 取值情況如圖7所示,通過比較得到,當(dāng)PCA輸出維數(shù)取 23 、FCN第一、二層神經(jīng)元數(shù)量取 2° 時(shí), Ap 與 F1 分?jǐn)?shù)在驗(yàn)證集上皆能取到最大值0.9941和0.9902。
2.3 性能驗(yàn)證
各模型在驗(yàn)證集(300個(gè)實(shí)測(cè)能譜)上的 P-R 曲線如圖8,PCA-FCN的 P-R 曲線下的面積(即Ap 值)最大,表2進(jìn)一步印證了上述結(jié)果,PCA-FCN模型的 值均大于0.98,顯著優(yōu)于其它三種方法,顯示其平均核素識(shí)別率大于 98% 且誤識(shí)別率 lt;2% ;其它三種方法的 Ap?F1 值均小于0.9,其中FCN模型優(yōu)于其它兩種方法,而傳統(tǒng)的全能峰分析法性能最差,平均核素識(shí)別率小
1400 混合譜1(核素組合:Co+C)混合譜2(核素組合:Co+Na)1200 混合譜3(核素組合:Co+Mn)混合譜4(核素組合: )1000 混合譜5(核素組合:Co+Na)混合譜6(核素組合:Co+Na)
數(shù) 800 混合譜7(核素組合:Co+Co+Mn)
計(jì) 混合譜8(核素組合:Co+Co+Na)600 混合譜9(核素組合:Co+Mn+Na)混合譜10(核素組合:Co+Mn+2Na)400 混合譜11(核素組合: 2757C0+2760C0+2554Mn+1122Na) 20000 200 400 600 8001000 1200 14001600能量(keV)
于 70% 。
同時(shí),圖9給出了各方法核素識(shí)別混淆矩陣,矩陣中第 i 行第 j 列的元素值代表第 i 種核素組合被識(shí)別為第 j 種核素組合的概率,取值范圍為[0,1]。理想情況下,混淆矩陣的對(duì)角線元均為1,非對(duì)角元均為0。圖9直觀地反映出,PCA-FCN的混淆矩陣非對(duì)角元幾乎為0,而其它三種方法均散布有較明顯的非對(duì)角元;表3列出了4種方法的核素識(shí)別混淆矩陣的對(duì)角元,PCA-FCN模型的對(duì)角元均接近于1,具體在[0.9806,1.0000]之間,說明非對(duì)角元均較小,而PCA模型的對(duì)角元在[0.635 0.0.798 4] 之間,F(xiàn)CN模型的對(duì)角元在[0.7927,0.8462]之間,傳統(tǒng)全能峰法的對(duì)角元在 [0.5023,0.6981] 之間。表4統(tǒng)計(jì)了較低與較高能譜總計(jì)數(shù)條件下各方法的核素識(shí)別率效果
2.4 討論
從表3混淆矩陣對(duì)角元分布上看,PCA-FCN模型在單核素和多核素條件下的核素識(shí)別準(zhǔn)確率差異不大,說明能譜復(fù)雜度對(duì)其識(shí)別性能影響較小,同時(shí),表4顯示不同計(jì)數(shù)條件下該模型識(shí)別準(zhǔn)確率變化同樣不明顯,即模型對(duì)能譜統(tǒng)計(jì)漲落具備魯棒性;上述數(shù)據(jù)表明PCA-FCN模型很好地繼承了ANN類模型對(duì)復(fù)雜能譜的特征提取能力和非ANN類模型對(duì)統(tǒng)計(jì)噪聲的抑制作用,體現(xiàn)了兩種基礎(chǔ)模型的互補(bǔ)優(yōu)勢(shì);同時(shí),驗(yàn)證了經(jīng)通用數(shù)據(jù)訓(xùn)練的模型可準(zhǔn)確識(shí)別不同測(cè)量下的各種能譜,證實(shí)模型通用性得到明顯增強(qiáng)
相比而言,表3中PCA模型在單核素情形下的識(shí)別準(zhǔn)確率較高,數(shù)值在[0.7812,0.7984]范圍內(nèi),在兩種核素情形下則降至[0.7004,0.7578],3種核素情形下進(jìn)一步下降至[0.6749,0.7050],4種核素情形下低至0.6350,可見其識(shí)別準(zhǔn)確率隨核素種類即能譜復(fù)雜度的增加而下降。相反,表4中PCA模型核素識(shí)別率隨能譜總計(jì)數(shù)變化則較小,即對(duì)能譜統(tǒng)計(jì)漲落不敏感。正如前言指出的,這是由于PCA等非ANN類算法以數(shù)據(jù)降維、聚類為主要機(jī)制,蘊(yùn)含了較強(qiáng)的數(shù)據(jù)平滑、去噪作用,因此表現(xiàn)出一定的抗統(tǒng)計(jì)漲落性能,但聚類過程大多以數(shù)據(jù)點(diǎn)間距離等作為簡化的歸類依據(jù),細(xì)節(jié)特征提取和非線性映射能力不足,故而在處理NaI探測(cè)器伽馬能譜時(shí),難以應(yīng)對(duì)多核素識(shí)別任務(wù)。
FCN模型在各種核素?cái)?shù)量下的識(shí)別準(zhǔn)確率變化不大(見表3),具體為單核素時(shí)在[0.7946,0.8462]范圍內(nèi),兩種核素時(shí)為[0.7927,0.8367],3種核素時(shí)為[0.7993,0.8386],4種核素時(shí)為0.8261,但能譜總計(jì)數(shù)對(duì)其核素識(shí)別性能有較大影響(見表4),原因同樣如前言所述,ANN類算法通過對(duì)全譜信息的逐層提取,可較好表征能譜細(xì)節(jié)特征,并建立能譜與核素之間的非線性映射關(guān)系,從而在處理較復(fù)雜的多核素能譜時(shí)性能仍能保持準(zhǔn)確性,但由于缺乏數(shù)據(jù)預(yù)處理、降維、去噪環(huán)節(jié),對(duì)能譜統(tǒng)計(jì)漲落更敏感
由表3和表4可知,傳統(tǒng)的全能峰分析法的核素識(shí)別準(zhǔn)確率隨核素?cái)?shù)量的增加和能譜總計(jì)數(shù)的降低而顯著下降,這是因?yàn)槿芊宸治龇ㄒ蕾噷?duì)能譜中單個(gè)峰結(jié)構(gòu)的識(shí)別,核素?cái)?shù)量增加時(shí)能譜中全能峰數(shù)量也增加,全能峰相互重疊的情況更顯著,增加了單個(gè)全能峰的識(shí)別難度;同時(shí),能譜總計(jì)數(shù)降低,能譜統(tǒng)計(jì)漲落變大,信噪比下降,全能峰同樣更難以被準(zhǔn)確識(shí)別。
3結(jié)論
本文針對(duì)傳統(tǒng)方法的NaI(TI)伽馬能譜核素識(shí)別準(zhǔn)確性較低的難題,分析了現(xiàn)有ANN類和非
ANN類識(shí)別模型的優(yōu)缺點(diǎn),提出PCA-FCN混合模型,綜合了ANN類模型的細(xì)節(jié)特征提取能力和非ANN類型模型的數(shù)據(jù)降維優(yōu)勢(shì);同時(shí),針對(duì)已有研究必須確保模型訓(xùn)練與應(yīng)用時(shí)測(cè)量條件完全一致的缺陷,建立了隨機(jī)化能譜樣本生成策略,構(gòu)建了通用性較強(qiáng)的能譜數(shù)據(jù)集,為拓展模型實(shí)用價(jià)值奠定了基礎(chǔ)。基于實(shí)測(cè)的驗(yàn)證實(shí)驗(yàn)證明了PCA-FCN模型的優(yōu)勢(shì)和隨機(jī)化策略的可行性,對(duì)300個(gè)待識(shí)別實(shí)測(cè)能譜,PCA-FCN 模型的 Ap?F1 指標(biāo)達(dá)到0.9823和0.9801,顯著優(yōu)于PCA模型、FCN模型以及傳統(tǒng)的全能峰分析方法;PCA-FCN模型在不同核素?cái)?shù)量、不同能譜總計(jì)數(shù)條件下識(shí)別準(zhǔn)確率較穩(wěn)定,而其余三種模型受這些條件影響較大。本文旨在建立了一種基于PCA-FCN模型和隨機(jī)化樣本生成策略的核素識(shí)別技術(shù)框架,后續(xù)使用者可根據(jù)實(shí)際需求在本文基礎(chǔ)上擴(kuò)展數(shù)據(jù)集以增強(qiáng)方法適用性。本文的結(jié)果驗(yàn)證了該技術(shù)在未來付諸實(shí)際應(yīng)用的潛力。
參考文獻(xiàn):
[1]高妍,曾國強(qiáng),顧民,等.核素識(shí)別儀中的自適應(yīng)變換寬度 SNIP 算法開發(fā)[J].核技術(shù),2019,42(6):30-34. GAO Yan,ZENG Guoqiang,GU Min,etal.Developmentof adaptive width SNIPalgorithm in nuclides identification instrument[J]. Nuclear Techniques,2019,42(6) :30-34.
[2]趙日,劉立業(yè),李君利.基于遞推關(guān)系式的 γ 能譜全能峰基底扣減方法[J].原子能科學(xué)技術(shù),2018,52(6):1085 -1091. ZHAO Ri,LIU Liye,LI Junli. Continuum subtraction method under full-energy peak in γ spectrum based on recursion formula[J]. Atomic Energy Science and Technology,2018,52(6):1085-1091.
[3]ZHU Menghua,LIU Lianggang,QI Dongxu,etal.Leastsquare fitig oflowresolution gammaray spectra with cubic Bspline basis functions[J]. Chinese Physics C,2009,33(1):24-30.
[4]BI Haijie,ZHANG Yingying,WU Bingwei,etal.Studyonreconstructionand analytical methodofseawaterradioactive gamma spectrum[J].Applied Radiationand Isotopes:Including Data,Instrumentationand MethodsforUse in Agriculture,Industry and Medicine,2023,198:110853.
[5]趙日,劉立業(yè),曹勤劍.基于能譜重建技術(shù)的全身計(jì)數(shù)器 x 能譜分析[J].原子能科學(xué)技術(shù),2019,53(8):1495 -1501. ZHAO Ri,LIU Liye,CAO Qinjian.Y spectrum analysis based on reconstruction technology for whole body counter[J]. Atomic Energy Science and Technology,2019,53(8) : 1495-1501.
[6]霍勇剛,安洪振,吳岳雷,等.一種基于模式識(shí)別的放射性核素快速識(shí)別方法研究[J].核電子學(xué)與探測(cè)技術(shù),2014, 34(1) :51-53. HUO Yngang,AN Hongzhen,WU Yuelei,et al.Fast radioactive nuclide recognition method study basedon pattern recognition[J]. Nuclear Electronics amp; Detection Technology,2014,34(1):51-53.
[7]張江梅,任俊松,李培培,等.基于支持向量機(jī)的復(fù)雜核素能譜識(shí)別[J].核電子學(xué)與探測(cè)技術(shù),2016,36(8):856 -861. ZHANG Jiangmei,REN Junsong,LI Peipei,etal.Complex radioactive nuclide identification method based onsupport vector machine[J]. Nuclear Electronics amp; Detection Technology,2016,36(8): 856-861.
[8]LI Xiaozhe,ZHANG Qingxian,TANHeyi,et al.Fast nuclide identificationbasedona sequential Bayesian method[J]. Nuclear Science and Techniques,2021,32(12): 143.
[9] QI Sheng,WANG Shanqiang,CHEN Ye,et al.Radionuclide identification method for NaI low-count gamma-ray spectra using artificial neural network[J]. Nuclear Engineering and Technology, 2O22, 54(1) : 269-274.
[10] Kim J,Park K,ChoG.Multi-radioisotope identification algorithmusing anartificial neural network for plastic gamma spectra[J].Applied Radiation and Isotopes,2019,147:83-90.
[11] KamudaM,StinnettJ,Sullivan CJ.Automatedisotope identification algorithmusing arificial neural networks[J].IEEE Transactions on Nuclear Science,2017,64(7):1858-1864.
[12] CHEN Liang,WEI Yixiang.Nuclide identification algorithm basedonK-L transform and neural networks[J].Nuclear InstrumentsandMethods inPhysicsResearch,Section A:Accelerators,Spectrometers,Detectorsand Associated Equipment,2009,598(2):450-453.
[13] MathewJ,KshirsagarR,Abidin DZ,etal.A comparison of machine learning methods to clasifyradioactive elements using prompt-gamma-ray neutron activation data[J]. Scientific Reports,2O23,13(1): 9948.
[14] Al-Nima R RO,Dlay S S,WooWL,etal.Anovelbiometricapproach to generate ROC curve from the Probabilistic Neural Network[C]//2016 24th Signal Processng and Communication Application Conference (SIU):IEEE,2016:141- 144.
Research on NaI( Tl) gamma spectrum radionuclide identification technology based on hybrid PCA-FCN model
LIU Xin1,2, ZHAO Ri'2, TAN Jun1 , WANG Maolin1, HUANG Jian1, ZHANG Jing1,2, LIANG Runcheng12,LIU Zhaoxing1,2,SHI Zhongyan12,WANG Jia1,LINGHU Renjing1,LIU Liye' (1. China Institute for Radiation Protection,Taiyuan O3Ooo6;2. Shanxi Provincial Key Laboratory for Translational Nuclear Medicine and Precision Protection,Taiyuan O30006)
Abstract:The poor energy resolution of Nal(Tl)detector makes it dificult to accurately identify radionuclides based on the acquired gamma spectrum.In order to improve the identification accuracy,this paper proposed a hybrid PCA-FCN identification model based on the advantages and disadvantages of existing research methods and models. Based on the randomization strategy,a robust gamma energy spectrum datasets was constructed through empirical measurements and Monte Carlo simulations.The datasets was utilized to train the model and conduct validation experiments.Results indicate that the PCA-FCN model achieved radionuclide identification performance factors of O. 982 3 for average precision (AP )and 0.980 1 for the F1 score,markedly surpassing the performance of PCA models,F(xiàn)CN models,and traditional full-energy peak analysis methods.The identification accuracy can stillbe maintained under varying spectral complexities and statistical fluctuations. This conclusion shows the potential of the PCA-FCN model and the random sample generation strategy for future applications in quantitative measurement of radioactivity.
Key words:NaI(Tl) detector; radionuclide identification;gamma spectrum;principal component analysis; fully connected network