喬春源,裴俊琛,*,王子澳,陳永靜
(1.北京大學(xué) 物理學(xué)院 核物理與核技術(shù)重點(diǎn)實(shí)驗(yàn)室,北京 100871;2.中國原子能科學(xué)研究院 核數(shù)據(jù)重點(diǎn)實(shí)驗(yàn)室,中國核數(shù)據(jù)中心,北京 102413)
原子核裂變的發(fā)現(xiàn)深刻地改變了人類社會(huì),也一直是核物理研究的一個(gè)重要分支。其中核裂變數(shù)據(jù)是很多核科學(xué)與核工程應(yīng)用的重要基礎(chǔ)數(shù)據(jù)[1-2],比如在核能、國防安全、核廢料嬗變、醫(yī)學(xué)同位素生產(chǎn)等方面,因此核裂變數(shù)據(jù)的精度和可靠性直接關(guān)系到相關(guān)應(yīng)用的有效性、安全性等。在超重元素合成[3-4]、反應(yīng)堆中反中微子異常和中子星合并過程中的r-process[5]等研究中,核裂變研究也是不可或缺的。隨著能源生產(chǎn)的革新,新一代反應(yīng)堆-快中子反應(yīng)堆對(duì)核數(shù)據(jù)的精度要求更高[6],也急需不同能量的中子誘發(fā)錒系核裂變產(chǎn)額數(shù)據(jù)。當(dāng)前實(shí)驗(yàn)測(cè)量的裂變產(chǎn)額數(shù)據(jù)往往是不完整的?;趯?shí)驗(yàn)數(shù)據(jù)和數(shù)據(jù)評(píng)價(jià)方法,國際上各核大國建立了自己的核數(shù)據(jù)中心和核數(shù)據(jù)評(píng)價(jià)庫,如中國的CENDL[7]、美國的ENDF/B-Ⅶ.1[8]、日本的JENDL-4.0[9]和歐洲的JEFF-3.1.1[10]等。但這些主要的核數(shù)據(jù)評(píng)價(jià)庫中只有熱中子、0.5 MeV和14 MeV 3個(gè)能量點(diǎn)的中子誘發(fā)裂變的完整產(chǎn)額分布。因此對(duì)連續(xù)能量的中子誘發(fā)裂變的產(chǎn)額進(jìn)行可靠的評(píng)價(jià)是非常受關(guān)注的問題。
目前裂變產(chǎn)額評(píng)價(jià)主要依賴唯象模型,如TALYS程序[11]、GEF唯象模型[12],但對(duì)缺乏實(shí)驗(yàn)數(shù)據(jù)的核區(qū)和能區(qū)的外推還不夠可靠。美國Randrup等[13]發(fā)展的宏觀-微觀模型和Schunck等[14]發(fā)展的TDGCM微觀模型在描述裂變碎片產(chǎn)額方面都取得了很大進(jìn)展。但基于位能面演化的裂變模型不能自洽地描述兩個(gè)碎片之間激發(fā)能的分配機(jī)制。在實(shí)驗(yàn)方面,國際上公開的來自國際原子能機(jī)構(gòu)牽頭的EXFOR庫的裂變產(chǎn)額數(shù)據(jù)也存在很大的不確定性和分歧,需要進(jìn)行甄別。目前,散裂中子源已成為核數(shù)據(jù)測(cè)量的先進(jìn)平臺(tái)。在我國廣東東莞建成的散裂中子源,為我國裂變實(shí)驗(yàn)研究提供了很好的平臺(tái)。同時(shí),國際上基于逆運(yùn)動(dòng)學(xué)技術(shù)和磁譜儀,實(shí)現(xiàn)了提取一些裂變產(chǎn)物的整條同位素鏈的產(chǎn)額分布[15]。這些技術(shù)的發(fā)展為裂變產(chǎn)額數(shù)據(jù)評(píng)價(jià)提供了很好的基礎(chǔ),同時(shí)可對(duì)微觀裂變理論提供更好的約束。但這些實(shí)驗(yàn)測(cè)量的裂變產(chǎn)額數(shù)據(jù)往往存在不確定度,是不完整的、有分歧的,而傳統(tǒng)的評(píng)價(jià)方法不能充分利用這些有缺陷的數(shù)據(jù)信息。
近年來,機(jī)器學(xué)習(xí)和人工智能在處理復(fù)雜的大數(shù)據(jù)方面有很大優(yōu)勢(shì)。在核物理領(lǐng)域與機(jī)器學(xué)習(xí)的交叉應(yīng)用正在興起[16],國內(nèi)核物理界相繼發(fā)表了機(jī)器學(xué)習(xí)對(duì)不同核物理問題的交叉應(yīng)用,如對(duì)原子核質(zhì)量[17]、電荷半徑[18]、反應(yīng)截面[19]、狀態(tài)方程[20]、裂變產(chǎn)額數(shù)據(jù)[21-22]等的學(xué)習(xí)和推斷。大家逐漸認(rèn)識(shí)到機(jī)器學(xué)習(xí)方法有望形成新的核數(shù)據(jù)評(píng)價(jià)方法,將理論模型計(jì)算、實(shí)驗(yàn)數(shù)據(jù)、數(shù)據(jù)不確定度量化等結(jié)合起來,實(shí)現(xiàn)數(shù)據(jù)評(píng)價(jià)自動(dòng)化,甄別異常數(shù)據(jù),已經(jīng)在核數(shù)據(jù)研究方面取得重要進(jìn)展[21-22]。
本文的主要目的是基于貝葉斯機(jī)器學(xué)習(xí),通過數(shù)據(jù)融合[23]利用大量的來自不同實(shí)驗(yàn)的原始裂變產(chǎn)額數(shù)據(jù)進(jìn)行產(chǎn)額-能量關(guān)系的研究。數(shù)據(jù)融合是處理不精確數(shù)據(jù)的一種盛行的方法,包括所有潛在的數(shù)據(jù)相關(guān)性,比單獨(dú)的數(shù)據(jù)源能提供更多的信息。利用融合后數(shù)據(jù)之間的相關(guān)性有助于提高預(yù)測(cè)能力。本文以中子誘發(fā)235U裂變?yōu)槔?,利用不同能量點(diǎn)的產(chǎn)額實(shí)驗(yàn)數(shù)據(jù)和JENDL-4.0庫的產(chǎn)額評(píng)價(jià)數(shù)據(jù)為約束條件,進(jìn)行產(chǎn)額-能量關(guān)系的研究。
本工作基于貝葉斯神經(jīng)網(wǎng)絡(luò)(BNN)方法[24]。與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)方法相比,BNN將神經(jīng)網(wǎng)絡(luò)權(quán)重參數(shù)設(shè)定為概率分布,而不是固定數(shù)值。BNN將網(wǎng)絡(luò)參數(shù)的概率分布視作先驗(yàn)分布,利用貝葉斯統(tǒng)計(jì)關(guān)系學(xué)習(xí)后得到后驗(yàn)分布,從而得到預(yù)測(cè)均值和不確定度。BNN還可以對(duì)特定問題采用不同的先驗(yàn)分布,從而引入懲罰函數(shù)避免過擬合問題。
基于貝葉斯定理得到參數(shù)的后驗(yàn)分布如下:
(1)
式中:P(θ)為先驗(yàn)分布,在訓(xùn)練數(shù)據(jù)之前已知的模型參數(shù)的信息;P(θ|D)為后驗(yàn)分布,表示學(xué)習(xí)數(shù)據(jù)集D的信息后得到的模型參數(shù)θ的分布;P(D|θ)為BNN網(wǎng)絡(luò)的似然函數(shù),一般采用高斯形式。似然分布函數(shù)由下式給出:
(2)
式中:D={xi,ti};χ2為目標(biāo)函數(shù),其形式為:
(3)
式中:xi為輸入數(shù)據(jù);ti為輸出結(jié)果裂變產(chǎn)額;Δti為噪聲強(qiáng)度[24];σi,exp為實(shí)驗(yàn)數(shù)據(jù)的誤差。一般的機(jī)器學(xué)習(xí)方法很少考慮實(shí)驗(yàn)數(shù)據(jù)的不確定度。在不同實(shí)驗(yàn)數(shù)據(jù)的融合中,不確定度大的數(shù)據(jù)所占的權(quán)重會(huì)比較小,這是合理的。Δti對(duì)同一種數(shù)據(jù)是均勻的,是隨學(xué)習(xí)而變化的超參數(shù),反映了神經(jīng)網(wǎng)絡(luò)對(duì)整體數(shù)據(jù)的描述能力。對(duì)實(shí)驗(yàn)數(shù)據(jù)的不確定度的考慮是貝葉斯機(jī)器學(xué)習(xí)的優(yōu)勢(shì)。
本文BNN采用前饋神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)函數(shù)為:
(4)
式中:H和I分別為隱藏神經(jīng)元的數(shù)量和輸入?yún)?shù)的個(gè)數(shù);θ為模型參數(shù);a、bj、cj、dij分別為輸出層的偏置、權(quán)重和隱藏層的偏置、權(quán)重。本工作采用Tanh激活函數(shù)和雙隱藏層的貝葉斯神經(jīng)網(wǎng)絡(luò)。
與傳統(tǒng)方法不同,貝葉斯預(yù)測(cè)是基于對(duì)后驗(yàn)分布生成的模型參數(shù)的大量估計(jì)。因此對(duì)于1個(gè)新輸入數(shù)據(jù)xn的預(yù)測(cè)結(jié)果,可根據(jù)馬爾科夫鏈-蒙特卡羅采樣積分得到:
(5)
本文以中子誘發(fā)235U裂變累積產(chǎn)額實(shí)驗(yàn)數(shù)據(jù)為例,基于BNN研究了裂變產(chǎn)額的產(chǎn)額-能量關(guān)系。神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)為xi={Zi,Ai,Ei},其中,Zi為裂變碎片的質(zhì)子數(shù),Ai為裂變碎片的質(zhì)量數(shù),Ei=ei+Si為復(fù)合核的激發(fā)能(ei和Si分別為入射中子能量和復(fù)合核中子分離能)。本工作主要是對(duì)中子誘發(fā)235U裂變累積產(chǎn)額進(jìn)行貝葉斯數(shù)據(jù)融合學(xué)習(xí)。采用了約53個(gè)不同能量的累積產(chǎn)額實(shí)驗(yàn)數(shù)據(jù),共計(jì)約1 527個(gè)數(shù)據(jù)點(diǎn)取自EXFOR庫[25],同時(shí)采用JENDL-4.0庫中熱中子、0.50 MeV和14 MeV能點(diǎn)共3 096個(gè)累積產(chǎn)額評(píng)價(jià)數(shù)據(jù)點(diǎn)作為約束學(xué)習(xí)[9]。
首先研究了不同神經(jīng)元個(gè)數(shù)的雙層網(wǎng)絡(luò)結(jié)果,分別計(jì)算了18×18、20×20和22×22個(gè)神經(jīng)元的網(wǎng)絡(luò),選取裂變碎片99Mo的產(chǎn)額-能量關(guān)系的比較結(jié)果,如圖1所示。從圖1可看出,實(shí)驗(yàn)數(shù)據(jù)是嘈雜的、不完整的,甚至還有分歧。發(fā)現(xiàn)隨著神經(jīng)元個(gè)數(shù)的增多,BNN的評(píng)價(jià)結(jié)果更接近JENDL-4.0的結(jié)果。圖1a中,BNN的評(píng)價(jià)結(jié)果與實(shí)驗(yàn)結(jié)果和JENDL-4.0結(jié)果都存在明顯偏差,并且置信區(qū)間更大。但圖1b和c中,BNN的評(píng)價(jià)結(jié)果符合實(shí)驗(yàn)結(jié)果和JENDL-4.0結(jié)果的趨勢(shì),其中在2~9 MeV之間20×20個(gè)神經(jīng)元的評(píng)價(jià)結(jié)果更符合實(shí)驗(yàn)結(jié)果。一般在結(jié)果相似情況下,神經(jīng)元越少的模型的推斷越可靠,以避免過擬合。因此本文的后續(xù)工作都是基于20×20個(gè)神經(jīng)元的雙層網(wǎng)絡(luò)BNN分析。
陰影部分為BNN評(píng)價(jià)不確定度,采用95%的置信區(qū)間圖1 采用雙隱藏層貝葉斯神經(jīng)網(wǎng)絡(luò)和不同神經(jīng)元個(gè)數(shù)對(duì)中子誘發(fā)235U裂變的碎片99Mo的產(chǎn)額-能量關(guān)系的評(píng)價(jià)結(jié)果的對(duì)比Fig.1 Comparison of evaluation results of two-layer Bayesian neural networks with different numbers of neurons for n+235U fission fragment 99Mo
一些長(zhǎng)壽命同位素的產(chǎn)額-能量關(guān)系在裂變環(huán)境監(jiān)測(cè)中具有特殊的應(yīng)用價(jià)值。比如97Zr是1種相對(duì)高產(chǎn)量的裂變產(chǎn)物,可用于零反應(yīng)堆功率的測(cè)定[26]。圖2示出97Zr、127Sb、131I、140Ba、143Ce和147Nd的裂變產(chǎn)額的能量依賴關(guān)系??煽闯?,數(shù)據(jù)融合可以合理地給出產(chǎn)額-能量關(guān)系和不確定度量化。本工作主要?jiǎng)訖C(jī)是推斷出熱中子到14 MeV之間的產(chǎn)額-能量依賴關(guān)系。對(duì)于97Zr,累積產(chǎn)額隨能量的增加下降。對(duì)于127Sb,累積產(chǎn)額隨能量的增加而增加。對(duì)于131I,累積產(chǎn)額隨能量先增加,但在10 MeV后趨于平緩。對(duì)于140Ba和143Ce,累積產(chǎn)額都是先隨著能量的增加而下降,在10 MeV后趨于平緩。對(duì)于147Nd,累積產(chǎn)額隨能量的增加而下降。選取的6個(gè)核的BNN評(píng)價(jià)結(jié)果趨勢(shì)都與實(shí)驗(yàn)結(jié)果符合,推斷的不確定度也是在能接受的范圍內(nèi)。BNN的不確定度包含兩部分:總體回歸的背景噪音和與數(shù)據(jù)有關(guān)的不確定度[24]。從圖2可看出,BNN評(píng)價(jià)的背景不確定度在1.35左右。
實(shí)驗(yàn)數(shù)據(jù)選取于EXFOR[25],陰影部分為BNN評(píng)價(jià)不確定度,采用95%的置信區(qū)間圖2 基于BNN研究n+235U反應(yīng)裂變碎片的產(chǎn)額-能量依賴關(guān)系Fig.2 BNN evaluated yield-energy relation of n+235U fission fragments
圖3示出了在2、6、8、10和14 MeV能量下,BNN數(shù)據(jù)融合得到的中子誘發(fā)235U裂變的二維累積產(chǎn)額分布。此前我們研究了對(duì)一維質(zhì)量Y(A)或電荷產(chǎn)額分布Y(Z)的評(píng)價(jià)[21-22],本文所展示的二維分布Y(Z,N)是以前工作的深入發(fā)展。二維累積產(chǎn)額分布與高斯分布有很大的不同,很難用半經(jīng)驗(yàn)?zāi)P椭苯佑?jì)算。原則上,本文的結(jié)果包含了所有碎片的產(chǎn)額-能量關(guān)系??煽闯觯谫|(zhì)子數(shù)Z=53~54和中子數(shù)N=80~81附近的產(chǎn)額最大,隨著能量的增加產(chǎn)額峰值在逐漸下降。一般認(rèn)為,隨著激發(fā)能的增加,對(duì)稱裂變會(huì)變得更加顯著[27-28]。非對(duì)稱裂變相關(guān)的兩個(gè)峰隨能量的增加而減小,而對(duì)稱裂變對(duì)應(yīng)的中間分布隨能量的增加而增大。因此,BNN數(shù)據(jù)融合可合理地描述裂變模式的能量依賴性。圖3f~j為相應(yīng)的不確定度,所有數(shù)據(jù)的整體背景噪音約為1.35。圖3f~j中1 032個(gè)數(shù)據(jù)點(diǎn)的平均不確定度分別為1.471、1.474、1.476、1.482和1.490。因?yàn)橐恍┧槠漠a(chǎn)額值較小,所以在圖3a~e中未顯示。但所有碎片的產(chǎn)額都存在背景不確定度,所以圖3f~j所顯示的范圍更大。精確和完整的累積產(chǎn)額是估算反應(yīng)堆異常中微子譜的關(guān)鍵,本文結(jié)果將為此類研究提供參考。目前BNN計(jì)算得到的不確定度仍較大?;诹炎兯槠姾煞植嫉呢惾~斯研究表明,加入奇偶效應(yīng)后不確定度會(huì)減小[22]。因此后續(xù)會(huì)研究奇偶效應(yīng)和其他物理約束對(duì)二維產(chǎn)額評(píng)價(jià)的影響。
圖3a~e中從藍(lán)色到紅色的變化表示碎片累積產(chǎn)額隨中子入射能量的變化,圖3f~j中的顏色變化反映了不確定度隨能量的變化圖3 貝葉斯神經(jīng)網(wǎng)絡(luò)得到的n+235U的二維累積產(chǎn)額分布隨能量的變化Fig.3 Two-dimensional CFY distributions of n+235U fission obtained by BNN data fusion
綜上所述,本文將貝葉斯機(jī)器學(xué)習(xí)應(yīng)用于有誤差的、不完整的、有分歧的所有中子誘發(fā)235U裂變的產(chǎn)額實(shí)驗(yàn)數(shù)據(jù)進(jìn)行融合評(píng)價(jià)。貝葉斯數(shù)據(jù)融合可以包含更多的潛在關(guān)聯(lián),可以增強(qiáng)對(duì)不完整裂變產(chǎn)額數(shù)據(jù)的能量依賴的推斷,這是快中子反應(yīng)堆模擬的關(guān)鍵需求。評(píng)價(jià)結(jié)果給出了關(guān)鍵裂變碎片的產(chǎn)額-能量關(guān)系,并得到了能量相關(guān)的累積裂變產(chǎn)額的二維分布,合理地反映了裂變模式隨能量增加的演化。相對(duì)于之前基于貝葉斯機(jī)器學(xué)習(xí)對(duì)一維的裂變產(chǎn)額分布進(jìn)行的學(xué)習(xí)和評(píng)價(jià),本文是以前工作的進(jìn)一步深入發(fā)展,更貼近實(shí)際的裂變產(chǎn)額數(shù)據(jù)需求。未來機(jī)器學(xué)習(xí)應(yīng)用于裂變產(chǎn)額數(shù)據(jù)評(píng)價(jià)還需進(jìn)一步考慮裂變物理的約束,減小推斷誤差,形成更可靠的評(píng)價(jià)方法。