彭向凱 吉經緯 李琳 任偉 項靜峰 劉亢亢 程鶴楠 張鎮(zhèn) 屈求智 李唐 劉亮? 呂德勝?
1)(中國科學院上海光學精密機械研究所,量子光學重點實驗室,上海 201800)
2)(中國科學院大學材料與光電子研究中心,北京 100049)
由于原子在外磁場作用下的塞曼效應導致原子能級分裂與頻移,使原子鐘、原子干涉儀以及冷原子重力儀等以原子作為傳感器的精密設備都會受環(huán)境磁場影響[1?5],在地面實驗室環(huán)境中,主要是地磁場的影響.解決此問題的通常做法是對待測原子樣品做多層磁屏蔽以降低環(huán)境磁場對屏蔽內部原子的影響,磁屏蔽材料一般選用磁導率較高的坡莫合金鐵磁材料[6,7].但是對于繞地球飛行的星上設備來說,比如星載原子鐘與空間冷原子鐘,感受到的地磁場和地面實驗室的很大不同之處在于衛(wèi)星會經歷一個周期變化的磁場[8?10].例如對于搭載在“天宮二號”空間實驗室的空間冷原子鐘來說,衛(wèi)星在近地約400 km的斜45°軌道運行,經歷磁場變化受衛(wèi)星繞地周期與地球自轉兩方面的影響,磁場隨時間變化近似于被20 d周期調幅的90 min周期正弦曲線[11].在這樣的環(huán)境磁場影響下,星上原子鐘磁屏蔽內的原子樣品感受到的磁場不僅有被屏蔽衰減后的剩余磁場,更嚴重的是有鐵磁材料在變化外場下被磁化產生的感應交變磁場.
如果能夠精確測量磁屏蔽內感應磁場,可以通過洛倫茲線圈產生動態(tài)補償磁場來有效消除變化外場的影響,由于磁場傳感器自身磁性對原子樣品會產生干擾,在靠近原子樣品的屏蔽內放置磁場傳感器的方法并不適用,需要通過探測環(huán)境磁場來精確預測屏蔽內感應磁場.磁屏蔽內感應磁場隨外磁場呈磁滯曲線變化,可以通過線性擬合或多項式擬合的方法近似預測[8,9],更精確的方法是使用Jiles-Atherton(J-A)磁滯模型[12?14],該模型是目前最為常用的描述鐵磁性材料磁滯特性的經典數(shù)學模型,是一種具有物理基礎的現(xiàn)象學模型,能夠真實地描述磁屏蔽內感應磁場與外磁場的非線性關系,通過求解J-A磁滯模型方程便能夠得到較為準確的磁滯回線,從而根據(jù)探測到的環(huán)境磁場精確預測磁屏蔽內感應磁場
在J-A磁滯模型方程中,代表磁性材料特性的一組J-A參數(shù)是整個問題的基礎,目前還沒有一種快速、便捷、精確的方法對這一問題進行完整的解決,通常是在經驗值的基礎上根據(jù)特性磁場環(huán)境實驗測試進行擬合.機器學習技術,尤其是依賴人工神經網(wǎng)絡的深度學習,有極其強大的擬合能力[15?17].同時使用在線學習的技術,可以自動尋找到最優(yōu)化的參數(shù)值[18?20].這個過程往往遠快于人工調節(jié),并且結果往往優(yōu)于人工調節(jié).機器學習在線優(yōu)化技術已經應用于相當多的量子實驗中[21?25],而深度神經網(wǎng)絡也已經應用于冷原子實驗的磁光阱(magnetooptical trap,MOT)參數(shù)的優(yōu)化[26].之前也有研究利用神經網(wǎng)絡結合遺傳算法通過離線學習對硅鋼片J-A參數(shù)進行優(yōu)化擬合,其結果優(yōu)于利用解析模型的擬合[27,28].神經網(wǎng)絡從數(shù)學模型角度可以看作對復雜函數(shù)的擬合,多參數(shù)擬合對人工計算是比較困難的工作,對于現(xiàn)在電腦來說卻是非常簡單的工作,參數(shù)越多這種差異越明顯.使用神經網(wǎng)絡,得益于電腦的運算速度,即便數(shù)百個參數(shù)的擬合仍然可以快速準確地完成,而對于人工來說幾乎是不可能完成的.本文使用神經網(wǎng)絡模型在線學習對JA參數(shù)進行最優(yōu)化擬合,可以用更少的時間找到最優(yōu)參數(shù),并且應用于大規(guī)模參數(shù)時具有更好的魯棒性[26].根據(jù)擬合的參數(shù),在模擬衛(wèi)星載荷感受地磁變化的情況下對磁屏蔽內剩余磁場進行補償,得到了優(yōu)于手動參數(shù)擬合的結果.
為了將J-A模型應用于磁屏蔽,我們將屏蔽內的剩余磁場分為兩部分: 被磁屏蔽衰減后的環(huán)境磁場BSE以及磁屏蔽本身被磁化后產生的感應磁場BM[29],因此有
第一項以磁屏蔽系數(shù)SE隨環(huán)境磁場線性變化;第二項與磁屏蔽的磁化強度成比例,可表示為BM=C×M,C為比例系數(shù),有和真空磁導率相同的量綱,單位為nT × m/A,在不同的位置有不同的取值,可以通過有限元仿真得到各個位置的取值.屏蔽內剩余磁場由于BM的存在產生了磁滯回線的形狀.
使用J-A模型求磁屏蔽被環(huán)境磁場磁化后的磁化強度M,J-A模型由下式表示[30]:
其中He=μ0(H+αM)是J-A模型中的有效場,μ0是真空磁導率,H為環(huán)境磁場;Ms,k,a,a,c為J-A參數(shù),需要通過實測結果來確定.當 dH<0 時d=1,當 dH?0 時d=–1.
為了簡化計算以及將來更方便地用于磁場補償系統(tǒng),我們對模型進行了合理的簡化.首先,磁疇耦合參數(shù)a在軟磁材料中影響很小[31],我們將軟磁材料a經典值4 × 10–4與0值分別代入J-A模型計算屏蔽內剩余磁場,發(fā)現(xiàn)磁屏蔽內剩余磁場計算值差別小于0.5 nT,并且a取0時,積分方程可以解析求解展開為多項式形式,這樣可以在結果影響很小的情況下極大地提高計算效率,便于軟件編程,這對于實現(xiàn)磁場的實時補償是很必要的.另外,當He/a<0.1 時,可以近似使用在空間磁場環(huán)境下,這個條件總是滿足的.基于上述簡化,公式可以改寫為
其中當x> 0時 [x]+=x,x≤ 0時 [x]+=0.
此外,我們對環(huán)境磁場采集是離散值而非連續(xù)值,因此為了方便計算可以將公式中M(t)改寫為M(Hn),即用當前環(huán)境磁場狀態(tài)下的磁化強度表示當前時刻的磁化強度,最終可以得到整個剩余磁場的表達式
在選擇最優(yōu)參數(shù)值的過程中,首先根據(jù)經驗值對參數(shù)進行一些簡化和范圍的限定,限定范圍首先可以確保得到的參數(shù)值具有合理的物理含義,并且可以更加迅速準確地擬合出參數(shù)值,同時又可以防止得到的參數(shù)值陷于局域最優(yōu)值而非全局最優(yōu)值.飽和磁化強度Ms可以根據(jù)坡莫合金的參數(shù)表得知在5.4× 105附近,我們將范圍限定于5 × 105—6 × 105.扎釘參數(shù)k近似等于矯頑力,可以根據(jù)參數(shù)表將范圍限定于1—50.可逆參數(shù)c的范圍根據(jù)定義限定于0—1.Langevin梯度參數(shù)a根據(jù)實測磁滯圖形可以限定于1.5 × 104—2.5 × 104.
在本次實驗中,測試對象是單層磁屏蔽,對于更廣泛應用的多層磁屏蔽來說,只需要將多層磁屏蔽當作一個系統(tǒng),對該系統(tǒng)利用上述J-A方程分析,求解J-A參數(shù)、衰減系數(shù)SE和比例系數(shù)C,然后對屏蔽內關心的位置展開計算分析,就可以準確計算屏蔽內剩余磁場.
為了模擬近地軌道的磁場環(huán)境,我們搭建了一個準亥姆霍茲線圈,通過控制線圈電流來控制中心軸向磁場.該裝置由三組八邊形線圈構成(便于使用鋁型材搭建),線圈直徑約為1.3 m,整體高度約為1.5 m.我們將待測屏蔽筒置于線圈內部處,屏蔽筒直徑為30 cm,高度為80 cm,并在屏蔽筒內部中心位置放置一個磁通門用于采集屏蔽內磁場,在線圈軸線遠離屏蔽筒處放置另一個磁通門用于采集環(huán)境磁場.圖1(a)是整個測試系統(tǒng)的示意圖,F1和F2分別為探測環(huán)境磁場和屏蔽內部磁場的磁通門.圖1(b)是用于模擬近地軌道磁場的環(huán)境磁場變化圖.實驗過程中,首先讓線圈電流產生正弦變化的環(huán)境磁場,根據(jù)得到的磁滯回線作為神經網(wǎng)絡訓練與反饋的值來獲得屏蔽筒J-A參數(shù),并將這組參數(shù)用于預測近地軌道環(huán)境磁場條件下的屏蔽內磁場,將預測值和實測結果進行對比,驗證神經網(wǎng)絡算法預測J-A參數(shù)的準確性.
圖1 (a)實驗裝置示意圖,同時也是有限元仿真時所用的模型圖;(b)對模型進行測試所用的近地軌道環(huán)境磁場Fig.1.(a)The schematic diagram of the experimental device and also the model diagram used in our finite element simulation;(b)low Earth orbit environmental magnetic field used to test the model.
在利用神經網(wǎng)絡對J-A參數(shù)優(yōu)化之前,除了預先設定參數(shù)范圍外,預測屏蔽內磁場還需要知道屏蔽筒內各處衰減系數(shù)SE和磁化強度與磁場之間的比例系數(shù)C,我們使用有限元分析方法(finite element method,FEM)[31]仿真屏蔽筒內空間各處的衰減系數(shù)SE和比例系數(shù)C優(yōu)化前的初始值.圖2展示了屏蔽內部一個縱向截面上有限元計算所得的SE和C.我們探測所用磁通門置于屏蔽最中心處,在此處的衰減系數(shù)約為31,比例系數(shù)約為–1.8.使用其他方法獲得J-A參數(shù)時,這兩項參數(shù)一般都僅僅使用仿真值,雖然有限元模型可能存在的各種誤差,但是往往因多參數(shù)之間關系復雜不對這兩個參數(shù)進行調節(jié).而使用神經網(wǎng)絡自動調節(jié)參數(shù)時,由于神經網(wǎng)絡具有強大的仿真計算能力,我們將這兩個參數(shù)也作為代求參數(shù).對SE進行有限元仿真時,選擇了廠家給出的相對磁導率,實際上磁導率可能無法嚴格等于廠家給出的參數(shù),并且屏蔽效果可能由于形變等原因與仿真結果有一定偏差,因此我們根據(jù)仿真結果31,將范圍限定于20—40.對C進行有限元仿真時,我們將磁屏蔽看作永磁體,設置磁化強度,能夠得到空間中不同位置的感應磁場,從而計算比例系數(shù).同樣,由于形變、位置偏差等一些原因,實際結果可能也會和仿真結果有偏差,因此根據(jù)有限元仿真結果–1.8,因此我們將范圍限定于–1.5—–2.5.
圖2 (a)數(shù)據(jù)所在磁屏蔽筒截面示意圖;(b)有限元仿真所得到屏蔽內一個截面上的屏蔽效率分布圖;(c)有限元仿真得到的屏蔽內一個截面上的磁化強度比例系數(shù)圖Fig.2.(a)A schematic view of the section of the data;(b)the shielding efficiency distribution on a section inside the shield calculated by FEM software;(c)the magnetization intensity ratio coefficient on a section of the shield calculated by FEM software.
本文需要優(yōu)化的是J-A模型中的5個參數(shù)Ms,k,a,a,c和衰減系數(shù)SE以及比例系數(shù)C共7個參數(shù).我們建立如圖3的參數(shù)優(yōu)化神經網(wǎng)絡.
在圖3中,神經網(wǎng)絡作為一個復雜的函數(shù),我們給定輸入?yún)?shù)值,圖中x1,x2,···,x7對應J-A模型中的5個參數(shù)Ms,k,a,a,c和衰減系數(shù)SE以及比例系數(shù)C,每一組參數(shù)可通過神經網(wǎng)絡對應一個輸出值y,同樣的參數(shù)值,在給定環(huán)境磁場的情況下,代入(4)和(5)式,可以算出相應的剩余磁場,并和實測的剩余磁場相減后求標準差y0,我們使用神經網(wǎng)絡這樣一個通用的函數(shù)形式來擬合這個參數(shù)值到標準差的復雜過程,一旦完成擬合,使用scipy庫[32]可以方便求出令輸出值即標準差最小的參數(shù)值.此外我們使用了在線學習的方法,視情況將預測的參數(shù)值重新代到神經網(wǎng)絡中進行訓練,這樣可以充分利用每組參數(shù),用盡可能少的輪次擬合出最準確的神經網(wǎng)絡.
神經網(wǎng)絡模型建立過程中,網(wǎng)絡層數(shù)與每層的神經元數(shù)是首先需要考慮的問題[15].神經網(wǎng)絡層數(shù)以及神經元數(shù)量會影響神經網(wǎng)絡的性能,如果層數(shù)較少,或者神經元數(shù)量較少,可能會導致無法擬合出復雜的對應關系(欠擬合),如果層數(shù)較多,或者神經元數(shù)量較多,有可能會將原本簡單的關系擬合復雜(過擬合).神經元數(shù)量依慣例通常選用2的次方個,我們嘗試過64個神經元,以及3層或4層網(wǎng)絡,結果顯示出明顯的過擬合,即預測最優(yōu)參數(shù)的標準差起伏很大且不理想,如圖4(b)所示.我們同時也嘗試過16個神經元,2層網(wǎng)絡,結果顯示出明顯的欠擬合(所需輪次較多,且調參結果沒有32個神經元結果好).綜合上述實驗,我們認為選用2層,每層32個神經元,對于我們這個只有7個饋入節(jié)點的神經網(wǎng)絡來說是比較合適的,如圖4(a)所示.隨著參數(shù)的增加,我們需要增加神經元以及神經網(wǎng)絡層數(shù),具體所需數(shù)量還要根據(jù)實驗來確定.
首先隨機選擇12組參數(shù)并求得相應的標準差對神經網(wǎng)絡進行訓練,梯度下降方法使用Adam方法,每一層的激活函數(shù)選用Relu函數(shù),訓練輪次為500次,完全在線學習,批量選為1.根據(jù)訓練得到的神經網(wǎng)絡,使用L-BFGS-B方法預測當前最優(yōu)參數(shù)值[33],為了防止參數(shù)陷于可能的局部最優(yōu)值而非全局最優(yōu)值,我們對每一組預測最優(yōu)值增加一個很小的隨機偏置量,并將求得的標準差代入神經網(wǎng)絡繼續(xù)進行100輪次的訓練.此外,若連續(xù)5次預測得到的標準差均大于之前得到的最優(yōu)值的標準差,將重新完全隨機選擇下一組參數(shù)值,以求跳出局部最優(yōu)值.訓練過程持續(xù)到得到一個優(yōu)于預期最低標準差的值或者到達最大循環(huán)次數(shù)或者連續(xù)20次預測值沒有優(yōu)于之前的最優(yōu)值.流程圖如圖5所示,圖中只顯示了一個結束條件.
圖3 神經網(wǎng)絡調參原理示意圖 使用2個隱藏層的全連接神經網(wǎng)絡,每層32個神經元,一旦神經網(wǎng)絡訓練完成,就能調用scipy庫預測最優(yōu)參數(shù)Fig.3.Principle of optimizing with neural network.We use 2 hidden layers of full connected neural network,32 neurons per layer.Once the neural network training is completed,we can use scipy to predict the optimal parameters.
由于注入值較少,選用了一個兩層的的神經網(wǎng)絡,因此網(wǎng)絡訓練時間很短,預測最優(yōu)參數(shù)也很快,每組參數(shù)求標準差每組需要約2 s,求得一組理想?yún)?shù)大約僅需要3 min.我們使用keras[34]建立神經網(wǎng)絡,使用scipy調用L-BFGS-B方法進行最優(yōu)參數(shù)的預測.相比神經網(wǎng)絡對參數(shù)擬合,我們利用人工僅對J-A模型中的5個參數(shù)進行優(yōu)化擬合,一般情況也需要幾個小時.
圖4 (a)當選用2層網(wǎng)絡各32個神經元時,預測標準差收斂性好且最小值僅為4.9;(b)當選用3層網(wǎng)絡各64個神經元時,由于過擬合預測標準差振蕩且最小值為27Fig.4.(a)When 32 neurons of the 2 layers network are selected,the convergence of the prediction standard deviation is good and the minimum value is only 4.9;(b)when 64 neurons of the 3 layers network are selected,the convergence of the prediction standard deviation is poor because of over-fit and the minimum value is 27.
使用神經網(wǎng)絡調參的結果如圖6所示,首先用一個正弦變化的環(huán)境磁場進行調參.圖6(a)橫坐標為總循環(huán)次數(shù),縱坐標為我們設定的標準差,藍色點為初始隨機地用于訓練神經元的12組參數(shù),可見在第20輪左右,即初始訓練后預測的第8組參數(shù)就已經開始明顯收斂于最優(yōu)值,最終得到的JA參數(shù)為Ms=540074,c=0.58,a=19817,k=9.50,SE=36.37,C=-2.37.標準差值為4.90,在該組參數(shù)下計算得到的磁滯回線和實測值如圖6(b)所示,紅線為預測值黑線為實測值.
相應地,當我們手動調節(jié)參數(shù)時,根據(jù)參數(shù)表確定Ms=540000,并根據(jù)有限元仿真結果確定SE=31,C=–1.8.在此基礎上調整k,c和a,根據(jù)經驗觀察,a和幅值關聯(lián)較大,k與c和磁滯程度關聯(lián)較大,經歷長時間反復調節(jié)之后,得到的最優(yōu)的標準差值為7.09,在此時實測和預測的磁滯回線的形狀仍然高度重合,很難進一步調節(jié),然而手工調參和神經網(wǎng)絡調參的標準差相差了接近一倍,意味著仍有很大的可調空間.顯然使用神經網(wǎng)絡自動調參,節(jié)省了工作量,節(jié)約了大量時間,同時得到了更加準確的參數(shù).另外,最優(yōu)參數(shù)得到的SE和C的取值與有限元結果的差異,提示了可能存在于有限元仿真過程中的誤差,因素可能是材料磁導率的理論值和實際值的偏差、模型和實際屏蔽結構誤差等.表1顯示了手動和自動方法獲得參數(shù)的對比.
圖5 自動調參的流程圖Fig.5.The flow chart of optimizing magnetic shielding characteristic parameters.
圖6 (a)一個典型的求參過程圖,預測參數(shù)值的標準差隨實驗輪次逐漸降低;(b)相應參數(shù)計算得到的磁滯回線與實測回線的比較Fig.6.(a)A typical continuation process graph,the standard deviation of the predicted parameter values is gradually reduced with the experimental round;(b)comparison of hysteresis loop and measured loop calculated by corresponding parameters.
另外,初始隨機參數(shù)的不同可能導致不同的預測速度,但通常都能夠收斂到理想的參數(shù)點.圖7展示了另兩組初始隨機參數(shù)進行預測的標準差和循環(huán)輪次圖,同樣藍色點為初始隨機的用于訓練神經元的12組參數(shù),可以看出由于初始隨機值不同,在本次訓練中更快達到了標準差小于5的期望值.
表1 手動調參和自動調參得到的參數(shù)值Table 1.Parameter values obtained by manual tuning and automatic tuning.
接著將該組參數(shù)應用于接近實際衛(wèi)星在軌經歷的環(huán)境磁場,得到的結果如圖8所示.圖8(a)和圖8(b)分別是在環(huán)境磁場隨時間變化情況下,利用使用神經網(wǎng)絡調參后得到的參數(shù)來計算屏蔽內磁場和實測屏蔽內磁場的對比圖,橫坐標分別為時間和環(huán)境磁場; 圖8(c)表示計算值和實測值的差值隨時間變化曲線; 圖8(d)表示計算值和實測值的差值隨環(huán)境磁場變化曲線.圖中標準差越小說明計算越準確.其中黑線是僅考慮衰減項BSE不考慮磁化項BM的計算結果差值,另外兩組則分別用手動得到的參數(shù)和神經網(wǎng)絡得到的參數(shù)來計算,其中手動找到的參數(shù)標準差為9.33,神經網(wǎng)絡調參標準差為7.01.可見使用J-A模型計算屏蔽內參數(shù)是非常必要的,僅考慮衰減項而忽略磁滯項將會導致很大誤差,另外利用神經網(wǎng)絡獲取J-A模型的參數(shù)比手動參數(shù)更加快速準確,為我們對空間鐘磁屏蔽補償參數(shù)的選擇提供了有效的幫助.
圖7 另外兩組不同隨機初始訓練參數(shù)下,標準差隨實驗輪次的收斂圖Fig.7.Convergence graph of standard deviation with experimental rounds under two different random initial training parameters.
圖8 在近地軌道磁場環(huán)境下實測磁場與計算磁場的對比圖(a)橫坐標為時間;(b)橫坐標為環(huán)境磁場;(c)使用手動調節(jié)參數(shù),自動求得的參數(shù),以及僅考慮衰減項不考慮磁化項,計算磁場與實測磁場的差值,橫坐標為時間;(d)橫坐標為環(huán)境磁場Fig.8.A comparison of the measured magnetic field with the calculated magnetic field in a near-Earth orbit magnetic field environment;(a)The x axis is time;(b)the x-axis is the ambient magnetic field;(c)use manual adjustment parameters,automatically obtained parameters,and simple BSE to calculate the difference between the magnetic field and the measured magnetic field,the abscissa is time;(d)the x-axis is the ambient magnetic field.
基于描述鐵磁材料磁滯特性的J-A模型,我們對坡莫合金磁屏蔽裝置在變化外磁場情況下屏蔽筒內磁場進行預測.結合有限元模型對磁屏蔽特性的初步分析,使用神經網(wǎng)絡在線學習的方法以獲得磁屏蔽的J-A參數(shù)與屏蔽特性的最優(yōu)值,并模擬通過低軌衛(wèi)星經歷的地磁場情況下驗證擬合參數(shù)的準確性.擬合結果與實驗測試表明,使用簡單的兩層神經網(wǎng)絡就可以高效、快速地獲得超過手工調節(jié)精度的J-A參數(shù).一方面通過該方法對磁屏蔽特性的精確測定,可以應用于在軌運行的高精度磁敏感衛(wèi)星載荷,通過在軌磁場補償?shù)拇胧?獲得更好的磁屏蔽效果; 另一方面驗證了神經網(wǎng)絡應用于空間冷原子鐘相關系統(tǒng)參數(shù)調整的可行性.該方法從理論上擴展了目前對于多參數(shù)擬合優(yōu)化的工具,對于實際應用中通常會遇到的多參數(shù)物理實驗尋找系統(tǒng)最優(yōu)解會有很大幫助.例如可以應用于類似復雜系統(tǒng)的調參工作,對冷原子實驗中與多個光功率、頻率、時序相關的冷原子數(shù)目和冷原子溫度進行優(yōu)化[35,36],相關參數(shù)往往有數(shù)百個之多,受限于在軌運行時資源,人工調節(jié)幾乎沒有可能找到最優(yōu)參數(shù).我們希望神經網(wǎng)絡的應用能夠幫助優(yōu)化空間冷原子鐘的性能,并且實際最優(yōu)參數(shù)與理論最優(yōu)參數(shù)的差別有可能幫助我們進一步反思微重力條件下原子冷卻的物理機制.