姜 斌,曲美霞,李青葦,曹書畫,鐘云鵬
山東大學(威海)機電與信息工程學院,山東 威海 264209
白矮主序雙星[1](white dwarf-main sequence,WDMS)的光譜為復合光譜,由主星和伴星構成[2]。白矮星(white dwarf,WD)控制光譜藍端特征,以巴爾末線系(Balmer series)的吸收線為主[3]; 伴星控制光譜紅端特征,呈現(xiàn)小質量主序星特別是M型矮星的特征[4]。通過光譜分解得到其中的白矮星與M型恒星的信息對研究WDMS有著重要的意義。Heller[5]等利用模板進行χ2最小化匹配來得到恒星的溫度等信息。這種方法需要遍歷所有的白矮星模板光譜與M型恒星模板光譜,找出使得χ2最小的組合作為WDMS中的白矮星和M型恒星的光譜,并進一步得到物理參數(shù)。方法的時間復雜度為O(n*m*k*L),其中n,m,k分別為WDMS實測光譜、白矮星和M型模板光譜的數(shù)量,L為光譜的維度。這種算法時間復雜度導致該方法需要消耗較大的計算資源。
生成對抗網絡(generative adversarial nets,GAN)是Goodfellow[6]等提出的一種網絡模型。GAN由一個生成器和一個判別器組成,生成器負責模仿訓練數(shù)據(jù),判別器負責判斷數(shù)據(jù)的真假,通過生成器和判別器的相互對抗同時提升生成器和判別器的性能。最終的結果是生成器生成的數(shù)據(jù)足夠逼真以至于判別器無法判斷真假,即最后判別器會認為生成器生成的數(shù)據(jù)為真的概率為0.5。
Stark[7]等根據(jù)GAN設計了PSFGAN用于分離星系圖像中的類星體點源。Fussell[8]等研究使用GAN生成天體圖像。Arjovsky[9]等研究了GAN的不足,提出了WGAN(wasserstein generative adversarial networks),可以很好地克服GAN在訓練當中遇到的一些問題[10]。
針對傳統(tǒng)的WDMS光譜分解方法計算量太大的問題,本文基于GAN設計了一個用于分解WDMS光譜的神經網絡模型,分別使用SDSS(the sloan digital sky survey)中發(fā)現(xiàn)的WDMS光譜、Koster的白矮星模板光譜[11]、MARCS模板庫[12]的M型恒星模板光譜進行訓練。根據(jù)網絡模型生成的白矮星與M型恒星的光譜,同時遍歷兩種模板光譜,尋找最接近的模板光譜以獲取恒星參數(shù)信息。遍歷可以并行,因此使用此方法的時間復雜度為O(n*(m+k)*L)。
這是一個比GAN更大更復雜的對抗網絡。將模型生成的數(shù)據(jù)與使用χ2最小方法得出的部分結果進行了對比,得到了較好的結果。
如圖1所示,本文實驗使用DNN模型,網絡由編碼網絡Q(Encoder),解碼網絡Pa和Pb(Decoder a 和 Decoder b),判別網絡Da,Db,Dx(Discriminator a,Discriminator b,Discriminator x)組成。本文使用Pa和Pb作為生成器,Pa模仿生成數(shù)據(jù)a,Pb模仿生成數(shù)據(jù)b。Da和Db分別負責判別對應的數(shù)據(jù)。Dx保證編碼不會坍縮在一起。
圖1 網絡結構示意圖Fig.1 Network structure diagram
用x表示WDMS光譜,x∈Rn,使用xa表示a類數(shù)據(jù),使用xb表示b類數(shù)據(jù),xa∈Rn,xb∈Rn。n為維度,三類數(shù)據(jù)有相同的數(shù)據(jù)維度,用ncode表示編碼的維度。
將x輸入到網絡中,通過已有的經驗知識判斷Pa和Pb是否適合進行訓練,同時用WD模板光譜訓練Pa和Da,用M型恒星模板光譜訓練Pb和Db,最終得到分解網絡Q,Pa和Pb。
該網絡的時間復雜度由模型的具體架構決定,例如一層普通BP神經網絡的時間復雜度為O(Dout*(Din+oAF)),其中Dout和Din分別為網絡層的輸出和輸入的維度,oAF為激活函數(shù)的時間復雜度。而單層卷積層的時間復雜度為O(M2*K2*Cin*Cout),其中M為卷積核輸出特征圖的邊長,K為卷積核的邊長,Cin和Cout為輸入輸出的通道數(shù)。
網絡通過如式(1)和式(2)損失函數(shù)進行訓練
Ez~Pz(z)[log(1-D(G(z)))]
(1)
(2)
s.t.xa∈Va,xb∈Vb,z∈Rncode
其中λ是一個可調的平衡系數(shù),用于平衡由于數(shù)據(jù)規(guī)模復雜程度引起的損失不平衡,通常值為1。z是一組隨機數(shù)據(jù),z應當在函數(shù)Q的值域內,取值范圍一般與網絡輸出層的激活函數(shù)相關。
定義函數(shù)C來表示原數(shù)據(jù)與合成后的數(shù)據(jù)應當有的關系
x=C(a,b),x=a+b
(3)
使用如式(4)損失函數(shù)
c=C(Pa(Q(x)),Pb(Q(x)))
(4)
式(4)中,l(x,y)為歐氏距離:l(x,y)=‖x-y‖2。
Dx用于防止網絡Q的輸出坍縮,使其輸出有一個較好的分布。
使用符號Θ(·)表示(·)的學習參數(shù),記L(a,b)=-loga-log(1-b)。使用Ian Goodfellow等使用的訓練方法。對于網絡Da和Db,使用式(5)更新參數(shù)
ΘDa?ΘDa-αΘDaL(Da(xa),Da(Ga(z)))
ΘDb?ΘDb-αλ1ΘDbL(Db(xb),Db(Gb(z)))
(5)
s.t.xa∈Va,xb∈Vb,z∈Rncode
對于Pa和Pb,使用式(6)更新參數(shù)
ΘPa?ΘPa+αΘPa[logDa(Pa(Q(x)))-λ2l(x,c)
ΘPb?ΘPb+αΘPb[λ1logDb(Pb(Q(x)))-λ2l(x,c)]
(6)
對于Dx,使用式(7)更新參數(shù)
ΘDx?ΘDx+αΘDxL(Dx(x),Dx(z))
(7)
對于Q,使用式(8)更新參數(shù)
ΘQ?ΘQ+αΘQ[logDa(Pa(Q(x)))+λ1logDb(Pb(Q(x)))-
λ2l(x,c)+λ3log(1-Dx(Q(x)))]
(8)
以上公式使用了標準梯度下降(GD)的方式,在實際運行時應選用適合的優(yōu)化器,如隨機梯度下降(SGD)、自適應矩估計(Adam)等。可調參數(shù)λ2用于調節(jié)生成光譜的正確性和分解的準確性。算法整體描述如下:
算法
1: 初始化神經網絡
2: fori=1 tokdo
3: 通過(5)更新Da和Db的參數(shù)
4: 通過(6)更新Pa和Pb的參數(shù)
5: 通過(7)更新Dx的參數(shù)
6: 通過(8)更新Q的參數(shù)
7: end for
從SDSS光譜庫中選取1 746條WDMS光譜,截取波長4 000~9 000 ?的部分并將其插值到16 220維,見圖2。對M型恒星和白矮星的模板光譜均截取同樣波長的部分并插值到16 220維,見圖3和圖4。
圖2 WDMS光譜Fig.2 WDMS spectra before processing
圖3 M型恒星模板光譜Fig.3 M-star template spectra
圖4 白矮星模板光譜Fig.4 White dwarf template spectra
根據(jù)光譜數(shù)據(jù)建立的網絡模型結構見表1。四項參數(shù)為: 網絡名稱、網絡層次、神經元數(shù)量、激活函數(shù)。
表1 網絡模型結構Table 1 The structure of the network model
光譜分解效果見圖5。
圖5 WDMS光譜分解圖Fig.5 Decomposed WDMS spectra
表2 兩種方法結果對比Table 2 The comparison of the two methods
圖5中從上到下依次是WDMS實測光譜、網絡模型生成的白矮星、M型恒星光譜,三種光譜均歸一化到[0,1]。
將網絡生成的光譜數(shù)據(jù)與模板光譜進行比較,用最接近的光譜的恒星數(shù)據(jù)代替,并與χ2最小方法進行了比較,部分結果見表2。
表2中的temp為有效溫度。模型給出了與χ2最小化方法相近的結果。綜合比較結果和方差分布見圖6和圖7。
圖6 分解結果對比Fig.6 Comparisons of decomposition results
研究對抗神經網絡在光譜處理領域的應用,基于GAN設計了一個用于分解WDMS光譜的無監(jiān)督神經網絡,通過訓練神經網絡模型使其獲得分解WDMS光譜的能力,并將網絡模型生成的光譜數(shù)據(jù)與其他分解方法進行了對比,證明了方法的可行性。實驗結果表明,在與傳統(tǒng)方法準確率相近的情況下,該方法將時間復雜度從O(n*m*k*L)降到了O(n*(m+k)*L)。在實際實驗中,通過使用GPU加速,網絡生成光譜的速度非???,以至于這個時間可以忽略不計,而網絡訓練需要的時間不應當被計入算法的時間。該方法從理論上和實際操作中都可以極大地減少計算量。
圖7 方差分布Fig.7 Distribution of variance
本文模型基于Goodfellow等提出的模型,而此后被提出的各種GAN的變種和改進可以用于改進模型和損失函數(shù)等。本文方案也可以作為一個框架,在實際實現(xiàn)的時候可以用更合適的方法代替其中的一部分結構。
在未來工作中,我們將繼續(xù)改進模型來提高模型對光譜細節(jié)的學習能力,提高光譜分解的準確率。同時,讓模型變得更加普適,以適應其他類型的復合光譜如激變變星等雙星的分解。