胡敏超 付明磊
(浙江工業(yè)大學(xué)理學(xué)院 杭州 310023)
引力波是一種時空漣漪,如同石頭被丟進水里產(chǎn)生的波紋。黑洞、中子星等天體在碰撞過程中有可能產(chǎn)生引力波。1916年,愛因斯坦在廣義相對論的基礎(chǔ)上,提出愛因斯坦場方程。愛因斯坦認為當物質(zhì)和能量的分布發(fā)生變化時,時空結(jié)構(gòu)也將改變。而這種時空結(jié)構(gòu)的變化將以“波”的形式傳播,這就是他所預(yù)言的引力波。
但此后,引力波的探測陷入困境。直到2015年9月14日,激光干涉引力波天文臺(LIGO)實現(xiàn)了人類歷史上第1次引力波的直接探測。隨后,引力波探測發(fā)展迅速。在2017年8月14日,美國LIGO和歐洲VIRGO 2個項目組在3個不同的引力波探測器幾乎同時探測到一個新的引力波事件。這是人類發(fā)現(xiàn)的第4個引力波事件。該事件由不同機器、不同項目組共同發(fā)現(xiàn),使引力波的探測成果更加真實可信。2017年10月3日,Rainer Weiss等3人在發(fā)現(xiàn)引力波中做出重大貢獻而獲得了諾貝爾物理學(xué)獎?,F(xiàn)今,探測出的引力波事件還在不斷增加。
傳統(tǒng)的引力波檢測方式為匹配濾波方法。匹配濾波方式在引力波信號提取的工作中已經(jīng)體現(xiàn)出其優(yōu)秀的工作性能。然而,匹配濾波也有其缺陷。首先,匹配濾波的計算量巨大,使得數(shù)據(jù)處理速度非常慢。此外,匹配濾波方法的工作前提是需要一個準確的理論模板。這可能導(dǎo)致在理論預(yù)期之外的引力波信號無法被找到[1]。
為了促進天文學(xué)的發(fā)展,加快引力波信號的檢測與研究,很多科學(xué)家進行了研究與探討。其中,Daniel George團隊在2016年至2017年期間,結(jié)合深度學(xué)習(xí)領(lǐng)域的相關(guān)知識,使用深度濾波的方式來檢測引力波信號。
引力波的特點是強噪聲、弱信號。將一個標準引力波信號白化并疊加在信噪比為7.5的噪聲中[2](圖1),隱藏在噪聲中的引力波信號在相應(yīng)頻譜圖中是不可見的。而深度神經(jīng)網(wǎng)絡(luò)(deep neural network,DNN)卻可以直接檢測到該信號的存在。這表明了深度濾波檢測引力波是切實可行的。
圖1 引力波疊加噪聲
Daniel George團隊在最初使用了最基本的卷積神經(jīng)網(wǎng)絡(luò)(convolution neural network,CNN),在經(jīng)過不斷的比較測試后,設(shè)計獲得了一種深度卷積神經(jīng)網(wǎng)絡(luò)。結(jié)果表明,在相同條件下,這種深度濾波的正確率不低于匹配濾波,運算速度卻是匹配濾波的13倍(如圖2)。
圖2 深度濾波和匹配濾波運算速度對比
使用深度學(xué)習(xí)來檢測引力波的另一個優(yōu)勢是神經(jīng)網(wǎng)絡(luò)可以進行遷移學(xué)習(xí)[3]。將設(shè)計好的模型在一個大型數(shù)據(jù)集中完成訓(xùn)練,只需要進行參數(shù)微調(diào)即可在其他數(shù)據(jù)集上使用。這種無監(jiān)督模型使用范圍更廣,無需匹配濾波方法一般的完備的理論模板,可自動區(qū)分各種噪聲,并檢測出引力波。這種方法已經(jīng)成功的在LIGO真實數(shù)據(jù)中檢測出前3個引力波信號數(shù)據(jù)[4]。
此后,不斷有學(xué)者在深度學(xué)習(xí)方法的基礎(chǔ)上,使用新的方法來優(yōu)化其探測模型的性能。例如Shen等人[5]引入去噪自編碼器(denoising autoencoder,DAE)來對引力波去除混合的高斯噪聲來還原信號。Li等人[6]對高斯噪聲污染的模擬引力波信號進行小波分解,以此提高分辨準確率。Fan等人[7]使用多個來源的信號數(shù)據(jù)來加強神經(jīng)網(wǎng)絡(luò)對參數(shù)估計的性能。Chua等人[8]使用降階建模方式來表示波形數(shù)據(jù),以此推導(dǎo)并搭建模型。這些方法為深度學(xué)習(xí)和引力波探測的結(jié)合提供了更多思路。
隨著技術(shù)的發(fā)展,探測器的靈敏度也不斷提高。但所有方法都受到探測器噪聲的限制,其中最難以分辨的是瞬態(tài)非高斯噪聲信號,稱為“毛刺”(glitches)?!懊獭辈粌H會對數(shù)據(jù)產(chǎn)生影響,并且在某些情況下會掩蓋引力波信號[9]。為了解決這一問題,Zooniverse平臺主辦的公民科學(xué)項目中就有一個引力監(jiān)測(Gravity Spy)項目[10]。在初始的數(shù)據(jù)集中,包含了22類毛刺的8 583個樣本(如表1)。這些分類和相關(guān)的典型形態(tài)由LIGO、Gravity Spy和一些公共學(xué)科等科學(xué)家組合設(shè)定,并且隨著時間的推移,數(shù)據(jù)集也在擴展。
表1 22類毛刺
隨著技術(shù)不斷發(fā)展,人們對于毛刺的研究與認識也更加深入,然而仍然還有許多未知的毛刺類別。為了更全面的探索新的毛刺類型,Bahaadini等人[11]基于深度學(xué)習(xí),提出了一種判別嵌入函數(shù),用作聚類任務(wù)的特征提取器。該方法利用了深度學(xué)習(xí)可以進行遷移學(xué)習(xí)的優(yōu)勢,即這種經(jīng)過訓(xùn)練的嵌入函數(shù)將從已知毛刺類中提取到的特征信息用于未知毛刺類(如圖3),使其可在未知毛刺樣本中找到潛在的新毛刺類別。
圖3 深度神經(jīng)網(wǎng)絡(luò)示意圖
Bahaadini等人[12]還提出了一種深度多視圖卷積神經(jīng)網(wǎng)絡(luò)來自動分類毛刺,來提高分類的整體準確性。與傳統(tǒng)的僅使用單視圖模型的標準方法相比,他們提出了4輸入模型,即使用毛刺的4個不同的持續(xù)時間0.5 s、1 s、2 s、4 s來繪制毛刺(如圖4)。測試分析結(jié)果表明,具有較短毛刺的單視圖模型對于較短毛刺的類性能更好,具有較長毛刺的單視圖模型對于較長毛刺的類性能更好。而他們所提出的多視圖模型比單視圖模型的分類精度高。除了深度學(xué)習(xí)方法,也有一些學(xué)者希望用小波分解等信號分類方法來對毛刺進行分類,但雖然速度更快一些,但精度卻不如深度學(xué)習(xí)方法高[13]。
圖4 具有4個視圖的Helix glitches的示例
本文為了更好地了解深度學(xué)習(xí)在引力波探測中的工作方式和其優(yōu)劣性,從數(shù)據(jù)集的整理、卷積神經(jīng)網(wǎng)絡(luò)的設(shè)計應(yīng)用到結(jié)果的對比進行了研究與探討。
本文所使用的是來自LIGO Hanford、LIGO Livingston和VIRGO 3個來源的引力波數(shù)據(jù)以及模擬的高斯白噪聲。引力波數(shù)據(jù)(如圖5)的采樣頻率是4 096 Hz,對應(yīng)的是1 s時間的4 096個數(shù)據(jù)點,每個來源1 000組數(shù)據(jù)。本文將3個數(shù)據(jù)集的數(shù)據(jù)進行整合,使得3個來源的數(shù)據(jù)可以在一起進行對比使用。訓(xùn)練集中的奇數(shù)組數(shù)據(jù)是3×4 096的引力波數(shù)據(jù),偶數(shù)組是3×4 096的模擬高斯白噪聲數(shù)據(jù),使用的訓(xùn)練集數(shù)據(jù)總數(shù)為100~800組。測試集同訓(xùn)練集相反,偶數(shù)組數(shù)據(jù)是引力波數(shù)據(jù),奇數(shù)組數(shù)據(jù)是模擬高斯白噪聲數(shù)據(jù),總數(shù)為100組。使用有監(jiān)督學(xué)習(xí)方式,給每組數(shù)據(jù)打上標簽,True代表引力波數(shù)據(jù),F(xiàn)alse代表噪聲數(shù)據(jù),進行二分類判斷。
圖5 引力波信號
選擇好訓(xùn)練集和測試集之后,設(shè)計使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型來進行訓(xùn)練。為了使得模型的正確率和訓(xùn)練速度之間進行平衡,對模型的構(gòu)成進行了分析與測試,最終得到了相對較好的模型(圖6)。
圖6 網(wǎng)絡(luò)模型示意圖
模型包括3個卷積層和3個池化層。3個卷積層來提取特征,使用的卷積核分別為3×16,1×16,1×16。每1個卷積層后都有1個池化層,池化方式使用最大池化。然后使用1個壓平層將數(shù)據(jù)壓平。最后是全連接層,在第2層使用softmax作為二分類的輸出。訓(xùn)練集中的數(shù)據(jù)訓(xùn)練200個循環(huán),訓(xùn)練集數(shù)據(jù)從100~800組不等,訓(xùn)練完畢后,進行測試集正確率的比較。
訓(xùn)練集在訓(xùn)練結(jié)束時的正確率都到了100%,測試集的正確率隨著訓(xùn)練集樣本數(shù)而變化(表2)。當訓(xùn)練集的樣本數(shù)為100時,雖然訓(xùn)練集的正確率為100%,而測試集的正確率只有91%,說明訓(xùn)練集樣本數(shù)不足而導(dǎo)致了訓(xùn)練集過擬合。隨著訓(xùn)練集的增加,測試集的正確率不斷上升。當訓(xùn)練樣本數(shù)為500組數(shù)據(jù)時,正確率達到了100%,損失值也僅有0.004。隨后樣本數(shù)的增加對于正確率的影響波動不大,正確率在97%~100%之間。
表2 測試結(jié)果
隨著科技的發(fā)展,人們對于宇宙未知的探索欲望不斷增加,引力波的探測為天體物理學(xué)展現(xiàn)了新的方向。在引力波的探測中,匹配濾波依然是一種優(yōu)秀的方式,然而其缺點也讓人們希望找到新的出路。隨著深度學(xué)習(xí)的發(fā)展,其在數(shù)據(jù)處理中的高效性能引得人們的青睞。結(jié)合深度學(xué)習(xí)的方式來探測引力波變成了新的熱門課題。也取得了不錯研究成果。他們的研究也證明了深度學(xué)習(xí)在引力波探測中有著廣闊的應(yīng)用前景。然而此類方法依然有許多的問題待解決,例如重力間諜項目表明了毛刺的難以分辨。如何使用深度學(xué)習(xí)來更好地分辨出未知各類噪聲,更好地探測出引力波事件,還需要一個漫長的發(fā)展過程,相信隨著深度學(xué)習(xí)的不斷發(fā)展,各類模型的不斷進步,其在引力波的探測中會有更好的應(yīng)用方式。