王梓輝
在太陽系之外找到另一個“地球”,一直是人類探索太空的最大夢想。為此,當(dāng)人們在意識到地球的“行星”屬性之后,就開始將目光瞄準(zhǔn)在圍繞其他恒星運行的“系外行星”身上。
如今,在望遠(yuǎn)鏡光學(xué)(telescope optics)、太空飛行、計算機(jī)等技術(shù)的幫助下,人類已經(jīng)開始偵測和探究其他恒星周圍的行星。目前天文學(xué)家們搜尋系外行星的主要工具是美國航空航天局(NASA)于2009年發(fā)射升空的開普勒太空望遠(yuǎn)鏡。這臺太空望遠(yuǎn)鏡被設(shè)計發(fā)射的目的,就是去發(fā)現(xiàn)更多的環(huán)繞其他恒星運行的行星。
自從2009年升空以來,開普勒太空望遠(yuǎn)鏡可謂戰(zhàn)功赫赫,在其四年的正常工作時間里,開普勒太空望遠(yuǎn)鏡觀察了近20萬顆恒星,每30分鐘拍一次照片,并創(chuàng)造了近140億個數(shù)據(jù)點,這140億個數(shù)據(jù)點相當(dāng)于大約2000兆個可能的行星軌道。
2015年1月9日,美國宇航局“開普勒”系外行星探測器啟動了K2任務(wù),該任務(wù)時長為兩年,以確定系外行星上能否支持生命的存在
如此大量的數(shù)據(jù)是天文學(xué)家們尋找系外行星的最佳寶庫,在人類迄今已經(jīng)發(fā)現(xiàn)的3700多顆系外行星中,有超過2700顆是由這臺空間望遠(yuǎn)鏡發(fā)現(xiàn)的。NASA開普勒項目(Kepler Mission)科學(xué)家馬里奧·佩雷斯(Mario Perez)就曾表示:“開普勒提供的數(shù)據(jù)獨一無二,因為它是唯一囊括了這些類地行星信息的數(shù)據(jù)庫。理解這些類地行星在星系中的出現(xiàn)頻率,有助于NASA在未來任務(wù)中直接為另一個‘地球拍照?!?/p>
然而,數(shù)據(jù)有了,擺在天文學(xué)家面前的難題變成了如何處理這么龐大的數(shù)據(jù),以及如何更有效地分析這些數(shù)據(jù)。
一位來自互聯(lián)網(wǎng)巨頭Google的AI工程師克里斯托弗·肖爾(Christopher Shallue)出人意料地就這些問題給出了一個解決方案,而他的辦法似乎能讓天文學(xué)家們處理收集到的天文數(shù)據(jù)時不怎么費力,這也讓他從一個單純的互聯(lián)網(wǎng)工程師變成了橫跨人工智能與太空探索兩界的科研明星。
“之前我在Google內(nèi)部負(fù)責(zé)的工作是‘圖像描述(image captioning),也就是將拍攝的一個照片給機(jī)器之后,機(jī)器能自動出現(xiàn)一個句子來描述這張照片?!毙枌Ρ究榻B他此前的研究領(lǐng)域時如此說道。顯然,對于圖像的智能化分析正是他的專長。
一個偶然的機(jī)緣,他發(fā)現(xiàn)從開普勒太空望遠(yuǎn)鏡拍攝的數(shù)據(jù)中尋找行星的工作與他所做的圖像分析工作頗有相似之處。因為當(dāng)一顆運行中的行星擋住了恒星的光線時,恒星的亮度會減小,天文學(xué)家正是以此原理為基礎(chǔ),將這種圖像亮度訊號的變化用來辨識恒星周圍運行的行星。
恰好Google內(nèi)部有一個“20%計劃”(Google員工可以利用20%的時間來做你喜歡或感興趣的事情),于是肖爾和得克薩斯大學(xué)奧斯汀分校的天文學(xué)家安得烈·范德堡(Andrew Vanderburg)一起合作,利用自己擅長的人工智能技術(shù)來嘗試分析開普勒太空望遠(yuǎn)鏡所積累的數(shù)據(jù)。
“我們利用超過1萬5000個經(jīng)過標(biāo)記的開普勒太空望遠(yuǎn)鏡信號的數(shù)據(jù)集,訓(xùn)練了一個基于TensorFlow建立的機(jī)器學(xué)習(xí)模型來區(qū)分行星和其他天體?!毙栒f道。簡單來說,就是他們利用天文學(xué)家標(biāo)記過信號的數(shù)據(jù),來“教導(dǎo)”機(jī)器也能學(xué)會辨別這些不同的信號,比如其中大約3500個是經(jīng)過驗證的行星或強(qiáng)行星的信號,另外的則不是。通過這種差異性的學(xué)習(xí),可以訓(xùn)練神經(jīng)網(wǎng)絡(luò)區(qū)分什么才是行星的信號,最終使得機(jī)器能分辨出行星運動的通性和規(guī)律,以此來和恒星、雙星系統(tǒng)及其他天體的規(guī)律相區(qū)分。
“最終,當(dāng)我們利用這個系統(tǒng)來測試未曾分析過的信號時,它識別行星信號和非行星信號的準(zhǔn)確率高達(dá)96%,這意味著這個系統(tǒng)是可以發(fā)揮作用的?!?/p>
為縮小搜尋范圍,他們將研究范圍定為了670個已知的可容納兩顆或更多系外行星的恒星。在這樣的過程中,他們發(fā)現(xiàn)了兩顆新行星:開普勒80g和開普勒90i。值得注意的是,因為開普勒90i是第八個被發(fā)現(xiàn)圍繞恒星開普勒90運行的行星,這使開普勒90成為除了太陽系之外,人類已知的第一個擁有八大行星的星系。
同時,肖爾還利用新的工具與技術(shù)觀測到開普勒90i要比地球大30%,表面溫度大約800華氏度,所以它并不適合人類居住。利用這樣的新方法,人類尋找下一個“地球”的步伐能加快不少。
去年12月,NASA舉辦了一場電話會議,同Google一起發(fā)布了這個天文探索領(lǐng)域的重大發(fā)現(xiàn),也讓人類在探索太空的過程中多了一個強(qiáng)有力的智能化工具?!熬拖裎覀兤诖哪菢?,在我們所擁有的開普勒數(shù)據(jù)中潛藏著令人興奮的發(fā)現(xiàn),等待著我們用合適的工具或技術(shù)來挖掘它們,”NASA天體物理學(xué)部負(fù)責(zé)人保羅·赫茲(Paul Hertz)說道,“這一發(fā)現(xiàn)表明,我們的數(shù)據(jù)將成為未來幾年創(chuàng)新研究人員們的寶庫?!?/p>
在9月于上海舉行的世界人工智能大會上,本刊也與首次來到中國的克里斯托弗·肖爾就人工智能技術(shù)與太空探索的相關(guān)工作進(jìn)行了對話。
三聯(lián)生活周刊:作為一個AI方向的工程師,你怎么會產(chǎn)生了利用AI技術(shù)去探索太空的想法?
克里斯托弗·肖爾:實際上我本人不是天文學(xué)家,但我平時對天文科學(xué)這類的理科比較感興趣,我會在空閑的時候去讀一些和太空科學(xué)相關(guān)的書。之前,我恰好讀到一本書,名字叫《人類宇宙》(Human Universe),這本書講的就是從宇宙起源到我們?nèi)祟惾绾翁剿魈盏墓适隆>褪窃谶@本書中,我讀到了開普勒望遠(yuǎn)鏡是在2009年的時候發(fā)射到太空的,然后它會發(fā)送回來很多的數(shù)據(jù),而這些數(shù)據(jù)都需要人來進(jìn)行分析,但是數(shù)據(jù)量實在太大。這點就給我一定的啟迪,因為在Google,我們擅長的就是去分析數(shù)據(jù),這是我們的一個專長。由此我就想到了一個合作的可能:它有海量的數(shù)據(jù),這些數(shù)據(jù)又需要去分析,這就啟迪我利用AI去進(jìn)行合作。
三聯(lián)生活周刊:這個項目中具體要完成的任務(wù)是你們和NASA一起商量出來的,還是你們自己發(fā)現(xiàn)并決定的?
克里斯托弗·肖爾:其實我們都知道,NASA發(fā)起了對開普勒望遠(yuǎn)鏡的探索使用,他們面向大眾公布了很多數(shù)據(jù),這些數(shù)據(jù)在網(wǎng)上都可以找到,而我們Google這邊其實是和得克薩斯大學(xué)奧斯汀分校一起去合作分析這些數(shù)據(jù)。但是當(dāng)我們得到這些新發(fā)現(xiàn)之后,是和NASA一起來宣布這個結(jié)果的。
三聯(lián)生活周刊:看起來,這個項目所使用的機(jī)器學(xué)習(xí)技術(shù)主要集中在圖像領(lǐng)域,它是否和那些在醫(yī)學(xué)領(lǐng)域的智能化診斷研究有相似之處?因為它們都是使用機(jī)器學(xué)習(xí)技術(shù)對圖像進(jìn)行分析。
克里斯托弗·肖爾:我們知道,在醫(yī)學(xué)領(lǐng)域,像目前對糖尿病的研究就取得了很大進(jìn)展,成果激動人心,而且對整個人類都有貢獻(xiàn),我們也發(fā)現(xiàn)目前有很多人都在這方面進(jìn)行探索。這兩種方向的研究確實有很多相似之處,因為它們都要分析很多的圖片,所以它們都是利用機(jī)器學(xué)習(xí)的方法,采用深度神經(jīng)網(wǎng)絡(luò)技術(shù),讓機(jī)器能夠?qū)D像進(jìn)行分析。這些是它們的類似之處。
三聯(lián)生活周刊:除了行星的搜索之外,在其他的科學(xué)領(lǐng)域,比如物理學(xué)方面的大型粒子對撞機(jī)所做的也是粒子的搜尋工作。這種大量的數(shù)據(jù)分析工作可能和現(xiàn)在的搜尋行星類型差不多,你對這些不同的科學(xué)領(lǐng)域有涉足的計劃嗎?
克里斯托弗·肖爾:我本人并沒有涉及大型粒子探測器的研究之中,因為我們知道,其實科學(xué)它的覆蓋面是非常之廣的,我們現(xiàn)在也是希望能夠用機(jī)器學(xué)習(xí)技術(shù)來更好地了解科學(xué),利用這些技術(shù)來分析數(shù)據(jù)。事實上,天文學(xué)里面所收集到的這些數(shù)據(jù)就已經(jīng)是海量的了,已經(jīng)足夠我們?nèi)シ治龊荛L的時間。而且據(jù)我所知,行業(yè)里其實已經(jīng)有人開始利用機(jī)器學(xué)習(xí)技術(shù)來開展對大型粒子對撞機(jī)的探索了。
三聯(lián)生活周刊:隨著人工智能技術(shù)越來越多地幫天文學(xué)家們處理數(shù)據(jù),天文學(xué)家對人工智能技術(shù)的依賴也會越來越強(qiáng),那他們有沒有可能在這個過程中喪失一些自我發(fā)現(xiàn)新事物的創(chuàng)新能力?你是否聽過學(xué)界有類似的擔(dān)憂?
克里斯托弗·肖爾:事實上,你提的問題我也比較了解。我們訓(xùn)練的模型其實是通過我們對于這些已知的事物進(jìn)行不斷的培訓(xùn),讓這個模型能夠了解這些已知的事物,然后再用這樣的一個模型去發(fā)現(xiàn)類似的這些事物。所以說在這樣的過程中,這些AI技術(shù)的應(yīng)用是關(guān)系到人的參與。機(jī)器學(xué)習(xí)并不是萬能的,相比起來,人類更善于觀察和發(fā)現(xiàn)全新的事物。只有讓人工智能和人進(jìn)行協(xié)作,才能夠幫助人類更好地發(fā)現(xiàn)更多新的內(nèi)容。
三聯(lián)生活周刊:把這種人工智能技術(shù)引入天文探索的工作中,這對于這個領(lǐng)域來說是否算是一個新時代的開始?
克里斯托弗·肖爾:這樣一個所謂的“新時代”其實還是關(guān)系到海量數(shù)據(jù)的分析。像之前我們所討論的開普勒太空望遠(yuǎn)鏡的發(fā)射也是為了收集數(shù)據(jù),它在八年時間中收集了海量的數(shù)據(jù)。另外我們也知道,NASA最近又發(fā)射了一個新的衛(wèi)星,叫“TESS”(Transiting Exoplanet Survey Satellite),它所涉及的數(shù)據(jù)可能比開普勒太空望遠(yuǎn)鏡的數(shù)據(jù)更多。這就要求在未來的時代里,我們必須有更先進(jìn)的技術(shù)來對這些數(shù)據(jù)進(jìn)行分析,而不能夠單純地依靠人去對數(shù)據(jù)進(jìn)行分類,去手動地對數(shù)據(jù)進(jìn)行檢查。