李珊珊 樊東衛(wèi) 崔辰州 何勃亮 陶一寒 霍志英 米琳瑩 羅阿理 陳建軍 侯 文 孔 嘯 李蔭碧 郭炎鑫 李 雙 李長華 許允飛 韓 軍 楊絲絲 楊涵溪 趙永恒
(中國科學(xué)院國家天文臺,北京 100101)
大天區(qū)面積多目標(biāo)光纖光譜天文望遠(yuǎn)鏡(Large Sky Area Multi-Object Fiber Spectroscopic Telescope,LAMOST),也稱郭守敬望遠(yuǎn)鏡,是一架由我國自主研制兼具大口徑、大視場(5°)、高光譜獲取率等特點的反射式施密特望遠(yuǎn)鏡。其利用焦面上4 000 根精確定位的光纖,可以同時觀測4 000 個左右的天體目標(biāo),通過分布式可控光纖定位系統(tǒng),將數(shù)據(jù)記錄在16 臺光譜儀上的32 個CCD中(每臺光譜儀分紅、藍(lán)端)。LAMOST在每觀測日可獲取約10 GB原始數(shù)據(jù)以及處理分析后產(chǎn)生的更多的次生數(shù)據(jù)[1-2]。
LAMOST于2008年建設(shè)完成并進(jìn)行了第一次測試觀測,于2011年10月開始先導(dǎo)巡天觀測[1]。從那時起,這架國家重大科學(xué)望遠(yuǎn)鏡開啟了它10年巡天觀測的歷程,像一只坐落在我國北方壯麗群山之巔的觀天巨眼,以驚人的速度和效率捕獲來自宇宙中天體的光譜信息,不斷刷新人類在巡天觀測領(lǐng)域的光譜獲取記錄,孕育大量科研成果,助力國內(nèi)外天文學(xué)家在恒星、星族、銀河系結(jié)構(gòu)及運(yùn)動學(xué)研究等領(lǐng)域的不斷開拓和進(jìn)取。
在天文學(xué)界,望遠(yuǎn)鏡觀測獲得的科學(xué)數(shù)據(jù)經(jīng)過數(shù)據(jù)保護(hù)期后,通常會面向全世界范圍公開發(fā)布,使任何人(不僅僅是天文學(xué)家)都能通過一定途徑方便地獲取數(shù)據(jù)、使用數(shù)據(jù),進(jìn)行科學(xué)研究。保護(hù)期內(nèi)的天文觀測數(shù)據(jù)通常只面向觀測及項目團(tuán)隊內(nèi)部使用,保護(hù)期時長根據(jù)不同望遠(yuǎn)鏡不同項目的規(guī)定各有不同,通常為1 ~2年。因此,LAMOST的巡天觀測數(shù)據(jù)最終向全世界開放是一種必然。LAMOST的觀測能力和數(shù)據(jù)獲取能力是毋庸置疑的,必須為它構(gòu)建一個與之相匹配的數(shù)據(jù)發(fā)布系統(tǒng)和天文數(shù)據(jù)庫,使其具備世界級的數(shù)據(jù)管理、數(shù)據(jù)檢索與開放共享能力。但是,我國天文學(xué)界尚未建立如此海量天文數(shù)據(jù)的開放共享體系。于2001年,在中國首屆虛擬天文臺技術(shù)研討會上提出了建設(shè)中國虛擬天文臺(China-VO)及面向虛擬天文臺的LAMOST計劃[3]。LAMOST經(jīng)過10 余年的建設(shè)與發(fā)展,推動了我國天文數(shù)據(jù)相關(guān)技術(shù)的發(fā)展。國家天文科學(xué)數(shù)據(jù)中心正在應(yīng)用國際先進(jìn)的虛擬天文臺技術(shù)為LAMOST提供全生命周期的數(shù)據(jù)服務(wù),并與LAMOST運(yùn)行和發(fā)展中心共同形成了相對完整穩(wěn)定的數(shù)據(jù)發(fā)布流程及系統(tǒng),成為支撐望遠(yuǎn)鏡從觀測到數(shù)據(jù)發(fā)布再到天文學(xué)家下載使用整個流程不可或缺的組成部分。
本文將回顧近10年來LAMOST數(shù)據(jù)發(fā)布系統(tǒng)的開發(fā)建設(shè)情況,并對系統(tǒng)架構(gòu)及功能進(jìn)行簡要介紹,探討LAMOST數(shù)據(jù)的影響力,展示國際發(fā)布工作及科普教育延伸應(yīng)用開發(fā)取得的成果,展望未來建設(shè)與發(fā)展。
LAMOST先導(dǎo)巡天觀測于2011年10月24日正式啟動,并于2012年6月結(jié)束,覆蓋了9個月亮周期,獲取光譜約百萬條。最終經(jīng)過信噪比等篩選流程,保留了319 000 條光譜。FITS格式的光譜數(shù)據(jù)可以通過當(dāng)時的LAMOST官方網(wǎng)站(http://www.lamost.org/)進(jìn)行索引和下載[4]。這是LAMOST最早的數(shù)據(jù)發(fā)布。為了進(jìn)行數(shù)據(jù)的宣傳和推廣,研究團(tuán)隊在第28 屆國際天文學(xué)聯(lián)合會(IAU)大會上設(shè)置展臺,制作包含LAMOST先導(dǎo)數(shù)據(jù)的光盤(圖1)供天文學(xué)家獲取和研究數(shù)據(jù)。IAU會刊《天問》報道了LAMOST建設(shè)、觀測與數(shù)據(jù)發(fā)布的相關(guān)情況[5]。
圖1 LAMOST先導(dǎo)巡天數(shù)據(jù)光盤
此后,基于先導(dǎo)巡天得到的經(jīng)驗,LAMOST科學(xué)委員會分析了觀測數(shù)據(jù)并制定了5年巡天觀測計劃。該計劃主要觀測目標(biāo)為河內(nèi)恒星,也包括相當(dāng)一部分的河外源[5]。2012年9月28日,LAMOST第一年巡天正式開始,至2013年6月結(jié)束。在此期間,LAMOST汲取了斯隆數(shù)字化巡天(Slona Digital Sky Survey,SDSS)的經(jīng)驗,高度重視數(shù)據(jù)管理與發(fā)布工作,正式開啟了LAMOST數(shù)據(jù)發(fā)布系統(tǒng)的建設(shè)及數(shù)據(jù)開放共享的序幕。
2015年3月19日,正式對全世界發(fā)布LAMOST取得的首批巡天光譜數(shù)據(jù),即完全開放共享。此次公開發(fā)布的數(shù)據(jù)包含220 萬條光譜信息,完成了于2011年9月至2013年6月近兩年的巡天觀測任務(wù)(先導(dǎo)巡天及第一年正式巡天)。其中,信噪比大于10 的恒星光譜有172 萬條,超過了當(dāng)時世界上所有已知恒星巡天項目的光譜總和。同時,發(fā)布數(shù)據(jù)中還包括一個108 萬顆恒星的光譜參數(shù)星表,是當(dāng)時世界上最大的恒星光譜參數(shù)星表[6]。這批數(shù)據(jù)最早于2013年8月對國內(nèi)天文學(xué)家和國際合作者優(yōu)先發(fā)布,并根據(jù)國際天文學(xué)界的慣例,在數(shù)據(jù)保護(hù)期之后對全世界開放共享。
為更好地服務(wù)此次國際發(fā)布,中國虛擬天文臺團(tuán)隊基于自身在虛擬天文臺領(lǐng)域和天文數(shù)據(jù)領(lǐng)域的多年研究經(jīng)驗和技術(shù)積累,投入全部研發(fā)力量與LAMOST數(shù)據(jù)團(tuán)隊合作,開發(fā)了為項目量身定制的全新的數(shù)據(jù)發(fā)布在線服務(wù)系統(tǒng)(網(wǎng)站平臺)[7-8]。研發(fā)過程主要參考了國際上備受肯定的SDSS檢索界面和發(fā)布模式[9],借鑒了國際先進(jìn)的數(shù)據(jù)管理發(fā)布理念,尊重天文科研人員的使用習(xí)慣,不僅支持?jǐn)?shù)據(jù)下載,還提供LAMOST先導(dǎo)巡天和第一年巡天數(shù)據(jù)(DR1)的在線檢索和瀏覽,是國內(nèi)首個支持國內(nèi)天文大科學(xué)裝置的專業(yè)數(shù)據(jù)發(fā)布平臺。這也形成了現(xiàn)在LAMOST數(shù)據(jù)發(fā)布系統(tǒng)的雛形。
平臺實現(xiàn)了多項技術(shù)的融合應(yīng)用,主要包括:光譜數(shù)據(jù)可視化,支持在線查看光譜信息、修改紅移、自定義光譜發(fā)射線吸收線等;打通系統(tǒng)和云平臺的通道,檢索結(jié)果可直接導(dǎo)入云空間存儲;每個版本釋放前預(yù)先做好LAMOST數(shù)據(jù)與40 余個常用星表的融合工作并提供檢索服務(wù);實現(xiàn)國際虛擬天文臺聯(lián)盟制定的錐形檢索、光譜檢索等數(shù)據(jù)訪問協(xié)議,拓寬數(shù)據(jù)傳播范圍和使用渠道。這種設(shè)計開發(fā)思路不但保證了科研學(xué)者使用時的流暢性和連貫性,也最大限度地向全世界開放,并為對接國際化需求和標(biāo)準(zhǔn)鋪平了道路。此次LAMOST數(shù)據(jù)發(fā)布服務(wù)工作是在中國科學(xué)院“十二五”科研信息化專項“天文學(xué)科技領(lǐng)域云”和國家地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺天文數(shù)據(jù)中心的支持下完成的。
郭守敬望遠(yuǎn)鏡是國家投資的大型科學(xué)設(shè)備,按照天文界慣例,其觀測數(shù)據(jù)需通過“數(shù)據(jù)發(fā)布”最終向所有公眾開放。截至2020年年底,LAMOST光譜巡天觀測數(shù)據(jù)已經(jīng)進(jìn)行了26 次不同批次、不同版本的發(fā)布(其中部分發(fā)布批次中包含多個星表和光譜數(shù)據(jù)),設(shè)計開發(fā)全新數(shù)據(jù)發(fā)布網(wǎng)站平臺10 余個,總發(fā)布數(shù)據(jù)量超過29.74 TB。為方便相關(guān)數(shù)據(jù)的使用和溯源,LAMOST數(shù)據(jù)發(fā)布在線服務(wù)平臺除提供最新巡天觀測數(shù)據(jù)的瀏覽、檢索查詢和下載服務(wù)外,還保留了所有已發(fā)布批次數(shù)據(jù)的公開檢索服務(wù)。
LAMOST巡天觀測獲得的原始數(shù)據(jù)只有經(jīng)過復(fù)雜的數(shù)據(jù)處理流程(PIPELINE)后才能對外發(fā)布。處理流程中的關(guān)鍵環(huán)節(jié)會形成中間數(shù)據(jù)、次生數(shù)據(jù)等。為了保證數(shù)據(jù)的可追溯性,方便質(zhì)量控制,這些數(shù)據(jù)也會入庫存儲供后續(xù)使用。所有觀測和處理流程均有日志記錄。目前的LAMOST原始觀測數(shù)據(jù)包括低分辨率、中分辨率兩部分,需經(jīng)過分類處理進(jìn)行參數(shù)測量、繪制光譜圖、人工檢查等環(huán)節(jié),再經(jīng)數(shù)據(jù)質(zhì)量控制,最終制作成數(shù)據(jù)對外發(fā)布。其簡化后的流程如圖2所示。根據(jù)《LAMOST 光譜巡天數(shù)據(jù)政策》,發(fā)布數(shù)據(jù)主要包括以下3 種類型:一是原始數(shù)據(jù)及原始來源信息(如觀測日志文件、校準(zhǔn)文件等),由科學(xué)委員會酌情公布;二是一維光譜數(shù)據(jù),在每年觀測季數(shù)據(jù)獲取后18 個月內(nèi)進(jìn)行增量發(fā)布;三是星表數(shù)據(jù),于一維光譜數(shù)據(jù)發(fā)布后的6 個月內(nèi)發(fā)布。在實際發(fā)布中,星表數(shù)據(jù)通常與光譜數(shù)據(jù)同期發(fā)布。為保護(hù)參與項目的機(jī)構(gòu)和個人成員利益,只有獲得項目科學(xué)委員會批準(zhǔn)的成員才能提前使用未發(fā)布的觀測數(shù)據(jù)。原則上除一維光譜數(shù)據(jù)、星表數(shù)據(jù)外,原始數(shù)據(jù)不會公開發(fā)布,將進(jìn)行長期保存①LAMOST光譜巡天數(shù)據(jù)政策h(yuǎn)ttp://www.lamost.org/lmusers/cms/article/view?id=1。。
圖2 LAMOST巡天觀測數(shù)據(jù)處理流程示意
LAMOST一期巡天觀測(2011—2017年)僅提供低分辨率光譜及星表數(shù)據(jù),中國虛擬天文臺團(tuán)隊為LAMOST巡天觀測數(shù)據(jù)提供在線檢索、查詢及下載服務(wù)的時間、發(fā)布網(wǎng)址等信息,如表1所示。
表1 LAMOST一期巡天(2011—2017年)數(shù)據(jù)發(fā)布情況
LAMOST二期巡天觀測(2018—2022年),其數(shù)據(jù)發(fā)布以《LAMOST光譜巡天第六次數(shù)據(jù)發(fā)布第〇版第一季度》為起點。與一期巡天僅進(jìn)行低分辨率觀測不同,二期巡天開啟了中、低分辨率光譜巡天交替進(jìn)行的觀測模式。二期巡天觀測數(shù)據(jù)的釋放更加注重發(fā)布版本的規(guī)范性。以第〇版(V0)對應(yīng)季度數(shù)據(jù),該版本數(shù)據(jù)為測試版數(shù)據(jù),于觀測結(jié)束后一個半月內(nèi)發(fā)布,僅限于工作組成員和獲得項目科學(xué)委員會批準(zhǔn)的成員使用;以第一版(V1)對應(yīng)國內(nèi)正式版數(shù)據(jù),于觀測結(jié)束后一年發(fā)布(每年夏季),可供國內(nèi)科研工作者及國際合作者使用;第二版(V2)對應(yīng)國際正式版數(shù)據(jù),于國內(nèi)正式版數(shù)據(jù)發(fā)布一年半后發(fā)布(每年冬季),該版本完全向全世界公開開放,任何人都可下載使用。其他數(shù)據(jù)更新和修正以子版本號標(biāo)記,如V1.1、V1.2 等。由于天文數(shù)據(jù)的特殊性,每個發(fā)布版本都有科研人員使用并產(chǎn)出相應(yīng)的成果,不能隨意替換刪除。因此,LAMOST釋放的所有數(shù)據(jù)版本在國家天文科學(xué)數(shù)據(jù)中心長期保留,并允許科研人員根據(jù)需求進(jìn)行檢索和下載。截至目前,LAMOST二期巡天已發(fā)布數(shù)據(jù)的詳細(xì)情況見表2。從先導(dǎo)巡天到一期巡天,再到二期巡天,LAMOST持續(xù)進(jìn)行光譜巡天觀測工作,不斷擴(kuò)大觀測天區(qū)范圍,累積獲得觀測光譜數(shù)量逐年增加,如圖3所示。截至2021年3月,在LAMOST光譜巡天第八次數(shù)據(jù)發(fā)布第一版時,低分辨率總光譜數(shù)已達(dá)10 388 423 條,中分辨率總光譜數(shù)達(dá)到6 038 218 條。
圖3 LAMOST低分辨率巡天觀測總光譜數(shù)及觀測天區(qū)數(shù)
表2 LAMOST二期巡天(2018—2022年)數(shù)據(jù)發(fā)布情況
續(xù)表
隨著LAMOST巡天觀測的持續(xù)進(jìn)行,數(shù)據(jù)發(fā)布較為頻繁,版本復(fù)雜多樣,數(shù)據(jù)內(nèi)容豐富。為更好地方便天文學(xué)家檢索使用數(shù)據(jù),在每次發(fā)布前還需要將發(fā)布數(shù)據(jù)與其他國內(nèi)外光學(xué)、射電、紅外、紫外等常用星表融合,實現(xiàn)多種數(shù)據(jù)在線檢索和分析等功能,最終形成具有可用性、易用性和實用性的在線服務(wù)平臺。LAMOST數(shù)據(jù)發(fā)布系統(tǒng)架構(gòu)既能滿足數(shù)據(jù)持續(xù)穩(wěn)定對外發(fā)布需求,也能為科研人員最大限度地提供便捷。該系統(tǒng)由硬件層、系統(tǒng)層、在線服務(wù)、宣傳推廣4 個層面構(gòu)成。其具體架構(gòu)如圖4所示。
圖4 LAMOST數(shù)據(jù)發(fā)布系統(tǒng)架構(gòu)
其中,在線服務(wù)模塊是用戶直接體驗和使用的平臺,由下面5 個部分組成(以DR8 V1為例)。
(1)數(shù)據(jù)發(fā)布系統(tǒng)首頁:LAMOST巡天數(shù)據(jù)以年度巡天為單位進(jìn)行網(wǎng)站首頁風(fēng)格的升級和設(shè)計開發(fā),至今已正式發(fā)布的系統(tǒng)平臺累計達(dá)10個版本。在每個系統(tǒng)的首頁上展示版本名稱、版本號、常用功能連接、數(shù)據(jù)統(tǒng)計(低分辨率、中分辨率)、致謝模板等。
(2)數(shù)據(jù)在線檢索:用戶可通過該功能對低分辨率和中分辨率光譜進(jìn)行在線檢索。該模塊是參考SDSS檢索功能并結(jié)合LAMOST數(shù)據(jù)自身特點設(shè)計的。用戶可通過位置區(qū)域、指定目標(biāo)、觀測ID、紅移、觀測信息、恒星參數(shù)、類別、信噪比等多種限制方式進(jìn)行檢索。檢索后即返回如圖5所示的數(shù)據(jù)列表。
圖5 LAMOST DR8 數(shù)據(jù)檢索結(jié)果頁面
用戶可將檢索結(jié)果返回列表以CSV或VOTable格式下載。光譜文件(FITS、PNG等格式)可下載到本地計算機(jī)上,也可存儲至中心提供的云空間內(nèi)進(jìn)行在線科研?;贖TML5 開發(fā)的光譜查看功能,可實現(xiàn)放大縮小檢查光譜細(xì)節(jié)、查看光譜分類、修改紅移值、自定義光譜法射線吸收線,可支持用戶進(jìn)行在線光譜可視化和數(shù)據(jù)分析。
(3)數(shù)據(jù)獲取:LAMOST巡天觀測發(fā)布數(shù)據(jù)包括星表數(shù)據(jù)、光譜數(shù)據(jù)等。系統(tǒng)允許用戶通過SQL查詢數(shù)據(jù)、使用FTP下載、離線等方式獲取數(shù)據(jù)。前兩者符合條件的用戶可在線自行操作,離線獲取數(shù)據(jù)需要提交申請表,獲得批準(zhǔn)后即可至數(shù)據(jù)中心線下拷貝數(shù)據(jù)。
(4)文檔:系統(tǒng)中的文檔欄目包括該版本數(shù)據(jù)釋放文檔、低分辨率數(shù)據(jù)描述(中英)、中分辨率數(shù)據(jù)描述(中英)和LAMOST數(shù)據(jù)政策、發(fā)表政策等。
(5)幫助與聯(lián)絡(luò):系統(tǒng)提供數(shù)據(jù)獲取介紹文檔、常見問題(FAQ)等幫助信息,允許用戶在線提交聯(lián)系LAMOST運(yùn)行和發(fā)展中心的申請。
2015年3月至2020年 9月,LAMOST DR1至LAMOST DR6 的數(shù)據(jù)逐年向全世界公開發(fā)布。以LAMOST DR6 數(shù)據(jù)為例,2020年9月發(fā)布版本為《LAMOST光譜巡天第六次數(shù)據(jù)第二版》(LAMOST DR6 V2),包含先導(dǎo)巡天及正式巡天前6年的光譜數(shù)據(jù),如圖6所示。這一數(shù)據(jù)發(fā)布標(biāo)志著在國際上LAMOST光譜數(shù)據(jù)正式邁入千萬量級時代,成為世界上第一個獲取光譜數(shù)超千萬的光譜巡天項目。
圖6 LAMOST 先導(dǎo)巡天和正式巡天前6年的天區(qū)覆蓋圖
除面向全球的數(shù)據(jù)釋放外,國家天文科學(xué)數(shù)據(jù)中心利用自身在國際虛擬天文臺領(lǐng)域的影響力,積極推廣LAMOST數(shù)據(jù)的國際化應(yīng)用,提高中國天文數(shù)據(jù)知名度。2016年3月,LAMOST第一批巡天數(shù)據(jù)(LAMOST DR1)正式被法國斯特拉斯堡天文數(shù)據(jù)中心(CDS)的VizieR數(shù)據(jù)庫系統(tǒng)收錄,獲得永久星表編號“V/146”。從這一刻開始,LAMOST光譜數(shù)據(jù)完整地融入了國際天文數(shù)據(jù)庫系統(tǒng)。其星表和光譜數(shù)據(jù)均可按照國際虛擬天文臺標(biāo)準(zhǔn)接口和檢索方式訪問,可方便地與其他數(shù)據(jù)交叉融合使用。此后,LAMOST DR2、LAMOST DR4 數(shù)據(jù)分別在2017年3月和2018年9月被VizieR數(shù)據(jù)庫系統(tǒng)收錄,并分別獲得了“V/149”和“V/153”的永久星表編號。LAMOST數(shù)據(jù)被VizieR收錄,提升了我國天文數(shù)據(jù)在國際上的顯示度,可以更大程度地發(fā)揮數(shù)據(jù)的科學(xué)價值。
2020年6月,歐洲空間局與中國科學(xué)院國家天文臺、國家天文科學(xué)數(shù)據(jù)中心合作為其交互式天體圖譜平臺ESASky打造簡體中文版,并收錄了LAMOST DR5 V3 數(shù)據(jù)。通過該平臺,來自全世界的天文學(xué)家和天文愛好者能夠隨時隨地瀏覽LAMOST巡天觀測數(shù)據(jù)。
大數(shù)據(jù)時代,天文數(shù)據(jù)的開放性已引起越來越多來自其他領(lǐng)域的關(guān)注和興趣。海量真實的天文觀測數(shù)據(jù)不僅能夠幫助天文學(xué)家探索未知,也在云計算、人工智能技術(shù)、機(jī)器學(xué)習(xí)等方面展現(xiàn)了跨領(lǐng)域應(yīng)用的潛力。2018年2月,國家天文臺—阿里云天文大數(shù)據(jù)聯(lián)合研究中心啟動了“天文數(shù)據(jù)挖掘”天池大賽,以郭守敬望遠(yuǎn)鏡巡天光譜分類為課題,通過阿里云天池數(shù)據(jù)眾智平臺征集高效、高準(zhǔn)確率的自動化算法。2020年1月,由北京智源人工智能研究院主辦,國家天文臺、數(shù)據(jù)評測平臺biendata聯(lián)合舉辦的天體分類數(shù)據(jù)競賽“智源杯天文數(shù)據(jù)算法挑戰(zhàn)賽”正式啟動。參賽選手使用LAMOST DR4 數(shù)據(jù)集中近100 萬條天體光譜數(shù)據(jù),利用人工智能技術(shù)進(jìn)行分類算法優(yōu)化。此類競賽不僅能為解決天文研究中的實際光譜分類問題提供新的思路,也為人工智能算法提供了天然的練兵場。大量參賽選手為高校學(xué)生,他們通過實際科學(xué)問題的求解,有機(jī)會更加深入地學(xué)習(xí)相關(guān)天文知識,增加了對天文數(shù)據(jù)的了解。國家天文科學(xué)數(shù)據(jù)中心將總結(jié)相關(guān)比賽組織經(jīng)驗,提煉標(biāo)準(zhǔn)數(shù)據(jù)集,繼續(xù)拓寬LAMOST巡天數(shù)據(jù)更廣泛的應(yīng)用場景。
LAMOST天體光譜數(shù)據(jù)開放共享的10年收獲頗豐。目前,該系統(tǒng)正在服務(wù)國內(nèi)幾乎所有天文研究教學(xué)單位的專業(yè)用戶和大量國際合作者,累積超過千人。系統(tǒng)獲得了國內(nèi)外天文學(xué)家的廣泛認(rèn)可,幫助他們在銀河系結(jié)構(gòu)與演化、恒星物理、特殊天體及致密天體、類星體等重要前沿領(lǐng)域取得了一系列有國際影響力的研究成果。其中,《發(fā)現(xiàn)迄今銀河系中自轉(zhuǎn)最快恒星》《發(fā)現(xiàn)宇宙中鋰豐度最高恒星》《銀河系發(fā)現(xiàn)新的移動星群》等基于LAMOST數(shù)據(jù)取得的研究成果在中央電視臺相關(guān)欄目中播出,影響廣泛。LAMOST用戶委員會對數(shù)據(jù)服務(wù)的評價連年為優(yōu)。
截至2020年年底,LAMOST數(shù)據(jù)發(fā)布系統(tǒng)支持科學(xué)用戶在線檢索達(dá)3 179 139 次,支持科研學(xué)者使用LAMOST巡天數(shù)據(jù)產(chǎn)出SCI論文700余篇,利用LAMOST數(shù)據(jù)發(fā)表的SCI論文引用數(shù)超過7 000 次并呈現(xiàn)快速增長趨勢。發(fā)表于RAA的LAMOST DR1 數(shù)據(jù)發(fā)布論文由于高被引而榮獲“第三屆中國科協(xié)優(yōu)秀論文獎”和英國皇家物理學(xué)會出版社2018年“中國高被引文章獎”。2019年5月,《郭守敬望遠(yuǎn)鏡數(shù)據(jù)發(fā)布系統(tǒng)》入選“2018年度中國科學(xué)院信息化優(yōu)秀案例”①《郭守敬望遠(yuǎn)鏡數(shù)據(jù)發(fā)布系統(tǒng)被評為中科院信息化優(yōu)秀案例》https://nadc.china-vo.org/article/20190509090152?locale=zh_CN。。由國家天文科學(xué)數(shù)據(jù)中心和LAMOST運(yùn)行和發(fā)展中心共同研制的《海量天體光譜數(shù)據(jù)分析與產(chǎn)品發(fā)布系統(tǒng)的研制與應(yīng)用》獲得北京市科技進(jìn)步二等獎。
從打包下載到在線檢索,從對國內(nèi)釋放到面向全世界,從天文學(xué)家專用到服務(wù)于跨領(lǐng)域研究應(yīng)用,LAMOST觀測數(shù)據(jù)的開放共享不斷完善改進(jìn),數(shù)據(jù)發(fā)布方式與內(nèi)容從稚嫩探索走向成熟豐富。其中,國家天文科學(xué)數(shù)據(jù)中心全程參與,使天文學(xué)家使用LAMOST數(shù)據(jù)更加便捷,不僅能夠“用好數(shù)據(jù)”而且能夠“好用數(shù)據(jù)”。數(shù)據(jù)全生命周期管理模式為國內(nèi)其他天文望遠(yuǎn)鏡的數(shù)據(jù)管理提供了示范。
追溯過往,國家天文科學(xué)數(shù)據(jù)中心的前身中國天文數(shù)據(jù)中心已經(jīng)成立30 多年。但是在LAMOST開始正式觀測并持續(xù)生產(chǎn)天文數(shù)據(jù)之前,我國缺少自己生產(chǎn)的大規(guī)模天文觀測數(shù)據(jù),中國的天文學(xué)家和天文數(shù)據(jù)工作者也沒有開展大型天文數(shù)據(jù)庫的建設(shè)以及學(xué)習(xí)并實踐國際虛擬天文臺聯(lián)盟相關(guān)標(biāo)準(zhǔn)的機(jī)會。LAMOST的出現(xiàn)和其穩(wěn)定的數(shù)據(jù)產(chǎn)出,對我國天文數(shù)據(jù)中心建設(shè)起到了至關(guān)重要的推動作用,為中國虛擬天文臺技術(shù)的發(fā)展提供了機(jī)會。
LAMOST數(shù)據(jù)的開放共享,縮短了中國天文數(shù)據(jù)開放共享工作與世界先進(jìn)水平的距離,打開了全新交流窗口和渠道。10年中,大量相關(guān)研究人員和技術(shù)人才參與發(fā)布系統(tǒng)建設(shè)開發(fā),不僅為這個世界上最大的天文光譜庫添磚加瓦,也鍛煉了隊伍,積累了經(jīng)驗??茖W(xué)數(shù)據(jù)管理指導(dǎo)原則FAIR(可發(fā)現(xiàn),可訪問,可互操作,可重用)自初見雛形到2016年正式提出,已成為科學(xué)數(shù)據(jù)管理的國際準(zhǔn)則[10]。LAMOST數(shù)據(jù)發(fā)布系統(tǒng)完全符合這一數(shù)據(jù)管理原則,其成功更是驗證了該原則的有效性,說明其符合未來科學(xué)數(shù)據(jù)管理的發(fā)展方向。
LAMOST二期巡天即將完成,LAMOST的觀測數(shù)據(jù)管理和開放共享將進(jìn)入嶄新階段。未來LAMOST數(shù)據(jù)團(tuán)隊將繼續(xù)優(yōu)化數(shù)據(jù)質(zhì)量,提升數(shù)據(jù)的可追溯性,規(guī)范數(shù)據(jù)入庫過程,完善數(shù)據(jù)發(fā)布系統(tǒng),進(jìn)行更深更廣的國際化推廣,打造國際權(quán)威的科學(xué)數(shù)據(jù)庫系統(tǒng),并繼續(xù)推動LAMOST巡天數(shù)據(jù)在可視化與可視分析、人工智能、機(jī)器學(xué)習(xí)、科普教育等領(lǐng)域的應(yīng)用。同時,國家天文科學(xué)數(shù)據(jù)中心將以國際化先進(jìn)理念為指導(dǎo),打造科學(xué)平臺,實現(xiàn)數(shù)據(jù)與科研要素的深度融合,對天文數(shù)據(jù)的開放共享進(jìn)行全新探索,推動科研模式的變革[11]。
致謝
郭守敬望遠(yuǎn)鏡(Large Sky Area Multi-Object Fiber Spectroscopic Telescope,LAMOST)是中國科學(xué)院建設(shè)的國家重大科學(xué)項目。該項目資金由國家發(fā)展和改革委員會提供。LAMOST由中國科學(xué)院國家天文臺運(yùn)營和管理。本文得到了中國虛擬天文臺、國家天文科學(xué)數(shù)據(jù)中心、中國科學(xué)院科學(xué)數(shù)據(jù)中心體系提供的數(shù)據(jù)資源和技術(shù)支持。感謝國家天文臺—阿里云天文大數(shù)據(jù)聯(lián)合研究中心對本項工作的支持。