顏嘉麒 閔超 余厚強 魏家鵬 賈韜 馬建
摘? ?要:大科學(xué)裝置和大規(guī)??茖W(xué)基礎(chǔ)設(shè)施產(chǎn)生的科學(xué)數(shù)據(jù)促進了領(lǐng)域科學(xué)研究的新一輪發(fā)展,更加驅(qū)動了科學(xué)研究者之間的創(chuàng)新科研協(xié)作??茖W(xué)數(shù)據(jù)驅(qū)動的科研協(xié)作,成為科學(xué)研究的新范式和大趨勢。第六屆中國科學(xué)數(shù)據(jù)大會以“科學(xué)數(shù)據(jù)與重大科研基礎(chǔ)設(shè)置”為主題,關(guān)注科學(xué)數(shù)據(jù)管理與開放共享過程中的政策、方法、技術(shù)及基礎(chǔ)設(shè)施建設(shè)等問題。文章以大會分論壇“科學(xué)數(shù)據(jù)驅(qū)動的科研協(xié)作”內(nèi)容的梳理和總結(jié)為基礎(chǔ),從科學(xué)數(shù)據(jù)驅(qū)動的科研協(xié)作之機理、特征、案例、研究路徑等視角進行述評,揭示了科學(xué)數(shù)據(jù)驅(qū)動的科研協(xié)作的新范式,提出了未來研究方向與機會。
關(guān)鍵詞:科研協(xié)作;科學(xué)數(shù)據(jù);科學(xué)裝置;科學(xué)基礎(chǔ)設(shè)施
中圖分類號:G250.2;G311? ?文獻(xiàn)標(biāo)識碼:A? ?DOI:10.11968/tsyqb.1003-6938.2020052
Abstract The scientific research data generated by large scale scientific apparatus and research infrastructures has accelerated the new development in scientific domain research, driving innovative research collaborations among scientific researchers. The collaboration driven by scientific data has become a new paradigm and trend for scientific research. Under such circumstances, the 6th China Data Science Conference (CDSC) was held with the theme of "Scientific Data and Large Scale Scientific Infrastructure", focusing on the problems occurring in the process of scientific data management and sharing, including policies, methods, technologies, and infrastructures construction, etc. As a summary of the Workshop of Scientific Data driven Research Collaboration (SDRC) in the CDSC, the paper made investigation and study of the mechanism, features, cases, and research paths of SDRC. New paradigm of research collaboration driven by scientific data was identified, and proposals were put forward for future research directions and opportunities, which provides a foundation for the theoretical and practical development of scientific research collaboration.
Key words research collaboration; scientific data; scientific apparatus; research infrastructures
1? ?引言
科學(xué)數(shù)據(jù)是國家科技創(chuàng)新發(fā)展和經(jīng)濟社會進步的重要基礎(chǔ)性戰(zhàn)略資源,是科研創(chuàng)新最基本、最活躍、影響面最寬的科技資源。隨著大天區(qū)面積多目標(biāo)光纖光譜天文望遠(yuǎn)鏡(LAMOST)、大亞灣核反應(yīng)堆中微子實驗、500米口徑球面射電望遠(yuǎn)鏡(FAST)等近年來相繼投入運行使用,這些科研基礎(chǔ)設(shè)施將產(chǎn)生大量可靠的科學(xué)數(shù)據(jù)資源。以這些大科學(xué)裝置產(chǎn)生的數(shù)據(jù)為代表,科學(xué)數(shù)據(jù)引發(fā)領(lǐng)域科學(xué)研究的范式變革,驅(qū)動了科學(xué)研究者之間的科研協(xié)作創(chuàng)新??茖W(xué)數(shù)據(jù)驅(qū)動的科研協(xié)作方式,成為科學(xué)研究的新范式和大趨勢。在此背景下, 2019年8月21-23日在中國貴陽主辦的第六屆中國科學(xué)數(shù)據(jù)大會以“科學(xué)數(shù)據(jù)與重大科研基礎(chǔ)設(shè)施”為主題,設(shè)有5個大會報告、21個并行分會、216個分會報告,關(guān)注科學(xué)數(shù)據(jù)管理與開放共享過程中的政策、方法、技術(shù)及基礎(chǔ)設(shè)施建設(shè)等問題。
中國科學(xué)數(shù)據(jù)大會是在2013年由國際科技數(shù)據(jù)委員會(Committee on Data for Science and Technology,CODATA)中國全國委員會發(fā)起并開始籌備, 旨在推動我國科學(xué)數(shù)據(jù)的開放、技術(shù)交流及數(shù)據(jù)科學(xué)的發(fā)展。中國科學(xué)數(shù)據(jù)大會在我國加快科研大數(shù)據(jù)開放共享、大數(shù)據(jù)時代科研信息化基礎(chǔ)環(huán)境建設(shè)、全球影響力科技創(chuàng)新中心建設(shè)、科學(xué)數(shù)據(jù)與數(shù)據(jù)科學(xué)學(xué)科建設(shè)、科學(xué)數(shù)據(jù)服務(wù)創(chuàng)新發(fā)展等方面起到積極的推動作用??茖W(xué)大數(shù)據(jù)是中國科學(xué)數(shù)據(jù)大會長期以來關(guān)注的重要問題,首屆科學(xué)數(shù)據(jù)大會就以“科研大數(shù)據(jù)與數(shù)據(jù)科學(xué)”為主題;在第四屆科學(xué)數(shù)據(jù)大會上,中科院副院長張亞平還指出,在科學(xué)研究領(lǐng)域,繼觀測實驗、理論分析、計算模擬之后,一種“大數(shù)據(jù)驅(qū)動的科學(xué)發(fā)現(xiàn)”新模式已經(jīng)開始顯現(xiàn),科學(xué)大數(shù)據(jù)已經(jīng)成為科技創(chuàng)新的新引擎。
本次中國科學(xué)數(shù)據(jù)大會上,南京大學(xué)信息管理學(xué)院顏嘉麒副教授、閔超助理教授、南京理工大學(xué)經(jīng)濟管理學(xué)院余厚強副教授、西南大學(xué)計算機與信息科學(xué)學(xué)院賈韜教授與香港城市大學(xué)資訊系統(tǒng)系的馬建教授共同發(fā)起并籌辦了“科學(xué)數(shù)據(jù)驅(qū)動的科研協(xié)作”主題分會。來自上海交通大學(xué)、中科院成都文獻(xiàn)情報中心、大連理工大學(xué)等機構(gòu)的演講嘉賓和科研人員共50余人參加了分會的現(xiàn)場討論與交流。本文通過對會議內(nèi)容與嘉賓研討的梳理和總結(jié),從科學(xué)數(shù)據(jù)驅(qū)動的科研協(xié)作之機理、特點、案例、研究路徑等視角進行述評,提出未來研究方向與機會,以期為相關(guān)實踐與理論發(fā)展提供參考。
2? ?科學(xué)大數(shù)據(jù)背景下科研協(xié)作范式的轉(zhuǎn)變
科學(xué)數(shù)據(jù)產(chǎn)生,通常是由科學(xué)研究者以特定的科學(xué)裝置(或者特定的實驗環(huán)境)通過某種實驗程序收集而來。從信息系統(tǒng)(Human, System, Information)的研究角度[1]來看,科學(xué)數(shù)據(jù)驅(qū)動的科研協(xié)作主要是由科學(xué)研究者、科研裝置(環(huán)境)、科學(xué)數(shù)據(jù)三個因素組成的科研協(xié)作新范式(見圖1)??茖W(xué)研究者是科學(xué)實踐的主體,確定研究對象并設(shè)計科學(xué)活動??茖W(xué)裝置(環(huán)境)是科學(xué)活動中科學(xué)研究者采用的實踐工具,也代表科學(xué)活動的程序和規(guī)范??茖W(xué)數(shù)據(jù)是表征研究對象客體各種特征的產(chǎn)物,是通過科學(xué)活動由某種科學(xué)裝置(環(huán)境)而產(chǎn)生的。
傳統(tǒng)的科研協(xié)作是科學(xué)研究者主導(dǎo)的[2]??茖W(xué)研究者使用科學(xué)裝置,科學(xué)裝置產(chǎn)生科學(xué)數(shù)據(jù),科學(xué)研究者處理科學(xué)數(shù)據(jù)。科學(xué)研究者的基本特征是能動性和創(chuàng)造性。科學(xué)研究者以個體面貌出現(xiàn),也以群體面貌出現(xiàn)??茖W(xué)研究者之間的科研協(xié)作隨著研究者之間越來越明確的分工而顯得越來越明顯??茖W(xué)裝置(環(huán)境)的基本特征是規(guī)范性和工具性,而科學(xué)數(shù)據(jù)的基本特征是客觀性和對象性。隨著科研協(xié)作的發(fā)展,多套科學(xué)裝置協(xié)作同時研究一個科學(xué)問題、多份科學(xué)數(shù)據(jù)互相驗證科學(xué)研究的情形也變得越來越常見。
科學(xué)大數(shù)據(jù)是指與科學(xué)研究相關(guān)的大數(shù)據(jù)[3]。在科學(xué)大數(shù)據(jù)時代,科學(xué)研究者、科學(xué)裝置和科學(xué)數(shù)據(jù)三者之間的相互作用和影響進一步促進了科學(xué)協(xié)作新模式的出現(xiàn)。重大科研基礎(chǔ)設(shè)施的建設(shè)與更新,引發(fā)數(shù)據(jù)快速累積;高通量儀器設(shè)備以及新數(shù)據(jù)處理技術(shù)和方法帶來了科學(xué)數(shù)據(jù)的快速增長,打破了過去由科學(xué)研究者主導(dǎo)科研協(xié)作的平衡。五百米口徑球面射電望遠(yuǎn)鏡(FAST)多科學(xué)目標(biāo)巡天每天將產(chǎn)生約500TB的零級未壓縮數(shù)據(jù),需要100G高速網(wǎng)絡(luò)將數(shù)據(jù)傳輸至數(shù)據(jù)中心進行處理①。FAST科學(xué)工程的建立和產(chǎn)生的大量難以處理的科學(xué)數(shù)據(jù),驅(qū)使天文學(xué)家主動尋求與全球范圍內(nèi)計算機科學(xué)家、人工智能專家、軟硬件工程師的跨領(lǐng)域科研協(xié)作。同樣的,在生命科學(xué)領(lǐng)域,高通量測序技術(shù)能一次對幾十萬到幾百萬條DNA分子進行序列測定。我國具有龐大的基因數(shù)據(jù)產(chǎn)出能力,隨著國家在人口健康領(lǐng)域的戰(zhàn)略部署,將產(chǎn)生百PB級的基因數(shù)據(jù)①,占世界總數(shù)的一半以上。這種大規(guī)模的基因數(shù)據(jù),使得生命科學(xué)在生命科學(xué)家與數(shù)據(jù)庫、數(shù)據(jù)科學(xué)、信息管理等領(lǐng)域?qū)<业幕优c協(xié)作中迸發(fā)出新的科學(xué)發(fā)現(xiàn)模式。
有別于實驗科學(xué)、理論科學(xué)、計算科學(xué),上述這種科學(xué)發(fā)現(xiàn)模式強調(diào)數(shù)據(jù)作為科學(xué)發(fā)現(xiàn)的基礎(chǔ),并以數(shù)據(jù)為中心和驅(qū)動、基于對海量數(shù)據(jù)的處理和分析去發(fā)現(xiàn)新知識為基本特征??茖W(xué)研究者參與到科學(xué)數(shù)據(jù)的采集、存儲、管理、分析、可視化和知識發(fā)現(xiàn)的各個不同階段,形成科學(xué)協(xié)作、科學(xué)發(fā)現(xiàn)的新方法和新途徑。
3? ?科學(xué)數(shù)據(jù)驅(qū)動科研協(xié)作的特征
科學(xué)數(shù)據(jù)驅(qū)動的科研協(xié)作模式順應(yīng)的是科學(xué)研究范式的改變。20世紀(jì),科學(xué)史學(xué)家普賴斯[4]就曾經(jīng)指出科學(xué)研究的模式將由大學(xué)實驗室所從事的小科學(xué)(Little Science)轉(zhuǎn)變?yōu)槎鄬W(xué)科整合應(yīng)用性的大科學(xué)(Big Science)。普賴斯指出,小科學(xué)強調(diào)昔日個人化的研究成果,而由于科學(xué)文獻(xiàn)數(shù)量大增、資訊超載,致使科學(xué)研究者無法及時充分掌握及利用科學(xué)資訊,且造成研究之重復(fù),因而現(xiàn)在的研究趨向集體研究而產(chǎn)生大科學(xué)[5]。大科學(xué)研究模式的改變,使得科學(xué)協(xié)作也已經(jīng)從研究者之間的“合作”,逐漸轉(zhuǎn)變?yōu)橛纱罅靠茖W(xué)數(shù)據(jù)產(chǎn)生驅(qū)動下,科學(xué)家、工程師、從業(yè)者之間以及他們與科研儀器之間的“協(xié)同工作”。具體說來,與傳統(tǒng)科研協(xié)作相比,科學(xué)數(shù)據(jù)驅(qū)動的科研協(xié)作至少在以下六方面表現(xiàn)出顯著的特征。
3.1? ? 科學(xué)合作規(guī)模持續(xù)增大
在過去的數(shù)十年間,科學(xué)研究的主體整體上經(jīng)歷了從單打獨斗到團隊合作的發(fā)展變遷,尤其是近年來呈現(xiàn)出從小團隊科研到大團隊科研的明顯趨勢。科學(xué)研究者之間的頻繁合作行為表現(xiàn)在不斷增長的科研團隊規(guī)模,而團隊規(guī)模的增長在科學(xué)論文合著行為中體現(xiàn)得十分明顯。胡志剛②基于科睿唯安公司的InCites工具分析發(fā)現(xiàn),如今論文合著中科研團隊的規(guī)模已經(jīng)增長到四十年前的三倍多。在1980-1984年間,一篇科學(xué)論文的作者數(shù)量平均是3.29人,而這一數(shù)字到2015-2019年間已增長到6.91人。與此同時,科學(xué)合作在多個層面得到加強,國家間的合作占比從原來的4.1%增加到22.25%,專業(yè)學(xué)術(shù)機構(gòu)與產(chǎn)業(yè)界的合作比例亦增加到原來水平的兩倍有余。
3.2? ? ?科學(xué)合作模式呈現(xiàn)異質(zhì)性
在合作規(guī)模持續(xù)增長的宏大背景下,科學(xué)合作模式在不同主體之間涌現(xiàn)出異質(zhì)性。(1)在合作模式研究方面,陳云偉③利用論文作者合作網(wǎng)絡(luò)社團劃分的方法,在量子信息、腦科學(xué)、碳纖維、稀土、大氣灰霾等領(lǐng)域展開大量實證研究。他發(fā)現(xiàn)不同的科研單元呈現(xiàn)迥異的科研工作模式,如在量子信息領(lǐng)域的四個頂級科研單元中,我國科研單元呈現(xiàn)出顯著的集團軍式的合作模式,具備明顯的聯(lián)合攻關(guān)特征,而國外科研單元中的科學(xué)研究者則在論文發(fā)表方面表現(xiàn)出較為疏松的合作網(wǎng)絡(luò);(2)在國際合作方面,沙特阿拉伯是國際化程度最高的國家,約四分之三的論文來自國際合作。中國大陸、土耳其和印度的國際論文比例則處于相對靠后的位置;(3)在產(chǎn)學(xué)研合作方面,瑞士以高達(dá)7.26%的產(chǎn)學(xué)研合作論文比例高居全球首位,中國的產(chǎn)學(xué)研合作則低于世界平均水平。不同學(xué)科內(nèi)部的合作模式也具有差異性,如天文學(xué)與天體物理學(xué)由于研究工作的獨特性質(zhì),近一半的論文來自國際合作;再如石油工程領(lǐng)域的產(chǎn)學(xué)研合作比例遠(yuǎn)高于其他領(lǐng)域④。
3.3? ? ?從合作發(fā)文到基于儀器設(shè)備、基礎(chǔ)設(shè)施的科研協(xié)作
合作發(fā)文的背后是科研相關(guān)人員之間愈發(fā)頻繁的協(xié)同工作,典型代表是以大型科研裝置、設(shè)備、儀器等科學(xué)基礎(chǔ)設(shè)施為中心,吸引越來越多的科學(xué)工作者投身其中。然而,正如本次會議上魏家鵬①和顏嘉麒②總結(jié)的,目前科研儀器設(shè)備在科研協(xié)作中發(fā)揮作用還受到一些障礙的影響,如用戶范圍有限[6]、使用門檻偏高[7]、共享平臺缺乏[8]等。他們基于區(qū)塊鏈技術(shù)思想,分別從制度與技術(shù)方面提出一種科研設(shè)備共享平臺的設(shè)計方案。在科研設(shè)備的共享過程中,通過引入積分、賬戶等制度,將設(shè)備擁有者、申請者、使用者的權(quán)益與積分進行錨定,建立一整套安全、高效、可流轉(zhuǎn)的設(shè)備共享生態(tài)系統(tǒng);在技術(shù)方面,借助區(qū)塊鏈去中心化、可信以及不可篡改的技術(shù)特征,完整嵌入科學(xué)設(shè)備的積分記錄系統(tǒng),從而真實記錄每一次協(xié)作的發(fā)生。他們指出,該方案的本質(zhì)即是在保證科研設(shè)備所有權(quán)不發(fā)生轉(zhuǎn)移的前提下,通過Token積分對科研設(shè)備的使用權(quán)進行流轉(zhuǎn)與共享,從而增益科學(xué)價值,促進科研協(xié)作。
3.4? ? 科學(xué)數(shù)據(jù)的保存和利用需要更加規(guī)范化
科學(xué)數(shù)據(jù)集一方面產(chǎn)生于科研發(fā)現(xiàn)與協(xié)作過程,如今越來越呈現(xiàn)出數(shù)量大、種類多、來源廣等特征;另一方面,科研工作者對科學(xué)數(shù)據(jù)的使用需求日益多樣化,對這些數(shù)據(jù)的挖掘與利用也進一步推動著科學(xué)發(fā)現(xiàn)與協(xié)作的升級。與會者分別從天文學(xué)與地球科學(xué)兩個學(xué)科角度闡述了這一問題。左雨萌③指出天文歷史數(shù)據(jù)的長期保存是天文數(shù)據(jù)管理中的重要問題,原因在于數(shù)據(jù)的未來復(fù)用往往受到數(shù)據(jù)保存中一系列格式轉(zhuǎn)化的影響,這就需要數(shù)據(jù)生產(chǎn)者、保存者與使用者的多方協(xié)同。哈佛大學(xué)圖書館與史密森天文臺的合作項目Phaedra,為天文手稿、文獻(xiàn)、文物等多種實體包含的珍貴數(shù)據(jù)提供了成功復(fù)用的案例。余厚強等④從地球系統(tǒng)科學(xué)出發(fā),通過對數(shù)據(jù)共享平臺的統(tǒng)計和內(nèi)容分析,發(fā)現(xiàn)科學(xué)數(shù)據(jù)集的使用方式除了學(xué)術(shù)需求外,還存在教育需求、社會需求等多樣方式。不過他們也指出,傳統(tǒng)的數(shù)據(jù)引證方式只能反映不足8%的數(shù)據(jù)集使用需求,因此有必要建立更加規(guī)范化、標(biāo)準(zhǔn)化的科學(xué)數(shù)據(jù)引證、評價與共享體系。
3.5? ? 科學(xué)數(shù)據(jù)共享在科研協(xié)作中具有重要位置
如今科學(xué)研究越來越依賴于數(shù)據(jù),對科學(xué)數(shù)據(jù)進行共享也成為科研協(xié)作的重要基石與驅(qū)動因素[9]。為此,我國采用建立機構(gòu)知識庫、國家級科研數(shù)據(jù)中心等方式,促進科研數(shù)據(jù)的跨機構(gòu)、跨行業(yè)共享與交流??蒲袛?shù)據(jù)需要共享,其原因在于,一方面科研數(shù)據(jù)包含的信息類和數(shù)據(jù)項豐富[10], 包括科研人員數(shù)據(jù)、科研資料數(shù)據(jù)、科研技術(shù)數(shù)據(jù)以及科研環(huán)境數(shù)據(jù)等,貫穿于科研的整個生命周期,價值巨大;另一方面,科研數(shù)據(jù)的共享有利于減少數(shù)據(jù)的重復(fù)生產(chǎn)、降低數(shù)據(jù)的使用成本、增進科研成果的同行評議[11],進一步有助于提高我國科學(xué)研究成果的產(chǎn)出。然而,顏嘉麒等①②指出,現(xiàn)有的科研數(shù)據(jù)共享平臺尚未很好地實現(xiàn)共享交流的效果,主要體現(xiàn)在“不能共享”“不愿共享”和“不敢共享”。其主要原因在于,已有平臺的接入機制少、成本高、障礙多;數(shù)據(jù)共享者面臨的風(fēng)險責(zé)任與權(quán)利收益之間存在矛盾[12];傳統(tǒng)有限防護機制未能很好保障數(shù)據(jù)安全。顏嘉麒等同時認(rèn)為,區(qū)塊鏈中的分布式共享賬本技術(shù)有潛力為構(gòu)建開放、安全、可信的科研數(shù)據(jù)共享網(wǎng)絡(luò)提供技術(shù)與制度方面的參考。
3.6? ? 科學(xué)協(xié)作促使科學(xué)家在全球范圍內(nèi)流動
大規(guī)??茖W(xué)設(shè)施的投入、科學(xué)資源的配置和科學(xué)數(shù)據(jù)的產(chǎn)生同樣驅(qū)動和引導(dǎo)了科學(xué)家的流動,并激發(fā)出更多的科學(xué)協(xié)作機會,這尤其體現(xiàn)在科研人員的國際流動上??蒲腥藛T的流動,一方面在流入國與流出國之間建立起聯(lián)系,背后是科學(xué)知識的流動與科學(xué)影響的輸出,另一方面也有可能造成不同地區(qū)科學(xué)人才結(jié)構(gòu)的失衡。這更體現(xiàn)了科學(xué)裝置投入和科學(xué)數(shù)據(jù)產(chǎn)生對吸引人才的重要作用。李江等⑤基于對全球范圍科學(xué)家簡歷數(shù)據(jù)的分析,認(rèn)為科學(xué)人員的流動已經(jīng)從某些地區(qū)的人才流失、人才回流發(fā)展到全球范圍內(nèi)的人才環(huán)流。他們構(gòu)建出科學(xué)家流動的三維地圖,按照年份、學(xué)科、地區(qū)、機構(gòu)等條件展示科學(xué)家流動的特征與趨勢??茖W(xué)家去新的機構(gòu)、城市與國家任職,這一信息反映在其簡歷信息上,尤其是以O(shè)RCID為代表的大型數(shù)據(jù)集,系統(tǒng)記錄了科學(xué)家流動的全球數(shù)據(jù)。當(dāng)然,科學(xué)家流動除了受到科研條件與科研資源的影響,還受制于諸多復(fù)雜的因素,如經(jīng)濟發(fā)展、自然環(huán)境、社會環(huán)境、子女教育等。
4? ?案例分析:LAMOST科學(xué)數(shù)據(jù)驅(qū)動的科研協(xié)作
大科學(xué)裝置是一種在物理上不可分割的科研資源,產(chǎn)生的大規(guī)??茖W(xué)數(shù)據(jù)促使來自不同團體的科學(xué)家組成研究團隊協(xié)同工作,有效降低了科學(xué)合作中的協(xié)調(diào)成本[13-14]。以2008年建成的LAMOST天文望遠(yuǎn)鏡為例,它是中科院國家天文臺的國家重大科技基礎(chǔ)設(shè)施,以大視場、大光譜觀測等特點居于國際領(lǐng)先地位。2019年3月,巡天7年的LAMOST望遠(yuǎn)鏡發(fā)布DR6數(shù)據(jù)集,其中包括4902個觀測天區(qū)與1125萬條光譜,成為世界首個突破千萬量級的光譜巡天項目[15]。
LAMOST的建造與使用是大科學(xué)裝置促進科研協(xié)作在全球范圍內(nèi)開展的鮮明案例。Web of Science數(shù)據(jù)庫與美國國家太空總署(NASA)的天體物理數(shù)據(jù)系統(tǒng)ADS顯示,截至2018年,除了中國以外,美國、英國、澳大利亞、德國、法國、加拿大、西班牙、日本、意大利、丹麥等國家均在不同程度上利用LAMOST產(chǎn)出科研論文。這些科研成果隨著LAMOST觀測數(shù)據(jù)集度過保護期后向國際學(xué)術(shù)界開放共享的步伐,在成果數(shù)量上呈現(xiàn)出指數(shù)型快速增長的態(tài)勢。相關(guān)的科研協(xié)作主要體現(xiàn)在LAMOST巡天項目與有關(guān)科研計劃的數(shù)據(jù)發(fā)布、天文觀測與研究、多種望遠(yuǎn)鏡觀測結(jié)果的比較等工作上。主要的研究問題則包括光譜技術(shù)、恒星豐度與基本參數(shù)、銀河系動力學(xué)、數(shù)據(jù)分析方法等眾多方面。
基于LAMOST的科研協(xié)作同樣展現(xiàn)出多樣性的合作來源與異質(zhì)性的合作模式。在國際合作層面,有國外科研機構(gòu)參與的論文數(shù)量已經(jīng)超過單純由中國科研機構(gòu)完成的論文數(shù)量,并且前者比后者多出25%的可觀比例。其中,在有國外機構(gòu)參與的論文中,又有近四分之一是單純由國外機構(gòu)自身或者相互合作完成。毫無疑問,中國是國際合作網(wǎng)絡(luò)的核心,與美國、德國、英國等發(fā)達(dá)國家之間的合作更加頻繁;而歐洲國家如法國、英國、德國、比利時等之間的合作也保持在較高的水平上。在機構(gòu)合作層面,盡管中科院系統(tǒng)的科研院所具有臨近優(yōu)勢,但是一系列國外科研機構(gòu)同樣在使用LAMOST與其開放的數(shù)據(jù)從事科學(xué)研究,其中不乏美國勞倫斯理工學(xué)院、加州理工學(xué)院,意大利國家天體物理研究所,澳大利亞悉尼大學(xué),以及英國劍橋大學(xué)等世界著名科研機構(gòu)。同樣地,中科院國家天文臺與南京天文光學(xué)技術(shù)研究所作為機構(gòu)合作網(wǎng)絡(luò)中的兩個中心節(jié)點,與國內(nèi)外科研機構(gòu)在協(xié)同利用LAMOST上起到重要的樞紐與協(xié)調(diào)作用。在科學(xué)家個人層面,如果將個人合作關(guān)系繪制成網(wǎng)絡(luò)圖,可以看到某些顯著的合作模式從圖中涌現(xiàn)出來(見圖2)。整張合作網(wǎng)絡(luò)在微觀上呈現(xiàn)密集的合作狀態(tài),科學(xué)家個人之間的合作逐步在本地形成了內(nèi)部凝聚的合作群體,這些合作群體的規(guī)模有大有小,散布于整張網(wǎng)絡(luò)的各個位置。在網(wǎng)絡(luò)中非常顯著的位置,出現(xiàn)了一個規(guī)模很大的連通分支,它主要是有中國科學(xué)家群體組成的密集合作網(wǎng)絡(luò),經(jīng)由各種網(wǎng)絡(luò)路徑與其他網(wǎng)絡(luò)節(jié)點(科學(xué)家)產(chǎn)生千絲萬縷的合作聯(lián)系。網(wǎng)絡(luò)中還有其他一些內(nèi)部聯(lián)系緊密的子網(wǎng)絡(luò),它們內(nèi)部發(fā)生頻繁的合作,同時通過某些橋節(jié)點而與其他子網(wǎng)絡(luò)內(nèi)的科學(xué)家產(chǎn)生聯(lián)系。如比利時皇家天文臺的Peter De Cat連接了多個中外研究群體。LAMOST無疑為全球天文學(xué)家解決天文學(xué)問題提供了良好的觀測工具與協(xié)作平臺。
5? ?未來的研究方向與機會
隨著科學(xué)大數(shù)據(jù)的公開與普及,科研人員如何合理地分配與利用科學(xué)裝置及其產(chǎn)生的大量科研數(shù)據(jù),以及科研人員在更廣泛的層面上應(yīng)該如何更好地開展科研合作,已經(jīng)成為科學(xué)界日益關(guān)注的問題。對此議題的深入探討將推進科學(xué)數(shù)據(jù)共享與科研合作朝向高效、高產(chǎn)與高影響的方向發(fā)展?!翱茖W(xué)數(shù)據(jù)驅(qū)動的科研協(xié)作”科研論壇,經(jīng)過研討,與會專家認(rèn)為科學(xué)數(shù)據(jù)驅(qū)動的科研協(xié)作在以下三個主要方向上展現(xiàn)出豐富的研究機遇。
5.1? ? 科研協(xié)作的分析與描述
通過應(yīng)用數(shù)理統(tǒng)計和計算技術(shù)等數(shù)學(xué)方法對科研協(xié)作活動的過程、形式、規(guī)模、影響進行定量分析,從中找出科學(xué)數(shù)據(jù)驅(qū)動的科研協(xié)作的活動規(guī)律性??蒲袇f(xié)作的計量與描述研究方法主要源于情報科學(xué)和科學(xué)學(xué),亦包括網(wǎng)絡(luò)計量學(xué)和替代計量學(xué)的方法。
(1)非正式科學(xué)交流環(huán)境下的科研協(xié)作模式??茖W(xué)大數(shù)據(jù)環(huán)境下涌現(xiàn)出許多新的科研協(xié)作模式。在正式科學(xué)交流所使用的平臺和工具之外,研究者通過非正式科學(xué)交流渠道實現(xiàn)科研協(xié)作,也在發(fā)揮重要作用。分析和描述非正式科學(xué)交流環(huán)境里的科研協(xié)作模式,包括通過社交媒體平臺分享合作信息、推廣科研成果,通過眾包平臺實現(xiàn)數(shù)據(jù)分布式標(biāo)注等,將成為科學(xué)計量學(xué)領(lǐng)域重要的研究課題。
(2)科研協(xié)作的規(guī)模與網(wǎng)絡(luò)分析??蒲袇f(xié)作規(guī)模是指參與科研協(xié)作的人員數(shù)量、資金投入、時間投入等要素的規(guī)模,能夠反映科研協(xié)作的整體發(fā)展態(tài)勢。在科學(xué)大數(shù)據(jù)的環(huán)境下,科研協(xié)作網(wǎng)絡(luò)層次更加豐富,包括國家層次、機構(gòu)層次和個人層次的合作網(wǎng)絡(luò)。未來科學(xué)計量研究除了通過合著關(guān)系構(gòu)建,也可以考慮使用基金項目、會議組織等其他各種形式豐富的合作聯(lián)系,更加立體的揭示科研協(xié)作的核心人員、合作模式。
(3)區(qū)域間科研協(xié)作發(fā)展趨勢與影響力。科學(xué)大數(shù)據(jù)環(huán)境下科研協(xié)作是跨國界跨區(qū)域的合作。國家之間科研協(xié)作的橫向比較,通過統(tǒng)計其科研協(xié)作發(fā)展隨時間的變化,分析各國科研協(xié)作的項目、政策,洞察國家科研協(xié)作的宏觀趨勢??鐓^(qū)域科研協(xié)作表現(xiàn)在不同的地理層次,洲際、國際、省際、市際乃至校際之間的科研協(xié)作,呈現(xiàn)出不同的特點,在設(shè)計初衷和目標(biāo)使命方面亦存在不同,分析跨區(qū)域科研協(xié)作項目的影響力,有助于理解地理要素對科研協(xié)作的作用。
5.2? ? 科研協(xié)作的設(shè)計與實現(xiàn)
通過信息技術(shù)與科學(xué)學(xué)的組合,解決在科學(xué)協(xié)作中遇到的技術(shù)與工程問題??蒲袇f(xié)作的設(shè)計與實現(xiàn)的研究方法主要借鑒計算機科學(xué)和軟件工程等工程學(xué)的研究方法,通過不斷進步的信息通訊技術(shù)實現(xiàn)和支持科學(xué)數(shù)據(jù)驅(qū)動的科研協(xié)作。該方向的主要課題包括但不限于:
(1)科學(xué)數(shù)據(jù)資源共享機制、科研協(xié)作平臺框架設(shè)計。在科學(xué)大數(shù)據(jù)環(huán)境下,科研資源分享方式與傳統(tǒng)科研環(huán)境下的科學(xué)數(shù)據(jù)共享發(fā)生了本質(zhì)的改變。多源、多維與海量的科學(xué)大數(shù)據(jù)需要更加高效的共享機制和科研協(xié)作平臺。如何利用人工智能、區(qū)塊鏈、協(xié)同計算等前沿信息技術(shù),設(shè)計更能保證隱私和權(quán)益的科學(xué)數(shù)據(jù)資源共享機制、更有效率的科研協(xié)作平臺,是未來研究支持科研協(xié)作一個重要的研究方向。
(2)科研智能協(xié)作具體推薦與分析算法??茖W(xué)大數(shù)據(jù)環(huán)境下,科研工作者在不同項目里的角色更加多樣化,可以參與的科研協(xié)作形式更加豐富,在科研工作可以發(fā)揮的作用越來越多。通過機器學(xué)習(xí)與推薦系統(tǒng)算法,智能推薦與分析科研協(xié)作的模式,可以實現(xiàn)更有效率的科研協(xié)作服務(wù),并且可以進一步通過數(shù)據(jù)分析驅(qū)動創(chuàng)新的科研協(xié)作。
(3)科學(xué)數(shù)據(jù)共享中的質(zhì)量控制和信息安全問題研究??茖W(xué)數(shù)據(jù)的質(zhì)量控制與信息安全問題是指數(shù)據(jù)存儲穩(wěn)定性、數(shù)據(jù)質(zhì)量、防止黑客攻擊等保障科學(xué)數(shù)據(jù)可被安全訪問的基本問題,是科研協(xié)作得以開展的基礎(chǔ)。科學(xué)大數(shù)據(jù)環(huán)境下,科學(xué)數(shù)據(jù)的內(nèi)容、種類、數(shù)量等都發(fā)生了變化。在這種新環(huán)境下,如何通過各種加密方式、授權(quán)管理、質(zhì)量檢測和信息安全手段來控制和保護科學(xué)數(shù)據(jù)的共享,將會成為未來研究的熱點和重點。
5.3? ? 科研協(xié)作的管理與規(guī)劃
通過社會學(xué)和管理學(xué)的研究方法,旨在解決科研協(xié)作的管理和規(guī)劃問題??蒲袇f(xié)作的管理與規(guī)劃的研究方法主要借鑒管理學(xué)、運籌學(xué)和經(jīng)濟學(xué)等社會學(xué)的研究方法。該方向的主要課題包括但不限于:
(1)科研協(xié)作相關(guān)科技政策與科學(xué)大數(shù)據(jù)規(guī)范化管理研究。政府和管理部門為了鼓勵和支持科研協(xié)作,應(yīng)該如何規(guī)范科學(xué)大數(shù)據(jù)的采集、使用、共享等方面的管理,是在科學(xué)大數(shù)據(jù)背景下科技管理的重要課題。科技政策體系實施上,如何將數(shù)據(jù)管理與科研研究模式相結(jié)合,必然為科技管理的研究者帶來很多未來的研究機會。
(2)科技資源統(tǒng)籌、利益分配與共享激勵措施??萍假Y源是創(chuàng)新體系的重要組成要素,決定了創(chuàng)新能力的強弱。在科學(xué)大數(shù)據(jù)環(huán)境下,更加需要統(tǒng)籌科技資源總體狀況。因此,研究如何根據(jù)不同類型科技基礎(chǔ)條件資源的發(fā)展特點分配利益,設(shè)計充分調(diào)動參與者積極性的共享激勵措施政策,也會是未來的研究熱點。
(3)科研協(xié)作項目的評審機制與經(jīng)濟和社會效益評估??茖W(xué)大數(shù)據(jù)環(huán)境下,對科學(xué)產(chǎn)出的評價更加全面和多樣化。如何設(shè)計健全科學(xué)協(xié)作項目的評審機制,如對科研協(xié)作項目不僅從科技產(chǎn)出,也從經(jīng)濟和社會角度進行多角度評估,會是未來科學(xué)評價的重點。
6? ?結(jié)語
隨著大規(guī)??茖W(xué)數(shù)據(jù)的增長,基于科學(xué)數(shù)據(jù)驅(qū)動的科研協(xié)作成為必然趨勢,呈現(xiàn)出新特點和新模式,構(gòu)成科學(xué)數(shù)據(jù)大會中的重要議題??梢灶A(yù)見,未來人與人、人與儀器之間的交互越來越普遍,科研協(xié)作將更加緊密地圍繞科學(xué)數(shù)據(jù)來展開。但是,科學(xué)數(shù)據(jù)問題也存在學(xué)科差異。在自然科學(xué)如高能物理學(xué)、天體物理學(xué)等,基于大科學(xué)裝置產(chǎn)生的大規(guī)模科學(xué)數(shù)據(jù)十分普遍;在工程技術(shù)領(lǐng)域如物聯(lián)網(wǎng)、森林監(jiān)控體系等,基于海量傳感器產(chǎn)生的海量數(shù)據(jù)得到廣泛積累;在人文社科領(lǐng)域如考古、新聞傳播領(lǐng)域,基于數(shù)字人文、3D建模、社交媒體等的大數(shù)據(jù)引領(lǐng)學(xué)科研究新范式。這些不同學(xué)科的科學(xué)數(shù)據(jù),在屬性特點、存儲傳播和研究路徑方面都表現(xiàn)出差異,需要開展針對性的研究。
參考文獻(xiàn):
[1]? Gregor S.The Nature of Theory in Information Systems[J].MIS Quarterly,2006,30(3):611-642.
[2]? 王赟,魏子晗,沈絲楚,等.世紀(jì)科學(xué)之問“合作+行為是如何進化的”——中國學(xué)者的回應(yīng)[J].科學(xué)通報,2016,61(1):20-33.
[3]? 孫建軍,李陽.科學(xué)大數(shù)據(jù):范式重塑與價值實現(xiàn)[J].圖書與情報,2017(5):20-26.
[4]? Price D J d S.Little science,big science[M].New York: Columbia Univ.Press,1963.
[5]? 劉則淵,陳悅,朱曉宇.普賴斯對科學(xué)學(xué)理論的貢獻(xiàn)——紀(jì)念科學(xué)計量學(xué)之父普賴斯逝世30周年[J].科學(xué)學(xué)研究,2013,31(12):1761-1772.
[6]? 宋立榮,劉春曉,張薇.我國大型科學(xué)儀器資源開放共享建設(shè)中問題及對策思考[J].情報雜志,2014,33(11):1-6,13.
[7]? 劉洋,何建佳.大型科學(xué)儀器設(shè)備共享的合作收益分配模型——基于努力因素的分析[J].科技管理研究,2017,37(3):179-184.
[8]? 董誠,張新民,侯敏.大型科學(xué)儀器共享的三層次模型及實例分析[J].中國基礎(chǔ)科學(xué),2012,14(5):55-59.
[9]? 黎建輝,沈志宏,孟小峰.科學(xué)大數(shù)據(jù)管理:概念、技術(shù)與系統(tǒng)[J].計算機研究與發(fā)展,2017,54(2):235-247.
[10]? Fischer B A,Zigmond M J.The Essential Nature of Sharing in Science[J].Science & Engineering Ethics,2010,16(4):783-799.
[11]? Tenopir C,Allard S,Douglass K,et al.Data sharing by scientists:practices and perceptions[J].PLoS ONE,2011,6:e21101.
[12]? Christine L.Borgman,青秀玲.科研數(shù)據(jù)共享的挑戰(zhàn)[J].現(xiàn)代圖書情報技術(shù),2013(5):1-20.
[13]? 黃敏,楊海珍.加強大科學(xué)裝置的管理[J].中國科學(xué)院院刊,2006(3):41-46.
[14]? 張玲玲,王蝶,張利斌.跨學(xué)科性與團隊合作對大科學(xué)裝置科學(xué)效益的影響研究[J].管理世界,2019,35(12):199-212.
[15]? 國家天文臺.LAMOST DR6數(shù)據(jù)集正式發(fā)布[EB/OL].[2019-12-20].http://www.bao.ac.cn/xwzx/gdtpxw/201903/t20190327_5262549.html.