張莉婧?張新新
【摘要】 ?數(shù)據(jù)出版是促進數(shù)據(jù)共享的有效措施之一。隨著大數(shù)據(jù)科學范式的興起、數(shù)字出版數(shù)據(jù)化發(fā)展的推動以及5G技術的落地,科學數(shù)據(jù)呈現(xiàn)爆發(fā)式增長,數(shù)據(jù)共享逐漸成為科學研究領域的熱點話題,數(shù)據(jù)出版為數(shù)據(jù)共享開辟新路徑。從數(shù)據(jù)出版實踐經(jīng)驗來看,現(xiàn)階段,我國數(shù)據(jù)出版仍處于發(fā)展階段。不同背景下學者對數(shù)據(jù)出版的定義理解不同,但已初步形成數(shù)據(jù)出版流程和數(shù)據(jù)出版模式。5G環(huán)境下,數(shù)據(jù)出版面臨的數(shù)據(jù)存儲、數(shù)據(jù)共享以及數(shù)據(jù)引用等問題將得到有效解決,數(shù)據(jù)出版將發(fā)生翻天覆地的變化。
【關 ?鍵 ?詞】數(shù)據(jù)出版;科學數(shù)據(jù);5G;數(shù)據(jù)共享;云數(shù)據(jù)庫;VR出版
【作者單位】張莉婧,中地數(shù)媒(北京)科技文化有限責任公司;張新新,武漢大學信息管理學院,地質(zhì)出版社。
【中圖分類號】G230 【文獻標識碼】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2019.23.001
隨著5G時代的來臨、大數(shù)據(jù)以及出版業(yè)數(shù)字化轉(zhuǎn)型升級的迅猛發(fā)展,數(shù)據(jù)共享變得尤為重要,數(shù)據(jù)出版將成為出版界和科學研究領域日益關注的熱點問題。科學數(shù)據(jù)是信息時代開發(fā)利用潛力最大的戰(zhàn)略性、基礎性科技資源,已成為解決復雜科學問題的關鍵要素,以及驅(qū)動科學發(fā)現(xiàn)和決策支持的新型基礎設施[1]。在此背景下,2019年11月8日,國際科學理事會數(shù)據(jù)委員會(CODATA)正式發(fā)布《科研數(shù)據(jù)北京宣言》。宣言依據(jù)公共科研數(shù)據(jù)開展多邊合作的廣泛社會意義提出十條原則。其中一條原則指出,“全球數(shù)據(jù)同盟與開放數(shù)據(jù)的FAIR(可發(fā)現(xiàn)、可獲取、可互操作、可重用)原則”,F(xiàn)AIR原則作為一套國際化方法,旨在提高科學數(shù)據(jù)管理、監(jiān)管和出版,以此順應我國開放科研數(shù)據(jù)趨勢,而數(shù)據(jù)共享是開放科研數(shù)據(jù)的一種形式。數(shù)據(jù)共享可以將研究成果再現(xiàn)及驗證,讓公眾應用現(xiàn)有的數(shù)據(jù)提出新的科學問題,從而不斷提升科學研究和創(chuàng)新水平。數(shù)據(jù)出版是推動數(shù)據(jù)開放、數(shù)據(jù)共享的重要手段和激勵機制。
一、研究背景
數(shù)據(jù)作為對事實觀察的結果,貫穿于整個科學領域,在科研學術活動中扮演著不可或缺的角色。數(shù)據(jù)不再僅僅是科學研究的結果,正在慢慢轉(zhuǎn)變?yōu)榭茖W研究的基礎性材料,科學研究將圍繞數(shù)據(jù)進行。數(shù)據(jù)因具有可重復利用的特性決定了其共享的價值大大超過了其本身所擁有的科研價值。隨著互聯(lián)網(wǎng)的快速發(fā)展,大數(shù)據(jù)時代新科學范式的興起,受到數(shù)字出版的數(shù)據(jù)化發(fā)展的推動,科學數(shù)據(jù)的采集成本正在逐漸降低,各種數(shù)據(jù)的容量正在呈指數(shù)級增長,數(shù)據(jù)的共享與復用逐漸成為科學研究領域的熱點話題。
1.大數(shù)據(jù)時代新科學范式的興起
2013年被譽為大數(shù)據(jù)元年,隨著浙江人民出版社《大數(shù)據(jù)時代》一書的出版,大數(shù)據(jù)領域掀起了一股出版熱潮,此后,大數(shù)據(jù)一直作為熱門話題滲透各行各業(yè)?!叭绾螌⒋髷?shù)據(jù)的數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)標引、數(shù)據(jù)計算、數(shù)據(jù)建模、數(shù)據(jù)應用、數(shù)據(jù)服務等產(chǎn)業(yè)鏈,與出版業(yè)的編輯、校對、印制、發(fā)行等流程進行無縫銜接,是考究數(shù)字出版智庫水準的重要標尺之一?!盵2]人類科學研究范式經(jīng)歷了以科學實驗為主的第一范式——經(jīng)驗科學,以理論總結和理性概括為主的第二范式——理論科學,以仿真和模擬為主的第三范式——計算科學,現(xiàn)在發(fā)展到以科學數(shù)據(jù)為主的第四范式,即大數(shù)據(jù)時代的新科學范式——數(shù)據(jù)密集型科學。數(shù)據(jù)密集型科學的出現(xiàn),意味著數(shù)據(jù)不僅是科學研究的對象,還是科學研究的工具;計算機不僅能做模擬仿真,還能進行分析歸納,得出理論。數(shù)據(jù)密集型科學轉(zhuǎn)變了科學研究方法,研究人員可通過大量的已知數(shù)據(jù)計算得出之前未知的理論。
大數(shù)據(jù)時代,新科學范式的興起導致科學數(shù)據(jù)在容量上呈爆發(fā)式增長,在結構上更多趨于呈現(xiàn)非結構化和半結構化的復雜形態(tài),并形成以科學數(shù)據(jù)為核心的科研過程[3]。數(shù)據(jù)密集型科學研究已經(jīng)成為科學研究領域的主導方式,其數(shù)據(jù)量之大、發(fā)展速度之快已經(jīng)超出人們預想,社會各界會越來越重視數(shù)據(jù)的價值。數(shù)據(jù)共享是數(shù)據(jù)密集型科學研究的必經(jīng)之路,數(shù)據(jù)出版為完善我國科學數(shù)據(jù)共享機制開拓新途徑。
2.數(shù)字出版的數(shù)據(jù)化發(fā)展
數(shù)字出版經(jīng)過多年的發(fā)展,主要經(jīng)歷了數(shù)字化、碎片化以及數(shù)據(jù)化發(fā)展三個階段,目前正在經(jīng)歷智能化發(fā)展階段。不同的階段催生出不同的數(shù)字出版新業(yè)態(tài),同時產(chǎn)生典型的數(shù)字出版產(chǎn)品,不同階段之間也存在著交叉發(fā)展。如今,數(shù)字出版是智能化與數(shù)據(jù)化共同發(fā)展階段,數(shù)據(jù)化發(fā)展推動智能化發(fā)展的出現(xiàn)。
2013年至今,是數(shù)字出版的數(shù)據(jù)化發(fā)展階段。從數(shù)字出版產(chǎn)業(yè)鏈的角度分析,這一階段的主要特征有以下方面:圍繞知識體系邏輯,以圖書資源為基礎,以移動互聯(lián)網(wǎng)、云計算、大數(shù)據(jù)、語義分析等高新技術為支撐,以為用戶提供個性化、定制化、交互式的知識服務為新的產(chǎn)品形態(tài),呈現(xiàn)數(shù)據(jù)化出版和智能化出版態(tài)勢。
數(shù)字出版的數(shù)據(jù)化發(fā)展階段,催生了數(shù)據(jù)出版的新業(yè)態(tài)。數(shù)據(jù)出版是指以數(shù)據(jù)作為生產(chǎn)要素,將文字、圖片、音視頻、游戲、動漫等都當作數(shù)據(jù)的表現(xiàn)形式,其圍繞著數(shù)據(jù)挖掘、采集、標引、存儲、計算開展出版工作,通過數(shù)據(jù)模型的構建,最終上升到數(shù)據(jù)應用和數(shù)據(jù)服務的層面[4]。
3.5G技術的落地
2019年6月6日,工信部頒發(fā)了首張5G牌照,5G開始正式進入規(guī)模化商用階段。5G通信技術憑借高速率、泛在網(wǎng)、低功耗、低延時、高可靠和大容量等特點,將加速整個社會的智能化發(fā)展,開啟萬物互聯(lián)的智能媒體時代。毋庸置疑,數(shù)據(jù)出版領域也將發(fā)生巨大變革。5G時代,計算機的性能將更加強大,借助計算機對海量數(shù)據(jù)進行計算和挖掘已成為必然,幫助科研人員發(fā)現(xiàn)隱藏在紛繁數(shù)據(jù)之中的重要關聯(lián)關系,成為第四范式數(shù)據(jù)密集型科學研究的核心問題,而數(shù)據(jù)出版成為解決科學問題的關鍵。
隨著5G技術的落地,一方面,5G技術將驅(qū)動數(shù)據(jù)共享,在科學研究領域,只要開展科學研究活動,都將沒有選擇地被卷入到科學數(shù)據(jù)的主體隊伍中。在此背景下,有效調(diào)動作為產(chǎn)生科學數(shù)據(jù)、應用科學數(shù)據(jù)的科研人員的主動性、積極性,成為科學數(shù)據(jù)共享的關鍵。另一方面,5G技術將賦能數(shù)據(jù)出版,給數(shù)據(jù)共享帶來便利,優(yōu)化數(shù)據(jù)出版流程,使數(shù)據(jù)存儲、用戶引用更方便。
二、數(shù)據(jù)出版的主要流程和模式
數(shù)據(jù)出版與數(shù)據(jù)共享是相輔相成的關系,數(shù)據(jù)出版是促進數(shù)據(jù)共享的重要手段,數(shù)據(jù)共享是驅(qū)動數(shù)據(jù)出版的重要因素。對數(shù)據(jù)出版的研究最早始于2005年國外學者對數(shù)據(jù)共享和出版制度的關注,早期對數(shù)據(jù)出版的研究主要聚焦于數(shù)據(jù)出版的價值分析和實踐經(jīng)驗的介紹。在互聯(lián)網(wǎng)技術的推動下,數(shù)據(jù)出版實踐逐漸開展。不同實踐背景下,學者對數(shù)據(jù)出版的定義有所不同,在實踐過程中也總結了一套完整的數(shù)據(jù)出版流程和數(shù)據(jù)出版模式。此外,出版過程中的各種問題也隨之暴露,如數(shù)據(jù)的存儲問題、服務問題和引用問題等。
1.數(shù)據(jù)出版的定義
正如吉姆·格雷(Jim Gray)所說:“所有科學文獻都上網(wǎng),所有科學數(shù)據(jù)都上網(wǎng),而且它們之間具備可互操作性?!盵5](如圖1)數(shù)據(jù)出版業(yè)也需要將數(shù)據(jù)上傳到互聯(lián)網(wǎng),但并不是簡單地將數(shù)據(jù)上傳,而是需要學術出版的流程規(guī)范。雖然數(shù)據(jù)出版的研究已經(jīng)相對比較成熟,但不同研究背景的學者對數(shù)據(jù)出版的定義有著不同的理解。在學術界,學者的共識是數(shù)據(jù)出版就是與科學研究產(chǎn)生的數(shù)據(jù)有關的出版活動,但是針對該出版與科研論文出版是否一致,不同的學者有不同的觀點。劉闖等學者認為,該出版過程與科研論文發(fā)表過程相同,需要經(jīng)過同行專家評審方可正式出版,出版之后才能對科學數(shù)據(jù)成果引用與評價[6]。張小強等學者認為,數(shù)據(jù)出版是學術界新的出版形式,其出版與科研論文的出版不能完全等同,因為數(shù)據(jù)出版的過程中包括對科研數(shù)據(jù)及有關的信息進行評議和編輯[7]。還有些學者認為,數(shù)據(jù)出版與論文出版完全不同,是指將科研數(shù)據(jù)通過任何形式上傳到互聯(lián)網(wǎng)并允許其他使用的行為,其出版過程沒有科研論文出版那么正式。數(shù)據(jù)出版的不同定義在國內(nèi)外都有一定的代表性,這從側(cè)面反映了學界對數(shù)據(jù)出版概念存在爭議。
筆者認為,數(shù)據(jù)出版與科研論文出版既有相同之處也有不同之處。數(shù)據(jù)出版與科研論文的出版過程一樣嚴格,為了避免出現(xiàn)學術不端的行為,保障科學研究成果的知識產(chǎn)權,激勵更多的科學家參與數(shù)據(jù)出版,二者均需要經(jīng)過嚴格的審批才可出版。而數(shù)據(jù)出版區(qū)別于科研論文出版主要在于出版模式,數(shù)據(jù)出版模式相對多樣化,筆者將在下文闡述。
2.數(shù)據(jù)出版的主要流程
簡單來說,數(shù)據(jù)出版是指學者將科學研究生產(chǎn)的科學數(shù)據(jù),按照數(shù)據(jù)出版機構格式要求提交,專家從科學研究角度對所提交的數(shù)據(jù)進行審議,學者依據(jù)審議結果修改之后再次提交數(shù)據(jù),沒有問題之后,出版機構創(chuàng)建標準和永久的數(shù)據(jù)引用信息對數(shù)據(jù)進行存儲、發(fā)布,供其他學者引用。根據(jù)國內(nèi)外的數(shù)據(jù)出版實踐經(jīng)驗,數(shù)據(jù)出版主要流程歸結為以下五個基本環(huán)節(jié):數(shù)據(jù)生產(chǎn)、數(shù)據(jù)提交、數(shù)據(jù)審核、數(shù)據(jù)發(fā)布及數(shù)據(jù)引用,流程圖見圖2。
詳細流程說明如下:
(1)數(shù)據(jù)生產(chǎn)。在5G時代背景下,任何領域的科學研究均會產(chǎn)生大量的科研數(shù)據(jù),所以科學研究的過程就是數(shù)據(jù)生產(chǎn)的過程。數(shù)據(jù)生產(chǎn)的主力軍是科學研究者,輔以數(shù)據(jù)生產(chǎn)工具和平臺。
(2)數(shù)據(jù)提交,即學者將原始數(shù)據(jù)和科研過程產(chǎn)生的數(shù)據(jù),按數(shù)據(jù)出版機構格式要求以數(shù)據(jù)論文或解釋說明的形式上傳。例如,《中國科學數(shù)據(jù)》期刊要求學者在提交數(shù)據(jù)時提交數(shù)據(jù)用途、元數(shù)據(jù)、數(shù)據(jù)文件,要求學者在提交元數(shù)據(jù)時提交數(shù)據(jù)集標題、數(shù)據(jù)集作者、數(shù)據(jù)集關鍵詞、數(shù)據(jù)集摘要等基本信息。數(shù)據(jù)文件可以任何文件格式上傳,但只有200MB以內(nèi)的數(shù)據(jù)可直接上傳,否則需要使用FTP上傳。
(3)數(shù)據(jù)審核,又稱同行審議,是數(shù)據(jù)出版的關鍵步驟。避免出現(xiàn)數(shù)據(jù)造假和學術不端的行為是數(shù)據(jù)出版的重要目標,但數(shù)據(jù)質(zhì)量評估一直是難以解決的復雜問題。數(shù)據(jù)質(zhì)量并不是通過專家簡單瀏覽就能確定的,需要通過實驗的檢驗和應用,所以數(shù)據(jù)審核對專家的知識儲備和投入時間成本要求相對較高。
(4)數(shù)據(jù)發(fā)布。數(shù)據(jù)審核通過后,數(shù)據(jù)出版機構需要給數(shù)據(jù)賦予永久性的唯一標識符,包括DOI、URL等,并將數(shù)據(jù)公布出版平臺,同時對數(shù)據(jù)進行永久性存儲,最大限度地為其他學者對數(shù)據(jù)的引用提供可能。
(5)數(shù)據(jù)引用。數(shù)據(jù)出版的目的是數(shù)據(jù)共享,方便其他研究者對數(shù)據(jù)的復用,數(shù)據(jù)引用是數(shù)據(jù)出版的核心目標。更多的專著、論文、報告等形式研究成果以引用的方式引用已發(fā)布的數(shù)據(jù),需要數(shù)據(jù)出版機構、評審專家以及作者密切合作。
3.數(shù)據(jù)出版的模式
依據(jù)不同的劃分維度,數(shù)據(jù)出版的模式各有不同。本文從數(shù)據(jù)出版機構出發(fā),將數(shù)據(jù)出版模式主要劃分為兩種(見圖3):第一種是數(shù)據(jù)中心出版模式,將科學數(shù)據(jù)直接提交到數(shù)據(jù)中心;第二種是出版商出版模式,將科學數(shù)據(jù)以數(shù)據(jù)附屬于論文或論文附屬于數(shù)據(jù)的形式提交到期刊單位。
(1)數(shù)據(jù)中心出版模式。該模式下的數(shù)據(jù)中心是指具有數(shù)據(jù)存儲、數(shù)據(jù)發(fā)布功能的科研機構、大學或?qū)iT的數(shù)據(jù)存儲機構。數(shù)據(jù)中心的數(shù)據(jù)出版將數(shù)據(jù)和數(shù)據(jù)的描述信息存儲在同一服務器上,學者引用時數(shù)據(jù)與數(shù)據(jù)的描述信息將同步出現(xiàn),方便學者獲取數(shù)據(jù)。這種出版模式對數(shù)據(jù)規(guī)范性、數(shù)據(jù)質(zhì)量、數(shù)據(jù)格式、數(shù)據(jù)穩(wěn)定性及數(shù)據(jù)獨立性要求相對較高,但各數(shù)據(jù)中心的互操作性較差。比較典型的數(shù)據(jù)中心出版模式是全球變化科學研究數(shù)據(jù)出版系統(tǒng),該系統(tǒng)于2017年榮獲“聯(lián)合國世界信息峰會獎”,從2014年6月創(chuàng)辦至今,已有995位作者參與出版,共出版數(shù)據(jù)集656個、數(shù)據(jù)量258GB。數(shù)據(jù)出版中心出版模式是大部分學者的選擇。
(2)出版商出版模式,又可稱為期刊出版。該出版模式與傳統(tǒng)論文出版模式類似,主要由期刊出版單位負責數(shù)據(jù)質(zhì)量和學術質(zhì)量的把控。依據(jù)出版成果可分為數(shù)據(jù)附屬于論文、論文附屬于數(shù)據(jù)兩種形式。這種出版模式對數(shù)據(jù)規(guī)范性、數(shù)據(jù)質(zhì)量、數(shù)據(jù)格式、數(shù)據(jù)穩(wěn)定性及數(shù)據(jù)獨立性要求相對較弱,對上傳的數(shù)據(jù)容量有一定的限制。典型的期刊單位是《全球變化數(shù)據(jù)學報》,該學報是在全球變化科學研究數(shù)據(jù)出版系統(tǒng)的基礎上于2017年創(chuàng)辦的季刊,截至目前已發(fā)布數(shù)據(jù)論文245篇。出版商出版模式是少部分學者的選擇。
三、 5G對數(shù)據(jù)出版的新推動
5G構建了超寬帶、低延遲、高密度、高可靠、高可信的泛在計算與通信基礎設施,形成人、機、物三元融合的萬物互聯(lián)空間;5G為VR/AR、人工智能等技術的加速發(fā)展創(chuàng)造了條件,將人們對互聯(lián)網(wǎng)的體驗推向制高點,5G的問世和發(fā)展在互聯(lián)網(wǎng)信息時代是一座重要的里程碑。5G時代,互聯(lián)網(wǎng)體驗會更加豐富,海量數(shù)據(jù)存儲和智能化處理會更加便捷。具體到數(shù)據(jù)出版,5G技術將分別從數(shù)據(jù)庫存儲、數(shù)據(jù)共享及數(shù)據(jù)引用三方面產(chǎn)生新推動。
1.云數(shù)據(jù)庫助力數(shù)據(jù)存儲
1G時代依靠關系型數(shù)據(jù)庫滿足基本需求,2G時代開源數(shù)據(jù)庫產(chǎn)品初露鋒芒,3G時代非關系型數(shù)據(jù)庫應對數(shù)據(jù)暴增,4G時代“分布式+關系型”數(shù)據(jù)庫應對視頻存儲。5G時代,數(shù)據(jù)洪流隨即涌現(xiàn),人們對數(shù)據(jù)存儲和分析計算的需求將不斷提高,隨著云計算技術的不斷成熟,大部分應用將要部署到云上,云數(shù)據(jù)庫開始崛起。數(shù)據(jù)庫上云是必然趨勢,即云數(shù)據(jù)庫將成為5G時代數(shù)據(jù)存儲的關鍵。
據(jù)Gartner預測,5G時代,云數(shù)據(jù)庫將主導數(shù)據(jù)存儲市場,到2022年將會有75%的數(shù)據(jù)庫被部署或遷移到云平臺,只有5%的數(shù)據(jù)庫會繼續(xù)部署在內(nèi)部環(huán)境中。據(jù)相關數(shù)據(jù)統(tǒng)計,國內(nèi)領先的云服務廠商——阿里云目前已將40萬個數(shù)據(jù)庫成功遷移至云端。在數(shù)據(jù)出版中,從數(shù)據(jù)生產(chǎn)、存儲到引用的各個環(huán)節(jié),數(shù)據(jù)庫都至關重要。而5G環(huán)境下,云數(shù)據(jù)庫的重要性更是不言而喻,它將助力數(shù)據(jù)存儲,推動數(shù)據(jù)出版進一步發(fā)展。
當前,從事數(shù)據(jù)出版服務的數(shù)據(jù)中心或期刊出版單位大部分是通過自建數(shù)據(jù)庫的方式存儲數(shù)據(jù),根據(jù)存儲需求自行搭建數(shù)據(jù)庫、購買服務器、備份數(shù)據(jù)、修復安全漏洞及維護數(shù)據(jù)庫,需要耗費大量的人力和物力成本,但資源利用率依然很低,當多個用戶同時訪問同一數(shù)據(jù)庫時會出現(xiàn)阻塞現(xiàn)象。此外,缺乏統(tǒng)一的自建數(shù)據(jù)庫標準給各數(shù)據(jù)中心和期刊出版單位的數(shù)據(jù)共享帶來極大不便,對數(shù)據(jù)出版有一定的阻礙作用。5G時代,云數(shù)據(jù)庫存儲將解決自建數(shù)據(jù)庫遭遇的問題,在大量減少成本的同時,加強資源利用率,數(shù)據(jù)中心或期刊出版單位依據(jù)企業(yè)需求購置專業(yè)數(shù)據(jù)庫支持服務,可實現(xiàn)輕松部署,保障數(shù)據(jù)的高可靠性。同時,云數(shù)據(jù)庫存儲可為眾多數(shù)據(jù)倉儲庫建立鏈接提供便捷,實現(xiàn)以關聯(lián)數(shù)據(jù)的發(fā)布方式提高數(shù)據(jù)的可發(fā)現(xiàn)性[8],加強數(shù)據(jù)共享,助力數(shù)據(jù)存儲,提高數(shù)據(jù)出版商的出版積極性,為數(shù)據(jù)出版發(fā)展持續(xù)提供動力。
2.超高速驅(qū)動數(shù)據(jù)共享
相比4G,5G將以全新的網(wǎng)絡架構,提供至少十倍于4G的峰值速率、毫秒級的傳輸時延和千億級的連接能力,打開了一條更寬的移動通信之路。5G的目標是在所有地點提供無處不在的高數(shù)據(jù)速率連接——無論移動還是靜止,5G將允許用戶組訪問特定的數(shù)據(jù)。這意味著今后數(shù)據(jù)庫將有覆蓋廣泛多樣的傳輸系統(tǒng)、高速度的移動數(shù)據(jù)訪問能力。
據(jù)調(diào)查,相比歐美國家,現(xiàn)階段我國數(shù)據(jù)共享模式處于發(fā)展階段,作為科學數(shù)據(jù)的生產(chǎn)者、使用者和管理者——科研人員數(shù)據(jù)共享意愿相對低下。影響科研人員數(shù)據(jù)共享意愿的因素諸多,如個人背景、國家政策、共享成本、技術支撐及數(shù)據(jù)質(zhì)量等,其中,共享成本是關鍵因素之一。對科研數(shù)據(jù)進行共享需要占據(jù)科研人員原本就不充裕的時間,因此,有效解決數(shù)據(jù)共享成本是提高科研人員數(shù)據(jù)共享積極性的有效手段。
目前,不同數(shù)據(jù)出版商的數(shù)據(jù)上傳和下載方式不同,但對所上傳的數(shù)據(jù)容量都有一定限制。當數(shù)據(jù)量較大時,受網(wǎng)絡帶寬限制,上傳速度會相對較慢。數(shù)據(jù)上傳和下載實質(zhì)上是對數(shù)據(jù)庫的訪問,而影響數(shù)據(jù)庫訪問速度的因素有很多,其中,網(wǎng)絡速度是客觀因素之一,這可通過提高移動數(shù)據(jù)訪問的能力來優(yōu)化數(shù)據(jù)庫性能,進而節(jié)省數(shù)據(jù)上傳和下載所需的時間成本。5G技術的超高速移動數(shù)據(jù)訪問能力有效地解決了這一問題。超高速為數(shù)據(jù)上傳與下載節(jié)省成本,有效地提高了科研人員數(shù)據(jù)共享意愿,進而驅(qū)動數(shù)據(jù)共享,直接影響數(shù)據(jù)出版的發(fā)展。
3.VR出版加強數(shù)據(jù)引用
2016年被業(yè)界稱為“VR元年”,2019年被業(yè)界稱為“5G元年”,5G與VR強強聯(lián)合,必將重塑各個行業(yè)。VR出版通過將虛擬現(xiàn)實技術與傳統(tǒng)出版物相結合的方式實現(xiàn)出版,帶給讀者一種接觸式的閱讀體驗。VR出版物可以為人們提供全景式閱讀,帶來跨時空的閱讀體驗,讓讀者與作者、自然“對話”。5G技術的出現(xiàn)將給VR出版帶來革新。
VR技術應用數(shù)據(jù)出版的場景包括科學研究領域的數(shù)據(jù)建模、數(shù)據(jù)仿真等場景。科學研究是一項既復雜又困難的工作,其產(chǎn)生的科研數(shù)據(jù)相對比較抽象,需要一定的研究理論做支撐,這也是數(shù)據(jù)出版商要求提交數(shù)據(jù)描述的重要原因??茖W研究者如果想復用已出版的數(shù)據(jù),需要花費大量時間反復通讀數(shù)據(jù)描述、應用數(shù)據(jù)、推敲理論,但依然會出現(xiàn)數(shù)據(jù)誤用。VR出版可還原科研數(shù)據(jù)產(chǎn)生的整個過程以及數(shù)據(jù)產(chǎn)生的實驗效果,數(shù)據(jù)引用者通過瀏覽就能理解數(shù)據(jù)的真諦,節(jié)省大量成本??梢姡琕R出版可以加強數(shù)據(jù)引用,實現(xiàn)數(shù)據(jù)出版目標。
四、結語
數(shù)據(jù)出版作為一種數(shù)據(jù)共享機制,可推動數(shù)據(jù)共享、復用、挖掘增值服務,保障數(shù)據(jù)知識產(chǎn)權,影響社會科學創(chuàng)新。由于數(shù)據(jù)庫存儲困難、數(shù)據(jù)共享成本較大、數(shù)據(jù)引用復雜等因素,我國的數(shù)據(jù)出版仍處于發(fā)展階段,亟須加快數(shù)據(jù)出版的步伐。5G技術的落地,云數(shù)據(jù)庫助力數(shù)據(jù)存儲,超高速驅(qū)動數(shù)據(jù)共享,VR出版加強數(shù)據(jù)引用,有效解決了數(shù)據(jù)出版當前面臨的嚴峻問題,從根本上推動科學研究者參與數(shù)據(jù)共享的積極性,促進我國數(shù)據(jù)出版的快速發(fā)展。
|參考文獻|
[1]國際數(shù)據(jù)委員會2019年學術大會在京召開[EB/OL].(2019-11-22)[2019-11-25].http://www.scichi.cn/content.php?id=4443.
[2]張新新. 數(shù)字出版高端智庫建構綜述[J]. 科技與出版,2017(1):17-23
[3]黃鑫. 基于服務內(nèi)容的科學數(shù)據(jù)服務用戶滿意度研究[D]. 武漢:武漢大學博士學位論文,2017.
[4]廖文峰,張新新. 數(shù)字出版發(fā)展三階段論[J]. 科技與出版,2015(7):87-90.
[5]徐麗芳,叢挺. 數(shù)據(jù)密集、語義、可視化與互動出版:全球科技出版發(fā)展趨勢研究[J]. 出版科學,2012(4):73-80.
[6]劉闖. 論全球變化科學研究數(shù)據(jù)出版[J]. 地理學報,2014(1):1-3.
[7]張小強,李欣. 數(shù)據(jù)出版理論與實踐關鍵問題[J].中國科技期刊研究,2015(8):813-821.
[8]段青玉,王曉光.人文社科數(shù)據(jù)出版平臺FAIR原則應用調(diào)查研究[J].科技與出版,2019(4):6-11.