■劉 嫻
上海圖書館《圖書館雜志》編輯部,上海市靜安區(qū)長樂路746號 200040
在科學(xué)研究日趨全球化的背景下,開放、協(xié)作成為科研活動的常態(tài)??茖W(xué)數(shù)據(jù)的價值日益凸顯,科學(xué)數(shù)據(jù)開放與共享成為開放科學(xué)運動的重點,成為科技與教育、出版與傳播、圖書與情報等領(lǐng)域的重要議題[1]??茖W(xué)數(shù)據(jù)出版是落實科學(xué)數(shù)據(jù)建設(shè)規(guī)劃、推動科學(xué)數(shù)據(jù)開放共享的有效方式和重要手段,是推動科學(xué)數(shù)據(jù)共享的最根本途徑。
目前有關(guān)科學(xué)數(shù)據(jù)出版的研究主要聚焦于流程[2-3]、模式[4-6]、平臺[7-8]、政策[9-15]、質(zhì)量控制[16-18]、實踐探索[19-21]、問題與對策[22-25]、數(shù)據(jù)論文[26-27]等方面。從現(xiàn)有研究來看:理論研究較多,視角較為寬泛;對期刊的數(shù)據(jù)出版實踐研究較少,對國內(nèi)的數(shù)據(jù)出版實踐研究尤其不夠。我國科學(xué)數(shù)據(jù)出版主要發(fā)生在側(cè)重于實驗數(shù)據(jù)支撐的自然科學(xué)與工程技術(shù)領(lǐng)域,針對社會科學(xué)領(lǐng)域的數(shù)據(jù)出版以及數(shù)據(jù)平臺出版與服務(wù)實踐的研究不多??茖W(xué)數(shù)據(jù)作為科學(xué)研究的數(shù)據(jù)支撐,無論是對自然科學(xué)的實驗分析,還是對社會科學(xué)的實證研究都具有重要的價值[28]。
《圖書館雜志》是由上海市圖書館學(xué)會與上海圖書館聯(lián)合主辦的《中文核心期刊要目總覽》核心期刊、中國人文社會科學(xué)核心期刊、中國優(yōu)秀圖書館學(xué)期刊,在探索期刊的創(chuàng)新和融合發(fā)展方面一直走在行業(yè)的前列?!秷D書館雜志》的數(shù)據(jù)出版實踐作為建立較早的社會科學(xué)領(lǐng)域的數(shù)據(jù)出版案例在許多文獻[1,4,23,27]中都有介紹,但這些研究都是從《圖書館雜志》數(shù)據(jù)出版管理平臺[29]上得到的簡要信息,沒有詳細(xì)的第一手資料。本研究將從筆者供職的《圖書館雜志》具體案例出發(fā),全面論述平臺正式啟用以來的出版實踐,為我國社會科學(xué)學(xué)術(shù)期刊數(shù)據(jù)出版提供參考。
數(shù)據(jù)是圖書館的核心資產(chǎn)之一,圖書館正在經(jīng)歷數(shù)據(jù)化轉(zhuǎn)型,主要表現(xiàn)在圖書館實踐數(shù)據(jù)化、圖書館學(xué)研究數(shù)據(jù)化、圖書館學(xué)教育數(shù)據(jù)化。數(shù)據(jù)驅(qū)動正成為圖書館發(fā)展趨勢之一,影響圖書館事業(yè)的方方面面[30]。為了最大限度地利用這些數(shù)據(jù),《圖書館雜志》聯(lián)合復(fù)旦大學(xué)大數(shù)據(jù)研究院人文社會科學(xué)數(shù)據(jù)研究所,于2016年啟動了數(shù)據(jù)出版管理平臺(圖1)研究項目,該項目是國內(nèi)社會科學(xué)領(lǐng)域“期刊論文+數(shù)據(jù)論文+數(shù)據(jù)平臺”的典型代表,即傳統(tǒng)學(xué)術(shù)期刊在出版專業(yè)學(xué)術(shù)論文的同時,也出版數(shù)據(jù)論文,并將支撐專業(yè)學(xué)術(shù)論文結(jié)論的數(shù)據(jù)和數(shù)據(jù)論文描述的數(shù)據(jù)在自建的數(shù)據(jù)管理平臺上出版。
圖1 《圖書館雜志》數(shù)據(jù)出版管理平臺首頁
圖2 《圖書館雜志》數(shù)據(jù)管理平臺結(jié)構(gòu)圖
《圖書館雜志》數(shù)據(jù)出版管理平臺吸納了哈佛-麻省理工數(shù)據(jù)中心采用的核心技術(shù)框架及規(guī)范,參考國際元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范DDI(Data Documentation Initiative)、DataCite的數(shù)據(jù)引證規(guī)范搭建了既與國際標(biāo)準(zhǔn)接軌又符合國內(nèi)期刊出版現(xiàn)狀的數(shù)據(jù)出版管理平臺。
《圖書館雜志》數(shù)據(jù)出版管理平臺采用全球數(shù)據(jù)管理領(lǐng)域先進的B/S架構(gòu),后臺使用Java語言,前臺使用HTML5、CSS3、ES5/6等語言,以NODEJS為代理并通過AJAX技術(shù)與后臺通信。數(shù)據(jù)庫選用具有清晰的數(shù)據(jù)存儲層、業(yè)務(wù)邏輯層、應(yīng)用層和人機交互層等邏輯結(jié)構(gòu)的POSTGRESQL,實現(xiàn)數(shù)據(jù)管理、使用、展現(xiàn)、搜索等功能,支持未來接入大數(shù)據(jù)服務(wù)引擎[31]。此外,平臺采用了目前成熟的企業(yè)級框架——JSF+EJB+JPA,具有收縮性和可擴展性。
《圖書館雜志》數(shù)據(jù)管理平臺的功能設(shè)計框架見圖2。
服務(wù)展示層:展示上海圖書館《圖書館雜志》數(shù)據(jù)管理平臺的服務(wù),由期刊數(shù)據(jù)管理平臺和門戶網(wǎng)站組成。
功能模塊層:提供《圖書館雜志》數(shù)據(jù)管理平臺的基本功能,包括期刊數(shù)據(jù)管理、期刊數(shù)據(jù)引證、期刊數(shù)據(jù)監(jiān)護、數(shù)據(jù)分析、數(shù)據(jù)權(quán)限管理、數(shù)據(jù)瀏覽與檢索、數(shù)據(jù)收割、版本管理、數(shù)據(jù)導(dǎo)航、通知公告管理、資源檢索、數(shù)據(jù)精選等[31]。
技術(shù)支撐層:平臺底層軟件技術(shù)支持由身份認(rèn)證集成、Handle引證系統(tǒng)、CMS系統(tǒng)、數(shù)據(jù)分析系統(tǒng)構(gòu)成,為應(yīng)用系統(tǒng)各功能模塊提供通用技術(shù)支持,支持統(tǒng)一身份認(rèn)證的接入、權(quán)限校驗、數(shù)據(jù)上傳下載、數(shù)據(jù)多維度分析等功能。
基礎(chǔ)設(shè)施層:為平臺運行的IDC等服務(wù)器和網(wǎng)絡(luò)設(shè)備等硬件環(huán)境。在云環(huán)境下,也可以支持云架構(gòu),為上層服務(wù)提供穩(wěn)定、安全、高速的運行環(huán)境。
數(shù)據(jù)規(guī)范和使用條款:為保證《圖書館雜志》數(shù)據(jù)管理平臺的良好運轉(zhuǎn)提供了配套的數(shù)據(jù)管理標(biāo)準(zhǔn)規(guī)范和制度保障。
《圖書館雜志》數(shù)據(jù)出版管理平臺對存儲在該平臺的數(shù)據(jù)提供數(shù)據(jù)分級管理、數(shù)據(jù)引證、數(shù)據(jù)描述、數(shù)據(jù)分析、數(shù)據(jù)權(quán)限管理、數(shù)據(jù)瀏覽、數(shù)據(jù)檢索、數(shù)據(jù)共享、版本管理、數(shù)據(jù)導(dǎo)航等服務(wù)[32],詳見表1。
表1 《圖書館雜志》數(shù)據(jù)管理平臺提供的服務(wù)功能
《圖書館雜志》數(shù)據(jù)出版管理平臺支持富媒體數(shù)據(jù)、支撐數(shù)據(jù)、數(shù)據(jù)論文、已發(fā)表論文獨立數(shù)據(jù)4種數(shù)據(jù)出版類型(表2)。作者在數(shù)據(jù)平臺上提交數(shù)據(jù)和描述信息,獲取handle號(數(shù)字資源全球唯一標(biāo)識符),實現(xiàn)數(shù)據(jù)出版[32]。
(1) 富媒體數(shù)據(jù)出版。對于論文中包含較多圖片、表格或者有相關(guān)音頻、視頻等富媒體文件的論文,必要圖片、表格隨論文出版,拓展閱讀的圖片、表格、音頻、視頻在數(shù)據(jù)出版管理平臺增強出版。將handle號附在文末,同時制作二維碼,放在標(biāo)題右側(cè),供讀者掃碼讀取。
(2) 支撐論文研究結(jié)論的數(shù)據(jù)出版。支撐論文研究結(jié)論的數(shù)據(jù)包括但不限于原始數(shù)據(jù),處理后的數(shù)據(jù)、軟件、算法、協(xié)議、方法、材料等。將數(shù)據(jù)上傳到平臺時生成的handle號附在紙刊文末,供同行專家評審,出版后供其他研究者查閱、評價或引用。
(3) 數(shù)據(jù)論文出版。數(shù)據(jù)論文描述的是某一個數(shù)據(jù)集,給出數(shù)據(jù)收集、處理過程、軟件工具、文件格式等細(xì)節(jié)描述[33]。數(shù)據(jù)論文發(fā)表在紙刊上,以幫助讀者更好地獲取、理解和使用數(shù)據(jù)。數(shù)據(jù)論文描述的數(shù)據(jù)集在數(shù)據(jù)出版管理平臺出版,論文與數(shù)據(jù)之間通過handle號關(guān)聯(lián)?!秷D書館雜志》數(shù)據(jù)論文結(jié)構(gòu)詳見1.6節(jié)。
(4) 獨立數(shù)據(jù)出版。為促進更多的數(shù)據(jù)共享復(fù)用,避免數(shù)據(jù)外流,《圖書館雜志》鼓勵研究者將已在國內(nèi)外期刊發(fā)表的研究論文中的研究數(shù)據(jù)、數(shù)據(jù)集另行投到該刊的數(shù)據(jù)出版管理平臺,數(shù)據(jù)審核通過后作為研究數(shù)據(jù)成果單獨錄用發(fā)表,并與原論文出處或地址相互關(guān)聯(lián)[34]。
表2 4種數(shù)據(jù)出版類型比較分析
《圖書館雜志》在廣泛調(diào)研國內(nèi)外數(shù)據(jù)論文格式的基礎(chǔ)上,結(jié)合圖情專業(yè)學(xué)術(shù)論文的特征,設(shè)置了該刊的數(shù)據(jù)論文結(jié)構(gòu)框架,包括數(shù)據(jù)論文基本信息、數(shù)據(jù)集信息、輔助信息(表3)。可以看到,該數(shù)據(jù)論文框架具有較好的規(guī)范性和統(tǒng)一性?!秷D書館雜志》在官網(wǎng)為作者提供數(shù)據(jù)論文模板,供作者下載參考。
表3 《圖書館雜志》數(shù)據(jù)論文結(jié)構(gòu)框架
(1) 數(shù)據(jù)提交政策。在國際學(xué)術(shù)出版界,許多出版商鼓勵或要求作者上傳數(shù)據(jù)、提供數(shù)據(jù)可用性聲明,并在論文中引用數(shù)據(jù)集?!秷D書館雜志》鼓勵作者在論文投稿階段提交數(shù)據(jù),并要求其在論文錄用階段提交數(shù)據(jù);鼓勵或要求作者將高清晰度的富媒體格式文件和數(shù)據(jù)集上傳到數(shù)據(jù)出版管理平臺,同時將上傳后的數(shù)據(jù)handle地址添加至文末。
(2) 數(shù)據(jù)評審政策。數(shù)據(jù)評審內(nèi)容包括研究原創(chuàng)性、獨特性,數(shù)據(jù)真實性、可用性,數(shù)據(jù)與數(shù)據(jù)論文的一致性等維度,數(shù)據(jù)評審流程包括責(zé)任編輯初審、數(shù)據(jù)編輯初審、同行評審、責(zé)任編輯復(fù)審、主編終審等環(huán)節(jié),嚴(yán)格把控數(shù)據(jù)的質(zhì)量和可用性。
(3) 數(shù)據(jù)共享政策?!秷D書館雜志》制定了分類分級、逐步加強的數(shù)據(jù)共享政策;倡導(dǎo)作者共享數(shù)據(jù),采用Creative Commons系列知識共享許可協(xié)議,包括CC0 和CC-BY 4.0,在保障作者知識產(chǎn)權(quán)的基礎(chǔ)上促進數(shù)據(jù)的完全公開共享[19]。
(4) 數(shù)據(jù)保護政策。嚴(yán)格遵守相關(guān)法律和行業(yè)標(biāo)準(zhǔn)(引用規(guī)范)。為確保數(shù)據(jù)訪問安全,控制訪問數(shù)據(jù)的用戶以及用戶可訪問的數(shù)據(jù)內(nèi)容范圍,按角色對數(shù)據(jù)訪問設(shè)置了3種不同程度的權(quán)限管理,即任何人可以訪問、授權(quán)用戶可以訪問或者完全保密。系統(tǒng)平臺遵循國際標(biāo)準(zhǔn)規(guī)范,采取相應(yīng)的技術(shù)方案來保證安全性、可靠性、可用性和擴展性。
《圖書館雜志》數(shù)據(jù)出版管理平臺與以復(fù)旦大學(xué)大數(shù)據(jù)研究院人文社會科學(xué)數(shù)據(jù)研究所、復(fù)旦大學(xué)圖書館張計龍等為代表的學(xué)術(shù)團隊合作,他們在科學(xué)數(shù)據(jù)出版理論研究和實踐探索上走在圖情界的前列。團隊人員既有圖情領(lǐng)域的專家,又有經(jīng)驗豐富的平臺設(shè)計技術(shù)人員,這就使得《圖書館雜志》數(shù)據(jù)出版管理平臺的起點較高。
由于數(shù)據(jù)出版在提高研究過程透明度、增加論文可信度、提升作者學(xué)術(shù)影響力、提高作者學(xué)術(shù)信譽方面具有前所未有的優(yōu)勢,這一新型出版模式得到作者的廣泛認(rèn)同和支持,作者上傳數(shù)據(jù)的積極性越來越高。平臺提供數(shù)據(jù)發(fā)布規(guī)范與數(shù)據(jù)論文格式模板,采用同行評議并提供審核標(biāo)準(zhǔn),提供數(shù)據(jù)出版生命周期管理,所發(fā)布數(shù)據(jù)具有“來源可靠、質(zhì)量可信、公開發(fā)布、公共利用、唯一標(biāo)識、知識產(chǎn)權(quán)清晰、可正式引用”[35]等特征,還重視作者需求和拓展服務(wù)、加強宣傳擴大影響力。多管齊下的數(shù)據(jù)政策使得平臺數(shù)據(jù)的質(zhì)和量有了一定的保障,行業(yè)影響力較大,平臺的實踐案例經(jīng)常被學(xué)者作為社科領(lǐng)域的出版平臺代表與國內(nèi)外相關(guān)平臺進行對照研究就是很好的證明。
《圖書館雜志》紙刊在2018年第8期開設(shè)“數(shù)據(jù)論文”欄目,刊發(fā)兩篇數(shù)據(jù)論文——復(fù)旦大學(xué)大數(shù)據(jù)研究院人文社會科學(xué)數(shù)據(jù)研究所殷沈琴、張計龍、汪東偉等的《2015年復(fù)旦大學(xué)師生中文電子期刊資源訪問行為數(shù)據(jù)集》和汪東偉、伏安娜、張計龍等的《2016年復(fù)旦大學(xué)自然科學(xué)領(lǐng)域中文電子期刊資源訪問數(shù)據(jù)集》, 同時在數(shù)據(jù)出版管理平臺發(fā)布了這兩篇數(shù)據(jù)論文的數(shù)據(jù)集,有效地促進了科學(xué)數(shù)據(jù)的傳播和復(fù)用。截止到2022年4月6日,《2015年復(fù)旦大學(xué)師生中文電子期刊資源訪問行為數(shù)據(jù)集》被下載了30180次。這兩篇數(shù)據(jù)論文給其他研究者提供了很好的樣本,為《圖書館雜志》吸引了來自廈門大學(xué)圖書館、浙江大學(xué)圖書館、浙江理工大學(xué)圖書館等單位作者的投稿。截至2022年4月6日,數(shù)據(jù)出版管理平臺的訪問量為1100312人次, 數(shù)據(jù)集的均篇下載量為9506次。
《圖書館雜志》數(shù)據(jù)出版管理平臺在業(yè)界具有一定的影響力,但是與歐美發(fā)達國家的數(shù)據(jù)出版管理平臺相比還存在差距。
出版的數(shù)據(jù)論文數(shù)量占比不高,數(shù)據(jù)出版與學(xué)術(shù)期刊融合發(fā)展的深度和廣度還有待進一步提高??蒲腥藛T為了更好地適應(yīng)數(shù)據(jù)密集型科研范式的學(xué)術(shù)生態(tài),有著迫切的數(shù)據(jù)管理與利用的培訓(xùn)需求?!秷D書館雜志》可以抓住這一機遇,與圖情檔行業(yè)期刊如《圖書情報工作》合作,共同舉辦數(shù)據(jù)論文寫作與投稿研修班,對數(shù)據(jù)提交規(guī)范和論文寫作進行指導(dǎo),以便研究人員更好地掌握數(shù)據(jù)論文這一新型的寫作模式,提高科研人員的數(shù)據(jù)素養(yǎng),增加研究人員寫作數(shù)據(jù)論文的積極性和規(guī)范性。
數(shù)據(jù)評審是數(shù)據(jù)質(zhì)量控制的重要方法,數(shù)據(jù)評審能夠激勵科研人員開拓新的研究途徑,提高科技成果轉(zhuǎn)化的效率,使科研數(shù)據(jù)具有更高的重用價值[36]。數(shù)據(jù)論文的內(nèi)容和結(jié)構(gòu)不同于學(xué)術(shù)論文主流的IMRaD結(jié)構(gòu),同行評議審查數(shù)據(jù)的標(biāo)準(zhǔn)也與傳統(tǒng)學(xué)術(shù)論文存在差異,《圖書館雜志》數(shù)據(jù)以及數(shù)據(jù)論文的評審標(biāo)準(zhǔn)還不夠細(xì)化,要探索規(guī)范、多元的評審標(biāo)準(zhǔn),幫助評審專家從數(shù)據(jù)內(nèi)容的完整性、科學(xué)性、可信度、可重用性等方面提出準(zhǔn)確、有效的審稿意見,從而規(guī)范數(shù)據(jù)論文的審稿流程,確保數(shù)據(jù)集的可靠性。
《圖書館雜志》設(shè)立了數(shù)據(jù)編輯崗位進行平臺日常維護,為作者提供在線幫助。對投稿數(shù)據(jù)從形式上進行審核,對數(shù)據(jù)的時效性、客觀性、真實性等進行初步評估。對于富媒體數(shù)據(jù)、支撐論文結(jié)論的數(shù)據(jù)以及數(shù)據(jù)論文描述的數(shù)據(jù),在論文正式刊發(fā)時檢驗論文與數(shù)據(jù)鏈接準(zhǔn)確與否。平臺維護與數(shù)據(jù)初審工作量大,技術(shù)要求高,但編輯部的數(shù)據(jù)編輯人員不足,要聘請國內(nèi)外知名數(shù)據(jù)管理和數(shù)據(jù)技術(shù)專家,籌建數(shù)據(jù)出版編輯部。
相較于國際上比較成熟的數(shù)據(jù)出版,目前國內(nèi)的數(shù)據(jù)出版還存在明顯差距,缺乏成熟的科學(xué)數(shù)據(jù)出版管理平臺是主要問題之一?!秷D書館雜志》建立的數(shù)據(jù)出版管理平臺是社會科學(xué)領(lǐng)域期刊的創(chuàng)新探索。該平臺技術(shù)含量高、功能齊全、數(shù)據(jù)論文結(jié)構(gòu)規(guī)范、數(shù)據(jù)政策較為完備,在國內(nèi)期刊界具有一定的影響力,也具備與國際數(shù)據(jù)出版接軌的基礎(chǔ),但也存在數(shù)據(jù)論文數(shù)量占比較低、數(shù)據(jù)評審機制有待規(guī)范、數(shù)據(jù)出版團隊建設(shè)有待加強等問題,還有較大的提升空間。需要借鑒國內(nèi)外出版機構(gòu)的先進數(shù)據(jù)出版經(jīng)驗,完善《圖書館雜志》的數(shù)據(jù)出版機制和運行模式,更好地服務(wù)科研群體;爭取在國際主流數(shù)據(jù)倉儲平臺如Re3data[37]上進行注冊、認(rèn)證與索引,吸引更多的研究人員上傳數(shù)據(jù);進一步提升數(shù)據(jù)管理與傳播的有效性、增加數(shù)據(jù)利用與重用的規(guī)范性、提高數(shù)據(jù)傳播的國際影響力。
爭取持續(xù)的資金支持是平臺發(fā)展的強大物質(zhì)基礎(chǔ)??茖W(xué)數(shù)據(jù)出版涉及科學(xué)數(shù)據(jù)的采集、組織、存檔、發(fā)布、共享、開放等一系列活動,這些活動涉及的人員、設(shè)備、維保等必然產(chǎn)生相應(yīng)的成本,而且隨著數(shù)據(jù)量的不斷累積,需要增加相應(yīng)的人員和設(shè)備,這就形成了長期的不斷增長的科學(xué)數(shù)據(jù)管理成本[38]。目前數(shù)據(jù)出版平臺的資金來源主要是上海市新聞出版局的專項基金和上海圖書館的配套資金,在上述項目資助結(jié)束后爭取新的資金支持是平臺可持續(xù)發(fā)展的基本保障。
在優(yōu)化出版管理團隊、規(guī)范數(shù)據(jù)評議方式與標(biāo)準(zhǔn)、培養(yǎng)科研人員的數(shù)據(jù)素養(yǎng)等方面還要持續(xù)發(fā)力,制定更加詳細(xì)的多層次科研數(shù)據(jù)政策,使得開放科學(xué)數(shù)據(jù)具有更強的可操作性。
本研究對《圖書館雜志》數(shù)據(jù)出版管理平臺及其實踐進行了全景式掃描,為社會科學(xué)領(lǐng)域的數(shù)據(jù)出版提供參考。個案的研究難以概觀行業(yè)現(xiàn)狀,以此實踐為基礎(chǔ),與國外的同類期刊如Wiley旗下期刊《美國情報學(xué)會會刊》(JournaloftheAmericanSocietyforInformationScience)進行對比討論是未來的研究方向。
致謝衷心感謝《圖書館雜志》數(shù)據(jù)出版管理平臺方案設(shè)計工程師沈聰和數(shù)據(jù)編輯談潔在本文寫作過程中給予的大力支持!