周 陽
(中國藥科大學圖書與信息中心,江蘇 南京 211198)
預印本(Preprint)一般指科研成果正式出版前,本著自愿原則,出于同行交流目的,先通過互聯(lián)網(wǎng)發(fā)布的文章。預印本的優(yōu)勢主要體現(xiàn)在:1)可避免因?qū)徃迦似妼е鲁晒麩o法被廣泛知曉;2)傳播速度快;3)可獲得修改建議,使作者完善成果,提高發(fā)表率;4)提供首發(fā)證明,保護首創(chuàng)權(quán)益。
本研究主要采用網(wǎng)站調(diào)研的方式,選取當今國內(nèi)外10個較為知名且覆蓋多個不同學科的預印本系統(tǒng)作為調(diào)研樣本進行調(diào)研:arXiv、ChemRxiv、bioRxiv、medRxiv、engrXiv、SocArXiv、PsyArXiv、LawArXiv、MDPI Preprints、ChinaXiv。此次調(diào)研內(nèi)容主要包括:運營管理、資金來源、平臺軟件、組織檢索、資源內(nèi)容、使用統(tǒng)計、存儲政策、共享政策、質(zhì)量控制、學術(shù)服務、人員配置、宣傳推廣等方面。ChinaXiv是目前我國較知名的預印本系統(tǒng),它代表了我國預印本系統(tǒng)目前的狀況,將其與國外預印本系統(tǒng)放在一起調(diào)研比較,能夠?qū)⑽覈A印本系統(tǒng)目前的優(yōu)劣處更凸顯出來,對提出我國預印本系統(tǒng)進一步發(fā)展的策略參考更有幫助。
運營管理關(guān)乎預印本系統(tǒng)的頂層設計,資金來源又是預印本系統(tǒng)的構(gòu)建基石,這是預印本系統(tǒng)最不可或缺的兩個方面。調(diào)研樣本的運營管理與資金來源情況詳見表1。
表1 預印本系統(tǒng)運營管理與資金來源情況
續(xù)表1
arXiv運營管理主要有4個團隊:1)科學委員會,由科研人員組成,提供政策建議;2)成員委員會,由成員機構(gòu)組成,就業(yè)務規(guī)劃等問題投票表決:貢獻組織(至少7個)、高貢獻組織(最多5個)、西蒙斯基金會(1個),此外還有5名無表決權(quán)成員;3)技術(shù)委員會,負責審查和討論技術(shù)決策;4)康奈爾行政工作人員。bioRxiv顧問委員會委員主要來自Cold Spring Harbor Laboratory、Google、American Society for Microbiology、Harvard、HighWire Press等機構(gòu)。ChemRxiv、engrXiv、SocArXiv、PsyArXiv、LawArXiv、MDPI Preprints也是如此,可見,設顧問委員會(科學委員會或指導委員會)是當下預印本系統(tǒng)較普遍的管理方式,且委員多來自學科內(nèi)權(quán)威機構(gòu),包括高校、圖書館、實驗室、公司、研究機構(gòu)、出版社、聯(lián)盟協(xié)會等,數(shù)量從幾人到上百人,職責是為預印本系統(tǒng)決策提供建議。由表1可知,預印本系統(tǒng)的主要資金來源有:運營機構(gòu)、基金會、會員機構(gòu)、捐贈、公司企業(yè)、合作組織等。
運營管理上,ChinaXiv和大多數(shù)受調(diào)研的系統(tǒng)一樣也設科學咨詢委員會和用戶咨詢委員會,且委員也是來自中國科學院、國內(nèi)知名高校和圖書館的專家。資金來源上,ChinaXiv是唯一一個靠政府撥款運營的預印本系統(tǒng),其優(yōu)勢是資金來源穩(wěn)定可靠,但資金來源過于單一、廣泛性不強,社會其他機構(gòu)的參與度也較低,且政府撥款的資金在使用靈活度上有一定的制約。
平臺軟件是預印本系統(tǒng)重要的“硬件配置”。調(diào)研樣本中除了LawArXiv和ChinaXiv,其余8個都涉及GitHub平臺。GitHub是一個基于Git的代碼托管平臺,于2008年4月正式上線,目前在GitHub上托管的代碼包已超1億個。10個受調(diào)研的系統(tǒng)中還有4個是基于Open Science Framework Preprints平臺構(gòu)建的,如engrXiv、SocArXiv、PsyArXiv、LawArXiv。Open Science Framework Preprints的主要推動者是Center for Open Scinece組織,該平臺可提供免費存儲空間,且無容量限制,還自帶版本控制,可實現(xiàn)多人遠程協(xié)作,如創(chuàng)建一個project可添加多人編輯權(quán)限,還可關(guān)注其他project,也可與其他平臺對接。ChemRxiv基于 Figshare平臺構(gòu)建,英國Macmillian出版公司的分支機構(gòu)Digital Science負責對Figshare提供資金、技術(shù)支持與功能優(yōu)化,開放的存儲空間不設限,且為注冊用戶提供20GB個人存儲空間,單個文件最大支持5GB,支持科研成果快速被引用、共享與發(fā)現(xiàn)。
組織檢索是預印本系統(tǒng)重要的“軟件配置”。調(diào)研樣本中engrXiv、SocArXiv、PsyArXiv、LawArXiv使用的是較常見的檢索途徑:學科主題、題名、關(guān)鍵詞、日期;ChemRxiv與前面4個預印本系統(tǒng)相比,將學科主題替換成開放許可;arXiv檢索途徑最多,除了上述4種常用途徑,還有作者、評論、參考文獻、文章號、arXiv標識符、數(shù)字對象唯一標識符(DOI)、開放研究者與貢獻者身份識別碼(ORCID)、arXiv作者ID;bioRxiv、medRxiv也有DOI檢索,除常用的4個途徑,還新增作者、摘要、全文檢索和資源格式;MDPI Preprints 也有DOI檢索,除了上述常用的4個途徑,還新增作者、摘要、文獻類型和匹配度。
ChinaXiv的構(gòu)建平臺是EPrints。EPrints由南安普頓大學開發(fā),是目前國際上存儲庫構(gòu)建的主要系統(tǒng)平臺之一,其團隊也提供軟件的托管、培訓與咨詢等相關(guān)服務,最新版本為EPrints3.4。EPrints平臺的OAI兼容性較強,ChinaXiv基于OAI協(xié)議支持第三方在遵循CC BY 3.0許可的前提下,提供有效的OAI-PMH 2.0(開放存儲先導計劃元數(shù)據(jù)收割協(xié)議)開放接口,將ChinaXiv平臺文章的OAI-DC元數(shù)據(jù)及應用嵌入第三方平臺,如中科院文獻情報中心集成檢索平臺等。檢索途徑上,ChinaXiv在4種基本檢索途徑的基礎上還增加了作者、摘要、分類和論文號。此外,為方便用戶實現(xiàn)多途徑檢索,ChinaXiv還可以繼續(xù)增加檢索途徑,如DOI、ORCID等。
如果系統(tǒng)平臺是“骨架”,那資源內(nèi)容就是“血肉”。資源內(nèi)容的調(diào)研主要從學科范圍、存儲數(shù)量和資源類型三方面著手(涉及數(shù)據(jù)截止日期為2020年9月16日)。
資源的學科劃分:1)“主學科+細分學科”或研究主題,如arXiv的“物理學+天體物理學”等13個細分學科或研究主題;MDPI Preprints的“藝術(shù)與人文+語言學”等15個細分學科或研究主題。2)學科分類和研究主題混合組織在一起,如ChemRxiv主要是化學學科的無機化學等24個細分學科或研究主題;bioRxiv主要是生物學的古生物學等27個細分學科或研究主題;medRxiv主要是醫(yī)藥學科的成癮藥物等51個細分學科或研究主題;SocArXiv主要是社會科學類的教育類等4個細分學科或研究主題;PsyArXiv主要是心理學的臨床心理學等10個細分學科或研究主題;LawArXiv主要是法學的商法等10個細分學科或研究主題。3)按研究主題組織,如engrXiv涵蓋研究主題如建筑工程等22個。
資源數(shù)量百萬級的只有arXiv(1 762 888 份);資源數(shù)量萬級的有4個:bioRxiv(96 838 份)、MDPI Preprints(16 286 份)、PsyArXiv(11 476 份)、medRxiv(10 977 份);資源數(shù)量千級的有4個:SocArXiv(6 269 份)、ChemRxiv(6 060 份)、LawArXiv(1 319 份)、engrXiv(1 233 份)。資源類型主要是尚未發(fā)表的學術(shù)論文,而 SocArXiv還存儲一些工作論文、已發(fā)表論文、數(shù)據(jù)和代碼;ChemRxiv還存儲一些數(shù)據(jù)集和在線資源。
數(shù)據(jù)統(tǒng)計是對資源內(nèi)容建設情況的一個考核指標,主要從“資源上傳”和“資源使用”兩個方面進行統(tǒng)計(涉及數(shù)據(jù)截止日期為2020年9月18日)?!百Y源上傳情況統(tǒng)計”是以“作者”為切入點,主要包括作者發(fā)文統(tǒng)計、作者機構(gòu)統(tǒng)計、作者提交時間及作者發(fā)文主題等:1)統(tǒng)計發(fā)文作者的系統(tǒng)有1個:MDPI Preprints 有作者數(shù)量統(tǒng)計 61 193 人;2)統(tǒng)計作者提交時間的系統(tǒng)有4個:arXiv有每月提交總量統(tǒng)計,bioRxiv和medRxiv可選擇不同年份或月份查看上傳資源,MDPI Preprints有最新上傳的3篇文章展示。“資源使用情況統(tǒng)計”是以“用戶”為切入點,調(diào)研的10個系中有7個系統(tǒng)提供用戶使用資源情況統(tǒng)計:arXiv有日使用統(tǒng)計、月下載統(tǒng)計、每年會員機構(gòu)使用量排名;ChemRxiv每篇文章都有點擊、下載和引用量統(tǒng)計,默認提供一周點擊和下載量統(tǒng)計,也有月和年下載量統(tǒng)計、總點擊和總下載量統(tǒng)計,還有點擊量最高的前10篇論文展示,以及從哪個網(wǎng)站鏈接到本站次數(shù)排行;engrXiv、SocArXiv、PsyArXiv、LawArXiv每篇文章都有下載量統(tǒng)計;MDPI Preprints有月點擊量統(tǒng)計。
ChinaXiv的學科劃分雖然沒有“‘主學科+細分學科’或研究主題”那么細致,但是將學科分類和研究主題分成兩個組織方式,學科方式主要有生物學等28個學科分類,研究主題方式主要有核物理學等17個研究主題。將“學科”與“研究主題”分開,而不是混合組織在一起,不但增加了用戶瀏覽的途徑,也讓資源呈現(xiàn)更清晰。ChinaXiv的資源數(shù)量也達到萬級(14 002 份),在所有調(diào)研樣本中排第四,與排第一達百萬級的arXiv相比,其存儲量上還有很大的提升空間。和大部分調(diào)研的系統(tǒng)一樣,ChinaXiv的資源類型的存儲都是學術(shù)論文預印本,為吸收更多的學術(shù)資源,也可適當放寬資源類型的要求?!百Y源上傳情況統(tǒng)計”方面,ChinaXiv是最全的,涵蓋:1)作者發(fā)文統(tǒng)計:列出前99位的作者發(fā)文數(shù)量;2)作者機構(gòu)統(tǒng)計:列出前99個機構(gòu)發(fā)文數(shù)量;3)作者提交時間:有最新提交統(tǒng)計;4)作者發(fā)文主題:有每個主題的資源量統(tǒng)計。用戶“使用情況統(tǒng)計”方面,ChinaXiv的每篇文章都有點擊、下載量統(tǒng)計,可根據(jù)點擊、下載量排序,ChinaXiv還側(cè)重在對“資源使用”的統(tǒng)計,并沒有對“用戶行為”進行統(tǒng)計,可參考arXiv增加對用戶的統(tǒng)計,如年下載量機構(gòu)排名、地區(qū)排名等,亦可參考ChemRxiv統(tǒng)計用戶從哪個網(wǎng)站鏈接到ChinaXiv,通過分析用戶行為,優(yōu)化自身平臺設計。
存儲政策與共享政策是從“資源提交”和“資源共享”兩個方面對系統(tǒng)存儲的預印本資源進行規(guī)范。
存儲政策主要是從提交格式、提交時間、提交方式、提交要求、修改刪除和版權(quán)政策進行規(guī)范:1)提交格式。arXiv要求PDF、JPEG、PNG、GIF格式;bioRxiv、medRxiv、engrXiv、SocArXiv、PsyArXiv、LawArXiv要求存儲的手稿為一個包含文本、圖表的PDF、Word、Latex或WPS文件,補充數(shù)據(jù)單獨提交;ChemRxiv要求PDF格式,英文語種且文件大小不超過5GB;bioRxiv、medRxiv也明確要求英文語種。2)提交時間。arXiv規(guī)定標準時區(qū)14:00前提交的文檔,當天20:00可公開,也可能審核延遲,周五、周六不公開。3)提交方式。arXiv要求作者自行提交,如由第三方提交須是在作者書面確認的前提下。4)提交要求。arXiv、ChemRxiv、bioRxiv要求提交的文檔真實準確,符合學術(shù)交流公認標準的主題性和可評審性,不得侵犯任何實體的任何權(quán)利;engrXiv、SocArXiv、PsyArXiv、LawArXiv要求不得上傳有害計算機代碼。5)修改刪除。bioRxiv、medRxiv、SocArXiv、PsyArXiv、MDPI Preprints規(guī)定可提交修改版,但修改版與原版使用相同DOI號,都可公開,補充資料必須隨附于每一個版本;所有調(diào)研的系統(tǒng)都要求如文檔有冒犯性言語、非科學內(nèi)容、剽竊材料、不符合倫理標準以及用于非法目的就會被刪除。6)版權(quán)政策。預印本版權(quán)一般歸作者所有,只要不與系統(tǒng)的開放許可沖突,作者可與期刊簽訂出版協(xié)議,很多期刊也允許研究成果出版前在預印本系統(tǒng)發(fā)布,因此,作者可使用SHERPA/RoMEO查詢期刊相關(guān)政策,以保證研究成果在期刊的正式出版。而在此次調(diào)研的10個系統(tǒng)中,bioRxiv、medRxiv可直接從預印本系統(tǒng)傳輸手稿到同行評審系統(tǒng)或投稿期刊。
10個受調(diào)研系統(tǒng)共享政策的相同部分主要有:作者必須同意在非排他性、不可撤銷和免版稅的許可下再去使用其他知識共享許可,且作者需證明自己有權(quán)授予此許可。在知識共享許可的選擇上,除絕大部分都使用創(chuàng)作共用署名許可(CC BY 4.0)或直接使用Creative Commons Public Domain Dedication (CC0 1.0)許可,樣本還分兩個流派:1)創(chuàng)作共用署名——相同方式共享許可(CC BY-SA 4.0),創(chuàng)作共用署名——非商業(yè)——相同方式共享許可(CC BY-NC-SA 4.0),如arXiv;2)創(chuàng)作共用署名——非商業(yè)許可(CC BY-NC 4.0),創(chuàng)作共用署名——不可衍生許可(CC BY-ND 4.0),創(chuàng)作共用署名——非商業(yè)——不可衍生許可(CC BY-NC-ND 4.0),如ChemRxiv、bioRxiv、medRxiv。
存儲政策主要的6個要求里,ChinaXiv較明確的有5個:在“提交格式”上有對文件格式和補充數(shù)據(jù)的要求:要求存儲的手稿為一個包含文本、圖表的PDF、Word、Latex或WPS文件,補充數(shù)據(jù)單獨提交,但是沒有對語種和文件大小有要求;在“提交時間”上目前沒有明確要求,可參考arXiv設置提交和公開時間;在“提交方式”上較靈活多樣:ChinaXiv接受用戶自行提交,用戶也可將論文、許可協(xié)議、身份識別等發(fā)至工作人員郵箱,工作人員批量提交;“提交要求”較明確:要求提交的文檔真實準確,符合學術(shù)交流公認標準的主題性和可評審性,不得侵犯任何實體的任何權(quán)利,也可以補充對有害代碼上傳的要求;在“修改刪除”上缺少對修改版的提交要求,可增補;在“版權(quán)政策”上可借鑒bioRxiv、medRxiv直接從預印本系統(tǒng)傳輸手稿到同行評審系統(tǒng)或投稿期刊。在共享政策上,ChinaXiv主要使用CC BY-SA 4.0和CC BY-NC-SA 4.0兩種許可,還另設了一些規(guī)定如“第三方若出于非商業(yè)目的將ChinaXiv內(nèi)容轉(zhuǎn)載,應在作品顯著位置注明‘內(nèi)容源于ChinaXiv’,并給出ChinaXiv網(wǎng)站鏈接,若需對內(nèi)容進行修改或用于商業(yè)目的,應聯(lián)系ChinaXiv單獨授權(quán),按授權(quán)方式使用”,還規(guī)定“除提交者或預印本系統(tǒng)與出版商達成協(xié)議外,提交者不應向預印本系統(tǒng)提交從出版商網(wǎng)站下載的論文PDF版本,出版商擁有論文PDF版本的著作權(quán)和版式權(quán)”,總的來說ChinaXiv的共享政策趨保守。
存儲政策的“提交要求”,主要是對提交文檔內(nèi)容的真實準確性提出要求,文檔內(nèi)容質(zhì)量控制主要體現(xiàn)在對文檔學術(shù)性的評估,體現(xiàn)在幾個方面:1)文檔分類。審核員需對文檔進行學科或研究類型分類,如arXiv會對作者提交文檔的學科分類進行審核,不合適的進行調(diào)整,交叉學科會被歸類到主學科,在涉及的其他學科設置關(guān)聯(lián)檢索;bioRxiv將文檔分為新研究、實證性研究與矛盾性結(jié)果研究。2)文檔刪除。在學術(shù)規(guī)范與內(nèi)容質(zhì)量審核不過關(guān)時才會刪除,如arXiv對不可檢索、重復、非學科收錄范圍,及同一作者單日提交超3篇的論文進行刪除;ChemRxiv、bioRxiv、medRxiv要求必須是獨立存在的研究性論文,教學材料等可能會被刪除,但medRxiv允許臨床研究設計方案和數(shù)據(jù)分析類文檔存儲,但不能侵犯患者隱私。3)作者上訴的權(quán)利及處理。arXiv規(guī)定作者有權(quán)對審核員的操作進行上訴,科學委員會進行復核,如復核結(jié)果維持原判,且作者無法提供額外信息,則不可重復上訴。4)審核人員的來源與要求也是質(zhì)量控制的重要保證。arXiv的審核人員來自各學科的專家志愿者,由科學委員會批準,審核員不可私下與被審核作者聯(lián)系。
預印本系統(tǒng)不僅要為用戶提供學術(shù)資源,還要為用戶提供學術(shù)服務,此次10個調(diào)研系統(tǒng)提供的學術(shù)服務主要有:1)學科資源訂閱,如arXiv需按學科主題訂閱;bioRxiv、medRxiv、SocArXiv都可通過電子郵件訂閱感興趣領(lǐng)域論文推送。2)開放評論及引用,bioRxiv、medRxiv、SocArXiv、PsyArXiv、MDPI Preprints能評論和通過DOI引用預印本,如一篇文章有多個版本,由于DOI號相同,則需添加特定版本的URL來引用。3)可向系統(tǒng)提供反饋意見,MDPI Preprints允許用戶對預印本系統(tǒng)因性別、種族、宗教等致使歧視的問題提出上訴。
在質(zhì)量控制上,ChinaXiv并沒有明確可查的成文規(guī)定,因此可廣泛借鑒其他國際預印本系統(tǒng),在文檔分類、文檔刪除、作者上訴的權(quán)利及處理、審核人員的來源與要求等方面形成規(guī)范化、成文版且公開可見的對提交的預印本資源的質(zhì)量控制方面的明確規(guī)定。ChinaXiv提供的學術(shù)服務較全面,與其他調(diào)研的系統(tǒng)相比除了尚未提供預印本引用服務,學科資源訂閱、開放評論、提供首發(fā)證明、推薦合作期刊、向系統(tǒng)提供反饋意見等學術(shù)服務均已提供,特別是ChinaXiv與《材料研究學報》等22家期刊建立的優(yōu)秀稿件雙向推送機制,可以讓ChinaXiv向論文提交者推薦合適發(fā)表的期刊,其合作期刊也可從ChinaXiv遴選優(yōu)質(zhì)論文稿源,且合作期刊征得作者同意后,還可將投稿的優(yōu)質(zhì)論文預印本推送到ChinaXiv系統(tǒng)先OA,這是切實惠及論文作者與學術(shù)期刊,也切實推動預印本持續(xù)發(fā)展的好方法。
預印本系統(tǒng)構(gòu)建完成并順利運營不僅需要有資金、技術(shù)、資源三大主要組成部分,還要有一個重要的組成部分,就是人員。維持預印本系統(tǒng)正常運營的人員主要涉及技術(shù)、審核、管理、服務、宣傳等,各預印本系統(tǒng)根據(jù)自身建設規(guī)模來配置人員數(shù)量以及確定聘用人員的方式,人員配置較復雜的是運營管理團隊,此內(nèi)容已在前文“運營管理”部分詳細介紹,不再贅述。
預印本系統(tǒng)除了構(gòu)建運營,還有一個重要任務就是宣傳推廣,此次調(diào)研的系統(tǒng)的宣傳推廣方式主要有:1)利用社交平臺進行宣傳和互動。arXiv有Blog和Twitter,Blog主頁展示最新上傳內(nèi)容,還可按主題瀏覽,并有各主題博文的數(shù)量統(tǒng)計;bioRxiv有Twitter,新論文會在Twitter上同步更新,bioRxiv存儲論文的不同學科也都有自己的Twitter,各學科新論文也會在不同學科的Twitter發(fā)布;medRxiv也會在Twitter同步新論文;SocArXiv有Twitter、Facebook和YouTube;PsyArXiv也有Blog。2)利用新聞宣傳欄宣傳推廣。如bioXiv、medRxiv都有新聞宣傳頁面。3)被知名網(wǎng)站索引。bioRxiv、medRxiv、SocArXiv的預印本被Google Scholar等索引。
目前,ChinaXiv在宣傳推廣上只有新聞宣傳頁面,可增加社交平臺和被知名網(wǎng)站索引等宣傳途徑,提高知名度。
在分析總結(jié)10個預印本系統(tǒng)調(diào)研結(jié)果,特別是在比較分析ChinaXiv與其他調(diào)研系統(tǒng)的基礎上,充分結(jié)合我國國情,為我國預印本系統(tǒng)的進一步發(fā)展提供啟示和參考。
雖然我國構(gòu)建的預印本系統(tǒng)ChinaXiv涉及生物學、物理學、天文學、數(shù)學、化學、心理學、管理學、醫(yī)學藥學等28個學科,是多學科綜合型預印本系統(tǒng),但目前國外預印本系統(tǒng)主流還是從單個學科構(gòu)建,因此本研究認為我國預印本系統(tǒng)也可以以單個學科進行構(gòu)建。雖然ChinaXiv目前也有合作共建的預印本子庫,如ChinaXiv巖土力學預印本平臺、中國圖情檔預印本平臺(試用)、貴州省學術(shù)預印本平臺(試用)等,但既有學科性又有地域性,略顯雜亂,且子庫建設基本都處于初始階段。因此,為防止日后我國預印本系統(tǒng)建設中人力財力的過度消耗與浪費,同一學科應極力避免重復構(gòu)建,而是集中合力共同構(gòu)建一個高質(zhì)量的預印本系統(tǒng)。以藥學為例,可由國內(nèi)某個藥科大學為主導,以“集中存儲模式”構(gòu)建藥學學科預印本系統(tǒng),其他想?yún)⑴c的藥科大學或大學的藥學院、藥學類科研院所都可在此系統(tǒng)存儲預印本,參與機構(gòu)可從資金、技術(shù)、人員、資源等多個途徑給予其支持。待多個學科都已構(gòu)建預印本系統(tǒng)后,還可構(gòu)建一站式檢索的聯(lián)合平臺,綜合檢索多學科甚至全學科預印本資源,用戶如需檢索某一特定主題,特別是交叉學科的預印本,如若不清楚文章的具體學科歸類可在聯(lián)合平臺進行檢索,聯(lián)合平臺會直接跳轉(zhuǎn)到存儲資源的預印本系統(tǒng)。聯(lián)合平臺內(nèi)各參與機構(gòu)還可增進跨學科學術(shù)交流,吸引國外的高等學校、科研機構(gòu)參與,將本機構(gòu)學術(shù)成果預印本存儲到我國相應學科的預印本系統(tǒng),推進我國預印本系統(tǒng)的國際化發(fā)展,讓中國學術(shù)更多地參與國際學術(shù)交流,逐步構(gòu)建國際學術(shù)共同體。
此外,還需確定預印本系統(tǒng)的運營管理模式。單學科預印本系統(tǒng)的運營可參照ChinaXiv等系統(tǒng)設顧問委員會,委員來源也可選自參與機構(gòu)和學科內(nèi)的知名專家,為發(fā)展決策提供參考建議和方案評估。若系統(tǒng)規(guī)模較大,還可借鑒arXiv設置分工更細致的各指導委員會,如技術(shù)支撐委員會、資金籌集委員會、資源建設委員會,統(tǒng)籌各個方面,其委員選拔方式可與顧問委員會類似。委員會人數(shù)可根據(jù)參與機構(gòu)的規(guī)模靈活確定,一般在10—100人之間。構(gòu)建多學科預印本系統(tǒng)聯(lián)合平臺后,還需組建聯(lián)合委員會,由各單個學科預印本系統(tǒng)的顧問委員會派1—2人勝任聯(lián)合委員會委員,負責協(xié)調(diào)處理聯(lián)合平臺內(nèi)各預印本系統(tǒng)之間的問題。
資金來源方面,ChinaXiv不同于其他調(diào)研系統(tǒng),是唯一一個靠政府撥款運營的預印本系統(tǒng),雖然資金來源穩(wěn)定可靠,但渠道過于單一,且資金使用靈活度較低,也降低了預印本系統(tǒng)與其他機構(gòu)組織交流合作的機會。因此我國需進一步拓寬預印本系統(tǒng)的資金渠道,借鑒國外預印本系統(tǒng)的資金來源。首先,可增加參與構(gòu)建和運營機構(gòu)的出資??梢詤⒖急?的7個預印本系統(tǒng)依靠構(gòu)建運營機構(gòu)提供資金支持;其次,可增加與基金會、公司企業(yè)、合作組織在資金上的合作。表1中有3個預印本系統(tǒng)靠基金支持,SocArXiv的資金就來源于多個合作組織,此外表1中由公司企業(yè)提供資金的預印本系統(tǒng)主要有3個;再次,接受捐贈也是相對重要的資金來源。表1中有4個預印本系統(tǒng)接受捐贈,接受的捐贈形式包括現(xiàn)金、股票、基金、證券甚至遺產(chǎn)。
ChinaXiv的構(gòu)建系統(tǒng)是Eprints,它是國際存儲庫構(gòu)建的老牌系統(tǒng)之一,獨立性和兼容性都很強,平臺對接可繼續(xù)使用OAI-PMH 2.0開放接口,OAI-PMH是一項簡單靈活的元數(shù)據(jù)互操作協(xié)議,因此用Eprints來構(gòu)建我國各學科預印本系統(tǒng)及聯(lián)合平臺也是不錯的選擇。但調(diào)研發(fā)現(xiàn),除了ChinaXiv,其他國際預印本系統(tǒng)都已開始引入集成平臺托管,構(gòu)建代碼也引入代碼托管平臺,這體現(xiàn)了預印本系統(tǒng)的一個發(fā)展趨勢。OSF Preprints使用SHARE來聚合各種預印本系統(tǒng)的搜索結(jié)果,并建立索引。用戶可直接在OSF Preprints平臺存儲,也可通過Dropbox、AmazonS3、Box、GoogleDrive、ownCloud等連接服務存儲。目前,基于OSF Preprints構(gòu)建托管的預印本系統(tǒng)有AfricArXiv、MindRxiv等26個之多,存儲資源總量達 2 293 487 份(數(shù)據(jù)截止日期為2020年10月8日),從OSF Preprints平臺可以直接鏈接到各托管預印本系統(tǒng),大大增加了新預印本系統(tǒng)資源的利用率。目前,F(xiàn)igshare共有超過 30 000 篇內(nèi)容被引用,合作機構(gòu)有高校、科研院所、出版商、基金、會議、政府機構(gòu)、實驗室,如卡內(nèi)基梅隆大學、卡里生態(tài)系統(tǒng)研究學院、施普林格·自然、威康基金會、《美國科學院院報》、美國環(huán)境保護署計算毒理學中心、生命科學實驗室等約142個,為3個預印本系統(tǒng)TechRxiv、ChemRxiv和Advance提供支持托管(數(shù)據(jù)截止日期為2020年10月12日)。如果構(gòu)建我國預印本系統(tǒng)及聯(lián)合平臺的終極目標是推進我國學術(shù)交流的國際化,那么直接利用已發(fā)展成熟的國際集成開放平臺構(gòu)建托管完全可以起到事半功倍的效果。構(gòu)建和修改代碼還可以利用GitHub進行代碼托管,GitHub不僅是代碼托管平臺,也是開發(fā)者的社交網(wǎng)絡平臺,在GitHub進行代碼托管的項目可以通過Pull Request形式吸引眾多軟件開發(fā)人員參與系統(tǒng)修復與優(yōu)化。
資源組織檢索方面,ChinaXiv在10個調(diào)研系統(tǒng)中處于中等水平,除了增加檢索途徑,還需要將檢索途徑條理化。綜合調(diào)研情況及我國其他檢索系統(tǒng)慣例分析,我國預印本系統(tǒng)或聯(lián)合平臺檢索途徑可采用一般、高級和個性化檢索相結(jié)合的方式。一般檢索可使用常見檢索途徑如分類、學科、題名、日期、關(guān)鍵詞、作者、機構(gòu);高級檢索可使用DOI、ORCID、參考文獻、開放許可、文獻類型、匹配度等不常用的檢索途徑;注冊用戶還可使用個性化檢索,保存使用過的檢索策略,或自主設置優(yōu)先檢索字段,還可提供評論檢索,通過用戶本人或他人評論內(nèi)容關(guān)鍵詞進行檢索,或通過本系統(tǒng)文章標識符、作者ID實現(xiàn)內(nèi)部檢索。多種檢索途徑組織條理化,可凸顯系統(tǒng)的人性化與個性化。
預印本系統(tǒng)資源的建設主要從學科、數(shù)量和類型三方面進行討論。資源的學科劃分可參照ChinaXiv將預印本按照“學科”和“主題”兩大方式進行獨立的分類導航,這樣“學科”歸屬存在交叉與爭議的資源可通過“研究主題”類目進行存儲。鑒于前文提出我國預印本系統(tǒng)可從單學科開始構(gòu)建,因此學科內(nèi)容可進一步細分,可參照arXiv、MDPI Preprints以“主學科+細分學科”進行資源劃分,確保細分學科能夠被充分體現(xiàn),如藥學學科下設很多二級學科如藥物制劑、藥物化學等,二級學科下還有分支學科,如藥物制劑的分支學科有醫(yī)院藥劑學、生物藥劑學等,這樣可使預印本資源的學科歸類更細致、準確。
資源數(shù)量方面,調(diào)研系統(tǒng)萬級的有5個,百萬級的有1個,而ChinaXiv排第四。我國預印本系統(tǒng)資源存儲可盡量多,只有切實建成我國各學科最新科研成果展示庫,才能使中國科研在國際學術(shù)界產(chǎn)生更大的影響力。研究表明,OA資源的引用影響已逐漸超過非OA資源,因此,我國預印本系統(tǒng)要避免小區(qū)域或小機構(gòu)零散重復構(gòu)建,同學科的機構(gòu)應合力構(gòu)建一個預印本系統(tǒng),再在預印本系統(tǒng)或聯(lián)合平臺設“機構(gòu)”的檢索途徑凸顯各參與機構(gòu)的科研能力。
資源類型方面,我國預印本系統(tǒng)應當如ChinaXiv一樣主要存儲學術(shù)論文預印本,還可將作者原稿、修改稿及無版權(quán)爭議的刊發(fā)稿同時存儲,使用同一個DOI不同URL實現(xiàn)版本的關(guān)聯(lián)與區(qū)分。當然,除了學術(shù)論文,還可適當放寬存儲類型以增加存儲量,如準備出版的圖書手稿、臨床報告、實驗報告都可發(fā)布,提高科研人員的積極性,總的來說應把控好兩點:一是未出版,二是學術(shù)性。
在數(shù)據(jù)統(tǒng)計中,ChinaXiv的“資源上傳情況統(tǒng)計”相較于其他調(diào)研系統(tǒng)處于領(lǐng)先地位。我國預印本系統(tǒng)可參考ChinaXiv在“提交時間統(tǒng)計”里設置“最近提交統(tǒng)計”,還可參考arXiv、bioRxiv、medRxiv增加“按年份或月份查看提交資源”。從這些統(tǒng)計數(shù)據(jù)中進一步挖掘?qū)W術(shù)價值,分析不同學術(shù)機構(gòu)、科研團隊的研究方向、學科發(fā)展及研究的冷熱點等形成分析報告,為科研人員提供參考。在“資源使用情況統(tǒng)計”上,ChinaXiv還是側(cè)重對“資源使用”的統(tǒng)計,我國預印本系統(tǒng)可以結(jié)合arXiv、ChemRxiv對“用戶行為”進行統(tǒng)計,如下載機構(gòu)、下載地區(qū)和引導網(wǎng)站的統(tǒng)計,并結(jié)合不同用戶的資源需求,析出用戶的興趣需求和行為模式,從而優(yōu)化系統(tǒng)平臺的功能設計。這些“用戶”關(guān)乎著預印本系統(tǒng)龐大的“作者群”和“潛在作者群”,他們既是資源的使用者,又是資源的提供者,而“平臺質(zhì)量”對用戶的自存儲行為有著顯著而直接的影響。
存儲政策主要包含的6個方面arXiv全部涉及,ChinaXiv已涉及5個,因此,我國預印本系統(tǒng)可著重參考arXiv和ChinaXiv,盡量細致全面地制訂好存儲政策:1)提交格式。預印本宜以PDF、WPS、Latex、JPEG、中英雙語種、大小不超過5G為首選,成果的科研數(shù)據(jù)、圖表需單獨提供。2)提交時間。作者可隨時提交,審核需1—3個工作日。3)提交方式。可采用作者自行提交、工作人員代交和第三方提交相結(jié)合的方式以方便作者的不同需求,若第三方提交需提供作者書面許可。4)提交要求。預印本須以學術(shù)研究為基礎,可評審、可刊發(fā),不侵犯任何實體的任何權(quán)利,不得上傳有害代碼。5)修改刪除。作者可上傳修改版,且每個修改版都需隨附補充資料,如用戶舉報或?qū)徍巳藛T在已發(fā)布的預印本中發(fā)現(xiàn)剽竊或不符合研究倫理等內(nèi)容將有權(quán)刪除。6)版權(quán)政策。預印本版權(quán)歸屬幾乎都是作者,作者在論文投稿時需與期刊簽訂協(xié)議,允許論文初稿在預印本系統(tǒng)繼續(xù)公開,受期刊評審并修改后的版本需等期刊刊發(fā)并經(jīng)過期刊允許才可將刊發(fā)版公布在預印本系統(tǒng),且需提供刊發(fā)期刊的稿件鏈接;但有一些期刊不允許發(fā)表前在預印本系統(tǒng)發(fā)布,因此,作者需在SHERPA/RoMEO查詢各期刊相關(guān)政策,目前Elsevier、Springer、EMBOpress、IOP Publishing等知名出版機構(gòu)都采取積極的預印本投稿政策,PLOS等開放獲取的出版機構(gòu)對預印本更是持歡迎態(tài)度;還可借鑒bioRxiv、medRxiv從預印本系統(tǒng)傳輸手稿到同行評審系統(tǒng)或投稿期刊,期刊可查看預印本系統(tǒng)中用戶對該文章的評價,增加預印本系統(tǒng)與期刊的交流,有利于期刊支持投稿文章原稿先在預印本系統(tǒng)開放。
調(diào)研可知,ChinaXiv、arXiv、ChemRxiv、bioRxiv、medRxiv的共享政策都趨保守。預印本系統(tǒng)存儲政策的“趨開放”與“趨保守”是預印本系統(tǒng)建設的兩種思路。在我國現(xiàn)階段,特別是各學科預印本系統(tǒng)尚未被廣泛建設與利用的前提下,采用趨保守的共享政策如CC BY-NC-SA或CC BY-NC-ND,可以提高作者的“安全感”這也許更有利于作者選擇使用預印本系統(tǒng)提前公布正式出版前的科研成果。
存儲政策中的“提交要求”主要從作者角度思考,希望作者對預印本的科學性、嚴謹性進行核查,而“質(zhì)量控制”是從系統(tǒng)角度,對已上傳的預印本進行內(nèi)容質(zhì)量的審核。此次調(diào)研中,ChinaXiv并沒有明確可查的有關(guān)“質(zhì)量控制”方面的規(guī)定,因此,我國預印本系統(tǒng)可參考arXiv、bioRxiv、medRxiv等增加相關(guān)規(guī)定,但要注意把握適度原則,預印本系統(tǒng)并非學術(shù)期刊,不經(jīng)同行評審,審核人員無權(quán)判斷一篇論文的學術(shù)價值,不能因為學術(shù)觀點而將其刪除。質(zhì)量控制需把握2個標準:1)符合收錄范圍都可在平臺發(fā)布;2)審核人員只就規(guī)定內(nèi)容進行審核或調(diào)整歸類,學術(shù)觀點正確與否不由平臺評估。日內(nèi)瓦大學一位量子物理學家就質(zhì)疑過arXiv存在偏見,其學生關(guān)于黑洞的文章就被arXiv拒稿,該物理學家雖然也認為該論文存在一些不夠嚴謹?shù)膯栴},但預印本系統(tǒng)并非需要經(jīng)過層層審核的期刊發(fā)文,學術(shù)觀點不能成為拒稿理由,還有作者指責arXiv將其論文分類調(diào)整到冷門分類,影響其論文的點擊下載量。因此審核人員身份需要獲顧問委員會批準,且不可與被審核作者私下聯(lián)系。為確保民主性,作者還需要有上訴權(quán),顧問委員會對上訴內(nèi)容進行審核,并給出最終結(jié)論,作者如無新的證據(jù),不可重復上訴。
ChinaXiv提供的學術(shù)服務較全面,從調(diào)研可知,預印本系統(tǒng)一般需提供基本的學術(shù)服務包括學科資源訂閱、開放評論和引用功能、為作者提供首發(fā)證明等。在此基礎上還可以參考ChinaXiv與多家期刊建立的優(yōu)秀稿件雙向推送機制,為作者推薦投稿期刊,也為期刊遴選優(yōu)質(zhì)稿源。當然,還可以積極接受用戶反饋,根據(jù)用戶建議提供針對性的學術(shù)服務,如開設討論版,推動跨機構(gòu)、跨學科的學術(shù)交流等。
在網(wǎng)站調(diào)研中只能查到負責運營管理的委員會的人員配置,但整個預印本系統(tǒng)順利運轉(zhuǎn)還需設置以下崗位:1)技術(shù)人員,負責系統(tǒng)架構(gòu)維護和軟件模塊嵌入,可采用公司外包、線上遠程與線下駐場相結(jié)合的配置方式;2)審核人員和學術(shù)服務人員,負責對預印本格式、類型與內(nèi)容的審核,以及為用戶提供學術(shù)服務,可由參與機構(gòu)具有學科背景的科研人員兼職;3)行政人員和宣傳推廣人員,負責行政業(yè)務和宣傳推廣,這部分工作內(nèi)容較煩瑣、工作時間較固定,需專職招聘。
在宣傳推廣上,ChinaXiv目前只設有新聞頁面進行宣傳,我國預印本系統(tǒng)可參考其他調(diào)研系統(tǒng),增加宣傳推廣渠道,但要注意與我國國情相結(jié)合:1)利用社交平臺與用戶互動時,由于國內(nèi)無法登陸Twitter、Facebook、YouTube等網(wǎng)站,可開設微信、微博、短視頻App賬號,利用好國內(nèi)社交軟件;2)被其他知名網(wǎng)站索引或?qū)Ш?,國?nèi)無法使用Google Scholar,可使用百度學術(shù)建立索引,聯(lián)合平臺需制作各學科預印本系統(tǒng)名錄,且在各合作期刊網(wǎng)站設預印本系統(tǒng)的導航鏈接。
本文利用網(wǎng)站調(diào)研的方法,通過分析國內(nèi)外10個較知名預印本系統(tǒng)現(xiàn)狀,提出進一步發(fā)展我國預印本系統(tǒng)的建議,即“構(gòu)建各學科預印本系統(tǒng)及聯(lián)合檢索平臺”,并從資金、技術(shù)、資源等方面提出具體策略參考。當然,本文所提出的策略參考只是鑒于10個調(diào)研樣本分析提出的,存在一定的局限性和片面性,在后續(xù)研究中,會進一步擴大樣本量,以期作出更為全面的調(diào)研分析。