■張 恬 孟美任
1)中國科學(xué)院文獻情報中心,北京市海淀區(qū)中關(guān)村北四環(huán)西路33號 1001902)中國科學(xué)院大學(xué)經(jīng)濟與管理學(xué)院圖書情報與檔案管理系,北京市海淀區(qū)中關(guān)村北四環(huán)西路33號 100190
科學(xué)研究已經(jīng)步入數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)的第四范式[1],研究過程更加復(fù)雜精細,學(xué)界對實驗結(jié)果可重復(fù)性驗證的要求日益嚴格[2]。然而,“可重復(fù)性危機”卻日益凸顯,Nature對化學(xué)、物理、地球和環(huán)境科學(xué)、生物學(xué)和醫(yī)學(xué)等領(lǐng)域的1576名科研人員進行調(diào)查,發(fā)現(xiàn)超過70%的科研人員曾經(jīng)嘗試但未能重復(fù)他人實驗[3],已發(fā)表成果的不可重復(fù)已經(jīng)帶來了科研資源的浪費且影響嚴重[4-5]。評判科研成果能否發(fā)表的最重要機制——同行評議,存在過程不透明,人情評審、虛假評審泛濫等局限,是造成這一危機的重要原因之一[6-7]。同時,傳統(tǒng)、封閉的學(xué)術(shù)交流體系——科學(xué)研究只有出版后才能開放共享,且很多論文背后的數(shù)據(jù)無法獲得發(fā)表,很多作者的無法被認可,這與科研人員日益增長的知識獲取需求之間的嚴重矛盾,使作為學(xué)術(shù)交流重要載體和媒介的學(xué)術(shù)出版也面臨著前所未有的挑戰(zhàn)。盡管學(xué)術(shù)界、出版界、公共/私人機構(gòu)合力推進開放科學(xué)運動,探索開放數(shù)據(jù)、開放同行評議等機制及相關(guān)實現(xiàn)技術(shù),以保證科學(xué)研究成果能夠開放、客觀、可靠[8-9],然而在現(xiàn)行的技術(shù)條件下,開放數(shù)據(jù)的安全性、完整性,以及知識產(chǎn)權(quán)等關(guān)鍵問題均未能得到有效的保障。因此,可重復(fù)性危機、科研數(shù)據(jù)不夠開放等學(xué)術(shù)交流面臨的難題仍無法得到有效解決。
區(qū)塊鏈最早被作為比特幣的應(yīng)用技術(shù)出現(xiàn)在Nakamoto[10]2008年發(fā)表的論文《比特幣:一種點對點的電子現(xiàn)金系統(tǒng)》中,從本質(zhì)上來說,區(qū)塊鏈是利用分布式技術(shù)和共識算法重新構(gòu)造的一種信任機制[11]。作為一種分布式交易和數(shù)據(jù)管理技術(shù),區(qū)塊鏈具有開放性、去中心化、可追溯性、不可篡改性、匿名性等特點,可以應(yīng)用到解決學(xué)術(shù)交流面臨的難題之中。近年來,國外學(xué)者已經(jīng)嘗試將區(qū)塊鏈技術(shù)應(yīng)用于科研數(shù)據(jù)管理和學(xué)術(shù)出版中[12-14],但是國內(nèi)學(xué)者關(guān)于區(qū)塊鏈的相關(guān)應(yīng)用研究尚局限于學(xué)術(shù)出版領(lǐng)域的展望性綜述[15-17],鮮有關(guān)于區(qū)塊鏈技術(shù)在學(xué)術(shù)交流體系應(yīng)用場景中的系統(tǒng)梳理研究。傳統(tǒng)的學(xué)術(shù)出版模式使得學(xué)術(shù)交流的重心只局限于科學(xué)研究生命周期的后端。本研究將從學(xué)術(shù)交流中難以解決的問題出發(fā),通過歸納總結(jié)區(qū)塊鏈技術(shù)的優(yōu)勢特點,調(diào)研分析該技術(shù)在科研生命周期中的應(yīng)用場景,系統(tǒng)探討區(qū)塊鏈技術(shù)如何幫助學(xué)術(shù)交流/學(xué)術(shù)出版服務(wù)于整個科研生命周期,解決學(xué)術(shù)交流/學(xué)術(shù)出版面臨的難題。
區(qū)塊鏈可以被看作是一個分布式數(shù)據(jù)庫,其數(shù)據(jù)不是存儲在某個中央服務(wù)器上,而是在其網(wǎng)絡(luò)中的每個參與節(jié)點(計算機或服務(wù)器)上都存儲了副本,即所有節(jié)點可以共享區(qū)塊鏈中曾經(jīng)完成的每條交易信息,該數(shù)據(jù)庫利用加密技術(shù)(如哈希和數(shù)字簽名)以安全、線性和時序的方式實現(xiàn)新條目的添加,任何單個節(jié)點都不能隨意地進行更改,而只能通過平臺的一致性算法進行更改,因此保證了區(qū)塊鏈系統(tǒng)比其他涉及第三方的集中性交易系統(tǒng)更加透明、安全和不可篡改(保證了數(shù)據(jù)完整性)。以上特點使得科研數(shù)據(jù)在管理、評價、發(fā)表、獲取、確權(quán)等方面面臨的一系列難題都能從技術(shù)層面得以解決。
筆者借鑒區(qū)塊鏈技術(shù)的相關(guān)優(yōu)勢指出其能夠應(yīng)對的學(xué)術(shù)交流難題(表1),具體的應(yīng)對方案將通過后文的案例分析進行歸納和總結(jié)。
表1 區(qū)塊鏈技術(shù)應(yīng)對學(xué)術(shù)交流難題總結(jié)
自2017年開始,已有一些國際出版商陸續(xù)與技術(shù)公司合作,啟動了將區(qū)塊鏈技術(shù)應(yīng)用于學(xué)術(shù)交流體系尤其是學(xué)術(shù)出版項目,包括Peer Review Blockchain、Artifacts.ai、Scienceroot.com、 Pluto.network、OrviuM.IO等,國內(nèi)尚未出現(xiàn)較為典型的案例。筆者對上述案例進行了調(diào)研,限于篇幅,僅對3個典型案例進行分析,重點剖析區(qū)塊鏈技術(shù)基于科學(xué)研究生命周期的應(yīng)用場景。
致力于支撐科學(xué)研究全生命周期的Digital Science和開發(fā)智能合約區(qū)塊鏈技術(shù)的軟件公司Katalysis,聯(lián)合Springer Nature和Open Researcher and Contributor ID(ORCID)于2017年3月聯(lián)合啟動Peer Review Blockchain項目,旨在利用分布式注冊表和區(qū)塊鏈技術(shù),重點關(guān)注研究可重復(fù)性低、評審過程缺乏完整可靠數(shù)據(jù)的驗證、審稿人貢獻難以獲得認可和日益增加的投稿數(shù)量給同行評議帶來負擔(dān)等問題。四方共同分工:Digital Science負責(zé)項目管理;Katalysis負責(zé)實現(xiàn)測試平臺;Springer Nature資助參與出版和同行評議工作流部分;ORCID提供個人標識符、身份驗證相關(guān)支持。2018年4月,Taylor & Francis和劍橋大學(xué)出版社加入該項目。第三批加入的出版商是Karger Publishers。2018年9月,全球慈善基金會、科研資助者Wellcome Trust作為顧問身份加入,共同研究如何利用區(qū)塊鏈技術(shù)認可和獎勵審稿人的工作質(zhì)量,以及如何利用獎勵與評審相結(jié)合的方式擴充審稿人庫。
Peer Review Blockchain通過將關(guān)于同行評議過程的關(guān)鍵數(shù)據(jù)存儲和發(fā)布在一個共享平臺上,從而提高同行評議過程的透明度、認可度和效率,同時又能保證隱私需求[符合《通用數(shù)據(jù)保護條例》(General Data Protection Regulation,GDPR)][23],數(shù)據(jù)流示意圖見圖1。稿件、作者、審稿人的不同信息片段并沒有鏈接到區(qū)塊鏈本身,而是作為隨機數(shù)字串來處理,只有具備適當(dāng)權(quán)限的用戶才能以搜索特定信息的方式將其聚合在一起。對于個人隱私而言,這意味著避免了信息拼湊在一起可以推斷個人身份的風(fēng)險。Peer Review Blockchain不會存儲明確的個人識別信息,而是將個人信息的處理外包給ORCID。在知識產(chǎn)權(quán)方面,存儲在區(qū)塊鏈中的同行評議數(shù)據(jù)不屬于任何實體或組織,項目中的所有參與者都可以訪問這些數(shù)據(jù),因此,只有參與者同意免費共享的數(shù)據(jù),才會明確地存儲在區(qū)塊鏈中。
圖1 Peer Review Blockchain數(shù)據(jù)流示意圖[24]
ARTiFACTS是一個由學(xué)術(shù)出版商、媒體、軟件和金融技術(shù)團隊合作創(chuàng)建的利用區(qū)塊鏈技術(shù)促進科研的平臺,其核心是維護一個分布式分類賬和交易引擎,科研人員可以實時地發(fā)布永久、有效、不可變和不可篡改的記錄鏈,從科研生命周期的最早期階段開始,記錄包括歸屬/貢獻、引用在內(nèi)的所有科研“交易”行為,所有形式的內(nèi)容在所有階段中的共享和可發(fā)現(xiàn)性都更加安全,降低了失去知識產(chǎn)權(quán)控制的風(fēng)險,目前該平臺正在申請專利。借助ARTiFACTS平臺,無縫部署到科研工作流中的區(qū)塊鏈技術(shù)可以創(chuàng)建一個更有效且不可變的存在性證明(Proof-of-Existence)和數(shù)據(jù)歸屬/貢獻的證明,以展示和記錄研究人員的學(xué)術(shù)貢獻。
默頓普通科學(xué)描述(The Mertonian Description of Normal Science)把引文描述為科學(xué)貨幣?,F(xiàn)代文獻計量學(xué)教父加菲爾德認為,科學(xué)家應(yīng)該以引文的形式向他們的信息來源者(Preceptors)支付報酬[25],而直到目前,引用僅僅發(fā)生在學(xué)術(shù)出版以后——科研生命周期的后期,并且只涵蓋具有商業(yè)索引期刊所發(fā)表的成果(僅占科研產(chǎn)出的一小部分),即圍繞引文這種研究貨幣的“交易”只有一小部分被捕獲,通常還是在交易發(fā)生很久之后。由于當(dāng)前引文解決方案的局限性,很多科研產(chǎn)出的重要歸屬/貢獻和相互連接將永遠丟失或永遠不會發(fā)生。因此,學(xué)術(shù)界需要采用新技術(shù)為科研增加價值[26]。ARTiFACTS的創(chuàng)立初衷是通過獨特的區(qū)塊鏈引擎,為科研提供一個透明的分類賬記錄,在這里每個人都能看到并同意“交易余額”,使加菲爾德和默頓的引文效用愿景成為可能。ARTiFACTS使整個科研生命周期中的所有科研產(chǎn)出都能夠被證明存在、被發(fā)現(xiàn)和被引用,這些科研產(chǎn)出包括數(shù)據(jù)集、研究設(shè)計、資助申請、海報、演講稿、會議記錄、調(diào)查、手稿以及一篇已經(jīng)發(fā)表的論文,并為科研人員、機構(gòu)、資助者、出版商提供各式服務(wù)(表2)。
表2 ARTiFACTS針對不同身份用戶的服務(wù)內(nèi)容
Scienceroot是一個基于區(qū)塊鏈技術(shù)建立的更有效、更透明、更開放的科研生態(tài)系統(tǒng),讓全球科學(xué)界的任何人都能夠通過這個系統(tǒng)募集資金、互動、討論研究思路、合作,并最終發(fā)表他們的工作成果。
立足于學(xué)術(shù)交流中的兩大難題:知識被大型機構(gòu)、公司控制,科學(xué)發(fā)現(xiàn)被關(guān)閉在付費墻之外;錯誤的評價和激勵機制——發(fā)布的內(nèi)容變得比實際發(fā)布本身更重要。Scienceroot致力于利用區(qū)塊鏈技術(shù)解決上述問題,為科研社區(qū)打造全新的生態(tài)系統(tǒng),特點如下:(1)創(chuàng)建獨特貨幣——Science Token。這種加密貨幣可以隨時隨地交換,使得全球科學(xué)界和非科學(xué)界通過投資一項有價值的事業(yè)直接參與促進科學(xué)的發(fā)展。(2)獨特身份認證。通過將ORCID和ResearchID等項目集成到自己的平臺中,確保一個不可變/不可篡改的持久數(shù)字標識符,該標識符可以集成在研究工作流程中,如授權(quán)提交、研究漫游、手稿提交等。(3)不變檔案。提交的每篇文章都將在區(qū)塊鏈上生成時間戳,以創(chuàng)建所有科學(xué)文章的不可變的開放訪問檔案。單獨的個人或團體不會擁有對系統(tǒng)的控制權(quán),每位用戶都可以清晰地訪問所有信息。(4)獎勵制度。建立同行評議激勵機制和論文作者獎勵制度,每半年對被引用的文章進行排序,作者將得到相應(yīng)的獎勵,如讀者發(fā)現(xiàn)文章有價值也可以獎勵作者。Scienceroot的三大功能如表3所示。
表3 Scienceroot的三大功能
根據(jù)上述案例的分析結(jié)果可以發(fā)現(xiàn),區(qū)塊鏈技術(shù)能夠在科學(xué)研究、學(xué)術(shù)交流中發(fā)揮重要作用。筆者基于科研生命周期對以上案例進行分析和總結(jié),結(jié)果如表4所示。
盡管學(xué)術(shù)交流尤其是學(xué)術(shù)出版面臨眾所周知的挑戰(zhàn),但幾十年甚至幾百年來,學(xué)術(shù)交流模式仍然保持驚人的不變:(1)傳統(tǒng)的數(shù)據(jù)庫收錄政策導(dǎo)致學(xué)術(shù)交流只局限于已發(fā)表的論文,而科研生命周期中的其他重要成果產(chǎn)出被完全阻擋在外;(2)數(shù)據(jù)收錄時部分研究成果已經(jīng)嚴重過時,大量最新研究的價值無法得到及時評價;(3)研究成果發(fā)表很久后才可能發(fā)現(xiàn)已發(fā)表數(shù)據(jù)的不可重復(fù)性和一些學(xué)術(shù)不端行為;(4)評價指標體系設(shè)計的不全面導(dǎo)致研究人員越來越以追求高排名為首要目標,忽視了純粹的科研[27];(5)引入社交網(wǎng)絡(luò)并借助科研社區(qū)力量促進了共享、合作和快速采用,但并沒有很好地解決上述問題,并且還出現(xiàn)了額外的問題:無效/不完全的引用;研究人員失去知識產(chǎn)權(quán)的風(fēng)險;侵犯版權(quán)的可能性(從無意到明顯的盜版,如Sci-Hub);一些“游戲系統(tǒng)”的行為利用替代計量獲得了高影響力。這些阻礙科學(xué)開放的因素在一定程度上也許需要新一代變革性技術(shù)來解決。
科學(xué)研究與學(xué)術(shù)交流在先后經(jīng)歷了數(shù)據(jù)庫時代和社交網(wǎng)絡(luò)時代之后,有望進入?yún)^(qū)塊鏈時代[28]。區(qū)塊鏈時代將覆蓋到科研生命周期的所有階段和所有科研產(chǎn)出;支持與已經(jīng)使用的各種數(shù)據(jù)存儲庫、學(xué)術(shù)和研究機構(gòu)使用的各種認證和授權(quán)系統(tǒng)的集成,能為所有科研產(chǎn)出提供高度完整、全面的實時引用和互鏈,同時確認歸屬/貢獻和提供知識產(chǎn)權(quán)保護;通過權(quán)衡來解決作者需求(例如共享與知識產(chǎn)權(quán)保護、公開透明與隱私);建立實驗數(shù)據(jù)和同行評議行為的可追溯、不可撤銷的記錄,以規(guī)避學(xué)術(shù)不端行為,避免可重復(fù)性危機。因此,越來越多的研究者相信區(qū)塊鏈技術(shù)是一種可以從根本上改變學(xué)術(shù)交流的技術(shù),可以促進開放科學(xué)、開放研究和數(shù)據(jù)共享。
表4 三大區(qū)塊鏈平臺應(yīng)用場景總結(jié)
如果區(qū)塊鏈技術(shù)是一項革命性的新技術(shù),那么廣泛采用它將觸及包括科學(xué)家、資助者、機構(gòu)和出版商在內(nèi)的所有層面,勢必影響一些學(xué)術(shù)資源壟斷者的既得利益。出版商通過收取訂閱費或開放獲取費等模式將內(nèi)容分發(fā)給學(xué)術(shù)界,如果數(shù)據(jù)的收集和分析、同行評議、內(nèi)容的傳播都在區(qū)塊鏈上進行,那么出版商/期刊在學(xué)術(shù)交流體系中的重要性有可能被削弱。已經(jīng)出現(xiàn)一些應(yīng)用區(qū)塊鏈技術(shù)的平臺,如DECENT和LYBR,允許作者自己上傳內(nèi)容,并根據(jù)讀者數(shù)量自主設(shè)置價格和獲得收入(可設(shè)置每次觀看或下載需要支付的價格,并在結(jié)束時直接獲得足額付款,無任何差價),如果內(nèi)容貢獻者不止一個,那么這類平臺作為內(nèi)容分發(fā)系統(tǒng)將自動進行付款拆分,并且付款比例可以隨時調(diào)整。
另外有一些科學(xué)家開始使用神秘的筆名來發(fā)表文章,這些筆名其實是基于公鑰密碼簽名的加密代碼,以后可以用來證明作者身份,但是僅從已發(fā)布的代碼中無法獲知作者的真實姓名。有趣的是,他們發(fā)表文章的觀點是:如果正確使用區(qū)塊鏈技術(shù),可能會使當(dāng)前大部分學(xué)術(shù)交流和出版體系過時,減少科學(xué)共同體對出版業(yè)的依賴,釋放科研經(jīng)費[29]。
雖然出版商和期刊面臨上述挑戰(zhàn),但技術(shù)變革帶來的更多是機遇。如前文分析,國際各大出版商已經(jīng)積極參與到探索學(xué)術(shù)出版創(chuàng)新模式的項目中,基于區(qū)塊鏈技術(shù),出版商可以實現(xiàn)從只發(fā)表傳統(tǒng)論文到發(fā)表各種類型的科研產(chǎn)出數(shù)據(jù),從只服務(wù)于科研的后端拓展到將服務(wù)貫穿于整個科研生命周期的各個環(huán)節(jié),從而使學(xué)術(shù)出版的價值得以延伸。
區(qū)塊鏈在科研生命周期各個階段中的應(yīng)用實踐已經(jīng)展開,與現(xiàn)有技術(shù)相比,能夠更好地解決科學(xué)研究與學(xué)術(shù)交流面臨的問題。學(xué)術(shù)交流還有望拓展出一些新的模式,并在區(qū)塊鏈技術(shù)的支撐下得以實現(xiàn),例如出版商可以使用區(qū)塊鏈技術(shù)集成小額支付功能,在訂閱模式或開放獲取作者付費模式以外,開辟新的付費模式——按單個內(nèi)容項(內(nèi)容可劃分為的最小單元)的使用情況支付[11]。區(qū)塊鏈技術(shù)可以更精準地統(tǒng)計科研“交易”情況,比引文計量積累所需要的時間更短,從而可能對研究人員建立聲譽和信用積累的方式產(chǎn)生巨大的影響?;趨^(qū)塊鏈的智能合同將使整個研究過程向外界展示,實現(xiàn)標準的科學(xué)后處理算法和決策程序,可以用于研究預(yù)注冊,并自動做出科研假設(shè)是否被接受或被拒絕的決定[30]。由于智能合同可以自動募集和發(fā)放資金,因此科研項目經(jīng)費的申請模式也可以改變——從研究人員提出研究方案、資助方評審后考慮是否予以資助的傳統(tǒng)模式,轉(zhuǎn)變?yōu)橘Y助方提出需求,由研究人員進行競標,中標后自動獲得資金的模式。
區(qū)塊鏈技術(shù)具有保障數(shù)據(jù)的安全性、完整性和知識產(chǎn)權(quán)等優(yōu)勢,可以應(yīng)用于建立科研生命周期各個階段可追溯、不可變的“交易”記錄,有助于促進整個科研過程和數(shù)據(jù)的開放共享,幫助已發(fā)表論文之外的其他各類科研產(chǎn)出獲得歸屬/貢獻認可,消除學(xué)術(shù)交流面臨的可重復(fù)性危機、科研數(shù)據(jù)不夠開放等難題,同時作為學(xué)術(shù)交流的重要媒介,學(xué)術(shù)出版的模式(從出版類型到出版時機)也得以創(chuàng)新和拓展,價值得以延伸。盡管區(qū)塊鏈技術(shù)存在局限性,但仍然可以預(yù)見,區(qū)塊鏈技術(shù)將為開放科學(xué)帶來新的推動力。