趙麗梅
(黑龍江大學(xué)信息管理學(xué)院;黑龍江大學(xué)信息資源管理研究中心,黑龍江哈爾濱 150080)
科學(xué)數(shù)據(jù)是大數(shù)據(jù)時(shí)代重要的學(xué)術(shù)資源,不僅是科學(xué)研究的基礎(chǔ),而且是國(guó)家創(chuàng)新系統(tǒng)以及科學(xué)研究過(guò)程中最重要的因素之一,在科學(xué)研究和知識(shí)創(chuàng)新中具有重要的戰(zhàn)略驅(qū)動(dòng)作用,需要通過(guò)具體的開(kāi)發(fā)利用才能彰顯出其價(jià)值。由于蘊(yùn)藏多種科學(xué)理論的科學(xué)數(shù)據(jù)零零散散地分布存檔于各種學(xué)術(shù)情境中,不僅需要將其公開(kāi)存取,更需要進(jìn)行深度解讀和整合利用,踐行科學(xué)大數(shù)據(jù)和科學(xué)深度數(shù)據(jù)時(shí)代所要求的研究理念[1]。但是由于科學(xué)數(shù)據(jù)行業(yè)體系發(fā)展不夠成熟、監(jiān)管體系以及管理服務(wù)不夠完善等原因,科學(xué)數(shù)據(jù)質(zhì)量參差不齊,科研人員在對(duì)科學(xué)數(shù)據(jù)進(jìn)行利用時(shí)所面臨的風(fēng)險(xiǎn)和不確定性越來(lái)越高,對(duì)于即將使用的數(shù)據(jù)無(wú)法完全信任科學(xué)數(shù)據(jù)的質(zhì)量,影響最終的科學(xué)研究效率,導(dǎo)致多種科研資源的浪費(fèi)。而科學(xué)數(shù)據(jù)質(zhì)量是科學(xué)研究的重要基礎(chǔ)保障之一,但是面對(duì)看似十分規(guī)整的科學(xué)數(shù)據(jù)產(chǎn)品,如果不通過(guò)精細(xì)的溯源、專業(yè)的深度解讀,很難甄別其真?zhèn)位蛘咴u(píng)判其質(zhì)量高低,因此科學(xué)數(shù)據(jù)溯源作為科學(xué)數(shù)據(jù)質(zhì)量與安全管理的重要手段,將為科學(xué)數(shù)據(jù)管理行業(yè)提供基本保障,并能夠降低科學(xué)數(shù)據(jù)利用中的風(fēng)險(xiǎn),提高數(shù)據(jù)驅(qū)動(dòng)創(chuàng)新研究的效率[2]。
區(qū)塊鏈的核心理念在于集成存檔數(shù)據(jù),實(shí)行分布式存取以及節(jié)點(diǎn)之間無(wú)障礙傳輸與共享,降低參與主體之間信息非對(duì)稱的共識(shí)機(jī)制和多體協(xié)同治理的激勵(lì)約束機(jī)制,利用加密算法實(shí)現(xiàn)安全保障的創(chuàng)新舉措[3]。對(duì)于科學(xué)數(shù)據(jù)溯源而言,具有很強(qiáng)的應(yīng)用契合度。本文將科學(xué)數(shù)據(jù)溯源置于區(qū)塊鏈的系統(tǒng)框架中,探討區(qū)塊鏈視域下的科學(xué)數(shù)據(jù)溯源議題,旨在尋求高效適合的科學(xué)數(shù)據(jù)溯源方案,促進(jìn)科學(xué)數(shù)據(jù)管理與利用的順利開(kāi)展。
科學(xué)數(shù)據(jù)作為重要的科學(xué)研究戰(zhàn)略資料,其真實(shí)性和可靠性能夠強(qiáng)化科研人員對(duì)其利用的信念以及降低研究的風(fēng)險(xiǎn)??茖W(xué)數(shù)據(jù)溯源是管控其真實(shí)性和可靠性的重要渠道之一,因此成為業(yè)界人員的重要研究對(duì)象和實(shí)踐議題。
科學(xué)數(shù)據(jù)溯源是大數(shù)據(jù)時(shí)代科學(xué)研究活動(dòng)的“辯章學(xué)術(shù)、考鏡源流”,即實(shí)現(xiàn)對(duì)科學(xué)數(shù)據(jù)的源頭與發(fā)展過(guò)程進(jìn)行仔細(xì)考證的宗旨。根據(jù)王芳等[4]的梳理分析,目前有關(guān)科學(xué)數(shù)據(jù)溯源的研究多是技術(shù)維度的分析,更確切地說(shuō)是通過(guò)技術(shù)來(lái)踐行科學(xué)數(shù)據(jù)管理思想的研究范式,諸如融合大數(shù)據(jù)理念和相關(guān)技術(shù)(包括區(qū)塊鏈技術(shù))進(jìn)行科學(xué)數(shù)據(jù)平臺(tái)和共享管理系統(tǒng)的開(kāi)發(fā),是科學(xué)數(shù)據(jù)溯源體系基礎(chǔ)設(shè)施架構(gòu)和內(nèi)容建設(shè),從主體間際關(guān)系的視角對(duì)科學(xué)數(shù)據(jù)溯源活動(dòng)的探討相對(duì)較少。本文擬以區(qū)塊鏈信息對(duì)稱理念為思想框架,融合溯源內(nèi)容和流動(dòng)鏈條以及主體間際關(guān)系優(yōu)化的視角來(lái)探討科學(xué)數(shù)據(jù)溯源問(wèn)題,意圖完善現(xiàn)有的理論范疇。
根據(jù)科學(xué)數(shù)據(jù)的流動(dòng)鏈條,科學(xué)數(shù)據(jù)溯源是將科學(xué)數(shù)據(jù)生產(chǎn)、利用、流轉(zhuǎn)與再生產(chǎn)等多個(gè)控制環(huán)節(jié)進(jìn)行信息記錄并賦予潛在用戶存取權(quán)限,對(duì)科學(xué)數(shù)據(jù)進(jìn)行多方向(正向、逆向和不定向)、多維度(整體共享、部分利用)的追蹤管理,實(shí)現(xiàn)科學(xué)數(shù)據(jù)來(lái)源可查詢、去向可追蹤以及數(shù)據(jù)質(zhì)量可保障的目標(biāo),即科學(xué)數(shù)據(jù)溯源是對(duì)科學(xué)數(shù)據(jù)對(duì)象本身以及基于科學(xué)數(shù)據(jù)的生產(chǎn)、利用、流轉(zhuǎn)與再生產(chǎn)(二次開(kāi)發(fā))等過(guò)程所產(chǎn)生數(shù)據(jù)的一切溯源活動(dòng)[5],見(jiàn)圖1。
圖1 科學(xué)數(shù)據(jù)溯源中的數(shù)據(jù)流
從圖1 可以看出,科學(xué)數(shù)據(jù)溯源不僅包括對(duì)科學(xué)數(shù)據(jù)本身的溯源,而且也包括對(duì)科學(xué)數(shù)據(jù)作用主體信息及其通過(guò)科學(xué)數(shù)據(jù)而產(chǎn)生的各類關(guān)系信息的溯源,這些主體信息以及關(guān)系信息也是追蹤科學(xué)數(shù)據(jù)流向的重要內(nèi)容。一方面可以保障基于科學(xué)數(shù)據(jù)的科學(xué)研究的有效性,通過(guò)科學(xué)數(shù)據(jù)平臺(tái)實(shí)現(xiàn)科學(xué)數(shù)據(jù)質(zhì)量監(jiān)管和問(wèn)題數(shù)據(jù)的有效召回,潛在的數(shù)據(jù)用戶可以通過(guò)查看溯源信息掌握數(shù)據(jù)質(zhì)量的控制環(huán)節(jié),保障自身數(shù)據(jù)利用的安全可靠,降低科學(xué)研究中的不確定性,保障科學(xué)數(shù)據(jù)用戶的權(quán)益。另一方面也可以維護(hù)科學(xué)數(shù)據(jù)生產(chǎn)主體的利益,特別是科學(xué)數(shù)據(jù)經(jīng)過(guò)多次利用流轉(zhuǎn)之后形成新的再生科學(xué)數(shù)據(jù)產(chǎn)品時(shí),不僅應(yīng)該保障科學(xué)數(shù)據(jù)二次開(kāi)發(fā)主體的利益,而且也應(yīng)該維護(hù)科學(xué)數(shù)據(jù)原初生產(chǎn)主體對(duì)再生科學(xué)數(shù)據(jù)產(chǎn)品利用與流轉(zhuǎn)等環(huán)節(jié)的追蹤和知情權(quán)利。因此以科學(xué)數(shù)據(jù)為介體而形成的主體間際關(guān)系是科學(xué)數(shù)據(jù)溯源的重要途徑。
從微觀層面來(lái)講,科學(xué)數(shù)據(jù)溯源體系能夠?yàn)榭茖W(xué)數(shù)據(jù)用戶提供相對(duì)穩(wěn)妥的科學(xué)數(shù)據(jù)集合和科學(xué)數(shù)據(jù)獲取渠道,節(jié)省科學(xué)數(shù)據(jù)用戶的存取成本,對(duì)于科學(xué)數(shù)據(jù)生產(chǎn)者而言,完善的科學(xué)數(shù)據(jù)溯源體系能夠?yàn)槠涔芸乜茖W(xué)數(shù)據(jù)后續(xù)的流通渠道提供便利措施。從宏觀層面來(lái)講,科學(xué)數(shù)據(jù)溯源是科學(xué)數(shù)據(jù)協(xié)同治理的關(guān)鍵環(huán)節(jié),不僅能夠保障科學(xué)數(shù)據(jù)共享活動(dòng)中利益相關(guān)者的權(quán)利,而且能夠規(guī)范其所承擔(dān)的責(zé)任[6]。
隨著《國(guó)家科學(xué)數(shù)據(jù)管理辦法》的頒布,科學(xué)數(shù)據(jù)的開(kāi)放和共享已經(jīng)是大勢(shì)所趨,未來(lái)的科學(xué)數(shù)據(jù)管理不僅僅是鼓勵(lì)更多的科研主體共享數(shù)據(jù),而是需要對(duì)共享或開(kāi)放的數(shù)據(jù)進(jìn)行質(zhì)量管理,降低科學(xué)數(shù)據(jù)流動(dòng)過(guò)程中的不確定性。
科學(xué)數(shù)據(jù)的不確定性貫穿于科學(xué)數(shù)據(jù)生產(chǎn)、流轉(zhuǎn)、應(yīng)用以及二次開(kāi)發(fā)等各個(gè)階段[7]。由于目前共享或開(kāi)放的科學(xué)數(shù)據(jù)質(zhì)量控制管理權(quán)限仍然集中在建設(shè)方或服務(wù)方,二者作為科學(xué)數(shù)據(jù)流動(dòng)鏈條上的重要利益相關(guān)者以及科學(xué)數(shù)據(jù)質(zhì)量控制管理主體,出于自身利益的考慮,存在著隨意篡改科學(xué)數(shù)據(jù)的可能性,這樣無(wú)法從源頭上把握科學(xué)數(shù)據(jù)的質(zhì)量[8]。另外,如果科學(xué)數(shù)據(jù)質(zhì)量控制管理權(quán)限僅僅集中在一種利益相關(guān)者手中,一旦所處平臺(tái)受到攻擊而數(shù)據(jù)被篡改,則將出現(xiàn)科學(xué)數(shù)據(jù)的真實(shí)性難以辨別的負(fù)面境況,加大科學(xué)數(shù)據(jù)利用的不確定性和風(fēng)險(xiǎn)[9]。
從源頭上把握科學(xué)數(shù)據(jù)的質(zhì)量,不僅能夠做到對(duì)科學(xué)數(shù)據(jù)的供應(yīng)予以監(jiān)管,提升科學(xué)數(shù)據(jù)供應(yīng)市場(chǎng)的信譽(yù),而且從長(zhǎng)遠(yuǎn)來(lái)講,還能最大化保證科學(xué)數(shù)據(jù)用戶的權(quán)益。而為了保證科學(xué)數(shù)據(jù)原始生產(chǎn)主體的權(quán)益以及為了維持科學(xué)數(shù)據(jù)開(kāi)發(fā)利用的可持續(xù)性,必須讓科學(xué)數(shù)據(jù)生產(chǎn)主體有權(quán)利而且能夠追蹤科學(xué)數(shù)據(jù)利用、流轉(zhuǎn)以及科學(xué)數(shù)據(jù)二次開(kāi)發(fā)的整個(gè)進(jìn)程,以防止科學(xué)數(shù)據(jù)在被利用、流轉(zhuǎn)以及再生的過(guò)程中,其他數(shù)據(jù)管理或利用主體存在數(shù)據(jù)利用不端或被誤導(dǎo)利用的境況,實(shí)現(xiàn)科學(xué)數(shù)據(jù)溯源的雙向監(jiān)督。但是這種監(jiān)督存在信息不對(duì)稱、監(jiān)管不及時(shí)的現(xiàn)象,當(dāng)科學(xué)數(shù)據(jù)出現(xiàn)質(zhì)量問(wèn)題時(shí),這些參與主體雖然能夠彼此驗(yàn)證,但是往往無(wú)法快速地在有效的時(shí)間內(nèi)確認(rèn)具體的責(zé)任主體,為了防止問(wèn)題科學(xué)數(shù)據(jù)繼續(xù)流轉(zhuǎn),只能從總體上聲明科學(xué)數(shù)據(jù)的問(wèn)題,損害的是真正遵守規(guī)則的參與主體。
因此科學(xué)數(shù)據(jù)溯源不僅僅應(yīng)該涉及數(shù)據(jù)初始生產(chǎn)環(huán)節(jié)中數(shù)據(jù)采集或者建設(shè)情境、數(shù)據(jù)處理的過(guò)程以及相應(yīng)的實(shí)施主體,還需要延伸到科學(xué)數(shù)據(jù)的利用、流轉(zhuǎn)以及二次開(kāi)發(fā)過(guò)程?;趨^(qū)塊鏈的科學(xué)數(shù)據(jù)溯源可以保證整個(gè)科學(xué)數(shù)據(jù)流動(dòng)鏈條上的信息相對(duì)開(kāi)放,各個(gè)環(huán)節(jié)的運(yùn)營(yíng)系統(tǒng)協(xié)同運(yùn)行,有助于建立多方共同信任體系和隱私保護(hù)體系,消除科學(xué)數(shù)據(jù)生產(chǎn)、流轉(zhuǎn)、利用以及二次開(kāi)發(fā)鏈條中的信息孤島現(xiàn)象,提升已然共享的科學(xué)數(shù)據(jù)的真實(shí)性和公信力,發(fā)揮科學(xué)數(shù)據(jù)溯源體系的價(jià)值,實(shí)現(xiàn)科學(xué)數(shù)據(jù)溯源的真正目的[10]。
采用區(qū)塊鏈的方式進(jìn)行科學(xué)數(shù)據(jù)溯源,主要源于區(qū)塊鏈能夠保證所溯源科學(xué)數(shù)據(jù)及其利用與再生信息的完整性、真實(shí)性、連續(xù)性[11]。區(qū)塊鏈作為公共記錄手段的分布式賬本系統(tǒng),能夠?qū)⑴c主體的操作權(quán)限,進(jìn)而能夠保證科學(xué)數(shù)據(jù)、所涉及的主體信息以及主體關(guān)系信息的原始性、完整性和真實(shí)性[12]。
區(qū)塊鏈有助于優(yōu)化乃至打破多科學(xué)數(shù)據(jù)主體之間的信息非對(duì)稱態(tài)勢(shì),降低主體信息交互的成本,優(yōu)化主體之間的信任關(guān)系。在科學(xué)數(shù)據(jù)供應(yīng)、流轉(zhuǎn)、利用以及二次開(kāi)發(fā)的過(guò)程中,涉及到的是多元化的科學(xué)數(shù)據(jù)主體,其瓶頸是面向多主體的信息協(xié)同以及科學(xué)數(shù)據(jù)供應(yīng)和流轉(zhuǎn)的科學(xué)數(shù)據(jù)追溯,需要對(duì)科學(xué)數(shù)據(jù)進(jìn)行跨主體的流轉(zhuǎn)與互操作。對(duì)于科學(xué)數(shù)據(jù)生產(chǎn)主體、科學(xué)數(shù)據(jù)二次開(kāi)發(fā)主體以及科學(xué)數(shù)據(jù)利用主體之間的數(shù)據(jù)獨(dú)立存儲(chǔ)體系,彼此之間無(wú)法建立可強(qiáng)制執(zhí)行的信任,形成數(shù)據(jù)孤島,導(dǎo)致科學(xué)數(shù)據(jù)產(chǎn)品的溯源信息無(wú)法交互與共享。區(qū)塊鏈通過(guò)建立科學(xué)數(shù)據(jù)溯源多主體之間的信息實(shí)時(shí)傳輸系統(tǒng),能夠優(yōu)化改善乃至打破科學(xué)數(shù)據(jù)供應(yīng)和流轉(zhuǎn)以及利用過(guò)程中各個(gè)主體之間的信息非對(duì)稱態(tài)勢(shì)。通過(guò)自身分布式的架構(gòu)體系,科學(xué)數(shù)據(jù)的所有溯源信息存儲(chǔ)在每一個(gè)參與主體節(jié)點(diǎn)上,相應(yīng)的共識(shí)協(xié)議、激勵(lì)機(jī)制使參與主體節(jié)點(diǎn)之間形成一個(gè)彼此驗(yàn)證的網(wǎng)絡(luò),做到多主體信息對(duì)稱和多主體彼此監(jiān)督并實(shí)時(shí)訪問(wèn)的溯源數(shù)據(jù)共享體系[13]。區(qū)塊鏈對(duì)于主體信息以及主體關(guān)系信息的共享,將科學(xué)數(shù)據(jù)主體之間復(fù)雜的信息交互問(wèn)題,轉(zhuǎn)化為科學(xué)數(shù)據(jù)流動(dòng)鏈條上的管理問(wèn)題,實(shí)現(xiàn)科學(xué)數(shù)據(jù)全生命周期的信息存取,有效解決主體信息之間的信息非對(duì)稱問(wèn)題,降低主體信息交互的成本和信任建立的難度以及主體關(guān)系建構(gòu)過(guò)程中的不確定性[14]。
基于區(qū)塊鏈的科學(xué)數(shù)據(jù)溯源有利于認(rèn)定科研主體的學(xué)術(shù)優(yōu)先權(quán),以維護(hù)科研主體的學(xué)術(shù)權(quán)利[15]??茖W(xué)數(shù)據(jù)是科研主體為了實(shí)現(xiàn)相應(yīng)的科研目標(biāo),對(duì)所屬科研領(lǐng)域的相關(guān)科研成果的研發(fā)進(jìn)程進(jìn)行規(guī)劃、設(shè)計(jì)、實(shí)施與分析總結(jié)而獲取的數(shù)據(jù)集合,科研主體對(duì)于科學(xué)數(shù)據(jù)的生產(chǎn)與維護(hù)往往投入了大量的智力勞動(dòng),因此科學(xué)數(shù)據(jù)是主體科研成果及其知識(shí)產(chǎn)權(quán)體系的基礎(chǔ)構(gòu)成要素之一,是科研主體維護(hù)其學(xué)術(shù)權(quán)利的重要依據(jù)。有關(guān)此方面我國(guó)已經(jīng)開(kāi)啟了相應(yīng)的實(shí)踐行動(dòng),2021 年1 月27 日正式發(fā)布的開(kāi)放數(shù)據(jù)聯(lián)盟鏈ODC(Open Data Chain)解決的核心問(wèn)題就是科研真實(shí)性和成果歸屬的認(rèn)定與評(píng)判。傳統(tǒng)意義上的科研領(lǐng)域?qū)W術(shù)優(yōu)先權(quán)往往是通過(guò)被同行認(rèn)可的公開(kāi)發(fā)表的最終科研成果予以確認(rèn);對(duì)于基于區(qū)塊鏈的科學(xué)數(shù)據(jù)溯源活動(dòng)而言,其共識(shí)機(jī)制能夠令學(xué)術(shù)共同體快速認(rèn)知科學(xué)數(shù)據(jù)的生產(chǎn)主體,并能夠有效率地認(rèn)定科學(xué)數(shù)據(jù)對(duì)于最終科研成果的決定性,可為科學(xué)研究提供相應(yīng)的證據(jù)鏈條。因此基于區(qū)塊鏈的科學(xué)數(shù)據(jù)溯源一方面可從基礎(chǔ)數(shù)據(jù)資料層面上確定科研成果的學(xué)術(shù)優(yōu)先權(quán)的歸屬,有利于彌補(bǔ)科研成果發(fā)表遲滯所帶來(lái)的認(rèn)定時(shí)差,另一方面可為學(xué)術(shù)糾紛中責(zé)任主體的認(rèn)定提供基礎(chǔ)依據(jù),更有利于激勵(lì)科研人員沒(méi)有后顧之憂地從事科研活動(dòng)[16]。
基于區(qū)塊鏈的科學(xué)數(shù)據(jù)溯源是以科學(xué)數(shù)據(jù)對(duì)象為基礎(chǔ)節(jié)點(diǎn)對(duì)數(shù)據(jù)進(jìn)行全息式的溯源和追蹤。從內(nèi)容存儲(chǔ)角度看,溯源內(nèi)容包括基礎(chǔ)數(shù)據(jù)對(duì)象和再生數(shù)據(jù)對(duì)象:其中基礎(chǔ)數(shù)據(jù)對(duì)象包括科學(xué)數(shù)據(jù)對(duì)象本身和描述科學(xué)數(shù)據(jù)對(duì)象的數(shù)據(jù),即科學(xué)數(shù)據(jù)元數(shù)據(jù)(基于數(shù)據(jù)對(duì)象屬性來(lái)確定科學(xué)數(shù)據(jù)溯源的描述框架);再生數(shù)據(jù)對(duì)象包括科學(xué)數(shù)據(jù)生產(chǎn)、利用和流轉(zhuǎn)以及二次開(kāi)發(fā)過(guò)程所產(chǎn)生的過(guò)程數(shù)據(jù)、溯源結(jié)果數(shù)據(jù)以及溯源過(guò)程中所觀測(cè)到的主體數(shù)據(jù)及其關(guān)系數(shù)據(jù),這些數(shù)據(jù)作為科學(xué)數(shù)據(jù)對(duì)象本身的再生數(shù)據(jù)和溯源進(jìn)程監(jiān)控?cái)?shù)據(jù)也是科學(xué)數(shù)據(jù)溯源內(nèi)容的重要組成部分[5]。其中科學(xué)數(shù)據(jù)對(duì)象及其元數(shù)據(jù)是溯源活動(dòng)的基礎(chǔ)內(nèi)容,溯源過(guò)程數(shù)據(jù)是溯源最終數(shù)據(jù)流向的依據(jù),結(jié)果數(shù)據(jù)是對(duì)科學(xué)數(shù)據(jù)溯源活動(dòng)的存檔記錄,可以為未來(lái)的科學(xué)數(shù)據(jù)溯源活動(dòng)提供可借鑒的經(jīng)驗(yàn)藍(lán)本,主體數(shù)據(jù)和主體關(guān)系數(shù)據(jù)是科學(xué)數(shù)據(jù)確權(quán)以及維護(hù)主體權(quán)益的證據(jù)信息,基于區(qū)塊鏈的科學(xué)數(shù)據(jù)溯源內(nèi)容結(jié)構(gòu)如圖2 所示。
圖2 基于區(qū)塊鏈的科學(xué)數(shù)據(jù)溯源內(nèi)容結(jié)構(gòu)
根據(jù)科學(xué)數(shù)據(jù)溯源的內(nèi)容,基于區(qū)塊鏈的科學(xué)數(shù)據(jù)溯源平臺(tái)以科學(xué)數(shù)據(jù)對(duì)象為核心,以數(shù)據(jù)生產(chǎn)、數(shù)據(jù)利用和流轉(zhuǎn)、數(shù)據(jù)二次開(kāi)發(fā)等過(guò)程為依據(jù),通過(guò)對(duì)其生產(chǎn)主體、利用主體、流轉(zhuǎn)主體(如數(shù)據(jù)供應(yīng)商)、二次開(kāi)發(fā)主體等信息進(jìn)行前向溯源和后續(xù)追蹤存儲(chǔ),將每一次溯源記錄與所對(duì)應(yīng)的科學(xué)數(shù)據(jù)對(duì)象綁定在一起,形成復(fù)雜多元化的溯源數(shù)據(jù)集合,作為科學(xué)數(shù)據(jù)管理及其質(zhì)量保障的基礎(chǔ)依據(jù)。因此基于區(qū)塊鏈的科學(xué)數(shù)據(jù)溯源活動(dòng)是匯聚多主體資源及其共同智慧的平臺(tái)系統(tǒng),數(shù)據(jù)的真實(shí)性和統(tǒng)一性是平臺(tái)運(yùn)行的基本前提,以滿足科學(xué)研究活動(dòng)的剛性需求和科學(xué)數(shù)據(jù)溯源活動(dòng)的有效性,避免用戶利益的損失和平臺(tái)公信力的下降[17]。
基于區(qū)塊鏈的科學(xué)數(shù)據(jù)溯源活動(dòng),其整個(gè)運(yùn)行體系是開(kāi)放的,不限于特定的主體或者特定的科研項(xiàng)目,有相關(guān)科學(xué)數(shù)據(jù)需求的其他主體都可以參與,共建基于區(qū)塊鏈的可信科學(xué)數(shù)據(jù)生態(tài)系統(tǒng)。但是該溯源系統(tǒng)平臺(tái)不是主體匿名隨意進(jìn)出的數(shù)據(jù)場(chǎng)域,而是要核驗(yàn)主體的身份與數(shù)據(jù)使用意圖,即對(duì)參與方的身份真實(shí)性和意圖合理性進(jìn)行驗(yàn)證。用戶主體的隱私信息以及數(shù)據(jù)利用痕跡可以記錄在區(qū)塊鏈中,但是只有科學(xué)數(shù)據(jù)供應(yīng)主體有權(quán)利掌握科學(xué)數(shù)據(jù)用戶的利用痕跡信息,其他主體無(wú)權(quán)獲取科學(xué)數(shù)據(jù)用戶主體的相關(guān)信息,即只有在利用他人所生產(chǎn)的科學(xué)數(shù)據(jù)的情況下,數(shù)據(jù)用戶主體有責(zé)任和義務(wù)呈報(bào)自身的數(shù)據(jù)利用痕跡,但是只允許對(duì)科學(xué)數(shù)據(jù)用戶主體的總體情況信息進(jìn)行存取,即知道有人利用數(shù)據(jù),但是沒(méi)有權(quán)利獲取利用主體以及如何利用等相關(guān)信息,只有在發(fā)生糾紛才能從系統(tǒng)中調(diào)用詳細(xì)的利用信息;對(duì)于科學(xué)數(shù)據(jù)的二次開(kāi)發(fā)主體而言,需要通過(guò)區(qū)塊鏈向用戶主體提供數(shù)據(jù)初始生產(chǎn)主體的信息[18]。
區(qū)塊鏈的運(yùn)行模式包括三種:公有鏈、私有鏈和聯(lián)盟鏈。公有鏈不對(duì)訪問(wèn)權(quán)限予以要求,整個(gè)鏈內(nèi)的信息是公開(kāi)透明的,參與主體的任何信息訪問(wèn)和存取行為都是有跡可循的,主體之間形成沒(méi)有信任機(jī)制的信任關(guān)系,其代價(jià)是犧牲了主體的信息隱私權(quán)利;私有鏈對(duì)主體的訪問(wèn)權(quán)限予以嚴(yán)格控制,根據(jù)情境所需有選擇性地予以開(kāi)放,因此適合于一定范疇、并能夠?qū)π畔⑦M(jìn)行修改和控制其開(kāi)放規(guī)則的系統(tǒng)環(huán)境;聯(lián)盟鏈采用多個(gè)主體共同參與管理的運(yùn)行模式,在該運(yùn)行模式中,各個(gè)參與主體對(duì)于節(jié)點(diǎn)的控制具有嚴(yán)格的分工,任何節(jié)點(diǎn)都有其特定的管理主體,以規(guī)范數(shù)據(jù)在特定主體之間進(jìn)行讀寫和存取,主體需要經(jīng)過(guò)授權(quán)才能參與網(wǎng)絡(luò)的管理行為[19]。
在科學(xué)數(shù)據(jù)溯源活動(dòng)的實(shí)施過(guò)程中,只有參與主體之間存在一定的信任前提和利益約束,才能保證科學(xué)數(shù)據(jù)溯源活動(dòng)的可持續(xù)性。本部分基于聯(lián)盟鏈和私有鏈的運(yùn)行特征,提出融合私有鏈和聯(lián)盟鏈來(lái)實(shí)施科學(xué)數(shù)據(jù)溯源活動(dòng)的運(yùn)行模式。該運(yùn)行模式首先是基于聯(lián)盟鏈的科學(xué)數(shù)據(jù)溯源運(yùn)行模式,科學(xué)數(shù)據(jù)的生產(chǎn)主體、利用主體、流轉(zhuǎn)主體以及二次開(kāi)發(fā)主體需要系統(tǒng)內(nèi)部的授權(quán)才能加入或退出網(wǎng)絡(luò),在網(wǎng)絡(luò)內(nèi)部不僅科學(xué)數(shù)據(jù)的存在信息、供應(yīng)信息、利用信息、二次開(kāi)發(fā)信息都是公開(kāi)的,而且科學(xué)數(shù)據(jù)供需雙方基于數(shù)據(jù)發(fā)生的一切聯(lián)系信息也是對(duì)稱的,需要成員主體共同協(xié)商維護(hù),即科學(xué)數(shù)據(jù)流動(dòng)的整個(gè)鏈條信息都是可以溯源的,對(duì)于科學(xué)數(shù)據(jù)流動(dòng)鏈條的每個(gè)環(huán)節(jié)的用戶特別是最終用戶而言,能夠通過(guò)網(wǎng)絡(luò)內(nèi)部的公開(kāi)信息和對(duì)稱信息來(lái)溯源預(yù)利用的科學(xué)數(shù)據(jù)的來(lái)源和流向,從而強(qiáng)化其對(duì)科學(xué)數(shù)據(jù)質(zhì)量的正向信念,因此參與主體之間的信任前提得以滿足[20]。其次該聯(lián)盟鏈內(nèi)部也需要配置私有鏈的運(yùn)行模式,因?yàn)樗接墟湹拈_(kāi)放范疇有限,需要對(duì)科學(xué)數(shù)據(jù)溯源活動(dòng)的參與主體權(quán)限進(jìn)行認(rèn)證與限制,在融合兩種鏈的科學(xué)數(shù)據(jù)溯源運(yùn)行模式中,科學(xué)數(shù)據(jù)原初生產(chǎn)主體可以對(duì)任何科學(xué)數(shù)據(jù)溯源記錄或相應(yīng)的參與主體采用私有鏈的認(rèn)證方式和管理模式,即使其在聯(lián)盟鏈中已經(jīng)得以確認(rèn),但是作為聯(lián)盟成員的獨(dú)立個(gè)體也有權(quán)利拒絕為其提供數(shù)據(jù)或者采取不合作的方式,這一切取決于科學(xué)數(shù)據(jù)需求主體的信用等級(jí)是否符合數(shù)據(jù)供應(yīng)主體的預(yù)期[21]。
之所以在聯(lián)盟鏈中進(jìn)一步采用私有鏈的方式對(duì)科學(xué)數(shù)據(jù)的利用、流轉(zhuǎn)以及二次開(kāi)發(fā)進(jìn)行權(quán)限認(rèn)證,就是為了賦予科學(xué)數(shù)據(jù)原初生產(chǎn)主體對(duì)科學(xué)數(shù)據(jù)的后續(xù)作用進(jìn)程的控制權(quán)限。否則如果科學(xué)數(shù)據(jù)的原初生產(chǎn)者對(duì)科學(xué)數(shù)據(jù)的后續(xù)使用進(jìn)程沒(méi)有任何控制權(quán)限,不僅無(wú)法保證科學(xué)數(shù)據(jù)后續(xù)利用和開(kāi)發(fā)的安全性,也無(wú)法對(duì)科學(xué)數(shù)據(jù)生產(chǎn)者獲取后續(xù)進(jìn)程所帶來(lái)的剩余盈余提供保障,這樣會(huì)對(duì)科學(xué)數(shù)據(jù)生產(chǎn)者的積極性帶來(lái)負(fù)面影響,導(dǎo)致科學(xué)數(shù)據(jù)生產(chǎn)者延遲發(fā)布科學(xué)數(shù)據(jù)以最大限度地獲取科學(xué)數(shù)據(jù)的價(jià)值。因此科學(xué)數(shù)據(jù)溯源平臺(tái)應(yīng)該采用私有鏈和聯(lián)盟鏈融合的方式進(jìn)行科學(xué)數(shù)據(jù)溯源及相應(yīng)的管理活動(dòng),保障主體權(quán)利的同時(shí)促進(jìn)長(zhǎng)效激勵(lì)機(jī)制的產(chǎn)生,以滿足參與主體之間的利益約束。
科學(xué)數(shù)據(jù)溯源作為科學(xué)數(shù)據(jù)質(zhì)量與安全管理的重要手段,不僅能為科學(xué)數(shù)據(jù)管理行業(yè)提供基本保障,而且能夠降低科學(xué)數(shù)據(jù)利用中的風(fēng)險(xiǎn),提升科學(xué)數(shù)據(jù)驅(qū)動(dòng)創(chuàng)新研究的效率。為了避免溯源手段存在信息非對(duì)稱、監(jiān)管不及時(shí)的現(xiàn)象,保證科學(xué)數(shù)據(jù)溯源參與主體的權(quán)益,以區(qū)塊鏈為視角對(duì)科學(xué)數(shù)據(jù)溯源的運(yùn)行理念進(jìn)行探討,能夠?qū)⒖茖W(xué)數(shù)據(jù)主體之間的信息非對(duì)稱降到最低:一方面區(qū)塊鏈作為一種共識(shí)機(jī)制,能夠?qū)崿F(xiàn)高效的科學(xué)數(shù)據(jù)溯源活動(dòng),提升已然共享的科學(xué)數(shù)據(jù)的真實(shí)性和公信力,發(fā)揮科學(xué)數(shù)據(jù)溯源的價(jià)值,實(shí)現(xiàn)科學(xué)數(shù)據(jù)溯源的真正目的——促進(jìn)科學(xué)數(shù)據(jù)管理與利用的順利開(kāi)展,另一方面作為協(xié)同治理的激勵(lì)約束機(jī)制,通過(guò)融合私有鏈和聯(lián)盟鏈的科學(xué)數(shù)據(jù)溯源運(yùn)行模式,能夠保障科學(xué)數(shù)據(jù)溯源參與主體信任關(guān)系的建立與利益約束的實(shí)現(xiàn),從而從長(zhǎng)遠(yuǎn)戰(zhàn)略上維護(hù)科學(xué)數(shù)據(jù)溯源參與主體的權(quán)益,以實(shí)現(xiàn)科學(xué)數(shù)據(jù)管理與共享的可持續(xù)性。