周 靜
(肇慶市圖書館,廣東肇慶526040)
為了拓展網(wǎng)絡(luò)圖書館資源,為用戶提供更優(yōu)質(zhì)服務(wù),國內(nèi)圖書館相繼開啟了機(jī)構(gòu)知識庫建設(shè),以更加專業(yè)的數(shù)據(jù)管理技術(shù),提升知識共享水平。在圖書館機(jī)構(gòu)知識庫建設(shè)過程中,區(qū)塊鏈技術(shù)可在知識產(chǎn)權(quán)保護(hù)、用戶訪問數(shù)據(jù)保護(hù)與數(shù)據(jù)開放方面提供支持。
機(jī)構(gòu)知識庫(Institutional Repository-KUIR,IR)是基于開放獲取理念的新型在線服務(wù)平臺,集知識發(fā)現(xiàn)、保存、利用、傳播功能于一體的共享平臺[1]。機(jī)構(gòu)知識庫與圖書館的結(jié)合始于2004 年,IR技術(shù)的發(fā)展經(jīng)歷了系統(tǒng)論述、理論探索、實(shí)踐研究三個階段。機(jī)構(gòu)知識庫綜述文章多來源于外文文獻(xiàn),研究領(lǐng)域日益細(xì)分,統(tǒng)計(jì)現(xiàn)有相關(guān)研究成果可知,互操作性、聯(lián)盟建設(shè)、評價研究是機(jī)構(gòu)知識庫學(xué)術(shù)界的熱點(diǎn)研究方向[2,3]。
1)從IR 的互操作角度看,首先應(yīng)搭建互操作應(yīng)用需求框架,互操作制度與行為規(guī)范應(yīng)同時滿足各利益相關(guān)方需求,中國科學(xué)院國家科學(xué)圖書館蘭州分館的姚曉娜等人研究通過機(jī)構(gòu)知識庫OAI 元數(shù)據(jù)互操作接口擴(kuò)展,來實(shí)現(xiàn)條目數(shù)據(jù)與資源集合的實(shí)時同步,從而實(shí)現(xiàn)復(fù)雜元數(shù)據(jù)格式的數(shù)據(jù)共享與雙向傳輸。
2)從IR 的聯(lián)盟建設(shè)角度來看,公共圖書館機(jī)構(gòu)知識庫聯(lián)盟建設(shè)應(yīng)重點(diǎn)考慮四個方面:知識產(chǎn)權(quán)保護(hù)、數(shù)據(jù)資源質(zhì)量保障、數(shù)據(jù)資源存繳制度規(guī)范、政策框架搭建。中國科學(xué)院文獻(xiàn)情報中心的魏蕊等人提出將IR 協(xié)同建設(shè)與圖書館IR 聯(lián)盟體系并軌,加大公共圖書館IR 推廣力度,以IR 聯(lián)盟經(jīng)驗(yàn)促進(jìn)環(huán)雄安區(qū)域公共圖書館IR協(xié)同建設(shè)。
3)從IR 評價角度看,應(yīng)以9 項(xiàng)原則及其所包含的績效指標(biāo)為評價基礎(chǔ),與Altmetrics 指標(biāo)評價體系結(jié)合,以適應(yīng)不同機(jī)構(gòu)知識庫評價需求。
區(qū)塊鏈(Blockchain)是一個去中心化的數(shù)據(jù)庫,由“中本聰”最早提出,是數(shù)據(jù)存儲、點(diǎn)對點(diǎn)傳輸、共享機(jī)制、加密算法的綜合應(yīng)用場景[4]。區(qū)塊鏈技術(shù)誕生于金融領(lǐng)域,作為比特幣的底層技術(shù),隨其暴漲而引發(fā)全球關(guān)注。其去中心化、分布式賬本架構(gòu),在打破信息孤島的同時,降低了數(shù)據(jù)管理成本。梳理區(qū)塊鏈技術(shù)要點(diǎn),包含三個因素:是一種數(shù)據(jù)記錄格式;組合成數(shù)據(jù)塊;用于數(shù)據(jù)記錄。區(qū)塊鏈技術(shù)誕生于虛擬數(shù)字貨幣應(yīng)用場景,經(jīng)歷了三個發(fā)展階段:數(shù)字貨幣1.0 階段;智能合約與數(shù)字資產(chǎn)2.0 階段;區(qū)塊鏈社區(qū)3.0 階段[5]。區(qū)塊鏈技術(shù)分為公有區(qū)塊鏈、私有區(qū)塊鏈、聯(lián)盟區(qū)塊鏈三個應(yīng)用場景。
從廣義層面來看,區(qū)塊鏈技術(shù)是一種全新的分布式計(jì)算方法與架構(gòu)基礎(chǔ),數(shù)據(jù)生成與更新基于分布式節(jié)點(diǎn)共識算法,數(shù)據(jù)存儲與驗(yàn)證基于塊鏈?zhǔn)綌?shù)據(jù)結(jié)構(gòu),數(shù)據(jù)傳輸與訪問的安全性基于密碼學(xué)加密算法,數(shù)據(jù)編程與操作基于自由化腳本代碼組成的智能合約。區(qū)塊鏈技術(shù)并不是單純的新技術(shù),而是現(xiàn)有加密算法、P2P文件傳輸?shù)燃夹g(shù)的重新組合,成為一種新型數(shù)據(jù)存儲、記錄、傳輸、展示方案,匯聚這些技術(shù)優(yōu)勢與現(xiàn)有數(shù)據(jù)庫對接。區(qū)塊鏈的核心優(yōu)勢在于去中心化、去信任理念,數(shù)據(jù)存儲與信息記錄支持所有參與者的共同參與,依靠集體維護(hù)形成一個可靠的數(shù)據(jù)庫,區(qū)塊鏈有四個技術(shù)優(yōu)勢:
1)非對稱加密和授權(quán)技術(shù),雖然區(qū)塊鏈上存儲的交易數(shù)據(jù)是公開的,但賬戶身份信息是加密訪問的,只有授權(quán)的數(shù)據(jù)擁有者才能夠訪問,在保障數(shù)據(jù)安全的同時,保護(hù)個人隱私信息。
2)分布式賬本,交易記賬由多個節(jié)點(diǎn)共同完成,這些分布于不同位置的節(jié)點(diǎn)均記錄完整賬目,每個節(jié)點(diǎn)可獨(dú)立監(jiān)督交易過程的合法性,也可共同進(jìn)行佐證。
3)共識機(jī)制,各個不同節(jié)點(diǎn)間達(dá)成共識,遵循有效記錄的一致性認(rèn)定原則,作為一種認(rèn)定手段,同時可以保證數(shù)據(jù)存儲、傳輸、訪問的非改寫性。
4)智能合約,以不可篡改的可信數(shù)據(jù)為參考坐標(biāo),自動完成預(yù)定規(guī)則、條款的執(zhí)行行為。
在國務(wù)院印發(fā)的《“十三五”國家信息化規(guī)劃》中,區(qū)塊鏈技術(shù)第一次正式列入國家發(fā)展規(guī)劃。繼金融領(lǐng)域之后,區(qū)塊鏈技術(shù)在政府辦公、物聯(lián)網(wǎng)、保險、教育、法律、物流等領(lǐng)域均有不同程度應(yīng)用[6]。區(qū)塊鏈技術(shù)在機(jī)構(gòu)知識庫中的應(yīng)用尚處于起步探索階段,但頗受學(xué)術(shù)界關(guān)注,圖書情報檔案領(lǐng)域已開始探討區(qū)塊鏈技術(shù)對電子文件管理模式以及電子健康檔案構(gòu)建等的影響。具體到圖書館領(lǐng)域,已有學(xué)者探討其對于公共圖書館館配數(shù)字化電子文獻(xiàn)資源建設(shè)的影響。憑借區(qū)塊鏈技術(shù)優(yōu)勢,圖書館機(jī)構(gòu)知識庫為圖書館、數(shù)據(jù)資源、終端用戶間提供了一個更便于聯(lián)系的平臺,在信息資源上傳與訪問方面,圖書館與用戶的自主空間均得到釋放。
公共圖書館為公眾提供免費(fèi)圖書資源服務(wù),一般由中央或地方財(cái)政提供資金支持,并負(fù)責(zé)運(yùn)營、管理。高校圖書館與公共圖書館功能定位互為補(bǔ)充,公共圖書館側(cè)重文獻(xiàn)保障、公眾服務(wù);高校圖書館、科研機(jī)構(gòu)側(cè)重科學(xué)研究,但隨著“萬眾創(chuàng)新”政策的推行,公共圖書館也積累了一定數(shù)量的科研成果,且呈現(xiàn)逐年遞增態(tài)勢,其內(nèi)容保存、展示、服務(wù)需要一個集成化平臺。本文選取10個公共圖書館樣本,統(tǒng)計(jì)其在中國知網(wǎng)、萬方數(shù)據(jù)、維普網(wǎng)三大檢索平臺的期刊論文收錄情況,見表1。
表1 國內(nèi)公共圖書館三大檢索平臺論文收錄情況
上表統(tǒng)計(jì)了國內(nèi)10 個公共圖書館期刊論文收錄數(shù)據(jù),各館論文數(shù)量絕大部分已超過百條,部分圖書館收錄數(shù)量超過千余條??蒲谐晒愋统诳撐耐猓€包含電子圖書、專利文檔、項(xiàng)目報告、多媒體資源等多種格式文獻(xiàn)。如果這些科研成果可以在公共圖書館機(jī)構(gòu)知識庫中存儲、交互、展示,其學(xué)術(shù)價值將得到進(jìn)一步發(fā)揮。
機(jī)構(gòu)知識庫有利于科研成果開放存取,科研成果顯示度得到提升,學(xué)術(shù)期刊對科研成果的壟斷格局被打破,營造更加開放的知識共享、傳播、應(yīng)用平臺,公共圖書館對科研成果的收藏屬性,決定了其與機(jī)構(gòu)知識庫天然的內(nèi)生聯(lián)系。在紙質(zhì)期刊出版時代,各機(jī)構(gòu)科研成果分布于不同期刊收錄,不具備集中展示平臺。機(jī)構(gòu)知識庫平臺應(yīng)運(yùn)而生,面向?qū)W者與專業(yè)技術(shù)人員集中展示機(jī)構(gòu)科研實(shí)力,提升公共圖書館整體科研素質(zhì)[7]。
機(jī)構(gòu)知識庫在助力公共圖書館科研成果開放存取的同時,還可降低科研成本,節(jié)省科研人員的期刊購置、查閱費(fèi)用;同時,機(jī)構(gòu)知識庫的開放存取屬性,使科研成果覆蓋范圍擴(kuò)大,獲取方式更加便捷,科研成果影響力、引用率、顯示度得到增強(qiáng)。
機(jī)構(gòu)知識庫除了在學(xué)術(shù)資源傳播與應(yīng)用方面具備技術(shù)優(yōu)勢外,還支持學(xué)術(shù)數(shù)據(jù)保存的長期性,機(jī)構(gòu)科研成果管理機(jī)制得到完善。同時,機(jī)構(gòu)知識庫還支持增值服務(wù)擴(kuò)展業(yè)務(wù),提升科研成果應(yīng)用水平。以中國科學(xué)院機(jī)構(gòu)知識庫建設(shè)為例,在基礎(chǔ)功能建設(shè)同時,又拓展了科研成果管理、學(xué)術(shù)價值評估、作者學(xué)術(shù)名片、科研報告在線瀏覽與下載等增值業(yè)務(wù),為科研人員提供更加豐富的人性化服務(wù)。
機(jī)構(gòu)知識庫提供OAI- MPH 開放接口,支持?jǐn)?shù)據(jù)交換、共享,突破了長期制約數(shù)據(jù)庫發(fā)展的“信息孤島”束縛,互操作性能顯著[8]。OAI-MPH接口實(shí)現(xiàn)了不同機(jī)構(gòu)知識庫間的數(shù)據(jù)一體化檢索,如CALIS 機(jī)構(gòu)知識庫、中國科學(xué)院機(jī)構(gòu)知識庫、臺灣學(xué)術(shù)機(jī)構(gòu)典藏機(jī)構(gòu)知識庫間的互聯(lián)網(wǎng)絡(luò)聯(lián)盟,實(shí)現(xiàn)了零信息孤島數(shù)據(jù)互連,用戶可在集成檢索界面完成數(shù)據(jù)訪問、收藏、下載操作。
對圖書館科研資源機(jī)構(gòu)知識庫聯(lián)盟建設(shè)需求調(diào)研過程中,司莉、莊曉喆認(rèn)為科研人員對科研數(shù)據(jù)上傳至機(jī)構(gòu)知識庫存在顧慮,如數(shù)據(jù)的安全如何得到保障、數(shù)據(jù)涉密及個人隱私、數(shù)據(jù)是否會被越權(quán)使用等。因此,機(jī)構(gòu)知識庫建設(shè)過程中需重點(diǎn)關(guān)注科研資源的長期安全保存與知識產(chǎn)權(quán)保護(hù)。部分學(xué)者還提出數(shù)據(jù)自主提交需求,避免數(shù)據(jù)在中間環(huán)節(jié)提交的改動風(fēng)險。為了擴(kuò)大機(jī)構(gòu)知識庫覆蓋范圍及提高應(yīng)用水平,需要在機(jī)構(gòu)知識庫建設(shè)過程中發(fā)揮區(qū)塊鏈技術(shù)優(yōu)勢。
機(jī)構(gòu)知識庫知識共享業(yè)務(wù)的實(shí)現(xiàn),需要大量科研數(shù)據(jù)作為支撐,但專家學(xué)者、科研人員普遍存在知識產(chǎn)權(quán)保護(hù)不到位、科研成果或研究數(shù)據(jù)被非正常使用的芥蒂,而缺乏科研結(jié)論、數(shù)據(jù)的上傳分享意愿?,F(xiàn)有知識產(chǎn)權(quán)保護(hù)手段為事先簽署授權(quán)協(xié)議書或制定嚴(yán)格的知識產(chǎn)權(quán)條例,保護(hù)手段單一,未形成產(chǎn)權(quán)保護(hù)體系。區(qū)塊鏈提供了技術(shù)層面的知識產(chǎn)權(quán)保護(hù)手段,其不可變更的技術(shù)屬性成為證明知識作品存在的新方式[9]。區(qū)塊鏈技術(shù)在知識產(chǎn)權(quán)保護(hù)領(lǐng)域的應(yīng)用,打消了科研工作者的產(chǎn)權(quán)顧慮。
數(shù)字化公證與區(qū)塊鏈驗(yàn)證搭建了一條虛擬的數(shù)據(jù)鏈條,信息一旦寫入?yún)^(qū)塊鏈便無法更改,研究人員的科研數(shù)據(jù)上傳后,便獲得了不可更改的數(shù)字化身份。同時,全部版權(quán)信息被設(shè)計(jì)為公開透明的,以供追溯查詢操作,在遭遇版權(quán)不清晰糾紛問題時,可通過查閱、舉證來組織有效維權(quán)。抄襲現(xiàn)象有望永久消失,因?yàn)閿?shù)據(jù)使用記錄會被永久保存。在區(qū)塊鏈技術(shù)中,合約會以數(shù)字化形式智能寫入,機(jī)構(gòu)知識庫用戶默認(rèn)其知識產(chǎn)權(quán)保護(hù)條例,憑借區(qū)塊鏈技術(shù)的不可更改特性,保障科研數(shù)據(jù)存儲、訪問、下載流程的透明化及可追溯性。
數(shù)據(jù)的開放性與安全性是相互矛盾的,對公共圖書館機(jī)構(gòu)知識庫而言,用戶的參與程度與使用體驗(yàn)直接決定了數(shù)據(jù)資源獲取的便捷程度。
機(jī)構(gòu)知識庫的建設(shè)初衷決定了其開放性,應(yīng)盡量減少權(quán)限設(shè)置,否則會降低用戶獲取數(shù)據(jù)的便捷性,降低機(jī)構(gòu)知識庫使用頻次,無法達(dá)到用戶期望水平,阻礙公共圖書館機(jī)構(gòu)知識庫的進(jìn)一步發(fā)展。同時,應(yīng)該設(shè)置必要的數(shù)據(jù)開放權(quán)限,部分研究數(shù)據(jù)包含被調(diào)研者的個人隱私信息,區(qū)塊鏈技術(shù)提供的身份驗(yàn)證功能可很好地實(shí)現(xiàn)訪問權(quán)限設(shè)置。以電子健康檔案為例,包含大量個人隱私信息,在區(qū)塊鏈技術(shù)支持下,通過不同的電子簽名權(quán)限授予機(jī)制,避免隱私數(shù)據(jù)被惡意修改,從而實(shí)現(xiàn)數(shù)字化健康信息的安全有效保存。
電子簽名同樣適用于科研數(shù)據(jù)開放時涉及的個人隱私保護(hù)問題,存儲于區(qū)塊鏈上的科研成果與學(xué)術(shù)信息,通過哈希加密算法生成私鑰和公鑰,私鑰可以是單一的,也可以是多重的,同時支持加入時空維度信息。研究人員的個人隱私信息,獲得了加密技術(shù)與身份驗(yàn)證雙重保護(hù)[10]。不同級別用戶設(shè)置差異化的數(shù)據(jù)獲取權(quán)限,以訪問不同的數(shù)據(jù)內(nèi)容,專家學(xué)者與科研人員的個人隱私得到進(jìn)一步保護(hù)。數(shù)據(jù)開放權(quán)限與圖書館管理體系剝離,數(shù)據(jù)上傳主體依據(jù)信息重要等級,自行選擇適用全部公開、特定用戶公開、特定用戶加密,或全部加密權(quán)限。
區(qū)塊鏈技術(shù)可以構(gòu)造一個順序相連的時間鏈條,建立環(huán)環(huán)相扣的一對一信任關(guān)系,基于共享機(jī)制,保證數(shù)據(jù)記錄的真實(shí)性與準(zhǔn)確性,分布式存儲技術(shù)在保障數(shù)據(jù)安全的同時,還支持?jǐn)?shù)據(jù)校驗(yàn),構(gòu)成一個去中心化的分布式數(shù)據(jù)庫,有序且可信。以區(qū)塊鏈技術(shù)作為支撐,圖書館機(jī)構(gòu)知識庫便可實(shí)現(xiàn)科研人員所上傳實(shí)驗(yàn)數(shù)據(jù)、學(xué)術(shù)報告、論文、著作等資料的長期安全存儲,數(shù)據(jù)校驗(yàn)機(jī)制在很大程度上保證了數(shù)據(jù)的完整性;同時,區(qū)塊鏈技術(shù)的可溯源、不可改寫、加密傳輸、智能合約特性,可輔助數(shù)字化資源的長期安全存儲。共享機(jī)制是一種多方受益模式,去信任化理念構(gòu)造了一個純粹的信任系統(tǒng),科研人員成果上傳后,不用再顧慮抄襲、濫用風(fēng)險,用戶也無須提供信用度,圖書館等第三方機(jī)構(gòu)不再提供用戶高可信度擔(dān)保。參與者對機(jī)構(gòu)知識庫的信任不是建立在人與人之間的信任關(guān)系之上,由于技術(shù)安全的客觀性,隨著參與度的深入,數(shù)據(jù)安全性呈現(xiàn)正比例提升,數(shù)據(jù)內(nèi)容在整個過程中是公開透明的。
區(qū)塊鏈的顯著技術(shù)優(yōu)勢在于去中心化,但是去中心化不是絕對的,應(yīng)辯證看待。去中心化涉及三方面內(nèi)容:政治決策層面、控制邏輯層面、程序架構(gòu)層面。在政治、決策與程序架構(gòu)層面,區(qū)塊鏈的去中心化是容易實(shí)現(xiàn)的,而在控制邏輯層面應(yīng)該是中心化的。程序架構(gòu)層面的去中心化是通過分布式技術(shù)實(shí)現(xiàn)的,控制邏輯層面的中心化,是指統(tǒng)一記賬與數(shù)據(jù)統(tǒng)一,即Global Leader 中央集權(quán)模式。政治決策層的去中心化也不是必然的,視決策制定規(guī)則的差異性而定,部分研究學(xué)者在探索非中心化的公共圖書館機(jī)構(gòu)知識庫系統(tǒng)。機(jī)構(gòu)知識庫的主體是科研數(shù)據(jù)的上傳者與終端平臺用戶,公共圖書館是平臺提供者與參與方。區(qū)塊鏈技術(shù)出現(xiàn)前,圖書館在機(jī)構(gòu)知識庫建設(shè)中扮演協(xié)調(diào)管理與宣傳推廣角色;區(qū)塊鏈技術(shù)的到來,弱化了圖書館的管理屬性,取而代之的是數(shù)據(jù)上傳者與使用者的群體自治性。因此在資源收集方面,公共圖書館職能應(yīng)由包攬向輔助數(shù)據(jù)上傳者轉(zhuǎn)變。