戶勝南
(上海大學圖書情報檔案系 上海 200444)
古人云 “慎終追遠,民德歸厚矣”。后代子孫在清明節(jié)祭祀先人的習俗沿襲至今,追思感恩成為中國傳統(tǒng)美德應有之義。注重孝道歷來是中華民族的傳統(tǒng)美德,也是后代子孫一直堅守的內(nèi)心信仰。要盡孝,首先要知道對誰盡孝,要了解自己的祖先所為何人。家譜檔案是同宗共祖的血親集團記載本族世系和事跡的原始記錄,[1]是家族發(fā)展變化和后代子孫身份認證的可靠憑證。家譜檔案可以清晰地展現(xiàn)同一姓氏先輩們的繼承脈絡,是了解家族史的寶貴財富,對于孝道的發(fā)揮起著重要的促進作用。新中國成立后初期,家譜檔案的研究較為冷門,較少得到學者們的重視。十一屆三中全會以后,中國譜牒學會的成立為我國家譜檔案的研究歷程正式拉開了序幕。[2]計算機和互聯(lián)網(wǎng)技術在檔案領域的應用使得傳統(tǒng)的紙質(zhì)檔案逐漸轉為電子檔案。家譜檔案也不例外,按照載體不同分為紙質(zhì)家譜檔案和電子家譜檔案。電子家譜檔案的出現(xiàn)推進了為檔案用戶提供家譜檔案共享服務的進程,為電子家譜檔案集成平臺的構建提供了現(xiàn)實基礎。
我國現(xiàn)存的家譜仍以紙質(zhì)檔案為載體。在檔案用戶查找利用的過程中,時常會出現(xiàn)不知道家譜檔案保存地點的現(xiàn)象。我國的檔案法及相關法規(guī)條例并沒有對家譜檔案的歸屬范圍進行明確的闡述。家譜檔案歸屬范圍不明確使人們變得“無從下手”。對于手中擁有家譜的個人來說,除去隱私曝光和家譜失傳的顧慮,會疑惑于留給家人繼續(xù)保存還是遞交給圖書館、博物館亦或是檔案館等眾多文化機構保管;對于想查找利用家譜的用戶而言,他們將迷茫于家譜到底被保管在哪個文化機構亦或是流傳于哪位高人手中;家譜檔案歸屬范圍不明確,不利于保管家譜檔案的文化機構對家譜檔案進行深入研究,嚴重阻礙了家譜檔案的開發(fā)利用。
目前,我國紙質(zhì)家譜檔案分散保管在圖書館、博物館、檔案館等多個文化機構,有些甚至被個人所保管。紙質(zhì)家譜檔案保管地點分散,往往使得用戶無法在一個機構里借閱處于不同機構的家譜,不能享受到集中統(tǒng)一利用的便利。而且不同的保管機構對于紙質(zhì)家譜檔案的管理側重點是不一樣的。圖書館傾向于把紙質(zhì)家譜檔案當做知識產(chǎn)物,供讀者汲取知識,陶冶情操;博物館側重于把紙質(zhì)家譜檔案當做文物進行保管,沒有把對紙質(zhì)家譜進行開發(fā)利用列入博物館的重點工作;個人最關注的是紙質(zhì)家譜的保管與流傳。紙質(zhì)家譜檔案的開發(fā)利用工作在許多機構或個人那里沒有受到重視,用戶“利用不便”是必然結果。
家譜檔案歸屬范圍不明確且分散保管的現(xiàn)狀,不利于家譜檔案的開發(fā)利用。但是把所有的家譜檔案歸到一個機構里是不符合現(xiàn)實情況的,《檔案法》也規(guī)定了,圖書館、博物館等文化機構也具有保管收藏家譜檔案的權利。[3]所以,我們只能在保持原保管機構主體地位的基礎上采取其他措施來滿足用戶的利用需求。電子家譜檔案集成平臺應運而生。
電子家譜檔案集成平臺是指通過在異構分布環(huán)境(操作系統(tǒng)、網(wǎng)絡、數(shù)據(jù)庫)下提供透明、一致的信息訪問和交互手段,以提供電子家譜檔案資源共享為目的,支持各特定領域應用系統(tǒng)集成的平臺。國內(nèi)的電子家譜檔案集成平臺建設處于起步狀態(tài)。在國內(nèi),上海圖書館積極投身于電子家譜檔案資源共享平臺的建設。上海圖書館把隸屬于其他機構的家譜檔案整合到一起,為用戶提供家譜檔案的館藏地、索書號、條形碼和借閱狀態(tài)等信息,讓用戶了解所需家譜檔案的所處位置,但并沒有直接為用戶提供電子家譜檔案資源。造成這種結果的主要原因是人們對于隱私的保護以及安全意識。安全性是電子家譜檔案集成平臺建設所要考慮的重要關鍵因素。電子家譜檔案集成平臺的安全隱患主要體現(xiàn)在電子家譜檔案的真實性保障和平臺的安全性保障上。
電子家譜檔案集成平臺的建設是實現(xiàn)電子家譜檔案資源的共享、為檔案用戶提供便利服務的重要舉措。而電子家譜檔案的真實性對電子家譜檔案集成平臺的構建有著至關重要的作用。如果電子家譜檔案的真實性受到破壞,電子家譜檔案集成平臺的構建則無根無基,毫無意義可言。電子家譜檔案制作過程具有信息易變性、載體與信息的可分離性等特點,為電子家譜檔案的真實性帶來了很多不確定因素。所以電子家譜檔案的真實性是構建電子家譜檔案集成平臺需要攻克的一個重難點問題。由于電子家譜檔案的特點,檔案管理人員僅從管理方面采取措施并不能夠應對電子家譜檔案的真實性威脅,技術方面的措施也是必要的。
計算機和網(wǎng)絡信息技術的發(fā)展給人們的生活帶來了極大的便利,與此同時,存在著很多潛在的威脅。電子家譜檔案集成平臺的構建使得檔案用戶能夠在同一個平臺使用到分散于不同機構的家譜,大大提高了用戶的利用效率。電子家譜檔案集成平臺要解決電子家譜的異構問題,這直接影響到檔案用戶的使用。除了異構問題,黑客、網(wǎng)絡病毒的防范是電子家譜檔案集成平臺需要關注的重點問題。黑客攻擊主要是通過非法(非授權)訪問,進入服務系統(tǒng),竊取信息,造成家譜檔案的泄密,甚至進行違規(guī)操作,刪除、修改、惡意添加,使正常使用者獲取錯誤信息或者無法獲得服務,干擾系統(tǒng)的正常運行。病毒攻擊主要是利用系統(tǒng)存在的漏洞和人為的疏忽,潛入并破壞計算機系統(tǒng),使得計算機系統(tǒng)無法正常運行,直接影響到電子家譜檔案的信息安全。黑客、網(wǎng)絡病毒的存在給網(wǎng)絡環(huán)境的安全帶來了極大的威脅,使得電子家譜檔案集成平臺隨時面臨著被黑掉的可能。
區(qū)塊鏈(Blockchain),是比特幣的一個重要概念,由中本特于2008年第一次提出?!八举|(zhì)上是一個去中心化的數(shù)據(jù)庫,同時作為比特幣的底層技術,是一串使用密碼學方法相關聯(lián)產(chǎn)生的數(shù)據(jù)塊,每一個數(shù)據(jù)塊中包含了一批次比特幣網(wǎng)絡交易的信息,用于驗證其信息的有效性(防偽)和生成下一個區(qū)塊”[4]。區(qū)塊鏈不是單一的技術,它具有綜合性,是一個集成了多方面研究成果基礎上的綜合性技術系統(tǒng)。[5]它包括時間戳技術、非對稱加密算法、分布式賬本、共識機制、智能合約等關鍵技術。區(qū)塊鏈具有去中心化、所有節(jié)點共同記賬、“人人平等”的特點,適用于解決交易的信任和安全問題。
科學技術的飛速發(fā)展為電子家譜檔案信息集成平臺的建設帶來了曙光。要構建一個合格的電子家譜檔案信息集成平臺,前提就是要確保平臺資源的可靠性,即電子家譜檔案的真實性。
由于家譜檔案的形成具有連續(xù)性,歷經(jīng)時代變遷,家譜檔案的流傳要承受很多內(nèi)部因素和外部因素的干擾。內(nèi)部因素主要表現(xiàn)在家譜檔案本身載體的性質(zhì),外部因素分為人為因素和自然災害因素,所以電子家譜檔案形成的基礎——紙質(zhì)家譜檔案的真實性有待考量。而且相對于紙質(zhì)家譜檔案,電子家譜檔案面臨著更多的威脅,主要是因為電子家譜檔案具有信息易變性、檔案與載體的可分離性等特點。對于電子家譜檔案的形成過程,管理人員無法進行過程追蹤,因此它的真實性很難得到有效的保障。電子家譜檔案的真實性如果無法得到有效保障,檔案用戶的利用就失去了意義。
區(qū)塊鏈具有去中心化的特點,多個節(jié)點都具有“記賬”和“監(jiān)督”功能,所有的節(jié)點都處于平等的地位,遵循少數(shù)服從多數(shù)的原則。理論上來講,如果負責電子家譜檔案的區(qū)塊鏈的一半以上節(jié)點被修改,電子家譜檔案內(nèi)容才有改變的可能。這在很大程度上加強了記帳內(nèi)容的真實性保障,為電子家譜檔案的真實性披上一層堅固的盔甲,全節(jié)點參與的共同治理模式,開啟了信任保障的新機制。[6]此外,區(qū)塊鏈技術中時間戳、智能合約、保密算法等技術的應用能夠在文件存儲和再利用階段有效防偽保密,保證信息安全,且在文件形成過程中做到透明可追溯,加強對電子文件真實性的保護。[7]以時間戳技術為例,它的具體應用要經(jīng)過幾個步驟,首先用戶選定文件,運用哈希算法生成摘要,然后把文件生成的摘要發(fā)給第三方數(shù)字時間戳服務機構(DTS),DTS收到文件摘要后,將收到文件摘要的時間信息加入文件里,進行加密,再發(fā)回給用戶。由此可見,區(qū)塊鏈的時間戳機制通過所有節(jié)點對電子家譜檔案從形成、保存等過程中形成的信息加蓋時間印章和信息主體的數(shù)字簽名的方式,直接對電子家譜檔案進行追蹤,實現(xiàn)電子家譜檔案生命周期的全過程管理。
互聯(lián)網(wǎng)等計算機網(wǎng)絡技術使得同一資源的異地傳送和不同資源的集成共享成為了現(xiàn)實,為人們利用資源提供了便利條件。但是互聯(lián)網(wǎng)環(huán)境復雜,隱藏著黑客和計算機病毒等許多危險因素,網(wǎng)絡資源的安全一直是人們關注的重中之重。電子家譜檔案的安全可分為兩方面,一是指電子家譜檔案的使用價值不受到破壞,能夠以檔案保存時的原始面貌呈現(xiàn)在用戶面前;二是指電子家譜檔案只能被擁有使用權限的用戶使用。
區(qū)塊鏈技術在電子家譜檔案集成平臺的應用能夠提高電子家譜檔案安全性的有效保障。一方面,區(qū)塊鏈的非對稱加密算法能夠保護電子家譜檔案保存時的原始內(nèi)容不被修改;非對稱加密算法的運行原理是在信息傳遞的過程中,通過兩個密鑰(公鑰進行加密,私鑰進行解密)來達到信息安全保障的效果。信息接收方首先生成一對密鑰,并將公鑰發(fā)送給信息發(fā)送方,信息發(fā)送方通過公鑰對信息進行加密并發(fā)送,接收方使用預先生成的私鑰進行數(shù)據(jù)解密,可以避免密鑰在傳輸過程中的安全問題[8]。檔案工作者可以利用非對稱加密算法,授予檔案用戶相應的權限以利用電子家譜檔案,既滿足了檔案用戶的利用需求,也能夠限制電子家譜檔案的非法擴散。另一方面,區(qū)塊鏈支持分布式存儲。分布式存儲通過將數(shù)據(jù)分布存儲在各個節(jié)點上來提高數(shù)據(jù)的安全性。每個節(jié)點都能存儲數(shù)據(jù)變動的完整過程,都能對數(shù)據(jù)進行監(jiān)督。如果存儲數(shù)據(jù)的某一節(jié)點被攻陷,其他節(jié)點不會受影響,仍會正常運行,繼續(xù)承擔起保護數(shù)據(jù)安全的職責。由于我們不在中心化的服務器上存儲數(shù)據(jù),所以不會發(fā)生因服務器癱瘓而引起的數(shù)據(jù)丟失的情況。而且隨著加入?yún)^(qū)塊鏈節(jié)點的增多,數(shù)據(jù)安全性的加強,就能得到更多節(jié)點的監(jiān)督與維護。
區(qū)塊鏈作為一門擁有極大潛力的綜合性新興技術,受到金融、教育、公共服務等多領域的關注。它的“去中心化”特點、分布式賬本、非對稱加密算法等技術為數(shù)據(jù)提供了安全保障。這種安全保障的特點在于去中心化,由多節(jié)點共同管理、共同監(jiān)督,遵循少數(shù)服從多數(shù)的原則。如果把區(qū)塊鏈技術運用到家譜檔案集成利用平臺的構建,那么其安全性將得到很大程度的保障。但是這種安全性保障并不是絕對的。區(qū)塊鏈的安全性是以大量的可信計算節(jié)點為基礎的,確保在其發(fā)展之前不會受到來自于外部的數(shù)據(jù)攻擊是一大挑戰(zhàn)。[9]理論上來講,如果一半以上的節(jié)點被惡意攻擊成功,數(shù)據(jù)的安全性就不能夠得到保障。雖然攻擊一半以上節(jié)點的成本代價比較大,但這種小概率情況仍有發(fā)生的可能。同時,隨著時代的進步和信息技術的發(fā)展,區(qū)塊鏈技術可能越來越不能保證絕對的安全。區(qū)塊鏈的安全保障機制存在著許多安全隱患,需要通過不斷的完善來維護數(shù)據(jù)的安全。
區(qū)塊鏈的分布式賬本機制要求各個節(jié)點共同記賬,以增加賬本的可信度。 每個節(jié)點都會把數(shù)據(jù)變動的過程完整地記錄下來,達到相互監(jiān)督的結果。這樣下來,數(shù)據(jù)由多個節(jié)點共同維護,數(shù)據(jù)的可靠性確確實實有所提高。但是每個節(jié)點都需要一定的空間來保存信息,隨著節(jié)點的不斷增多,需要存儲的信息會越來越多,所需要的存儲空間就會越來越大。根據(jù)阿里的研究,聯(lián)盟鏈項目超級賬本架構 (Hyperledger Fabric)下每個區(qū)塊鏈應用的上鏈數(shù)據(jù)存在61TB的容量上限。[10]長此以往,存儲空間的固定容量將不能滿足日益增長的海量數(shù)據(jù),這將會對區(qū)塊鏈的應用發(fā)展產(chǎn)生制約,也是運用區(qū)塊鏈的平臺必須考慮的問題。
區(qū)塊鏈上記錄了從創(chuàng)建以來的每一條(筆)數(shù)據(jù)(交易),為保持同步,每一個參與節(jié)點都必須下載存儲并實時更新從創(chuàng)世塊開始不斷擴充的數(shù)據(jù)集合[11]。重復的數(shù)據(jù)存儲不可避免地會帶來存儲資源浪費和電能耗費等后果,與中心化結構的應用相較而言,分布式中心的應用具有明顯的算力資源浪費等。[12]據(jù)有關數(shù)據(jù)顯示,比特幣一年的耗電量占全球耗電量的0.13%,超過數(shù)十個國家的全國年用電量。[13]
區(qū)塊鏈在檔案領域的應用處于初步探索階段。目前檔案學者所發(fā)的與區(qū)塊鏈有關的文獻,大多數(shù)都是探討區(qū)塊鏈的特點以及區(qū)塊鏈在檔案領域的適用性,缺乏實際案例。區(qū)塊鏈有其獨特的優(yōu)勢,它以分布式賬本、非對稱加密等技術增強了電子家譜檔案的真實性和可靠性,為家譜檔案集成利用平臺的安全運行提供了保障。但區(qū)塊鏈不是萬能藥,它具有去中心化的特點,要求所有節(jié)點共同記賬、共同監(jiān)督,這樣的運行程序使得應用平臺不得不保存很多重復的數(shù)據(jù)信息,造成了數(shù)據(jù)資源的浪費。