秦森林
(四川大學(xué)計(jì)算機(jī)學(xué)院,成都610065)
近年來隨著互聯(lián)網(wǎng)和大數(shù)據(jù)的快速發(fā)展,特別是移動(dòng)互聯(lián)網(wǎng)已經(jīng)進(jìn)入到我們生活的方方面面。人們對(duì)于數(shù)據(jù)的認(rèn)識(shí)已經(jīng)有了很大的提升。大數(shù)據(jù)時(shí)代的來臨,數(shù)據(jù)已成為各領(lǐng)域最重要的生產(chǎn)資料,公眾的數(shù)據(jù)意識(shí)和使用能力隨之迅速提升[1]。一個(gè)國(guó)家絕大多數(shù)的數(shù)據(jù)都被政府所擁有,政府部門也是數(shù)據(jù)最大的生產(chǎn)者,所以政府?dāng)?shù)據(jù)共享可以豐富公眾獲取數(shù)據(jù)的渠道,數(shù)據(jù)獲得后可以將政府?dāng)?shù)據(jù)的潛在價(jià)值挖掘出來并且?guī)砭薮蟮男б?。與此同時(shí),政府?dāng)?shù)據(jù)的開放增強(qiáng)了信息民主化建設(shè),使政府決策更加科學(xué)、精準(zhǔn)、有效,政府工作將會(huì)更透明高效的開展。另外,政府?dāng)?shù)據(jù)的共享可以使政府部門內(nèi)部相互協(xié)作,提高工作效率。然而數(shù)據(jù)的共享必然會(huì)面臨一系列安全和信任問題,數(shù)據(jù)會(huì)不會(huì)遭到篡改,數(shù)據(jù)會(huì)不會(huì)泄漏這些問題亟待解決。
區(qū)塊鏈本質(zhì)上可以理解為分布式賬本,是眾多技術(shù)的結(jié)合體,這些技術(shù)包括點(diǎn)對(duì)點(diǎn)傳輸、共識(shí)算法、分布式存儲(chǔ)與加解密算法等。區(qū)塊鏈利用塊鏈?zhǔn)浇Y(jié)構(gòu)來驗(yàn)證與存儲(chǔ)數(shù)據(jù),基于分布式共識(shí)算法來生成和更新數(shù)據(jù),通過密碼學(xué)的方式保證數(shù)據(jù)傳輸與訪問的安全。從功能上看,區(qū)塊鏈記錄不可篡改,不需要第三方中介的介入。而且區(qū)塊鏈具有去中心化的特點(diǎn),能夠減少服務(wù)器宕機(jī)造成的數(shù)據(jù)丟失以及可以降低對(duì)中心服務(wù)器管理的復(fù)雜性等問題[2]。本文的設(shè)計(jì)正是基于區(qū)塊鏈技術(shù)特有的優(yōu)勢(shì),設(shè)計(jì)了一個(gè)基于區(qū)塊鏈的政府?dāng)?shù)據(jù)開放和共享模型。
美國(guó)是數(shù)據(jù)開放的先行者,在數(shù)據(jù)的采集、處理、挖掘與管理各個(gè)方面已經(jīng)相對(duì)成熟,已經(jīng)擁有了一套十分成熟的運(yùn)作體系。近年來,美國(guó)政府已經(jīng)將數(shù)據(jù)上升至國(guó)家戰(zhàn)略角度,并且已經(jīng)將數(shù)據(jù)作為資產(chǎn)進(jìn)行管理,目前成效顯著。在美國(guó)之后就是歐盟了,在過去的幾年里,歐盟關(guān)于科學(xué)數(shù)據(jù)的基礎(chǔ)設(shè)施投資已經(jīng)達(dá)到了一億多歐元,并且歐盟已經(jīng)將大數(shù)據(jù)信息化的發(fā)展作為了Horizon 2020 的有限領(lǐng)域之一[3]。我國(guó)國(guó)務(wù)院在2015 年9 月15 日發(fā)布的《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》中提出,將在2018 年底前建成國(guó)家政府?dāng)?shù)據(jù)統(tǒng)一開放平臺(tái)。在這一總目標(biāo)下,自2011 年起,北京、上海等地區(qū)在大數(shù)據(jù)的影響下率先開啟了政府?dāng)?shù)據(jù)開放的工作,建立了各自的政府?dāng)?shù)據(jù)開放平臺(tái)。2018 年5月8 日,成都市公共數(shù)據(jù)開放平臺(tái)(www.cddata.gov.cn)正式上線,標(biāo)志著成都公共數(shù)據(jù)開放工作邁出了重要一步[4]。
現(xiàn)有的政府?dāng)?shù)據(jù)開放平臺(tái)不管是國(guó)外的還是國(guó)內(nèi)的都是基于傳統(tǒng)方法來存儲(chǔ)數(shù)據(jù),將數(shù)據(jù)以文件存儲(chǔ)、將相關(guān)信息以數(shù)據(jù)庫(kù)存儲(chǔ),這種方式雖然簡(jiǎn)單方便但是安全性極差,極易被黑客或別有用心的不法分子利用和篡改。另外,現(xiàn)有的政府?dāng)?shù)據(jù)開放平臺(tái)的數(shù)據(jù)都是免費(fèi)的數(shù)據(jù),政府對(duì)于開放平臺(tái)的管理還處于起步階段,對(duì)于數(shù)據(jù)的流通還沒有明確的法律法規(guī)。目前,中國(guó)進(jìn)入了經(jīng)濟(jì)發(fā)展的新階段,大數(shù)據(jù)作為經(jīng)濟(jì)增長(zhǎng)的新動(dòng)力、政府科學(xué)決策的新方法,迫切需要探索一種新的政府大數(shù)據(jù)管理和使用模式,制定一定的規(guī)范,使政府大數(shù)據(jù)既可以方便群眾、構(gòu)建一個(gè)更高效更透明的政府,又可以創(chuàng)造一定的價(jià)值和收益,帶來一定的經(jīng)濟(jì)效益,進(jìn)而不斷推動(dòng)政府開放更多更有價(jià)值的數(shù)據(jù)出來。
數(shù)據(jù)作為一種資源和資產(chǎn),只有共享才能發(fā)揮出它的潛在價(jià)值。當(dāng)前由政府主導(dǎo)的政府?dāng)?shù)據(jù)開放平臺(tái)的運(yùn)行仍處于不成熟的階段,很多有價(jià)值的數(shù)據(jù)都還沒有開放,主要原因在于政府對(duì)于數(shù)據(jù)開放后數(shù)據(jù)安全的考慮。因此,如何能在確保數(shù)據(jù)安全的前提下,開放更多更有價(jià)值的政府?dāng)?shù)據(jù),將會(huì)是今后發(fā)展的趨勢(shì)。
區(qū)塊鏈有很多優(yōu)良的特性。
(1)多中心:不同于傳統(tǒng)應(yīng)用的中心化數(shù)據(jù)管理,區(qū)塊鏈技術(shù)基于P2P 網(wǎng)絡(luò),去掉了中心化服務(wù)器,也沒有數(shù)據(jù)的管理機(jī)構(gòu),單個(gè)節(jié)點(diǎn)的鼓噪不會(huì)對(duì)整個(gè)系統(tǒng)造成影響,區(qū)塊鏈網(wǎng)絡(luò)中有多個(gè)節(jié)點(diǎn)相互監(jiān)督,從而避免了數(shù)據(jù)造假,提高了數(shù)據(jù)的安全性。整個(gè)網(wǎng)絡(luò)基于開源的信用算法,所有交易都發(fā)生在節(jié)點(diǎn)設(shè)備上,不需要任何信任中介及信用背書,大幅降低了信任成本。
(2)可信任、可溯源:區(qū)塊鏈中的交易記錄都通過Hash 算法等密碼學(xué)方法與相鄰區(qū)塊相連,交易數(shù)據(jù)和其他數(shù)據(jù)不可篡改并且可溯源,可以很好地解決信任問題,不需要信任中介,降低了信任成本。
(3)可靠數(shù)據(jù)庫(kù):區(qū)塊鏈中所有的節(jié)點(diǎn)都有全部交易數(shù)據(jù)與其他數(shù)據(jù)的備份,使數(shù)據(jù)有高度冗余的特性。理論上除非能操控51%以上的節(jié)點(diǎn),否則個(gè)別節(jié)點(diǎn)的宕機(jī)失效甚至遭到篡改都不會(huì)對(duì)整體數(shù)據(jù)造成影響。
(4)交易透明,匿名:交易雙方以及系統(tǒng)的參與者都是匿名的,而且交易是通過純算法來實(shí)現(xiàn),保證了交易數(shù)據(jù)透明而且也保護(hù)了個(gè)人隱私。
(5)自動(dòng)化:區(qū)塊鏈系統(tǒng)中的智能合約是可以自動(dòng)化的執(zhí)行一些預(yù)先定義好的規(guī)則和約定的一段計(jì)算機(jī)程序代碼,它大大提高了價(jià)值傳輸與契約達(dá)成的效率。
本文在區(qū)塊鏈的技術(shù)基礎(chǔ)上設(shè)計(jì)政府?dāng)?shù)據(jù)開放和共享的模型,如圖1 所示,主要分為應(yīng)用層、智能合約層、共識(shí)層、網(wǎng)絡(luò)層與數(shù)據(jù)層。
圖1 政府?dāng)?shù)據(jù)開放和共享模型架構(gòu)
數(shù)據(jù)來源主要有三種形式:首先政府相關(guān)部門會(huì)手動(dòng)上傳一部分?jǐn)?shù)據(jù),這種方式是當(dāng)前獲取數(shù)據(jù)的主要方式,而各種電子政務(wù)系統(tǒng)如人事管理系統(tǒng)等也是政府?dāng)?shù)據(jù)開放共享的來源之一,另外,政府部門有很多的物聯(lián)網(wǎng)設(shè)備,例如交管部門的電子眼等這些都可以作為數(shù)據(jù)的來源。其中后兩者都是未來為本模型提供數(shù)據(jù)的主要方式,這兩種方式更智能更方便,不需要手動(dòng)上傳,大大提高了數(shù)據(jù)上傳的效率。
數(shù)據(jù)層與網(wǎng)絡(luò)層主要提供底層技術(shù)支持,對(duì)區(qū)塊鏈的格式進(jìn)行了定義,保證數(shù)據(jù)進(jìn)行安全有效地傳輸。數(shù)據(jù)層由加解密算法確保安全,Hash 摘要算法可以確保數(shù)據(jù)不可篡改,并且需要按照定義好的區(qū)塊鏈格式,最后加上時(shí)間戳形成區(qū)塊,然后連接成區(qū)塊鏈。網(wǎng)絡(luò)層主要是對(duì)節(jié)點(diǎn)網(wǎng)絡(luò)接入和傳輸?shù)闹С?,使用P2P 網(wǎng)絡(luò)并進(jìn)行身份驗(yàn)證之后將相應(yīng)的數(shù)據(jù)存儲(chǔ)在分布式節(jié)點(diǎn)中。
智能合約層與共識(shí)層主要的作用是進(jìn)行節(jié)點(diǎn)的協(xié)同與管理,確保在多節(jié)點(diǎn)的情況下如何達(dá)成一致、如何自動(dòng)化執(zhí)行約定好的合約。在本模型中共識(shí)層使用PoS(股權(quán)證明機(jī)制)或DPoS(股權(quán)授權(quán)證明機(jī)制)的共識(shí)算法,摒棄了比特幣使用的PoW(工作量證明機(jī)制)。而智能合約層主要是將相關(guān)的法律法規(guī)等內(nèi)容嵌入到本模型區(qū)塊鏈中,利用計(jì)算機(jī)程序自動(dòng)執(zhí)行相關(guān)的規(guī)則。
本模型的應(yīng)用層主要是政府?dāng)?shù)據(jù)開放共享平臺(tái)信息門戶網(wǎng)站。該網(wǎng)站可以作為政府?dāng)?shù)據(jù)交易的平臺(tái)。而數(shù)據(jù)的消費(fèi)者可以是普通用戶、政府部門還有第三方公司,例如圍繞數(shù)據(jù)產(chǎn)業(yè)鏈做采集、清洗、建模、脫敏、脫密、可視化、算法的公司。
眾所周知,比特幣是基于區(qū)塊鏈的典型應(yīng)用。比特幣中每個(gè)區(qū)塊主要包括區(qū)塊頭和區(qū)塊體,其中區(qū)塊頭由上一個(gè)區(qū)塊頭的Hash 值、區(qū)塊頭Hash 值、Merkle樹根的哈希值、時(shí)間戳、難度指標(biāo)、Nonce 隨機(jī)數(shù)等信息組成,而區(qū)塊體主要是包含交易數(shù)據(jù)。而在本模型中我們除了要保存交易信息外,我們還需要保存共享的政府?dāng)?shù)據(jù)信息。在這里我們對(duì)區(qū)塊的結(jié)構(gòu)進(jìn)行修改,我們將政府開放共享的數(shù)據(jù)進(jìn)行Hash 計(jì)算后放入?yún)^(qū)塊體中,并且將這塊信息形成Merkle 樹將Merkle 樹根放入?yún)^(qū)塊頭中,該結(jié)構(gòu)如圖2 所示。
圖2 政府?dāng)?shù)據(jù)開放和共享模型區(qū)塊結(jié)構(gòu)
本模型設(shè)計(jì)了政府?dāng)?shù)據(jù)開放共享平臺(tái)信息門戶,可以作為政府?dāng)?shù)據(jù)交易的平臺(tái),也是普通消費(fèi)者獲取政府?dāng)?shù)據(jù)的平臺(tái),消費(fèi)者可以通過搜索查看得到自己想要的政府?dāng)?shù)據(jù)。政府部門在本平臺(tái)的后臺(tái)可以上傳相應(yīng)的政府?dāng)?shù)據(jù),未來可以使用物聯(lián)網(wǎng)設(shè)備與各種電子政務(wù)系統(tǒng)自動(dòng)化的介入該平臺(tái)。該平臺(tái)的底層使用了區(qū)塊鏈技術(shù),保證了數(shù)據(jù)的不可篡改。
本文分析了目前我國(guó)的政府?dāng)?shù)據(jù)開放平臺(tái)存在的問題,利用區(qū)塊鏈技術(shù)不可篡改、去中心化與可信任的優(yōu)勢(shì),設(shè)計(jì)了一個(gè)政府?dāng)?shù)據(jù)開放與共享的模型。通過本模型,更好地改進(jìn)了政府?dāng)?shù)據(jù)開放平臺(tái)的不足,提高了政府?dāng)?shù)據(jù)開放和共享過程中的安全性,保證了數(shù)據(jù)的不可篡改,更好地促進(jìn)了政府?dāng)?shù)據(jù)的開放共享。