劉千仞,薛 淼,任夢(mèng)璇,任 杰,王光全(中國(guó)聯(lián)通研究院,北京 )
數(shù)據(jù)可以是符號(hào),也可以是文字,還可以是語(yǔ)音或者圖像視頻等,總的來(lái)說(shuō)是信息的表現(xiàn)形式和載體?;ヂ?lián)網(wǎng)帶來(lái)的一個(gè)優(yōu)勢(shì)就是用戶可以便捷地共享數(shù)據(jù),隨著商業(yè)模式的不斷創(chuàng)新,一些企業(yè)發(fā)起可以通過(guò)收集和共享與用戶信息及其行為相關(guān)的數(shù)據(jù)來(lái)獲得利潤(rùn),具體是可以通過(guò)信息訓(xùn)練得出用戶喜好,從而針對(duì)性發(fā)布個(gè)性化廣告。國(guó)家也逐漸意識(shí)到數(shù)據(jù)的重要性,2019年11月1日,在中國(guó)共產(chǎn)黨第十九屆四中全會(huì)新聞發(fā)布會(huì)上,中央首次在公開場(chǎng)合提出數(shù)據(jù)可作為生產(chǎn)要素按貢獻(xiàn)參與分配。2019年11月22日,國(guó)務(wù)院副總理劉鶴在人民日?qǐng)?bào)發(fā)表署名文章,題為《堅(jiān)持和完善社會(huì)主義基本經(jīng)濟(jì)制度》,文章對(duì)數(shù)據(jù)作為新的生產(chǎn)要素,進(jìn)行了詳細(xì)解釋。把數(shù)據(jù)納入生產(chǎn)要素,是因?yàn)閿?shù)據(jù)是推動(dòng)許多新興產(chǎn)業(yè)發(fā)展的基礎(chǔ),其實(shí)反映了數(shù)字經(jīng)濟(jì)是國(guó)家經(jīng)濟(jì)發(fā)展極為重要的支柱。
隨著企業(yè)的規(guī)模越做越大,其產(chǎn)生的獨(dú)有數(shù)據(jù)就越多,所謂的獨(dú)有指的是這些數(shù)據(jù)會(huì)被單獨(dú)存儲(chǔ)在某個(gè)區(qū)域,不與外界聯(lián)通,就像孤島一樣無(wú)法進(jìn)行交互和鏈接,缺乏關(guān)聯(lián)性無(wú)法兼容。這種數(shù)據(jù)之間無(wú)法兼容及協(xié)作的情況便將其稱為數(shù)據(jù)孤島,隨著信息化的不斷能深入,已經(jīng)習(xí)慣了用數(shù)據(jù)來(lái)做決策,用數(shù)據(jù)來(lái)作為參考,而數(shù)據(jù)的基礎(chǔ)在于共享,如果數(shù)據(jù)無(wú)法共享,相互孤立,信息交互便無(wú)從談起,其也更可能導(dǎo)致大量的安全問(wèn)題與信任成本。
當(dāng)下數(shù)據(jù)市場(chǎng)面臨的最大問(wèn)題是什么?毫無(wú)疑問(wèn),就是隱私泄露問(wèn)題。
隨著《中華人民共和國(guó)網(wǎng)絡(luò)安全法》于2017年6月施行,監(jiān)管部門加強(qiáng)了對(duì)個(gè)人數(shù)據(jù)信息的保護(hù)和對(duì)相關(guān)大數(shù)據(jù)機(jī)構(gòu)的經(jīng)營(yíng)約束。而蘋果公司在其推出的最新系統(tǒng)版本中,專門添加了一個(gè)“廣告客戶標(biāo)識(shí)符”(IDFA),也就是設(shè)備標(biāo)識(shí)符,開發(fā)人員在調(diào)用時(shí)必須通過(guò)提示詢問(wèn)用戶才能獲取數(shù)據(jù),這意味著蘋果手機(jī)用戶開始慢慢向互聯(lián)網(wǎng)要回個(gè)人數(shù)據(jù)主權(quán),這顯然是好事,但在這種情況下,孤島效應(yīng)逐漸顯現(xiàn)。好看的“皮囊”千篇一律,有趣的“靈魂”萬(wàn)里挑一。數(shù)據(jù)就是“靈魂”,流動(dòng)起來(lái)的數(shù)據(jù)才能產(chǎn)生價(jià)值。但是現(xiàn)如今數(shù)據(jù)隱私保護(hù)面臨著種種問(wèn)題,想讓數(shù)據(jù)能夠充分流動(dòng)起來(lái)仍然困難重重。
在過(guò)去的幾年里,分布式賬本和區(qū)塊鏈技術(shù)已經(jīng)發(fā)展成為一種很有應(yīng)用前景的技術(shù)手段,在商品溯源、版權(quán)保護(hù)、司法存證、身份認(rèn)證等多種場(chǎng)景中支持可信和不可篡改的記錄,區(qū)塊鏈系統(tǒng)提供一種“智能合約”的技術(shù),允許建立對(duì)訪問(wèn)或修改每個(gè)數(shù)據(jù)實(shí)體的自動(dòng)驗(yàn)證??梢圆渴鹬悄芎霞s來(lái)編碼允許的數(shù)據(jù)使用目的、允許的軟件應(yīng)用程序、可以訪問(wèn)數(shù)據(jù)的人員或企業(yè)、時(shí)間限制、交易價(jià)格等。因此,區(qū)塊鏈提供了一種新的思路,可用于共享用戶數(shù)據(jù)——用戶模型和用戶貢獻(xiàn)的數(shù)據(jù)或研究數(shù)據(jù),及在此基礎(chǔ)上的可信計(jì)算解決方案。
萬(wàn)物互聯(lián)時(shí)代,連接數(shù)和數(shù)據(jù)成幾何增長(zhǎng),據(jù)IDC和Seagate聯(lián)合發(fā)布的白皮書,全球連接數(shù)預(yù)計(jì)到2025年達(dá)到1 000億。全球數(shù)據(jù)存儲(chǔ)量預(yù)計(jì)達(dá)到175 ZB。數(shù)據(jù)市場(chǎng)規(guī)模巨大,2019年數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、產(chǎn)業(yè)轉(zhuǎn)型、數(shù)據(jù)資產(chǎn)管理、信息安全等大數(shù)據(jù)技術(shù)及應(yīng)用市場(chǎng)呈爆發(fā)式增長(zhǎng)。中國(guó)信息通信研究院調(diào)研數(shù)據(jù)顯示,全球大數(shù)據(jù)市場(chǎng)收入規(guī)模預(yù)計(jì)從2019年的490億美元,到2027年將翻番超千億美元,而隨著大數(shù)據(jù)、移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等產(chǎn)業(yè)的深入發(fā)展,中國(guó)大數(shù)據(jù)產(chǎn)值規(guī)模預(yù)計(jì)將從2019年的8 000億增長(zhǎng)到2023年的15 000億,年復(fù)合增長(zhǎng)率(CAGR)為18.35%,處于快速增長(zhǎng)階段,這一切都說(shuō)明數(shù)據(jù)市場(chǎng)正迎來(lái)發(fā)展黃金時(shí)期。圖1示出的是全球及中國(guó)大數(shù)據(jù)市場(chǎng)規(guī)模預(yù)測(cè)。
圖1 全球及中國(guó)大數(shù)據(jù)市場(chǎng)規(guī)模及預(yù)測(cè)
隨著人工智能、云計(jì)算和物聯(lián)網(wǎng)技術(shù)的發(fā)展以及應(yīng)用領(lǐng)域的不斷擴(kuò)展,人們?cè)絹?lái)越關(guān)注數(shù)據(jù)的隱私和價(jià)值潛力。確權(quán)能力的不足使得海量數(shù)據(jù)處于“無(wú)主”狀態(tài),這些用戶隱私數(shù)據(jù)分布在互聯(lián)網(wǎng)巨頭、金融機(jī)構(gòu),甚至政府機(jī)構(gòu)等,互相隔離,形成了數(shù)據(jù)孤島。彼此之間數(shù)據(jù)互通共享的需求很大。
政府在數(shù)據(jù)共享方面有著天然的優(yōu)勢(shì),政府通過(guò)公開大量的數(shù)據(jù)集、網(wǎng)站的API以及網(wǎng)頁(yè)的源代碼,向大數(shù)據(jù)、人工智能、物聯(lián)網(wǎng)設(shè)備等開發(fā)者與數(shù)據(jù)使用者提供大量的應(yīng)用,協(xié)助開發(fā)者更好地使用數(shù)據(jù),試圖改善當(dāng)前數(shù)據(jù)的應(yīng)用模式,助力數(shù)據(jù)共享產(chǎn)業(yè)的發(fā)展。
各國(guó)政府也同時(shí)出臺(tái)大量的數(shù)據(jù)共享指導(dǎo)方針或法律,以規(guī)范數(shù)據(jù)的使用,為數(shù)據(jù)共享產(chǎn)業(yè)發(fā)展指明了方向,同時(shí)也積極推進(jìn)數(shù)據(jù)共享行業(yè)發(fā)展。如美國(guó)、英國(guó)、新加坡、加拿大等都建立了國(guó)家層面的政府?dāng)?shù)據(jù)開放平臺(tái),以分享工業(yè)、農(nóng)業(yè)、服務(wù)業(yè)、環(huán)境保護(hù)等十多個(gè)主題的數(shù)據(jù)。我國(guó)北京、上海、浙江、武漢、青島、無(wú)錫、香港等地區(qū)也紛紛推出了自己的數(shù)據(jù)共享平臺(tái),為數(shù)據(jù)共享產(chǎn)業(yè)的發(fā)展奠定了基礎(chǔ)。
各大企業(yè)也紛紛在數(shù)據(jù)共享行業(yè)進(jìn)行布局,如阿里的天池?cái)?shù)據(jù)開放平臺(tái)、微軟的Azure Data Share、谷歌的kaggle平臺(tái)、IBM的Watson大數(shù)據(jù)與分析平臺(tái)、亞馬遜的Open Data on AWS、百度的數(shù)據(jù)開放平臺(tái)、華為的大數(shù)據(jù)共享交換平臺(tái)等。
可以看出,隨著5G時(shí)代的到來(lái),數(shù)據(jù)隱私保護(hù)的呼聲越來(lái)越高。一方面,人們對(duì)數(shù)據(jù)作為具有巨大潛力的寶貴資源的理解越來(lái)越清晰。另一方面,大量數(shù)據(jù)與移動(dòng)終端及其行為關(guān)聯(lián)度極高,使得用戶越來(lái)越意識(shí)到數(shù)據(jù)隱私保護(hù)的重要性。
人工智能、智能化IoT設(shè)備等領(lǐng)域的市場(chǎng)需求量大且前景向好。但是目前無(wú)法有效地提供足夠多的訓(xùn)練數(shù)據(jù)支撐,使得智能化設(shè)備的開發(fā)周期變長(zhǎng)、精度降低。因此產(chǎn)品生成數(shù)據(jù)的效率和質(zhì)量不高,從而導(dǎo)致數(shù)據(jù)共享市場(chǎng)前進(jìn)緩慢。
數(shù)據(jù)隱私保護(hù)和數(shù)據(jù)共享并不沖突,但是對(duì)于大多數(shù)人來(lái)說(shuō)數(shù)據(jù)共享的觀念尚未形成,或是不愿、不敢、不想共享。權(quán)責(zé)不明、數(shù)字紅利的不可預(yù)見(jiàn)性以及體系不健全導(dǎo)致開放共享生態(tài)環(huán)境差。同時(shí),由于數(shù)據(jù)市場(chǎng)潛力巨大,各家都想通過(guò)自身獲得壟斷性的數(shù)據(jù)獲利,導(dǎo)致資源整合效率降低,限制了數(shù)據(jù)共享市場(chǎng)發(fā)展。
數(shù)據(jù)共享需要解決的問(wèn)題有,多家如何共建數(shù)據(jù)共享平臺(tái),主導(dǎo)權(quán)界定;數(shù)據(jù)共享過(guò)程中如何保證數(shù)據(jù)的權(quán)益歸屬;數(shù)據(jù)共享過(guò)程是否需要激勵(lì);如何確保數(shù)據(jù)流通過(guò)程中全程透明可追溯;如何保證算法在使用過(guò)程中不對(duì)數(shù)據(jù)進(jìn)行非法操作等。
為了解決上述問(wèn)題,就需要引入下一個(gè)概念:可信計(jì)算??尚庞?jì)算指的是在保護(hù)數(shù)據(jù)隱私的前提下對(duì)數(shù)據(jù)的安全計(jì)算和處理??尚庞?jì)算主要使用諸如安全多方計(jì)算和同態(tài)加密之類的加密技術(shù)在數(shù)據(jù)計(jì)算過(guò)程中完全保護(hù)數(shù)據(jù)隱私。
可信計(jì)算概念最早追溯到1983年美國(guó)頒布的《可信計(jì)算機(jī)系統(tǒng)評(píng)價(jià)標(biāo)準(zhǔn)》,TCSEC第一次正式提出了可信計(jì)算機(jī)的概念:可信計(jì)算機(jī)是一種能夠提供系統(tǒng)的可靠性、可用性、信息和行為安全性的計(jì)算機(jī)系統(tǒng)?,F(xiàn)階段可信計(jì)算最主要的2個(gè)屬性就是可靠性和安全性。因此,可信可簡(jiǎn)單表述為可靠加安全。
可信計(jì)算目前的研究方向主要有以下內(nèi)容:同態(tài)加密、安全多方計(jì)算(MPC)、零知識(shí)證明、可信執(zhí)行環(huán)境(TEE)。
同態(tài)加密是一種不需要預(yù)先解密加密數(shù)據(jù)即可執(zhí)行計(jì)算的方法。通過(guò)使用同態(tài)加密技術(shù)將數(shù)據(jù)存儲(chǔ)在區(qū)塊鏈上,可以實(shí)現(xiàn)完美的平衡,而不會(huì)導(dǎo)致區(qū)塊鏈屬性發(fā)生任何重大變化。
零知識(shí)證明是麻省理工學(xué)院研究人員在20世紀(jì)80年代提出的一種加密方法,并且是在可信計(jì)算中廣泛使用的加密算法之一??梢猿浞肿C明自己是某些權(quán)益的合法所有者,而不會(huì)泄漏相關(guān)信息,即給予外界的“知識(shí)”為“零”。
安全多方計(jì)算是由華裔科學(xué)家姚啟智教授于1982年提出的。簡(jiǎn)而言之,安全多方計(jì)算旨在解決保護(hù)一組不受信任方之間的隱私的協(xié)作計(jì)算問(wèn)題。允許多個(gè)數(shù)據(jù)所有者在彼此不信任的情況下執(zhí)行協(xié)作計(jì)算,輸出計(jì)算結(jié)果,并確保除計(jì)算結(jié)果外,任何一方都無(wú)法獲得其他任何多余信息。換句話說(shuō),安全多方計(jì)算技術(shù)可以在不泄露原始數(shù)據(jù)內(nèi)容的情況下獲得數(shù)據(jù)使用價(jià)值。
至于可信執(zhí)行環(huán)境是本文研究的重點(diǎn)方向,后文重點(diǎn)介紹。
可信計(jì)算組織(TCG)以可信賴平臺(tái)模塊(TPM)為核心技術(shù),在可信計(jì)算方面的研究代表了國(guó)外可信計(jì)算技術(shù)的發(fā)展水平。TCG相關(guān)規(guī)范在不斷完善和演進(jìn)過(guò)程中形成了自有的規(guī)范體系,TCG的核心規(guī)范是TPM2.0,作為TPM1.2的修訂版本發(fā)行,目前ISO/IEC將其標(biāo)識(shí)為國(guó)際標(biāo)準(zhǔn)。
我國(guó)從事可信計(jì)算技術(shù)的研究起步較早,并提出了并行計(jì)算和防御的雙重架構(gòu)。這種雙重系統(tǒng)結(jié)構(gòu)具有對(duì)業(yè)務(wù)應(yīng)用程序透明的特性,并被應(yīng)用于大規(guī)模工程系統(tǒng)。這種具有主動(dòng)抗干擾性的可信計(jì)算體系結(jié)構(gòu)是我國(guó)可信計(jì)算技術(shù)發(fā)展中最重要的創(chuàng)新之一。
我國(guó)在可信計(jì)算標(biāo)準(zhǔn)方面也有一定的沉淀和積累?!犊尚庞?jì)算體系結(jié)構(gòu)》標(biāo)準(zhǔn)最初作為團(tuán)體標(biāo)準(zhǔn)發(fā)布,經(jīng)過(guò)長(zhǎng)期修訂與調(diào)整,已于2020年4月28日正式發(fā)布國(guó)家標(biāo)準(zhǔn)版本,于2020年11月1日開始實(shí)施。
可信計(jì)算可以為數(shù)據(jù)安全性提供可信的環(huán)境,并在數(shù)據(jù)計(jì)算過(guò)程中實(shí)現(xiàn)數(shù)據(jù)隱私保護(hù)。因此可信計(jì)算有望改變目前數(shù)據(jù)市場(chǎng)困境,打破孤島現(xiàn)狀,安全可靠地釋放數(shù)據(jù)價(jià)值,并激活數(shù)據(jù)經(jīng)濟(jì)市場(chǎng)。在可信計(jì)算的推動(dòng)下,數(shù)據(jù)市場(chǎng)有望成倍增長(zhǎng)。
早期可信計(jì)算的研究主要以TCG組織為主,國(guó)內(nèi)開展可信計(jì)算研究的思路基本也是跟著TCG的步伐??尚庞?jì)算最核心的就是TPM硬件芯片,而隨著可信計(jì)算的發(fā)展,可信平臺(tái)模塊不一定再是硬件芯片的形式,尤其是在資源條件有限的移動(dòng)和嵌入式環(huán)境中,可信執(zhí)行環(huán)境的研究比較受到青睞,如基于ARM Trust?Zone、SGX、智能卡等可以實(shí)現(xiàn)可信計(jì)算環(huán)境。
3.1.1 TPM 安全芯片
TPM安全芯片是指符合可信賴平臺(tái)模塊標(biāo)準(zhǔn)的安全芯片,它能有效地保護(hù)電腦防止非法用戶訪問(wèn)。安全芯片主要是針對(duì)商業(yè)用戶,需要配合軟件進(jìn)行使用。TPM可以將密鑰存儲(chǔ)在芯片中固化的存儲(chǔ)單元中,可以大大提高其安全性,因此可以用來(lái)存儲(chǔ)和管理BIOS開機(jī)密碼和硬盤密碼;除此之外,TPM安全芯片可以執(zhí)行多種加密:用戶還可以在芯片中存儲(chǔ)應(yīng)用程序軟件密碼;并且還可以加密硬盤的任何部分并將敏感數(shù)據(jù)存儲(chǔ)在其中,以此實(shí)現(xiàn)計(jì)算機(jī)的備份和恢復(fù)功能。
3.1.2 Intel SGX
Intel SGX全稱Intel Software Guard Extensions,它是對(duì)英特爾體系(IA)的一種擴(kuò)展,以增強(qiáng)軟件安全性。SGX將通過(guò)驗(yàn)證的合法軟件和程序封裝到安全區(qū)(enclaves)中,以保護(hù)它們免受惡意軟件的侵害。該安全區(qū)級(jí)別非常高,也就是說(shuō),一旦將程序放入到容器中,即使是操作系統(tǒng)受到破壞,容器中的代碼和數(shù)據(jù)也不會(huì)受到影響,并且一個(gè)CPU中可以有多個(gè)安全區(qū)域,并行效率很高。
英特爾SGX的最大優(yōu)勢(shì)在于它僅信任自己和英特爾CPU,這個(gè)信任的級(jí)別是硬件的層面,因此基于軟件層面的攻擊甚至操作系統(tǒng)級(jí)攻擊都不能威脅到SGX創(chuàng)建的可信環(huán)境。此架構(gòu)很適合基于當(dāng)前多租戶云服務(wù)架構(gòu)的軟件,因?yàn)镾GX僅信任本身和Intel CPU,即使黑客通過(guò)云將病毒植入到PC中以控制底層操作系統(tǒng),也不會(huì)受到來(lái)自底層操作系統(tǒng)的攻擊。
3.1.3 ARM TrustZone
SGX是針對(duì)Intel處理器獨(dú)有的安全計(jì)算環(huán)境,而TrustZone則是為ARM處理器獨(dú)有。TrustZone不像SGX一樣可以封裝成多個(gè)安全區(qū)域,而是將CPU一分為二,一個(gè)是正常操作環(huán)境,另一個(gè)是受信任的操作環(huán)境。由于2個(gè)環(huán)境是隔離的并且并行運(yùn)行,因此代碼和資源很難被跨環(huán)境調(diào)用。同時(shí),當(dāng)程序要進(jìn)入受信任的操作環(huán)境時(shí),必須通過(guò)檢查的程序,具體的過(guò)程是程序需要執(zhí)行安全監(jiān)視中斷指令,以使操作系統(tǒng)檢查其安全性,由底層操作系統(tǒng)來(lái)負(fù)責(zé)整個(gè)系統(tǒng)的安全性。
3.1.4 SGX 與TrustZone 的差異
SGX和TrustZone還是有些不同的。主要表現(xiàn)為以下幾點(diǎn)。
SGX和TrustZone分別對(duì)應(yīng)Intel和ARM的處理器。2種處理器特定應(yīng)用場(chǎng)景有區(qū)別,Intel處理器的主要應(yīng)用場(chǎng)景是PC端,如電腦和服務(wù)器,ARM處理器主要應(yīng)用場(chǎng)景是移動(dòng)終端,如手機(jī)和機(jī)頂盒。
SGX的安全威脅在于操作系統(tǒng)下的硬件層,而TrustZone的安全威脅可以來(lái)自操作系統(tǒng)層,因此SGX的理論安全性高于TrustZone。Intel CPU的適用性更廣,因?yàn)橹С侄鄠€(gè)安全區(qū)受信任的環(huán)境。而TrustZone只有2種環(huán)境:正常環(huán)境和安全環(huán)境。
從開發(fā)難度上來(lái)看,TrustZone開發(fā)難度相對(duì)較小,其本質(zhì)是將硬件上的受信任資源與不受信任資源隔離。而SGX難度較高,盡管Intel提供了SGX SDK,目前有Avalon和graphene等產(chǎn)品來(lái)協(xié)助對(duì)接,但是將程序放入安全區(qū)域還是需要重構(gòu)代碼,目前需要的工作量仍然很大,并且由此引發(fā)的安全問(wèn)題也需要考慮。
3.2.1 可信計(jì)算基礎(chǔ)設(shè)施推進(jìn)不及預(yù)期
可信計(jì)算為推動(dòng)數(shù)據(jù)價(jià)值交換系統(tǒng)建立,涉及終端數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)交換平臺(tái)建設(shè)和相關(guān)政策法規(guī)推進(jìn),存在不及預(yù)期的可能。
3.2.2 可信計(jì)算硬件的問(wèn)題
目前存在的可信計(jì)算硬件多少都有一些短板,以SGX為例,雖然同其他技術(shù)相比比較快,但效率仍然很難滿足大規(guī)模的商業(yè)應(yīng)用。因?yàn)镃PU本身的空間較小,目前一代只有8G內(nèi)存,而且因?yàn)镾GX在硬件層,意味著pages在進(jìn)入以及離開硬盤的時(shí)候都需要進(jìn)行加密,因此運(yùn)行速度還比較慢,并且提速的難度較大。
3.2.3 可信計(jì)算壟斷的問(wèn)題
盡管SGX存在不少的問(wèn)題,但目前仍是可信執(zhí)行環(huán)境中最合適的硬件環(huán)境之一。但SGX是一個(gè)高度中心化的技術(shù),其內(nèi)嵌于Intel芯片,同時(shí)也是Intel公司的一項(xiàng)商用產(chǎn)品。這就意味著如果Intel芯片或其服務(wù)器出現(xiàn)問(wèn)題,或者Intel關(guān)閉此項(xiàng)功能,將會(huì)影響到SGX的使用,基于其所做的項(xiàng)目將無(wú)法運(yùn)轉(zhuǎn)。
目前全面強(qiáng)調(diào)國(guó)產(chǎn)自主化的大形勢(shì)下,國(guó)內(nèi)硬件廠商由于工藝短板的限制,距離實(shí)現(xiàn)全面自主化還有不少的路要走。
可信計(jì)算是向用戶不信任的軟件和硬件中添加一個(gè)可信模塊,而區(qū)塊鏈則是為了提升另一方造假撒謊的成本。當(dāng)區(qū)塊鏈與可信計(jì)算結(jié)合時(shí),區(qū)塊鏈可以從以下幾個(gè)方面起到作用。
a)提供中立環(huán)境。傳統(tǒng)可信計(jì)算使用的主機(jī),基本上是中心化的,服務(wù)器的掌控權(quán)在所有者手中,而區(qū)塊鏈采用分布式及去中心化的方式運(yùn)行,這就提供了非常好的中立環(huán)境。
b)數(shù)據(jù)確權(quán)及留痕。使用方對(duì)個(gè)人數(shù)據(jù)的每一次操作,可以將摘要等相關(guān)信息同步到鏈上,完成數(shù)據(jù)確權(quán)。用戶每一次的交互都會(huì)在鏈上留下痕跡,做到透明可查詢。
c)清結(jié)算功能。利用區(qū)塊鏈智能合約的方式去處理結(jié)算這個(gè)流程,整個(gè)流程透明,鏈上結(jié)算的方式保證結(jié)算的安全性,確保沒(méi)有任何一方抵賴。
d)提升效率。雖然可信計(jì)算能做到數(shù)據(jù)和協(xié)作方面的互信,但在實(shí)際應(yīng)用中,商業(yè)合作和利益分配信任問(wèn)題帶來(lái)的效率下降非常明顯,借助區(qū)塊鏈技術(shù),讓支出、收益、分潤(rùn)透明結(jié)算,賬本公開清晰可查,充分降本增效。
引入?yún)^(qū)塊鏈之后,文件經(jīng)過(guò)特殊加密后,只有數(shù)據(jù)擁有方授權(quán)才可進(jìn)行解密。數(shù)據(jù)本身不需要上鏈,但是數(shù)據(jù)使用的時(shí)候需要放入可信環(huán)境中。同時(shí)對(duì)代碼進(jìn)行溯源驗(yàn)證,功能分析,保證軟件安全性,不存在后門漏洞,代碼的分析結(jié)果和后續(xù)產(chǎn)生的操作都要上鏈。
區(qū)塊鏈的種種特性,使得其成為可信計(jì)算技術(shù)生態(tài)的重要組成部分。可信計(jì)算相關(guān)技術(shù)目前多與分布式計(jì)算類項(xiàng)目、數(shù)據(jù)類項(xiàng)目及鏈下解決方案相結(jié)合。目前此類項(xiàng)目的關(guān)注重點(diǎn)多在于主機(jī)端應(yīng)用場(chǎng)景,因此,在區(qū)塊鏈領(lǐng)域,SGX相比于TrustZone,有更多的應(yīng)用場(chǎng)景和需求。
隨著區(qū)塊鏈技術(shù)的發(fā)展,目前主要存在2個(gè)問(wèn)題:一個(gè)是數(shù)據(jù)開放引起的隱私泄露問(wèn)題;另一個(gè)是無(wú)法在鏈上執(zhí)行有效計(jì)算的性能問(wèn)題。
隱私泄露問(wèn)題不僅包括區(qū)塊鏈上記錄的交易信息的隱私泄露,還包括區(qū)塊鏈上記錄和傳輸?shù)钠渌麛?shù)據(jù)的隱私泄露,這是必須首要解決的問(wèn)題。而高性能計(jì)算和可擴(kuò)展性則一直是區(qū)塊鏈發(fā)展的瓶頸。在區(qū)塊鏈網(wǎng)絡(luò)中,所有節(jié)點(diǎn)需要共同處理和同步所有計(jì)算任務(wù),以確保計(jì)算任務(wù)的準(zhǔn)確性和不可篡改。但是這導(dǎo)致了嚴(yán)重的資源浪費(fèi)和效率低下。同時(shí),為了實(shí)現(xiàn)分布式處理,整個(gè)區(qū)塊鏈網(wǎng)絡(luò)中對(duì)構(gòu)建節(jié)點(diǎn)的要求不能太高,不能出現(xiàn)中心節(jié)點(diǎn),這進(jìn)一步影響了各個(gè)節(jié)點(diǎn)處理任務(wù)的能力。這時(shí)候,可信計(jì)算的隱私保護(hù)特性和分布式處理等優(yōu)點(diǎn)就可以很好地幫助解決這些問(wèn)題。
圖2示出的是基于區(qū)塊鏈的可信計(jì)算與數(shù)據(jù)共享方案。
本文提出一種基于區(qū)塊鏈的可信計(jì)算與數(shù)據(jù)共享方案,該方案中存在四方,分別是數(shù)據(jù)需求方、數(shù)據(jù)提供方、數(shù)據(jù)訓(xùn)練方和數(shù)據(jù)倉(cāng)庫(kù)。數(shù)據(jù)提供方和數(shù)據(jù)倉(cāng)庫(kù)都在區(qū)塊鏈平臺(tái)上注冊(cè)節(jié)點(diǎn),認(rèn)證通過(guò)后數(shù)據(jù)提供方將數(shù)據(jù)加密放入數(shù)據(jù)倉(cāng)庫(kù)中。數(shù)據(jù)需求方提出某種需求,然后由數(shù)據(jù)訓(xùn)練方在數(shù)據(jù)列表上找一下符合要求的數(shù)據(jù),找到數(shù)據(jù)后向?qū)?yīng)的數(shù)據(jù)提供方提出申請(qǐng)。數(shù)據(jù)提供方授權(quán)之后,相應(yīng)數(shù)據(jù)經(jīng)加密后和密鑰放入可信執(zhí)行環(huán)境,數(shù)據(jù)訓(xùn)練方也將算法進(jìn)行合規(guī)性驗(yàn)證,通過(guò)驗(yàn)證之后放入可信執(zhí)行環(huán)境中。之后在可信執(zhí)行環(huán)境中對(duì)數(shù)據(jù)進(jìn)行解密,然后算法對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練,運(yùn)算出來(lái)結(jié)果之后將摘要信息上鏈,訓(xùn)練方獲取運(yùn)算結(jié)果,并將結(jié)果反饋給需求方。同時(shí)數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)和算法銷毀,流程結(jié)束。
此方案中數(shù)據(jù)不離本地可供外部算法進(jìn)行處理,數(shù)據(jù)處理全流程信息透明并上鏈。鏈上信息應(yīng)包括如下部分:數(shù)據(jù)上鏈信息包括不限于數(shù)據(jù)名稱、類型、格式、大小、摘要、所有方、數(shù)據(jù)的被調(diào)用記錄、數(shù)據(jù)更新記錄等;算法上鏈信息包括不限于算法名稱、類型、格式、大小、所有方、算法更新紀(jì)律、合規(guī)性檢查結(jié)果等。
此方案實(shí)現(xiàn)了數(shù)據(jù)的全生命周期可視化管理,數(shù)據(jù)摘要信息上鏈,原始數(shù)據(jù)存儲(chǔ)在本地。數(shù)據(jù)處理時(shí)在本地經(jīng)過(guò)加密后交由通過(guò)合規(guī)驗(yàn)證的算法進(jìn)行運(yùn)算,算法在處理數(shù)據(jù)前獲得數(shù)據(jù)所有方授權(quán)后方可實(shí)現(xiàn)數(shù)據(jù)解密,進(jìn)行后續(xù)處理。
圖2 基于區(qū)塊鏈的可信計(jì)算與數(shù)據(jù)共享方案
同時(shí)利用硬件框架實(shí)現(xiàn)自有的數(shù)據(jù)共享及密鑰管理模塊,供各節(jié)點(diǎn)加解密及身份認(rèn)證使用,該密鑰體系應(yīng)具備在特定環(huán)境下可實(shí)現(xiàn)解密的功能,脫離特定環(huán)境后密鑰失效,特定環(huán)境包括不限于(具備SGX功能的硬件)可信硬件。
此方案已經(jīng)過(guò)測(cè)試,在復(fù)雜環(huán)境下,具備在保護(hù)數(shù)據(jù)與算法安全前提下提供可信計(jì)算的能力。
隨著5G和物聯(lián)網(wǎng)的發(fā)展,邊緣終端產(chǎn)生了越來(lái)越多的數(shù)據(jù),而伴隨著基于區(qū)塊鏈的數(shù)據(jù)共享和可信計(jì)算技術(shù)的成熟,這些海量數(shù)據(jù)將在終端處得到安全存儲(chǔ)和隱私保護(hù)。各類聯(lián)合機(jī)器學(xué)習(xí)算法將在終端用戶的授權(quán)下以分布式方式完成機(jī)器學(xué)習(xí),并輸出學(xué)習(xí)模型而不是隱私數(shù)據(jù),并且這些模型將在網(wǎng)絡(luò)中完成協(xié)作建模。傳統(tǒng)的中心云架構(gòu)的系統(tǒng)現(xiàn)有的托管數(shù)據(jù)也將在安全且受到完全保護(hù)的可信環(huán)境中進(jìn)行交換和協(xié)作計(jì)算。就像運(yùn)營(yíng)商網(wǎng)絡(luò)之于信息流轉(zhuǎn)的作用,一個(gè)從終端到云的數(shù)據(jù)價(jià)值交換系統(tǒng)將應(yīng)運(yùn)而生,可信計(jì)算系統(tǒng)就可以作為數(shù)據(jù)價(jià)值交換的“運(yùn)營(yíng)商”。在這樣的系統(tǒng)中,節(jié)點(diǎn)之間的數(shù)據(jù)協(xié)作計(jì)算和交換需要依賴于可信計(jì)算來(lái)實(shí)現(xiàn)隱私保護(hù)和數(shù)據(jù)安全。可以預(yù)見(jiàn),依靠這樣的平臺(tái)系統(tǒng),類似于互聯(lián)網(wǎng)生態(tài)的各種數(shù)據(jù)應(yīng)用市場(chǎng)將如雨后春筍般不斷涌現(xiàn),從而創(chuàng)造數(shù)據(jù)紅利時(shí)代。