劉 煒,彭宇飛,田 釗,盛朝陽,李 陽,佘 維
(1.鄭州大學 軟件學院 河南 鄭州 450002;2.鄭州大學 漢威物聯(lián)網(wǎng)研究院 河南 鄭州 450001;3.鄭州大學 互聯(lián)網(wǎng)醫(yī)療與健康服務河南省協(xié)同創(chuàng)新中心 河南 鄭州 450001;4.鄭州大學 信息工程學院 河南 鄭州 450001)
隨著信息技術的快速發(fā)展,醫(yī)療服務逐漸向數(shù)字化、信息化轉(zhuǎn)型。醫(yī)療數(shù)據(jù)作為重要數(shù)據(jù)資產(chǎn)也在不斷被分析和挖掘,極大地推動了醫(yī)療領域的研究與進展。不同組織機構(gòu)之間的信息交換與共享能夠使得醫(yī)療數(shù)據(jù)發(fā)揮更高價值,因此,跨地區(qū)、跨機構(gòu)的醫(yī)療信息共享需求日益增長。
醫(yī)療數(shù)據(jù)的來源和范圍多樣化,具有特殊的敏感性及重要性,不僅承載數(shù)據(jù)主體的健康狀況及醫(yī)療處理過程等信息,還涉及個人的隱私保護、行業(yè)的發(fā)展,甚至關系國家安全。然而,隨著數(shù)據(jù)爆炸式增長及深度挖掘的應用,醫(yī)療數(shù)據(jù)的泄露風險不斷增加[1-2]。醫(yī)療數(shù)據(jù)泄露方式主要分為非交互式泄露和交互式泄露,非交互式泄露是指醫(yī)院內(nèi)部系統(tǒng)或人員的泄露,如私自使用權(quán)限倒賣或濫用信息;交互式泄露即醫(yī)療信息在發(fā)布以及在不同機構(gòu)間共享時的泄露[3]。由于醫(yī)療數(shù)據(jù)的價值,在中心化信息系統(tǒng)中,中心節(jié)點存在泄露隱私的動機,各類醫(yī)療數(shù)據(jù)在多方交互及共享過程中也容易遭遇攻擊,從而導致隱私泄露。目前,醫(yī)療數(shù)據(jù)存儲依賴于醫(yī)院的信息化部門,許多醫(yī)院信息系統(tǒng)的安全防御能力欠缺,技術措施不足,一旦醫(yī)院系統(tǒng)遭受攻擊將會造成隱私信息泄露。云計算平臺能夠為醫(yī)療數(shù)據(jù)用戶提供強大的計算能力,但直接共享數(shù)據(jù)的服務模式帶來了一系列隱私安全問題及數(shù)據(jù)所有權(quán)問題。醫(yī)療數(shù)據(jù)可通過統(tǒng)計分析、數(shù)據(jù)挖掘、深度學習等方法從海量數(shù)據(jù)中剔除無意義部分,篩選出有價值的信息,經(jīng)過處理(如屬性匹配、信息關聯(lián))的數(shù)據(jù)存在泄露敏感信息的可能。
區(qū)塊鏈作為一種公開的去中心化分布式賬本,具有多方維護、不可篡改等特性[4],有利于解決醫(yī)療數(shù)據(jù)共享過程中的隱私問題,打通數(shù)據(jù)孤島,提供醫(yī)療數(shù)據(jù)安全共享及交易平臺,明確數(shù)據(jù)所有權(quán),有效地防止數(shù)據(jù)被惡意篡改或第三方濫用及倒賣現(xiàn)象。區(qū)塊鏈技術的發(fā)展和應用,在給醫(yī)療信息共享帶來便利的同時也帶來了新的安全隱私問題。相對于中心化架構(gòu),區(qū)塊鏈能夠避免因單點失效或數(shù)據(jù)泄露而引發(fā)的安全風險,從而保證數(shù)據(jù)的完整性及不可篡改性。但在區(qū)塊鏈系統(tǒng)中,交易記錄的透明性將顯著增加隱私泄露的風險,例如分析交易記錄可獲得用戶的交易規(guī)律[5]。在傳統(tǒng)醫(yī)療信息系統(tǒng)中,隱私保護的重點是確保中心信息系統(tǒng)的安全,然而在區(qū)塊鏈中沒有統(tǒng)一管理者,采用的信息傳遞機制和共識機制也為隱私保護帶來了新的機遇和挑戰(zhàn)。本文立足于醫(yī)療信息領域,對區(qū)塊鏈及相關隱私保護技術進行綜述。
隨著醫(yī)療信息化建設的不斷發(fā)展,醫(yī)療信息的共享與整合為患者提供了更好的服務質(zhì)量,有助于醫(yī)學研究的發(fā)展。醫(yī)療數(shù)據(jù)來源眾多,數(shù)據(jù)類型復雜,存儲于異構(gòu)的信息系統(tǒng)中,數(shù)據(jù)共享可實現(xiàn)不同醫(yī)療信息系統(tǒng)之間的數(shù)據(jù)交互。在醫(yī)療服務與醫(yī)學研究信息化的同時,醫(yī)療信息隱私問題也隨之而來。由于醫(yī)療信息的高價值與隱私性,在信息共享過程中,應結(jié)合隱私保護手段,在明確數(shù)據(jù)所有權(quán)、不泄露敏感信息的前提下發(fā)揮數(shù)據(jù)價值。要實現(xiàn)醫(yī)療數(shù)據(jù)的安全共享需滿足以下需求。
1)隱私性需求。醫(yī)療數(shù)據(jù)共享很大程度上涉及數(shù)據(jù)及相關方的隱私。隱私數(shù)據(jù)如果非法交易或使用,將帶來不可估量的后果,因此數(shù)據(jù)共享必須限制共享范圍,防止隱私數(shù)據(jù)泄露給無權(quán)限方。
2)完整性需求。醫(yī)療數(shù)據(jù)使用方需要確保共享方數(shù)據(jù)的可靠性,包括數(shù)據(jù)來源的可靠性、是否被篡改、是否偽造等。數(shù)據(jù)不完整或篡改將影響數(shù)據(jù)共享的效率,而且可能給數(shù)據(jù)使用方帶來嚴重的問題。
3)可用性需求??捎眯允侵笖?shù)據(jù)可在任何時間被任何有權(quán)限的用戶訪問和使用[6]。缺乏可用性醫(yī)療數(shù)據(jù)共享,提供方將無法提供數(shù)據(jù)服務,使用方將無法得到所需的數(shù)據(jù),因此保證醫(yī)療共享過程中的數(shù)據(jù)可用性,才能保證數(shù)據(jù)共享的效益,保證醫(yī)療數(shù)據(jù)發(fā)揮價值。
區(qū)塊鏈是一種以比特幣為代表的去中心化共享賬本,由數(shù)字加密貨幣衍生而來的新型技術架構(gòu)[7]。區(qū)塊鏈按照時間順序?qū)?shù)據(jù)區(qū)塊組成鏈式數(shù)據(jù)結(jié)構(gòu),并以密碼學技術保證鏈上數(shù)據(jù)的不可篡改和不可偽造。每個節(jié)點都通過Hash算法和Merkle樹,將一段時間內(nèi)接收到的交易封裝到一個帶有時間戳的區(qū)塊中,并將其鏈接到最長的主鏈中,形成最新區(qū)塊[4]。如圖1所示,每個區(qū)塊包括區(qū)塊頭和區(qū)塊體兩部分,區(qū)塊頭中封裝了前一個區(qū)塊的Hash值、時間戳、隨機數(shù)、Merkle根等;區(qū)塊體存儲交易信息,即區(qū)塊鏈記錄的數(shù)據(jù)信息,全部交易基于Merkle樹的Hash過程,生成唯一的Merkle樹根存儲在區(qū)塊頭中,每筆交易均由交易方進行數(shù)字簽名,并永久存儲在區(qū)塊中,供全體用戶查詢[8]。
圖1 區(qū)塊結(jié)構(gòu)
盡管區(qū)塊鏈系統(tǒng)在整體架構(gòu)上存在諸多共性,但同時也在不斷演變[9]。一般來說,區(qū)塊鏈由數(shù)據(jù)層、網(wǎng)絡層、共識層、激勵層、合約層和應用層組成,但隨著區(qū)塊鏈的發(fā)展與演變,一些傳統(tǒng)的模塊被弱化。因此,通過分析區(qū)塊鏈的本質(zhì)特征,結(jié)合目前的發(fā)展趨勢,本文將區(qū)塊鏈系統(tǒng)分為4層,如圖2所示。
圖2 區(qū)塊鏈體系架構(gòu)
1)網(wǎng)絡層。網(wǎng)絡層封裝了區(qū)塊鏈網(wǎng)絡的組網(wǎng)方式、節(jié)點之間的消息傳播機制和數(shù)據(jù)驗證機制等,其主要任務是通過傳播協(xié)議和驗證機制使得區(qū)塊鏈網(wǎng)絡中每個節(jié)點都能參與區(qū)塊的產(chǎn)生與校驗過程,僅當驗證后的區(qū)塊才能記入?yún)^(qū)塊鏈系統(tǒng)[4]。區(qū)塊鏈采用對等式網(wǎng)絡(peer-to-peer network, P2P)來組織分布式、關系平等、可動態(tài)進出的節(jié)點。交易節(jié)點生成新的交易后,將該交易廣播到區(qū)塊鏈網(wǎng)絡,在P2P網(wǎng)絡中,每個節(jié)點時刻監(jiān)聽網(wǎng)絡中廣播的數(shù)據(jù),當鄰居節(jié)點接收到交易節(jié)點產(chǎn)生的新交易時,首先驗證其是否有效,若有效則按照時間順序記入存儲池,同時再轉(zhuǎn)發(fā)給自己的鄰居節(jié)點,由此類推,該交易會逐漸廣播到全網(wǎng);若交易無效則被廢棄,以防止其在網(wǎng)絡中繼續(xù)傳播。在此過程中,接收方節(jié)點從網(wǎng)絡中收集信息,無須直接與發(fā)送方進行通信,相比于傳統(tǒng)網(wǎng)絡,攻擊者很難通過監(jiān)聽網(wǎng)絡流量來發(fā)現(xiàn)信息的來源和去向,因此,可防止通過此類攻擊來發(fā)現(xiàn)用戶之間的通信關系。
2)交易層。交易層實現(xiàn)兩個區(qū)塊鏈地址之間的數(shù)據(jù)傳輸,主要內(nèi)容包括地址格式、交易格式、全局賬本和智能合約。區(qū)塊鏈地址是用戶在區(qū)塊鏈系統(tǒng)中的假名,通常由公鑰加密算法產(chǎn)生,公鑰用于交易的輸入或輸出地址,私鑰由用戶保存,用于對交易進行簽名[5]。交易記錄了地址之間的數(shù)據(jù)交互記錄,主要有基于交易的模型和基于賬戶的模型,其中:比特幣采用基于交易的模型;以太坊及Hyperledger Fabric采用基于賬戶的模型[10]。基于賬戶的模型在可編程性、靈活性等方面更有優(yōu)勢,基于交易的模型中計算負擔由錢包來承擔,一定程度上減少了鏈上壓力。對于選擇何種模型,要從具體的業(yè)務場景出發(fā)。全局賬本存儲所有交易信息、合約及相關參數(shù),通常由區(qū)塊構(gòu)成,每個區(qū)塊中包含一定的交易信息。智能合約是一種能夠?qū)崿F(xiàn)自我執(zhí)行和驗證的計算機協(xié)議,其本質(zhì)上是將對象程序化并部署在區(qū)塊鏈上,再由外部事件來觸發(fā)合約的自動生成與執(zhí)行,進而改變對象的狀態(tài)與數(shù)值,同交易類似,智能合約內(nèi)容也將寫入全局賬本。
3)共識層。共識機制是區(qū)塊鏈系統(tǒng)的核心要素,共識安全對區(qū)塊鏈的數(shù)據(jù)安全起到重要的支撐作用[6]。去中心化的區(qū)塊鏈網(wǎng)絡由多方進行維護,保證系統(tǒng)中所有節(jié)點高效達成一致,維護相同的全局賬本是區(qū)塊鏈共識機制所要解決的核心問題,常見的共識機制包括工作量證明機制(proof of work, PoW)、權(quán)益證明機制(proof of stake, PoS)、股份授權(quán)證明機制(delegated proof of stake, DPoS)以及實用拜占庭容錯共識算法(practical byzantine fault tolerance, PBFT)等[11]。
比特幣區(qū)塊鏈采用PoW作為共識機制,其思想是通過算力競爭來保證數(shù)據(jù)一致性。各節(jié)點(礦工)同時競爭挖礦,挖礦過程中付出最大算力的節(jié)點將被選為記賬節(jié)點并由該節(jié)點生成下一區(qū)塊。PoS采用權(quán)益證明來代替算力,使用幣齡(一定數(shù)量的幣與最后一次交易時間長度的乘積)來選擇記賬節(jié)點,解決了PoW機制的資源浪費問題。DPoS是基于PoS衍生的解決方案,每個節(jié)點能夠自主選擇其信任的代理節(jié)點來輪流記賬生成新區(qū)塊,因而大量減少驗證記賬節(jié)點,使交易效率更高。由于硬件錯誤、網(wǎng)絡阻塞、惡意攻擊等原因,分布式網(wǎng)絡中存在不可信節(jié)點,因而需要支持拜占庭容錯(byzantine fault-tolerant, BTF)。PBFT是基于BTF的共識算法,解決了共識算法容錯率不高的問題,并且將算法復雜度由指數(shù)級降低到多項式級,使得拜占庭容錯在實際系統(tǒng)中得到應用。除了以上共識機制,實際應用中衍生出多種組合共識機制以及現(xiàn)有共識機制的變種。這些共識機制從效率、安全性等角度進行改進,各有優(yōu)劣,適用于不同的業(yè)務場景。
4)應用層。應用層封裝了各種應用場景和案例,如醫(yī)療數(shù)據(jù)共享平臺等,為用戶提供各種應用場景的程序和接口,以實現(xiàn)各方的交互。本層類似于各種軟件程序,也是去中心化應用(decentralized application, DAPP),包括智能合約以及調(diào)用合約的接口。從當前的區(qū)塊鏈應用發(fā)展來看,應用層在兼顧隱私的同時面臨監(jiān)管缺失問題。監(jiān)管技術的目的是對非法行為進行檢測、追蹤和追責,從而保證區(qū)塊鏈平臺的內(nèi)容安全。然而,區(qū)塊鏈去中心化、不可篡改、匿名等特點增加了監(jiān)管機制設置的難度[6]。
數(shù)據(jù)隱私保護的核心是保護數(shù)據(jù)隱私性與完整性,隱私性指防止數(shù)據(jù)被未授權(quán)用戶訪問,完整性是指保證數(shù)據(jù)真實、未被篡改[8]。由于區(qū)塊鏈的存儲容量有限,將區(qū)塊鏈技術用于數(shù)據(jù)隱私保護,通常使用存儲與管理分離的方式,大量的原始數(shù)據(jù)存儲于鏈下服務器,并由這些服務器保證數(shù)據(jù)的隱私性,數(shù)據(jù)索引及權(quán)限由區(qū)塊鏈進行管理,由區(qū)塊鏈的公開賬本保證數(shù)據(jù)完整性。訪問控制技術用于實現(xiàn)用戶權(quán)限的管理,由于區(qū)塊鏈數(shù)據(jù)對所有用戶可見,并且不可篡改,相比于基于單一節(jié)點的授權(quán)策略,基于區(qū)塊鏈對用戶權(quán)限進行管理,可實現(xiàn)公開透明的授權(quán)和訪問控制,不存在第三方的越權(quán)行為。區(qū)塊鏈的不可篡改特性可用于對數(shù)據(jù)的流向進行全程監(jiān)控,實現(xiàn)對數(shù)據(jù)存儲、傳輸、計算等過程中的可追溯、可審計。然而,區(qū)塊鏈全局賬本的公開透明會給鏈上數(shù)據(jù)隱私帶來一定的不利因素。區(qū)塊鏈中的隱私分為身份隱私和交易隱私[12]。
身份隱私是指用戶身份信息與區(qū)塊鏈地址的關聯(lián)。區(qū)塊鏈中的地址由用戶公鑰自行產(chǎn)生,并與用戶身份信息無關聯(lián),可作為用戶在區(qū)塊鏈系統(tǒng)中的假名。然而,區(qū)塊鏈的匿名性并不能保證絕對隱私性,在用戶使用區(qū)塊鏈地址參與交易時,有可能泄露用戶身份信息。交易隱私是指區(qū)塊鏈賬本中存儲的交易數(shù)據(jù)與交易數(shù)據(jù)背后的知識。在比特幣系統(tǒng)中,交易是公開記錄在鏈上的,沒有采取隱私保護措施。但隨著區(qū)塊鏈技術在醫(yī)療領域的應用,交易記錄中通常包含敏感信息。此外,隨著數(shù)據(jù)分析及挖掘技術在醫(yī)療領域的應用,醫(yī)療交易記錄背后通常能夠反映一系列知識。身份隱私和交易隱私是區(qū)塊鏈隱私保護的重點內(nèi)容,一旦用戶身份與區(qū)塊鏈地址之間的映射關系泄露,就可能對用戶隱私造成嚴重危害,不同于傳統(tǒng)的中心化系統(tǒng),在區(qū)塊鏈中無法通過刪除存儲在全局賬本中的數(shù)據(jù)來限制泄露隱私信息的傳播,即使采用硬分叉手段,形成一條不同的新鏈,也無法挽回數(shù)據(jù)泄露產(chǎn)生的后果。因此,在區(qū)塊鏈中更應注重隱私信息的保護。
醫(yī)療信息隱私保護包括數(shù)據(jù)在發(fā)布、存儲、交換、分析等過程中的保護。本文將醫(yī)療信息隱私保護方法分為面向數(shù)據(jù)和面向用戶的隱私保護。面向數(shù)據(jù)的隱私保護是指對醫(yī)療數(shù)據(jù)中敏感信息本身的保護[5];面向用戶的隱私保護是指用戶的數(shù)據(jù)訪問授權(quán)以及在數(shù)據(jù)使用、交易等過程中,對用戶信息的隱私保護。
面向醫(yī)療數(shù)據(jù)的隱私保護即對敏感信息本身進行保護,主要分為3類:基于數(shù)據(jù)加密的隱私保護;基于數(shù)據(jù)失真的隱私保護以及基于數(shù)據(jù)限制發(fā)布的隱私保護。
區(qū)塊鏈中使用基于哈希算法的交易存儲機制以及數(shù)字簽名保證鏈上數(shù)據(jù)的真實、不可抵賴性,然而在復雜的醫(yī)療業(yè)務場景中,交易數(shù)據(jù)以及智能合約的隱私性需要結(jié)合其他的密碼學技術,如同態(tài)加密、安全多方計算等。此外,在基于區(qū)塊鏈的醫(yī)療數(shù)據(jù)共享平臺中,區(qū)塊鏈地址一旦產(chǎn)生,就只能通過配套的私鑰對該地址的數(shù)字資產(chǎn)進行轉(zhuǎn)移和支付,因此擁有私鑰即擁有該地址數(shù)字資產(chǎn)的掌控權(quán),錢包的安全性及密鑰存儲方式對區(qū)塊鏈系統(tǒng)中數(shù)據(jù)隱私安全帶來重要影響。
2.1.1同態(tài)加密 在醫(yī)療大數(shù)據(jù)時代,對數(shù)據(jù)進行挖掘、學習、分析等操作可為患者、醫(yī)院及相關機構(gòu)帶來更多價值,如深入了解疾病、推動實現(xiàn)個性化服務等。而在數(shù)據(jù)的計算、處理過程中,保護數(shù)據(jù)隱私是醫(yī)療數(shù)據(jù)共享的重要前提。同態(tài)加密(homomorphic encryption, HE)由Rivest等在20世紀70年代首次提出,是一類具有特殊屬性的加密算法。與一般的加密算法相比,同態(tài)加密除了基本的加密操作,還能實現(xiàn)密文之間的多種計算操作,即先計算后解密可等價于先解密后計算,該特性對于信息安全具有重要意義。
在醫(yī)療場景中,不具備計算資源的數(shù)據(jù)所有者可委托第三方對數(shù)據(jù)進行計算,并將計算結(jié)果返回,然而不可信第三方存在泄露隱私的風險。同態(tài)加密可實現(xiàn)第三方在不解密數(shù)據(jù)的情況下對醫(yī)療數(shù)據(jù)進行計算與驗證,如圖3所示,第三方(如用戶、云服務方等)或其他計算框架對加密的隱私數(shù)據(jù)進行相關操作,而不影響其保密性。在文獻[13]中,改進的同態(tài)加密算法能夠保證MapReduce框架中的計算安全,使得用戶在自主控制數(shù)據(jù)的同時保證數(shù)據(jù)計算和共享的安全性。
圖3 同態(tài)加密過程
區(qū)塊鏈交易和智能合約的透明性容易泄露數(shù)據(jù)隱私,同態(tài)加密可保證交易數(shù)據(jù)的隱私驗證及智能合約的計算安全,避免在數(shù)據(jù)驗證或操作過程中泄露隱私。文獻[14]提出了一種基于同態(tài)加密的區(qū)塊鏈隱私保護方法,驗證節(jié)點對加密的用戶交易信息進行操作和驗證,提高了區(qū)塊鏈技術的數(shù)據(jù)安全性和隱私性。針對醫(yī)療保險理賠過程中患者明文數(shù)據(jù)需被保險公司查看的問題,文獻[15]將同態(tài)加密與區(qū)塊鏈智能合約相結(jié)合解決醫(yī)療保險理賠過程中的隱私泄露問題。智能合約對密文數(shù)據(jù)進行操作,無須查看患者明文數(shù)據(jù)即可判斷是否符合理賠條件,并實現(xiàn)自動理賠功能,避免患者在與其他角色交互時泄露敏感數(shù)據(jù)。
云服務可為醫(yī)療數(shù)據(jù)提供強大的計算能力與存儲空間,區(qū)塊鏈可將醫(yī)療數(shù)據(jù)的相關操作記錄保存到公開賬本,以便用戶隨時查看,并保證數(shù)據(jù)不被篡改。區(qū)塊鏈與云技術的融合,既有利于解決區(qū)塊鏈的存儲與性能瓶頸,也能夠有效防止醫(yī)療數(shù)據(jù)被隨意偽造篡改。然而云服務及區(qū)塊鏈在實際場景中均面臨如何保證數(shù)據(jù)隱私的問題,同態(tài)加密可以在一定程度上解決數(shù)據(jù)在云端計算過程中的隱私問題,數(shù)據(jù)所有者可以將加密數(shù)據(jù)委托給不受信任的云服務方對數(shù)據(jù)進行處理而不泄露隱私信息。在區(qū)塊鏈中,同態(tài)加密技術不僅提供了隱私保護,同時允許隨時訪問鏈上的加密數(shù)據(jù)進行審計或其他操作。使用同態(tài)加密在區(qū)塊鏈上存儲數(shù)據(jù)將能夠保留公有鏈和私有鏈的優(yōu)點,同時完整地保留以太坊的優(yōu)點。
2.1.2安全多方計算 醫(yī)療數(shù)據(jù)的挖掘分析可使數(shù)據(jù)產(chǎn)生增值價值,尤其是相關數(shù)據(jù)的統(tǒng)計分析及反映集體特征的匯總信息具有更高的價值。然而由于醫(yī)療數(shù)據(jù)存儲的碎片化,單個醫(yī)療節(jié)點的私有數(shù)據(jù)存在數(shù)據(jù)量不足,數(shù)據(jù)維數(shù)不夠豐富等問題,醫(yī)療數(shù)據(jù)的隱私性及高價值導致數(shù)據(jù)所有方不愿共享原始數(shù)據(jù),影響數(shù)據(jù)產(chǎn)生增值價值。因此,在多方聯(lián)合計算過程中保護各相關方的數(shù)據(jù)隱私對醫(yī)療數(shù)據(jù)共享具有重要意義。
安全多方計算(secure multi-party computation, SMPC)是一種通用的密碼原語,可表示為
f(x1,x2,…,xn)=(y1,y2,…,yn)。
(1)
使互不信任的分布式環(huán)境下多個數(shù)據(jù)所有者聯(lián)合計算同一函數(shù),而不泄露自己的輸入數(shù)據(jù)xi,計算結(jié)束后,每個參與方除計算結(jié)果及自己的輸入值,無法了解其他的任何信息。SMPC在保證參與方輸入隱私的前提下完成協(xié)同計算任務,其框架涉及混淆電路、秘密共享、同態(tài)加密等密碼學技術[16]。SMPC技術的主要特點如下。
1)隱私性。任何參與方無法獲得其他參與方的輸入信息;
2)正確性。每個參與方均能獲得正確計算結(jié)果;
3)終止性。保證在有限時間內(nèi)有輸出;
4)忠誠性。大部分參與者按照規(guī)定執(zhí)行計算。
區(qū)塊鏈和SMPC均為參與方按照特定規(guī)則(協(xié)議)進行交互,區(qū)塊鏈強調(diào)計算結(jié)果的可驗證性,并防止結(jié)果被篡改,而SMPC強調(diào)的是計算過程中輸入數(shù)據(jù)的隱私性,并不能確保數(shù)據(jù)的可驗證性,其目的是在輸入保密的情況下得到正確的計算結(jié)果。區(qū)塊鏈能夠為SMPC做存證,SMPC也能夠應用于區(qū)塊鏈智能合約,在保證各方隱私的同時對多方數(shù)據(jù)進行聯(lián)合計算。針對SMPC中參與方的誠實問題,可通過區(qū)塊鏈來公開參與方的信譽,并通過激勵機制鼓勵誠實的參與方。BFR-MPC是一種基于區(qū)塊鏈的多方計算方案,區(qū)塊鏈公共賬本為各方維護了一個公開的信譽系統(tǒng),并通過激勵機制鼓勵各方執(zhí)行既定的計算協(xié)議,更好地保證了SMPC的公平性和魯棒性[17]。文獻[18]基于區(qū)塊鏈智能合約構(gòu)建了懲罰機制,提出了安全的SMPC協(xié)議,協(xié)議通過超時機制來判斷惡意參與方的提前終止行為,并對其進行經(jīng)濟懲罰。文獻[19]構(gòu)建了基于SMPC的智能合約框架,保證了智能合約執(zhí)行中的輸入隱私和計算正確性。
云計算的引入使得SMPC執(zhí)行的外部環(huán)境變得多樣和復雜,云服務器可看作不被完全信任的第三方,參與方將各自輸入利用同態(tài)加密后,上傳至云服務器,由云服務器對同態(tài)密文進行計算并返回結(jié)果,從而可以保證數(shù)據(jù)機密性[20]。同態(tài)加密可作為SMPC框架中的基礎協(xié)議,如文獻[21]和[22]將SMPC與同態(tài)加密相結(jié)合,為各參與方在SMPC協(xié)議中的輸入數(shù)據(jù)進行保密。
SMPC能夠為醫(yī)療數(shù)據(jù)提供一種隱私計算方案,旨在保證多方輸入數(shù)據(jù)不被泄露給其他參與方;區(qū)塊鏈技術旨在記錄醫(yī)療數(shù)據(jù)流通日志,為隱私計算提供可驗證性及可追溯性,激勵參與方提供真實數(shù)據(jù)并誠實履行既定計算協(xié)議。區(qū)塊鏈與SMPC的結(jié)合,可實現(xiàn)增值醫(yī)療數(shù)據(jù)的安全共享,并確保數(shù)據(jù)交易的可驗證、可追溯,有利于對各參與方的監(jiān)管及相關責任方的定位。
2.1.3密鑰管理 區(qū)塊鏈結(jié)合加密技術可實現(xiàn)安全的醫(yī)療數(shù)據(jù)共享,由于現(xiàn)代密碼體制要求加密算法公開,密碼系統(tǒng)的安全性并不取決于算法的保密性而取決于密鑰的保密性。因此,對于加密的醫(yī)療數(shù)據(jù),合理的保存私鑰是保證數(shù)據(jù)隱私的關鍵。在區(qū)塊鏈系統(tǒng)中,私鑰即資產(chǎn),錢包即存儲私鑰的載體,掌握私鑰即擁有一個區(qū)塊鏈地址背后的數(shù)據(jù)資產(chǎn),因此私鑰安全對數(shù)據(jù)隱私尤為關鍵。按照是否聯(lián)網(wǎng)訪問,私鑰的存儲方式可以分為冷錢包和熱錢包;按照是否由第三方代理錢包可分為托管類型錢包和非托管類型錢包。
冷錢包由于不能被網(wǎng)絡訪問,避免了黑客盜取私鑰的風險,比熱錢包會更安全;熱錢包在聯(lián)網(wǎng)狀態(tài)下可以隨時進行交易,對于頻繁交易的投資者來說,熱錢包會更方便快捷。托管錢包是指第三方代表用戶控制加密貨幣的錢包,該錢包不提供用戶私鑰或?qū)⑺借€存儲在本地服務器中。如果用戶丟失私鑰,可以在服務器端恢復賬戶,因此更傾向于便捷使用錢包的用戶。然而服務提供商由于系統(tǒng)維護或?qū)嵜?know your customer, KYC)等原因凍結(jié)用戶資產(chǎn)時,托管類型錢包具有遭遇資金被黑客盜走的風險。此外,用戶的資產(chǎn)實際被交易所掌控,交易所可能會出于實名制或者反洗錢(anti money laundering, AML)等原因凍結(jié)用戶資產(chǎn)。非托管錢包是指用戶完全控制并持有自己的加密貨幣的錢包,私鑰會被加密存儲在用戶的設備中。在非托管類型錢包中,如果用戶丟失助記詞,將無法恢復資產(chǎn)。文獻[23]提出了一個基于區(qū)塊鏈技術的分布式公鑰方案,通過區(qū)塊鏈網(wǎng)絡中的節(jié)點共同承擔密鑰存儲的職責。相比傳統(tǒng)的公鑰系統(tǒng),將現(xiàn)實的存儲系統(tǒng)拆分到區(qū)塊鏈分布式節(jié)點的方案具有較好的響應性能和抗干擾能力。
為解決分布式網(wǎng)絡密鑰管理困難、通訊開銷過大等問題,文獻[24]提出了一種基于區(qū)塊鏈的密鑰管理方案(key management schemes based on blockchain, KMSBoB),設計了分布式群組網(wǎng)絡下密鑰管理和傳輸過程,其核心是分布式網(wǎng)絡環(huán)境下基于區(qū)塊鏈的密鑰管理策略,將MTI/CO協(xié)議與區(qū)塊鏈多節(jié)點挖礦相結(jié)合,形成一種分布式環(huán)境下多節(jié)點會話密鑰生成協(xié)議。KMSBoB把傳統(tǒng)的密鑰管理模型轉(zhuǎn)變?yōu)榛趨^(qū)塊鏈的運行模式,將驗證密鑰分量合法性、密鑰分量傳輸和密鑰分量共享的3個過程統(tǒng)一于全體安全管理節(jié)點(secure management node, SMN)的挖礦過程,通過全體SMN成員驗證區(qū)塊數(shù)據(jù)合法性的過程,實現(xiàn)密鑰數(shù)據(jù)的動態(tài)安全管理,降低了傳統(tǒng)自治域之間因密鑰傳輸?shù)耐ㄐ砰_銷和密鑰泄露的安全風險。
醫(yī)療數(shù)據(jù)集中通常包含著敏感信息,如患者身份、診斷結(jié)果等,若不采取隱私保護技術而直接將數(shù)據(jù)進行分析或發(fā)布,會造成隱私的泄露。如何從醫(yī)療數(shù)據(jù)集中提取有價值的信息是醫(yī)療隱私保護的關鍵問題,研究人員試圖找到能夠抵御最大背景知識攻擊的隱私保護方法,差分隱私在一定程度上滿足了上述要求。差分隱私是Dwork在2006年提出隱私定義,是一種獨立于數(shù)據(jù)集的強隱私概念,能夠防止攻擊者在擁有任何背景知識下的攻擊。設有隨機算法M,PM為M所有可能的輸出構(gòu)成的集合。對于任意兩個鄰近數(shù)據(jù)集D和D′,以及PM的任何子集SM,若算法M滿足式
Pr[M(D)∈SM]≤exp(ε)*Pr[M(D′)∈SM],
(2)
則稱算法M提供參數(shù)ε的差分隱私保護。其中ε為隱私保護預算,用來控制差分隱私算法在兩個相鄰數(shù)據(jù)集上獲得相同輸出的概率比值,體現(xiàn)算法所能提供的隱私保護水平[25]。差分隱私的基本思想是對原始數(shù)據(jù)的查詢添加噪聲,從而使得單獨數(shù)據(jù)的插入或刪除不會對任何計算的輸出造成影響,攻擊者因此難以根據(jù)多次查詢結(jié)果的差異性反推出數(shù)據(jù)集中某條數(shù)據(jù)。
基于差分隱私的數(shù)據(jù)發(fā)布策略需要在保護隱私的同時兼顧數(shù)據(jù)的效用性及隱私預算ε的分配策略。文獻[28]結(jié)合差分隱私約束和數(shù)據(jù)效用性優(yōu)化構(gòu)建了分布式非線性規(guī)劃模型,設計了兩種解決方案安全地求解該模型,即全局解決方案(GS)和局部解決方案(LS),并在實驗中基于不同參數(shù)、執(zhí)行時間、計算復雜度評價該差分隱私發(fā)布策略。理論分析與實驗結(jié)果均表明,該方案滿足差分隱私要求且具有很好的實用性。合理的預算分配策略要盡可能使ε的生命周期長一些,常用的分配策略包括線性分配、均勻分配、指數(shù)分配、自適用性分配以及混合策略分配等[29]。文獻[30]通過區(qū)塊鏈來驗證隱私預算ε的使用,并根據(jù)數(shù)據(jù)所有者提供的隱私要求通過智能合約自適應地更改其分配。
差分隱私是目前信息安全研究領域中的熱點之一,其嚴格的數(shù)學定義與實現(xiàn)機制為醫(yī)療信息隱私保護提供了一個有效并可靠的解決方案,但從實際應用上看,將差分隱私保護投入醫(yī)療領域?qū)嶋H應用中還需要更深入的研究。醫(yī)療實際應用中存在許多復雜數(shù)據(jù)集,數(shù)據(jù)之間存在關聯(lián)性,而傳統(tǒng)的差分隱私方法并未考慮數(shù)據(jù)之間的聯(lián)系,醫(yī)療圖像數(shù)據(jù)以及動態(tài)醫(yī)療數(shù)據(jù)的發(fā)布也是差分隱私保護方法有待解決的問題。
在區(qū)塊鏈技術中存在“不可能三角”,所謂的“不可能三角”是指在區(qū)塊鏈公有鏈中,很難同時做到去中心化、安全性及很高的交易處理性能。區(qū)塊鏈的鏈上鏈下系統(tǒng)都有一定的局限性,鏈下系統(tǒng)具有可擴展計算及存儲性能,但難以驗證數(shù)據(jù)確保數(shù)據(jù)不被篡改;區(qū)塊鏈鏈上系統(tǒng)可保證信息的公開透明及不可篡改性,但其擴展性及吞吐量一直是瓶頸。醫(yī)療數(shù)據(jù)通常信息量大、類型復雜,對隱私保護的需求不同,因此不宜將大量原始數(shù)據(jù)或?qū)﹄[私要求高的數(shù)據(jù)直接存儲在公開賬本中。在實際醫(yī)療場景中,可將鏈下信息系統(tǒng)與區(qū)塊鏈相結(jié)合,一方面利用區(qū)塊鏈保證鏈下原始醫(yī)療數(shù)據(jù)的完整性,另一方面可通過鏈下系統(tǒng)實現(xiàn)海量數(shù)據(jù)的存儲與計算。此外,結(jié)合鏈下系統(tǒng),通過限制鏈上信息的發(fā)布,可直接將敏感醫(yī)療信息從公開賬本中移除,從而保護隱私信息的安全。
鏈外存儲是將原始數(shù)據(jù)存儲在鏈下數(shù)據(jù)庫,對應的摘要哈希值或索引信息存儲在分布式賬本中。哈希算法可將任意長度的字符串映射成固定長度的二進制值串,通過原始數(shù)據(jù)映射之后得到的二進制值串即哈希值。文獻[13]的數(shù)據(jù)共享方案中,由于原始數(shù)據(jù)的數(shù)據(jù)量較大,且可能包含隱私信息,不適合存儲在鏈上,因此采用鏈上索引表信息與鏈下數(shù)據(jù)庫相結(jié)合的方式進行存儲,一方面能夠釋放區(qū)塊鏈上的大量存儲空間,另一方面亦可提高信息共享的效率,以此保證數(shù)據(jù)的安全性。對于數(shù)據(jù)量較大的醫(yī)療信息,不適合在共識過程中傳輸,因此,現(xiàn)有的醫(yī)療區(qū)塊鏈系統(tǒng)大多采用此類存儲方式,如文獻[31]提出的基于區(qū)塊鏈的醫(yī)療數(shù)據(jù)分享模型(medical data share model, MDSM)。鏈外存儲提供了較強的隱私性,但是由于原始數(shù)據(jù)存儲在鏈下,仍然需要各方自行維護鏈下數(shù)據(jù)庫安全。此外,隨著量子計算的發(fā)展,哈希算法面臨安全性降低甚至被攻破的危險,因此從長遠來看,勢必要發(fā)展適用于區(qū)塊鏈的抗量子攻擊的密碼技術[10]。
賬本隔離是指將不同隱私需求的賬本分別放在不同的分布式賬本上,如圖4所示。文獻[32]提出的Fabric支持多通道,在增強隱私性方面做了很大改進,實現(xiàn)賬本隔離保護隱私性。共識服務由排序節(jié)點Orderers提供,賬本由Peer節(jié)點管理,Channel代表私有廣播通道,保證消息的隔離性和私密性,不同的智能合約關聯(lián)主體僅執(zhí)行并驗證相關交易,Peers可訂閱多個Channel,并且只能訪問訂閱通道上的交易。共識服務接收所有交易,雖然外部節(jié)點無法看到通道內(nèi)交易數(shù)據(jù),但Orderers可以看到所有通道的數(shù)據(jù),為防止Orderers節(jié)點泄露交易的內(nèi)容,必須利用其他技術來隱藏敏感數(shù)據(jù),例如哈希散列或同態(tài)加密。然而,使用多通道來保護數(shù)據(jù)安全也存在不足,為了保護任意多方之間的隱私,需要構(gòu)建O(n2)量級的通道,從而消耗大量資源,此外多通道機制無法滿足動態(tài)的數(shù)據(jù)訪問控制。
圖4 賬本隔離
公有鏈是指任何節(jié)點都可以隨時進入系統(tǒng)中讀取數(shù)據(jù)、發(fā)送可確認交易、競爭記賬的區(qū)塊鏈,典型的公有鏈如比特幣、以太坊?;诠墟湹南到y(tǒng)具有很高的公信力,但隱私性及交易性能較低。私有鏈的寫入權(quán)限是由某個組織或機構(gòu)控制,其參與節(jié)點是有限和可控的,因此私有鏈往往有更快的交易速度、更好的隱私保護、更低的交易成本。聯(lián)盟鏈是指由若干個機構(gòu)共同參與管理的區(qū)塊鏈,每個機構(gòu)都運行著一個或多個節(jié)點,其中的數(shù)據(jù)只允許系統(tǒng)內(nèi)不同的機構(gòu)進行讀寫和發(fā)送交易,并且共同來記錄交易數(shù)據(jù)。與私有鏈相比,聯(lián)盟鏈中的權(quán)限設計要求會更加復雜。私有鏈、聯(lián)盟鏈架構(gòu)從根本上關閉了非授權(quán)節(jié)點接觸數(shù)據(jù)的渠道,降低了隱私泄露的風險[5],但與公有鏈相比,這兩種架構(gòu)是不具備或是不完全中心化的。
基于鏈外存儲的區(qū)塊鏈醫(yī)療信息共享平臺不僅能夠為存儲在各醫(yī)療機構(gòu)服務器中的數(shù)據(jù)提供完整性保障,又能夠?qū)?shù)據(jù)量大、對隱私需求高的醫(yī)療信息從公開賬本中移除,既提高了區(qū)塊鏈的交易性能,又保證了數(shù)據(jù)的隱私。與公有鏈相比,聯(lián)盟鏈和私有鏈限制了區(qū)塊鏈節(jié)點的加入,具有更強的隱私性,結(jié)合醫(yī)療數(shù)據(jù)共享的特點,可將不同類型的區(qū)塊鏈相結(jié)合,通過“以鏈制鏈”的方式,實現(xiàn)隱私保護與監(jiān)管機制的平衡。
在面向數(shù)據(jù)的隱私保護中,區(qū)塊鏈結(jié)合基于數(shù)據(jù)加密、數(shù)據(jù)失真及限制發(fā)布的隱私保護方法實現(xiàn)了對敏感數(shù)據(jù)本身的保護,表1介紹了相關方法的特點,并分析了各種隱私保護技術的優(yōu)勢與不足。
表1 面向數(shù)據(jù)的隱私保護機制對比
基于數(shù)據(jù)加密的隱私保護方法通常具有較高的安全性,同態(tài)加密、SMPC技術可實現(xiàn)數(shù)據(jù)的隱私計算,結(jié)合區(qū)塊鏈能夠存儲隱私計算過程中的相關憑證,為驗證計算結(jié)果正確性提供可信日志,加密效率及計算開銷問題是本類方法需要重點考慮的問題。差分隱私能夠有效防御基于知識背景的攻擊,然而對于復雜、連續(xù)的醫(yī)療數(shù)據(jù),以及分布式差分計算需要進一步深入研究?;谙拗瓢l(fā)布的隱私方案能夠在保證數(shù)據(jù)安全的同時減輕鏈上開銷,但是對區(qū)塊鏈底層的改進可能帶來新的安全隱患。此外,由于原始數(shù)據(jù)需各方維護,鏈上鏈下的對接安全也需深入研究。
面向用戶的隱私保護是指用戶對數(shù)據(jù)的訪問控制權(quán)限及其在區(qū)塊鏈系統(tǒng)中的匿名性。訪問控制策略是保護數(shù)據(jù)隱私的重要方式之一,其作用是限制數(shù)據(jù)的共享范圍,保證信息不被非法獲取。雖然用戶在區(qū)塊鏈系統(tǒng)中的身份與現(xiàn)實世界中的身份無關聯(lián),然而通過分析、聚類等技術處理鏈上交易記錄能夠獲得不同賬戶間的交易關系圖譜,推測交易的輸入輸出關系,對交易者的隱私造成威脅。由于區(qū)塊鏈的公開透明,當醫(yī)療隱私信息保存在區(qū)塊鏈上時,匿名性就成為了首要重視問題。面向用戶的隱私保護方法主要基于訪問控制和交易匿名。訪問控制包括基于智能合約的訪問控制策略和基于屬性加密的訪問控制策略;交易匿名方法包括混合協(xié)議、零知識證明、數(shù)字簽名、安全通道協(xié)議及K匿名技術。
訪問控制技術用于對用戶權(quán)限進行管理,允許合法用戶依照其所擁有的權(quán)限訪問系統(tǒng)內(nèi)的相應資源,禁止非法用戶對系統(tǒng)的訪問,從而保證信息的安全[7]。EMR為醫(yī)療機構(gòu)記錄和保存患者就診記錄提供了極大的便利,而當前的EMR訪問控制機制存在授權(quán)效率低、靈活性差、權(quán)力中心化等問題,基于區(qū)塊鏈智能合約及基于屬性加密的訪問控制機制對解決上述問題提供了應對方案。
3.1.1智能合約 基于第三方的訪問控制策略由可信中心實體進行構(gòu)建,然而,在實際醫(yī)療應用場景中不存在絕對安全的第三方實體,中心化EMR訪問控制機制依賴主節(jié)點的穩(wěn)定性,主節(jié)點作惡或發(fā)生故障會嚴重威脅醫(yī)療機構(gòu)及患者的隱私和利益。區(qū)塊鏈技術具有分布式去中心化不可篡改的優(yōu)勢,因此將區(qū)塊鏈技術應用在醫(yī)療數(shù)據(jù)訪問控制中可以很好地解決問題,目前國內(nèi)外研究中基于區(qū)塊鏈智能合約可實現(xiàn)對數(shù)據(jù)的訪問控制,如MedRec[33]、Ancile[34]、MeDShare[35]等醫(yī)療區(qū)塊鏈平臺。智能合約的本質(zhì)是一種能夠?qū)崿F(xiàn)自我執(zhí)行和驗證的計算機協(xié)議,提供了一種先進的思想,使得在區(qū)塊鏈網(wǎng)絡上實施更多的訪問控制模型。MedRec通過以太坊平臺對電子醫(yī)療數(shù)據(jù)進行訪問控制,醫(yī)療組織在獲得病人授權(quán)后方可使用醫(yī)療數(shù)據(jù),使得醫(yī)療數(shù)據(jù)真正屬于患者所有,實現(xiàn)了對病人數(shù)據(jù)的隱私保護及不同醫(yī)療機構(gòu)之間的數(shù)據(jù)整合[33]。文獻[34]使用以太坊智能合約實現(xiàn)醫(yī)療區(qū)塊鏈系統(tǒng)中不同角色之間的交互,適應不同用戶的需求。
區(qū)塊鏈能夠為數(shù)據(jù)進行審計跟蹤,對敏感信息的訪問保留行為日志,對惡意行為進行懲罰。MeDShare采用智能合約和訪問控制機制有效地追蹤數(shù)據(jù)的行為,為區(qū)塊鏈中的實體提供數(shù)據(jù)來源、審計和控制,對惡意實體取消訪問控制權(quán)限[35]。文獻[36]針對云服務提供商的數(shù)據(jù)安全共享,提出一種基于區(qū)塊鏈的數(shù)據(jù)共享框架,利用區(qū)塊鏈實現(xiàn)云中敏感數(shù)據(jù)的訪問控制,并保留訪問節(jié)點的行為日志,保證后續(xù)的責任認證。醫(yī)療機構(gòu)聯(lián)盟服務器群(medical institution federate servers, MIFS)配合改進的股份授權(quán)機制,通過信用積分策略對誠實節(jié)點增加信用積分,對惡意節(jié)點進行懲罰并限制其訪問數(shù)據(jù)的權(quán)限,實現(xiàn)數(shù)據(jù)的訪問控制[31]。
3.1.2屬性加密 屬性加密(attribute-based encryption, ABE)是解決醫(yī)療數(shù)據(jù)隱私和細粒度訪問控制問題的重要技術?;趨^(qū)塊鏈的EMR共享方案(blockchain based privacy preserving data sharing for EMPS, BPDS)采用基于密文策略屬性基加密(ciphertext policy attribute based encryption, CP-ABE)的訪問控制機制讓患者預先設置EMR的訪問結(jié)構(gòu),并利用訪問結(jié)構(gòu)對EMR進行加密,使得患者可以完全控制自己的電子病歷,當且僅當訪問者的屬性能夠滿足訪問結(jié)構(gòu)時才能解密EMR[37]。文獻[38]提出的區(qū)塊鏈數(shù)據(jù)共享模型基于ABE對企業(yè)數(shù)據(jù)進行訪問控制與共享,實現(xiàn)了更安全的細粒度訪問控制。一個數(shù)據(jù)所有者將一份明文數(shù)據(jù)加密發(fā)送給N個不同共享方,若使用傳統(tǒng)公鑰加密算法,如圖5(a)所示,數(shù)據(jù)所有者需要使用N個不同公鑰將明文加密N次,形成N份不同密文,分別發(fā)送給N個共享方。若使用ABE,如圖5(b)所示,加密時只需要根據(jù)成員屬性生成用于加密的公鑰PK,而不需要關心群體中成員的數(shù)量和身份,降低了數(shù)據(jù)加密開銷,也保護了成員隱私,能夠?qū)崿F(xiàn)更加靈活的訪問控制策略。
圖5 ABE算法與傳統(tǒng)非對稱加密的對比
在中心化系統(tǒng)的ABE方案中,單點故障或第三方不誠實可能會使系統(tǒng)的安全受到威脅。文獻[39]提出Etherenm與ABE相結(jié)合的框架,解決集中式云存儲系統(tǒng)中密鑰濫用、隱私數(shù)據(jù)泄露等問題。文獻[40]提出了一種基于Ethereum區(qū)塊鏈技術的訪問控制安全云存儲框架,數(shù)據(jù)所有者可以通過鏈上智能合約設置數(shù)據(jù)的有效訪問期限,并對訪問控制實現(xiàn)跟蹤。DAHB框架(distributed architecture based on hierarchical blockchain for internet of things)以基于屬性下訪問控制(attribute-based access control, ABAC)模型為基礎,采用智能合約實現(xiàn)對物聯(lián)網(wǎng)設備基于屬性的域內(nèi)和跨域的靈活、動態(tài)、自動化的訪問控制[41]。智能合約實現(xiàn)ABAC模型中策略執(zhí)行點、屬性權(quán)威、策略決策點部分,在屬性中引入信任度量,利用信任值與誠實度反映實體能夠履行合約的信用能力和穩(wěn)定性,作為授權(quán)決策的依據(jù)。文獻[42]針對大數(shù)據(jù)資源來源廣、動態(tài)性強的特點,提出基于ABAC的區(qū)塊鏈大數(shù)據(jù)訪問控制機制,保證訪問控制信息的透明公開、可審計、可驗證及不可篡改,實現(xiàn)數(shù)據(jù)的自動化靈活訪問。
訪問控制是EMR常用的隱私保護策略,基于角色的訪問控制(role-based access control, RBAC)著重于有權(quán)訪問信息的策略,被授權(quán)的用戶可以訪問全部數(shù)據(jù),因此很難控制數(shù)據(jù)原始區(qū)域的隱私性,然而在實際應用中,用戶僅需要獲得部分數(shù)據(jù)即可。文獻[43]提出了一種EMR差分隱私訪問控制機制,授權(quán)不受信任的第三方用戶僅擁有有限的數(shù)據(jù)視圖,該方法不僅考慮了時間、用戶特征等變量,也有效地控制了需要提供的信息量。針對包含敏感信息的分析數(shù)據(jù)(例如流行病分析需要分析身份來追蹤疾病傳播),文獻[44]將訪問控制機制與區(qū)塊鏈及差分隱私相集成以實現(xiàn)數(shù)據(jù)的保護。
基于屬性加密可實現(xiàn)對醫(yī)療數(shù)據(jù)更靈活、更細粒度的訪問控制,同時可實現(xiàn)一對多的授權(quán),降低數(shù)據(jù)加密開銷。借助區(qū)塊鏈去中心化、不可篡改特點實現(xiàn)數(shù)據(jù)所有者(患者、醫(yī)療機構(gòu)等)對數(shù)據(jù)的控制,避免了不可信第三方對數(shù)據(jù)的泄露,同時實現(xiàn)了公開透明、可審計的訪問控制,有助于制定更加靈活的訪問策略。
保證區(qū)塊鏈交易匿名性是醫(yī)療區(qū)塊鏈數(shù)據(jù)共享平臺隱私性的關鍵。各種數(shù)字簽名是實現(xiàn)匿名交易的常用手段。隨著醫(yī)療大數(shù)據(jù)挖掘與分析技術的發(fā)展,攻擊者可能通過對鏈上交易分析得到交易地址之間的關聯(lián),降低區(qū)塊鏈匿名性,對此可將交易進行混淆,或限制鏈上交易信息的發(fā)布來增大交易分析的難度。
3.2.1混幣機制 混幣機制能夠模糊交易發(fā)送方與接收方之間的關系,增加攻擊者通過公開賬本分析用戶交易規(guī)律的難度,是一種有效的區(qū)塊鏈隱私保護機制?;鞄艡C制基本思想可表達為
CM(Z1,CA(Z0,m),A)→CA(Z0,m),A,
(3)
式(3)左側(cè)代表中間方從發(fā)送方接收到的信息,右側(cè)代表中間方將信息處理后發(fā)送給接收方的消息。發(fā)送方首先使用接收方公鑰CA對消息Z0和m進行加密,再將加密信息、接收方地址A、驗證消息Z1打包并使用中間方公鑰加密,中間方對消息解密并驗證無誤后將CA(Z0,m)發(fā)送到地址A,接收方可對CA(Z0,m)進行解密[45]。在混幣過程中,中間方僅能驗證加密的消息CA(Z0,m)而無法得知具體消息內(nèi)容。
在中心化混幣機制中,混幣過程由第三方節(jié)點執(zhí)行,通過第三方節(jié)點處理,改變交易傳遞過程中流動軌跡,提高攻擊者發(fā)現(xiàn)交易流向的難度。此類混幣機制中提供混幣服務的第三方掌握輸入、輸出地址之間的聯(lián)系,存在泄露混幣過程的可能性。Mixcoin是一種改進的中心化混幣機制,為提高第三方節(jié)點的可信度,Mixcoin為用戶設置了審計功能,混幣服務節(jié)點的違規(guī)行為將造成信譽的損失,但Mixcoin并未在根本上解決第三方對混幣過程的泄露問題[46]。去中心化混幣機制不需要第三方節(jié)點參與,最早的去中心化混幣方案是比特幣論壇上提出的CoinJoin機制,核心思想是通過將多筆單輸入-單輸出交易合并為一筆多輸入-多輸出交易[45]。CoinJoin能夠避免第三方泄露混幣信息的風險,然而無法保護所有參與方的誠信,CoinShuffle的輸出地址洗牌機制能夠使參與者無法得到除自己以外的交易地址關聯(lián),但該方案在混幣過程中需要參與者同時在線,攻擊者可趁機發(fā)動拒絕服務攻擊[47]。CoinParty由安全多方計算模擬可信第三方,在網(wǎng)絡中存在惡意節(jié)點的情況下,能夠保證混幣過程的有效性[48]。
混幣機制實現(xiàn)簡單,能夠提高區(qū)塊鏈交易隱私性,并且不會對區(qū)塊鏈原有共識機制造成影響,但單獨使用混幣機制的效果十分有限,因此需要在未來的研究中結(jié)合安全高效的加密方案保證混幣過程的隱私性。目前的混幣機制主要應用于數(shù)字貨幣領域,對于數(shù)據(jù)量大、類型復雜的醫(yī)療信息,需要選擇有代表性的輕量數(shù)據(jù)作為交易信息,降低混幣過程難度。在密碼學機制保護下的混幣機制需要充分考慮醫(yī)療服務器的計算和存儲性能,同時盡量避免對區(qū)塊鏈底層協(xié)議的修改。
3.2.2零知識證明 零知識證明(zero-knowledge proof)由S.Micali和C.Rackoff提出,實現(xiàn)驗證者在不需要任何有效信息的情況下驗證消息的有效性。在區(qū)塊鏈中,零知識證明能夠隱藏交易雙方的地址、金額等細節(jié),并保證驗證節(jié)點驗證交易有效性。Zerocoin協(xié)議可將比特幣鑄造成Zerocoin,驗證者通過零知識證明來驗證Zerocoin是否被花費,而無法獲取Zerocoin的交易信息[49]。Zerocash采用簡潔非交互性零知識證明技術(zero-knowledge succinct non-interactive argument of knowledge, zk-SNARK),實現(xiàn)去中心化匿名支付,是目前區(qū)塊鏈UTXO模型中隱私性最強的加密貨幣,與Zerocoin相比,Zerocash對交易金額保密并支持任意面值的交易[50]。Hawk是一種基于零知識證明的隱私智能合約框架,由編譯器使用零知識證明等加密原語自動編譯,實現(xiàn)參與者、執(zhí)行者和區(qū)塊鏈三方之間的密碼學協(xié)議。Hawk的安全保障包括鏈上隱私和合約隱私;鏈上隱私指不向未參與合約的第三方公開交易細節(jié);合約隱私則保護的是合約參與者之間的合約共識[51]。
在醫(yī)療應用場景中,用戶身份與其他信息通常具有關聯(lián)性,攻擊者一旦通過交易分析手段將交易地址與用戶真實身份關聯(lián)起來,交易信息將完全暴露。零知識證明是保證隱私數(shù)據(jù)可驗證性的有效方法,但由于效率問題,該方法一般適用于數(shù)據(jù)量較小的數(shù)據(jù)。對于海量、結(jié)構(gòu)復雜的醫(yī)療數(shù)據(jù),一方面需要選擇具有代表性的數(shù)據(jù)作為驗證信息打包成交易,另一方面零知識證明的效率是需要考慮的關鍵問題。
3.2.3數(shù)字簽名 群簽名是1991年由Chaum提出的簽名概念,一個群體中的任意成員可以以匿名的方式代表整個群體對消息進行簽名,而且可以僅用單個群公鑰公開驗證。群簽名由群管理員管理,群管理員的存在保證了簽名的可追蹤性。環(huán)簽名是一種簡化的群簽名,簽名者只有選擇一個可能的簽名者集合,獲得其公鑰,然后公布這個集合即可,所有成員平等,不需要管理者。在群簽名中,群管理員可以撤銷簽名,揭露真正的簽名者,而環(huán)簽名在不添加額外信息的前提下無法揭示簽名者。盲簽名除了滿足一般的數(shù)字簽名條件外,還必須滿足下面的兩條性質(zhì)。
1)簽名者對其所簽署的消息是不可見的,即簽名者不知道他所簽署消息的具體內(nèi)容;
2)簽名消息不可追蹤,即當簽名消息被公布后,簽名者無法知道這是他哪次簽署的。
數(shù)字簽名常被用于保護區(qū)塊鏈交易匿名性,文獻[52]結(jié)合混幣及聚合簽名等技術,實現(xiàn)保護收付款者身份和交易金額隱私的全匿名區(qū)塊鏈系統(tǒng)。文獻[53]在Mixcoin的基礎上采用盲簽名進行改進,使第三方節(jié)點在混幣過程中無法獲得交易雙方信息,避免中心化混幣機制中交易雙方在混幣過程中對第三方節(jié)點透露信息。文獻[54]采用環(huán)簽名,使參與方在混幣過程中無須與其他用戶進行交互,為去中心化混幣機制中的拒絕服務攻擊提供了有效的防御措施。
交易匿名是區(qū)塊鏈應用場景中保護用戶隱私的關鍵,在實際醫(yī)療應用場景中,不僅需要在保護隱私的前提下對節(jié)點的真實身份進行認證,還需要考慮可監(jiān)管問題,通過對非法交易的溯源,實現(xiàn)對惡意行為的追責。文獻[55]提出一種基于身份認證的多密鑰生成中心(key generation center, KGC)群簽名方案,通過多KGC群簽名保護交易雙方的用戶身份,實現(xiàn)在節(jié)點間驗證身份的同時保護節(jié)點的隱私,該方案具有簽名不可偽造性,符合聯(lián)盟鏈區(qū)塊鏈部分去中心化和節(jié)點隱私要求。針對匿名認證的監(jiān)管問題,文獻[56]在匿名認證過程中加入監(jiān)管機制,通過匿名證書來確定用戶的權(quán)限,同時在出示證書時可選擇屬性,以確保用戶身份隱私信息不會泄露,可信中心(CA)在匿名認證的過程,若用戶出現(xiàn)不誠信行為,審計人員可隨時恢復出資產(chǎn)內(nèi)容和交易方身份信息對其進行追責。文獻[56]結(jié)合匿名認證技術、群簽名和零知識證明技術,使CA能夠?qū)δ涿C書進行身份追蹤。文獻[57]通過追蹤比特幣系統(tǒng)中交易信息在網(wǎng)絡層的傳播路徑,將交易中的匿名地址和發(fā)起交易節(jié)點的IP地址相關聯(lián),實現(xiàn)比特幣交易溯源。通過基于主動嗅探的鄰居節(jié)點識別方法,對特定節(jié)點發(fā)送探測信息以推測鄰居節(jié)點,實現(xiàn)輕量級交易溯源,該溯源機制有較強的實踐意義和使用價值,但很難適用于非交易型數(shù)據(jù)區(qū)塊鏈。
在醫(yī)療數(shù)據(jù)隱私保護的同時,還應當推動各醫(yī)療機構(gòu)和監(jiān)管部門的數(shù)據(jù)分享和連通,實現(xiàn)監(jiān)管全覆蓋,提高監(jiān)管效率。監(jiān)管機制有助于拓寬區(qū)塊鏈在醫(yī)療領域的應用范圍,提供健康的信息共享環(huán)境,預防及遏制攻擊者利用區(qū)塊鏈進行非法活動,使區(qū)塊鏈技術在醫(yī)療領域發(fā)揮更大的價值。
3.2.4安全通道協(xié)議 鏈下支付網(wǎng)絡將原本鏈上大量的交易細節(jié)放在鏈下處理僅將最終結(jié)果上鏈,區(qū)塊鏈作為仲裁平臺以確保交易安全性,對支付過程中的異常進行處理,保護交易細節(jié)隱私性的同時,間接提高系統(tǒng)的交易吞吐量[58]。
閃電網(wǎng)絡是最早的鏈下支付通道,主要包括RSMC(recoverable sequence maturity contract)協(xié)議和HTLC(hashed timelock contract)協(xié)議,使得系統(tǒng)內(nèi)任意兩個節(jié)點都可以通過支付通道實現(xiàn)轉(zhuǎn)賬,并在交易不上鏈的情況下確認交易[59]。文獻[60]中的支付通道是一個不受信任的中介,用來發(fā)行匿名憑證(vouchers)。發(fā)送方使用比特幣在支付通道中交換匿名憑證并發(fā)送收款方,收款方憑借匿名憑證兌換比特幣,區(qū)塊鏈作為仲裁平臺,通過鏈上智能合約來確保憑證交易期間的公平性,可防止惡意中介的抵賴,確保vouchers→BTC及BTC→vouchers過程的公平性。
安全通道通常需要結(jié)合數(shù)據(jù)加密技術實現(xiàn)交易過程中的安全性。文獻[60]與中心化混幣機制不同的是,盲簽名使得支付通道無法將憑證的發(fā)行與兌換相關聯(lián),即無法得知交易雙方的關系,保證交換期間的隱私性。文獻[61]針對鏈下第三方支付通道的隱私保護問題,運用盲簽名技術及零知識證明技術,使第三方不能獲取用戶的交易信息,從而防止第三方從中作惡,保證用戶的隱私性。TumbleBit是一種兼容比特幣系統(tǒng)的鏈下交易通道,在無信任的中介Tumbler中實現(xiàn)快速匿名的鏈下支付[62]。通過RSA和ECDSA密碼學技術,Tumbler能夠驗證用戶交易的真實性,而無法獲取用戶的交易信息,實現(xiàn)用戶交易的不可鏈接性,從而保證用戶隱私性。
Sprites方案是針對閃電網(wǎng)絡方案效率的改進,通過調(diào)用全局的Hash原像管理智能合約(preimage manage contract)的狀態(tài),近似并行的獲知交易是否完成,大大減少了最壞情況下用戶的等待時間,減少了時間成本[63]。鏈下交易方案在交易雙方?jīng)]有直接支付通道時,允許中繼節(jié)點作為服務提供者完成交易,中繼節(jié)點能獲取交易雙方的交易信息,使用戶的隱私受到威脅。針對支付通道網(wǎng)絡(payment-channel network, PCN)的隱私性與并發(fā)性,文獻[64]提出了Fulgor和Rayo協(xié)議,阻塞協(xié)議Fulgor能夠為PNC提供隱私性保障,但在支付網(wǎng)絡中存在一定死鎖概率,非阻塞協(xié)議Rayo解決了交易過程中的死鎖問題,但與Fulgor相比,Rayo犧牲了部分隱私性能。智能合約Multi-Hop HTLC是Fulgor和Rayo協(xié)議的核心,與閃電網(wǎng)絡相比,該合約隱藏了交易過程中的支付路徑,以保證交易雙方的身份隱私。
醫(yī)療數(shù)據(jù)交易場景中可能涉及相關方權(quán)限、多方計算等復雜問題,如果將整個交易過程上鏈,可能會影響區(qū)塊鏈性能。鏈下交易機制既能夠為區(qū)塊鏈的隱私保護提供新的思路,又在一定程度上提升交易吞吐量,但是這種方法需要對底層協(xié)議進行修改,對業(yè)務場景的限制較多,目前只能支持數(shù)字加密貨幣領域,將該方法用于醫(yī)療數(shù)據(jù)交易,需要將鏈上交易機制與鏈下系統(tǒng)有機結(jié)合,實現(xiàn)鏈上鏈下的協(xié)同。
3.2.5K匿名 隨著定位技術的快速發(fā)展,基于位置的服務(location-based services, LBS)在生活中日益普及,如醫(yī)療領域中的流行病監(jiān)控,基于位置數(shù)據(jù)來實現(xiàn)受感染個人的跟蹤,可以更好地了解社交距離的有效性,或根據(jù)先前的信息向可能接近已知病例的個人發(fā)送警報。位置和移動數(shù)據(jù)為更好地了解和抗擊流行病提供了一條有效途徑,然而LBS的使用可能伴隨用戶隱私的泄露,從而阻礙LBS的發(fā)展,因此研究者們針對位置隱私保護技術展開了研究。
基于K匿名的隱私保護方法被廣泛應用于基于位置的服務中,K匿名是Latanya Sweeney和Pierangela Samarati提出的一種匿名化數(shù)據(jù)技術,該模型的思想是將屬性標識進行泛化壓縮處理,使得所有記錄被劃分到若干等價類,每個等價類具有相同的標識,實現(xiàn)將一個記錄隱藏在一組記錄中,因此也成為基于分組的隱私保護模型。文獻[65]將匿名區(qū)的構(gòu)造視為請求用戶與協(xié)作用戶間的兩方博弈,利用區(qū)塊鏈賬本的不可篡改特性,為博弈雙方的真實位置提供證據(jù),懲罰泄露位置和欺騙行為的用戶,以約束其自利行為,自利行為多的一方不能構(gòu)造自己的匿名區(qū)。然而K匿名中存在背景知識攻擊,攻擊者可利用其擁有的背景知識以較高的概率推測出某些記錄所對應個體的隱私信息。對此,虛擬位置選擇(dummy-location selection, DLS)算法通過熵度量選擇虛擬位置,并在此算法的基礎上提出一種增強型的DLS,在熵明顯增加的情況下擴大隱藏區(qū)域,同時保持著原始算法的隱私級別,對于利用背景知識攻擊輔助尋找真實位置的攻擊者增加了分析難度[66]。相比于K匿名,差分隱私對背景知識攻擊可提供較強的隱私保護,在位置數(shù)據(jù)發(fā)布中實現(xiàn)了相關研究與應用。文獻[67]根據(jù)車輛軌跡的Markov特點計算位置節(jié)點的敏感度,并根據(jù)位置敏感度,統(tǒng)計閾值和敏感度閾值添加適量Laplace噪音,增加數(shù)據(jù)的可用性及有效性。文獻[68]的CPL算法將地理拓撲關系轉(zhuǎn)化為帶權(quán)無向圖,計算各區(qū)域的隱私級別,并提出差分隱私預算模型,該機制不僅能夠保護當前位置的隱私,還能夠保證之前的位置信息不會因當前位置信息的發(fā)布而泄露。
K匿名及差分隱私是位置隱私保護的常用方法,不依賴復雜的密碼學技術,因此用戶計算開銷較小,并可獲得精準的查詢結(jié)果。但此類方法無法提供有效的依據(jù)來證明其隱私保護水平,其安全性依賴于攻擊者掌握背景知識的多少,因此,面對新型攻擊,基于K匿名方法的模型需要不斷完善。
面向用戶的區(qū)塊鏈隱私保護重點是訪問權(quán)限及交易匿名性,表2介紹了訪問控制方法及交易匿名性隱私保護方法,并對各種方法的優(yōu)缺點進行對比。智能合約作為區(qū)塊鏈上能夠自動執(zhí)行的腳本,可實現(xiàn)更靈活、自動化的訪問控制策略,智能合約經(jīng)部署上鏈后不可修改,因此可保證授權(quán)的公平性,避免決策中心化,但智能合約本身存在安全漏洞可能為訪問控制帶來新的問題?;趯傩约用艿脑L問控制能夠?qū)崿F(xiàn)一對多的授權(quán)和更細粒度的訪問控制策略,但是其使用的雙線性加密耗費了較多的時間成本?;鞄艡C制可以在一定程度上實現(xiàn)隱私保護,但效果十分有限,因此需要結(jié)合其他的隱私保護手段來提高混幣過程的隱私性,如數(shù)字簽名、零知識證明等。零知識證明具有較強的安全性,但該方法效率較低,只適用于數(shù)據(jù)量較小的數(shù)據(jù)。數(shù)字簽名能夠保證交易匿名性,但在具體醫(yī)療應用場景中,在保護用戶隱私的同時也要兼顧監(jiān)管問題,對非法行為進行定位追溯,應當結(jié)合具體場景實現(xiàn)匿名性和監(jiān)管機制的平衡。安全通道協(xié)議能夠為區(qū)塊鏈的隱私保護提供新的思路,同時減輕鏈上存儲壓力,但是目前這種方法只用于數(shù)字加密貨幣領域,面向醫(yī)療領域更加復雜海量的數(shù)據(jù),還需要進一步研究。K匿名是一種基于分組的方法,常用于位置隱私保護,由于其不依賴復雜的密碼學技術,通常計算開銷較小,但面對新型的攻擊,其模型需要不斷改進。
表2 面向用戶的隱私保護方法對比
區(qū)塊鏈技術在隱私保護方面擁有獨特優(yōu)勢并取得了諸多研究成果,但區(qū)塊鏈在自身的安全性、隱私性、交易性能以及與其他隱私保護技術結(jié)合等方面均存在很多需要解決的問題,這些問題也是將區(qū)塊鏈應用于醫(yī)療信息隱私保護領域時必須解決的關鍵問題。
1)鏈上數(shù)據(jù)發(fā)布問題。區(qū)塊鏈通過公開透明的數(shù)據(jù)賬本,促進醫(yī)療數(shù)據(jù)更合理的流通與共享,為打破醫(yī)院內(nèi)部及醫(yī)院之間的數(shù)據(jù)孤島提供技術支持。區(qū)塊鏈去中心化、不可篡改特性能夠避免系統(tǒng)中數(shù)據(jù)被個人或機構(gòu)操縱,即使單個節(jié)點失效或遭受攻擊也不會影響數(shù)據(jù)的完整性及整個系統(tǒng)的運行。醫(yī)療信息具有來源廣、數(shù)據(jù)量大、數(shù)據(jù)類型復雜及隱私性強等特點,醫(yī)療數(shù)據(jù)集中包含的隱私信息會隨著數(shù)據(jù)的發(fā)布和共享而泄露,對于此類數(shù)據(jù)若不結(jié)合其他隱私手段直接發(fā)布上鏈,勢必對數(shù)據(jù)隱私造成影響。
由于區(qū)塊容量有限,且交易性能與吞吐量也是區(qū)塊鏈技術的一大瓶頸,區(qū)塊鏈難以直接存儲大規(guī)模數(shù)據(jù)。對于大規(guī)模的原始醫(yī)療數(shù)據(jù)的存儲與計算處理,勢必采用鏈上鏈下相結(jié)合的方式,因此區(qū)塊鏈賬本中需要發(fā)布具有代表性的數(shù)據(jù),在保證不泄露隱私的前提下,確保鏈下存儲數(shù)據(jù)的完整性與實際應用場景中數(shù)據(jù)交易的可驗證性。此外,實現(xiàn)區(qū)塊鏈與鏈下傳統(tǒng)信息系統(tǒng)的安全對接是進一步研究的關鍵問題。
2)匿名性與監(jiān)管的平衡。區(qū)塊鏈中支持匿名的交易,但從實際情況來看,區(qū)塊鏈交易匿名并不具備真正的匿名,隨著數(shù)據(jù)分析技術的發(fā)展,攻擊者仍然能夠通過數(shù)據(jù)挖掘等技術從鏈上公開的交易信息中得到地址之間的關聯(lián)關系,推測真實的用戶身份,因此用戶隱私性無法得到真正的保障。從消極角度看,這會對交易匿名性造成嚴重影響,由于交易的透明性,用戶身份暴露即鏈上信息會泄露;但從積極角度看,這有助于監(jiān)管機制發(fā)現(xiàn)非法交易及犯罪痕跡,對相關組織及責任人實現(xiàn)責任的定位與追蹤。在實際應用中,應結(jié)合具體場景平衡匿名性與可監(jiān)管性之間的關系,在保證合法用戶隱私的同時抵制非法行為。
基于上述問題,我們對區(qū)塊鏈在醫(yī)療信息隱私保護領域中的研究方向進行展望。
1)鏈下隱私計算與鏈上存證相結(jié)合。醫(yī)療原始數(shù)據(jù)只是醫(yī)療信息產(chǎn)業(yè)的基礎,其價值屬性遠低于作出相關計算分析處理(如大數(shù)據(jù)挖掘、深度學習等)后的增值價值。單個機構(gòu)組織通常面臨樣品數(shù)量不充足、數(shù)據(jù)維度不夠豐富等問題,在計算過程中需要多方補充數(shù)據(jù),然而,由于數(shù)據(jù)的高價值及隱私屬性,各醫(yī)療數(shù)據(jù)所有方在聯(lián)合計算過程中需要對數(shù)據(jù)進行隱私保護。若將醫(yī)療數(shù)據(jù)直接提供給需求方或進行多方之間的交互,極易造成隱私的泄露,因此許多數(shù)據(jù)用戶不愿提供數(shù)據(jù),導致大量數(shù)據(jù)無法發(fā)揮更大的使用價值。
分離數(shù)據(jù)的所有權(quán)和使用權(quán),實現(xiàn)多方醫(yī)療數(shù)據(jù)在無須出庫的情況下在本地進行聯(lián)合隱私計算,并將聯(lián)合計算產(chǎn)生的增值數(shù)據(jù)共享給需求方,使得需求方在不接觸原始數(shù)據(jù)即可獲取數(shù)據(jù)的增值價值,降低隱私泄露的風險。同態(tài)加密、SMPC等是實現(xiàn)醫(yī)療數(shù)據(jù)隱私計算的有效方法,然而這些方法側(cè)重于計算過程中對數(shù)據(jù)的保護,無法保證參與方提供數(shù)據(jù)的真實性以及計算結(jié)果的可驗證性。區(qū)塊鏈作為多方共同維護,能夠有效防止抵賴的分布式賬本技術,重在強調(diào)計算的可驗證性,以及防止計算結(jié)果的篡改。區(qū)塊鏈激勵機制也有助于促進各計算參與方履行既定計算協(xié)議,增加作惡的成本。因此,未來可嘗試將現(xiàn)有的隱私計算技術與區(qū)塊鏈技術相結(jié)合,通過鏈下隱私計算保證數(shù)據(jù)的隱私性與可控性,并由區(qū)塊鏈存儲計算過程中的相關憑證,以實現(xiàn)計算結(jié)果的可驗證性。
2)基于智能合約實現(xiàn)對數(shù)據(jù)的搜索授權(quán)及訪問控制。由于海量的醫(yī)療數(shù)據(jù)種類復雜,對隱私的需求不同,不適于鏈上存儲,因此在現(xiàn)有的醫(yī)療區(qū)塊鏈應用中,大多將原始數(shù)據(jù)加密存儲在鏈下數(shù)據(jù)庫中,鏈上只保存數(shù)據(jù)的摘要(如Hash值)以保證數(shù)據(jù)的完整性。確保醫(yī)療數(shù)據(jù)在共享過程中的隱私安全,需要實現(xiàn)鏈外數(shù)據(jù)的安全搜索,設置合理的訪問控制權(quán)限。智能合約具有自動執(zhí)行的特點,可對用戶進行訪問授權(quán),并在公開賬本中記錄對該用戶的授權(quán)以及數(shù)據(jù)搜索日志?;谥悄芎霞s的訪問控制策略有利于避免權(quán)力中心化,使得數(shù)據(jù)授權(quán)過程的透明公開化,實現(xiàn)更靈活、自動化的訪問控制。
3)實現(xiàn)“以鏈制鏈”的監(jiān)管機制以及非法交易溯源。監(jiān)管技術也是隱私保護可持續(xù)發(fā)展的關鍵之一,在研究醫(yī)療信息隱私保護的同時,還要對非法行為進行監(jiān)管和追溯,由于區(qū)塊鏈的匿名性及去中心化,對監(jiān)管區(qū)塊鏈,尤其是公有鏈提出了更高的要求。在醫(yī)療區(qū)塊鏈系統(tǒng)中可采用聯(lián)盟鏈+私有鏈的監(jiān)管機制,私有鏈由各機構(gòu)內(nèi)部維護,存儲數(shù)據(jù)相關信息,聯(lián)盟鏈中引入監(jiān)管節(jié)點,存儲數(shù)據(jù)交易信息以實現(xiàn)對數(shù)據(jù)的管控與追蹤,既可發(fā)揮私有鏈交易速度快、隱私性強的優(yōu)勢,又能通過聯(lián)盟鏈確保數(shù)據(jù)市場交易秩序、約束非法交易行為。此外,監(jiān)管方需要在保護合法用戶隱私的前提下及時發(fā)現(xiàn)非法交易,并對非法交易全過程及相關責任人進行定位追蹤,為惡意行為提供犯罪證據(jù)。
醫(yī)療信息化為醫(yī)學領域的研究與服務帶來便利的同時也帶來了很多新的隱私安全問題。區(qū)塊鏈的去中心化、不可篡改、匿名性、可追溯性等特點為保障醫(yī)療信息在共享過程中的安全隱私提供了解決思路。本文面向醫(yī)療信息領域,系統(tǒng)地梳理了區(qū)塊鏈的定義、架構(gòu)以及數(shù)據(jù)隱私保護需求,介紹了基于區(qū)塊鏈技術的數(shù)據(jù)和用戶隱私保護方法,并對這些方法進行了分析對比,總結(jié)了現(xiàn)有方法存在的問題和挑戰(zhàn),最后針對研究現(xiàn)狀中的不足與挑戰(zhàn),展望了未來的研究方向。