韓士斌,王士泉,于慧杰,于 楠,王愛娥,李 偉*
(1.東華軟件股份公司,北京 100191;2.火箭軍特色醫(yī)學中心核與輻射損傷實驗室,北京 100088)
區(qū)塊鏈技術是繼云計算、物聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能后最有潛力觸發(fā)第五輪顛覆性革命浪潮的核心技術[1]。區(qū)塊鏈的基本思想是通過建立一個網(wǎng)絡上的公共賬本,由網(wǎng)絡中所有參與的用戶(計算機)共同在賬本上記賬與核賬,每個用戶都有一樣的賬本,所有數(shù)據(jù)都是公開透明的,且不需要中心服務器作為信任中介,就能在技術層面保證信息的真實性和不可篡改性,即可信性。區(qū)塊鏈用技術設計取代權威控制和情感信任,并以此建立了一種網(wǎng)絡結構,所有用戶都可以參與并成為無數(shù)節(jié)點之一,從而進行認證、確權、交易、追溯和調整等一系列操作。區(qū)塊鏈技術公開透明、成本低、速度快、分布廣,且不會被篡改、偽造和取締記錄,可廣泛適用于醫(yī)療場景。
區(qū)塊鏈技術本質上是一種分布式記賬技術,可以看作是一個沒有中心節(jié)點的數(shù)據(jù)庫,它不是由某一方掌握的,而是各方共同參與記賬,利用簽名私鑰和共識機制,確保數(shù)據(jù)不被篡改或損毀。區(qū)塊鏈技術的基礎架構分為6層,包括數(shù)據(jù)層、網(wǎng)絡層、共識層、激勵層、合約層和應用層,每層分別完成一項核心功能,各層之間相互配合,從而實現(xiàn)了一個全員參與的信任機制[2]。區(qū)塊鏈技術可以顯著提升數(shù)據(jù)的安全性,節(jié)省顯性及隱性的互聯(lián)互通成本,因此在健康醫(yī)療領域,區(qū)塊鏈適合應用于以下幾個方面:
(1)醫(yī)聯(lián)體區(qū)塊鏈。將區(qū)塊鏈技術應用于醫(yī)聯(lián)體底層技術架構體系中,以解決長期困擾醫(yī)療機構的“信息孤島”和數(shù)據(jù)安全問題。以分級診療就醫(yī)體驗為例:居民就近在衛(wèi)生院體檢,通過區(qū)塊鏈技術進行體檢報告分析,篩查出心腦血管慢病的高?;颊撸枰D診的患者可以由社區(qū)醫(yī)生通過區(qū)塊鏈實現(xiàn)電子病歷向上級醫(yī)院的授權和流轉,而上級醫(yī)院的醫(yī)生在被授權后可通過電子病歷迅速了解患者的既往病史和體檢信息,患者不需要進行二次基礎檢查。
(2)區(qū)域慢病、腫瘤大數(shù)據(jù)中心?;趨^(qū)塊鏈分布式存儲技術建立大數(shù)據(jù)中心,可打通各醫(yī)療機構間慢病、腫瘤等醫(yī)療數(shù)據(jù)共享的壁壘,促進機構間完成數(shù)據(jù)共享,通過智能合約自動分配共享收益,助力實現(xiàn)持續(xù)、跨地區(qū)、跨機構的醫(yī)療大數(shù)據(jù)服務。
(3)藥品溯源。區(qū)塊鏈技術在藥品防偽領域的應用與身份認證極為相似,都是利用區(qū)塊鏈可追溯的特點,賦予藥品原料與成品唯一編碼,從而實現(xiàn)藥品溯源。
(4)蛋白質折疊。蛋白質可憑借相互作用在細胞環(huán)境(特定的酸堿度、溫度等)下自我組裝,這種自我組裝過程就是蛋白質折疊。如果蛋白質沒有正確折疊,將會使人患很多病癥,如阿爾茨海默癥、肌萎縮性脊髓側索硬化癥、帕金森氏癥等,而計算蛋白質折疊結構需要龐大的算力[3]。利用區(qū)塊鏈技術可以建立一個分布式網(wǎng)絡協(xié)助折疊蛋白質,網(wǎng)絡中每一個節(jié)點在進行運算時都可以調用全網(wǎng)的算力,從而大大降低科研項目中服務器的采購成本。
此外,還可將區(qū)塊鏈技術應用于醫(yī)保理賠、藥品流通、健康管理、醫(yī)療審計以及DRGs等領域,打造健康醫(yī)療產業(yè)新架構,助力醫(yī)院、醫(yī)保、醫(yī)藥、監(jiān)管等機構能實時連接、無縫分享數(shù)據(jù),且無需擔心信息泄露與篡改。通過建立一套互信共享機制來規(guī)范醫(yī)療行為,為在醫(yī)院、醫(yī)保、患者之間建立透明可信的新型關系提供了創(chuàng)新途徑,進一步激發(fā)了深化醫(yī)藥衛(wèi)生體制改革的動力和活力,提升了健康醫(yī)療的服務效率和質量[4]。
從目前國內情況來看,區(qū)塊鏈技術在醫(yī)療領域中仍處于嘗試與應用探索階段。區(qū)塊鏈技術最大的價值是在一個不可信的環(huán)境中提供信任,利用技術手段建立一套互信機制,這恰恰是我國醫(yī)療行業(yè)所急需的。
例如醫(yī)院將患者的診療過程以數(shù)據(jù)的形式寫入?yún)^(qū)塊鏈,可為醫(yī)患糾紛提供證據(jù),避免出現(xiàn)醫(yī)鬧現(xiàn)象或者醫(yī)院篡改病歷等事件;在集團化醫(yī)院中,A院將電子病歷、醫(yī)學影像、病理等數(shù)據(jù)存儲于區(qū)塊鏈并及時同步到B醫(yī)院的數(shù)據(jù)庫中,使患者的治療方案以一種精準實時、安全可信的方式在醫(yī)療體系內流轉,這不僅能節(jié)約醫(yī)療人員的人力時間成本,還提高了患者信息透明度,在增加患者對醫(yī)院、醫(yī)生信任的同時也避免了一些重復檢查項目,節(jié)省了就醫(yī)成本[5];在臨床科研中,共同協(xié)作的科研單位可將患者的臨床數(shù)據(jù),如性別、年齡、生理信號、實驗數(shù)據(jù)、癥狀、診療過程、診療結果、用藥等信息用區(qū)塊鏈技術進行存儲,匯聚成連續(xù)的、可共享的、實時更新的大樣本疾病隊列,并應用于疑難雜癥、重大慢病等課題研究,有助于人工智能篩查診斷、早期干預等人工智能算法的加速研究,開發(fā)智能輔助診療裝備;在區(qū)域分級診療或轉診平臺中,利用區(qū)塊鏈保存居民電子健康檔案及檢查、檢驗結果,并對相關字段進行隱私保護與權限控制,可有效解決當前居民電子健康檔案更新不及時,以及在轉診(上轉/下轉)環(huán)節(jié)由于需要單獨機構審核(一個可信的運營者),互認共享困難,難以在地區(qū)大規(guī)模推廣的現(xiàn)狀(目前,在一個區(qū)域示范醫(yī)聯(lián)體內部之間才能比較容易地實現(xiàn)轉診)[6]。
區(qū)塊鏈技術通過計算來獲取信任,其局限是效率不高。因此,在吞吐量高、交易頻次很高或實時性較高的場景(如大宗商品交易)中不太適用。此外,如果業(yè)務自身要求集中式管控或者授權(比如醫(yī)藥訂單的審批)也不適宜用區(qū)塊鏈技術處理。
2016年8月,國務院發(fā)布了《關于促進和規(guī)范健康醫(yī)療大數(shù)據(jù)應用發(fā)展的指導意見》,將健康醫(yī)療大數(shù)據(jù)納入國家發(fā)展軌跡。2017年2月,國家衛(wèi)生計生委發(fā)布《關于印發(fā)《“十三五”全國人口健康信息化發(fā)展規(guī)劃》的通知》(國衛(wèi)規(guī)劃發(fā)〔2017〕6號),要求大力促進健康醫(yī)療大數(shù)據(jù)應用發(fā)展,探索創(chuàng)新“互聯(lián)網(wǎng)+健康醫(yī)療”服務新模式、新業(yè)態(tài)。在上述政策利好背景下,各類區(qū)域健康醫(yī)療大數(shù)據(jù)中心、健康大數(shù)據(jù)產業(yè)園/基地/實驗室紛紛落地開花,其應用涉及健康管理、慢病服務、便民惠民、公共衛(wèi)生、醫(yī)療協(xié)同、行業(yè)治理、醫(yī)藥研發(fā)等各類新業(yè)態(tài)。此外,由各大科研院所/中心承擔的各類單病種科研項目的申報、獲批也如火如荼,如由國家癌癥中心牽頭的“一庫一網(wǎng)”項目,覆蓋了30家省級腫瘤醫(yī)院及177家市級腫瘤??漆t(yī)院,計劃在3 a內建成國家腫瘤數(shù)據(jù)中心及腫瘤大數(shù)據(jù)平臺;由科技部主持的“精準醫(yī)學研究”大規(guī)模人群隊列研究類項目、專病隊列研究項目(包括心血管疾病、腦血管疾病、呼吸系統(tǒng)疾病、代謝性疾病、罕見病等)、重大慢性非傳染性疾病防控研究等科研類項目。
上述項目/課題普遍都涉及了患者病案首頁信息、電子病歷等臨床與診療多模異構數(shù)據(jù)的分布式傳輸、匯聚、存儲及分析利用。因此,對上述數(shù)據(jù),既要求能夠真實可靠地在各醫(yī)院、研究單位、管理機構間流動,又要求對敏感數(shù)據(jù)進行脫敏與隱私保護,同時還要建立起各單位間完善可信的協(xié)作運行機制。區(qū)塊鏈技術的應用推廣,為臨床科研領域解決上述問題提供了強有力的手段。
研發(fā)重大慢病流行病學大數(shù)據(jù)監(jiān)測平臺,需要從臨床醫(yī)學中心(區(qū)域中心醫(yī)院)實時匯聚心血管臨床研究數(shù)據(jù)、糖尿病臨床研究數(shù)據(jù)、腫瘤登記信息,從疾病預防控制中心(centers for disease control,CDC)定時采集慢病危險因素監(jiān)測數(shù)據(jù),從區(qū)域衛(wèi)生健康委員會獲取全員人口、住院病案首頁以及死亡醫(yī)學證明數(shù)據(jù),能實現(xiàn)重大慢病海量結構化與非結構化數(shù)據(jù)的縱向鏈接,以及模糊匹配、精確檢索、患者畫像等功能[7]。
傳統(tǒng)的數(shù)據(jù)共享主要采用中央服務器和災備中心統(tǒng)一存儲技術,各用戶客戶端基于中心數(shù)據(jù)庫實現(xiàn)在線訪問,但同級用戶之間缺乏可信的數(shù)據(jù)共享交換機制,而基于去中心化的區(qū)塊鏈技術從根本上可以解決這個難題。針對重大慢性非傳染性專病數(shù)據(jù)共享,可通過確定基于核心關鍵變量及隨機抽樣變量的可信鏈賬本,依托響應式編程實現(xiàn)自主可控的許可鏈,逐步建立慢病共享、交換信息的高階共生生態(tài)運行框架。該框架通過超級賬本開源項目HyperLedger來實現(xiàn),共分為6層,從底層到上層分別是數(shù)據(jù)層、網(wǎng)絡層、共識層、合約層、API層和監(jiān)控層,如圖1所示。其中,數(shù)據(jù)層主要封裝底層數(shù)據(jù)區(qū)塊以及相關的數(shù)據(jù)加密和時間戳等技術;網(wǎng)絡層主要封裝分布式組網(wǎng)、數(shù)據(jù)傳播、消息訂閱和驗證等機制;共識層主要封裝網(wǎng)絡節(jié)點的各類共識算法;合約層主要封裝各類腳本、算法和智能合約,是區(qū)塊鏈可編程特性的基礎;應用層主要封裝區(qū)塊鏈的各種應用場景[8]。
圖1 高階共生生態(tài)運行框架
區(qū)塊鏈技術可解決重大慢病大數(shù)據(jù)的共享機制建立問題,通過共享權確認數(shù)據(jù)的所有權,實現(xiàn)區(qū)塊鏈初始化。通過區(qū)塊鏈一致性協(xié)議共享數(shù)據(jù)的有序擴散,采用公鑰體系實現(xiàn)用戶授權。在慢病可信數(shù)據(jù)共生生態(tài)下,每個共享資源端的機構是一個自成長的節(jié)點,均有一套獨立的賬本,每個客戶端數(shù)據(jù)一致,即使部分客戶端數(shù)據(jù)被毀也不影響數(shù)據(jù)安全的可靠性[9]。通過可視化的去中心記賬原型系統(tǒng),各協(xié)作機構可進一步提出數(shù)據(jù)共享索取需求,按照共享審核流程實現(xiàn)重點分發(fā)。面向合約容器的可視化去中心記賬原型系統(tǒng)主流程如圖2所示。
圖2 可視化區(qū)塊鏈記賬原型系統(tǒng)主流程
原型系統(tǒng)包括合約容器、區(qū)塊鏈、共識機制、可視化界面、網(wǎng)絡傳播和API接口6個部分。其中合約容器內包括合約部署、合約執(zhí)行和合約驗證模塊。區(qū)塊鏈包括區(qū)塊存儲與區(qū)塊檢索模塊。在合約執(zhí)行過程中用戶可通過可視化界面或API接口方式實現(xiàn)調用。共識機制是區(qū)塊鏈建立信任的基石,其內容包括賬本的規(guī)范化(如何組織區(qū)塊、組織交易鏈)、交易的確定性執(zhí)行結果、交易的非雙花唯一性、交易的順序完備性以及其他保證網(wǎng)絡安全穩(wěn)定運行的其他信息(如數(shù)據(jù)可用性)。此外,賬本底層還需要有共享的網(wǎng)絡傳播機制(包括各種P2P算法),便于進行基于權限的相關交易數(shù)據(jù)的快速同步。
區(qū)塊鏈設計采用HyperLedger Fabric技術架構,使用Redis數(shù)據(jù)庫持久化存儲,共識算法可插拔,采用Python語言實現(xiàn)運行任意智能合約,慢病、腫瘤數(shù)據(jù)通過API調用實現(xiàn)互聯(lián)互通。
區(qū)塊鏈技術的特性包括分布式、不可篡改、匿名性、可信共享、安全性等。利用區(qū)塊鏈技術的分布式鏈式結構特性來支持健康數(shù)據(jù)的共享;利用不可篡改的時間戳特性可解決數(shù)據(jù)追溯及信息防偽問題;利用高冗余度及多私鑰的復雜保管權限特性以滿足安全和隱私保護要求。其中,個人隱私保護基于區(qū)塊鏈的安全性;電子健康檔案流轉基于區(qū)塊鏈的不可篡改性,通過多簽名私鑰與非對稱加密技術來防止個人記錄被竊取。個人健康數(shù)據(jù)通過哈希函數(shù)處理后放置在區(qū)塊鏈上,之后使用多簽名私鑰技術,只有獲得授權的單位/機構才可以對數(shù)據(jù)進行訪問。如將個人健康體征數(shù)據(jù)放在區(qū)塊鏈上,通過分配組合一個私鑰private key,由幾個醫(yī)療機構(或協(xié)作單位)間共同持有private key的不同部分,只有private key遇到上面任何一方,才能授權訪問個人健康體征數(shù)據(jù)。
如果說人工智能帶來的是生產力的巨大提升,那么區(qū)塊鏈技術則提供了生產關系的變革手段。利用區(qū)塊鏈技術確保數(shù)據(jù)不被篡改或損毀的方式,更適用于醫(yī)療場景,其分布式結構可應用于醫(yī)療數(shù)據(jù)共享,其靈活的可編程特性可幫助醫(yī)療機構建立拓展應用。在去中心化的背景下,臨床醫(yī)學中心、疾病控制中心、衛(wèi)生健康委員會等機構中慢病、腫瘤醫(yī)療數(shù)據(jù)的查詢和使用記錄都將以不可篡改的方式記錄在區(qū)塊鏈上,使科研人員能獲取完整的隊列資料用于臨床研究;使衛(wèi)生管理者能夠動態(tài)掌握各類慢病資源,實現(xiàn)科學管理和決策;使患者能夠掌握個人連續(xù)的健康資料,享受跨區(qū)域、跨機構的健康醫(yī)療服務,從而建立臨床科研與區(qū)塊鏈技術相結合的新模式。