關(guān)鍵詞】 醫(yī)療成像;大數(shù)據(jù);數(shù)據(jù)管理;健康信息互操作性;隱私權(quán);數(shù)據(jù)加密;政策制訂【中圖分類號】 R 446.9 R 197.3 【文獻標識碼】 ADOI: 10.12114/j.issn.1007-9572.2023.0897
Research on the Privacy-preserving Technical Scheme and the Coordinative Policies Strategies for Big Data in Medical Imaging
CHEN Kaiyuan1,2,CHENLong3,ZHANGYi1,2,CHAI Runqi3,WANGNa2,ZENG Huatang1,2.4,CHAI Senchun,LIANG Wannian1,2*
1.VankeSchoolofPublicHealth,TsinghuaUniversity,BeijinglOoo84,China 2.HealthyChinaResearchInstitute,TsinghuaUniversity,BeijinglOoo84,China 3.SchoolofAutomation,Beijing InstituteofTechnology,BeijinglOoo81,China 4.Shenzhen Health Development Research and Data ManagementCenter,Shenzhen518028,China *Corresponding authors:CHAI Senchun,Professor/Doctoral supervisor;E-mail:chaisc97@bit.edu.cn LIANGWannian,Professor/Doctoral supervisor; E -mail:liangwn@tsinghua.edu.cn CHENKaiyuan and CHENLongareco-first authors
【Abstract】BackgroundResponding to the increasing demand for privacy encryption in image-based medical big data,itisofgeatimpoanceofproposinganinovativeframeworkofoded-asedprivacypreservingsegmentationtechology,andexploringtheimplementationpathwaystofacilitatetepracticalapplicationofthistechnologyfromacollboratiepespective of technologyandpolicylegislation.ObjectiveTodevelopaprivacyprotectiontechnologyframeworktailoredforimage-based medical bigdata,andpropose policyandlegislativecoodinationstrategies toadvance thetechnolog'sadoption,inorderto enhance the healthcare informatizationservicesystembycombining technological innovation with policysupport.Methods Constructtheinnovativeframeworkforprivacypreservingsegmentationtechnologyinmedicalimagebigdatabyliteraturereview, theoreticalanalysis,technologyframeworkdevelopment,experimentalvalidation,andpolicyanalysis,andthenproposethe policyandlegislativecoordinationstrategies.ResultsWesuccessullyconstructtheinovativeframeworkforprivacypreserving segmentation technologyinmedical image bigdata andthough theefectiveness verification,and propose specificpolicyand legislativerecommendations addresing theinadequaciesofexistinglaws andregulationsin areas such asclouddata processing, liabilityatribution,technicalstandards,andspecialdataprotection.ConclusionCoded-basedinnovativeframework for privacypreserving segmentation technology inmedical image bigdatacanenableeffectivesharingandutilizationof image-based medicaldata bysafeguarding patient'sprivacy,significantlyenhancethedatasecurityand privacyprotectionlevel,andthe proposing ofcoespondingpolicyandlegislativecoodinationstrategiesoffers novelinsightsndapproaches toscue goveance in this domain.
【Key words】Medical imaging;Big data;Data management;Health information interoperability;Privacy;Data encryption;Policy making
習近平總書記指出,“創(chuàng)新是一個系統(tǒng)工程,創(chuàng)新鏈、產(chǎn)業(yè)鏈、資金鏈、政策鏈相互交織、相互支撐”“科技創(chuàng)新、制度創(chuàng)新要協(xié)同發(fā)揮作用,兩個輪子一起轉(zhuǎn)”[1],體現(xiàn)了制度協(xié)同創(chuàng)新之于科技創(chuàng)新的關(guān)鍵性。2023年3月,中共中央辦公廳、國務(wù)院辦公廳印發(fā)《關(guān)于進一步完善醫(yī)療衛(wèi)生服務(wù)體系的意見》(以下簡稱《意見》)。為“深入貫徹黨中央關(guān)于實施健康中國戰(zhàn)略的決策部署,推動全面建立中國特色優(yōu)質(zhì)高效的醫(yī)療衛(wèi)生服務(wù)體系,為人民群眾提供全方位全周期健康服務(wù)”,《意見》強調(diào)發(fā)揮信息技術(shù)支撐作用,提出“加強健康醫(yī)療大數(shù)據(jù)共享交換與保障體系建設(shè)”“推進醫(yī)療聯(lián)合體內(nèi)信息系統(tǒng)統(tǒng)一運營和互聯(lián)互通,加強數(shù)字化管理”“加快健康醫(yī)療數(shù)據(jù)安全體系建設(shè),強化數(shù)據(jù)安全監(jiān)測和預(yù)警,提高醫(yī)療衛(wèi)生機構(gòu)數(shù)據(jù)安全防護能力,加強對重要信息的保護”等[2],為推進數(shù)字健康治理科學化、醫(yī)療大數(shù)據(jù)安全治理領(lǐng)域技術(shù)創(chuàng)新等提供了方向指引。
為實現(xiàn)科技創(chuàng)新與制度創(chuàng)新的“雙輪驅(qū)動”,應(yīng)切實以制度創(chuàng)新破除制約科技創(chuàng)新的體制、機制障礙,通過補齊醫(yī)療大數(shù)據(jù)安全治理領(lǐng)域的規(guī)范性、支持性政策立法短板而完善政策協(xié)同機制,最大限度上調(diào)動創(chuàng)新主體的積極性并釋放其創(chuàng)新活力。目前,數(shù)字健康治理領(lǐng)域的科學研究在學科交叉融合及技術(shù)與政策立法協(xié)同方面存在一定的真空地帶,導(dǎo)致部分先進技術(shù)難以及時落地應(yīng)用。為積極響應(yīng)國家戰(zhàn)略,探索數(shù)字健康治理領(lǐng)域技術(shù)方案與政策立法協(xié)同機制深度融合路徑,本研究以圖像類醫(yī)療大數(shù)據(jù)安全治理場景為切入點,深入分析此類場景中隱私加密需求及相關(guān)技術(shù)研究現(xiàn)狀,提出一種基于編碼的創(chuàng)新型圖像類醫(yī)療大數(shù)據(jù)隱私保護分割技術(shù)框架,并從宏觀與微觀兩個層面探索促進圖像類醫(yī)療大數(shù)據(jù)隱私加密技術(shù)落地應(yīng)用的政策立法協(xié)同策略,以期從科學技術(shù)革新與政策立法助力兩個維度推動健康信息化服務(wù)體系的完善,為健康中國建設(shè)獻計獻策。
1圖像類醫(yī)療大數(shù)據(jù)隱私加密需求及相關(guān)技術(shù)、政策立法研究現(xiàn)狀
隨著國家大數(shù)據(jù)戰(zhàn)略的推進與實施,數(shù)據(jù)的計算與處理逐漸從本地計算機轉(zhuǎn)移至云平臺,后者可以在很大程度上解決計算、存儲資源及空間問題。在深度學習模型高速發(fā)展的背景下,云平臺已成為深度學習模型數(shù)據(jù)庫擴容、大數(shù)據(jù)資源共享及大模型訓(xùn)練的重要依托。在圖像類醫(yī)療大數(shù)據(jù)共享交換領(lǐng)域,云服務(wù)器的應(yīng)用是實現(xiàn)不同醫(yī)療機構(gòu)間數(shù)據(jù)互聯(lián)互通及跨平臺數(shù)據(jù)分析的主要手段,然而,醫(yī)療數(shù)據(jù)通常包含患者隱私等敏感信息,須通過加密技術(shù)等加以保護,在保障有益共享的前提下限制未經(jīng)授權(quán)的數(shù)據(jù)訪問及泄露。如何平衡數(shù)據(jù)開放與加密的限度并增強共享交換策略的可控性、穩(wěn)定性是相關(guān)技術(shù)、政策立法研究共同面臨的重要問題。
1.1 相關(guān)技術(shù)研究現(xiàn)狀
在技術(shù)層面,過度的醫(yī)療數(shù)據(jù)隱私限制會阻礙不同醫(yī)療機構(gòu)間的合作,因此需積極開發(fā)適當?shù)碾[私加密算法,以實現(xiàn)數(shù)據(jù)開放與加密的有效平衡、安全可控。目前,用于實現(xiàn)圖像類醫(yī)療大數(shù)據(jù)隱私加密的算法主要包括4大類:聯(lián)邦學習、數(shù)據(jù)變換、同態(tài)加密、可學習的圖像加密。此外,部分學者還基于主流框架提出了一些其他類型的隱私加密算法?,F(xiàn)階段主流圖像類醫(yī)療大數(shù)據(jù)隱私加密算法及代表性研究詳見表1[3-15]
1.2相關(guān)政策立法研究現(xiàn)狀
目前,醫(yī)療大數(shù)據(jù)安全治理相關(guān)政策立法研究已充分論證了醫(yī)療大數(shù)據(jù)隱私保護的必要性:呂欣等「的研究論述了大數(shù)據(jù)安全和隱私保護的重要價值及關(guān)鍵技術(shù)突破在其中發(fā)揮的核心作用;閆倩等[7]的研究支持醫(yī)學數(shù)據(jù)開放與安全政策協(xié)同的必要性;劉軍平等[18]的研究從靜態(tài)安全和動態(tài)安全兩個維度闡釋了醫(yī)療數(shù)據(jù)安全的內(nèi)涵和外延,提出應(yīng)建立醫(yī)療數(shù)據(jù)全生命周期防護體系的建議;葉竹盛等「19]的研究探討了我國當前法律框架中醫(yī)療數(shù)據(jù)的“去標識化”和“匿名化”制度基礎(chǔ)。然而,上述醫(yī)療大數(shù)據(jù)安全治理相關(guān)政策立法研究多是基于單一學科理論,未與技術(shù)發(fā)展、實踐有機結(jié)合,且研究視角多集中在宏觀概念及不同政策之間的耦合關(guān)系,缺乏針對有關(guān)政策落地方案的探索。
綜上,醫(yī)療大數(shù)據(jù)高效治理格局的實現(xiàn)需要從兩個方面進行突破:一是不斷創(chuàng)新、研發(fā)關(guān)鍵技術(shù);二是持續(xù)推進技術(shù)與政策立法的協(xié)同發(fā)展。因此,本研究擬突破傳統(tǒng)單一學科研究范式,在針對當前技術(shù)短板提出改進方案的基礎(chǔ)上,深度結(jié)合圖像類醫(yī)療大數(shù)據(jù)共享交換應(yīng)用場景具體需求及技術(shù)特點,以促進技術(shù)落地及制度貫徹為導(dǎo)向,探索切實可行的政策立法支撐方案。
2 圖像類醫(yī)療大數(shù)據(jù)隱私加密技術(shù)方案
2.1 概述
針對圖像類醫(yī)療大數(shù)據(jù)共享交換隱私加密需求,本研究團隊提出了一種基于編碼的創(chuàng)新型圖像類醫(yī)療大數(shù)據(jù)隱私保護分割技術(shù)框架,該框架包括部署于客戶端的圖像編碼網(wǎng)絡(luò)、掩膜編碼網(wǎng)絡(luò)和部署于服務(wù)器端的分割網(wǎng)絡(luò)(圖1),可通過對數(shù)據(jù)編碼將數(shù)據(jù)變換為不包含視覺隱私信息的編碼,從而實現(xiàn)原始數(shù)據(jù)的隱私保護。
2.2圖像/掩膜編碼網(wǎng)絡(luò)
圖像編碼網(wǎng)絡(luò)本質(zhì)上是一個由編碼器和解碼器組合而成的自動編碼器,具有相同的輸人和目標。輸入或目標通常為MRI圖像、X線圖像等醫(yī)療圖像。編碼器由1個輸入層和4個下采樣層組成,其中輸入層是1個卷積塊的重復(fù)應(yīng)用,包括1個核大小 3×3 、步幅2、填充1的卷積層,隨后是批量歸一化(batchnormalization,BN),1個線性整流函數(shù)(rectifiedlinearunit,ReLU)激活函數(shù)層,以穩(wěn)定訓(xùn)練;下采樣層類似于輸入層,但在卷積塊之前包含一個步幅2的最大池化操作。解碼器由4個上采樣層和1個輸出層組成,其中上采樣層利用尺度為2的雙線性插值來恢復(fù)特征圖的分辨率;輸出層是1個 1×1 卷積層,沒有填充,以保證輸出形狀與輸入相同。
注:A為訓(xùn)練設(shè)置,B為推理設(shè)置; x 表示醫(yī)學圖像, x′ 表示重建的醫(yī)學圖像, xe 表示編碼醫(yī)學圖像, ye 表示編碼分割掩膜, y 表示分割掩膜, y′ 表示重建的分割掩膜, ye′ 表示預(yù)測的編碼分割掩膜。
掩膜編碼網(wǎng)絡(luò)遵循與圖像編碼網(wǎng)絡(luò)相同的架構(gòu),但具有不同的輸人和目標,其中輸入被替換為特定任務(wù)的“金標準”分割掩碼,目標的通道數(shù)被更改為與分割前景類別數(shù)一致。一旦圖像編碼網(wǎng)絡(luò)訓(xùn)練完成,來自圖像編碼網(wǎng)絡(luò)和掩膜編碼網(wǎng)絡(luò)的編碼器輸出將分別作為分割網(wǎng)絡(luò)的輸入和目標。
圖像/掩膜編碼網(wǎng)絡(luò)結(jié)構(gòu)詳見表2。
2.3分割網(wǎng)絡(luò)
分割網(wǎng)絡(luò)不同于廣泛應(yīng)用的U型結(jié)構(gòu)分割網(wǎng)絡(luò)[20],其通常使用多個下采樣操作步驟,并跟隨多個上采樣操作步驟。分割網(wǎng)絡(luò)在編碼器中采用雙線性插值,在卷積層之后的解碼器中采用最大池化操作,這就導(dǎo)致中間特征的空間維度大于輸入或輸出;為了利用全局上下文信息,在靠近輸入和輸出層的位置采用了金字塔池化模塊(PPM)[21],以融合不同池化尺度下的特征。本研究使用的PPM是1個四層的模塊,其池化尺度分別為1、3、5、7。此外,本研究還采用編碼器與解碼器之間的跳躍連接[22],以更好地保留位置信息剩余的架構(gòu)與圖像/掩膜編碼網(wǎng)絡(luò)相同。分割網(wǎng)絡(luò)的輸人來自圖像編碼網(wǎng)絡(luò)的編碼圖像,目標來自掩膜編碼網(wǎng)絡(luò)的編碼掩碼,而由于從圖像編碼網(wǎng)絡(luò)中分離出來的編碼器的輸出已包含了足夠的高層語義含義,沒必要再冒著丟失更多位置信息的風險通過下采樣操作來提取特征,因此本研究的分割網(wǎng)絡(luò)采用了上述過完備架構(gòu)。
綜上,創(chuàng)新型圖像類醫(yī)療大數(shù)據(jù)隱私保護分割技術(shù)框架的3個網(wǎng)絡(luò)是獨立的,只要數(shù)據(jù)準備就緒,就可以在不需要來自其他網(wǎng)絡(luò)的梯度或特征的情況下進行訓(xùn)練。通常情況下,對于隱私保護分割,創(chuàng)新型圖像類醫(yī)療大數(shù)據(jù)隱私保護分割技術(shù)框架的圖像編碼網(wǎng)絡(luò)和掩膜編碼網(wǎng)絡(luò)部署在醫(yī)院或醫(yī)療實體等客戶端,而分割網(wǎng)絡(luò)則部署在服務(wù)器端,即云服務(wù)提供商等。
2.4訓(xùn)練過程和推理過程
訓(xùn)練過程:首先,通過最小化輸入和輸出之間的差值訓(xùn)練圖像編碼網(wǎng)絡(luò)和掩膜編碼網(wǎng)絡(luò),訓(xùn)練完成后將編碼器從編碼網(wǎng)絡(luò)中分離出來,對圖像和GT分割掩碼進行編碼;其次,將包含足夠語義信息和很少視覺信息的編碼圖像和掩碼傳輸?shù)椒?wù)器端,以訓(xùn)練分割網(wǎng)絡(luò)學習編碼圖像到編碼掩碼的映射。創(chuàng)新型圖像類醫(yī)療大數(shù)據(jù)隱私保護分割技術(shù)框架的訓(xùn)練過程見圖2。
推理過程:完成3個網(wǎng)絡(luò)的訓(xùn)練后,創(chuàng)新型圖像類醫(yī)療大數(shù)據(jù)隱私保護分割技術(shù)框架就可用于醫(yī)學圖像分割,在此階段,只需要圖像編碼網(wǎng)絡(luò)的編碼器、掩膜編碼網(wǎng)絡(luò)的解碼器和分割網(wǎng)絡(luò):首先,由客戶端的編碼器對醫(yī)學圖像進行編碼;其次,將編碼后的圖像傳輸?shù)椒?wù)器端作為分割網(wǎng)絡(luò)的輸入,然后再將輸出傳輸回客戶端;最后,由解碼器對從服務(wù)器端返回的數(shù)據(jù)進行解碼,從而獲得圖像的預(yù)測分割掩碼,實現(xiàn)通過僅傳輸編碼數(shù)據(jù)同時保留原始圖像甚至掩碼在本地的方式來保護圖像類醫(yī)療大數(shù)據(jù)隱私。創(chuàng)新型圖像類醫(yī)療大數(shù)據(jù)隱私保護分割技術(shù)框架的推理過程見圖3。
2.5 有效性驗證
基于公開的心臟MRI數(shù)據(jù)集(來自多中心、多供應(yīng)商、多疾病心臟分割挑戰(zhàn)賽,共包含320個來自5個醫(yī)療中心的具有手工標注的樣本并進行了多次實驗)[23]前3個醫(yī)療中心的數(shù)據(jù)與Python 3.10、PyTorch1.12.0、Ubuntu 18.04,以Dice 相似系數(shù)(dice similaritycoefficient,DSC)作為評價指標,驗證創(chuàng)新型圖像類醫(yī)療大數(shù)據(jù)隱私保護分割技術(shù)框架的有效性,結(jié)果顯示,其在前3個醫(yī)療中心數(shù)據(jù)中的DSC分別為 81.14% !80.67% 、 80.15% ,證實了該框架的有效性。
3 圖像類醫(yī)療大數(shù)據(jù)隱私保護政策立法協(xié)同機制
創(chuàng)新型圖像類醫(yī)療大數(shù)據(jù)隱私保護分割技術(shù)框架主要分為訓(xùn)練過程和推理過程,數(shù)據(jù)流轉(zhuǎn)主要在“客戶端-云服務(wù)器-客戶端”這一閉環(huán)中進行,其基礎(chǔ)架構(gòu)與當前主流的用于圖像類醫(yī)療大數(shù)據(jù)深度學習類隱私加密算法一致。因此,基于創(chuàng)新型圖像類醫(yī)療大數(shù)據(jù)隱私保護分割技術(shù)框架探討政策立法在各環(huán)節(jié)及各主體層面的協(xié)同策略具有合理性與普適性,但是,創(chuàng)新型圖像類醫(yī)療大數(shù)據(jù)隱私保護分割技術(shù)框架下相關(guān)數(shù)據(jù)在云服務(wù)器的加密流轉(zhuǎn)是圖像類醫(yī)療大數(shù)據(jù)深度學習類隱私加密算法中不可或缺的環(huán)節(jié)之一,我國現(xiàn)階段的數(shù)據(jù)安全治理政策立法對于規(guī)范云端數(shù)據(jù)存在一定缺位,且針對圖像類醫(yī)療大數(shù)據(jù)等敏感數(shù)據(jù)的保護尚存較大制度建設(shè)空間。
3.1醫(yī)療大數(shù)據(jù)安全治理政策立法現(xiàn)狀及面臨的問題
自2015年黨的十八屆五中全會首次提出“國家大數(shù)據(jù)戰(zhàn)略”以來,中共中央、國務(wù)院陸續(xù)出臺了一系列政策、規(guī)范文件,逐步建立起較為完備的數(shù)據(jù)基礎(chǔ)制度。2022年12月,中共中央、國務(wù)院出臺《關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見》[24],進一步明確了數(shù)據(jù)基礎(chǔ)制度的外延,即數(shù)據(jù)產(chǎn)權(quán)制度、流通交易制度、收益分配制度、安全治理制度,其中數(shù)據(jù)產(chǎn)權(quán)制度、流通交易制度均需以保障數(shù)據(jù)安全為前提。由此可見,安全治理制度是數(shù)據(jù)基礎(chǔ)制度的核心。然而,由于我國數(shù)據(jù)安全治理制度建設(shè)尚處于起步階段,頂層架構(gòu)尚未完全建立健全,因此數(shù)據(jù)安全治理體系仍存在主責部門不清、相關(guān)主體權(quán)責界限模糊、跨部門協(xié)同未形成制度化、缺乏常態(tài)化統(tǒng)籌協(xié)調(diào)機制等問題,并有賴于相關(guān)政策立法的完善。
在數(shù)據(jù)安全治理方面,我國的頂層法律法規(guī)主要包括《中華人民共和國民法典》第四編第六章“隱私與個人信息保護”、《中華人民共和國刑法》中有關(guān)數(shù)據(jù)犯罪的條款及《中華人民共和國網(wǎng)絡(luò)安全法》《中華人民共和國數(shù)據(jù)安全法》《中華人民共和國個人信息保護法》《關(guān)鍵信息基礎(chǔ)設(shè)施安全保護條例》等。在醫(yī)療大數(shù)據(jù)安全治理領(lǐng)域,相關(guān)法律法規(guī)還包括《中華人民共和國基本醫(yī)療衛(wèi)生與健康促進法》,且《中華人民共和國基本醫(yī)療衛(wèi)生與健康促進法》第四十九條對健康醫(yī)療數(shù)據(jù)安全保障提出了更為具體的要求,包括:“加快醫(yī)療衛(wèi)生信息基礎(chǔ)設(shè)施建設(shè),制定健康醫(yī)療數(shù)據(jù)采集、存儲、分析和應(yīng)用的技術(shù)標準”“推進醫(yī)療衛(wèi)生機構(gòu)建立健全醫(yī)療衛(wèi)生信息交流和信息安全制度”等。
對于醫(yī)療大數(shù)據(jù)安全治理,上述法律法規(guī)面臨的問題主要分為3個方面:(1)有關(guān)數(shù)據(jù)安全治理的條款多為原則性規(guī)定,缺乏實施細則,數(shù)據(jù)治理主體缺乏有效的制度性參考,無法真正推進數(shù)據(jù)安全治理工作的落地實施,導(dǎo)致數(shù)據(jù)安全無法得到有效保障,如《中華人民共和國數(shù)據(jù)安全法》第三章“數(shù)據(jù)安全制度”第二十二條雖規(guī)定:“國家建立集中統(tǒng)一、高效權(quán)威的數(shù)據(jù)安全風險評估、報告、信息共享、監(jiān)測預(yù)警機制”,但并未對相關(guān)機制的主責部門及實施程序做出具體規(guī)定。(2)不同層級、不同時間頒布的法律法規(guī)在數(shù)據(jù)保護對象、數(shù)據(jù)處理者義務(wù)等方面的規(guī)定存在沖突,導(dǎo)致各主體在開展數(shù)據(jù)安全治理相關(guān)工作時缺乏一致性及有序性,如《中華人民共和國刑法》保護的數(shù)據(jù)僅包括“計算機信息系統(tǒng)中存儲、處理或者傳輸?shù)臄?shù)據(jù)”,但在《中華人民共和國數(shù)據(jù)安全法》《中華人民共和國個人信息保護法》中,受保護的數(shù)據(jù)類型則不限于計算機信息系統(tǒng)中的數(shù)據(jù)。(3)當前政策立法存在一定的滯后性及碎片化特征,無法完全適應(yīng)當前技術(shù)發(fā)展,主要表現(xiàn)為數(shù)據(jù)安全立法滯后于相關(guān)技術(shù)及業(yè)務(wù)發(fā)展,多項法規(guī)、政策、標準、實施細則未實現(xiàn)體系化整合且存在制度缺位,如現(xiàn)行法律法規(guī)未明確云端大數(shù)據(jù)傳輸及加密規(guī)范,國家層面立法與地方、行業(yè)立法在數(shù)據(jù)開放主管部門、數(shù)據(jù)標準、個人權(quán)利保護程度等方面未實現(xiàn)系統(tǒng)化整合。
上述法律法規(guī)在醫(yī)療大數(shù)據(jù)安全治理領(lǐng)域面臨的問題一方面會加劇數(shù)據(jù)孤島的形成,另一方面可能導(dǎo)致相關(guān)大數(shù)據(jù)新技術(shù)業(yè)態(tài)發(fā)展面臨無法可依的情況,
需要指出的是,為推動醫(yī)療大數(shù)據(jù)的互聯(lián)互通,完善相關(guān)數(shù)據(jù)安全治理制度,中共中央、國務(wù)院及中央網(wǎng)信辦、工業(yè)和信息化部、國家衛(wèi)生健康委員會等部門制定并發(fā)布了更具針對性的政策文件,在一定程度上填補了頂層政策立法的不足,相關(guān)政策文件主要包括:國務(wù)院辦公廳于2016年印發(fā)的《關(guān)于促進和規(guī)范健康醫(yī)療大數(shù)據(jù)應(yīng)用發(fā)展的指導(dǎo)意見》、于2018年印發(fā)的《關(guān)于促進“互聯(lián)網(wǎng) + 醫(yī)療健康”發(fā)展的意見》;國家衛(wèi)生健康委于2018年印發(fā)的《國家健康醫(yī)療大數(shù)據(jù)標準、安全和服務(wù)管理辦法(試行)》和《全國醫(yī)院信息化建設(shè)標準與規(guī)范(試行)》,國家衛(wèi)生健委員會、國家中醫(yī)藥管理局于2019年印發(fā)的《關(guān)于落實衛(wèi)生健康行業(yè)網(wǎng)絡(luò)信息與數(shù)據(jù)安全責任的通知》,國家衛(wèi)生健康委、國家醫(yī)療保障局、國家中醫(yī)藥管理局于2020年印發(fā)的《關(guān)于深入推進“互聯(lián)網(wǎng) + 醫(yī)療健康”“五個一”服務(wù)行動的通知》,國家衛(wèi)生健康委、國家中醫(yī)藥局于2020年印發(fā)的《關(guān)于加強全民健康信息標準化體系建設(shè)的意見》,國家衛(wèi)生健康委、國家中醫(yī)藥局、國家疾控局于2022年印發(fā)的《“十四五”全民健康信息化規(guī)劃》等。此外,國家衛(wèi)生健康委還先后發(fā)布了227項衛(wèi)生健康信息化標準,進一步完善了醫(yī)療大數(shù)據(jù)安全治理體系。然而,上述具有針對性的政策文件在頂層設(shè)計與貫徹落實方面仍存在一定短板:(1)政策文件的頂層設(shè)計未能完全匹配大數(shù)據(jù)領(lǐng)域的技術(shù)發(fā)展,如一些新興類型數(shù)據(jù)的保護未被政策文件覆蓋,數(shù)據(jù)安全保護技術(shù)的合規(guī)性尚未得到有關(guān)政策文件支持,行業(yè)促進性政策文件未提供重點技術(shù)鼓勵清單等;(2)有關(guān)部門尚未對相關(guān)政策、標準文件進行系統(tǒng)化梳理并在統(tǒng)一平臺公布,上傳下達存在一定的不暢;(3)國家相關(guān)部門未對地方政府制定的數(shù)據(jù)治理政策及標準進行全面的合規(guī)審查,且未對中央及地方的權(quán)力邊界進行明確劃分,導(dǎo)致中央和地方的政策及標準兼容性較差,一定程度上加劇了醫(yī)療大數(shù)據(jù)治理制度的碎片化。
3.2基于圖像類醫(yī)療大數(shù)據(jù)隱私加密場景的“科技一制度”一體化解決方案
在圖像類醫(yī)療大數(shù)據(jù)隱私加密場景中,現(xiàn)行法律法規(guī)及政策在隱私保護方面尚存在以下問題:(1)同一數(shù)據(jù)在不同類型終端的流轉(zhuǎn)未被充分考慮,如前所述,《中華人民共和國刑法》保護的數(shù)據(jù)僅包括“計算機信息系統(tǒng)中存儲、處理或者傳輸?shù)臄?shù)據(jù)”,針對云數(shù)據(jù)的犯罪如何入刑尚有待相關(guān)法律及司法解釋進一步明確。(2)相關(guān)法律法規(guī)及政策不能適應(yīng)云平臺“去中心化特征,如《中華人民共和國數(shù)據(jù)安全法》第二十七條規(guī)定“重要數(shù)據(jù)的處理者應(yīng)當明確數(shù)據(jù)安全負責人和管理機構(gòu),落實數(shù)據(jù)安全保護責任”,該條款用于本地數(shù)據(jù)時具有可執(zhí)行性,但涉及“去中心化”的云端數(shù)據(jù)處理時則很難明確責任歸屬;此外,我國各層級相關(guān)政策文件亦未對云端數(shù)據(jù)隱私保護的責任主體做出統(tǒng)一規(guī)定。(3)隱私保護方面尚缺乏相應(yīng)的技術(shù)標準。圖像類醫(yī)療大數(shù)據(jù)具有兩項基本特征,即圖像數(shù)據(jù)的二維性和醫(yī)療數(shù)據(jù)的敏感性,但現(xiàn)行法律法規(guī)及政策文件并未針對不同類別數(shù)據(jù)制定差異化技術(shù)標準,且已有的技術(shù)標準的規(guī)范對象多為數(shù)據(jù)元,并未對技術(shù)準入標準出規(guī)定。(4)在頂層法律法規(guī)層面未充分體現(xiàn)對敏感性醫(yī)療數(shù)
據(jù)的特殊保護。有關(guān)醫(yī)療大數(shù)據(jù)治理及健康信息保護的法律條款主要見于《中華人民共和國基本醫(yī)療衛(wèi)生與健康促進法》第四十九條、《中華人民共和國個人信息保護法》第二十八條、最高人民法院《關(guān)于審理利用信息網(wǎng)絡(luò)侵害人身權(quán)益民事糾紛案件適用法律若干問題的規(guī)定》第十二條等,但其實施細則有待進一步明確。由此可見,政策立法與目前主流圖像類醫(yī)療大數(shù)據(jù)隱私加密技術(shù)存在一定脫節(jié)問題,相關(guān)技術(shù)或可因缺乏制度保障而難以落地。
針對圖像類醫(yī)療大數(shù)據(jù)隱私加密場景制定“科技-制度”一體化解決方案,首先應(yīng)明確場景需求、主要技術(shù)環(huán)節(jié)、技術(shù)邊界及制度短板,進而通過推進制度框架與技術(shù)框架的融合而實現(xiàn)二者的協(xié)同,具體到本研究微觀層面的聚焦點-圖像類醫(yī)療大數(shù)據(jù)隱私加密場景而言,其主要場景需求是實現(xiàn)圖像類醫(yī)療信息在“客戶端-云服務(wù)器端-客戶端”的“可視化-隱私加密-數(shù)據(jù)解碼”。因此,制定相關(guān)數(shù)據(jù)治理政策時應(yīng)充分考慮該場景中數(shù)據(jù)流轉(zhuǎn)特點,對同一數(shù)據(jù)的全生命周期可溯源性做出規(guī)定,并明確同一數(shù)據(jù)在不同流轉(zhuǎn)環(huán)節(jié)中的差異化隱私保護方式、程度及責任歸屬。此外,由于當前隱私加密算法的主要目的在于促進基于云服務(wù)器的醫(yī)學圖像多中心協(xié)作,且本研究已驗證了創(chuàng)新型圖像類醫(yī)療大數(shù)據(jù)隱私保護分割技術(shù)框架的有效性,因此可以考慮將“鼓勵基于云服務(wù)器的醫(yī)學圖像多中心協(xié)作”納入數(shù)字健康促進政策。在技術(shù)標準制定方面,本研究已對主流圖像類醫(yī)療大數(shù)據(jù)隱私加密算法進行了系統(tǒng)梳理,可考慮以此為基礎(chǔ),聯(lián)合主責部門及業(yè)界專家明確隱私加密技術(shù)準入指標,并以標準合規(guī)審查為目的,通過試點示范方式在推廣前預(yù)評估相關(guān)指標與各類強制性、促進性政策的契合度。
“十四五”規(guī)劃綱要已明確建設(shè)數(shù)字中國戰(zhàn)略部署,并將加強公共數(shù)據(jù)開放共享列為重點工作之一,提出“建立健全國家公共數(shù)據(jù)資源體系,確保公共數(shù)據(jù)安全,推進數(shù)據(jù)跨部門、跨層級、跨地區(qū)匯聚融合和深度利用”。因此,協(xié)同推進圖像類醫(yī)療大數(shù)據(jù)共享學習技術(shù)、隱私加密技術(shù)及數(shù)據(jù)安全治理制度發(fā)展有助于這一戰(zhàn)略目標在醫(yī)療衛(wèi)生領(lǐng)域的落地。同時,隨著大數(shù)據(jù)時代科學技術(shù)的迭代更新,大數(shù)據(jù)的類型、承載媒介、處理及傳輸技術(shù)手段等亦呈現(xiàn)多元化發(fā)展。因此,以技術(shù)應(yīng)用場景為單元實施“科技-制度”一體化解決方案可在最大限度上推動相關(guān)制度的與時俱進,但考慮到政策立法穩(wěn)定性與合理性的平衡,宜在充分、全面考慮醫(yī)療大數(shù)據(jù)領(lǐng)域各類場景需求及技術(shù)共性的基礎(chǔ)上完善原則性的頂層立法,在實施細則、司法解釋、各層級政策及技術(shù)標準中充分考慮不同場景需求之間的差異,從宏觀與微觀、技術(shù)與制度等維度完善我國圖像類醫(yī)療大數(shù)據(jù)安全治理體系,形成科技與制度相互促進的可持續(xù)發(fā)展格局。
小結(jié)與展望
本研究論述了從技術(shù)發(fā)展及政策立法兩個維度“雙管齊下”推進我國醫(yī)療大數(shù)據(jù)安全治理體系發(fā)展與完善的重要性,通過聚焦圖像類醫(yī)療大數(shù)據(jù)隱私加密場景下的“科技-制度”一體化解決方案,提出促進技術(shù)與政策立法高效匹配與協(xié)同的可行路徑。當前,數(shù)字健康領(lǐng)域的各類技術(shù)正處于高速發(fā)展階段,政策立法的滯后性問題日益凸顯。在技術(shù)研發(fā)階段針對新興技術(shù)框架及特點同步開展具有針對性的制度匹配研究或可在一定程度上解決制度的滯后性問題,從而優(yōu)化科研促進環(huán)境,推動新技術(shù)的研發(fā)與及時落地。在此過程中,探索多學科融合路徑并建立創(chuàng)新型交叉學科研究范式至關(guān)重要。
作者貢獻:陳開元負責研究選題與設(shè)計,論文撰寫;陳龍負責算法設(shè)計、數(shù)據(jù)處理、計算機代碼實現(xiàn);張怡、柴潤祺負責論文修訂;王娜、曾華堂負責提供研究數(shù)據(jù),參與理論研究;柴森春、梁萬年負責選題指導(dǎo)、審閱與修訂論文,對文章整體負責。
本文無利益沖突。
陳開元D https://orcid.org/0000-0001-5165-0802
參考文獻
[1]李蕾.協(xié)同推進科技創(chuàng)新和制度創(chuàng)新[EB/OL].(2023-12-15)[2024-01-22]. https://politics.gmw.cn/2023-12/15/content_37030655.htm.
[2]新華社.中共中央辦公廳國務(wù)院辦公廳印發(fā)《關(guān)于進一步完善醫(yī)療衛(wèi)生服務(wù)體系的意見》[EB/OL].(2023-03-23)[2023-11-13].https://www.gov.cn/zhengce/2023-03/23/content_5748063.htm.
[3]LI WQ,MILLETARI F,XU DG,et al.Privacy-preservingfederated brain tumour segmentation[M]//Machine Learning inMedical Imaging.Cham:SpringerInternational Publishing,2019:133-141.D0I: 10.1007/978-3-030-32692-0_16.
[4]LIXX,GUYF,DVORNEKN,etal.Multi-sitefMRIanalysisusingprivacy-preserving federated learning and domainadaptation:ABIDE results[J].MedImage Anal,2020,65:101765.
[5]WICAKSANAJ,YANZQ,ZHANGD,etal.FedMix:mixedsupervised federated learning for medical image segmentation[J].IEEETransMedImaging,2023,42(7):1955-1968.
[6]LIM,LAILZ,SUDAN,etal.PrivyNet:aflexible framework forprivacy-preserving deep neural network training[EB/OL].(2017-09-18)[2023-11-13].https://arxiv.org/abs/1709.06161v3.
[7]ALI OSIAS,TAHERIA,SHAMSABADI AS,etal. Deep private-feature extraction[J].IEEE TransKnowl Data Eng,2020,32(1):54-66.DOI: 10.1109/TKDE.2018.2878698.
[8]DINGXF,F(xiàn)ANGHB,ZHANG ZL,etal.Privacy-preserving feature extraction via adversarial training[J].IEEE TransKnowlData Eng,2022,34(4):1967-1979.
[9]DOWLIN N,GILAD-BACHRACHR,LAINEK,etal.Cryptonets:applying neural networks to encrypted datawith highthroughput and accuracy[C].Proceedings of the 33rd InternationalConference on Machine Learning,New York,USA,2016.
[10]HESAMIFARD E, TAKABI H,GHASEMI M. CryptoDL:deepneural networks over encrypted data[EB/OL].(2017-11-15)[2023-11-13].https://arxiv.org/abs/1711.05189v1.
[11]TANAKA M.Learnable image encryption[C]//2018 IEEEInternational Conference on Consumer Electronics-Taiwan(ICCE-TW).May 19-21,2018,Taichung,Taiwan,China.IEEE,2018:1-2.DOI:10.1109/ICCE-China.2018.8448772.
[12]SIRICHOTEDUMRONG W,KINOSHITA Y,KIYA H. Pixel-basedimage encryptionwithout key management for privacy-preserving deep neural networks [J].IEEE Access,2019,7:177844-177855.
[13]HUANG Q X, YAP W L, CHIU M Y, et al. Privacy-preservingdeep learning with learnable image encryption on medical images[ J].IEEE Access,2022,10:66345-66355.
[14] CHANG Q,QU H, ZHANG Y K, et al. Synthetic learning:learn from distributed asynchronized discriminator GAN withoutsharing medical image data[C]//2O2O IEEE/CVF Conference onComputer Vision and Pattern Recognition(CVPR). June 13-19,2020.Seatle,WA,USA.IEEE,2020:13853-13863.
[15] KIM B N,DOLZ J, JODOIN P M,et al. Privacy-net: anadversarial approach for identity-obfuscated segmentation of medicalimages[J].IEEE Trans Med Imag,2021,40(7):1737-1749.DOI: 10.1109/TMI.2021.3065727.
[16]呂欣,韓曉露.健全大數(shù)據(jù)安全保障體系研究[J].信息安全研究,2015,1(3):211-216.
[17]閆倩,馬海群.我國開放數(shù)據(jù)政策與數(shù)據(jù)安全政策的協(xié)同探究[J].圖書館理論與實踐,2018(5):1-6.
[18]劉軍平,黃澤雨.醫(yī)療數(shù)據(jù)安全之困境及其破解路徑[J].醫(yī)學與法學,2023,15(5):14-19.
[19]葉竹盛,劉婉君.醫(yī)療科研中的生物醫(yī)療數(shù)據(jù)“匿名化”問題研究[J].醫(yī)學與法學,2023,15(4):44-53.
[20]RONNEBERGER O,F(xiàn)ISCHERP,BROX T.U-Net:convolutionalnetworks for biomedical image segmentation[M]//Medical ImageComputing and Computer-Assisted Intervention - MICCAI 2015.Cham:Springer International Publishing,2015:234-241.
[21]ZHAOHS,SHIJP,QI XJ,et al.Pyramid scene parsing network[C]//2017 IEEE Conference on Computer Vision and PatternRecognition(CVPR). July 21-26,2017,Honolulu,HI,USA.IEEE,2017:6230-6239.DOI:10.1109/CVPR.2017.660.
[22]HE K M, ZHANG X Y,REN S Q,et al. Deep residual learningfor image recognition [C]//2O16 IEEE Conference on ComputerVision and Pattern Recognition(CVPR).June27-30,2016,LasVegas,NV,USA.IEEE,2016:770-778.
[23] CAMPELLO V M,GKONTRA P, IZQUIERDO C,et al. Multi-centre,multi-vendor and multi-disease cardiac segmentation:theMamp;Ms challenge[J]. IEEE Trans Med Imaging,2021,40(12):3543-3554. DOI: 10.1109/TMI.2021.3090082.
[24]新華社.中共中央 國務(wù)院關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見[EB/OL].(2022-12-19)[2023-11-14].https://www.gov.cn/zhengce/2022-12/19/content_5732695.htm.(收稿日期:2024-11-08;修回日期:2025-01-04)(本文編輯:鹿飛飛)