一、前言
近年來,智慧醫(yī)療逐漸成為全球醫(yī)療健康領(lǐng)域的研究熱點和發(fā)展趨勢。在智慧醫(yī)療環(huán)境中,包括但不限于電子病歷、醫(yī)學影像等健康數(shù)據(jù)往往涉及患者的個人隱私,具有極高的敏感性和重要性。然而,醫(yī)療健康隱私數(shù)據(jù)在存儲和傳輸過程中面臨著諸多安全風險。例如,數(shù)據(jù)泄露可能導致患者隱私被侵犯,進而引發(fā)一系列法律問題;數(shù)據(jù)被篡改則可能影響醫(yī)生的診斷和治療決策,對患者的生命健康構(gòu)成威脅等。因此,研究智慧醫(yī)療健康隱私數(shù)據(jù)安全保護方法具有重要意義。針對數(shù)據(jù)的隱私保護問題,國內(nèi)外學者已經(jīng)進行了大量研究,并取得了顯著成果。文獻1中針對隱私數(shù)據(jù)安全保護問題,設(shè)計一種基于雙層鏈的安全保護方法,可以保證數(shù)據(jù)的真實性、安全性和可擴展性,但雙層鏈結(jié)構(gòu)的復雜性和技術(shù)實現(xiàn)難度較高,在實際應用中,如何確保雙層鏈的穩(wěn)定運行和高效通信是一個挑戰(zhàn)。文獻[2]中針對隱私數(shù)據(jù)安全保護問題,設(shè)計一種基于聯(lián)邦學習算法的安全保護方法,可以提升數(shù)據(jù)的抵抗病毒攻擊能力,但聯(lián)邦學習算法需要參與方之間頻繁交換模型參數(shù),在復雜網(wǎng)絡(luò)中可能導致巨大的通信開銷。鑒于傳統(tǒng)隱私數(shù)據(jù)安全保護方法存在的問題,本文提出了一種基于可搜索加密的智慧醫(yī)療健康隱私數(shù)據(jù)安全保護方法,以期能夠推動我國智慧醫(yī)療領(lǐng)域的健康發(fā)展。
二、篩選智慧醫(yī)療健康隱私數(shù)據(jù)
一般來說,智慧醫(yī)療健康數(shù)據(jù)涵蓋了個人信息、病歷記錄、診斷結(jié)果、治療方案等多個方面,包含大量的敏感信息,一旦發(fā)生泄露,將造成嚴重的安全問題。因此,為了有效保護智慧醫(yī)療健康隱私數(shù)據(jù)的安全,需要對隱私數(shù)據(jù)進行精準篩選。本文引入基于隱私偏序拓撲分類的方法進行智慧醫(yī)療健康隱私數(shù)據(jù)篩選。首先,獲取智慧醫(yī)療健康數(shù)據(jù)序列中每個數(shù)據(jù)的屬性,這些屬性包括但不限于患者的個人信息、病歷記錄、診斷結(jié)果和治療方案等,并根據(jù)各屬性的敏感程度,確定智慧醫(yī)療健康數(shù)據(jù)的隱私等級。然后,結(jié)合隱私數(shù)據(jù)排序敏感性算法,完成隱私偏序的拓撲分類。這一步驟旨在將具有相似隱私程度的智慧醫(yī)療健康數(shù)據(jù)歸為一類,形成不同的隱私數(shù)據(jù)簇。此時,為了更精確地描述每個隱私數(shù)據(jù)簇的隱私特性,本文定義了極小隱私集的概念。具體來說,就是在一個智慧醫(yī)療健康隱私數(shù)據(jù)集中,包含所有隱私程度最高數(shù)據(jù)的子集即為極小隱私集。在智慧醫(yī)療健康隱私數(shù)據(jù)集X中,設(shè)所有數(shù)據(jù)構(gòu)成的集合為 X={X1 , x2 , ,每個數(shù)據(jù)x都有對應的隱私程度度量值 p(xi) 定義極小隱私集V,見式(1):
V=[x∈X|p(x)=maxy∈Xp(y)]
極小隱私集V是智慧醫(yī)療健康隱私數(shù)據(jù)集中,由所有隱私程度達到最大值的數(shù)據(jù)所組成的子集。因此,本文通過獲取極小隱私集,可以推算出任意一個首隱私極元數(shù)據(jù)(即隱私程度最高的數(shù)據(jù))在極小隱私集內(nèi)的相對隱私秩。首隱私極元數(shù)據(jù)S是極小隱私集V中的任意一個元素。它滿足 s∈V, 并且在隱私程度上,S與極小隱私集中其他元素具有相同的最高隱私程度,也就是符合極小隱私集的定義條件,是極小隱私集的成員。相對隱私秩用于衡量首隱私極元數(shù)據(jù)在極小隱私集內(nèi)的相對位置或隱私程度的相對關(guān)系。那么,相對隱私秩的計算公式見式(2):
式中, p(xi) 表示數(shù)據(jù)項 x 的隱私程度度量值, minXi 表示數(shù)據(jù)集X中所有數(shù)據(jù)項的隱私程度的最小值,maxXi表示數(shù)據(jù)集X中所有數(shù)據(jù)項隱私程度的最大值。在實際篩選中,假設(shè)智慧醫(yī)療健康隱私數(shù)據(jù)集中的極小隱私集處于非空狀態(tài)。那么,對于隱私程度最高的智慧醫(yī)療健康數(shù)據(jù)來說,隱私線序集的隊尾節(jié)點指向該數(shù)據(jù)。此時,本文在已知層數(shù)和相對隱私秩的情況下,不斷更新智慧醫(yī)療健康數(shù)據(jù)的極小隱私集,直至達到最大迭代次數(shù),停止更新,可以輸出一組隱私線序,該線序包含隱私數(shù)據(jù)記錄指針、偏序隱私層號以及相對隱私秩。最后,根據(jù)輸出的隱私線序,可以完成基于隱私偏序的智慧醫(yī)療健康數(shù)據(jù)的拓撲分類,并根據(jù)各類別數(shù)據(jù)的敏感程度,篩選出隱私數(shù)據(jù),進而制定個性化隱私保護方案。
三、基于可搜索加密的隱私數(shù)據(jù)安全保護
根據(jù)上述內(nèi)容完成智慧醫(yī)療健康隱私數(shù)據(jù)的篩選后,針對篩選出的隱私數(shù)據(jù),本文設(shè)計一種基于國密SM9的可搜索加密方案,以此進行安全保護。首先,以安全參數(shù)A為輸入,生成系統(tǒng)中的公開參數(shù)。具體來說:選取雙線性對群 Q1,Q2 1 Qr , Q1 , Q2 為素數(shù)N階循環(huán)群,e: 為雙線性映射, Y1?Y2 分別為群 Q1,Q2 的生成元,這是基于雙線性對的數(shù)學特性,為后續(xù)加密、解密以及陷門生成提供基礎(chǔ)運算環(huán)境。選取哈希函數(shù)
哈希函數(shù)用于將任意長度的輸入映射為固定長度的哈希值,在加密過程中用于對數(shù)據(jù)進行摘要處理,確保數(shù)據(jù)完整性驗證。密鑰派生函數(shù) F2:{0,1}*?{0,1}L ,密鑰派生函數(shù)KDF根據(jù)輸入的種子值生成所需長度的密鑰材料,其中L為SM9中使用對稱加密的密鑰長度。確定消息認證碼函數(shù)M,消息認證碼函數(shù)M用于驗證消息的完整性和真實性,防止數(shù)據(jù)在傳輸過程中被篡改。選取8比特表示的私鑰生成函數(shù)標識符B,私鑰生成函數(shù)標識符B則用于標識特定的私鑰生成方式,以便在系統(tǒng)中正確生成和管理私鑰。結(jié)合上述參數(shù),即可生成輸出系統(tǒng)參數(shù)C,見式(3):
式中,R表示輸出系統(tǒng)參數(shù)之一。以上述系統(tǒng)輸出參數(shù)C為輸入,分別生成接收方和發(fā)送方的密鑰對。本文隨機選取 α∈HN* 作為接收方私鑰,計算 αY1 作為接收方公鑰。隨機選取 β∈HN* 作為發(fā)送方私鑰,計算 作為發(fā)送方公鑰,這種基于隨機數(shù)選取私鑰,并通過與生成元的運算得到公鑰的方式,是公鑰加密體系的常見做法,保證了密鑰對的安全性和隨機性。完成密鑰生成后,本文以關(guān)鍵詞 G∈(0, 1)* 、接收方公鑰 αY1 、發(fā)送方私鑰 β 、隨機比特 x∈(0, 1)* 和系統(tǒng)參數(shù)C為輸入,生成關(guān)鍵詞密文 WG ,見式(5):
W1 、 W2 、 W3 的表述見式(6:
式中, W1? W2 、 W3 表示智慧醫(yī)療健康隱私數(shù)據(jù)組成,r表示在生成關(guān)鍵詞密文過程中使用的隨機值,Enc為加密函數(shù)。同時,本文以關(guān)鍵詞 、發(fā)送方公鑰 {BY1. 接收方私鑰 ∝ 和系統(tǒng)參數(shù)C為輸入,生成關(guān)鍵詞陷門P(G),見式(7):
最后,以關(guān)鍵詞密文 WG 、關(guān)鍵詞陷門P(G)和系統(tǒng)參數(shù)C為輸人,對二者所含關(guān)鍵詞是否一致進行匹配測試。在SM9結(jié)構(gòu)中,對稱密鑰派生通?;谝延械乃借€和其他相關(guān)參數(shù)進行。以接收方為例,在生成關(guān)鍵詞密文和陷門時,需要用到對稱密鑰。已經(jīng)生成接收方私鑰 ∝ 和系統(tǒng)公開參數(shù),對稱密鑰 Ksym 可以通過如下方式派生:首先,計算一個中間值 ,這里利用雙線性映射e的特性,將接收方公鑰 αY1 和群 Q2 的生成元 Y2 進行映射運算。然后,將Z作為密鑰派生函數(shù)KDF的輸入,結(jié)合其他必要的參數(shù)(如特定的鹽值、標識信息等,假設(shè)為salt和info),生成對稱密鑰,見式(8):
Ksym=KDF(Z,salt,info,L)
其中,R表述為式(4):
R=(Q1,Q2,QT,N,e,Y1,Y2)
L為所需對稱密鑰的長度。這樣就完成了從私鑰和系統(tǒng)參數(shù)到對稱密鑰的派生過程,為后續(xù)的加密操作提供對稱密鑰支持。
當用戶想要搜索某個關(guān)鍵詞時,使用陷門和加密數(shù)據(jù)作為輸入,進行匹配測試。匹配測試的過程通常涉及雙線性對的計算,通過比較計算結(jié)果和某個預定值來判斷關(guān)鍵詞是否存在于加密數(shù)據(jù)中。如果匹配測試成功,說明關(guān)鍵詞存在于加密數(shù)據(jù)中,系統(tǒng)可以返回相應的搜索結(jié)果(如包含該關(guān)鍵詞的文檔標識符)。否則,說明關(guān)鍵詞不存在于加密數(shù)據(jù)中,系統(tǒng)返回空結(jié)果或表示未找到的提示。
圖1智慧醫(yī)療健康隱私數(shù)據(jù)的安全性系數(shù)對比
私鑰泄露時,因過往密文基于當時公鑰和系統(tǒng)參數(shù)加密,攻擊者無私鑰無法逆向推導關(guān)鍵詞原文,也無法偽造陷門,確保歷史密文安全。密鑰更新后,新密文基于新私鑰加密,舊陷門因與新密文參數(shù)不匹配,無法通過匹配測試保障新密文安全。
如果通過匹配測試,則說明本文設(shè)計的基于國密SM9的可搜索加密方案,能夠滿足智慧醫(yī)療健康隱私數(shù)據(jù)的安全保護需求。
在加密過程中,身份認證是確保數(shù)據(jù)完整性和真實性的重要步驟。在SM9算法中,身份認證可以通過使用消息認證碼函數(shù)MAC來實現(xiàn)。具體步驟如下。
生成消息認證碼:在加密過程中,發(fā)送方可以使用消息認證碼函數(shù)MAC,將消息、對稱密鑰、接收方的公鑰以及其他相關(guān)參數(shù)作為輸入,生成消息認證碼Tag。這個消息認證碼Tag將附加在加密消息上一起發(fā)送給接收方。
驗證消息認證碼:接收方在收到加密消息和消息認證碼后,可以使用相同的消息認證碼函數(shù)MAC,將解密后的消息、對稱密鑰(通過共享密鑰派生得到)以及自己的公鑰作為輸入,重新生成消息認證碼Tag。然后,比較Tag'和接收到的Tag是否相等,以驗證消息的完整性和真實性。
因此,本文通過結(jié)合公鑰認證可搜索加密技術(shù)設(shè)計的隱私數(shù)據(jù)安全保護方案,能夠在加密智慧醫(yī)療健康隱私數(shù)據(jù)上直接進行搜索,同時保證數(shù)據(jù)的隱私性和完整性。
四、實驗分析
(一)實驗設(shè)置
為了驗證可搜索加密下智慧醫(yī)療健康隱私數(shù)據(jù)安全保護方法的有效性和優(yōu)越性,將該方法設(shè)置為實驗組,并引入基于雙層鏈的和基于聯(lián)邦學習算法的兩種智慧醫(yī)療健康隱私數(shù)據(jù)安全保護方法,設(shè)置為對照組,展開仿真對比實驗。首先,采用高性能服務器,搭建本次仿真實驗環(huán)境。然后,采用EICU數(shù)據(jù)集作為實驗數(shù)據(jù)。EICU數(shù)據(jù)集是一個包含大量重癥監(jiān)護患者健康隱私信息的公開智慧醫(yī)療數(shù)據(jù)集,涵蓋了患者的姓名、性別、治療記錄等多種類型的數(shù)據(jù)。實驗過程中,分別應用實驗組方法和對照組中兩種方法針對實驗數(shù)據(jù)集進行安全保護,對比分析保護結(jié)果。
(二)結(jié)果分析
在本次實驗中,為避免實驗結(jié)果的偶然性,將原始EICU數(shù)據(jù)集劃分為多個不同大小的數(shù)據(jù)包。在不同規(guī)模的智慧醫(yī)療健康隱私數(shù)據(jù)下,分別應用上述三種方法進行安全保護。為了驗證各方法對隱私數(shù)據(jù)的保護效果,對智慧醫(yī)療健康隱私數(shù)據(jù)進行模擬攻擊,引入了針對不同攻擊類型的影響因子,從數(shù)據(jù)泄露、推斷攻擊以及訪問模式泄露三個維度綜合評估數(shù)據(jù)安全性。具體公式見式(9):
式中,U代表智慧醫(yī)療健康隱私數(shù)據(jù)的綜合安全性系數(shù),該值越大,表明數(shù)據(jù)的安全保護效果越理想。 o1 、 ωω2 、 ωω(ω)3 分別為數(shù)據(jù)泄露維度、推斷攻擊維度、訪問模式泄露維度的權(quán)重系數(shù)。
數(shù)據(jù)泄露維度: Nw 表示在模擬攻擊下智慧醫(yī)療健康隱私數(shù)據(jù)未泄露量,N表示智慧醫(yī)療健康隱私數(shù)據(jù)總量, Nw/N 用于衡量在模擬攻擊下未泄露數(shù)據(jù)量在總數(shù)據(jù)量中所占的比例,直觀反映數(shù)據(jù)泄露情況對安全性的影響。
圖2智慧醫(yī)療健康隱私數(shù)據(jù)的運行時間對比
1-I/I用于衡量推斷攻擊下的安全性。I表示通過推斷攻擊導致泄露的敏感信息數(shù)量,I表示數(shù)據(jù)中包含的敏感信息總量。該比例越大,說明推斷攻擊造成的影響越小,數(shù)據(jù)在抵御推斷攻擊方面的安全性越高。
1-K/K用于衡量訪問模式泄露下的安全性。K表示出現(xiàn)異常訪問模式的次數(shù),K表示總的訪問次數(shù)。該比例越大,表明訪問模式的安全性越高,遭受訪問模式泄露攻擊的風險越低。
根據(jù)上式,計算并整理在模擬攻擊場景下,實驗組方法和對照組中兩種方法安全保護后智慧醫(yī)療健康隱私數(shù)據(jù)的安全性系數(shù),如圖1所示。從圖1數(shù)據(jù)可以看出,與對照組中兩種方法相比,實驗組方法具有更佳的智慧醫(yī)療健康隱私數(shù)據(jù)安全保護效果。具體來說,在模擬攻擊場景下,經(jīng)過實驗組方法保護后的智慧醫(yī)療健康隱私數(shù)據(jù)的平均安全性系數(shù)為0.9736,較對照組中兩種方法分別提升了0.0425、0.0649,說明實驗組方法的抗攻擊能力更強,可以有效保護智慧醫(yī)療健康隱私數(shù)據(jù)安全,避免數(shù)據(jù)泄露。為了進一步驗證實驗組方法的優(yōu)越性,在應用實驗組方法和對照組中兩種方法進行不同規(guī)模的智慧醫(yī)療健康隱私數(shù)據(jù)包安全保護過程中,統(tǒng)計并整理各方法運行時間,如圖2所示。
從圖2數(shù)據(jù)可以看出,在不同規(guī)模的智慧醫(yī)療健康隱私數(shù)據(jù)包安全保護中,實驗組方法表現(xiàn)出明顯高于對照組中兩種方法的保護效率。隨著待安全保護智慧醫(yī)療健康隱私數(shù)據(jù)規(guī)模的不斷增加,三種方法的運行時間均有所上升。但是,與對照組中兩種方法相比,實驗組方法的運行時間不僅一直處于最低水平,而且上升速率更小。由此可以說明,實驗組方法可以在保證智慧醫(yī)療健康隱私數(shù)據(jù)安全性的同時,顯著提升安全保護效率??傊疚难芯康目伤阉骷用芟轮腔坩t(yī)療健康隱私數(shù)據(jù)安全保護方法是可行且可靠的,能夠滿足智慧醫(yī)療健康領(lǐng)域?qū)Π踩院蛯崟r性要求較高的應用場景。
五、結(jié)語
本文針對智慧醫(yī)療健康隱私數(shù)據(jù)安全保護問題,設(shè)計了一種基于可搜索加密的隱私數(shù)據(jù)安全保護方法。文中首先基于隱私偏序拓撲分類的方法,篩選出了需要保護的隱私數(shù)據(jù)。然后,設(shè)計一種基于國密SM9的可搜索加密方案,保護了隱私數(shù)據(jù)的安全性。仿真對比實驗結(jié)果表明,相比傳統(tǒng)方法,本文設(shè)計方法能夠顯著提高智慧醫(yī)療健康隱私數(shù)據(jù)安全保護效果,為智慧醫(yī)療服務的順利開展提供有力保障。未來,本文將繼續(xù)優(yōu)化算法性能,提高系統(tǒng)可擴展性,以適應更大規(guī)模的數(shù)據(jù)集和更復雜的應用場景。
參考文獻
[1]劉靖宇,曹興旺,顏鈺瑩,等.基于雙層鏈的個人隱私數(shù)據(jù)保護和授權(quán)框架[J].鄭州大學學報(理學版),2024,56(02):1-8.
[2]符太東,李育強.基于聯(lián)邦學習算法的復雜網(wǎng)絡(luò)大數(shù)據(jù)隱私保護[J].計算機仿真,2024,41(06):498-502.
[3]蔣偉進,陳藝琳,韓裕清,等.K-Modes聚類數(shù)據(jù)收集和發(fā)布過程中的混洗差分隱私保護方法[J].通信學報,2024,45(01):201-213.
[4]宋翔飛,王化群.一個具有前向安全和后向安全的可驗證多關(guān)鍵字可搜索加密方案[J].計算機學報,2023.46(04):727-742.
[5]周丹鈺,閻允雪,張建棟,等.隱私保護的高效安全三方稀疏數(shù)據(jù)計算[J].計算機學報,2024,47(05):1179-1193.
作者單位:仁澎(上海)醫(yī)療科技有限公司
責任編輯:王穎振 鄭凱津