李 健
(徐州醫(yī)科大學(xué) 信息化處,江蘇 徐州 221000)
隨著信息技術(shù)的快速發(fā)展與智能設(shè)備的普遍應(yīng)用,各個(gè)行業(yè)都會(huì)收集大量數(shù)據(jù)用于分析客戶(hù)需求、企業(yè)發(fā)展方向等,但是這些數(shù)據(jù)往往包含了用戶(hù)的個(gè)人隱私數(shù)據(jù),簡(jiǎn)單刪除用戶(hù)的姓名、年齡等可以在一定程度上保護(hù)用戶(hù)的隱私,但很難抵抗背景攻擊、頻繁查詢(xún)攻擊。部分研究人員采用了同態(tài)加密、差分隱私等方法來(lái)保護(hù)用戶(hù)隱私,并取得了較好的效果。2006年,Dwork等人[1]提出差分隱私(differential privacy),該方法是最早用于解決數(shù)據(jù)泄露的問(wèn)題,在該方法的定義下,數(shù)據(jù)集的添加或減少計(jì)算結(jié)果對(duì)于具體某條數(shù)據(jù)的變化影響較小。2009年,Gentry等人[2]提出全同步加密(homomorphic encryption),該方法實(shí)現(xiàn)了在加密數(shù)據(jù)上進(jìn)行任意計(jì)算,但全同步加密方法不適應(yīng)于深度學(xué)習(xí)模型,計(jì)算復(fù)雜度較高,實(shí)時(shí)性較差。
圖1 系統(tǒng)流程及模塊劃分圖
同態(tài)加密、差分隱私方法多用于保護(hù)空間數(shù)據(jù)、流數(shù)據(jù)等,針對(duì)圖像隱私保護(hù)的相關(guān)研究較少,但人們獲取圖像的渠道日益豐富,圖像同樣蘊(yùn)含了大量個(gè)人敏感信息,很有可能泄露個(gè)人隱私信息[3-4]。比如,攻擊者可以通過(guò)收集大量的人臉圖像判斷是否為同一人,通過(guò)分析能夠得出該人的性別、家庭住址等敏感信息。Wright等人[5]將壓縮感知應(yīng)用到人臉識(shí)別,該算法提出的改進(jìn)高斯觀測(cè)矩陣,實(shí)現(xiàn)了對(duì)圖像的多層CS采樣編碼,達(dá)到了隱私保護(hù)的目,對(duì)于被遮擋的人臉圖像識(shí)別具有較高的準(zhǔn)確度。張嘯劍等人[6]提出結(jié)合矩陣分解與差分隱私的人臉圖像發(fā)布,該算法將低秩分解與奇異值分解結(jié)合對(duì)圖像壓縮,但隱私人臉特征重構(gòu)圖像存在較大問(wèn)題,分類(lèi)性較差。患者的醫(yī)療圖像同樣包含患者的個(gè)人隱私,上傳到醫(yī)療信息系統(tǒng)中可能會(huì)造成個(gè)人隱私泄露。為此,該文提出了基于便攜式虹膜儀的醫(yī)療圖像數(shù)據(jù)安全共享系統(tǒng),并結(jié)合實(shí)際病例,給出了系統(tǒng)的架構(gòu)和具體實(shí)現(xiàn)方法[7-8]。
醫(yī)療圖像數(shù)據(jù)安全共享系統(tǒng)主要由客戶(hù)端,圖像處理端及云平臺(tái)三部分組成??蛻?hù)端Ⅰ由醫(yī)生、患者構(gòu)成,客戶(hù)端Ⅱ由科研人員構(gòu)成。圖像處理端由圖像采集模塊,圖像處理模塊構(gòu)成。云平臺(tái)由網(wǎng)絡(luò)通信與數(shù)據(jù)庫(kù)構(gòu)成。
該系統(tǒng)將采集到的圖像數(shù)據(jù)實(shí)時(shí)傳輸?shù)结t(yī)生診療端,患者可通過(guò)查詢(xún)?nèi)肟诩皶r(shí)了解醫(yī)生診斷意見(jiàn)和患者自身病況,同時(shí)這部分采集到的數(shù)據(jù)經(jīng)過(guò)離散傅里葉變換技術(shù)對(duì)圖像進(jìn)行壓縮,將時(shí)域信息轉(zhuǎn)換為頻域信息,對(duì)圖像有效特征提取傅里葉系數(shù)。采用拉普拉斯機(jī)制對(duì)此系數(shù)添加拉普拉斯噪音,形成噪音系數(shù),該過(guò)程需要滿足ε-差分隱私,從而保護(hù)圖像數(shù)據(jù)的隱私信息。利用GPRS/4G網(wǎng)絡(luò)上傳至數(shù)據(jù)庫(kù),研究者可以通過(guò)接口提取處理后的圖像開(kāi)展研究。該文系統(tǒng)流程和算法流程分別如圖1、圖2和表1所示。
表1 該文算法流程
為了充分將底層硬件和上層軟件結(jié)合,系統(tǒng)開(kāi)發(fā)采用異構(gòu)式平臺(tái)??蛻?hù)端Ⅰ、Ⅱ軟件運(yùn)行于嵌入式ARM11平臺(tái),操作系統(tǒng)采用Linux;云平臺(tái)上的數(shù)據(jù)庫(kù)采用DBbridge。目前,DBbridge已經(jīng)支持Oracle、TDSQL、TBase、MySQL、PostgreSQL等多種數(shù)據(jù)庫(kù)類(lèi)型的遷移。網(wǎng)絡(luò)通信服務(wù)基于ICOP通信模型,采用TCP/IP協(xié)議,支持云平臺(tái)到處理端服務(wù)器及處理端服務(wù)器到客戶(hù)端的無(wú)線和有線兩種傳輸模式??蛻?hù)端采用Visual Studio.NET移動(dòng)開(kāi)發(fā)平臺(tái),軟件運(yùn)行于PC機(jī),客戶(hù)端Ⅰ、Ⅱ均采用C/S架構(gòu)與服務(wù)器建立連接,通過(guò)匯編語(yǔ)言python對(duì)圖像進(jìn)行壓縮處理,處理過(guò)程滿足ε-差分隱私。
圖2 算法流程圖
系統(tǒng)硬件設(shè)計(jì)分為兩部分:圖像采集模塊,網(wǎng)絡(luò)通信模塊。圖像采集模塊用于采集患者的虹膜圖像;網(wǎng)絡(luò)通信模塊能夠?qū)D像采集模塊處理后的醫(yī)療圖像及初始圖像傳送至數(shù)據(jù)庫(kù),并且通過(guò)登錄客戶(hù)端反饋不同的醫(yī)療圖像。其硬件系統(tǒng)組成如圖3所示。
圖3 硬件系統(tǒng)組成圖
圖像處理是圖像處理端的核心模塊,以ARM11S3C44B0控制芯片為核心,擴(kuò)展LED顯示模塊,GPRS/4G通信模塊等,可初步實(shí)現(xiàn)對(duì)圖像的處理、存儲(chǔ)和傳輸功能。該系統(tǒng)對(duì)嵌入式Linux操作系統(tǒng)僅保留必需的功能模塊,使資源利用最大化。各硬件模塊的實(shí)現(xiàn)如下。
圖像采集模塊由PC圖像采集卡,PC圖像處理卡組成,PC圖像采集卡是控制攝像機(jī)拍照,完成相機(jī)輸出的視頻信號(hào)的實(shí)時(shí)數(shù)據(jù)采集,并提供與PC的高速接口,是協(xié)調(diào)整個(gè)系統(tǒng)的重要設(shè)備;PC圖像處理卡在圖像采集卡的基礎(chǔ)上,增加了圖像分析、處理等功能。目的是提高圖像信號(hào)的實(shí)時(shí)處理能力、降低主控系統(tǒng)在圖像處理過(guò)程中對(duì)資源的要求,從而提高系統(tǒng)整體處理能力。圖像采集軟件處理系統(tǒng)工作原理如圖4所示。
圖4 圖像采集軟件處理系統(tǒng)工作原理圖
本設(shè)計(jì)的A/D轉(zhuǎn)換芯片采用AD7892,它是一款高速、低功耗、12位模數(shù)轉(zhuǎn)換器(ADC),采用+5 V單電源供電。AD7892內(nèi)置一個(gè)1.47 μs逐次逼近型ADC、一個(gè)片內(nèi)采樣保持放大器、一個(gè)內(nèi)部+2.5 V基準(zhǔn)電壓源和片內(nèi)多功能接口結(jié)構(gòu),并且提供兩種數(shù)據(jù)輸出格式可供選擇:?jiǎn)蝹€(gè)并行12位字或串行數(shù)據(jù)??焖倏偩€訪問(wèn)時(shí)間和標(biāo)準(zhǔn)控制輸入,可確保該器件與微處理器和數(shù)字信號(hào)處理器輕松實(shí)現(xiàn)并行接口。通過(guò)高速串行接口,可以與微控制器及數(shù)字信號(hào)處理器的串行端口直接連接。
圖像處理端將采集到的患者圖像進(jìn)行處理,添加噪音,對(duì)圖像進(jìn)行隱私保護(hù),通過(guò)GPRS/4G網(wǎng)絡(luò)上傳至安全共享系統(tǒng)服務(wù)器的指定位置,當(dāng)醫(yī)生需要診斷患者病情時(shí),由網(wǎng)絡(luò)通信模塊將便攜式虹膜儀采集患者的醫(yī)療圖像下載至醫(yī)生治療端,醫(yī)生治療端對(duì)患者醫(yī)療圖像進(jìn)行分析并給出診斷意見(jiàn);患者通過(guò)登錄患者查詢(xún)端及時(shí)了解醫(yī)生的診斷意見(jiàn)和患者自身健康狀況;研究者通過(guò)登錄科研人員研究端,下載處理后的患者醫(yī)療圖像,科研人員對(duì)此類(lèi)病情的分析研究,給出具體治療方案,方便此類(lèi)病情患者的后續(xù)治療。該模塊主要實(shí)現(xiàn)了網(wǎng)絡(luò)通信和圖像存儲(chǔ)與傳輸,網(wǎng)絡(luò)通信服務(wù)模塊是安全共享平臺(tái)的中樞系統(tǒng),主要功能是接收?qǐng)D像處理端的TCP連接,同時(shí)將這些采集到圖像存儲(chǔ)到數(shù)據(jù)庫(kù)。
對(duì)于輸入圖像序列H,將每一個(gè)像素點(diǎn)作為一個(gè)單元,則圖像序列H可以表示為一個(gè)二維矩陣Am×n,其中m表示矩陣的行數(shù),n表示矩陣的列數(shù)。
定義2:設(shè)便攜式虹膜儀采集到一幅尺寸大小為m×n的圖像,則用矩陣可表示為:
(1)
(2)
式中,ε表示差分預(yù)算,該值與算法M的隱私保護(hù)程度成反比關(guān)系,ε越小表示算法M隱私保護(hù)效果更加魯棒。常用的機(jī)制有拉普拉斯機(jī)制,指數(shù)機(jī)制和高斯機(jī)制。該文采用拉普拉斯機(jī)制實(shí)現(xiàn)圖像的差分隱私。
3.2.1 拉普拉斯機(jī)制
3.2.2 指數(shù)機(jī)制
從式中可以看出,指數(shù)分布是分段分布。當(dāng)x小于等于0時(shí),函數(shù)結(jié)果為0;當(dāng)x大于0時(shí),函數(shù)結(jié)果為λe-λx。
圖像數(shù)據(jù)由矩陣形式表示,若對(duì)整幅圖像采用拉普拉斯機(jī)制添加噪音,魯棒性較差,如圖5和圖6所示。
圖5 初始圖像 圖6 整體加噪后的圖像
由圖5、6可知,對(duì)整幅圖像添加噪音后圖像變得較為模糊,與初始圖像相差較大,雖然達(dá)到了保護(hù)圖像安全隱私的目的,但實(shí)用性較差,無(wú)法提供給研究者可用數(shù)據(jù)。由定義2可知,只需對(duì)該圖像的部分特征進(jìn)行加噪,保證該處理過(guò)程滿足ε-差分隱私,重構(gòu)后的圖像與初始圖像相差較小,精度較為準(zhǔn)確。
輸入:圖像序列:H;參數(shù)k,隱私預(yù)算ε;
輸出:滿足ε-差分隱私的圖像序列H1;
(1)Fα←DFT(ω)//對(duì)初始圖像進(jìn)行傅里葉變換;
(2)Fl←Fα(1≤l≤α)//對(duì)變換后的圖像提取有效特征中的l×l個(gè)傅里葉系數(shù);
根據(jù)上述系統(tǒng)設(shè)計(jì)方案,設(shè)計(jì)出基于便攜式虹膜儀的醫(yī)療圖像數(shù)據(jù)安全共享系統(tǒng),為了驗(yàn)證該系統(tǒng)的可行性,需要進(jìn)行一次仿真實(shí)驗(yàn),使用公共數(shù)據(jù)庫(kù)圖像數(shù)據(jù)進(jìn)行實(shí)驗(yàn)對(duì)比。在python3.7的環(huán)境下搭建基于便攜式虹膜儀的醫(yī)療圖像數(shù)據(jù)安全共享系統(tǒng)仿真系統(tǒng),實(shí)驗(yàn)步驟如下:
1)虹膜儀采集患者醫(yī)療圖像,該圖像采集后直接上傳到客戶(hù)端Ⅰ;
2)醫(yī)生登錄客戶(hù)端Ⅰ,給出診斷結(jié)果;
3)患者登錄客戶(hù)端Ⅰ,查詢(xún)?cè)\斷意見(jiàn);
4)采集的醫(yī)療圖像經(jīng)過(guò)傅里葉變換得到該圖像的頻譜數(shù)據(jù);
5)提取有效數(shù)據(jù)進(jìn)行加噪,對(duì)添加噪音后的頻譜數(shù)據(jù)進(jìn)行逆傅里葉變換,得到重構(gòu)圖像;
6)科研人員登錄客戶(hù)端Ⅱ,獲取重構(gòu)后的圖像進(jìn)行研究。
具體實(shí)驗(yàn)結(jié)果如下:
圖7 初始圖像 圖8 系統(tǒng)處理后的圖像
圖7為便攜式虹膜儀采集的初始圖像,該圖像采集后直接上傳到客戶(hù)端Ⅰ,醫(yī)生通過(guò)該圖像進(jìn)行分析給出診療意見(jiàn),患者通過(guò)查詢(xún)端登錄客戶(hù)端Ⅰ,查詢(xún)醫(yī)生診斷意見(jiàn),歷史診斷查詢(xún)結(jié)果等,及時(shí)了解自身健康狀況,配合治療,保證患者病情得到有效控制。圖8為處理后圖像,為了保證患者隱私數(shù)據(jù)的安全共享,在此圖像上傳到云平臺(tái)數(shù)據(jù)庫(kù)之前,利用差分隱私算法進(jìn)行加噪處理,同時(shí)保證圖像數(shù)據(jù)的高可用性,該部分圖像被科研人員研究分析,對(duì)此類(lèi)疾病分析得到長(zhǎng)期治療方案。從實(shí)驗(yàn)結(jié)果可知,該系統(tǒng)能夠?qū)崿F(xiàn)采集滿足ε-差分隱私的醫(yī)療圖像,具有較好的可用性與實(shí)用性,并且為醫(yī)療圖像數(shù)據(jù)安全設(shè)計(jì)平臺(tái)提供了新的指導(dǎo)方法,能有效地用于醫(yī)療系統(tǒng)領(lǐng)域。
基于便攜式虹膜儀的醫(yī)療圖像數(shù)據(jù)安全共享系統(tǒng)不僅能夠滿足醫(yī)生的快速診療需求,同時(shí)滿足了患者及時(shí)了解病情的需求,此外,利用差分隱私算法處理后的圖像數(shù)據(jù)還能夠滿足研究者的科研需求。該安全平臺(tái)的設(shè)計(jì)能夠?qū)崟r(shí)處理醫(yī)生與患者的需求,保存大量的醫(yī)療數(shù)據(jù),并確?;颊叩尼t(yī)療圖像隱私不被泄露。實(shí)驗(yàn)結(jié)果表明,該文設(shè)計(jì)的系統(tǒng)功能完善,魯棒性強(qiáng),圖像采集傳輸準(zhǔn)確并且安全,具有較大的理論價(jià)值及實(shí)踐意義。