卿立銀 季瑞齊 彭洪偉 孫佳雯
摘要:醫(yī)院信息系統(tǒng)由有線網(wǎng)絡(luò)、無線網(wǎng)絡(luò)、傳統(tǒng)數(shù)據(jù)終端、智能數(shù)據(jù)終端、基于微型工業(yè)控制系統(tǒng)的精密醫(yī)療設(shè)備組成。規(guī)模僅限于醫(yī)院內(nèi)部,并不龐大,但成分卻很復(fù)雜,符合大數(shù)據(jù)技術(shù)多數(shù)據(jù)源、多數(shù)據(jù)渠道、多數(shù)據(jù)類型的構(gòu)造特點,可以作為大數(shù)據(jù)技術(shù)的實驗平臺,推廣使用。醫(yī)院信息系統(tǒng)安全屬于新興熱點,適合作為切入層,切入大數(shù)據(jù)技術(shù)。切入分為數(shù)據(jù)選擇、數(shù)據(jù)采集,數(shù)據(jù)傳輸和數(shù)據(jù)分析四個切入點,其中重點和難點是數(shù)據(jù)采集技術(shù),即探針程序的開發(fā),要根據(jù)不同的平臺選擇不同的開發(fā)語言。
關(guān)鍵詞:大數(shù)據(jù)技術(shù);醫(yī)院信息系統(tǒng);信息安全;數(shù)據(jù)源;數(shù)據(jù)渠道;數(shù)據(jù)類型;探針程序;數(shù)據(jù)分析
中圖分類號: TP311? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2020)35-0025-02
開放科學(xué)(資源服務(wù))標識碼(OSID):
1 因為構(gòu)造的特殊性,大數(shù)據(jù)技術(shù)理論研究多,生產(chǎn)實踐少
大數(shù)據(jù)技術(shù)作為新興的計算機技術(shù),近些年來受到廣泛的關(guān)注,網(wǎng)絡(luò)安全等級保護2.0標準甚至為大數(shù)據(jù)技術(shù)訂制一套安全指標。但是,該技術(shù)僅僅少量投入生產(chǎn)實踐,至今仍然以理論研究為主。究其原因,乃是因為該項技術(shù)的特殊性。大數(shù)據(jù)技術(shù)不單強調(diào)數(shù)據(jù)量大,更多的是強調(diào)數(shù)據(jù)多樣化,尤其是在海量數(shù)據(jù)基礎(chǔ)之上的數(shù)據(jù)多樣化。數(shù)據(jù)多樣化和數(shù)據(jù)量龐大,是大數(shù)據(jù)技術(shù)的兩個基石,缺一不可。如圖1所示。
從內(nèi)部構(gòu)成而言,大數(shù)據(jù)技術(shù)又稱“三多一分析技術(shù)”。三多指的是多數(shù)據(jù)源、多數(shù)據(jù)渠道、多數(shù)據(jù)類型,一分析指的是統(tǒng)一的分析模型。如圖2所示。
對類似圖書館藏書管理系統(tǒng)這樣的中小型信息系統(tǒng)而言,數(shù)據(jù)源、數(shù)據(jù)渠道、數(shù)據(jù)格式都相對單一,數(shù)據(jù)量較小,不能形成海量數(shù)據(jù),缺乏構(gòu)成大數(shù)據(jù)分析技術(shù)的基礎(chǔ)條件。而對于銀行核心信息系統(tǒng)這樣的大型信息系統(tǒng)而言,數(shù)據(jù)源、數(shù)據(jù)渠道、數(shù)據(jù)格式多樣,每日有幾億甚至更多的交易量,具備構(gòu)成大數(shù)據(jù)分析的基礎(chǔ)條件。但是其核心骨干網(wǎng)絡(luò)利用率高達80%以上,通信壓力過大,不能為大數(shù)據(jù)技術(shù)提供足夠的網(wǎng)絡(luò)帶寬,需要開辟專門的通信網(wǎng)絡(luò)。數(shù)據(jù)分析模型復(fù)雜,運算負荷重,要求配備大量高端服務(wù)器才能實現(xiàn)。這要求銀行投入大量財力構(gòu)建基礎(chǔ)設(shè)施,并配備專業(yè)的團隊??紤]到成本,銀行高層管理人員容易產(chǎn)生抵觸情緒。大數(shù)據(jù)分析技術(shù)呈現(xiàn)“高不成低不就”的尷尬局面。目前,除了淘寶、京東等電商平臺利用大數(shù)據(jù)技術(shù)分析客戶的購物心理外,在其他信息領(lǐng)域上,大數(shù)據(jù)技術(shù)仍然處在理論研究,未投入實踐。
2 醫(yī)院信息領(lǐng)域是大數(shù)據(jù)技術(shù)的良好推廣平臺之一
為了加快信息化速度,推進大數(shù)據(jù)技術(shù)投入生產(chǎn)實踐,筆者結(jié)合十幾年醫(yī)院信息系統(tǒng)安全經(jīng)驗,提出在醫(yī)院信息系統(tǒng)當(dāng)中推廣大數(shù)據(jù)技術(shù)的方法。強調(diào)一點,醫(yī)院信息系統(tǒng)具備推廣大數(shù)據(jù)技術(shù)的天然條件。第一,醫(yī)院信息系統(tǒng)包含有線通信設(shè)備、無線通信設(shè)備、傳統(tǒng)數(shù)據(jù)終端、智能數(shù)據(jù)終端、基于微型工業(yè)控制系統(tǒng)的精密醫(yī)療設(shè)備等各式各樣的設(shè)備,具備多樣的數(shù)據(jù)源。第二,醫(yī)院信息系統(tǒng)具備無線網(wǎng)、有線網(wǎng)、內(nèi)網(wǎng)、專網(wǎng)、互聯(lián)網(wǎng)等多種通信渠道,具備豐富的數(shù)據(jù)傳輸網(wǎng)絡(luò)。第三,醫(yī)院信息系統(tǒng)存儲病人基本信息、病理病例信息、醫(yī)藥信息、醫(yī)療設(shè)備信息、財務(wù)信息、后勤保障信息等多樣的數(shù)據(jù)類型。第四,醫(yī)院信息系統(tǒng)的覆蓋面較小,僅限于醫(yī)院內(nèi)部,覆蓋面小,則通信壓力小,可以為大數(shù)據(jù)技術(shù)劃分出專門的通信帶寬,用以傳輸數(shù)據(jù)。即使通信帶寬不足,也可以購買少量通信設(shè)備,緊急擴充,以滿足需要。
綜上所述,醫(yī)院信息系統(tǒng),具備推廣大數(shù)據(jù)技術(shù)的天然的、相對優(yōu)良的條件,是大數(shù)據(jù)技術(shù)推廣的理想平臺之一。
3 推廣關(guān)鍵——探針程序的開發(fā)
根據(jù)前文陳述,或者從圖3可以看到,醫(yī)院信息系統(tǒng)的覆蓋面僅限于醫(yī)院內(nèi)部,數(shù)據(jù)傳輸方面壓力不大,不是實現(xiàn)瓶頸。實現(xiàn)瓶頸主要來自數(shù)據(jù)采集,數(shù)據(jù)采集又稱為數(shù)據(jù)探針或者探針技術(shù)。如何在數(shù)據(jù)終端中準確無誤地安插探針,采集到完整真實的數(shù)據(jù),是大數(shù)據(jù)技術(shù)實現(xiàn)的關(guān)鍵之一。
探針是部署在硬件平臺上的一段可執(zhí)行程序,需要做專門的程序開發(fā)。站在探針程序開發(fā)的角度,將數(shù)據(jù)終端分為通用操作系統(tǒng)終端和非通用操作系統(tǒng)終端。PC終端、手機等智能終端、自助服務(wù)終端等數(shù)據(jù)終端,統(tǒng)稱為通用操作系統(tǒng)終端。通用操作系統(tǒng)終端采用的是Windows、Linux等主流操作系統(tǒng)。這些操作系統(tǒng)具備公開的標準的程序開發(fā)接口,英文名稱為Application Programming Interface,即API。開發(fā)人員可以通過官方API文檔,在操作系統(tǒng)層面調(diào)用程序接口,采集數(shù)據(jù),并通過網(wǎng)絡(luò)傳輸接口將數(shù)據(jù)放置在網(wǎng)絡(luò)中傳輸。高壓氧艙、生化分析儀、氣管鏡、內(nèi)窺鏡等智能醫(yī)療設(shè)備,在性質(zhì)上屬于微型工業(yè)控制系統(tǒng),稱為非通用操作系統(tǒng)終端。非通用操作系統(tǒng)終端,不對外開放開發(fā)接口,沒有API可以調(diào)用。但是這些終端會通過某一種方式,將數(shù)據(jù)導(dǎo)出到某一臺PC終端。我們可以將該PC終端作為探針程序的開發(fā)對象,調(diào)用相應(yīng)官方API,采集數(shù)據(jù)并傳輸。探針數(shù)據(jù)流向圖,如圖4所示。
探針程序所采用的開發(fā)語言要根據(jù)具體的情況確定。如果數(shù)據(jù)終端是瀏覽器,開發(fā)語言采用JavaScript;數(shù)據(jù)終端是安卓手機App,開發(fā)語言采用Java;數(shù)據(jù)終端是Windows系列終端,開發(fā)語言優(yōu)先采用C#。開發(fā)語言的選擇沒有硬性指標,要根據(jù)實際情況選擇適合的語言。
4 最終成果——基于大數(shù)據(jù)技術(shù)的醫(yī)院信息系統(tǒng)安全管理中心
功能、性能、安全是信息系統(tǒng)的構(gòu)成三要素。其中安全是當(dāng)今熱點和難點,同時又是相對空白點。將大數(shù)據(jù)技術(shù)應(yīng)用到醫(yī)院信息系統(tǒng)安全領(lǐng)域,符合當(dāng)今形勢。前文中論述數(shù)據(jù)采集即探針技術(shù)和數(shù)據(jù)渠道的實現(xiàn)方法,下面討論大數(shù)據(jù)技術(shù)的另外兩個方面、數(shù)據(jù)選擇和數(shù)據(jù)分析模型。這兩方面內(nèi)容不必從頭做起,因為目前有非常好的模型可以借鑒,即網(wǎng)絡(luò)安全等級保護2.0標準(以下簡稱等保2.0)。數(shù)據(jù)采集的對象,完全可以全盤借鑒等保2.0的網(wǎng)絡(luò)結(jié)構(gòu)、安全計算環(huán)境、安全區(qū)域邊界等測評對象,針對這些測評對象,從身份鑒別、訪問控制、安全審計、入侵防范、數(shù)據(jù)備份等安全角度抽取原始安全數(shù)據(jù),這樣操作簡單高效。 數(shù)據(jù)分析模型的關(guān)鍵是全網(wǎng)唯一標識符和時間戳。全網(wǎng)唯一標識符可以對每一個安全對象進行標識和有效定位。時間戳標記安全事件發(fā)生的時間。標識符和時間戳聯(lián)合起來,就可以對安全事件進行二維鎖定。因為醫(yī)院信息系統(tǒng)本身規(guī)模較小,同時相比銀行、電信、電力、航空等領(lǐng)域信息系統(tǒng),不容易引起國家級黑客組織的注意,安全壓力不大。所以數(shù)據(jù)分析模型沒必要太復(fù)雜,僅將全網(wǎng)唯一標識符和時間戳關(guān)聯(lián)起來,針對勒索病毒、DDOS進攻等主流的安全威脅分析確認一下,就足夠了。
在上述論述過程中,忽視了一個細節(jié),就是信息格式變換,采集上來的數(shù)據(jù),可能是視頻、音頻、圖片或其他各種各樣格式的數(shù)據(jù)。要將不同格式的數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一的數(shù)字或文字格式,需要做專門的數(shù)據(jù)提取。這種提取技術(shù)屬于成熟的技術(shù),請感興趣的讀者查閱相關(guān)資料,在此不贅述。
5 理論誕生于實踐,理論還要回歸實踐
大數(shù)據(jù)理論是非常優(yōu)秀的理論,是信息技術(shù)集大成之作。但不論多么優(yōu)秀的理論,如果不能付諸實踐,也只是水中月,鏡中花,黃粱一夢而已。廣大科研人員不僅要關(guān)注理論創(chuàng)新,同時更要關(guān)注理論實現(xiàn),要將理論融入生產(chǎn)實踐,用理論去指導(dǎo)生產(chǎn)實踐,這樣才能真正促進科技發(fā)展和人類進步。
參考文獻:
[1] 馮麗.大數(shù)據(jù)技術(shù)解析及其安全建設(shè)研究[J].電腦知識與技術(shù),2019,15(25):13-14.
[2] 張杰宏.醫(yī)院信息系統(tǒng)安全現(xiàn)狀及缺陷[J].電腦知識與技術(shù),2019,15(25):15-17.
[3] 馮麗,王彩學(xué),張杰宏,等.基于大數(shù)據(jù)分析技術(shù)的商業(yè)銀行信息系統(tǒng)安全預(yù)警實施方案[J].電腦知識與技術(shù),2020,16(23):52-53.
【通聯(lián)編輯:唐一東】