(廈門大學(xué)附屬第一醫(yī)院計(jì)算機(jī)中心,廈門 361003)
廈門大學(xué)附屬第一醫(yī)院創(chuàng)辦于1937年,現(xiàn)擁有院本部、2所院內(nèi)院、6個(gè)院區(qū)、2家護(hù)理院、6家社區(qū)衛(wèi)生服務(wù)中心,是一家大型三級甲級綜合醫(yī)院。
我院于2017年8月通過HIMSSEMRAM(住院急診)七級評審,2018年6月通過HIMSSO-EMRAM(門診)七級評審,2019年6月成為福建省首家同時(shí)通過國家電子病歷系統(tǒng)功能應(yīng)用水平五級及國家醫(yī)療健康信息互聯(lián)互通標(biāo)準(zhǔn)化成熟度五級乙等的醫(yī)院,進(jìn)入了全國醫(yī)院信息化先進(jìn)行列。目前對照2018年4月國家衛(wèi)生健康委員會(huì)新頒布的《全國醫(yī)院信息化建設(shè)標(biāo)準(zhǔn)與規(guī)范(試行)》容災(zāi)備份標(biāo)準(zhǔn),我院已經(jīng)基本滿足嚴(yán)格的應(yīng)用級容災(zāi)要求。
隨著臨床信息的完全電子化,保障硬件對信息系統(tǒng)性能的可靠支持,保障系統(tǒng)很好的延續(xù)性和安全性顯得異常重要[1]。信息系統(tǒng)面臨的風(fēng)險(xiǎn)分為三類:一是系統(tǒng)因素,包括計(jì)算機(jī)軟硬設(shè)備故障、網(wǎng)絡(luò)通訊故障等;二是人為因素,包括病毒傳播與黑客攻擊、人員操作失誤或蓄意破壞、恐怖主義襲擊等,目前超過70%的系統(tǒng)故障是人員誤操作造成;三是環(huán)境因素,包括水災(zāi)、火災(zāi)、地震等自然災(zāi)害以及建筑物坍塌、社會(huì)動(dòng)亂、戰(zhàn)爭等[2]。
為了確保業(yè)務(wù)連續(xù)性,醫(yī)院采用防患于未然的建設(shè)思路,投入資金建設(shè)完善的硬件及災(zāi)備支撐,全面降低了信息系統(tǒng)故障的可能性,通過定期演練提高應(yīng)急反應(yīng)能力,降低由信息系統(tǒng)宕機(jī)帶來的影響。在基本不改變現(xiàn)有信息系統(tǒng)統(tǒng)一存儲(chǔ)架構(gòu)的情況下,以最經(jīng)濟(jì)、最有效的方式構(gòu)建了全方位的整體容災(zāi)[3],現(xiàn)介紹為完善災(zāi)備和業(yè)務(wù)連續(xù)性的建設(shè)經(jīng)驗(yàn)。
我院“兩地三中心”混合云架構(gòu)是由院內(nèi)不同建筑樓的地位均等的2個(gè)雙活數(shù)據(jù)中心和電信醫(yī)療云數(shù)據(jù)中心組成,并行地為業(yè)務(wù)訪問提供服務(wù),實(shí)現(xiàn)資源的充分利用,避免資源處于閑置狀態(tài);其中一個(gè)數(shù)據(jù)中心發(fā)生故障或?yàn)?zāi)難,另一個(gè)數(shù)據(jù)中心能夠立即全部實(shí)現(xiàn)接管,實(shí)現(xiàn)用戶的“故障無感知”;同時(shí)在電信醫(yī)療云部署應(yīng)用級容災(zāi)中心,協(xié)同院內(nèi)日常工作,分擔(dān)部分邊緣業(yè)務(wù),實(shí)現(xiàn)資源的充分利用,一旦院區(qū)數(shù)據(jù)中心發(fā)生故障或者災(zāi)難,30分鐘內(nèi)能實(shí)現(xiàn)能迅速接管業(yè)務(wù)。在杏林院區(qū)建立備份中心,每天將定時(shí)備份數(shù)據(jù)保存到杏林備份中心。如果發(fā)生災(zāi)難性故障,能夠確保一份數(shù)據(jù)存在。數(shù)據(jù)中心基礎(chǔ)架構(gòu)拓?fù)鋱D見圖1。
圖1 數(shù)據(jù)中心基礎(chǔ)架構(gòu)拓?fù)鋱D
利用ORACLE12C多租戶的架構(gòu)優(yōu)勢,我院將HIS、EMR、集成平臺(tái)、CDR數(shù)據(jù)庫分別作為插件數(shù)據(jù)庫,整合在一個(gè)容器數(shù)據(jù)庫中,實(shí)現(xiàn)資源的動(dòng)態(tài)分配和管理,建設(shè)全院統(tǒng)一的數(shù)據(jù)庫云平臺(tái)。
數(shù)據(jù)庫云平臺(tái)計(jì)算資源池由4臺(tái)x3850構(gòu)成4節(jié)點(diǎn)ORACLE12CRAC,任何一個(gè)節(jié)點(diǎn)出現(xiàn)故障,另外其他三個(gè)節(jié)點(diǎn)能立即自動(dòng)承擔(dān)任務(wù),能夠?qū)崿F(xiàn)無縫接管。
數(shù)據(jù)庫云平臺(tái)的存儲(chǔ)資源池采用存儲(chǔ)雙活技術(shù)和連續(xù)數(shù)據(jù)保護(hù)技術(shù),將數(shù)據(jù)鏡像到兩套全閃存存儲(chǔ),當(dāng)其中一套存儲(chǔ)需要停機(jī)或出現(xiàn)故障時(shí),無需人工切換,業(yè)務(wù)不受影響。通過存儲(chǔ)虛擬化技術(shù)可實(shí)現(xiàn)數(shù)據(jù)的本地整合與遠(yuǎn)程復(fù)制,以確保災(zāi)難備份中心與生產(chǎn)中心的數(shù)據(jù)保持同步,以實(shí)現(xiàn)數(shù)據(jù)災(zāi)難備份[4]。
數(shù)據(jù)云平臺(tái)建設(shè)連續(xù)數(shù)據(jù)保護(hù),配置2臺(tái)連續(xù)數(shù)據(jù)保護(hù)應(yīng)用設(shè)備和一套連續(xù)數(shù)據(jù)保護(hù)存儲(chǔ),防止誤刪除/病毒營銷等邏輯故障。連續(xù)數(shù)據(jù)保護(hù)系統(tǒng)實(shí)時(shí)將生產(chǎn)數(shù)據(jù)副本卷及記錄I/O變化的日志卷保存下來,如果出現(xiàn)誤刪除/病毒等邏輯故障,通過副本卷和日志卷回滾到故障發(fā)生前的狀態(tài),將丟失或受影響的數(shù)據(jù)找回。數(shù)據(jù)中心數(shù)據(jù)云架構(gòu)拓?fù)鋱D見圖2。
圖2 數(shù)據(jù)中心數(shù)據(jù)云架構(gòu)拓?fù)鋱D
運(yùn)用VMware虛擬化技術(shù),結(jié)合存儲(chǔ)虛擬化技術(shù),建設(shè)成雙活虛擬化數(shù)據(jù)中心,將院內(nèi)現(xiàn)有服務(wù)器資源組建成跨數(shù)據(jù)中心的虛擬化計(jì)算資源池,達(dá)到近似在本地虛擬化平臺(tái)vMotion的效果,實(shí)現(xiàn)業(yè)務(wù)系統(tǒng)的高可靠性。
雙活虛擬化平臺(tái)采用專門針對虛擬化的連續(xù)數(shù)據(jù)保護(hù)系統(tǒng)軟件,靈活地將重要的虛擬機(jī)實(shí)現(xiàn)連續(xù)數(shù)據(jù)保護(hù),并將管理界面和vCenter集成在一起,方便運(yùn)維管理。虛擬化平臺(tái)架構(gòu)拓?fù)鋱D見圖3。
由兩臺(tái)Windows2012服務(wù)器做成SQLServer 2008集群,包含影像(DICOM)和報(bào)告(RIS)。存儲(chǔ)配備兩套全閃存做為在線PACS存儲(chǔ)。歸檔存儲(chǔ)配置一套橫向擴(kuò)展的大容量存儲(chǔ),實(shí)現(xiàn)醫(yī)院PACS系統(tǒng)歸檔醫(yī)學(xué)影像文件的長期數(shù)據(jù)保存。大容量影像存儲(chǔ)擴(kuò)容可通過增加節(jié)點(diǎn),且處理性能和帶寬也得到同步增加,大容量存儲(chǔ)特有的節(jié)點(diǎn)體系結(jié)構(gòu)設(shè)計(jì)無需數(shù)據(jù)遷移。為防止影像數(shù)據(jù)的誤刪除/病毒影響等邏輯故障,同樣建立了連續(xù)數(shù)據(jù)保護(hù)系統(tǒng)。影像系統(tǒng)平臺(tái)架構(gòu)拓?fù)鋱D見圖4。
圖3 虛擬化平臺(tái)架構(gòu)拓?fù)鋱D
圖4 影像系統(tǒng)平臺(tái)架構(gòu)拓?fù)鋱D
租用電信醫(yī)療云作為我院應(yīng)用級容災(zāi)中心,構(gòu)成“兩地三中心”架構(gòu)。通過連續(xù)數(shù)據(jù)保護(hù)技術(shù)及ORALCEDATAGUARD將重要的系統(tǒng)數(shù)據(jù)從主數(shù)據(jù)中心遠(yuǎn)程異步復(fù)制到醫(yī)療云數(shù)據(jù)中心,整體架構(gòu)拓?fù)鋱D見圖1。
院區(qū)的重要業(yè)務(wù)數(shù)據(jù)采用Lan-Free的備份方式,將數(shù)據(jù)直接寫入院內(nèi)備份介質(zhì),同時(shí)通過虛擬帶庫的復(fù)制功能將數(shù)據(jù)復(fù)制到杏林院區(qū),實(shí)現(xiàn)備份數(shù)據(jù)的異地容災(zāi),同時(shí)采用重復(fù)數(shù)據(jù)刪除技術(shù),節(jié)約95%以上的帶寬和復(fù)制時(shí)間。
由于我院2017年已經(jīng)實(shí)現(xiàn)臨床診療過程無紙化,即無紙質(zhì)病歷,因此,容災(zāi)建設(shè)不僅需要滿足本地?cái)?shù)據(jù)備份和本地應(yīng)用恢復(fù)的要求,還需將容災(zāi)延伸到院區(qū)各醫(yī)療業(yè)務(wù)科室。按業(yè)務(wù)要求將患者關(guān)鍵醫(yī)療數(shù)據(jù)定時(shí)推送到本地工作站,并配置不間斷電源,保證斷電情況也至少能運(yùn)行一個(gè)小時(shí)。當(dāng)全院或局部區(qū)域發(fā)生停電、斷網(wǎng)等宕機(jī)時(shí),醫(yī)護(hù)人員可使用科室級本地容災(zāi)系統(tǒng),查詢患者的關(guān)鍵醫(yī)療數(shù)據(jù)。以病區(qū)為例,每個(gè)病區(qū)指定一臺(tái)護(hù)理工作站作為本地容災(zāi)工作站,當(dāng)病區(qū)啟動(dòng)應(yīng)急時(shí),在本工作站可以查看該病區(qū)當(dāng)前在床患者的最新診療數(shù)據(jù),包括基本信息、醫(yī)囑數(shù)據(jù)、病歷文書、檢查檢驗(yàn)報(bào)告等。
我院通過數(shù)據(jù)庫云、虛擬化平臺(tái)、影像系統(tǒng)平臺(tái)、應(yīng)用級云容災(zāi)和異地定時(shí)備份以及科室級本地容災(zāi)的建設(shè),實(shí)現(xiàn)存儲(chǔ)的分布式存儲(chǔ)架構(gòu),連續(xù)數(shù)據(jù)保護(hù),虛擬化和數(shù)據(jù)云,構(gòu)建了完整、靈活、高效的容災(zāi)備份支撐體系,基本滿足醫(yī)院信息化應(yīng)用容災(zāi)要求。結(jié)合我院容災(zāi)建設(shè)的實(shí)踐經(jīng)驗(yàn),建議各醫(yī)院建設(shè)容災(zāi)體系時(shí)應(yīng)該綜合考慮RTO和RPO、運(yùn)維可操作性及資金投入等因素,優(yōu)先考慮建設(shè)本地和異地定時(shí)數(shù)據(jù)備份,接著建設(shè)基于存儲(chǔ)雙活的虛擬化平臺(tái),再應(yīng)用連續(xù)數(shù)據(jù)保護(hù)技術(shù)防止數(shù)據(jù)丟失,最后建設(shè)異地應(yīng)用容災(zāi),逐步實(shí)現(xiàn)全方位的應(yīng)用級容災(zāi)。