陳展欽 羅遠(yuǎn)梅 馬麗明
隨著市場(chǎng)經(jīng)濟(jì)的發(fā)展,科學(xué)信息技術(shù)已日益成為提高醫(yī)院科學(xué)管理水平、醫(yī)療服務(wù)質(zhì)量和醫(yī)療工作效率的有效手段[1],醫(yī)院信息化運(yùn)維也隨著建設(shè)發(fā)展而日益復(fù)雜化,給醫(yī)院管理者、硬件、軟件運(yùn)維工程師的工作增加了復(fù)雜性,給醫(yī)院信息化運(yùn)維提出了前所未有的挑戰(zhàn)。
醫(yī)院IT運(yùn)維面臨的挑戰(zhàn):醫(yī)院業(yè)務(wù)對(duì)IT依賴性在不斷加強(qiáng),醫(yī)院信息化程度提高、基于IT技術(shù)的醫(yī)療業(yè)務(wù)不斷創(chuàng)新;醫(yī)院7×24可用性需求:醫(yī)院業(yè)務(wù)的特殊性,決定了醫(yī)院信息系統(tǒng)必須滿足隨時(shí)隨地的服務(wù)請(qǐng)求;日趨復(fù)雜的醫(yī)院IT系統(tǒng)技術(shù)架構(gòu),一項(xiàng)簡(jiǎn)單應(yīng)用穿越多個(gè)資源層面,故障診斷和恢復(fù)變得越來(lái)越困難;持續(xù)增長(zhǎng)的醫(yī)院IT運(yùn)營(yíng)成本壓力。
醫(yī)院IT運(yùn)維管理的現(xiàn)狀:“以資源為中心”監(jiān)控運(yùn)維模式,即不同的維護(hù)工程師負(fù)責(zé)某一部分的醫(yī)院信息系統(tǒng)運(yùn)維工作,由于分散性模塊化管理,浪費(fèi)了人力資源與降低了工作效率。
醫(yī)院IT運(yùn)維中的幾個(gè)常見(jiàn)問(wèn)題,也制約著醫(yī)院信息化的建設(shè)與發(fā)展;資源不足:醫(yī)院IT運(yùn)維投入跟不上IT規(guī)模的增長(zhǎng)、IT復(fù)雜性變化永遠(yuǎn)快于IT人員成長(zhǎng)、IT日常運(yùn)行維護(hù)工作占據(jù)大量時(shí)間、IT運(yùn)維知識(shí)轉(zhuǎn)化、傳遞和共享不足;被動(dòng)響應(yīng):70%的故障是終端用戶首先發(fā)現(xiàn)的,存在監(jiān)測(cè)盲點(diǎn),缺乏故障預(yù)警能力、主動(dòng)監(jiān)控機(jī)制;監(jiān)控孤島:缺乏統(tǒng)一集中的監(jiān)控管理平臺(tái),無(wú)法直接洞察全局,無(wú)法快速定位用戶問(wèn)題根源;面向設(shè)備:無(wú)法建立IT資源與業(yè)務(wù)之間關(guān)聯(lián)、與業(yè)務(wù)部門(mén)之間缺乏非技術(shù)性溝通界面、不能準(zhǔn)確判斷事件對(duì)業(yè)務(wù)的影響,等等。
醫(yī)院IT集成監(jiān)控管理平臺(tái),應(yīng)以醫(yī)院業(yè)務(wù)應(yīng)用監(jiān)控為重點(diǎn)和主線,并涵蓋支撐醫(yī)院業(yè)務(wù)應(yīng)用正常運(yùn)作之IT基礎(chǔ)架構(gòu)的各個(gè)部件,以最終實(shí)現(xiàn)醫(yī)院業(yè)務(wù)應(yīng)用健康狀況全方位監(jiān)控平臺(tái)[2]。監(jiān)控范圍應(yīng)分為兩個(gè)維度,縱向?yàn)榫W(wǎng)絡(luò)、服務(wù)器、數(shù)據(jù)庫(kù)、中間件和應(yīng)用系統(tǒng)5個(gè)層次,并可擴(kuò)展到業(yè)務(wù)運(yùn)作健康狀況監(jiān)控,橫向?yàn)榭捎眯?、性能、資源、安全和異常錯(cuò)誤5個(gè)方面監(jiān)控內(nèi)容。
在日常發(fā)展復(fù)雜的醫(yī)院信息化建設(shè)中,醫(yī)院IT集成監(jiān)控管理平臺(tái)能為醫(yī)院帶來(lái)幾個(gè)層面的效益;業(yè)務(wù)負(fù)責(zé)人:與IT技術(shù)人員有了共同視圖,提高了溝通效率,幫助確定問(wèn)題優(yōu)先級(jí)別,確保醫(yī)院關(guān)鍵業(yè)務(wù)可用性;應(yīng)用程序負(fù)責(zé)人:加快問(wèn)題定位速度,減少宕機(jī)時(shí)間,縮短故障恢復(fù)時(shí)間,在用戶受影響之前檢測(cè)到潛在問(wèn)題,提高醫(yī)院各業(yè)務(wù)部門(mén)的滿意度;IT支持人員:協(xié)助發(fā)現(xiàn)故障隱患,快速定位問(wèn)題根源,了解IT事件的業(yè)務(wù)影響,正確安排工作優(yōu)先級(jí);主動(dòng)發(fā)現(xiàn)故障隱患,確保IT基礎(chǔ)架構(gòu)和服務(wù)的穩(wěn)定運(yùn)行。
基于醫(yī)院IT運(yùn)維面臨的挑戰(zhàn)和問(wèn)題,業(yè)務(wù)的高速發(fā)展,迫切地需要我們提了一個(gè)行之有效的解決方案,該方案必須滿足以下幾個(gè)需求:醫(yī)院IT資源監(jiān)控,滿足標(biāo)準(zhǔn)設(shè)備和平臺(tái)的監(jiān)測(cè)能力;業(yè)務(wù)服務(wù)監(jiān)控,滿足標(biāo)準(zhǔn)服務(wù)探測(cè),具有強(qiáng)大的非標(biāo)服務(wù)定制能力;滿足按照業(yè)務(wù)和管理的需要[3],靈活組織監(jiān)控視圖,方面日常監(jiān)控管理。
服務(wù)端:Linux服務(wù)器+Mysql數(shù)據(jù)庫(kù)+監(jiān)控分析外掛,三者整合為一臺(tái)硬件引擎,方便快速部署與管理;終端:根據(jù)采集需要部署探針或代理;實(shí)現(xiàn)從“面向設(shè)備”到“面向業(yè)務(wù)”的運(yùn)維理念轉(zhuǎn)變,業(yè)務(wù)服務(wù)建模、實(shí)現(xiàn)IT與業(yè)務(wù)關(guān)聯(lián),服務(wù)影響分析、服務(wù)可用性報(bào)告;實(shí)現(xiàn)從“被動(dòng)運(yùn)維”到“主動(dòng)運(yùn)維”的運(yùn)維方式轉(zhuǎn)變,主動(dòng)服務(wù)偵測(cè),全面消除監(jiān)測(cè)盲點(diǎn),故障主動(dòng)預(yù)警,真正做到防患于未然;實(shí)現(xiàn)從“分散監(jiān)控”到“集中監(jiān)控”的管控模式轉(zhuǎn)變,消除監(jiān)控孤島、集中事件管理、統(tǒng)一服務(wù)視圖。
網(wǎng)絡(luò)設(shè)備:監(jiān)控應(yīng)全面管理支持SNMP協(xié)議各個(gè)網(wǎng)絡(luò)設(shè)備廠商,監(jiān)控設(shè)備類(lèi)型包括交換機(jī)、路由器、防火墻、負(fù)載均衡等設(shè)備,監(jiān)控內(nèi)容包括設(shè)備可用性(ping)、端口流量、端口使用率、內(nèi)存使用率、CPU使用率等。
主機(jī)/操作系統(tǒng):監(jiān)控應(yīng)從多個(gè)方面對(duì)服務(wù)器硬件資源和操作系統(tǒng)進(jìn)行監(jiān)控管理,監(jiān)控內(nèi)容包括非法登錄監(jiān)測(cè)、存儲(chǔ)空間監(jiān)測(cè)、CPU負(fù)載監(jiān)測(cè)、物理內(nèi)存監(jiān)測(cè)、交換區(qū)空間監(jiān)測(cè)、IO負(fù)載監(jiān)測(cè)、集群狀態(tài)監(jiān)測(cè)、指定進(jìn)程監(jiān)測(cè)和系統(tǒng)日志監(jiān)測(cè)等。支持 IBM AIX、Windows、Unix、Linux、Red Hat等多種操作系統(tǒng)。
數(shù)據(jù)庫(kù):監(jiān)控從可用性、性能、占用資源、安全事件和異常錯(cuò)誤等多個(gè)方面對(duì)數(shù)據(jù)庫(kù)進(jìn)行全面監(jiān)控,如響應(yīng)時(shí)間監(jiān)測(cè)、連接進(jìn)程數(shù)監(jiān)測(cè)、連接客戶端監(jiān)測(cè)、指定進(jìn)程監(jiān)測(cè)、長(zhǎng)事務(wù)監(jiān)測(cè)、鎖監(jiān)測(cè)、進(jìn)程回滾監(jiān)測(cè)、數(shù)據(jù)庫(kù)空間監(jiān)測(cè)和數(shù)據(jù)日志監(jiān)測(cè)等。支持 ORACLE、Sybase、DB2、SQL Server、MySQL等多種數(shù)據(jù)庫(kù)。
中間件:是位于網(wǎng)絡(luò)、操作系統(tǒng)和數(shù)據(jù)庫(kù)之上和應(yīng)用系統(tǒng)之下的一種獨(dú)立的系統(tǒng)軟件或服務(wù)程序,常見(jiàn)的中間件類(lèi)型有交易中間件、消息中間件、RPC中間件、應(yīng)用服務(wù)器和WEB服務(wù)器等。監(jiān)控應(yīng)支持各種常用的中間件軟件監(jiān)控,如 WebLogic、WebSphere、Jboss、Tomcat、Apache、IIS、Exchange Server等。中間件監(jiān)控應(yīng)從可用性、性能、占用資源、安全事件和異常錯(cuò)誤等幾個(gè)方面對(duì)中間件進(jìn)行全方位監(jiān)測(cè),如Apache監(jiān)測(cè)內(nèi)容包括服務(wù)進(jìn)程監(jiān)測(cè)、負(fù)載監(jiān)測(cè)、請(qǐng)求監(jiān)測(cè)、閑置監(jiān)測(cè)、內(nèi)存使用情況監(jiān)測(cè)和數(shù)據(jù)庫(kù)連接監(jiān)測(cè)等信息。
針對(duì)醫(yī)院信息系統(tǒng)運(yùn)維存在的種種困難及產(chǎn)生原因,我們迫切需要一款比較優(yōu)秀的監(jiān)控平臺(tái),該平臺(tái)需具備以下功能和特性。
3.3.1 監(jiān)控管理 覆蓋常見(jiàn)資源監(jiān)控模型,網(wǎng)絡(luò)設(shè)備、主機(jī)、數(shù)據(jù)庫(kù)、中間件、應(yīng)用;支持服務(wù)主動(dòng)模擬偵測(cè),網(wǎng)絡(luò)服務(wù):ping、fping、ftp、dhcp、dns、telnet;郵箱服務(wù):pop、smtp;數(shù)據(jù)庫(kù)服務(wù):jdbc、odbc;WEB服務(wù):http、https;支持快速創(chuàng)建監(jiān)控模型,支持個(gè)性化的監(jiān)控模型創(chuàng)建,實(shí)現(xiàn)醫(yī)院不同個(gè)性化的定制;支持代理和非代理采集,支持輕量級(jí)、低智能、采集時(shí)不需知道賬號(hào)和密碼、二次開(kāi)發(fā)能力強(qiáng)的代理采集;支持各類(lèi) IT 標(biāo)準(zhǔn)如 SNMP、Telnet/SSH、WMI、JDBC/ODBC、JMX、API的非代理采集,兩種方式提供的監(jiān)控?cái)?shù)據(jù)來(lái)源,保證監(jiān)控結(jié)果的準(zhǔn)確性。支持可視化展現(xiàn):對(duì)海量數(shù)據(jù)要有深入的洞察力,對(duì)信息整合要有全局觀、提供“儀表盤(pán)化”的高智能性可視化、操作的易用性。
3.3.2 事件管理 故障根源分析:基于采集依賴、基于業(yè)務(wù)依賴,從而快速準(zhǔn)確定位故障的根源。
衍生事件屏蔽:消除告警風(fēng)暴,避免由于風(fēng)暴的產(chǎn)生而影響正常的業(yè)常。
基于規(guī)則的事件處理引擎:包括事件過(guò)濾、豐富、壓制、關(guān)聯(lián)及升級(jí);事件過(guò)濾,對(duì)嚴(yán)重級(jí)別低或運(yùn)維不關(guān)注的事件進(jìn)行過(guò)濾;事件豐富,為事件后續(xù)處理提供添加必要信息,以幫助理解事件背景、提高事件管理效率和便利服務(wù)管理;事件壓制,用來(lái)處理重復(fù)發(fā)生事件,以減少事件數(shù)量;事件關(guān)聯(lián),事件清除、因果關(guān)聯(lián);事件升級(jí),調(diào)整事件嚴(yán)重性級(jí)別以提醒運(yùn)維工程師盡快處理該事件。
3.3.3 服務(wù)影響管理 通過(guò)創(chuàng)建并維護(hù)服務(wù)模型、關(guān)聯(lián)和處理服務(wù)組件相關(guān)事件,為醫(yī)院IT運(yùn)維工程師提供服務(wù)影響分析,幫助醫(yī)院實(shí)時(shí)了解問(wèn)題對(duì)服務(wù)的影響、快速定位問(wèn)題根源和輔助確定解決問(wèn)題優(yōu)先順序。
3.3.4 監(jiān)控結(jié)果查詢與處理 根據(jù)不同的管理需要,可以按“管理視圖”、“設(shè)備視圖”、“業(yè)務(wù)視圖”和“自定義視圖”,“KPI視圖”進(jìn)行分類(lèi),不同的分類(lèi)滿足不同權(quán)限監(jiān)控需要。
3.3.5 告警管理 根據(jù)日常告警,可提供“郵件報(bào)警、短信報(bào)警、桌面報(bào)警、聲光報(bào)警、顯示屏管理”等多種方式的告警;而從方便告警處理、報(bào)警日志查詢等,加快信息的主動(dòng)告警,使運(yùn)維工程師主動(dòng)解決監(jiān)控故障,降低系統(tǒng)的風(fēng)險(xiǎn)及提高醫(yī)院的服務(wù)水平與滿意度。
3.3.6 報(bào)表管理 CUP負(fù)載監(jiān)測(cè)變化趨勢(shì)分析報(bào)表,提供決策支持,如采購(gòu)、更換設(shè)備、優(yōu)化升級(jí)軟件。
3.3.7 權(quán)限管理 提供單位用戶管理、角色用戶管理、角色權(quán)限管理、用戶組管理等不同等級(jí)的權(quán)限管理。
基于以上幾點(diǎn),在醫(yī)院相關(guān)領(lǐng)導(dǎo)的重視及部門(mén)的大力支持和緊密配合下,我院與某公司合作,結(jié)合我院的特點(diǎn)二次開(kāi)發(fā)并共同實(shí)施了一款面向業(yè)務(wù)的醫(yī)院IT一體化監(jiān)控平臺(tái)軟件,從2012年7月完成立項(xiàng),經(jīng)過(guò)業(yè)務(wù)調(diào)研、設(shè)計(jì)開(kāi)發(fā),于2012年10月完成投產(chǎn),提供給各相關(guān)業(yè)務(wù)管理人員,經(jīng)過(guò)半年的運(yùn)行,系統(tǒng)運(yùn)行效果良好,達(dá)到了項(xiàng)目的技術(shù)規(guī)范要求。
該平臺(tái)軟件集成了IT基礎(chǔ)架構(gòu)監(jiān)控、事件管理、服務(wù)影響管理、告警管理和報(bào)表管理等功能模塊,其監(jiān)控范圍覆蓋了醫(yī)院業(yè)務(wù)所依賴網(wǎng)絡(luò)、服務(wù)器、數(shù)據(jù)庫(kù)、應(yīng)用和服務(wù)等各種IT基礎(chǔ)設(shè)施,監(jiān)控內(nèi)容涵蓋了可用性、性能、資源、安全等各個(gè)方面的監(jiān)控需求。通過(guò)其內(nèi)置的圖形化的服務(wù)建模工具,醫(yī)院可快速創(chuàng)建各種業(yè)務(wù)服務(wù)模型來(lái)實(shí)現(xiàn)業(yè)務(wù)與IT資源之間的動(dòng)態(tài)關(guān)聯(lián),幫助運(yùn)維工程師了解在IT基礎(chǔ)設(shè)施出現(xiàn)問(wèn)題時(shí)對(duì)醫(yī)院業(yè)務(wù)的影響和在業(yè)務(wù)出現(xiàn)問(wèn)題時(shí)快速定位問(wèn)題根源,從而為醫(yī)院提供一種以業(yè)務(wù)為主線的整體監(jiān)控運(yùn)維模式,以確保IT基礎(chǔ)架構(gòu)穩(wěn)定運(yùn)行和醫(yī)院業(yè)務(wù)的持續(xù)可用性。
通過(guò)醫(yī)院IT集成監(jiān)控管理平臺(tái),多方位一體化監(jiān)控網(wǎng)絡(luò)設(shè)備、主機(jī)/操作系統(tǒng)、數(shù)據(jù)庫(kù)、中間件,為我院信息化運(yùn)營(yíng)搭建了可視化平臺(tái),直觀、及時(shí)有效監(jiān)控IT故障并實(shí)時(shí)處理,使管理者、主管部門(mén)達(dá)到有效的監(jiān)控作用,加強(qiáng)了醫(yī)院信息化安全可靠管理[4],提高了醫(yī)院滿意度,進(jìn)一步提升醫(yī)院的整體綜合效益。
[1]王春雨,王耀煒,付繼剛.擺脫被動(dòng),以前瞻視角進(jìn)行醫(yī)院數(shù)字化建設(shè)[J].中國(guó)高新技術(shù)企業(yè),2010,(09):135-136
[2]喬 民,馮 帆、索向軍,等.淺談我國(guó)醫(yī)院信息化建設(shè)的現(xiàn)狀及對(duì)策[J].華北國(guó)防醫(yī)藥,2008,20(30):81 -82.
[3]高晉華.數(shù)字化醫(yī)院建設(shè)的實(shí)踐與體會(huì)[J].解放軍醫(yī)院管理雜志,2007(6):10-11.
[4]李湘平.醫(yī)院信息系統(tǒng)的安全問(wèn)題[J].現(xiàn)代醫(yī)院,2012,12:(7):141-142.