戴常浪,溫從劍,劉興淮
基于SQL Server的應急系統(tǒng)解決方案
戴常浪,溫從劍,劉興淮
目的:建立應急系統(tǒng)解決方案,保證醫(yī)院醫(yī)療活動的不間斷運行。方法:根據(jù)醫(yī)院實際情況,設計和實現(xiàn)基于SQL Server代理的應急系統(tǒng)解決方案并投入使用。結(jié)果:該系統(tǒng)方案在各種極端情況發(fā)生時均可“零成本”地支撐起部分或全院性業(yè)務,保證了信息系統(tǒng)安全穩(wěn)定運行。結(jié)論:該系統(tǒng)方案歷經(jīng)多次應急演練驗證,具有較強的可行性與可靠性。
SQL Server;應急系統(tǒng);醫(yī)院
我院是一所綜合性三級甲等醫(yī)院,為滿足業(yè)務需求,提高患者就醫(yī)效率,目前已建成醫(yī)院信息系統(tǒng)(hospital information system,HIS)、實驗室信息系統(tǒng)(laboratory information system,LIS)、電子病歷系統(tǒng)(electronic medical record,EMR)、醫(yī)學影像信息系統(tǒng)(picture archiving and communication systems,PACS)等,醫(yī)院的業(yè)務運行對信息系統(tǒng)依賴性越來越大,醫(yī)院管理逐步從費用管理向醫(yī)療信息化管理方向延伸,因此,信息系統(tǒng)的安全穩(wěn)定運行至關重要[1]。筆者以我院一次核心業(yè)務癱瘓事件為例,闡述了應急系統(tǒng)的重要性并給出基于SQL Server的應急系統(tǒng)解決方案。
1.1 事件經(jīng)過
2012年9月28日13:30左右,使用科室反映LIS速度變慢,經(jīng)檢查為輸入輸出端口(input/output,I/O)讀寫阻塞現(xiàn)象嚴重,即通過群集軟件(賽門鐵克Veritas)切換至備份服務器,在切換過程中,群集軟件異常,由于HIS和LIS服務器為互備模式,造成HIS、 LIS服務器無法找到存儲設備,均無法正常使用。經(jīng)修復,HIS服務器于16:35運行正常,使用約10 min后,發(fā)現(xiàn)HIS數(shù)據(jù)庫為2012年4月13日數(shù)據(jù),之后的數(shù)據(jù)均處于丟失狀態(tài),即停止使用??紤]數(shù)據(jù)很難在短時間內(nèi)恢復,決定還原當日4:00備份數(shù)據(jù)后使用,于18:20數(shù)據(jù)庫還原完成,急診收費和發(fā)藥可應急使用。隨后,在原廠工程師的遠程協(xié)助下,HIS于次日0:30恢復正常,但LIS仍運行緩慢。為臨時解決這一問題,將LIS數(shù)據(jù)庫恢復到單機服務器上使用。此次故障前后造成HIS斷續(xù)停機約9 h。
1.2 故障分析與排除
對存儲的LIS資源組重新劃分邏輯單元號(logical unit number,LUN)并測試,拷貝相同大小的數(shù)據(jù)文件,拷貝數(shù)據(jù)到中心機房存儲的磁盤上,拷貝無法完成,服務器卡死??截悢?shù)據(jù)到門診機房存儲的磁盤上,拷貝數(shù)據(jù)正常,無卡死現(xiàn)象。更換中心機房存儲LUN的監(jiān)管控制器,與HIS服務器在相同的控制器B中,拷貝數(shù)據(jù)正常。再把LIS的LUN調(diào)整到控制器A上,拷貝數(shù)據(jù)時,拷貝無法完成,服務器卡死[2-3]。通過數(shù)據(jù)反復拷貝,最終判斷是由于IBM DS5020存儲控制器A性能下降,造成LIS磁盤在鏡像(MIRROR)后讀寫出現(xiàn)一個讀寫快,一個讀寫慢,導致鏡像后讀寫混亂,從而導致LIS程序運行慢。更換控制器,故障排除。
1.3 情況總結(jié)
為提高HIS運行的可靠性,我院已采用存儲區(qū)域網(wǎng)絡(storage area network,SAN)架構(gòu)的“2+2”服務器集群模式,不僅排除了單點故障,而且雙存儲之間采用存儲鏡像技術實現(xiàn)了異地數(shù)據(jù)容災[4]。本次故障系Veritas群集軟件切換異常,造成主備服務器均不能使用,從而導致醫(yī)院業(yè)務斷續(xù)癱瘓了9 h之久。通過本次故障,我院迫切需要建立一套應急系統(tǒng),用于一線系統(tǒng)癱瘓后支撐醫(yī)院業(yè)務,以保證醫(yī)療工作正常有序開展。
該應急系統(tǒng)是針對醫(yī)院核心業(yè)務HIS而設立的。其原理如下:將HIS數(shù)據(jù)庫最后一次完全備份及時地還原至應急服務器,且應急服務器的系統(tǒng)配置、數(shù)據(jù)庫環(huán)境與HIS服務器設置一致,當應急系統(tǒng)啟用時,只需將當天最后一次差異備份還原至應急服務器,同時將HIS服務器斷開網(wǎng)絡,并將應急服務器的IP地址和機器名與HIS服務器設置一致,然后接入網(wǎng)絡即可。這樣做的主要時間代價是將最后一次差異備份還原至應急服務器的時間,數(shù)據(jù)代價是從最后一次差異備份到發(fā)生故障時丟失的數(shù)據(jù)。
上述原理中所涉及到的流程及數(shù)據(jù)庫命令如下:
(1)4:30 HIS服務器開始生成最后一次完全備份,備份路徑為HIS服務器存儲上的y:ackup his40_ full.bak,所需時間為5~10 min。
(2)5:00應急服務器通過計劃任務把第1步的備份拷貝至應急服務器E盤目錄下,所需時間約為60 min。
(3)6:30應急服務器啟動備份還原作業(yè),還原命令為“restore database[THIS4]from disk='E: his40_ full.bak'with replace,norecovery”,所需時間約為90 min。
3.1 應急服務器數(shù)據(jù)庫啟用
(1)根據(jù)當前時間找到當天最新的一次差異備份,將其拷貝至應急服務器。
(2)在SQL2005企業(yè)管理器中連接本地數(shù)據(jù)庫,執(zhí)行以下語句:“restore database[THIS4]from disk='差異備份文件所在絕對路徑'with replace,recovery”,該命令的含義是用指定的數(shù)據(jù)庫備份文件還原指定的數(shù)據(jù)庫,并將數(shù)據(jù)庫還原之后置于可用狀態(tài)。若文件當天進行差異備份沒有成功,則執(zhí)行以下語句:“restore database[THIS4]with recovery”,該命令可以把處于還原狀態(tài)中的THIS4數(shù)據(jù)庫變成可用狀態(tài)[5-6]。
3.2 應急網(wǎng)絡的搭建
(1)將標簽為“應急服務器”和“輔域控”的網(wǎng)線接入應急交換機1上。
(2)將帶有應急標簽的6根網(wǎng)線(其中2根線連到門診藥房,2臺終端;4根線連接收費處,4臺終端)接入到應急交換機2上,同時將連往應急交換機1的網(wǎng)線接入應急交換機2上,這樣就組成了一個包含6臺終端、2臺交換機、1臺應急服務器、1臺輔域控服務器的應急網(wǎng)絡。
(3)將應急服務器的主機名改為THIS,與下面的客戶端所連接的HIS服務器重名,同時將應急服務器的IP地址更改為原HIS服務器的IP地址。
3.3 應急終端的啟用
一旦主從服務器同時宕機、核心交換機出現(xiàn)故障等極端現(xiàn)象發(fā)生時,原先收費處、門診藥房工作站不需做任何修改即可啟用應急系統(tǒng)。
定期的應急演練充分地證實了該應急系統(tǒng)方案的可行性與可靠性,在各種極端現(xiàn)象發(fā)生時,可“零成本”地支撐起醫(yī)院業(yè)務。當網(wǎng)絡發(fā)生全院性癱瘓時,該方案可保證門急診收費和藥房業(yè)務的正常運轉(zhuǎn);當服務器同時宕機或存儲等發(fā)生故障,而網(wǎng)絡正常時,該方案可支撐起全院所有的HIS業(yè)務。
醫(yī)院信息系統(tǒng)不可能沒有故障,當再出現(xiàn)核心業(yè)務癱瘓時,基于SQL Server的應急系統(tǒng)可支撐起醫(yī)院關鍵業(yè)務,保證了醫(yī)療工作正常有序地進行,并將損失減到最小[7]。
[1]黎偉強.醫(yī)院信息系統(tǒng)應急預案的建立與整體實施[J].醫(yī)學信息學雜志,2007(2):132-133.
[2]孫林記,冒衛(wèi).探析SAN存儲光纖盤陣的配置[J].電腦知識與技術,2009,5(25):7 276-7 277,7 292.
[3]李偉.基于SAN架構(gòu)的數(shù)據(jù)存儲和備份系統(tǒng)[J].電腦知識與技術,2010,6(20):5 406-5 407.
[4]郝尚永.基于SAN架構(gòu)的醫(yī)院網(wǎng)絡數(shù)據(jù)存儲系統(tǒng)設計與實現(xiàn)[J].醫(yī)療衛(wèi)生裝備,2009,30(12):47-48.
[5]湯永利,程艷艷.淺談SQL Server 2005數(shù)據(jù)庫備份與恢復[J].科技信息,2012(20):49-51.
[6]向猛.SQL Server 2005數(shù)據(jù)庫備份與恢復研究[J].現(xiàn)代計算機:專業(yè)版,2012(9):45-48.
[7]邢海燕.醫(yī)院信息系統(tǒng)故障應急預案[J].中國數(shù)字醫(yī)學,2008,3(12):23-24.
(收稿:2013-10-03 修回:2014-03-20)
(欄目責任編校:李 影)
Emergency system solutions based on SQL Server agent
DAI Chang-lang,WEN Cong-jian,LIU Xing-huai
(Center of Computer,Huai'an First People's Hospital,Nanjing Medical University, Huai'an 223300,Jiangsu Province,China)
ObjectiveTo put forward emergency system solutions to ensure uninterrupted hospital medical services. MethodsThe emergency system solutions were designed and realized based on SQL Server agent,and then put into practice.ResultsThe solutions could support parts or all of hospital services with no cost in case of extreme situations, and thus the safety and stability could be ensured for the information system.ConclusionSeveral emergency trials prove that the solutions behaves well in feasibility and reliability.[Chinese Medical Equipment Journal,2015,36(1):130-131]
SQL Server;emergency system;hospital
R318;TP311.13;R197.324
A
1003-8868(2015)01-0130-02
10.7687/J.ISSN1003-8868.2015.01.130
戴常浪(1989—),男,助理工程師,主要從事網(wǎng)絡及系統(tǒng)集成、數(shù)據(jù)庫應用等方面的研究工作,E-mail:nanchenglangzi1989@163.com。
223300江蘇淮安,南京醫(yī)科大學附屬淮安第一人民醫(yī)院計算機中心(戴常浪,溫從劍,劉興淮)