祖東生
1醫(yī)院存儲(chǔ)需求
隨著醫(yī)院信息化的不斷深入,以電子病歷為核心的數(shù)據(jù)共享、數(shù)據(jù)挖掘成為醫(yī)院信息化的顯著特征,而如何保障電子病歷數(shù)據(jù)的安全,如何支撐迅速增長(zhǎng)的醫(yī)療數(shù)據(jù)的可靠存儲(chǔ)與高性能利用,成為醫(yī)院信息化存儲(chǔ)技術(shù)的重點(diǎn)。
但目前醫(yī)院經(jīng)常使用的磁帶備份技術(shù)、光纖通道存儲(chǔ)技術(shù)在數(shù)據(jù)的安全性、存儲(chǔ)系統(tǒng)容量和性能的可擴(kuò)展性方面還存在數(shù)據(jù)恢復(fù)速度慢、可靠性低、存儲(chǔ)價(jià)格高等問題,本文將針對(duì)以上問題,探討存儲(chǔ)新技術(shù)在醫(yī)院的應(yīng)用情況。
2目前醫(yī)院存儲(chǔ)系統(tǒng)現(xiàn)狀
2.1服務(wù)器多數(shù)為Windows操作系統(tǒng)做雙機(jī),少數(shù)大型醫(yī)院采用UNIX平臺(tái)的小型機(jī)。
2.2數(shù)據(jù)庫多數(shù)為SQL Server和Oracle。
2.3存儲(chǔ)系統(tǒng)多數(shù)為FC SAN和少量DAS產(chǎn)品。
3醫(yī)院應(yīng)用系統(tǒng)特點(diǎn)
3.1 I/O密集型數(shù)據(jù)庫應(yīng)用。以三級(jí)甲等醫(yī)院為例,每日門診人數(shù)為2000人次~3000人次,上午至中午為高峰期。
3.2系統(tǒng)要求快速響應(yīng)。病人與窗口操作人員、醫(yī)生、護(hù)士等都是面對(duì)面地交流,系統(tǒng)響應(yīng)時(shí)間直接影響病人的情緒和醫(yī)務(wù)人員的工作效率。
3.3業(yè)務(wù)連續(xù)性要求極高,掛號(hào)、取藥、收款等任何窗口的系統(tǒng)停機(jī)都會(huì)帶來嚴(yán)重的后果。
3.4醫(yī)院門診、住院系統(tǒng)的收費(fèi)數(shù)據(jù)量雖然不是很大,但數(shù)據(jù)的安全性要求非常高,一旦丟失將給醫(yī)院帶來直接經(jīng)濟(jì)損失。
3.5對(duì)于LIS、PACS等檢查系統(tǒng)產(chǎn)生的大尺寸圖像數(shù)據(jù),數(shù)據(jù)的可擴(kuò)展存儲(chǔ)、安全存儲(chǔ)、快速存儲(chǔ)是醫(yī)院存儲(chǔ)系統(tǒng)面臨的最大難題。
4目前門診系統(tǒng)普遍存在的問題
4.1系統(tǒng)響應(yīng)時(shí)間。以三級(jí)甲等醫(yī)院為例,在高峰時(shí)段存儲(chǔ)系統(tǒng)所承受的壓力計(jì)算如下:上午3個(gè)小時(shí)門診人數(shù)為2500人,平均每分鐘為15人,鑒于醫(yī)院門診數(shù)據(jù)庫表數(shù)量多,關(guān)聯(lián)復(fù)雜,假定每個(gè)病人產(chǎn)生100次I/O,那么門診系統(tǒng)單獨(dú)產(chǎn)生的I/O請(qǐng)求為每分鐘1500次,即使加上其他系統(tǒng),I/O請(qǐng)求數(shù)也不超過每分鐘3000次。對(duì)于主流的FC或者SCSI磁盤陣列來說,這樣的壓力在正常情況下是完全可以滿足的,但是我們看一下目前中端磁盤陣列的體系結(jié)構(gòu),如圖1。
如圖所示,這種體系結(jié)構(gòu)的弊端在于整個(gè)存儲(chǔ)系統(tǒng)只有兩個(gè)控制器,任何一個(gè)控制器的失效都會(huì)降低系統(tǒng)整體性能的50%,如果再考慮到Cache等的影響,實(shí)際性能會(huì)有更嚴(yán)重的影響。存儲(chǔ)系統(tǒng)是整個(gè)IT系統(tǒng)的基石,當(dāng)它的性能出現(xiàn)嚴(yán)重下降時(shí),即使應(yīng)用的服務(wù)器配置再高也無濟(jì)于事。它會(huì)直接使整個(gè)應(yīng)用系統(tǒng)性能的嚴(yán)重下降,使操作響應(yīng)時(shí)間延長(zhǎng),使窗口排起長(zhǎng)隊(duì),造成患者抱怨,日接待患者數(shù)量減少,醫(yī)院效益和名譽(yù)都受到損害。而潛在的問題是此時(shí)系統(tǒng)處于臨界狀態(tài),在更換新的備件之前(2天~3天)整個(gè)系統(tǒng)一直處于以上狀態(tài),隨著時(shí)間的推移,造成的影響程度將呈幾何級(jí)增長(zhǎng)。
4.2業(yè)務(wù)連續(xù)性。目前多數(shù)醫(yī)院在應(yīng)用服務(wù)器和網(wǎng)絡(luò)連接設(shè)備上都實(shí)現(xiàn)了高可用,但存儲(chǔ)系統(tǒng)作為IT系統(tǒng)的基石卻并沒有得到足夠重視,磁盤陣列內(nèi)部的RAID技術(shù)和部件級(jí)的冗余設(shè)計(jì)并不能保證存儲(chǔ)系統(tǒng)級(jí)別的高可用,這也是很多系統(tǒng)管理員的認(rèn)識(shí)誤區(qū)。拋開地震、洪水等自然因素,醫(yī)院的存儲(chǔ)系統(tǒng)仍然面臨著火災(zāi)、停電等威脅,雖然RAID5技術(shù)和雙控制器設(shè)計(jì)允許單塊硬盤和單個(gè)控制器出錯(cuò),但不能保證在人們發(fā)現(xiàn)問題(可能幾天)直到解決問題(可能需要更長(zhǎng)時(shí)間)之前,沒有其他硬盤或者控制器再出問題。一旦存儲(chǔ)系統(tǒng)宕機(jī)其后果將非常嚴(yán)重,如整個(gè)應(yīng)用系統(tǒng)停止運(yùn)行,一切工作都無法正常進(jìn)行。再如數(shù)據(jù)受到損壞,后果無法想象等。
4.3數(shù)據(jù)安全性問題。數(shù)據(jù)安全性主要分兩種情況來討論:一是物理安全性。當(dāng)存儲(chǔ)系統(tǒng)出現(xiàn)硬件故障時(shí),可能會(huì)導(dǎo)致數(shù)據(jù)全部丟失或者部分丟失,對(duì)于數(shù)據(jù)庫應(yīng)用來說,部分?jǐn)?shù)據(jù)丟失可能導(dǎo)致應(yīng)用無法正常運(yùn)行。目前多數(shù)醫(yī)院采用磁帶備份的方式來保護(hù)數(shù)據(jù),但是磁帶介質(zhì)受環(huán)境因素影響較大,當(dāng)真正需要多盤磁帶來恢復(fù)數(shù)據(jù)時(shí),往往會(huì)出現(xiàn)某一盤磁帶出故障而導(dǎo)致數(shù)據(jù)無法完全恢復(fù),而且每次進(jìn)行完磁帶備份后,管理員并不知道剛剛備份的數(shù)據(jù)是否真的可用,如果每次備份都要進(jìn)行校驗(yàn),無疑會(huì)加重管理員的工作負(fù)擔(dān)。
除了磁帶備份存在安全問題外,目前很多醫(yī)院近年來采購(gòu)的FC硬盤或者SCSI硬盤存儲(chǔ)系統(tǒng)也存在安全隱患,考慮到硬盤價(jià)格因素,大多數(shù)存儲(chǔ)系統(tǒng)都會(huì)使用RAID5方式來保護(hù)數(shù)據(jù)。一般來講,硬盤經(jīng)過1年-2年的在線使用后,出現(xiàn)故障的幾率會(huì)增大。當(dāng)一塊硬盤出現(xiàn)故障后,該RAID5中其他硬盤的負(fù)載會(huì)驟然增長(zhǎng),一般管理員很難做到在第一時(shí)間就能發(fā)現(xiàn)問題。在發(fā)現(xiàn)問題前(2天一3天)整個(gè)RAID數(shù)據(jù)都處于危險(xiǎn)狀態(tài),直到新的備件更換后,任意一塊硬盤再出現(xiàn)故障就會(huì)導(dǎo)致數(shù)據(jù)丟失。在這種情況下,數(shù)據(jù)幾乎是不可能完全恢復(fù)的,而且主流的大容量硬盤在更換配件后Rebuild的過程也是很漫長(zhǎng)的,在此期間,必須要保證其他硬盤不能再出問題了。
4.4邏輯安全性。當(dāng)系統(tǒng)受病毒感染時(shí)(尤其對(duì)于Windows平臺(tái)),數(shù)據(jù)很可能會(huì)遭到破壞,另外一種可能的破壞是人為誤操作導(dǎo)致數(shù)據(jù)丟失或受損。
醫(yī)院信息系統(tǒng)的正常運(yùn)行與病人的診療數(shù)據(jù)、醫(yī)院的財(cái)務(wù)數(shù)據(jù)密切相關(guān),任何數(shù)據(jù)的丟失或者破壞都會(huì)對(duì)醫(yī)院造成災(zāi)難性后果。
5問題分析
5.1光纖通道存儲(chǔ)存在單個(gè)控制器失效問題,存儲(chǔ)系統(tǒng)性能嚴(yán)重下降(包括響應(yīng)時(shí)間)的根本原因在于目前中端存儲(chǔ)產(chǎn)品的體系架構(gòu),與具體品牌型號(hào)無關(guān)。
解決方法:突破傳統(tǒng)架構(gòu)束縛,將高端存儲(chǔ)產(chǎn)品架構(gòu)平民化,允許多個(gè)控制器同時(shí)工作,互為冗余,降低單個(gè)控制器故障帶來的風(fēng)險(xiǎn)。
5.2業(yè)務(wù)連續(xù)性要求整個(gè)IT系統(tǒng)實(shí)現(xiàn)高可用,RAID技術(shù)和磁盤陣列內(nèi)部的部件冗余不等于整個(gè)存儲(chǔ)系都實(shí)現(xiàn)了高可用。
解決方法:在醫(yī)院內(nèi)部或者本地異處構(gòu)建經(jīng)濟(jì)實(shí)用的存儲(chǔ)容災(zāi)系統(tǒng),從根本上為業(yè)務(wù)連續(xù)性提供保障。
5.3數(shù)據(jù)的安全存儲(chǔ)涉及物理安全和邏輯安全多個(gè)方面,現(xiàn)有存儲(chǔ)的安全解決方案存在恢復(fù)速度慢、可靠性低等問題。
解決方法:引入新一代虛擬帶庫技術(shù)解決磁帶備份速度和可靠性問題,通過SATA硬盤的RAID10技術(shù)和快照技術(shù)可提高存儲(chǔ)的物理安全性,以解決數(shù)據(jù)邏輯破壞問題。
6解決方案
6.1基于千兆以太網(wǎng)的醫(yī)院內(nèi)部數(shù)據(jù)容災(zāi)解決方案
6.1.1拓?fù)鋱D
名詞解釋:SCM(Storage controller module)存儲(chǔ)控制器;DE(Disk Enclosure)磁盤柜。
6.1.2拓?fù)鋱D描述:如圖所示,整個(gè)存儲(chǔ)系統(tǒng)完全基于千兆以太網(wǎng)架構(gòu),主數(shù)據(jù)中心和災(zāi)備中心可根據(jù)實(shí)際條件位于醫(yī)院內(nèi)部異處或者異地,兩個(gè)站點(diǎn)的數(shù)據(jù)在存儲(chǔ)系統(tǒng)內(nèi)部實(shí)時(shí)鏡像,服務(wù)器完全不受影響。
一旦主數(shù)據(jù)中心存儲(chǔ)系統(tǒng)出現(xiàn)異常停機(jī),應(yīng)用服務(wù)器可迅速調(diào)用災(zāi)備中心的存儲(chǔ)系統(tǒng)繼續(xù)工作。即使主數(shù)據(jù)中心整個(gè)系統(tǒng)停機(jī),災(zāi)備中心的應(yīng)用服務(wù)器也可以迅速接管應(yīng)用,從而確保應(yīng)用的連續(xù)性。
6.1.3方案特點(diǎn)分析:如圖所示,該存儲(chǔ)系統(tǒng)的體系架構(gòu)與傳統(tǒng)架構(gòu)發(fā)生了本質(zhì)變化,SCM與DE分離并結(jié)合以太網(wǎng)技術(shù)特點(diǎn)不再受控制器數(shù)量和距離的限制,多個(gè)控制器可同時(shí)工作,互相之間實(shí)現(xiàn)負(fù)載均衡和故障切換,例如在4個(gè)SCM配置下,單個(gè)SCM的故障只會(huì)降低系統(tǒng)四分之一的性能,從而保證了系統(tǒng)響應(yīng)時(shí)間的要求。
基于以太網(wǎng)的容災(zāi)系統(tǒng)大大降低了光纖通道產(chǎn)品容災(zāi)系統(tǒng)的門檻,數(shù)據(jù)的同步操作完全在存儲(chǔ)系統(tǒng)內(nèi)部通過千兆網(wǎng)絡(luò)進(jìn)行,應(yīng)用服務(wù)器不受任何影響,完全基于以太網(wǎng)架構(gòu)的存儲(chǔ)系統(tǒng)也能使災(zāi)難接管工作變得簡(jiǎn)單易行,使應(yīng)用服務(wù)器可透明地通過以太網(wǎng)使用災(zāi)備中心的存儲(chǔ)系統(tǒng)。
6.2存儲(chǔ)數(shù)據(jù)安全解決方案
6.2.1引入SATA硬盤技術(shù):目前單盤容量500G的SATA硬盤已經(jīng)上市,同F(xiàn)C和SCSI硬盤相比,SATA硬盤無疑具備最佳的容量?jī)r(jià)格比,RAID本身就是廉價(jià)磁盤冗余陣列的縮寫。采用性價(jià)比更合理的SATA硬盤,使用RAID10技術(shù),既能提供高級(jí)別的數(shù)據(jù)保護(hù),又能保證良好的性能(1塊250G的SATA硬盤售價(jià)為1800元,8塊做RAID10可用空間1TB,價(jià)格為14400元,而8塊普通的146G的FC硬盤做RAID5,至少需要30000元-40000元,可用空間也是1TB)。
RAID10技術(shù)與RAID5技術(shù)相比,每一塊硬盤都由另一塊硬盤進(jìn)行完全備份,只要不是保存數(shù)據(jù)的同一對(duì)硬盤同時(shí)出現(xiàn)故障,系統(tǒng)中即使有多塊硬盤有故障,仍能可靠運(yùn)行。RAID5系統(tǒng)中只要有一個(gè)硬盤出現(xiàn)故障,后續(xù)硬盤故障就不可恢復(fù),與其相比,RAID10技術(shù)的安全性更高。
6.2.2引入快照技術(shù):針對(duì)醫(yī)院數(shù)據(jù)系統(tǒng)可能受病毒破壞所造成的數(shù)據(jù)損失,或者人為的數(shù)據(jù)刪除、篡改等問題,新一代存儲(chǔ)系統(tǒng)還支持快照功能,如每半個(gè)小時(shí)做1次快照(只需要極小的空間,2秒~3秒時(shí)間),一旦出現(xiàn)系統(tǒng)感染病毒或者人為誤操作的情況,可以通過生成的快照卷迅速(數(shù)秒鐘時(shí)間)將數(shù)據(jù)恢復(fù)到半小時(shí)前的狀態(tài),從而最低限度地減少損失,最快速度地恢復(fù)系統(tǒng)應(yīng)用。
6.2.3引入磁盤備份技術(shù):上面提到SATA硬盤具有最佳的容量?jī)r(jià)格比,可以通過軟件將SATA磁盤陣列虛擬為磁帶庫設(shè)備,管理員只需要將數(shù)據(jù)備份到生成的磁盤庫上。這與原來的工作方式完全相同,不同的是備份速度和恢復(fù)速度大幅提高,更為重要的是磁盤在可靠性上遠(yuǎn)勝于磁帶設(shè)備,而且磁盤庫天然具有RAID功能,更加提高了備份數(shù)據(jù)的安全性和可靠性。引入D2D(Disk to Disk)技術(shù)后,原有的磁帶設(shè)備可以用來保存過期的或者不經(jīng)常被訪問到的數(shù)據(jù),實(shí)現(xiàn)了分級(jí)存儲(chǔ),即近期頻繁訪問的數(shù)據(jù)保存在現(xiàn)有的在線存儲(chǔ)設(shè)備上,訪問頻率稍低的數(shù)據(jù)保存在SATA磁盤陣列上,需要?dú)w檔的數(shù)據(jù)備份到磁帶上,從而做到了合理分配資源。
7解決的問題
7.1系統(tǒng)響應(yīng)時(shí)間。實(shí)際上,體系架構(gòu)的變化為存儲(chǔ)系統(tǒng)整體性能的可靠性提供了保障,多個(gè)控制器同時(shí)工作降低了單個(gè)控制器故障給系統(tǒng)帶來的影響和風(fēng)險(xiǎn),多個(gè)控制器之間實(shí)現(xiàn)負(fù)載均衡和故障切換,進(jìn)一步優(yōu)化了存儲(chǔ)系統(tǒng)的性能,增強(qiáng)了系統(tǒng)的整體可靠性。
7.2業(yè)務(wù)連續(xù)性。在本方案中,整個(gè)IT系統(tǒng)從存儲(chǔ)系統(tǒng)到網(wǎng)絡(luò)設(shè)備和應(yīng)用服務(wù)器都實(shí)現(xiàn)了高可用,完全基于網(wǎng)絡(luò)架構(gòu)的存儲(chǔ)系統(tǒng)使得原本只有金融電信用戶才考慮的整體容災(zāi)方案向醫(yī)院敞開了大門。
7.3數(shù)據(jù)安全性。使用高性價(jià)比的SATA硬盤構(gòu)成RAID10技術(shù),為金融電信級(jí)別的數(shù)據(jù)提供了保護(hù)??煺占夹g(shù)可以保證將數(shù)據(jù)迅速恢復(fù)到出問題前的狀態(tài);D2D技術(shù)提高了數(shù)據(jù)備份和恢復(fù)的可靠性。
8帶來的好處
除了上述直接解決的問題外,存儲(chǔ)系統(tǒng)體系架構(gòu)的變化為用戶帶來了很多潛在的好處。
8.1為應(yīng)用系統(tǒng)未來的升級(jí)和擴(kuò)展提供無縫支持。如醫(yī)院規(guī)模的擴(kuò)大,就診人數(shù)的增多,病床數(shù)量的增加等要求應(yīng)用系統(tǒng)提供更高的性能保證,在原有的存儲(chǔ)產(chǎn)品架構(gòu)下,我們只能通過購(gòu)買更高級(jí)別的產(chǎn)品來滿足性能的不足,造成重復(fù)投資和原有投資的浪費(fèi)。但是現(xiàn)在我們只需要通過增加控制器的數(shù)量來增強(qiáng)整體性能,通過增加DE的數(shù)量來擴(kuò)展系統(tǒng)容量,從而實(shí)現(xiàn)了隨需應(yīng)變,自動(dòng)適應(yīng)應(yīng)用要求,最大限度地保護(hù)用戶投資。
8.2完全基于以太網(wǎng)技術(shù)的存儲(chǔ)產(chǎn)品在成熟度、可管理性、易維護(hù)方面都是傳統(tǒng)存儲(chǔ)產(chǎn)品無法相比的,從而減輕了管理員日常維護(hù)工作的力度,使其釋放更多的能量去關(guān)注應(yīng)用系統(tǒng)的優(yōu)化,為廣大患者提供更優(yōu)質(zhì)的醫(yī)療服務(wù)。
8.3其他好處,如為數(shù)據(jù)提供了最高級(jí)別的物理保護(hù);為在線應(yīng)用提供了最迅速的數(shù)據(jù)恢復(fù)手段;縮短了每天數(shù)據(jù)備份的時(shí)間,減輕系統(tǒng)管理員工作壓力,可以將更多精力投入到應(yīng)用優(yōu)化中;為未來的法規(guī)遵從做好準(zhǔn)備等。
9總結(jié)
存儲(chǔ)系統(tǒng)是IT系統(tǒng)的基石,它的高效穩(wěn)定運(yùn)行為醫(yī)院門診系統(tǒng)乃至整個(gè)系統(tǒng)的良性運(yùn)轉(zhuǎn)提供了最底層的保障,而這一切的實(shí)現(xiàn)來自于新型架構(gòu)存儲(chǔ)系統(tǒng)的使用。IP的存儲(chǔ)構(gòu)建以及SATA硬盤的性價(jià)比,決定了它必將成為市場(chǎng)選擇的主流。Neocean IXS000作為華為3COM公司推出的全新存儲(chǔ)產(chǎn)品,在支持上述新技術(shù)特性的同時(shí),其全新的體系架構(gòu)和成熟的技術(shù)標(biāo)準(zhǔn)保證Neocean IXS000具備強(qiáng)大的線性擴(kuò)展能力,可以適應(yīng)從入門級(jí)到企業(yè)級(jí)的所有應(yīng)用要求。是華為3Com“自適應(yīng)網(wǎng)絡(luò)存儲(chǔ)架構(gòu)”的堅(jiān)實(shí)基礎(chǔ),主要體現(xiàn)在:業(yè)務(wù)自適應(yīng):隨不同的業(yè)務(wù)要求,動(dòng)態(tài)擴(kuò)展、部署、調(diào)整存儲(chǔ)和帶寬資源;架構(gòu)自適應(yīng):能夠從最低端一直無縫擴(kuò)展到最高端的存儲(chǔ)產(chǎn)品。自動(dòng)適應(yīng)用戶現(xiàn)有網(wǎng)絡(luò)環(huán)境,向后兼容萬兆網(wǎng)絡(luò);管理自適應(yīng):像管理用戶現(xiàn)有網(wǎng)絡(luò)一樣管理存儲(chǔ),無須具備特殊知識(shí)??梢暬?、向?qū)焦芾斫缑?,?jiǎn)便易用。
責(zé)任編輯梁紀(jì)鋒