莫 偉
(民航山東空中交通管理分局 山東 250014)
雙機熱備指的是基于高可用系統(tǒng)中的兩臺服務器的熱備(或高可用)。服務器的故障可能由各種原因引起,如設備故障、操作系統(tǒng)故障、軟件系統(tǒng)故障等等。一般地講,在技術人員在現(xiàn)場的情況下,恢復服務器正??赡苄枰?0分鐘、幾小時甚至幾天。從實際經(jīng)驗上看,除非是簡單地重啟服務器,否則往往需要幾個小時以上。而如果技術人員不在場,則恢復服務的時間就更長了。
(1)民航山東空管分局辦公由兩臺服務器,一臺作為ORACLE數(shù)據(jù)庫服務器,一臺作為WEB服務器。多年來,對于數(shù)據(jù)庫的備份一直為冷備份操作,即使用GHOST軟件,在晚間非工作時間進行備份,待服務器異常后,需手動還原。這種方式有很多缺點,首先在工作期間出現(xiàn)故障需要還原時,會連接不上服務器,從而影響分局辦公,其次備份及還原時間長,往往恢復的時間長達1天,且工作量大。
(2)組成雙機熱備的方案主要的兩種方式基于共享存儲(磁盤陣列)的方式和利用數(shù)據(jù)的同步方式,保證主備服務器的數(shù)據(jù)一致性。第一種是集群,集群可能包括多臺服務器。第二種是通過軟件方式實現(xiàn)雙機熱備。即不采用共享的存儲設備,而是數(shù)據(jù)不再單點存儲,本機數(shù)據(jù)可以向多臺主機做實時的數(shù)據(jù)復制。就本單位來說,問題在于如果使用WINDOWS集群服務進行雙機熱備,則必須使用磁盤陣列,如果使用純軟件進行雙機熱備,則需要大量資金購買熱備軟件,從而導致雙機熱備方案成本很高。
(1)將主服務器(雙網(wǎng)卡)與備服務器(雙網(wǎng)卡)使用交叉線連接起來作為心跳線。設:主機IP:10.14.128.27主機心跳:192.168.1.11備機IP:10.14.128.24備機心跳:192.168.1.12;
(2)使用互聯(lián)網(wǎng)上免費提供的文件同步備份軟件進行文件的同步;
(3)編寫程序,放置在備份機上,程序的目的是實現(xiàn)純軟件下雙服務器的熱備份功能,通過心跳線通訊,探查主服務器狀態(tài),一旦主服務器故障,備機會根據(jù)心跳線通訊返回的狀態(tài)自動接管主服務器應用。程序關鍵內容大致如下:
由于需要雙機熱備的是ORACLE數(shù)據(jù)庫,所以拷貝正在使用中的數(shù)據(jù)庫文件是個難題,正在使用中的數(shù)據(jù)庫文件是無法被復制傳輸?shù)模槍Υ藛栴}解決方法是:據(jù)庫文件.dbf等的備份,解決文件占用問題)//停用oraclehome92agent服務
(4)在計劃任務中添加新任務,啟動程序,日程安排選“每天”,進入高級,選中“重復任務”,每一分鐘執(zhí)行一次,時限9999小時59分鐘。
(5)在備服務器上安裝免費的同步軟件,按需求設置好同步的間隔時間和執(zhí)行任務的頻率。
在方案完成以后,基本實現(xiàn)了服務器在純軟件方式下的雙機熱備份,將以前出現(xiàn)故障時,影響分局辦公的平均時間1天左右降至10分鐘以內,并且該方案由于不使用任何外部設備,因此成本也幾乎為零,為分局節(jié)省了大量的資金,同時還將網(wǎng)管員從繁復的備份工作中解放出來,達到了預期的效果。
[1]劉志丹,彭建華.一種基于商用電信網(wǎng)絡的容錯技術[J].電訊技術,2009,(1):20-25.
[2]盧燕寧,耿國華.基于Cmster的多服務器容錯與切換技術的研究[J].微機發(fā)展,2004,(6):28-31
[3]謝希仁.計算機網(wǎng)絡[M].2008.01