摘 要 互聯(lián)網(wǎng)的廣泛應(yīng)用,電子商務(wù)系統(tǒng)接通全球市場,信息成為企業(yè)生存的關(guān)鍵資源。電子商務(wù)系統(tǒng)一旦涉足全球市場,就可能遇到急劇增長的信息,即使是對最堅固的平臺來說這也是一個嚴(yán)峻的考驗,因此隨之而來的對信息系統(tǒng)的安全保障已成為普遍關(guān)注的問題。了解容錯技術(shù)的發(fā)展有助于對Stratus容錯服務(wù)器的利用。本文主要對容錯技術(shù)在鋼鐵企業(yè)中的應(yīng)用問題進(jìn)行了分析,希望能夠產(chǎn)生積極的影響。
關(guān)鍵詞 容錯技術(shù) 服務(wù)器安全 應(yīng)用
一、容錯技術(shù)的意義
容錯的含義比較寬泛,這種不確定性容易引發(fā)歧義,增加理解上的難度。從概念上來說,容錯是指服務(wù)器對于錯誤的容納能力,是應(yīng)用過程中對于服務(wù)器穩(wěn)定性追求的一個目標(biāo)。服務(wù)器的容錯技術(shù)一般是指由于種種原因在系統(tǒng)中出現(xiàn)了數(shù)據(jù)、文件損壞或丟失時,系統(tǒng)能夠自動將這些損壞或丟失的文件和數(shù)據(jù)恢復(fù)到發(fā)生事故以前的狀態(tài),服務(wù)器還具備繼續(xù)工作的能力,使系統(tǒng)能夠連續(xù)正常運行的一種技術(shù)。容錯系統(tǒng)一般有兩種,既有因具備熱備份方案而允許出錯的系統(tǒng),也有對出錯非常敏感的系統(tǒng)。這里的“出錯”既有人為因素,也有非人為原因。
雖然在一般情況下,信息系統(tǒng)的故障不會給企業(yè)運作帶來什么影響,但在某些關(guān)鍵時刻,系統(tǒng)的故障就會給企業(yè)帶來不可挽回的影響和損失,這對醫(yī)院、報社、工廠、金融機構(gòu)等而言,尤其重要。容錯技術(shù)的產(chǎn)生和應(yīng)用正是在這種客觀需求下應(yīng)運而生的。容錯技術(shù)的逐步成熟,使得具備容錯功能的服務(wù)器具備了更高的可用性和可維護(hù)性,而且容錯服務(wù)器還可以降低用戶的總體擁有成本,更多的企業(yè)開始把目光從雙機熱備轉(zhuǎn)向了具有容錯技術(shù)的服務(wù)器平臺。
具備容錯技術(shù)的服務(wù)器是通過對服務(wù)器的關(guān)鍵部件采用冗余配置的模式,當(dāng)出現(xiàn)操作失誤或系統(tǒng)故障時,服務(wù)器的容錯機構(gòu)可以及時發(fā)現(xiàn)、及時補救所出現(xiàn)的系統(tǒng)故障,以保護(hù)文件、恢復(fù)并保持系統(tǒng)的正常運行。而專業(yè)的容錯服務(wù)器則能夠自動分離故障模塊,在不中斷運行的情況下,進(jìn)行模塊調(diào)換,對損壞的部件進(jìn)行維護(hù),并且在一切物理故障消除后,系統(tǒng)會自動恢復(fù)同步運行。容錯服務(wù)器在“可靠性、可用性、可管理性、可維護(hù)性、可兼容性、可擴展性”等設(shè)計方面得到了更好的保障。
二、如何保護(hù)服務(wù)器
在容錯服務(wù)器領(lǐng)域,通常采用以下三種方式保護(hù)服務(wù)器,一是把兩臺服務(wù)器共享磁盤陣列柜做成集群,二是在兩臺服務(wù)器間安裝雙機容錯軟件,三是單機容錯。它們各自所對應(yīng)的容錯級別也是從低到高的,也就是說,服務(wù)器群集技術(shù)容錯級別最低,而單機容錯技術(shù)級別最高。
(一)雙機熱備份技術(shù)所采用的是兩臺配置完全一樣的服務(wù)器系統(tǒng),操作系統(tǒng)的應(yīng)用程序安裝在兩臺服務(wù)器的本地系統(tǒng)盤上,整個網(wǎng)絡(luò)系統(tǒng)的數(shù)據(jù)是通過磁盤整理集中管理和備份數(shù)據(jù)的。數(shù)據(jù)集中管理是通過雙機熱備份系統(tǒng),將所有站點的數(shù)據(jù)直接從中央存儲設(shè)備讀取和存儲,并由專業(yè)人員進(jìn)行管理,保護(hù)了數(shù)據(jù)的安全性和保密性。
(二)單機容錯服務(wù)器則是通過CPU時鐘鎖頻,通過對系統(tǒng)中所有硬件的備份,包括CPU、內(nèi)存和I/O總線等的冗余備份,通過系統(tǒng)內(nèi)所有冗余部件的同步運行,實現(xiàn)真正意義上的容錯。任何系統(tǒng)部件的故障都不會造成系統(tǒng)停頓和數(shù)據(jù)丟失。
(三)雙機熱備的容錯模式和單機容錯服務(wù)器的定位稍有不同,雙機熱備一般可以實現(xiàn)99.9%的可用性,單機容錯卻可以實現(xiàn)99.999%的可用性。這樣,雙機熱備份大多應(yīng)用在業(yè)務(wù)連續(xù)性不是很嚴(yán)格的行業(yè),比如公安系統(tǒng)或者個別的制造企業(yè),這些行業(yè)的應(yīng)用允許數(shù)據(jù)有一小段時間的中斷。而如電信、金融、證券和醫(yī)療等要求高的行業(yè)則是容錯服務(wù)器的天下。
另外,雙機熱備容錯方式由于至少需要2臺服務(wù)器,導(dǎo)致在軟件采購(操作軟件、中間件、雙機備份軟件等)、系統(tǒng)維護(hù)升級、系統(tǒng)硬件升級都需要比單機容錯方式多1倍的額外投入,而且在雙機熱備份軟件出現(xiàn)故障時,其維修的難度較高,會給客戶帶來較大的困難。因此,雖然單機容錯服務(wù)器的硬件成本高于雙機備份方式的硬件投入,而其總成本卻遠(yuǎn)遠(yuǎn)低于雙機備份方式的成本。
三、容錯系統(tǒng)應(yīng)用
進(jìn)入21世紀(jì)以來,制造、中小企業(yè)、能源、交通等領(lǐng)域?qū)Ψ?wù)器,特別是中低端IA服務(wù)器的需求激增,過去僅僅可以應(yīng)用在RISC平臺、HP-UX環(huán)境下的容錯產(chǎn)品也面臨著新的挑戰(zhàn)。另一方面,企業(yè)越來越依賴信息系統(tǒng)來完成關(guān)鍵業(yè)務(wù)的應(yīng)用,同時他們不可能配備更多的專業(yè)人員來進(jìn)行專職維護(hù)。雙機熱備、集群服務(wù)器遇到難題。尤其對24小時不間斷,長期工作負(fù)責(zé)核心的服務(wù)系統(tǒng),需要具備容錯服務(wù)。
在煉鋼的L2控制層當(dāng)中,采用的是四臺Stratus容錯ftServer4300服務(wù)器,分別作為預(yù)處理、電路/轉(zhuǎn)爐、煉爐及連鑄數(shù)據(jù)庫服務(wù)器,容錯服務(wù)器的二級PCS系統(tǒng)具備如下特征:
系統(tǒng)開放性:容許哦服務(wù)器一般應(yīng)用的是工業(yè)行業(yè)標(biāo)準(zhǔn)設(shè)計,系統(tǒng)具備良好的開放性,采用的是RedHat Linux操作系統(tǒng),數(shù)據(jù)庫應(yīng)用的是oracle,今后軟件的移植、系統(tǒng)的升級均很方便。
系統(tǒng)的可靠性:容錯服務(wù)器應(yīng)用部件級冗余,因此關(guān)鍵的核心組件都是冗余的,采用美國容錯公司的專有的硬件時鐘同步技術(shù),冗余的容錯硬件的部件在同一時鐘周期下執(zhí)行相同的運算,在一個部件出現(xiàn)故障的情況下,其冗余部件就像激活了備份一樣,繼續(xù)正常工作;服務(wù)器系統(tǒng)的零切換時間保證了實時數(shù)據(jù)的完整性和可靠性,結(jié)合容錯的故障安全軟件及主動服務(wù)體系結(jié)構(gòu),從而保證了系統(tǒng)的99.999%的可用性。
經(jīng)過對于現(xiàn)有硬件平臺的分析,鋼鐵廠熱軋生產(chǎn)線二級過程控制系統(tǒng)與數(shù)據(jù)庫系統(tǒng)選用了Stratus ftServer容錯系統(tǒng)。此系統(tǒng)應(yīng)用的是緊密封裝的機架或機柜配置,且第三代容錯系統(tǒng)繼承了ftServer技術(shù)的可靠性,再加上精細(xì)的行業(yè)標(biāo)準(zhǔn)模塊化部件設(shè)計,結(jié)合相關(guān)操作系統(tǒng)的可用性、高性能、安全特點,這樣完全能夠滿足生產(chǎn)的需要。
參考文獻(xiàn):
[1].韓曉娜.陳朝旭.緱林峰一類傳感器故障的主動容錯控制西北大學(xué)學(xué)報(自然科學(xué)版)2010(1).
[2].孫發(fā);劉楓基于OPCUnifiedArchitecture的服務(wù)器研究儀器儀表標(biāo)準(zhǔn)化與計量2006(05).