席曉宇
摘 要 隨著時(shí)代的發(fā)展,信息技術(shù)的進(jìn)步,計(jì)算機(jī)已經(jīng)逐漸的成為了各行各業(yè)中不可取代的一部分,我國(guó)對(duì)于計(jì)算機(jī)技術(shù)的應(yīng)用也十分的廣泛。其中,計(jì)算機(jī)服務(wù)器系統(tǒng)是計(jì)算機(jī)中十分重要的一個(gè)技術(shù),能夠?yàn)閲?guó)防、醫(yī)療以及金融等各個(gè)行業(yè)為計(jì)算機(jī)系統(tǒng)提供不間斷的服務(wù),如果它出現(xiàn)問(wèn)題那么會(huì)造成十分嚴(yán)重的損失,因此應(yīng)該對(duì)于計(jì)算機(jī)服務(wù)器系統(tǒng)的容錯(cuò)技術(shù)進(jìn)行足夠的重視并且對(duì)其進(jìn)行進(jìn)一步的發(fā)展。本文主要對(duì)其進(jìn)行了詳細(xì)的闡述。
關(guān)鍵詞 計(jì)算機(jī) 服務(wù)器系統(tǒng) 容錯(cuò)技術(shù)
中圖分類號(hào):TP302.8 文獻(xiàn)標(biāo)識(shí)碼:A
1容錯(cuò)必要性
隨著計(jì)算機(jī)技術(shù)的普及,通過(guò)計(jì)算機(jī)系統(tǒng)來(lái)進(jìn)行信息的傳輸并提供服務(wù)逐漸應(yīng)用的越來(lái)越廣泛,但是計(jì)算機(jī)的軟硬件都有可能會(huì)發(fā)生故障,這些故障如果沒(méi)有及時(shí)的進(jìn)行解決很容易造成巨大的損失,甚至?xí)斐烧麄€(gè)服務(wù)的終止網(wǎng)絡(luò)也會(huì)因此而癱瘓,因此產(chǎn)生難以估量的損失。因此,系統(tǒng)的容錯(cuò)性以及不間斷的性質(zhì)顯得尤為重要,為了能夠更好地保證系統(tǒng)安全、可靠地運(yùn)行,必須要采取一定的措施來(lái)保證計(jì)算機(jī)系統(tǒng)能夠在出現(xiàn)故障的時(shí)候已然可以正常的使用。經(jīng)過(guò)人們地長(zhǎng)時(shí)間的研究,總結(jié)出來(lái)了兩種方法,一種叫做避錯(cuò),就是使用正確的設(shè)計(jì)并且進(jìn)行相應(yīng)的質(zhì)量控制盡可能的避免系統(tǒng)產(chǎn)生錯(cuò)誤,防止將錯(cuò)誤引進(jìn)系統(tǒng)之中,但是在實(shí)際的運(yùn)行中難免會(huì)產(chǎn)生一些意料之外的事情,因此這種方法在實(shí)施起來(lái)有著很大的難度。另外一種就是容錯(cuò),在系統(tǒng)中出現(xiàn)了某些硬件或者軟件的錯(cuò)誤的時(shí)候,系統(tǒng)能夠執(zhí)行規(guī)定的一組程序,或者說(shuō)這種程序不會(huì)因?yàn)橄到y(tǒng)的故障而被中斷或者在中途被修改,且其執(zhí)行的結(jié)果也不包含系統(tǒng)中的故障引起的差錯(cuò)。
隨著科技的不斷發(fā)展,計(jì)算機(jī)技術(shù)的逐漸普及,設(shè)備的安全性以及可靠性逐漸的引起了越來(lái)越多的人的重視,因此計(jì)算機(jī)服務(wù)器系統(tǒng)的容錯(cuò)技術(shù)十分重要。當(dāng)系統(tǒng)的內(nèi)部出現(xiàn)故障的時(shí)候,通過(guò)容錯(cuò)技術(shù)能夠消除故障產(chǎn)生的影響并且使系統(tǒng)最終仍然能夠給出正確的結(jié)果。按照時(shí)間進(jìn)行故障的劃分,故障可以分為以下幾種類型:永久性的故障、間歇性的故障以及偶然性的故障。隨著計(jì)算機(jī)的硬件技術(shù)的不斷發(fā)展,容錯(cuò)計(jì)算機(jī)的系統(tǒng)開(kāi)銷逐漸的降低,同時(shí)糾錯(cuò)的速度變得越來(lái)越快。而軟件方面的容錯(cuò),對(duì)于硬件不會(huì)提出過(guò)高的要求。
2容錯(cuò)技術(shù)概述
容錯(cuò)指的是計(jì)算機(jī)系統(tǒng)的一個(gè)或者多個(gè)關(guān)鍵的部件發(fā)生故障或者將要發(fā)生故障的時(shí)候,仍然能夠保持正常的工作而不影響其正確結(jié)果的一種性能或者是措施。容錯(cuò)往往是使用榮譽(yù)的方法來(lái)對(duì)故障及西寧消除的,因此冗余技術(shù)是計(jì)算機(jī)的容錯(cuò)技術(shù)的基礎(chǔ),一般情況下冗余技術(shù)可以分為以下的幾種類型。
2.1硬件冗余
這種冗余技術(shù)指的是通過(guò)增加一定的硬件設(shè)備的方式來(lái)檢測(cè)或者屏蔽一些故障。硬件冗余中可以將其再細(xì)化分為部分冗余和完全冗余兩種主要的方式,對(duì)于完全冗余的方式來(lái)看,可以按照工作方式的不同而將其劃分為熱備、冷備、溫備以及雙工等四種工作方式。
在機(jī)器處于熱備工作方式時(shí),兩個(gè)互為冗余的計(jì)算機(jī)系統(tǒng)都是處于加電的工作狀態(tài)的,但是熱備的計(jì)算機(jī)系統(tǒng)對(duì)于系統(tǒng)的處理結(jié)果不會(huì)輸出。在主計(jì)算機(jī)系統(tǒng)發(fā)生故障的時(shí)候,熱備計(jì)算機(jī)系統(tǒng)直接的接手主系統(tǒng)開(kāi)始進(jìn)行工作,在系統(tǒng)的故障修復(fù)完畢以后,熱備的機(jī)器又再次的處于備用的狀態(tài)。
與此相對(duì)的,冷備工作方式和熱備工作方式存在一定的差異,冷備工作方式的備用計(jì)算機(jī)系統(tǒng)沒(méi)有進(jìn)行加電,當(dāng)主機(jī)發(fā)生故障的時(shí)候冷備機(jī)器才會(huì)進(jìn)行接手,在故障完成以后冷備機(jī)器又會(huì)重新的變成備用機(jī)器。
而溫備的機(jī)器的工作方式則是冗余的兩個(gè)系統(tǒng)都是處于加電的狀態(tài)的,其中一個(gè)正在工作,另外一個(gè)處于等待的狀態(tài)。如果工作的機(jī)器發(fā)生了故障,那么另外一個(gè)機(jī)器就能夠直接進(jìn)行接手工作,并且在故障結(jié)束以后主機(jī)繼續(xù)工作,備用的機(jī)器繼續(xù)變?yōu)閭溆脿顟B(tài)。
雙工的工作方式,指的就是在這個(gè)方式中兩個(gè)機(jī)器處于同時(shí)工作的狀態(tài),并且將處理結(jié)果進(jìn)行輸出,在發(fā)生了故障以后,對(duì)兩個(gè)機(jī)器的結(jié)果進(jìn)行比較之后再進(jìn)行輸出,這樣能夠盡可能的降低故障造成的損傷。
2.2軟件冗余
軟件冗余指的是為了能夠檢測(cè)或者屏蔽軟件中的一些差錯(cuò),增加一些在正常運(yùn)行的時(shí)候不需要的軟件方法。和硬件系統(tǒng)的故障研究相比較而言,對(duì)于軟件的錯(cuò)誤進(jìn)行糾正顯得更加的困難,目前為止還沒(méi)有一個(gè)相對(duì)來(lái)說(shuō)比較成熟的、完整的方法來(lái)檢測(cè)系統(tǒng)中軟件的可靠性、安全性。目前來(lái)看,比較普遍使用的對(duì)于軟件故障的處理方式有兩種,一種是前向回復(fù),一種是后向恢復(fù)。
其中,前向恢復(fù)主要指的是將計(jì)算機(jī)的當(dāng)前計(jì)算狀態(tài)繼續(xù)的進(jìn)行下去,然后將之后的狀態(tài)能夠正確的和當(dāng)前的狀態(tài)連接起來(lái)使其具有連貫性。目前來(lái)看使用的前向恢復(fù)狀態(tài)的方法主要是N-versionProgramming方法,這種方法的基本思路是由不同的團(tuán)隊(duì)開(kāi)始進(jìn)行獨(dú)立化的設(shè)計(jì),然后通過(guò)使用不同的方法以及不同的設(shè)計(jì)語(yǔ)言,在不同的開(kāi)發(fā)環(huán)境下使用不同的目的來(lái)展示同一個(gè)結(jié)果,這樣就能夠減少在各個(gè)版本的軟件上出現(xiàn)相關(guān)的錯(cuò)誤的可能性。
而后向錯(cuò)誤指的就是在計(jì)算機(jī)的軟件出現(xiàn)故障以后,將計(jì)算機(jī)的系統(tǒng)狀態(tài)恢復(fù)到之前的某一個(gè)正確的狀態(tài)上。目前來(lái)看比較普遍的一種后向恢復(fù)方式主要有恢復(fù)塊方法以及防衛(wèi)式程序設(shè)計(jì)兩種方式。其中恢復(fù)塊方法就是在同一個(gè)功能下,有主塊和多個(gè)后備塊,當(dāng)主塊運(yùn)行的時(shí)候如果沒(méi)有通過(guò)最后的驗(yàn)收測(cè)試,那么就指令第一個(gè)后備塊開(kāi)始進(jìn)行工作,使其吃呢個(gè)為主塊然后以此為順序直到所有的后備塊都被耗盡。在這樣的方式下,設(shè)計(jì)出來(lái)的主塊以及后備塊應(yīng)該盡可能的保持相對(duì)的獨(dú)立性,這樣就不會(huì)因?yàn)橹鲏K出現(xiàn)了錯(cuò)誤而導(dǎo)致后備塊的運(yùn)行受到影響。
2.3信息冗余
所謂信息冗余指的就是除了實(shí)現(xiàn)正常的功能所需要的信息之外,額外的增加一些信息來(lái)保證程序能夠正常的運(yùn)行并且得到正確的結(jié)果。這些冗余的信息往往被加入到原始的數(shù)據(jù)中,加入的信息通常情況下包括檢錯(cuò)以及糾錯(cuò)這兩種編碼。我們使用加入的檢測(cè)編碼來(lái)自動(dòng)的檢測(cè)軟件中具有的錯(cuò)誤,同時(shí)使用糾錯(cuò)的編碼來(lái)對(duì)錯(cuò)誤進(jìn)行糾正。
2.4時(shí)間冗余
時(shí)間冗余就是通過(guò)額外的增加一定的時(shí)間來(lái)完成系統(tǒng)的某些功能,這些附加的時(shí)間主要能夠用來(lái)進(jìn)行故障的檢測(cè)、或者故障的屏蔽上面。
目前來(lái)看,比較流行的時(shí)間榮譽(yù)方式有兩種,一種是RSHW,這種冗余方式主要是對(duì)一組數(shù)據(jù)執(zhí)行同一種指令,然后通過(guò)在相同的硬件上在不同的時(shí)間片對(duì)這些指令進(jìn)行執(zhí)行。另一種時(shí)間冗余方式則是使用數(shù)據(jù)延遲設(shè)備將其與表決電路結(jié)合到一起,將一次數(shù)據(jù)處理的輸出結(jié)果進(jìn)行不同的延遲大小的設(shè)置,使其能夠復(fù)制成多個(gè)版本并且在表決器中進(jìn)行比較。
2.5簡(jiǎn)單的雙機(jī)備份
這種方式主要在20世紀(jì)30年代的時(shí)候得到了廣泛的應(yīng)用,通過(guò)使用雙處理機(jī)或者雙機(jī)的方式來(lái)進(jìn)行容錯(cuò)。根據(jù)系統(tǒng)的工作情況的不同,又可以將之微熱備份和冷備份這兩種情況。
其中,雙機(jī)熱備份技術(shù)是一種將軟硬件很好地結(jié)合起來(lái)的一種方案,這種方案主要包括兩臺(tái)服務(wù)器以及一個(gè)恭喜那個(gè)的磁盤陣列柜,還有相應(yīng)的程序。在這種技術(shù)中,有著專業(yè)的人員對(duì)數(shù)據(jù)進(jìn)行管理,并且這些數(shù)據(jù)是存放在這些磁盤陣列柜中,這樣能夠使得數(shù)據(jù)十分安全。在工作的時(shí)候,數(shù)據(jù)通過(guò)中央儲(chǔ)存器進(jìn)行讀取以及存儲(chǔ),這樣在實(shí)際的工作過(guò)程中及時(shí)主服務(wù)器出現(xiàn)了一定的問(wèn)題,也能夠有另外一臺(tái)服務(wù)器理科的啟動(dòng)并且同時(shí)接替該主服務(wù)器的工作,從而保證了系統(tǒng)能夠安全的運(yùn)行。為了保證這個(gè)系統(tǒng)能夠正常的運(yùn)行工作,這個(gè)系統(tǒng)中運(yùn)用了兩臺(tái)服務(wù)器,兩臺(tái)服務(wù)器之間互相的發(fā)送通訊信號(hào)從而保證聯(lián)系,服務(wù)器在之前會(huì)約定好一定的時(shí)間間隔進(jìn)行信號(hào)的發(fā)送,如果某一臺(tái)服務(wù)器沒(méi)有及時(shí)的發(fā)送信息,那么另外一臺(tái)服務(wù)器就可以判斷出這臺(tái)服務(wù)器存在問(wèn)題,系統(tǒng)的相應(yīng)管理軟件就會(huì)迅速的啟動(dòng)備用的系統(tǒng),這樣能夠維持系統(tǒng)不間斷的正常的進(jìn)行工作。
而雙機(jī)熱備份方案中還可以進(jìn)一步的區(qū)分出這樣的三種模式:雙機(jī)熱備模式、雙機(jī)互備模式、雙機(jī)雙工模式。
(1)雙機(jī)熱備模式,在這樣的模式中存在著主服務(wù)器以及備用的服務(wù)器,這兩臺(tái)服務(wù)器能夠同時(shí)的對(duì)數(shù)據(jù)進(jìn)行寫入,這樣就保證了數(shù)據(jù)的同步。而當(dāng)主服務(wù)器發(fā)生故障的時(shí)候,備用的服務(wù)器就能夠及時(shí)的被激活,從而保證了服務(wù)器始終運(yùn)行嗎,確保了系統(tǒng)的安全。
(2)雙機(jī)互備模式。這種模式下,系統(tǒng)中存在兩臺(tái)服務(wù)器并且這兩臺(tái)服務(wù)器能夠同時(shí)的運(yùn)行兩個(gè)獨(dú)立的應(yīng)用,在運(yùn)行的時(shí)候無(wú)論哪一臺(tái)的服務(wù)器發(fā)生故障,另外一臺(tái)服務(wù)器都能夠接管這一臺(tái)服務(wù)器的內(nèi)容并且繼續(xù)工作下去,這樣就保證了的服務(wù)能夠連續(xù)的運(yùn)行,因此有著很高的安全性,并且這種模式下對(duì)于服務(wù)器有著較高的配置要求。
(3)雙機(jī)雙工模式。在這種模式下,即有兩臺(tái)服務(wù)器,這兩臺(tái)服務(wù)器能夠同時(shí)的工作,并且運(yùn)行的程序是一樣的,這樣能夠保證負(fù)載較為均衡。
2.6操作系統(tǒng)支持的雙機(jī)備份
這種冗余方式進(jìn)行容錯(cuò)主要是在20世紀(jì)70年代的中期出現(xiàn)的,是一種軟件和硬件結(jié)構(gòu)的容錯(cuò)方式,這種容錯(cuò)方法是在操作系統(tǒng)的層次上的,支持聯(lián)機(jī)的維修,也就是說(shuō)故障部分在退出以后能夠及時(shí)的進(jìn)行維修并且在維修之后重新的投入到運(yùn)行中,這個(gè)過(guò)程中對(duì)于正常的正在運(yùn)行的程序不會(huì)產(chǎn)生影響。系統(tǒng)的容錯(cuò)是在操作系統(tǒng)下進(jìn)行控制的,每一個(gè)處理機(jī)上面都保持了所有的系統(tǒng)資源的狀態(tài)的表格,以及本機(jī)和其他機(jī)所具有的相關(guān)工作的工作進(jìn)程。
2.7單機(jī)容錯(cuò)
所謂單機(jī)容錯(cuò)指的就是在系統(tǒng)中只使用一臺(tái)服務(wù)器來(lái)進(jìn)行一種高性能的容錯(cuò)。這種方式和其他的容錯(cuò)技術(shù)相比較而言所具有的最大優(yōu)勢(shì)就是能夠把發(fā)貨所能故障的模塊自動(dòng)的分離出去,并且把故障的模塊和備用的模塊記性調(diào)換,在故障的部分被排除以后,使用相應(yīng)的容錯(cuò)技術(shù)能夠保證系統(tǒng)繼續(xù)的運(yùn)行下去。為了實(shí)現(xiàn)真正的容錯(cuò),單機(jī)的容錯(cuò)服務(wù)器能夠通過(guò)系統(tǒng)內(nèi)部的所有冗余的部件進(jìn)行同步的運(yùn)行。并且由于單機(jī)的容錯(cuò)方式實(shí)際上只需要使用一臺(tái)服務(wù)器,而雙機(jī)的容錯(cuò)模式則需要使用兩臺(tái)服務(wù)器,因此單機(jī)的容錯(cuò)方式相對(duì)表而言投入更少一些。目前市場(chǎng)上使用的單機(jī)容錯(cuò)產(chǎn)品除了有著較好的兼容性之外,還能夠支持主板等關(guān)鍵性的硬件的熱插拔,用起來(lái)十分的方便。
3結(jié)論
隨著計(jì)算機(jī)技術(shù)逐漸的成為了人們的工作學(xué)習(xí)生活中不可或缺的一部分,人們對(duì)于計(jì)算機(jī)的依賴程度的增加,計(jì)算機(jī)服務(wù)器的故障性問(wèn)題也逐漸的引起了越來(lái)越多的人的重視,其直接的影響到計(jì)算機(jī)的性能,并且如果沒(méi)有設(shè)置相應(yīng)的容錯(cuò)方案很有可能產(chǎn)生巨大的財(cái)產(chǎn)損失。因此,本文主要在介紹了計(jì)算機(jī)容錯(cuò)的必要性的基礎(chǔ)上,對(duì)于現(xiàn)有的計(jì)算機(jī)服務(wù)器系統(tǒng)的容錯(cuò)技術(shù)進(jìn)行了詳細(xì)的分析,希望能夠起到一定的參考價(jià)值,促進(jìn)未來(lái)計(jì)算機(jī)服務(wù)器系統(tǒng)的容錯(cuò)技術(shù)的進(jìn)一步發(fā)展。
參考文獻(xiàn)
[1] 史飛.關(guān)于計(jì)算機(jī)服務(wù)器系統(tǒng)的容錯(cuò)技術(shù)[J].中小企業(yè)管理與科技(下旬刊),2016,(06):171-172.
[2] 吳輝明.關(guān)于計(jì)算機(jī)服務(wù)器系統(tǒng)的容錯(cuò)技術(shù)[J].電子測(cè)試,2015,(12):60-61.
[3] 吳玥.淺析計(jì)算機(jī)服務(wù)器系統(tǒng)的容錯(cuò)技術(shù)[J].無(wú)線互聯(lián)科技,2014,(11):67-68.
[4] 許敏.分布式文件系統(tǒng)容錯(cuò)機(jī)制的研究與實(shí)現(xiàn)[D].電子科技大學(xué),2012.
[5] 楚國(guó)鋒.基于LoadRunner的高端容錯(cuò)機(jī)性能評(píng)測(cè)系統(tǒng)的研究與設(shè)計(jì)[D].哈爾濱工業(yè)大學(xué),2010.
[6] 陳匯遠(yuǎn).計(jì)算機(jī)信息系統(tǒng)安全技術(shù)的研究及其應(yīng)用[D].鐵道部科學(xué)研究院,2004.
[7] 邵艷明.集群視頻服務(wù)器容錯(cuò)與流共享策略研究[D].華中科技大學(xué),2004.
[8] 谷國(guó)棟.容錯(cuò)冗余技術(shù)研究及其在水利樞紐工程計(jì)算機(jī)監(jiān)控系統(tǒng)中的應(yīng)用[D].河海大學(xué),2001.
[9] 莊蓉茹.集群系統(tǒng)下的通信系統(tǒng)開(kāi)發(fā)[D].昆明理工大學(xué),2001.