劉雪松 劉智慧
1.內(nèi)蒙古廣播電視臺內(nèi)蒙古 呼和浩特 010050
2.呼倫貝爾市微波管理總站 內(nèi)蒙古 呼倫貝爾 021008
在自動化播出應(yīng)用越來越廣泛的情況下,播出系統(tǒng)更多的使用了服務(wù)器和工作站。為了保障播出系統(tǒng)運(yùn)行不間斷,避免單節(jié)點(diǎn)故障產(chǎn)生,服務(wù)器系統(tǒng)普遍會設(shè)置主備雙機(jī)模式。故障轉(zhuǎn)移群集技術(shù)能在故障發(fā)生時自動將業(yè)務(wù)切換至運(yùn)行正常的服務(wù)器,避免人工操作不及時、不正確,從而保證業(yè)務(wù)運(yùn)行不中斷。
故障轉(zhuǎn)移群集是一種高可用性的基礎(chǔ)結(jié)構(gòu)層,是由微軟視窗操作系統(tǒng)提供的針對服務(wù)器系統(tǒng)的一項(xiàng)服務(wù)。故障轉(zhuǎn)移群集系統(tǒng)可由最多64個物理節(jié)點(diǎn)或8000個虛擬機(jī)組成,每臺服務(wù)器相當(dāng)于一個冗余節(jié)點(diǎn)。整個群集系統(tǒng)允許部分節(jié)點(diǎn)掉線、故障或損壞而不影響整個系統(tǒng)的正常運(yùn)作,群集角色會得到主動監(jiān)視以驗(yàn)證它們是否正常工作。如果不工作,則會重新啟動這些角色或?qū)⑵湟苿拥狡渌?jié)點(diǎn),其他節(jié)點(diǎn)接管發(fā)生故障的服務(wù)器的過程通常稱為“故障轉(zhuǎn)移”。
群集技術(shù)使用對外一個虛擬地址,內(nèi)部結(jié)構(gòu)不對外顯示。這樣進(jìn)行了切換也不會被其他設(shè)備察覺,真正做到無縫切換,不影響業(yè)務(wù)運(yùn)行。如果一臺服務(wù)器變?yōu)椴豢捎脿顟B(tài),則另一臺服務(wù)器自動接管發(fā)生故障的服務(wù)器并繼續(xù)處理任務(wù)。群集中的每臺服務(wù)器在群集中至少有一臺其他服務(wù)器確定為其備用服務(wù)器。故障轉(zhuǎn)移群集可應(yīng)用于最新的Windows server2012、2016等操作系統(tǒng)。
故障轉(zhuǎn)移群集技術(shù)需要基于域的管理模式,所有服務(wù)器在相同的工作域內(nèi)。通過“見證機(jī)制”來監(jiān)測各節(jié)點(diǎn)運(yùn)行狀態(tài),通過“仲裁機(jī)制”判斷由哪個節(jié)點(diǎn)接管。下面介紹仲裁機(jī)制和見證機(jī)制。
群集的仲裁由投票元素的數(shù)量確定,這些投票元素必須是活動群集成員身份的一部分,以供該群集正確啟動或繼續(xù)運(yùn)行。默認(rèn)情況下,群集中的每個節(jié)點(diǎn)都具有單個仲裁投票。此外,仲裁見證具有其他單個仲裁投票,可以為每個群集配置一個仲裁見證。仲裁見證可以是指定的磁盤資源或文件共享資源。群集是否有可正常工作的仲裁,是由活動群集成員身份中的大部分投票元素確定的。
在現(xiàn)行視窗系統(tǒng)中提供了三種仲裁配置:典型設(shè)置、添加或更改仲裁見證和高級仲裁配置和見證選擇。
2.1.1 典型設(shè)置
該群集自動將投票分配到每個節(jié)點(diǎn)并且動態(tài)管理節(jié)點(diǎn)投票。如果它適用于你的群集,并且有可用的群集共享存儲,該群集將選擇磁盤見證。建議在大多數(shù)情況下使用此選項(xiàng),因?yàn)槿杭浖詣舆x擇可為群集提供最高可用性的仲裁和見證配置。
2.1.2 添加或更改仲裁見證
可以添加、更改或刪除見證資源??梢耘渲梦募蚕砘虼疟P見證。該群集自動將投票分配到每個節(jié)點(diǎn)并且動態(tài)管理節(jié)點(diǎn)投票。
2.1.3 高級仲裁配置和見證選擇
僅當(dāng)具有有關(guān)配置仲裁的特定于應(yīng)用程序或特定于站點(diǎn)的要求時才選擇該選項(xiàng)??梢孕薷闹俨靡娮C、添加或刪除節(jié)點(diǎn)投票,以及選擇該群集是否動態(tài)管理節(jié)點(diǎn)投票。默認(rèn)情況下,將投票權(quán)分配給所有節(jié)點(diǎn),并動態(tài)管理節(jié)點(diǎn)投票。
典型設(shè)置是一種默認(rèn)的方式,只有我們明確要使用哪種見證方式時才會選擇高級配置。從仲裁方式,我們可以看到見證機(jī)制對于如何配置仲裁方式具有影響,而具有怎樣的硬件配置和管理方式又會影響見證方式的選擇。
判斷節(jié)點(diǎn)狀態(tài)需要具有一個磁盤,所有節(jié)點(diǎn)通過能否讀寫該磁盤判斷節(jié)點(diǎn)狀態(tài)。如果所有節(jié)點(diǎn)都可以看到該磁盤,則通常建議使用磁盤見證。當(dāng)需要考慮使用復(fù)制存儲的多站點(diǎn)災(zāi)難恢復(fù)時,建議使用文件共享見證。僅當(dāng)存儲系統(tǒng)支持從所有站點(diǎn)到復(fù)制存儲的讀寫訪問時,才可以使用復(fù)制存儲配置磁盤見證。
在實(shí)際配置過程中,對于群集系統(tǒng)內(nèi)節(jié)點(diǎn)沒有單獨(dú)存儲系統(tǒng)的情況下會采用文件共享式見證,常見于數(shù)據(jù)庫服務(wù)器、控制服務(wù)器、應(yīng)用服務(wù)器等;對于節(jié)點(diǎn)配有單獨(dú)存儲系統(tǒng)的可以采用磁盤見證方式,常見于文件存儲服務(wù)器、音視頻錄制服務(wù)器等。
文件共享式見證可以將共享文件設(shè)置在群集系統(tǒng)外的共同連接服務(wù)器,例如可設(shè)置在同一域內(nèi)的域控服務(wù)器,這樣可以提供較高的安全性。磁盤見證方式則應(yīng)當(dāng)將共享文件設(shè)置在群集內(nèi)的單獨(dú)存儲磁盤上,這樣可以擺脫其他服務(wù)器的影響,并且單獨(dú)存儲系統(tǒng)穩(wěn)定性較好,這樣可以保證見證的有效性。
故障轉(zhuǎn)移群集技術(shù)在廣播播出系統(tǒng)的應(yīng)用主要針對兩大類服務(wù)器。第一類是數(shù)據(jù)庫服務(wù)器、應(yīng)用控制類服務(wù)器,例如矩陣控制服務(wù)器、檢測系統(tǒng)數(shù)據(jù)庫、制播網(wǎng)數(shù)據(jù)庫和制播網(wǎng)應(yīng)用服務(wù)器等。第二類就是制播網(wǎng)系統(tǒng)音頻服務(wù)器、監(jiān)測系統(tǒng)音視頻慢錄服務(wù)器等。
第一類服務(wù)器都是沒有單獨(dú)存儲磁盤,需要采取第三方服務(wù)器提供共享文件。
圖1 數(shù)據(jù)庫系統(tǒng)群集圖示
圖1是數(shù)據(jù)庫A和B做群集,域控服務(wù)器提供見證。這樣的方式不但要求域控服務(wù)器始終運(yùn)行正常,也要求相互連接的局域網(wǎng)保持通暢才能正常切換。所以整個網(wǎng)絡(luò)作為一個整體需要全面保障,日常維護(hù)不應(yīng)只針對關(guān)鍵設(shè)施要對所有相關(guān)設(shè)備進(jìn)行觀察,才能保證系統(tǒng)運(yùn)行正常。
第二類服務(wù)器都是有單獨(dú)存儲磁盤的,磁盤可以提供見證。圖2是視頻慢錄服務(wù)器A和B組成群集,同時它們又通過存儲區(qū)域網(wǎng)絡(luò)連接著共同的存儲陣列。
圖2 存儲系統(tǒng)群集圖示
兩個服務(wù)器都可以訪問這個陣列。這樣在存儲陣列上建立一片區(qū)域進(jìn)行見證,就可以驗(yàn)證雙方是否正常。這樣的網(wǎng)絡(luò)結(jié)構(gòu)不受整體域網(wǎng)絡(luò)的影響,可以在群集內(nèi)部自行進(jìn)行切換,而且存儲整列由于采用冗余技術(shù)穩(wěn)定性也更好。應(yīng)該可以說是一種更穩(wěn)定的方式。具體要采用哪種方式見證還要依據(jù)具體的硬件條件和安全性的要求進(jìn)行配置。