葉繼強(qiáng)
【摘 要】本文通過分析在企業(yè)有關(guān)于混用新舊服務(wù)器配置高可用群集的問題,通過采用VMware EVC技術(shù)解決這類問題的途徑,并描述了在中核蘇閥科技實(shí)業(yè)股份有限公司(以下簡稱“公司”)案例中應(yīng)用虛擬化平臺技術(shù)構(gòu)建服務(wù)器高可用群集(HA)的過程,研究合理的服務(wù)虛擬化應(yīng)用平臺構(gòu)架。通過實(shí)踐證明,基于VMware EVC技術(shù)能將新舊服務(wù)器組成群集,計算資源得以共享,使虛擬機(jī)應(yīng)用服務(wù)可以進(jìn)行故障自動遷移,提高了服務(wù)器的使用率和穩(wěn)定性,降低了公司在服務(wù)器設(shè)備資金的投入成本和管理成本。
【關(guān)鍵詞】服務(wù)器高可用群集;虛擬化技術(shù);VMware EVC
中圖分類號: TP302文獻(xiàn)標(biāo)識碼: A 文章編號: 2095-2457(2019)33-0011-002
DOI:10.19694/j.cnki.issn2095-2457.2019.33.005
0 引言
隨著企業(yè)的不斷擴(kuò)大,企業(yè)服務(wù)器數(shù)量也越來越多。大多服務(wù)器只運(yùn)行一個系統(tǒng)應(yīng)用,公司采用虛擬化技術(shù)很好的解決服務(wù)器計算資源閑置的問題,為了使服務(wù)器計算資源能夠互通共享,就需要配置服務(wù)器高可用群集。
中核蘇閥科技實(shí)業(yè)股份有限公司(以下簡稱“公司”)信息中心現(xiàn)有信息化建設(shè)起步較早,公司的信息化應(yīng)用系統(tǒng)分布在不同的物理服務(wù)器上,數(shù)據(jù)環(huán)境基本按照“一臺服務(wù)器、一個操作系統(tǒng)、一種應(yīng)用”的模式不斷搭建擴(kuò)展。公司信息中心機(jī)房現(xiàn)有物理服務(wù)器數(shù)量三十余臺,但由于服務(wù)器建設(shè)周期不同,服務(wù)器新舊程度存在差異,服務(wù)器CPU也有不同平臺等級的問題,對配置服務(wù)器高可用群集帶來困難。通過配置增強(qiáng)型vMotion兼容性 (Enhanced vMotion Compatibility,EVC)功能確保群集內(nèi)服務(wù)器的兼容性,可以解決新舊服務(wù)器混用問題。
1 需求分析與方案設(shè)計
公司的虛擬化平臺搭建的是VMware vSphere平臺,服務(wù)器搭載的是ESXi6.0u3版本系統(tǒng);計算資源方面,服務(wù)器品牌均為HPE服務(wù)器,但服務(wù)器系列跨度較大,從GEN7至GEN10各個系列的新舊服務(wù)器混用;存儲方面,公司使用萬兆網(wǎng)絡(luò)連接存儲聚合與數(shù)據(jù)群集,為服務(wù)器群集高可用提供基礎(chǔ)。原服務(wù)器群集使用VCSA進(jìn)行統(tǒng)一管理,雖然應(yīng)用數(shù)據(jù)都與計算資源服務(wù)器分離,但由于服務(wù)器兼容性問題,無法使用在線遷移功能,計算資源故障后也無法自動遷移至可用服務(wù)器上。
由于VMware vSphere平臺虛擬硬件規(guī)格對于啟用高可用群集的CPU有兼容性要求,本次重新構(gòu)建了一個以3臺ESXi6.5U2的主機(jī)的群集并新建vCenter進(jìn)行管理。VMware EVC具有多種模式,不同的模式所提供的功能有所不同,由服務(wù)器硬件規(guī)格差異所支持的模式也有所不同,當(dāng)具有不同EVC模式支持的主機(jī),創(chuàng)建成同一個群集時,其EVC選型支持以最小的一臺主機(jī)的最后一項(xiàng)為準(zhǔn)。
群集必須最低具有三臺ESXi主機(jī),本次挑選了2臺HPE DL380 GEN10和1臺DL580 GEN9的服務(wù)器進(jìn)行構(gòu)建群集。雖然服務(wù)器CPU型號不同,但所支持的EVC模式是基本相同的:
新建的服務(wù)器群集不對公司原有網(wǎng)絡(luò)環(huán)境產(chǎn)生改變,連接公司原有萬兆存儲網(wǎng)絡(luò)并掛載存儲聚合卷,3臺服務(wù)器分別連接公司核心網(wǎng)絡(luò)交換機(jī)與災(zāi)備網(wǎng)絡(luò)交換機(jī),完成群集網(wǎng)絡(luò)組建。
在不影響各個應(yīng)用服務(wù)連續(xù)性和終端環(huán)境穩(wěn)定性的前提下,使用VEEAM災(zāi)備系統(tǒng)對公司OA應(yīng)用、ERP應(yīng)用、視頻會議系統(tǒng)原有系統(tǒng)進(jìn)行全環(huán)境備份,并直接恢復(fù)至新的虛擬群集中;在新群集上新建備用域及DNS服務(wù)器,使全新安裝的虛擬機(jī)環(huán)境能在域環(huán)境故障情況下具有一定的容錯能力。
2 服務(wù)器高可用群集EVC配置實(shí)踐過程
VMware的高可用必須先創(chuàng)建一個群集,然后用主機(jī)填充該群集,并在建立故障切換保護(hù)之前配置EVC設(shè)置。群集構(gòu)建的基礎(chǔ)是vSphere和vCenter Server的搭建。為3臺服務(wù)器安裝相同版本的EXSi6.5U2后,選取第一臺搭建VCSA至服務(wù)器本地磁盤上后,確定群集的節(jié)點(diǎn),配置節(jié)點(diǎn)的網(wǎng)絡(luò)連接并掛載共享存儲。
根據(jù)公司原核心網(wǎng)絡(luò)VLAN的劃分,為3臺服務(wù)器分配配置三個虛擬交換機(jī),一個作為生產(chǎn)網(wǎng)絡(luò)、一個作為虛擬機(jī)動態(tài)遷移vMotion網(wǎng)絡(luò)、另一個作為備份網(wǎng)絡(luò)。通過連接萬兆網(wǎng)絡(luò)添加兩個存儲聚合卷,完成服務(wù)器高可用群集的底層要求。在建立好網(wǎng)絡(luò)架構(gòu)后,將3臺服務(wù)器添加到群集并完成高可用配置。
按EVC設(shè)置規(guī)則,不同型號的主機(jī)按所支持的EVC模式的最后一項(xiàng)為準(zhǔn),在群集配置中選擇為Intel 主機(jī)啟用EVC,并將VMware EVC模式選為Intel "Broadwell"Generation模式,此模式可提供事務(wù)性同步擴(kuò)展、監(jiān)控模式訪問防護(hù)、多精度帶進(jìn)位加指令擴(kuò)展、PREFETCHW和RDSEED等CPU功能,缺點(diǎn)是只支持同等級或更高CPU規(guī)格的服務(wù)器加入群集。在開啟了EVC后配置開啟vSphere HA,在出現(xiàn)服務(wù)器故障下自動重新啟動虛擬機(jī)應(yīng)用服務(wù),并設(shè)置預(yù)留一定比例的群集資源來定義故障切換容量。
在完成了群集的基礎(chǔ)搭建后,通過vCenter對群集的計算資源進(jìn)行整合,并為要遷移的虛擬機(jī)應(yīng)用系統(tǒng)預(yù)估劃分計算容量和空間容量。通過不同的遷移方式,將虛擬機(jī)遷移至群集上:
通過使用公司VEEAM災(zāi)備系統(tǒng),將原有虛擬機(jī)系統(tǒng)環(huán)境、應(yīng)用服務(wù)、數(shù)據(jù)全部備份并封裝成獨(dú)立的備份單元,在群集上直接將備份單元恢復(fù)至虛擬環(huán)境里來。完成整體環(huán)境恢復(fù)后,恢復(fù)網(wǎng)絡(luò)服務(wù)并測試應(yīng)用功能。
在群集上新建備用域與DNS服務(wù)器,并為群集上的虛擬機(jī)配置可切換的備用地址,斷開群集與主域之間的網(wǎng)絡(luò)連接,測試備用域與DNS的可用性。
公司視頻會議系統(tǒng)驗(yàn)證使用的是USB電子狗,由于該USB設(shè)備無法進(jìn)行自動遷移,需在群集上為虛擬機(jī)與主機(jī)之前建立反向規(guī)則,將視頻會議應(yīng)用虛擬機(jī)綁定至規(guī)定的主機(jī),使其不進(jìn)行自動故障遷移。
服務(wù)器高可用群集配置全部完成后,對群集故障遷移能力進(jìn)行測試,關(guān)閉群集中任意一臺主機(jī),群集檢測到主機(jī)故障并自動對虛擬機(jī)進(jìn)行了計算資源遷移,應(yīng)用服務(wù)完全不受虛擬機(jī)的在線遷移影響,做到客戶端無感知故障自動遷移。而視頻會議應(yīng)用由于虛擬機(jī)規(guī)則的設(shè)置,沒有進(jìn)行自動遷移。
4 效益分析
通過服務(wù)器高可用群集EVC配置,有效地發(fā)揮了公司虛擬化平臺,使新舊服務(wù)器可以混用在同一群集中,大幅提高了舊服務(wù)器的利用率,有效遏制了物理服務(wù)器數(shù)量的增長。
減少了物理服務(wù)器的采購數(shù)量,如不使用EVC技術(shù),那每次服務(wù)器購置就必須按群集主機(jī)基數(shù)進(jìn)行采購,現(xiàn)在按需對服務(wù)器數(shù)量進(jìn)行更新,對中小型機(jī)房的服務(wù)器采購節(jié)省了大量更新設(shè)備的經(jīng)費(fèi),同時也延長了老服務(wù)器的可用時間。
利用服務(wù)器高可用群集,實(shí)現(xiàn)了服務(wù)器之間的動態(tài)資源調(diào)配和高可用功能,可使群集有能力進(jìn)行主機(jī)故障自動遷移虛擬機(jī)應(yīng)用服務(wù),保證了應(yīng)用系統(tǒng)業(yè)務(wù)的連續(xù)性。
通過配置EVC技術(shù),成功將原有3臺新舊混搭的物理服務(wù)器構(gòu)建成一個高可用群集,虛擬化應(yīng)用效果較好。通過服務(wù)器虛擬化群集整合,既滿足了公司應(yīng)用系統(tǒng)穩(wěn)定運(yùn)行的需求,又有效控制了公司服務(wù)器設(shè)備購置和管理的成本。