王依群,王劍新
?
虛擬化技術(shù)在數(shù)據(jù)中心遷移中的應(yīng)用研究
王依群,王劍新
(哈爾濱電氣集團(tuán)有限公司,哈爾濱 150040)
云計算、虛擬化技術(shù)的快速發(fā)展,推動大型企業(yè)紛紛在基礎(chǔ)架構(gòu)上進(jìn)行彈性部署、云化。哈電集團(tuán)2015年江北數(shù)據(jù)中心投用,以數(shù)據(jù)中心遷移為契機(jī),充分考慮現(xiàn)有服務(wù)器資源,搭建企業(yè)內(nèi)部虛擬化平臺,對現(xiàn)有系統(tǒng)進(jìn)行虛擬化改造,并在遷移過程中直接遷移至云端,既保證了數(shù)據(jù)和系統(tǒng)的安全、快速、穩(wěn)定遷移,同時對現(xiàn)有基礎(chǔ)架構(gòu)進(jìn)行了升級,提升了數(shù)據(jù)資源的集約共享能力,做到服務(wù)的快速部署和響應(yīng),提升了系統(tǒng)的穩(wěn)定性。
虛擬化;數(shù)據(jù)中心;遷移;基礎(chǔ)架構(gòu)升級
哈爾濱電氣集團(tuán)公司由于企業(yè)發(fā)展需要,于2015年在江北科研基地新建了數(shù)據(jù)中心機(jī)房,需要在總部搬遷前將數(shù)據(jù)中心遷移至新機(jī)房。同時,由于近幾年企業(yè)信息化的推進(jìn),新系統(tǒng)上線頻繁,新建系統(tǒng)同時增加一套服務(wù)器設(shè)備的模式已滿足不了系統(tǒng)快速部署的要求,單機(jī)系統(tǒng)負(fù)載不足造成一定的資源浪費(fèi)。同時,公司業(yè)務(wù)對信息化的依賴導(dǎo)致對基礎(chǔ)架構(gòu)可靠性要求越來越高[1]。云計算、虛擬化的技術(shù)發(fā)展及業(yè)界實(shí)踐,使得我們認(rèn)為在機(jī)房遷移過程中同時采用虛擬化技術(shù),將現(xiàn)有系統(tǒng)遷移虛擬化環(huán)境運(yùn)行,將業(yè)務(wù)中斷時間大幅縮短,遷移效率大大提高,數(shù)據(jù)安全性得到極大保障。對服務(wù)器資源進(jìn)行統(tǒng)籌安排,提升基礎(chǔ)環(huán)境可靠性,提高服務(wù)器存儲資源利用率,為日后打造彈性、可快速部署的信息化基礎(chǔ)環(huán)境提供架構(gòu)支撐[2]。
隨著企業(yè)信息化建設(shè)的快速推進(jìn),服務(wù)器、存儲等設(shè)備急劇增加,要求基礎(chǔ)架構(gòu)更加靈活、高效、反應(yīng)快速,對信息化基礎(chǔ)支撐能力提出了新的挑戰(zhàn)。隨著虛擬化、云計算技術(shù)的成熟,應(yīng)用的日益廣泛,很多企業(yè)IT部門已經(jīng)將自己的數(shù)據(jù)中心重塑為企業(yè)“私有云”。江北基地數(shù)據(jù)中心建設(shè),集團(tuán)信息化基礎(chǔ)支撐能力大幅提升,為建設(shè)企業(yè)私有云提供了有利條件。以機(jī)房搬遷為契機(jī),充分利用集團(tuán)現(xiàn)有計算資源,采用最新虛擬化、云計算技術(shù),搭建集團(tuán)云計算平臺,增強(qiáng)企業(yè)基礎(chǔ)支撐能力。
集團(tuán)現(xiàn)有基礎(chǔ)架構(gòu)為傳統(tǒng)經(jīng)典架構(gòu),每個信息系統(tǒng)對應(yīng)一臺數(shù)據(jù)庫服務(wù)器、一臺應(yīng)用服務(wù)器,每次系統(tǒng)實(shí)施都要經(jīng)歷硬件采購、基礎(chǔ)環(huán)境搭建等環(huán)節(jié),基礎(chǔ)架構(gòu)靈活性差。不同信息系統(tǒng)間的計算資源無法共享,造成計算資源浪費(fèi)。硬件資源沒有實(shí)現(xiàn)高可用,單臺服務(wù)器故障導(dǎo)致系統(tǒng)宕機(jī),可靠性差。
(1)通過搭建企業(yè)私有云,將企業(yè)現(xiàn)有計算、存儲資源進(jìn)行整合,充分利用現(xiàn)有硬件資源,減少硬件總成本投入,實(shí)現(xiàn)資源快速響應(yīng),做到計算資源服務(wù)的快速部署上線;
(2)系統(tǒng)動態(tài)分配計算資源與存儲,有效利用企業(yè)服務(wù)器資源,減少物理服務(wù)器數(shù)量;
(3)通過云計算高可用技術(shù),可實(shí)現(xiàn)物理服務(wù)器故障后虛擬服務(wù)器自動漂移,保障系統(tǒng)持續(xù)運(yùn)行服務(wù)不間斷。
(1)在機(jī)房遷移過程中,業(yè)務(wù)中斷時間越短越好,本次業(yè)務(wù)中斷目標(biāo)定在5天;
(2)遷移過程中,涉及企業(yè)財務(wù)、人事等核心數(shù)據(jù),要確保數(shù)據(jù)安全,保證核心數(shù)據(jù)不丟失;
(3)系統(tǒng)恢復(fù)運(yùn)行后,要確保虛擬化后的系統(tǒng)性能滿足業(yè)務(wù)需求,在最大并發(fā)數(shù)下能夠保證用戶體驗(yàn)良好;
(4)虛擬化后數(shù)據(jù)集中存儲于存儲中,要確保存儲故障后的數(shù)據(jù)安全。
建立一整套系統(tǒng)管理平臺,對私有云架構(gòu)進(jìn)行全面的管理。管理重點(diǎn)包括:
(1)虛擬資源池的平臺的搭建,支持異構(gòu)的虛擬化平臺
(2)虛擬資源池管理(包含虛擬機(jī)、虛擬存儲、虛擬網(wǎng)絡(luò))
通過系統(tǒng)管理平臺能夠讓虛擬機(jī)共享后端資源池中的資源,確保在群集中的主機(jī)均能有效支撐在這之上運(yùn)行的虛擬機(jī),如果主機(jī)資源有限或者出現(xiàn)故障,上面運(yùn)行的虛擬機(jī)就會遷移至有充足計算資源的主機(jī)上。同時通過服務(wù)管理平臺和門戶對用戶進(jìn)行快速服務(wù)交付。
(3)云平臺運(yùn)行狀態(tài)監(jiān)控
系統(tǒng)管理平臺可以在第一時間幫助管理員了解到虛擬終機(jī)資源耗用及監(jiān)控狀況,除了能夠提供主動預(yù)警服務(wù)之外,也可以在出現(xiàn)問題之后快速診斷問題,并可提供遠(yuǎn)程支持。
(4)私有云的安全性
除了存在信息安全泄露的遺患之外,還有可能出現(xiàn)病毒及惡意代碼問題,會影響整個私有云平臺及IT基礎(chǔ)架構(gòu)。本次項(xiàng)目中采用集中式虛擬機(jī)部署方式,統(tǒng)一部署防病毒軟件、制定統(tǒng)一的補(bǔ)丁及應(yīng)用程序分發(fā)策略、制定統(tǒng)一的密碼策略和IT安全策略等。
私有云整體架構(gòu)主要包括服務(wù)器虛擬化、資源池設(shè)計、服務(wù)器群集組設(shè)計、私有云平臺管理功能設(shè)計、軟硬件選擇等。(如圖1所示)
圖1 私有云整體架構(gòu)
私有云系統(tǒng)管理平臺部分,微軟Windows Server Hyper-V 及系統(tǒng)管理套件SystemCenter來構(gòu)建虛擬資源池,并進(jìn)行全面的私有云系統(tǒng)管理。
一期應(yīng)用Windows Server Hyper-V實(shí)現(xiàn)虛擬化,二期應(yīng)用SystemCenter 實(shí)現(xiàn)高效管理。
在硬件選擇方面主要會涉及以下三部分:
服務(wù)器:在架構(gòu)設(shè)計中,會建設(shè)3個高可用群集,分別對應(yīng)私有云系統(tǒng)、管理平臺和應(yīng)用業(yè)務(wù)系統(tǒng)。一期只建設(shè)應(yīng)用業(yè)務(wù)系統(tǒng)群集,Windows群集能夠?qū)崿F(xiàn)虛擬機(jī)的高可用性,一旦群集內(nèi)的某臺宿主服務(wù)器出現(xiàn)故障,可迅速的將虛擬機(jī)遷移到群集其他的節(jié)點(diǎn)上??紤]到服務(wù)器虛擬化對高可用性的要求,建議在該群集中,專門預(yù)留一到三個節(jié)點(diǎn)作為專門的備機(jī),以提供更高的高可用性。
存儲:考慮到要實(shí)現(xiàn)私有云平臺的高可用性和高性能,在存儲類型上建議使用IPSAN。根據(jù)對集團(tuán)現(xiàn)有存儲量統(tǒng)計為2TB,從可擴(kuò)展性角度考慮,需要存儲容量為10TB并實(shí)現(xiàn)RAID10,實(shí)際可用存儲容量為5TB。
一期需增加一臺10TB的IPSAN存儲。
私有云資源池由后端構(gòu)成群集組的宿主服務(wù)器構(gòu)成,形成計算資源的虛擬化池,提供給虛擬化管理平臺,虛擬桌面和虛擬服務(wù)器使用。在本方案中,后端虛擬機(jī)池由Windows Server 2012 Hyper-V來實(shí)現(xiàn),通過服務(wù)器虛擬化技術(shù)來支持上述虛擬機(jī)。
Hyper-V宿主服務(wù)器通過內(nèi)置在Windows Server 2012上的集群服務(wù)來構(gòu)建一個虛擬資源池,不同于單臺的Hyper-V宿主服務(wù)器,Hyper-V宿主服務(wù)器群集能夠?qū)崿F(xiàn):
可以將多臺宿主服務(wù)器的資源進(jìn)行整合,可以按照宿主服務(wù)器資源利用情況合理分配虛擬機(jī);
良好的擴(kuò)展性,如果原有數(shù)量的宿主服務(wù)器已經(jīng)存在性能瓶頸,計算資源已經(jīng)不能滿足要求,可以非常方便的添加新的宿主服務(wù)器到群集組中,從而擴(kuò)展虛擬機(jī)的支持?jǐn)?shù)量;
可有效提高虛擬機(jī)的高可用性,一旦群集組中某一臺宿主服務(wù)器出現(xiàn)故障或需要進(jìn)行定期運(yùn)行維護(hù)的時候,運(yùn)行在該宿主服務(wù)器上的虛擬機(jī)會平滑遷移到群集內(nèi)的其它宿主服務(wù)器上。
整個遷移過程分為4個階段,第1階段為前期準(zhǔn)備,包括將系統(tǒng)進(jìn)行備份、數(shù)據(jù)備份等內(nèi)容;第2階段為停機(jī)備份,將現(xiàn)有系統(tǒng)全面停止服務(wù),進(jìn)行系統(tǒng)虛擬化備份,同時服務(wù)器等設(shè)備下架、遷移;第3階段為系統(tǒng)恢復(fù)階段,將備份系統(tǒng)在新機(jī)房虛擬環(huán)境下啟動、復(fù)原、驗(yàn)證,設(shè)備遷移至新機(jī)房重新上架、恢復(fù),加入云環(huán)境;第4階段為系統(tǒng)集成測試上線,對所有系統(tǒng)進(jìn)行集成測試并進(jìn)入運(yùn)行環(huán)境,業(yè)務(wù)人員測試。
此階段主要有3部分要點(diǎn):
(1)在新機(jī)房環(huán)境中測試部分系統(tǒng)運(yùn)行,對于一些應(yīng)用范圍比較小的系統(tǒng)比如IT內(nèi)部系統(tǒng),提前遷移,測試環(huán)境可用性和整個流程;
(2)系統(tǒng)數(shù)據(jù)備份要盡量預(yù)留多份,可以在新環(huán)境中保存兩份,確保數(shù)據(jù)安全;
(3)遷移方案要進(jìn)行細(xì)化,責(zé)任到人,并進(jìn)行系統(tǒng)推演,明確時間節(jié)點(diǎn),盡量做到周密細(xì)致。
在實(shí)際遷移過程中,本階段無差異,按照預(yù)定計劃完成。
停機(jī)備份階段要點(diǎn)如下:
(1)與業(yè)務(wù)部門充分溝通,保證停機(jī)對現(xiàn)有業(yè)務(wù)沖擊最小,且數(shù)據(jù)恢復(fù)點(diǎn)得到雙方簽字確認(rèn);
(2)備份過程要盡量快速,同時開展機(jī)房設(shè)備搬遷工作,要做到安全有序,防止發(fā)生系統(tǒng)電源切斷等意外;
(3)下架過程要盡量選用安全可控工作人員,熟悉電子設(shè)備拆卸、搬運(yùn)流程,保證設(shè)備的安全性。
系統(tǒng)恢復(fù)階段要點(diǎn)如下:
(1)系統(tǒng)恢復(fù)要有優(yōu)先級,對于重要業(yè)務(wù)系統(tǒng)如財務(wù)、郵件系統(tǒng)要優(yōu)先恢復(fù)并盡快進(jìn)行系統(tǒng)可用測試,為萬一發(fā)生的系統(tǒng)故障處理預(yù)留充足時間;
(2)對于系統(tǒng)故障要有一定的預(yù)期,公司網(wǎng)站系統(tǒng)由于服務(wù)器運(yùn)行已經(jīng)10余年,且由于面對外網(wǎng)開發(fā),無法進(jìn)入虛擬化環(huán)境,老化設(shè)備搬遷極大可能出現(xiàn)故障,故需與設(shè)備廠商提前聯(lián)系,確保設(shè)備故障后工程師和備品備件快速入場恢復(fù);
(3)系統(tǒng)恢復(fù)要嚴(yán)謹(jǐn)細(xì)致,對于系統(tǒng)網(wǎng)絡(luò)等配置要按照操作手冊準(zhǔn)確無誤,節(jié)省排查系統(tǒng)配置錯誤時間;
(4)對于虛擬化環(huán)境的性能要實(shí)時監(jiān)控,系統(tǒng)加入增多,對共享存儲及網(wǎng)絡(luò)會產(chǎn)生持續(xù)壓力,實(shí)時監(jiān)控系統(tǒng)的處理能力,出現(xiàn)過載情況要及時進(jìn)行處理,增加相應(yīng)設(shè)備容量。
集成測試要點(diǎn)如下:
(1)集成測試主要考察系統(tǒng)的整體運(yùn)行狀況,在系統(tǒng)運(yùn)行穩(wěn)定的情況下,需要開展系統(tǒng)遷移測試,將一臺服務(wù)器關(guān)機(jī),測試系統(tǒng)故障發(fā)生后漂移能力;
(2)業(yè)務(wù)人員測試盡量選擇相同時段進(jìn)行,可同時測試系統(tǒng)的并發(fā)處理能力,為后期系統(tǒng)運(yùn)維及擴(kuò)容提供相應(yīng)數(shù)據(jù)。
整體遷移過程安全、快速,無重大故障發(fā)生,比預(yù)期7天的系統(tǒng)時間縮短到4天,保證了數(shù)據(jù)的安全性。
以機(jī)房遷移為契機(jī),通過搭建服務(wù)器高可用集群,可以將企業(yè)現(xiàn)有計算、存儲資源進(jìn)行整合,充分利用現(xiàn)有硬件資源,減少硬件總成本投入,實(shí)現(xiàn)資源快速響應(yīng)。做到系統(tǒng)遷移的快速、安全、可靠,計算資源服務(wù)的快速部署上線,系統(tǒng)動態(tài)分配計算資源與存儲,有效利用企業(yè)服務(wù)器資源,可極大減少物理服務(wù)器數(shù)量??蓪?shí)現(xiàn)物理服務(wù)器故障后虛擬服務(wù)器自動漂移,保障系統(tǒng)持續(xù)運(yùn)行服務(wù)不間斷。項(xiàng)目未來將對現(xiàn)有集群進(jìn)行整合,通過部署私有云管理系統(tǒng),搭建企業(yè)私有云,使哈電集團(tuán)基礎(chǔ)架構(gòu)邁向云時代。
[1] 周鐵成. 虛擬化技術(shù)在數(shù)據(jù)中心架構(gòu)中的應(yīng)用研究[J]. 現(xiàn)代計算機(jī), 2009.
[2] 林秀. 虛擬化技術(shù)在企業(yè)數(shù)據(jù)中心中的應(yīng)用[J]. 電信快報, 2011.
The Application Research of Virtualization Technology in the Migration of Data Center
WANG Yiqun, WANG Jianxin
(Harbin Electric Corporation, Harbin 150040, China)
The rapid development of cloud computing and virtualization technology drives large enterprises to deploy cloud on the infrastructure. HPEC Jiangbei 2015 data center put into use, the data center migration as an opportunity to fully consider the existing server resources, build the enterprise virtualization platform, virtual reform of the existing system, and in the migration process of direct migration to virtualized enviroment, both to ensure the safe, rapid and stable data transfer. At the same time, the existing infrastructure to upgrade, enhance the intensive data sharing ability, to achieve the quick deployment of service and rapid response, and enhance the stability of the system.
virtualization; data center; migration; infrastructure upgrading
TK730
A
1000-3983(2018)02-0077-04
2017-11-11
王依群(1965-),1988年畢業(yè)于西安交通大學(xué)工程力學(xué)專業(yè),現(xiàn)從事信息化管理工作,高級工程師。