沈 強,楊 健,王家亮
(1.中國民航信息網(wǎng)絡(luò)股份有限公司,北京 100105; 2.中國民航大學 計算機科學與技術(shù)學院,天津 300300)
民航云計算環(huán)境下的SLA保證策略研究
沈 強1,楊 健1,王家亮2
(1.中國民航信息網(wǎng)絡(luò)股份有限公司,北京 100105; 2.中國民航大學 計算機科學與技術(shù)學院,天津 300300)
為了營造民航業(yè)應(yīng)用云計算的環(huán)境,讓航空公司、機場等用戶將關(guān)鍵的業(yè)務(wù)遷移到云計算平臺,細化服務(wù)品質(zhì),實現(xiàn)服務(wù)協(xié)議的精細化愈加重要。云計算資源的池化對信息系統(tǒng)底層資源的管理提出了更高要求,基于云計算的高效負載、服務(wù)等級的資源調(diào)度策略將有助于交付更符合民航業(yè)云用戶需求的平臺。為此,設(shè)計并建立了以業(yè)務(wù)系統(tǒng)為核心,以業(yè)務(wù)系統(tǒng)SLA定義與監(jiān)控、業(yè)務(wù)系統(tǒng)資源和服務(wù)使用、業(yè)務(wù)系統(tǒng)自動化容量管理和資源調(diào)配為主要功能的資源管理體系,設(shè)計了動態(tài)負載均衡策略和資源調(diào)度策略并實現(xiàn)了面向SLA的業(yè)務(wù)管理系統(tǒng)。實際生產(chǎn)運行結(jié)果表明,所建立的虛擬機動態(tài)遷移技術(shù)實現(xiàn)了負載均衡,保證了SLA的動態(tài)資源分配過程建模及所實現(xiàn)的業(yè)務(wù)系統(tǒng)自動化管理均具有較好的應(yīng)用效果。
云計算;民航;服務(wù);資源;服務(wù)等級協(xié)議;負載均衡;動態(tài)遷移
隨著社會經(jīng)濟的迅速發(fā)展和民航信息服務(wù)市場容量的擴大,民航服務(wù)產(chǎn)業(yè)不斷拓展,民航系統(tǒng)也逐步向更集中、更統(tǒng)一、更簡便的云計算平臺轉(zhuǎn)變。隨著公有云服務(wù)的快速發(fā)展,云提供商日益增多,這也給用戶選擇云服務(wù)時帶來諸如安全、隱私以及可靠等方面的挑戰(zhàn)。相比過去傳統(tǒng)的集中緊耦合的大型主機系統(tǒng),云平臺在帶來靈活性的同時也帶來了系統(tǒng)高穩(wěn)定性、大規(guī)模密集交易性能的挑戰(zhàn),研究云提供商所保證服務(wù)的質(zhì)量、滿足民航云用戶的需求是關(guān)鍵問題[1]。文中將針對云計算環(huán)境下航空業(yè)信息化服務(wù)水平的技術(shù)保證手段進行探討。
為了保障云消費者所獲得服務(wù)的質(zhì)量,同時提升云計算提供商的信譽,達到維護云用戶和云服務(wù)提供商雙方權(quán)益的目的,需要云消費者和云計算服務(wù)提供商簽訂關(guān)于服務(wù)質(zhì)量的協(xié)議來約定細節(jié),這個合同稱為服務(wù)等級協(xié)議(Service Level Agreement,SLA)。目前云計算提供商主要依靠兩種處理方式:一種是基于云用戶需求優(yōu)化配置[2]現(xiàn)有資源;另一種是通過增加、擴展現(xiàn)有資源的方式來保障SLA[3]。其中,優(yōu)化配置現(xiàn)有資源基礎(chǔ)又存在兩種形式:一是基于多租戶服務(wù)請求的優(yōu)先級調(diào)度;二是云服務(wù)的部署優(yōu)化和應(yīng)用遷移。
民航業(yè)信息系統(tǒng)向來以大規(guī)模、高性能、高穩(wěn)定著稱,面對云計算這種帶有規(guī)模大、集群式架構(gòu)特性的服務(wù)器部署模式,云計算服務(wù)器等異構(gòu)的基礎(chǔ)設(shè)施和服務(wù)類型的多樣性容易造成系統(tǒng)中業(yè)務(wù)承載不均衡,重載節(jié)點響應(yīng)速度急劇下降導(dǎo)致系統(tǒng)無法提供服務(wù),容易造成SLA違約。同時在云計算環(huán)境下,數(shù)據(jù)中心的服務(wù)基礎(chǔ)資源的位置,主機的資源可用性、響應(yīng)能力等因素容易使云數(shù)據(jù)中心在不同位置的服務(wù)資源提供服務(wù)的成本有較大區(qū)別[4-5]。因此部署高效的負載均衡策略和資源調(diào)度策略對于保障云計算SLA至關(guān)重要。
在動態(tài)資源管理框架及相應(yīng)的調(diào)度策略基礎(chǔ)上[6-7],針對民航信息系統(tǒng)的特征,基于選擇適合民航云計算服務(wù)的遷移集合及如何實施遷移兩個維度,優(yōu)化改進了最小遷移次數(shù)(Minimization of Migrations,MM)策略,保證了云計算平臺服務(wù)運行過程中的SLA,同時又降低了因遷移帶來的額外能源消耗。
云計算平臺中往往利用虛擬化技術(shù)實現(xiàn)計算資源、網(wǎng)絡(luò)資源等資源管理的便捷性。虛擬化技術(shù)的最新發(fā)展趨勢是支持虛擬機的動態(tài)遷移,而不影響運行于其上的應(yīng)用程序。因此,在服務(wù)繁忙時,將資源利用率超過上限閾值物理機上的部分虛擬機遷出,以確保不違反云用戶和云計算服務(wù)提供商簽訂的SLA。但是,關(guān)于虛擬機的具體遷移實施,需要合理的策略,否則,很容易產(chǎn)生額外的能耗,甚至會造成違反服務(wù)的SLA。
動態(tài)遷移(Live Migration),是指在保證虛擬機中各服務(wù)正常運行的同時,將虛擬機系統(tǒng)從一臺宿主物理主機移動到另一臺宿主物理主機的過程[8]。
虛擬機運行所需的鏡像文件和相關(guān)配置文件都存放在共享存儲中,如SAN(Storage Area Network)或NAS(Network Attached Storage)[9]。在遷移過程中,只需將虛擬機內(nèi)存執(zhí)行狀態(tài)遷移到宿主物理主機中即可完成遷移。通過共享存儲,可以確保不對云用戶業(yè)務(wù)造成影響,基于虛擬機的動態(tài)遷移技術(shù)實現(xiàn)零宕機條件下的服務(wù)器維護。方便系統(tǒng)管理員能夠動態(tài)、靈活地利用云計算平臺的計算能力。在HA中支持網(wǎng)絡(luò)及存儲雙路心跳,在發(fā)生HA時,支持被隔離服務(wù)器的自動重啟提供服務(wù)。
設(shè)計虛擬機動態(tài)遷移策略的關(guān)鍵是處理好與虛擬機遷移相關(guān)的服務(wù)器內(nèi)存、CPU運行狀態(tài)、網(wǎng)絡(luò)連接和虛擬設(shè)備狀態(tài)、存儲設(shè)備等物理基礎(chǔ)資源[10-12]。目前比較常見的虛擬機動態(tài)遷移算法是內(nèi)存預(yù)拷貝(pre copy)遷移算法。最具代表性的是VMWare和XenSource分別推出的VMotion[13]遷移以及Xen Motion[14]遷移。這兩種遷移方式都適用于局域網(wǎng)并且有相似的方案用于內(nèi)存和網(wǎng)絡(luò)連接的遷移。其中,預(yù)拷貝遷移的主要工作過程如下:虛擬機監(jiān)控器將所有內(nèi)存頁標記為臟頁面并拷貝到目的主機上;然后迭代拷貝。這里迭代是指采用幾輪增量同步,上一輪傳輸過程中被修改過的頁面在本次遷移。當需要傳輸?shù)膬?nèi)存小于閾值或者迭代次數(shù)超過設(shè)置的最大迭代次數(shù)時停止迭代。最后,掛起源主機上的虛擬機,拷貝CPU狀態(tài)和最后一輪產(chǎn)生的臟頁面到目的主機,恢復(fù)目的主機上的虛擬機。民航公共云平臺動態(tài)遷移方案里實現(xiàn)了預(yù)拷貝遷移方法。如果目的主機出現(xiàn)故障,則終止遷移過程,繼續(xù)在源主機上運行虛擬機。
預(yù)拷貝遷移的主要目的在于實現(xiàn)了虛擬機的動態(tài)遷移,同時可以確保民航公共云服務(wù)平臺的高可靠性,保證民航云用戶的服務(wù)等級。
云計算環(huán)境中的資源調(diào)度是指請求任務(wù)在多個數(shù)據(jù)中心尋找滿足目標的資源。根據(jù)資源調(diào)度時間的不同分為在線調(diào)度和批調(diào)度。在線調(diào)度是指根據(jù)任務(wù)到達情況,實時尋找合適的可利用資源,如果無法找到,就等待或者拒絕。目前的云計算環(huán)境中,基于在線調(diào)度策略的研究主要集中在以滿足用戶的各種資源請求為目的,卻較少關(guān)注云計算服務(wù)提供商的利益。需要從在線調(diào)度的方向研究有效的任務(wù)調(diào)度算法,使得在滿足用戶SLA的前提下,實現(xiàn)云計算資源提供商的收益最大化。對于LaaS層的調(diào)度,需要考慮的是,云計算環(huán)境中因服務(wù)器的位置、計算等資源的可用性等客觀因素會造成不同資源提供的成本存在較大差異。面對接踵而至的任務(wù),不同的任務(wù)SLA規(guī)定的QoS指標也不相同,LaaS層的調(diào)度策略既要考慮滿足任務(wù)的SLA,又要確保接收任務(wù)所獲得的收益是最大的。
在云環(huán)境下,將云用戶的動態(tài)需求表示成用戶請求,采用過程化模擬方法,將云計算資源提供服務(wù)的過程模擬成虛擬機的分配過程,確保云計算服務(wù)供應(yīng)商在遵循SLA協(xié)議的前提下達到利潤最大化,增強云計算服務(wù)提供商的競爭力。其中,云計算資源分配過程如下:
云環(huán)境中可以對虛擬化技術(shù)抽象后的計算、網(wǎng)絡(luò)、存儲等基礎(chǔ)設(shè)施資源進行統(tǒng)一集中化管理。實現(xiàn)了邏輯計算資源、邏輯存儲資源以及邏輯網(wǎng)絡(luò)資源的監(jiān)控功能、管理功能和調(diào)度功能,提高了云計算平臺中邏輯資源的自動化管理水平。
鑒于用戶對云計算平臺中的計算資源和存儲資源的需要差異大、變化大,所以需要預(yù)先建立標準的計算資源模板和存儲資源模板。在云計算環(huán)境中,可以通過虛擬化技術(shù),實時動態(tài)地分配、更改用戶云主機的邏輯計算資源和邏輯存儲資源。
云計算環(huán)境內(nèi),可以為不同的用戶或者用戶內(nèi)的不同部門之間分配安全的邏輯隔離網(wǎng)絡(luò),實現(xiàn)邏輯網(wǎng)絡(luò)資源分配的靈活性。通過云平臺的網(wǎng)絡(luò)組件agent,實現(xiàn)對用戶內(nèi)部不同網(wǎng)絡(luò)之間的策略控制和對外部的策略控制。
而資源分配與高可用模塊分配的最大目的是要準確地計算和分布業(yè)務(wù)系統(tǒng)所需要的各種資源,包括硬件資源和軟件資源,以保證業(yè)務(wù)系統(tǒng)所依賴的整個IT基礎(chǔ)架構(gòu)鏈條盡量冗余,且冗余組件間完全沒有相互影響。其冗余設(shè)計如圖1所示。在進行分布策略設(shè)計時,主要考慮如下:
(1)任何一個軟硬件組件都是不可靠的,均可能會出現(xiàn)故障。
圖1 冗余設(shè)計圖
(2)任何兩個組件只要存在聯(lián)系,即有可能發(fā)生故障傳染。
(3)在特定業(yè)務(wù)場景下,如要求嚴格事物一致性的業(yè)務(wù)場景,對無法實現(xiàn)完全冗余的資源(如數(shù)據(jù)庫集群組件本身)必須經(jīng)過嚴格的可靠性評估,選擇經(jīng)過長時間運行檢驗,可靠性可以達到99.99%的組件;對其中涉及的組件,還需進行運行管理加強設(shè)計,即在不配運維資源時(如監(jiān)控資源),運維資源也要做到冗余設(shè)計,以保證可以迅速發(fā)現(xiàn)和修復(fù)故障。
資源分配與高可用保證模塊的一個理想分配結(jié)果如圖2所示。一個業(yè)務(wù)系統(tǒng)將運行在兩個完全隔離的IT基礎(chǔ)架構(gòu)之上,可見,任何一個架構(gòu)中的任何一個組件的故障都不會影響業(yè)務(wù)系統(tǒng)的正常運行。
圖2 資源分配圖
同時,資源分配與高可用保證模塊還負責實現(xiàn)業(yè)務(wù)系統(tǒng)對資源分布的一些其他要求,如統(tǒng)一業(yè)務(wù)系統(tǒng)的資源盡可能集中等。因此,在具體實現(xiàn)上,資源分配模塊如圖2所示,主要由定位和分布兩部分功能構(gòu)成。定位是根據(jù)用戶的各種輸入,獲得滿足用戶要求的各種資源,作為用戶最終使用資源的備選;而分布則是根據(jù)多個分配策略,確定用戶最終將使用哪幾個具體的底層資源。但無論選擇何種分布策略,資源分配均將首先保證用戶所使用的一組資源必須分布在不用的底層資源上,從而保證了任何一個底層資源的失效不會對用戶整體的服務(wù)質(zhì)量產(chǎn)生影響。
對傳統(tǒng)云計算中心的資源調(diào)度策略進行分析,提出了云平臺管理系統(tǒng)的模型及系統(tǒng)實現(xiàn),以保證SLA的服務(wù)水平。
為更加靈活地管理業(yè)務(wù)系統(tǒng),適應(yīng)不同的業(yè)務(wù)系統(tǒng)分類場景,業(yè)務(wù)系統(tǒng)采用多級結(jié)構(gòu),分為“產(chǎn)品線”-“模塊”-“業(yè)務(wù)系統(tǒng)”三個維護級別,并為各個級別的維護定義簡單高效的維護流程,具體業(yè)務(wù)管理流程體系如圖3所示。
流程的基本原則為:
(1)每個企業(yè)的超級管理員為整個業(yè)務(wù)系統(tǒng)管理體系負責,控制所有的業(yè)務(wù)系統(tǒng)架構(gòu)及屬性變更。
(2)每個級別的業(yè)務(wù)對象均需定義若干不同功能的管理角色,負責該業(yè)務(wù)對象不同方面的維護和管理工作,如:總體負責、維護工作等。同時,為支持簡單的管理體系,不同的角色可以由同一個人來擔任。
(3)上級業(yè)務(wù)結(jié)構(gòu)的管理者可以定義下級業(yè)務(wù)的結(jié)構(gòu)和屬性,但其定義的變更需要超級管理員審批,以減少業(yè)務(wù)定義的隨意性,保證業(yè)務(wù)系統(tǒng)的精簡和相對穩(wěn)定。
圖3 在線用戶管理
如圖3所示,產(chǎn)品線中的企業(yè)超級管理員負責產(chǎn)品線結(jié)構(gòu)的增刪改以及屬性的變更;模塊中的企業(yè)超級管理員和產(chǎn)品線經(jīng)理同時負責模塊結(jié)構(gòu)的增刪改,同時企業(yè)超級管理員還負責變更的審核;業(yè)務(wù)系統(tǒng)中,企業(yè)超級管理員和產(chǎn)品線經(jīng)理也共同負責模塊結(jié)構(gòu)的增刪改,同時企業(yè)超級管理員還負責變更的審核。
通過虛擬機動態(tài)遷移技術(shù)實現(xiàn)負載均衡,以及對保證SLA資源調(diào)度的動態(tài)資源分配過程進行優(yōu)化建模,實現(xiàn)面向SLA的業(yè)務(wù)管理系統(tǒng)。
民航云計算環(huán)境下的SLA保證策略非常重要,通過研究設(shè)計動態(tài)負載均衡策略和資源調(diào)度策略并實現(xiàn)面向SLA的業(yè)務(wù)管理系統(tǒng),各個在線企業(yè)可以很容易地梳理自己的應(yīng)用系統(tǒng),提高了用戶標準化管理各個業(yè)務(wù)系統(tǒng)的SLA水平,實現(xiàn)了對平臺所提供的各種資源的高效、有序管理,降低了管理和資源使用成本,提升了資源使用效率。
[1] 史玉良,王 捷.一種多租戶云數(shù)據(jù)存儲緩存管理機制[J].計算機研究與發(fā)展,2014,51(11):2528-2537.
[2] 趙秀濤,張 斌,張長勝.一種基于服務(wù)選取的SBS云資源優(yōu)化分配方法[J].軟件學報,2015,26(4):867-885.
[3] Castro P H P,Barreto V L,Corrêa S L,et al.A joint CPU-RAM energy efficient and SLA-compliant approach for cloud data centers[J].Computer Networks,2016,94:1-13.
[4] 羅軍舟,金嘉暉,宋愛波,等.云計算:體系架構(gòu)與關(guān)鍵技術(shù)[J].通信學報,2011,32(7):3-21.
[5] 譚一鳴,曾國蓀,王 偉.隨機任務(wù)在云計算平臺中能耗的優(yōu)化管理方法[J].軟件學報,2012,23(2):266-278.
[6] Antonescu A F,Braun T.Simulation of SLA-based VM-scaling algorithms for cloud-distributed applications[J].Future Generation Computer Systems,2016,54:260-273.
[7] Serrano D,Bouchenak S,Kouki Y,et al.SLA guarantees for cloud services[J].Future Generation Computer Systems,2016,54:233-246.
[8] Dastjerdi A V,Buyya R.An autonomous time-dependent SLA negotiation strategy for cloud computing[J].Computer Journal,2015,58(11):3202-3216.
[9] Marudhadevi D,Dhatchayani V N,Sriram V S S.A trust evaluation model for cloud computing using service level agreement[J].Computer Journal,2015,58(10):2225-2232.
[10] 劉鵬程,陳 榕.面向云計算的虛擬機動態(tài)遷移框架[J].計算機工程,2010,36(5):37-39.
[11] 常德成,徐高潮.虛擬機動態(tài)遷移方法[J].計算機應(yīng)用研究,2013,30(4):971-976.
[12] 熊安萍,徐曉龍.基于內(nèi)存迭代拷貝的Xen虛擬機動態(tài)遷移機制研究[J].計算機科學,2013,40(8):63-65.
[13] Guan Haibing,Yao Jianguo,Qi Zhengwei.Energy-efficient SLA guarantees for virtualized GPU in cloud gaming[J].IEEE Transactions on Parallel and Distributed Systems,2015,26(9):2434-2443.
[14] Alrebeish F,Bahsoon R.Implementing design diversity using portfolio thinking to dynamically and adaptively manage the allocation of web services in the cloud[J].IEEE Transactions on Cloud Computing,2015,3(3):318-331.
Research on SLA Assurance Strategy for Cloud Computing Environment of Civil Aviation
SHEN Qiang1,YANG Jian1,WANG Jia-liang2
(1.China TravelSky Holding Company,Beijing 100105,China; 2.College of Computer Science and Technology,Civil Aviation University of China,Tianjin 300300,China)
In order to create the cloud computing environment for the aviation industry,making the key business of airlines,airports and other users moved to cloud computing platform,it becomes more and more important to implement the refinement of service agreements.The higher request has been proposed for cloud computing resource pooling to the underlying resource management of information system.A reasonable resource scheduling strategy based on cloud computation with efficient workloads and high service grade is helpful to deliver the platform more suitable to the requests of civil aviation cloud users.Therefore,a resource management system has been designed and established which considers business system as key and takes SLA definition of business system and its monitoring,automatic management of the system capacity and resource allocation as its functions.The dynamic load balancing strategy and resource scheduling strategy has been designed and thus the business management system for SLA has been implemented.The results of practical production operations show that balancing load has been realized with the virtual machine live migration technology to guarantee the better effects for both the modeling of dynamic resource allocation process and the realized automatic management of business system.
cloud computing;civil aviation;services;resources;SLA;load balancing;live migration
2016-05-24
2016-09-07 網(wǎng)絡(luò)出版時間:2017-04-28
國家發(fā)改委云計算工程(發(fā)改辦高技[2014]1799)
沈 強(1974-),男,研究方向為新技術(shù)在民航信息系統(tǒng)的應(yīng)用。
http://kns.cnki.net/kcms/detail/61.1450.TP.20170428.1702.014.html
TP391
A
1673-629X(2017)06-0156-04
10.3969/j.issn.1673-629X.2017.06.032