杜家兵 ,劉勝強(qiáng) ,龐維欣 ,郇長武 ,于 洋
(1.佛山供電局,廣東佛山,528000;2 煙臺海頤軟件股份有限公司,山東煙臺,264000)
為做好智能電網(wǎng)下云計(jì)算技術(shù)的研究和應(yīng)用工作,推進(jìn)佛山供電局智能電網(wǎng)云計(jì)算信息管理平臺的搭建,實(shí)現(xiàn)主機(jī)、存儲層“私有云”應(yīng)用架構(gòu)和資源的最大化共享及云計(jì)算技術(shù)的有效應(yīng)用,實(shí)現(xiàn)不同IT 廠家、相同IT 廠家不同IT 設(shè)備的統(tǒng)一管理,構(gòu)建穩(wěn)定、安全、可靠和彈性擴(kuò)展的數(shù)據(jù)存儲基礎(chǔ)架構(gòu),為智能電網(wǎng)各應(yīng)用系統(tǒng)提供動態(tài)的云資源服務(wù),結(jié)合佛山供電局實(shí)際建設(shè)和應(yīng)用,提出云計(jì)算服務(wù)全生命周期管理思路。
佛山供電局智能電網(wǎng)云計(jì)算信息管理平臺采用全新IBM輕量級的基礎(chǔ)架構(gòu)云計(jì)算平臺,能夠有效支持Power、X86 架構(gòu)服務(wù)器以及各種刀片服務(wù)器,提供多種虛擬化技術(shù),可與現(xiàn)有的虛擬化或非虛擬化基礎(chǔ)設(shè)施配合工作。作為完全集成的軟件堆棧,可以通過基礎(chǔ)架構(gòu)云計(jì)算平臺使用戶從搭建起平臺虛擬化環(huán)境的“云就緒”狀態(tài)逐步過渡到真正的“云”環(huán)境。
智能電網(wǎng)云計(jì)算平臺主要實(shí)現(xiàn)內(nèi)容有:創(chuàng)建映像,即將實(shí)際存儲簡化映像存儲,采用標(biāo)準(zhǔn)操作系統(tǒng)創(chuàng)建新的系統(tǒng)映像,實(shí)現(xiàn)物理機(jī)或在不同的系統(tǒng)之間的映像轉(zhuǎn)換節(jié)省存儲空間;部署虛擬機(jī),通過資源和虛擬機(jī)隔離確保信息訪問安全,實(shí)現(xiàn)動態(tài)容量擴(kuò)展加快新應(yīng)用交付使用等;云操作實(shí)現(xiàn),通過管理授權(quán)給云用戶使用,自動化批復(fù),實(shí)現(xiàn)標(biāo)準(zhǔn)化部署和配置,提供直觀界面進(jìn)服務(wù)過程進(jìn)行管理。
智能電網(wǎng)云計(jì)算信息管理平臺根據(jù)邏輯層次,可以分為物理資源層、邏輯資源層、虛擬化管理平臺層、云計(jì)算服務(wù)管理層。云計(jì)算平臺基礎(chǔ)架構(gòu)如圖1 所示。
圖1 云計(jì)算平臺基礎(chǔ)架構(gòu)
物理資源層包括服務(wù)器、存儲系統(tǒng)和網(wǎng)絡(luò)等物理資源;邏輯資源層包括邏輯計(jì)算資源的分配,邏輯磁盤分配和管理,網(wǎng)絡(luò)VLAN 管理等虛擬化后的邏輯資源,而邏輯資源實(shí)際是物理資源跟虛擬化技術(shù)的結(jié)合,以便提供更好的可擴(kuò)展性、可分配性和可調(diào)度性;虛擬化管理平臺層是邏輯資源管理、分配、調(diào)度、監(jiān)控與計(jì)量的平臺,提供了針對邏輯計(jì)算資源、邏輯存儲資源和邏輯網(wǎng)絡(luò)資源的監(jiān)控、管理和調(diào)度功能,實(shí)現(xiàn)邏輯資源的自動化管理,為用戶門戶和管理層提供了按需分配的引擎;云計(jì)算服務(wù)管理層是云平臺的用戶門戶,對于使用云平臺服務(wù)的終端用戶,看不到也不需要了解物理或邏輯資源層的構(gòu)成和虛擬化管理平臺層的運(yùn)作,只需關(guān)注虛擬化的資源,使用虛擬化的資源。
云計(jì)算平臺基礎(chǔ)架構(gòu)提供了一套從底層硬件到上層服務(wù)的完整端到端的云管理能力,核心管理軟件底層具備有分別針對Power 和X86 服務(wù)器資源的管理能力,可分別通過PowerVM和VMWare vCenter 接入虛擬化后的計(jì)算資源,從而向上層云管理平臺提供動態(tài)資源。在管理層提供了豐富的各種面向服務(wù)的功能模塊和完整的服務(wù)生命周期管理能力,服務(wù)產(chǎn)品管理、服務(wù)申請、服務(wù)審批、服務(wù)供應(yīng)、服務(wù)變更和服務(wù)回收。
基于輕量級基礎(chǔ)架構(gòu)云計(jì)算解決方案,通過采用硬件設(shè)備虛擬化、軟件版本標(biāo)準(zhǔn)化、系統(tǒng)管理自動化和服務(wù)流程一體化等手段,建設(shè)一個(gè)以服務(wù)為中心的云計(jì)算運(yùn)行平臺,資源的使用方式從專有獨(dú)占方式轉(zhuǎn)變成完全共享方式,運(yùn)行環(huán)境可以自動部署和調(diào)整資源分配,實(shí)現(xiàn)資源隨需掌控,從而為管理者和應(yīng)用者建立一個(gè)基于業(yè)務(wù)的資源共享、服務(wù)集中和自動化的開放數(shù)據(jù)中心。
通過硬件資源、系統(tǒng)業(yè)務(wù)及數(shù)據(jù)的全面整合和梳理,將智能電網(wǎng)下龐大、眾多、分散的存儲環(huán)境統(tǒng)一納入到云計(jì)算管理平臺的管理之下。在實(shí)際建設(shè)中,將電力營銷管理、計(jì)量自動化、生產(chǎn)管理、人力資源等系統(tǒng)的海量數(shù)據(jù)納入到云計(jì)算平臺中,依托當(dāng)前的硬件資源并適當(dāng)擴(kuò)展,實(shí)現(xiàn)異地容災(zāi)、數(shù)據(jù)備份,實(shí)現(xiàn)云計(jì)算技術(shù)與海量數(shù)據(jù)處理技術(shù)的融合,為智能電網(wǎng)相關(guān)應(yīng)用系統(tǒng)提供動態(tài)的云資源服務(wù)。
在智能電網(wǎng)云計(jì)算平臺實(shí)踐建設(shè)中,要遵循以下原則:高可靠性原則,即平臺可不間斷持續(xù)可用;資源靈活分配原則,即可根據(jù)業(yè)務(wù)需求能夠靈活進(jìn)行資源動態(tài)分配;可擴(kuò)展性原則,即可以動態(tài)伸縮,滿足應(yīng)用和用戶規(guī)模的持續(xù)增長;開放性原則,即可以支持跨平臺統(tǒng)一管理,支持多種虛擬化技術(shù)以及異構(gòu)存儲的統(tǒng)一管理。
基于以上原則,智能電網(wǎng)云計(jì)算平臺的建設(shè)需根據(jù)用戶群及業(yè)務(wù)模式的不同,建設(shè)中要重點(diǎn)考慮的問題也不一樣,可根據(jù)分步走的規(guī)劃,特別是在初次搭建云平臺的過程中,要重視以下步驟和要點(diǎn):構(gòu)建“資源池”,云計(jì)算平臺采用池化資源管理。“池”是公共資源,資源并不屬于某一個(gè)應(yīng)用或業(yè)務(wù),而是根據(jù)具體要求,從公共資源池中劃分資源;采用服務(wù)管理流程化、自動化的方式集中管理,減少人為的參與,為平臺的規(guī)?;瘮U(kuò)展提供條件,業(yè)務(wù)系統(tǒng)作為云計(jì)算平臺的用戶,不需要關(guān)心資源的來源及原理,只需要登陸系統(tǒng)使用資源;當(dāng)業(yè)務(wù)需求變化的時(shí)候,可以通過彈性伸縮機(jī)制和自動化來快速相應(yīng),以適應(yīng)業(yè)務(wù)的變化;平臺所提供的各種資源服務(wù),如存儲、CPU、內(nèi)存、網(wǎng)絡(luò)帶寬和軟件許可證等,是可以監(jiān)控、控制和計(jì)量的,能夠?yàn)榉?wù)水平管理提供依據(jù)。平臺建設(shè)規(guī)模可隨著業(yè)務(wù)類型增加和業(yè)務(wù)量的增加而迅速擴(kuò)展,高可擴(kuò)展性在建設(shè)過程必須得以保證;平臺可通過多副本容錯(cuò)和計(jì)算資源同構(gòu)可互換來提高服務(wù)的可靠性,在建設(shè)過程中對資源的選擇上,就要采用可靠性高的服務(wù)器和存儲
基于上述云計(jì)算平臺的基礎(chǔ)性建設(shè),將原來運(yùn)行于各物理平臺的具體應(yīng)用,分期分批地向云計(jì)算平臺遷移,并做好業(yè)務(wù)管理模式上的切換。通過云計(jì)算平臺逐漸替代原系統(tǒng)的物理機(jī)平臺,這一過程即通過云計(jì)算平臺實(shí)現(xiàn)智能電網(wǎng)下的系統(tǒng)數(shù)據(jù)和應(yīng)用服務(wù)管理,提高資源整合利用效率,真正為企業(yè)的業(yè)務(wù)提升提供強(qiáng)有力的平臺支持。
根據(jù)不同應(yīng)用的具體特性,所采取的具體步驟有所差異??傮w而言,首先應(yīng)該對智能電網(wǎng)下的各應(yīng)用系統(tǒng)進(jìn)行綜合評估,根據(jù)各種應(yīng)用特性選擇需要建設(shè)或遷移的業(yè)務(wù)應(yīng)用,為其制定適合于該應(yīng)用建設(shè)或遷移的方案。該方案需在云計(jì)算平臺的測試環(huán)境上進(jìn)行驗(yàn)證,如測試通過,則還需進(jìn)一步確認(rèn)該方案的細(xì)節(jié)問題,以及擬定失敗以后的回滾方案等,在失敗的情況下能夠根據(jù)回滾方案進(jìn)行回滾,并對失敗原因進(jìn)行分析。
在智能電網(wǎng)云計(jì)算平臺中,需要實(shí)現(xiàn)端到端的流程管理,采用工作流引擎來協(xié)調(diào)企業(yè)內(nèi)各個(gè)部門的資源利用,提高管理效率。端到端服務(wù)流程包括資源服務(wù)申請流程、分配流程、回收流程以及資源使用報(bào)告流程、服務(wù)監(jiān)控管理流程。通過分析,引入全生命周期管理模式可以有效解決云計(jì)算平臺的全過程管理
在實(shí)踐過程中,基于SOA 架構(gòu)和Java EE 技術(shù)路線實(shí)現(xiàn)云服務(wù)全生命周期管理。通過全生命周期的管理服務(wù)模式,實(shí)現(xiàn)云計(jì)算資源的充分有效利用,為應(yīng)用者提供從申請、預(yù)留、審批、供給、修改到釋放的全過程服務(wù)和管理?;谟行У臋?quán)限管理,所提供的服務(wù)流程都可以在云服務(wù)管理平臺界面上通過點(diǎn)擊鼠標(biāo)方的方式靈活配置和調(diào)用。另外,還可以提供客戶化設(shè)置,可以根據(jù)具體應(yīng)用需求快速搭建系統(tǒng)服務(wù)環(huán)境,也可以靈活應(yīng)對用戶服務(wù)流程的修改。云服務(wù)全生命周期管理主要功能如下所述。
⑴服務(wù)申請流程
業(yè)務(wù)管理人員通過審核正在進(jìn)行服務(wù)申請的所有項(xiàng)目信息,確認(rèn)無誤后對每個(gè)項(xiàng)目啟動“服務(wù)申請”,進(jìn)入到資源請求信息頁面。系統(tǒng)管理人員接收所提交的業(yè)務(wù)需求申請表單后,根據(jù)項(xiàng)目所需的資源情況,分配資源申請信息,包括:CPU 型號、CPU 大小、硬盤型號、硬盤大小、操作系統(tǒng)和所需軟件等信息,然后專責(zé)人員審批環(huán)節(jié)。審批完成后,系統(tǒng)自動將資源申請信息發(fā)送給云管理后臺程序,自動創(chuàng)建相關(guān)的服務(wù),同時(shí)接收創(chuàng)建完畢后的服務(wù)信息。
⑵服務(wù)回收流程
服務(wù)超過使用期限后,系統(tǒng)可自動對過期服務(wù)進(jìn)行回收,以便釋放該服務(wù)所占用的系統(tǒng)資源。如需繼續(xù)使用服務(wù),系統(tǒng)管理人員可以在云服務(wù)全生命周期管理監(jiān)控頁面對超期的服務(wù)器進(jìn)行服務(wù)續(xù)用申請功能,同樣續(xù)用申請需專責(zé)人員審批。
⑶服務(wù)暫停流程
如果業(yè)務(wù)管理人員申請的服務(wù)資源暫時(shí)不需要使用,可以提交服務(wù)暫停申請,釋放申請的服務(wù)資源。
⑷服務(wù)啟動流程
如果業(yè)務(wù)管理人員申請的服務(wù)資源處于暫停狀態(tài)時(shí),需要重新啟用資源,可以提交服務(wù)啟動申請,通過審批流程過,系統(tǒng)將自動把需要啟動的服務(wù)信息提交云管理后臺程序,啟用相關(guān)的服務(wù)。
⑸ 服務(wù)變更流程
服務(wù)變更申請由業(yè)務(wù)管理人員填寫服務(wù)變更的詳細(xì)信息,如磁盤空間變更信息、CPU 變更信息、影像變更信息、變更理由、變更人與變更時(shí)間等信息,填寫完變更信息后提交審核,最終由平臺自動啟動變更創(chuàng)建過程。
平臺自動記錄服務(wù)全生命周期每個(gè)環(huán)節(jié)的執(zhí)行信息,管理人員可以查詢每個(gè)服務(wù)的相關(guān)標(biāo)識、狀態(tài),監(jiān)控服務(wù)所處的里程碑點(diǎn),同時(shí)可以調(diào)閱已完成服務(wù)的執(zhí)行情況。
云服務(wù)平臺的權(quán)限管理主要針對用戶所屬角色的定義和用戶角色對服務(wù)的訪問權(quán)限的管理。用戶角色定義了用戶或者用戶組對應(yīng)的角色名稱,一個(gè)用戶或者用戶組可以同時(shí)擁有多個(gè)角色。結(jié)合虛擬化資源管理流程,設(shè)立申請人、審批人和管理員3 種角色:
申請人:業(yè)務(wù)系統(tǒng)接口人。申請人是資源最終使用者,即云平臺的租戶。申請人通過自服務(wù)門戶進(jìn)行資源的申請、操作、監(jiān)控等。
審批人:評估審批。審核所有提交的服務(wù)請求和資源實(shí)施方案,并確保潛在影響和風(fēng)險(xiǎn)得到評估,做出批準(zhǔn)或拒絕的決定,針對具體服務(wù)請求,評估并確定相應(yīng)資源的分派。
管理員:平臺管理。管理員整體資源的管理和規(guī)劃;資源模板的設(shè)計(jì),資源池整體運(yùn)營情況的評估和優(yōu)化,收集分析應(yīng)用系統(tǒng)需求和配置,分析應(yīng)用和業(yè)務(wù)的限制條件
在云服務(wù)平臺的全生命周期管理中,在定義用戶角色時(shí),對于輸入的用戶應(yīng)在PKI 或LDAP 系統(tǒng)中進(jìn)行驗(yàn)證合法性,若接入系統(tǒng)已有PKI 或LDAP 驗(yàn)證,則平臺只提供應(yīng)用系統(tǒng)級的認(rèn)證,無需到用戶一級的認(rèn)證,具體應(yīng)用系統(tǒng)的權(quán)限認(rèn)證由系統(tǒng)各自完成。PKI 認(rèn)證必須在用戶每次調(diào)用不同服務(wù)時(shí)進(jìn)行,只要用戶2 次調(diào)用的不是同一個(gè)服務(wù),均需要進(jìn)行PKI 認(rèn)證。若考慮到PKI 認(rèn)證對平臺性能方面的影響,可考慮將PKI 認(rèn)證信息常駐緩存,提高驗(yàn)證效率。服務(wù)訪問權(quán)限的管理可以在系統(tǒng)基礎(chǔ)設(shè)施服務(wù)平臺中定義訪問某個(gè)業(yè)務(wù)服務(wù)所必須具有的角色。多個(gè)角色可以允許訪問同一個(gè)服務(wù)。
對云服務(wù)平臺管理中涉及的相關(guān)參數(shù)提供統(tǒng)一維護(hù)功能,滿足系統(tǒng)參數(shù)增、刪、改和查的需要,對每項(xiàng)操作都需進(jìn)行詳細(xì)日志記錄,并提供統(tǒng)計(jì)查詢和報(bào)表分析功能。
通過構(gòu)建智能電網(wǎng)云計(jì)算平臺有效提高了資源利用率近3 倍,節(jié)省了存儲空間達(dá)60%,同時(shí)在服務(wù)器及資源應(yīng)用維護(hù)上大大降低了管理成本,資源部署周期從原來的幾個(gè)星期減少幾個(gè)小時(shí)。通過有效的云服務(wù)全生命周期管理構(gòu)建了自我服務(wù)平臺,可自動響應(yīng)業(yè)務(wù)變化,使IT 服務(wù)架構(gòu)與業(yè)務(wù)管理緊密聯(lián)系,使資源管理更加規(guī)范性,提高了管理水平。隨著云計(jì)算的應(yīng)用研究以及業(yè)內(nèi)相關(guān)構(gòu)建實(shí)踐經(jīng)驗(yàn)的不斷累積,云計(jì)算平臺所打造的虛擬化、自動化、服務(wù)化技術(shù),很快將成為智能電網(wǎng)的應(yīng)用與研究方向。
[1]鄭湃,崔立真,王海洋,等.云計(jì)算環(huán)境下面向數(shù)據(jù)密集型應(yīng)用的數(shù)據(jù)布局策略與方法[J].計(jì)算機(jī)學(xué)報(bào),2010,33(8):1472-1480.
[2]李亞瓊,宋瑩,黃永兵.一種面向虛擬化云計(jì)算平臺的內(nèi)存優(yōu)化技術(shù)[J].計(jì)算機(jī)學(xué)報(bào),2011,34(4):684-693.
[3]劉曉茜,楊壽保,郭良,等.雪花結(jié)構(gòu):一種新型數(shù)據(jù)中心網(wǎng)絡(luò)結(jié)構(gòu)[J].計(jì)算機(jī)學(xué)報(bào),2011,34(1):76-85.
[4]劉鵬.實(shí)戰(zhàn)Hadoop—開啟通向云計(jì)算的捷徑[M].北京:電子工業(yè)出版社,2011.
[5]崔婷婷,孫建鋼.建云數(shù)據(jù)中心需考量生命周期[J].中國經(jīng)濟(jì)和信息化,2012(11):95.
[6]匡勝徽,李勃.云計(jì)算體系結(jié)構(gòu)及應(yīng)用實(shí)例分析[J].計(jì)算機(jī)與數(shù)字工程,20l0,38(3):60-63,91