周保紅,劉 帥,張玉松
(1.三峽水利樞紐梯級(jí)調(diào)度通信中心,湖北 宜昌 443002; 2.智慧長(zhǎng)江與水電科學(xué)湖北省重點(diǎn)實(shí)驗(yàn)室,湖北 宜昌 443002)
云計(jì)算是一種采用大量低成本的標(biāo)準(zhǔn)計(jì)算單元,通過(guò)網(wǎng)絡(luò)連接構(gòu)建基礎(chǔ)設(shè)施平臺(tái),以實(shí)現(xiàn)各種IT基礎(chǔ)設(shè)施資源共享和按需分配的信息技術(shù)[1]。云技術(shù)已在各個(gè)行業(yè)得到廣泛應(yīng)用,如國(guó)家電網(wǎng)已通過(guò)云技術(shù)建設(shè)了調(diào)控云,采用物理分布與邏輯統(tǒng)一相結(jié)合的分級(jí)部署設(shè)計(jì)方式,形成了國(guó)調(diào)中心主節(jié)點(diǎn)與各省級(jí)調(diào)度機(jī)構(gòu)協(xié)同節(jié)點(diǎn)共同組成的基礎(chǔ)云資源集合[2]。同時(shí),云基礎(chǔ)架構(gòu)的引入有效解決了傳統(tǒng)基礎(chǔ)架構(gòu)的問(wèn)題。云基礎(chǔ)架構(gòu)在傳統(tǒng)基礎(chǔ)架構(gòu)計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)硬件層的基礎(chǔ)上,增加了虛擬化層、云層。相對(duì)于傳統(tǒng)IT基礎(chǔ)架構(gòu),云基礎(chǔ)架構(gòu)通過(guò)虛擬化整合與自動(dòng)化,應(yīng)用系統(tǒng)共享基礎(chǔ)架構(gòu)資源池,實(shí)現(xiàn)高利用率、高可用性、低成本、低能耗;并通過(guò)云平臺(tái)層的自動(dòng)化管理,實(shí)現(xiàn)快速部署、易于擴(kuò)展、智能管理。新一代水庫(kù)調(diào)度自動(dòng)化系統(tǒng)在數(shù)據(jù)存儲(chǔ)方面引入了基于CRAID的虛擬存儲(chǔ)技術(shù)、存儲(chǔ)雙活技術(shù)、集群技術(shù)等。
三峽梯級(jí)水庫(kù)調(diào)度自動(dòng)化系統(tǒng)原本為集中式數(shù)據(jù)中心模式,可為系統(tǒng)提供物理設(shè)備集中存放、運(yùn)行和管理服務(wù)[3]。該構(gòu)架方式為傳統(tǒng) “專機(jī)專用”方式,易于部署,在系統(tǒng)建設(shè)初期發(fā)揮較大作用。隨著業(yè)務(wù)的擴(kuò)張以及應(yīng)用需求的不斷豐富,該方式的不足逐漸顯現(xiàn)。受能源、空間、成本和管理等方面的制約,系統(tǒng)管理、運(yùn)行、維護(hù)成本的顯著增加,集中建設(shè)的優(yōu)勢(shì)不能進(jìn)一步體現(xiàn)。因此,本文提出了三峽梯級(jí)水庫(kù)調(diào)度自動(dòng)化系統(tǒng)云平臺(tái)的總體方案,闡述了云平臺(tái)計(jì)算資源池、網(wǎng)絡(luò)方案、存儲(chǔ)資源池、云計(jì)算管理平臺(tái)的具體實(shí)現(xiàn)方法。
構(gòu)建云平臺(tái)的關(guān)鍵在于較好地解決云基礎(chǔ)設(shè)施數(shù)據(jù)存儲(chǔ)的穩(wěn)定性、高效性、安全性問(wèn)題,設(shè)計(jì)主要應(yīng)用CRAID虛擬存儲(chǔ)技術(shù)、存儲(chǔ)雙活技術(shù)、集群技術(shù)來(lái)解決上述問(wèn)題。
高性能的存儲(chǔ)是構(gòu)建云平臺(tái)的基礎(chǔ)。劉艷等[4]借鑒集群文件系統(tǒng)“分布式虛擬磁盤”的概念,針對(duì)大規(guī)模 RAID提出了一種新的CSRAID存儲(chǔ)結(jié)構(gòu),其由若干結(jié)構(gòu)不同SubRAID組成,并能為各用戶提供一個(gè)由SubRAID物理存儲(chǔ)空間構(gòu)成的、始終適應(yīng)用戶I/0需求的虛擬磁盤。通過(guò)仿真實(shí)驗(yàn)結(jié)果表明:與傳統(tǒng)結(jié)構(gòu)大規(guī)模 RAID 系統(tǒng)相比,同樣大小存儲(chǔ)空間的CSRAID系統(tǒng)的I/0性能具有顯著優(yōu)勢(shì)?;贑SRAID的商用技術(shù)已得到應(yīng)用,并且從CRAID 1.0發(fā)展到CRAID 2.0。CRAID 1.0原理主要是通過(guò)將磁盤細(xì)分為數(shù)千甚至數(shù)萬(wàn)個(gè)小單元進(jìn)行單獨(dú)管理(引入了Cell層),在單元內(nèi)發(fā)生的故障和問(wèn)題采用其他單元替換與屏蔽故障單元方式進(jìn)行處理,避免對(duì)整個(gè)磁盤進(jìn)行數(shù)據(jù)重建。在進(jìn)行全盤數(shù)據(jù)重建時(shí)該技術(shù)也會(huì)將健康單元數(shù)據(jù)提前克隆到新磁盤中,只對(duì)個(gè)別故障單元數(shù)據(jù)進(jìn)行校驗(yàn)計(jì)算重建。CRAID 2.0在CRAID 1.0基礎(chǔ)上采用全新算法和三重?cái)?shù)據(jù)校驗(yàn)機(jī)制,在保證數(shù)據(jù)安全、磁盤空間使用率和性能的前提下,在保護(hù)力度上更優(yōu)異,其較傳統(tǒng)RAID技術(shù)優(yōu)勢(shì)見表1。本文選取具有CRAID 2.0技術(shù)的產(chǎn)品來(lái)構(gòu)建存儲(chǔ)體系以提升存儲(chǔ)性能與數(shù)據(jù)穩(wěn)定性。
表1 RAID技術(shù)比較Tab.1 RAID technology comparison
為避免傳統(tǒng)數(shù)據(jù)中心故障導(dǎo)致丟失數(shù)據(jù)的情況,數(shù)據(jù)中心普遍采用了存儲(chǔ)雙活技術(shù)。主要做法為運(yùn)用2套存儲(chǔ)系統(tǒng),兩者互為鏡像,當(dāng)一個(gè)存儲(chǔ)系統(tǒng)發(fā)生故障時(shí),業(yè)務(wù)自動(dòng)切換到另一個(gè)存儲(chǔ)系統(tǒng)中[5]。存儲(chǔ)雙活技術(shù)對(duì)存儲(chǔ)網(wǎng)絡(luò)要求極高,一般用于1 km范圍內(nèi)容的保護(hù)設(shè)計(jì),在配合遠(yuǎn)距離集群軟件下使用其雙活功能也只能擴(kuò)展到數(shù)十千米范圍內(nèi),該技術(shù)一般用于進(jìn)行同城災(zāi)備保護(hù)。
傳統(tǒng)的雙活存儲(chǔ)方案無(wú)法由存儲(chǔ)陣列自身直接實(shí)現(xiàn),更多的是通過(guò)在服務(wù)器上增加卷鏡像軟件,或者通過(guò)增加額外的存儲(chǔ)虛擬化引擎實(shí)現(xiàn),這兩種方式存在的弊端如下:① 卷鏡像軟件實(shí)施復(fù)雜,對(duì)應(yīng)用業(yè)務(wù)影響大;② 存儲(chǔ)虛擬化引擎存在性能、可靠性的瓶頸以及兼容性問(wèn)題;③ 相關(guān)軟件購(gòu)買成本較高,維護(hù)開銷大。
本文選取內(nèi)置存儲(chǔ)引擎的國(guó)產(chǎn)化雙活存儲(chǔ)產(chǎn)品保護(hù)云平臺(tái)的數(shù)據(jù),在復(fù)原時(shí)間目標(biāo)(Recovery Time Objective,RTO)、復(fù)原點(diǎn)目標(biāo)(Recovery Point Objective,RPO)的目標(biāo)實(shí)現(xiàn)上具備優(yōu)勢(shì),其主要優(yōu)點(diǎn)如下:① 讀寫并發(fā),雙活;② 自動(dòng)化秒級(jí)完成故障存儲(chǔ)陣列切換;③ 采用虛擬卷技術(shù),無(wú)需操作系統(tǒng)額外安裝軟件支持;④ 內(nèi)部專用萬(wàn)兆網(wǎng),數(shù)據(jù)同步高速;⑤ 雙陣列控制器冗余,形成高可靠的雙活四控結(jié)構(gòu)。
構(gòu)建系統(tǒng)云平臺(tái)涉及的關(guān)鍵集群技術(shù)主要包括核心數(shù)據(jù)庫(kù)集群與虛擬化集群技術(shù)。
1.3.1 核心數(shù)據(jù)庫(kù)集群技術(shù)
集群數(shù)據(jù)庫(kù)的數(shù)據(jù)分配技術(shù)可提升數(shù)據(jù)庫(kù)均衡性,提高數(shù)據(jù)庫(kù)性能、提高數(shù)據(jù)使用率[6]。作為整個(gè)系統(tǒng)最重要的部分,從安全性能角度考慮,核心數(shù)據(jù)庫(kù)采用高性能物理機(jī)方式進(jìn)行部署。每個(gè)核心數(shù)據(jù)庫(kù)采用集群的方式構(gòu)建。數(shù)據(jù)庫(kù)集群包含數(shù)臺(tái)高性能服務(wù)器作為組成節(jié)點(diǎn),節(jié)點(diǎn)間通信通過(guò)高速內(nèi)部通信網(wǎng)絡(luò)進(jìn)行,節(jié)點(diǎn)間高速通信網(wǎng)絡(luò)可以采用萬(wàn)兆網(wǎng)絡(luò)的方式,每個(gè)集群數(shù)據(jù)庫(kù)系統(tǒng)中通過(guò)建設(shè)不同的數(shù)據(jù)庫(kù)實(shí)現(xiàn)對(duì)各個(gè)業(yè)務(wù)數(shù)據(jù)的存儲(chǔ)和管理。核心數(shù)據(jù)庫(kù)區(qū)物理機(jī)部署集群,主要優(yōu)勢(shì)如下:① 高性能物理機(jī)可以解決數(shù)據(jù)庫(kù)對(duì)于高并發(fā)I/O帶來(lái)的資源競(jìng)爭(zhēng),為其提供獨(dú)立足夠的資源空間;② 集群負(fù)載均衡能解決業(yè)務(wù)突發(fā)增長(zhǎng)情況下帶來(lái)的訪問(wèn)量和數(shù)據(jù)處理能力不足問(wèn)題;③ 集群布置能方便性能持續(xù)擴(kuò)張,能通過(guò)動(dòng)態(tài)增設(shè)服務(wù)器解決資源擴(kuò)張;④ 集群布置能實(shí)現(xiàn)故障自動(dòng)切除、業(yè)務(wù)自動(dòng)轉(zhuǎn)移,避免單點(diǎn)故障帶來(lái)的數(shù)據(jù)庫(kù)崩潰,帶來(lái)嚴(yán)重生產(chǎn)事故,具有極高的可靠性;⑤ 物理機(jī)部署數(shù)據(jù)庫(kù)可以確保數(shù)據(jù)的絕對(duì)信息安全,防止信息泄露。
1.3.2 虛擬化集群技術(shù)
三峽梯級(jí)水庫(kù)調(diào)度自動(dòng)化系統(tǒng)云平臺(tái)主要使用服務(wù)器虛擬化技術(shù)來(lái)實(shí)現(xiàn),其技術(shù)本質(zhì)就是通過(guò)虛擬化操作系統(tǒng)將服務(wù)器物理資源抽象成邏輯資源,讓1臺(tái)服務(wù)器變成幾臺(tái)甚至幾十臺(tái)相互隔離的虛擬服務(wù)器,不再受限于物理上的界限,讓CPU、內(nèi)存、磁盤、I/O等硬件變成可以動(dòng)態(tài)管理的“資源池”,從而提高資源的利用率,簡(jiǎn)化系統(tǒng)管理,實(shí)現(xiàn)服務(wù)器資源池化的整合,讓計(jì)算資源對(duì)業(yè)務(wù)的變化更具適應(yīng)力。虛擬化集群的幾個(gè)關(guān)鍵點(diǎn):① 虛擬化操作系統(tǒng),該操作系統(tǒng)能將所有物理機(jī)的CPU、內(nèi)存、硬盤存儲(chǔ)、網(wǎng)絡(luò)等硬件通過(guò)軟件進(jìn)行抽象,資源打散重組成為資源池,并可任意劃分資源池作為虛擬機(jī);② 虛擬主機(jī)是數(shù)據(jù)中心的基本計(jì)算基礎(chǔ),可以聚合這些主機(jī)資源以構(gòu)建高度可用的動(dòng)態(tài)資源池環(huán)境,作為數(shù)據(jù)中心中每個(gè)應(yīng)用程序的整體計(jì)算資源。
云平臺(tái)主要由服務(wù)器虛擬化、云存儲(chǔ)和云桌面組成,提供了彈性可擴(kuò)展、負(fù)載均衡、按需自動(dòng)服務(wù)基礎(chǔ)支撐環(huán)境。在滿足業(yè)務(wù)應(yīng)用高性能、高可靠性、高安全性和高可適應(yīng)性的基礎(chǔ)上,云平臺(tái)可實(shí)現(xiàn)系統(tǒng)資源的集中管理、動(dòng)態(tài)調(diào)整、快速分配并進(jìn)一步減少IT整體投入目標(biāo)。
三峽梯級(jí)水庫(kù)調(diào)度自動(dòng)化系統(tǒng)采用云技術(shù)構(gòu)建,在宜昌區(qū)域?yàn)橹饔霉δ堋⒊啥紖^(qū)域?yàn)閭溆霉δ?、昆明區(qū)域具備有應(yīng)急調(diào)度功能。實(shí)現(xiàn)了宜昌、成都及昆明3地的業(yè)務(wù)功能整合。具體做法是通過(guò)在宜昌建立三峽水庫(kù)調(diào)度自動(dòng)化系統(tǒng)私有云環(huán)境并建立數(shù)據(jù)中心,將所有應(yīng)用、功能、數(shù)據(jù)均部署在數(shù)據(jù)中心;成都和昆明的業(yè)務(wù)人員通過(guò)網(wǎng)絡(luò)訪問(wèn)私有云數(shù)據(jù)中心,從而實(shí)現(xiàn)數(shù)據(jù)、應(yīng)用、功能的一致性與平臺(tái)的統(tǒng)一性。私有云數(shù)據(jù)中心在業(yè)務(wù)邏輯上總體呈現(xiàn)為安全Ⅱ區(qū)“水庫(kù)調(diào)度自動(dòng)化系統(tǒng)主平臺(tái)”和安全Ⅲ區(qū)“綜合數(shù)據(jù)云平臺(tái)”架構(gòu)。水庫(kù)調(diào)度主系統(tǒng)云平臺(tái)承載的業(yè)務(wù)主要是面向水庫(kù)實(shí)時(shí)調(diào)度,“綜合數(shù)據(jù)云平臺(tái)”承載的業(yè)務(wù)主要是面向水庫(kù)調(diào)度決策技術(shù)支持。
云計(jì)算平臺(tái)建設(shè)首先是IaaS層的建設(shè),即在水庫(kù)調(diào)度自動(dòng)化系統(tǒng)安全Ⅱ區(qū)和安全Ⅲ區(qū),通過(guò)將基礎(chǔ)硬件資源虛擬化的方式,將存儲(chǔ)硬件抽象為軟件,包括卷管理、RAID、數(shù)據(jù)保護(hù)、快照和復(fù)制等。通過(guò)對(duì)異構(gòu)的存儲(chǔ)資源抽象成邏輯存儲(chǔ)池,滿足應(yīng)用場(chǎng)景的需求。使用網(wǎng)絡(luò)虛擬化技術(shù)對(duì)底層各種網(wǎng)絡(luò)資源虛擬化,實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)的集中控制和管理,滿足統(tǒng)一快速靈活部署需求。采用分布式數(shù)據(jù)處理,通過(guò)冗余配置和數(shù)據(jù)庫(kù)互備等措施,將傳統(tǒng)數(shù)據(jù)庫(kù)服務(wù)器、應(yīng)用服務(wù)器、通信服務(wù)器、數(shù)據(jù)處理服務(wù)器等專用設(shè)備由云計(jì)算虛擬服務(wù)器代替,減少設(shè)備數(shù)量,提高管理效率。
在基礎(chǔ)硬件虛擬化的基礎(chǔ)上實(shí)現(xiàn)PaaS層和SaaS層功能。在IaaS 基礎(chǔ)上提供統(tǒng)一的平臺(tái)化系統(tǒng)軟件支撐服務(wù),包括將數(shù)據(jù)采集、數(shù)據(jù)通信、數(shù)據(jù)處理、信息查詢與展示、報(bào)表、數(shù)據(jù)監(jiān)視和報(bào)警、后臺(tái)權(quán)限管理、版本管理等功能提供給用戶。通過(guò)對(duì)水庫(kù)調(diào)度專業(yè)應(yīng)用軟件模塊的進(jìn)一步封裝,將系統(tǒng)中水庫(kù)調(diào)度、洪水預(yù)報(bào)、調(diào)度方案制作、節(jié)水增發(fā)、典型洪水分析、整編資料管理、水位優(yōu)化控制計(jì)算等具體應(yīng)用作為服務(wù)提供給用戶,滿足不同用戶的個(gè)性化定制需求。SaaS,PaaS,IaaS 3層模式架構(gòu)以及各層在系統(tǒng)中承擔(dān)的作用見圖1。
圖1 水庫(kù)調(diào)度自動(dòng)化系統(tǒng)云平臺(tái)架構(gòu)Fig.1 Cloud platform architecture of reservoir dispatching automation system
云平臺(tái)總體方案以軟件定義數(shù)據(jù)中心的模式,建設(shè)全新的云數(shù)據(jù)中心。同時(shí),在設(shè)計(jì)方案時(shí),充分考慮整個(gè)大系統(tǒng)的安全性,實(shí)現(xiàn)核心數(shù)據(jù)庫(kù)、虛擬機(jī)鏡像等關(guān)鍵數(shù)據(jù)的本地容災(zāi)備份,保證業(yè)務(wù)數(shù)據(jù)的安全性。方案設(shè)計(jì)范圍為水庫(kù)調(diào)度自動(dòng)化主系統(tǒng)、信息采集和交換平臺(tái)、內(nèi)/外網(wǎng)調(diào)度綜合數(shù)據(jù)平臺(tái)業(yè)務(wù)模塊,在遵照安全分區(qū)的信息安全防護(hù)要求的前提下構(gòu)建兩套云平臺(tái):① 安全Ⅱ區(qū)云平臺(tái),用于運(yùn)行水庫(kù)調(diào)度自動(dòng)化主系統(tǒng)和內(nèi)網(wǎng)綜合數(shù)據(jù)平臺(tái);② 安全Ⅲ區(qū)云平臺(tái),用于運(yùn)行外網(wǎng)調(diào)度綜合數(shù)據(jù)平臺(tái)和信息采集及交換平臺(tái)。安全Ⅱ/Ⅲ區(qū)云平臺(tái)的架構(gòu)見圖2。
圖2 系統(tǒng)云平臺(tái)架構(gòu)Fig.2 System cloud platform architecture
云計(jì)算平臺(tái)的建設(shè)內(nèi)容包括云操作系統(tǒng)(虛擬化操作系統(tǒng)、云計(jì)算管理平臺(tái))、硬件平臺(tái)建設(shè)(計(jì)算資源池、網(wǎng)絡(luò)資源池、存儲(chǔ)資源池)及業(yè)務(wù)前端的工作站,設(shè)計(jì)如下:① 云操作系統(tǒng)由虛擬化操作系統(tǒng)和云計(jì)算管理平臺(tái)等內(nèi)容構(gòu)成,并提供統(tǒng)一運(yùn)維、監(jiān)控報(bào)警、故障預(yù)警等管理手段。② 計(jì)算資源池的建設(shè)包括數(shù)據(jù)庫(kù)服務(wù)器和虛擬化資源池兩部分。數(shù)據(jù)庫(kù)服務(wù)器采用四路服務(wù)器;對(duì)于虛擬化資源池的建設(shè),安全Ⅱ區(qū)虛擬化資源池采用4臺(tái)四路服務(wù)器構(gòu)建,安全Ⅲ區(qū)虛擬化資源池采用8臺(tái)四路服務(wù)器和1臺(tái)雙路桌面服務(wù)器構(gòu)建。③ 存儲(chǔ)資源池的建設(shè)包括生產(chǎn)區(qū)域和本地備份區(qū)域兩個(gè)部分的存儲(chǔ)系統(tǒng)建設(shè)。生產(chǎn)存儲(chǔ)包括核心數(shù)據(jù)庫(kù)全閃存共享存儲(chǔ)(一級(jí)存儲(chǔ))、GIS及虛擬化高性能共享存儲(chǔ)(二級(jí)存儲(chǔ));備份存儲(chǔ)系統(tǒng)包括在備份磁盤陣列(二級(jí)存儲(chǔ))和備份一體機(jī),為核心數(shù)據(jù)庫(kù)、操作系統(tǒng)、虛擬化等提供兩份數(shù)據(jù)備份,提供多種備份措施,最大程度地保護(hù)客戶業(yè)務(wù)系統(tǒng)中關(guān)鍵數(shù)據(jù)的安全。④ 網(wǎng)絡(luò)資源池的建設(shè)主要是包括業(yè)務(wù)網(wǎng)絡(luò)、存儲(chǔ)網(wǎng)絡(luò)及管理網(wǎng)絡(luò)。業(yè)務(wù)網(wǎng)絡(luò)采用萬(wàn)兆光纖網(wǎng)絡(luò),存儲(chǔ)網(wǎng)絡(luò)采用16 Gb FC網(wǎng)絡(luò),管理網(wǎng)絡(luò)采用千兆以太網(wǎng)。
云計(jì)算資源池主要由基于X86架構(gòu)的服務(wù)器設(shè)備組成。根據(jù)基礎(chǔ)平臺(tái)總體架構(gòu)以及網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)中對(duì)功能區(qū)的劃分原則,將計(jì)算資源池設(shè)備按照需要實(shí)現(xiàn)的功能劃分為多個(gè)功能分區(qū),支撐不同的上層業(yè)務(wù)應(yīng)用,主要是水庫(kù)調(diào)度自動(dòng)化主系統(tǒng)、內(nèi)網(wǎng)綜合數(shù)據(jù)平臺(tái)、外網(wǎng)綜合數(shù)據(jù)平臺(tái)及信息采集與交換平臺(tái)的應(yīng)用,根據(jù)基礎(chǔ)平臺(tái)所承擔(dān)的應(yīng)用系統(tǒng)的特點(diǎn)和未來(lái)3~5 a的業(yè)務(wù)規(guī)劃,可把計(jì)算資源池分為核心數(shù)據(jù)庫(kù)集群和虛擬化集群。
云平臺(tái)建設(shè)方案應(yīng)綜合考慮業(yè)務(wù)高效運(yùn)行和便捷管理的需要,又要避免業(yè)務(wù)需要與管理需要之間的矛盾,因此將云平臺(tái)網(wǎng)絡(luò)分為業(yè)務(wù)網(wǎng)、存儲(chǔ)網(wǎng)、管理網(wǎng),3套網(wǎng)絡(luò)相互獨(dú)立,互不干涉,便于根據(jù)不同方面的需要規(guī)劃和調(diào)整網(wǎng)絡(luò)。各網(wǎng)絡(luò)特點(diǎn)如下:① 業(yè)務(wù)網(wǎng)用于訪問(wèn)客戶業(yè)務(wù)系統(tǒng)、業(yè)務(wù)系統(tǒng)內(nèi)部互聯(lián)、虛擬機(jī)遷移、以及LAN備份與備份數(shù)據(jù)復(fù)制,每個(gè)安全區(qū)的數(shù)據(jù)中心內(nèi)均采用10 Gb以太網(wǎng)絡(luò)高速互聯(lián)。② 存儲(chǔ)網(wǎng)提供本地存儲(chǔ)訪問(wèn)、存儲(chǔ)卷拷貝等網(wǎng)絡(luò)通訊能力,每個(gè)安全區(qū)的云計(jì)算中心內(nèi)均采用16 Gb FC網(wǎng)絡(luò)實(shí)現(xiàn)服務(wù)器與存儲(chǔ)之間的互聯(lián)。③ 管理網(wǎng)用于管理信息傳輸、集群心跳、集群仲裁等,每個(gè)數(shù)據(jù)中心內(nèi)均采用千兆網(wǎng)絡(luò)互聯(lián),以保證管理信息的及時(shí)有效傳遞,確保集群正常工作。④ 為保證系統(tǒng)高可用及業(yè)務(wù)連續(xù)性,業(yè)務(wù)網(wǎng)、存儲(chǔ)網(wǎng)及管理網(wǎng)均采用冗余鏈路部署,提高系統(tǒng)整體可用性和可靠性。
4.3.1 數(shù)據(jù)類型分析與存儲(chǔ)規(guī)劃
為滿足新建的云平臺(tái)的數(shù)據(jù)庫(kù)存儲(chǔ)、虛擬機(jī)、GIS等文件系統(tǒng)存儲(chǔ),需新增集中存儲(chǔ)設(shè)備。根據(jù)業(yè)務(wù)對(duì)存儲(chǔ)設(shè)備的不同要求,采用不同的存儲(chǔ)方式,并根據(jù)存儲(chǔ)設(shè)備性能建立分區(qū)存儲(chǔ)策略,采用CRAID技術(shù)為納入云平臺(tái)的應(yīng)用系統(tǒng)、數(shù)據(jù)提供統(tǒng)一的高可用性數(shù)據(jù)存儲(chǔ)服務(wù)和存儲(chǔ)管理服務(wù)。從采用的數(shù)據(jù)結(jié)構(gòu)角度來(lái)看,業(yè)務(wù)數(shù)據(jù)包括結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),特點(diǎn)如下:① 結(jié)構(gòu)化數(shù)據(jù)主要是關(guān)系數(shù)據(jù)庫(kù)存儲(chǔ)的流域水文、水庫(kù)運(yùn)行、電站運(yùn)行、電力等數(shù)據(jù),對(duì)存儲(chǔ)的性能、穩(wěn)定性及可靠性要求很高,采用閃存磁盤陣列,保證數(shù)據(jù)庫(kù)業(yè)務(wù)的高效運(yùn)行,用于一級(jí)存儲(chǔ);② 非結(jié)構(gòu)化數(shù)據(jù)主要包括專生成業(yè)務(wù)產(chǎn)生的圖片、視頻、工作檔案等數(shù)據(jù),例如GIS業(yè)務(wù)、氣象衛(wèi)片、專題文檔等數(shù)據(jù),此外還包括采用虛擬化技術(shù)產(chǎn)生的虛擬機(jī)文件。非結(jié)構(gòu)化數(shù)據(jù)量較大,對(duì)底層存儲(chǔ)性能和帶寬要求較高,配置為高速SAS盤與SATA盤混合存儲(chǔ),用于二級(jí)存儲(chǔ),并配置SSD緩存加速功能以提升數(shù)據(jù)讀寫效率,高速SAS盤為虛擬化提供存儲(chǔ)空間,SATA盤為GIS等業(yè)務(wù)系統(tǒng)提供存儲(chǔ)空間。
4.3.2 數(shù)據(jù)備份方案
為防止數(shù)據(jù)邏輯錯(cuò)誤、提高數(shù)據(jù)安全性,完善的數(shù)據(jù)容災(zāi)備份方案可為業(yè)務(wù)數(shù)據(jù)的安全性提供安全保障,數(shù)據(jù)備份方案將從備份方式、備份架構(gòu)、備份方案策略角度來(lái)設(shè)計(jì)。
(1) 數(shù)據(jù)備份方式。對(duì)核心數(shù)據(jù)庫(kù)數(shù)據(jù)、虛擬機(jī)鏡像等關(guān)鍵數(shù)據(jù)進(jìn)行備份,備份方式分為以下兩種:① 采用磁盤陣列備份方式,即額外再配置1套二級(jí)存儲(chǔ),通過(guò)數(shù)據(jù)庫(kù)復(fù)制技術(shù)將數(shù)據(jù)庫(kù)數(shù)據(jù)復(fù)制到第二套二級(jí)存儲(chǔ)中,通過(guò)卷拷貝將虛擬機(jī)鏡像等核心數(shù)據(jù)復(fù)制到第二套二級(jí)存儲(chǔ)中;② 采用備份一體機(jī)備份方式,通過(guò)LAN備份方式,對(duì)核心數(shù)據(jù)庫(kù)、操作系統(tǒng)等關(guān)鍵數(shù)據(jù)進(jìn)行備份。
(2) 數(shù)據(jù)備份架構(gòu)。結(jié)合備份技術(shù),采用本地備份,將備份數(shù)據(jù)分別傳輸至備份磁盤陣列及備份一體機(jī),做到1份數(shù)據(jù)3份保護(hù)。備份架構(gòu)如圖3所示。
圖3 備份架構(gòu)Fig.3 Backup architecture diagram
(3) 備份策略。備份系統(tǒng)的設(shè)計(jì)需要考慮配置的軟硬件產(chǎn)品之外,更需要精心設(shè)計(jì)。備份策略是整個(gè)備份系統(tǒng)中的重要策略,其作用為保證系統(tǒng)在故障情況下能實(shí)現(xiàn)數(shù)據(jù)的快速恢復(fù)。良好的備份策略和管理規(guī)劃是實(shí)現(xiàn)數(shù)據(jù)恢復(fù)的基礎(chǔ)。備份策略的選擇需要統(tǒng)籌考慮需備份的總數(shù)據(jù)量、線路帶寬、數(shù)據(jù)吞吐量、時(shí)間窗口以及對(duì)恢復(fù)時(shí)間的要求等因素,且還需要一并考慮通用的備份方式,如全量備份、增量備份和差分備份。結(jié)合系統(tǒng)特點(diǎn),綜合分析系統(tǒng)數(shù)據(jù)情況,數(shù)據(jù)備份策略規(guī)劃見表2。
表2 數(shù)據(jù)備份策略規(guī)劃Tab.2 Data backup strategy planning
借助云計(jì)算管理平臺(tái),可將基礎(chǔ)架構(gòu)資源集成到具有計(jì)算、網(wǎng)絡(luò)和存儲(chǔ)集合的資源池中,也可將數(shù)據(jù)中心的計(jì)算資源、存儲(chǔ)資源、網(wǎng)絡(luò)資源(和相關(guān)策略可以集成到虛擬數(shù)據(jù)中心資源池中。
管理平臺(tái)能簡(jiǎn)化對(duì)基礎(chǔ)架構(gòu)的訪問(wèn),其主要作用如下:① 基于開放的應(yīng)用模板,發(fā)布相關(guān)的虛擬機(jī)和Web目錄,實(shí)現(xiàn)用戶的快速管理和部署;② 在配額范圍內(nèi)提供彈性服務(wù),為用戶的應(yīng)用程序提供調(diào)度和業(yè)務(wù)擴(kuò)展功能,并支持資源池資源的擴(kuò)展以滿足用戶的更大規(guī)模的需求。
綜合運(yùn)維管理平臺(tái)包含運(yùn)維和運(yùn)營(yíng)兩個(gè)模塊。運(yùn)維模塊對(duì)資源層進(jìn)行智能運(yùn)維,包括對(duì)操作系統(tǒng)和應(yīng)用程序的監(jiān)控,以及操作系統(tǒng)級(jí)別的更改和配置。運(yùn)維模塊能支持第三方操作系統(tǒng)和應(yīng)用監(jiān)控工具的可延展性,同時(shí)能夠監(jiān)控、規(guī)劃和優(yōu)化系統(tǒng)資源,對(duì)數(shù)據(jù)中心資源進(jìn)行容量化管理,還提供告警和日志功能。該模塊還使用戶能夠及時(shí)發(fā)現(xiàn)并解決環(huán)境中的問(wèn)題,從而避免問(wèn)題擴(kuò)大化。
操作模塊給用戶帶來(lái)便捷服務(wù)交付體驗(yàn),通過(guò)基本配額的部署和計(jì)劃,可實(shí)現(xiàn)用戶定義的項(xiàng)目和工作流管理。同時(shí),操作模塊可對(duì)資產(chǎn)進(jìn)行審核下放和資產(chǎn)回收,通過(guò)計(jì)量透明地管理成本,還支持應(yīng)用程序部署、更改和數(shù)據(jù)監(jiān)視。
為了保障云平臺(tái)的安全,云計(jì)算管理平臺(tái)還設(shè)計(jì)了完整的安全架構(gòu),分別從主機(jī)/虛擬化、網(wǎng)絡(luò)、數(shù)據(jù)、管理等多個(gè)層次來(lái)考慮,其總體架構(gòu)如圖4所示。
圖4 云計(jì)算管理平臺(tái)總體架構(gòu)Fig.4 Overall architecture of cloud computing management platform
三峽梯級(jí)水庫(kù)調(diào)度自動(dòng)化系統(tǒng)依托虛擬存儲(chǔ)、存儲(chǔ)雙活、 集群等關(guān)鍵技術(shù)構(gòu)建了云計(jì)算平臺(tái),并以此為基礎(chǔ),設(shè)計(jì)了以宜昌主調(diào)、成都備調(diào)、昆明應(yīng)急調(diào)度的三地互備系統(tǒng)結(jié)構(gòu),實(shí)現(xiàn)了宜昌、成都及昆明三地的業(yè)務(wù)功能整合。該云平臺(tái)已完成設(shè)計(jì)和建設(shè),從實(shí)效效果來(lái)看,具備較好的穩(wěn)定性、可靠性、安全性,能實(shí)現(xiàn)系統(tǒng)資源的集中管理、動(dòng)態(tài)調(diào)整、快速分配的目標(biāo)。