文/王寶龍
作為一種新興的IT經(jīng)營模式,云計算能夠向用戶提供動態(tài)服務(wù)、可伸縮虛擬化資源。因此,高校在數(shù)字化建設(shè)過程中,通過云計算技術(shù)對其信息基礎(chǔ)設(shè)施進行改造,能夠打造虛擬化、高靈活性、高效易管理的云數(shù)據(jù)中心?;诖?,本文主要以云計算為基礎(chǔ),針對高校數(shù)據(jù)中心建設(shè)展開相關(guān)探討分析。
自20世紀(jì)90年代以來,高校的信息化經(jīng)歷了30年的歷程,從以網(wǎng)絡(luò)硬件建設(shè)為核心的網(wǎng)絡(luò)化的高校到以系統(tǒng)構(gòu)建為核心的數(shù)字高校,向著以智能服務(wù)為主導(dǎo)的智慧高校的方向發(fā)展。與此對應(yīng)的是,高校的資料處理系統(tǒng)從以網(wǎng)絡(luò)設(shè)備為主導(dǎo),逐步轉(zhuǎn)向計算、存儲、網(wǎng)絡(luò)設(shè)備;從網(wǎng)絡(luò)數(shù)據(jù)的交流,逐步轉(zhuǎn)向高校教學(xué)、科研和學(xué)工;各種數(shù)據(jù)存儲、處理業(yè)務(wù)轉(zhuǎn)變?yōu)閿?shù)據(jù)存儲、處理等業(yè)務(wù),并伴隨著數(shù)據(jù)存儲服務(wù)的不斷增多,高校數(shù)據(jù)中心容量逐漸增大。
目前,各高校的數(shù)據(jù)處理系統(tǒng)均采用了虛擬技術(shù)進行各類設(shè)備的整合,但隨著“互聯(lián)網(wǎng)+”教學(xué)理念的推進,隨著高校信息化建設(shè)的發(fā)展,許多問題暴露出來。一是,由于高校信息化水平提升,目前的教學(xué)條件已不能適應(yīng)新形勢;二是,IT系統(tǒng)的集中化導(dǎo)致了虛擬化的快速發(fā)展,對維護管理工作提出了嚴(yán)峻的要求,因此,提高企業(yè)運行的效能、降低企業(yè)職工的工作壓力已成為當(dāng)前亟待解決的問題;三是,多個虛擬平臺相互分離,沒有一個統(tǒng)一的管理系統(tǒng)用來實現(xiàn)系統(tǒng)的集中化。為了確保高校的信息系統(tǒng)能夠與時俱進,確保高校中的計算能力不會產(chǎn)生“孤島”現(xiàn)象,高??梢詫F(xiàn)有的計算資源進行集成和擴展,利用云計算技術(shù),實現(xiàn)對系統(tǒng)的高效集成。
虛擬化技術(shù)包括網(wǎng)絡(luò)技術(shù)、硬件技術(shù)、內(nèi)存技術(shù)、CPU和虛擬化應(yīng)用系統(tǒng)等。
虛擬化是云計算的一項關(guān)鍵技術(shù),它通過服務(wù)器、網(wǎng)絡(luò)、內(nèi)存等不同的實體資源,將抽象的數(shù)據(jù)轉(zhuǎn)化為更直觀的產(chǎn)品,從而為云計算應(yīng)用提供更多的支持。虛擬化技術(shù)具有不受限于現(xiàn)有資源和環(huán)境的特點。
云計算需要確保大量用戶同時并行,為了實現(xiàn)特定的目標(biāo)或者任務(wù),在復(fù)雜的基礎(chǔ)上,可以迅速地響應(yīng)并執(zhí)行任務(wù),從而增強用戶的使用體驗。MapReduce正是以這種思路為基礎(chǔ)的一種基于云計算任務(wù)計劃模式的編程模型。
云計算在滿足海量用戶需求的同時,也面臨著海量數(shù)據(jù),因此,在存儲方式、存儲安全性等方面,都要采取分布式的架構(gòu),以便在網(wǎng)絡(luò)中某個節(jié)點發(fā)生故障時,、可以確保存儲在不同位置的數(shù)據(jù)的安全性和可塑性。
例如,谷歌的數(shù)據(jù)管理技術(shù)和Hadoop開放源碼的數(shù)據(jù)管理模塊Hbase可以實現(xiàn)對數(shù)據(jù)進行分組讀取和存儲,從而大大提高了云計算的反應(yīng)能力。
結(jié)合信息化建設(shè)的目的和基本原理,基于云計算、數(shù)據(jù)中心等技術(shù)規(guī)范的數(shù)據(jù)中心服務(wù)架構(gòu)隨之誕生。該架構(gòu)顯示出基于云計算技術(shù)的高校數(shù)據(jù)中心的整體結(jié)構(gòu),在最下面的是一個資源,它包含了所有的實體設(shè)備,將服務(wù)器、網(wǎng)絡(luò)裝置及其他硬件視為一個整合的資源庫,并以特定的規(guī)模進行運作。虛擬化層次是基于對資源庫的需求進行選擇,然后按照需要產(chǎn)生相應(yīng)的虛擬機器。管理員要對用戶、服務(wù)器、網(wǎng)絡(luò)等進行統(tǒng)一管理,并能夠選擇性地進行資源打包,以確保虛擬機的高效性。應(yīng)用服務(wù)層是以用戶為中心的,可以為用戶提供多種服務(wù)。運營商在應(yīng)用服務(wù)層面上增加了多年積累的軟件,使其能夠共享企業(yè)的業(yè)務(wù)資源,并能快速地構(gòu)建出所需的應(yīng)用系統(tǒng)。
高校數(shù)據(jù)中心主要包括基礎(chǔ)設(shè)施、信息支持服務(wù)、應(yīng)用服務(wù);由運行管理系統(tǒng)和安全保密體系組成,保證了系統(tǒng)的安全性。該體系結(jié)構(gòu)涉及實體資源和網(wǎng)絡(luò)系統(tǒng)、存儲系統(tǒng)、計算系統(tǒng)三部分,用以支持系統(tǒng)的運作:資源池是通過對服務(wù)器、網(wǎng)絡(luò)、存儲等基礎(chǔ)資源的虛擬化,從而實現(xiàn)資源的靈活生成、調(diào)度和管理;網(wǎng)絡(luò)支持用戶獲得信息服務(wù),方便用戶經(jīng)過相應(yīng)的認證接入網(wǎng)絡(luò)系統(tǒng),并為其提供運行支持、核心服務(wù)、共享服務(wù)和系統(tǒng)服務(wù)。高校數(shù)據(jù)中心的主要功能包括:即時信息傳輸,數(shù)據(jù)庫訪問,軟件資源管理;流式業(yè)務(wù)、協(xié)作業(yè)務(wù)、資訊整合業(yè)務(wù);等等。高校數(shù)據(jù)中心的經(jīng)營分為軟體與資訊兩大范疇。在軟體環(huán)境中,資訊服務(wù)的架構(gòu)分為兩類:樹形與柵格形。其中,安全性主要是通過網(wǎng)絡(luò)、主機、應(yīng)用和數(shù)據(jù)層面來實現(xiàn)的,而加密技術(shù)主要利用通道和口令來完成信息的傳輸、處理和存儲。
1.硬件高可用設(shè)計
高校數(shù)據(jù)中心采用雙路供電、交換機堆疊、分布式部署,以保證整個數(shù)據(jù)中心在發(fā)生硬件故障后不影響整體業(yè)務(wù)的正常運轉(zhuǎn)。數(shù)據(jù)中心可以采取下列高可用的硬件方案。(1)每個伺服器均采用雙電源,并可同時連接兩路AC,以確保即使有一路電源被切斷,也可保持工作狀態(tài)。(2)訪問開關(guān)和核心開關(guān)均為雙層,每臺服務(wù)器通過網(wǎng)卡進行交叉連接,以確保高可靠的數(shù)據(jù)傳送。在啟動兩個交換機時,其中一臺成為堆疊主機,另一臺成為堆疊備機。高可用的備用程序在主設(shè)備和備用設(shè)備之間進行。(3)故障域指單個機房內(nèi)開關(guān)或電力裝置引起的最大故障的區(qū)域,一般是一臺或一套機柜。數(shù)據(jù)中心應(yīng)盡可能地將管理節(jié)點、核心交換機和磁盤陣列分布在不同的失效區(qū)域,以防止由于一個錯誤區(qū)域的異常而造成整個模塊無法使用。(4)利用兩個磁盤構(gòu)造RAID1來安裝基本操作系統(tǒng)。RAID1是RAID的最高安全保障,可以在兩個硬盤上同時讀寫,并提供100%的數(shù)據(jù)冗余,確保一個硬盤在損壞后不會對整個系統(tǒng)造成任何影響。
2.管理節(jié)點高可用設(shè)計
管理節(jié)點的作用是控制、監(jiān)控和調(diào)度整個平臺的資源,作為用戶在云端平臺上的控制臺,負責(zé)分發(fā)和回收資源。管理節(jié)點一旦發(fā)生故障,會導(dǎo)致管理服務(wù)無法正常運行,對運行管理、監(jiān)控報警、用戶訪問等都將產(chǎn)生一定的影響;而作業(yè)的自動化也將會對平臺或承租人的運營造成很大的影響。為了確保管理控制臺的可用性,數(shù)據(jù)中心必須使用高可用技術(shù)。云計算平臺提供了一個HA(HighA-vailability)的 雙管理結(jié)點,具有初始化、配置、維護等功能。在此基礎(chǔ)上,云計算平臺對各個管理結(jié)點進行了單獨的分配,從而解決了整個機箱降電平臺的管理問題。
3.虛擬機高可用設(shè)計
云計算是一種集成多個服務(wù)器的系統(tǒng),是一個具有共享資源的集群,可以實時監(jiān)控整個集群內(nèi)服務(wù)器和虛擬機的運行狀況。當(dāng)某個服務(wù)器出現(xiàn)故障時,云平臺會繼續(xù)進行檢測,一旦確認該伺服器宕機,所有受到影響的虛擬機就會立刻重新啟動資源池中的閑置伺服器,以確保服務(wù)的持續(xù)性。虛擬機高可用模式可以減少故障和IT服務(wù)的中斷,而無須利用額外的硬件或整合其他軟件,也可以避免由于單個操作系統(tǒng)或特定應(yīng)用程序的錯誤交換而導(dǎo)致的高額費用和高復(fù)雜度。
在存儲資源上,數(shù)據(jù)中心使用了超融合的分布式存儲技術(shù),每個云服務(wù)器均配備4個SSD和若干HDD。兩個SSD作為云計算平臺,兩個作為緩存。為防止系統(tǒng)出現(xiàn)單一故障,數(shù)據(jù)中心應(yīng)使用RAID1模式,并使用磁盤鏡像實現(xiàn)數(shù)據(jù)冗余。云計算服務(wù)器的數(shù)據(jù)是由分布式存儲實現(xiàn)的,它使用了多個拷貝的方法來確保數(shù)據(jù)的安全性。另外,2個高校數(shù)據(jù)中心各有2個數(shù)據(jù)庫服務(wù)器、本地2個SAN存儲器,以實現(xiàn)局域雙活體系結(jié)構(gòu),并利用同步工具對數(shù)據(jù)庫數(shù)據(jù)進行實時傳輸,實現(xiàn)了高校內(nèi)局部雙重活化與實時同步。在網(wǎng)絡(luò)資源方面,數(shù)據(jù)中心實現(xiàn)了主、備數(shù)據(jù)中心的即時通信;在2所高校的2個校區(qū)內(nèi),各配置2個核心交換機,采用2個較大的二次纖維網(wǎng)絡(luò)相連通。數(shù)據(jù)中心采用管理網(wǎng)、存儲網(wǎng)和服務(wù)網(wǎng)絡(luò),采用2臺千兆和4臺萬兆開關(guān),以防止單一故障;2個交換機獨立運行。數(shù)據(jù)中心在制造系統(tǒng)中使用了兩種不同的技術(shù),即4個萬兆口和2個1000兆口,使存儲網(wǎng)、業(yè)務(wù)網(wǎng)和管理網(wǎng)完全分開。2所高校的數(shù)據(jù)中心在災(zāi)難備份方面,均配備了后備系統(tǒng),并通過備份軟件實現(xiàn)了對應(yīng)用的實時備份;在備用中心的云計算系統(tǒng)中,采用備份系統(tǒng)來恢復(fù)資料,確保了系統(tǒng)的安全。
利用先進的云計算技術(shù),可以更新高?;A(chǔ)設(shè)施,從而打造虛擬化、靈活高效、便于管理的云數(shù)據(jù)中心。在此基礎(chǔ)上,構(gòu)建基于云計算的高校數(shù)據(jù)中心,可以為高校網(wǎng)絡(luò)的建設(shè)提供巨大的技術(shù)支撐和發(fā)展空間。