唐國(guó)純
(瓊臺(tái)師范學(xué)院信息科學(xué)技術(shù)學(xué)院,海南 ???571100)
隨著新一代信息通信技術(shù)(如大數(shù)據(jù)、物聯(lián)網(wǎng)、云計(jì)算、移動(dòng)互聯(lián)網(wǎng)等)被廣泛應(yīng)用在各種領(lǐng)域,高校信息資源的整合,尤其是數(shù)據(jù)的整合,已成為智能校園建設(shè)的重要一環(huán)。在教育大數(shù)據(jù)的構(gòu)建中,我國(guó)高校由于數(shù)據(jù)資產(chǎn)意識(shí)薄弱,數(shù)據(jù)缺乏規(guī)范性和統(tǒng)一管理,導(dǎo)致建立起科學(xué)規(guī)范的高校云數(shù)據(jù)中心困難重重。針對(duì)海量的高校數(shù)據(jù)資源,如何有效的實(shí)施數(shù)據(jù)整合,開(kāi)展其數(shù)據(jù)的挖掘分析與預(yù)測(cè),發(fā)掘出潛在的數(shù)據(jù)價(jià)值成為智慧校園建設(shè)的一部分。
根據(jù)云系統(tǒng)建設(shè)單位要求的不同,需要解決不同的需求問(wèn)題。當(dāng)前高校信息云中心一般包括教學(xué)云中心、學(xué)習(xí)云中心、后勤云中心、科研云中心、招生就業(yè)云中心等。計(jì)算集群系統(tǒng)是云系統(tǒng)中的重要組成部分,主要包括網(wǎng)絡(luò)、存儲(chǔ)、計(jì)算、診斷和基礎(chǔ)架構(gòu)五個(gè)子系統(tǒng)。對(duì)于云系統(tǒng)的建設(shè),可根據(jù)不同的需求建造不同的云類(lèi)型,如服務(wù)云和存儲(chǔ)云。
高校中存在著海量的數(shù)據(jù)信息。既包括學(xué)生的招生,檔案,學(xué)習(xí),校園生活,就業(yè)等信息,也包括教師的人事檔案,教學(xué),科研,校園生活等信息,此外它還包括行政部門(mén)人事檔案,工作,服務(wù)考核以及學(xué)校的資產(chǎn)信息[1]。隨著云計(jì)算、移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等新技術(shù)廣泛使用,師生通過(guò)微博、微信、各種短視頻、云視頻會(huì)議等信息平臺(tái)也產(chǎn)生了大量的數(shù)據(jù)。上述信息具有數(shù)據(jù)量大、結(jié)構(gòu)復(fù)雜、頻率快等特點(diǎn)。高校數(shù)據(jù)資源特性體現(xiàn)在:①分散性:高校信息云中心的數(shù)據(jù)資源都存儲(chǔ)在各自的數(shù)據(jù)中心,主要是由高校院系、行政、師生等服務(wù)對(duì)象生成的主要數(shù)據(jù),并以各種組織形式存儲(chǔ)。②海量性:一是來(lái)自云平臺(tái)的各種實(shí)時(shí)數(shù)據(jù)一直存儲(chǔ)在不同的云中。二是不同云中數(shù)據(jù)資源因交互協(xié)作也會(huì)產(chǎn)生大量的數(shù)據(jù)。③多源性[2]:主要體現(xiàn)在高校數(shù)據(jù)資源來(lái)源和種類(lèi)豐富。一是各類(lèi)云端設(shè)備產(chǎn)生的各種數(shù)據(jù)。二是云用戶(hù)因各種交互活動(dòng)而產(chǎn)生的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。④異構(gòu)性:主要指不同云成員的數(shù)據(jù)資源的組織和存儲(chǔ)形式差異。⑤資產(chǎn)和價(jià)值:數(shù)據(jù)資源可視為無(wú)形資產(chǎn)和價(jià)值。數(shù)據(jù)集成的目標(biāo)是對(duì)集成的云數(shù)據(jù)庫(kù)中心進(jìn)行數(shù)據(jù)挖掘分析,形成可視化的管理和決策信息。
數(shù)據(jù)提取與集成中要解決的主要問(wèn)題是動(dòng)態(tài)收集各種零碎的數(shù)據(jù),清洗數(shù)據(jù),統(tǒng)籌數(shù)據(jù)標(biāo)準(zhǔn),進(jìn)行數(shù)據(jù)分析。由于建設(shè)資金巨大,許多高校往往分階段完成信息化建設(shè),在管理信息系統(tǒng)的早期設(shè)計(jì)中沒(méi)有考慮一些過(guò)程數(shù)據(jù)的采集和集成,需要對(duì)應(yīng)用系統(tǒng)進(jìn)行擴(kuò)展,采集數(shù)據(jù)源,并在分析過(guò)程中將它們匯入云數(shù)據(jù)中心。同時(shí),異構(gòu)的數(shù)據(jù)類(lèi)型、廣泛的數(shù)據(jù)源等因素給數(shù)據(jù)集成造成了困難。高校要打造依托大數(shù)據(jù)的智慧校園,必須統(tǒng)籌構(gòu)建結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)集成的全局標(biāo)準(zhǔn),保證數(shù)據(jù)采集質(zhì)量。此外,由于高校半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的快速增長(zhǎng),傳統(tǒng)的聚類(lèi)和關(guān)聯(lián)分析等數(shù)據(jù)挖掘技術(shù)面臨新的挑戰(zhàn)[3-4]。它主要體現(xiàn)在各種云服務(wù)對(duì)數(shù)據(jù)的實(shí)時(shí)分析需求以及多源數(shù)據(jù)關(guān)聯(lián)關(guān)系的復(fù)雜性。高校需要在信息化建設(shè)部門(mén)中設(shè)置大數(shù)據(jù)小組,研究可靠的數(shù)據(jù)分析方法。另外,在高校數(shù)據(jù)集成過(guò)程中,由于各種數(shù)據(jù)關(guān)聯(lián)關(guān)系的復(fù)雜性、數(shù)據(jù)維度的多樣性,以及數(shù)據(jù)的安全性和隱私性問(wèn)題,如何使用多維疊加數(shù)據(jù)可視化模型,有效反應(yīng)數(shù)據(jù)的時(shí)空變化與比較等可視化顯示數(shù)據(jù)的方法,如何保證高校的數(shù)據(jù)安全和師生的隱私保護(hù),也是一個(gè)值得關(guān)注的問(wèn)題。
信息資源整合按其技術(shù)層次可將其分為標(biāo)準(zhǔn)和規(guī)范層、整合基礎(chǔ)網(wǎng)絡(luò)層、整合數(shù)據(jù)層、整合平臺(tái)和應(yīng)用層[5]。 因SDN 的開(kāi)放和可編程性易于實(shí)施全網(wǎng)管控,可有效滿(mǎn)足云數(shù)據(jù)中心網(wǎng)絡(luò)的需求[6]。隨著云計(jì)算,SDN 和大數(shù)據(jù)技術(shù)的不斷發(fā)展應(yīng)用,一種云計(jì)算和大數(shù)據(jù)的高校數(shù)據(jù)整合架構(gòu)如圖1 所示。
其中,SDN 網(wǎng)絡(luò)架構(gòu)要用于實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)設(shè)備的集中管理和控制;基礎(chǔ)設(shè)施服務(wù)主要對(duì)網(wǎng)絡(luò)資源進(jìn)行管理,以服務(wù)的方式動(dòng)態(tài)按需分配,進(jìn)行虛擬資源配置;云管理平臺(tái)主要用于實(shí)現(xiàn)高校云系統(tǒng)的集中管控,通過(guò)SDN 控制器實(shí)現(xiàn)對(duì)數(shù)據(jù)中心資源(計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)等)全局配置。
SDN 一般有單一集中控制和分布式控制方式。單一集中控制方式如圖2 所示。
單一集中控制模式通常適用于中型網(wǎng)絡(luò),但對(duì)性能影響不大。然而,對(duì)于大型網(wǎng)絡(luò),為了保證性能,需要采用多線(xiàn)程方式。如果采用單一集中控制模式來(lái)處理交換機(jī)請(qǐng)求,那么控制器跟其他域中的交換機(jī)間可能產(chǎn)生顯著的延遲現(xiàn)象。此外,它還會(huì)影響網(wǎng)絡(luò)處理性能。如果網(wǎng)絡(luò)的規(guī)模增加,會(huì)導(dǎo)致性能處理不可接受。另外,單節(jié)點(diǎn)故障可能發(fā)生在單集中控制中,可以通過(guò)增加控制器的數(shù)量來(lái)解決,即通過(guò)邏輯集中控制將控制器物理分布在網(wǎng)絡(luò)中。這允許每個(gè)交換機(jī)與控制器交互,以增強(qiáng)網(wǎng)絡(luò)的總體性能。分布式控制器通常有兩種模式。第一種是扁平控制方式(如圖3所示),第二種是層次控制方式(如圖4 所示)[7]。
扁平控制模式要求將所有控制器放置在不相交區(qū)域并管理它們自身所在的網(wǎng)絡(luò)。每個(gè)控制器經(jīng)東西方向接口相互通信,作用平等。故而在扁平控制模式下,所有控制器處于同一層面,每個(gè)控制器在物理上位于不同的區(qū)域[8]。所有的控制器邏輯上都可以作為全局控制器來(lái)管控整個(gè)網(wǎng)絡(luò)而實(shí)時(shí)動(dòng)態(tài)更新,交換機(jī)只要調(diào)整與控制器地址的映射,對(duì)數(shù)據(jù)層影響不大。扁平控制模式的缺點(diǎn)是每個(gè)控制器只控制本地網(wǎng)絡(luò),掌握整個(gè)網(wǎng)絡(luò)的狀態(tài),造成一定的資源浪費(fèi),在網(wǎng)絡(luò)更新時(shí)增加了控制器的整體負(fù)載而使性能受到影響。另外,在實(shí)際應(yīng)用中,如果不同域歸的運(yùn)營(yíng)商有差異,則很難保證不同域的控制器間的平等通信問(wèn)題。層次控制模式體現(xiàn)了控制器間的縱向管控能力。既局部控制器管控自己的網(wǎng)絡(luò),全局控制器管控局部控制器及其間的交互。層次控制器之間的相互通信有兩種類(lèi)型:一是局部控制器和全局控制器間的相互通信,二是全局控制器間的相互通信。對(duì)于不同的操作域,只需要協(xié)調(diào)全局控制器間的相互通信。該方法防止了全局控制器繼續(xù)不斷的交互,可靠地減少了流量負(fù)載。因?yàn)樵摲椒耐杏诒镜乜刂破魈幚硇畔⒌拿新?,所以在局部?yīng)用較多的情境中表現(xiàn)出良好的執(zhí)行效率。
作為高校云數(shù)據(jù)中心來(lái)說(shuō),整個(gè)網(wǎng)絡(luò)通常可劃分出三個(gè)層次,分別是物理設(shè)備層、局部網(wǎng)絡(luò)控制層和全局控制層[9-10]。高校的智慧校園構(gòu)建中,一個(gè)業(yè)務(wù)領(lǐng)域通常對(duì)應(yīng)著一個(gè)數(shù)據(jù)中心,比如教師數(shù)據(jù)中心,學(xué)生數(shù)據(jù)中心等。一般來(lái)說(shuō),第一層的物理交換機(jī)和第二層的控制器在每個(gè)數(shù)據(jù)中心內(nèi)的出口處均有布置,且第三層的SDN 網(wǎng)關(guān)和流量工程TE(Traffic Engineering)服務(wù)器要在一個(gè)全局統(tǒng)一的控制區(qū)域。因而SDN 層次控制方式較為適合,如果為了考慮集中控制和穩(wěn)定的可靠性,在經(jīng)費(fèi)保障的情況下,可結(jié)合扁平控制和層次控制的各自?xún)?yōu)點(diǎn),采用混合控制方式,如圖5 所示。
采用SDN 混合控制方式,第二層可根據(jù)需要在每個(gè)數(shù)據(jù)中心出口配置一臺(tái)或多臺(tái)配置控制器服務(wù)器,服務(wù)器經(jīng)SDN Gateway,可依托每個(gè)數(shù)據(jù)中心的控制器采集鏈路信息進(jìn)行掌控,對(duì)新業(yè)務(wù)進(jìn)行按需配置,并幫它挑揀出一條最優(yōu)路徑,生成業(yè)務(wù)相對(duì)應(yīng)的流,經(jīng)控制器配置在交換機(jī)上,與挑揀的路徑進(jìn)行捆綁,從而整體上使鏈路達(dá)到最優(yōu)配置。
本文對(duì)高校云數(shù)據(jù)中心模式進(jìn)行研究,系統(tǒng)梳理了高校信息資源的類(lèi)型、數(shù)據(jù)特征與數(shù)據(jù)整合困境,研究了基于SDN 的網(wǎng)絡(luò)控制,給出了“基于SDN 和大數(shù)據(jù)的高校云數(shù)據(jù)中心的設(shè)計(jì)”方案,期望為高校云數(shù)據(jù)中心建設(shè)提供一定的參考依據(jù)。