呂守向 湯紫雄
(福州理工學院 福建 福州 350506)
SD-EON繼承了軟件定義網(wǎng)絡(SDN)轉(zhuǎn)發(fā)與控制[1]解耦的優(yōu)勢,在應對云計算環(huán)境下隨機突發(fā)數(shù)據(jù)流承載方面發(fā)揮出了顯著的服務質(zhì)量(QoS)成效。尤其在大數(shù)據(jù)等眾多新型業(yè)務快速發(fā)展的背景下SD-EON上的多波長業(yè)務流類型和數(shù)量都將呈現(xiàn)多元化,此時不可避免地出現(xiàn)大象流和老鼠流[2]并存的局面。為了提供優(yōu)質(zhì)QoS保障,SD-EON架構中的控制層必須實施全網(wǎng)狀態(tài)偵測、基于流特征區(qū)分的節(jié)能局向方案制定、基于業(yè)務等級(CoS)波長通道動態(tài)配置等一系列關于QoS的管控策略。然而在高效調(diào)度多媒體流期間一旦遭遇控制信道故障勢必引發(fā)部分交換機轉(zhuǎn)發(fā)數(shù)據(jù)失效的局面。若該控制信道肩負著全網(wǎng)控制單元和全網(wǎng)交換機之間調(diào)度指令重任,那么無疑將會使整個SD-EON陷入癱瘓[3]??上攵?,在云計算和大數(shù)據(jù)背景[4]下SD-EON架構在發(fā)揮QoS優(yōu)勢時,其控制平面的穩(wěn)健性也同樣面臨潛在的危機。因此在當前云計算和大數(shù)據(jù)等新型技術廣泛部署的背景下研究一個穩(wěn)健性較高的SD-EON與之協(xié)作很有必要。
雖然此前也曾有過不少關于SD-EON穩(wěn)健性問題的相關探討,但是受限于這些研究的瓶頸而總是未能被高效地推廣實施。以文獻[5]為代表的研究就曾提出一個多維度管控策略來增強SD-EON應對海量流媒體業(yè)務的控制能力。該策略原理是在以太網(wǎng)絡中定義一個保護機制并交由專用的主機來控制,然后將該保護機制嵌入到因特網(wǎng)協(xié)議層和數(shù)據(jù)鏈路層中用于實施控制信令的轉(zhuǎn)發(fā)配置。此舉雖在一定程度上良好地保障了控制平面在調(diào)度流媒體業(yè)務期間的可靠性,卻不足以應對云計算環(huán)境下海量大數(shù)據(jù)業(yè)務的承載??梢娫摬呗韵碌腟D-EON控制平面僅在有限規(guī)模的網(wǎng)絡中才具備可靠的保障性,因此并不具備普適性。
為彌補上述策略的不足,文獻[6]在SD-EON上規(guī)劃了重路由高速自愈和1∶1備份保護自愈兩種抗毀技術來應對大數(shù)據(jù)背景下重載網(wǎng)絡的集中式管控問題。然而實際部署過程卻發(fā)現(xiàn)兩種抗毀技術均存在預置資源過度冗余的弊端。為了克服該弊端,文獻[7]試圖通過對多種拓撲網(wǎng)絡的控制層展開大量分析,求證控制單元的放置對全網(wǎng)管控的效力。實驗表明在SD-EON中科學放置控制單元的前提下全網(wǎng)僅需部署唯一的控制單元即可最小化網(wǎng)絡資源的冗余度并且具有良好的控制時效性。受限于控制單元數(shù)量的唯一性,該情形下的全網(wǎng)業(yè)務調(diào)度對該控制單元產(chǎn)生很高的依賴性。尤其在調(diào)度大規(guī)模波長業(yè)務時,全網(wǎng)對控制資源偏好度更為凸顯。為了避免該控制單元超負荷開銷導致計算精度失效的潛在風險,文獻[8]提出SD-EON多控制器放置和交叉保護算法。該算法雖良好地取得了雙效卻忽略了交換轉(zhuǎn)發(fā)單元在某一個時隙同時執(zhí)行來自不同控制單元下發(fā)的控制信令時可能存在沖突的情形。究其原因在于缺乏對控制單元優(yōu)先權的定義。為了避免控制單元在下發(fā)控制信令時對交換轉(zhuǎn)發(fā)單元造成指令沖突,文獻[9]提議將權威交換轉(zhuǎn)發(fā)單元設置為優(yōu)先權較低的控制單元,通過這種方式弱化SD-EON對那些優(yōu)先權較高的單控制器的好感度。然而該提議始終只討論權威交換轉(zhuǎn)發(fā)單元在固定網(wǎng)絡狀態(tài)下的部署情況。同時文獻[10]在研討SD-EON控制單元安置的科學性與控制平面可靠性的關聯(lián)度基礎上構思了一種基于圖切理論的分區(qū)安置方案。實踐表明在該分區(qū)安置方案下控制單元僅在域內(nèi)才表現(xiàn)出良好的可靠性,不足以在域間可靠地實施控制作業(yè)。文獻[11]所建立的基于整數(shù)線性模型的可靠性算法旨在探索SD-EON中控制單元和交換轉(zhuǎn)發(fā)網(wǎng)元間符合局向分離的最大光通道規(guī)模以便優(yōu)化控制單元部署的科學性。但該模型應用在云計算環(huán)境下開展大規(guī)模數(shù)據(jù)計算時所求的解缺乏全局性。甚至在大規(guī)模網(wǎng)絡中較為突出的由網(wǎng)元和控制單元之間物理間距引發(fā)的控制時效性問題,在所規(guī)劃的算法模型中并未被提及。文獻[12]結合帕累托理論為SD-EON設計的控制單元邊緣部署算法在一定程度上解決了前述文獻研究中無法兼顧控制平面可靠性、時效性和全局性等問題,然而對于交換轉(zhuǎn)發(fā)單元執(zhí)行多控制指令的沖突問題依舊束手無策。
綜上所述,目前圍繞SD-EON控制層面的主流研究仍有較大的可持續(xù)改進空間。可通過設計分布式提升方案來實現(xiàn)穩(wěn)健性目標。具體思路為:(1) 在基于一定的約束前提下從邏輯上將整個SD-EON網(wǎng)絡進行縱向切割,割離出多個分區(qū)。(2) 在每個分區(qū)子網(wǎng)內(nèi)引入分區(qū)控制單元(SCU)和低優(yōu)先權交換轉(zhuǎn)發(fā)單元(LPT)。SCU負責對分區(qū)子網(wǎng)內(nèi)的多波長顆粒和跨層調(diào)度作業(yè)的局部性管控,以及將控制平面對攜帶大數(shù)據(jù)的多波長業(yè)務實施集中式管控期間潛在的可靠性風險分派[13]到各分區(qū)子網(wǎng),從而使控制平面的故障風險在可化解范圍內(nèi)。同時在每一個分區(qū)子網(wǎng)內(nèi)配置若干個LPT用于應對控制平面因遭遇故障引發(fā)可靠性風險問題時,能夠?qū)嵤┹^小范圍內(nèi)的波長顆粒管控,從而使控制平面的可靠性風險問題在最短時間內(nèi)被排除。(3) 在全網(wǎng)范圍內(nèi)配置一個統(tǒng)籌控制單元(OCU)用于實施全局網(wǎng)絡中多波長顆粒和跨層調(diào)度作業(yè)的全局性管控。(4) 結合跨層調(diào)度模型為控制平面的信令設計出具有良好生存能力的局向信道并將其嵌入到SD-EON中為云計算環(huán)境下攜帶了大數(shù)據(jù)的多波長業(yè)務調(diào)度提供可持續(xù)性部署方案。根據(jù)所述的分布式立體化設計思路,本文構思了一種縱向管控部署下的嵌入式SD-EON穩(wěn)健性算法,旨在從全局角度出發(fā)規(guī)劃一種既能突破資源偏好度約束又能克服傳統(tǒng)研究方案所不能兼顧的多指標問題的方法。
部署控制單元必須在符合SD-EON集中管控的情形下進行。在此約束下通過在控制平面上放置一定數(shù)量的控制單元,并對全網(wǎng)執(zhí)行縱向切割將SD-EON分割出具有不同優(yōu)先權[14]的控制平面。自低向高依次為低優(yōu)先權控制平面、中優(yōu)先權控制平面、高優(yōu)先權控制平面。其中:將LPT定義為低優(yōu)先權控制單元,用于管控多波長業(yè)務顆粒和控制指令的配置并確??刂破矫嬖谠庥龉收虾髮嵤┳杂臅r間周期最小化;將SCU定義為中優(yōu)先權控制單元以降低整個控制平面對OCU資源的偏好度,并確保分區(qū)內(nèi)的故障修復能力;將OCU定義為高優(yōu)先權控制單元,用于提取跨分區(qū)、跨層等多波長顆粒調(diào)度期間的全網(wǎng)實時參量狀態(tài)。所設計的縱向管控部署模型如圖1所示。通過建立基于不同管控優(yōu)先級縱向模型為控制平面選取合適的位置植入相應數(shù)量控制單元的優(yōu)勢不僅在于可規(guī)避SD-EON在調(diào)度多波長業(yè)務時出現(xiàn)多個控制單元指令沖突的風險,并可緩解在此期間對某一特定控制單元產(chǎn)生過度的資源偏好現(xiàn)象。具體而言,其風險規(guī)避思想為若存在多個控制單元同時向某一個交換轉(zhuǎn)發(fā)網(wǎng)元下發(fā)控制信令,則優(yōu)先級較低的控制單元信令首先被該交換轉(zhuǎn)發(fā)網(wǎng)元丟棄。顯然該縱向切割模型不僅解決了控制指令沖突問題也能降低海量求解運算對單一控制單元的計算資源偏好。為了避免SD-EON中OpenFlow交換設備和控制平面鏈接出現(xiàn)失效,要求OpenFlow交換設備在和一個主用LPT建立鏈接的同時也要和至少一個以上的備用LPT建立鏈接。同時定義一個可獲取分區(qū)內(nèi)部網(wǎng)絡參量和拓撲信息的感知交換節(jié)點(SE)用于配合SCU收集分區(qū)子網(wǎng)的狀態(tài)。由于多個LPT和SE所放置的位置均不同,確保了網(wǎng)絡狀態(tài)提取通道和控制單元下發(fā)流表項通道具備無相關性。也就是說控制平面在雙向路由期間遭遇同時失效風險的概率極其低,這樣的設計思想在一定程度上提高了控制平面的穩(wěn)健性,同時也有別于傳統(tǒng)研究設計。
圖1 縱向管控模型設計
由縱向管控模型設計所述可知,控制平面的穩(wěn)健性與控制單元的方位和規(guī)模息息相關。為更好地提升縱向管控效力,在制定縱向管控目標之前首先對該模型的相關參數(shù)做如下定義:令SD-EON中的網(wǎng)元vLPT、網(wǎng)元vSE、網(wǎng)元vSCU、網(wǎng)元vOCU形成的網(wǎng)元集合為V;令全網(wǎng)各網(wǎng)元之間的鏈路集合為E,則整個SD-EON的拓撲結構可表征為G=(V,E);同時,定義分區(qū)子網(wǎng)x內(nèi)的節(jié)點集合為Nx,其中網(wǎng)元SE的節(jié)點集合為vx→SE,于是有vx→SE∈Nx。將Nx內(nèi)的vx→SE之外的網(wǎng)元節(jié)點集合記作Nx -(vx→SE),并假設網(wǎng)元vx -(vx→SE)∈Nx-(vx→SE)。要提高全網(wǎng)波長業(yè)務調(diào)度期間的管控效率,要求SE在最短時間內(nèi)偵測到網(wǎng)絡實時參量并令LPT迅速將流表項下發(fā)給交換轉(zhuǎn)發(fā)網(wǎng)元,同時讓SCU以最小的時間成本在分區(qū)子網(wǎng)內(nèi)形成低優(yōu)先權的管控。若要實現(xiàn)這樣的部署目標,則需同時滿足以下四個目標函數(shù)。
相比較文獻[15]所提支配極小化機制,縱向管控方案采用極小化覆蓋方式為控制單元規(guī)劃數(shù)量和方位,對于SD-EON控制平面穩(wěn)健性而言更符合全網(wǎng)集中管控的要求,更具優(yōu)勢。其原因可通過下列證明過程獲悉。
首先,假設網(wǎng)元子集I為網(wǎng)元子集V的一個子集,且I定義為全網(wǎng)節(jié)點規(guī)模最小化覆蓋。對于那些不屬于I的隨機網(wǎng)元m而言,將和其建立鏈接狀態(tài)的鏈路集合記作K=(m,n),且m∈E,n∈E。將集合K內(nèi)除m以外的網(wǎng)元集合記作L=(n),且m∈K,n∈K。則|K|=|L|。若集合K和集合L規(guī)模均在兩個以上,且隨機網(wǎng)元m不屬于全網(wǎng)節(jié)點規(guī)模最小化覆蓋I,那么n∈I,于是有L?I。據(jù)此可知對于網(wǎng)元子集I而言,將存在超過兩個以上的網(wǎng)元和I集合以外的隨機網(wǎng)元m建立鏈接。因此在以無向圖G=(V,E)為代表的SD-EON拓撲結構中,若I為全網(wǎng)節(jié)點規(guī)模最小化覆蓋且所有網(wǎng)元均存在兩個以上連接度,則對隨機的I之外的網(wǎng)元m而言,最少存在兩個來自于I的網(wǎng)元和m鄰接。據(jù)此論證,縱向管控部署方案也就會出現(xiàn)兩個以上的控制網(wǎng)元和單個交換轉(zhuǎn)發(fā)網(wǎng)元節(jié)點建立鏈接的情況。這在很大程度上保證了SD-EON控制層面的穩(wěn)健性。此優(yōu)勢是支配極小化機制[15]所不具備的。以網(wǎng)元A-F構建的兩個拓撲為例做如下比較。假設每個拓撲中的六個網(wǎng)元所建立的光鏈路集均有l(wèi)A-B、lB-C、lD-C、lD-F、lF-A、lB-F、lF-C、lE-C、lE-F、lE-B。支配極小化機制下的拓撲圖中的網(wǎng)元F以vLPT形式存在并執(zhí)行流表轉(zhuǎn)發(fā)操作,同時將該網(wǎng)元定義為極小支配集合。其他五個網(wǎng)元均以OpenFlow交換機[16]的形式存在??v向管控方案下的拓撲具有相同的鏈路集。同樣假設網(wǎng)元B、網(wǎng)元C、網(wǎng)元F以vLPT形式存在并執(zhí)行流表轉(zhuǎn)發(fā)操作,同時將這三個網(wǎng)元視為極小化覆蓋。其他三個網(wǎng)元均以OpenFlow交換機的形式存在。在這樣的拓撲前提下假定網(wǎng)元D和網(wǎng)元F間的光鏈路遭遇失效,那么對于縱向管控方案下的拓撲而言,因其任意一個網(wǎng)元均存在與超過兩個以上的vLPT保持鏈接狀態(tài)使得網(wǎng)元D可經(jīng)由另外的vLPT接收到控制層面向其轉(zhuǎn)發(fā)的流表指令。相比而言,支配極小化機制下的拓撲因不具備此保障特性而使網(wǎng)元D未能接收到控制層面向其轉(zhuǎn)發(fā)的流表指令。為讓分區(qū)網(wǎng)絡中的SCU以最低時間成本偵聽到分區(qū)網(wǎng)絡狀態(tài)參量進而實施高度統(tǒng)籌管控,那么在規(guī)劃部署方案時將網(wǎng)元LPT和網(wǎng)元SE進行融合考慮是有必要的。
其次,既然I被定義為圖G全網(wǎng)節(jié)點規(guī)模最小化覆蓋,意味著網(wǎng)元子集I和圖G整個網(wǎng)絡中的邊具備關聯(lián)性。且圖G內(nèi)所有網(wǎng)元可受網(wǎng)元子集I來支配,因此網(wǎng)元子集I可以是圖G的支配集合。據(jù)此可知多個圖G中的最小支配集合可以視為網(wǎng)元集合I內(nèi)的子集。因此在以無向圖G=(V,E)為代表的SD-EON拓撲結構中,若I為全網(wǎng)節(jié)點規(guī)模最小化覆蓋,那么I可視為圖G的支配集合,同時多個圖G的極小支配集合都將作為I的子集來存在。據(jù)此論證,要使控制層面在最短時間內(nèi)偵測到故障風險參數(shù)將可能遭遇到的故障風險降到極限,控制單元的部署過程應先參照第一論證中最小化覆蓋I的準則來規(guī)劃網(wǎng)元LPT,再參照第二論證I中的支配集合規(guī)劃出網(wǎng)元SE并將網(wǎng)元SCU部署在網(wǎng)元SE上。然后再將網(wǎng)元OCU放置在所有網(wǎng)元SCU的中心地帶。
根據(jù)所述的縱向管控思想設計出如圖2所示的縱向管控方案。
圖2 縱向管控方案實施過程
使SD-EON具備良好的穩(wěn)健性不僅需要為控制單元統(tǒng)籌規(guī)劃出一個如前文所述的方位配置方案,同時也要考慮為那些向上提供網(wǎng)絡狀態(tài)偵聽傳輸、向下提供流表項更新的控制信道設計一個科學的資源路由規(guī)劃機制才能夠在保證控制單元穩(wěn)健性的同時也兼顧到整個控制平面的穩(wěn)健性。對于控制信道而言,其承擔著網(wǎng)絡狀態(tài)數(shù)據(jù)的收集和流表項資源的下發(fā)任務,該信道內(nèi)的交互式信令規(guī)模雖小但生存等級卻是最高的?;诖藢刂破矫嬲归_資源冗余規(guī)劃也是必要的。假設將SD-EON全網(wǎng)從資源的角度分為五個層,自頂向下依次為轉(zhuǎn)發(fā)層、接入層、光口層、時隙層、頻隙層。在此分層級結構設計中,網(wǎng)絡資源因顆粒規(guī)模漸大而使其使用率逐漸降低,同時規(guī)劃配置資源的時間開銷也相應降低。為最大程度降低因?qū)嵤┛刂浦噶顐鬏數(shù)墓饴酚赏ǖ酪?guī)模問題引發(fā)的控制層面故障風險,資源冗余規(guī)劃機制將那些在頻隙層中執(zhí)行路由計算的控制指令統(tǒng)一調(diào)度到光口層后再送至頻隙層。此舉旨在縮小實施信令承載調(diào)度的介質(zhì)規(guī)模以降低控制平面遭遇故障的可能性。整個資源冗余規(guī)劃機制的步驟為:首先根據(jù)前文所述的全局縱向配置方案思想自底向上依次配置出網(wǎng)元LPT、網(wǎng)元SCU、網(wǎng)元OCU并設立分區(qū)子網(wǎng),初始化鏈路集B(B為空)和OCU集λ′。為集合λ′范圍外的每一個SCU和LPT統(tǒng)計出到達集合λ′范圍內(nèi)網(wǎng)元間距最小的個體,并將這些SCU或LPT個體納入λ′,隨即把SCU / LPT與相應網(wǎng)元間的路由局向存入鏈路集B內(nèi)同時置其權重為零。如果得到的集合λ′和λ等同,那么保存該鏈路集B;如果不等同,那么重復執(zhí)行上一步驟。其次,從所保存的鏈路集B內(nèi)尋找某一個分區(qū)子網(wǎng)內(nèi)所有LPT與該分區(qū)子網(wǎng)的SCU最短路由局向,以及每一個分區(qū)子網(wǎng)中SCU和OCU的最短路由局向。根據(jù)多徑廣播防護策略[18]從全網(wǎng)中搜索出一個圈[19]中的路由用于為那些承載了OCU流表資源的鏈路集B內(nèi)的鏈路提供保護用途的防護局向。如果光口層在調(diào)度資源時出現(xiàn)緊缺情形,那么先從時隙層再從頻隙層調(diào)度更多的資源為前兩個步驟計算出的鏈路集B中的主用局向和防護局向分別調(diào)配充足的工作和防護資源。一旦控制層面遭遇失效風險,在局部分區(qū)子網(wǎng)內(nèi)開啟恢復策略。依次由次選分區(qū)子網(wǎng)、第三分區(qū)子網(wǎng)對應的LPT立即給受災網(wǎng)元vb轉(zhuǎn)發(fā)相應的流表資源;同時受災網(wǎng)元vb通過該流表轉(zhuǎn)發(fā)路由向其上層網(wǎng)元SCU提交所偵測到的網(wǎng)絡狀態(tài)參量。要是控制層面并未出現(xiàn)險情則默認由首選分區(qū)子網(wǎng)對應的LPT向vb傳輸相應的流表資源,同時該vb將所偵測到的網(wǎng)絡狀態(tài)參量提交至該分區(qū)子網(wǎng)所對應的SCU。不難看出,整個資源冗余規(guī)劃機制的目標有兩個:(1) 為交換機到SCU之間的上行單工控制路由、LPT到交換機之間的下行單工控制路由提供低時延的恢復自愈保障;(2) SCU到LPT之間的下行單工路由、SCU到OCU之間的雙工通信提供低時延的保護自愈保障。此雙自愈策略旨在為控制信道提供穩(wěn)健的生存能力和科學的資源調(diào)配方案。
圖3 平均恢復率1
圖4 平均恢復率2
圖5 平均失效風險率1
圖6 平均失效風險率2
此外,控制時延也是衡量SD-EON穩(wěn)健與否的重要標準。不同的組網(wǎng)結構對控制時延的要求有所差異。理想情況下,方案的部署需控制在相應的時延門限范圍內(nèi),盡可能以最低的控制成本把時延代價降至最小。圖7所示的時延代價示意圖內(nèi)縱坐標三個時延參量從小到大分別表示控制平面生存性時延代價要求[20]、環(huán)形網(wǎng)自愈技術門限、網(wǎng)狀網(wǎng)自愈技術門限,其中H、AVE、L分別指部署穩(wěn)健性策略時付出的最高、平均、最小自愈時延值。顯而易見,穩(wěn)健性策略下的控制時延總體比可靠性算法、分區(qū)安置方案都要低。不僅如此,穩(wěn)健性策略下的時延代價在滿足生存性指標要求的同時,其峰值參量和均值也明顯地遠低于臨界指標10 ms。這表明穩(wěn)健性策略能夠以絕對性優(yōu)勢嵌入到SD-EON實施更可靠的服務。相比之下,奉行控制單元和交換轉(zhuǎn)發(fā)網(wǎng)元間符合局向分離的最大光通道規(guī)模的可靠性算法所安置的節(jié)點處具有較大的連接規(guī)模,且基本上位居全網(wǎng)的中心地帶。因這樣的區(qū)域內(nèi)節(jié)點密度較大且距離交換設備遙遠,控制指令在路由過程中產(chǎn)生的時間成本也就最高,故在本項考察中表現(xiàn)出了最弱的穩(wěn)健性。
圖7 時延代價
通過對比傳統(tǒng)研究在SD-EON可靠性設計方面存在的可持續(xù)改進空間,提出一種普適性較強穩(wěn)健性策略。該策略兼顧了控制單元在局部網(wǎng)絡中和全局網(wǎng)絡中的集中管控作用。主要通過多元化部署網(wǎng)元節(jié)點來區(qū)分控制單元的權限,避免底層交換機出現(xiàn)執(zhí)行指令沖突的同時也為控制信道提供穩(wěn)妥的資源配置方案和故障防護方案。測試結果顯示所研究的縱向管控部署下的嵌入式SD-EON穩(wěn)健性策略具備良好的科學性。