楊世標(biāo),范永斌,黃坤
(中國(guó)聯(lián)通廣東分公司,廣東廣州,510630)
當(dāng)前電信運(yùn)營(yíng)商網(wǎng)絡(luò)很大程度上還依賴于維護(hù)工程師的經(jīng)驗(yàn)和技能,某運(yùn)營(yíng)商運(yùn)維10000 臺(tái)設(shè)備規(guī)模的網(wǎng)絡(luò)需要接近400 人,而OTT 運(yùn)維1000000 臺(tái)服務(wù)器的網(wǎng)絡(luò)僅僅需要200 多人。OTT 的高效與他們自帶的先進(jìn)的網(wǎng)絡(luò)設(shè)計(jì)基因有關(guān),從組網(wǎng)伊始就采用全I(xiàn)P 網(wǎng)絡(luò)、集中式運(yùn)維,注重模塊化、標(biāo)準(zhǔn)化和自動(dòng)化。而電信運(yùn)營(yíng)商由于歷史原因,網(wǎng)絡(luò)不斷在原有基礎(chǔ)上進(jìn)行迭代,網(wǎng)絡(luò)架構(gòu)、路由協(xié)議等不統(tǒng)一,且設(shè)備以傳統(tǒng)路由器交換機(jī)為主,建設(shè)愈發(fā)復(fù)雜,導(dǎo)致運(yùn)營(yíng)商網(wǎng)絡(luò)運(yùn)營(yíng)的CAPEX、OPEX 成本一直居高不下。
本文就如何在保有當(dāng)前網(wǎng)絡(luò)投資,不改變當(dāng)前網(wǎng)絡(luò)主體架構(gòu)及設(shè)備的情況下,通過(guò)基于SDN、AI 算法實(shí)現(xiàn)城域網(wǎng)二干中繼流量的自動(dòng)化、智能化調(diào)優(yōu),提高網(wǎng)絡(luò)安全性、降低網(wǎng)絡(luò)建設(shè)成本進(jìn)行研究。
傳統(tǒng)城域網(wǎng)采用雙平面口字型組網(wǎng)架構(gòu)與骨干核心對(duì)接,可構(gòu)建城域網(wǎng)雙平面架構(gòu)(雙平面間相互保護(hù))。城域網(wǎng)使用IGP+BGP 架構(gòu),業(yè)務(wù)地址使用BGP 攜帶,全球通告,IGP為BGP 提供連接(TCP 可達(dá)性)的邏輯基礎(chǔ)架構(gòu),并在故障時(shí)提供高效收斂機(jī)制確保BGP 的穩(wěn)定性。BGP 結(jié)合IGP 架構(gòu)實(shí)現(xiàn)城域網(wǎng)業(yè)務(wù)流量收斂的高效及簡(jiǎn)潔性。
由于接入層交換機(jī)設(shè)備性能不足、設(shè)備數(shù)量大,設(shè)備通常不會(huì)開(kāi)啟BGP。常規(guī)組網(wǎng)方式是城域網(wǎng)核心CR 通過(guò)IGP 下發(fā)默認(rèn)路由,解決匯聚以下設(shè)備的默認(rèn)路由問(wèn)題。
核心CR 根據(jù)匯聚設(shè)備發(fā)布的BGP 業(yè)務(wù)路由時(shí)所攜帶的BGP 屬性值,設(shè)置固定的MED 值,對(duì)回程流量進(jìn)行雙平面的控制,實(shí)現(xiàn)流量的負(fù)載均衡。
該組網(wǎng)方式以城域網(wǎng)核心CR 為分割點(diǎn),當(dāng)核心CR 與骨干網(wǎng)或匯聚之間發(fā)生全阻時(shí),骨干與匯聚彼此之間無(wú)感知,從而導(dǎo)致流量在城域網(wǎng)CR 之間進(jìn)行繞轉(zhuǎn),此外,若核心CR 與骨干之間發(fā)生部分中繼中斷,導(dǎo)致平面擁塞,而保護(hù)平面又無(wú)法完全承載故障平面流量時(shí),無(wú)法快速進(jìn)行精細(xì)化的流量調(diào)整,若為保障故障期間業(yè)務(wù)不受損,則城域網(wǎng)CR 之間橫聯(lián)帶寬需要與城域網(wǎng)CR 的出口帶寬同步進(jìn)行擴(kuò)容,然而該部分橫聯(lián)帶寬正常情況下極度輕載,資源無(wú)法得到有效利用,城域網(wǎng)出口中繼則必須將利用率嚴(yán)格控制在50%以下。
圖1 網(wǎng)絡(luò)架構(gòu)圖
2.2.1 城域網(wǎng)IGP 域協(xié)議設(shè)計(jì)
全網(wǎng)使用ISIS 作為IGP 協(xié)議,各設(shè)備根據(jù)網(wǎng)絡(luò)層次的劃分,核心層設(shè)備為L(zhǎng)evel-2 層,匯聚層設(shè)備為L(zhǎng)evel-1-2層,接入層設(shè)備為L(zhǎng)evel-1 層。通過(guò)層次劃分的方式,由Level-1-2 設(shè)備向Level-1 層設(shè)備發(fā)布默認(rèn)路由,核心CR 取消IGP 下發(fā)默認(rèn)路由,通過(guò)轉(zhuǎn)發(fā)骨干發(fā)布的EBGP 默認(rèn)路由解決城域網(wǎng)內(nèi)匯聚設(shè)備默認(rèn)路由問(wèn)題。實(shí)現(xiàn)匯聚層設(shè)備默認(rèn)路由可隨骨干與核心之間的狀態(tài)變化而變化。
2.2.2 城域網(wǎng)雙向流量調(diào)優(yōu)策略設(shè)計(jì)
城域網(wǎng)出方向流量設(shè)計(jì):城域網(wǎng)CR 設(shè)置接收骨干CR的BGP 路由策略,可靈活針對(duì)各AS 域的BGP 路由設(shè)置Local Preference 值為200(以下簡(jiǎn)稱LP 值);結(jié)合Netflow 系統(tǒng)采集的CR 至各AS 域的流量數(shù)據(jù),當(dāng)需要進(jìn)行出向流量調(diào)整時(shí),可根據(jù)流量數(shù)據(jù)調(diào)整相應(yīng)AS 號(hào)的LP 值,實(shí)現(xiàn)出向流量的平面切換。
城域網(wǎng)入方向流量設(shè)計(jì):城域網(wǎng)BRAS/SR/NAT(以下簡(jiǎn)稱匯聚設(shè)備)通過(guò)BGP 發(fā)布業(yè)務(wù)路由,城域網(wǎng)CR 轉(zhuǎn)發(fā)業(yè)務(wù)路由至骨干CR,添加MED 值屬性控制回程路徑,通過(guò)設(shè)置IGPcost為MED 值的方式,匯聚設(shè)備鏈路中斷后的回程流量自動(dòng)調(diào)整,實(shí)現(xiàn)骨干業(yè)務(wù)路由可隨匯聚核心與匯聚之間的狀態(tài)變化而變化。
基于以上網(wǎng)絡(luò)架構(gòu)協(xié)議的設(shè)計(jì),可實(shí)現(xiàn)核心CR 與骨干或匯聚之間發(fā)生全阻時(shí),流量自動(dòng)切換至保護(hù)平面,而無(wú)需再經(jīng)故障平面核心CR 繞行至保護(hù)平面進(jìn)行轉(zhuǎn)發(fā),從而可減少城域網(wǎng)核心CR 之間的橫聯(lián)帶寬建設(shè),只需保留少量帶寬為特定業(yè)務(wù)服務(wù)即可。
隨著傳輸系統(tǒng)建設(shè)的不斷完善,城域網(wǎng)出口單平面全阻的情況已較少發(fā)生,然而,當(dāng)某傳輸系統(tǒng)發(fā)生故障時(shí),仍可能導(dǎo)致城域網(wǎng)某平面出現(xiàn)大量出口中繼中斷,導(dǎo)致平面發(fā)生擁塞。為進(jìn)一步提高資源利用率,通過(guò)對(duì)流量的自動(dòng)化智能調(diào)整,實(shí)現(xiàn)平面擁塞后的流量精細(xì)化管理,從而降低網(wǎng)絡(luò)建設(shè)成本及業(yè)務(wù)受損時(shí)長(zhǎng)。
2.3.1 流量切換操作步驟
(1)城域網(wǎng)出向流量切換
由于城域網(wǎng)CR 采用雙平面口字型架構(gòu),出向流量基于集團(tuán)發(fā)布路由時(shí)設(shè)置的MED 進(jìn)行控制,根據(jù)BGP 選路原則,LP 值可優(yōu)于MED 值進(jìn)行路徑控制,城域網(wǎng)內(nèi)接收骨干路由時(shí),可通過(guò)調(diào)整LP 值調(diào)整選路。
(2)城域網(wǎng)入向流量切換
城域網(wǎng)匯聚設(shè)備通過(guò)BGP 發(fā)布業(yè)務(wù)路由時(shí),通過(guò)添加BGP 路由屬性控制回程路徑。如希望從C1 平面回程,打上屬性AS:1001,城域網(wǎng)C1 向集團(tuán)發(fā)布路由時(shí),對(duì)AS:1001 的路由設(shè)置MED 為IGPcost(正常為1500),城域網(wǎng)C2 針對(duì)該屬性路由設(shè)置MED 值為3000,通過(guò)調(diào)整CR 與匯聚設(shè)備的IGP cost 進(jìn)行回程流量調(diào)整。
如圖2,當(dāng)C1 平面出口部分中繼中斷導(dǎo)致?lián)砣麜r(shí),將CR2 接收AS 64666 的LP 值調(diào)整為200,將CR1 與匯聚設(shè)備的IGPcost 調(diào)整為4000 后,可將涉及的流量切換至CR2 平面,而無(wú)需進(jìn)行平面流量完全切換。
圖2 C1 平面出口擁塞流量調(diào)整示意圖
2.3.2 流量智能調(diào)優(yōu)系統(tǒng)架構(gòu)設(shè)計(jì)
在上述網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)的基礎(chǔ)上,可實(shí)現(xiàn)統(tǒng)一、標(biāo)準(zhǔn)化的上下行流量切換操作。同時(shí),結(jié)合IP 網(wǎng)管系統(tǒng)、Netflow 系統(tǒng)實(shí)時(shí)采集城域網(wǎng)CR 至各匯聚設(shè)備流量信息,城域網(wǎng)CR 至各AS 域流量信息,通過(guò)采集的數(shù)據(jù)進(jìn)行分析,使用AI 智能算法,實(shí)現(xiàn)網(wǎng)絡(luò)流量預(yù)測(cè)。此外,通過(guò)中繼電路信息采集,可實(shí)現(xiàn)網(wǎng)絡(luò)故障下的中繼擁塞預(yù)測(cè)。
流量智能調(diào)優(yōu)系統(tǒng)北向?qū)痈骶C合網(wǎng)管監(jiān)控系統(tǒng),接收網(wǎng)管推送的城域網(wǎng)設(shè)備告警、流量預(yù)測(cè)等信息;并根據(jù)相關(guān)信息生成流量調(diào)整策略及形成配置模板,通過(guò)南向接口將配置模板推送至SDN 控制器,由SDN 控制器完成配置的自動(dòng)下發(fā),全程自動(dòng)化實(shí)現(xiàn),無(wú)需人工干預(yù)。
當(dāng)中繼鏈路故障恢復(fù)后,綜合網(wǎng)管系統(tǒng)自動(dòng)調(diào)用流量智能調(diào)優(yōu)系統(tǒng),進(jìn)行配置恢復(fù)操作,完成故障閉環(huán)。
圖3 流量智能調(diào)優(yōu)架構(gòu)圖
2.3.3 流量智能調(diào)優(yōu)實(shí)現(xiàn)步驟
正常情況下,城域網(wǎng)雙平面CR 出口中繼峰值利用率在75%以下,雙平面互為保護(hù),且雙平面出入向流量大致均衡。
當(dāng)發(fā)生干線、板卡等故障導(dǎo)致某平面大面積出口中繼電路故障時(shí),由于平面未中斷,基于IP 路由轉(zhuǎn)發(fā)的流量模型不會(huì)發(fā)生變化,將可能導(dǎo)致故障平面出口中繼發(fā)生擁塞,或在未來(lái)一段時(shí)間發(fā)生擁塞。如故障發(fā)生時(shí)間為19:30,在未來(lái)兩小時(shí)內(nèi),流量迎來(lái)高峰期,將導(dǎo)致網(wǎng)絡(luò)擁塞。因此,綜合網(wǎng)管系統(tǒng)根據(jù)當(dāng)前故障平面剩余出口帶寬,及未來(lái)2 小時(shí)(一般干線故障搶修時(shí)限)流量預(yù)測(cè)數(shù)據(jù),進(jìn)行判斷當(dāng)前或未來(lái)是否存在擁塞風(fēng)險(xiǎn)。若不存在擁塞風(fēng)險(xiǎn),則不做任何操作,并持續(xù)進(jìn)行觀測(cè)。當(dāng)故障后存在擁塞或預(yù)測(cè)存在擁塞風(fēng)險(xiǎn)時(shí),綜合網(wǎng)管系統(tǒng)將推送相關(guān)信息至流量智能調(diào)優(yōu)系統(tǒng)。流量智能調(diào)優(yōu)系統(tǒng)接收到綜合網(wǎng)管系統(tǒng)預(yù)測(cè)的擁塞預(yù)警,需要進(jìn)行流量調(diào)整時(shí),通過(guò)預(yù)測(cè)的擁塞情況、非故障平面冗余帶寬等信息,針對(duì)不同場(chǎng)景進(jìn)行相應(yīng)的策略下發(fā)。
(1)首先判斷非故障平面冗余帶寬是否滿足完全承載故障平面的所有流量,若能承載,則直接生成故障平面流量全切的配置策略,通過(guò)南向接口將策略轉(zhuǎn)換為標(biāo)準(zhǔn)模板推送至SDN 控制器,通過(guò)調(diào)用SDN 控制器下發(fā)配置將故障平面流量統(tǒng)一調(diào)整至非故障平面。
(2)若非故障平面無(wú)法完全承載故障平面的所有流量,需要進(jìn)行擁塞流量切換時(shí),針對(duì)需要進(jìn)行調(diào)整的雙向流量分別進(jìn)行計(jì)算。
如果出向流量計(jì)算需要調(diào)整50G,通過(guò)Netflow 系統(tǒng)采集的故障平面核心CR 至各AS 域的流量歷史數(shù)據(jù),選取相應(yīng)ASN組合,通過(guò)策略調(diào)整將該部分出向流量切換至非故障平面。
如果入向流量計(jì)算需要調(diào)整80G,通過(guò)綜合網(wǎng)管系統(tǒng)采集的故障平面核心CR 至各城域網(wǎng)匯聚設(shè)備的流量歷史數(shù)據(jù),選取相應(yīng)的匯聚設(shè)備組合,調(diào)整相應(yīng)鏈路的IGPcost 值,將該部分匯聚設(shè)備發(fā)布的業(yè)務(wù)IP 地址流量切換至非故障平面(具體調(diào)整方式見(jiàn)2.3.1 流量切換操作步驟)。
全程流量智能調(diào)優(yōu)系統(tǒng)基于提前規(guī)劃的流量智能調(diào)優(yōu)模型進(jìn)行自動(dòng)計(jì)算,生成具體的調(diào)整策略,然后系統(tǒng)通過(guò)南向接口將策略轉(zhuǎn)換為標(biāo)準(zhǔn)模板推送至SDN 控制器,通過(guò)調(diào)用SDN 控制器下發(fā)配置,實(shí)現(xiàn)流量的自動(dòng)化、智能化的快速、靈活調(diào)整。
當(dāng)故障結(jié)束時(shí),綜合網(wǎng)管系統(tǒng)推送故障恢復(fù)信息至流量智能調(diào)優(yōu)系統(tǒng),流量智能調(diào)優(yōu)系統(tǒng)調(diào)用SDN 控制器,下發(fā)配置恢復(fù)操作,恢復(fù)原有流量模型,從而完成故障閉環(huán)管理。
圖4 流量智能調(diào)優(yōu)示意圖
圖5 流量智能調(diào)優(yōu)流程圖
未來(lái),無(wú)人自動(dòng)駕駛網(wǎng)絡(luò)將是網(wǎng)絡(luò)發(fā)展的方向,自動(dòng)化維護(hù)的發(fā)展趨勢(shì)不可逆轉(zhuǎn)。隨著網(wǎng)絡(luò)的不斷演進(jìn),按傳統(tǒng)方式繼續(xù)進(jìn)行網(wǎng)絡(luò)建設(shè)的方式不再適合。本文通過(guò)在現(xiàn)有網(wǎng)絡(luò)架構(gòu)的基礎(chǔ)上,進(jìn)行網(wǎng)絡(luò)自動(dòng)化維護(hù)的改造,為將來(lái)通信運(yùn)營(yíng)商實(shí)現(xiàn)無(wú)人自動(dòng)駕駛網(wǎng)絡(luò)的發(fā)展做出探索。