(北京郵電大學(xué),中國 北京100876)
降低成本、改善性能和保障運(yùn)行是網(wǎng)絡(luò)管理系統(tǒng)建設(shè)始終追求的目標(biāo)。從21世紀(jì)初開始,人們逐漸認(rèn)識(shí)到進(jìn)一步降低成本,改善性能,需要提高網(wǎng)絡(luò)管理的自動(dòng)化程度。此后,經(jīng)歷了20余年的發(fā)展,相關(guān)技術(shù)的不斷出現(xiàn)持續(xù)推動(dòng)著網(wǎng)絡(luò)管理自動(dòng)化技術(shù)的進(jìn)步。
1)基于策略的網(wǎng)絡(luò)管理
早期的網(wǎng)絡(luò)管理自動(dòng)化是基于策略的網(wǎng)絡(luò)管理[1]。該管理方式是指,在不對(duì)網(wǎng)絡(luò)管理系統(tǒng)重新編碼且在其在線運(yùn)行的情況下,動(dòng)態(tài)改變網(wǎng)絡(luò)管理系統(tǒng),從而提高網(wǎng)絡(luò)管理的自動(dòng)化程度。
2)基于智能的網(wǎng)絡(luò)管理
隨著研究的不斷進(jìn)展,人們發(fā)現(xiàn)在大規(guī)模的網(wǎng)絡(luò)環(huán)境下,基于策略的網(wǎng)絡(luò)管理會(huì)產(chǎn)生策略沖突,尤其是在復(fù)雜的環(huán)境中。網(wǎng)絡(luò)環(huán)境越復(fù)雜,策略沖突就越嚴(yán)重。在這種情況下,需要提高網(wǎng)絡(luò)管理自動(dòng)化的程度。因此,從21世紀(jì)初起,基于智能的網(wǎng)絡(luò)管理逐漸成為研究熱點(diǎn)[2]。
基于智能的網(wǎng)絡(luò)管理是指,通過將網(wǎng)絡(luò)管理領(lǐng)域?qū)<业慕?jīng)驗(yàn)總結(jié)為知識(shí),形成知識(shí)庫,然后基于該知識(shí)庫進(jìn)行網(wǎng)絡(luò)管理。采用這樣的方法,同樣可以在不對(duì)網(wǎng)絡(luò)管理系統(tǒng)重新編碼且在其在線運(yùn)行的情況下,動(dòng)態(tài)改變網(wǎng)絡(luò)管理系統(tǒng),從而提高網(wǎng)絡(luò)管理的自動(dòng)化程度。
3)自主管理的網(wǎng)絡(luò)管理
隨著研究的深入,人們遇到了和基于策略的網(wǎng)絡(luò)管理類似的問題:將網(wǎng)絡(luò)管理領(lǐng)域不同的專家經(jīng)驗(yàn)總結(jié)為統(tǒng)一的知識(shí)表示是一件相當(dāng)困難的事情。同時(shí),由于網(wǎng)絡(luò)管理系統(tǒng)建設(shè)具有周期性的特點(diǎn),在一個(gè)新網(wǎng)絡(luò)對(duì)應(yīng)的網(wǎng)絡(luò)管理系統(tǒng)建設(shè)的初期,專家的經(jīng)驗(yàn)還不能及時(shí)被總結(jié)出來。
在基于智能的網(wǎng)絡(luò)管理研究時(shí)期,在歐盟FP7和H2020的支持下,研究人員開展了基于自主管理的網(wǎng)絡(luò)管理的研究[3]。自主管理的基本思想是讓網(wǎng)絡(luò)本身具有管理能力,其目標(biāo)是實(shí)現(xiàn)5S(自感知、自配置、自保護(hù)、自優(yōu)化、自修復(fù)),并在異構(gòu)無線接入網(wǎng)、軟件定義網(wǎng)絡(luò)(SDN)、網(wǎng)絡(luò)功能虛擬化(NFV)等網(wǎng)絡(luò)上開展具有2S或3S的初步驗(yàn)證性實(shí)驗(yàn),同時(shí)在5G等新型網(wǎng)絡(luò)上探索具有自主管理能力的體系結(jié)構(gòu)[4]。有關(guān)實(shí)驗(yàn)顯示:自主管理能夠在自感知方面有較好的效果,但網(wǎng)絡(luò)管理自動(dòng)化程度總體上并無明顯提高。
4)基于深度學(xué)習(xí)的網(wǎng)絡(luò)管理
在圖像、語音、自然語言處理方面取得重要進(jìn)展的深度學(xué)習(xí)方法也逐漸被業(yè)界關(guān)注。初步的實(shí)驗(yàn)表明:深度學(xué)習(xí)在故障管理和性能管理預(yù)期有比較好的效果,但總體上網(wǎng)絡(luò)管理自動(dòng)化程度并無明顯提高,特別是需要海量的訓(xùn)練數(shù)據(jù)也是一件比較困難的事情。
以上幾種方法的共同特征是:
1)提出了一種基于X1的網(wǎng)絡(luò)管理自動(dòng)化方法,可以很快地將網(wǎng)絡(luò)管理自動(dòng)化程度從零提高到一定程度;但到達(dá)一定程度后,想再進(jìn)一步提高就顯得困難。
2)又提出了一種基于X2的網(wǎng)絡(luò)管理方法,又可以很快地將網(wǎng)絡(luò)管理自動(dòng)化程度從零提高到一定程度;但到達(dá)一定程度后,想再進(jìn)一步提高還是顯得非常困難。
以上過程一遍一遍地重復(fù),似乎存在一個(gè)天花板,只要碰到這個(gè)天花板,自動(dòng)化程度就很難再提高了。
這個(gè)現(xiàn)象引起我們對(duì)網(wǎng)絡(luò)管理自動(dòng)化的思考:如果有一個(gè)天花板的話,那么這個(gè)天花板是什么?
在早期,網(wǎng)絡(luò)管理面對(duì)的是單一網(wǎng)絡(luò)的簡(jiǎn)單環(huán)境,執(zhí)行的是一些簡(jiǎn)單重復(fù)的操作;而現(xiàn)在,網(wǎng)絡(luò)管理面對(duì)的是疊加/混合/綜合/融合/異構(gòu)的復(fù)雜環(huán)境,執(zhí)行的是一些復(fù)雜精細(xì)的操作。雖然發(fā)生了如此大的變化,但網(wǎng)絡(luò)管理過程并沒有發(fā)生變化,仍舊是3個(gè)基本操作:監(jiān)視、分析和控制。
實(shí)現(xiàn)網(wǎng)絡(luò)管理過程的一般方法是先對(duì)規(guī)劃的網(wǎng)絡(luò)管理功能確定管理參數(shù),再確定管理參數(shù)的管理指標(biāo),然后對(duì)管理指標(biāo)進(jìn)行監(jiān)視、分析和控制。例如,在故障管理中,監(jiān)視就是故障監(jiān)視,采用主動(dòng)或被動(dòng)的方式,實(shí)時(shí)或周期地收集告警事件;分析就是故障定位,根據(jù)告警事件進(jìn)行故障定位;控制就是故障恢復(fù)。如果能夠進(jìn)行故障管理的自動(dòng)化,這3個(gè)操作應(yīng)當(dāng)形成閉環(huán),即故障管理閉環(huán)。故障管理閉環(huán)的示意如圖1所示。
▲圖1 故障管理閉環(huán)
▲圖2 配置管理閉環(huán)
目前的各種網(wǎng)絡(luò)管理方法主要是為了提高這3個(gè)管理操作中某個(gè)操作的質(zhì)量或效率,并沒有解決管理操作形成閉環(huán)這個(gè)技術(shù)難題。例如,故障管理的故障監(jiān)視中采用的各種方法,就是從海量事件中過濾出告警事件,然后將大量重復(fù)的告警事件收斂為可供分析的有效告警事件。目前使用的各種方法就是提高過濾和收斂的質(zhì)量或效率。
因此,提高網(wǎng)絡(luò)管理自動(dòng)化程度就是要提高形成閉環(huán)的程度,其中有兩項(xiàng)關(guān)鍵技術(shù)問題:一是實(shí)現(xiàn)網(wǎng)絡(luò)控制自動(dòng)化(網(wǎng)絡(luò)管理過程中控制操作的自動(dòng)化),二是閉環(huán)調(diào)用技術(shù)。
網(wǎng)絡(luò)控制自動(dòng)化的難點(diǎn)是網(wǎng)絡(luò)控制結(jié)果存在不確定性。網(wǎng)絡(luò)在運(yùn)行的情況下,特別是在不正常的情況下,如果改變網(wǎng)絡(luò)配置,結(jié)果則存在不確定性。目前在自配置、自保護(hù)、自修復(fù)等方面主要有兩種辦法:一種是啟動(dòng)備用(保護(hù))部件,另一種是部件升級(jí)。
啟動(dòng)備用(保護(hù))部件實(shí)質(zhì)上沒有對(duì)網(wǎng)絡(luò)配置進(jìn)行改變,只是在線更換了相同配置的部件。
部件升級(jí)實(shí)際上是網(wǎng)絡(luò)擴(kuò)容的常用方法。在網(wǎng)絡(luò)擴(kuò)容時(shí)進(jìn)行部件升級(jí),一般選擇在網(wǎng)絡(luò)穩(wěn)定、低載時(shí)有計(jì)劃地進(jìn)行。在實(shí)施網(wǎng)絡(luò)控制進(jìn)行部件升級(jí)時(shí),實(shí)現(xiàn)網(wǎng)絡(luò)穩(wěn)定和低載,常用的方法就是部分降級(jí)和閉塞部分用戶,但這都有可能產(chǎn)生部件升級(jí)原因的正反饋,從而增加網(wǎng)絡(luò)控制結(jié)果的不確定性。
閉環(huán)調(diào)用是一個(gè)閉環(huán)調(diào)用另一個(gè)閉環(huán)。例如,在故障管理閉環(huán)的故障恢復(fù)操作中,故障管理的資源中不足以保證故障恢復(fù)的質(zhì)量,需要通過配置管理改變配置,以提高故障管理中資源的數(shù)量。在這種情況下,就需要故障管理閉環(huán)中的故障恢復(fù)調(diào)用配置管理閉環(huán)中的配置控制。
配置管理閉環(huán)的示意如圖2所示,閉環(huán)調(diào)用的過程如圖3所示。
▲圖3 閉環(huán)調(diào)用過程示意圖
圖3顯示的是最大管理功能粒度,但實(shí)際閉環(huán)的管理功能粒度要小得多,因此實(shí)際閉環(huán)調(diào)用也就復(fù)雜得多。
通常用閉環(huán)調(diào)用圖來表示閉環(huán)調(diào)用的關(guān)系。在閉環(huán)調(diào)用圖中,結(jié)點(diǎn)表示一個(gè)閉環(huán),如果一個(gè)閉環(huán)調(diào)用另一個(gè)閉環(huán),那么這兩個(gè)閉環(huán)對(duì)應(yīng)的兩個(gè)結(jié)點(diǎn)是鄰接結(jié)點(diǎn)。
在使用閉環(huán)調(diào)用圖時(shí),閉環(huán)調(diào)用中的一些判定問題,如閉環(huán)調(diào)用循環(huán)、閉環(huán)調(diào)用死鎖、閉環(huán)調(diào)用嵌套等,就可以轉(zhuǎn)化為對(duì)圖或子圖的處理。
網(wǎng)絡(luò)管理自動(dòng)化研究面臨著巨大的技術(shù)挑戰(zhàn),迫切需要研究人員開展網(wǎng)絡(luò)管理自動(dòng)化方面系統(tǒng)性、長期性的研究,其中基礎(chǔ)性的工作是閉環(huán)形成技術(shù)。系統(tǒng)解決閉環(huán)形成問題還有較長的路要走。