從慶平,張 莉,劉繼平
(中國石油天然股份有限公司長慶油田分公司數(shù)字化與信息中心,西安 710018)
隨著網(wǎng)絡(luò)技術(shù)不斷發(fā)展和網(wǎng)絡(luò)用戶逐漸增多,網(wǎng)絡(luò)面臨著架構(gòu)復(fù)雜化、業(yè)務(wù)多樣化、體驗多元化等諸多挑戰(zhàn)。網(wǎng)絡(luò)用戶對網(wǎng)絡(luò)性能的要求越來越高。依靠專家經(jīng)驗的傳統(tǒng)網(wǎng)絡(luò)發(fā)展模式已無法適應(yīng)當(dāng)前時代的需求。與此同時,云計算、虛擬化技術(shù)、5G 通信、人工智能等新興技術(shù)逐漸成為大數(shù)據(jù)時代社會發(fā)展和經(jīng)濟(jì)增長的核心力量。人工智能技術(shù)正在和網(wǎng)絡(luò)行業(yè)深度結(jié)合。能夠支持資源動態(tài)分配、功能靈活部署、自動優(yōu)化網(wǎng)絡(luò)配置等功能的智能化網(wǎng)絡(luò)已成為科研院所的研究熱點。
根據(jù)中興軟件公司的分析,網(wǎng)絡(luò)智能化水平可分為4 級,即初級智能化、中級智能化、高級智能化和完全智能化[1]。而我國當(dāng)前網(wǎng)絡(luò)智能化水平介于初級和中級之間。智能化網(wǎng)絡(luò)結(jié)合各項高新技術(shù),可按需、靈活地支撐全行業(yè)應(yīng)用及其業(yè)務(wù)場景,滿足當(dāng)前時代對網(wǎng)絡(luò)的需求。這些需求包括但不限于:①支持網(wǎng)絡(luò)即服務(wù)(Network as a Service,NaaS),實現(xiàn)2G、3G、4G、5G 等通信技術(shù)規(guī)格的共存和協(xié)同發(fā)展[2];②支持云化、虛擬化或在專用硬件中部署,以靈活適應(yīng)各種應(yīng)用場景;③支持在云環(huán)境或虛擬化環(huán)境中,網(wǎng)絡(luò)資源按需、動態(tài)、全局性、自動化地調(diào)度,以實現(xiàn)網(wǎng)絡(luò)的自動優(yōu)化;④支持各個網(wǎng)絡(luò)節(jié)點和基站之間協(xié)調(diào)合作,復(fù)雜環(huán)境下抗干擾,以提高網(wǎng)絡(luò)結(jié)構(gòu)的魯棒性;⑤支持將部分功能下沉至網(wǎng)絡(luò)邊緣,即支持邊緣計算能力,以降低網(wǎng)絡(luò)延時,提高用戶體驗;⑥支持網(wǎng)絡(luò)故障自動識別、自動定位、網(wǎng)絡(luò)狀態(tài)自動感知,以降低網(wǎng)絡(luò)管理和優(yōu)化的復(fù)雜度。
人工智能在網(wǎng)絡(luò)智能化中的應(yīng)用可分為3 個層次:分析層、調(diào)度層和感知層,如圖1 所示。分析層負(fù)責(zé)從網(wǎng)絡(luò)流量包、網(wǎng)絡(luò)拓?fù)湫畔?、用戶行為信息等原始?shù)據(jù)中挖掘分析出有用信息,調(diào)度層和感知層依據(jù)分析層的輸出結(jié)果對網(wǎng)絡(luò)進(jìn)行深層次的調(diào)度與感知。
網(wǎng)絡(luò)流量是網(wǎng)絡(luò)負(fù)荷的直接反饋指標(biāo)。精準(zhǔn)可靠的網(wǎng)絡(luò)流量預(yù)測結(jié)果可使相關(guān)人員迅速掌握網(wǎng)絡(luò)流量的規(guī)律和趨勢并及時地進(jìn)行調(diào)控,能夠有效地提升網(wǎng)絡(luò)資源利用率。網(wǎng)絡(luò)流量不同于其他流量數(shù)據(jù),具有很強(qiáng)的非線性、隨機(jī)性、自相似性、多分形性和潮汐性[3]。傳統(tǒng)的線性預(yù)測模型無法精確地預(yù)測網(wǎng)絡(luò)流量,預(yù)測誤差較高。而人工智能中的神經(jīng)網(wǎng)絡(luò)擁有較高的泛化性與預(yù)測能力,是目前流量預(yù)測的主流方法。其中,循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)及其衍生網(wǎng)絡(luò)在該應(yīng)用場景中表現(xiàn)最為出色。RNN 以網(wǎng)絡(luò)流量序列數(shù)據(jù)為輸入,其結(jié)構(gòu)具有記憶性,即可在預(yù)測時考慮過去時刻數(shù)據(jù)和未來時刻數(shù)據(jù)對當(dāng)前時刻數(shù)據(jù)的影響,故在處理流量預(yù)測這類時間序列預(yù)測問題時具有一定的優(yōu)勢。
門控循環(huán)單元(Gate Recurrent Unit,GRU)、長短期記憶網(wǎng)絡(luò)(Long-Short Term Memory,LSTM)、雙向長短時記憶網(wǎng)絡(luò)(Bi-directional Long Short-Term Memory,Bi-LSTM)等循環(huán)神經(jīng)網(wǎng)絡(luò)在該應(yīng)用場景中已有諸多成果。但在實際網(wǎng)絡(luò)環(huán)境中,網(wǎng)絡(luò)流量存在極強(qiáng)的突發(fā)性。目前的RNN 難以學(xué)習(xí)到數(shù)據(jù)中的突發(fā)性,導(dǎo)致對突發(fā)時刻及該時刻后的網(wǎng)絡(luò)流量預(yù)測時誤差較大。未來需研究可精確預(yù)測突發(fā)網(wǎng)絡(luò)流量的方法。
告警關(guān)聯(lián)是網(wǎng)絡(luò)故障自動定位中的一項重要技術(shù),其基本思想是通過關(guān)聯(lián)多個告警信息為某單一告警信息過濾不必要的、不相關(guān)的信息,為相關(guān)人員提供合理的告警事件清單,以快速地識別故障源?;谌斯ぶ悄艿母婢P(guān)聯(lián)最常用的是基于Apriori 算法和基于FP-Growth 算法的關(guān)聯(lián)規(guī)則挖掘模型,通過對物理主機(jī)內(nèi)存超載、虛擬主機(jī)嚴(yán)重負(fù)載、網(wǎng)卡端口異常、磁盤可用空間不足等告警信息進(jìn)行關(guān)聯(lián)分析,與某一具體故障進(jìn)行綁定,從而形成告警事件清單。一個小型網(wǎng)絡(luò)的入侵檢測系統(tǒng)(Intrusion Detection System,IDS)等網(wǎng)絡(luò)安全設(shè)備每天可收集GB 甚至TB 級的告警信息,人工智能所帶來的大數(shù)據(jù)挖掘能力是實現(xiàn)自動故障分析、故障自愈等網(wǎng)絡(luò)智能化運維手段的必備手段。但現(xiàn)有的告警關(guān)聯(lián)案例庫仍需繼續(xù)豐富,且應(yīng)研究告警關(guān)聯(lián)與增量學(xué)習(xí)技術(shù)的結(jié)合以賦予關(guān)聯(lián)規(guī)則挖掘模型持續(xù)學(xué)習(xí)新告警信息樣本的能力。
用戶行為分析的目標(biāo)是根據(jù)抓取到的網(wǎng)絡(luò)用戶所處環(huán)境、上網(wǎng)日志、上網(wǎng)行為等數(shù)據(jù)智能分析出用戶的個性、特點和預(yù)計使用的網(wǎng)絡(luò)服務(wù)等,為網(wǎng)絡(luò)服務(wù)優(yōu)化提供決策依據(jù)。自然語言處理(Natural Language Processing,NLP)是人工智能的一個分支,同時也是國內(nèi)外學(xué)者分析網(wǎng)絡(luò)用戶行為的常用方法。通過NLP 中的文本分類、文本聚類、信息抽取、文本相似度計算等技術(shù),用戶行為可分為有意識行為、無意識行為、正常行為、異常行為、流量行為和協(xié)議行為,從而可以利用人工智能技術(shù)進(jìn)一步對網(wǎng)絡(luò)用戶進(jìn)行分類。目前,國內(nèi)外學(xué)者們已提出了不少用于分類、聚類用戶行為文本的模型,其準(zhǔn)確率仍有提高空間。進(jìn)一步提高用戶行為分析模型的性能是該應(yīng)用場景下一步的研究方向。
網(wǎng)絡(luò)切片技術(shù)是網(wǎng)絡(luò)智能化中實現(xiàn)網(wǎng)絡(luò)功能和硬件設(shè)備的解耦。其結(jié)果可看作是針對不同的應(yīng)用需求而產(chǎn)生的獨立虛擬網(wǎng)絡(luò)。保證較高的服務(wù)等級協(xié)議(Service-Level Agreement,SLA)和可接受的頻譜效率可視為智能網(wǎng)絡(luò)切片的兩個約束條件。針對以上兩個約束,以人工智能領(lǐng)域中的強(qiáng)化學(xué)習(xí)(Reinforcement Learning,RL)為代表的智能網(wǎng)絡(luò)切片方法實現(xiàn)了支持虛擬網(wǎng)絡(luò)的動態(tài)資源分配。RL 不需要先驗的網(wǎng)絡(luò)環(huán)境知識,即在制定切片策略時不需要結(jié)合專家知識,可降低網(wǎng)絡(luò)運維成本。而在實踐中,執(zhí)行網(wǎng)絡(luò)切片需暫時切斷部分網(wǎng)絡(luò)服務(wù),故需額外考慮RL 的效率以增加基于人工智能的智能網(wǎng)絡(luò)切片的實用性。
用戶對云服務(wù)質(zhì)量的要求越來越高,云計算的需求呈指數(shù)型增長。為了提升用戶體驗、保證服務(wù)質(zhì)量,虛擬機(jī)資源調(diào)度技術(shù)日益引人關(guān)注。虛擬機(jī)調(diào)度可優(yōu)化服務(wù)器運行,其優(yōu)化目標(biāo)包括中央處理器(Central Processing Unit,CPU)、內(nèi)存、存儲等資源,貪婪算法、啟發(fā)式算法等傳統(tǒng)方法難以在可接受的時間內(nèi)計算出調(diào)度策略。目前已研究利用人工智能中的RL 構(gòu)建虛擬機(jī)資源調(diào)度學(xué)習(xí)模型,將服務(wù)延遲指標(biāo)作為獎賞函數(shù)來學(xué)習(xí)優(yōu)化策略。RL 提供了一個可行的且可不斷更新的虛擬機(jī)調(diào)度方案,但還需要進(jìn)一步研究如何提高RL 的學(xué)習(xí)效率,并縮小RL 所需的狀態(tài)存儲空間。
基于人工智能的攻擊預(yù)測通?;诋?dāng)前IDS 觀察到的惡意行為,預(yù)測某個攻擊發(fā)生的概率、正在發(fā)生的攻擊的策略、網(wǎng)絡(luò)環(huán)境中資產(chǎn)面臨的威脅,并對預(yù)測到的攻擊進(jìn)行攻擊意圖判斷,以制定防御方案。傳統(tǒng)方法基于馬爾可夫模型和攻擊圖推斷某個攻擊轉(zhuǎn)換成某種狀態(tài)的概率,再根據(jù)網(wǎng)絡(luò)中關(guān)鍵資產(chǎn)的價值和攻擊成本推斷攻擊意圖。但這種方法難以擴(kuò)展到實時的大規(guī)模應(yīng)用場景,故學(xué)者提出利用機(jī)器學(xué)習(xí)中的動態(tài)貝葉斯網(wǎng)絡(luò)(Dynamic Bayesian Network,DBN)和決策樹學(xué)習(xí)實現(xiàn)攻擊預(yù)測。DBN 擁有對攻擊樣本的學(xué)習(xí)能力,通過計算網(wǎng)絡(luò)中各節(jié)點的先驗風(fēng)險概率,從而對攻擊預(yù)測概率進(jìn)行靜態(tài)評估,可輔助網(wǎng)絡(luò)管理員評估網(wǎng)絡(luò)安全風(fēng)險。機(jī)器學(xué)習(xí)方法具有較好的泛化性和容錯能力,但網(wǎng)絡(luò)攻擊的方法和種類日新月異,DBN 這種基于歷史數(shù)據(jù)的機(jī)器學(xué)習(xí)方法無法有效地預(yù)測新型網(wǎng)絡(luò)攻擊。需研究能夠做到快速響應(yīng)新攻擊、及時學(xué)習(xí)新的攻擊活動樣本和及時更新功能的人工智能模型。
挑戰(zhàn)和機(jī)遇總是并存的。人工智能技術(shù)的研究和網(wǎng)絡(luò)智能化的發(fā)展都是一個長期過程。在未來,人們應(yīng)研究二者進(jìn)一步融合的方法,將人工智能技術(shù)與基于網(wǎng)絡(luò)結(jié)構(gòu)提出的霧計算、邊緣計算、聯(lián)邦計算等新型計算范式結(jié)合,再反哺于網(wǎng)絡(luò)智能化研究,打造網(wǎng)絡(luò)智能化新生態(tài)。