何瀟
(陜西財經(jīng)職業(yè)技術(shù)學(xué)院,陜西咸陽 712000)
高速發(fā)展的信息化時代促使大數(shù)據(jù)的到來,面對與日俱增的數(shù)據(jù)量,如何對大數(shù)據(jù)進(jìn)行分析利用仍然是領(lǐng)域內(nèi)的研究重點(diǎn),充分挖掘和利用大數(shù)據(jù)資源已成為企業(yè)提高競爭優(yōu)勢的重要途徑,在此方面,利用人工智能深度學(xué)習(xí)成為較佳的選擇,而科學(xué)合理的深度學(xué)習(xí)框架則是深度學(xué)習(xí)的基礎(chǔ)和關(guān)鍵,為有效滿足呈動態(tài)變化的應(yīng)用需求,該框架需具有良好的可移植性、靈活性等優(yōu)勢,TensorFlow(谷歌開源,支持分布式迭代訓(xùn)練)則屬于較為優(yōu)秀的深度學(xué)習(xí)框架,但隨著所需處理問題復(fù)雜程度的不斷提高,基于深度學(xué)習(xí)的模型隨之不斷變大,迭代訓(xùn)練一個較復(fù)雜的深度模型所需時間較長,TensorFlow 訓(xùn)練時間長的問題日益突出,需要進(jìn)一步優(yōu)化以滿足使用需求。
隨著人工智能領(lǐng)域研究的深入,深度學(xué)習(xí)得到快速發(fā)展和完善,成為網(wǎng)絡(luò)運(yùn)營商提高網(wǎng)絡(luò)控制和管理過程自主能力和智能水平的有效途徑。在探索和應(yīng)用人工智能的過程中,非形式化內(nèi)容的實(shí)現(xiàn)和描述難以使用計算機(jī)完成,對于一些非形式化行為在使用硬編碼的體系進(jìn)行表示時,要求人工智能系統(tǒng)具有主動獲取知識的能力即機(jī)器學(xué)習(xí)。
目前,機(jī)器學(xué)習(xí)已在圖像檢測、目標(biāo)識別等領(lǐng)域內(nèi)得到普遍應(yīng)用,深度學(xué)習(xí)方法是機(jī)器學(xué)習(xí)的一個重要分支,該方法主要通過深層神經(jīng)網(wǎng)絡(luò)完成數(shù)據(jù)擬合過程,雖然不斷增多的無線設(shè)備一定程度上促進(jìn)了無線異構(gòu)網(wǎng)絡(luò)設(shè)施的發(fā)展,但急劇增加和不斷變化的網(wǎng)絡(luò)流量仍給網(wǎng)絡(luò)自身帶來較大的壓力,在提升通信質(zhì)量方面,實(shí)現(xiàn)網(wǎng)絡(luò)資源的合理分配成為一項重要手段,通過應(yīng)用路由選擇方法可實(shí)現(xiàn)網(wǎng)絡(luò)流量的有效控制[1-2]。目前在無線異構(gòu)網(wǎng)絡(luò)路由中應(yīng)用深度學(xué)習(xí)的研究較少,在選擇路由路徑時使用傳統(tǒng)的路由協(xié)議算法易導(dǎo)致?lián)砣麊栴}的出現(xiàn)。
針對以往的路徑經(jīng)驗,通過深度學(xué)習(xí)的原始數(shù)據(jù)訓(xùn)練功能,可有效避免選擇路由路徑時的堵塞問題,進(jìn)而提高路由選擇的質(zhì)量和效率。關(guān)于深度學(xué)習(xí)在通信網(wǎng)絡(luò)中應(yīng)用的研究:在無線傳感器網(wǎng)絡(luò)中,考慮到其應(yīng)用受限于分類無線傳感網(wǎng)的計算,結(jié)合運(yùn)用了非負(fù)矩陣因數(shù)分解算法和深度學(xué)習(xí)設(shè)計了一種更加有效的算法;通過卷積神經(jīng)網(wǎng)絡(luò)的運(yùn)用實(shí)現(xiàn)了結(jié)構(gòu)和編碼效率的顯著提高[3]。
傳統(tǒng)的路由協(xié)議及深度學(xué)習(xí)的訓(xùn)練結(jié)構(gòu)均具有一定的局限性,為了解決這一問題,對于包括輸入和輸出在內(nèi)的路由數(shù)據(jù),可以采用實(shí)時獨(dú)立的網(wǎng)絡(luò)算法,基于深度卷積網(wǎng)絡(luò)的特征提取完成有效的特征處理過程。
在評價網(wǎng)絡(luò)的質(zhì)量和規(guī)模時,路由協(xié)議中的路由參數(shù)是一項重要指標(biāo),而高質(zhì)量通信網(wǎng)絡(luò)的獲取需基于目前的網(wǎng)絡(luò)現(xiàn)狀,主要表現(xiàn)在急劇增長的網(wǎng)絡(luò)數(shù)據(jù)流量與網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜程度。關(guān)于路由路徑選擇方面的研究:采用機(jī)器學(xué)習(xí)訓(xùn)練大規(guī)模數(shù)據(jù)集時,由于傳統(tǒng)路由不具備基于自主學(xué)習(xí)經(jīng)驗的路由優(yōu)化能力,在并行通信過程中,過長的工作節(jié)點(diǎn)與參數(shù)服務(wù)器通信時間會明顯提高訓(xùn)練耗時,一種基于深度學(xué)習(xí)的智能化流量監(jiān)控系統(tǒng)實(shí)現(xiàn)了流量的實(shí)時監(jiān)控,進(jìn)而在一定程度上避免了擁塞問題。文中在現(xiàn)有研究成果的基礎(chǔ)上,為更加有效地避免堵塞,針對以往經(jīng)驗數(shù)據(jù),采用深度學(xué)習(xí)方法對被標(biāo)記的數(shù)據(jù)進(jìn)行學(xué)習(xí)訓(xùn)練,在此基礎(chǔ)上選出有效路徑組合,進(jìn)而有效減少平均時延,同時降低丟包率[4]。
2.1.1 分布式表達(dá)
分布式表達(dá)作為表示學(xué)習(xí)的一種重要工具,分布式學(xué)習(xí)可將kn個不同的概念通過具有k個值的n個特征進(jìn)行描述,分布式的表示方法是神經(jīng)網(wǎng)絡(luò)和概率模型(分別包含多個隱藏單元和多個潛變量)的考慮重點(diǎn)。
對于包含2n種配置的N維二元向量,輸入空間的不同區(qū)域與各種配置一一對應(yīng),由不同概念間的共享屬性產(chǎn)生的泛化是區(qū)別的重要依據(jù)。對于特殊的分布式表示,可通過閾值處理輸入的線性函數(shù)實(shí)現(xiàn)二元特征的準(zhǔn)確提取,Rd由各二元特征分成一個對半空間,在輸入空間中,O(nd) 個不同的區(qū)域可通過相同數(shù)量的參數(shù)進(jìn)行確切表示,通過特征提取器(非線性可能連續(xù))處理表達(dá)中的每個特征是分布式的優(yōu)勢所在,雖可對較多不同的區(qū)域進(jìn)行明確編碼,但受限于沒有一一對應(yīng)的映射關(guān)系而導(dǎo)致容量有限[5]。
2.1.2 深度卷積神經(jīng)網(wǎng)絡(luò)
為降低深度監(jiān)督網(wǎng)絡(luò)的訓(xùn)練難度,通常需采用非監(jiān)督的方法進(jìn)行預(yù)測訓(xùn)練,作為基于有監(jiān)督學(xué)習(xí)的數(shù)學(xué)模型,深度卷積網(wǎng)絡(luò)具有易于訓(xùn)練的優(yōu)勢,特征提取過程即將所需訓(xùn)練的數(shù)據(jù)輸入網(wǎng)絡(luò)中,由其矩陣反復(fù)進(jìn)行卷積和池化的操作,獲取一個全連接的網(wǎng)絡(luò),然后再進(jìn)行分類輸出[6]。能夠共享權(quán)值的卷積神經(jīng)網(wǎng)絡(luò)使整個模型的參數(shù)數(shù)量得以有效減少,進(jìn)而提高了訓(xùn)練效率。通過深度卷積神經(jīng)網(wǎng)絡(luò)的前端完成特征提取過程,前端由交替出現(xiàn)的卷積層池化層構(gòu)成,已提取特征局部則通過網(wǎng)絡(luò)的后端完成整合與變換處理,后端由多個全連接層構(gòu)成,網(wǎng)絡(luò)會以不同的任務(wù)為依據(jù),動態(tài)調(diào)整最終輸出,對于數(shù)量較多的訓(xùn)練數(shù)據(jù),使用深度卷積網(wǎng)絡(luò)可從中將泛化能力強(qiáng)的有效特征提取出來,特別適用于分類任務(wù)[7]。圖1 為深度卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)示意圖,作為網(wǎng)絡(luò)的核心卷積層,由多個卷積核構(gòu)成,負(fù)責(zé)完成對不同層次特征的學(xué)習(xí),具體通過卷積核處理輸入數(shù)據(jù)得到相應(yīng)的輸出(即特征圖);池化層主要負(fù)責(zé)壓縮處理特征圖,一系列學(xué)習(xí)和操作完成后再接入到全連接層[8]。
圖1 深度卷積網(wǎng)絡(luò)結(jié)構(gòu)圖
2.1.3 BP算法
BP 算法通常結(jié)合使用梯度下降算法,是常用于人工神經(jīng)網(wǎng)絡(luò)中的一種誤差反向傳播算法,主要負(fù)責(zé)對整個網(wǎng)絡(luò)的權(quán)值進(jìn)行更新,BP 算法主要由激勵傳遞(包括前向傳遞和誤差反向傳遞)和權(quán)值更新兩個過程構(gòu)成,訓(xùn)練過程需基于大量標(biāo)記數(shù)據(jù)完成,該算法的流程為:先初始化整個網(wǎng)絡(luò)的權(quán)值和偏置,隨機(jī)進(jìn)行,范圍在(0,1)區(qū)間內(nèi),輸入數(shù)據(jù)逐層經(jīng)過網(wǎng)絡(luò)后,在網(wǎng)絡(luò)輸出同真實(shí)輸出間差距較大的情況下,進(jìn)入誤差反向傳遞階段,各層根據(jù)反向逐層傳遞的誤差更新相應(yīng)的權(quán)值和偏置,在此基礎(chǔ)上實(shí)現(xiàn)誤差的有效減小[9]。
通過簡化設(shè)計一個無線通信網(wǎng)絡(luò),完成對文中路由路徑選擇過程的描述,機(jī)器在全部可供選擇的路徑中選擇一條最優(yōu)路徑,該路徑可能不是最短路徑,通信策略基于源節(jié)點(diǎn)和目的節(jié)點(diǎn)間的連接,考慮到在網(wǎng)絡(luò)環(huán)境降低的問題上,包括OSPF、IS-IS、RIP等在內(nèi)的傳統(tǒng)路由協(xié)議有選擇最短路徑的內(nèi)在傾向,傳統(tǒng)路由協(xié)議在較為擁擠的網(wǎng)絡(luò)環(huán)境下,會以固定不變的規(guī)則為依據(jù),根據(jù)預(yù)設(shè)好的時間間隔做出典型路由決定,屬于在短時間間隔內(nèi)突然觸發(fā)的情況,進(jìn)而增加了通信擁擠現(xiàn)象的出現(xiàn),且狀態(tài)持續(xù)時間較長。
為有效提高路由策略的智能水平,文中構(gòu)建了一種基于網(wǎng)絡(luò)流量的深度學(xué)習(xí)系統(tǒng),并在TensorFlow 平臺中完成系統(tǒng)數(shù)據(jù)的訓(xùn)練,系統(tǒng)具體流程如 圖2 所示[10]。
圖2 深度學(xué)習(xí)系統(tǒng)流程圖
2.2.1 初始階段
初始階段的主要目標(biāo)在于獲取學(xué)習(xí)系統(tǒng)所需數(shù)據(jù),在負(fù)荷和環(huán)境不同時,對不同路由器的通信情況及路徑可采用傳統(tǒng)路由策略進(jìn)行模擬和記錄,或者從可用的數(shù)據(jù)集里提取出相關(guān)信息,以供訓(xùn)練階段使用[11]。
2.2.2 訓(xùn)練階段
訓(xùn)練階段主要負(fù)責(zé)監(jiān)督學(xué)習(xí)上一階段獲取的信息,為強(qiáng)化其在深度學(xué)習(xí)訓(xùn)練系統(tǒng)中的應(yīng)用效果,策略核心網(wǎng)絡(luò)中路由的數(shù)量由N表示,內(nèi)部路由數(shù)量l 小于路由的數(shù)量,以二維向量(x→,y→)作為訓(xùn)練算法的輸入,x→表示路由的通信量,y→表示下一個路由器,對應(yīng)的輸出為權(quán)矩陣(WM)[12]。訓(xùn)練算法主要由輸入數(shù)據(jù)的初始化與特征提?。ㄍㄟ^深度卷積網(wǎng)絡(luò)完成)、深度學(xué)習(xí)網(wǎng)絡(luò)的調(diào)整(通過BP 算法完成)兩部分構(gòu)成,基于復(fù)合函數(shù)鏈?zhǔn)椒▌t的BP 算法屬于一種多層次神經(jīng)網(wǎng)絡(luò)的訓(xùn)練算法,各路由器均需執(zhí)行的訓(xùn)練過程為:對神經(jīng)網(wǎng)絡(luò)每一層的輸入數(shù)據(jù)進(jìn)行依次訓(xùn)練,路由編號由k表示,每一步花費(fèi)(k-1)個隱含層;然后,通過BP 算法的使用完成對各層權(quán)重的調(diào)節(jié),滿足要求后給出最終的輸出值,從而最大程度減小深度學(xué)習(xí)系統(tǒng)的輸出誤差;此外,由于深度學(xué)習(xí)系統(tǒng)的目的地址較多,各路由器還需對深度學(xué)習(xí)系統(tǒng)進(jìn)行訓(xùn)練(以目的節(jié)點(diǎn)路由數(shù)量為依據(jù)),每個邊緣路由器和內(nèi)部路由器的訓(xùn)練個數(shù)分別為N-1-1個和N-1 個,各運(yùn)行的深度學(xué)習(xí)系統(tǒng)僅能在一個臨近的節(jié)點(diǎn)進(jìn)行預(yù)測,訓(xùn)練過程需使用部分通信量和臨近節(jié)點(diǎn)完成[13]。
2.2.3 運(yùn)行階段
運(yùn)行階段各路由器先向邊緣路由器傳送通信量,再根據(jù)權(quán)值矩陣數(shù)據(jù)完成相應(yīng)深度學(xué)習(xí)系統(tǒng)的創(chuàng)建,利用權(quán)矩陣能運(yùn)行全部可能路徑,在此基礎(chǔ)上完成對臨近路由的預(yù)測,重復(fù)此步驟直至獲取所需路由信息,深度學(xué)習(xí)系統(tǒng)以路徑經(jīng)驗作為學(xué)習(xí)對象,并從中獲取最優(yōu)的通信路徑,進(jìn)而有效避免了由最短路徑引起的擁塞。設(shè)計所需的無線網(wǎng)狀骨干網(wǎng)絡(luò)(4 × 4)使用開源的NS3 作為網(wǎng)絡(luò)仿真器完成模擬,具體如圖3 所示,假設(shè)深度卷積網(wǎng)絡(luò)運(yùn)行于各邊緣路由器,以其他邊緣路由器作為目的地,且只在邊緣路由器(接入終端均與其相連)中生成分組,內(nèi)部路由器只負(fù)責(zé)轉(zhuǎn)發(fā)分組,將對應(yīng)的路徑附加到分組,在此基礎(chǔ)上完成整個路徑的構(gòu)建,內(nèi)部路由器負(fù)責(zé)完成路徑的讀取及數(shù)據(jù)包的轉(zhuǎn)發(fā),由多個路由器構(gòu)成的路徑需使用多個深度卷積網(wǎng)絡(luò)實(shí)現(xiàn)完整的構(gòu)建過程,使用深度學(xué)習(xí)優(yōu)化處理現(xiàn)有的輸入路徑數(shù)據(jù)矩陣可實(shí)現(xiàn)所需輸出的獲取[14]。
圖3 無線網(wǎng)狀骨干網(wǎng)框架
對于網(wǎng)絡(luò)狀態(tài)性能的估測,現(xiàn)有的網(wǎng)絡(luò)仿真可有效滿足相應(yīng)需求,文中的深度學(xué)習(xí)系統(tǒng)使用TensorFlow 完成具體的搭建和訓(xùn)練過程,再通過NS3 網(wǎng)絡(luò)仿真的使用完成最優(yōu)路徑的尋找,主要針對網(wǎng)絡(luò)的平均時延、信令開銷、整體吞吐量的性能進(jìn)行仿真,根據(jù)文獻(xiàn)[10]建立起網(wǎng)絡(luò)環(huán)境,設(shè)置上述網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的參數(shù),鏈路帶寬為8 Mb/s,使用1 kb 大小的數(shù)據(jù)和控制數(shù)據(jù)包,各節(jié)點(diǎn)的緩沖區(qū)無限制。其中的總數(shù)據(jù)包生成速率變化范圍在7~15 Mb/s 間,基準(zhǔn)方法采用OSPF,對采用的深度學(xué)習(xí)系統(tǒng)進(jìn)行比較。更新各路徑的時間間隔為0.25 s,同時交換一次信令。
訓(xùn)練深度學(xué)習(xí)系統(tǒng)時以均方誤差作為停止條件,收斂速度和訓(xùn)練效果在包含16 個節(jié)點(diǎn)的4 層學(xué)習(xí)系統(tǒng)中表現(xiàn)較佳,均方誤差值較小,訓(xùn)練的復(fù)雜程度同隱含層節(jié)點(diǎn)數(shù)量成正比[15]。網(wǎng)絡(luò)的平均時延、信令開銷、整體吞吐量在OSPF 和深度學(xué)習(xí)下的實(shí)驗對比結(jié)果如圖4 所示,在不同的生成速率下,相比于OSPF 深層學(xué)習(xí)系統(tǒng)的信令開銷明顯更低,原因在于整個路徑僅有邊緣路由器進(jìn)行計算;深度學(xué)習(xí)系統(tǒng)吞吐量明顯提高,說明系統(tǒng)可在有效避免擁塞的同時,提高路徑的評估質(zhì)量;深層學(xué)習(xí)方法使獲取合適路徑的耗時明顯縮短,顯著縮短了深層學(xué)習(xí)系統(tǒng)的平均延遲[16]。
圖4 實(shí)驗對比結(jié)果
不斷擴(kuò)大的網(wǎng)絡(luò)規(guī)模暴露出了現(xiàn)有網(wǎng)絡(luò)策略成熟度不高的問題,網(wǎng)絡(luò)條件受到較大增長流量的影響而呈現(xiàn)出不斷變化的狀態(tài),面對數(shù)據(jù)規(guī)模和網(wǎng)絡(luò)流量要求的不斷提高,路由策略的重要性日益突出,作為一種新的學(xué)習(xí)方法,深度學(xué)習(xí)在網(wǎng)絡(luò)系統(tǒng)中的應(yīng)用不斷深入[17-20],在路徑選擇過程中通過應(yīng)用深度學(xué)習(xí)可在有效節(jié)省獲取最短路徑所需時間的同時,有效提升數(shù)據(jù)的傳送效率,文中主要對優(yōu)化選擇網(wǎng)
絡(luò)路由路徑的實(shí)現(xiàn)方法進(jìn)行了設(shè)計,通過在網(wǎng)絡(luò)路由中運(yùn)用深度學(xué)習(xí)系統(tǒng)實(shí)現(xiàn)了路由策略的有效優(yōu)化,具有一定的實(shí)際應(yīng)用價值。