劉 博,康 旖,陳禹旭,梁子鍵,李曉璐
(南方電網(wǎng)數(shù)字電網(wǎng)集團(tuán)有限公司,廣東 廣州 510700)
多組件融合技術(shù)可以按照相似性聚合標(biāo)準(zhǔn)將具有相關(guān)性映射關(guān)系的數(shù)據(jù)樣本關(guān)聯(lián)在一起,以保證互聯(lián)網(wǎng)絡(luò)的布局合理性、避免信息樣本出現(xiàn)過(guò)度累積的情況。
溶滯網(wǎng)絡(luò)是包含路由協(xié)議的存儲(chǔ)與轉(zhuǎn)發(fā)的網(wǎng)絡(luò)。由于其具有高延遲的特性,故數(shù)據(jù)樣本的連接在緩沖區(qū)域內(nèi)會(huì)表現(xiàn)出間接性。這也是導(dǎo)致網(wǎng)絡(luò)緩沖區(qū)占用率過(guò)高的主要原因。文獻(xiàn)[1]基于多層前饋神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型,借助神經(jīng)性節(jié)點(diǎn)過(guò)濾溶滯網(wǎng)絡(luò)中的非必要傳輸數(shù)據(jù),并利用多層前饋神經(jīng)網(wǎng)絡(luò)組件,將這些信息樣本整合成多個(gè)數(shù)據(jù)包存儲(chǔ)結(jié)構(gòu)。文獻(xiàn)[2]基于循環(huán)神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型,主要通過(guò)復(fù)雜化數(shù)據(jù)樣本傳輸路徑的方式,緩解溶滯網(wǎng)絡(luò)的數(shù)據(jù)擁堵情況。由于網(wǎng)絡(luò)環(huán)境內(nèi)包含多臺(tái)數(shù)據(jù)庫(kù)主機(jī),所以未被完全消耗的信息樣本可被這些元件設(shè)備直接存儲(chǔ)。文獻(xiàn)[3]提出長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)預(yù)測(cè)模型,旨在去除溶滯網(wǎng)絡(luò)中不具備自主傳輸能力的數(shù)據(jù)樣本,并通過(guò)多次處理過(guò)程使得網(wǎng)絡(luò)體系的信息存儲(chǔ)壓力得到緩解。然而,隨著網(wǎng)絡(luò)運(yùn)行時(shí)間的延長(zhǎng),上述3種方法的信道平均占用率并不能保持在既定數(shù)值標(biāo)準(zhǔn)之內(nèi),占用率相對(duì)較高。
為此,本文構(gòu)建基于多組件融合的溶滯網(wǎng)絡(luò)緩沖區(qū)占用率預(yù)測(cè)模型。首先,本文在多組件框架的基礎(chǔ)上,融合溶滯網(wǎng)絡(luò)緩沖區(qū)內(nèi)的數(shù)據(jù)樣本,并配置可移植的任務(wù)。然后,本文基于獲取的任務(wù),根據(jù)溶滯缺失值計(jì)算結(jié)果,設(shè)計(jì)基于決策樹的溶滯網(wǎng)絡(luò)緩沖區(qū)占用率預(yù)測(cè)模型。最后,本文通過(guò)試驗(yàn)驗(yàn)證了該模型具有較好的預(yù)測(cè)效果。該模型為解決溶滯網(wǎng)絡(luò)中數(shù)據(jù)滯留引起的緩沖區(qū)內(nèi)存不足的問(wèn)題提供了參考。
溶滯網(wǎng)絡(luò)緩沖區(qū)內(nèi)的數(shù)據(jù)樣本處理需要在多組件框架的基礎(chǔ)上,推導(dǎo)數(shù)據(jù)樣本融合條件,并聯(lián)合可應(yīng)用信息參量,確定可移植任務(wù)的配置情況。
在溶滯網(wǎng)絡(luò)中,多組件框架同時(shí)管控Linux數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)服務(wù)層、頂層緩沖單元、Java組件等多個(gè)預(yù)測(cè)結(jié)構(gòu)。溶滯網(wǎng)絡(luò)的多組件預(yù)測(cè)框架如圖1所示。
圖1 溶滯網(wǎng)絡(luò)的多組件預(yù)測(cè)框架
Bundle預(yù)測(cè)軟件可以直接提取溶滯網(wǎng)絡(luò)緩沖區(qū)內(nèi)的擁塞數(shù)據(jù)參量,并可以借助傳輸信道將這些信息樣本反饋至網(wǎng)絡(luò)服務(wù)層結(jié)構(gòu)中。當(dāng)前情況下,若Linux數(shù)據(jù)庫(kù)中已存儲(chǔ)樣本滿足信息參量的多組件融合條件,Java組件就可以在處理數(shù)據(jù)樣本的同時(shí),對(duì)數(shù)據(jù)占用率進(jìn)行計(jì)算[4-5]。
本文設(shè)α為網(wǎng)絡(luò)溶滯系數(shù)的最小取值結(jié)果、ε為最大取值結(jié)果、β為多組件框架內(nèi)的數(shù)據(jù)樣本辨別系數(shù)、Vα為基于α的溶滯網(wǎng)絡(luò)緩沖特征值;Vε為基于ε的溶滯網(wǎng)絡(luò)緩沖特征值。在設(shè)置多組件框架時(shí),α∈(1,e)、ε∈(1,e)的賦值條件同時(shí)成立。本文聯(lián)立上述物理量,將多組件框架對(duì)于數(shù)據(jù)占用率的計(jì)算式定義為:
(1)
Java組件[6]對(duì)于溶滯網(wǎng)絡(luò)緩沖區(qū)內(nèi)擁塞數(shù)據(jù)參量的處理能力,決定了多組件框架的運(yùn)行能力。為避免頂層緩沖單元中出現(xiàn)信息參量過(guò)存儲(chǔ)情況,本文在設(shè)置多組件框架時(shí),要求數(shù)據(jù)占用率計(jì)算結(jié)果不得超過(guò)溶滯網(wǎng)絡(luò)緩沖區(qū)組織對(duì)數(shù)據(jù)信息樣本最大存儲(chǔ)能力的50%。
數(shù)據(jù)樣本融合條件決定了溶滯網(wǎng)絡(luò)緩沖區(qū)的當(dāng)前占用率水平是否具備繼續(xù)存儲(chǔ)數(shù)據(jù)信息參量的能力。當(dāng)選取的數(shù)值樣本趨近于1時(shí),表明溶滯網(wǎng)絡(luò)緩沖區(qū)占用率水平較高,基本不具備繼續(xù)存儲(chǔ)數(shù)據(jù)信息參量的能力;當(dāng)選取的數(shù)值樣本趨近于0時(shí),表明溶滯網(wǎng)絡(luò)緩沖區(qū)占用率水平較低,可以繼續(xù)存儲(chǔ)數(shù)據(jù)信息。本文以多組件框架作為必要預(yù)測(cè)結(jié)構(gòu),根據(jù)式(1)獲取的M,結(jié)合數(shù)據(jù)樣本融合程度X將具有連續(xù)存儲(chǔ)能力的溶滯網(wǎng)絡(luò)緩沖區(qū)占用率水平視為未達(dá)到信息參量溢出標(biāo)準(zhǔn)的數(shù)據(jù)樣本融合條件。綜合上述分析和參量,本文得到網(wǎng)絡(luò)緩沖區(qū)域溶滯強(qiáng)度為c時(shí)的數(shù)據(jù)樣本取值結(jié)果Zc。Zc的取值范圍為:
(2)
本文基于式(2)對(duì)c強(qiáng)度下的數(shù)據(jù)樣本融合向量Xc求導(dǎo),則有:
(3)
(4)
式中:φ為基于多組件融合算法的數(shù)據(jù)樣本取值系數(shù);Δb為溶滯網(wǎng)絡(luò)緩沖區(qū)內(nèi)數(shù)據(jù)樣本的單位累積量;γ為良性取值條件。
如果Δb取值超過(guò)數(shù)據(jù)信息樣本在溶滯網(wǎng)絡(luò)緩沖區(qū)組織內(nèi)存儲(chǔ)數(shù)量的50%,表示網(wǎng)絡(luò)體系已經(jīng)出現(xiàn)擁塞現(xiàn)象;如果Δb取值接近數(shù)據(jù)樣本存儲(chǔ)數(shù)量的50%,表示溶滯網(wǎng)絡(luò)體系正面臨擁塞風(fēng)險(xiǎn)[7];如果Δb取值遠(yuǎn)小于數(shù)據(jù)樣本存儲(chǔ)數(shù)量的50%,表示單位運(yùn)行周期內(nèi),溶滯網(wǎng)絡(luò)體系不會(huì)出現(xiàn)擁塞現(xiàn)象。
可移植任務(wù)配置主要用于集成溶滯網(wǎng)絡(luò)緩沖區(qū)內(nèi)的數(shù)據(jù)樣本統(tǒng)計(jì)與管理服務(wù)。在已知數(shù)據(jù)樣本融合條件的情況下,待移植任務(wù)之間的關(guān)聯(lián)性越強(qiáng),則網(wǎng)絡(luò)主機(jī)在存儲(chǔ)數(shù)據(jù)參量時(shí)所需消耗的占用空間就越大[8-10]。本文設(shè)τ為數(shù)據(jù)樣本移植處理的方向性系數(shù),λn為n個(gè)不相等也不等于零的網(wǎng)絡(luò)擁塞行為標(biāo)記向量,An為與n個(gè)不相等擁塞行為標(biāo)記向量相關(guān)的數(shù)據(jù)預(yù)測(cè)參數(shù)。在上述物理量的支持下,本文聯(lián)立式(4),將可移植任務(wù)指令執(zhí)行文件mn定義為:
(5)
在式(5)的基礎(chǔ)上,本文設(shè)a為初始配置權(quán)限,則基于多組件融合的可移植任務(wù)配置表達(dá)式為:
(6)
本文配置可移植任務(wù)指令,要求數(shù)據(jù)樣本在溶滯網(wǎng)絡(luò)中必須占據(jù)相同的緩沖區(qū)存儲(chǔ)空間。當(dāng)數(shù)據(jù)樣本注入多組件框架結(jié)構(gòu)時(shí),已存儲(chǔ)信息參量由相同存儲(chǔ)節(jié)點(diǎn)傳輸至相同目標(biāo)節(jié)點(diǎn),使得占用網(wǎng)絡(luò)空間的數(shù)據(jù)樣本得到充分融合。
在多組件融合算法的支持下,本文建立決策樹組織,并根據(jù)溶滯缺失值計(jì)算結(jié)果確定復(fù)雜度指標(biāo)的取值范圍,以實(shí)現(xiàn)溶滯網(wǎng)絡(luò)緩沖區(qū)占用率預(yù)測(cè)模型的設(shè)計(jì)與應(yīng)用。
決策樹組織布局形式如圖2所示。
圖2 決策樹組織布局形式
決策樹組織由1個(gè)根節(jié)點(diǎn)(輸入節(jié)點(diǎn))、多個(gè)子葉節(jié)點(diǎn)(過(guò)渡節(jié)點(diǎn))共同組成[11],可以處理溶滯網(wǎng)絡(luò)中的數(shù)據(jù)分類問(wèn)題。為實(shí)現(xiàn)對(duì)溶滯網(wǎng)絡(luò)緩沖區(qū)占用率的預(yù)測(cè),根節(jié)點(diǎn)的選取必須遵循多組件融合標(biāo)準(zhǔn),即所選取決策樹組織根節(jié)點(diǎn)必須與多組件框架連接形式及數(shù)據(jù)樣本融合條件相匹配。為避免數(shù)據(jù)信息樣本在溶滯網(wǎng)絡(luò)緩沖區(qū)域內(nèi)占據(jù)過(guò)大的存儲(chǔ)空間,每增加1層子葉節(jié)點(diǎn)對(duì)象,都要預(yù)留1個(gè)結(jié)余節(jié)點(diǎn)供網(wǎng)絡(luò)主機(jī)自由分配[12]。子葉節(jié)點(diǎn)連接數(shù)量較多,且實(shí)際連接數(shù)量隨著決策樹組織復(fù)雜度的提升而持續(xù)增多。因此,根節(jié)點(diǎn)與子葉節(jié)點(diǎn)之間的數(shù)據(jù)傳輸方向雖然保持一致,但對(duì)應(yīng)關(guān)系并不唯一。
(7)
因?yàn)闆Q策樹組織對(duì)于數(shù)據(jù)樣本參量的傳輸能力不可能等于100%,所以η∈(0,1)。但為避免溶滯網(wǎng)絡(luò)緩沖區(qū)占用率過(guò)高,應(yīng)使數(shù)據(jù)樣本在網(wǎng)絡(luò)體系內(nèi)保持較快的傳輸速率,故η的取值更趨近于1。
溶滯網(wǎng)絡(luò)緩沖區(qū)組織經(jīng)過(guò)數(shù)據(jù)清洗后,各決策樹節(jié)點(diǎn)內(nèi)都存在不同程度的信息樣本流失行為,即所缺失數(shù)據(jù)不能完全代替連續(xù)時(shí)間點(diǎn)處的流量數(shù)據(jù)。原始數(shù)據(jù)樣本與流失后數(shù)據(jù)樣本之間的對(duì)應(yīng)關(guān)系可以用溶滯缺失值來(lái)表示。求解網(wǎng)絡(luò)緩沖區(qū)溶滯缺失值這一過(guò)程涉及對(duì)數(shù)據(jù)樣本基本存儲(chǔ)特征與基本融合特征的計(jì)算。具體計(jì)算式如式(8)和式(9)所示。
(8)
(9)
本文聯(lián)立式(7)、式(8)、式(9),則求解基于多組件融合的網(wǎng)絡(luò)緩沖區(qū)溶滯缺失值的表達(dá)式為:
(10)
式中:kv、ko、kμ分別為3個(gè)不相等的數(shù)據(jù)樣本存儲(chǔ)占比率參量,%。
為了最大限度控制數(shù)據(jù)樣本在溶滯網(wǎng)絡(luò)緩沖區(qū)的占用率水平,本文在獲取溶滯缺失值指標(biāo)之后,對(duì)具有缺失值特征的數(shù)據(jù)樣本進(jìn)行選取處理,再對(duì)剩余信息參量進(jìn)行擬合填充處理。
構(gòu)建溶滯網(wǎng)絡(luò)緩沖區(qū)占用率預(yù)測(cè)模型時(shí),復(fù)雜度指標(biāo)決定了網(wǎng)絡(luò)體系的布局繁瑣程度。其取值越大,表示網(wǎng)絡(luò)體系的布局越繁瑣,數(shù)據(jù)樣本由1個(gè)緩沖區(qū)傳輸?shù)搅硗?個(gè)緩沖區(qū)所需消耗的時(shí)間越長(zhǎng),網(wǎng)絡(luò)主機(jī)存儲(chǔ)樣本參量所需消耗的占用空間越大。R′為溶滯網(wǎng)絡(luò)緩沖區(qū)域內(nèi)數(shù)據(jù)樣本的布局系數(shù)。
(11)
(12)
因?yàn)?umax-umin)的計(jì)算數(shù)值恒大于零,所以數(shù)據(jù)樣本參量在溶滯網(wǎng)絡(luò)緩沖區(qū)內(nèi)的傳輸方向始終為正。在求解占用率預(yù)測(cè)模型時(shí),不需考慮數(shù)據(jù)信息的反向傳輸行為。
溶滯網(wǎng)絡(luò)環(huán)境緩沖區(qū)占用率水平影響網(wǎng)絡(luò)體系的擁塞程度。一般而言,隨著數(shù)據(jù)樣本傳輸量的增大,緩沖區(qū)組織占用率水平也會(huì)不斷增大,但其增幅平緩且輕微。若在某個(gè)緩沖區(qū)內(nèi)出現(xiàn)大幅度攀升,則表示該緩沖區(qū)組織內(nèi)的占用率水平異常增大,即該區(qū)域出現(xiàn)了局部擁塞問(wèn)題。因此,對(duì)于溶滯網(wǎng)絡(luò)擁塞程度的分析,等同于對(duì)網(wǎng)絡(luò)緩沖區(qū)占用率的統(tǒng)計(jì)。本次試驗(yàn)針對(duì)上述內(nèi)容展開對(duì)比研究。
本文選擇基于多組件融合的預(yù)測(cè)模型(本文預(yù)測(cè)模型)、基于多層前饋神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型(文獻(xiàn)[1]預(yù)測(cè)模型)、基于循環(huán)神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型(文獻(xiàn)[2]預(yù)測(cè)模型)、長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)預(yù)測(cè)模型(文獻(xiàn)[3]預(yù)測(cè)模型)進(jìn)行試驗(yàn)。本文配置溶滯網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)作為試驗(yàn)環(huán)境。
溶滯網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)如圖3所示。
圖3 溶滯網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)
溶滯網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)包括互聯(lián)網(wǎng)、RG-NBR1300G路由器、RG-S2928G-E智能交換機(jī)、計(jì)算機(jī)主機(jī)等。其中,互聯(lián)網(wǎng)連接不同地域的設(shè)備;RG-NBR1300G路由器可進(jìn)行廣域網(wǎng)與局域網(wǎng)之間的轉(zhuǎn)接;RG-S2928G-E智能交換機(jī)可進(jìn)行多設(shè)備之間的無(wú)阻塞轉(zhuǎn)發(fā);計(jì)算機(jī)主機(jī)是網(wǎng)絡(luò)中的終端設(shè)備,通過(guò)Wi-Fi連接到局域網(wǎng)中,以實(shí)現(xiàn)數(shù)據(jù)傳輸和通信。在溶滯網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)中,本文分別利用4種試驗(yàn)?zāi)P蛯?duì)溶滯網(wǎng)絡(luò)運(yùn)行過(guò)程中緩沖區(qū)域的實(shí)時(shí)占用率水平進(jìn)行預(yù)測(cè),并對(duì)比試驗(yàn)結(jié)果。
溶滯網(wǎng)絡(luò)擁塞程度標(biāo)準(zhǔn)值σ、緩沖區(qū)擁塞系數(shù)ζ′之間的數(shù)值關(guān)系可表示為:
σ?(Ψ×ζ′)
(13)
式中:Ψ為數(shù)據(jù)樣本的單位輸出量。
根據(jù)第1節(jié)的溶滯網(wǎng)絡(luò)緩沖區(qū)內(nèi)的數(shù)據(jù)樣本處理過(guò)程,獲取多組件框架可移植任務(wù)配置情況為9.0×109個(gè)數(shù)據(jù)樣本。本文以9.0×109個(gè)作為本文預(yù)測(cè)模型、文獻(xiàn)[1]預(yù)測(cè)模型、文獻(xiàn)[2]預(yù)測(cè)模型、文獻(xiàn)[3]預(yù)測(cè)模型的溶滯網(wǎng)絡(luò)緩沖區(qū)占用率預(yù)測(cè)樣本數(shù),以ζ′為指標(biāo)分析不同模型的預(yù)測(cè)效果。
在不同模型作用下的ζ′如表1所示。
表1 不同模型作用下的ζ′
在緩沖區(qū)數(shù)據(jù)樣本個(gè)數(shù)達(dá)到6.0×109個(gè)之前,應(yīng)用本文預(yù)測(cè)模型可控制緩沖區(qū)擁塞系數(shù)取值始終等于0.3。在緩沖區(qū)數(shù)據(jù)樣本個(gè)數(shù)處于7.0×109~9.0×109個(gè)之間時(shí),應(yīng)用本文預(yù)測(cè)模型可控制緩沖區(qū)擁塞系數(shù),使其呈現(xiàn)小幅增大的數(shù)值變化態(tài)勢(shì),擁塞系數(shù)最大值僅達(dá)到0.6。應(yīng)用文獻(xiàn)[1]預(yù)測(cè)模型后,控制緩沖區(qū)擁塞系數(shù)始終保持較為穩(wěn)定的數(shù)值變化態(tài)勢(shì),其值為0.9保持不變,但與0.6相比增大了0.3。應(yīng)用文獻(xiàn)[2]預(yù)測(cè)模型后,控制緩沖區(qū)擁塞系數(shù)則呈現(xiàn)出持續(xù)增大的變化態(tài)勢(shì),最大值達(dá)到1.4,與0.6相比增大了0.8。應(yīng)用文獻(xiàn)[3]預(yù)測(cè)模型后,控制緩沖區(qū)擁塞系數(shù)保持先增大、再減小的變化態(tài)勢(shì),全局最大值達(dá)到2.6,與0.6相比增大了2.0。
為驗(yàn)證3.2節(jié)試驗(yàn)結(jié)果的準(zhǔn)確性,還需診斷溶滯網(wǎng)絡(luò)緩沖體系內(nèi)的信道平均占用率水平。本文選擇表1中每組試驗(yàn)方法的緩沖區(qū)擁塞系數(shù)最大值作為試驗(yàn)條件,在多組件融合算法的支持下,建立決策樹預(yù)測(cè)模型。本文設(shè)定溶滯缺失值為5×109,復(fù)雜度取值范圍為[0.45,0.55],在該參數(shù)設(shè)置下記錄擁塞系數(shù)最大時(shí)的4組模型信道平均占用率的變化情況。信道平均占用率對(duì)比如表2所示。
表2 信道平均占用率對(duì)比
分析表2可知:本文預(yù)測(cè)模型在預(yù)測(cè)時(shí),調(diào)節(jié)信道的平均占用率最低為37%、最高為60%;文獻(xiàn)[3]預(yù)測(cè)模型在預(yù)測(cè)時(shí),調(diào)節(jié)信道的平均占用率最高為96%;文獻(xiàn)[1]預(yù)測(cè)模型在預(yù)測(cè)時(shí),調(diào)節(jié)信道的平均占用率最大為70%,低于文獻(xiàn)[2]預(yù)測(cè)模型,但略高于本文預(yù)測(cè)模型。預(yù)測(cè)模型在預(yù)測(cè)時(shí),調(diào)節(jié)信道平均占用率的排列順序與ζ′的排列順序一致,即3.2節(jié)試驗(yàn)結(jié)果的準(zhǔn)確性得到驗(yàn)證。
基于多組件融合的預(yù)測(cè)模型可以有效預(yù)測(cè)溶滯網(wǎng)絡(luò)緩沖區(qū)占用率,且預(yù)測(cè)準(zhǔn)確率較高,能避免網(wǎng)絡(luò)體系出現(xiàn)大面積擁塞。然而現(xiàn)階段,多組件融合算法的能力有限,應(yīng)用該算法所構(gòu)建的預(yù)測(cè)模型進(jìn)行預(yù)測(cè)時(shí),只能控制溶滯網(wǎng)絡(luò)緩沖區(qū)擁塞系數(shù)取值在0.6以內(nèi),調(diào)節(jié)信道平均占用率仍達(dá)到60%。后續(xù)研究可以在多組件融合算法的基礎(chǔ)上對(duì)引發(fā)溶滯網(wǎng)絡(luò)緩沖區(qū)占用率過(guò)高問(wèn)題的主要因素進(jìn)行深入分析,力求在充分縮小擁塞系數(shù)取值的同時(shí)使信道組織的平均占用率水平得到控制。