宋芳,錢罕林,何薇
(新疆輕工職業(yè)技術(shù)學(xué)院,新疆烏魯木齊 830021)
現(xiàn)階段,無線網(wǎng)絡(luò)鏈路調(diào)度主要劃分為最短鏈路調(diào)度問題,即基于最少時間槽調(diào)度鏈路集;最大獨(dú)立集鏈路問題,即給定通信鏈路,以識別可于同時間間隙內(nèi)同步實(shí)時傳輸?shù)牟l(fā)鏈路最大子集。Pei G,Vullikanti A 等人面向最大獨(dú)立集鏈路問題進(jìn)行了應(yīng)用于具備穩(wěn)定開銷與任意二進(jìn)制干擾的調(diào)度算法設(shè)計(jì)。鏈路干擾中最為常見的是協(xié)議干擾模型與信干燥比(SINR)干擾模型?;趨f(xié)議干擾模型,若既定傳輸范圍之內(nèi)未出現(xiàn)其他鏈路正?;顒樱敲磩t認(rèn)定此鏈路成功傳輸。通常兩個并發(fā)鏈路間共存關(guān)系取決于幾何形狀,則以模型為基礎(chǔ)的干擾關(guān)系可由沖突圖呈現(xiàn),且以經(jīng)典圖理論工具切實(shí)有效解決問題。但是基于SINR干擾模型,并發(fā)傳輸鏈路激活狀態(tài)主要由信道條件與聚合干擾程度所決定,其中不同傳輸沖突則取決于全部并發(fā)傳輸所積累干擾[1]。Moscibroda T,Wattendhofer R,Zollinger A 等學(xué)者通過研究得知,以SINR 干擾模型為基礎(chǔ)的傳輸調(diào)度算法,可有效優(yōu)化網(wǎng)絡(luò)綜合性能。在既有研究結(jié)果基礎(chǔ)上,本文提出了無線通信網(wǎng)絡(luò)抗干擾鏈路資源分布式智能調(diào)度算法。
無線通信網(wǎng)絡(luò)抗干擾鏈路資源分布式智能調(diào)度模型具體如圖1所示。
圖1 分布式智能調(diào)度模型原理框架
分布式智能調(diào)度模型將定向傳輸鏈路當(dāng)作獨(dú)立算法執(zhí)行者[2],而執(zhí)行者于有所感知的通信干擾環(huán)境下獨(dú)立決策。鏈路決策結(jié)束之后,反饋結(jié)果于自身鏈路,以更新環(huán)境。各鏈路在后續(xù)迭代時,便就更新環(huán)境與決策的獎勵為依據(jù)作出新決策,整個網(wǎng)絡(luò)在持續(xù)循環(huán)迭代中獲得鏈路調(diào)度最優(yōu)策略。
基于調(diào)度網(wǎng)絡(luò)各通信鏈路,以實(shí)現(xiàn)網(wǎng)絡(luò)容量最大化。在無線網(wǎng)絡(luò)內(nèi),信號接收功率是與傳輸距離相關(guān)的遞減函數(shù),如果選擇路徑損耗模型,則:
其中,F(xiàn)j代表傳輸功率;Fi代表接收功率;p 代表發(fā)送與接收節(jié)點(diǎn)的間距;σ代表路徑損耗因子。
假設(shè)網(wǎng)絡(luò)包含M條并發(fā)鏈路,節(jié)點(diǎn)面向鏈路x時,具體傳輸功率則以F(j,Ux)表示,節(jié)點(diǎn)Ux和節(jié)點(diǎn)Px之間的傳輸間距具體表示為p(Ux,Px),那么于任何接收節(jié)點(diǎn)位置所遭遇的干擾即:
其中,κ代表網(wǎng)絡(luò)噪聲;p(Uy,Px)代表鏈路y發(fā)射機(jī)與鏈路x接收機(jī)之間的實(shí)際距離。節(jié)點(diǎn)Px對應(yīng)SINR 計(jì)算公式具體即:
就香農(nóng)定理為依據(jù),鏈路(Ux,Px)的最大信道容量計(jì)算公式即:
其中,V代表帶寬。
網(wǎng)絡(luò)容量即全網(wǎng)并發(fā)鏈路信道容量總和,具體表示為:
定向傳輸過程中,假設(shè)以具備四個方向的天線定向傳輸模型為輔助。定向干擾示例具體如圖2所示。
圖2 定向干擾示意圖
等分發(fā)射節(jié)點(diǎn)周圍為四個波束方向[3],根據(jù)順時針方向加以編號。在通信過程中選擇與接收節(jié)點(diǎn)精確對應(yīng)的定向波束以傳輸數(shù)據(jù)信息。在鏈路y定向傳輸過程中,鏈路x接收節(jié)點(diǎn)如果處于波束覆蓋區(qū)域之內(nèi),那么便會被干擾,而干擾強(qiáng)度由鏈路y發(fā)射機(jī)與鏈路x接收機(jī)之間的實(shí)際距離所決定。
分布式智能調(diào)度算法的設(shè)計(jì)目標(biāo)是通過節(jié)點(diǎn)位置相關(guān)信息,基于充分考慮網(wǎng)絡(luò)定向干擾強(qiáng)度,以決策鏈路是否激活,實(shí)現(xiàn)網(wǎng)絡(luò)容量最大化,即:
其中,Ox=1 代表鏈路已激活,否則未激活;s.t.代表約束條件。
基于實(shí)際應(yīng)用場景分析,探究問題的分布式求解方法,而非以節(jié)點(diǎn)控制求解集中式。
在問題模型構(gòu)建中,各節(jié)點(diǎn)決策直接受環(huán)境變化、周圍節(jié)點(diǎn)的干擾影響,而其自身決策結(jié)果也會影響網(wǎng)絡(luò)環(huán)境與干擾狀況,此問題無法基于數(shù)學(xué)推導(dǎo)獲取閉式解,然而可通過神經(jīng)網(wǎng)絡(luò)加以訓(xùn)練與學(xué)習(xí),以獲得最優(yōu)解[4]。
為實(shí)現(xiàn)分布式尋優(yōu),并保障模型在不同網(wǎng)絡(luò)規(guī)模中的適應(yīng)性,針對網(wǎng)絡(luò)鏈路并行開展獨(dú)立網(wǎng)絡(luò)訓(xùn)練,具體如圖3所示。鏈路決策結(jié)束之后,反饋結(jié)果于自身鏈路,更新網(wǎng)絡(luò)環(huán)境,并持續(xù)迭代鏈路。在持續(xù)性迭代中,整個網(wǎng)絡(luò)獲得鏈路調(diào)度最優(yōu)策略。在迭代或?qū)?yōu)之后,就鏈路調(diào)度輸出,可得知網(wǎng)絡(luò)容量。在此學(xué)習(xí)框架下,全部鏈路都保持獨(dú)立、并行學(xué)習(xí),以生成網(wǎng)絡(luò)全部鏈路決策,因此網(wǎng)絡(luò)布局與鏈路數(shù)量對于分布式智能調(diào)度算法并不會造成影響。
圖3 強(qiáng)化學(xué)習(xí)整體框架
鏈路訓(xùn)練需基于通信感知閾限之內(nèi)的其他鏈路信息,實(shí)現(xiàn)正確決策。通過感知環(huán)境建模,抽象化關(guān)鍵狀態(tài)信息為神經(jīng)網(wǎng)絡(luò)輸入特征,以輸入網(wǎng)絡(luò)實(shí)現(xiàn)智能決策。而神經(jīng)網(wǎng)絡(luò)輸入特征即訓(xùn)練鏈路信道增益及其狀態(tài)、訓(xùn)練鏈路感知閾限之內(nèi)其他鏈路信道增益及其狀態(tài)、訓(xùn)練鏈路干擾信息(通信范圍之內(nèi)對于其他鏈路所形成的干擾與由其他激活鏈路所帶來的干擾)。
信道增益:為防止干擾信道進(jìn)行估計(jì)產(chǎn)生計(jì)算成本,并保障整個網(wǎng)絡(luò)適應(yīng)性,基于路徑損耗模型生成卷積核,以衡量鏈路信道增益。
干擾特征:由天線定向傳輸模型劃分卷積核為四個不同波束方向卷積核,以獲取并分析鏈路可感知閾限之內(nèi)存在的定向干擾;將通信網(wǎng)格進(jìn)行劃分,單個網(wǎng)格應(yīng)和卷積核網(wǎng)格大小相同,面向網(wǎng)格統(tǒng)計(jì)激活鏈路接收機(jī)與發(fā)射機(jī)節(jié)點(diǎn)數(shù)量,以構(gòu)成接收與發(fā)射節(jié)點(diǎn)密度矩陣。在發(fā)射機(jī)節(jié)點(diǎn)密度統(tǒng)計(jì)過程中,應(yīng)就激活鏈路接收與發(fā)射節(jié)點(diǎn)對應(yīng)位置,進(jìn)行鏈路發(fā)射節(jié)點(diǎn)波束方向計(jì)算分析,以形成多波束方向發(fā)射節(jié)點(diǎn)密度矩陣。在分布式網(wǎng)格內(nèi),所有節(jié)點(diǎn)都不可能獲取全局信息,各節(jié)點(diǎn)可依靠的實(shí)際上是在訓(xùn)練鏈路感知范圍之內(nèi)能夠感知到的相關(guān)信息[5]。
通過卷積核與節(jié)點(diǎn)密度進(jìn)行鏈路干擾強(qiáng)度統(tǒng)計(jì)分析的優(yōu)勢在于,可防止估算網(wǎng)絡(luò)全部干擾信道,以避免造成不可估量的計(jì)算成本;面向不同通信感知范圍與信道傳輸模型時,只需就不同范圍與模型進(jìn)行卷積核修改即可,可在很大程度上保障分布式智能調(diào)度算法適應(yīng)性。
通過卷積進(jìn)行局部特征提取,并輸入全連接神經(jīng)網(wǎng)絡(luò),以網(wǎng)絡(luò)學(xué)習(xí)實(shí)現(xiàn)目標(biāo)。神經(jīng)網(wǎng)絡(luò)即同層神經(jīng)元間并未銜接,而第m層神經(jīng)元與第m-1層神經(jīng)元相互對接。單個神經(jīng)元是由輸入、線性加權(quán)、非線性激活函數(shù)、輸出共同構(gòu)成的,其通常是執(zhí)行線性運(yùn)算,激活函數(shù)以進(jìn)行非線性預(yù)算,從而基于神經(jīng)網(wǎng)絡(luò)擬合函數(shù),求解問題[6]。
而強(qiáng)化學(xué)習(xí)是就環(huán)境決策問題所設(shè)計(jì)的模型,只需評估環(huán)境的行為價值即可。在每一次迭代時,鏈路都會直接決定其是否激活,即此次迭代的動作。而不同激活狀態(tài)所引發(fā)的網(wǎng)絡(luò)干擾環(huán)境變化也存在一定差異,且對于網(wǎng)絡(luò)容量的影響也大不相同。本文以網(wǎng)絡(luò)容量為獎勵,基于調(diào)整動作策略適度加大獎勵值,以最大程度上降低干擾,同時最大化網(wǎng)絡(luò)容量。
以分布式智能調(diào)度算法與全部激活、粒子群算法進(jìn)行性能對比分析。
全部激活:全部鏈路激活,只需一次性計(jì)算即可;粒子群算法:無法獲取全局最優(yōu)解時的典型尋求算法,迭代以此需計(jì)算種群粒子具體位置、速度、適應(yīng)度相關(guān)值;分布式算法:將通信網(wǎng)絡(luò)劃分為卷積核網(wǎng)格,需通過全連通級輸入特征向量、隱藏層神經(jīng)元數(shù)量以及通信網(wǎng)絡(luò)鏈路數(shù)量進(jìn)行神經(jīng)網(wǎng)絡(luò)運(yùn)行時間復(fù)雜度計(jì)算。以鏈路干擾衡量方式為基礎(chǔ),由多次尋優(yōu)內(nèi)擇取最優(yōu)結(jié)果,從而與分布式算法對比分析[7]。
在性能評估時,于600×600m 地理圖中隨機(jī)生成60 對節(jié)點(diǎn),以構(gòu)成數(shù)據(jù)集,其中包括通信網(wǎng)絡(luò)全部鏈路位置。卷積核代表節(jié)點(diǎn)感知范圍。
對比了兩種不同算法與全部激活的網(wǎng)絡(luò)容量。不同算法網(wǎng)絡(luò)容量具體如圖4所示。
圖4 基于不同迭代次數(shù)的不同算法網(wǎng)絡(luò)容量
由圖可知,就算法收斂角度而言,粒子群算法尋優(yōu)需要經(jīng)過的迭代次數(shù)最多,分布式智能調(diào)度算法只需通過3-4次,就能獲取最優(yōu)化結(jié)果,而且算法與環(huán)境間實(shí)時交互,以確保在環(huán)境變動時,節(jié)點(diǎn)可就環(huán)境變化進(jìn)行策略調(diào)整。此外密度矩陣與卷積核單個網(wǎng)格可為節(jié)點(diǎn)提供活動空間范圍,以適應(yīng)節(jié)點(diǎn)在迭代時的實(shí)時變動。所以說分布式智能調(diào)度算法可確保實(shí)時操作性,且網(wǎng)絡(luò)容量性能良好。
不同迭代次數(shù)下基于卷積核的不同算法網(wǎng)絡(luò)容量具體如表1所示。
表1 不同迭代次數(shù)下基于卷積核的算法容量(單位:bit s-1Hz-1)
由表1可知,在卷積核逐步增大的趨勢下,不同算法的網(wǎng)絡(luò)容量都會有所下降。這主要是由于卷積核增大代表著算法節(jié)點(diǎn)感知范圍擴(kuò)大,造成干擾的鏈路數(shù)量變多,以此網(wǎng)絡(luò)干擾便會增多,容量則會隨之降低。而且基于不同卷積核,算法收斂并未發(fā)生顯著變化,尋優(yōu)所需要的迭代次數(shù)大體相同,而分布式智能調(diào)度算法迭代次數(shù)明顯少于粒子群算法。
不同迭代次數(shù)下基于網(wǎng)絡(luò)規(guī)模的不同算法網(wǎng)絡(luò)容量具體如表2所示。
由表2可知,在網(wǎng)絡(luò)規(guī)模不斷擴(kuò)大的形勢下,盡管干擾愈發(fā)嚴(yán)重,但是并發(fā)鏈路數(shù)量仍舊呈現(xiàn)持續(xù)增加狀態(tài),因此網(wǎng)絡(luò)容量表現(xiàn)為逐步增大的態(tài)勢。在網(wǎng)絡(luò)規(guī)模擴(kuò)大時,粒子群算法收斂性能倍受影響,迭代次數(shù)顯著增多,而分布式智能調(diào)度算法并未發(fā)生明顯變化。
表2 不同迭代次數(shù)下基于網(wǎng)絡(luò)規(guī)模的算法容量(單位:bit s-1Hz-1)
基于不同卷積核的算法網(wǎng)絡(luò)容量具體如圖5所示。
圖5 基于不同卷積核的算法網(wǎng)絡(luò)容量
由圖可知,基于不同卷積核,相較于與全部激活、粒子群算法,分布式智能調(diào)度算法所獲取網(wǎng)絡(luò)吞吐量與其差異并不顯著,遠(yuǎn)高于全部鏈路激活算法的性能,說明分布式智能調(diào)度算法于不同感知范圍內(nèi)都可快速準(zhǔn)確學(xué)習(xí)調(diào)度策略。
基于不同網(wǎng)絡(luò)規(guī)模的算法網(wǎng)絡(luò)容量具體如圖6所示。
圖6 基于不同網(wǎng)絡(luò)規(guī)模的算法網(wǎng)絡(luò)容量
由圖可知,隨著網(wǎng)絡(luò)規(guī)??s小,節(jié)點(diǎn)分布愈發(fā)分散,出現(xiàn)定向干擾的幾率也非常小,激活全部鏈路便可獲取較好網(wǎng)絡(luò)容量;隨著網(wǎng)絡(luò)規(guī)模擴(kuò)大,節(jié)點(diǎn)分布越來越緊密,出現(xiàn)干擾的幾率快速增大,分布式智能調(diào)度算法所獲效果更為顯著。
總之,相比粒子群算法,雖然分布式智能調(diào)度算法的網(wǎng)絡(luò)容量稍微偏低,但是在具體無線通信網(wǎng)絡(luò)環(huán)境下,以粒子群算法調(diào)度抗干擾鏈路資源的難度非常大,所以本文提出的分布式智能調(diào)度算法更具優(yōu)勢。
綜上所述,本文針對無線通信網(wǎng)絡(luò)提出了抗干擾鏈路資源分布式智能調(diào)度算法,并進(jìn)行了仿真分析,以此得出結(jié)論:
就算法收斂角度而言,粒子群算法尋優(yōu)需要經(jīng)過的迭代次數(shù)最多,而分布式智能調(diào)度算法只需通過3-4 次,就能獲取最優(yōu)化結(jié)果,且分布式智能調(diào)度算法可確保實(shí)時操作性,網(wǎng)絡(luò)容量性能良好;在卷積核逐步增大的趨勢下,不同算法的網(wǎng)絡(luò)容量都會有所下降,基于不同卷積核,算法收斂并未發(fā)生顯著變化,尋優(yōu)所需要的迭代次數(shù)大體相同,而分布式智能調(diào)度算法迭代次數(shù)明顯少于粒子群算法;在網(wǎng)絡(luò)規(guī)模擴(kuò)大時,粒子群算法收斂性能倍受影響,迭代次數(shù)顯著增多,而分布式智能調(diào)度算法并未發(fā)生明顯變化;基于不同卷積核,相較于與全部激活、粒子群算法,分布式智能調(diào)度算法于不同感知范圍內(nèi)都可快速準(zhǔn)確學(xué)習(xí)調(diào)度策略;基于不同網(wǎng)絡(luò)規(guī)模,分布式智能調(diào)度算法所獲效果更為顯著;相比粒子群算法,雖然分布式智能調(diào)度算法的網(wǎng)絡(luò)容量稍微偏低,但是在具體無線通信網(wǎng)絡(luò)環(huán)境下,以粒子群算法調(diào)度抗干擾鏈路資源的難度非常大,所以分布式智能調(diào)度算法更具優(yōu)勢。