方國杏,賈楠楠,張逸凡,王龍龍,王淑賢,楊 茹,彭張節(jié),2*
(1.上海師范大學(xué)信息與機(jī)電工程學(xué)院,上海201418;2.東南大學(xué)信息科學(xué)與工程學(xué)院移動通信國家重點(diǎn)實(shí)驗(yàn)室,江蘇南京211189)
協(xié)作通信技術(shù)是通過網(wǎng)絡(luò)中移動節(jié)點(diǎn)的彼此協(xié)作進(jìn)行通信,可提高無線網(wǎng)絡(luò)的容量及可靠性.在無線通信中,該技術(shù)已被用于對抗無線衰落,從而提升系統(tǒng)性能.協(xié)作中繼節(jié)點(diǎn)的數(shù)據(jù)處理方式包括放大轉(zhuǎn)發(fā)協(xié)議(AF)和譯碼轉(zhuǎn)發(fā)協(xié)議(DF),前者只是簡單地把接收到的數(shù)據(jù)放大之后轉(zhuǎn)發(fā)出去;后者在對接收到的信號譯碼及編碼之后再轉(zhuǎn)發(fā)出去.本研究的中繼節(jié)點(diǎn)采用AF數(shù)據(jù)處理方式.
在中繼選擇方案中,通過全局選擇協(xié)作中繼來提高網(wǎng)絡(luò)性能,中繼節(jié)點(diǎn)被允許進(jìn)行自適應(yīng)功率調(diào)整的策略,這會造成大量的網(wǎng)絡(luò)開銷.從實(shí)際的角度考慮,限定中繼節(jié)點(diǎn)的功率水平的網(wǎng)絡(luò)更加可行.本研究假設(shè)每個(gè)中繼都有兩個(gè)功率水平:零和最大功率,即一個(gè)中繼節(jié)點(diǎn)要么用允許的最大功率參與協(xié)作,要么保持沉默狀態(tài).
大數(shù)據(jù)驅(qū)動的人工智能技術(shù)取得了長足的進(jìn)步,在語言、圖像處理領(lǐng)域的運(yùn)用非常成功.伴隨著并行計(jì)算架構(gòu)的發(fā)展,深度學(xué)習(xí)技術(shù)也具備了在線運(yùn)算的能力,高實(shí)時(shí)性以及低復(fù)雜度等優(yōu)點(diǎn)使其能與無線通信緊密地結(jié)合[1-5].
在由一個(gè)信源、一個(gè)信宿和多個(gè)并行轉(zhuǎn)發(fā)放大中繼節(jié)點(diǎn)組成的網(wǎng)絡(luò)中,提出一套基于深度學(xué)習(xí)的多中繼選擇策略,研究分析該策略下,網(wǎng)絡(luò)的平均接收信噪比(SNR)和能效的性能.
兩跳AF 中繼無線網(wǎng)絡(luò)系統(tǒng)框圖如圖1所示,主要由三部分組成:一個(gè)信源節(jié)點(diǎn)S,一個(gè)信宿節(jié)點(diǎn)X,N 個(gè)并行的AF 中繼節(jié)點(diǎn),分別用Ri表示,i=1'2'…'N.其中,S 和X 之間沒有直達(dá)信道,須通過中繼節(jié)點(diǎn)的協(xié)作才能進(jìn)行通信.每個(gè)中繼節(jié)點(diǎn)只有一根半雙工的全向收發(fā)天線,可用于發(fā)送和接收.分別用fi和gi表示S 到Ri和Ri到X 的信道狀態(tài)信息(CSI),i=1'2'…'N.假設(shè)第i 個(gè)中繼節(jié)點(diǎn)已知其信道狀態(tài)信息fi和gi,并且X 已知全局信道狀態(tài)信息.每次傳輸時(shí),在信源處使用的功率為P,在中繼處使用的發(fā)射功率為Pi.當(dāng)信源和信宿之間有發(fā)送任務(wù)時(shí),中繼節(jié)點(diǎn)要么以全部功率協(xié)作,要么不協(xié)作通信[6-7].
圖1 兩跳AF中繼無線網(wǎng)絡(luò)系統(tǒng)框圖
其中,w是信宿中的噪聲;vi是第i個(gè)中繼中的噪聲,假設(shè)噪聲都是具有零均值和單位方差的獨(dú)立同分布復(fù)高斯隨機(jī)變量.因此,可以計(jì)算出信宿節(jié)點(diǎn)的平均接收SNR[7]
信宿節(jié)點(diǎn)X的平均SNR最大化問題可表示為:
在最大化接收SNR 的同時(shí),為每個(gè)中繼分配了單獨(dú)的功率約束.因此,在中繼選擇策略中,總發(fā)射功率隨著協(xié)作中繼的集合變化而變化.該系統(tǒng)的能效可以表示為:
式(3)是一個(gè)非線性、非凸的0-1整數(shù)規(guī)劃問題,只能采用窮舉法求得該問題的最優(yōu)解,但是隨著中繼節(jié)點(diǎn)的數(shù)量增大,該問題的時(shí)間復(fù)雜度呈指數(shù)型增長[8-9].本研究通過深度神經(jīng)網(wǎng)絡(luò)無限逼近該問題的最優(yōu)解.
2.1.1 生成訓(xùn)練數(shù)據(jù)集
1)根據(jù)大小為N×2的信道狀態(tài)信息矩陣Hm生成大小為N×4的訓(xùn)練樣本;
2)根據(jù)所有的信道狀態(tài)信息數(shù)據(jù)集m={1'…'M},重復(fù)步驟1;
3)將dm變 成 大 小 為1×4N 的 矢 量,通 過 堆 疊生 成 訓(xùn) 練 數(shù) 據(jù) 集D ∈RM×4N,即D=
2.1.2 定義關(guān)鍵績效指標(biāo)(KPI)
通過KPI對訓(xùn)練數(shù)據(jù)集進(jìn)行標(biāo)簽.在通信中,可以選擇任何性能評判準(zhǔn)則作為KPI指標(biāo),如能效、誤碼率(BER)和平均接收SNR等.本研究選擇信宿節(jié)點(diǎn)的平均接收SNR作為KPI.
2.1.3 為訓(xùn)練數(shù)據(jù)集標(biāo)簽
為確定一個(gè)訓(xùn)練樣本的類別標(biāo)簽,計(jì)算每個(gè)協(xié)作中繼集合的KPI,選擇達(dá)到最大KPI 的協(xié)作中繼集合的索引,作為該訓(xùn)練樣本的類別標(biāo)簽.
DNN-relay-net 模型是一個(gè)具有5層結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)模型.第一層是一個(gè)具有256個(gè)隱藏節(jié)點(diǎn)的全連接層(Dense),輸入是一個(gè)大小為1×20 的訓(xùn)練樣本d'm,以max(x,0)為激活函數(shù);第二層為Dropout 層,以0.08 的概率隨機(jī)舍棄第一層一部分的權(quán)重;第三層是一個(gè)具有128 個(gè)隱藏節(jié)點(diǎn)的全連接層,以max(x'0)為激活函數(shù);第四層為Dropout層,以0.08的概率隨機(jī)舍棄第三層一部分的權(quán)重;第五層是一個(gè)具有31個(gè)隱藏節(jié)點(diǎn)的全連接層,以softmax為激活函數(shù),輸出對應(yīng)訓(xùn)練樣本的預(yù)測標(biāo)簽.
圖2 3種選擇策略的平均接收SNR比較
圖3 為基于3 種中繼選擇策略的能效性能曲線.從圖3 中可以看到,隨著P 不斷增大,3 種中繼選擇策略的能效均增大.隨機(jī)選擇策略的能效最差,而基于DNN-relay-net 模型的選擇策略在一段時(shí)間內(nèi)能效高于最優(yōu)選擇策略,這是因?yàn)镈NN-relay-net 模型在預(yù)測時(shí),并未達(dá)到100%的正確率,在發(fā)射功率較低時(shí),最優(yōu)選擇策略傾向于同時(shí)使用5 個(gè)中繼節(jié)點(diǎn)獲得最優(yōu)的平均接收SNR,而DNN-relay-net 模型選擇總功率較小的協(xié)作中繼子集,在兩者平均接收SNR 幾乎相等的情況下,DNN-relay-net 模型獲得更高的能效;隨著發(fā)射功率的增大,DNN-relay-net模型的能效開始逐漸低于最優(yōu)選擇策略.
圖3 3種選擇策略的能效比較
通過測試樣本的平均預(yù)測時(shí)間衡量模型的時(shí)間復(fù)雜度[9].表1 分別顯示了基于DNN-relay-net 模型的中繼選擇策略和基于最優(yōu)選擇策略的測試樣本的平均預(yù)測時(shí)間.通過表1 可以看到,DNN-relay-net模型的時(shí)間復(fù)雜度明顯低于最優(yōu)選擇策略.
表1 2種策略時(shí)間復(fù)雜度比較
將兩跳中繼網(wǎng)絡(luò)中的多中繼選擇問題描述為一個(gè)多分類問題,利用基于深度學(xué)習(xí)的方案(DNN 神經(jīng)網(wǎng)絡(luò))構(gòu)建分類模型,并選擇協(xié)作中繼子集,最大化平均接收SNR.仿真結(jié)果可以看出,該策略可以獲得與最優(yōu)算法相當(dāng)?shù)钠骄邮誗NR,同時(shí)降低了時(shí)間復(fù)雜度.然而,該策略存在一定的誤分類情況,在發(fā)射功率較高時(shí),能效明顯低于最優(yōu)選擇策略.下一步將通過對策略的改進(jìn),提高分類精度.