楊媛媛,丁建軍
(1.西安郵電大學(xué) 通信與信息工程學(xué)院,陜西 西安 710121; 2.陜西省信息通信網(wǎng)絡(luò)及安全重點(diǎn)實(shí)驗(yàn)室,陜西 西安 710121; 3.中興通訊股份有限公司,廣東 深圳 518057)
大規(guī)模多輸入多輸出(multiple-input multiple-output,MIMO)技術(shù)作為5G關(guān)鍵技術(shù)之一,可以提高系統(tǒng)容量和頻譜利用率[1],這得益于基站(base station,BS)處獲得的準(zhǔn)確信道狀態(tài)信息(channel state information,CSI)。但隨著天線數(shù)增加,反饋開銷急劇增加,如何減少反饋開銷成為研究熱點(diǎn),但傳統(tǒng)方法有很多缺點(diǎn),例如基于向量量化的方法需要占用太多上行頻譜資源[2]?;诖a本的方法反饋完整CSI需要過多反饋比特?cái)?shù)。許多基于壓縮感知的方法,例如LASSO-solver,TVAL3[3]和BM3D-AMP[4]等,需假設(shè)CSI是稀疏的,且重構(gòu)算法大多是迭代算法,復(fù)雜度高。
深度學(xué)習(xí)(deep learning,DL)作為當(dāng)今最流行的研究趨勢之一,應(yīng)用廣泛,已有工作將DL算法引入大規(guī)模MIMO反饋方案中,為解決傳統(tǒng)CSI反饋難題提供新思路。其中,文獻(xiàn)[5]提出一種基于DL的網(wǎng)絡(luò)CsiNet,通過編碼器對(duì)CSI進(jìn)行壓縮,解碼器進(jìn)行重構(gòu);文獻(xiàn)[6]提出CsiNet-LSTM,在相干時(shí)間內(nèi)用長短期記憶(long short term memory,LSTM)提取信道的時(shí)間相關(guān)性,進(jìn)一步提高信道恢復(fù)的質(zhì)量;文獻(xiàn)[7]提出RecCsiNet,用卷積網(wǎng)來提取/恢復(fù)信道特征,將全連接層和LSTM并聯(lián)作為壓縮/解壓縮模塊,其中LSTM學(xué)習(xí)殘差特征,為了減少參數(shù)量又提出了PR-RecCsiNet。但這些模型只處理固定維數(shù)的CSI,且都包含全連接層,參數(shù)量大,訓(xùn)練復(fù)雜度高。
本文提出了一種新的信道反饋網(wǎng)絡(luò),命名為多卷積多轉(zhuǎn)置卷積網(wǎng)絡(luò)(multiple-convolutional multiple-transposed-convolutional network,MCMTNet)。MCMTNet由卷積神經(jīng)網(wǎng)絡(luò)、轉(zhuǎn)置卷積神經(jīng)網(wǎng)絡(luò)和精細(xì)密集連接網(wǎng)絡(luò)組成。仿真結(jié)果表明,提出的MCMTNet性能優(yōu)于傳統(tǒng)壓縮感知方法和CsiNet[5],尤其是在高壓縮比情況下。
本文考慮一個(gè)單小區(qū)頻分雙工(frequency division duplex,FDD)大規(guī)模MIMO正交頻分復(fù)用(orthogonal frequency division multiplexing,OFDM)系統(tǒng),假設(shè)BS配置了Nt個(gè)發(fā)射天線,用戶設(shè)備(user equipment,UE)配置1根接收天線,且OFDM系統(tǒng)在Nc個(gè)正交子載波上傳輸信息,第i個(gè)子載波上的接收信號(hào)表示為
(1)
為了減少反饋開銷,通過二維離散傅里葉變換(discrete Fourier transformation,DFT)將H變換到角度延遲域以增加稀疏性
(2)
式中Fd和Fa分別為Nc×Nt,Nt×Nt的DFT矩陣,由于時(shí)延擴(kuò)展的有限性,稀疏矩陣H′只有前N(N?Nc)行有非零值,其余行元素幾乎為零。因此,保留H′的前N行為矩陣H″,此時(shí)反饋參數(shù)量減少至N×Nt。
雖然參數(shù)量減少了,但N×Nt仍是一個(gè)很大的數(shù)字,需要設(shè)計(jì)合理的反饋方案進(jìn)一步壓縮信息。由于傳統(tǒng)方法性能不佳,因此考慮DL算法,整體反饋流程如圖1所示。首先,H做2D-DFT變換為H′,截?cái)嗪鬄镠″,再根據(jù)壓縮比,將H″通過壓縮模塊變成特征向量s,UE將s反饋給BS。BS再根據(jù)壓縮比,將s通過重構(gòu)模塊恢復(fù)出″,再補(bǔ)零為′,最后′再經(jīng)過離散傅里葉逆變換(inverse discrete Fourier transformation,IDFT)變換為。本文的目標(biāo)是設(shè)計(jì)和訓(xùn)練MCMTNet,使經(jīng)過壓縮重構(gòu)后的″與H″之間差異最小化。
圖1 下行CSI反饋工作流程框圖
CsiNet采用全連接層進(jìn)行壓縮/解壓縮,其維數(shù)與信道維數(shù)有關(guān),參數(shù)量巨大,提出的MCMTNet解決了這個(gè)問題,MCMTNet結(jié)構(gòu)如圖2所示,由卷積神經(jīng)網(wǎng)絡(luò)、轉(zhuǎn)置卷積神經(jīng)網(wǎng)絡(luò)和精細(xì)密集連接網(wǎng)絡(luò)構(gòu)成。
圖2 MCMTNet結(jié)構(gòu)
網(wǎng)絡(luò)的壓縮模塊由多層卷積神經(jīng)網(wǎng)絡(luò)構(gòu)成,層數(shù)由壓縮比決定,構(gòu)成通用壓縮模塊,用C(x)表示具有l(wèi)層卷積神經(jīng)網(wǎng)絡(luò)的輸出
C(x)=ωl(ωl-1(…(ω2(ω1x+b1)+b2)…)+bl-1)+bl
=ω1ωl-1…ω2ω1x+ωlωl-1…ω2b1+…+ωlbl-1+bl
(3)
式中x,ωl,bl分別為網(wǎng)絡(luò)的輸入、權(quán)重矩陣和偏置向量,通過ω1ωl-1…ω2ω1對(duì)輸入進(jìn)行壓縮,壓縮后的特征向量為s,即s=C(H″)。壓縮模塊第一層的卷積核大小為3×3,步長為1,填充為1,輸入經(jīng)過第一層維數(shù)不變,之后每一層的卷積核大小為4×4,步長為2,填充為1,此時(shí)維數(shù)按比例縮小為原來的50 %,因此,該壓縮模塊可以處理任何維數(shù)的輸入。
轉(zhuǎn)置卷積在圖像語義分割領(lǐng)域主要用來將特征圖放大回原來的尺寸,與原有的卷積操作類似,區(qū)別在于轉(zhuǎn)置卷積是卷積的反向過程[8]。本文通過多層轉(zhuǎn)置卷積網(wǎng)絡(luò)對(duì)s初始重構(gòu),層數(shù)由壓縮比確定,其結(jié)構(gòu)與壓縮模塊對(duì)稱,構(gòu)成通用重構(gòu)模塊。假設(shè)D(x)為轉(zhuǎn)置卷積神經(jīng)網(wǎng)絡(luò)的輸出,將s反饋給BS后,BS通過多層轉(zhuǎn)置卷積神經(jīng)網(wǎng)絡(luò)對(duì)s進(jìn)行初始重構(gòu),通過最小化均方誤差(mean squared error,MSE)從多層轉(zhuǎn)置卷積神經(jīng)網(wǎng)絡(luò)中得到初始重構(gòu)
(4)
式中θCom為壓縮模塊參數(shù),θD為多層轉(zhuǎn)置卷積神經(jīng)網(wǎng)絡(luò)參數(shù),‖·‖2為歐幾里德范數(shù),T為訓(xùn)練集總樣本數(shù)。
過深網(wǎng)絡(luò)會(huì)產(chǎn)生退化問題,為解決該問題,密集卷積網(wǎng)絡(luò)提出了密集連接機(jī)制,即互相連接所有的層,以實(shí)現(xiàn)特征重用[9]。受RefineNet[6]和密集連接機(jī)制[9]啟發(fā),設(shè)計(jì)了精細(xì)密集連接網(wǎng)絡(luò),如圖3所示,由4個(gè)卷積塊、密集連接以及卷積網(wǎng)構(gòu)成,其中每一層的卷積核大小為3×3,輸入輸出通道數(shù)不同,其他參數(shù)一致。
圖3 精細(xì)密集連接網(wǎng)絡(luò)
通過密集連接將特征連接到所有卷積塊,以提高信道重構(gòu)的性能,令人R(x)表示精細(xì)密集連接網(wǎng)絡(luò)的輸出,通過最小化MSE從精細(xì)密集連接網(wǎng)絡(luò)中得出最終重構(gòu)
L(θCom,θRec)=L(θCom,θD,θR)
(5)
式中θRec為整個(gè)重構(gòu)模塊參數(shù),包括轉(zhuǎn)置卷積神經(jīng)網(wǎng)絡(luò)參數(shù)θD和精細(xì)密集連接網(wǎng)絡(luò)參數(shù)θR。
本文與LASSOl1-solver[3],TVAL3[4],BM3D-AMP[5]和CsiNet[6]進(jìn)行對(duì)比,使用CsiNet[6]的數(shù)據(jù)集,該數(shù)據(jù)集由COST 2100模型[10]產(chǎn)生,考慮工作頻率為5.3 GHz的室內(nèi)場景。BS采用Nt=32根發(fā)射天線,UE配置1根接收天線,OFDM的子載波數(shù)Nc=32,令N=Nt=32,則H″的維數(shù)為32×32。訓(xùn)練集、驗(yàn)證集、測試集數(shù)據(jù)量分別為100 000, 30 000, 20 000,批處理大小為200,迭代次數(shù)為1 000。網(wǎng)絡(luò)的部署和訓(xùn)練采用PyTorch框架,并采用GPU進(jìn)行加速。使用Xavier[11]初始化網(wǎng)絡(luò)的權(quán)值參數(shù),使用Adam優(yōu)化器和帶預(yù)熱的余弦退火動(dòng)態(tài)學(xué)習(xí)率調(diào)整方案,并采用Mish激活函數(shù),其表達(dá)式為
f(x)=x×tanh(softplus(x))
(6)
為評(píng)價(jià)模型的性能,用歸一化均方誤差(normalized mean squared error,NMSE)表示原始信道數(shù)據(jù)H″和重構(gòu)后的信道數(shù)據(jù)″的差異,其公式為
(7)
(8)
MCMTNet與其他方法在NMSE和ρ的對(duì)比結(jié)果如表1所示,由表1可得,當(dāng)壓縮比大于1/4時(shí),MCMTNet性能均優(yōu)于其他方法。當(dāng)壓縮比大于1/4時(shí),傳統(tǒng)壓縮感知方法已不能滿足要求,此時(shí)便體現(xiàn)出DL方法的優(yōu)勢,且MCMTNet的NMSE比CsiNet平均改善了1.78 dB,在ρ上改善了3 %。
表1 不同壓縮比下NMSE(dB)和ρ對(duì)比
本文還對(duì)比了MCMTNet和CsiNet參數(shù)量,如表2所示。由表2可知,MCMTNet的參數(shù)量遠(yuǎn)少于CsiNet,這是因?yàn)镃siNet包含全連接層,其參數(shù)量與該層的輸入、輸出維數(shù)有關(guān),而卷積層的參數(shù)量與其卷積核大小、輸入通道數(shù)有關(guān),而與輸入、輸出維數(shù)無關(guān),所以,相同壓縮比條件下卷積層的參數(shù)量遠(yuǎn)小于全連接層。
表2 不同壓縮比下網(wǎng)絡(luò)參數(shù)量對(duì)比
此外,還對(duì)比了不同激活函數(shù)的NMSE,結(jié)果如表3所示。由表3可知,Mish激活函數(shù)的NMSE低于Sigmod,ReLU激活函數(shù),說明Mish激活函數(shù)相比這兩種激活函數(shù)增加了模型的非線性能力,增強(qiáng)了網(wǎng)絡(luò)的表達(dá)能力。同時(shí),隨著壓縮比不斷增大,即網(wǎng)絡(luò)層數(shù)不斷增加,Mish激活函數(shù)改善了梯度消失問題。
表3 不同壓縮比下各激活函數(shù)的NMSE(dB)對(duì)比
最后,通過繪制模型的損失曲線來驗(yàn)證模型的收斂性,選取壓縮比為1/32的模型,MSE損失曲線如圖4所示。根據(jù)圖4可知MCMTNet的訓(xùn)練損失曲線平滑且收斂速度快,測試損失曲線以訓(xùn)練損失曲線為下界上下波動(dòng),說明網(wǎng)絡(luò)訓(xùn)練輕微過擬合,但最終與訓(xùn)練損失曲線趨于一致,共同收斂,這得益于DL網(wǎng)絡(luò)強(qiáng)大的特征提取和壓縮能力。
圖4 均方誤差損失變化曲線
針對(duì)單小區(qū)FDD大規(guī)模MIMO系統(tǒng),提出了一種可以處理任意維數(shù)CSI的信道反饋網(wǎng)絡(luò)MCMTNet,其性能優(yōu)于CsiNet和傳統(tǒng)壓縮感知方法。在訓(xùn)練中采用了Mish激活函數(shù),并與Sigmoid,ReLU激活函數(shù)進(jìn)行對(duì)比,結(jié)果表明:Mish激活函數(shù)顯著提高了網(wǎng)絡(luò)的性能。此外,MCMTNet采用卷積/轉(zhuǎn)置卷積層對(duì)CSI進(jìn)行壓縮/解壓縮,每一層網(wǎng)絡(luò)的尺寸與輸入、輸出數(shù)據(jù)的維數(shù)無關(guān),因此,MCMTNet可以處理任意維數(shù)信道數(shù)據(jù),并降低了網(wǎng)絡(luò)參數(shù)量。