方世林,趙子琪,余 丹,謝文武,方世峰
(1.湖南理工學(xué)院 信息科學(xué)與工程學(xué)院,湖南 岳陽(yáng) 414006; 2.廣興洲中學(xué),湖南 岳陽(yáng) 414016)
非正交多址(NOMA)是第五代無(wú)線通信中提高頻譜效率和系統(tǒng)吞吐量的一種多址技術(shù)[1,2].對(duì)于功率域與碼域中相同的時(shí)頻資源,NOMA 系統(tǒng)可以允許其中兩個(gè)以上的用戶來(lái)共享這些資源.在正交頻分復(fù)用系統(tǒng)中,一個(gè)用戶在一個(gè)時(shí)隙可以訪問(wèn)一組子載波信道.通過(guò)引入NOMA,可以將信道條件較好的用戶與信道條件較差的用戶的子載波共享,從而有效地利用帶寬資源[3~6].NOMA 系統(tǒng)接收機(jī)常采用串行干擾抵消(SIC)算法,該算法雖然實(shí)現(xiàn)簡(jiǎn)單,但是性能較差; 而性能較好的最大似然算法(Maximum Likelihood,ML)復(fù)雜度過(guò)高,一般不用于實(shí)際產(chǎn)品中[7~9].因而,需要尋找一種合適于NOMA 系統(tǒng)的接收機(jī).
深度學(xué)習(xí)(Deep Learning,DL)是近年來(lái)發(fā)展十分迅速且熱度很高的研究領(lǐng)域,它是一種特殊的人工神經(jīng)網(wǎng)絡(luò)模型.從根源上來(lái)講,深度學(xué)習(xí)其實(shí)是機(jī)器學(xué)習(xí)的一個(gè)分支[10].早在2006年,被稱為深度學(xué)習(xí)之父的Hinton 就在《Science》上發(fā)文,綜合其發(fā)文,可以概括出他的兩個(gè)主要觀點(diǎn): (1)對(duì)多層次的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行了闡述,其特征學(xué)習(xí)能力是十分強(qiáng)大并且優(yōu)秀的; (2)多層網(wǎng)絡(luò)難以訓(xùn)練,但該困難是可以解決的,它可以通過(guò)分層訓(xùn)練(Layer Wise Prc Training)來(lái)有效解決,并首次提出了無(wú)監(jiān)督自主學(xué)習(xí)逐層預(yù)訓(xùn)練法.
本文將深度學(xué)習(xí)應(yīng)用于NOMA 系統(tǒng),提出了一種基于DL 的NOMA 接收機(jī),其性能較傳統(tǒng)SIC 算法優(yōu)越,接近于最優(yōu)的ML 算法,且復(fù)雜度較ML 算法低.
考慮如圖1 所示的OFDM 系統(tǒng)中的兩個(gè)用戶上行鏈路NOMA 場(chǎng)景,其中兩個(gè)用戶終端共享相同的頻
圖1 用戶的NOMA 系統(tǒng)
率資源同時(shí)傳輸數(shù)據(jù).基站(Basic Station,BS)將接收來(lái)自兩個(gè)用戶的數(shù)據(jù)符號(hào)的疊加,包括信道噪聲.在用戶終端和BS 處使用單個(gè)天線.假設(shè)發(fā)射機(jī)和接收機(jī)處的CSI 都已知,則執(zhí)行功率分配.功率分配的原則是使多個(gè)用戶有一個(gè)合適的SINR,以便在接收端進(jìn)行聯(lián)合譯碼.
假設(shè)N個(gè)子載波OFDM 系統(tǒng)中每個(gè)子載波的用戶數(shù)為M,子載波上的接收信號(hào)滿足
其中Y(k),Xi(k)和W(k)分別是頻域接收信號(hào),用戶i的傳輸符號(hào)和加性高斯白噪聲; 變量Pi(k)表示在子載波k上分配給用戶i的傳輸功率.為N個(gè)子載波中的每一個(gè)分配了總功率P,用戶i的功率分配系數(shù)為受限于標(biāo)量Hi(k)是多徑信道Hi(t)的脈沖響應(yīng),滿足
其中ρi,l和τi,l分別是復(fù)信道增益和用戶i的第l徑分量的對(duì)應(yīng)時(shí)延.單輸入單輸出(SISO)信道的每個(gè)抽頭被建模為瑞利衰落,解析路徑總數(shù)L= 20.
基于DL 的NOMA 接收器由一個(gè)DNN 表示,該DNN 用于一次恢復(fù)兩個(gè)用戶的傳輸符號(hào).離線訓(xùn)練DNN,隱式學(xué)習(xí)信道特性,其目標(biāo)是在線部署階段映射接收到的信號(hào)到對(duì)應(yīng)的發(fā)送傳輸符號(hào).MUD 的DNN 如圖2 所示,包括5 個(gè)層: 輸入層、長(zhǎng)短期記憶(LSTM)層、全連接層、Softmax 層和分類層.DNN 的核心部分是LSTM 層,這是一種RNN,它可以利用數(shù)據(jù)的時(shí)間依賴性,常被應(yīng)用于序列和時(shí)間序列數(shù)據(jù)的分類.LSTM 網(wǎng)絡(luò)在學(xué)習(xí)序列數(shù)據(jù)的同時(shí)保存相關(guān)信息.在基于LSTM 的DL-OFDM 系統(tǒng)模型中,時(shí)間步長(zhǎng)被等效地視為子載波.針對(duì)LSTM 層中的一個(gè)時(shí)間步長(zhǎng)模塊,可以對(duì)DNN 進(jìn)行訓(xùn)練,實(shí)現(xiàn)任意子載波的MUD.
圖2 基于LSTM 的深度學(xué)習(xí)模型
設(shè)計(jì)的基于深度學(xué)習(xí)的OFDM-NOMA 接收機(jī)模型的主要參數(shù)見(jiàn)表1.深度學(xué)習(xí)開(kāi)發(fā)包為Deep Learning toolbox,其中OFDM-NOMA 系統(tǒng)的搭建使用了Communication toolbox.仿真系統(tǒng)為一個(gè)64 子載波OFDM 系統(tǒng),其中數(shù)據(jù)以O(shè)FDM 數(shù)據(jù)包的形式傳輸.為了簡(jiǎn)單起見(jiàn),一個(gè)數(shù)據(jù)包由3 個(gè)OFDM 符號(hào)組成.每個(gè)用戶被分配兩個(gè)導(dǎo)頻序列,它們占據(jù)前兩個(gè)OFDM 符號(hào)并以第三個(gè)OFDM 符號(hào)傳輸一個(gè)數(shù)據(jù)流.OFDM 系統(tǒng)使用正交相移鍵控(QPSK)進(jìn)行基帶調(diào)制,每個(gè)符號(hào)每副載波包含2 位.在每次仿真中,生成隨機(jī)的QPSK 符號(hào),形成具有固定導(dǎo)頻序列的OFDM 數(shù)據(jù)包.執(zhí)行逆DFT 之后,在隨后的時(shí)域OFDM符號(hào)之間,需要插入循環(huán)前綴.如果要躲避碼間干擾,碼間干擾的長(zhǎng)度就不能小于信道的脈沖響應(yīng).然后OFDM 包通過(guò)當(dāng)前的無(wú)線信道傳輸.基站將收到來(lái)自兩個(gè)用戶的傳輸OFDM 數(shù)據(jù)包,加上接收機(jī)噪聲.將接收到的OFDM 數(shù)據(jù)包,通過(guò)形成一個(gè)包含數(shù)據(jù)包中所有符號(hào)的實(shí)部和虛部的特征向量來(lái)作為訓(xùn)練樣本.特征向量的維數(shù)是每個(gè)訓(xùn)練樣本的特征個(gè)數(shù).在本研究中,一個(gè)OFDM 數(shù)據(jù)包中有64 個(gè)子載波和3 個(gè)OFDM 符號(hào),其特征數(shù)為64 × 3 × 2 =384.通過(guò)在訓(xùn)練中提供相應(yīng)的標(biāo)簽Q(k),可以訓(xùn)練DNN 恢復(fù)任意子載波上的數(shù)據(jù).標(biāo)簽被定義為一個(gè)整數(shù),表示兩個(gè)用戶共同傳輸?shù)姆?hào).由于兩個(gè)用戶都在傳輸QPSK 符號(hào),因此將有16 種組合/標(biāo)簽.輸入層的輸入大小為384.在LSTM 層中,隱藏單元數(shù)為128 個(gè),其次是輸出大小為16 的全連接層.softmax 層將對(duì)其輸入應(yīng)用softmax 函數(shù),分類層將輸出估計(jì)的標(biāo)簽,以同時(shí)映射兩個(gè)用戶傳輸?shù)姆?hào).
表1 仿真參數(shù)
從圖3 和圖4 可以看到,無(wú)論是對(duì)于遠(yuǎn)場(chǎng)用戶還是近場(chǎng)用戶的符號(hào)檢測(cè),DL 算法都優(yōu)于目前常用的SIC 算法即LS 算法與MMSE 算法,并接近已知完美的信道狀態(tài)下的ML 算法.但是ML 算法復(fù)雜度比DL 算法要高,并且條件要求更多.
圖3 用戶1 不同檢測(cè)算法的性能對(duì)比
圖4 用戶2 不同檢測(cè)算法的性能對(duì)比
(1) CP 長(zhǎng)度的影響
通常,在后續(xù)符號(hào)之間插入有限長(zhǎng)度CP 以避免ISI 并保持子載波的正交性.圖5 和圖6 分別為用戶1和用戶2 的不同長(zhǎng)度CP 的SER 曲線.當(dāng)CP 不小于信道沖激響應(yīng)(CP 長(zhǎng)度=20)時(shí),采用LS 或MMSE 估計(jì),DL 接收機(jī)的性能優(yōu)于SIC 接收機(jī).此外,對(duì)于圖6 中較弱的用戶2,DL 接收機(jī)從SIC 接收機(jī)產(chǎn)生更大的SER 間隙并實(shí)現(xiàn)與用戶1 類似的SER,這表明DNN 對(duì)信號(hào)功率是魯棒的,并且可以減輕SIC 過(guò)程中的檢測(cè)錯(cuò)誤傳播影響.當(dāng)CP 比信道短得多(CP 長(zhǎng)度=12)時(shí),LS 和MMSE 都不能有效地估計(jì)信道.在ISI 的嚴(yán)重影響下,即使在理想的CSI 下,ML 接收機(jī)也不能提供最優(yōu)解.然而,DL 接收機(jī)仍然工作得很好,對(duì)于兩個(gè)用戶來(lái)說(shuō)都比ML 接收機(jī)表現(xiàn)得更好.結(jié)果表明,DNN 對(duì)ISI 引起的信號(hào)失真具有較強(qiáng)的魯棒性,能夠根據(jù)訓(xùn)練數(shù)據(jù)學(xué)習(xí)信道特性.從信道相位衰落的角度測(cè)試了DNN 的魯棒性.采用DL 算法的用戶1 和 用戶2 的結(jié)果分別在圖5 和圖6 中以藍(lán)色虛線/實(shí)線曲線給出.在理想情況下(無(wú)相位衰落),當(dāng)符號(hào)不與相鄰符號(hào)重疊時(shí),DL 接收器的性能與ML 相當(dāng).在信道相位衰落時(shí),DL 接收器性能略差,這表明DNN 在逐包測(cè)量相移時(shí)遇到的退化.另一方面,由于ISI 的嚴(yán)重影響,DNN 對(duì)隨機(jī)相移具有很強(qiáng)的魯棒性,并且在理想情況下具有與之相當(dāng)?shù)男阅?
圖5 具有不同CP 長(zhǎng)度的用戶1 的SER 曲線
圖6 具有不同CP 長(zhǎng)度的用戶2 的SER 曲線
(2) 導(dǎo)頻符號(hào)數(shù)量的影響
研究不同導(dǎo)頻符號(hào)數(shù)的影響,LS 和MMSE 信道估計(jì)的性能取決于已知的導(dǎo)頻符號(hào),其用來(lái)恢復(fù)信道響應(yīng).在模擬中,每個(gè)導(dǎo)頻序列有64 或16 個(gè)導(dǎo)頻符號(hào).圖7 和圖8 分別給出了用戶1 和用戶2 的兩種情況的SER 曲線.從圖7 和圖8 可以得知,當(dāng)使用64 個(gè)導(dǎo)頻符號(hào)時(shí),LS 和MMSE 方法都可以提供可靠的估計(jì).然而,DL接收機(jī)可以獲得更好的性能.當(dāng)導(dǎo)頻符號(hào)的數(shù)目減少到16 時(shí),無(wú)論是遠(yuǎn)場(chǎng)用戶1 還是近場(chǎng)用戶2,LS 和MMSE 方法的性能都顯著地降低,其精度在用戶1 和用戶2 的28 db SNR 下顯著降低,特別是遠(yuǎn)場(chǎng)用戶2,很明顯不能夠給接收機(jī)提供可靠的性能.而DL 接收機(jī)仍然可以提供與64 導(dǎo)頻情況相當(dāng)?shù)男阅?并且與ML 算法的性能相當(dāng),這表明DNN 對(duì)于導(dǎo)頻符號(hào)的數(shù)目更為魯棒,并且可以用較少的導(dǎo)頻獲得更好的性能.
圖7 具有不同導(dǎo)頻符號(hào)數(shù)的用戶1 的SER 曲線
圖8 具有不同導(dǎo)頻符號(hào)數(shù)的用戶2 的SER 曲線
(3) 學(xué)習(xí)率的影響
研究以不同學(xué)習(xí)速率訓(xùn)練的DL 接收機(jī)的性能,圖9 給出兩個(gè)用戶的SER 曲線.圖中較低的學(xué)習(xí)速率產(chǎn)生較低的SER,而支持較高的學(xué)習(xí)速率將導(dǎo)致DNN 中的權(quán)重的快速更新并產(chǎn)生較高的驗(yàn)證誤差.在本次訓(xùn)練中,學(xué)習(xí)率為0.05 時(shí)提供了最差的性能,并且該學(xué)習(xí)率收斂時(shí)間最長(zhǎng).但一般來(lái)說(shuō)越低的學(xué)習(xí)率能夠提供更加精確的精度,但是也會(huì)大大增加收斂的時(shí)間.考慮到訓(xùn)練精度和訓(xùn)練時(shí)間之間的權(quán)衡,將所有其他模擬場(chǎng)景的學(xué)習(xí)率都設(shè)置為0.01.
圖9 具有不同DNN 學(xué)習(xí)率的用戶1、2 的SER 曲線
(4) 批處理大小的影響
訓(xùn)練數(shù)據(jù)被分組成批,其中批的大小遠(yuǎn)遠(yuǎn)小于訓(xùn)練樣本的總數(shù).一個(gè)批在DNN 中向前和向后傳播的過(guò)程稱為一次迭代.在本研究中,需要24 次迭代來(lái)完成整個(gè)數(shù)據(jù)集的一個(gè)歷元.DNN 將分批獲取訓(xùn)練數(shù)據(jù),以便每次傳播需要的內(nèi)存較少.圖10 研究不同批量大小的影響.容易看出,批處理大小為8000 的性能要強(qiáng)于批處理大小為4000 的且要強(qiáng)于批處理大小為2000.這表明批量越大,DNN 的性能越好.在訓(xùn)練過(guò)程中,較小的批比較大的批收斂得更快,以達(dá)到相同的驗(yàn)證精度.然而,小批量顯示較低的測(cè)試精度.更大的批處理需要更少的迭代和DNN 參數(shù)更新,使用更多的數(shù)據(jù)為每次更新提供更精確的梯度估計(jì).因此,較大的批量大小導(dǎo)致具有更好性能的最終接收器.
圖10 具有不同DNN 批處理大小的用戶1、2 的SER 曲線
本文對(duì)雙用戶的NOMA 系統(tǒng)進(jìn)行了研究,其中信道估計(jì)和信號(hào)檢測(cè)是研究的重點(diǎn).提出一種基于DL的NOMA 接收機(jī),用于一次恢復(fù)兩個(gè)用戶發(fā)送的符號(hào).仿真結(jié)果表明,與傳統(tǒng)的信道估計(jì)方法相比,DL算法比LS 算法和MMSE 算法都要優(yōu)秀.很大程度上已經(jīng)接近了最優(yōu)算法最大似然法,但最大似然法要求已知信道環(huán)境,并且接收機(jī)的復(fù)雜度更高.所以說(shuō),DL 算法具有更好的性能,并且對(duì)有限的無(wú)線資源(如信號(hào)功率、導(dǎo)頻符號(hào)和循環(huán)前綴)具有更強(qiáng)的魯棒性.