景小榮, 張思思
(1. 重慶郵電大學通信與信息工程學院, 重慶 400065;2. 移動通信技術重慶市重點實驗室, 重慶 400065)
當前,6 GHz以下的蜂窩頻譜嚴重不足,而毫米波頻段可利用的頻譜資源卻非常豐富,但易受路徑等衰落的影響[1]。大規(guī)模多輸入多輸出(massive multiple input multiple output,mMIMO)技術通過利用基站(base station,BS)部署成百上千根天線所帶來的巨大陣列增益,恰好可彌補毫米波信號在傳輸過程中所承受的嚴重路徑損耗[2]。因此,毫米波與mMIMO相結合,即毫米波mMIMO,使系統(tǒng)容量得到顯著提升。同時,與正交多址接入(orthogonal multiple access,OMA)不同,功率域非OMA(non-OMA, NOMA)利用疊加編碼和連續(xù)干擾消除(successive interference cancellation,SIC)技術[3],在有限的資源里為更多的用戶提供服務,以實現(xiàn)大規(guī)模連接和低延遲傳輸,將進一步提升系統(tǒng)頻譜效率。因此,毫米波mMIMO和NOMA技術的融合,將為未來移動通信更高頻譜效率的需求提供強有力的保障。
眾所周知,在傳統(tǒng)MIMO系統(tǒng)中,為降低接收機設計復雜度,通常基于全數(shù)字結構(full digital architecture,FD-A)對發(fā)射信號進行預編碼處理[4],BS端需為每根天線配備專用的射頻(radio frequency,RF)鏈。毫米波mMIMO系統(tǒng)中BS端通常配備數(shù)百根甚至上千根天線,若繼續(xù)沿用FD-A,將導致無法承受的硬件成本和系統(tǒng)功耗。為此,學術界提出基于混合結構(hybrid architecture,HA)的預編碼[5]設計思路,即將預編碼分解為數(shù)字預編碼器和模擬預編碼器兩部分,該結構僅需少量RF鏈,同時模擬預編碼器可采用低成本的模擬移相器(analog phase shifters,APS)來實現(xiàn),從而大幅度地降低了系統(tǒng)硬件成本和功耗。
截止目前,針對毫米波mMIMO系統(tǒng),已有大量文獻基于HA,設計了許多預編碼方案。按照RF鏈和發(fā)射天線之間的連接方式,現(xiàn)有HA可分為全連接HA(fully-connected HA, FC-HA)和子連接HA(sub-connected HA, SC-HA)?;贔C-HA,文獻[6]將混合預編碼器和組合器聯(lián)合優(yōu)化問題分解為兩個獨立的優(yōu)化問題,進而利用迭代算法求取次優(yōu)解。解培中等人針對信號傳播漫散射而造成的用戶間干擾問題,提出一種基于SIC的魯棒預編碼器設計方案[7]。文獻[8]在對基帶預編碼矩陣分解基礎上,將預編碼設計映射成一多層神經(jīng)網(wǎng)絡來實現(xiàn)。文獻[9]以最大化系統(tǒng)能效為目的,提出一種次優(yōu)迭代算法來設計預編碼矩陣。盡管基于FC-HA的預編碼設計方案具有相對優(yōu)越的性能,但其所需APS的數(shù)量是發(fā)射天線的數(shù)量與RF鏈數(shù)量的乘積。同時,其還需與發(fā)射天線數(shù)相等的加法器,這意味著基于FC-HA的預編碼設計方案的硬件成本和功耗依然很高。
在SC-HA中,每個RF鏈僅與發(fā)射天線的某一固定子集相連,有效地減少了系統(tǒng)對APS的需求。同時,在多用戶系統(tǒng)中,所需RF鏈的數(shù)目可設定與用戶數(shù)相當。于是,其系統(tǒng)功耗和硬件成本均得到大幅度降低。因此,SC-HA更適用于實際系統(tǒng)?;赟C-HA,文獻[10]提出一種基于SIC的混合預編碼器設計方案,相比于文獻[7],該方案避免了奇異值分解和矩陣轉換。然而傳統(tǒng)的SC-HA不夠靈活,因此文獻[11]通過動態(tài)改變RF鏈和天線之間的連接方式,提出一種基于動態(tài)SC-HA(dynamically SC-HA, DSC-HA)的預編碼方案。與FC-HA和SC-HA相比,該方案在降低系統(tǒng)功耗的同時,系統(tǒng)頻譜效率得到明顯提升。
隨著無線通信的發(fā)展,面對5G頻譜效率提升5~15倍的需求,NOMA由于具備良好的過載特性而逐步引起人們的關注。于是,部分學者提出將毫米波mMIMO和NOMA相結合,形成毫米波mMIMO-NOMA系統(tǒng),并對其預編碼技術展開深入研究。文獻[12]針對FC-HA,以最大化系統(tǒng)和速率為目標,提出了基于有限反饋波束碼本的預編碼設計方案,進而通過用戶配對和功率分配算法來減小NOMA用戶簇內和簇間干擾。文獻[13]提出一種基于聯(lián)盟博弈論的用戶分組和天線分配算法,以獲得模擬波束賦形矩陣,進而利用低復雜度線性預編碼算法設計數(shù)字預編碼矩陣。Dai等人以最大化系統(tǒng)可達速率為目標,構建一有關預編碼與功率分配的聯(lián)合非凸優(yōu)化問題[14],進而提出一種簇頭選擇算法來實現(xiàn)模擬預編碼設計,并根據(jù)等效信道來設計數(shù)字預編碼矩陣。在文獻[14]的基礎上,文獻[15]提出一種相對比較復雜的模數(shù)預編碼和功率分配聯(lián)合設計方案??傊?目前針對毫米波mMIMO-NOMA系統(tǒng)中混合預編碼技術的研究處于起始階段,而且這些研究均基于FC-HA。因此,對于毫米波mMIMO-NOMA系統(tǒng)而言,這將會引起非常高的硬件成本和功耗。
在上述分析基礎上,本文針對毫米波mMIMO-NOMA系統(tǒng),基于DSC-HA,提出一種高效預編碼方案。在該方案中,在對用戶進行分簇的基礎上,基于等效信道增益最大化原則利用KM算法來實現(xiàn)DSC網(wǎng)絡設計,即發(fā)射天線動態(tài)分組,進而實現(xiàn)模擬預編碼矩陣設計,以實現(xiàn)RF鏈與發(fā)射天線間的動態(tài)匹配。在此基礎上,采用迫零(zero forcing,ZF)算法實現(xiàn)數(shù)字預編碼器設計,以達到消除簇間干擾的目的。最后,以最大化各NOMA簇和速率為目標,對簇內用戶功率進行分配,以減小簇內用戶間干擾。仿真結果表明,本文針對毫米波mMIMO-NOMA系統(tǒng)提出的基于DSC-HA的預編碼方案的系統(tǒng)和速率不但明顯優(yōu)于基于SC-HA的預編碼方案,而且能效顯著優(yōu)于基于FD-A和FC-HA的預編碼方案。
考慮如圖1所示的多用戶毫米波mMIMO-NOMA系統(tǒng)下行鏈路。假設BS配置N根天線和M(M?N)個RF鏈,為K(K≥2M)個單天線用戶提供服務。為了充分實現(xiàn)多路復用增益,假設數(shù)據(jù)流數(shù)等于RF鏈數(shù)。為便于后續(xù)分析,將BS配置的N根發(fā)射天線依次用1,2,…,N標記,并以集合Ψ={1,2,…,N}表示。M個RF鏈依次用1,2,…,M標記,并以集合Θ={1,2,…,M}表示。根據(jù)文獻[16],從K個用戶中選擇2M個用戶,分別用1,2,…,2M標記,以集合U={1,2,…,2M}表示。進一步,對其進行分簇,假設每個NOMA簇最多容納兩個用戶。
圖1 動態(tài)子連接混合結構系統(tǒng)模型Fig.1 Dynamically sub-connected hybrid architecture system model
基于上述條件,第m個NOMA簇內強用戶的接收信號為
(1)
與文獻[17]類似,采用基于擴展的Saleh-Valenzuela模型對毫米波信道進行建模,則
(2)
(3)
假設各NOMA簇內強用戶采用理想SIC,即完全消除簇內弱用戶干擾,則第m個NOMA簇內強用戶的接收信號可簡化為
(4)
對應地,接收信干噪比為
(5)
根據(jù)NOMA功率分配原則,弱用戶無法利用理想SIC消除來自強用戶的干擾,故第m個NOMA簇內弱用戶接收信號為
(6)
對應地,接收信干噪比為
SINRm,2=
(7)
根據(jù)式(5)和式(7),系統(tǒng)可達和速率為
(8)
式中:Rm,n=log2(1+SINRm,n)(m=1,2,…,M;n=1,2)。
以系統(tǒng)可達和速率最大化為目標,預編碼設計問題則等效為下列優(yōu)化問題:
C2:‖F(xiàn)wm‖2=1,m=1,2,…,M
(9)
在預編碼設計過程中,先假設系統(tǒng)中用戶均采用相同發(fā)射功率,并在忽略NOMA簇間和簇內干擾的條件下,利用用戶信道狀態(tài)信息的差異性,結合KM算法完成發(fā)射天線動態(tài)分組,進而實現(xiàn)模擬預編碼矩陣設計。接著,以模擬預編碼后的等效信道為基礎,實現(xiàn)數(shù)字預編碼矩陣設計。最后,以最大化各NOMA簇和速率為目標,通過優(yōu)化簇內各用戶功率分配,來降低簇內用戶間干擾。下面分別對其進行說明。
依照上述設計思路,當所有用戶采用相同的發(fā)射功率,式(9)中目標函數(shù)可展開為
(10)
式中:
式(10)要取得最大值,只需對于任意NOMA簇m,使Gm(F)取得最大值即可。這意味著對于不同NOMA簇,將存在不同的模擬預編碼矩陣Fm,其中1≤m≤M,這顯然與實際情況不符。根據(jù)前述分析,系統(tǒng)中所有NOMA簇必須共用同一模擬預編碼矩陣F。于是,將F分成M列,其中第m列與第m個NOMA簇相匹配,這樣同時也保證了各NOMA簇的公平性。即使如此,根據(jù)Gm(F)的結構,優(yōu)化問題式(9)仍不易求解。
為使該問題可解,令暫時忽略簇間干擾(即先不考慮數(shù)字預編碼)和簇內強用戶對弱用戶的影響,則優(yōu)化問題式(9)轉化為關于發(fā)射天線動態(tài)分組與模擬預編碼設計的聯(lián)合優(yōu)化問題:
C3:Am∩Am′=φ,m≠m′
(11)
式中:
C3:Am∩Am′=?,m≠m′
(12)
為各RF鏈選擇最佳連接天線的問題,本質上可等效為一加權二分圖最佳匹配問題,而KM算法[18]被證明是求解這類問題的一種有效手段,因此文中采用KM算法來解決天線分組問題。
為了降低天線分組的復雜度[11],同時保證各NOMA簇的公平性,令每個RF鏈均與N/M根天線相連。在該條件下,下面給出發(fā)射天線分組的流程,可分4個階段實現(xiàn),具體步驟如下。
步驟 1初始化階段
為所有RF鏈和發(fā)射天線構成的集合Θ和Ψ中每一個頂點賦予一標號,記作可行頂標,分別用L(m)和L(p)表示,m∈Θ,p∈Ψ。相應地,由集合Θ和Ψ中任意兩頂點m和p構成的邊稱為可行邊,即e=(m,p),邊權值用w(m,p)表示。天線分組中,每一次天線選擇,集合Θ和Ψ中頂點的可行頂標分別初始化:
(13)
式中:hm,1,p和hm,2,p分別為第m個NOMA簇中強和弱用戶信道矢量的第p個元素,m=1,2,…,M,p=1,2,…,N。
步驟 2天線循環(huán)選擇階段
對集合Θ中頂點m,從集合Ψ中選擇使邊權值w(m,p)=|hm,1,p|+|hm,2,p|最大的頂點pm與之匹配。由于集合Θ中每個頂點在集合Ψ中選擇使邊權值最大的頂點時,均從集合Ψ的N個頂點中選擇。而根據(jù)前述優(yōu)化分析,每根天線僅與一個RF鏈相連。因此,需判斷集合Ψ中頂點是否與集合Θ中頂點存在一對多重復匹配。如果不存在,即經(jīng)一次循環(huán),集合Θ中各頂點分別與集合Ψ中M個不同頂點實現(xiàn)匹配,文中稱作最佳匹配,則將匹配天線索引pm放入與第m個RF鏈對應的天線集合Am中,其中m=1,2,…,M;否則進入匹配更新階段。
步驟 3匹配更新階段
對于集合Ψ中頂點與集合Θ中某些頂點(為便于后續(xù)描述,令由這些頂點組成子集Ξ?Θ)存在一對多匹配時。令集合Ψ中該頂點與Ξ中序號最小的頂點ζmin相匹配,而對Ξ中其他頂點,依序利用深度優(yōu)先遍歷(depth first search, DFS)方法[19]從集合Ψ中剩余的未與集合Θ中頂點相匹配的頂點(令由這些頂點組成子集Π?Ψ)中尋找使得邊權值最大的頂點,即判斷是否存在可行邊。若存在,將當前頂點m′∈Ξζmin與子集Π中該頂點相匹配;否則修改當前頂點的可行頂標。為此,引入變量:
d=min{L(m′)+L(p′)-w(m′,p′)}
(14)
步驟 4信道更新階段
在上述發(fā)射天線分組的基礎上,根據(jù)各RF鏈連接的天線集設計對應的模擬預編碼矢量。考慮到實際系統(tǒng)中APS分辨率通常有限,假設設定APS分辨率為Bbits,則fm中第p個元素可表示為
(15)
(16)
最后,對W進行歸一化處理以滿足功率約束條件,則第m個NOMA用戶簇的數(shù)字預編碼矢量為
經(jīng)預編碼處理,各NOMA簇間干擾已被有效削弱;然而,在上述設計過程中,為簡化分析,假設所有NOMA簇均采用相同發(fā)射功率[20]。因此,本節(jié)將通過優(yōu)化簇內用戶間功率分配,來減小簇內用戶間干擾。
考慮NOMA簇內功率分配時,為了最大化各NOMA和速率,構建如下優(yōu)化問題:
s.t. C1:0<γm<1
(17)
顯然,優(yōu)化問題式(17)為受限條件下關于γm的單變量優(yōu)化問題,其中C4可等價為
(18)
令
則βm,1≥βm,2。
利用式(5)和式(7),式(17)中Rm,1和Rm,2可表示為
(19)
在此基礎上,對C2和C3進行化簡,可得功率分配因子γm的取值范圍:
γm∈[γmin,γmax]=
(20)
至此,優(yōu)化問題式(17)已化簡為無約束的單變量求最值問題。將式(19)代入式(17),對其關于γm求一階導:
(21)
(22)
綜上,基于DSC-HA的預編碼設計步驟如下所示。其中,步驟1實現(xiàn)動態(tài)天線分組;根據(jù)發(fā)射天線動態(tài)分組的子集,步驟2~步驟7實現(xiàn)每個RF鏈對應模擬預編碼矢量設計;步驟8~步驟11確定系統(tǒng)中強用戶的等效信道;步驟12~步驟15實現(xiàn)數(shù)字預編碼設計;步驟16~步驟22對各NOMA簇內用戶進行功率分配。
輸入:下行鏈路信道矩陣H,APS分辨率B初始化:F=0,H=0,Am=?,γm=0(m=1,2,…,M)步驟 1 由KM算法完成天線分組,得到天線集合{Am}Mm=1;步驟 2 for m=1,2,…,M步驟 3 for p=1,2,…,N步驟 4 if p∈Am步驟 5 n0=argminn∈{0,1,…,2B-1}(φm,1,p+φm,2,p)2-2πn2B;步驟 6 fm,p=e-j2πn02B;步驟 7 end if end for end for步驟 8 for m=1:M;步驟 9 hm,1=hm,1F;步驟 10 end for步驟 11 H=[hT1,1,hT2,1,…,hTM,1]T;步驟 12 利用式(16),確定W;步驟 13 for m=1:M步驟 14 wm=wm‖F(xiàn)wm‖2;步驟 15 end for步驟 16 for m=1:M步驟 17 利用式(22),確定γm=γ*m;步驟 18 if γm∈(0,1)步驟 19 γm=γ*m;步驟 20 else步驟 21 γm=Pm;步驟 22 end if end for輸出:F,{wm}Mm=1,{Am}Mm=1,{γm}Mm=1
由上述預編碼設計步驟,基于DSC-HA的預編碼設計方案的計算復雜度主要集中在步驟1、步驟5和步驟12。在步驟1中,需采用KM算法遍歷所有頂點來實現(xiàn)天線分組,最壞情況下每次需要修改O(N)次頂標,對應的計算復雜度為O(N2),因此,天線分組所需計算復雜度約為O(N3)。步驟5中,實現(xiàn)模擬預編碼設計,其所需計算復雜度約為O(N2B)。步驟12中,確定數(shù)字預編碼涉及矩陣乘法和矩陣求逆運算,其計算復雜度約為O(M3)。因此,基于DSC-HA的預編碼設計方案的復雜度約為O(N3+N2B+M3)?;贔C-HA的預編碼方案和基于SC-HA的預編碼方案[14]的復雜度分別約為O(MN2B+M3)和O(N2B+M3)。而通常M?N。因此,這3種方案計算復雜度滿足關系:O(N2B+M3) 本節(jié)通過數(shù)值仿真對基于DSC-HA預編碼方案(以DSC-HA-NOMA表示)進行評估,并與FD-A、基于FC-HA的mMIMO-NOMA和mMIMO-OMA(分別以FC-HA-NOMA和FC-HA-OMA表示)系統(tǒng)和基于SC-HA的mMIMO-NOMA、mMIMO-OMA(分別以SC-HA-NOMA和SC-HA-OMA表示)等方案[14]相比較。仿真參數(shù)設置如表2所示。 表2 仿真參數(shù) 在K=30,N=256,B=4 bits時,圖2給出了不同預編碼方案在不同信噪比(signal to noise ratio,SNR)下系統(tǒng)和速率的變化曲線。從圖2中可看出,FD-A方案的系統(tǒng)和速率最高,但其硬件成本非常高;SC-HA方案雖然降低了系統(tǒng)功耗,但由于特殊的硬件結構,很大程度上限制了波束賦形增益,因而其系統(tǒng)和速率最低;FC-HA-NOMA方案的和速率性能十分接近FD-A方案,但其能效明顯低于DSC-HA-NOMA方案。在整個SNR范圍內,所提DSC-HA方案性能均優(yōu)于SC-HA-NOMA和SC-HA-OMA方案;隨著SNR增加,受NOMA技術優(yōu)勢的影響,使得本文提出的DSC-HA-NOMA的性能甚至優(yōu)于FC-HA-OMA,從而驗證了本文所提方案在多用戶mMIMO-NOMA系統(tǒng)中具有優(yōu)良的性能。 圖2 系統(tǒng)和速率隨SNR變化曲線Fig.2 System sum rate versus SNR 與圖2仿真配置條件相同,圖3給出了不同預編碼方案的系統(tǒng)能效隨SNR變化曲線圖,其中系統(tǒng)能效定義為 (23) 式中:PRF為每個RF鏈所需功率;PAPS為每個APS的功耗;PBB為基帶功耗;NAPS表示APS的個數(shù)。對于FC-HA方案,所需APS數(shù)為MN;對于SC-HA和DSC-HA方案,APS數(shù)為N。能效計算式(23)中各單元的功耗具體值見文獻[21]。 圖3 系統(tǒng)能效隨SNR變化曲線Fig.3 System energy efficiency versus SNR 由圖3發(fā)現(xiàn),所提DSC-HA-NOMA方案的能效明顯優(yōu)于現(xiàn)有對比方案。FD-A方案由于RF鏈數(shù)等于BS發(fā)射天線數(shù)而導致系統(tǒng)能效最低;FC-HA方案需要8個RF鏈,(8×256)個APS和256個RF加法器。而SC-HA方案和本文所提DSC-HA方案僅需256個APS,且不需要RF加法器。從圖4可知,隨APS分辨率增加,所有方案除FD-A外,其和速率性能均逐漸提升,而且當分辨率為4 bits時,各方案和速率性能基本達到收斂,故本文仿真設置最佳分辨率為B=4 bits;且文中所提方案性能始終優(yōu)于對應的SC-HA方案。 另外,由于FD-A不涉及模擬預編碼設計,因此其性能不受APS分辨率影響。所以,在整個SNR范圍內,FC-HA方案的能效性能明顯低于SC-HA方案和本文方案。此外,無論是FC-HA還是SC-HA,采用NOMA的系統(tǒng)能效總是優(yōu)于采用OMA的系統(tǒng)能效。同時,受NOMA技術潛在優(yōu)勢和FC-HA功耗的限制,隨著SNR增加,DSC-HA-NOMA方案與FC-HA-NOMA以及FC-HA-OMA方案之間的能效差距越明顯。 在N=256,K=30,SNR=10 dB時,圖4給出了上述幾種方案的系統(tǒng)和速率隨APS量化比特數(shù)變化的仿真結果。 圖4 系統(tǒng)和速率隨APS量化比特變化曲線Fig.4 System sum rate versus APS quantization bit 此外,圖5給出了當K=30,M=8,SNR=10 dB,B=4 bits時,不同預編碼方案的系統(tǒng)和速率隨BS天線數(shù)變化的關系曲線。 圖5 系統(tǒng)和速率隨BS天線數(shù)變化曲線Fig.5 System sum rate versus antenna number 從圖5中可看出,隨BS天線數(shù)增加,所有方案的系統(tǒng)和速率均明顯提升,表明BS天線數(shù)對系統(tǒng)和速率性能影響非常明顯。同時,與對應的OMA系統(tǒng)相比,無論采取何種預編碼結構,NOMA系統(tǒng)均具有明顯的優(yōu)勢。此外,在系統(tǒng)功耗幾乎相同的情況下,本文所提DSC-HA-NOMA方案的性能要明顯優(yōu)于SC-HA-NOMA方案。 由于文中采用KM算法來實現(xiàn)動態(tài)天線分組,因此在N=256,M=8條件下,表3給出DSC-HA-NOMA方案一次信道實現(xiàn)時,與各RF鏈對應的天線動態(tài)分組情況。其中,Am表示與第m(m=1,2,…,M)個RF鏈相連的BS端天線集合。DSC-HA方案中各RF鏈與發(fā)射天線間的連接更為靈活,從而打破了SC-HA中模擬預編碼矩陣的對角約束條件,使各RF鏈能夠與其BS發(fā)射天線實現(xiàn)優(yōu)化匹配。因此,DSC-HA方案的系統(tǒng)和速率和能效明顯優(yōu)于SC-HA方案。 表3 DSC-HA方案中與各RF鏈對應的天線分組情況 為了發(fā)揮毫米波mMIMO-NOMA系統(tǒng)的優(yōu)勢,同時有效地降低系統(tǒng)功耗和用戶間干擾,本文基于DSC-HA提出一種高效預編碼方案。在該方案中,首先在用戶分成若干NOMA簇的基礎上,基于等效信道增益最大化原則利用KM算法聯(lián)合設計DSC網(wǎng)絡,進而實現(xiàn)模擬預編碼設計。接著,為了消除各NOMA簇間干擾,基于ZF準則設計數(shù)字預編碼器。最后,為了減小簇內用戶間干擾,以系統(tǒng)和速率最大化為目標,對簇內強弱用戶的功率進行優(yōu)化。仿真結果表明,DSC-HA方案的系統(tǒng)和速率明顯優(yōu)于SC-HA方案,且能效顯著優(yōu)于FD-A和FC-HA方案。此外,盡管本文所提方案假設BS采用均勻線陣,實際上相關結果可直接擴展到均勻面陣情形。4 仿真分析
5 結 論