羅佳俊 代海波* 王保云 李春國
①(南京郵電大學(xué)物聯(lián)網(wǎng)學(xué)院 南京 210003)
②(南京郵電大學(xué)通信與信息工程學(xué)院 南京 210003)
③(東南大學(xué)信息科學(xué)與工程學(xué)院 南京 210096)
未來的無線網(wǎng)絡(luò)有望朝著智能和軟件可重構(gòu)范式發(fā)展,從而實(shí)現(xiàn)人類和移動(dòng)設(shè)備之間的無處不在的通信,還將能夠感知、控制和優(yōu)化無線環(huán)境,以實(shí)現(xiàn)低功耗、高吞吐量、大規(guī)模連接和低延遲通信的愿景[1]。由于第6代移動(dòng)通信場景(6G)中通信情況將會(huì)越來越復(fù)雜,在網(wǎng)絡(luò)架構(gòu)方面,大規(guī)模MIMO和小蜂窩受到了越來越多的關(guān)注[2],尤其在用戶密度較高的擁擠區(qū)域,對于實(shí)際的通信場景非常有意義。目前超可靠低延遲通信(Ultra-Reliable and Low-Latency Communications, URLLC)是支持6G網(wǎng)絡(luò)[3]的重要標(biāo)準(zhǔn),采用短數(shù)據(jù)包通信來滿足其對可靠性和延遲的嚴(yán)格要求,URLLC專注于任務(wù)要求嚴(yán)格的應(yīng)用場景,包括工廠自動(dòng)化、自動(dòng)駕駛、智能電網(wǎng)等等,這些運(yùn)用都需要超低的時(shí)延和超高的可靠性[4]。
智能超表面(Intelligent Reconfigurable Surface, IRS)能夠重新配置無線傳播環(huán)境[5],作用類似于無源金屬鏡或“波收集器”,并且可以通過編程以可定制的方式改變撞擊電磁場,在實(shí)現(xiàn)低功耗、高能效、高速、大規(guī)模方面的巨大潛力-連接性和低延遲無線通信,其被視為非常有潛力的一項(xiàng)創(chuàng)新技術(shù)。同時(shí)由于大量的IRS單元元素及其獨(dú)特的硬件限制,在基于IRS的系統(tǒng)中準(zhǔn)確和低開銷的信道估計(jì)是最關(guān)鍵的一種挑戰(zhàn),文獻(xiàn)[6]專注于IRS 授權(quán)的多用戶多輸入單輸出(MISO)上行鏈路通信系統(tǒng),并提出了一種基于并行因子分解的信道估計(jì)框架,以得到級聯(lián)信道模型,針對基站和IRS之間的信道以及IRS和用戶之間的信道提出了兩種迭代估計(jì)算法,證明了使用估計(jì)通道的總速率在各種設(shè)置下總是達(dá)到完美通道的總速率,從而驗(yàn)證了所提出的估計(jì)算法的有效性和魯棒性。文獻(xiàn)[7]研究了多IRS輔助毫米波系統(tǒng)中的安全波束成形,通過聯(lián)合優(yōu)化發(fā)射波束成形和IRS控制,在總發(fā)射功率和單位模量約束下最大化保密率,并且基于逐次凸優(yōu)化逼近和流形優(yōu)化提出了一種交替優(yōu)化算法,結(jié)果表明相較于傳統(tǒng)的方案,所提出的算法可以有效提高保密率。文獻(xiàn)[8]研究了由IRS輔助的無線電力傳輸系統(tǒng)可實(shí)現(xiàn)的能量收集區(qū)域,聯(lián)合優(yōu)化IRS處的無源反射波束以及基站能量波束以擴(kuò)大可獲得的能量區(qū)域,并提出一種交替優(yōu)化算法,以迭代的方式交替優(yōu)化半定松弛法的反射波束以及逐次凸逼近的能量波束,結(jié)果證明了所提方案的有效性。當(dāng)前許多的研究是將IRS與URLLC結(jié)合,或者將IRS與異構(gòu)網(wǎng)絡(luò)場景結(jié)合,例如在文獻(xiàn)[9]中研究了IRS輔助多輸入單輸出(MISO)正交頻分多址(OFDMA)多小區(qū)網(wǎng)絡(luò)的資源分配算法設(shè)計(jì),部署IRS為傳播條件不利的URLLC用戶創(chuàng)建虛擬鏈路增強(qiáng)通信通道并提高可靠性。在文獻(xiàn)[10]中最大化毫微微蜂窩用戶的總數(shù)據(jù)速率與總交叉的比率,通過聯(lián)合優(yōu)化毫微微蜂窩基站的發(fā)射功率和子載波分配因子,在兩層正交頻分多址的異構(gòu)網(wǎng)絡(luò),以及不完美CSI的層干擾的基礎(chǔ)上研究優(yōu)化問題,利用二次變換法、變量松弛法以及拉格朗日對偶理論將原問題轉(zhuǎn)化為了凸優(yōu)化問題,結(jié)果表明,相較于傳統(tǒng)方案干擾效率提高了。文獻(xiàn)[11]對智能超表面增強(qiáng)的多用戶通信系統(tǒng)中的相關(guān)優(yōu)化設(shè)計(jì)問題進(jìn)行了研究,分為智能超表面空間位置的優(yōu)化設(shè)計(jì)和智能超表面輔助的無小區(qū)網(wǎng)絡(luò)的聯(lián)合優(yōu)化設(shè)計(jì)兩個(gè)部分。文獻(xiàn)[12]提出了一種新穎的智能反射通信系統(tǒng),使用IRS服務(wù)于小型蜂窩網(wǎng)絡(luò)中的多個(gè)微用戶,同時(shí)輔助宏蜂窩到宏用戶的傳輸,通過在用戶速率約束和實(shí)際相移約束下聯(lián)合設(shè)計(jì)RIS處的相移矩陣和宏蜂窩處的波束成形從而最小化總功耗。
然而,文獻(xiàn)[7–12]要么只考慮了URLLC而沒有考慮異構(gòu)網(wǎng)絡(luò),要么只考慮香農(nóng)容量情況,當(dāng)網(wǎng)絡(luò)情況變得復(fù)雜,香農(nóng)容量又無法滿足用戶的需求也是一種值得考慮的情況。因此為了滿足異構(gòu)網(wǎng)絡(luò)下短包通信用戶的通信QoS要求,本文提出了一種更符合實(shí)際應(yīng)用需求的交替迭代優(yōu)化算法,主要貢獻(xiàn)如下:
(1)本文考慮異構(gòu)網(wǎng)絡(luò)下短包通信的用戶通信質(zhì)量要求,由于低時(shí)延通信用戶在異構(gòu)網(wǎng)絡(luò)下受到宏蜂窩的通信干擾,使用智能超表面提高用戶的整體通信質(zhì)量要求,滿足其服務(wù)質(zhì)量要求,建立一個(gè)聯(lián)合優(yōu)化主動(dòng)波束向量和IRS被動(dòng)波束向量的多變量耦合短包通信最大化平均和速率問題。該問題是一個(gè)多變量耦合非凸優(yōu)化問題,很難直接求解。
(2)為了對該問題求解,采用固定優(yōu)化變量的處理方式,將該問題分解為兩個(gè)優(yōu)化子問題,分別對于小蜂窩主動(dòng)波束以及IRS反射被動(dòng)波束利用逐次凸逼近(Successive Convex Approximation,SCA)的方法將原問題轉(zhuǎn)化為了凸優(yōu)化問題,最后提出了一種交替優(yōu)化(Alternating Optimization,AO)算法求解。
(3)仿真結(jié)果表明,與其他的算法對比,本文算法具有較好的收斂特性,在IRS的部署下,本文算法在IRS單元數(shù)量、小蜂窩傳輸功率、宏蜂窩傳輸功率、解碼錯(cuò)誤概率方面均有不錯(cuò)的性能表現(xiàn)。
圖1 IRS輔助異構(gòu)網(wǎng)絡(luò)系統(tǒng)模型
對于大多數(shù)的非凸問題目前尚沒有系統(tǒng)的解決方法,在文章接下來的部分,對于這種問題本文做了一系列的處理,提出了一種基于交替優(yōu)化的計(jì)算效率次優(yōu)迭代算法。
表1 基于SCA的迭代主動(dòng)預(yù)編碼波束向量算法設(shè)計(jì)(算法1)
這一節(jié)對于所提出的系統(tǒng)以及算法給出了具體的仿真結(jié)果,考慮IRS輔助的異構(gòu)網(wǎng)絡(luò)中的所有通信參與者位于同一個(gè)2維平面上面,SC范圍內(nèi)IRS輔助的微小區(qū)用戶有2個(gè),宏小區(qū)用戶也有2個(gè),其中中心點(diǎn)為(0,0) m,小蜂窩(–50,0) m,宏蜂窩位于(200,0) m, IRS位于(0,50) m,其次微小區(qū)用戶位于中心點(diǎn)為(0,25) m半徑為5 m的圓上,宏小區(qū)用戶位于中心點(diǎn)為(0,75) m半徑為5 m的圓上,噪聲功率譜密度為–174 dBm/Hz,系統(tǒng)帶寬設(shè)置240 kHz, Rician因子設(shè)置為10,考慮的低時(shí)延用戶解碼錯(cuò)誤概率ε=10-5,每個(gè)包的比特?cái)?shù)量Lk=11bit,考慮的天線數(shù)量為4根,IRS單元數(shù)量N=16,36,64,對于宏小區(qū)用戶處的最低SNR要求,設(shè)置最低為15,本文比較的是微小區(qū)用戶的平均系統(tǒng)和速率,以下簡稱平均系統(tǒng)和速率。
表2 基于SCA迭代優(yōu)化反射相移算法設(shè)計(jì)(算法2)
表3 基于交替迭代優(yōu)化主動(dòng)波束和反射相移算法設(shè)計(jì)(算法3)
為了更好地對比觀察所提出算法性能,本文使用了兩種比較算法,分別是:
(1)隨機(jī)相移算法:在該方法中,對于每一個(gè)IRS單元使用隨機(jī)相位移動(dòng)的方式,也就是說,對于優(yōu)化變量相移u,一開始就選擇[ 0,2π)之間的一個(gè)隨機(jī)數(shù)并且固定,轉(zhuǎn)而只對于Wk做優(yōu)化。
(2)無IRS算法:直接移掉IRS相關(guān)的信道G和hr,k以及相移Φ,僅僅優(yōu)化Wk。
為了比較算法的收斂特性,考慮將本文提出的算法與異構(gòu)網(wǎng)絡(luò)下的深度強(qiáng)化學(xué)習(xí)(Deep Reinforcement Learning, DRL)框架[23]做對比分析,目前采用DRL算法解決異構(gòu)網(wǎng)絡(luò)中的資源分配問題[24]已經(jīng)有許多相關(guān)的研究,在文獻(xiàn)[25]中將DRL與IRS結(jié)合研究主動(dòng)和被動(dòng)波束向量的優(yōu)化,所以本文異構(gòu)網(wǎng)絡(luò)下DRL對比算法的強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)框架參考文獻(xiàn)[26]中的設(shè)置,通信場景的設(shè)置與本文算法保存一致。首先從圖2可以看出,當(dāng)反射單元數(shù)量N=64時(shí),在前210次迭代的時(shí)候,DRL算法的收斂速度快于所提出的算法,但本文算法在250次迭代左右開始有收斂的趨勢了,而DRL并沒有明顯的收斂跡象,在1000到4000次迭代過程中,本文算法逐漸收斂穩(wěn)定,而DRL收斂曲線并不穩(wěn)定,這可能和DRL算法的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練方式有關(guān),在6500次迭代左右DRL算法的平均系統(tǒng)和速率高于本文算法N=64的情況,并在以后逐漸增加且都高于本文算法的表現(xiàn),大概在9000多次迭代的時(shí)候DRL算法才開始達(dá)到收斂,而本文算法早就在1500次迭代左右達(dá)到收斂狀態(tài)。在計(jì)算開銷方面,由于DRL算法引入神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),在訓(xùn)練過程中包括對于action,state以及reward這3個(gè)運(yùn)算狀態(tài)的更新,涉及主動(dòng)以及反射波束、小蜂窩功率、宏蜂窩SINR、微小區(qū)用戶和速率等等,計(jì)算的空間復(fù)雜度比較大,而計(jì)算時(shí)間復(fù)雜度主要體現(xiàn)在神經(jīng)網(wǎng)絡(luò)的訓(xùn)練階段,假設(shè)外層循環(huán)更新預(yù)測網(wǎng)絡(luò)T1次,內(nèi)層循環(huán)T2個(gè) 時(shí)間步長,經(jīng)驗(yàn)池采樣批次大小為T3,那么在訓(xùn)練階段DRL算法計(jì)算復(fù)雜度為O(T1(T2+T3)),當(dāng)神經(jīng)網(wǎng)絡(luò)訓(xùn)練完畢,神經(jīng)網(wǎng)絡(luò)的決策過程的計(jì)算復(fù)雜度就遠(yuǎn)小于訓(xùn)練階段了,因?yàn)闆Q策過程只依賴神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)而不需要更多的學(xué)習(xí),所以當(dāng)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中參與訓(xùn)練的神經(jīng)元參數(shù)過多,訓(xùn)練周期過長的時(shí)候,計(jì)算復(fù)雜度是高于所提出方案的。另外從圖2還可以看出,隨著迭代次數(shù)的增加,平均系統(tǒng)和速率都是呈單調(diào)上升的趨勢,并最終收斂到一個(gè)局部最優(yōu)的值。其次對于不同的IRS單元,例如N=16,其初始迭代的時(shí)候,平均系統(tǒng)和速率增加的很快,達(dá)到收斂的趨勢點(diǎn)較早。而當(dāng)N=64的時(shí)候,其初始迭代的平均系統(tǒng)和速率增加的相對比較慢,達(dá)到收斂的趨勢點(diǎn)相對靠后,而N=36時(shí),其迭代初始狀態(tài)位于二者之間。最后對于迭代的最終收斂狀態(tài),如N=16,由于IRS單元數(shù)量的限制,其最終收斂的平均系統(tǒng)和速率比較小,而當(dāng)N=64的時(shí)候,其最終收斂的平均系統(tǒng)和速率相對比較大,這是由于IRS對于信號(hào)的增強(qiáng)作用,且與IRS單元數(shù)量是正向的關(guān)系。
圖2 迭代次數(shù)與系統(tǒng)平均和速率關(guān)系, N =16,36,64,Pmax =30 dBm
圖3是小蜂窩的最大傳輸功率與平均系統(tǒng)和速率之間的關(guān)系,隨著Pmax的增加,平均系統(tǒng)和速率呈上升的趨勢,這是由優(yōu)化問題中的約束 C3所決定的,Pmax直 接影響了優(yōu)化變量Wk的取值范圍大小??梢钥闯?,在Pmax=15 dBm時(shí),3種算法的情況不一樣,所提出的優(yōu)化算法的平均系統(tǒng)和速率最大,隨機(jī)相移算法次之,無IRS的情況最低。在Pmax=15~40 dBm時(shí),所提出算法與另外兩種算法之間的上升幅度也是有一些差距的,但是差距變化幅度并不大,隨機(jī)相移與去掉IRS的情況非常類似。在Pmax=40~45 dBm時(shí),3種算法之間的差別就開始顯現(xiàn)出來了,所提出算法相對另外兩種算法增速開始變大,隨機(jī)相移相對于無IRS的情況增速也開始變大,無IRS的情況增速最小。
圖3 小蜂窩SC的P max 與 系統(tǒng)平均和速率,K =2,N =16
從圖5可以看出,3種算法隨著MC的傳輸功率PMC的提升,平均系統(tǒng)和速率都是下降的。宏蜂窩MC對于微小區(qū)用戶的平均系統(tǒng)和速率的影響可以從式(4)和式(7)中看出來,在式(4)中由于MC的傳輸功率的增加,分母上的宏蜂窩v就會(huì)增大,對于微小區(qū)用戶的干擾增加,即微小區(qū)用戶的SINR就會(huì)降低,進(jìn)而平均系統(tǒng)和速率就會(huì)降低。其次可以看到,對于所提出的算法,一開始當(dāng)MC的發(fā)射功率還比較小的時(shí)候,例如24~32 dBm時(shí),由于IRS的增強(qiáng)作用的影響還比較大,所以平均系統(tǒng)和速率下降得還比較慢,但是當(dāng)過了32 dBm這個(gè)點(diǎn)之后,由于MC的發(fā)射功率增加得太多了,對于SINR的影響逐漸變大,所以平均系統(tǒng)和速率下降幅度就突然變大了。對于隨機(jī)相移的情況,由于固定了初始相移,所以IRS對于信號(hào)的增強(qiáng)作用不如所提出的算法那么大。對于無IRS的情況,功率曲線整體低于另外2種算法,且下降的幅度相對較小,但是最后由于MC的功率影響實(shí)在是太大了,所以后面也會(huì)出現(xiàn)平均系統(tǒng)和速率的急劇下降。同時(shí)可以看出所提出算法的效果并不是一直優(yōu)于隨機(jī)相移和無IRS的情況,當(dāng)解碼錯(cuò)誤概率ε=10-6時(shí),平均系統(tǒng)和速率低于ε=10-5時(shí)3種算法,這說明了隨著宏蜂窩功率的增加,ε的變化對于平均系統(tǒng)和速率的影響要大于隨機(jī)相移和無IRS的情況。
圖4 IRS反射單元與系統(tǒng)平均和速率,K =2,Pmax =40 dBm
圖5 宏蜂窩MC最大傳輸功率P MC與系統(tǒng)平均和速率,K =2,N =16,Pmax =40 dBm
圖6 本文算法SC最大傳輸功率與系統(tǒng)平均和速率
本文研究在宏蜂窩(MC)和小蜂窩(SC)共存的異構(gòu)網(wǎng)絡(luò)通信環(huán)境下,通過在小蜂窩的范圍內(nèi)部署IRS來進(jìn)行輔助增強(qiáng)通信,進(jìn)而滿足小蜂窩內(nèi)微小區(qū)用戶的高可靠低時(shí)延通信需求。本文構(gòu)建的問題,是一個(gè)非凸的優(yōu)化問題,這是因?yàn)閁RLLC速率表達(dá)式的非凸性質(zhì),所以論文分析開始就對于URLLC做了泰勒展開近似處理。本文設(shè)計(jì)的算法是聯(lián)合優(yōu)化小蜂窩處的波束成形向量以及IRS相移向量,通過使用連續(xù)凸逼近SCA、交替優(yōu)化等方法,獲得一個(gè)該問題的次優(yōu)解。仿真結(jié)果表明,IRS在SC范圍內(nèi)確實(shí)能夠起到輔助增強(qiáng)通信的作用,通過與另外兩個(gè)算法對比,可以看出在異構(gòu)網(wǎng)絡(luò)場景下IRS對于信號(hào)的增強(qiáng)幅度還是比較大的。