王雪,金濤,錢志鴻,胡良帥,王鑫,2
(1.吉林大學(xué)通信工程學(xué)院,吉林 長(zhǎng)春 130012;2.吉林農(nóng)業(yè)大學(xué)信息技術(shù)學(xué)院,吉林 長(zhǎng)春 130118)
作為5G 的關(guān)鍵技術(shù)之一,D2D(device-todevice)通信技術(shù)是指通信網(wǎng)絡(luò)中鄰近設(shè)備不通過基站而直接交換信息的技術(shù)[1]。在無線通信系統(tǒng)中加入D2D 通信技術(shù),不僅可以提高系統(tǒng)頻譜效率,降低時(shí)延,還可以減輕核心網(wǎng)絡(luò)的負(fù)載[2]。但是,當(dāng)D2D 通信中用戶間距離較遠(yuǎn)或者鏈路質(zhì)量較差時(shí),需要引入中繼來保證信息的可靠、有效傳輸。并且,引入中繼可以擴(kuò)大蜂窩系統(tǒng)的覆蓋范圍[3-4]。隨著用戶設(shè)備的大量增長(zhǎng)以及終端設(shè)備電池容量的限制,如何有效地提高能量效率,實(shí)現(xiàn)綠色通信,是未來無線通信發(fā)展的關(guān)鍵。
現(xiàn)有的文獻(xiàn)大多研究的是蜂窩通信與D2D 直連通信并存場(chǎng)景下的能效優(yōu)化問題。文獻(xiàn)[5]通過使用聯(lián)合迭代拍賣算法,優(yōu)化了包括蜂窩用戶在內(nèi)的所有終端設(shè)備的能效。文獻(xiàn)[6]考慮D2D 通信復(fù)用蜂窩鏈路下行頻譜資源,在滿足蜂窩用戶QoS(quality of service)的條件下,最大化系統(tǒng)總D2D鏈路的能量效率。文獻(xiàn)[7]則考慮的是D2D 通信復(fù)用蜂窩鏈路上行頻譜資源,基于能效構(gòu)造D2D 鏈路與蜂窩鏈路之間的二分圖,利用蓋爾-沙普利算法解決D2D 用戶與蜂窩用戶之間的匹配問題。文獻(xiàn)[8]通過聯(lián)合解決D2D 直連通信下的功率控制和信道分配問題,最大化系統(tǒng)D2D 用戶對(duì)的能效。文獻(xiàn)[9]將非凸形式的能效優(yōu)化問題轉(zhuǎn)換為凸函數(shù)進(jìn)行求解,提出了一種聯(lián)合信道分配和功率控制的兩層優(yōu)化算法。文獻(xiàn)[10]在D2D 直連通信中加入了能量采集(EH,energy harvesting)技術(shù),研究了包含能量采集時(shí)隙、功率和信道分配的能效優(yōu)化問題。
在蜂窩通信與D2D 中繼通信并存場(chǎng)景下,可以從模式選擇、功率控制、中繼選擇/信道分配等多個(gè)方面去優(yōu)化能效。文獻(xiàn)[11-12]考慮從功率控制角度優(yōu)化能效,不同的是,前者利用非線性整數(shù)規(guī)劃方法解決了單個(gè)D2D 中繼鏈路的能效最大化問題,后者則利用在線學(xué)習(xí)策略從全局角度最大化系統(tǒng)的能量效率??紤]功率控制和信道分配2 個(gè)方面,文獻(xiàn)[13]首先最大化D2D 中繼通信的第一跳鏈路和第二跳鏈路的能效,然后基于兩跳鏈路的能效值,采用匹配算法選擇合適的中繼,最大化系統(tǒng)中D2D鏈路的總能效。文獻(xiàn)[14]假設(shè)中繼具有從射頻信號(hào)中獲得能量的EH 技術(shù)功能,研究D2D 通信中的功率控制和中繼選擇問題。文獻(xiàn)[15]提出了一種基于能效最優(yōu)的模式選擇策略,在確定最優(yōu)中繼數(shù)量的條件下,通過選擇使用中繼通信或者協(xié)同通信的方式來優(yōu)化系統(tǒng)的能效。文獻(xiàn)[16]考慮了D2D 通信的直連、中繼及協(xié)同3 種通信方式共存的場(chǎng)景,通過將優(yōu)化問題拆分成聯(lián)合模式選擇、功率控制和信道分配3 個(gè)子問題分別求解,提高了系統(tǒng)的D2D 鏈路能效。
文獻(xiàn)[11-16]大多只是從功率控制和中繼選擇,或者功率控制和信道分配兩方面考慮優(yōu)化D2D 中繼通信的能效,缺乏聯(lián)合三者的研究,因此,本文在D2D 中繼輔助通信系統(tǒng)中,通過聯(lián)合考慮功率控制、中繼選擇以及信道分配以最大化系統(tǒng)D2D用戶的總能效。本文首先建模能效優(yōu)化問題,并將能效優(yōu)化問題拆分為功率控制、中繼選擇和信道分配3 個(gè)子問題。然后,利用非線性整數(shù)規(guī)劃及凸優(yōu)化理論解決功率控制問題,利用強(qiáng)化學(xué)習(xí)中的Q 學(xué)習(xí)算法解決中繼選擇問題。最后,基于功率控制和中繼選擇,結(jié)合匹配理論,使用匈牙利算法求解信道分配問題。仿真結(jié)果表示,與現(xiàn)有文獻(xiàn)對(duì)比,本文所提的算法在保證蜂窩用戶和D2D 用戶的傳輸速率的條件下,有效地增加D2D 用戶的能量效率。
假設(shè)在單小區(qū)蜂窩系統(tǒng)中,存在N 對(duì)D2D 用戶、L 個(gè)理想中繼以及K 個(gè)蜂窩用戶,其中,一對(duì)D2D 用戶包含一個(gè)D2D 發(fā)射端和一個(gè)D2D 接收端。D2D 用戶對(duì)的索引集合表示為 M={1,2,…,N},D2D 發(fā)射端的索引集合表示為 S={1,2,…,N},D2D接收端的索引集合表示為 D={1,2,…,N},中繼的索引集合表示為 R={1,2,…,L},蜂窩用戶的索引集合表示為 C={1,2,…,K}。假設(shè)D2D 用戶的發(fā)射端與接收端之間由于鏈路質(zhì)量較差,沒有直連通路,只能通過中繼進(jìn)行通信,且中繼均采用放大轉(zhuǎn)發(fā)協(xié)議,同時(shí)每個(gè)蜂窩用戶都已經(jīng)預(yù)先分配了正交信道。系統(tǒng)模型如圖1 所示,假設(shè)某一D2D 用戶對(duì)m=(s,d)(m ∈M,s ∈S,d ∈D)復(fù)用蜂窩用戶c ∈C的上行鏈路頻譜資源,通過中繼r ∈ R進(jìn)行通信。在D2D 中繼通信第一跳鏈路中,中繼r 和基站的信干噪比(SINR,signal to interference plus noise ratio)分別為
圖1 系統(tǒng)模型
其中,Ps和Pc分別表示D2D 發(fā)射端和蜂窩用戶的傳輸功率,Gsr、Gsb、Gcr和Gcb分別表示D2D 發(fā)射端到中繼、D2D 發(fā)射端到基站、蜂窩用戶到中繼和蜂窩用戶到基站的信道增益,N0表示加性高斯白噪聲。
在D2D 中繼通信第二跳鏈路中,D2D 接收端d和基站的信干噪比分別為
其中,Pr表示中繼的傳輸功率,Grd、Grb和Gcd分別表示中繼到D2D 接收端、中繼到基站和蜂窩用戶到D2D 接收端的信道增益。
根據(jù)式(1)和式(3),D2D 發(fā)射端s 到D2D 接收端d 的能效表達(dá)式為
其中,xmr表示中繼選擇因子,當(dāng)D2D 用戶對(duì)m 通過中繼r 完成通信時(shí)xmr=1,否則xmr=0;Pcir、W 和η 分別表示電路功率、信道帶寬和功率放大系數(shù)。
本文旨在最大化整個(gè)系統(tǒng)的D2D 用戶對(duì)的能效,具體表達(dá)式為
其中,X 表示中繼選擇矩陣,矩陣X 第m 行、第r列的元素是中繼選擇因子xmr;Y 表示信道選擇矩陣,矩陣Y 第m 行、第c 列的元素是信道復(fù)用因子ymc,當(dāng)D2D 對(duì)m 復(fù)用蜂窩用戶c 的信道通信時(shí)ymc=1,否則ymc=0;向量和分別表示D2D 發(fā)射端、中繼和蜂窩用戶的傳輸功率向量;表示D2D 發(fā)射端和中繼的最大傳輸功率;表示蜂窩用戶的最大傳輸功率;表示D2D 通信鏈路必須滿足的最小傳輸速率;表示蜂窩用戶必須滿足的最小傳輸速率。
約束式(7)和式(8)保證一個(gè)中繼只能服務(wù)一個(gè)D2D 用戶對(duì),并且一個(gè)D2D 用戶對(duì)只能復(fù)用一個(gè)中繼。類似地,約束式(9)和式(10)保證一條信道只能被一個(gè)D2D 用戶對(duì)復(fù)用,并且一個(gè)D2D 用戶對(duì)只能復(fù)用一條蜂窩用戶的信道。約束式(11)~式(13)分別是D2D 發(fā)射端、中繼和蜂窩用戶的傳輸功率限制。約束式(14)~式(16)分別是D2D 第一跳鏈路、D2D 第二跳鏈路和蜂窩用戶鏈路的傳輸速率限制。
由多個(gè)約束條件和變量可以看出,本文的能效優(yōu)化問題是一個(gè)混合整數(shù)非線性規(guī)劃(MINLP,mixed integer non-linear programing)的NP-hard 問題,而NP-hard 問題沒有一個(gè)有效的直接求解方法。為了求解這個(gè)優(yōu)化問題,本文將其分為功率控制、中繼選擇和信道分配3 個(gè)子問題進(jìn)行求解。
假設(shè)D2D 用戶對(duì)m 通過中繼r 進(jìn)行通信,并且復(fù)用蜂窩用戶c 的信道資源,則xmr=1 且ymc=1,D2D 發(fā)送端s 到接收端d 的能效優(yōu)化問題為
由式(5)可得出,D2D 發(fā)射端到接收端的能效是關(guān)于蜂窩用戶功率Pc的減函數(shù),所以為了最大化D2D 發(fā)射端到接收端的能效,功率Pc需要取得最小值。根據(jù)約束式(13)、式(16)和文獻(xiàn)[11],得出蜂窩用戶最小傳輸功率為
式(19)是一個(gè)分?jǐn)?shù)形式的非凸函數(shù),所以利用Dinkelbach 方法將其轉(zhuǎn)換成等價(jià)的凸函數(shù)形式。首先,用變量表示D2D 發(fā)射端到接收端的能效值,并且定義式(19)所示的最大能效為
引理1當(dāng)且僅當(dāng)以下條件成立時(shí)得到
證明證明過程請(qǐng)參考文獻(xiàn)[17]。
證畢。
由引理1 可將優(yōu)化問題式(19)從分?jǐn)?shù)形式轉(zhuǎn)化為等價(jià)的減式形式,即
式(23)為一個(gè)帶約束條件的凸優(yōu)化問題,可使用拉格朗日乘子法求解,但是所得結(jié)果與有關(guān),為了獲得的值,本文通過迭代進(jìn)行計(jì)算。假設(shè)在第 n 次迭代中功率變量為 Ps(n)以及能效值為q1(n-1),則式(23)的增廣拉格朗日式為
其中,δ(n)和 θ(n)分別是約束式(14)和式(20)的拉格朗日算子。根據(jù)拉格朗日對(duì)偶分解,式(19)的能效優(yōu)化問題等價(jià)為
由KKT(Karush-Kuhn-Tucker)條件可求得
其中,{ x}+=max{0,x}。拉格朗日算子 δ(n)和 θ(n)的值可由梯度下降法迭代更新,計(jì)算式為
其中,τ 表示拉格朗日算子的第τ 次迭代,α 為步長(zhǎng)。中繼的最優(yōu)功率的計(jì)算式為
在功率控制問題的求解過程中包含兩層迭代。其中,外層迭代是為了求解q1,迭代次數(shù)用n 表示,最大迭代次數(shù)為Iouter,迭代誤差為 Δ1;內(nèi)層迭代為了更新拉格朗日算子δ 和θ,迭代次數(shù)用τ 表示,最大迭代次數(shù)為Iinner,迭代誤差為 Δ2。功率控制的具體步驟如算法1 所示。
算法1基于Dinkelbach 方法和拉格朗日乘子法的功率控制算法
輸入Gsr、Gsb、Gcr、Gcb、Grd、Grb、Gcd、N0、W、
輸出
在為每個(gè)D2D 用戶對(duì)選擇合適的中繼之前,為了減小計(jì)算復(fù)雜度,本文為每個(gè)D2D 用戶對(duì)劃分了備選的中繼集合。對(duì)于D2D 用戶對(duì)m,可選用中繼的區(qū)域劃分如圖2 所示,備選中繼所在區(qū)域處于以D2D 發(fā)射端s 和D2D 接收端d 的距離Dsd為半徑,分別以D2D 發(fā)射端s 和D2D 接收端d 為圓心所畫的2 個(gè)圓的重合區(qū)域。D2D 用戶對(duì)m 的備選中繼集合可表示為
其中,Dsr和Drd分別表示D2D 發(fā)射端到中繼和中繼到D2D 接收端的距離。
圖2 備選中繼區(qū)域示意
在給每個(gè)D2D 用戶對(duì)劃分備選中繼區(qū)域之后,為了保證D2D 用戶對(duì)的正常通信,本文設(shè)計(jì)優(yōu)先完成備選中繼數(shù)較少的D2D 用戶對(duì)的中繼選擇。具體地,用|Gm|表示D2D 用戶對(duì)m 的備選中繼數(shù),根據(jù)|Gm|的大小升序排列,得到新的D2D 用戶對(duì)集合M*。然后,利用本文提出的基于Q 學(xué)習(xí)的中繼選擇算法完成每個(gè)D2D 用戶對(duì)的中繼選擇。
Q 學(xué)習(xí)是一種典型的強(qiáng)化學(xué)習(xí)算法,可以在任意給定的馬爾可夫決策過程中通過學(xué)習(xí)過程找到最優(yōu)的動(dòng)作[18]。在一次學(xué)習(xí)過程中,學(xué)習(xí)的主體稱為智能體(agent),智能體通過感知周圍的環(huán)境,判斷當(dāng)前所處的狀態(tài)st,其中t 表示在一次迭代學(xué)習(xí)過程的時(shí)刻。之后根據(jù)一定的策略(例如ε-貪婪算法)從動(dòng)作集合At選擇某個(gè)動(dòng)作at。在執(zhí)行某個(gè)動(dòng)作之后,智能體會(huì)收到環(huán)境的反饋,稱為獎(jiǎng)賞Rt,Rt反映了所執(zhí)行動(dòng)作的好壞。在每次選擇動(dòng)作時(shí),智能體通常會(huì)大概率地選擇當(dāng)前已知的最優(yōu)動(dòng)作,但是也會(huì)小概率地去嘗試新的動(dòng)作,最終達(dá)到最大化總獎(jiǎng)賞值的目的。Q 學(xué)習(xí)通過更新學(xué)習(xí)動(dòng)作狀態(tài)值函數(shù) Q(st,at)來獲得最優(yōu)策略,其中 Q(st,at)表示在給定狀態(tài)st下執(zhí)行動(dòng)作at的收益。動(dòng)作狀態(tài)值函數(shù) Q(st,at)在時(shí)刻t 的更新式為
其中,α∈(0,1]表示學(xué)習(xí)因子,Rt表示獎(jiǎng)賞值,γ 表示折扣因子。從式(31)可以看出,從狀態(tài)st出發(fā),依照某種策略選擇動(dòng)作at,隨后更新Q 值函數(shù)。當(dāng)所有的動(dòng)作狀態(tài)值都被頻繁地執(zhí)行后,Q 估計(jì)值最終會(huì)收斂到最優(yōu)Q 值上,從而獲得最優(yōu)策略。
本文將中繼選擇的過程建模為D2D 用戶對(duì)學(xué)習(xí)尋找最優(yōu)中繼的過程,分別定義Q 學(xué)習(xí)中的智能體,動(dòng)作集合At、狀態(tài)集合St和獎(jiǎng)賞函數(shù)Rt如式(32)~式(34)所示。
智能體:所有D2D 用戶對(duì)。
其中,al表示選擇中繼l 完成通信。在t 時(shí)刻的動(dòng)作at可以是集合At中任一元素。
其中,EEs,d表示D2D 發(fā)射端到D2D 接收端的能效值,可通過功率控制進(jìn)行計(jì)算;EEth表示D2D 鏈路的能效閾值。
其中,λ 表示放大系數(shù)。獎(jiǎng)賞函數(shù)反映了中繼選擇的好壞,若選擇的中繼滿足D2D 鏈路的最小能效時(shí),返回一個(gè)正值;若不滿足,返回一個(gè)負(fù)值。當(dāng)每對(duì)D2D 用戶完成Q 學(xué)習(xí)過程后,會(huì)生成對(duì)應(yīng)于中繼的Q 表,根據(jù)Q 表,便可以選擇最優(yōu)中繼。具體的基于Q 學(xué)習(xí)的中繼選擇過程如算法2 所示。
算法2基于Q 學(xué)習(xí)的中繼選擇算法
在3.1 節(jié)和3.2 節(jié)中,通過功率控制和中繼選擇可以得到D2D 用戶對(duì)在復(fù)用某一蜂窩用戶信道下的最大能效,本節(jié)討論如何為每個(gè)D2D 用戶對(duì)分配合適的信道以最大化系統(tǒng)總D2D 用戶的能效。
由于蜂窩用戶集合C 和D2D 用戶集合M 是2 個(gè)互不相交的集合,因此本文構(gòu)建二分圖G=(V ,E),其中二分圖中頂點(diǎn)V 表示蜂窩用戶集合和D2D 用戶對(duì)集合,邊E 表示為D2D 用戶對(duì)和蜂窩用戶之間的連線。在3.1 節(jié)的功率控制中,通過約束式(16)已經(jīng)滿足蜂窩用戶的QoS,所以在信道分配時(shí),只需要考慮如何最大化系統(tǒng)總D2D 用戶對(duì)的能效。因此,設(shè)定D2D 用戶與蜂窩用戶之間邊的權(quán)重表示的是該D2D 用戶復(fù)用該蜂窩用戶信道時(shí)的能效值。引入N ×K 的矩陣T 表示權(quán)重矩陣,矩陣的行表示D2D 用戶對(duì),矩陣的列表示蜂窩用戶。
根據(jù)以上分析,信道分配問題可以轉(zhuǎn)換為最大二部圖匹配問題,并使用匈牙利算法進(jìn)行求解。由匈牙利算法計(jì)算出一個(gè)包含信道分配信息的布爾矩陣Y,根據(jù)矩陣Y 便可為每個(gè)D2D 用戶分配合適的信道。具體信道分配過程如算法3 所示。
算法3基于匹配理論的信道分配算法
本文所提出的能效優(yōu)化算法由3 個(gè)部分組成,分別是基于Dinkelbach 方法和拉格朗日乘子法的功率控制算法、基于Q 學(xué)習(xí)的中繼選擇算法和基于匹配理論的信道分配算法。在假設(shè)D2D 用戶獲得確定輔助的中繼以及復(fù)用的信道情況下,得出單一D2D 用戶能效最大時(shí)的功率分配解。之后,基于功率分配的解,在假設(shè)復(fù)用信道確定的條件下,利用Q 學(xué)習(xí)計(jì)算D2D 用戶在復(fù)用任意一條信道時(shí)的最佳中繼?;诠β士刂坪椭欣^選擇,計(jì)算D2D 用戶復(fù)用每條可用信道時(shí)的能效矩陣,利用匈牙利算法得到信道分配解。雖然本文提出的能效算法復(fù)雜度較高,但是能在理論上獲得系統(tǒng)總D2D 用戶的最大能效值。
本文所提能效優(yōu)化算法的復(fù)雜度取決于功率控制、中繼選擇和信道分配算法?;贒inkelbach方法和拉格朗日乘子法的功率控制算法復(fù)雜度為O(IouterIinner),考慮N 個(gè)D2D 用戶對(duì),K 個(gè)蜂窩用戶以及每個(gè)D2D 用戶對(duì)可復(fù)用的最大中繼數(shù)L,則功率控制算法的復(fù)雜度為O(MNRIouterIinner)?;赒 學(xué)習(xí)的中繼選擇算法的復(fù)雜度取決于Q 學(xué)習(xí)中狀態(tài)集合數(shù)|St|和動(dòng)作集合數(shù)|At|,所以中繼選擇算法的復(fù)雜度為O(|St||At|)?;谄ヅ淅碚摰男诺婪峙渌惴◤?fù)雜度為O(K3),其中K 為蜂窩用戶數(shù)。綜上所述,本文提出的聯(lián)合功率控制、中繼選擇和信道分配的能效優(yōu)化算法的復(fù)雜度為O(MNRIouterIinner+|St||At|+K3)。
本文使用Matlab 仿真工具對(duì)算法進(jìn)行仿真,重復(fù)執(zhí)行1 000 次蒙特卡洛實(shí)驗(yàn),然后對(duì)結(jié)果取平均值。每一次算法執(zhí)行過程中,中繼、蜂窩用戶和D2D 用戶均隨機(jī)分布在系統(tǒng)中。假設(shè)系統(tǒng)內(nèi)D2D與蜂窩鏈路的陰影衰落均服從均值為0、標(biāo)準(zhǔn)差分別為12 dB 與10 dB 的對(duì)數(shù)正態(tài)分布,其余主要仿真參數(shù)如表1 所示。
表1 實(shí)驗(yàn)仿真參數(shù)
仿真中,將本文所提算法與文獻(xiàn)[13]的BEEPER 算法、隨機(jī)中繼選擇算法和隨機(jī)信道分配算法進(jìn)行對(duì)比。其中,文獻(xiàn)[13]的BEEPER 算法分別優(yōu)化D2D 中繼通信的第一跳和第二跳鏈路的能效,然后再完成中繼選擇,但是并沒有考慮信道的分配,所以,為了全面評(píng)價(jià)本文所提算法,與BEEPER 算法進(jìn)行對(duì)比時(shí),在BEEPER 算法中加入了本文提出的信道分配算法。隨機(jī)中繼選擇算法是本文所提功率控制和信道分配算法的結(jié)合,而每個(gè)D2D 用戶的輔助中繼是從備選中繼區(qū)域中隨機(jī)選擇的。隨機(jī)信道分配算法是本文所提功率控制和中繼選擇算法的結(jié)合,而信道的分配是隨機(jī)的。
圖3 是在N=K=10、L=50 和Dmax=100 的條件下,系統(tǒng)D2D 用戶總能效的累計(jì)分布函數(shù)曲線。由圖3 可知,本文所提算法最大可達(dá)能效大于其余3 種算法,且比BEEPER 算法約高2%,比隨機(jī)中繼選擇算法高13%,比隨機(jī)信道分配算法高41%。本文所提算法優(yōu)于BEEPER 算法的原因是本文算法直接對(duì)D2D 發(fā)射端到接收端的能效優(yōu)化問題進(jìn)行求解,而BEEPER 算法通過分別最大化D2D 通信第一跳和第二跳鏈路的能效來解決問題。本文所提算法優(yōu)于隨機(jī)中繼選擇算法和隨機(jī)信道分配的原因是前者考慮從功率、中繼和信道3 個(gè)方面優(yōu)化系統(tǒng)中D2D 用戶的總能效,而后兩者僅是從功率和中繼或者功率和信道2 個(gè)方面去優(yōu)化能效。
圖3 D2D 用戶總能效的累計(jì)分布函數(shù)曲線
當(dāng)L=50 和Dmax=100 時(shí),系統(tǒng)總D2D 用戶對(duì)能效隨D2D 用戶對(duì)數(shù)目變化的曲線如圖4 所示。隨著D2D 用戶數(shù)目的增加,4 種算法的D2D 鏈路總能效都呈現(xiàn)了遞增的趨勢(shì)。在D2D 用戶數(shù)相同的情況下,本文所提算法的性能明顯優(yōu)于其他3 種優(yōu)化算法。這是因?yàn)楸疚乃崴惴?lián)合考慮從功率控制、中繼選擇和信道分配3 個(gè)方面優(yōu)化系統(tǒng)中D2D 用戶的總能效,并且在解決功率控制問題時(shí),在假設(shè)的條件下,直接求解出D2D 發(fā)射端到接收端的最大能效。當(dāng)N=K=15 時(shí),本文所提算法的能效值比BEEPER 算法約高2%,比隨機(jī)中繼選擇算法高13%,比隨機(jī)信道分配算法高41%。
圖4 D2D 用戶總能效隨D2D 用戶數(shù)變化曲線
圖5 是當(dāng)N=K=10 和L=50 時(shí),系統(tǒng)總D2D 用戶對(duì)能效隨D2D 發(fā)射端與接收端最大傳輸距離Dmax變化的曲線。從圖5 中可以看出,隨著Dmax的增大,總能效呈遞減的趨勢(shì)。這是因?yàn)楫?dāng)Dmax增大時(shí),D2D 發(fā)射端和中繼需要增加發(fā)射功率以保證傳輸質(zhì)量,從而降低了能效。但是從整體上來說,本文所提算法優(yōu)于其余3 種對(duì)比算法。當(dāng)Dmax=50 時(shí),本文算法的能效值比BEEPER 算法約高1%,比隨機(jī)中繼選擇算法高13%,比隨機(jī)信道分配算法高41%。
圖5 D2D 用戶總能效隨Dmax變化曲線
圖6 給出了當(dāng)K=N=10 和Dmax=100 時(shí),D2D用戶總能效隨著中繼數(shù)L 變化的曲線。隨著L 的增加,本文所提算法、BEEPER 算法和隨機(jī)信道分配算法的曲線呈現(xiàn)遞增的趨勢(shì),而隨機(jī)中繼選擇算法的曲線平緩,沒有太大的波動(dòng)。這是因?yàn)殡S著中繼數(shù)目增加,加入了中繼選擇過程的本文所提算法、BEEPER 算法和隨機(jī)信道分配算法會(huì)選擇更合適的中繼進(jìn)行通信,而隨機(jī)中繼選擇算法在選擇中繼時(shí)是隨機(jī)的,所以關(guān)于系統(tǒng)D2D 用戶總能效的曲線沒有太大波動(dòng)。當(dāng)L=150 時(shí),本文所提算法的能效值高于BEEPER 算法2%,高于隨機(jī)中繼選擇算法26%,高于隨機(jī)信道分配算法34%。
圖6 D2D 用戶總能效隨中繼數(shù)變化曲線
圖3~圖6 的仿真中D2D 用戶數(shù)和蜂窩用戶數(shù)是相等的,也就是說,D2D 用戶數(shù)與可復(fù)用信道數(shù)是一致的,而圖7 給出了D2D 用戶數(shù)與信道數(shù)不一致的情況下,每種算法的能效曲線。在圖7 中,仿真參數(shù)分別為K=10、L=50 和Dmax=100。隨著N增加,本文所提算法、BEEPER 算法和隨機(jī)中繼選擇算法的曲線呈現(xiàn)遞增并趨于平緩的趨勢(shì),而隨機(jī)信道分配算法曲線平緩,沒有太大的波動(dòng)。因?yàn)樾诺蕾Y源的增加,加入了信道分配過程的3 種算法會(huì)被分配到更合適的信道進(jìn)行通信,而隨機(jī)信道分配算法在信道分配時(shí)是隨機(jī)的,所以能效曲線沒有太大波動(dòng)。當(dāng)N=20 時(shí),本文所提算法的能效值高于BEEPER 算法2%,高于隨機(jī)中繼選擇算法10%,高于隨機(jī)信道分配算法49%。
圖7 D2D 用戶總能效隨蜂窩用戶數(shù)變化曲線
為了提高D2D 中繼通信系統(tǒng)中D2D 用戶的能效,本文提出了一種聯(lián)合功率控制、中繼選擇和信道分配的能效優(yōu)化算法。首先,在保證D2D 用戶和蜂窩用戶的QoS 條件下,建模能效優(yōu)化問題。其次,使用Dinkelbach 方法與拉格朗日乘子法,求解能效的最優(yōu)值。再次,根據(jù)功率控制得到的能效值,通過Q 學(xué)習(xí)算法選擇合適的中繼。最后,基于D2D用戶集合與蜂窩用戶集合構(gòu)建二分圖,設(shè)置集合間邊的權(quán)重值為能效值,利用匈牙利算法完成信道分配。仿真結(jié)果表明,本文所提算法有效地提高了系統(tǒng)D2D 用戶的總能效。