劉 通
(1.重慶工程職業(yè)技術學院,重慶 402260;2.重慶郵電大學,重慶 400065)
隨著移動互聯(lián)網的逐步普及,相關應用也日趨豐富,越來越多的移動用戶對移動網絡提出了高速率、高可靠低時延、萬物互聯(lián)等各種要求。5G移動通信系統(tǒng)中eMMB(enhanced Mobile Broadband,eMMB,增強移動寬帶)、uRLLC(ultra Reliable Low Latency Communications,uRLLC,低時延高可靠)、mMTC(Massive Machine Type Communications, mMTC, 海量大連接)三大應用場景可以在4G通信系統(tǒng)的基礎上有效應對用戶的各種要求,提升用戶的網絡QoE(Quality of Experience,QoE, 體驗質量)。在工業(yè)界、學術界、商界,5G移動通信系統(tǒng)均得到了廣泛的關注[1]。
作為一種有效提高系統(tǒng)頻譜效率和減少通信延遲的通信方式,D2D(Device to Device,D2D,端到端)通信模型近來受到了廣泛的關注和深入的研究。D2D通信模式被定義為在蜂窩網絡中兩個移動用戶之間的直接通信[2]。在D2D通信模式下,源節(jié)點用戶將信息直接發(fā)送給目的節(jié)點,將流量從傳統(tǒng)的以網絡為中心的實體卸載到D2D網絡,數(shù)據(jù)不再遍歷基站或核心網,從而可以大量節(jié)約對系統(tǒng)資源的使用,并能進一步降低信息傳遞的時延,增加網絡容量,擴大網絡的覆蓋范圍[3]。
然而由于D2D通信在空間、距離和信道鏈路質量上的限制,將其它終端用戶作為中繼節(jié)點協(xié)作的通信方式相繼被提出,協(xié)作D2D方式更進一步地提高了網絡的頻譜利用率和系統(tǒng)穩(wěn)定性[4]。由于中繼節(jié)點隨機分布在源節(jié)點附近,如何進行可靠的中繼節(jié)點選擇引起了學者們的興趣。文獻[5]從交互和社交貢獻的角度研究了中繼節(jié)點間的社會關系,隨后構建了一個有效增強多跳D2D通信協(xié)作效率的優(yōu)化中繼選擇模型,基于上述模型提出了一種社交感知的中繼選擇策略,并在仿真中證明了此中繼選擇模型在節(jié)約系統(tǒng)功率開銷上的優(yōu)勢。文獻[6]作者研究了基于社交相似性感知的D2D中繼選擇問題,提出了一種兩階段D2D 中繼選擇方案。 利用直覺模糊分析的聯(lián)合算法,設計了層次過程和熵權生成方法。仿真結果驗證了兩階段中繼選擇能夠在確保高系統(tǒng)在吞吐量,公平性的同時還能進一步提升資源使用效率。
另一方面,由于數(shù)據(jù)規(guī)模的不斷擴大以及計算機處理性能的提升,機器學習在人臉識別、數(shù)據(jù)挖掘、自然語言處理等方面的成功使得其受到了廣泛的關注。機器學習的方法也被應用到D2D通信模式中以提升網絡的智能化水平。文獻[7]研究了具有自優(yōu)化和自主學習的源節(jié)點自主選擇中繼節(jié)點的問題。提出了一種基于分散學習的中繼分配算法,源節(jié)點利用增強學習技術,能夠根據(jù)環(huán)境的反饋進行優(yōu)化中繼節(jié)點的選取。一般情況下,系統(tǒng)在未知CSI(Channel State Information,CSI, 信道狀態(tài)信息)條件下進行中繼選擇所獲得的網絡性能均不夠理想。而根據(jù)文獻[8]所提出的基于Q學習算法的跨層中繼選擇方案進行中繼選擇,即使在未知CSI前提條件下,亦能明顯提升系統(tǒng)的傳輸效率。
本研究在5G蜂窩通信網絡中,考慮了一種雙向多中繼系統(tǒng)協(xié)作D2D通信場景,并在此場景中提出了一種使用機器學習進行可靠中繼選擇的策略??煽恐欣^節(jié)點的選擇不僅取決于中繼節(jié)點與終端節(jié)點間的距離,同時還取決于鏈路間的信道增益,通過CART決策樹算法進行學習并對中繼節(jié)點進行分類。可采用的分類方法有兩種,文章進一步對兩種不同分類方法的基尼系數(shù)和信息增益進行了分析,并基于此分析得到了可靠中繼的候選集。
5G移動通信系統(tǒng)模型如圖1所示,多個用戶處于宏基站的覆蓋范圍內。設此宏基站覆蓋范圍內的用戶數(shù)為j,用戶構成的集合為N,滿足N={N|N1∪N1…∪Nj}。為了降低信息傳遞的時延,提升網絡的整體性能,處于某個區(qū)域內的用戶采用D2D模式進行通信。設在此宏蜂窩基站覆蓋范圍內采用D2D模式進行協(xié)作通信的通信節(jié)點個數(shù)為k, D2D模式下的用戶節(jié)點構成集合M={M|M1∪M1…∪Mj},并有M?N成立。
圖1 系統(tǒng)模型
D2D通信模式下的雙向多中繼系統(tǒng)模型如圖2所示,系統(tǒng)包括D1,D2兩個終端節(jié)點以及i個中繼節(jié)點D3,有M={M|D1∪D2∪D31∪D32…∪D3i}成立。fi,li分別代表從D1,D2到第i個中繼節(jié)點間的信道系數(shù),此系數(shù)服從指數(shù)分布,且信噪比也服從指數(shù)分布。
圖2 D2D雙向多中繼系統(tǒng)模型
雙向中繼系統(tǒng)中在兩個時隙內完成信息的傳輸與交互。在第一時隙內,終端節(jié)點D1及D2同時將信息發(fā)送至被選中的某個中繼節(jié)點D3i。為確保信息傳輸?shù)挠行?,中繼節(jié)點接收到信號之后首先對其進編碼。在第二時隙內將編碼后的信號廣播至目的節(jié)點D1及D2。兩個終端節(jié)點間存在數(shù)據(jù)直傳的情況不在討論范圍之內,且假設每個節(jié)點都具有完全信道狀態(tài)信息。
設在第一時隙內D1發(fā)送的信號為x1,D2發(fā)送的信號為x2,則中繼節(jié)點接收到的信號可表示為:
y3i=fix1+lix2+ε
(1)
式中ε為對應的加性白噪聲,假設所有的白噪聲功率譜密度為N0。
D3i將接收到的信號y3i進行編碼放大后廣播,設D3i編碼放大后的信號為z3i,則在第二個時隙內,兩個目的節(jié)點接收到的信號分別可以表示為:
y1=fiz3i+ε1
(2)
y2=liz3i+ε2
(3)
式中,ε1和ε2分別為加性白噪聲,同樣假設所有的白噪聲功率譜密度為N0。
系統(tǒng)中有多個中繼節(jié)點可用于協(xié)作通信,不同的中繼節(jié)點會帶來不同的系統(tǒng)增益。文獻[8]中分析了在雙向中繼節(jié)點中,地理位置分布在兩個終端節(jié)點正中的中繼可為系統(tǒng)帶來最大增益,故被選為最優(yōu)中繼。然而在實際網絡節(jié)點部署過程中,受到地理環(huán)境的限制以及用戶的移動性,中繼節(jié)點基本不可能剛好處于兩個終端節(jié)點的正中位置,但處于正中位置附近范圍內的中繼節(jié)點也能給系統(tǒng)帶來較大的系統(tǒng)增益。故可認為分布在目的節(jié)點和中繼節(jié)點中間某段區(qū)域內的中繼節(jié)點可作為候選節(jié)點[10-13]。
設系統(tǒng)有k個中繼節(jié)點,這些中繼節(jié)點構成中繼集S。兩個終端節(jié)點間的距離為d,第i個中繼節(jié)點到D1節(jié)點之間的距離為di,滿足di≤d。候選中繼集的集合可表示為:
V={i||d/2-di|≤dth}i=1,2…k
(4)
文獻[9]提出了一種基于信道增益的中繼節(jié)點選擇。在該方案中具有最大信道增益的中繼節(jié)點被視為最佳轉發(fā)中繼。設cgi代表第i個中繼節(jié)點的信道增益,則根據(jù)信道增益選出的最佳中繼候選集可表示為:
T={i|cgi≥cgi_th}i=1,2…k
(5)
基于CART決策樹的可靠中繼選擇策略即是通過分類的方法從i個節(jié)點中選出能給系統(tǒng)帶來理想增益的節(jié)點集。
由于中繼節(jié)點有兩個參數(shù)di和cgi,故可選擇兩種分類方式對中繼集S進行分類,分別為距離優(yōu)先的分類方式和信道增益優(yōu)先的分類方式。
圖3 距離優(yōu)先的分類方式
如圖3所示,在距離優(yōu)先的分類方式中,首先根據(jù)中繼節(jié)點與兩個終端節(jié)點之間的距離進行第一次分類,不滿足條件的中繼節(jié)點在第一次分類中被分為負類集T-。滿足條件的中繼節(jié)點構成一個新的集合T+。在T+中以中繼節(jié)點的信道增益cgi對集合中的候選中繼進行分類,分類之后會出現(xiàn)兩個子集合及T++和T+-,T+-集合中的中繼節(jié)點處的信道增益小于設定門限值,故不屬于候選中繼集;信道增益大于門限值的集合被劃分到集合T++。集合T++中的節(jié)點不僅滿足距離要求,同時還滿足信道增益大于門限值的要求,故可作為候選中繼集。
信道增益優(yōu)先的分類方式:
圖4 信道增益優(yōu)先的分類方式
如圖4所示,在信道增益優(yōu)先的分類方式第一次分類時采用的分類標準是中繼節(jié)點處的信道增益,滿足條件的備選中繼節(jié)點集為正類集V+,不滿足的為負類集V-。之后根據(jù)中繼節(jié)點在地理位置上的分布進行第二次分類,滿足條件的節(jié)點被劃分到候選中繼集V++,不滿足條件節(jié)點則分類到負類集V+-。
分類方式的差異會導致性能增益的不同,為衡量不同分類方式的優(yōu)劣,可采用熵或基尼系數(shù)對劃分方式進行進一步分析。由于上述兩個分類所涉及的機器學習方式為監(jiān)督類學習,其輸出結果為離散取值,故可使用基尼指數(shù)來進行分析。
基尼指數(shù)數(shù)學表達式為:
(6)
式中c代表多類劃分的數(shù)量,上述兩個分類劃分都是二分類,故c=2,進一步得到基尼指數(shù)的數(shù)學表達式為:
Gini(S)=1-P2+-P2-
(7)
式中P2+代表樣本屬于正類的概率,P2-代表樣本屬于負類的概率。
基于距離的分類方式首先考慮的是不同的地理位置分布,但在進行第一次分類時卻忽略了信道增益的影響,會導致偏差的出現(xiàn),即某些中繼節(jié)點雖然沒有處于最佳位置區(qū)間,但其信道增益有可能是最佳的。對于基于信道增益的分類方式也存在同樣的問題,即某些信道增益并不是很高的中繼節(jié)點,其地理位置有可能位于最佳區(qū)間。上述問題是機器學習分類問題中典型的分類“不純凈”問題,不純凈的分類給系統(tǒng)帶來的增益有所不同,為衡量上述兩種不同分類方式的優(yōu)劣,進一步定義使用特征u劃分集合S的信息增益為:
(8)
Si代表利用特征u可以將集合S劃分為m個互不相交的子集,即S=S1∪S2∪…∪Sm。
根據(jù)距離di進行分類的數(shù)據(jù)類型為分類變量,根據(jù)此分類變量得到的結果為正類樣本T+和負類樣本T-,故其信息增益的計算方法可表述為:
(9)
根據(jù)cgi進行分類的數(shù)據(jù)類型為數(shù)據(jù)變量,由于每個中繼節(jié)點的信道增益不同,故在此基礎上,還需要進一步尋找分割點進行數(shù)據(jù)劃分。首先將各個中繼節(jié)點處的信道增益cgi按照其大小進行升序排序,得到新的數(shù)據(jù)序列{N_Cg1,N_Cg2…N_Cgk},然后再確定新的分割點,分割點的構建方法如下:
(10)
對于新創(chuàng)建的判定條件ω1,ω2,…,ωj,可根據(jù)(8)式計算每個判定條件所對應的信息增益,得到集合G={j|G(S,ω1),G(S,ω2),…G(S,ωj)j=1,2…k-1},根據(jù)信息增益的定義,其中取值最大的信息增益所對應的判定條件為最優(yōu)判定條件,有:
ωbest=arg max{G(S,ωj)j=1,2…k-1}
(11)
其對應的信息增益為:
(12)
為使最終的樣本劃分更為純凈,在第一次進行劃分時應選擇能帶來最大信息增益的劃分方式,故當GT>GV成立時,應選用距離優(yōu)先的分類方式。若GT 仿真實驗中采用MATLABR2016a作為數(shù)據(jù)分析處理工具,衰落信道的模型為: (13) 圖5 D1用戶、D2用戶和中繼節(jié)點位置分布圖 在仿真中,首先分析了中繼選擇策略對系統(tǒng)頻譜效率的影響。 系統(tǒng)總速率由下式給出: Rsum=R12+R21 (14) R12代表從節(jié)點D1到節(jié)點D2間的可達速率,表達式為: (15) 同理,R21代表從節(jié)點D2到節(jié)點D2間的可達速率,表達式為: (16) 式中,p1、p2、p3分別代表源節(jié)點、目的節(jié)點和中繼節(jié)點的發(fā)射功率。 圖6 不同中繼選擇策略對應的系統(tǒng)總速率 圖6反映了在消耗相同總功率的情況下,使用不同中繼選擇策略與系統(tǒng)總功率間的關系。當使用本研究所提出的RSBC策略進行中繼選擇時,系統(tǒng)總體性能明顯優(yōu)于隨機中繼選擇方案。如在總功率消耗等于30 W時,隨機進行中繼選擇所獲得的系統(tǒng)總速率約為2.9 bit/s/Hz。同樣的系統(tǒng)總功率消耗條件下,使用RSBC策略后系統(tǒng)總速率可達約3.5 bit/s/Hz,系統(tǒng)的總速率有0.6 bit/s/Hz的提升。同時將RSBC與文獻[9]中的BRS(Bidirectional Relay Selection,BRS,雙向中繼選擇)策略進行了對比,在消耗相同的總功率條件下,RSBC較BRS策略平均有0.22 bit/s/Hz的性能提升。 此后對系統(tǒng)中繼概述進行了仿真,系統(tǒng)中繼概率的表達式為: (17) γi代表第i條鏈路上目的節(jié)點的接收信噪比,滿足γi=pi|fi|2/σ2,pi表示分配到第條鏈路上發(fā)射節(jié)點的功率,γth代表接收信噪比閥值。 由圖7可以看出,若系統(tǒng)性能不夠理想,即在低信噪比區(qū)間內,是否進行優(yōu)化中繼選擇對系統(tǒng)的性能影響不大,如當總功率小于10 W時,使用優(yōu)化中繼選擇與隨機進行中繼選擇得到的中斷概率并無太大區(qū)別,導致這種情況的原因是系統(tǒng)發(fā)射功率過低,信道質量極差,信號在無線信道中傳送時衰落極大。但隨著系統(tǒng)總功率的提升,信道質量的改善,本研究所提的基于CART決策樹的中繼選擇方案可以顯著地提高系統(tǒng)性能[14-15]。 圖7 不同中繼選擇策略對應的中斷概率 本研究在5G D2D網絡中對雙向中繼系統(tǒng)中的中繼節(jié)點選擇進行了研究。首先基于中繼節(jié)點的距離和信道增益兩個參數(shù),使用CART決策樹分類算法提出兩種分類方法。不同的分類方法獲得的分類集不同,而不同的分類集又會對系統(tǒng)的性能如總速率和中斷概率造成影響。為了能讓系統(tǒng)的性能得到更大的提升,通過基尼指數(shù)和信息增益兩個指標對兩種分類方法進行了比較分析,最終的仿真結果證明所提方案能夠有效提升系統(tǒng)總速率和降低中斷概率。3 仿真分析
4 結 語