趙振濤,尹斯星,李書(shū)芳
(1.公安部第一研究所;2.北京郵電大學(xué))
由于頻譜資源的有限性,無(wú)線通信系統(tǒng)中射頻前端的參數(shù)設(shè)置需根據(jù)頻譜使用情況和相關(guān)頻譜管理規(guī)定進(jìn)行設(shè)定。認(rèn)知無(wú)線電(Cognitive Radio,CR)技術(shù)可以感知周?chē)鸁o(wú)線頻譜環(huán)境。按照現(xiàn)有頻譜分配原則,無(wú)線頻譜資源劃分為授權(quán)頻段與非授權(quán)頻段,得到授權(quán)的團(tuán)體和個(gè)人長(zhǎng)期獨(dú)占該頻譜使用權(quán)。由于在某個(gè)地點(diǎn)授權(quán)用戶(hù)(又叫主用戶(hù),Primary Users,PUs)不會(huì)在任何時(shí)間都使用該頻段,因此,不少授權(quán)頻段都處于空閑的狀態(tài)(稱(chēng)為頻譜空洞或頻譜孔)。如3G/4G/5G和廣播電視的授權(quán)頻段雖然保障了高通信質(zhì)量,但大多數(shù)時(shí)間的信道利用效率卻太低(我國(guó)大多數(shù)城市的大多數(shù)時(shí)間飽和度不到35%)。因此需要利用認(rèn)知無(wú)線電的頻譜感知等關(guān)鍵技術(shù),對(duì)無(wú)線信道進(jìn)行能量收集和實(shí)時(shí)監(jiān)測(cè),在保障業(yè)務(wù)服務(wù)質(zhì)量的基礎(chǔ)上改變頻譜的子信道分配和功率的效能分配,讓非授權(quán)用戶(hù)(又叫次級(jí)用戶(hù),Secondary Users,SUs)以競(jìng)爭(zhēng)方式接入使用,從而更加有效地調(diào)控電磁環(huán)境中的頻譜效率[1]。
對(duì)于需要無(wú)線充電的無(wú)線傳感器,首先需要外部充電過(guò)程為感知計(jì)算和數(shù)據(jù)傳輸提供能量。如果沒(méi)有足夠的能量,傳輸也會(huì)中斷。能量收集的主要挑戰(zhàn)不是最小化能量消耗和最大化網(wǎng)絡(luò)運(yùn)行時(shí)間,而是收集能量的效用最大化[2],即通過(guò)利用環(huán)境能量的空間變化來(lái)最大化數(shù)據(jù)傳遞速率[3]。能量效率間接反映了傳感器對(duì)頻譜的利用效率。為了改善CR系統(tǒng)的能量效率,通常采用降低能量消耗以及能量收集的方法[4]。其中,能量收集以能量補(bǔ)充的方式來(lái)確保系統(tǒng)的供能,在無(wú)線網(wǎng)絡(luò)中具有十分廣泛的應(yīng)用,如移動(dòng)Adhoc 網(wǎng)絡(luò)、蜂窩網(wǎng)絡(luò)、傳感器網(wǎng)絡(luò)和車(chē)載網(wǎng)絡(luò)等場(chǎng)景。在能量收集的相關(guān)研究中,文獻(xiàn)[5?7]從信息論的角度出發(fā),在不同的CR 系統(tǒng)中研究了基于能量收集的信道容量邊界。文獻(xiàn)[8,9]則研究了不同條件下能量收集的最優(yōu)策略與規(guī)則,其中,文獻(xiàn)[8]研究了單用戶(hù)能量收集無(wú)線通信系統(tǒng)中的最佳分組調(diào)度問(wèn)題,根據(jù)流量負(fù)載和可用能量自適應(yīng)地調(diào)整傳輸速率,從而獲得分組與傳輸所需的最小時(shí)間。文獻(xiàn)[9]則是基于能量采集時(shí)間和可充電電池容量均受限的情況,設(shè)計(jì)的最優(yōu)傳輸策略。由于從環(huán)境中獲取的射頻能量對(duì)傳感器的充電量不確定,為探尋最佳能源管理政策,在能量傳輸和通信功能之間進(jìn)行權(quán)衡[10],就需要對(duì)預(yù)期的無(wú)線網(wǎng)絡(luò)信號(hào)時(shí)間進(jìn)行最優(yōu)設(shè)計(jì)。F.Ian‐nello 和O.Simeone[11?13]基于Markov 模型重新設(shè)計(jì)了媒體訪問(wèn)控制(MAC)協(xié)議,構(gòu)造了傳感器最優(yōu)的能量傳遞和最優(yōu)的數(shù)據(jù)通信時(shí)間的函數(shù)表達(dá)式[14]。Mi‐chelusi則提出了基于在線優(yōu)化的能量管理方案[15]。
很明顯,次用戶(hù)能量收集時(shí)間越長(zhǎng),可以獲得更多的能量,使得瞬時(shí)傳輸速率得以改善[16];為提高次用戶(hù)的傳輸性能,需要感知更多信道能夠獲得更多的可用信道,這會(huì)以消耗更多時(shí)間和能源為代價(jià)[17]。在時(shí)隙模式中,用在能量收集和信道感知上的時(shí)間越多,數(shù)據(jù)傳輸?shù)臅r(shí)間越少,SUs的有效傳輸質(zhì)量(傳輸數(shù)據(jù)總量和鏈路頻譜效率)就越低[18]。文獻(xiàn)[19]設(shè)計(jì)的次用戶(hù)的頻譜感知策略、分配的感知時(shí)間、能量,獲得主次用戶(hù)數(shù)據(jù)通信總吞吐量的最大值。而文獻(xiàn)[20]是在保證主用戶(hù)通信不受影響的前提下,優(yōu)化的頻譜感知策略以獲得最大的次用戶(hù)數(shù)據(jù)通信的最大吞吐量。
上述的工作主要從頻譜感知、接入策略以及網(wǎng)絡(luò)性能等方面進(jìn)行了研究。實(shí)際情況下,非授權(quán)用戶(hù)運(yùn)行的時(shí)隙中能量收集和頻譜感知會(huì)產(chǎn)生相互影響和制約,目前很少有工作對(duì)能量收集與頻譜感知進(jìn)行協(xié)同管理,來(lái)對(duì)整體性能進(jìn)一步優(yōu)化[21]。為此,本文將重點(diǎn)放在能量收集和頻譜感知的策略設(shè)計(jì)上,以進(jìn)一步優(yōu)化SUs的期望鏈路頻譜效率。本文設(shè)計(jì)的CR 系統(tǒng)基于能量收集和頻譜共享的感知優(yōu)化,其中SUs 以時(shí)隙模式運(yùn)行。假設(shè)時(shí)隙被分為三個(gè)非重疊部分,分別用于能量收集、頻譜感知和數(shù)據(jù)傳輸。由于這三個(gè)操作共享操作時(shí)隙和能量消耗,因此三者之間存在著博弈平衡:能量收集時(shí)間越長(zhǎng),可以獲得更多的能量,使得瞬時(shí)傳輸速率得以改善;雖然會(huì)消耗更多時(shí)間和能源代價(jià),不過(guò)通過(guò)感知更多信道能夠獲得更多的可用信道。然而,在時(shí)隙模式中,花費(fèi)在能量收集和信道感知上的時(shí)間越多,數(shù)據(jù)傳輸?shù)臅r(shí)間越少,這就降低了SU 的有效傳輸質(zhì)量(即,可實(shí)現(xiàn)的吞吐量)。為此,我們將重點(diǎn)放在能量收集和頻譜感知的策略設(shè)計(jì)上,以進(jìn)一步優(yōu)化SU 的期望有效吞吐量。同樣,根據(jù)感知結(jié)果靈活調(diào)整電磁調(diào)控器件的參數(shù),有利于提高頻譜感知的數(shù)據(jù)精度。
CR系統(tǒng)中對(duì)頻譜的利用可分為交織、覆蓋和分層三種不同模型。在交織模型中,非授權(quán)用戶(hù)只能通過(guò)頻譜感知技術(shù)發(fā)現(xiàn)其他非授權(quán)的空閑頻譜并加以利用,而不允許使用授權(quán)用戶(hù)的頻帶。在覆蓋模型中,非授權(quán)用戶(hù)與授權(quán)用戶(hù)以合作共享。非授權(quán)用戶(hù)要將自己的能量分成兩部分,其中一部分用于提高授權(quán)用戶(hù)功率,提高授權(quán)用戶(hù)的增益、以減輕非授權(quán)用戶(hù)傳輸引起的干擾,這樣才能換來(lái)授權(quán)用戶(hù)頻譜的使用權(quán),用于非授權(quán)用戶(hù)自身的數(shù)據(jù)。
在分層模型中,允許授權(quán)用戶(hù)和非授權(quán)用戶(hù)共存,因此網(wǎng)絡(luò)也被稱(chēng)為頻譜共享網(wǎng)絡(luò)[22],且授權(quán)用戶(hù)比非授權(quán)用戶(hù)在頻譜分配上具有更高的優(yōu)先級(jí),非授權(quán)用戶(hù)必須在授權(quán)用戶(hù)預(yù)定義的干擾約束(即預(yù)定義的干擾閾值)下才能共享。本文基于分層模型進(jìn)行對(duì)需要無(wú)線供電的無(wú)源SUs傳感器(對(duì)于有源SUs,可認(rèn)為其能量收集的時(shí)隙為零)進(jìn)行頻譜感知的優(yōu)化和實(shí)驗(yàn)驗(yàn)證。
設(shè)定可利用的頻譜總時(shí)長(zhǎng)一定,SU 采集、消耗能量三個(gè)過(guò)程——能量采集、頻譜感知、數(shù)據(jù)傳遞均以時(shí)隙的長(zhǎng)短來(lái)衡量。這三個(gè)操作共享整個(gè)時(shí)隙和能量消耗,顯然三者之間存在相互制約的折中關(guān)系:能量采集的越多,傳輸速率越高;感知更多的可用信道,就意味著占用更多的時(shí)間和能量;而能量采集和頻譜感知又?jǐn)D占真正用來(lái)數(shù)據(jù)通信的時(shí)間,從而降低SU總的有效通信能力(吞吐量)。
考慮到能量收集的能量雙工約束的“save?then?transmit”協(xié)議[23]和頻譜感知的實(shí)際硬件限制中的“l(fā)isten?before?talk”協(xié)議[10],設(shè)定次級(jí)用戶(hù)采用“能量采集‐頻譜感知‐數(shù)據(jù)傳輸(Harvesting?Sens‐ing?Transmitting,H?S?T)”結(jié)構(gòu),SUs 每一次感知一個(gè)信道,判斷其可用性并計(jì)算覺(jué)得是否繼續(xù)感知新的信道[10]。如圖1 所示,感知共享過(guò)程以三個(gè)非重疊的時(shí)隙模式運(yùn)行,時(shí)隙分別用于能量收集,頻譜感知和數(shù)據(jù)傳輸。這里只關(guān)注SUs 的期望鏈路頻譜效率而不是瞬時(shí)鏈路頻譜效率,因此設(shè)定SUs 的能量采集均值保持不變。本文主要符號(hào)見(jiàn)表1。
圖1 能量采集?頻譜感知?數(shù)據(jù)傳輸?shù)臅r(shí)隙結(jié)構(gòu)圖
表1 頻譜共享優(yōu)化模型中主要符號(hào)縮寫(xiě)
H?S?T頻譜共享結(jié)構(gòu)的三個(gè)階段為:
(1)能量采集:在(0,ρT]時(shí)間段,SUs 從電磁環(huán)境中收集并儲(chǔ)備能量;
(2)頻譜感知:在(ρT,ρT+nTs]時(shí)間段,停止能量采集,開(kāi)始對(duì)各信道進(jìn)行感知與計(jì)算(圖1 中,其中前3個(gè)信道可用,最后1個(gè)不可用)。
(3)數(shù)據(jù)傳輸:在(ρT+nTs,T]時(shí)間段,停止感知計(jì)算,啟用存儲(chǔ)設(shè)備中的能量進(jìn)行數(shù)據(jù)傳輸。
H?S?T 策略采用時(shí)間順序逐個(gè)感知信道,SU 先感知一個(gè)授權(quán)信道,判斷其是否可用,然后判斷是否停止感知僅使用當(dāng)前獲得的信道進(jìn)行數(shù)據(jù)傳輸,還是根據(jù)剩余的時(shí)間和能量是否仍有機(jī)會(huì)進(jìn)一步改善總的信道能力而繼續(xù)感知新的信道。如果感知一個(gè)或多個(gè)信道(即使獲得了更多的可用信道)也無(wú)法改善由于頻譜感知產(chǎn)生的時(shí)間和能量代價(jià),即無(wú)法提高鏈路頻譜效率,則終止感知工作。圖1 中表達(dá)了SU 在感知四個(gè)授權(quán)信道之后決定終止頻譜感知,并利用三個(gè)可用信道進(jìn)行數(shù)據(jù)傳輸。
基于以上H?S?T 策略,給定每次感知共享過(guò)程的能量采集的時(shí)隙占比ρ,SUs 逐個(gè)感知授權(quán)信道并基于先前的感知結(jié)果決定是否終止。于是,SU 的頻譜感知決策問(wèn)題即可轉(zhuǎn)化為個(gè)別參數(shù)確定條件下整體優(yōu)化的最佳終止問(wèn)題(Parametrized Optimal Stopping Problem,POSP)。如圖2 所示,SU 的頻譜感知規(guī)則可以通過(guò)二叉樹(shù)直觀地表示。
圖2中每個(gè)節(jié)點(diǎn)的左分支子節(jié)點(diǎn)表示獲得可用信道(概率為P),右分支表示不可獲得信道(概率為1?P)。紅色表示終止繼續(xù)感知。節(jié)點(diǎn)上的數(shù)字表示在每次感知之后可用信道的總數(shù)量,每條路徑的深度表示已感知的信道數(shù)量。在每個(gè)感知步驟中獲得可用信道的概率用數(shù)學(xué)語(yǔ)言表達(dá)為P=p(1?Pf)。頻譜感知規(guī)則如同圖2的樹(shù)形結(jié)構(gòu),從根節(jié)點(diǎn)開(kāi)始,基于每個(gè)感知步驟處的感知結(jié)果沿著相應(yīng)路徑前進(jìn)。如果檢測(cè)到可用信道,則將左子節(jié)點(diǎn)作為下一節(jié)點(diǎn)(leaf nodes),如果沒(méi)有檢測(cè)到可用信道,則取右側(cè),最終在不能進(jìn)一步增強(qiáng)SU 的鏈路頻譜效率的紅色節(jié)點(diǎn)結(jié)束,而初始狀態(tài)表示沒(méi)有進(jìn)行感知且未獲得可用信道。因此,規(guī)則樹(shù)中的每一條路徑對(duì)應(yīng)于的頻譜感知所有過(guò)程S 中的一種可能情況(感知觀測(cè)序列)。例如,圖1 中所示的頻譜感知過(guò)程對(duì)應(yīng)于圖2 中左起第二路徑。
圖2 基于二叉樹(shù)的頻譜感知規(guī)則可視化
可以得到,SU 在當(dāng)前時(shí)隙中可獲得的數(shù)據(jù)吞吐量期望值與頻譜感知遵循規(guī)則樹(shù)的路徑t的相關(guān)函數(shù)為:
由于SU 的頻譜感知過(guò)程(即,頻譜感知規(guī)則樹(shù)中不止一條可能的路徑)Dt、At存在于多種可能情況,所以R(ρ,U)顯然是隨機(jī)值。因?yàn)樾诺涝肼曉鲆鎟在一個(gè)時(shí)隙內(nèi)保持不變,可被視為能量收集環(huán)節(jié)中的固定損耗,令“r=1”,X就代表了接收端的等效能量采集功率。將α定義為頻譜感知一個(gè)信道的歸一化時(shí)間,β定義為歸一化能耗,SU 基于離散路徑的數(shù)據(jù)總吞吐量的期望值就可表示為:
其中0<α=Ts/T<1,0<β=Es/XT<1。注意,在規(guī)則U中的每個(gè)感知步驟均受限于時(shí)間和能量,即,僅當(dāng)剩余時(shí)間和能量足夠時(shí),感知一個(gè)或多個(gè)信道的規(guī)則才是可行有效的。
由于在頻譜共享過(guò)程中,公式(1)中能量采集的時(shí)隙占比ρ 也是要優(yōu)化的變量,而每個(gè)時(shí)隙占比ρ唯一地確定了一種最佳的頻譜感知規(guī)則U=U(ρ),所以求解公式(2)的POSP問(wèn)題就更具挑戰(zhàn)性,其可以分解為感知策略和算法優(yōu)化兩個(gè)子問(wèn)題:I)給定ρ 的條件下尋求最優(yōu)頻譜感知規(guī)則;II)基于子問(wèn)題I的解,通過(guò)優(yōu)化ρ來(lái)求解公式(2)。
如前所述,總時(shí)長(zhǎng)T一定的條件下,一旦能量采集時(shí)隙占比ρ確定,頻譜感知的最優(yōu)策略即可轉(zhuǎn)述為一種有限時(shí)間段的POSP問(wèn)題。其目的尋找這樣的最佳頻譜感知規(guī)則:SUs 在當(dāng)前感知到的可用的信道(定義為“已觀測(cè)信道”)能夠?qū)崿F(xiàn)的最大的期望信道數(shù)據(jù)吞吐量(定義為“信道回饋”)。
開(kāi)始按規(guī)則樹(shù)感知找到的具有最大的。頻譜感知規(guī)則由兩個(gè)要素決定:
(1)已觀測(cè)信道狀態(tài)的序列,由Z1,Z2,...表示,它們服從伯努利分布,且與概率P互不相關(guān);
(2)一系列信道回饋函數(shù)給定當(dāng)前觀測(cè)到的可用信道,即由R0,R1(z1),R2(z1,z2),......,R∞(z1,z2,...)表示的SU數(shù)據(jù)吞吐量的期望值。這里zi∈{0,1}(i∈{1,2,...}),i為序號(hào),zi=0 表示信道空閑可用,zi=1 表示信道繁忙已被占用。信道回饋Rn(z1,...,zn)可以表示為:
其中,an=表示在已觀測(cè)信道z1,...,zn中獲得的可用信道。此時(shí),頻譜感知規(guī)則優(yōu)化問(wèn)題就可描述為:在感知到n個(gè)信道并觀測(cè)Z1=z1,Z2=z2,...,Zn=zn之后,SU 決定是終止感知并獲得已知的信道回饋Rn(z1,...,zn),還是繼續(xù)感知下一個(gè)信道并觀測(cè)Zn+1。特別地,如果沒(méi)有感知信道(i=0)并且也不再進(jìn)行信道觀測(cè),則接收常數(shù)R0=0;由于事實(shí)上頻譜感知規(guī)則是有界的,如公式(3)所示,永不終止的頻譜感知是不存在的,可被感知的信道數(shù)量的上限Nu=取決于時(shí)間和能量約束以及CR 系統(tǒng)中的有限信道數(shù)。通過(guò)反向歸納來(lái)分析,由于SU必須在Nu終止感知(在感知Nu信道之后),就要求先在Nu?1時(shí)就找到最佳頻譜感知規(guī)則。已知Nu?1時(shí)的頻譜感知規(guī)則,回推階段Nu?2,以此類(lèi)推,直到回到起始原點(diǎn)。
既然最初即知感知數(shù)量最多是Nu,則從最初階段i=0 到i=Nu共Nu個(gè)信道全部期望的數(shù)據(jù)總吞吐量就為:
由Nu直到遞推到初始階段0,0 由于各信道相互獨(dú)立,且服從相同的伯努利分布,因此得到 通過(guò)遞歸求解公式(5)在給定ρ條件下的最優(yōu)化后的頻譜感知規(guī)則U*(ρ),依據(jù)圖2 感知規(guī)則,SU 的期望數(shù)據(jù)吞吐量表示為 其中S*(ρ)是在優(yōu)化后的感知規(guī)則U*(ρ)中,從的根節(jié)點(diǎn)到子葉節(jié)點(diǎn)的路徑集合,而是指U*(ρ)中路徑t 的路徑深度和最優(yōu)可用信道數(shù)量。 在給定ρ條件下確定了最佳頻譜感知規(guī)則U*(ρ)之后,再將最佳感知規(guī)則U*(ρ)帶入等式(2)對(duì)ρ 進(jìn)行優(yōu)化,將獲得的ρ和U*(ρ)代入等式(7): 將公式(7)中(ρ,U*(ρ))進(jìn)行描點(diǎn)繪圖,得到的曲線通常不是凸函數(shù)[24],因此公式(8)中的最大值不能直接用凸函數(shù)的求最大值方法。(ρ,U*(ρ))的曲線主要有圖3 中的四種,其中只有圖3(a)中的(ρ,U*(ρ))曲線為整體凸形,說(shuō)明很小的時(shí)間代價(jià)與能量代價(jià)(0<α<0.01,0<β<0.01)即可滿(mǎn)足一次頻譜感知時(shí),信道數(shù)據(jù)吞吐量的期望值對(duì)于能量采集時(shí)間比這個(gè)變量的函數(shù)是凸的。隨著頻譜感知的時(shí)間代價(jià)α與能量代價(jià)β 的增加,盡管不能確定信道數(shù)據(jù)吞吐量的期望值(ρ,U*(ρ))是否為凸形,但可以將其視為分段的凸形曲線,如圖3(b) (c) (d)所示,每個(gè)段凸形曲線就是一個(gè)規(guī)則不變區(qū)間,規(guī)則不變區(qū)間就是每個(gè)保證凸函數(shù)的能量采集時(shí)間比的范圍。對(duì)比每個(gè)規(guī)則不變區(qū)間的最優(yōu)值,即可獲得全局的最優(yōu)值。如圖3 (c)中的全局最優(yōu)期望有效吞吐量及存在于0.36<ρ<0.41 的區(qū)間內(nèi)。過(guò)?。?<ρ<0.1)或過(guò)大(0.9<ρ<1)的能量采集時(shí)隙都會(huì)由于過(guò)于有限的采集能量或傳輸時(shí)間使得期望有效吞吐量接近于零,不可能為最優(yōu)也就無(wú)需詳細(xì)討論,所以,圖3 僅展示了能量采集時(shí)隙占從0.1 到0.9 的情況。 圖3 不同時(shí)間和能量成本的Rˉ(ρ,U*(ρ))曲線 (ρ,U*(ρ))的分段凸形源于在ρ的一定區(qū)間內(nèi)U*(ρ)保持不變,而S*(ρ),三者與相關(guān)也為U*(ρ)常數(shù),卻與ρ不直接相關(guān),這些ρ的區(qū)間也因此稱(chēng)為“規(guī)則不變區(qū)間”。在規(guī)則不變區(qū)間中,得到期望鏈路頻譜效率為: 因?yàn)橄禂?shù)為正的對(duì)數(shù)函數(shù)為單調(diào)遞增凸函數(shù),且分段變化的概率函數(shù)為正值,因此等式(9)在其遞增范圍內(nèi)是凸形曲線。 所以,U*(ρ)是分段變化的,(ρ,U*(ρ))是分段凸形的。特別地,如圖3 (a),如果每次頻譜感知時(shí)間足夠短、能耗足夠低,這就表示能夠感知所有N個(gè)授權(quán)信道,剩余的時(shí)間和能量可全部用于數(shù)據(jù)傳輸,則U*(ρ)始終保持不變,因此對(duì)于任何ρ,(ρ,U*(ρ))是嚴(yán)格凸的。圖3(c)中的一些規(guī)則不變區(qū)間數(shù)據(jù)傳輸速率卻極低,這是因?yàn)楦鶕?jù)最佳頻譜感知規(guī)則,為了感知盡量多的信道,使得留給SU 用于數(shù)據(jù)傳輸?shù)哪芰炕驎r(shí)間很少[22]。 因此,本文提出了分段局部最優(yōu)比較算法(Piece‐wise Local Optimium Comparision,PLOC)來(lái)尋找全局最優(yōu)。該P(yáng)LOC 算法用二分法枚舉所有規(guī)則不變的區(qū)間,先精確定位每個(gè)規(guī)則不變區(qū)間的起始點(diǎn)和終點(diǎn),遍歷求得每個(gè)區(qū)間的局部最優(yōu)值,由于(ρ,U*(ρ))是凸形的,通過(guò)求導(dǎo)可以得出每個(gè)區(qū)間中的局部最優(yōu)值。然后通過(guò)比較所有局部最優(yōu)值來(lái)選擇最佳值來(lái)確定全局最優(yōu)值,再返回來(lái)確定全局最優(yōu)能量采集時(shí)隙占比ρ。 為評(píng)估該P(yáng)LOC 算法的復(fù)雜度,本文通過(guò)一個(gè)具有10個(gè)授權(quán)信道的CR 系統(tǒng),并選擇解決凸形問(wèn)題的典型算法——模擬退火算法(Simulated Anneal‐ing Algorithm,SAA)作為算法優(yōu)化的參照。模擬退火算法來(lái)源于固體退火降溫原理,最早的思想是由N.Metropolis 等人于1953年提出[25]。在熱力學(xué)中,物體的溫度愈低,其分子熱能愈少。物體緩慢的降溫過(guò)程叫退火,直到其內(nèi)能最低的結(jié)晶狀態(tài)。將處于非晶體狀態(tài)的固體加至充分高溫,再進(jìn)行退火,直至晶體狀態(tài),系統(tǒng)達(dá)到最穩(wěn)定狀態(tài),這樣就找到了分子穩(wěn)定的“最優(yōu)解”。設(shè)E為物體在溫度T時(shí)的分子內(nèi)能,ΔE為溫度T時(shí)物體的內(nèi)能改變量,k為玻爾茲曼常數(shù),則根據(jù)Metropolis 準(zhǔn)則,物體在溫度為T(mén)時(shí),出現(xiàn)減小ΔE的內(nèi)能時(shí)以趨于降溫平衡的概率為exp(-ΔE/(kT))[26]。如果這個(gè)高溫至晶體的過(guò)程存在全局的最優(yōu)解,則尋求的分子穩(wěn)定即為分子的最穩(wěn)定的解。1983年,S.Kirkpatrick 等人基于Monte?Carlo 迭代求解策略成功地將固體退火思想引入到組合優(yōu)化領(lǐng)域形成了具有時(shí)變概率的全局優(yōu)化的串行結(jié)構(gòu)優(yōu)化算法SAA[26]。SAA 從某一高溫狀態(tài)開(kāi)始退火,尋求最優(yōu)解,但此時(shí)最優(yōu)解有可能是局部最優(yōu)解,因此SAA 算法通過(guò)概率性地跳出局部區(qū)間,并最終遍歷全局,尋找到全局最優(yōu)解[27]。借用固體退火思想,將物體內(nèi)能E模擬為目標(biāo)函數(shù)值f,物體溫度T演化成控制參數(shù)t,由初始解和控制參數(shù)t開(kāi)始,依概率在不同區(qū)間進(jìn)行跳轉(zhuǎn),對(duì)當(dāng)前解重復(fù)優(yōu)化迭代,算法終止時(shí)即逼近全局最優(yōu)解[26]。 通過(guò)運(yùn)行在HP Z210 工作站上的MATLAB 2010a進(jìn)行50次仿真測(cè)試,無(wú)論效率如何,兩種算法都能確保它們收斂到全局最優(yōu)性。兩種算法的平均運(yùn)行時(shí)間如圖4 所示,PLOC 算法比SAA 算法快很多。這是因?yàn)镾AA 算法只是一味地搜索全局最優(yōu),而PLOC 算法利用Rˉ(ρ,U*(ρ))的分段凸形將原始問(wèn)題分解為有限數(shù)量的分段凸形子問(wèn)題,這些子問(wèn)題可以通過(guò)連續(xù)求導(dǎo)而快速收斂。此外,頻譜感知的時(shí)間和能量代價(jià)ρ越高,頻譜感知規(guī)則樹(shù)的深度越小,兩種算法遍歷整個(gè)規(guī)則樹(shù)的速度越快。 圖4 PLOC和SAA的復(fù)雜性比較(秒級(jí)) 基于搜索的PLOC 算法雖然可推導(dǎo)出全局最優(yōu)能量采集時(shí)隙占比和頻譜感知規(guī)則,然而,由于計(jì)算相對(duì)復(fù)雜,特別是在頻譜感知的短時(shí)間和低能耗的情況下,將大大擴(kuò)展頻譜感知規(guī)則樹(shù),并會(huì)在該問(wèn)題在付出較高的計(jì)算代價(jià)。為了進(jìn)一步降低復(fù)雜性,通過(guò)將原始動(dòng)態(tài)問(wèn)題近似為靜態(tài)問(wèn)題,本文提出了一種可以一次性求的次優(yōu)解決方案,從而避開(kāi)基于搜索原理的PLOC算法。 如前所述,SU 的頻譜感知規(guī)則可以通過(guò)二叉樹(shù)直觀地表示。為統(tǒng)一數(shù)學(xué)建模,將路徑深度Dt為隨機(jī)數(shù)的二進(jìn)制規(guī)則樹(shù)替換為各路徑皆完整的二進(jìn)制規(guī)則樹(shù):對(duì)頻譜感知規(guī)則施加額外約束,規(guī)定規(guī)則樹(shù)是完整二進(jìn)制規(guī)則樹(shù),其中每個(gè)路徑具有一致的深度。于是,由SU 感知固定數(shù)量的信道,從中選擇可用的信道用于數(shù)據(jù)傳輸,因此頻譜感知規(guī)則就簡(jiǎn)化為如何確定最優(yōu)的感知信道數(shù)量。因此,公式(2)變?yōu)殪o態(tài)問(wèn)題,其目的僅在于選擇適當(dāng)?shù)哪芰坎杉瘉?lái)感知信道的數(shù)量。對(duì)于這樣的二進(jìn)制完整規(guī)則樹(shù),SU 的頻譜效率由下式給出: 其中D指的是要被感知的信道的數(shù)量(即,完整規(guī)則樹(shù)的統(tǒng)一深度)和A是可用信道數(shù)。由于每個(gè)授權(quán)信道的狀態(tài)為伯努利分布式隨機(jī)變量P[28],于是A變?yōu)槠谕麨镈P的二項(xiàng)分布隨機(jī)變量。因此,二進(jìn)制完整規(guī)則樹(shù)問(wèn)題可以表述為雙變量靜態(tài)優(yōu)化問(wèn)題,由下式給出: 式中ρ-Dβ≥0,1-ρ-Dα≥0,0 ≤ρ≤1,D∈{0,1,...N} 如前所述方程式(2)由于設(shè)定場(chǎng)景下獲得可用信道的概率P是常數(shù),故刪除。約束ρ-Dβ≥0,1-ρ-Dα≥0,0 ≤ρ≤1 旨在保證信道感知消耗的能量不應(yīng)超過(guò)所有收獲的能量(能量約束),ρ-Dβ≥0,1-ρ-Dα≥0,0 ≤ρ≤1 是要保證所需時(shí)間應(yīng)小于能量收集后的剩余時(shí)間(時(shí)間約束)。由此可得出0 ≤D≤1/(α+β)。 由于包含取整變量、離散變量以及連續(xù)變量,因此等式(11)屬于非常具有挑戰(zhàn)性的混合整數(shù)化非線性規(guī)劃(Mixed?Integer Non?Linear Programming,MIN‐LP)問(wèn)題。首先,可以判斷(11)是一個(gè)凸問(wèn)題,可通過(guò)求 解Karush?Kuhn?Tucker(KKT)最優(yōu)條件的方程組[24]得出全局最優(yōu)能量采集時(shí)隙占比ρ和要感知的信道數(shù)D。這里,因?yàn)閷?dǎo)出的最佳信道數(shù)不一定是整數(shù),通過(guò)求解KKT 方程組給出的全局最優(yōu)解不一定適用。所以,要將導(dǎo)出的最優(yōu)D取整,進(jìn)一步導(dǎo)出適用的最優(yōu)節(jié)省比ρ。 當(dāng)D≥0時(shí),方程(11)的KKT 最優(yōu)條件由下式給出: 其中λi(i∈{ 1,2,3,4,5})為對(duì)偶變量。顯然,由于D=0,ρ=0,ρ=1,ρ-Dβ=0和1-ρ-Dα=0將導(dǎo)致期望鏈路頻譜效率為零,這不可能是最佳方案。所以取消諸如λi=0,i∈{1,2,3,4,5}這些榮譽(yù)的補(bǔ)充條件和對(duì)偶變量,通過(guò)簡(jiǎn)單地求解以下方程系統(tǒng)即可推導(dǎo)出(12)的全局最優(yōu)解: 全局最優(yōu)解的(ρ**,D**)可表達(dá)為: 其中W(·)為L(zhǎng)ambert W函數(shù)。 如前面所討論,被感知信道的全局最優(yōu)數(shù)目不一定是整數(shù)。因此,將n**取整到它兩個(gè)臨近的整數(shù)上,并分別推導(dǎo)出兩個(gè)相應(yīng)的最優(yōu)能量采集時(shí)隙占比,然后在兩者中選擇最佳解作為原公式(2)問(wèn)題的可行最佳解。在上述分析的基礎(chǔ)上,圖5 詳細(xì)描述了確定可行的最佳能量采集時(shí)隙占比和感知信道數(shù)目的過(guò)程。其中,Dh為取整時(shí)較大的整數(shù),Dl為取整時(shí)較小的整數(shù),最優(yōu)值與取整后的最優(yōu)值之間的差值定義為δ=D**?Dl=1?(Dh?D**)。概括地說(shuō),對(duì)于一個(gè)實(shí)際的CR 系統(tǒng),其授權(quán)信道的數(shù)量有限(如以前規(guī)定的N個(gè)授權(quán)信道),適用的最佳感知信道數(shù)量為min(D*,N)由于公式(7)中的目標(biāo)函數(shù)的一致性,由公式(14)進(jìn)一步可以得到適用的最優(yōu)能量采集時(shí)隙占比ρ**。 圖5 計(jì)算次優(yōu)能量采集時(shí)隙占比和感知信道總數(shù)目的流程圖 對(duì)于能量采集功率、頻譜感知時(shí)間和能源代價(jià)幾個(gè)參數(shù)變化時(shí),最優(yōu)能量采集時(shí)隙占比和頻譜傳感規(guī)則對(duì)應(yīng)的最優(yōu)解和次最優(yōu)解,本節(jié)用數(shù)值方法進(jìn)行研究。設(shè)每個(gè)許可信道擁有1MHz 的帶寬,鏈路頻譜效率單位為bit/s/MHz。 對(duì)于最初公式(2)中隨機(jī)的二叉規(guī)則樹(shù)問(wèn)題,使用最優(yōu)預(yù)期的感知信道數(shù)目(即預(yù)期最佳規(guī)則樹(shù)的深度)來(lái)評(píng)估頻譜感知規(guī)則,由下式給出: 圖6 和圖7分別給出了最佳能量采集時(shí)隙占比ρ*及期望感知信道數(shù)Nˉ隨不同的信道感知時(shí)間α和能量代價(jià)β(X=10 和P=0.5),可以看出,兩圖中都普遍存在時(shí)間或能量代價(jià)略有變化對(duì)最佳能量采集時(shí)隙占比或最佳頻譜感知規(guī)則沒(méi)有顯著影響的區(qū)域[24],如同中虛線內(nèi)矩形區(qū)域。 圖6 最優(yōu)能量采集時(shí)隙占比與時(shí)間和能耗代價(jià)的關(guān)系 圖7 最佳預(yù)期感知信道數(shù)量和時(shí)間和能耗代價(jià)的關(guān)系 圖8 和圖9 顯示了不同的能量采集功率下可感知最佳能量采集時(shí)隙占比和預(yù)期信道數(shù)(T=1,P=0.5),能量采集功率越大,能量采集所用時(shí)間越少,則留給頻譜感知和數(shù)據(jù)傳輸?shù)臅r(shí)間更多。以與此同時(shí),隨著能量采集功率的提升,最佳頻譜感知規(guī)則樹(shù)的路徑深度越深,這就意味著每次都有足夠的能力感知更多的信道。 圖8 最佳能量采集時(shí)隙占比與能量采集功率 圖9 期望最佳感知信道數(shù)目與能量采集功率 對(duì)于改變后的各路徑補(bǔ)充完整的二進(jìn)制規(guī)則樹(shù),如圖10和圖11(X=10)所示,不同時(shí)間和能量代價(jià)下的次優(yōu)能量采集時(shí)隙占比和感知信道總數(shù)。圖中看出,為獲得克服頻譜感知的更高時(shí)間成本并提高期望鏈路頻譜效率,需要先獲得足夠的能量,隨著能耗的增加,SUs的更佳策略就要用更高的時(shí)間占比來(lái)收集能源。而隨著時(shí)間成本的增加,又傾向于用較短的時(shí)間收集能量,以確保有足夠的時(shí)間進(jìn)行頻譜感知和數(shù)據(jù)傳輸。同時(shí),頻譜感知的時(shí)間和能量成本越高,可被感知的信道也越少,而足夠的時(shí)間才能保證正常的數(shù)據(jù)傳輸,以提高鏈路頻譜效率。對(duì)于一個(gè)有限N個(gè)授權(quán)信道的實(shí)際CR系統(tǒng),要感知的信道的最優(yōu)數(shù)的上界是Nu,根據(jù)公式(14),次優(yōu)的能量采集時(shí)隙占比也有上限。 圖10 次優(yōu)能量采集時(shí)隙占比與時(shí)間和能耗的關(guān)系 圖11 次優(yōu)信道感知數(shù)量與N時(shí)間和能耗的關(guān)系 圖12 和圖13分別顯示了不同能量采集功率下的次優(yōu)能量采集時(shí)隙占比和次優(yōu)信道感知總數(shù)(T=1,Ts=0.02,Es=1),能量采集功率越大,能量采集所需的時(shí)間越少(包括全局最優(yōu)方案和次優(yōu)解決方案),這樣就有更多的時(shí)間用于頻譜傳感和數(shù)據(jù)傳輸。同時(shí),隨著能源采集率的增加,也能感知更多的可用信道(包括全局最優(yōu)方案和次優(yōu)解決方案)。由于將全局最優(yōu)信道數(shù)取整運(yùn)算,圖12 和圖13 中最佳能量采集時(shí)隙占比和能量代價(jià)及能量采集功率曲線呈“之字形”。其中虛線描述了一種全局次優(yōu)解決方案的收斂趨勢(shì),隨著能量采集功率的增長(zhǎng),局部的次優(yōu)儲(chǔ)能方案收斂于全局次優(yōu)方案(如圖10所示)。在這個(gè)意義上,從系統(tǒng)設(shè)計(jì)的角度來(lái)看,全局次優(yōu)能量采集時(shí)隙占比方案適用于具有高效能量采集的CR系統(tǒng)。 圖12 次優(yōu)能量采集時(shí)隙占比和能量采集功率對(duì)比 圖13 次優(yōu)信道感知總數(shù)與能量采集功率的關(guān)系 本節(jié)根據(jù)公式(14)和仿真平均鏈路頻譜效率先研究PLOC 和次優(yōu)解決方案的性能,然后將次優(yōu)解決方案與一個(gè)將能量采集時(shí)隙占比與頻譜感知規(guī)則分開(kāi)優(yōu)化的基本方案進(jìn)行比較。構(gòu)建一個(gè)具有10個(gè)授權(quán)信道的CR 系統(tǒng),通過(guò)生成隨機(jī)獲得可用信道的不同概率P的10個(gè)授權(quán)信道的各100個(gè)狀態(tài)樣本,每個(gè)時(shí)隙中將能量采集功率隨每個(gè)狀態(tài)樣本隨機(jī)變化,其服從δ?分布。 如圖14 所示,分別用最優(yōu)和次優(yōu)解決方案評(píng)估理論上的期望能量采集功率,通過(guò)方程式(2)和(11)中的公式計(jì)算最優(yōu)和次優(yōu)解的理論期望能量采集功率(E[X]=10),可以看出,隨著感知時(shí)間和能量成本的增加,最優(yōu)解決方案略微優(yōu)于次優(yōu)解決方案,數(shù)據(jù)吞吐量的相對(duì)性能卻隨著獲得可用信道的概率增加而縮小。這種對(duì)比變化原因在于,雖然最優(yōu)和次優(yōu)解都收斂到逐一檢測(cè)所有授權(quán)信道的方案,但獲得可用信道的概率信息與最優(yōu)解有關(guān),而與次優(yōu)解無(wú)關(guān)。這可以通過(guò)比較圖6 和圖7 來(lái)印證,而圖10 和11 顯示了次優(yōu)解決方案往往具有較低的能量采集時(shí)隙占比和較高的期望感知信道總數(shù)。類(lèi)似地,圖8 和圖9 顯示了次優(yōu)方案雖然獲得的能量較少卻能夠?qū)⒋蟛糠帜芎挠糜谛诺栏兄?,在概率上SUs 能夠獲得更多的可用信道,使得次優(yōu)方案的吞吐量接近最優(yōu)方案。 圖14 理論上可達(dá)到的吞吐量與授權(quán)信道的空閑概率 這意味著,在選擇兩個(gè)解決方案時(shí)應(yīng)該在性能和計(jì)算復(fù)雜性之間進(jìn)行權(quán)衡:對(duì)于一個(gè)具有較強(qiáng)計(jì)算能力的面向性能的CR系統(tǒng),最優(yōu)方案更可??;對(duì)于計(jì)算能力較低(如認(rèn)知無(wú)線傳感器網(wǎng)絡(luò))的能量受限的CR系統(tǒng),低復(fù)雜度的次優(yōu)解決方案更加適用。 對(duì)最優(yōu)與次優(yōu)解再進(jìn)行1000個(gè)感知共享的狀態(tài)樣本進(jìn)行仿真分析,平均可實(shí)現(xiàn)吞吐量的結(jié)果與圖15中的理論結(jié)果基本一致,即二者效果相當(dāng)。 圖15 在200個(gè)時(shí)隙內(nèi),通信速率監(jiān)測(cè)和解耦的優(yōu)化方案 將次優(yōu)解決方案與具有200個(gè)仿真時(shí)隙的最優(yōu)解決方案進(jìn)行比較,其中能量采集和頻譜感知的優(yōu)化彼此獨(dú)立,首先根據(jù)[29]中的分析結(jié)果優(yōu)化能量采集時(shí)隙占比,然后通過(guò)[10]中的最優(yōu)停止解決方案優(yōu)化剩余時(shí)間段的頻譜感知規(guī)則。使用次優(yōu)解決方案和解耦優(yōu)化解決方案在整個(gè)200個(gè)時(shí)隙上實(shí)現(xiàn)的信道數(shù)據(jù)傳輸總量的仿真結(jié)果如圖15所示(α=0.03,β=0.03和E[X]=10)。 可見(jiàn),對(duì)于60%以上的感知共享過(guò)程,次優(yōu)解決方案優(yōu)于解耦優(yōu)化解決方案,有近40%次優(yōu)解決方案的吞吐量低于解耦優(yōu)化解決方案,但整體上次優(yōu)方案的均值更高。這是因?yàn)楣剑?1)的目標(biāo)是最大化SUs的期望鏈路頻譜效率(在一個(gè)時(shí)間段內(nèi)的平均值),而不是每次均優(yōu)于解耦最優(yōu)方案。 圖16顯示了具有不同能量采集功率E[X]的兩種解決方案的平均鏈路頻譜吞吐量(其他系統(tǒng)參數(shù)保持不變),顯然,能量采集功率E[X]越大,平均鏈路頻譜吞吐量越高。兩種解決方案都可以更好地利用所收集的能量,相對(duì)于能量采集功率均近似于的平均鏈路能量采集功率。更重要的是,替代的標(biāo)準(zhǔn)二叉樹(shù)規(guī)則樹(shù)解決方案總體上優(yōu)于所有將能量采集功率參數(shù)設(shè)置獨(dú)立的優(yōu)化解決方案,這表明能量收集和頻譜感知的聯(lián)合優(yōu)化方案實(shí)現(xiàn)了比解耦獨(dú)立優(yōu)化更好的性能。 圖16 不同能量采集功率的次優(yōu)和解耦優(yōu)化解決方案的均方值 為了更加合理利用授權(quán)頻帶空閑時(shí)間的頻譜資源,本文利用認(rèn)知無(wú)線電的頻譜感知等關(guān)鍵技術(shù)對(duì)無(wú)線信道進(jìn)行基于能效的收集和監(jiān)測(cè),給出優(yōu)化頻譜子信道分配和功率分配的策略和方案,從而在保障主用戶(hù)PUs 服務(wù)質(zhì)量的基礎(chǔ)上借用給次級(jí)用戶(hù)SUs 以提升頻譜利用效率。首先,構(gòu)建了基于時(shí)隙和能量的頻譜分配模型,將期望通信速率的優(yōu)化問(wèn)題轉(zhuǎn)化為POSP 問(wèn)題。由于無(wú)線信道占用的時(shí)變性以及主用戶(hù)活動(dòng)規(guī)律的隨機(jī)性,本文利用頻譜感知以及信令交互過(guò)程中的能量效率可用間接反映系統(tǒng)頻譜效率特點(diǎn),提出了基于能量采集功率最優(yōu)的自適應(yīng)動(dòng)態(tài)優(yōu)比方法。為了提升計(jì)算效率、節(jié)省計(jì)算能耗、減少計(jì)算復(fù)雜度,利用上一次感知優(yōu)化的結(jié)果作為下一次感知的規(guī)則樹(shù),形成了基于靜態(tài)公式化的方案來(lái)對(duì)信道共享進(jìn)行預(yù)期規(guī)劃,推導(dǎo)出了最優(yōu)采集能量與感知計(jì)算消耗能量的平衡規(guī)則和可用信道的動(dòng)態(tài)調(diào)整規(guī)則,得到了更高效的頻譜資源分配算法和最佳的能量管理策略。與在各區(qū)間跳轉(zhuǎn)以避免陷入局部區(qū)間并最終趨于全局最優(yōu)解的SAA算法相比,該算法在接近動(dòng)態(tài)全局最優(yōu)算法效果的同時(shí)降低了計(jì)算周期、減小了對(duì)信道的占用時(shí)間,減少了計(jì)算能耗。實(shí)驗(yàn)結(jié)果表明,該靜態(tài)次優(yōu)方案在性能接近自適應(yīng)計(jì)算的全局動(dòng)態(tài)最優(yōu)方案,特別是在獲得可用信道的概率較低、時(shí)隙小、計(jì)算能耗較高的苛刻條件下,簡(jiǎn)潔高效的靜態(tài)次優(yōu)方案明顯優(yōu)于全局動(dòng)態(tài)優(yōu)化的最優(yōu)方案。3.2 能量采集時(shí)隙占比優(yōu)化程度的評(píng)估
3.3 與退火算法的優(yōu)化能力對(duì)比
4 頻譜感知次優(yōu)方案
4.1 次優(yōu)問(wèn)題的數(shù)學(xué)建模
4.2 次優(yōu)方案的規(guī)則設(shè)計(jì)
4.3 混合后的次優(yōu)解決方案
5 最優(yōu)解與次優(yōu)解的仿真結(jié)果及分析
5.1 最優(yōu)解決方案
5.2 次優(yōu)解決方案
6 性能評(píng)估
6.1 最優(yōu)和次優(yōu)解決方案的性能比較
6.2 與參數(shù)解耦分別優(yōu)化的性能比較
7 小結(jié)
中國(guó)傳媒大學(xué)學(xué)報(bào)(自然科學(xué)版)2021年2期