呂鑫鑫 朱 琦
(南京郵電大學江蘇省無線通信重點實驗室,江蘇南京 210003)
為了提升無線頻譜的利用效率,認知無線電技術(shù)被廣泛使用于無線通信技術(shù)中。其中,認知無線電技術(shù)主要包括頻譜感知,頻譜管理和共享等多種技術(shù)[1]。頻譜感知是指某頻譜已被分配給某個用戶,但是該用戶在某些時間和位置并沒有使用該頻譜。為了讓一些未授權(quán)用戶可以使用特定區(qū)域該頻段頻譜以提升頻譜利用率,可以安排一些次用戶對這一區(qū)域的頻譜使用情況進行感知[2]。頻譜感知技術(shù)按感知人數(shù)的不同主要可以劃分為單用戶感知與協(xié)作頻譜感知。在移動通信中,無線信號存在大尺度衰落與多徑效應,所以單用戶感知并不是十分準確,所以需要多用戶協(xié)作感知。
為了使各個相互合作的次用戶的數(shù)據(jù)融合,文獻[3]提出了“與”融合、“或”融合、表決融合、最大后驗概率融合和貝葉斯融合五種準則,分別給出了這五種準則融合后檢測概率與虛警概率的表達式。為了提升協(xié)作感知精度,降低開銷,文獻[4]提出了一種通過可靠次用戶提交的數(shù)據(jù)來提升頻譜檢測性能的算法,只有次用戶檢測結(jié)果較為精確時,才能向次用戶基站提交自己的檢測結(jié)果,反之,次用戶不提交數(shù)據(jù)。為了獲得更優(yōu)的檢測概率,文獻[5]統(tǒng)計檢測信號的功率譜峰谷差,推導出感知門限和檢測概率的表達式。同時,在協(xié)作頻譜感知的研究中,博弈論的方法也被廣泛使用。文獻[6]提出了基于聯(lián)盟博弈的協(xié)作頻譜感知模型,模型算法用于解決形成最優(yōu)聯(lián)盟的大小與聯(lián)盟核心的動態(tài)選擇。模型也從次用戶匯報時間和能量的角度來控制次用戶的合作開銷,以提升感知性能。文獻[7]引入進化博弈方法,在噪聲不確定的情況下,次用戶可以選擇是否參與感知,通過迭代學習的方法來產(chǎn)生一個進化穩(wěn)定策略。
大多數(shù)協(xié)作頻譜感知的文獻的研究前提是次用戶無條件愿意進行頻譜感知,忽視了感知次用戶的招募和感知積極性。因此,本文將群智感知激勵機制引進了協(xié)作頻譜感知。
群智感知的激勵機制可以分為有報酬激勵與無報酬激勵兩種[8],無報酬激勵機制主要由娛樂激勵和社會榮譽激勵組成,適用范圍較窄。有報酬激勵機制主要采用的是博弈論方面的方法。文獻[9]最早將博弈論中的拍賣機制引入群智感知激勵機制的研究中,主要提出了基于反拍賣的動態(tài)虛擬積分參與機制。在此基礎(chǔ)上,文獻[10]使用貪婪算法來解決有預算的群智感知激勵機制的覆蓋范圍和數(shù)據(jù)質(zhì)量問題。文獻[11]采用斯塔科爾伯格博弈設計激勵算法,服務器作為領(lǐng)導者,次用戶作為跟隨者,其競爭策略是調(diào)整感知時間。服務器先公布總的報酬,次用戶通過調(diào)整感知時間來獲得最大效益。為了平衡用戶效益和平臺效益,文獻[12]采用了貝葉斯博弈,提出了一個在次用戶滿意的情況下,使次用戶補償最小化的參與等級決定和報酬分配機制。文獻[13]提出了基于跨空間多元交互的群智感知動態(tài)激勵模型CSII,利用跨空間數(shù)據(jù)分析并通過系統(tǒng)、任務發(fā)布者和次用戶三者之間的多元交互來激勵次用戶高質(zhì)量完成感知任務。為了提升感知數(shù)據(jù)的時效性,文獻[14]提出了時間相關(guān)的移動群智感知數(shù)據(jù)收集機制,在這個機制中每一個感知數(shù)據(jù)都含有一個時間標簽值,隨著時間的推移,數(shù)據(jù)質(zhì)量會下降。
大多數(shù)群智感知激勵機制的文獻并沒有考慮到多人感知多任務的場景,也沒有將群智感知的場景具體化到協(xié)作頻譜感知中去。群智感知激勵機制作為一種激勵感知次用戶的有效機制,恰好可以與協(xié)作頻譜感知相結(jié)合。本文首次將群智感知的激勵機制應用于協(xié)作頻譜感知中,提出了一種感知次用戶效用最優(yōu)的基于多任務群智感知的協(xié)作頻譜感知算法,先建立參與感知次用戶的效用函數(shù),通過計算感知次用戶的最優(yōu)采樣點數(shù)得出次用戶的最優(yōu)效用,通過貪婪算法在有限預算的來選取進行感知的次用戶,在次用戶感知完成后發(fā)放一定的報酬,以激發(fā)用戶的感知積極性。
本文內(nèi)容安排如下:第2部分是系統(tǒng)模型,第3部分介紹了次用戶效用最優(yōu)的多任務算法并對最優(yōu)效用的計算進行了推導,第4部分是本文算法的性能仿真與分析,最后是本文的結(jié)束語。
如圖1所示,系統(tǒng)的場景是一個半徑為4 km的圓形區(qū)域,圓形區(qū)域內(nèi)有N個待感知信道,將每一個待感知信道稱為一個感知任務Ti,i=1,2,...,N。在仿真場景內(nèi)均勻分布著若干參與感知的次用戶,每個次用戶都可以感知所有任務,但在同一時間只能感知一個任務。為了激勵次用戶進行頻譜感知,基站會給被選中的完成任務的次用戶一定的報酬。
圖1 多任務系統(tǒng)模型
假設主用戶系統(tǒng)中共有N個信道,每個次用戶可以感知各個信道,但同時只能感知其中一個信道,次用戶采用能量檢測的方式進行頻譜感知,由文獻[15]可知,次用戶j感知信道i的檢測概率pji的表達式為
(1)
式中,pf為次用戶j的虛警概率,γji表示次用戶j感知任務i的信噪比,tji代表次用戶j感知信道i的感知時間。tjifs表示次用戶j的采樣點數(shù),記為nji,采樣頻率fs是一個定值。Q函數(shù)表達式為
(2)
由Q函數(shù)性質(zhì)可知,當檢測概率pji大于0.5時,Q函數(shù)中的x小于0。當檢測概率小于0.5時,由于數(shù)據(jù)質(zhì)量不具有參考價值,該次用戶不參與感知,所以
(3)
次用戶存在錯誤概率,錯誤概率由兩部分組成,即主用戶不存在時的虛警概率和主用戶存在時的漏檢概率[2],表達式為
pe=p(u1)(1-pd)+p(u0)pf
(4)
次用戶通過控制信道將感知數(shù)據(jù)上報給基站,次用戶基站對次用戶的感知結(jié)果進行融合,做出最終的頻譜感知判定。協(xié)作頻譜感知的數(shù)據(jù)融合算法有“或”融合、“與”融合、表決融合等多種融合算法。本文采用基于表決融合準則的算法。這個準則是在M個感知用戶中,設置一個表決門限k,當有k個以上的感知用戶支持一個假設時,此假設被判定成立[2]。表決融合系統(tǒng)的檢測概率pD和虛警概率可以分別表示為:
(5)
(6)
本文提出了基于激勵機制的多任務協(xié)作頻譜感知算法,流程如圖2所示,次用戶基站先發(fā)布待感知信道的任務,次用戶根據(jù)建立的次用戶效用,優(yōu)化次用戶的采樣點數(shù)以獲得次用戶的最優(yōu)效用,最優(yōu)效用若大于次用戶的閾值,則將選擇的任務和檢測概率一并提交至基站,基站采用貪婪算法選取參與的次用戶,在次用戶將感知后的判決結(jié)果提交至基站后,基站將由檢測概率決定的報酬發(fā)放至參與的次用戶。
圖2 次用戶與次用戶基站交互流程
首先次用戶基站公布需要感知的任務集合{Ti}和Ti的預算bi,i=1,2,...,N。其中Ti表示任務i(即對信道i進行感知),N個信道對應于N個任務。任務i的預算bi是基站由所有任務的總預算B按一定的規(guī)則分配而得。
次用戶收到基站公布的任務后,將根據(jù)效用進行任務選擇,次用戶j感知任務i的效用定義為
uji=k·pji·bi-tji·ci,i=1,2,...,N,j=1,2,...,M
(7)
式中pji代表次用戶j感知任務i的檢測概率,ci代表單位時間次用戶感知任務i的檢測代價,k是一個價格系數(shù),由基站決定。效用的前一部分表示次用戶的收益,與檢測概率和預算有關(guān),后一部分是感知的代價,與感知時間有關(guān)。
(8)
次用戶效用存在最大值的一個必要條件是uji關(guān)于nji的一階偏導數(shù)單調(diào)遞減且存在負值,所以需要證明uji關(guān)于nji的二階偏導數(shù)小于或等于0。需要說明的是,在實際情況下次用戶的采樣點數(shù)為離散整數(shù),這樣就無法求導。為了方便數(shù)學推導,這里先假設采樣點數(shù)為連續(xù)值,計算完成后再對其取整。首先求一階偏導數(shù)得
(9)
式中
(10)
(11)
(12)
(13)
(14)
次用戶j計算自己感知各個信道任務的效用,求得所有的效用集合{uji}后,選擇一個最大效用,當最大效用大于次用戶j的閾值thj(可以承受的最低效用)后,即max{uji}≥thj,向次用戶基站提交選擇的感知任務和預計的檢測概率,即
綜上所述,本文提出的基于多任務群智感知的協(xié)作頻譜感知算法步驟如下:
步驟1次用戶基站公布任務集{Ti}以及對應的bi,i=1,2,...,N;
步驟2各個次用戶分別計算感知不同信道的效用,并選擇其中最大的效用,如果這個效用大于該名次用戶的閾值,那么向次用戶基站提交選擇的感知任務和預計的檢測概率
步驟3次用戶基站在收到所有信息后,在有限的預算條件下對各任務按檢測概率的大小挑選次用戶;
步驟4基站通知被選中的次用戶開始頻譜感知;
步驟5次用戶將感知后的判決結(jié)果發(fā)送至基站;
步驟6基站發(fā)放報酬。
首先是優(yōu)化算法在不同次用戶數(shù)量下的性能比較,并將結(jié)果與文獻[16]和文獻[17]中的算法進行對比與分析,來展示算法的性能。
本文選取文獻[16]和文獻[17]的兩個算法作為對比算法。文獻[16]將頻譜感知與群智感知相結(jié)合,次用戶的收益與匯報的結(jié)果相關(guān)。匯報結(jié)果與融合判決結(jié)果相同將獲得較多收益,否則收益較少。文獻[17]是一個群智感知算法,本質(zhì)上是采用了拍賣機制的貪婪算法。仿真中需要對上面兩種算法進行一些調(diào)整,以適應本文系統(tǒng)模型。文獻[16]中的次用戶就近選擇感知任務,感知成功的報酬取任務預算的十分之一,失敗的報酬為成功的一半。將文獻[17]算法中次用戶的感知質(zhì)量具體化為檢測概率,次用戶效用函數(shù)中的距離改為采樣點數(shù),增加感知成本,與采樣點數(shù)相關(guān)。兩個算法中的次用戶的采樣點數(shù)都取固定值,這個固定值取的是本文算法中次用戶采樣點數(shù)的平均值。
仿真的場景內(nèi),共存在6個待感知信道,占用了這6個感知任務的主用戶坐標分別為(1333,1000)、(1333,2000)、(1333,3000)、(2666,1000)、(2666,2000)和(2666,3000),所有次用戶的采樣頻率都是10 kHz,感知代價與感知時間有關(guān),為每毫秒0.139,0.141,0.143,0.145,0.147,0.149,價格系數(shù)k取0.14,次用戶的虛警概率設為0.1。次用戶心理閾值th取0.1。
仿真中,信號的傳播同時考慮大尺度衰落和小尺度衰落,大尺度衰落采用經(jīng)驗路徑損耗模型,衰落系數(shù)取3.4,小尺度衰落服從瑞利分布。
圖3給出了次用戶人數(shù)為50時的算法性能。圖(a)、圖(b)和圖(c)分別描述的是融合后的檢測概率、次用戶平均效用和融合后的錯誤概率隨預算的變化情況,圖中的檢測概率和錯誤概率是各任務協(xié)作檢測概率的均值??梢钥闯鰴z測概率和平均效用隨預算遞增,錯誤概率隨預算遞減。顯然本文算法的性能要優(yōu)于對比算法,原因是本文算法能夠使次用戶效用取得最優(yōu),從而激勵更多次用戶參與感知,提升融合后的檢測概率,降低錯誤概率。當預算較低時,文獻[17]算法的檢測概率不存在且平均效用為0,這是由于當預算較低時,價格高的次用戶都被淘汰,價格低的次用戶能獲得的效用也比較低,低于其心理閾值,所以不選擇參與感知,導致任務無人參與感知。
圖4給出的是次用戶人數(shù)為80時的算法性能仿真圖。對比圖3和圖4中的檢測概率和錯誤概率曲線,可以看出次用戶人數(shù)增加時,曲線走勢大致相同,但是次用戶較少時的檢測概率要低于次用戶較多時,錯誤概率要高于次用戶較多時。這是因為當次用戶數(shù)量少時,次用戶分布比較分散,其距離主用戶的距離較遠,信噪比偏低,不同的任務的檢測人數(shù)會變少,參與檢測的次用戶的數(shù)據(jù)質(zhì)量也會較低,所以融合后的檢測概率會比人數(shù)多時低,與此同時錯誤概率會變高。對比圖3(b)和圖4(b),可以看出這三種算法的次用戶平均效用基本不受次用戶人數(shù)影響,因為這三種算法的效用函數(shù)都和人數(shù)無關(guān)。
圖3 次用戶數(shù)為50時的頻譜檢測性能
圖5討論了不同心理閾值對算法性能的影響,仿真中次用戶數(shù)量取50。由圖中可以看出,檢測概率隨著心理閾值的增大而減小,原因是心理閾值低時,參與感知的次用戶多,所以檢測概率會隨之提高。當預算較低時次用戶得到的報酬很少,如果此時心理閾值較大,則任務無人參與,如心理閾值為0.15的曲線所示。
圖4 次用戶數(shù)為80時的頻譜檢測性能
圖5 心理閾值對檢測概率的影響
協(xié)作頻譜感知可以有效地提升頻譜感知準確率,然而在多數(shù)的協(xié)作頻譜感知文獻中,感知用戶的積極性并沒有被考慮到。本文首次將群智感知的激勵機制與協(xié)作頻譜感知相結(jié)合,提出了一種感知次用戶效用最優(yōu)的多任務激勵算法,通過優(yōu)化次用戶的采樣點數(shù)來提升次用戶的個人效用。最后通過數(shù)值仿真顯示,在感知數(shù)據(jù)質(zhì)量得到保證的情況下,次用戶的個人效用得到了有效的提升,提升了次用戶的感知積極性。
[1] Cichoń K, Kliks A, Bogucka H. Energy-Efficient Cooperative Spectrum Sensing: A Survey[J]. IEEE Communications Surveys & Tutorials, 2016, 18(3):1861-1886.
[2] 卞荔. 認知無線電系統(tǒng)中基于數(shù)據(jù)融合的協(xié)作頻譜感知算法的研究[D].南京:南京郵電大學, 2010.
Bian Li. The Study of the Cooperative Spectrum Sensing Algorithm in Cognitive Radio based on Data Fusion[D]. Nanjing: Nanjing University of Posts and Telecommunications, 2010. (in Chinese)
[3] 卞荔, 朱琦. 基于數(shù)據(jù)融合的協(xié)作頻譜感知算法[J].南京郵電大學學報:自然科學版, 2009, 29(2):73-78.
Bian Li, Qi Zhu. Cooperative Spectrum Sensing Algorithm Based on Data Fusion[J]. Journal of Nanjing University of Posts and Telecommunications: Natural Science Edition, 2009, 29(2):73-78. (in Chinese)
[4] 岳文靜, 陳志, 鄭寶玉,等. 基于可靠次用戶信息的協(xié)作頻譜感知算法研究[J]. 電子與信息學報, 2012, 34(5):1208-1213.
Yue Wenjing, Chen Zhi, Zheng Baoyu, et al. Cooperative Spectrum Sensing Based on Reliable Secondary User Information[J]. Journal of Electronics & Information Technology, 2012, 34(5):1208-1213.(in Chinese)
[5] 趙知勁, 呂曦, 尚俊娜,等. 利用功率譜最大最小值的頻譜感知算法[J]. 信號處理, 2017, 33(2):152-157.
Zhao Zhijin, Lv Xi, Shang Junna, et al. The Spectrum Sensing Algorithm Using the Maximum Value and Minimum Value of the Power Spectral Density[J]. Journal of Signal Processing, 2017, 33(2):152-157.(in Chinese)
[6] Deka S K, Chauhan P, Sarma N. Constraint Based Cooperative Spectrum Sensing for Cognitive Radio Network[C]∥International Conference on Information Technology. IEEE, 2015:63- 68.
[7] 岳文靜, 沈冬冬, 陳志. 噪聲不確定下基于進化博弈論的協(xié)作頻譜檢測研究[J]. 信號處理, 2017,33(10):1385-1392.
Yue Wenjing, Shen Dongdong, Chen Zhi. Research on Cooperative Spectrum Detection Based on Evolutionary Game Theory under Noise Uncertainty[J]. Journal of Signal Processing, 2017,33(10):1385-1392.(in Chinese)
[8] Jaimes L G, Vergara-Laurens I J, Raij A. A Survey of Incentive Techniques for Mobile Crowd Sensing[J]. IEEE Internet of Things Journal, 2015, 2(5):370-380.
[9] Lee J S, Hoh B. Dynamic pricing incentive for participatory sensing[J]. Pervasive & Mobile Computing, 2010, 6(6):693-708.
[10] Jaimes L G, Vergara-Laurens I, Labrador M A. A location-based incentive mechanism for participatory sensing systems with budget constraints[C]∥IEEE International Conference on Pervasive Computing and Communications. Lugano, Switzerland : IEEE, 2012:103-108.
[11] Yang D, Xue G, Fang X, et al. Crowdsourcing to smartphones: incentive mechanism design for mobile phone sensing[C]∥International Conference on Mobile Computing and Networking. Istanbul, Turkey: ACM, 2012:173-184.
[12] Koutsopoulos I. Optimal incentive-driven design of participatory sensing systems[C]∥INFOCOM, 2013 Proceedings IEEE. Turin, Italy: IEEE, 2013:1402-1410.
[13] 南文倩, 郭斌, 陳薈慧,等. 基于跨空間多元交互的群智感知動態(tài)激勵模型[J]. 計算機學報, 2015, 38(12):2412-2425.
Nan Wenqian, Guo Bin, Chen Huihui, et al. A Cross-Space, Multi-Interaction-Based Dynamic Incentive Mechanism for Mobile Crowd Sensing[J]. Chinses Journal of Computers, 2015, 38(12):2412-2425.(in Chinese)
[14] Ho C J, Vaughan J W. Online task assignment in crowdsourcing markets[C]∥Twenty-Sixth AAAI Conference on Artificial Intelligence.Toronto,Canada: AAAI Press, 2012:45-51.
[15] Liang Y C, Zeng Y, Peh E C Y, et al. Sensing-Throughput Tradeoff for Cognitive Radio Networks[J]. Wireless Communications IEEE Transactions on, 2008, 7(4):1326-1337.
[16] Chen Bin, Zhang Bi-ling, Yu Jung-Lang, et al. An indirect reciprocity based incentive framework for cooperative spectrum sensing[C]∥IEEE International Conference on Communications. Paris, France: IEEE, 2017:1- 6.
[17] Hu T, Xiao M, Hu C, et al. A QoS-sensitive task assignment algorithm for mobile crowdsensing[J]. Pervasive & Mobile Computing, 2017,41(5):333-342.