張力,廖天,何業(yè)軍
(深圳大學(xué)電子與信息工程學(xué)院,廣東 深圳 518060)
人們對通信的需求從早期的文字通信演變?yōu)楫?dāng)今的視頻通信[1]。隨著通信需求的不斷增加,有限的頻譜資源很難滿足人們的需求[2],主要表現(xiàn)為現(xiàn)有頻譜資源調(diào)度和分配的不合理[3]。
現(xiàn)有的頻譜資源共享方式[4]無法最大程度地保證通信服務(wù)質(zhì)量,原因是在解決認(rèn)知用戶和授權(quán)用戶之間頻譜資源的共享問題及認(rèn)知用戶之間頻譜資源的競爭問題時沒有考慮授權(quán)用戶和認(rèn)知用戶的通信質(zhì)量,也沒有考慮系統(tǒng)中所有用戶的公平度,對于系統(tǒng)中授權(quán)用戶和認(rèn)知用戶之間的競爭也沒有考慮。而解決這類問題的主要方法就是博弈論[5],通過博弈論的相關(guān)原理有效地解決授權(quán)用戶和認(rèn)知用戶之間的競爭關(guān)系,使最終的調(diào)度方案達(dá)到納什均衡[6]。
Niyato等[7]對合作博弈方式和非合作博弈方式進(jìn)行了對比分析,對這2種博弈方式的應(yīng)用場合、優(yōu)缺點及構(gòu)架進(jìn)行了介紹,并給出了不同場合選擇博弈方式的依據(jù),為博弈論的進(jìn)一步應(yīng)用奠定了基礎(chǔ),但只停留在理論分析階段。Kim 等[8]提出了一種多主多從結(jié)構(gòu)的Stackelberg博弈理論,并從理論上論證了該方法通過多次迭代和反饋之后可以搜索到最優(yōu)的納什均衡,但復(fù)雜的反饋決策限制了應(yīng)用。Nguyen等[9]提出一種基于預(yù)測和感知的頻譜共享方法,該方法將資源塊的時間結(jié)構(gòu)分為頻譜預(yù)測、頻譜感知和數(shù)據(jù)傳輸,改善了部分性能但未在博弈理論進(jìn)一步研究。Zhu等[10]針對宏用戶提供更多訪問頻譜的機會,設(shè)計了一種激勵機制,該機制使用一種分層的動態(tài)博弈框架,下層建立演化博弈模型,上層建立Stackelberg差分博弈模型,然而該分層博弈架構(gòu)將引入層間干擾問題,但文中并未考慮。張婷等[11]設(shè)計演化博弈算子,建立分式規(guī)劃機制的次用戶效用函數(shù),實現(xiàn)了能效最優(yōu)的資源分配,但該方法僅考慮能效而未考慮如頻譜利用率等問題。Vidal等[12]基于博弈論研究在不干擾主用戶的條件下讓次用戶使用頻譜,而該方法提高的頻譜利用率有限。Yang等[13]基于Stackelberg博弈調(diào)整使資源分配最大化效用,降低能耗,該方法在其他資源分配模型中有待進(jìn)一步驗證。Al-Talabani等[14]研究基于Stackelberg博弈讓主網(wǎng)絡(luò)和次節(jié)點共享頻譜資源,并加入噪聲提高認(rèn)知無線電網(wǎng)絡(luò)傳輸保密性。韓松等[15]考慮主用戶二次邊際成本,設(shè)計主用戶反饋機制和次用戶信任機制,以最大化效用和提高頻譜利用率,其考慮的主次用戶效用函數(shù)較為簡單。博弈和非博弈集中調(diào)度最主要的差異是博弈集中調(diào)度的認(rèn)知用戶和授權(quán)用戶的博弈結(jié)果會相互影響,從而不斷在博弈策略中選擇較優(yōu)的博弈結(jié)果,非博弈集中調(diào)度取決于具體的調(diào)度參與者,一般不會相互影響。
本文考慮用戶的公平度,給出了反映認(rèn)知用戶頻譜需求的效益函數(shù),引入了雙目標(biāo)鯨魚優(yōu)化算法(WOA,whale optimization algorithm),實現(xiàn)公平有效的頻譜分配。本文的貢獻(xiàn)如下:1)基于Stackelberg博弈引入雙目標(biāo)WOA,將授權(quán)用戶和認(rèn)知用戶共同的收益優(yōu)化分為各自的收益優(yōu)化過程,設(shè)計出一種新的基于Stackelberg博弈的頻譜共享調(diào)度算法;2)通過加入影響認(rèn)知用戶公平分配頻譜的函數(shù)到認(rèn)知用戶收益的優(yōu)化模型中,能實現(xiàn)認(rèn)知用戶較為公平的頻譜分配,最終得到授權(quán)用戶和認(rèn)知用戶的最優(yōu)頻譜分配結(jié)果。
本文首先描述雙目標(biāo)WOA;然后建立頻譜共享博弈模型,提出了雙目標(biāo)WOA頻譜共享算法,并介紹了算法的實現(xiàn)步驟和流程;最后對本文算法進(jìn)行仿真驗證,分析了算法復(fù)雜度、仿真時間、系統(tǒng)效用方面等性能。
傳統(tǒng)的WOA[16]主要針對單一目標(biāo)的獵捕,當(dāng)考慮2個目標(biāo)獵物時,主要會涉及以下關(guān)鍵因素。
1)每個“獵物群”的“獵物”數(shù)量。如果2個“獵物群”中的“獵物”個體數(shù)量差異比較大,“獵物”個體是否優(yōu)先考慮大“獵物群”,以滿足“獵物”個體最后的“捕食”需求。
2)距離2個獵物群中心位置的距離。如果“獵物”個體與小數(shù)量獵物群的距離遠(yuǎn)小于與大數(shù)量獵物群的距離,是否先考慮捕食小“獵物群”,進(jìn)而圍捕大“獵物群”。
3)約束條件。在何種情況下會形成雙目標(biāo)捕食環(huán)境等。
針對初始鯨魚群個體環(huán)繞數(shù)量,設(shè)置個體數(shù)量浮動因子F,群族個體數(shù)量Q,環(huán)繞“獵物”(“獵物1”和“獵物2”)的初始個體數(shù)量表示為
其中,rand()表示(0,1)之間的隨機量,Q1與Q2分別表示“獵物1”與“獵物2”初始環(huán)繞的捕獵者數(shù)量,F(xiàn)表示(0,1)之間的變量。
距離是優(yōu)先考慮的因素,當(dāng)距離優(yōu)勢足夠明顯時,即d1>2d2,則不考慮其他因素的影響直接追擊“獵物2”,反之亦然,其中d1和d2表示捕獵者分別與“獵物1”“獵物2”的距離。當(dāng)距離優(yōu)勢不夠明顯時,則需要考慮目標(biāo)對于個體的最要性來決定下一時刻的追擊目標(biāo),可得式(3)。
其中,μi表示獵物個體在整個獵物群體中的權(quán)值,i=1,2,…,N。當(dāng)同時考慮距離與權(quán)重時,則每個個體在更新位置前需要做出式(4)所示的判斷。
其中,K表示影響目標(biāo)選擇的個數(shù);αk表示各影響因素之間的比重;βk為對應(yīng)因素的權(quán)值;n表示該時刻捕獵的目標(biāo),以對下一時刻的位置進(jìn)行更新。
在鯨魚螺旋捕食階段[16],根據(jù)式(5)進(jìn)行優(yōu)化。
其中,X(t+1)為捕獵者的位置向量;t為迭代參數(shù);D′為捕獵者與獵物的距離向量;l為 0~1的隨機變量;b為常量;X*(t)為每次迭代捕獵者的局部最優(yōu)位置向量;γ為更新權(quán)值,如式(6)所示。
其中,γmin表示最小權(quán)值,取值為0.05;γmax表示最大權(quán)值,取值為0.95;f(x)表示修正函數(shù),如式(7)所示。
其中,μ表示xi的均值。
選擇狩獵目標(biāo)數(shù)量比和單目標(biāo)權(quán)重比的關(guān)系為停止條件,對收斂速率和收斂精度都有一定影響。當(dāng)滿足式(8)時,停止對于狩獵目標(biāo)的選擇,以前一時刻的目標(biāo)為基準(zhǔn),直至完成狩獵目標(biāo)的捕獲。
其中,Q1(t)和Q2(t)分別表示t次迭代時,環(huán)繞“獵物1”與“獵物2”鯨魚的數(shù)量。
當(dāng)分布式天線系統(tǒng)(DAS,distributed antenna system)和集中式天線系統(tǒng)(CAS,centralized antenna system)通信過程產(chǎn)生相同的吞吐量時,CAS需要更大的發(fā)送功率。當(dāng)DAS和CAS以相同的發(fā)送功率進(jìn)行通信的時候,DAS具有更高的吞吐量[17]。
DAS和CAS能量效率和頻譜效率的關(guān)系如圖1所示。從圖1可知,CAS和DAS在頻率效率小于2 bit/(s.Hz)時,隨著頻率效率的增加,兩者的能量效率均增加。當(dāng)頻率效率大于2 bit/(s.Hz)時,兩者的能量效率逐漸降低并趨于平穩(wěn)。由于其天線距離用戶較遠(yuǎn),CAS的大尺度衰落現(xiàn)象較為嚴(yán)重,因此能量效率較低。由于DAS的天線隨機分布在小區(qū)的不同位置,天線距離用戶較近,因此大尺度衰落現(xiàn)象較輕,能量效率較高。由圖1還可知,DAS的理論最小值的能量效率也大于CAS,因此本文在DAS的基礎(chǔ)上進(jìn)行研究。
圖1 DAS與CAS能量效率與頻譜效率關(guān)系
本文頻譜共享的認(rèn)知無線電系統(tǒng)如圖2所示。假設(shè)系統(tǒng)有M個授權(quán)用戶,一個基站及N個隨機分布的天線,其中,N個天線只用于數(shù)據(jù)信號的發(fā)送和接收。所有授權(quán)用戶將閑置的頻譜資源整合為一個共享池,并出售頻譜資源給認(rèn)知用戶,從而獲得收益。認(rèn)知用戶通過購買共享池的頻譜資源來實現(xiàn)信號發(fā)送和接收?;驹谡麄€交易環(huán)節(jié)作為“中間人”,協(xié)調(diào)授權(quán)用戶和認(rèn)知用戶間的交易。
圖2 網(wǎng)絡(luò)頻譜共享系統(tǒng)
假設(shè)授權(quán)用戶的價格策略為P*,認(rèn)知用戶購買的帶寬b*,引入式(9)所示的認(rèn)知用戶收益函數(shù)[18]。
其中,U(b)為認(rèn)知用戶的收益;b=[b1,...,bi,...,bM]表示M個授權(quán)用戶給基站的帶寬向量;表示認(rèn)知用戶的頻譜利用率;ωi表示認(rèn)知用戶所擁有的單位傳輸速率下所帶來的收益;Pi表示授權(quán)用戶i的頻譜價格;b′j表示認(rèn)知用戶j的實際頻譜需求;f(·)表示實際的頻譜需求函數(shù),其作用是當(dāng)實際的網(wǎng)絡(luò)頻譜需求改變時,認(rèn)知用戶收益也會改變,所得的均衡點也會發(fā)生改變[19-20],從而使認(rèn)知用戶收益更符合實際頻譜需求情況。
假設(shè)xij表示天線j的頻譜資源是否分配給用戶i,如果是,則xij=1,否則xij=0。那么認(rèn)知用戶的收益目標(biāo)函數(shù)為
其中,Uj表示認(rèn)知用戶的收益函數(shù),即式(9)的認(rèn)知用戶收益函數(shù)。如果某個用戶i被分配天線j,那么將產(chǎn)生一個收益Uj。然后通過式(10)計算得到所有認(rèn)知用戶的整體收益值。
單個授權(quán)用戶的收益函數(shù)為[21]
其中,Mi表示授權(quán)用戶的連接數(shù)量;c1表示授權(quán)用戶收益權(quán)值;c2表示授權(quán)用戶損失權(quán)值;表示授權(quán)用戶系統(tǒng)連接者需求帶寬;表示授權(quán)用戶的頻譜利用率;Wi表示授權(quán)用戶擁有的閑置頻譜資源。
當(dāng)存在多個授權(quán)用戶時,授權(quán)用戶的收益函數(shù)將有所不同。在Stackelberg博弈中,假設(shè)授權(quán)用戶A的頻譜資源價格為pA,授權(quán)用戶B觀測到A的價格后,考慮自身的利益,選擇價格pB。在整個過程中,A先有價格,B根據(jù)A的價格選擇價格,而A無法預(yù)先獲得B的價格。B的策略定義為SB:QA→QB,其中,QA=(0,∞)表示A的價格區(qū)間,QB=(0,∞)表示B的價格區(qū)間。因此,其價格向量可以表示為(pA,SB(pA))。同理,對于授權(quán)用戶C,其價格向量表示為(pA,pB,SC(pA,pB)),其中,pB=SB(pA)。在Stackelberg博弈中,本文以2個授權(quán)用戶為例,則授權(quán)用戶收益函數(shù)為[21]
那么授權(quán)用戶的收益目標(biāo)函數(shù)為
其中,Пi(P)為授權(quán)用戶的收益函數(shù),即式(12)的授權(quán)用戶收益函數(shù)。如果天線j的頻譜資源被出售,那么對授權(quán)用戶將產(chǎn)生一個收益Пi。通過式(13)計算得到所有授權(quán)用戶的整體收益值。
頻譜分配的公平度目標(biāo)函數(shù)如式(14)所示。
其中,ξ表示一個較小值,一般取0.000 01,以避免出現(xiàn)值為0的情況。
假設(shè)某一天線的閑置頻譜資源較多,其他天線閑置頻譜資源較少,若大多數(shù)用戶都去搶占該天線資源,將會導(dǎo)致認(rèn)知用戶的個體收益下降,而采用頻譜分配的公平度目標(biāo)函數(shù)后,認(rèn)知用戶則選擇不同的天線來均衡地購買頻譜資源。
認(rèn)知用戶和授權(quán)用戶的整體收益反映系統(tǒng)效用,設(shè)認(rèn)知用戶和授權(quán)用戶收益歸一化值分別為y1和y2,系統(tǒng)效用函數(shù)為
其中,λ1和λ2表示加權(quán)值,均取值0.5。
在Stackelberg博弈的基礎(chǔ)下,本文所采用雙目標(biāo)WOA頻譜共享算法的優(yōu)化模型如式(16)和式(17)所示。
其中,δ1、δ2和δ3表示權(quán)值,有δ1+δ2+δ3=1。如果頻譜分配結(jié)果偏向于認(rèn)知用戶收益,增大δ1;如果頻譜分配結(jié)果偏向于授權(quán)用戶收益,增大δ2;如果頻譜分配結(jié)果偏向于認(rèn)知用戶的公平度,則增大δ3的值。
在優(yōu)化模型中,為了避免出現(xiàn)不符合實際情況的最優(yōu)解,使頻譜分配更符合實際情況,設(shè)置了3個約束條件[17],如式(18)~式(20)所示。其中,式(18)表示所有認(rèn)知用戶的整體頻譜資源需求之和小于所有授權(quán)用戶的閑置頻譜資源;式(19)表示每一個用戶只使用某一個授權(quán)用戶的頻譜資源或者不使用任何授權(quán)用戶的頻譜資源;式(20)表示如果認(rèn)知用戶被分配某授權(quán)用戶的頻譜資源,那么xij={1},否則xij={0}。在該約束條件下的優(yōu)化結(jié)果中,優(yōu)化模型的結(jié)果將更符合實際頻譜需求。
在雙目標(biāo)WOA頻譜共享算法中,需要優(yōu)化變量xij的值,所有的xij可組合成M×N維向量,將其轉(zhuǎn)換為一維向量記為
那么在雙目標(biāo)WOA頻譜共享算法中,只需要將待優(yōu)化變量[x11,...,x1N,x21,...,x2N,...,xM1,...,xMN]、式(16)和式(17)的優(yōu)化目標(biāo)加入算法進(jìn)行優(yōu)化即可。具體步驟如下。
Step1進(jìn)行參數(shù)初始化,隨機分配參數(shù)[x11,...,x1N,x21,...,x2N,...,xM1,...,xMN],即在初始條件下,認(rèn)知用戶隨機分配頻譜資源。
Step2根據(jù)式(16)和式(17)計算初始參數(shù)下認(rèn)知用戶的優(yōu)化目標(biāo)和授權(quán)用戶的優(yōu)化目標(biāo)。
Step3開始進(jìn)入雙目標(biāo)WOA優(yōu)化,結(jié)合第2節(jié),通過WOA的鯨魚行走覓食階段、鯨魚包圍階段和鯨魚螺旋捕食階段實現(xiàn)參數(shù)[x11,...,x1N,x21,...,x2N,...,xM1,...,xMN]的迭代更新,并同時計算對應(yīng)的優(yōu)化目標(biāo)函數(shù)值。
Step4將每次迭代計算得到的優(yōu)化目標(biāo)函數(shù)值和當(dāng)前迭代的最優(yōu)目標(biāo)函數(shù)值進(jìn)行對比,并獲得較優(yōu)的目標(biāo)函數(shù)值。
Step5重復(fù)上述步驟,直到完成所有的迭代計算,將最后迭代輸出的參數(shù)[x11,...,x1N,x21,...,x2N,...,xM1,...,xMN]作為最后的優(yōu)化結(jié)果,即頻譜分配結(jié)果。
雙目標(biāo)WOA頻譜共享算法流程如圖3所示。
圖3 雙目標(biāo)WOA頻譜共享算法流程
仿真實驗參數(shù)如表1所示。本文算法將與基于Bertrand博弈算法和基于Stackelberg博弈算法進(jìn)行對比仿真,其中,基于Bertrand博弈算法無法反映實際的頻譜需求,屬于靜態(tài)博弈;基于Stackelberg博弈算法可以反映實際的頻譜需求,屬于動態(tài)博弈。通過與這2種博弈進(jìn)行對比,可討論不同博弈對仿真性能的影響。
表1 仿真實驗參數(shù)
價格納什均衡點和頻譜請求帶寬納什均衡點的仿真結(jié)果如圖4和圖5所示,這2個均衡點是與性能相關(guān)的分技術(shù)指標(biāo)。由圖4可知,2個授權(quán)用戶的價格呈正向變動,這意味著當(dāng)一個授權(quán)用戶提高價格時,另一個授權(quán)用戶也會提高價格,其反應(yīng)函數(shù)曲線呈y=x對稱形式。圖4中,P1和P2表示授權(quán)用戶1和授權(quán)用戶2的歸一化價格。由圖5可知,2個認(rèn)知用戶的頻譜請求帶寬與授權(quán)用戶價格呈反比,即授權(quán)用戶價格越低,請求帶寬越高。認(rèn)知用戶的請求帶寬提高會降低授權(quán)用戶的頻譜價格,間接提高授權(quán)用戶出租的頻譜資源,從而提高認(rèn)知用戶和授權(quán)用戶的收益,進(jìn)一步提高系統(tǒng)效用,而系統(tǒng)效用的提升也意味著通信系統(tǒng)的吞吐率的提升。由圖4和圖5可知,基于Stackelberg博弈算法相對于基于Bertrand博弈算法,其頻譜價格有一定程度的降低,而認(rèn)知用戶的頻譜請求則較大幅度提升。而本文算法中,各授權(quán)用戶在參考其他授權(quán)用戶的價格后才給出價格,因此其最終的價格將低于基于Stackelberg博弈算法的博弈模型,而其對應(yīng)的認(rèn)知用戶頻譜請求則最大。
圖4 授權(quán)用戶的價格納什均衡點
最佳授權(quán)價格隨可出租的閑置頻譜資源增加而變化的仿真結(jié)果如圖6所示,最佳授權(quán)價格是與性能相關(guān)的分技術(shù)指標(biāo)。由圖6可知,隨著可出租的閑置頻譜資源的增加,為了讓更多的認(rèn)知用戶購買頻譜資源,其最優(yōu)的授權(quán)價格逐漸減低。當(dāng)閑置頻譜資源增加到一定程度時,為保證授權(quán)用戶的收益,其授權(quán)價格將趨于穩(wěn)定。其中,基于Bertrand博弈算法考慮的情況較為理想化,認(rèn)為博弈參與者最優(yōu)價格最大,從而使認(rèn)知用戶收益降低?;赟tackelberg博弈算法相對于基于Bertrand博弈算法更符合實際情況,能夠吸引更多的認(rèn)知用戶來購買頻譜資源,因此得到的最優(yōu)授權(quán)價格低于基于Bertrand博弈算法的價格。本文算法采用了基于Stackelberg博弈算法,各個授權(quán)用戶在參考其他授權(quán)用戶的價格后才給出價格,最終的價格將低于基于Stackelberg博弈算法,因此具有最低的授權(quán)價格。3種算法的最終價格分別為5.95(本文算法)、6.36(基于Stackelberg博弈算法)、7.03(基于Bertrand博弈算法)。本文算法的最終價格為基于Bertrand博弈算法價格的84.64%,為基于Stackelberg博弈算法價格的93.55%。
圖6 授權(quán)頻譜最佳授權(quán)價格變化
授權(quán)用戶收益隨著可出租的閑置頻譜資源增加而變化的仿真結(jié)果如圖7所示,授權(quán)用戶收益是與性能相關(guān)的分技術(shù)指標(biāo)。由圖7可知,隨著可出租閑置頻譜資源的增加,授權(quán)用戶的收益逐漸增加,這是由于當(dāng)閑置頻譜資源逐漸增加,其售價不斷減低,從而吸引更多的認(rèn)知用戶購買頻譜資源。當(dāng)閑置頻譜資源大于5的時候,隨著認(rèn)知用戶的頻譜需求逐漸得到滿足,授權(quán)用戶出售的頻譜價格逐漸趨于穩(wěn)定,系統(tǒng)的整體收益也逐漸平穩(wěn)。同理,由于基于Bertrand博弈算法假設(shè)博弈參與者的條件是完全相同的,在實際的系統(tǒng)中的最優(yōu)價格最大,導(dǎo)致參與購買頻譜資源的認(rèn)知用戶較少,因此整體的收益最低?;赟tackelberg博弈算法的頻譜價格小于基于Bertrand博弈算法,因此整體收益更高。本文算法采用了基于Stackelberg博弈,價格最低,參與購買的用戶數(shù)量也最多,因此整體收益也最大。3種算法對應(yīng)的授權(quán)用戶的最終收益分別為455(本文算法)、364(基于Bertrand博弈算法)、418(基于Stackelberg博弈算法)。本文算法授權(quán)用戶的收益相對于Bertrand博弈算法價格提升了25%,相對于基于Stackelberg博弈算法價格提升了8.85%。
認(rèn)知用戶收益隨著可出租的閑置頻譜資源增加而變化的仿真結(jié)果如圖8所示,認(rèn)知用戶收益是與性能相關(guān)的分技術(shù)指標(biāo)。由圖8可知,隨著可出租的閑置頻譜資源的增加,認(rèn)知用戶的收益逐漸增加,由于頻譜資源價格的不斷降低,對于購買者認(rèn)知用戶來講,其收益逐漸增加,當(dāng)閑置資源數(shù)量大于20時,絕大多數(shù)認(rèn)知用戶的頻譜需求得到了滿足,授權(quán)用戶出售的頻譜價格也趨于穩(wěn)定,因此其收益保持不變。由于基于Bertrand博弈算法假設(shè)博弈參與者的條件是完全相同的,因此該算法應(yīng)用到實際的系統(tǒng)中,其最優(yōu)價格最大,認(rèn)知用戶的收益自然也就最小。而基于Stackelberg博弈算法,其頻譜價格小于基于Bertrand博弈算法,認(rèn)知用戶的收益較高。而本文算法的價格最低,認(rèn)知用戶的收益也最大。3種算法對應(yīng)的認(rèn)知用戶的最終收益分別為2 789(本文算法)、2 563(基于Bertrand博弈算法)、2 307(基于Stackelberg博弈算法)。本文算法中認(rèn)知用戶的收益相對于基于Bertrand博弈算法價格提升了20.89%,相對于基于Stackelberg博弈算法價格提升了8.82%。
圖7 授權(quán)用戶收益
圖8 認(rèn)知用戶收益
系統(tǒng)效用是系統(tǒng)的技術(shù)指標(biāo),系統(tǒng)效用隨用戶數(shù)量的變化情況如圖9所示。由圖9可見,隨著用戶數(shù)量的逐漸增加,不同博弈模型下的系統(tǒng)效用均逐漸增加。若都不考慮認(rèn)知用戶公平度,基于Bertrand博弈算法及基于Stackelberg博弈算法的系統(tǒng)效用均比本文算法低,這是由于仿生智能算法具有強并行計算能力,經(jīng)過復(fù)雜的迭代優(yōu)化獲得了較優(yōu)授權(quán)用戶受益和認(rèn)知用戶受益,因此其系統(tǒng)效用將會更高。
圖9 系統(tǒng)效用
圖10給出了不同公平加權(quán)系數(shù)δ3對算法性能的影響,分別設(shè)置δ3=0.9、δ3=0.5、δ3=0.1。公平度是通信性能的技術(shù)指標(biāo),它和通信網(wǎng)絡(luò)的業(yè)務(wù)吞吐率是相互矛盾的,如果公平度越高,通信網(wǎng)絡(luò)的業(yè)務(wù)吞吐率將會越低,如果公平度越低,通信網(wǎng)絡(luò)的業(yè)務(wù)吞吐率將會越高。由圖10可知,對比3種算法的系統(tǒng)效用,當(dāng)公平度加權(quán)系數(shù)較小的時候,頻譜資源分配受認(rèn)知用戶信道質(zhì)量影響較小,本文算法可以獲得更高的系統(tǒng)效用,而當(dāng)公平度加權(quán)系數(shù)較大的時候,由于算法過于強調(diào)公平度,信道較差的認(rèn)知用戶也能獲得較多頻譜資源,反而影響了最終的系統(tǒng)效用。因此,在實際中,需要根據(jù)用戶的實際需求來設(shè)置加權(quán)系數(shù)。
圖10 不同公平加權(quán)系數(shù)δ3對系統(tǒng)效用的影響
圖11給出了對200個用戶使用3種對比算法其對應(yīng)的公平度指標(biāo),此時由圖11可知,由于本文算法在頻譜分配過程中,考慮了頻譜分配公平度指標(biāo),因此進(jìn)行頻譜分配時具有最高的公平度,平均達(dá)到了86.8%。而基于Stackelberg博弈算法雖然考慮了實際博弈過程的特點,但是由于沒有涉及公平度的因素,其最終分配結(jié)果所計算得到的公平度只有71.3%。基于Bertrand博弈算法假設(shè)了各個博弈參與者完全相同的條件,因此在實際中,無法獲得較好的頻譜分配結(jié)果,其公平度只有59.2%。
圖11 系統(tǒng)公平度指標(biāo)對比
圖12給出了3種對比算法對應(yīng)的仿真時間,其是與通信相關(guān)的分技術(shù)指標(biāo),對認(rèn)知用戶數(shù)量從10逐漸遞增到200的仿真時間進(jìn)行對比。由圖12可知,本文算法的仿真時間最長,因為通過雙目標(biāo)WOA優(yōu)化需要迭代,這會增加算法的復(fù)雜度。而基于Bertrand博弈算法的實現(xiàn)復(fù)雜度最小,因此其仿真時間最短。
圖12 算法仿真時間對比
通過以上分析,在考慮公平度的情況下,本文算法的復(fù)雜度和仿真時間雖然不占優(yōu)勢,但其他性能優(yōu)勢明顯,故本文算法在整體上有較為明顯的性能優(yōu)勢。
通過分析WOA的特點及應(yīng)用對象,提出了一種雙目標(biāo)WOA頻譜共享算法,并給出了算法步驟和流程。本文基于Stackelberg博弈,引入強并行計算能力的雙目標(biāo)WOA,加入影響認(rèn)知用戶公平分配的函數(shù),建立基于Stackelberg博弈的雙目標(biāo)WOA頻譜共享算法。仿真結(jié)果符合預(yù)期目標(biāo),在算法復(fù)雜度、仿真時間和系統(tǒng)效用方面性能雖稍占劣勢,但其他性能均取得較好結(jié)果,因此,所提方法在博弈論的頻譜共享中有一定探索價值。