王大為,劉新浩,李 竹,蘆 賓,郭愛心,柴國強(qiáng)
(山西師范大學(xué)物理與信息工程學(xué)院,山西臨汾 041004)
近年來隨著物聯(lián)網(wǎng)、無線自組網(wǎng)、無人集群系統(tǒng)等技術(shù)的快速發(fā)展,無線通信業(yè)務(wù)量激增,導(dǎo)致頻譜資源供給與通信業(yè)務(wù)需求之間的供需不平衡問題日益嚴(yán)峻[1-2]。頻譜資源供給不足一方面是因?yàn)轭l譜作為國家的重要戰(zhàn)略資源確實(shí)緊缺,而另一方面是由于傳統(tǒng)預(yù)先劃分的靜態(tài)頻譜分配方式所導(dǎo)致的頻譜利用率低。2019 年,全球首屆6G 峰會發(fā)表的《6G 無線智能無處不在:關(guān)鍵驅(qū)動與研究挑戰(zhàn)》白皮書指出,6G 需要改變頻譜使用規(guī)則,提升頻譜資源利用率。認(rèn)知無線電技術(shù)可動態(tài)探測無線環(huán)境,通過智能算法進(jìn)行空閑頻譜判斷、發(fā)射機(jī)和接收機(jī)工作參數(shù)調(diào)整,讓認(rèn)知用戶智能地接入暫時不被授權(quán)用戶使用的“頻譜空穴”,從而實(shí)現(xiàn)頻譜資源的動態(tài)管理進(jìn)而提高頻譜利用率,被認(rèn)為是解決頻譜資源短缺問題的有效方法[3-4]。頻譜分配作為認(rèn)知無線電技術(shù)的重要環(huán)節(jié)起著限制認(rèn)知用戶和授權(quán)用戶之間的干擾、提高網(wǎng)絡(luò)效益的關(guān)鍵作用。而頻譜分配問題可抽象為一個數(shù)學(xué)上的非確定性多項(xiàng)式難題的約束優(yōu)化問題。到目前為止,有大量研究通過將圖論著色模型[5]、博弈論模型[6]、定價拍賣模型[7]等經(jīng)典數(shù)學(xué)模型以及人工智能算法與認(rèn)知無線電技術(shù)相結(jié)合以解決頻譜分配問題。例如遺傳算法[8-10]、蟻群算法[11-13]、二進(jìn)制粒子群優(yōu)化(Binary Particle Swarm Optimization,BPSO)算 法[14-16]、離散人 工蜂群(Discrete Artificial Bee Colony,DABC)算法[17-19]等應(yīng)用于解決該問題取得了不少成果。此外,在本文的前期研究中也提出了一種基于改進(jìn)二進(jìn)制粒子群優(yōu)化(Improved Binary Particle Swarm Optimization,IBPSO)[20]的頻譜分配方法來提高網(wǎng)絡(luò)效益。但正如No Free Lunch Theorem of Optimization 定理[21]所言,沒有通用算法可以完美解決所有實(shí)際工程問題。這些算法在解決認(rèn)知無線電頻譜分配時,特別是在用戶數(shù)和可用頻譜較多的大規(guī)模問題上,都難以避免地陷入局部最優(yōu)。而蝠鲼覓食優(yōu)化(Manta Ray Foraging Optimization,MRFO)算法是群智能算法領(lǐng)域的最新研究成果,由Zhao 等[22]受蝠鲼群體覓食過程中鏈?zhǔn)揭捠场⒙菪捠澈涂辗捠车刃袨榈膯l(fā)而于2020 年設(shè)計(jì)和正式提出,具有結(jié)構(gòu)簡單、參數(shù)少、全局探索能力強(qiáng)等特點(diǎn),可有效避免傳統(tǒng)啟發(fā)式智能算法普遍存在的局部最優(yōu)問題。然而該算法基于連續(xù)域提出,不能直接用于解決頻譜分配問題。因此,本文基于Sigmoid 函數(shù)(Sigmoid Function,SF)離散法和異或算子提出了離散蝠鲼覓食優(yōu)化(Discrete Manta Ray Foraging Optimization,DMRFO)算法。該算法的主要工作體現(xiàn)在進(jìn)行離散化設(shè)計(jì)時,根據(jù)頻譜分配問題的特點(diǎn),通過定義蝠鲼運(yùn)動速度和引入解的親1 性策略自適應(yīng)地平衡DMRFO 算法在二進(jìn)制空間的探索能力和開發(fā)能力,使得DMRFO 算法在理論上更適用于解決認(rèn)知無線電中的頻譜分配問題。同時,實(shí)驗(yàn)結(jié)果也表明DMRFO 算法的收斂速度和收斂精度明顯優(yōu)于離散人工蜂群(DABC)算法、二進(jìn)制粒子群優(yōu)化(BPSO)算法和改進(jìn)的二進(jìn)制粒子群優(yōu)化(IBPSO)算法。
MRFO 算法是Zhao 等[22]于2020 年提出的一種新的群智能算法。該算法受蝠鲼覓食行為的啟發(fā)分為鏈?zhǔn)揭捠?、螺旋覓食和空翻覓食三個過程,能有效避免傳統(tǒng)啟發(fā)式智能算法普遍存在的局部最優(yōu)問題。
1)鏈?zhǔn)揭捠常–hain foraging)。
蝠鲼群體覓食時,每個蝠鲼會跟在另一個蝠鲼后面形成一條覓食鏈,雄性蝠鲼被較大的雌性蝠鲼馱著并配合著雌性蝠鲼胸鰭舞動節(jié)拍在雌性蝠鲼的背部上空游動,以保證前面蝠鲼錯失的食物源會被后面的蝠鲼捕捉到,從而提升群體的覓食效益。在MRFO 算法中,某一位置的食物濃度越高則該位置越好。雖然當(dāng)前時刻還不知道最佳食物源的位置,但假設(shè)目前已知的食物濃度最高的位置為最佳食物源,蝠鲼觀察并游向最佳食物源。在游動過程中,第一個蝠鲼向最佳食物源移動而其他蝠鲼同時向最佳食物源和它前面的蝠鲼移動,從頭到尾排成一行形成一條覓食鏈。即在每次迭代過程中,每個蝠鲼按照目前找到的最佳食物源位置和它前面的蝠鲼更新自己的位置。鏈?zhǔn)揭捠尺^程的數(shù)學(xué)模型可表示如下:
其中:(t)表示第i個蝠鲼t時刻所在位置的第d維參數(shù);r為服從[0,1]均勻分布的隨機(jī)數(shù);α=2 ·r是權(quán)重系數(shù)(t)表示目前發(fā)現(xiàn)的最優(yōu)食物源位置的第d維參數(shù)。第i個蝠鲼的位置更新取決于第i-1 個蝠鲼的位置和目前發(fā)現(xiàn)的最優(yōu)食物源的位置xbest(t),而第1 個蝠鲼的位置更新策略取決于最優(yōu)食物源的位置。需要特別說明的是,如果把蝠鲼運(yùn)動的物理空間和MRFO 算法的搜索空間對應(yīng),則蝠鲼的位置xi(t)就是搜索空間中的解,最優(yōu)食物源的位置xbest(t)就是搜索空間中的最優(yōu)解。
2)螺旋覓食(Cyclone foraging)。
當(dāng)某個蝠鲼發(fā)現(xiàn)深海中的優(yōu)質(zhì)食物源時,蝠鲼群體中每個蝠鲼會首尾相接螺旋式向食物源聚集。聚集過程中蝠鲼群體的運(yùn)動方式由單純的鏈?zhǔn)竭\(yùn)動轉(zhuǎn)變?yōu)閲@最優(yōu)食物源的螺旋運(yùn)動。螺旋覓食過程可用如下數(shù)學(xué)模型表示:
其中:β=2er1(T-t+1)/T· sin(2πr1)表示螺旋運(yùn)動的權(quán)重系數(shù),T表示最大迭代次數(shù),r1代表旋轉(zhuǎn)因子,為服從[0,1]均勻分布的隨機(jī)數(shù)。蝠鲼群體根據(jù)該式在最優(yōu)食物源附近螺旋式隨機(jī)搜索,因此螺旋覓食過程對最優(yōu)解附近的區(qū)域有較好的開發(fā)性能。此外,為了強(qiáng)化算法的搜索性能,可以隨機(jī)產(chǎn)生一個新位置(解),然后在該位置附近執(zhí)行螺旋覓食操作,其數(shù)學(xué)模型式如下:
其中是在搜索空間中隨機(jī)產(chǎn)生的一個新位置(解)。
3)空翻覓食(Somersault foraging)。
當(dāng)某個蝠鲼發(fā)現(xiàn)食物源后,將食物源視作一個支點(diǎn)并繞支點(diǎn)旋轉(zhuǎn)、空翻至一個新位置,以引起其他蝠鲼的注意。對蝠鲼群體而言,空翻覓食是一個隨機(jī)的、局部的和頻繁的動作,它可以提高蝠鲼群體的覓食效益,其數(shù)學(xué)模型如式(4):
其中:S是空翻因子,決定空翻的距離;r2和r3是服從[0,1]均勻分布的兩個隨機(jī)數(shù)。隨著S取值不同,蝠鲼個體會空翻至搜索空間中和當(dāng)前位置關(guān)于最優(yōu)解對稱的位置。如果當(dāng)前位置和最優(yōu)解相距較遠(yuǎn),則空翻后位置與最優(yōu)解相距也較遠(yuǎn),表征著對搜索空間的探索;如果當(dāng)前位置和最優(yōu)解相距較近,則空翻后位置與最優(yōu)解也較近,表征著對最優(yōu)解附近空間的開發(fā)。
MRFO 是針對連續(xù)空間函數(shù)優(yōu)化問題設(shè)計(jì)的,為解決工程中的頻譜分配問題須對蝠鲼覓食優(yōu)化算法進(jìn)行離散化處理。此外,由于頻譜分配問題中僅有{0,1}兩種狀態(tài),故本文主要探索如何將適用于連續(xù)空間的MRFO 算法離散為二進(jìn)制空間的優(yōu)化算法。因此,在對MRFO 算法離散化的過程中需滿足兩點(diǎn):首先是要保留覓食行為的不變性,即將連續(xù)空間中的覓食行為映射到二進(jìn)制空間后相應(yīng)的覓食動作應(yīng)保持不變;其次是搜索空間應(yīng)和待解決的實(shí)際問題相匹配,即搜索空間的一個解(位置)對應(yīng)著解決問題的一種方案。在MRFO 算法中,通過分析式(1)~(4)可知,各式中等號左邊代表t+1 時刻蝠鲼的位置,而等號右邊第一項(xiàng)表示t時刻蝠鲼所在位置,其余項(xiàng)之和的含義為t時刻蝠鲼的位移,即速度v(t)。速度作為蝠鲼個體t時刻的移動距離直接與t時刻的位置相加決定蝠鲼t+1 時刻的位置。然而,在離散二進(jìn)制問題中,解屬于{0,1}二進(jìn)制集,對解的每一維參數(shù)僅存在“變”和“不變”兩種情況,因此應(yīng)將連續(xù)空間中速度的方向性和長短性通過適當(dāng)?shù)挠成浔碚鳛槎M(jìn)制空間中的“變”和“不變”兩種情況。
本文首先將速度離散為二進(jìn)制值,然后采用異或算子求解新的位置。首先利用Sigmoid 函數(shù)對連續(xù)空間中的速度變量進(jìn)行離散化,設(shè)(t)表示t時刻的連續(xù)速度變量,則采用SF 法離散速度的步驟如下:
則SF[(t)]為對連續(xù)變量(t)二進(jìn)制離散化后的結(jié)果。其中rand(1)表示生成一個服從[0,1]均勻分布的隨機(jī)數(shù)。如果在連續(xù)空間中t時刻的速度變量較大則說明t時刻蝠鲼的位置與t+1 時刻的位置相距較遠(yuǎn),對應(yīng)于二進(jìn)制空間蝠鲼t+1 時刻的位置相對于t時刻則應(yīng)“變”;反之則應(yīng)“不變”。因此,t+1 時刻新的位置更新公式如式(7)所示:
其中⊕為異或符號。如果連續(xù)空間中t時刻的速度變量較大則由式(6)映射后速度為1 的概率會較大,經(jīng)式(7)異或運(yùn)算后(t+1)相對于(t“)變”的概率也較大;反之,則(t+1)相對于(t)“不變”概率較大。因此,本文首先采用式(5)~(6)表示的SF 離散法將連續(xù)空間的速度映射到離散的二進(jìn)制空間,然后再用式(7)所代表的異或算子計(jì)算下一時刻的位置。本文提出的DMRFO 中的三個覓食過程分別簡述如下:
1)離散鏈?zhǔn)揭捠尺^程。在MRFO 算法中,速度作為蝠鲼個體當(dāng)前時刻的位移存在方向性和長短性,但在離散二進(jìn)制問題中解(位置)屬于{0,1}二進(jìn)制集,對解的每一維參數(shù)僅存在變和不變兩種情況。鏈?zhǔn)揭捠尺^程中如果當(dāng)前位置與全局最優(yōu)位置、前一個體的位置存在較大差異時,速度的絕對值會較大,此時該維參數(shù)應(yīng)該以更大概率向全局最優(yōu)和前一個體學(xué)習(xí),即變;而如果當(dāng)前位置與全局最優(yōu)位置、前一個體的位置相同時,速度的絕對值會較小,同時當(dāng)前位置已為最優(yōu)的概率較大,此時則應(yīng)保持不變。因而本文將速度離散為二進(jìn)制值,并以其和當(dāng)前位置進(jìn)行異或求解新的位置。離散鏈?zhǔn)揭捠尺^程的速度定義如式(8):
其中c1、c2和c3為權(quán)重系數(shù)。引入調(diào)節(jié)因子c3r3是因?yàn)槿绻麅H以求差之后的絕對值作為評價當(dāng)前位置與全局最優(yōu)的量度(式(8)的前2 項(xiàng)),此時(t)屬于閉區(qū)間[0,c1+c2],經(jīng)由Sigmoid 函數(shù)映射后值在0.5 以上,具有不公平性,于是進(jìn)一步引入調(diào)節(jié)因子c3r3以保證映射過程取1 和0 的公平性。將式(8)代入式(7)中可得離散化鏈?zhǔn)揭捠车臄?shù)學(xué)模型如式(9):
為分析算法的公平性,取數(shù)學(xué)期望進(jìn)行分析。當(dāng)i≥2 時的計(jì)算推導(dǎo)過程如式(10):
為保證映射過程取1 和0 的公平性,則權(quán)重系數(shù)應(yīng)滿足約束條件:c1=c2,c3=0.5(c1+c2)。當(dāng)c1=c2=4 時可得不同情況下速度離散概率分析如表1。
由表1 可以看出,當(dāng)全局最優(yōu)和前一蝠鲼位置一致,但與當(dāng)前蝠鲼位置不一致時,(t)的期望值為2、離散為1 的概率為0.88,此時異或出的新位置將以較大概率向全局最優(yōu)、前一蝠鲼的位置靠近,即相對于當(dāng)前值變;當(dāng)前位置、全局最優(yōu)、前一蝠鲼三者一致時,(t)的期望值為-2、離散為0 的概率為1-0.12=0.88,即異或運(yùn)算后當(dāng)前位置以較大概率保持不變;而其他情況下,位置變與不變概率相等。因此,在離散鏈?zhǔn)揭捠尺^程中,蝠鲼會向全局最優(yōu)和前一個體學(xué)習(xí)并根據(jù)t時刻速度大小自適應(yīng)調(diào)整t+1 時刻的位置。
表1 鏈?zhǔn)揭捠车乃俣入x散概率分析Tab.1 Discrete probability analysis of velocity in chain foraging
2)離散螺旋覓食過程。在MRFO 算法的螺旋覓食過程中蝠鲼群體在最優(yōu)解附近進(jìn)行螺旋運(yùn)動,以增強(qiáng)對最優(yōu)解附近空間的開發(fā)性能。在離散二進(jìn)制空間內(nèi)圍繞最優(yōu)解的螺旋運(yùn)動過程中,解的每一維參數(shù)只有變和不變兩種情況。因此以MFRO 算法計(jì)算出的連續(xù)螺旋覓食速度式(11)作為參考變量采用SF 離散化得到的離散螺旋覓食的數(shù)學(xué)模型如式(12)所示:
根據(jù)認(rèn)知無線中頻譜分配的要求,應(yīng)使得在最優(yōu)解附近空間螺旋覓食的搜索結(jié)果具有親1 特性。故取數(shù)學(xué)期望對離散螺旋覓食過程的親1 性進(jìn)行分析,當(dāng)i≥2,螺旋系數(shù)β=4 時,不同情況下速度的離散概率如表2 所示。
表2 螺旋覓食的速度離散概率分析Tab.2 Discrete probability analysis of velocity in spiral foraging
由表2 可以看出,當(dāng)全局最優(yōu)解為0 時,根據(jù)頻譜分配問題可知其為全局最優(yōu)的概率較小,故此處設(shè)計(jì)新解應(yīng)該以更大的概率變;當(dāng)全局最優(yōu)解為1 時,根據(jù)頻譜分配問題可知其為全局最優(yōu)的概率較大,故此處設(shè)計(jì)新解應(yīng)該以更大的概率不變;其余情況下新解變與不變概率相等。離散化螺旋覓食策略可以使對最優(yōu)解附近的開發(fā)結(jié)果以較大概率朝著1的方向改變。離散化螺旋覓食的親1 特性符合認(rèn)知無線電中工程實(shí)際問題的要求,有利于提升對最優(yōu)解附近空間的開發(fā),從而避免算法陷入局部最優(yōu)。
3)離散空翻覓食過程。由于直接采用MRFO 算法中空翻覓食的速度計(jì)算式(4)計(jì)算出的速度存在長短性和方向性,而二進(jìn)制問題只存在變與不變,故在離散化時需對之進(jìn)行二進(jìn)制的修正,如式(13)。離散空翻覓食過程的數(shù)學(xué)模型如式(14):
其中:r1、r2和r3分別是服從[0,1]均勻分布的隨機(jī)數(shù),r3為調(diào)節(jié)因子;S為空翻系數(shù)。引入調(diào)節(jié)因子是為了保證映射過程取1 和0 的公平性。當(dāng)S=4 時,離散空翻覓食過程中不同情況下速度離散概率分析如表3 所示。
由表3 可知,當(dāng)前解和全局最優(yōu)解不一致時,當(dāng)前解發(fā)生變化的概率為0.88;當(dāng)前解和全局最優(yōu)解一致時,當(dāng)前解變的概率為0.12。該過程可以保證當(dāng)前解不斷向全局最優(yōu)靠近和學(xué)習(xí)。
表3 空翻覓食的速度離散概率分析Tab.3 Discrete probability analysis of velocity in somersault foraging
綜上所述,在DMRFO 中蝠鲼會向全局最優(yōu)解和前一個體學(xué)習(xí)并根據(jù)t時刻速度大小自適應(yīng)調(diào)整t+1 時刻的位置。同時,針對認(rèn)知無線電頻譜分配問題的特定背景在離散螺旋覓食過程中引入最優(yōu)解親1 性的先驗(yàn)知識,通過在全局最優(yōu)解附近進(jìn)行二進(jìn)制螺旋覓食從而避免算法陷入局部最優(yōu)以提升算法解決頻譜分配問題的性能。此外,為提高算法的可移植性,最優(yōu)解親1 性的先驗(yàn)知識僅由螺旋系數(shù)β控制。
在認(rèn)知無線電網(wǎng)絡(luò)中,認(rèn)知用戶使用非授權(quán)頻段的前提條件是不能干擾授權(quán)用戶的通信,即授權(quán)用戶有通信請求時認(rèn)知用戶應(yīng)及時退出該頻段。實(shí)際通信環(huán)境中授權(quán)用戶、認(rèn)知用戶數(shù)量都是不斷變化的。如果頻譜分配的計(jì)算時間相對于通信環(huán)境變化可忽略,則在一個較短的時隙內(nèi)可認(rèn)為信道參數(shù)不變。因此,頻譜分配模型可通過頻譜可用性矩陣L、效益矩陣B、干擾矩陣C和分配矩陣A描述。假設(shè)通信環(huán)境中認(rèn)知用戶數(shù)量為N,可用頻譜數(shù)為M,則頻譜分配模型的主要參數(shù)[5,19-20]可表示為:
1)頻譜可用性矩陣:L={ln,m|ln,m∈{0,1}}N×M是一個N×M的二進(jìn)制矩陣,表征頻譜的可用性。即ln,m=1 表示認(rèn)知用戶n可以使用頻帶m;否則用戶n不可使用頻帶m。
2)效益矩陣:B={bn,m|bn,m∈R+}N×M,其中bn,m是一個正實(shí)數(shù),表示認(rèn)知用戶n使用頻帶m后能帶來的網(wǎng)絡(luò)效益。
3)干擾約束矩陣:C={cn,k,m|cn,k,m∈{0,1}}N×N×M是由M個N×N的二維矩陣組成的三維矩陣,表征認(rèn)知用戶之間的干擾約束情況。其中cn,k,m=1 表示認(rèn)知用戶n和認(rèn)知用戶k同時使用頻帶m會產(chǎn)生干擾;cn,k,m=1 表示認(rèn)知用戶n、k可同時 使用頻帶m。顯然n=k時,cn,n,m的取值由ln,m決定,即cn,n,m=1-ln,m。
4)分配矩陣:A={an,m|an,m∈{0,1}}N×M是一個N×M的二維矩陣,它代表在某一時隙上M個頻帶對N個認(rèn)知用戶的無干擾分配策略,其中an,m=1 表示認(rèn)知用戶n在此時隙內(nèi)使用頻帶m。顯然,分配矩陣必須滿足分配時無干擾的條件,即:當(dāng)cn,k,m=1 時,對?n,k∈[1,N],m∈[1,M],有an,m+ak,m≤1。
基于以上描述,第n個認(rèn)知用戶所能獲得的網(wǎng)絡(luò)效益為
整個通信網(wǎng)絡(luò)所能獲得的網(wǎng)絡(luò)總效益為
如果設(shè)Λ(L,C)N,M表示在給定N、M以及L和C約束情況下的無干擾頻譜分配策略集,則頻譜分配問題可轉(zhuǎn)化為如下的最優(yōu)化問題:
頻譜的最終分配策略記錄在分配矩陣A中,直接對A進(jìn)行編碼,則搜索空間的維數(shù)為N×M,編碼維度較高??紤]到A受頻譜可用性矩陣L的約束,L中值為0 的元素所對應(yīng)的A的元素值必定為0,因?yàn)椴豢捎妙l譜必定不能被分配,因此只需將L中值為1 的元素提取出來進(jìn)行編碼,頻譜分配完畢后再根據(jù)之前的對應(yīng)關(guān)系還原即可。如圖1 所示,L為4× 5二維矩陣,縮減為一維矩陣x后,成為一個1× 7 一維矩陣,解x的維數(shù)由20 縮減為7,搜索空間由220降為27,極大壓縮了搜索空間。
圖1 搜索空間壓縮與還原實(shí)例Fig.1 Example of search space compression and recovery
搜索空間中,解x的各維參數(shù)與A的元素存在一一對應(yīng)的關(guān)系,當(dāng)x的某一維參數(shù)由0 變?yōu)? 時,意味著系統(tǒng)嘗試將某一信道分配給某個認(rèn)知用戶,如分配滿足無干擾分配條件則網(wǎng)絡(luò)總效益U(β)將會增加由該用戶在該信道通信帶來的效益值;如分配不滿足無干擾分配條件,則系統(tǒng)根據(jù)干擾矩陣C隨機(jī)拒絕當(dāng)前某一認(rèn)知用戶的通信請求,即將存在干擾的兩個參數(shù)中的一個隨機(jī)置0。相反,解x的某一維參數(shù)由1變?yōu)? 雖不會帶來干擾沖突,但卻意味著讓某個用戶退出在某一信道上的通信,此時網(wǎng)絡(luò)總效益U(β)必定減小,雖嘗試了新的解,但卻不是朝著網(wǎng)絡(luò)總效益增大的方向。因此,頻譜分配問題的解x具有親1 特性,DMRFO 算法應(yīng)引導(dǎo)解朝著由0 向1 的方向搜索。
基于以上描述,首先根據(jù)頻譜分配模型對實(shí)際頻譜分配問題進(jìn)行建模,然后將待分配矩陣A壓縮為x,則x張成的二進(jìn)制空間即為優(yōu)化算法的搜索空間,基于DMRFO 的頻譜分配算法偽碼如下所示。
仿真通信環(huán)境的參數(shù)L、B、C、M、N設(shè)置如下:L為隨機(jī)生成的0、1 矩陣;B的元素值為從1 到10 間隨機(jī)選取的實(shí)數(shù);C為各二維矩陣隨機(jī)生成的0、1 二元對稱陣;可用頻譜數(shù)M=22;認(rèn)知用戶數(shù)N=20。
3.1.1 DMRFO參數(shù)比較
本實(shí)驗(yàn)旨在驗(yàn)證前文對MRFO 算法離散化過程分析的正確性及所提DMRFO 算法的有效性。在DMFRO 算法中參數(shù)c1和c2取值不同會影響覓食行為中的選擇概率,因此本實(shí)驗(yàn)設(shè)定群體規(guī)模SN=50,最大迭代次數(shù)T=500,進(jìn)行100 次獨(dú)立實(shí)驗(yàn)觀測本文算法的平均收斂情況以研究參數(shù)對算法收斂過程的影響。參數(shù)c1和c2取不同值時本文算法的收斂結(jié)果如圖2 所示。
圖2 不同參數(shù)的算法收斂過程對比Fig.2 Algorithm convergence process comparison of different parameters
通過圖2 可知,參數(shù)c1和c2的大小會影響DMRFO 算法的收斂速度,但對算法的收斂精度影響較小。因此,綜合實(shí)驗(yàn)結(jié)果和前文的理論分析,在本文后續(xù)實(shí)驗(yàn)中設(shè)定c1=4、c2=4。
3.1.2 DMRFO魯棒性分析
為分析本文算法在解決頻譜分配問題時的魯棒性,在參數(shù)c1=4、c2=4 的情況下,將本文算法(DMRFO)和離散人工蜂群算法(DABC)、二進(jìn)制粒子群算法(BPSO)以及改進(jìn)的二進(jìn)制粒子群算法(IBPSO)分別獨(dú)立運(yùn)行100 次以研究算法對隨機(jī)因素的魯棒性,實(shí)驗(yàn)結(jié)果如圖3 所示。表4 為不同算法對應(yīng)的均值和標(biāo)準(zhǔn)差指標(biāo)值。
綜合圖3 和表4 可知,本文提出的DMRFO 算法的均值和標(biāo)準(zhǔn)差都優(yōu)于其他3 個算法。均值反映了算法收斂精度的優(yōu)劣,而標(biāo)準(zhǔn)差反映了收斂結(jié)果的穩(wěn)定性。因此,本文算法在收斂性能上優(yōu)于DABC、BPSO 和IBPSO 算法。
圖3 不同算法的魯棒性對比Fig.3 Robustness comparison of different algorithms
表4 不同算法的均值和標(biāo)準(zhǔn)差Tab.4 Mean and standard deviation of different algorithms
3.2.1 最大網(wǎng)絡(luò)效益仿真
頻譜分配基于某一瞬間信道環(huán)境不變的假設(shè),以最大化網(wǎng)絡(luò)效益為目標(biāo)函數(shù),故要求算法能夠快速高效地收斂。本文對DMRFO 算法和DABC、BPSO、IBPSO 等典型算法在相同信道環(huán)境下進(jìn)行對比,分別獨(dú)立重復(fù)30 次實(shí)驗(yàn)后得到的平均網(wǎng)絡(luò)總效益收斂曲線如圖4。
圖4 不同算法的網(wǎng)絡(luò)總效益收斂曲線Fig.4 Convergence curves of network total benefit of different algorithms
由圖4 可知,DMFRO 的收斂結(jié)果遠(yuǎn)優(yōu)于DABC、BPSO 和IBPSO 算法。該實(shí)驗(yàn)說明相比經(jīng)典的算法,本文提出的DMRFO 算法更適合解決頻譜分配問題。這是因?yàn)槭紫萂FRO 的機(jī)制本身要優(yōu)于DABC 和BPSO,其次通過設(shè)計(jì)離散化策略將頻譜分配問題的先驗(yàn)性信息有效融入到了DMFRO算法的運(yùn)行機(jī)制中。
3.2.2 不同環(huán)境下網(wǎng)絡(luò)總效益仿真
為驗(yàn)證本文算法的普遍性,分別采用本文算法對30 種不同的通信環(huán)境進(jìn)行頻譜分配仿真實(shí)驗(yàn),不同通信環(huán)境下獲得的最大網(wǎng)絡(luò)總效益及和其他典型算法的對比如圖5所示。
圖5 不同通信環(huán)境下不同算法的網(wǎng)絡(luò)總效益Fig.5 Network total benefits of different algorithms in different communication environments
由圖5 可知,隨著通信環(huán)境不同,認(rèn)知用戶使用空閑信道的頻譜后能帶來的網(wǎng)絡(luò)總效益也不同,但本文算法所帶來的網(wǎng)絡(luò)總效益始終大于DABC、BPSO 和IBPSO 算法獲得的網(wǎng)絡(luò)總效益。因此,本文提出的DMRFO 算法具有更好的頻譜分配性能。
3.3.1 不同用戶數(shù)下的平均效益
設(shè)環(huán)境中可用頻譜數(shù)M=22 保持不變,當(dāng)認(rèn)知用戶數(shù)N不斷增加時,認(rèn)知用戶的平均效益隨認(rèn)知用戶數(shù)的變化曲線如圖6 所示,可以看出,隨著認(rèn)知用戶數(shù)不斷增加,單個認(rèn)知用戶能獲得的平均效益呈遞減變化。
由圖6 可知,在認(rèn)知用戶數(shù)較少時,即頻譜資源充足,四種頻譜分配算法的結(jié)果相近;但當(dāng)認(rèn)知用戶數(shù)較多時,即頻譜資源比較緊缺,本文算法的分配結(jié)果顯著優(yōu)于其他三種經(jīng)典算法。
圖6 認(rèn)知用戶數(shù)N遞增時的平均效益Fig.6 Average benefit with the number of cognitive users N increasing
3.3.2 不同信道數(shù)下的平均效益
設(shè)認(rèn)知用戶數(shù)N=20 不變,當(dāng)可用頻譜數(shù)M不斷增加時,單個認(rèn)知用戶獲得的平均效益值曲線如圖7 所示,隨著可用頻譜數(shù)的增加,單個用戶獲得的平均效益值不斷增加,且DMRFO 算法顯著優(yōu)于其他3 種算法。
隨著通信環(huán)境中可用頻譜數(shù)M增加,頻譜分配問題的求解規(guī)模越大。從圖7 可知,當(dāng)求解問題的規(guī)模較小時,4 種算法都能取得最優(yōu)結(jié)果,但隨著求解問題規(guī)模遞增,DMRFO 算法的性能顯著優(yōu)于其他3 種典型算法。
圖7 可用頻譜數(shù)M遞增時的平均效益Fig.7 Average benefit with the number of available spectrums M increasing
綜上所述,本文提出的基于DMRFO 的頻譜分配算法顯著優(yōu)于典型的DABC、BPSO 和IBPSO 頻譜分配算法。
針對MRFO 算法只能處理連續(xù)函數(shù)的優(yōu)化問題而不能解決頻譜分配問題的不足,本文提出了DMRFO 算法,然后將該算法應(yīng)用于解決認(rèn)知無線電中的頻譜分配問題。本文的主要工作如下:
1)通過SF 離散法和異或算子使蝠鲼可以根據(jù)當(dāng)前時刻速度大小自適應(yīng)調(diào)整下一時刻的位置從而向全局最優(yōu)解和前一個體學(xué)習(xí)。同時,針對認(rèn)知無線電頻譜分配問題的特定背景,在離散螺旋覓食過程中引入最優(yōu)解親1 性的先驗(yàn)知識,通過在全局最優(yōu)解附近進(jìn)行二進(jìn)制螺旋覓食從而避免算法陷入局部最優(yōu),以提升算法解決頻譜分配問題的性能。此外,為提高算法的可移植性,最優(yōu)解親1 性的先驗(yàn)知識僅由螺旋系數(shù)β控制,從而方便了先驗(yàn)性知識的引入和刪除。
2)將本文提出的離散蝠鲼覓食優(yōu)化算法用于解決認(rèn)知無線電中的頻譜分配問題,顯著提升了網(wǎng)絡(luò)的效益,取得了較好的效果。