劉陽陽戴明威黃曉霞
1(中國科學(xué)院深圳先進(jìn)技術(shù)研究院 深圳 518055)
2(中國科學(xué)院大學(xué) 北京 100049)
基于分層Dirichlet過程的頻譜利用聚類和預(yù)測
劉陽陽1,2戴明威1,2黃曉霞1
1(中國科學(xué)院深圳先進(jìn)技術(shù)研究院 深圳 518055)
2(中國科學(xué)院大學(xué) 北京 100049)
認(rèn)知無線電網(wǎng)絡(luò)通過動態(tài)頻譜接入技術(shù),利用授權(quán)頻段的空閑時段實(shí)現(xiàn)頻譜共享。對頻譜利用特征的描述和未來利用率的預(yù)測有利于實(shí)現(xiàn)高效頻譜感知算法,進(jìn)而優(yōu)化頻譜接入策略。通過對標(biāo)準(zhǔn)的分層Dirichlet過程進(jìn)行擴(kuò)展,提出了一種跨信道的非參數(shù)貝葉斯模型UTD-HDP(UTD擴(kuò)展的分層Dirichlet過程),用于無線頻譜利用率數(shù)據(jù)的聚類分析和分布參數(shù)估計(jì)。利用該模型,可以自適應(yīng)地描述無線頻譜利用率的特征,實(shí)現(xiàn)了對未來時間頻譜利用率的高精度預(yù)測。
頻譜利用特征提取;頻譜利用預(yù)測;分層Dirichlet過程;Ginns采樣
無線頻譜是一種有限、寶貴的自然資源,國際通信聯(lián)盟(International Telecommunication Union)定義可用的無線頻譜上限為3000 GHz。為防止不同設(shè)備的相互干擾,當(dāng)前無線網(wǎng)絡(luò)采用固定的頻譜分配政策:由政府部門根據(jù)不同無線電業(yè)務(wù)的技術(shù)特點(diǎn)、業(yè)務(wù)能力、帶寬需求等因素劃分不同的頻段。隨著通信技術(shù)的不斷發(fā)展,各種無線應(yīng)用如廣播、電視、移動通信等不斷涌現(xiàn),無線頻譜資源將被耗盡已成為業(yè)界的共識。
調(diào)查發(fā)現(xiàn),無線頻譜各頻段利用率介于15%~85%,而且不同頻段頻譜利用率在不同時間和地域呈現(xiàn)出很強(qiáng)的波動性[1]。為解決無線頻譜資源耗盡的問題,提高無線頻譜利用率,研究人員提出了認(rèn)知無線電網(wǎng)絡(luò)的概念[2,3]。認(rèn)知無線電網(wǎng)絡(luò)采用動態(tài)頻譜接入技術(shù),利用授權(quán)頻譜的空閑時段進(jìn)行通信,實(shí)現(xiàn)頻譜共享,從而提高頻譜利用率。在認(rèn)知無線電網(wǎng)絡(luò)系統(tǒng)中,非授權(quán)用戶可以感知授權(quán)信道的頻譜占用狀態(tài),然后利用授權(quán)信道的空閑時隙進(jìn)行通信,并且在授權(quán)用戶需要通信時退出授權(quán)信道。
檢測授權(quán)頻譜利用率的動態(tài)變化需要精確的頻譜感知技術(shù)和快速的頻譜轉(zhuǎn)換策略。這對于實(shí)時變化的頻譜利用來說難度極大,無法實(shí)現(xiàn)。因此通過對授權(quán)用戶使用無線頻譜資源的模型和規(guī)律進(jìn)行挖掘,實(shí)現(xiàn)頻譜利用率的預(yù)測,對設(shè)計(jì)高效的頻譜感知算法和頻譜接入策略具有十分重要的意義。目前,頻譜預(yù)測技術(shù)主要有兩類:信號強(qiáng)度預(yù)測和信道占用狀態(tài)預(yù)測[4]。對于信道的信號強(qiáng)度預(yù)測,主要有基于自回歸滑動平均模型(AutoregressiveMovingAverageModel,ARMA)[5,6]、自回歸積分滑動平均模型(Autoregressive Integrated Moving Average Model,ARIMA)[7]進(jìn)行回歸分析的方法,以及結(jié)合了經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)的支持向量回歸(Support Vector Regression,SVR)方法;而對于信道占用狀態(tài)的預(yù)測,主要有基于馬爾科夫鏈[8,9],隱馬爾科夫模型[9]以及頻繁模式挖掘[4,10]等方法。以上方法均能達(dá)到一定的預(yù)測精度。
ARMA、SVR回歸分析和基于馬爾科夫鏈的方法只能對單個信道的利用率或占用狀態(tài)進(jìn)行回歸分析和建模預(yù)測。考慮到信道間的相關(guān)性,本文采取了一種基于分層Dirichlet過程的無限混合模型,將一組信道的利用率數(shù)據(jù)表示為一組無限混合的概率分布模型。這是一種非參數(shù)貝葉斯模型,模型中的參數(shù)個數(shù)不是固定的,而是自適應(yīng)地隨著數(shù)據(jù)變化[11,12]。通過應(yīng)用分層Dirichlet過程,在統(tǒng)一的模型中對多個不同信道的利用率數(shù)據(jù)進(jìn)行建模,可以將一組信道的利用率數(shù)據(jù)聚類為不同的模式,實(shí)現(xiàn)跨信道的模式類共享,從而實(shí)現(xiàn)魯棒性更好的建模和預(yù)測。特別是在數(shù)據(jù)稀疏的情況下進(jìn)行建模預(yù)測時,可以結(jié)合其他信道的數(shù)據(jù)減小數(shù)據(jù)缺失對預(yù)測精度的影響。
分層Dirichlet過程是Dirichlet過程在隨機(jī)分布上的層次泛化,本文簡要介紹這兩種模型及其在數(shù)據(jù)聚類中的應(yīng)用。
2.1 Dirichlet過程混合模型
Dirichlet過程是一種隨機(jī)過程。1973年, Ferguson[13]提出其定義:假設(shè)G0是測度空間上的隨機(jī)概率分布,參數(shù)α是正實(shí)數(shù),如果空間上的概率分布G滿足對的任意一個有限劃分A1,A2,…,Ar,均有,則G服從由基分布G0和參數(shù)α確定的Dirichlet過程[11],記為
令X={x1,x2,…,xn}為觀測數(shù)據(jù)的集合, Dirichlet過程混合模型可以將觀測數(shù)據(jù)xi聚類,每類由一個概率密度函數(shù)f(θi)表示。Dirichlet過程混合模型可以用如下的生成式模型表示:
其中,G為關(guān)于θi的先驗(yàn)分布,服從Dirichlet過程;為Concentration參數(shù);G0為基分布;θi為聚類的類參數(shù),用以描述每個類的概率分布f(θi)?;植糋0可以連續(xù)分布或離散分布,而DP(α,G0)以概率1將先驗(yàn)分布G0離散化,從而使得觀測數(shù)據(jù)可以形成聚類[14],這是一個無限混合模型。與K-means等聚類方法不同,類參數(shù)θi的個數(shù)不是指定的,而是與觀測數(shù)據(jù)xi的個數(shù)相等。若兩個數(shù)據(jù)的類參數(shù)相等,即θi=θj,則xi和xj隸屬于同一類。
2.2 分層 Dirichlet 過程混合模型
Dirichlet過程混合模型可以對單組數(shù)據(jù)進(jìn)行聚類分析和分布參數(shù)估計(jì),但是無法描述多組數(shù)據(jù)間共享聚類的特性。非參數(shù)貝葉斯模型分層Dirichlet過程(Hierarchical Dirichlet Process, HDP)[11,12]混合模型的提出,為多組數(shù)據(jù)間共享聚類問題提供了解決方法。
令X1,X2,…,XJ表示J組數(shù)據(jù),其中Xj={xj1,xj2,…,xjnj}。與Dirichlet過程混合模型相似,分層 Dirichlet過程混合模型對每組數(shù)據(jù)分別定義了一個概率分布Gj,作為每組數(shù)據(jù)中每個觀測數(shù)據(jù)xji對應(yīng)類參數(shù)θji的先驗(yàn)分布。為在多組數(shù)據(jù)間共享聚類,使。其中,G0為全局概率分布,滿足;為 Concentration參數(shù);H為基分布。這是一個兩層的分層Dirichlet過程,其生成式模型表示為:
其中,xji表示第j組數(shù)據(jù)中第i個數(shù)據(jù);θji為jji對應(yīng)的類參數(shù)。
注意到基分布H本身也可以定義為服從Dirichlet過程,因此分層Dirichlet過程可以根據(jù)需要繼續(xù)擴(kuò)展分層。分層Dirichlet過程混合模型的參數(shù)推斷主要有變分推斷和馬爾科夫鏈蒙特卡羅(Markov Chain Monte Carlo,MCMC)采樣方法兩種。Teh[11]給出了分層Dirichlet過程在中國連鎖餐館過程(Chinese Restaurant Franchise,CRF)框架下的三種Ginns采樣算法,分別為基于CRF的后驗(yàn)采樣算法,增強(qiáng)表示的后驗(yàn)采樣算法和直接分配后驗(yàn)采樣算法。
本文使用基于分層 Dirichlet過程混合模型的非參數(shù)貝葉斯模型來對頻譜利用率數(shù)據(jù)進(jìn)行聚類分析和預(yù)測。無線頻譜可以細(xì)分為多個信道,本文將一組信道記為,每個信道的頻譜利用率數(shù)據(jù)為一個連續(xù)的時間序列,記為。其中,表示信道Cj在ti時刻的頻譜利用率。標(biāo)準(zhǔn)的分層Dirichlet過程混合模型無法描述含有時間變量的觀測數(shù)據(jù)。McInerney等[15]通過對標(biāo)準(zhǔn)分層 Dirichlet過程混合模型進(jìn)行擴(kuò)展,提出LocHDP模型,用于描述含有時間變量的人群地點(diǎn)觀測數(shù)據(jù)。借鑒LocHDP的擴(kuò)展方法,本文給出了針對信道頻譜利用率數(shù)據(jù)進(jìn)行建模分析擴(kuò)展的分層Dirichlet過程模型,稱為UTD-HDP模型。
3.1 UTD-HDP模型
頻譜利用率的高低主要取決于相應(yīng)服務(wù)的使用程度,頻譜利用率的變化與人們?nèi)粘I盍?xí)慣息息相關(guān)。令,其中,表示一周中的周一至周日;tji表示一天中的時間;該三元組表示信道Cj一周中dji這天tji時刻的頻譜利用率為uji。UTD-HDP模型的基本思想就是挖掘頻譜利用率數(shù)據(jù)變化的模式,建立非參數(shù)貝葉斯模型,并進(jìn)行預(yù)測。令θji表示xji對應(yīng)的模式類,一個觀測數(shù)據(jù)的概率分布可以表示為幾個模式類不同概率的混合,其似然度為:
在分層Dirichlet過程混合模型中,進(jìn)行多組數(shù)據(jù)分析的關(guān)鍵在于類參數(shù)的共享,例如在文檔主題分析中,詞匯表在主題間是共享的。而在頻譜利用率分析中,不同信道可能在某些時間表現(xiàn)出某種模式,但不同信道在相同模式下對應(yīng)的利用率可能也不同,例如廣播電視信號,不同信道可能在某個相同的時間點(diǎn)呈現(xiàn)不同的利用率模式。因此,對于頻譜利用率數(shù)據(jù)不同文檔的不同模式間共享時間變量即tji和dji,利用率變量uji則和相應(yīng)信道Cj相關(guān)。具體地來說,利用率uji為連續(xù)變量,使用高斯分布來描述其概率分布,如下:
為使時間分布平滑并且表示缺失時間的分布情況,同樣使用高斯分布來估計(jì)時間變量tji的概率分布,如下:
時間變量dji是離散的,使用多項(xiàng)分布來描述:
在分層Dirichlet過程混合模型中,為計(jì)算方便,式(5)(6)(7)中的分布參數(shù)均取相應(yīng)的共扼先驗(yàn)分布[16,17],如式(8)所示:
其中, 為Normal Inverse-Gamma分布;a、b和c均為超參數(shù)。
將該擴(kuò)展的分層Dirichlet過程混合模型記為UTD-HDP,其生成式過程如下所示:
(1)從一個Dirichlet過程中采樣全局概率分布G0,根據(jù)G0生成全局模式類的分布:
(2)對每個全局模式類 ,生成共享變量t和d相關(guān)的類參數(shù):
(3)對每個信道Cj,以G0為基分布,生成該信道中模式類的概率分布:
(4)對信道Cj中每個模式類θji,生成每個信道的利用率變量u相關(guān)的模式類參數(shù):
3.2 參數(shù)推斷
Teh等[11]給出了分層Dirichlet過程混合模型在中國連鎖餐館(CRF)框架下的三種Ginns采樣算法。在CRF框架中,每個觀測數(shù)據(jù)xji被看作一個顧客,每組數(shù)據(jù)則被視為一個餐館。對于每個顧客,首先被分配到一個餐桌,每個餐桌被分配一道菜,通過將顧客分配到不同的餐桌,每個餐桌分配菜來對顧客進(jìn)行聚類,分配到相同菜的顧客,也就是數(shù)據(jù),即隸屬于同一類。
本文擴(kuò)展了其中直接分配后驗(yàn)采樣算法,直接將每個數(shù)據(jù)分配給特定類,分配餐桌的過程由每組數(shù)據(jù)中每一類的餐桌數(shù)目mjk體現(xiàn)。每次采樣主要對五個變量進(jìn)行采樣,分別為每個數(shù)據(jù)所屬類θji,每組數(shù)據(jù)中每一類的餐桌數(shù)目mjk和類的全局概率分布φk,以及超參數(shù)α和γ。對于UTD-HDP模型,變量mjk和φk以及超參數(shù)α和γ的采樣過程與標(biāo)準(zhǔn)HDP模型相同,這里不再贅述。下面給出θji的采樣方法。
根據(jù)UTD-HDP模型定義,對于數(shù)據(jù)xji,已知分配給類k的其他數(shù)據(jù)時,xji隸屬于類k,即θjk=k的條件概率為:
將式(5)(6)(7)以及式(8)表示的參數(shù)共扼先驗(yàn)分布代入式(9)各項(xiàng),積分消參,可得
根據(jù)Teh等[11]研究結(jié)果,采樣公式為
圖1給出了UTD-HDP模型進(jìn)行參數(shù)推斷的Ginns采樣算法。首先進(jìn)行初始化,對各個訓(xùn)練數(shù)據(jù)隨機(jī)分配模式類,并計(jì)算對應(yīng)模型參數(shù),初始化完成后進(jìn)行Ginns采樣。實(shí)際應(yīng)用發(fā)現(xiàn),進(jìn)行100次迭代,算法即可收斂。
圖1 UTD-HDP模型的Gibbs采樣算法Fig.1 Gibbs sampling algorithm for UTD-HDP
3.3 利用率預(yù)測
對所觀測的樣本進(jìn)行Ginns采樣后,即可得到UTD-HDP模型的參數(shù)。根據(jù)該模型,可以預(yù)測未來某時刻各信道的頻譜利用率。
具體地,指定未來一個時刻,即一周中的日期變量d和這天中的時間變量t,根據(jù)3.1節(jié)定義的模型,UTD-HDP可以給出該時刻的利用率在[0,1]區(qū)間上的連續(xù)概率分布,從而得到該時刻的利用率預(yù)測值。對于某個信道Cj,該概率分布如下:
其中,X為觀測數(shù)據(jù)集合;表示根據(jù)X建立的UTD-HDP模型的參數(shù)集合;θ為分配的模式類;為利用率;d,t均為時間變量。
由貝葉斯定理,式(13)中,
因此,(13)式化簡為
其中,S表示共進(jìn)行S次采樣,上式表示取S次采樣的平均分布;角標(biāo)中的s表示第s次采樣得到的不同參數(shù)。
在深圳市取三個地點(diǎn):中國科學(xué)院深圳先進(jìn)技術(shù)研究院科研樓、深圳市寶安區(qū)某居民樓和深圳市南山區(qū)科技園某辦公樓,從2013年8月1日至2013年12月1日進(jìn)行歷時四個月的頻譜測量工作。使用能量探測法測量了315 M、433 M(對講機(jī)及遙控頻段)、470 M(數(shù)字電視頻段)、CDMA、GSM以及2.4G等六個頻段的各信道接收信號強(qiáng)度(Received Signal Strength Indication,RSSI)數(shù)據(jù)。本文以GSM下行頻段測量數(shù)據(jù)為例進(jìn)行實(shí)驗(yàn)分析。該頻段測量頻率范圍為948.9 MHz~959.7 MHz,測量分辨率為0.4 MHz,分為25個信道,每秒鐘掃描一次。對每個信道的接收信號強(qiáng)度數(shù)據(jù),根據(jù)經(jīng)驗(yàn)值設(shè)置頻譜占用的閾值,得到每秒鐘的占用狀態(tài),并根據(jù)占用周期得到每段時間的利用率水平。本文取其中20個信道從2013年10月15日0:00至2013年11月4日23:59共三周數(shù)據(jù)進(jìn)行分析。取前兩周每半個小時的利用率數(shù)據(jù)作為訓(xùn)練集,建立UTD-HDP模型,并根據(jù)該模型預(yù)測第三周的頻譜利用率,同觀測值進(jìn)行比較,分析預(yù)測精確度。
4.1 頻譜利用率聚類
選取適當(dāng)?shù)某瑓?shù),利用圖1算法對訓(xùn)練數(shù)據(jù)集進(jìn)行聚類分析,共發(fā)現(xiàn)8個模式類。圖2為一周中不同模式類的天概率分布,結(jié)果顯示不同的模式類在一周中出現(xiàn)概率各不相同。圖3為各個模式類在一天中不同時刻的概率密度,直方圖為該模式類中數(shù)據(jù)的概率分布。從圖3可以看出在各個模式類中,時間變量數(shù)據(jù)符合所對應(yīng)的高斯分布,且不同模式類發(fā)生的時間各不相同。各模式類中利用率變量的分布同各信道相關(guān),圖4展示了第5個模式類在第10至第18共9個信道利用率的概率密度。觀察可知,各信道中各個模式類中數(shù)據(jù)符合所對應(yīng)的高斯分布,并且不同信道的同一模式類的參數(shù)各不相同。圖5展示了各個模式類在第1至第9共9個信道的概率分布,可以看出不同信道中各個模式類的分布各異。綜上可以看出,所得結(jié)果符合UTD-HDP模型信道間共享時間變量,利用率變量局限于每個信道的定義,并且各個模式類在信道間實(shí)現(xiàn)共享,達(dá)到了建模目標(biāo)。
圖2 各個模式類在一周時間d的概率分布Fig.2 Probability distribution of days for each pattern
圖3 各個模式類的時間t概率分布Fig.3 Probability distribution of time for each pattern
圖4 第5個模式類在信道10~18中利用率u的概率分布Fig.4 Probability distribution of utilization for pattern 5 in channel 10-18
圖5 各個模式類在信道1~9的概率分布Fig.5 Probability distribution of patterns in channel 1-9
4.2 頻譜利用率預(yù)測
利用3.3節(jié)預(yù)測算法和通過前兩周數(shù)據(jù)建立UTD-HDP模型對這20個信道在第三周的頻譜利用率進(jìn)行預(yù)測。圖6展示了對第5、第7和第12共3個信道的預(yù)測結(jié)果。圖6顯示該算法對測試集中一周的頻譜利用率預(yù)測結(jié)果精度很高,平均平方誤差的平均值為0.0036。表1展示了這3個信道預(yù)測結(jié)果平均平方誤差(MSE)。
其中,N為測試數(shù)據(jù)個數(shù);ui為觀測值; 為預(yù)測值。
為進(jìn)行對比,采用Wang等[7]的ARIMA時間序列方法預(yù)測結(jié)果作為對比。注意到訓(xùn)練集中這兩周即2013年10月15日至2013年10月28日的測量數(shù)據(jù)缺失比較嚴(yán)重,每個信道實(shí)際應(yīng)為672個數(shù)據(jù),實(shí)際觀測數(shù)據(jù)平均為430個,數(shù)據(jù)缺失率達(dá)到36%。為建立ARIMA模型,對缺失數(shù)據(jù)進(jìn)行了周期平滑化處理。對每個信道,選取季節(jié)性乘法ARIMA模型進(jìn)行回歸預(yù)測,通過AIC(Akaike Information Criterion)準(zhǔn)則確定模型階數(shù),然后對第三周的頻譜利用率進(jìn)行預(yù)測。第5、第7和第12這3個信道的預(yù)測結(jié)果見圖7。從圖7可以看出,與UTD-HDP模型預(yù)測結(jié)果相比,ARIMA模型的預(yù)測結(jié)果精度略有不足。表1為分別利用UTD-HDP模型和ARIMA時間序列模型進(jìn)行預(yù)測(圖6和圖7)的3個信道的平均平方誤差,及20個信道的平均平方誤差的平均值。對比可知,與經(jīng)過周期平滑處理后的ARIMA模型預(yù)測結(jié)果相比,UTD-HDP模型的利用率預(yù)測平均平方誤差都有明顯減小,三個信道分別減少8.33%、73.3%和14.56%,20個信道的平均值減小了23.4%。UTD-HDP模型預(yù)測精度明顯更高。因此,UTD-HDP模型進(jìn)行預(yù)測時,通過跨信道的模式共享,其他信道的信息可以彌補(bǔ)某些信道數(shù)據(jù)缺失的影響,即可以有效解決數(shù)據(jù)稀疏的問題。
圖6 UTD-HDP模型的預(yù)測結(jié)果Fig.6 Prediction result using UTD-HDP
圖7 ARIMA模型的預(yù)測結(jié)果Fig.7 Prediction result usingARIMA
表1 兩種模型預(yù)測結(jié)果的平均平方誤差對比結(jié)果Table 1 Comparison result of MSE of prediction using ARIMA and UTD-HDP
在本文中,我們針對頻譜利用率在時間、頻率維度的相關(guān)性,對標(biāo)準(zhǔn)HDP模型進(jìn)行擴(kuò)展,提出了跨信道的多元信道利用率數(shù)據(jù)進(jìn)行建模分析的UTD-HDP模型。該模型可以對多個信道的頻譜利用率時間序列進(jìn)行聚類分析,挖掘信道利用率的模式類,并根據(jù)所建立的模型進(jìn)行利用率預(yù)測,并且達(dá)到較高的預(yù)測精度。
在未來工作中,一方面是進(jìn)行進(jìn)一步的實(shí)驗(yàn),考察分析不同信道數(shù)目以及時間長度對于聚類和預(yù)測精度的影響。另一方面,UTD-HDP模型的一個缺陷是需要調(diào)節(jié)參數(shù),不同參數(shù)對模式類聚類以及預(yù)測精度都有明顯影響,在圖1算法中添加超參數(shù)采樣過程以解決這一問題。
[1] Federal Communicaitons Commission.Notice of proposed rule making and order(FCC 03-222) [DB/OL].[2014-08-04].http://wen.cs.ucdavis. edu/~liu/289I/Material/FCC-03-322A1.pdf.
[2] Mitola J,Jr Maguire GQ.Cognitive radio:making software radios more personal[J].IEEE Personal Communications,1999,6(4):13-18.
[3] Akyildiz IF,Lee WY,Vuran MC,et al.Next generation/dynamic spectrum access/cognitive radio wireless networks:a survey[J].Computer Networks,2006,50(13):2127-2159.
[4] Huang P,Liu CJ,Li X,et al.Wireless spectrum occupancy prediction nased on partial periodic pattern mining[C]//IEEE 20th International Symposium on Modeling,Analysis&Simulation of Computer and Telecommunication Systems,2012: 51-58.
[5] Wen ZG,Luo T,Xiang WD,et al.Autoregressive spectrum hole prediction model for cognitive radio systems[C]//IEEE International Conference on Communications Workshops,2008:154-157.
[6] Su JZ,Wu W.Wireless spectrum prediction model nased on time series analysis method [C]//Proceedings of the 2009 ACM Workshop on Cognitive Radio Networks,2009:61-66.
[7] Wang Z,Salous S.Spectrum occupancy statistics and time series models for cognitive radio[J]. Journal of Signal Processing Systems,2011,62(2): 145-155.
[8] Ghosh C,Corderiro C,Agrawal DP,et al.Markov chain existence and hidden Markov models in spectrum sensing[C]//IEEE International Conference on Pervasive Computing and Communications,2009:1-6.
[9] Song CQ,Chen DW,Zhang Q.Understand the predictanility of wireless spectrum:a large-scale empirical study[C]//2010 IEEE International Conference on Communications,2010:1-5.
[10]Yin SX,Chen DW,Zhang Q,et al.Mining spectrum usage data:a large-scale spectrum measurement study[J].IEEE Transactions on Monile Computing,2012,11(6):1033-1046.
[11]Teh YW,Jordan MI,Beal MJ,et al.Hierarchical Dirichlet processes[J].Journal of the American Statistical Association,2006,101(476):1566-1581.
[12]Teh YW,Jordan MI,Beal MJ,et al.Sharing clusters among related groups:Hierarchical Dirichlet processes[C]//Advances in Neural Information Processing Systems,2005:1385-1392.
[13]Ferguson TS.A nayesian analysis of some nonparametric pronlems[J].The Annals of Statistics,1973,1(2):209-230.
[14]Jnandi S,Woolrich MW,Behrens TEJ.Multiplesunjects connectivity-nased parcellation using hierarchical Dirichlet process mixture models[J]. NeuroImage,2009,44(2):373-384.
[15]Mclnerney J,Zheng J,Rogers A,et al.Modelling heterogeneous location hanits in human populations for location prediction under data sparsity[C]// Proceedings of the 2013 ACM International Joint Conference on Pervasive and Uniquitous Computing,2013:469-478.
[16]Bishop CM.Pattern Recognition and Machine Learning[M].New York:Springer,2006.
[17]Murphy KP.Conjugate Bayesian Analysis of the Gaussian Distrinution[Z].2007.
Spectrum Utilization Clustering and Prediction Based on Hierarchical Dirichlet Process
LIU Yangyang1,2DAI Mingwei1,2HUANG Xiaoxia1
1(Shenzhen Institutes of Advanced Technology,Chinese Academy of Sciences,Shenzhen518055,China)
2(University of Chinese Academy of Sciences,Beijing100049,China)
Cognitive radio networks achieve spectrum sharing ny utilizing the idle periods of licensed nands via dynamic spectrum access technique. Spectrum characterization and prediction help perform more efficient spectrum sensing and then optimize spectrum access strategy. In the paper, UTD-HDP, a nonparametric Bayesian model, was introduced ny extending the standard HDP(Hierarchical Dirichlet Process) to perform utilization data clustering and distrinution parameters estimation. Using this model, we characterized the features of spectrum utilization adaptively and predicted the future spectrum utilization with high accuracy.
spectrum utilization feature extraction; spectrum utilization prediction; hierarchical Dirichlet process; Ginns sampling
TN 92
A
2014-04-04
:2014-08-04
劉陽陽(通訊作者),碩士研究生,研究方向?yàn)檎J(rèn)知無線電網(wǎng)絡(luò),E-mail:liu.yy@siat.ac.cn;戴明威,碩士研究生,研究方向?yàn)檎J(rèn)知無線電網(wǎng)絡(luò);黃曉霞,博士,研究員,博士生導(dǎo)師,研究方向?yàn)闊o線傳感網(wǎng)絡(luò)、認(rèn)知無線電網(wǎng)絡(luò)、無線通信和移動計(jì)算。