曾菊玲 張春雷 蔣礪思 夏 凌
①(三峽大學(xué) 宜昌 443002)
②(University of California,Irvine,CA,USA)
無線網(wǎng)絡(luò)虛擬化是5G的主要組網(wǎng)模式[1,2]。合適的網(wǎng)絡(luò)架構(gòu)和有效的資源分配策略是虛擬化的關(guān)鍵技術(shù)。文獻(xiàn)[3-5] 提出了資源提供者(Infrastructure Providers, InPs)直接向UEs(Users)提供資源的2級架構(gòu)模型,由于未將移動虛擬網(wǎng)絡(luò)操作者 (Mobile Virtual Network Operators, MVNOs)包含在內(nèi),InPs直接面向所有UEs,計(jì)算復(fù)雜度高,且無法實(shí)現(xiàn)虛擬資源管理。文獻(xiàn)[2,6] 提出了3級架構(gòu)模型,中間層MVNOs向UEs提供服務(wù),InPs與UEs解耦并被MVNOs共享,計(jì)算復(fù)雜度、資源利用及管理、系統(tǒng)效用及用戶體驗(yàn)得到改善,被廣泛采用?;?層架構(gòu)的多種分層聯(lián)合優(yōu)化資源分配模型被提了出來且常用分層博弈求解,文獻(xiàn)[7] 給出了一種通過機(jī)會頻譜共享實(shí)現(xiàn)虛擬化的機(jī)制,但非完全隔離降低了在虛擬網(wǎng)絡(luò)中的可實(shí)用性,文獻(xiàn)[8,9] 分別給出了基于合同理論及破產(chǎn)博弈的虛擬資源分配策略,分別采用 MVNOs與UEs或MVNOs與InPs 2級架構(gòu)以及僅MVNOs效用最優(yōu)難以保證整個網(wǎng)絡(luò)性能,文獻(xiàn)[10,11] 提出了3級架構(gòu)下2層聯(lián)合的分層拍賣機(jī)制,保證了整體效用最大和資源分配次優(yōu),但不能保證個體效用最大,特別地,對于無線虛擬網(wǎng)絡(luò),作為賣方的MVNO需要全部信道信息進(jìn)行中心決策,信道反饋開銷大,系統(tǒng)復(fù)雜,計(jì)算量大。文獻(xiàn)[12] 采用MVNOs與InPs以及UEs與MVNOs聯(lián)合分層匹配博弈機(jī)制,保證了各層及個體效用最優(yōu),去中心化的實(shí)現(xiàn)方法也使系統(tǒng)相對簡單,但還存在以下不足:(1)上、下兩層博弈不相關(guān)聯(lián)的效用函數(shù)及隨機(jī)價(jià)格導(dǎo)致一致收斂困難、層間循環(huán)迭代次數(shù)多、計(jì)算復(fù)雜度大;(2)信道狀態(tài)信息僅出現(xiàn)在InPs、未出現(xiàn)在MVNOs與UEs的效用函數(shù)中,導(dǎo)致整個博弈無法跟蹤信道變化;(3)分層匹配博弈僅實(shí)現(xiàn)了MVNOs控制下UEs與切片匹配,并未對功率、帶寬進(jìn)行優(yōu)化分配,不能實(shí)現(xiàn)基于信道特征的最大效用及較高資源利用率。因此,建立基于信道特征的優(yōu)化模型和具有耦合關(guān)聯(lián)的分層博弈以及切片選擇與資源分配同時(shí)實(shí)現(xiàn)的新博弈結(jié)構(gòu),尋找跟蹤信道、收斂快的自適應(yīng)策略是目前具有挑戰(zhàn)性的工作。
在分層博弈的下層,基于匹配實(shí)現(xiàn)UEs對切片的選擇,在上層,基于UEs與切片匹配關(guān)系,采用Stackelberg博弈實(shí)現(xiàn)基于信道特征的資源分配,將使效用及資源利用率優(yōu)化,策略更加完善[13]。
對于優(yōu)化模型,在用戶級以基于流帶寬的用戶滿意度定價(jià)效用函數(shù),既符合未來5G通信中以用戶為中心、以流媒體為主要承載模式的趨勢[14,15],也與分別以帶寬和功率為效用函數(shù)的MVNOs及In-Ps建立關(guān)聯(lián),加速循環(huán)迭代一致收斂,提高跟蹤信道能力。在MVNOs,根據(jù)其在上、下層博弈中的完全信息狀態(tài)和非完全信息狀態(tài),分別基于局部信道信息和平均信道信息對購買功率非對稱定價(jià),不僅使系統(tǒng)簡單易行,而且進(jìn)一步提高了跟蹤信道能力,特別是服從統(tǒng)計(jì)分布的局部信道信息在迭代中較快收斂于平均信息,進(jìn)一步加速循環(huán)迭代收斂。
本文提出一種基于信道定價(jià)的無線虛擬網(wǎng)絡(luò)資源分配策略:匹配/Stackelberg分層博弈。分別以基于流帶寬的用戶滿意度、系統(tǒng)帶寬及切片功率作為報(bào)酬函數(shù)建立3級聯(lián)合優(yōu)化模型,并采用匹配/Stackelberg分層博弈求解。在博弈下層,定義MVNOm--InPn對 mn及其與UEs的1對1匹配博弈以代替UEs與MVNOs的多對1匹配,對 mn定義基于信道平均信息的切片功率價(jià)格,加速上、下一致收斂并使UEs根據(jù)信道特征選擇最優(yōu) mn,證明均衡點(diǎn)存在并給出低復(fù)雜度的分布式拒絕-接收算法;在博弈的上層,基于UEs與 mn已匹配關(guān)系,形成InPs與 mn的Stackelberg博弈,給出基于信道局部信息的優(yōu)化功率定價(jià)和分配策略,使系統(tǒng)效用及資源利用率基于信道特征最優(yōu)。最后給出雙層循環(huán)過程圖及穩(wěn)定條件并仿真驗(yàn)證。
如圖1是3級架構(gòu)的無線虛擬網(wǎng)絡(luò)。考慮一個由NB個基站(BSs)組成的下行網(wǎng)絡(luò),最高層是InPs,不失一般性,假定1個InP包含1個基站,基站的每個信道抽象成1個切片,1個InP包含 NS個切片,每切片帶寬相同,功率可調(diào),假定每切片只能以不同價(jià)格同時(shí)服務(wù)1個MVNO。中間層是MVNOs,根據(jù)網(wǎng)絡(luò)狀況和資源價(jià)格等因素動態(tài)向InPs購買無線資源,每MVNO可以不同價(jià)格購買多個切片,以不同的價(jià)格向UEs提供服務(wù),第 m個MVNO(m ∈M )向1組UEsKm提供服務(wù),K =UmKm為UEs總數(shù),| K|表示集合K的基數(shù)。最底層是UEs,以業(yè)務(wù)流模式向MVNOs提出帶寬請求,每UEs可向多個MVNOs提出服務(wù)申請。系統(tǒng)工作流程為:UEs向MVNOs提出帶寬申請,再由MVNOs向InPs申請切片。
圖1 無線虛擬網(wǎng)絡(luò)3級架構(gòu)及分層博弈示意圖
系統(tǒng)需要優(yōu)化。當(dāng)切片帶寬相同時(shí),UEs與切片間需要根據(jù)信道質(zhì)量最優(yōu)匹配,才能使資源效率最高。另一方面,根據(jù)效用,UEs存在大帶寬帶來的良好用戶體驗(yàn)與購買帶寬付出更大代價(jià)之間的矛盾,MVNOs存在向UEs提供更多帶寬獲得更大收益與付出更大代價(jià)向InPs購買帶寬的矛盾,總功率受限時(shí),InPs存在切片提高功率獲得更大報(bào)酬與付出更大代價(jià)的矛盾。因此,UEs, MVNOs, InPs之間需要優(yōu)化選擇及合理定價(jià),才能使效用和資源利用率最大,需要建立一個基于信道的3階段聯(lián)合優(yōu)化模型。
在虛擬無線網(wǎng)絡(luò)中,流是業(yè)務(wù)的主要模式,基于流帶寬的用戶滿意度作為用戶層質(zhì)量度量,通??煞譃檎Z音流、視頻流、數(shù)據(jù)流,由于本文僅針對2層業(yè)務(wù),所以選擇數(shù)據(jù)流。滿意度函數(shù)
MVNO m 購買切片n 向UEk 提供帶寬的報(bào)酬函數(shù)
上述式(4)、式(8)、式(15)分別以用戶滿意度、系統(tǒng)帶寬收入、切片功率收入作為報(bào)酬函數(shù),再通過式(3)、式(6)、式(7),三者融合在信道質(zhì)量上,使上、下兩層都基于信道質(zhì)量博弈,相比文獻(xiàn)[12],信道信息僅出現(xiàn)在下層而上層完全基于隨機(jī)價(jià)格博弈,更容易加速循環(huán)迭代收斂,提高跟蹤信道能力。
上述3個優(yōu)化目標(biāo)式(4)、式(8)、式(15)需要聯(lián)合優(yōu)化才能達(dá)到系統(tǒng)最優(yōu),但涉及到相互關(guān)聯(lián)的3個層次,需要循環(huán)迭代,且是一個混合整數(shù)非線性規(guī)劃問題,具有NP-hard復(fù)雜度,要獲得中心化解決方案,需要較大的計(jì)算量和復(fù)雜的控制過程。因此,本文引入匹配/Stackelberg分層博弈進(jìn)行分解,得到一個分布式次優(yōu)方案??紤]到MVNOs向用戶提供帶寬與向InPs購買物理資源兩個方向具有一定獨(dú)立性,以MVNOs為中心,將原問題分解為分層博弈,如圖1所示,下層是UEs與MVNOs的匹配博弈,上層是MVNOs與InPs的Stackelberg博弈。
推論 已有文獻(xiàn)證明,具有嚴(yán)格偏好的1對多或1對1匹配博弈一定存在穩(wěn)定匹配,可采用拒絕-接收算法求解。
5.2.1 UEs與MVNOs之間多對1的匹配博弈
如圖1所示,UEs向MVNOs租用帶寬,形成多對1的匹配博弈,但不能形成UEs與切片的精確匹配,且MVNOs向UEs提供的帶寬由MVNOs向InPs購買的切片到UEs的信道特性決定,將MVNOs與切片關(guān)聯(lián)起來作為整體參與匹配博弈更有實(shí)際意義。
5.2.2 UEk與mn之間1對1的匹配博弈
形成了MVNO m -切片n 對mn后,UEs集合K與mn的集合Mn形成如圖1所示的1對1匹配博弈。
(c) 傳統(tǒng)分層匹配博弈:文獻(xiàn)[12]中分層匹配博弈、mn在上、下層均采用隨機(jī)功率策略、隨機(jī)價(jià)格。
式(28)為完全信息狀態(tài)下基于局部信道信息最優(yōu)功率價(jià)格,只能作為上層博弈 mn購買功率的價(jià)格, mn與 UEs在下層匹配博弈中處于非完全信息
為了描述分層匹配/Stackelberg博弈的穩(wěn)定性,定義匹配阻斷集合 Ψ(k,mn) :設(shè)? (k,mn)是UEs與 mn1對1匹配形成的既有匹配對集合,若新匹配對集合 Ψ(k,mn) =? (k,mn),則匹配被阻斷,達(dá)到穩(wěn)定。
基于信道定價(jià)的分層匹配/Stackelberg博弈實(shí)現(xiàn)過程如下:
(1) mn均等功率條件下,進(jìn)行分層博弈;
(2) mn重新分配功率后,進(jìn)行分層博弈;
(3) 重復(fù)(2),直至穩(wěn)定。
考慮用戶均勻分布的一個區(qū)域,3個MVNOs向1個InP租用資源,向8個UEs提供業(yè)務(wù),InP的信道抽象成8個切片,切片到UEs的信道包含大尺度衰落和小尺度衰落,大尺度衰落由 d?2決定,8個用戶的損耗根據(jù)距離基站的距離分別為1 (3個)、0.1(3個)、0.05 (2個),所有信道的小尺度衰落服從均值相等的Rayleigh衰落,假定任一MVNO可以租用任一切片,但每一切片只能接受1個MVNO,形成24個 mn,UEs以隨機(jī)價(jià)格向MVNO購買帶寬,一經(jīng)確定,博弈過程中不再變化。仿真對6.1節(jié)中定義的基于信道定價(jià)的分層匹配/Stackelberg博弈、隨機(jī)定價(jià)的分層匹配/Stackelberg博弈、傳統(tǒng)分層匹配博弈3種策略進(jìn)行了性能比較。圖2比較了3種機(jī)制跟蹤信道的能力,當(dāng)信道變化時(shí),本文基于信道定價(jià)的分層匹配/Stackelberg博弈上、下層循環(huán)迭代2~3次達(dá)到穩(wěn)定,隨機(jī)定價(jià)的分層匹配/Stackelberg博弈則需要3~6次,傳統(tǒng)分層匹配博弈百次左右迭代達(dá)到穩(wěn)定占比大概2/10,多數(shù)需要更多次循環(huán),因此,圖2未畫出。可見本文策略跟蹤信道能力最好。
為了比較各種機(jī)制對頻譜效率的改善程度,定義切片功率均等條件下、UEs-MVNOs-InPs不經(jīng)匹配且信道最壞的情況為最壞情況。圖3比較了6.1節(jié)定義的3種策略與最壞情況當(dāng)信道變化時(shí)的系統(tǒng)和速率。相比最壞情況,3種匹配機(jī)制的系統(tǒng)和速率都有較大提高,本文策略的系統(tǒng)和速率最優(yōu),高出最壞情況大約60%,高出居中的隨機(jī)定價(jià)的分層匹配/Stackelberg博弈大約15%,傳統(tǒng)分層匹配博弈系統(tǒng)和速率改善最少。
圖2 不同價(jià)格機(jī)制跟蹤信道能力比較
圖3 不同機(jī)制的和速率比較
考慮到傳統(tǒng)分層匹配博弈價(jià)格完全隨機(jī),與本文所提機(jī)制進(jìn)行效用比較意義不大,而隨機(jī)定價(jià)的分層匹配/Stackelberg博弈為了保證功率為正,功率價(jià)格必須大于某一定值,雖然隨機(jī),但有一定范圍限制,具有比較價(jià)值。因此,圖4-圖6比較了本文策略與隨機(jī)定價(jià)分層匹配/Stackelberg博弈系統(tǒng)的效用,前者效用明顯高于后者。綜上所述,本文策略在信道跟蹤、系統(tǒng)和速率及效用上均優(yōu)于其他策略。
圖4 信道定價(jià)策略與隨機(jī)定價(jià)策略UEs效用比較
圖5 信道定價(jià)策略與隨機(jī)定價(jià)策略MVNOs效用比較
圖6 信道定價(jià)策略與隨機(jī)定價(jià)策略InPs效用比較
針對分層博弈策略不能跟蹤信道變化以及上、下層循環(huán)迭代導(dǎo)致的計(jì)算量過大問題,基于用戶滿意度、系統(tǒng)帶寬收益及切片功率收益建立了3級聯(lián)合優(yōu)化模型,進(jìn)而用分層博弈求解,提出了基于信道定價(jià)的匹配/Stackelberg分層博弈機(jī)制。通過定義 mn及其與UEs的1對1匹配博弈以及與InPs的Stackelberg博弈,實(shí)現(xiàn)資源分配,通過信道信息非對稱定價(jià) mn購買功率價(jià)格,跟蹤信道,加速收斂。給出了雙層循環(huán)流圖及穩(wěn)定條件。仿真表明本文策略在跟蹤信道、資源效率、效用方面均優(yōu)于其他分層博弈策略,為進(jìn)一步研究高動態(tài)、高移動性環(huán)境下的無線虛擬網(wǎng)絡(luò)資源分配策略提供了基礎(chǔ)。