王丁 曹奇英 許洪云 沈士根
摘 要:為解決無線傳感器網(wǎng)絡(luò)節(jié)點協(xié)作策略的選擇影響協(xié)作效果的問題,考慮到節(jié)點數(shù)量有限及個體隨機性,基于模仿突變Wright-Fisher過程的隨機演化博弈,提出了WSNs節(jié)點協(xié)作隨機演化模型,并加入了與節(jié)點協(xié)作程度相關(guān)的懲罰機制。該模型彌補了復(fù)制子動態(tài)不適用于節(jié)點數(shù)量有限的WSNs節(jié)點協(xié)作演化建模問題。經(jīng)過隨機動力學(xué)分析,推導(dǎo)并證明了達(dá)到演化穩(wěn)定狀態(tài)的定理。最后通過實驗驗證定理并分析了選擇強度和懲罰力度對WSNs節(jié)點協(xié)作演化穩(wěn)定狀態(tài)的影響。
關(guān)鍵詞:無線傳感器網(wǎng)絡(luò);協(xié)作;Wright-Fisher過程;隨機演化博弈;模仿突變
中圖分類號: TP393 文獻(xiàn)標(biāo)志碼: A 文章編號:2095-2163(2016)01-
Abstract: To solve the problem of coordination decisions among WSNs nodes which affects the cooperation between nodes, considering limited numbers of nodes and individual stochastic effect, this paper constructs a stochastic evolutionary trust model of WSNs nodes based on imitated mutation Wright-Fisher process, and introduces a punishment mechanism related to the coordination level of nodes. The model compensated for the shortcoming of replicator dynamics where it was inapplicable to the WSNs having limited numbers of nodes. Theorems of arriving at the evolutionary stable state, through stochastic dynamics analysis, are deduced and proved. Experiments verify the conclusions and analyze the impacts of punishment levels and selection intensities toward the WSNs nodes coordination evolutionary stable state.
Keywords: Wireless Sensor Networks(WSNs); Coordination; Wright-Fisher Process; Stochastic Evolutionary Game; Imitated Mutation
0 引言
無線傳感器網(wǎng)絡(luò)(Wireless Sensor Networks, WSNs) [1]是由數(shù)量眾多的傳感器節(jié)點以自組織和多跳等方式組成的無線網(wǎng)絡(luò)。WSNs中傳感器節(jié)點采集的數(shù)據(jù)需要被多個節(jié)點連續(xù)轉(zhuǎn)發(fā)后才能到達(dá)目標(biāo)節(jié)點。如果一個節(jié)點與其他節(jié)點協(xié)作,那么將會幫助其他節(jié)點轉(zhuǎn)發(fā)數(shù)據(jù)包,使協(xié)作任務(wù)的成功率提高,可認(rèn)為該節(jié)點獲得收益;但在轉(zhuǎn)發(fā)數(shù)據(jù)包的同時,節(jié)點本身需要付出一定的成本,如消耗能量、自身任務(wù)延時傳輸?shù)取S捎讷@得收益和付出成本是一個矛盾,因此若存在較多節(jié)點不和其他節(jié)點協(xié)作的情況,就會導(dǎo)致WSNs節(jié)點無法正常協(xié)作。因此,節(jié)點之間協(xié)作與否會直接影響到WSNs的穩(wěn)定性和協(xié)作任務(wù)的成功率。
近幾年來,已有許多學(xué)者使用演化博弈論的方法來分析網(wǎng)絡(luò)中的一些矛盾問題。文獻(xiàn)[2]分析了無限總體演化博弈的演化穩(wěn)定策略,并與復(fù)雜網(wǎng)絡(luò)博弈的演化穩(wěn)定策略進(jìn)行了比較,提出了一種適用于網(wǎng)絡(luò)演化博弈的演化穩(wěn)定策略新定義;文獻(xiàn)[3]將演化博弈應(yīng)用于延遲容忍網(wǎng)絡(luò)的非合作轉(zhuǎn)發(fā)控制方面,并分析了交互次數(shù)對演化均衡的影響。在WSNs研究領(lǐng)域,文獻(xiàn)[4]提出了一種基于演化博弈的資源控制協(xié)議,用于緩解WSNs內(nèi)部資源競爭矛盾。文獻(xiàn)[5]將演化博弈與WSNs節(jié)點信任決策結(jié)合,建立了WSNs節(jié)點信任博弈模型,提出并證明了在不同的參數(shù)條件下達(dá)到演化穩(wěn)定策略的定理。文獻(xiàn)[6]和文獻(xiàn)[7]在文獻(xiàn)[5]的基礎(chǔ)上分別引入了節(jié)點的反思機制和模仿機制,并考慮了網(wǎng)絡(luò)不可靠因素對模型的影響。
上述文獻(xiàn)所用的演化博弈模型大都是針對無限總體的對象,而實際情況中的研究對象一般都是有限總體。針對這個問題,學(xué)者們將隨機過程應(yīng)用到演化博弈中,形成了以有限總體為研究對象的隨機演化博弈。文獻(xiàn)[8]研究了服務(wù)提供商面對軟硬件服務(wù)攻擊時的安全和可信機制,提出了一種適用于虛擬傳感器服務(wù)(Virtual Sensor Services)的安全、可信的隨機演化聯(lián)合博弈防御框架。文獻(xiàn)[9]針對網(wǎng)構(gòu)軟件中存在的服務(wù)問題,將網(wǎng)構(gòu)軟件的服務(wù)差異化,并把基于Wright-Fisher過程的兩策略博弈拓展到多策略,提出了一種博弈參與者具有多個策略的信任演化博弈模型。文獻(xiàn)[10]把Moran過程應(yīng)用到無線網(wǎng)絡(luò)的接入選擇中,并從多策略的角度改進(jìn)了局部更新機制。隨機演化博弈雖然在其他領(lǐng)域已有較廣的應(yīng)用,但是目前在WSNs中應(yīng)用還較少。
本文使用基于兩策略頻率相關(guān)、帶模仿突變的Wright-Fisher過程隨機演化博弈模型來分析無線傳感器網(wǎng)絡(luò)中存在的節(jié)點協(xié)作問題。數(shù)量有限的WSNs節(jié)點在選擇協(xié)作與否時體現(xiàn)出了重復(fù)性、有限理性等特征,而對于整個WSNs來說,其目標(biāo)是在達(dá)到總體收益較高狀態(tài)的同時也能夠保持足夠的穩(wěn)健性,這些特征恰好滿足隨機演化博弈的要求。據(jù)此,本文建立了WSNs節(jié)點協(xié)作演化模型,使節(jié)點在無外界干預(yù)的情況下動態(tài)演化,各個節(jié)點根據(jù)模仿突變Wright-Fisher機制自行調(diào)整下一次博弈的策略,使WSNs逐漸演化到穩(wěn)定狀態(tài)。在到達(dá)演化穩(wěn)定狀態(tài)之后,WSNs中的絕大部分節(jié)點將會選擇協(xié)作策略并保持不變。在信任演化[5]的基礎(chǔ)上,通過考慮WSNs中有限節(jié)點數(shù)量的情況,引入懲罰因子和模仿機制來構(gòu)造協(xié)作博弈模型,并利用帶突變的Wright-Fisher過程來分析節(jié)點協(xié)作演化動態(tài),使WSNs節(jié)點協(xié)作模型更趨近真實狀況,并得出到達(dá)演化穩(wěn)定狀態(tài)的定理,分析影響到達(dá)演化穩(wěn)定狀態(tài)的影響因子。
1 基于突變Wright-Fisher過程的隨機演化博弈模型
博弈論是分析博弈個體在進(jìn)行博弈時表現(xiàn)出的行為并研究博弈個體的博弈最優(yōu)策略的理論。一個標(biāo)準(zhǔn)的博弈由3個要素組成:博弈個體,策略集合和收益函數(shù)[11]。博弈個體是參與博弈的主觀個體,每個博弈個體分別從策略集合中選取一種策略與另一個博弈個體進(jìn)行博弈,收益函數(shù)是博弈個體依據(jù)其策略與對手博弈所獲得的收益。收益函數(shù)可由收益矩陣的形式給出。經(jīng)典博弈的博弈個體總是完全理性[11]的,也就是說,博弈個體總是選擇收益最大的策略與對手進(jìn)行博弈。
演化博弈論在經(jīng)典博弈的基礎(chǔ)之上,結(jié)合博弈分析理論和生物種群的演化過程,形成了一個新的博弈論分支。在演化博弈論中,博弈個體都是有限理性[12]的,它把所有博弈個體的總體視為一個種群,將種群作為基本的研究對象,研究博弈個體在多次動態(tài)博弈中的策略演化狀況。
經(jīng)典的演化博弈的研究對象一般是無限總體,但在實際情況中,研究對象都是總體數(shù)量有限的,并且個體的隨機性在有限總體的博弈過程中起著非常重要的作用,因此基于隨機過程的隨機演化博弈成為了研究有限總體演化博弈的重要途徑,當(dāng)中較重要的三種模型是Moran過程[13]、Wright-Fisher過程[14]和隨機配對過程[15]。其中Wright-Fisher過程由于能夠在一次迭代內(nèi)進(jìn)行同步更新,相較于只能異步更新的其他兩種過程更具現(xiàn)實意義。
在Wright-Fisher過程中,總體中的個體在進(jìn)行策略更新時,會依據(jù)策略的適應(yīng)性選擇適合自身的策略,之后每一個體都會產(chǎn)生多個后代個體,得到一個總數(shù)大于總體數(shù)量的后代集合,再從這個集合中隨機選出等于總體數(shù)量的新個體取代當(dāng)前個體。
在文獻(xiàn)[14]描述的Wright-Fisher過程博弈模型的基礎(chǔ)上引入模仿突變概率 , , 表示選擇 策略的個體在下一次博弈時依然選擇 策略的概率, 表示選擇 策略的個體在下一次博弈時突變?yōu)?策略的概率, 表示選擇 策略的個體在下一次博弈時突變?yōu)?策略的概率, 表示選擇 策略的個體在下一次博弈時依然選擇 策略的概率。易知,突變概率 存在如下關(guān)系:
, (1)
每個博弈個體在進(jìn)行策略更新時,策略的選擇過程相當(dāng)于在個體后代的集合中進(jìn)行 次獨立的二項分布試驗,因此產(chǎn)生選擇 策略個體的過程就是概率為 的 重伯努利試驗,所以帶突變的Wright-Fisher過程是一個狀態(tài)空間為 的馬爾可夫鏈,系統(tǒng)從狀態(tài) 轉(zhuǎn)變到狀態(tài) 的轉(zhuǎn)移概率為:
(2)
2 WSNs節(jié)點協(xié)作演化模型
2.1 博弈模型
基于文獻(xiàn)[5]的研究,本文在WSNs節(jié)點協(xié)作博弈時加入了與節(jié)點協(xié)作程度相關(guān)的懲罰機制。在WSNs中,節(jié)點可以與鄰居節(jié)點進(jìn)行主動式的交互,選擇協(xié)作策略與對方協(xié)作,或選擇不協(xié)作策略不與對方協(xié)作。在本文中并不涉及節(jié)點協(xié)作程度的計算或量化過程,而是在節(jié)點選擇不協(xié)作策略時給予一定的懲罰。
考慮兩個節(jié)點在交互時的協(xié)作狀況,記 表示當(dāng)前節(jié)點數(shù)據(jù)被協(xié)作節(jié)點成功轉(zhuǎn)發(fā)傳輸而帶來的收益; 表示當(dāng)前節(jié)點選擇與其他節(jié)點協(xié)作,成功轉(zhuǎn)發(fā)其他節(jié)點數(shù)據(jù)使任務(wù)的成功率提高帶來的收益; 表示當(dāng)前節(jié)點因選擇協(xié)作策略提升了自身在對方節(jié)點的信任度收益或因選擇不協(xié)作策略而降低自身在對方節(jié)點的信任度損失; 表示當(dāng)前節(jié)點選擇協(xié)作策略使路由可靠度提升而帶來的收益或因選擇不協(xié)作策略而使路由可靠度降低所帶來的收益損失; 表示因?qū)Ψ焦?jié)點不協(xié)作而導(dǎo)致自身數(shù)據(jù)傳輸失敗帶來的收益損失; 表示因選擇不協(xié)作策略節(jié)省能量從而延長自身的生存周期所獲得的收益; 表示當(dāng)前節(jié)點向?qū)Ψ焦?jié)點發(fā)送自身的數(shù)據(jù)或轉(zhuǎn)發(fā)對方數(shù)據(jù)所產(chǎn)生的傳輸成本, 表示當(dāng)前節(jié)點因選擇了不協(xié)作策略而受到的懲罰損耗。
下面對各種可能發(fā)生的交互狀態(tài)分別進(jìn)行討論:
1)兩個節(jié)點在進(jìn)行交互時均選擇了協(xié)作策略。雙方節(jié)點的收益均為 。
2)兩個節(jié)點在進(jìn)行交互時有一個節(jié)點選擇了協(xié)作策略,而另一個節(jié)點選擇了不協(xié)作策略。此時選擇了協(xié)作策略的節(jié)點會幫助對方節(jié)點轉(zhuǎn)發(fā)傳輸數(shù)據(jù),而選擇不協(xié)作策略的節(jié)點則不會幫助對方轉(zhuǎn)發(fā)數(shù)據(jù),因此選擇協(xié)作策略的節(jié)點收益為 ,選擇不協(xié)作策略的節(jié)點收益為 。
3)兩個節(jié)點在進(jìn)行交互時均選擇了不協(xié)作策略。兩個節(jié)點的收益均為 。
定義1 無線傳感器網(wǎng)絡(luò)節(jié)點協(xié)作博弈是一個由四元組 表示的對稱博弈。其中參與者 為無線傳感器網(wǎng)絡(luò)中所有節(jié)點的集合; 為參與者的總體數(shù)量;策略集合為 , 為協(xié)作策略, 為不協(xié)作策略; 為無線傳感器網(wǎng)絡(luò)節(jié)點在一次兩人兩策略對稱博弈時的收益函數(shù),如表1所示。
2.2 模仿突變因子的確定
本文提出一種基于模仿策略的策略調(diào)整機制,使傳感器節(jié)點在協(xié)作博弈時若發(fā)現(xiàn)對方策略的收益大于自己的收益,就會模仿其策略或行為。模仿機制體現(xiàn)在博弈過程中具體表現(xiàn)為博弈個體在產(chǎn)生后代的過程中引入模仿突變因子,產(chǎn)生后代的過程中有一定的突變概率,將后代個體的策略調(diào)整為博弈對手的策略。
邏輯斯蒂方程(Logistic Equation)是研究生物學(xué)、社會學(xué)中種群增長的一種模型,在生態(tài)學(xué)中,一個種群內(nèi)個體數(shù)量的變化動態(tài)可以用邏輯斯蒂方程的微分形式表示:
(3)
其中, 為種群的瞬時增長量, 為種群的個體增長率, 為特定時間內(nèi)種群內(nèi)的個體數(shù)量, 為環(huán)境容納量,也就是該生態(tài)環(huán)境所能維持的種群內(nèi)個體最大數(shù)量。 為邏輯斯蒂系數(shù)。
在演化博弈過程中,突變因子在演化前期由于博弈次數(shù)較少或穩(wěn)定性的可信度不高,因此模仿突變因子具有較大的變化趨勢,而隨著演化過程的演進(jìn),系統(tǒng)穩(wěn)定性的可信度逐漸增強,因此模仿突變因子在演化后期的變化范圍較小,這個特性恰與邏輯斯蒂方程的增長趨勢相符,因此本文使用基于邏輯斯蒂方程的變形微分方程來表示模仿突變因子。
令 ,則邏輯斯蒂方程變形為:
(4)
記 表示博弈總體內(nèi)每個個體可選的博弈策略集,向量 表示總體狀況,其中 表示選擇策略 的個體比例; 表示選擇策略 的個體和選擇策略 的個體在博弈時相遇,兩個個體在經(jīng)過博弈后,互相學(xué)習(xí),觀察對方的策略和收益,對自己當(dāng)前的策略和收益進(jìn)行調(diào)整,使個體產(chǎn)生的后代有一定概率突變?yōu)槠渌呗?,?表示選擇 策略的后代個體突變?yōu)?策略的概率,由于模仿突變概率與各策略的收益和選擇該策略的個體在總體中的比例有關(guān),引入邏輯斯蒂變形方程可得模仿突變概率為:
(5)
其中, 表示策略 與策略 在博弈過程中期望收益之差。
2.3 引入模仿突變Wright-Fisher過程
由于WSNs的節(jié)點數(shù)量是有限的,進(jìn)行博弈的節(jié)點可以看作出自一個種群的有限總體,因此在WSNs節(jié)點協(xié)作博弈中引入模仿突變Wright-Fisher過程,該模型既能體現(xiàn)WSNs節(jié)點協(xié)作博弈的總體有限性、離散性和隨機性等特征,也能體現(xiàn)出節(jié)點在博弈時的策略調(diào)整過程。
假設(shè)在WSNs節(jié)點協(xié)作博弈中,節(jié)點的總數(shù)為 ,有數(shù)量為 的節(jié)點選擇協(xié)作策略,則有 個節(jié)點選擇不協(xié)作策略。在進(jìn)行節(jié)點協(xié)作博弈時,需剔除自己和自己博弈的情況,因此可得:
任選一個節(jié)點選擇協(xié)作策略的期望收益為: (6)
任選一個節(jié)點選擇不協(xié)作策略的期望收益為:
(7)
假設(shè)在演化博弈中,收益函數(shù)對該策略適應(yīng)度的影響因子為 , ,則在WSNs節(jié)點協(xié)作博弈中,協(xié)作策略的適應(yīng)度為: (8)
不協(xié)作策略的適應(yīng)度為: (9)
由于適應(yīng)度要求收益函數(shù)為非負(fù)數(shù),因此對策略的收益函數(shù)還應(yīng)加以修正,使其滿足適應(yīng)度的條件。選擇強度參數(shù) 的引入,使得Wright-Fisher過程具有了有限理性的特性。
定義2 在不考慮自身博弈情況的無線傳感器網(wǎng)絡(luò)節(jié)點協(xié)作博弈中,協(xié)作策略的適應(yīng)度為 ,不協(xié)作策略的適應(yīng)度為 ,其中 為選擇協(xié)作策略的節(jié)點數(shù)量, 為無線傳感器網(wǎng)絡(luò)節(jié)點在博弈時選擇協(xié)作策略的收益且:
(10)
為無線傳感器網(wǎng)絡(luò)節(jié)點在博弈時選擇不協(xié)作策略的收益且:
(11)
為收益對適應(yīng)度的選擇強度, 為常數(shù)使得收益函數(shù)為非負(fù)數(shù)。
定義3 在不考慮自身博弈情況的無線傳感器網(wǎng)絡(luò)節(jié)點協(xié)作博弈中,個體在每次博弈之后,產(chǎn)生的后代個體中,有一定的突變概率 使個體改變博弈的策略,個體的博弈策略從協(xié)作策略突變?yōu)椴粎f(xié)作策略的概率為:
(12)
則個體的博弈策略依然保持協(xié)作策略的概率為 ;個體的博弈策略從不協(xié)作策略突變?yōu)閰f(xié)作策略的概率為: (13)
則個體的博弈策略依然保持不協(xié)作策略的概率為 ,其中 , , , 為常數(shù)使得 , 。
在定義3中, 和 作為策略突變的概率,保證其大小與當(dāng)前節(jié)點的自身收益呈反向變化,與對方的收益呈正向變化。
WSNs的節(jié)點在進(jìn)行下一次博弈之前,會進(jìn)行以下步驟更新策略:
1)每個節(jié)點都會生成相同數(shù)量的多個選擇相同策略的后代,這些后代中,有一部分后代會以突變概率 突變,選擇對手策略,剩下的后代依然完全繼承父代個體選擇的策略,構(gòu)成一個數(shù)量為 的整數(shù)倍個后代的集合;
2)從這個后代集合里選出與總體數(shù)量相同的 個新一代后代,由于后代節(jié)點只有協(xié)作和不協(xié)作兩種策略,選擇每個節(jié)點的過程都是一次獨立伯努利試驗過程,由定義2可得,選出一個信任策略的后代節(jié)點的概率為 ,因此新一代博弈后代節(jié)點的產(chǎn)生過程就是一個概率為 的 重伯努利試驗;
3)新一代后代完全替換上一代,完成節(jié)點的一代更新。
由定理1和定理2可知,要使整個無線傳感器網(wǎng)絡(luò)具有良好的穩(wěn)定性和節(jié)點協(xié)作性,需促使無線傳感器網(wǎng)絡(luò)的節(jié)點在協(xié)作博弈時選擇協(xié)作策略,因此在設(shè)計無線傳感器網(wǎng)絡(luò)協(xié)作機制時應(yīng)使其盡量符合定理2的條件。懲罰因子 的引入會使無線傳感器網(wǎng)絡(luò)節(jié)點在選擇不協(xié)作策略時受到一定的懲罰,產(chǎn)生更多的損失,當(dāng) 逐漸增大,懲罰力度也逐漸變大時,會使無線傳感器網(wǎng)絡(luò)逐漸滿足定理2的條件,而逐漸偏離定理1的條件。當(dāng) 增大到一定程度,使得無線傳感器網(wǎng)絡(luò)節(jié)點信任博弈不滿足定理1,但是滿足定理2的條件時,無線傳感器網(wǎng)絡(luò)將處于比較理想的穩(wěn)定狀態(tài),此時網(wǎng)絡(luò)內(nèi)的所有節(jié)點在經(jīng)過有限次博弈之后都會最終選擇協(xié)作策略。
3 實驗分析
3.1 定理驗證實驗
在圖1中,當(dāng)WSNs節(jié)點協(xié)作博弈的條件滿足定理1時,設(shè)定選擇協(xié)作策略的節(jié)點初始比例為0.999 9,經(jīng)過140次博弈,絕大部分節(jié)點都選擇不協(xié)作策略,達(dá)到了 的演化穩(wěn)定狀態(tài);當(dāng)WSNs節(jié)點協(xié)作博弈的條件滿足定理2時,設(shè)定選擇協(xié)作策略的節(jié)點初始比例為0.000 1時,經(jīng)過78次博弈,絕大部分節(jié)點都選擇協(xié)作策略,達(dá)到了 的演化穩(wěn)定狀態(tài)。此實驗驗證了定理1和定理2成立。
3.2 影響因子驗證實驗
實驗中分別使用不同數(shù)值的懲罰因子 和選擇強度 來觀察其對無線傳感器網(wǎng)絡(luò)節(jié)點協(xié)作博弈的影響,并根據(jù)實驗結(jié)果給出優(yōu)化無線傳感器網(wǎng)絡(luò)節(jié)點協(xié)作博弈的對策。本實驗共設(shè)2組,第1組分析懲罰因子 對定理2的影響,第2組分析選擇強度 對定理2的影響。
3.2.1 懲罰因子 的影響
實驗設(shè)定: , , , , , , , , ; 分別設(shè)定為16和15。兩組數(shù)據(jù)均滿足定理2,實驗結(jié)果如圖2所示。
在圖2中,當(dāng)選擇協(xié)作策略的節(jié)點初始比例為0.000 1時,兩組數(shù)據(jù)均使得WSNs節(jié)點經(jīng)過一定次數(shù)的協(xié)作博弈達(dá)到了 的演化穩(wěn)定狀態(tài)。在其他參數(shù)相同的情況下, 的一組節(jié)點只需78次博弈即可達(dá)到演化穩(wěn)定狀態(tài),比 的另一組節(jié)點收斂速度更快。由此可知,在滿足定理2的條件下,提高懲罰因子 能有效促進(jìn)WSNs節(jié)點在進(jìn)行協(xié)作博弈時更快地達(dá)到演化穩(wěn)定狀態(tài)。
在圖3中,當(dāng)選擇協(xié)作策略的節(jié)點初始比例為0.0001時,三組數(shù)據(jù)均使得無線傳感器網(wǎng)絡(luò)節(jié)點經(jīng)過一定次數(shù)的協(xié)作博弈后達(dá)到了 的演化穩(wěn)定狀態(tài)。在其他參數(shù)相同的情況下, 的一組節(jié)點需要212次博弈才能達(dá)到穩(wěn)定狀態(tài), 的一組節(jié)點需要130次博弈才能達(dá)到穩(wěn)定狀態(tài),而 的一組節(jié)點只需78次即可達(dá)到穩(wěn)定狀態(tài)。由此可知,在滿足定理2的條件下,提高選擇強度 能有效促進(jìn)無線傳感器網(wǎng)絡(luò)節(jié)點在進(jìn)行協(xié)作博弈時更快地達(dá)到演化穩(wěn)定狀態(tài)。
4 結(jié)束語
節(jié)點間的協(xié)作問題是WSNs穩(wěn)定運行的重要基礎(chǔ),促進(jìn)WSNs節(jié)點互相協(xié)作能夠促使整個無線傳感器網(wǎng)絡(luò)達(dá)到穩(wěn)定狀態(tài)。本文根據(jù)無線傳感器網(wǎng)絡(luò)中節(jié)點數(shù)量有限等特點,引入與節(jié)點協(xié)作相關(guān)的懲罰機制,提出了基于模仿突變Wright-Fisher過程的無線傳感器網(wǎng)絡(luò)節(jié)點協(xié)作隨機演化模型,彌補了復(fù)制子動態(tài)不適用于節(jié)點數(shù)量有限的無線傳感器網(wǎng)絡(luò)中的缺陷,使無線傳感器網(wǎng)絡(luò)節(jié)點協(xié)作博弈模型更符合實際情況。在此基礎(chǔ)之上,對隨機演化博弈模型進(jìn)行了動力學(xué)分析,得出并證明了WSNs節(jié)點協(xié)作博弈達(dá)到演化穩(wěn)定狀態(tài)的定理。經(jīng)過分析與實驗驗證了結(jié)論:提高節(jié)點選擇不協(xié)作策略的懲罰力度和節(jié)點選擇協(xié)作策略的選擇強度均能有效促進(jìn)WSNs節(jié)點的協(xié)作程度,實現(xiàn)網(wǎng)絡(luò)的安全與穩(wěn)定。本文提出的基于模仿突變Wright-Fisher過程的WSNs節(jié)點協(xié)作隨機演化博弈模型,為無線傳感器網(wǎng)絡(luò)節(jié)點協(xié)作問題研究提供了理論依據(jù)。
參考文獻(xiàn):
[1] YICK J, MUKHERJEE B, GHOSAL D. Wireless sensor network survey[J]. Computer networks, 2008, 52(12): 2292-2330.
[2] CHENG D, XU T, QI H. Evolutionarily Stable Strategy of Networked Evolutionary Games[J]. IEEE transactions on neural networks and learning systems, 2014, 25(7): 1335-1345.
[3] EL-AZOUZI R, De PELLEGRINI F, SIDI H B A, et al. Evolutionary forwarding games in delay tolerant networks: Equilibria, mechanism design and stochastic approximation[J]. Computer Networks, 2013, 57(4): 1003-1018.
[4] FARZANEH N, YAGHMAEE M H. An adaptive competitive resource control protocol for alleviating congestion in Wireless Sensor Networks: An evolutionary Game Theory approach[J]. Wireless Personal Communications, 2015,82(1): 123-142.
[5] 沈士根, 馬絢, 蔣華, 等. 基于演化博弈論的 WSNs 信任決策模型與動力學(xué)分析[J]. 控制與決策, 2012, 27(8): 1133-1138.
[6] 李紫川, 沈士根, 曹奇英. 基于反思機制的 WSNs 節(jié)點信任演化模型[J]. 計算機應(yīng)用研究, 2014, 31(5): 1528-1531.
[7] LI Yuan-jie, XU Hong-yun, CAO Qi-ying, et al. Evolutionary game-based trust strategy adjustment among nodes in Wireless Sensor Networks[J]. International Journal of Distributed Sensor Networks, 2015,2015(818903):1-12.
[8] LIU J, SHEN S, YUE G, et al. A stochastic evolutionary coalition game model of secure and dependable virtual service in Sensor-Cloud[J]. Applied Soft Computing, 2015, 30: 123-135.
[9] 印桂生, 王瑩潔, 董宇欣, 等. 網(wǎng)構(gòu)軟件的 Wright-Fisher 多策略信任演化模型[J]. 軟件學(xué)報, 2012, 23(8): 1978-1991.
[10] 馮光升, 王慧強, 周沫, 等. 基于 Moran 過程的無線網(wǎng)絡(luò)接入選擇方法[J]. 北京郵電大學(xué)學(xué)報, 2014, 37(4): 10-14.
[11] FUDENBERG D, TIROLE J. 博弈論[M].北京: 中國人民大學(xué)出版社,2002.
[12] 喬根 W.威布爾. 演化博弈論[M]. 王永欽,譯.上海:上海人民出版社,2006: 40-86.
[13] MORAN P. A. P. The Statistical Processes of Evolutionary Theory[M]. Oxford: Clarendon Press, 1962.
[14] TRAULSEN A, CLAUSSEN J C, HAUERT C. Coevolutionary dynamics: from finite to infinite populations[J]. Physical review letters, 2005, 95(23): 238701.
[15] TRAULSEN A, PACHECO J M, NOWAK M A. Pairwise comparison and selection temperature in evolutionary game dynamics[J]. Journal of theoretical biology, 2007, 246(3): 522-529.
[16] OHTSUKI H, PACHECO J M, NOWAK M A. Evolutionary graph theory: breaking the symmetry between interaction and replacement[J]. Journal of Theoretical Biology, 2007, 246(4): 681-694.