樊 娜,朱依水,朱光源,唐 蕾,董 鳴,安宏海
(1.長安大學(xué) 信息工程學(xué)院,陜西 西安 710064;2.邯鄲市交通運輸局 基建處,河北 邯鄲 056000)
由于車聯(lián)網(wǎng)自身的網(wǎng)絡(luò)拓撲結(jié)構(gòu)多變、車輛節(jié)點連接短暫等特點以及車聯(lián)網(wǎng)中節(jié)點自私性等問題,車聯(lián)網(wǎng)環(huán)境中面向出行者的交通服務(wù)信息的安全可靠的傳輸面臨了更多的挑戰(zhàn)[1-4]。目前,研究人員針對車聯(lián)網(wǎng)環(huán)境中信息傳輸?shù)难芯恐饕性趦蓚€方面:采用重復(fù)廣播的思想以提高信息傳輸?shù)男蔥5-8];改進路由協(xié)議提高信息傳輸效率。在車輛網(wǎng)環(huán)境中,常用的兩類協(xié)議為按表驅(qū)動路由協(xié)議和按需驅(qū)動路由協(xié)議。研究人員多基于這兩類協(xié)議進行改進,以期提高車聯(lián)網(wǎng)中數(shù)據(jù)傳輸效率[9-11]。上述提出的這兩類提高車聯(lián)網(wǎng)信息傳輸效率的方法都是基于車聯(lián)網(wǎng)中的車輛節(jié)點積極合作的假設(shè)前提,并未考慮現(xiàn)實車聯(lián)網(wǎng)環(huán)境中節(jié)點的自私性因素的影響。在現(xiàn)實車聯(lián)網(wǎng)環(huán)境中,存在可信度較高的節(jié)點出于自私目的而常常拒絕主動發(fā)布或轉(zhuǎn)發(fā)交通服務(wù)信息的行為。由于此類自私節(jié)點的不合作行為,將對車輛網(wǎng)內(nèi)部交通信息服務(wù)的有效傳輸產(chǎn)生消極作用,影響車輛網(wǎng)的整體效率。
本文基于博弈論原理,提出一種基于動態(tài)博弈論的模型,該模型能激勵車聯(lián)網(wǎng)內(nèi)的節(jié)點采取合作行為,抑制自私節(jié)點和惡意節(jié)點的不合作行為,有效地優(yōu)化車聯(lián)網(wǎng)內(nèi)部信息傳輸?shù)沫h(huán)境。
在現(xiàn)實車聯(lián)網(wǎng)中,信息傳輸是交通流預(yù)測、協(xié)作駕駛等眾多交通應(yīng)用的關(guān)鍵環(huán)節(jié)。車聯(lián)網(wǎng)本身是由裝載傳感設(shè)備的車輛節(jié)點和部署在道路兩側(cè)的各類路基設(shè)備構(gòu)成。因此,結(jié)合在車聯(lián)網(wǎng)的應(yīng)用中,車聯(lián)網(wǎng)中的信息傳輸通常包含兩種方式:第一種方式為路基設(shè)備和車輛節(jié)點之間的信息傳輸。路基設(shè)備對在其有效通信范圍內(nèi)的車輛節(jié)點發(fā)布天氣、路況等交通服務(wù)信息,節(jié)點收到信息后將轉(zhuǎn)發(fā)該信息;此外車輛節(jié)點感知的交通信息也將發(fā)布給路基設(shè)備。第二種方式為車輛節(jié)點之間的信息傳輸。例如在城市交通中常見的應(yīng)用場景:車輛節(jié)點作為“目擊者”感知了道路堵車或車禍等其它道路突發(fā)事件,將主動向其有效通信范圍內(nèi)的車輛節(jié)點發(fā)布交通預(yù)警信息。在這兩種方式中,如果節(jié)點能主動參與發(fā)布感知信息或者轉(zhuǎn)發(fā)收到的消息,車聯(lián)網(wǎng)內(nèi)部的信息傳輸將進入良性循環(huán)。
然而車聯(lián)網(wǎng)某些節(jié)點自身出于節(jié)省能量、獨占道路資源等原因,常常會對于轉(zhuǎn)發(fā)或主動發(fā)布等信息傳輸行為采取消極態(tài)度,從而導(dǎo)致車聯(lián)網(wǎng)中類似的“搭便車”節(jié)點數(shù)量增長,直接影響車聯(lián)網(wǎng)中信息傳輸?shù)男省?/p>
博弈論最初是經(jīng)濟領(lǐng)域提出的一種解決利益沖突的數(shù)學(xué)模型,經(jīng)過多年的研究與發(fā)展,已經(jīng)在生物工程學(xué)、計算機應(yīng)用等多個領(lǐng)域獲得了廣泛應(yīng)用。近年來,博弈理論被越來越多地應(yīng)用在信息安全的眾多領(lǐng)域。在本文的研究中,將采用博弈論的方法建立動態(tài)模型,以期激勵車聯(lián)網(wǎng)中的各個節(jié)點采取合作積極的行為,主動發(fā)布或者轉(zhuǎn)發(fā)信息。博棄論中使參與者在特定約束條件下通過考慮其它參與者的對策做出相應(yīng)的對策,以獲得最大的收益,參與者之間存在利益或目標沖突,而利用博弈論來設(shè)計激勵機制則能較好解決參與者之間的利用沖突問題。
通常,一個演化博弈論的標準設(shè)置如下:
(1)用戶數(shù)量龐大,隸屬于不同的種群,存在相互競爭的自私性關(guān)系;
(2)設(shè)置當前隨機選擇的節(jié)點數(shù)量為隨機變量K,K≥0;
(3)假設(shè)每個種群有自身的策略集,種群中的用戶從自身種群的策略集中選取策略,以獲取最大化的收益。
基于上述設(shè)定,建立面向車聯(lián)網(wǎng)的演化動態(tài)博弈模型,對該模型的基本要素描述如下:
參與者:車聯(lián)網(wǎng)中所有車輛節(jié)點;
群體劃分:通過分析,車聯(lián)網(wǎng)中的車輛節(jié)點分為3個群體,正常節(jié)點為群體1,自私節(jié)點為群體2,惡意節(jié)點為群體3。每個群體中節(jié)點的數(shù)目是不確定的,隨著時間的推移,某個節(jié)點有可能從原屬群體轉(zhuǎn)移到其它群體。假設(shè)車聯(lián)網(wǎng)中車輛節(jié)點的分布服從泊松分布,在一次基于動態(tài)博弈模型的演化過程中,存在n個車輛節(jié)點參與博弈的概率可以通過式(1)計算
(1)
其中,參數(shù)θ>0,n≥1。
策略集:每個群體都有各自相對應(yīng)的行為策略,在不同的場景中,節(jié)點會采取不同的行為策略,以期獲取更大的利益。
正常節(jié)點群體的策略分為兩類:第一類是車輛節(jié)點愿意接收交通服務(wù)信息并轉(zhuǎn)發(fā),同時對于自身感知的信息愿意自主發(fā)布,第二類是車輛節(jié)點愿意接收交通信息并轉(zhuǎn)發(fā),但是不愿意自主發(fā)布交通信息。
自私節(jié)點群體的策略也分為兩類:第一類策略是車輛節(jié)點接收交通服務(wù)信息并轉(zhuǎn)發(fā);第二類策略是車輛節(jié)點接收交通服務(wù)信息但并愿不轉(zhuǎn)發(fā)。
惡意節(jié)點群體的策略同樣分為兩類:第一類是車輛節(jié)點接收交通服務(wù)信息,第二類是車輛節(jié)點拒絕接收交通服務(wù)信息。
在本模型中,影響節(jié)點采取合作行為的因素包括兩大類:一是成本付出,例如自身能量消耗等;二是收益,包括節(jié)點信譽值等。在博弈模型中通過對成本收益的演化分析來激勵車輛節(jié)點在信息服務(wù)傳輸中采取合作行為策略。在本文的研究中,車聯(lián)網(wǎng)的網(wǎng)絡(luò)結(jié)構(gòu)除了各類車輛節(jié)點、路基設(shè)備,還包括一個可信認證中心。在一次交通信息傳輸過程中,當車輛節(jié)點對感知的交通信息主動發(fā)布或者對收到的信息進行轉(zhuǎn)發(fā),則認證中心對節(jié)點進行收益獎勵。
因為在車聯(lián)網(wǎng)中存在多個群體,交通信息傳輸?shù)倪^程中存在群體之間的演化和博弈,不同群體具有不同的行為決策集合。
群體1的策略空間是G1={a1,a2},a1表示節(jié)點接收交通服務(wù)信息并轉(zhuǎn)發(fā),同時愿意自主發(fā)布相關(guān)服務(wù)信息,a2表示節(jié)點僅僅接收交通信息并轉(zhuǎn)發(fā),但是不愿意自主發(fā)布交通服務(wù)信息。
群體2的策略空間是G2={b1,b2},b1表示節(jié)點接收交通服務(wù)信息并轉(zhuǎn)發(fā),b2表示節(jié)點僅僅接收的交通服務(wù)信息,但拒絕轉(zhuǎn)發(fā)。
群體3的策略空間是G3={c1,c2},c1表示接收交通服務(wù)信息,因為這些信息有可能對自身有用,c2表示拒絕接收。
在本文的博弈模型中,車輛節(jié)點的收益可以定義為參與者采取某種具體的行為策略之后可以獲取的收益。車輛節(jié)點的收益函數(shù)的計算如下:
節(jié)點的收益=每個節(jié)點接收交通服務(wù)信息獲得的收益獎勵+轉(zhuǎn)發(fā)信息獲得的收益獎勵+自主發(fā)布交通服務(wù)信息獲得的收益獎勵-消耗的能量(轉(zhuǎn)發(fā)能量消耗+自主發(fā)布能量消耗)。
由于車輛網(wǎng)中車輛節(jié)點是移動的,假設(shè)兩個車輛節(jié)點之間的連接時間服從指數(shù)分布,在一段時間T內(nèi),兩車的連接概率計算如式(2)所示
(2)
在群體1中,車輛節(jié)點選擇策略a1的概率是x,x∈[0,1];在群體2中,車輛節(jié)點選擇策略b1的概率是y,y∈[0,1];群體3中,車輛節(jié)點選擇策略c1的概率是z,z∈[0,1]。
當群體1中的某個節(jié)點選擇策略a1,則其獲得收益的概率計算如式(3)所示
(3)
其中,n1為某次博弈過程中,群體1中參與博弈的節(jié)點的個數(shù),δ為據(jù)式(2)計算的兩車連接的概率值。
當群體2中的某個節(jié)點選擇策略b1時,收益概率計算如式(4)所示,其中n2為某次博弈過程中,群體2中參與博弈的節(jié)點的個數(shù)
(4)
當群體3中的某個節(jié)點選擇策略c1時,收益概率計算如式(5)所示,其中n3為某次博弈過程中,群體3中參與博弈的節(jié)點的個數(shù)
(5)
在計算出節(jié)點的收益概率之后,可以據(jù)此進行節(jié)點的收益的計算。
以群體1中的某節(jié)點為例,節(jié)點的收益CG1計算過程如式(6)所示
(6)
其中,B表示收益之和,L表示消耗能量之和。當節(jié)點選擇策略a1時,B的值等于r1+r2+r3,L的值等于e1+e2+e3;當節(jié)點選擇策略a2時,B的值等于r1+r2;L的值等于e1+e2。
同理,群體2中節(jié)點的收益CG2計算過程如式(7)所示
1.溫度。保持舍內(nèi)溫度20℃左右,分娩后3 d內(nèi)適宜溫度32℃~28℃;4~7 d適宜溫度28℃~25℃;8~30 d適宜溫度25℃~22℃。在舍內(nèi)設(shè)置保溫箱,進行人工保溫。
(7)
其中,當節(jié)點選擇策略b1時,B的值等于r1+r2,L的值等于e1+e2;當節(jié)點選擇策略b2時,B的值等于r1;L的值等于e1。
群體3中節(jié)點的收益CG3計算過程如式(8)所示
(8)
當節(jié)點選擇策略c1時,B的值等于r1,L的值等于e1;當節(jié)點選擇策略c2時,節(jié)點采取消極策略,即不進行任何接收或轉(zhuǎn)發(fā)信息的行為,獲得的收益獎勵和消耗均為0,因此收益計算結(jié)果也為0。
依據(jù)上述節(jié)點收益的計算,可以計算各個群體的平均效用函數(shù),以評估群體的博弈狀況。依據(jù)式(6),群體1的平均效用函數(shù)計算如式(9)所示
(9)
同理,依據(jù)式(6),群體2的平均效用函數(shù)計算如式(10)所示
(10)
群體3的平均效用函數(shù)計算如式(11)所示
(11)
在這個多種群的演化博弈環(huán)境中,需要設(shè)計動態(tài)演化模型的演化穩(wěn)定策略,該策略表明群體博弈最終趨于一個穩(wěn)定狀態(tài)。在本文的應(yīng)用場景中,每個群中的個體節(jié)點在群的整體演化過程中都會進行自我學(xué)習(xí),通過學(xué)習(xí),選擇收益較高的策略,放棄收益低的策略選擇,逐漸的固化收益最大化的策略選擇。在多次的動態(tài)博弈過程之后,整個群體趨向動態(tài)收斂直至達到均衡。演化策略的設(shè)計如下:
假設(shè)某次博弈的開始時刻為mt,結(jié)束時刻為,(m+1)t,m≥0。在一次動態(tài)演化博弈過程中,以正常節(jié)點群為例,當群體1中的節(jié)點選擇存在如下計算過程
q[a1,?a2+(1-?)a1]?q[a2,?a2+(1-?)a1]
(12)
其中,演化參數(shù)?∈(0,1),如果式(12)成立,則策略a1就是群體1的演化穩(wěn)定策略。同理可以確定群體2和群體3的演化穩(wěn)定策略。
通過上述步驟,車輛網(wǎng)中的車輛節(jié)點在動態(tài)演化博弈模型中經(jīng)過演化,逐漸趨向選擇收益高的策略,并且整個網(wǎng)絡(luò)系統(tǒng)在多次演化后趨于一種穩(wěn)定狀態(tài),從而實現(xiàn)抑制節(jié)點的自私行為,激勵節(jié)點的合作行為,提高交通服務(wù)信息的傳輸效率。
為了有效評估本文中提出的方法,以NS2仿真軟件為平臺,建立仿真環(huán)境,測試本文提出的模型在交通服務(wù)信息傳輸應(yīng)用場景中的性能。
在本文的仿真實驗中,各項實驗參數(shù)設(shè)置如下:仿真區(qū)域大小為2500 m×2000 m,通信范圍為160 m,車輛的速度依照目前國內(nèi)城市道路主流限速狀況以及日常交通流量情況,設(shè)置為30 km/h~65 km/h,仿真時間為100 s。當惡意節(jié)點占較大比例時,網(wǎng)絡(luò)將處于失效狀態(tài),本文方法主要研究抑制自私節(jié)點的不合作行為,因此對于惡意節(jié)點占較大比例的情況不考慮。在本文的仿真實驗中,車輛節(jié)點數(shù)目設(shè)置為300,設(shè)置正常節(jié)點和自私節(jié)點占總節(jié)點數(shù)的90%,其中正常節(jié)點數(shù)為180,自私節(jié)點為90個,惡意節(jié)點僅占10%。
在仿真實驗中,群體1、群體2以及群體3在實驗初始采取合作行為即分別選擇策略a1,b1,c1的節(jié)點比例占各自所屬群體節(jié)點總數(shù)比例為15%。依據(jù)文中對于節(jié)點收益和能量消耗的約定,經(jīng)過多次實驗,設(shè)置仿真實驗中模型初始參數(shù)如下:收益參數(shù)r1=5,r2=7,r3=10,同時設(shè)能量消耗參數(shù)e3=4,e2=3,e1=2。
本文研究中,仿真實驗分為兩個部分,第一部分是對本文中提出的算法自身性能評估,第二部分是將本文方法與M.RAYA等[6]提出的方法進行比較,評估兩種方法對網(wǎng)絡(luò)性能的影響。
第一部分:圖1為在仿真實驗中隨著時間的推移,群體1、群體2、群體3中的節(jié)點選擇合作策略a1,b1,c1百分比變化。
圖1 選擇合作策略的各種群節(jié)點百分比變化
圖1表明,在模型中變量固定,即模型的激勵確定的情況下,隨著仿真實驗的進行,模型展開演化博弈,各個群體中選擇合作策略的節(jié)點占各自群體節(jié)點總數(shù)的百分比從初始時的10%陸續(xù)增加,并且隨著時間變化,逐漸趨于穩(wěn)定,表明系統(tǒng)經(jīng)過多次博弈之后,趨于穩(wěn)定狀態(tài),其中群體1和群體2中節(jié)點的百分比都接近89%。由于仿真實驗設(shè)置中群體1和群體2節(jié)點的數(shù)量占網(wǎng)絡(luò)中節(jié)點數(shù)據(jù)的百分比達到90%,因此當這兩個群體的節(jié)點有接近89%的節(jié)點最終選擇合作策略之后,整個網(wǎng)絡(luò)將逐漸形成了一個大多數(shù)節(jié)點都選擇合作策略的穩(wěn)定的車聯(lián)網(wǎng)網(wǎng)絡(luò)環(huán)境。僅占整個網(wǎng)絡(luò)節(jié)點10%的惡意節(jié)點所屬群體3,在多次博弈后,選取合作策略的節(jié)點所占百分比同樣有所增加,提高到約20%。
圖1的結(jié)果表明隨著仿真時間的推移,模型不斷演化,仿真結(jié)果圖中顯示本文的激勵機制是有效性,正常、自私和惡意3個群體中選擇合作策略的節(jié)點數(shù)目在不斷增加,并逐漸趨于穩(wěn)定。
在現(xiàn)實應(yīng)用中,自私節(jié)點的不合作行為對車聯(lián)網(wǎng)中交通服務(wù)信息的傳輸產(chǎn)生較大的影響,在仿真實驗中,將調(diào)整模型的收益參數(shù),激勵自私節(jié)點選擇合作行為。設(shè)置通過當實驗中能量消耗參數(shù)不變,同時發(fā)布收益獎勵保持r3=10不變。在首次設(shè)置中,r2-e2=4,后續(xù)實驗中我們逐次增加r2-e2的值d,即當節(jié)點轉(zhuǎn)發(fā)交通服務(wù)信息時,獲取的收益獎勵與付出的能量消耗對比越明顯,將會有效地激勵節(jié)點更多參與網(wǎng)絡(luò)中的信息轉(zhuǎn)發(fā)。具體實驗結(jié)果如圖2所示。
圖2 轉(zhuǎn)發(fā)收益變化對群體2合作策略選擇的影響
當保持收益r1=5、r2=7不變,初次設(shè)置r3-e3=6,在后續(xù)中逐次增加r3-r1的值f,即當節(jié)點主動發(fā)布交通服務(wù)信息時,獲取收益獎勵與付出能耗對比越明顯,則將激勵節(jié)點更積極的主動發(fā)布服務(wù)信息。具體實驗結(jié)果如圖3所示。
圖3 發(fā)布收益變化對群體2合作策略選擇的影響
圖2和圖3表明,群體2中的自私節(jié)點,在選擇合作策略給自身帶來的收益與能耗對比顯著的激勵機制下,該群體中的節(jié)點選擇合作策略的百分比呈現(xiàn)出顯著持續(xù)增長態(tài)勢,并最終趨于一種穩(wěn)定狀態(tài)。實驗結(jié)果顯示,當博弈模型設(shè)置合適的收益參數(shù)時,能有效激勵自私節(jié)點趨向選擇收益較大的策略。
第二部分:對比本文方法和M.RAYA等文中提出的方法,從丟包率、轉(zhuǎn)發(fā)率等性能指標對網(wǎng)絡(luò)進行全面評估。本文方法中模型參數(shù)設(shè)置為初始設(shè)置狀態(tài),仿真時間為100 s。
圖4表明本文方法的轉(zhuǎn)發(fā)率在達到約90%后趨于穩(wěn)定,而M.RAYA等文中方法雖然采取了重復(fù)廣播的策略,但是由于節(jié)點的非積極合作行為產(chǎn)生的消極影響,導(dǎo)致轉(zhuǎn)發(fā)率只維持在70%左右。
圖4 兩種方法網(wǎng)絡(luò)轉(zhuǎn)發(fā)率對比
圖5中,在仿真初始階段,由于節(jié)點參與數(shù)目較少,本文方法和M.RAYA方法的丟包率都約為20%左右。隨著仿真時間的推移,越來越多的節(jié)點參與,M.RAYA方法由于自私節(jié)點和惡意節(jié)點的影響,網(wǎng)絡(luò)的丟包率持續(xù)增長,接近35%,而本文的方法由于有效激勵節(jié)點,隨著仿真時間的推移,越來越多的節(jié)點選擇合作策略,當博弈模型趨于穩(wěn)定時,網(wǎng)絡(luò)的丟包率也趨于穩(wěn)定,保持在15%之下。
圖5 兩種方法網(wǎng)絡(luò)丟包率對比
圖4和圖5的對比結(jié)果表明,通過激勵機制鼓勵節(jié)點采取合作策略后,本文的方法對網(wǎng)絡(luò)性能的影響較為明顯,與M.RAYA文中方法對比,仿真網(wǎng)絡(luò)的轉(zhuǎn)發(fā)率有顯著提高,而丟包率則下降明顯。
上述兩部分的仿真實驗結(jié)果表明,本文中提出的動態(tài)演化博弈模型,能有效地激勵節(jié)點采取合作行為,抑制了自私節(jié)點的自私行為。
針對車聯(lián)網(wǎng)環(huán)境中交通服務(wù)信息傳輸?shù)膽?yīng)用場景,本文設(shè)計提出了基于博弈理論的動態(tài)演化模型。該模型針對車聯(lián)網(wǎng)中正常節(jié)點群體、自私節(jié)點群體、惡意節(jié)點群體分別建立策略空間,通過多次演化博弈,激勵節(jié)點采取收益最大化的合作行為策略,有效抑制了自私節(jié)點的自私行為,從而形成趨于穩(wěn)定的良性的交通服務(wù)信息傳輸環(huán)境。在后續(xù)的研究中,將進一步對模型參數(shù)進行分析以優(yōu)化模型,進一步提高模型的效率。