董曉琦,秦雅琴,謝濟(jì)銘,李秋谷
(昆明理工大學(xué) 交通工程學(xué)院,云南 昆明 650500)
近年來,人車沖突現(xiàn)象嚴(yán)重,使得交通秩序紊亂,極大地降低了道路的通行效率.人車沖突問題一直是研究熱點(diǎn).在行人過街研究方面,Sueur等[1]從行人過街的風(fēng)險感知入手探討過街決策,探索了行人過街風(fēng)險決策的研究新角度;Cantillo等[2]考慮行人的性別、年齡等建立行人過街的離散模型;Pawar等[3]利用概率的方法評估行人在無信號路段過街可接受的安全間隙,并建立安全間隙模型;Ojo等[4]則調(diào)查 6 000 多名行人,找到行人行為與是否能安全過街之間的聯(lián)系;廖明軍等[5]通過視頻分析無信號控制路段行人過街行為建立模型,并基于模型進(jìn)行行人過街的仿真;向紅艷等[6]運(yùn)用定量分析的方法,通過實(shí)例驗(yàn)證了在車流量大的無信號路段行人過街風(fēng)險更高.在人車沖突研究方面,Huybers等[7]研究發(fā)現(xiàn),地面標(biāo)志標(biāo)線有助于減少人車沖突;Moudon等[8]發(fā)現(xiàn)交通環(huán)境以及行人、駕駛員的個性特征均會對碰撞造成影響;Liu等[9]對人車沖突中行人受傷程度進(jìn)行時空建模分析,發(fā)現(xiàn)行人的受傷程度與其性格特征、空間位置以及車輛型號等具有相關(guān)性.
1952年后,部分學(xué)者開始將博弈論運(yùn)用于機(jī)動車與行人搶行決策行為的研究中,考慮混合交通流存在的問題提出了改進(jìn)的雙向行人模型[10].除此之外,還得出了靜態(tài)博弈模型、動態(tài)博弈模型、演化動力學(xué)模型和非合作動態(tài)博弈模型等[11-14],并且通過嵌入博弈論模型,構(gòu)建了元胞自動機(jī)仿真系統(tǒng)模型[15].
隨著心理學(xué)以及運(yùn)籌學(xué)的發(fā)展,博弈論出現(xiàn)了新的分支——行為博弈論.實(shí)驗(yàn)人員運(yùn)用心理學(xué)等學(xué)科研究發(fā)現(xiàn),人類在博弈、決策的過程中,會受到個人性格、社會偏好和公平心理的影響.把行為博弈論運(yùn)用于行人過街決策行為研究,將使得模型與實(shí)際產(chǎn)生的結(jié)果更加擬合.
目前,基于博弈論在無信號控制路段的行人過街決策研究模型大多為傳統(tǒng)的博弈模型.然而在行人過街決策過程中,除受到外界環(huán)境、車流量、車速、過街人數(shù)等影響外,還受到年齡、性別、教育程度、風(fēng)險感知度等自身因素的影響[16].因此,模型預(yù)測與行人實(shí)際決策選擇行為時常相悖.本文考慮不完全理性下的行人、駕駛員過街行為,從博弈者對自身時間效益的看重程度、博弈者對對方的體諒程度以及博弈者對對方的不信任程度3個方面建立博弈模型.
在完全理性條件下,行人過街安全穿越間隙為式(1);在密度不大,車輛到達(dá)符合泊松分布,有充分超車機(jī)會的情況下,到達(dá)的車輛車頭時距大于等于行人安全穿越間隙的概率為式(2).聯(lián)立(1)和(2)可得出行人在完全理性的情況下,安全穿越街道的概率為式(3):
(1)
P(h≥τ)=e-λτ
(2)
(3)
式中:n為車道數(shù),H為一條車道的寬度,v為行人穿越街道時的速度,tr為行人的反應(yīng)時間,tc為一輛車的全部車身通過的時間,h為車頭時距,λ為車輛的平均到達(dá)率.
在實(shí)際交通環(huán)境中,行人和駕駛員生理、心理會出現(xiàn)不同的波動,具有不可控性[17].沒有信息交流的情況下,雙方的決策無法實(shí)現(xiàn)一致性,在此情況下形成了人車沖突.行人過街情形可分為三種情況,如圖1所示.
圖1 無信號控制路段行人過街方式Fig.1 Pedestrian crossing mode without signal control
1) 當(dāng)行人和機(jī)動車距離較遠(yuǎn)時,行人可判斷出此時可以安全通過,則不會造成人車沖突.
2) 當(dāng)行人與機(jī)動車較近時,行人和駕駛員會根據(jù)當(dāng)前的距離和車速判斷此時的安全程度,雙方很容易做出車輛先行的一致性決策,一般也不會造成人車沖突.
3) 當(dāng)距離介于這2種距離之間時,行人無法快速準(zhǔn)確判斷車輛是否通行.在此情況下,由于駕駛員存在個體差異會做出不同決策[18].行人只能根據(jù)以往的經(jīng)驗(yàn),判斷機(jī)動車通過的概率,做出自己是否通行的決策.并且因?yàn)樾腥说膫€體差異,也會做出是否通行的決策,此時駕駛員也需要判斷行人通過的概率,以改變自己的駕駛行為.
在雙方的博弈中,“人、車互不相讓”將造成交通沖突.“人、車互讓”將降低交通效率,兩種情況均不是最優(yōu)結(jié)果.最高效通行的結(jié)果是“車讓人”或者“人讓車”,行人與駕駛員決策達(dá)到一致性,避免沖突的發(fā)生.
博弈論中的3個基本要素包括:局中人、策略集和贏得函數(shù).
1) 局中人
在無信號控制路段,行人與機(jī)動車搶行的博弈中,有權(quán)決定自己是否通行的參與者稱為局中人.本文中具體指:行人和駕駛員.用I={1,2}表示該對策局中人的集合.約定行人為1,駕駛員為2.
2) 策略局
參與博弈的行人、駕駛員都為局中人i,i∈I都有自己的決策集Si.在博弈過程中,每個局中人有2個策略.行人、駕駛員都有“通行”、“不通行”兩個策略.設(shè)行人“通行”策略為a1,“不通行”策略為a2.駕駛員“通行”策略為b1,“不通行”為策略b2.因此該博弈中決策集合,即策略組為S1={a1,a2},S2={b1,b2}.
3) 贏得函數(shù)
在一局博弈中,每個局中人選出的策略所組成的策略集可以成為一個局勢.即Si是第i個局中人的一個策略,則行人與駕駛員的策略組為S=(S1,S2).一個局勢出現(xiàn)后,博弈的結(jié)果也就確定下來.此時,對于任意一個局勢S,行人或駕駛員會得到一個贏得值Hi(S),行人和駕駛員主要的贏得函數(shù)體現(xiàn)為時間效益.對于行人和駕駛員來說,H1(S)、H2(S)分別為行人和駕駛員的贏得函數(shù).
在行人、駕駛員過街博弈中,如果利用具體數(shù)據(jù)代表收益進(jìn)行定量分析,求解簡便,但是難以得到更具普遍代表性的結(jié)果.因此采用字母表示收益,對該局勢進(jìn)行定性分析以得到更加準(zhǔn)確的模型.T1代表車輛讓行,行人通過時行人節(jié)省的等待時間;T2代表行人讓行,車輛通行時駕駛員所節(jié)省的時間;t1代表行人避讓時,車輛隨后避讓,行人所節(jié)省的過街時間;t2表示車輛避讓時,行人隨后避讓,駕駛員所節(jié)省的過街時間,其中:T1>t1,T2>t2.同時,考慮行人步行速度與車輛速度情況,則有:T1 表1 贏得矩陣Tab.1 Win the matrix 設(shè)行人通行決策a1的概率為m,0 p=m(1-n)+(1-m)n=m+n-2mn (4) 行人、駕駛員的安全通行函數(shù)圖為一個三維立體空間圖,如圖2所示.該函數(shù)圖像類似于馬鞍圖,關(guān)于平面m+n-1=0對稱,鞍點(diǎn)為(0.5,0.5,0.5).此時行人、駕駛員通行概率均為0.5,最終可協(xié)調(diào)通行概率也為0.5.當(dāng)(m,n)取值為(1,0)或者(0,1)時,安全通行概率為1,達(dá)成了“車讓人”或“人讓車”的一致性決策的協(xié)調(diào). 圖2 人車安全通行概率圖Fig.2 Pedestrian-motor vehicle safe passage probability map 無信號控制交叉口行人過街過程中,在行人與車輛同時選擇禮讓的情況下則存在多次博弈的情況,在不斷博弈過程中彼此相互學(xué)習(xí),最終完成博弈. Von Neumann和Morgenstern[19]提出當(dāng)博弈的參與者大于兩方時,可以將相似的博弈方作為一個聯(lián)盟,可將多人博弈簡化為雙人博弈.本文考慮行人與駕駛員的效用函數(shù)會同時受到自身與對方的影響,并且博弈雙方是不完全理性的,還會受到自身個體偏好與社會習(xí)性的影響,構(gòu)建不完全理性情況下的博弈模型.模型假設(shè)如下: 1) 行人與駕駛員雙方是不完全理性的; 2) 博弈者的個人所得會受到對手收益的影響; 3) 博弈所處交通條件良好,不存在環(huán)境干擾現(xiàn)象; 4) 行人與駕駛員的異質(zhì)性表現(xiàn)為不同的自身時間的看重程度、對他人的體諒程度與不信任程度. 則人車沖突博弈模型如下: maxHi(S1,S2) (5) 式中:Hi(S1,S2)表示在一次行人過街博弈中,博弈者的效用.在傳統(tǒng)模型中引入αi、βi、θi3個參數(shù).αi(0≤αi≤1)表示在行為博弈中的局中人對自身時間效益的看重程度.通常情況下αi≥0.5,因?yàn)榻^大多數(shù)人更看重自己的利益所得,在此表現(xiàn)為所節(jié)省的時間.βi(0≤βi≤1)表示在行為博弈中局中人對對方的體諒程度.θi(0≤θi≤1)表示在行為博弈中的局中人對對方的不信任程度.πi(S1,S2)表示博弈者在此次博弈中的收益,而π-i(S1,S2)表示與之相博弈的對方的收益.PSi為博弈者i作出通行決策的概率. 根據(jù)維爾斯特拉斯定理:若集合A={y1,y2,…,yn},其中yi互異,1≤i≤n,且A?是一個非空緊集,函數(shù)f(x1,x2,…,xn)為連續(xù)函數(shù),則f(x1,x2,,…,xn)在集合A上至少有一個最值.易知函數(shù)Hi(S1,S2)在定義范圍內(nèi)至少一個最值. 考慮實(shí)際人車沖突的風(fēng)險情況,引入風(fēng)險因子和讓行后時間收益構(gòu)建新的贏得矩陣.假設(shè)行人風(fēng)險因子為σ1,駕駛員的風(fēng)險因子為σ2,且σ1<0,σ2<0,通常情況下,因行人與車輛發(fā)生沖突時,行人風(fēng)險更大,因此σ1<σ2.假設(shè)駕駛員讓行后時間收益為c1,行人讓行后時間收益為c2,且0 表2 贏得矩陣Tab.2 Win the matrix 根據(jù)人車沖突模型以及贏得矩陣得出4種不同決策下的贏得函數(shù): 1) 行人通行,駕駛員通行 H1(a1,b1)=α1σ1+(1-α1)σ2-β1(σ1-σ2)+θ1×0 (6) H2(a1,b1)=α2σ2+(1-α2)σ1-β2×0+θ2(σ2-σ1) (7) 2) 行人通行,駕駛員不通行 H1(a1,b2)=α1T1+(1-α1)c1-β1(T1-c1)+θ1×0 (8) H2(a1,b2)=α2c1+(1-α2)T1-β2×0+θ2(c1-T1) (9) 3) 行人不通行,駕駛員通行 H1(a2,b1)=α1c2+(1-α1)T2-β1×0+θ1(c2-T2) (10) H2(a2,b1)=α2T2+(1-α2)c2-β2(T2-c2)+θ2×0 (11) 4) 行人不通行,駕駛員不通行 H1(a2,b2)=α1t1+(1-α1)t2-β1(t1-t2)+θ1×0 (12) H2(a2,b2)=α2t2+(1-α2)t1-β2×0+θ2(t2-t1) (13) 隨著禮讓行人政策的推廣,若要達(dá)到社會最優(yōu),則需駕駛員禮讓行人優(yōu)先通過.考慮交通效率,在駕駛員禮讓的同時,行人需充分信任駕駛員直接過街.形成此策略局時效益最佳,此時保證行人滿足式(14),駕駛員需滿足式(15): (14) (15) 分析上述不等式以及數(shù)值模擬結(jié)果可得出: 1) 對于行人來說,當(dāng)行人在一定程度上能體諒和信任駕駛員,并且通行風(fēng)險降低后,行人將首先順利通行,該博弈將達(dá)到社會最優(yōu)局勢. 2) 對于駕駛員來說,當(dāng)駕駛員能更多程度地體諒行人,加大在有行人過街時駕駛員不禮讓行人的懲罰力度,駕駛員將為行人讓行,稍后通過路段沖突區(qū),無需反復(fù)進(jìn)行博弈決策,依然能達(dá)到社會最優(yōu)局勢. 3) 當(dāng)α1=α2=1,β1=β2=θ1=θ2=0時,該模型將變?yōu)榛旌喜呗訬ash均衡. 本文采取意向調(diào)查(Stated Preference,SP)方式獲取行人駕駛員的讓行傾向.行人、駕駛員傾向反映了行人、駕駛員長期形成的穩(wěn)定通行選擇,不同特質(zhì)的行人駕駛員在行為決策中存在差異性.問卷內(nèi)容包含行人、駕駛員讓行傾向、對自我的利益看重程度、對對方的信任程度以及體諒程度.為量化上述不同心理因素,將每類心理因素劃分為0~1的10個等級.針對行人、駕駛員分別設(shè)置不同讓行傾向問卷,對雙方在通行過程中不同傾向進(jìn)行調(diào)查.問卷內(nèi)容設(shè)置遵循合理性、邏輯性、準(zhǔn)確性和簡明性原則.問卷涵蓋不同年齡、學(xué)歷、職業(yè)、性別,符合問卷設(shè)計(jì)規(guī)范. 5.2.1 行人-駕駛員讓行傾向?qū)Ρ确治?/p> 讓行傾向在一定程度上反映了行人-駕駛員在無信號控制路段長期形成的穩(wěn)定行為選擇.本次調(diào)查共發(fā)出問卷700份,收回行人讓行傾向有效問卷347份,駕駛員讓行傾向有效問卷289份.根據(jù)調(diào)查數(shù)據(jù)得出行人-駕駛員讓行意愿頻率分布及數(shù)據(jù)擬合圖,如圖3所示,可得出: 圖3 行人-駕駛員不同讓行意愿頻率分布Fig.3 Frequency distribution of pedestrian - driver different willingness to yield 1) 藍(lán)色為行人讓行傾向,橙色表示駕駛員讓行傾向.不同顏色線段為不同讓行意愿頻率擬合Gaussian分布曲線.可以看出,行人、駕駛員讓行意愿基本呈高斯分布,行人讓行概率分布右偏、駕駛?cè)俗屝懈怕首笃?,說明隨著車讓人政策的實(shí)施與推廣,行人在無信號控制路段對駕駛員讓行期望較高,駕駛員主動避讓行人意識提高,駕駛員讓行意愿普遍高于行人,說明采集數(shù)據(jù)符合統(tǒng)計(jì)規(guī)律. 2) 行人讓行意愿峰高為71,讓行意愿集中分布于0.6±0.1,讓行意愿為0.5以上的數(shù)據(jù)共179組,占據(jù)調(diào)查到總數(shù)據(jù)的51.3%.駕駛員讓行意愿峰高為74,讓行意愿集中分布于0.8±0.1,讓行意愿為0.5以上的數(shù)據(jù)共有219組,占據(jù)調(diào)查到總數(shù)據(jù)的75.8%.說明在實(shí)際行人過街交通博弈過程中,行人屬于弱勢交通群體,雖有行人優(yōu)先政策,但出于自我保護(hù)等機(jī)制,部分行人仍會主動讓行,結(jié)果符合實(shí)際交通人車博弈情況,驗(yàn)證統(tǒng)計(jì)結(jié)果的有效性. 5.2.2 行人-駕駛員讓行心理影響因素對比分析 對影響行人、駕駛員通行決策的3個心理因素進(jìn)行調(diào)查,分為對自身時間看重程度、對對方的信任程度以及體諒程度.根據(jù)調(diào)查數(shù)據(jù)得出行人讓行意愿-個性圖,如圖4(a)所示.駕駛員讓行意愿-個性圖如圖4(b)所示. 1) 圖4中藍(lán)色代表讓行意愿,橙色代表對自身時間的看重程度,綠色代表對對方的不信任程度,紅色代表對對方的體諒程度.不同顏色線段為不同心理因素頻率擬合Gaussian分布曲線,可以看出行人、駕駛員不同心理程度基本呈高斯分布,說明采集數(shù)據(jù)符合統(tǒng)計(jì)規(guī)律.整體來看,行人與駕駛員在對自身時間看重程度與對對方的體諒程度上基本一致.行人、駕駛員對自身時間的看重程度集中分布于0.7±0.1,對對方的體諒程度集中于0.5±0.1,可見大部分非完全理性人都更看重自己的利益,不管是行人還是駕駛員,對對方的體諒度的一致性,說明讓行意愿還需考慮政策傾向、社會偏好、個體特質(zhì)等因素. 2) 對比圖4(a)和(b)可得,行人、駕駛員在對對方的信任程度上差距較大,體現(xiàn)為:行人對對方的不信任程度集中分布于0.5±0.1,而駕駛員對行人的不信任程度集中分布于0.7±0.1的區(qū)間.說明隨著社會的發(fā)展,針對駕駛員的規(guī)章制度逐步細(xì)化,增強(qiáng)了對駕駛員的管理、懲罰;行人在過街過程中逐步提高了對駕駛員的信任程度,敢于優(yōu)先通行,駕駛員則在駕駛經(jīng)驗(yàn)的提升中降低了對行人讓行的信任程度. (a)行人 (b)駕駛員圖4 行人、駕駛員讓行心理影響因素分布圖Fig.4 Distribution of psychological factors influencing pedestrians and drivers to yield 5.2.3 心理因素統(tǒng)計(jì)描述 將行人、駕駛員讓行意愿按從小到大的順序進(jìn)行排列,并對樣本進(jìn)行編號(1~N),N為樣本量,隨后根據(jù)其順序進(jìn)行讓行意愿、心理因素線性擬合,尋找讓行意愿與不同心理因素的關(guān)系,發(fā)現(xiàn)符合模型假設(shè).線性擬合式如公式(17)所示,參數(shù)擬合結(jié)果如表3所示: 表3 行人、駕駛員讓行意愿-心理因素?cái)M合結(jié)果Tab.3 Pedestrian and driver willingness to yield - fitting results of psychological factors P=Cα1+Dβ1+Eθ1+F (17) 為進(jìn)一步討論讓行意愿與不同心理因素之間的規(guī)律,繪制出讓行意愿、心理因素散點(diǎn)圖,如圖5所示.在實(shí)際交通環(huán)境下,每一位交通參與者具有異質(zhì)性,但宏觀來看,隨著不完全理性的行人、駕駛員對對方的不信任程度以及體諒程度不斷增高,對自身時間看重程度的降低,相對應(yīng)讓行意愿不斷提高.但是駕駛員相對于行人來說,受到對對方的不信任程度的影響較大. (a)行人 (b)駕駛員圖5 讓行意愿-心理因素統(tǒng)計(jì)Fig.5 Willingness to relinquish - statistics of psychological factors 在無信號控制路段,行人、駕駛員通行決策經(jīng)歷“感知-判斷-反應(yīng)”3個層級,雙方在感知的基礎(chǔ)上,與自身偏好相結(jié)合作出判斷決策.進(jìn)一步說明,新實(shí)施的車讓人政策法規(guī)對“交通環(huán)境”產(chǎn)生了巨大影響,從行人被迫等待車輛通行后伺機(jī)通行變?yōu)榱笋{駛員主動讓行. 5.2.4 數(shù)值模擬分析 傳統(tǒng)博弈模型數(shù)值模擬存在設(shè)置參數(shù)較為主觀的弊端,本文在調(diào)查分析特性后設(shè)置初始數(shù)值以及數(shù)值走向趨勢將更具科學(xué)性.依據(jù)行人-駕駛員讓行傾向調(diào)查得到的結(jié)論,利用MATLAB對模型進(jìn)行數(shù)值模擬,分析模型中6個參數(shù)敏感度α1、α2、β1、β2、θ1、θ2對社會最優(yōu)局的影響.為了便于計(jì)算,數(shù)值模擬中作出如下假設(shè): 1) 在傾向調(diào)查中發(fā)現(xiàn),駕駛員與行人對自身時間效益的看重程度基本相似,且行人、駕駛員均看重個人所得,因此設(shè)置初始參數(shù)大于0.5,即α1=α2≥ 0.5; 2) 在傾向調(diào)查中發(fā)現(xiàn),駕駛員與行人對對方的體諒程度基本相似,且體諒程度較低,因此設(shè)置參數(shù)從0.1開始,即初始β1=β2= 0.1; 3) 在傾向調(diào)查中發(fā)現(xiàn),駕駛員對行人不信任程度大于行人對駕駛員的不信任程度,即θ1>θ2. 本文設(shè)置初始值為:α1=α2= 0.5,β1=β2= 0.1,θ1=1,θ2=0.9,c1=10,T1=20.在分析α1、α2、β1、β2、θ1、θ2參數(shù)敏感度變化對最優(yōu)局影響時,其他參數(shù)賦值不變. 6個參數(shù)敏感度對最優(yōu)局的模擬結(jié)果如表4所示,從表中的數(shù)據(jù)可以得出以下結(jié)論: 表4 參數(shù)敏感度模擬結(jié)果Tab.4 Simulation results of parameter sensitivity 1) 將2~4行與第一行對比可以看出:在其他參數(shù)不變的情況下,隨著α1、α2的增加,即行人與駕駛員對自身時間效益看重程度的增加,行人的收益將逐漸增加,駕駛員的收益將逐漸降低; 2) 從5~7行可以看出:在其他參數(shù)不變的情況下,隨著β1、β2的減小,即行人與駕駛員對對方的體諒程度的減小,行人收益逐漸增大,駕駛員收益不變; 3) 從8~0行可以看出:在其他參數(shù)不變的情況下,隨著θ1、θ2的減小,即行人與駕駛員對對方的不信任程度的減小,行人收益不變,駕駛員收益逐漸增大. 在無信號控制路段,人車沖突成為降低道路通行能力以及事故的主要原因.在雙方過街的博弈中,行人、駕駛員自身收益大小成為是否通行的主要原因.根據(jù)研究得出,行人駕駛員收益受到多方面的影響.結(jié)合以上分析,提出以下幾個建議: 1) 在路測加裝識別監(jiān)控設(shè)備,電子識別并曝光駕駛員不禮讓行人行為,一方面通過罰款扣分的形式強(qiáng)制規(guī)范駕駛員行為,另一方面通過社會道德約束交通參與者的行為; 2) 在較寬路段設(shè)置安全島,保障行人多次過街的安全性,有助于行人安全過街; 3) 加強(qiáng)交通安全宣傳,強(qiáng)化道路參與者安全教育,引導(dǎo)形成車讓人的意識. 在現(xiàn)有博弈模型基礎(chǔ)上引入3個心理表征參數(shù),考慮彼此選擇對對方收益的影響,提出了在無信號控制路段不完全理性下的人車沖突博弈模型,得出4種決策局的不同收益,分析“車讓人”的社會最優(yōu)策略局.結(jié)合行人-駕駛員讓行傾向調(diào)查進(jìn)行數(shù)值模擬,模型與調(diào)查結(jié)果基本吻合,具有相似的趨勢. 研究結(jié)果表明,行人駕駛員雙方在對個人利益看重程度以及對對方的體諒程度上基本相似,但在信任程度上駕駛員對行人讓行的信任程度低于行人對駕駛員讓行的信任程度.同時,發(fā)現(xiàn)在新規(guī)則的影響下,在無信號控制路段,人車發(fā)生沖突時讓行狀態(tài)從“行人避讓車輛”變?yōu)椤榜{駛員主動禮讓行人”,說明該政策執(zhí)行后起到了管制作用.為使駕駛員能主動為行人讓行,行人更多地信任駕駛員,可將交通法規(guī)教育與硬性管控懲罰手段相結(jié)合,提高駕駛員、行人的安全意識,增強(qiáng)駕駛員搶行時的懲罰力度,從而提高道路的通行效率. 文中建立的模型以及分析結(jié)果可為無信號控制路段的管控提供參考,但本文選取的3個參數(shù)具有一定的局限性,后續(xù)需收集大量數(shù)據(jù)分析,篩選出更主要的心理參數(shù),并標(biāo)定出不同主觀概率所占權(quán)重.在無信號控制路段,行人駕駛員過街可能存在多次博弈的情況,因此還需考慮雙方在過街時的學(xué)習(xí)、認(rèn)知以及不斷適應(yīng)的過程,從而建立認(rèn)知層次模型.為進(jìn)一步探究政策誘導(dǎo)效果,可結(jié)合不同政策規(guī)劃下的懲罰力度,建立集主觀意識-客觀誘導(dǎo)于一體的博弈決策模型.2.2 行人、駕駛員的安全通行函數(shù)
3 基于行為博弈的模型改進(jìn)
3.1 模型假設(shè)
Hi(S1,S2)=αiπi(S1,S2)+(1-αi)π-i(S1,S2)
-βimax{πi(S1,S2)-π-i(S1,S2),0}
+θimin{πi(S1,S2)-π-i(S1,S2),0}
s.t.Hi(S1,S2)=PSiπi(S1,S2)
0≤αi≤1,i=1,2
0≤βi≤1,i=1,2
0≤θi≤1,i=1,23.2 贏得矩陣優(yōu)化
3.3 贏得函數(shù)
4 行人與機(jī)動車不完全理性下博弈社會最優(yōu)分析
4.1 社會最優(yōu)局建立
4.2 社會最優(yōu)分析
5 傾向調(diào)查與數(shù)值模擬分析
5.1 行人-駕駛員讓行傾向調(diào)查與數(shù)值模擬
5.2 讓行意愿分析
6 結(jié)論與展望