馮紹紅,翟龍真,陳佳賢
(南京航空航天大學(xué) 經(jīng)濟(jì)與管理學(xué)院,江蘇 南京 211100)
緊急疏散過程中,由于逃生資源的有限性,疏散人員之間存在著復(fù)雜的沖突交互行為。在沖突中,行人可以選擇競爭或合作的行為。行為沖突若處理不當(dāng),將給疏散和疏導(dǎo)帶來困難。因此,有必要揭示人員行為沖突策略選擇的博弈過程及演化規(guī)律,促進(jìn)資源競爭的合作,以減少沖突帶來的傷亡。
在對人群沖突機(jī)制以及自組織效應(yīng)的探索中,多數(shù)微觀行為模型采用隨機(jī)方法或引入摩擦系數(shù)來描述粒子間的擠壓力和摩擦力[1-3]。但是這些模型忽略了人員之間的個性特征以及對沖突中個體行為決策的影響。隨著研究的深入,博弈論成為探索人群沖突中個體行為決策的有利工具[4]。演化博弈模型以簡單的方式解決了人員面對沖突時的不同行為決策以及影響決策的內(nèi)在特征。這些特征獨(dú)立于外部環(huán)境,來自個體的生理與心理狀態(tài)。但是以往解決沖突問題的博弈模型,建立在博弈雙方具有對稱性的基礎(chǔ)之上,忽略了人員間的個體差異和非對稱的關(guān)系。這種非對稱性對不同人員的行為決策具有重要影響。
綜合分析,關(guān)于應(yīng)急疏散過程中的行為沖突問題,現(xiàn)有研究存在下述不足:1)忽略人員的個體特征因素,缺乏對人員間的非對稱性和合作的心理收益的分析;2)缺少個體特征對策略選擇過程的解釋,尤其是定量分析。因此,本文考慮人員的個體差異,引入非對稱性因子,采用鷹鴿博弈模型來探討非對稱視角下人員行為沖突問題。研究各相關(guān)因素變化對策略的影響,為減少應(yīng)急疏散中群體沖突,維持合作有序的疏散提出有效建議。
人員的個體差異,使人員在競爭共同目標(biāo)位置的行為沖突中之間形成了1種不對稱的競爭關(guān)系,從而形成了行為沖突中的“非對稱性”。參考田玉敏[5]、Chang等[6]和李麗華[7]提出的疏散主體在疏散過程中所具有的差異,本文從生理角度的年齡、性別和行動能力3個指標(biāo)來衡量疏散人員占領(lǐng)共同目標(biāo)位置的競爭值大小,以此來構(gòu)建人員的競爭值指標(biāo)體系,并計(jì)算疏散人員之間的非對稱性。
采用修正的“鷹鴿博弈”模型,反映應(yīng)急疏散過程中博弈雙方在非對稱視角下的行為沖突問題。當(dāng)沖突發(fā)生時,人員分別有2個策略:鴿策略(D)和鷹策略(H)。當(dāng)2類人員陷入沖突中時,假設(shè)[9]:
1)在沖突中成功獲得目標(biāo)位置的收益為v,產(chǎn)生沖突的成本為c,且c>v,否則持續(xù)的沖突總能獲得正收益,與實(shí)際不符。
2)當(dāng)發(fā)生沖突的人員都采取鴿策略時,競爭值為k的人員獲得收益為kv,競爭值為1-k的人員所獲收益為(1-k)v。
3)當(dāng)雙方都采取鷹策略時,競爭值為k的人員得到的收益為(v-c)/4k,另一方得到的收益為(v-c)/4(1-k),分母之所以乘以4,是為了使模型在k=0.5時能回到經(jīng)典的模型。
4)當(dāng)沖突中的人員采取不同的策略時,即一方采取鷹策略,而另一方采取鴿策略時,此時的收益與經(jīng)典模型相同,采取鷹策略的收益為v,采取鴿策略的收益為0。
根據(jù)以上假設(shè),博弈方A,B關(guān)于“鷹鴿博弈”采取不同策略時,其支付矩陣如表1所示。
表1 非對稱性“鷹鴿博弈”支付矩陣Table 1 Payoff matrix of asymmetric “hawk-dove game”
根據(jù)表1,博弈方A群體的人員選擇鴿策略的期望收益如式(1)所示:
VAD=kvy
(1)
式中:k表示人員競爭值;v表示獲得目標(biāo)位置的收益;y表示博弈方B群體中選擇鴿策略的比例。
博弈方A群體的人員選擇鷹策略的期望收益如式(2)所示:
(2)
博弈方A群體人員的平均期望收益如式(3)所示:
VA=xVAD+(1-x)VAH
(3)
式中:x表示博弈方A群體中選擇鴿策略的比例。
同理可得,博弈方B群體人員選擇鴿策略和鷹策略的期望收益為VBD、VBH和平均期望收益為VB。
由演化博弈原理可知,博弈雙方的復(fù)制動態(tài)方程分別如式(4)所示:
(4)
群體B選擇鴿策略的復(fù)制動態(tài)方程F(y)如式(5)所示:
(5)
(6)
圖1 v 由于收益中包含不可量化的指標(biāo),因此結(jié)合實(shí)際情況對相關(guān)參數(shù)進(jìn)行合理假設(shè)。假設(shè)非對稱性因子k=0.7。同時假設(shè)收益v=50,成本c=100。2者數(shù)值模擬初始值分別為(0.1,0.3),(0.4,0.7),(0.7,0.8),(0.8,0.7),(0.6,0.4),(0.3,0.1),參與主體策略選擇隨時間變化的動態(tài)演化過程如圖2所示。 圖2 博弈參與主體策略選擇的動態(tài)演化過程Fig.2 Dynamic evolution process of game participants’ strategy choice 當(dāng)博弈雙方的初始合作狀態(tài)分別位于點(diǎn)(0.1,0.3)或者(0.3,0.1)的位置時,表示群體雙方采取合作的比例很低,均傾向于采取競爭策略。根據(jù)前文模型c≥v的定義,當(dāng)雙方都采取競爭策略時,2者的成本遠(yuǎn)遠(yuǎn)大于所獲得的收益。因此博弈雙方為獲得更高的收益,有改變當(dāng)前策略的強(qiáng)烈意愿,最終向(0,1)或者(1,0)演化,即一方競爭,另一方合作。當(dāng)博弈雙方的初始合作狀態(tài)分別位于點(diǎn)(0.7,0.8)或者(0.8,0.7)的位置時,雙方均傾向于采取合作策略。然而由于采取競爭策略能夠獲得更大的收益,因此,雙方最終也將改變初始的合作策略,演化為(0,1)或(1,0),亦即一方競爭,另一方合作。 同時從圖3中可以看出,當(dāng)博弈雙方的初始合作比例(x,y)取不同值時,最終的博弈演化結(jié)果也收斂于不同點(diǎn),驗(yàn)證了雙方策略的演化結(jié)果對(x,y)初始值具有依賴性。 圖3 合作概率x隨非對稱性因子w的變化情況Fig.3 Variation of cooperation probability x with asymmetry factor w 1.3.1 非對稱性因子對博弈的影響 (7) 博弈雙方可能采取混合策略,由式(7)可以得到,混合策略中采取合作策略的比例強(qiáng)烈依賴于博弈雙方的非對稱性和沖突的單位成本收益。 由圖3可知,當(dāng)博弈雙方的非對稱性w=1時,此時合作概率x最小。當(dāng)沖突的單位成本收益r不變,博弈雙方的非對稱性變小或者變大時,即0 由上述對非對稱性的界定可知,疏散人員之間的非對稱性主要體現(xiàn)在生理差異方面,疏散人員之間的非對稱性可以促進(jìn)合作,主要在于:經(jīng)統(tǒng)計(jì),一般情況下,男性相比于女性,中青年相比于年幼和年長者,健全人員相較于殘疾人員,有更強(qiáng)的行動能力和更快的運(yùn)動速度,具有較高的競爭值,進(jìn)入目標(biāo)位置的概率更大。這種不對稱性使博弈雙方的勝負(fù)關(guān)系顯而易見。在現(xiàn)實(shí)中,由于逃生本能的驅(qū)使,競爭值較小的人員為爭奪有限的生存資源會采取激烈的競爭策略。如果競爭值大的人員也采取競爭策略,那么將導(dǎo)致雙方均不能及時有效地占領(lǐng)目標(biāo)位置,浪費(fèi)寶貴的時間。因此,競爭值高的人員為了減少時間浪費(fèi)的損失,更傾向與競爭值低的一方開展合作。對于競爭值低的人員來說,其會考慮到,如果競爭值高的人采取鷹策略,將會給自己帶來零收益或者更大的損失,而如果雙方均采取鴿策略,那么自己將從合作中得到部分收益。因此,競爭值低的人員將采取“示好”的方式減少與競爭值高的一方因公共資源緊張而導(dǎo)致的競爭,促成雙方的合作,使雙方維持較高的合作比例。當(dāng)雙方的非對稱性越顯著,越有利于促進(jìn)合作行為的演化,合作的比例越高。 1.3.2 不同的單位成本收益對博弈的影響 由圖4可知,當(dāng)非對稱因子w不變時,合作概率與沖突的單位成本收益r呈負(fù)相關(guān)關(guān)系。沖突的單位成本越大,合作比例越小,博弈雙方越傾向于選擇競爭策略。這與群體的趨利本性一致。為了減少人群沖突,提高疏散人群的合作比例,需要降低r值。由于r=v/c,分別考慮收益值v和成本c。 圖4 合作概率x隨沖突的單位成本收益r的變化情況Fig.4 Variation of cooperation probability x with unit cost-benefit of conflict r 1)關(guān)于收益v。在占領(lǐng)目標(biāo)位置的行為沖突中,各疏散人員的收益主要指的是時間收益。時間收益是疏散人員成功占領(lǐng)目標(biāo)位置時可能獲得的更短的逃生時間和更大的逃生機(jī)會。在特別緊急情況下,每一秒都象征著生的希望,有限且具有優(yōu)勢的位置資源使逃生者獲得的時間收益v是巨大的。疏散人員更傾向于選擇競爭而獲得更大的收益v,因此各疏散人員對同一目標(biāo)位置的爭奪也愈加激烈。當(dāng)緊急情況不會威脅到生命的情況下,疏散人員從沖突中獲得的時間收益減少而傾向于合作獲得更大的非時間收益。 2)關(guān)于沖突成本c。近些年來世界各地發(fā)生的踩踏事件層出不窮,傷亡嚴(yán)重。據(jù)統(tǒng)計(jì),這些事故與人員疏散時的恐慌與爭搶行為密切相關(guān)[10]。如果疏散人員之間發(fā)生激烈的競爭沖突,很容易造成群體恐慌和憤怒,使人群陷入1種極端焦慮的狀態(tài)而不能自拔,擁擠、跌倒、踩踏便接連發(fā)生。在這種情況下除了競爭沖突的直接成本,很可能還需要付出更大的機(jī)會成本,即各疏散人員需要付出的沖突成本c很大?;诖丝紤],各疏散人員應(yīng)傾向于減少競爭沖突,通過協(xié)調(diào)合作獲得更大的時間收益。 綜上考慮,當(dāng)發(fā)生緊急事件時,為提高疏散效率,現(xiàn)場指導(dǎo)人員可以從成本和收益2個角度出發(fā)采取相關(guān)措施,一方面緩解人群的緊張和恐慌情緒,從心理上減輕疏散人員的時間緊迫感,另一方面?zhèn)鬟f避免擁擠的信息,防止人群過度競爭導(dǎo)致的擁擠阻塞和時間浪費(fèi),從而提高疏散人員的合作比例,使人群能夠有序安全地疏散。 沖突與合作行為的演化一直是生物學(xué)家、社會和經(jīng)濟(jì)學(xué)家研究的重要問題之一。文獻(xiàn)[11]指出,合作者的集群效應(yīng)能夠使合作者在逃生中獲得更大的收益。合作者能夠從相互合作中得到更多的收益已從各方面得到證實(shí)。沖突的相互合作行為,不僅能使雙方依次通過目標(biāo)位置,而且增加了心理收益。 社會場理論認(rèn)為人類行為的影響因素不僅包括生理因素還包括心理因素。心理因素對人類行為的形成同樣具有舉足輕重的作用。Song等[12]認(rèn)為自私的人期望通過競爭獲取最大利益,無私的人出讓部分利益。道德情緒是指個體根據(jù)一定的道德標(biāo)準(zhǔn)評價自己或他人行為和思想時所產(chǎn)生的情緒[13]。其能激發(fā)個體做出對他人或整個社會有利行為的情緒性反應(yīng)。道德情緒最大的特點(diǎn)是社會性和利群性。當(dāng)個體意識到自己的行為違反了道德規(guī)范或傷害他人時,會產(chǎn)生羞恥、內(nèi)疚的消極道德情緒。而當(dāng)個體產(chǎn)生利他行為時則會獲得心安、自豪等積極道德情緒[14]。緊急情況下發(fā)生行為沖突,當(dāng)博弈雙方相互合作時,不僅能依次通過關(guān)鍵位置,能夠獲得對方的肯定與支持配合。這時雙方從心理上獲得自豪等積極的道德情緒,獲得合作剩余。另外據(jù)研究,具有高疏散經(jīng)驗(yàn)水平的人員由于受到應(yīng)急疏散演練和安全培訓(xùn),能夠了解恐慌是影響疏散效率的不良情緒,因此將會主動控制自身的恐慌情緒,保持冷靜,組織周圍人員遵守疏散秩序,成為合作的積極推動者,從而抑制恐慌情緒在人群中的擴(kuò)大和傳播[15],提高疏散效率。這部分人群因?yàn)樵陉P(guān)鍵時刻使所擁有的科學(xué)疏散知識發(fā)揮價值而獲得成就感;受感染的人群因采取合作策略,遵守維護(hù)疏散秩序,獲得價值感。 根據(jù)以上分析,處于沖突中的人員相互合作時會使雙方獲得心理收益。為簡化分析,假設(shè)博弈方A獲得的心理收益是MA,博弈方B獲得的心理收益是MB。因此考慮合作心理收益的支付矩陣如表2所示。 表2 考慮合作心理收益的支付矩陣Table 2 Payoff matrix considering psychological benefits of cooperation (8) 為進(jìn)一步分析系統(tǒng)演化均衡策略的變化情況,可分為4種情境對均衡點(diǎn)的穩(wěn)定性進(jìn)行判斷。 1)在kv+MA 2)在kv+MA>v,(1-k)v+MB 3)在kv+MA 4)在kv+MA>v,(1-k)v+MB>v的情境下,博弈方A和博弈方B的總收益均大于系統(tǒng)收益,這時,點(diǎn)(1,1)均為進(jìn)化穩(wěn)定點(diǎn),系統(tǒng)演化的均衡策略為(合作,合作)。博弈雙方的演化博弈相圖如圖5所示。 圖5 情境4)下的演化博弈相圖Fig.5 Phase diagram of game evolution in scenario 4) 在情境4)中,博弈雙方的合作心理收益顯著增加,雙方心理收益之和超過了系統(tǒng)收益,系統(tǒng)最終演化為合作狀態(tài)。由此可以看出,心理收益的增加,將有效促進(jìn)博弈雙方合作的順利進(jìn)行。 在考慮合作的心理收益的情況下,假設(shè)k=0.8,v=50,c=100,MA=30,MB=50,參與主體策略選擇隨時間變化的動態(tài)演化過程如圖6所示??梢?,當(dāng)kv+MA>v,(1-k)v+MB>v時,系統(tǒng)演化的均衡策略為(合作,合作)。可以看出博弈雙方合作的心理收益,是促進(jìn)雙方向合作演化的重要動力。因此,為了提高疏散效率,減少沖突造成的巨大時間成本,一方面應(yīng)提高應(yīng)急疏散演練和安全培訓(xùn)的水平,抑制恐慌情緒的擴(kuò)大與傳播,另一方面加強(qiáng)情緒道德的建設(shè),挖掘合作的心理收益。 圖6 考慮合作心理收益情況下博弈主體策略選擇的動態(tài)演化過程Fig.6 Dynamic evolution process of game participants’ strategy choice considering the psychological benefits of cooperation 1)非對稱性視角下的鷹鴿博弈模型更加符合應(yīng)急疏散過程中人員行為沖突的實(shí)際問題。本文從生理角度描述人員間的個體差異,界定人員之間的非對稱性。通過仿真發(fā)現(xiàn),人員之間的非對稱性越顯著,沖突的單位成本收益越小,將越有利于使博弈雙方接近于(鴿,鴿)的合作狀態(tài)。 2)通過考慮博弈雙方合作的心理收益,改進(jìn)非對稱鷹鴿博弈模型。研究發(fā)現(xiàn)當(dāng)合作的心理收益足夠大時,將改變鷹鴿博弈的結(jié)構(gòu)特征,促使博弈雙方向(鴿,鴿)的合作方向演化。 3)基于以上這些現(xiàn)象,可以從心理角度加強(qiáng)道德情緒的建設(shè),使人員養(yǎng)成尊老愛幼、愛護(hù)他人的高尚道德,加強(qiáng)應(yīng)急演練和安全培訓(xùn),培養(yǎng)人員的安全意識,從而促進(jìn)人員之間的相互合作,縮短緊急疏散時間。1.3 數(shù)值仿真
2 考慮合作心理收益的非對稱性演化博弈模型
2.1 疏散人員合作心理收益
2.2 模型構(gòu)建與求解
2.3 考慮合作心理收益下的動態(tài)演化過程
3 結(jié)論
中國安全生產(chǎn)科學(xué)技術(shù)2022年5期