李莎莎,崔鐵軍
(1. 遼寧工程技術大學 工商管理學院,遼寧 葫蘆島 125105;2. 遼寧工程技術大學 安全科學與工程學院,遼寧 葫蘆島 125105)
在任何項目構成的管理系統(tǒng)中,都存在博弈問題。系統(tǒng)中各參與者都在使用各種行為,力求使己方收益最大化,同時平衡各方收益,滿足各方要求。就最簡單工程系統(tǒng)而言,直接勞動者往往是被雇傭的,是直接操作系統(tǒng)的人。他們以自己收益最大化為目標,同時采用簡便、易行且成本最低的行為完成系統(tǒng)賦予的工作,一般是片面的收益最大化。但往往操作者的這些行為綜合在一起導致系統(tǒng)發(fā)生故障或事故,給系統(tǒng)整體收益帶來不利影響。另一角度,系統(tǒng)管理者往往是系統(tǒng)的所有者和受益人。他們以系統(tǒng)整體收益最大化為目標,一般不可考慮操作者群體的收益情況。因此當操作者和管理者成為系統(tǒng)運行的參與者時,他們的行為為各自收益最大化服務。同時,作為系統(tǒng)運行參與者,他們要考慮對方行為,從而調整己方行為,在獲得收益最大化的同時滿足對方要求。因此操作者和管理者組成了具有博弈特征的系統(tǒng),而如何在管理者角度分析和保障系統(tǒng)收益成為研究的關鍵問題。
關于各類系統(tǒng)博弈和收益問題的研究已有很多。風險收益動態(tài)視角下政府與社會資本合作演化博弈[1];動態(tài)激勵視角下建筑工人不安全行為演化博弈[2];資源投入不確定情形下的合作博弈策略[3];網絡博弈合作剩余收益分配[4];新零售模式下供應鏈收益博弈優(yōu)化[5];三方博弈視角下項目安全行為策略分析[6];進化博弈的礦工不安全行為研究[7];多方博弈下起重作業(yè)人員有意不安全行為分析[8];基于動態(tài)博弈的礦工不安全行為研究[9]和干預[10];風險管理合作中的演化博弈分析[11];建設工程管理的合作博弈決策[12]。這些研究一般專注于各自領域,并取得了良好效果,作者也在相關領域進行了一些研究等[13-15]。但缺乏對多事件組成系統(tǒng)的收益情況研究。操作者和管理者對系統(tǒng)中各事件可能采取各種行為,那么對兩者而言這些事件收益是不同的。進一步,如果這些事件間存在邏輯關系,共同演化導致了系統(tǒng)收益的變化,則是一個復雜的演化過程?,F有分析方法難以勝任。
針對上述問題,論文使用SFN[16-20]對演化過程進行表示和處理,將操作者和管理者不同行為作用于事件后的收益,定義為事件綜合收益,作為SFN邊緣事件。確定邊緣事件演化過程邏輯關系和處理方法,演化后得到最終事件,即系統(tǒng)收益,并判斷勝出者。
任何系統(tǒng),特別是實際工程建設過程作為系統(tǒng)研究時,可從人、機、環(huán)、管4個方面對系統(tǒng)需要的各種目標進行評價和分析,當然還有更細分類。這里人是系統(tǒng)的實際操作者,是系統(tǒng)中付出勞動的,操作各類機器的人。人存在不安全行為,這主要是對機器、環(huán)境及管理的不適應。機是系統(tǒng)中人的主要操作對象,在機發(fā)生物理破壞和不可逆破壞前一般不發(fā)生故障。機存在不安全狀態(tài),該狀態(tài)一般是由人的不安全行為和環(huán)境因素干擾造成的。環(huán)境在系統(tǒng)中對人和機都有影響,但主要是對人的干擾。適合和不適合的環(huán)境對人的不安全行為有明顯影響。管是系統(tǒng)中對人的約束,也是對機器操作的規(guī)范,使人避免不安全行為,管的具體實施者仍是人。因此上述系統(tǒng)可視為由操作系統(tǒng)的人和管理操作者的人,即操作者和管理者作為參與者的系統(tǒng)。
操作者是系統(tǒng)的使用者,具有安全行為和不安全行為。例如施工現場電焊過程中,焊工對于穿絕緣鞋這個事件可以采取安全和不安全行為。安全行為包括穿符合要求的絕緣鞋等;不安全行為包括不穿絕緣鞋或穿損壞的絕緣鞋等。操作者選擇安全行為或不安全行為的動機是考察行為后該事件給己方帶來的收益。安全行為往往投入更大,需滿足繁瑣的規(guī)章制度;不安全行為往往是方便快捷的,根據直觀而定。還需考慮行為后管理者對操作者行為的反應,可能對操作者收益有利或不利。操作者會綜合考量,在一定概率條件下選擇安全或不安全行為。
管理者是系統(tǒng)的管理或擁有者,系統(tǒng)整體收益可以說是管理者的收益。因此他們往往從系統(tǒng)收益最大化出發(fā)考慮行為策略,對操作者進行管理,包括懲罰和獎勵行為。例如施工現場電焊過程,管理者對操作者穿絕緣鞋或不穿絕緣鞋可采取不同的行為或無行為。對穿符合要求絕緣鞋的操作者進行獎勵,一般情況下管理者沒有獎勵行為;對不穿或穿不符合絕緣鞋的操作者進行懲罰,一般都對這種情況進行懲罰。管理者從系統(tǒng)和項目整體出發(fā)考量收益,并確保最大化;一般不考慮操作者的收益最大?;诖?,管理者根據操作者行為在一定概率條件下選擇懲罰和獎勵行為。
因此,系統(tǒng)中管理者行為和操作者行為都力求己方收益最大化,同時滿足對方的基本要求使對方妥協(xié),兩方策略構成了博弈系統(tǒng)。該系統(tǒng)在生產生活中普遍存在,只要存在管理者和操作者就存在這樣的博弈系統(tǒng),因此,研究參與者行為博弈和導致的系統(tǒng)收益具有重要意義。
系統(tǒng)存在兩個參與者相互博弈時,對系統(tǒng)中一個事件,操作者和管理者可執(zhí)行不同行為滿足己方收益。例如上節(jié)的穿絕緣鞋事件,雙方都有一定概率采取各自的不同行為。系統(tǒng)中另一事件,比如焊槍接地線接觸位置選擇,理論上可接在任何金屬構件上。但不可接在腳手架、鋼筋籠或周圍設備金屬外殼上,例如操作者的安全行為是接在專用地線上,不安全行為是接在上述構件上。但由于現場條件限制,地線時常接在上述構件而不接地。操作者有一定概率選擇安全或不安全行為;同樣管理者也根據實際情況對操作者的接地事件進行管理,有一定概率采取懲罰和獎勵行為。
穿絕緣鞋事件和焊接接地事件操作者都采取了一定行為,同時管理者也采取了對應行為。這時出現另一捆扎鋼筋事件,使得操作者必須徒手捆扎鋼筋,當然操作者和管理者對該事件也要采取適當行為。這3個事件組合在一起,最壞的情況是操作者觸電,操作者收益下降,導致停工,管理者收益下降;或者不發(fā)生觸電事故,操作者蒙混過關,管理者并未發(fā)現,兩者收益不變??梢姴僮髡吆凸芾碚呓M成了以收益為目標的博弈系統(tǒng)。
可見系統(tǒng)層面的收益取決于使系統(tǒng)發(fā)生故障的基本原因,即基本事件在受到操作者和管理者綜合行為處理后,兩者得到的收益情況。這些原因事件收益相互交織,因果演化成為一連串的事件組合,最終形成系統(tǒng)收益。該過程與系統(tǒng)故障過程發(fā)生機理類似,且系統(tǒng)中發(fā)生意外和故障是導致這些事件和系統(tǒng)功能效用變化的主要原因,而功能直接影響收益。作者提出使用SFN研究操作者和管理者博弈系統(tǒng)的收益問題。
博弈論源于20世紀初,又稱對策論。主要研究參與者之間對抗和合作交織情況下,如何決策從而使己方獲得較大收益,并使對方接受。博弈是兩個或多個參與者組成系統(tǒng)的局勢,至少應包括參與者、策略和收益。參與者是博弈存在的基礎,參與者不一定是人,可以是任何與其他系統(tǒng)存在競爭合作關系的系統(tǒng);策略是參與者根據系統(tǒng)局勢和各方情況在采取具體行為前進行的分析與考量。收益指各參與方在經過一系列競爭合作采用各種行為后,己方獲得的目標方面的收益。那么操作者與管理者行為導致系統(tǒng)收益變化是博弈問題。
作者將系統(tǒng)故障過程中各種事件及其邏輯關系抽象為系統(tǒng)故障演化過程(System Fault Evolution Process,SFEP),用SFN表示SFEP[16-20]。SFN包括節(jié)點和有向線段。節(jié)點代表事件,包括SFEP起始原因的邊緣事件,經歷的過程事件和系統(tǒng)最終故障情況的最終事件。有向線段表示事件之間的傳遞關系,從原因事件指向結果事件;傳遞概率表示原因事件導致結果事件的可能性。過程事件和最終事件是結果事件,它們有多個原因事件時下角標標注原因事件間邏輯關系。這樣SFN可表示復雜的SFEP、事件間邏輯關系及演化流程。由操作者和管理者組成博弈系統(tǒng),由于操作者和管理者的不同行為會導致不同的收益,那么對同一事件的不同行為得到的事件收益就可作為SFN的邊緣事件,通過SFN分析得到最終系統(tǒng)收益情況。使用SFN表示操作者與管理者行為的事件綜合收益與演化所得系統(tǒng)收益的關系,并通過博弈論思想解決是可行的。
根據文獻[2],基于SFN的綜合操作者與管理者行為博弈的系統(tǒng)收益分析方法的基本參數定義如下:
r1:操作者安全行為己方收益,R1={r11,···,r1i,···,r1I},選擇安全行為概率P={p1,···,pi,···,pI}。
I:邊緣事件數量,i=1,···,I。
r2:操作者安全行為對方(管理者)收益,R2={r21,···,r2i,···,r2I}。
r3:操作者不安全行為己方收益,R3={r31,···,r3i,···,r3I},選擇不安全行為概率1-P={1-p1,···,1-pi,···,1-pI}。
r4:操作者不安全行為對方收益,R4={r41,···,r4i,···,r4I}。
h:操作者不安全行為系統(tǒng)損失,H={h1,···,hi,···,hI}。
b1:管理者對對方不安全行為罰金,B1={b11,···,bi1,···,b1I},選擇懲罰行為概率Q={q1,···,qi,···,qI}。
b2:管理者對對方安全行為獎金,B2={b12,···,bi2,···,b2I},選擇獎勵行為概率1-Q={1-q1,···,1-qi,···,1-qI}。
上述安全與不安全行為,懲罰和獎勵行為都針對同一個事件ei,所有邊緣事件的集合e={e1,···,ei,···,eI}。
其中,CA為安全行為操作者收益;CU為不安全行為操作者收益。
其中,XF為懲罰行為管理者收益;XZ為獎勵行為管理者收益。
對單一事件而言,操作者和管理者行為后得到的事件綜合收益CXavg是操作者采取的安全和不安全行為給操作者帶來的收益Cavg與管理者采取的懲罰和獎勵行為給管理者帶來的收益Xavg的差值,如式(3)所示。
將式(3)展開,分別根據基本參數合并同類項,得到這些基本參數和對應行為概率與事件綜合收益的關系,如表1所示。
表1 基本參數與事件綜合收益關系Table 1 Relationship between basic parameters and comprehensive event profit
對應于操作者和管理者的博弈過程,邊緣事件相當于操作者行為和管理者行為產生的事件綜合收益。系統(tǒng)最終收益可能取決于操作者和管理者對多個事件采取的不同行為,因此這些行為對所有事件e1~i處理后產生的事件綜合收益是按照SFN相互作用最終形成系統(tǒng)收益C XTavg。例如,事件e1和事件e2同時發(fā)生導致后即事件發(fā)生,兩者是與關系。即操作者和管理者行為后所得兩個事件綜合收益之間也跟隨著相同邏輯關系傳遞到系統(tǒng)收益。這時兩事件同時存在,后繼事件收益是他們綜合收益的和。當兩事件之一發(fā)生導致后繼事件發(fā)生,兩者是或關系。在管理者角度,樂觀情況下的后繼事件收益取兩事件綜合收益較大者;悲觀情況下取較小者。當然,SFN中事件邏輯關系很多[21-22],可對應得到事件綜合收益邏輯關系。這些邏輯關系都基于與或關系,因此給出事件綜合收益與或關系得到后繼事件綜合收益算法,分別如式(5)~(6)所示。
如下給出一個SFEP的SFN,如圖1所示。
圖1 SFN的模型Fig.1 Model of SFN
圖1是某工程項目中事故的SFEP。邊緣事件包括e1、e2、e3、e4,代表導致事故的基本原因;E1、E2、E3表示過程事件,是邊緣事件相互作用后的中間事件;T表示最終事件,是系統(tǒng)最終事故狀態(tài)。
由3.3節(jié)可知,事件之間的演化和邏輯關系可等同于事件綜合收益的演化和邏輯關系。因此,e1、e2、e3、e4可代表操作者和管理者行為后產生的事件綜合收益。過程事件和最終事件下角標的“·”和“+”分別表示與關系和或關系。根據圖1和SFN的化簡方法[16-20]得到系統(tǒng)收益 CXTavg的事件收益c x1av~g4結構表達式,如式(7)所示。
基于樂觀和悲觀角度,將式(5)~(6)分別代入式(7)得到系統(tǒng)收益C XTavg,分別如式(8)~(9)所示。
樂觀系統(tǒng)收益
悲觀系統(tǒng)收益
上述過程完成了系統(tǒng)收益的分析。該系統(tǒng)的參與者是操作者和管理者,操作者有安全和不安全行為,管理者有懲罰和獎勵行為。對于任何一個導致系統(tǒng)故障的邊緣事件,操作者和管理者都可采取這些行為。因此,經過這些行為處理后的事件對于參與者將得到收益。不同邊緣事件之間邏輯關系不同,最終演化為系統(tǒng)的最終事件。可使用SFN方法研究事件綜合收益和系統(tǒng)收益關系,進而判斷系統(tǒng)中參與者的勝出方。為類似的施工安全管理、組織管理、工程管理等的參與者提供博弈方案,使己方利益最大化。
在系統(tǒng)中,對各事件操作者和管理者都有概率采取不同行為導致各事件綜合收益變化,進而導致系統(tǒng)收益變化。對事件綜合收益表達式進行化簡,重新組合得到各基本參數在事件綜合收益中出現的概率。給出了與或關系的事件綜合收益與后繼事件收益邏輯關系表達式,從而確定系統(tǒng)收益和博弈勝出者。通過實例說明方法分析流程,得到了實例系統(tǒng)的各事件綜合收益和系統(tǒng)收益。說明了方法的適用性和正確性。