毛軍權(quán), 孫紹榮
(1.上海財經(jīng)大學國際工商管理學院,上海 200433;2.上海理工大學管理學院,上海 200093)
員工越軌行為是指員工在各種情況下對組織成員、組織生存和組織規(guī)則有著明顯危害的主觀行為[1],是一種為個別利益侵犯共同利益的行為,既包括撒謊、偷懶和揩油等輕微行為,也包括盜竊、浮夸、欺詐、破壞及貪污等嚴重行為.一些研究表明,員工越軌行為非常普遍,有35%~55%的員工存在這種現(xiàn)象[2],對于處在社會轉(zhuǎn)型和深化改革背景下的國內(nèi)企業(yè)所遭遇到的這方面問題則更加突出,它具有主觀性、隱蔽性及擴散性等特征,直接影響和制約著企業(yè)的績效水平.因此,進行員工越軌行為組織控制的相關(guān)研究對于提高企業(yè)的凝聚力和競爭力具有非常重要的現(xiàn)實意義.但是,當前針對該領(lǐng)域的專門研究卻并不多,以至有學者發(fā)出了“越軌行為正在消亡嗎?”的呼吁[3].其中,在具體組織控制策略研究方面,Hollinger是最有影響的學者之一[4],他研究了公司政策、人格測試、調(diào)查控制、安全感和懲罰對員工越軌行為控制的影響,提出了制定控制策略的4個關(guān)鍵,即掌握越軌行為、傳播公司正面信息、實施懲罰制度、維護制度約束力和宣傳公司制度.文獻[1,4]根據(jù)越軌行為的成因提出了內(nèi)在控制、過程控制和結(jié)果控制這3種不同的組織控制策略及其組合,并運用因素分析法驗證了監(jiān)督制度、懲罰約束、敏感控制及宣傳溝通等組織控制策略的適用性.文獻[5]認為一個比較完善的企業(yè)員工行為控制體系應(yīng)該包括目標體系、標準體系、考核體系及獎懲體系等幾個方面.文獻[6]從戰(zhàn)略、文化和結(jié)構(gòu)三者互動的角度對企業(yè)員工越軌行為進行了審視,提出要把員工越軌行為的控制納入到企業(yè)戰(zhàn)略管理的范疇.文獻[7]探討了組織公平與工作場所中越軌行為的關(guān)系,提出企業(yè)管理者應(yīng)該盡量維護組織公平,提倡組織公民行為.文獻[8]提出了轉(zhuǎn)變管理者自身行為、改善約束體系和強化對員工的教育等3種改進措施來減少并控制員工的越軌行為.文獻[9]則通過建立行為控制的博弈模型,得到了對企業(yè)員工越軌行為實施控制的條件和時點的定量標準.
勿庸置疑,上述這些研究是很有價值的,但它們大多偏重于各種具體的越軌行為控制策略的定性研究,而從員工越軌行為控制的微觀機理視角進行定量研究的還比較欠缺,即便有些定量研究也是基于變量之間確定的因果關(guān)系來展開的,沒有檢索到直接涉及不確定性關(guān)系語境的專題文獻,而“唯一確定的就是不確定”[10]恰恰是當今企業(yè)所必須面對和關(guān)注的,在員工越軌行為控制領(lǐng)域當然也不例外.本文通過借鑒相關(guān)的理論模型[11],從不確定性視域出發(fā),建立了企業(yè)員工越軌行為控制的博弈模型,以期為相關(guān)企業(yè)建立和完善員工管理的制度提供一定程度的決策支持.
先作假定:
a.行為博弈的參與者主要有兩方,一是作為行為控制者的企業(yè)管理者,二是作為控制對象的員工,并預(yù)設(shè)他們?yōu)槔硇缘淖非笞陨硇в米畲蠡慕?jīng)濟人.這里的效用最大化既包括物質(zhì)財富最大化,也包括非物質(zhì)財富最大化(如對名譽、地位的追求).所謂“理性”,是指能充分理解自身利益所在,并能采取正確對策使自身效用最大化.
b.博弈雙方信息不對稱.企業(yè)管理者和員工都對自己的行為信息了解較多,而對對方的信息了解較少,只知道對方所有可能選擇的行為集,且僅可以進行不準確的概率估計.
c.企業(yè)管理者對員工行為的觀測能力有限.比如員工行為越軌,企業(yè)管理者很可能沒有發(fā)現(xiàn),或者員工有越軌行為,卻被當成創(chuàng)新行為等.
d.企業(yè)管理者的控制行為具有一定的不確定性.比如企業(yè)管理者發(fā)現(xiàn)員工行為越軌,是否真的會采取嚴厲的懲罰措施,以及到底采取何種懲罰措施,都可以是不確定的.
e.博弈參與雙方的行動順序為:企業(yè)管理者首先對員工給出自己的行為承諾,員工根據(jù)所了解的信息估計企業(yè)管理者的觀測能力和博弈策略,由此估計自己選擇各種行為時的期望回報,并據(jù)此選擇自己的行為.然后,企業(yè)管理者觀測員工的行為,給予員工相應(yīng)的控制回報.這個過程可以看作是行為控制中的一次博弈,且不斷如此循環(huán)往復(fù).員工可以根據(jù)一次次的博弈結(jié)果,逐步修改對企業(yè)管理者的觀測能力和應(yīng)對規(guī)則的估計.每一次的博弈結(jié)果會對下一步博弈中員工的行為產(chǎn)生影響.
定義1 員工的行為集Aa.
設(shè)員工所有的可選行為的集合為 Aa(簡稱員工的行為集),其中,一共有Na個行為,員工在博弈時必選擇且只選擇其中一個行為aai.
定義2 員工估管理者對 aai的觀測矩陣Pab
在員工選擇了某個行為aai的情況下,員工估計對方(管理者)把自己選擇的行為觀測成行為aaq (也包括行為aai本身,1≤q≤Na)的條件概率為并且即當員工選擇了某個行為aai時,員工估計自己的行為給管理者觀測成自己行為集中的各種行為的概率分布矩陣(簡稱員工估管理者對aai的觀測矩陣)為
當管理者觀測到員工選擇行為aai時,如果管理者選擇行為abj來對應(yīng),則表示為saij,稱saij為管理者的一個用abj來對應(yīng)aai的博弈策略.
定義4 管理者的對策行為集Ba.
設(shè)當管理者觀測到員工選擇行為aai時,管理者共有Nbai個行為可以選擇,即這時管理者存在 Nbai個博弈策略.再設(shè),Ba為當管理者觀測到員工的各種行為時管理者所有可選行為的集合,即當觀測到員工的各個行為后管理者對應(yīng)的各個行為集所成的并集,該集合稱為管理者的對策行為集.換言之,Ba是建立在員工行為集Aa上的管理者的對策行為集.該集合中的元素數(shù)量記為Nba.
例 員工的行為集為Aa={aa1=拒絕賄賂, aa2=接受賄賂}
當管理者觀測到員工行為為“拒絕賄賂”時,可選擇行為的集合為
當管理者觀測到員工行為為“接受賄賂”時,可選擇行為的集合為
則管理者的行為集Ba為
定義5 管理者的博弈策略矩陣Sb.
將Sb=S(Na×Nba)看作是在員工行為集Aa制約下管理者所有可能博弈策略的集合所成的矩陣,即管理者的博弈策略集矩陣.
例如,對于上例,管理者的博弈策略矩陣為
對于員工來說,即使確信管理者已經(jīng)觀測到自己選擇的行為為aai,一般也不能確信管理者是否一定能選擇行為abj來對應(yīng).即員工只能估計管理者存在博弈策略saij的概率為pab(saij).
定義6 員工估管理者的博弈策略概率矩陣Pab(Sb).
對應(yīng)于管理者的博弈策略集矩陣Sb,員工所估計的管理者的各種博弈策略的概率所成的矩陣為Pab(Sb),簡稱為員工估管理者的博弈策略概率矩陣.
其中,子矩陣Pab(sai)為員工估管理者觀測到員工行為aai時的博弈策略概率矩陣.
例如,對于上例,假設(shè)員工估計管理者的博弈策略概率矩陣為
設(shè)員工實際發(fā)生的行為aai與管理者實際發(fā)生的對應(yīng)行為abj共同作用,導致的對員工的回報為haij(-1≤haij≤1),在員工已經(jīng)選擇行為aai的情況下,管理者的博弈策略集的元素數(shù)量為Nba,因而可能給員工帶來的回報有Nba種.
定義7 行為aai的回報矩陣Hai.
在員工已經(jīng)選擇行為aai的情況下,員工可以期望的回報的集合所成的矩陣Hai(稱為行為aai的回報矩陣)為
定義8 員工的回報矩陣Hab.
對于員工行為集Aa和管理者行為集Ba,將集合
看作是在員工行為集Aa和管理者行為集Ba組合下的對員工的所有可能回報的集合,稱為員工的回報矩陣.
例如,對于上例,假設(shè)員工與管理者雙方的行為組合所形成的對員工的回報矩陣為(回報矩陣中的元素的數(shù)值為對員工的標準效用值,其值域為[-1, 1])
如果管理者明確地觀測到員工選擇了行為aai (這時管理者得到的信息是:員工選擇行為aai的概率為1,選擇其他行為的概率為0,即1),這時員工對自己的行為aai的估計期望回報為員工估管理者對aai的各種反應(yīng)規(guī)則的概率與相應(yīng)形成的對行為aai的回報矩陣的乘積,簡稱為“管理者觀測到aai情況下的估計期望回報”,用表示,即
在博弈過程中,員工可以用式(7)來估算各行為的期望回報,為回避風險而拒絕越軌行為,并選擇最優(yōu)行為.需要注意的是,由于行為 aai的回報矩陣Ha i依賴于雙方的行為組合,所以,在式(7)中,能夠單純地反映來自管理者信息的是員工估管理者對aai的觀測矩陣與員工估管理者的博弈策略概率矩陣 Pab(Sb)的乘積
描述員工在行為集Aa中選擇各種行為時,員工估管理者從行為集Ba中選擇各種應(yīng)對行為的概率的矩陣,稱為員工估管理者對Aa的反應(yīng)概率矩陣它是員工估管理者的觀測矩陣Pab(Aa)與員工估管理者的博弈策略概率矩陣Pab(Sb)的乘積,即
同理,可以得到員工的各行為的估計期望回報,排列起來就形成了描述員工的所有行為的估計期望回報矩陣,即
當員工發(fā)生了行為aai后,由于管理者可能有各種觀測結(jié)果,即不一定把員工的行為觀測成aai,同時管理者對于觀測到的各種行為,究竟采用何種博弈策略也是存在一定的概率的.因此,管理者對員工行為的對應(yīng)行為可表達為管理者各種可選擇行為的概率分布矩陣.這個矩陣可以根據(jù)管理者的實際觀測矩陣及管理者的博弈策略概率矩陣來計算.
設(shè)在員工已經(jīng)發(fā)生了行為aai的情況下,管理者在實際上把該行為觀測成員工行為集Aa中的各種行為的概率所成的矩陣,稱為管理者對aai的實際觀測矩陣即
定義11 管理者對Aa的實際觀測矩陣Pb(Aa).
對于員工的行為集Aa中的各種行為來說,在員工從中選擇各種行為時,把管理者對這些行為所成的實際觀測矩陣按行依次排列所成的矩陣,稱為管理者對Aa的實際觀測矩陣Pb(Aa),即
需要注意管理者對 Aa的實際觀測矩陣Pb(Aa)與員工估管理者的觀測矩陣Pab(Aa)的區(qū)別,Pb(Aa)中的元素表示的是管理者對員工行為的實際觀測概率,可以看作是真實的概率,而Pab(Aa)中的元素所表示的概率只是員工對管理者的各種觀測概率的估計,兩者很可能在實際上存在著較大差別.
定義12 管理者的博弈策略概率矩陣Pb(Sb).
對應(yīng)于管理者的博弈策略集Sb,管理者所確定的各種博弈策略的最優(yōu)概率(這種最優(yōu)概率有兩種含義,一是在保證員工在以后的博弈中以一定的意愿強度拒絕越軌行為的條件下,使管理者對員工的行為控制成本最小;二是在給定的成本下,使員工在以后的博弈中拒絕越軌行為的驅(qū)動力最大)所成的矩陣為Pb(Sb),簡稱為管理者的博弈策略概率矩陣,其中的元素pb(saij)表示當管理者觀測到員工發(fā)生了行為aa i時,管理者就以概率pb(saij)來選擇行為abj對應(yīng),即管理者使用博弈策略saij的概率為
其中,子矩陣Pb(sa i)為管理者觀測到員工行為aai時的博弈策略概率矩陣.
同樣,也需要注意管理者的博弈策略概率矩陣Pb(Sb)與員工估管理者的博弈策略概率矩陣Pab (Sb)的區(qū)別,Pb(Sb)中的元素可以看作是真實的概率,而Pab(Sb)中的元素所表示的概率只是員工對管理者的各種博弈策略的概率的估計,兩者很可能在實際上存在著較大差別.
將員工在行為集Aa中選擇各種行為時,管理者從行為集Ba中選擇各種應(yīng)對行為的概率,稱為管理者對Aa的實際反應(yīng)概率矩陣它是管理者的實際觀測矩陣Pb(Aa)與管理者的博弈策略概率矩陣Pb(Sb)的乘積,即
員工對行為aa i的實際期望回報是指行為aa i的回報的真實數(shù)學期望.如果員工能夠準確掌握管理者的全部信息,則員工對管理者的情況的估計是完全準確的,因此,員工對行為 aai的估計期望回報Ehai與實際期望回報Eh*ai是完全一致的.如果員工不能準確掌握管理者的全部信息,這時員工對管理者的情況的估計一般是不準確的,即員工對行為aai的估計期望回報Ehai與實際期望回報Eh*ai往往是不一致的.
同理,可以得到員工對自己各行為的實際期望回報,排列起來就形成了描述員工的所有行為的實際期望回報矩陣,即
同樣,如果員工能夠準確掌握管理者的全部信息,則員工的估計期望回報矩陣EhAa與實際期望回報矩陣是完全一致的.如果員工不能準確掌握管理者的全部信息,則兩者一般是不一致的.
在越軌行為控制的博弈過程中,理性的員工會根據(jù)自己掌握的管理者信息(比如管理者觀測自己行為能力的信息、管理者的博弈策略的信息等)來計算自己的估計期望回報矩陣EhAa,然后從中拒絕估計期望回報為負(即懲罰)的越軌行為,并選擇估計期望回報最高的最優(yōu)行為.因此,面對理性的員工,越軌行為控制實際上就是設(shè)法讓員工形成符合要求的估計期望回報矩陣EhAa,EhAa實際上全面描述了理性員工行為選擇的傾向與意愿強度,這是通過EhAa中各分量的數(shù)值判別來實現(xiàn)的.
隨著博弈各階段的逐漸進行,員工對管理者的信息一般會逐漸了解,即對管理者的信息的估計會越來越準確.這意味著在不斷的博弈過程中,員工的估計期望回報矩陣EhAa會與實際期望回報矩陣越來越接近,或者說EhAa會逐漸收斂于.在這個過程中,博弈各階段中的員工實際得到的回報是員工修正自己對管理者的信息判斷的主要依據(jù).
因此,考慮到后面階段對員工進行行為控制的需要,管理者不能只考慮在本階段博弈中的行為最優(yōu),而是要努力維護一個合理的實際期望回報矩陣.然而,這是通過建立合理的管理者的實際反應(yīng)概率矩陣來實現(xiàn)的,更進一步說是通過建立合理的管理者實際觀測矩陣Pb(Aa)與博弈策略概率矩陣Pb(Sb)來實現(xiàn)的.這就需要管理者對Pb(Sb)進行優(yōu)化,或者提高對員工行為的觀測能力.當然,這些都需要考慮控制成本問題.
由于越軌行為控制的目標是管理者事先確定的.所以,不確定視域下企業(yè)員工越軌行為控制的博弈均衡是:管理者以一定的成本選擇觀測能力和博弈策略,由此決定員工以一定的強度的驅(qū)動力拒絕越軌行為,并選擇最優(yōu)行為.雙方的博弈均衡點都集中表現(xiàn)為員工的實際期望回報矩陣,因為它既是由管理者的控制成本決定的,又是員工行為選擇的最終參照.
本文從不確定性視域出發(fā),考察了博弈雙方的行為觀測偏差,定義了在信息不對稱條件下企業(yè)管理者對員工的行為觀測矩陣、管理者的博弈策略矩陣、員工對企業(yè)管理者觀測能力的估計矩陣及對企業(yè)管理者博弈策略的估計矩陣等,建立了企業(yè)員工越軌行為控制的博弈模型,為企業(yè)員工越軌行為控制的研究提供了定量分析的新方法,具有比較重要的現(xiàn)實價值和方法創(chuàng)新意義.當然,由于本文的研究還只是初步的探討,相關(guān)的研究結(jié)果還有待于在更為廣泛的實證檢驗與實踐應(yīng)用中進一步發(fā)展和完善.
[1] 劉善仕.企業(yè)員工越軌行為的組織控制研究[J].外國經(jīng)濟與管理,2002,24(7):19-23.
[2] HARPER V L.Intuitive psychologist or intuitive lawyer?Alternative models of the attribution process[J]. Journal of Personality and Social Psychology,1990,39 (3):767-772.
[3] MITCHELL M J,RICHARD A W,DAVID D.Is Deviance“Dead”?The Decline of a Sociological Research Specialization[R].New York:The American Sociologist,2001.
[4] 劉善仕.企業(yè)員工越軌行為的組織控制策略研究[J].華南師范大學學報(社會科學版),2004,25(12): 135-138.
[5] 賀遠瓊,田志龍.我國企業(yè)員工行為控制體系的建立和完善[J].中國流通經(jīng)濟,2002,16(5):27-30.
[6] 石巧君,李相銀.企業(yè)員工越軌行為的戰(zhàn)略性思考[J].江蘇商論,2004,21(2):88-90.
[7] 李艷華,凌文輇.談組織公平與工作場所中越軌行為的關(guān)系[J].商業(yè)時代,2006,25(16):45-53.
[8] 董曉波.組織員工的非正常行為控制[J].淮海工學院學報(自然科學版),2007,16(4):81-84.
[9] 毛軍權(quán).企業(yè)員工越軌行為及其組織控制的經(jīng)濟學分析[J].管理現(xiàn)代化,2003,23(4):47-50.
[10] 徐飛.不確定性視域下的戰(zhàn)略管理[N].文匯報,2008 -04-06(6).
[11] 毛軍權(quán),孫紹榮.基于不確定性回報的行為控制博弈分析[J].數(shù)學的實踐與認識,2007,37(19):58-70.