摘 要:博弈就是一個(gè)在給定的語境中,博弈者借助一定的信息,形成自己的語境信念,進(jìn)而進(jìn)行效用最大化的決策過程。本文從語境和信息兩個(gè)方面對(duì)博弈決策的效用進(jìn)行了分析。在不同的語境下,博弈雙方的收益函數(shù)將出現(xiàn)差異。通過不同信息條件下的效用對(duì)比分析,本文指出,在同一語境下,如果信息使我們的信念逼近事實(shí),則一定會(huì)帶來更多的收益。改善語境和增加信息是博弈者提高收益的兩個(gè)重要途徑。
關(guān)鍵詞:博弈論;語境;信息;效用
中圖分類號(hào):F224.32 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1003-5192(2008)04-0071-04
Analysis of Information Utilities in Game Decisions
ZHAND Deng-bing
(College of Economics and Management, Nanjing University of Aeronautics and Astronautics, Nanjing 210016, China)
Abstract:A game is the process of decision-making in which the players use some information, form their own beliefs, and maximize their utilities in a certain context. The paper analyzed the decision utilities from the point of context and information. The utility functions will differ from each other in different contexts. With utility comparison between the dfferent information conditions, the paper points out that, in a certain context, information will bring the players more utilities if it makes the payers’ beliefs approaching to the facts. Improving the context and increasing the information are the two key paths for the players to reach the biggest profits.
Key words:game theory; context; information; utility
1 引言
信息的效用問題始終是博弈決策的核心問題。許多學(xué)者對(duì)此進(jìn)行了開創(chuàng)性的研究,胡昌平認(rèn)為信息的作用在于改變了人的知識(shí)結(jié)構(gòu)[1],寧宣熙等對(duì)信息價(jià)值進(jìn)行了詳細(xì)分析和量化研究[2],薛華成認(rèn)為信息價(jià)值可用信息導(dǎo)致的決策收益增量來衡量[3],烏家培對(duì)信息的經(jīng)濟(jì)效用問題進(jìn)行了研究[4],陳建龍則對(duì)信息效用及其實(shí)現(xiàn)過程進(jìn)行了探討[5]。
張維迎在專著《博弈論與信息經(jīng)濟(jì)學(xué)》中,通過對(duì)斯坦克爾伯格產(chǎn)量博弈的分析,指出“博弈中的信息優(yōu)勢(shì)可能會(huì)使參與人處于劣勢(shì)”,從而導(dǎo)致信息無效性。他指出,在這個(gè)完全信息動(dòng)態(tài)博弈中,由于后決策企業(yè)在它決策前,已經(jīng)知道了先行決策者的產(chǎn)量,因此它具有信息優(yōu)勢(shì),但是這種信息優(yōu)勢(shì)卻使它在競(jìng)爭(zhēng)中處于劣勢(shì)[6]。筆者認(rèn)為這種提法有值得推敲的地方。其一,后決策者的劣勢(shì)決不是因?yàn)樗哂袃?yōu)勢(shì)信息,而是因?yàn)樗幱谝粋€(gè)劣勢(shì)的環(huán)境中。其二,信息無效將使得人們對(duì)信息的價(jià)值產(chǎn)生懷疑,挫傷人們獲取信息的積極性。在本文中,我們將通過例子證明當(dāng)語境不變時(shí),信息總是有效的。當(dāng)然,如果信息的獲取導(dǎo)致決策者的語境發(fā)生變化,信息的有效性就受到影響。
2 不同語境下的決策效用分析
語境是對(duì)博弈環(huán)境的表述。為了分析的方便,我們以博弈論中的產(chǎn)量博弈為例來進(jìn)行博弈的效用分析。
現(xiàn)在,我們將問題表述如下:有兩個(gè)企業(yè)參與產(chǎn)量決策的博弈;產(chǎn)品的單位成本為常量C;產(chǎn)品的單位價(jià)格是總產(chǎn)量的函數(shù),有P=a-Q 。兩個(gè)企業(yè)應(yīng)該如何決策它們的產(chǎn)量?
我們認(rèn)為,在不同的語境下,決策結(jié)果和效用是不同的。下面,我們針對(duì)三種不同的語境條件,對(duì)此進(jìn)行論述。
2.1 聯(lián)合壟斷的決策效用
如果這兩個(gè)企業(yè)組成聯(lián)合同盟,則它們可均分由壟斷帶來的最高市場(chǎng)利潤(rùn)[7]。
壟斷企業(yè)的總利潤(rùn)為U=Q(a-Q-c),對(duì)Q求導(dǎo),可得利潤(rùn)最大時(shí)的Q*。壟斷總產(chǎn)量Q*=12(a-c),壟斷總利潤(rùn)Q*=14(a-c)2。
兩個(gè)企業(yè)均分以上的產(chǎn)量和利潤(rùn),所以有
q1=q2=14(a-c), u1=u2=18(a-c)2(1)
張登兵:博弈決策中的信息效用分析
Vo1.27, No.4預(yù)測(cè)2008年第4期
2.2 庫諾特寡頭競(jìng)爭(zhēng)模型的決策效用
在該模型下,兩個(gè)企業(yè)同時(shí)進(jìn)行產(chǎn)量決策。它們的決策都是基于對(duì)方產(chǎn)量的利潤(rùn)最大化行動(dòng)[8]。
兩個(gè)企業(yè)的利潤(rùn)函數(shù)如下
u1(q1,q2)=q1(a-q1-q2)-q1Cu2(q1,q2)=q2(a-q1-q2)-q2C(2)
對(duì)上述利潤(rùn)函數(shù)分別求偏導(dǎo)
u1q1=a-(q1+q2)-q1-cu2q2=a-(q1+q2)-q2-c(3)
令上式均為0,得兩個(gè)反應(yīng)函數(shù)
q1=12(a-q2-c)q2=12(a-q1-c)(4)
解這兩個(gè)反應(yīng)函數(shù)的方程組(即兩個(gè)反應(yīng)函數(shù)的交點(diǎn)),即可求納什均衡產(chǎn)量。
可解得:q*1,q*2都為13(a-c),均衡利潤(rùn)均為19(a-c)2。
2.3 斯坦克爾伯格產(chǎn)量競(jìng)爭(zhēng)模型的決策效用
在該模型中,兩個(gè)企業(yè)的行動(dòng)出現(xiàn)先后關(guān)系,企業(yè)1先選擇產(chǎn)量q1,企業(yè)2觀察到后選擇q2。我們可以用逆向歸納法進(jìn)行求解[9]。
首先,在給定q1的情況下,求企業(yè)2的最優(yōu)產(chǎn)量。問題是
maxu2(q1,q2)=q2(a-q1-q2-c)(5)
令一階條件為零,得
q2=12(a-q1-c)(6)
其次,企業(yè)1預(yù)測(cè)到企業(yè)2的上述產(chǎn)量,企業(yè)1的問題是
maxu1(q1,q2)=q1(a-q1-q2-c)=12(a-c)q1-12q21(7)
令一階條件為零,得均衡決策產(chǎn)量
q*1=12(a-c), q*2=14(a-c)(8)
進(jìn)而,我們可得上述產(chǎn)量下的利潤(rùn)
u1=18(a-c)2, u2=116(a-c)2(9)
2.4 不同語境下的效用比較
我們將上述求解結(jié)果列入下表中,進(jìn)行比較和分析。
從以上的數(shù)據(jù)比較中,我們可總結(jié)出一些非常有意義的結(jié)論。
對(duì)于企業(yè)2來講,由于他所處的決策環(huán)境的惡化,使得他的決策收益不斷降低。
為什么壟斷利潤(rùn)會(huì)大于庫諾特利潤(rùn)之和?這是由競(jìng)爭(zhēng)的語境所決定的。假設(shè)壟斷時(shí)的兩個(gè)企業(yè)處于完全聯(lián)合的狀態(tài),他們的最優(yōu)產(chǎn)量決策是統(tǒng)一的,沒有任何的不確定性。而庫諾特競(jìng)爭(zhēng)中,雙方都以自身的利益最大化為目標(biāo),而忽略了它們的行為對(duì)整體的負(fù)效應(yīng)。從語境上看,壟斷和庫諾特競(jìng)爭(zhēng)是兩種不同的語境,這導(dǎo)致了企業(yè)決策方法的不同,從而產(chǎn)生利潤(rùn)的差異。
在斯坦克爾伯格模型中,企業(yè)1是壟斷先行者,它自認(rèn)為自已在競(jìng)爭(zhēng)中占有絕對(duì)優(yōu)勢(shì),而選擇了整個(gè)社會(huì)的最優(yōu)壟斷產(chǎn)量。然而,它卻不能取得比聯(lián)合壟斷更多的收益,盡管它的產(chǎn)量翻了一倍。事實(shí)上,企業(yè)1的優(yōu)先決策,在使得對(duì)手收益變差的基礎(chǔ)上,卻沒有使得自己的收益增加,企業(yè)1的決策是一種“害人而不利已”的行為。從這里,我們也似乎看到了“以和為貴”“合作雙贏”的真諦所在。
3 不同信息條件下的決策效用分析
企業(yè)的理性決策行為是“信念”“預(yù)測(cè)語境”所決定的。也就是在信息的支持下,他“關(guān)于對(duì)手的信念”決定了他的理性決策行為。當(dāng)然,他的這種信念未必是正確的,他的實(shí)際收益取決于實(shí)際的語境。
表2 信念和決策的關(guān)系
關(guān)于對(duì)手的信念理性決策行為(產(chǎn)量)
對(duì)手不存在1/2
對(duì)手是理性決策者1/3
對(duì)手是先行壟斷者1/4
注:表中的產(chǎn)量數(shù)據(jù)中我們省去了(a-c)。
下面,我們以企業(yè)2為考慮對(duì)象,討論不同信息條件下的決策效用問題。
若企業(yè)1是先行壟斷者,但是企業(yè)2卻認(rèn)為對(duì)手不存在。此時(shí),他們的決策產(chǎn)量都是壟斷產(chǎn)量q=12(a-c)。從而導(dǎo)致市場(chǎng)實(shí)際產(chǎn)量為Q=a-c。此時(shí),兩者的利潤(rùn)均為0。這種狀況的產(chǎn)生是由于企業(yè)決策時(shí)信息缺乏所造成的必然結(jié)果。
如果企業(yè)1是先行壟斷者,但企業(yè)2卻認(rèn)為市場(chǎng)上存在兩個(gè)同樣的理性企業(yè),則決策結(jié)果會(huì)產(chǎn)生另一種情況。企業(yè)1選擇q1=12(a-c),而企業(yè)2選擇q2=13(a-c)。總產(chǎn)量為Q=56(a-c),價(jià)格為P=a-56(a-c)。可求得兩個(gè)企業(yè)的利潤(rùn)為
u1=112(a-c)2, u2=118(a-c)2
再者,如果企業(yè)1是先行壟斷者,而企業(yè)2知曉了這一信息(即:關(guān)于對(duì)手的信念和事實(shí)語境相同),它將選擇q2=14(a-c),兩個(gè)企業(yè)的利潤(rùn)為
u1=18(a-c)2, u2=116(a-c)2
當(dāng)企業(yè)1是理性決策者時(shí),我們類似可討論企業(yè)2的決策和收益情況。因此我們得到下面的“信息與收益對(duì)比表”。
從上面的“信息與收益對(duì)比表”中可以發(fā)現(xiàn)如下規(guī)律:
(1)語境是決定博弈參與者的關(guān)鍵因素。企業(yè)2的收益表明,當(dāng)“企業(yè)1是先行壟斷者”時(shí),企業(yè)2的收益總是比“企業(yè)1是理性決策者”時(shí)的收益要小。在特定的語境下,企業(yè)2的信息變化,并不能從實(shí)質(zhì)上改變他的劣勢(shì)地位。
(2)當(dāng)語境一定時(shí),參與者的收益隨著信息的增加而增加。特別地,當(dāng)企業(yè)2關(guān)于對(duì)手的信息和實(shí)際語境一致時(shí),他將取得該語境下的最大收益。在特定的語境下,決策者信息的增加總能提高它的收益,信息不可能是無效的。
(3)先動(dòng)優(yōu)勢(shì)不否定信息有效性。由上述計(jì)算可知,產(chǎn)量博弈具有先動(dòng)優(yōu)勢(shì)。先動(dòng)優(yōu)勢(shì)是博弈決策的語境問題,后行動(dòng)者的劣勢(shì)是由這一語境所決定的。不能說,后行動(dòng)者因?yàn)閾碛行畔?yōu)勢(shì)(獲得了前者搶先行動(dòng)的信息),才使得自己處于劣勢(shì)。導(dǎo)致利潤(rùn)較低的原因并不是因?yàn)槠髽I(yè)2掌握了企業(yè)1的產(chǎn)量決策信息,而是企業(yè)1在本質(zhì)上優(yōu)于企業(yè)2。相反,在這種特定的語境下,如果后行動(dòng)者沒有獲取前者首先行動(dòng)的信息,他將處于更大的劣勢(shì)。
4 博弈中的信息無效性分析
這里,我們引用博弈論的不完全信息庫諾特產(chǎn)量博弈模型。已知:價(jià)格函數(shù)為P=a-q1-q2,企業(yè)1的單位成本是c1,企業(yè)2的成本可能是cH2或cL2,為cL2的可能性是μ,利潤(rùn)函數(shù)為πi=qi(a-q1-q2-ci)。為了討論的方便,假設(shè)a=2,c1=1,cL2=34,cH2=54,μ=12。
我們可解得
q*1=13, qL*2=1124, qH*2=524
假定企業(yè)1的事實(shí)語境:“企業(yè)2是低成本”。則企業(yè)1的收益為
πL1=13(2-13-1124-1)=572
假定企業(yè)1已獲知企業(yè)2是低成本,但企業(yè)2還以為企業(yè)1不知道。因此,語境中的參與人2沒有收到額外的信息,信念不變,其決策方案仍是原先的方案,即q2=1124。
在不完全全信息博弈基礎(chǔ)上,企業(yè)1的語境沒有任何變化,其狀態(tài)不變。企業(yè)1獲取了低成本的信息(他也精確知道企業(yè)2將選擇q2=1124),因此,他將據(jù)此修正他的決策方案。
圖1 不影響博弈語境的信息獲取是有效的
此時(shí),企業(yè)1的利潤(rùn)函數(shù)為π1=q1(1-q1-1124),最大化此函數(shù),可解得
q1L=1348, π1=1348×1348
由此可見,企業(yè)1在獲取企業(yè)2是低成本信息后,其收益大于在不完全信息下的決策收益。
現(xiàn)在,我們考慮完全信息的情況。企業(yè)1獲取“企業(yè)2是低成本”的客觀信息,但企業(yè)2也知道企業(yè)1知道。此時(shí),完全信息下的納什均衡解為
q1L=14, q2L=12, π1=580
企業(yè)1獲取信息后,其收益反而降低了。這是因?yàn)?,在完全信息情況下,企業(yè)2的決策是在獲取企業(yè)1知道自己是低成本的基礎(chǔ)上作出的,因而對(duì)企業(yè)1的收益產(chǎn)生影響。所以,當(dāng)參與者在獲取信息的同時(shí),如果對(duì)其所在的語境產(chǎn)生了影響,我們就不能肯定該信息的獲取是有效的。
圖2 影響博弈語境的信息獲取不一定是有效的
所以,為了確保在獲取信息后,能有效提高自身效用,就必須在獲取了信息(收益函數(shù)改變了)后,讓對(duì)手還以為你的信息量不變。
需要強(qiáng)調(diào)的就是,信息效用的比較應(yīng)該在“給定的語境”基礎(chǔ)上進(jìn)行。如果系統(tǒng)在獲取信息的同時(shí),對(duì)系統(tǒng)所處的語境產(chǎn)生了影響,那么變化的語境有可能對(duì)信息效用的發(fā)揮產(chǎn)生負(fù)面影響。實(shí)際上,我們可以斷言,在博弈參與系統(tǒng)的語境不變時(shí),關(guān)于語境的更多信息對(duì)博弈決策來講總是有益的。
5 結(jié)論
語境和信息是影響博弈決策效用的兩個(gè)因素。在不同的語境下,博弈雙方將受到不同的制約,獲得不一樣的效用。通過不同信息條件下的效用對(duì)比分析,我們發(fā)現(xiàn)在同一語境下,如果信息使我們的信念逼近事實(shí),則一定會(huì)帶來更多的收益。當(dāng)然,這種能夠帶來額外收益的信息也未必是真正有效的。一方面,有用的信息未必有效,這還取決于投入產(chǎn)出的關(guān)系,即我們獲取信息的成本是否小于信息所帶來的收益增加。另一方面,信息的獲取有可能改變博弈的環(huán)境,從而影響信息的效用。
參 考 文 獻(xiàn):
[1]胡昌平.信息管理科學(xué)導(dǎo)論[M].北京:高等教育出版社,2001.36-39.
[2]寧宣熙,劉思峰.管理預(yù)測(cè)與決策方法[M].北京:科學(xué)出版社,2005.190-202.
[3]薛華成.管理信息系統(tǒng)[M].北京:清華大學(xué)出版社,1998.25-30.
[4]烏家培.信息經(jīng)濟(jì)學(xué)[M].北京:高等教育出版杜,2002.8-24.
[5]陳建龍.論信息效用及其實(shí)現(xiàn)過程[J].北京大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),1996,33(3):36-40.
[6]張維迎.博弈論和信息經(jīng)濟(jì)學(xué)[M].上海:上海人民出版社,2004.182-186.
[7]尹伯成.西方經(jīng)濟(jì)學(xué)簡(jiǎn)明教程[M].上海:上海人民出版社,2003.152-164.
[8]Osborne M J. An introduction to game theory[M]. Shanghai: Shanghai University of Finance Economics Press, 2005. 55-62.
[9]羅伯特#8226;吉本斯.博弈論基礎(chǔ)[M].北京:中國(guó)社會(huì)科學(xué)出版社,1999.47-49.