• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于N維非合作博弈

      2015-07-05 14:15:27盧豐周會紅
      2015年27期
      關(guān)鍵詞:大圓均衡點(diǎn)效用

      盧豐 周會紅

      一、緒論

      1.目的

      本文從二維非合作博弈①出發(fā),推廣至N維,人為地改變影響博弈的量,改變原博弈均衡②,使結(jié)果朝著有利于資源利用的方向變化,解決社會中存在的資源在眾人中合理分配問題。

      二、理論基礎(chǔ)

      1.n維非合作博弈均衡點(diǎn)存在性

      由角谷靜夫定理可推斷有均衡點(diǎn)存在?;诮枪褥o夫不動點(diǎn)定理而對存在性定理給出的證明(發(fā)表在:Proc.Nat.Acad.Sci.U.S.A.pp.48-49),該方法直接由布勞維爾不動點(diǎn)定理得出。證明的是在n維空間里構(gòu)建一個(gè)連續(xù)變換的T,使得T的不動點(diǎn)就是博弈的均衡點(diǎn)。由于n維混合策略空間是一個(gè)胞腔,且由布勞維爾不動點(diǎn)定理可知映射T至少有一個(gè)不動點(diǎn)ε,該點(diǎn)一定是一個(gè)均衡點(diǎn)。③

      三、乘車博弈

      1.乘車問題

      AB兩理性人住在兩個(gè)房間(信息不對稱④),居住處僅有1輛車僅能容納1人(資源稀缺性⑤),明天為假日,AB都想出行,由于無法交流,他們只能在有限的時(shí)間里,進(jìn)行博弈。假定效用⑥最大值為1,最小值為0,中間值為0.5。

      第一種情況:AB都選擇明天去,車無法滿足需求,資源配置不足。效用和為1.5(最大值為2)。

      第二種情況:A認(rèn)為B選擇明天去,所以A不準(zhǔn)備明天前往,而B沒有考慮到這種情況,從而選擇了明天前往,AB中一人明天前往,一人后天前往,資源合理配置⑦,此時(shí)效用和為1+1=2,為最大效用和。

      第三種情況:AB都認(rèn)為彼此明天前往會給對方帶來威脅,于是都選擇了后天前往,這種情況就造成了明天空車現(xiàn)象與后天超載現(xiàn)象,帶來的效用和為1.5。

      第四種情況:A若考慮到“B若認(rèn)為A明天前往從而B選擇后天前往”的情況,也許A就選擇明天前往,但同時(shí),若B也考慮到“A若認(rèn)為B明天前往從而A選擇后天前往”的情況下,B就會選擇明天前往,這樣,明天又會造成超載的情況,此時(shí)的效用和為1.5。

      第五種情況:考慮到彼此的三步潛在決定從而做出的決定。

      第n中情況:考慮到彼此的N步潛在決定從而做出的決定。

      雙方會陷于無盡的博弈循環(huán)中。不交流則不了解,只有靠判斷做出決定。考慮的潛在決定步數(shù)決定了是否能達(dá)到效用和最大的情況。雙方出現(xiàn)相差為奇數(shù)的情況,如A考慮一步,B考慮了兩步,就會出現(xiàn)效用和最大的情況,但出現(xiàn)偶數(shù)的情況,如A考慮一步,B考慮三步,那么,資源仍然分配不均,不能帶來效用最大化的情況。所以,只要他們分開前往,所得到的總效用為最大2。

      四、二維博弈模型分析

      1.總效用的模型表示

      將以上效用表達(dá)如下:

      任何有限的非合作博弈至少存在有一個(gè)均衡點(diǎn),而且非合作博弈均有可解性與強(qiáng)可解性⑧,證明來自John F. Nash,Jr論文。

      2.博弈斗爭性模型

      基于以上的分析,可以得出以下結(jié)果:

      (1)A考慮1+X步,B考慮2+X步,那么所得的博弈結(jié)果是一個(gè)明日前往,一個(gè)明日不前往,這時(shí)候所得的效用是最大的。

      (2)A考慮1+X步,B考慮3+X步,那么所得的博弈結(jié)果是一個(gè)明日前往(不前往),一個(gè)明日前往(不前往),這時(shí)候所得的效用是最小的。

      另外:無論X為多少,它不影響博弈的結(jié)果,“A考慮1+X步,B考慮2+X步”這種情況與“A考慮1步,B考慮2步”的結(jié)果是一樣的?!癆考慮1+X步,B考慮3+X步”與“A考慮1步,B考慮3步”所得的結(jié)果也是一樣的。

      X在這里只不過是一個(gè)循環(huán)數(shù),本研究將其稱為“循環(huán)因子”。

      把A的博弈動態(tài)轉(zhuǎn)化在圓上,把B的博弈過程轉(zhuǎn)化在另一平面的圓上。相切于a、b兩點(diǎn)。

      假定前提:

      (1)兩個(gè)圓都只是AB各自的博弈過程,AB兩人是兩個(gè)質(zhì)點(diǎn)。

      (2)A循著大圓作博弈結(jié)果,而B則循著“橢圓”作博弈結(jié)果,他們在環(huán)上所做的半個(gè)循環(huán)步數(shù)(每半圓)即為前面說過的考慮潛在決定的步數(shù)。

      (3)a、b都只能容納下一個(gè)質(zhì)點(diǎn),a表示明天不前往,b表示明天前往。同時(shí),橢圓可圍繞a、b轉(zhuǎn)動,即a、b是“橢圓”的軸。我們以θ來表示“橢圓”的偏轉(zhuǎn)角度,0≤θ≤π2,θ受理性人的心理偏好與外界因素的影響,θ越大,表示對“前往”的心理偏好越大,反之亦然。

      (4)A、B只有a、b兩個(gè)??奎c(diǎn),也就是博弈的決定點(diǎn)。

      (5)心理偏好是相對的,我們固定大圓固定不變,“橢圓”進(jìn)行旋轉(zhuǎn)。

      描述AB博弈過程:

      (1)AB同時(shí)停留在a點(diǎn),這就導(dǎo)致資源未達(dá)到合理分配,表示A、B兩人都做出了明日不前往的決定。

      (2)AB同時(shí)停留在b點(diǎn),這也導(dǎo)致資源未達(dá)到合理分配,表示AB都做出了明日前往的決定。

      (3)A停留在a點(diǎn),B停留在b點(diǎn),或者A停留在b點(diǎn),B停留在a點(diǎn),資源都能達(dá)到合理的分配,表示一個(gè)明日前往,一個(gè)明日不前往(后天前往)。

      (4)該模型也符合循環(huán)因子X的假設(shè),即只要A選擇其中一個(gè)??奎c(diǎn),那么B是經(jīng)過幾個(gè)循環(huán)才選擇到??奎c(diǎn)都跟X無關(guān)。

      θ的意義:

      1、

      θ取值為π2,“橢圓”已經(jīng)圍繞ab兩點(diǎn)旋轉(zhuǎn)至與大圓重合,極端情況,表示AB兩人都具有極強(qiáng)的明天前往的心理偏好,只會做出前往的決定,陰影面積為圓面積,它為大圓面積的100%,即表示,AB明日同往的概率為100%。

      2、

      θ取值為0,“橢圓”已經(jīng)圍繞a、b兩點(diǎn)旋轉(zhuǎn)與大圓垂直,極端情況,表示AB兩人是互相完全排斥的,他們都做出不前往的決定,而且一直不前往。陰影面積為0,也就表示AB明日同去的可能性為0。

      3、

      AB對明天“前往”具有不同心理偏好,θ取值在0與π2之間。將θ作為常量處理,即不受其他因素影響,考慮AB共同前往的可能性?!皺E圓”偏轉(zhuǎn)角度θ越大,AB的心理偏好越強(qiáng),同去的可能性越高。

      陰影部分占大圓面積比例m:

      m=陰影面積大圓面積=πr2sinθπrr=sinθ

      陰影占大圓面積的比例m僅僅與θ有關(guān)。

      3.假設(shè)前提

      m=sinθ,反映的是AB兩人在非合作博弈中最終一同前往的可能性,這也間接地反映了AB兩人的心理偏好與預(yù)期效用⑨。

      效用函數(shù),就是賦予個(gè)體的每一預(yù)期一個(gè)實(shí)數(shù)。效用函數(shù)并不唯一,如果U是這樣一個(gè)函數(shù),那么a>0時(shí),au+b也是這樣一個(gè)函數(shù)。如果用大寫字母表示預(yù)期,小寫字母表示實(shí)數(shù),這樣的效用函數(shù)滿足下列性質(zhì):

      (1)uA>uB等價(jià)于A優(yōu)于B,以此類推。

      (2)若0≤p≤1,則u[pA+(1-p)B]=pu(A)+(1-p)u(B)⑩

      對一人單獨(dú)分析,引入“潛在前往因子”和“非排斥因子”。

      用m=sinθ來間接表示這種預(yù)期效用與偏好的動態(tài)過程。θ增大,AB兩人共同前往可能性越大。用sinθ曲線間接表示預(yù)期效用,則沿著sinθ所作的切線即為預(yù)期邊際效用MU,切點(diǎn)處與原點(diǎn)所圍成的圖形面積即為預(yù)期效用。隨著所作決定時(shí)考慮的潛在決定的步數(shù)的不斷增加,預(yù)期邊際效用MU逐漸遞減,符合邊際效用遞減規(guī)律。等同于 “非排斥因子”的概念,即隨著A前往的概率越來越大。同時(shí),A也總會考慮B的前往決定從而對自己的決定產(chǎn)生猶豫,而對B的猶豫又會與自己想得到最大的預(yù)期效用相違背,于是產(chǎn)生了這種博弈。這時(shí)候兩人相互的排斥力也越來越大,即“非排斥因子”越來越小。我們可以用sin′θθ = t 來表示“非排斥因子”。

      另一方面,由于理性人都想讓自己的滿足程度達(dá)到最大,所以A前往的潛在決定越來越大,即A前往的可能性也越來越高,∫t0sinθdθ 在0≤θ≤π2時(shí)它的值在0-1之間呈概率分布。θ偏轉(zhuǎn)角度越大,∫t0sinθdθ 的值也就越大,前往的可能性也就越高,把它看做“潛在前往因子”。

      4.博弈均衡

      (1)非排斥因子>潛在前往因子,A的預(yù)期效用很大,因?yàn)樗X得B與他之間的“排斥力”很小,所以A前往的可能性極高,在原點(diǎn)時(shí)達(dá)到最大,他會有很強(qiáng)的心理偏好來引導(dǎo)他做出“前往”的這一決定,直到他的非排斥因子不能承擔(dān)為止。

      (2)非排斥因子”<“潛在前往因子”時(shí),A的預(yù)期總效用已經(jīng)很大,同時(shí),由于他的非排斥因子已經(jīng)小于潛在前往因子,那么,由于對B的決策的猶豫,他們之間的“排斥力”很大,A作為一個(gè)理性人不會再產(chǎn)生“前往”的心理偏好,這時(shí)候,A的決定就會停留在一個(gè)自己能接受的點(diǎn)上。

      (3)所以,理性人會把決策均衡點(diǎn)放在非排斥因子=潛在前往因子的時(shí)候,只有在這個(gè)時(shí)候,沒有任何其他的“排斥力”會使得決定人的心理偏好發(fā)生改變從而做出重新選擇前往的決定,這時(shí)候,決定人的心理趨向于一種既安全又滿足的狀態(tài)。

      假設(shè)存在t,使得“潛在前往因子”=“非排斥因子”成立。

      ∫t0sinθdθ =sinθ′θ = t

      ∵∫t0sinθdθ =sinθ′θ = t

      ∴ -cost-1=cost

      ∴ cost=12

      得t=π3,均衡點(diǎn)的角度為θ=π3,m=sinπ3=32

      在AB博弈過程中,最終有cosπ3=12的預(yù)期邊際效用,使得AB在明天共同前往的可能性為sinπ3=32≈0.866。在二維非合作博弈中,如果兩人都將對方的潛在決定作為自己下決定的依據(jù),想得到最大效用,則做出共同“前往”的可能性約為0.866。但均衡解未必是最優(yōu)解。

      五、二維到N維非合作博弈

      1.N維非合作博弈模型

      多維博弈的模型圖表示的是不同人的彼此之間的非合作博弈過程。此時(shí),均衡角度依然是θ=π3,事件之間相互獨(dú)立,但他們要一同做出“前往”的可能性就被影響因子縮小了,小于0.866。當(dāng)維數(shù)趨于非常多的時(shí)候,陰影部分共同區(qū)域的圖形就越可測量。

      2.模型討論

      θ對實(shí)驗(yàn)的影響:

      當(dāng)θ=π2 時(shí),所有平面的圓都旋轉(zhuǎn)與大圓重合,這時(shí)候n = 1,表明在所有人都具有相同的極端強(qiáng)烈的心理偏好的情況下,N人都將會選擇第二天“前往”。這是一種極端情況。

      2、

      維數(shù)等于圓個(gè)數(shù),它們彼此相切相互影響。維數(shù)越趨向于正無窮,其結(jié)果越接近真實(shí)值。強(qiáng)調(diào)兩個(gè)前提:(1)凡是在一個(gè)模型中,所有參與非合作博弈的人具有相同的心理偏好B11;(2)旋轉(zhuǎn)角度θ是基于對某特定事件的心理偏好B12。

      3、

      如果每個(gè)人都具有相同的“不前往”的心理偏好,那么此時(shí),旋轉(zhuǎn)角度θ=0,同時(shí)n = 0,即明天將不會有任何人前往。

      3.N維非合作博弈模型的總結(jié)

      表述:

      (1)宏觀上,同心理偏好群體(N維)一定前往的話,他們同去的可能性為sin2θ=1。微觀層面上,兩個(gè)人的博弈,一同前往的可能性也為100%。此時(shí)旋轉(zhuǎn)角度θ=π2。

      (2)宏觀上,同心理偏好群體非常想去的話,他們同去的可能性為sin2θ=34。微觀層面上,兩個(gè)人的博弈,一同前往的可能性為sinθ=32,此時(shí)旋轉(zhuǎn)角度θ=π3。

      (3)宏觀上,同心理偏好群體都可能前往的話,他們同去的可能性為sin2θ=12。微觀層面上,兩個(gè)人的博弈,一同前往的可能性為sinθ=22。此時(shí)旋轉(zhuǎn)角度為θ=π4。

      (4)宏觀上,同心理偏好群體都無所謂前往不前往的話,他們同去的可能性為sin2θ==14。微觀層面上,兩個(gè)人的博弈,一同前往的可能性為sinθ=12。此時(shí)旋轉(zhuǎn)角度為θ=π6。

      (5)宏觀上,同心理偏好的群體都不前往的話,他們同去的可能性為sin2θ=0。微觀層面上,兩個(gè)人的博弈,一同前往的可能性為sin2θ=0。此時(shí)旋轉(zhuǎn)角度為θ=0。

      六、應(yīng)用

      1.二維博弈

      AB分別為此次假設(shè)中的乘客,他們彼此將對方的想法作為自己做出決策的基礎(chǔ),由第四章可知,若AB一定前往,則兩人有100%的概率相撞;若AB可能去,則會有22的概率相撞;若AB都無所謂,則有0.5的概率相撞。若事先得知二人的偏好程度,可以調(diào)整公交車數(shù)量。

      2.多維應(yīng)用

      國慶前,抽樣得知,國慶節(jié)將有4000人去華山,他們彼此間都擔(dān)心對方的前往會不會給自己造成不便,且他們只對具有相同心理偏好的人產(chǎn)生博弈。抽樣顯示,一定前往1000人,非常想去1000人,可能去1000人,無所謂1000人,那么,國慶那天,預(yù)計(jì)會去的人數(shù)為:

      1000+1000×34+1000×12+1000×14=2500

      若華山承載上限為2000人,則應(yīng)及時(shí)考慮降低群體的偏好即θ,如提高票價(jià),或者安排部分去泰山游玩等來降低他們的預(yù)期效用,使資源達(dá)到最佳配置;若華山的承載上限為3000人,則應(yīng)及時(shí)考慮提高群體的偏好即θ,如降低票價(jià),提供更多的宣傳和服務(wù)以及開放華山其他游玩項(xiàng)目等,從而使資源達(dá)到最佳配置狀態(tài)。

      注解:

      ① 該詞摘自:Robert S.Pindyck,Daniel L.Rubinfeld. 微觀經(jīng)濟(jì)學(xué)[M].北京:中國人民大學(xué)出版社,2009:467

      ② 博弈均衡指n個(gè)參與人的一組策略(純策略或者混合策略)選擇,在其他人策略選擇不變的情況下,任何人都不能通過改變策略來使其期望支付得到改善。

      ③ 引自:John F.Nash,JR.納什博弈論論文集[C].北京:首都經(jīng)濟(jì)貿(mào)易大學(xué)出版社,2012:33-34

      ④ 信息不對稱:不同經(jīng)濟(jì)主體缺乏信息的程度往往是不一樣的。

      ⑤ 資源的稀缺性:一些資源的數(shù)量是有限的,具有排他性或競爭性。

      ⑥ 引自:Robert S.Pindyck,Daniel L.Rubinfeld.微觀經(jīng)濟(jì)學(xué)[M].北京:中國人民大學(xué)出版社,2009:76

      ⑦ 合理配置:即帕累托最優(yōu)狀態(tài)。

      ⑧ 強(qiáng)可解性:具有特殊性質(zhì)的解。

      ⑨ 預(yù)期效用:心理上所認(rèn)為會得到的效用,是一種計(jì)劃效用,非實(shí)際效用。

      ⑩ 引自:John F.Nash,JR.納什博弈論論文集[C].北京:首都經(jīng)濟(jì)貿(mào)易大學(xué)出版社,2012:4

      B11 前提(1)來源于阿羅不可能定理。該定理是這樣表述的:如果眾多的社會成員具有不同的偏好,而社會又有多種備選方案,那么在民主的制度下不可能得到令所有的人都滿意的結(jié)果,即博弈無解。所以必須要有這樣的假設(shè)前提。

      B12 為了方便計(jì)算所給出的一種標(biāo)準(zhǔn),也可以以“事件的反面”來進(jìn)行計(jì)算。

      參考文獻(xiàn):

      [1] John F.Nash,JR.納什博弈論論文集[C].北京:首都經(jīng)濟(jì)貿(mào)易大學(xué)出版社,2012

      [2] Robert S.Pindyck,Daniel L.Rubinfeld. 微觀經(jīng)濟(jì)學(xué)[M].北京:中國人民大學(xué)出版社,2009:467

      [3] Kakutani S.Duke Math.[J].8,457-459(1941)

      [4] Von Neumann J,Morgenstern O.The Theory of Games and Economic Behavior.Chap.3.Princeton:Princeton University Press,1941

      [5] Nash J F.,Shapley L S.A Simple Three-Person Poker Games.Annals of Mathematics Study No.24.Princeton University Press,1950

      猜你喜歡
      大圓均衡點(diǎn)效用
      畫大圓
      幼兒100(2021年38期)2021-12-23 08:38:22
      小學(xué)美術(shù)課堂板書的四種效用
      交易成本理論在油田企業(yè)小修業(yè)務(wù)自營和外包決策中的應(yīng)用分析
      三級供應(yīng)鏈投資模型的評價(jià)管理
      物流科技(2017年9期)2017-10-31 14:59:45
      填數(shù)
      填數(shù)
      納米硫酸鋇及其對聚合物的改性效用
      中國塑料(2016年9期)2016-06-13 03:18:48
      均衡點(diǎn)移動的直觀圖示及其例析
      幾種常見葉面肥在大蒜田效用試驗(yàn)
      玉米田不同控釋肥料效用研討
      溧水县| 乌兰察布市| 喀喇沁旗| 邵阳市| 孟津县| 金沙县| 冕宁县| 怀宁县| 翼城县| 巴林右旗| 桃园县| 徐汇区| 马公市| 长岛县| 班戈县| 延津县| 陆川县| 出国| 沂源县| 大邑县| 科尔| 桑植县| 思茅市| 刚察县| 阿拉善盟| 西华县| 建阳市| 邵阳县| 宁明县| 彭州市| 五华县| 武平县| 丹寨县| 吉安市| 徐州市| 珠海市| 闵行区| 濮阳县| 天峨县| 隆尧县| 鄯善县|