• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      非合作博弈均衡與合作博弈均衡之研究
      ——博弈均衡的裂變分析

      2012-12-15 06:50:14陳建先
      重慶行政 2012年5期
      關(guān)鍵詞:均衡點商販納什

      □ 陳建先

      非合作博弈均衡與合作博弈均衡之研究
      ——博弈均衡的裂變分析

      □ 陳建先

      一、非合作的博弈均衡

      傳統(tǒng)均衡和博弈均衡是均衡理論發(fā)展中的不同階段,也是均衡由靜態(tài)轉(zhuǎn)變?yōu)閯討B(tài)的一個過程。傳統(tǒng)均衡概念是以靜態(tài)的理論來分析社會狀況,而現(xiàn)代社會是動態(tài)的和發(fā)展的,因此需要運用博弈均衡來思考、探討社會均衡問題。

      博弈論中小約翰·福布斯·納什 (JohnForbes NashJr)首先提出對博弈進(jìn)行分類,即非合作博弈均衡和合作博弈均衡,而非合作均衡博弈理論的核心是“納什均衡”。因為納什提出的均衡理論對學(xué)界影響極大,由此獲得1994年諾貝爾經(jīng)濟學(xué)獎。納什均衡是經(jīng)濟學(xué)的一個重要概念,也是博弈論的一個重要概念,同時也是均衡理論的一個重要概念。諾貝爾經(jīng)濟學(xué)獎獲得者薩繆爾森曾說過:你可以將一只鸚鵡訓(xùn)練成經(jīng)濟學(xué)家,因為它所需要學(xué)習(xí)的只有兩個詞:供給與需求。博弈論家坎多瑞引申說:要成為現(xiàn)代經(jīng)濟學(xué)家,這只鸚鵡必須再多學(xué)一個詞“納什均衡”[1]。所謂納什均衡是指博弈行動的穩(wěn)定狀態(tài),在此狀態(tài)下,每一個參與人都擁有對其他參與人行動的正確預(yù)期,并且能理性行動。這是博弈論中最基礎(chǔ)、最基本的均衡。也就是說,在給定別人戰(zhàn)略不變的情況下,沒有任何人可以通過選擇其他戰(zhàn)略獲得更多支付,從而沒有任何人有積極性打破這種均衡?!敖o定你的策略,我的策略是我最好的策略;給定我的策略,你的策略也是你最好的策略”,這正是 “納什均衡 ”概念在兩人博弈情況下最通俗直觀的表達(dá)方式[2]。納什均衡認(rèn)為,因為每一方選擇戰(zhàn)略時都沒有共謀,他們只是選擇對自身最有利的戰(zhàn)略,而不考慮社會福利或任何其他群體的利益。納什均衡就是博弈中每個博弈方的策略構(gòu)成的一個策略組合。其中每個博弈方的策略,都是根據(jù)針對所有其他博弈方的策略構(gòu)成的,并且是最佳反映。過去,“囚犯困境”是一個難題,但用納什均衡理論就迎刃而解了。

      在納什均衡概念提出之前,美國經(jīng)濟學(xué)家霍特林 (HaroldHotelling)探討兩個商鋪如何定位的問題,后稱為霍特林模型[3]。即在一個1000米的沙灘上,兩個小商販,賣的商品和服務(wù)質(zhì)量都是一樣的。按照一般概念設(shè)想,商販A應(yīng)該將其位置安置在250米的這個點上,可以方便0~500米的消費者;商販B應(yīng)該將其位置安置在750米的這個點上,可以方便500~1000米的消費者(見圖1)。

      這樣的位置安置,商販A和商販B的收益都是均等的。人是“經(jīng)濟人”,要追求個體利益最大化。假設(shè)商販A將其位置由250米處往前移動100米(即350米處),那么,就意味著500~600米的消費者有一半屬于他的,也就是說,他的收益是0~500米,加上500~600米的一半消費者,其收益高于商販B;商販A這么做,商販B也可以這樣做,將其位置向前移動100米(即650米處),此時,商販A和商販B的收益又均等了;假設(shè)商販A又將其位置移動到500米處,那么,他的收益又比商販B的大了。商販A怎么做,商販B也可以這樣做(將其位置移動到500米處),此時商販A和商販B的收益又均等了。他倆不斷的移動位置,最后在500米處,找到了倆人的均衡點(見圖2)?;籼亓帜P褪堑湫偷姆呛献骶獠┺?,模型表明:雖然人們都在追求個體利益最大化,但最終還是會形成均衡。

      二、博弈均衡演變條件

      博弈視角背景下的社會均衡,最重要的是要實現(xiàn)從理性到有限理性的轉(zhuǎn)變,從零和博弈到變和博弈的轉(zhuǎn)變,從非合作博弈到合作博弈的轉(zhuǎn)變。這種轉(zhuǎn)變是基于有限理性理念、變和博弈理念和合作博弈理念的重塑。

      有限理性理念。1978年諾貝爾經(jīng)濟學(xué)獎獲得者西蒙認(rèn)為,人的理性能力是有限的,不可能對所有的可能選擇作出精確的利益計算。人在作決策時,采用的是由局部到整體的實驗方法,這時要求集體選擇達(dá)到個體都無法到達(dá)的理性是不可能。原因是人的理性能力是有限的:信息是不完備的,個人不知道全部備選方案;環(huán)境存在不確定性,外生事件隨時可能發(fā)生;人的認(rèn)識能力和計算能力是有限的。而且,人的理性在政治領(lǐng)域表現(xiàn)得更加弱化,其一是與經(jīng)濟活動相比,政治活動有更大的不確定性,人的政治行為難以理性化;其二是與經(jīng)濟活動相比,人們在政治活動中對自己行為結(jié)果所承擔(dān)的責(zé)任并不總是直接的,而且往往不是很確定的,這也淡化了人們進(jìn)行理性計算的動力[4]。博弈界中有一個著名的“最后通牒”實驗[5],在經(jīng)過長達(dá)十年時間,選擇15個不同文化背景的民族而進(jìn)行的。實驗規(guī)則:如兩人分一筆財產(chǎn)(1000元),由第一個人對第二個人提出自己的分配方案(如“我得995元,你得5元”)。若第二個人同意,就按此方案實施;如拒絕則1000元全收回,兩人均分文沒有。實驗結(jié)果表明:其一,在現(xiàn)實社會中,人們并非都是在個體追求利益最大化,與囚徒困境中的納什均衡并不相吻合。實驗中按照“經(jīng)濟人”假設(shè)理論判斷,第二個人的理性選擇是:只要有1元就應(yīng)該選擇同意,而不是選擇拒絕。但是實驗結(jié)果:大部分的實驗里,第一個人提出的方按是“5∶5”和“6∶4”分?!叭耸抢硇缘摹边@個基本假設(shè)在理論上是成立的,但在現(xiàn)實社會中,人們不可能這樣追求利益最大化,即有限理性;其二,盡管民族、地域、國家和文化等存在諸多差異,但是卻存在相對一致的“公平”理念。

      變和博弈理念。相對變和博弈而言,零和博弈(博弈方各自收益之和為零)在分析問題上進(jìn)行了簡化,這對于理性的分析問題帶來一些便捷途徑(尤其二人零和博弈,是博弈理論中研究最早的、最多的博弈),也成為研究其它博弈的基礎(chǔ),為復(fù)雜的博弈研究提供了基石。但零和博弈的基本出發(fā)點是理性的追求利益最大化,而這種理性在現(xiàn)實社會中是難以到達(dá)的,所以往往可能會出現(xiàn)偏離現(xiàn)實社會中人們的真實活動。美國《時代周刊》著名撰稿人羅伯·賴特在其名著 《非零和年代——人類命運的邏輯》中談到:人類命運的昌盛必然要懂得從零和年代走向非零和年代[6](所謂非零和博弈,如一個博弈的博弈各方之得益總和不總是保持為零的博弈)。零和博弈觀念正逐漸被變和博弈(博弈方有各自的收益值)理念所取代。因為,人們認(rèn)識到“利己”不一定要建立在“損人”的基礎(chǔ)上,通過有效合作仍然可能出現(xiàn)“雙贏”的局面。在一個“非零和”博弈中,贏得良好的結(jié)果往往不是靠戰(zhàn)勝對方,而是靠引導(dǎo)對方做出對雙方都有利的行為[7]。行為科學(xué)研究表明,對未來的預(yù)期是影響人們行為的重要因素:一種是預(yù)期收益:這樣做將會有什么好處;一種預(yù)期風(fēng)險:這樣做將會面臨什么問題,這樣會影響人們的現(xiàn)實選擇。納什認(rèn)為:“在這個理論中,‘預(yù)期’的概念是重要的?!盵8]對未來沒有明確的預(yù)期,是引發(fā)機會主義的關(guān)鍵要素。而只有在穩(wěn)定性機制作用下的未來,才會有較為明確的未來,才會有相對確定的預(yù)期。因而,人們應(yīng)塑造博弈的新理念——由單向的零和博弈轉(zhuǎn)變?yōu)榛拥淖兒筒┺模非缶夂献?、雙方共贏的新范式。

      合作博弈理念。合作博弈與非合作博弈之間的區(qū)別在于,博弈方的行為相互作用時,博弈方能否達(dá)成一個具有約束力的協(xié)議,如果能就是合作博弈,否則就是非合作博弈。非合作博弈強調(diào)的是個體理性、個體最優(yōu)策略,其結(jié)果往往是低效率的甚至是無效率的;而合作博弈強調(diào)的是團體理性、效率、公正、公平,合作博弈實際上就是一種“雙贏”或“多贏”的策略,它通常能獲得較高的效率。其實,博弈是一種“理念”,而非合作與合作方法是其兩個“影子”[9]。當(dāng)代社會正進(jìn)入利益共享的競爭-合作時代,單純強調(diào)競爭或合作都是不妥的:與對手“你輸我贏”的競爭只會破壞社會的發(fā)展,最終自己也將是一無所獲;合作也不是不考慮自身利益,而去創(chuàng)造一個自己不能把握的社會,也是不明智的。合作過程中不是沒有競爭,而是合作中的競爭,既積極合作,又要爭取自身的最大合作利益。合作競爭戰(zhàn)略強調(diào)競爭與合作的并重,強調(diào)合作不是不考慮自己利益,其最終的目標(biāo)仍然是使自己能夠在社會競爭中獲益。對于游戲參與者來說,最大的機會和最豐厚的利潤并非來自于參與游戲,而是來自于改變游戲本身,使游戲向有利于自己的方向發(fā)展,這是合作競爭戰(zhàn)略的核心?!妒ソ?jīng)》中有“天堂與地獄”的故事:在地獄,桌上擺滿了美味的食品,但他們總是吃不到,因為上帝給他們的是長長的勺子,始終無法喂進(jìn)自己的嘴里,所以在地獄的人都是黃皮刮瘦;在天堂,桌上擺滿了美味的食品,他們用長勺將食物送進(jìn)對方的嘴里,所以在天堂的人都紅頭花色。這個故事給人們得出一個道理:合作就是“天堂”,不合作就是“地獄”。在合作博弈中,贏得一個好的結(jié)果,往往不是如何去戰(zhàn)勝對手,而是設(shè)法引導(dǎo)對手做出對雙方都有利的行為,而到達(dá)博弈均衡的狀態(tài)。同時,應(yīng)該明確的是劃分非合作博弈和合作博弈不是從參與人的態(tài)度來考慮的,并不是非合作博弈中的參與人就不合作。恰恰相反,非合作博弈要回答的是當(dāng)無法達(dá)成有約束力的合作協(xié)議時,參與人之間如何通過理性行為的相互作用達(dá)成合作的目的。并且,合作博弈還需運用非合作博弈方法(無限重復(fù)博弈、談判博弈等)來到達(dá)合作之目的。

      三、合作的博弈均衡

      2005年諾貝爾經(jīng)濟學(xué)獎之所以授予兩位博弈論專家羅伯特·奧曼(RobertJ.Aumann)和托馬斯·謝林(ThomasC.Schelling),是因為他們在博弈均衡理論中提出了合作均衡理論——“相關(guān)均衡”和“聚點均衡”。

      “相關(guān)均衡”是羅伯特·奧曼的核心理論之一,即人們根據(jù)博弈策略以外的特定相關(guān)信號機制進(jìn)行決策選擇實現(xiàn)的均衡。相關(guān)均衡在某種意義上是納什均衡之后的又一個重要的均衡概念,是以博弈策略中統(tǒng)計意義上存在相關(guān)性為前提。要達(dá)到相關(guān)均衡,最為重要的是在信念和信息方面能夠有共同接受的東西,才能達(dá)成合作聯(lián)盟。如A、B二人各自獨立地將“法國、中國、德國、印度”等四個國家進(jìn)行兩兩組合,然后將A、B二人的選擇放在一起,看是否是相同的。如相同則說明他們的想法是一樣的,反之則然。如何才能尋求到策略的均衡點?可以看到,A、B二人各自的選擇方式有三種,如果兩者要選擇正確,其概率只有11%左右。筆者曾經(jīng)在多次的培訓(xùn)中做過實驗,只要把思維方式、理念確立好了,往往只作一次就能獲得成功。即需要著重思考兩點:一是對方怎么做,我就怎么做;二是根據(jù)屬性作策略。對方會怎么做,從理性的角度思考,是因為這樣做屬性多,對方就會這樣思考。整個選擇共有三種,如果將“法國——中國,德國——印度”或“法國——印度,中國——德國”組合在一起,其屬性只有“一東一西”。而如果將“中國——印度,法國——德國”放在一起,其屬性有“一東一西”、相鄰國家、發(fā)展國家與發(fā)展國家。很顯然,后者選擇的屬性要多一些,而這就是此策略的均衡點。而之所以這樣選擇,是因為他們選擇的共同依據(jù)——地理常識。而這就是此博弈的一個相關(guān)均衡點。在博弈存在多重均衡時,也就是人們有多重選擇,但需要協(xié)調(diào)時,相關(guān)均衡理論就是解決策略選擇方面協(xié)調(diào)困難和避免沖突的重要機制之一。

      聚點均衡是托馬斯·謝林的核心理論之一,即在效率曲線中,博弈者的利益是對立的,沒有帕累托改進(jìn) (如何一個人的趨利變動都會損害另一個人的利益),這種對立只是一種邏輯上的可能性,在效率曲線中必然存在一點,使得博弈者的利益是一致的[10]。由于導(dǎo)致聚點產(chǎn)生的因素?zé)o法用數(shù)理模型來表達(dá),所以數(shù)理模型分析方法往往忽視“聚點”的分析,而聚點的分析方法是博弈中的精髓之一。聚點均衡強調(diào)協(xié)調(diào),而協(xié)調(diào)需要彼此之間的交流,如果交流是認(rèn)同的,就會產(chǎn)生合作。如兩個人在1到100這100個整數(shù)中進(jìn)行選擇,A選一個數(shù),B選一個數(shù),如A和B所選的數(shù)相同,二者將獲得獎勵,否則一無所獲。在這個策略選擇中,均衡點有100個,那么實際會出現(xiàn)哪一個均衡點呢?初看這個選擇難度非常之大,用數(shù)理進(jìn)行分析,選中的概率只有萬分之一。筆者在做這方面的培訓(xùn)時,引導(dǎo)學(xué)員的思路,他們很快會思考到,策略選擇會集中在:“1”、“50”、“100”,這三個數(shù)。最終,大多數(shù)人選擇1,因為1是最小數(shù)、人位數(shù)、起始數(shù)和奇數(shù)。而學(xué)員們能在很短是時間里尋求到均衡點,其最關(guān)鍵的是要有均衡的理念及其方法。在博弈中,博弈各方同時選擇一個聚點所構(gòu)成的納什均衡就是聚點均衡。聚點對各博弈方都有吸引力,它是由歷史、文化、道德、習(xí)慣或純偶然的因素產(chǎn)生。聚點均衡是建立在雙方都滿意的“聚點”上的均衡,是納什均衡而且是多重納什均衡中比較容易被選擇的納什均衡,這種均衡在現(xiàn)實社會中比較普遍。

      (本文為2009年度國家社會科學(xué)基金項目 “我國政府公共決策利益博弈的路徑和機制研究”的階段性成果,項目號:.09XZZ011;論文作者為項目負(fù)責(zé)人)

      [1]白波.圖說博弈論pM].哈爾濱:哈爾濱出版社,2009.6.36.

      [2]喬林碧.政府經(jīng)濟學(xué)[M].北京:中國國際廣播出版社,2002.3.275.

      [3]王則柯,李杰.博弈論教程[M].北京:中國人民大學(xué)出版社,2010.4.254.

      [4]臧傳琴.從”經(jīng)濟人”假設(shè)到”政府失靈”[J].江漢論壇,2007.2.50.

      [5]丁社教.法治博弈分析導(dǎo)論[M].西安:西北工業(yè)大學(xué)出版社,2007.4.169.

      [6]孫恩棣.生活中的博弈[M].北京:京華出版社,2008.1.35.

      [7]白波.圖說博弈論[M].哈爾濱:哈爾濱出版社,2009.6.15.

      [8]何勤華.法治的追求[M].北京:北京大學(xué)出版社,2005.5.

      [9]董保民等.合作博弈 [M].北京:中國市場出版社,2008.4.6.

      [10]趙英軍,陳宇峰[M].沖突與合作世界中的博弈新視界.浙江:商業(yè)經(jīng)濟與管理,2005.11.11.

      作者:重慶行政學(xué)院公共管理教研部教授

      責(zé)任編輯:馬 健

      猜你喜歡
      均衡點商販納什
      THE ROLE OF L1 IN L2 LEARNING IN CHINESE MIDDLE SCHOOLS
      THE ROLE OF L1 IN L2 LEARNING IN CHINESE MIDDLE SCHOOLS
      交易成本理論在油田企業(yè)小修業(yè)務(wù)自營和外包決策中的應(yīng)用分析
      三級供應(yīng)鏈投資模型的評價管理
      物流科技(2017年9期)2017-10-31 14:59:45
      商販出售罌粟殼欲當(dāng)火鍋調(diào)料獲刑8年半
      公民與法治(2016年4期)2016-05-17 04:09:28
      推 銷
      愛你(2016年13期)2016-04-11 06:22:41
      均衡點移動的直觀圖示及其例析
      不確定條件下n人非合作博弈均衡點集的通有穩(wěn)定性
      師傅領(lǐng)進(jìn)門,修行靠個人
      流動商販治理模式研究
      阿坝| 南阳市| 社旗县| 鸡泽县| 望城县| 通辽市| 青冈县| 河西区| 新巴尔虎右旗| 神农架林区| 武山县| 玉龙| 巴楚县| 托里县| 乌鲁木齐县| 汽车| 林芝县| 兴海县| 定西市| 石阡县| 长寿区| 修水县| 汤原县| 娄烦县| 无极县| 镇坪县| 宁陵县| 麻栗坡县| 武穴市| 余干县| 紫云| 泗阳县| 延川县| 怀柔区| 荥阳市| 姜堰市| 丘北县| 静安区| 苍梧县| 临夏市| 洪洞县|