博弈方的行動(dòng)集合變化的博弈運(yùn)動(dòng)研究——以稀土出口貿(mào)易為例
徐寅峰1,2,文生威
(1.四川大學(xué)商學(xué)院,四川成都610065;2.機(jī)械制造系統(tǒng)工程國(guó)家重點(diǎn)實(shí)驗(yàn)室,陜西西安710049)
摘要:文章以稀土出口貿(mào)易為背景,分析了博弈方的行動(dòng)集合隨時(shí)間變化的博弈運(yùn)動(dòng)。首先定義了行動(dòng)集合的三種變化情形:集合變大、集合變小和集合變化不確定。然后針對(duì)單個(gè)博弈方行動(dòng)集合的三種變化情形,分別討論了均衡解的運(yùn)動(dòng)軌跡,分析表明:在行動(dòng)集合變大和變小兩種情形下,均衡解的軌跡呈現(xiàn)互逆的運(yùn)動(dòng)特性;在行動(dòng)集合變化不確定的情形下,保守和冒險(xiǎn)策略等價(jià),固定策略嚴(yán)格優(yōu)于保守、冒險(xiǎn)策略。在此基礎(chǔ)上,將模型推廣到博弈雙方的行動(dòng)集合均發(fā)生變化的博弈運(yùn)動(dòng)模型,分析表明上述結(jié)論仍然成立。最后,以中國(guó)同馬來(lái)西亞在2012年6月到2013年3月間的稀土出口貿(mào)易為例,驗(yàn)證了本文模型和求解方法的合理性與可行性。
關(guān)鍵詞:稀土貿(mào)易;寡頭競(jìng)爭(zhēng);行動(dòng)集合;博弈運(yùn)動(dòng);運(yùn)動(dòng)軌跡
收稿日期:2013-07-14
基金項(xiàng)目:國(guó)家自然科學(xué)基金資助項(xiàng)目(71371129,61221063);長(zhǎng)江學(xué)者和創(chuàng)新團(tuán)隊(duì)發(fā)展計(jì)劃(IRT1173)
作者簡(jiǎn)介:徐寅峰(1962-),男,吉林人,教授,研究方向:運(yùn)籌與控制;文生威(1987-),男,河南人,碩士研究生。
中圖分類號(hào):F224文章標(biāo)識(shí)碼:A
Research on the Gaming of the Players’ Action Sets Changing:
A Case Study of the Rare Earth Trade
XU Yin-feng1,2, WEN Sheng-wei
(1.BusinessSchoolofSiChuanUniversity,Chengdu610064,China; 2.StateKeyLabforManufacturingSystemsEngineering,Xi’an710049,China)
Abstract:Considering the export of rare earth as background, this paper analyzes the gaming model in which the players’ action sets are changing over time. First, we define three changing styles for action set: action set heightening, action set shrinking, and action set changing indeterminacy. Then we investigate the track of the equilibrium solution in which only one player’s action set will change over time. The results show that the tracks of the equilibrium solution when the action set heightening and shrinking are opposite, and the stationary strategy is strictly superior to conservative strategy and risky strategy which are equivalent in this situation. Moreover, this single action set changing model is applied to both two action sets changing over time and the results still hold trne for the new model. Finally, the rationality and feasibility of the gaming model and solution are validated by a case study of the rare earth export of China and Malaysia from June 2012 to March 2013.
Key words:rare earth trade; oligopoly competition; action sets; gaming; motion trial
0引言
一般認(rèn)為對(duì)博弈論的研究開(kāi)始于Zermelo和Neumann等人。1913年,Zermelo提出了選擇公理[1]。1928年,Neumann證明了最大最小定理,標(biāo)志著博弈論的正式誕生[2]。1944年,Neumann和Morgenstern合著《Theory of games and economic behavior》,將兩人博弈模型推廣到N人博弈并系統(tǒng)地應(yīng)用于經(jīng)濟(jì)領(lǐng)域,構(gòu)建了博弈論的理論體系[3]。1951年,Nash提出和論述了納什均衡的概念,奠定了非合作博弈的理論基礎(chǔ)[4]。1966年,Selten深入研究了動(dòng)態(tài)博弈中策略的交互作用,提出子博弈精煉納什均衡,隨后,Aumann和Maschler建立了不完全信息的重復(fù)博弈模型[1]。1973年,Smith和Price將生物理論中的進(jìn)化思想引入到博弈論中,提出了演化博弈的思想和演化穩(wěn)定策略的概念[5]。除此之外,還有許多國(guó)內(nèi)外學(xué)者的研究工作對(duì)博弈論的發(fā)展起到推動(dòng)作用?,F(xiàn)今,博弈論已經(jīng)成為經(jīng)濟(jì)學(xué)和管理學(xué)的核心內(nèi)容。
通常情況下,把以Nash為代表的博弈論稱為經(jīng)典博弈論,經(jīng)典博弈論假設(shè)博弈結(jié)構(gòu)和環(huán)境在博弈發(fā)生前事先給定。然而在現(xiàn)實(shí)的世界中,信息、物質(zhì)、能量處于一個(gè)快速變化的過(guò)程中,人類世界信息量的增加、自然環(huán)境和社會(huì)環(huán)境的運(yùn)動(dòng)變化導(dǎo)致博弈的各要素處于變化之中。博弈方、行動(dòng)集合、博弈次序和得益函數(shù)等要素在博弈的過(guò)程中發(fā)生變化,博弈不是在靜態(tài)的環(huán)境和固有的結(jié)構(gòu)下進(jìn)行的,而是在運(yùn)動(dòng)發(fā)展的環(huán)境和結(jié)構(gòu)中進(jìn)行的,稱這種運(yùn)動(dòng)變化的博弈為博弈運(yùn)動(dòng)(Gaming)。它不是某些博弈簡(jiǎn)單的重復(fù)或交替,而是考慮博弈要素隨時(shí)間運(yùn)動(dòng)變化。社會(huì)經(jīng)濟(jì)活動(dòng)中的博弈運(yùn)動(dòng)現(xiàn)象有很多,例如國(guó)際稀土貿(mào)易活動(dòng)就是一個(gè)典型的博弈運(yùn)動(dòng)。長(zhǎng)期以來(lái),中國(guó)的稀土出口量在國(guó)際稀土貿(mào)易總量中占90%的比重[6]。2013年1月,稀土生產(chǎn)商Lynas宣布在馬來(lái)西亞建設(shè)稀土提煉廠,該廠竣工后將是世界最大的稀土提煉廠。隨著馬來(lái)西亞稀土產(chǎn)量的變化,該國(guó)的行動(dòng)集合也隨之發(fā)生變化,那么,中國(guó)同馬來(lái)西亞的稀土出口博弈具有博弈運(yùn)動(dòng)的特征,隨著這種運(yùn)動(dòng)變化,國(guó)際稀土市場(chǎng)的貿(mào)易格局將發(fā)生重大轉(zhuǎn)變,研究各國(guó)如何在這種新形勢(shì)下進(jìn)行稀土出口博弈具有一定的理論和現(xiàn)實(shí)意義。
目前,從博弈論的角度對(duì)稀土出口的研究還比較少,并且都是從經(jīng)典博弈論出發(fā)的。王正明等[7]從稅收轉(zhuǎn)嫁的角度分析了寡頭國(guó)家的稀土資源稅對(duì)出口市場(chǎng)勢(shì)力的影響,研究了市場(chǎng)出清條件下的價(jià)格轉(zhuǎn)移彈性。裴文琳等[8]利用灰色關(guān)聯(lián)度模型評(píng)估稀土出口總量分別對(duì)出口價(jià)格、進(jìn)口價(jià)格、進(jìn)口總量的相關(guān)程度, 提出了我國(guó)稀土貿(mào)易的相關(guān)建議。本文從博弈運(yùn)動(dòng)的角度對(duì)稀土貿(mào)易的寡頭市場(chǎng)進(jìn)行分析,討論行動(dòng)集合變化的稀土出口寡頭博弈。國(guó)內(nèi)外有不少學(xué)者從不同的角度對(duì)寡頭模型進(jìn)行了研究,Elsadany[9]和Agiza[10]從動(dòng)態(tài)博弈的角度討論了企業(yè)序貫博弈和有限理性等因素對(duì)博弈方的影響,給出了相應(yīng)情形下動(dòng)態(tài)模型的決策值。盧亞麗[11]和閆安等[12]從系統(tǒng)動(dòng)力學(xué)的角度分析了寡頭競(jìng)爭(zhēng)的均衡解,并分析了系統(tǒng)的穩(wěn)定性。Mallard[13]從演化博弈的角度出發(fā),探討了有限理性在的產(chǎn)量調(diào)整過(guò)程中所起的作用,并從環(huán)境與組織本身的影響因素出發(fā),研究了學(xué)習(xí)型企業(yè)的動(dòng)態(tài)調(diào)整策略。此外,廖萍康[14]、Anufriev[15]和Zschocke[16]等學(xué)者放寬原模型的條件對(duì)寡頭模型進(jìn)行了研究。這些文獻(xiàn)的研究工作對(duì)博弈論的發(fā)展起到積極的作用,可是尚未考慮行動(dòng)集合隨時(shí)間變化的情形,也不滿足行動(dòng)集合的變化不改變均衡解的隱含條件。本文考慮行動(dòng)集合這一個(gè)因素發(fā)生變化的博弈運(yùn)動(dòng)模型,從運(yùn)動(dòng)變化的角度研究稀土出口博弈,討論了均衡狀態(tài)的運(yùn)動(dòng)形式和博弈方的行動(dòng)選擇,這是以往文獻(xiàn)沒(méi)有研究過(guò)的,也是本文的創(chuàng)新點(diǎn)和價(jià)值所在。
1問(wèn)題的描述與模型的建立
定義3行動(dòng)集合變化的博弈運(yùn)動(dòng)模型為G(t)=[{A,B},{Sj(t)},{πj(t)}],其中{A,B}表示博弈方的集合,t=0,1,2,…,T,j=1,2,j=1時(shí)表示博弈方A,j=2表示博弈方B,Sj(t)表示t時(shí)刻博弈方j(luò)的行動(dòng)集合,πj(t)表示t時(shí)刻博弈方j(luò)在t時(shí)刻的收益。
定義4博弈運(yùn)動(dòng)的軌跡可以用相繼的收益和實(shí)現(xiàn)該收益的行動(dòng)選擇組成,從初始時(shí)刻直到t時(shí)刻的軌跡記為H(t)=(q1(0),q2(0),π1(0),π2(0);q1(1),q2(1),π1(1),π2(1);…;q1(t),q2(t),π1(t),π2(t)),將這種記錄博弈方的行動(dòng)選擇和收益的序列稱為0到t時(shí)刻的運(yùn)動(dòng)軌跡。
H(t)是對(duì)整個(gè)博弈運(yùn)動(dòng)而言的,它包含從初始時(shí)刻直到t時(shí)刻的博弈運(yùn)動(dòng)信息,記錄和反映了博弈方的行動(dòng)和收益。特別的,當(dāng)博弈方的策略是均衡策略時(shí),H(t)可以反映均衡解的運(yùn)動(dòng)轉(zhuǎn)移情況。當(dāng)博弈方{A,B}的產(chǎn)能很大時(shí),行動(dòng)集合Sj(t)就很大,即為任意時(shí)刻博弈方的行動(dòng)不受產(chǎn)能的制約,則模型G(t)=[{A,B},{S(t)},{π}]退化為寡頭模型G0=[{A,B},{S},{π}]。本文考慮行動(dòng)集合的變化是博弈運(yùn)動(dòng)模型G(t)與模型G0的主要不同。
2行動(dòng)集合變化的博弈模型分析
(1)
博弈方B的收益函數(shù)為:
(2)
性質(zhì)2在模型G(t)中,如果在t時(shí)刻博弈方A的產(chǎn)能小于模型G0均衡解,那么博弈方B不會(huì)同博弈方A聯(lián)合。
(3)
(4)
令Δπj(t)表示t時(shí)刻博弈方j(luò)的產(chǎn)能信息未知時(shí)的收益減去其的產(chǎn)能已知時(shí)的收益,則有:
(5)
2.1行動(dòng)集合逐漸變大
定理1在博弈運(yùn)動(dòng)模型G(t)中,如果滿足S1(t)?S1(t+1),那么博弈方B的決策值是從聯(lián)合生產(chǎn)均衡狀態(tài)向模型G0均衡狀態(tài)的轉(zhuǎn)移過(guò)程。
證明博弈方A的產(chǎn)能逐步增加且沒(méi)有達(dá)到模型G0均衡解時(shí),由性質(zhì)1知A的決策值為其產(chǎn)能。當(dāng)A的行動(dòng)集合變大且已知時(shí),則B的收益函數(shù)表示:
(6)
(7)
定理1表明:當(dāng)稀土出口國(guó)A的產(chǎn)能和出口量逐步增加時(shí),稀土出口國(guó)B的出口量不是穩(wěn)定的,而是一個(gè)運(yùn)動(dòng)轉(zhuǎn)移的過(guò)程,意味著B(niǎo)在每個(gè)時(shí)刻都要對(duì)出口量進(jìn)行修正。B對(duì)出口量進(jìn)行修正時(shí)依賴于A的行動(dòng)集合的變化,分析B的決策可得以下推論:
推論1在博弈運(yùn)動(dòng)模型G(t)中,如果滿足S(t)?S(t+1),那么博弈方B采取保守策略將會(huì)促使博弈方A聲明其行動(dòng)集合。
(8)
可知B采取冒險(xiǎn)策略時(shí)Δπ1(t)>0,A的收益增加;又因?yàn)棣う?(t)<0,即只要B對(duì)A行動(dòng)集合的大小的預(yù)估出現(xiàn)偏差,B的收益就會(huì)減少,所以B希望正確的估計(jì)A的產(chǎn)能。綜上所述:B采取保守策略,這對(duì)A構(gòu)成威脅并將導(dǎo)致A的收益減少,那么A為了避免收益的減少,將會(huì)聲明其行動(dòng)集合,使B可以觀察到A的產(chǎn)能。證畢。
2.2行動(dòng)集合逐漸變小
定理2在博弈運(yùn)動(dòng)模型G(t)中,如果S(t+1)?S(t),那么博弈方B的決策值的轉(zhuǎn)移過(guò)程是博弈方A的行動(dòng)集合變大情形時(shí)的逆過(guò)程。
推論2在博弈運(yùn)動(dòng)模型G(t)中,如果滿足S(t+1)?S(t),那么博弈方B采取冒險(xiǎn)策略將會(huì)促使博弈方聲明其行動(dòng)集合。
(9)
2.3行動(dòng)集合變化情形不確定
定理3在博弈運(yùn)動(dòng)模型G(t)中,博弈方A行動(dòng)集合變化情況不確定,則博弈方B采取保守策略和冒險(xiǎn)策略等效,固定策略嚴(yán)格優(yōu)于保守策略和冒險(xiǎn)策略。
(10)
(11)
(12)
(13)
定理3表明:當(dāng)博弈方A的行動(dòng)集合變化情形不確定時(shí),博弈方希望得到的均衡策略適用于任意一個(gè)可能初始產(chǎn)能。所以在實(shí)際的問(wèn)題中,博弈方可能只需要知道在某些或者某一個(gè)特定情形下如何進(jìn)行策略選擇的就足夠了,也就是說(shuō)博弈方可以采取相對(duì)穩(wěn)定的出口策略。
3模型進(jìn)一步討論
Step 1初始化并設(shè)置參數(shù)a,c,T,q1(0),q2(0),計(jì)算π1(0),π2(0),并令t=1;
Step 4計(jì)算t時(shí)刻的收益πj(t);
Step 5更新H(t)。執(zhí)行t:t+1,然后返回到step2。
Step 4計(jì)算t時(shí)刻的收益πj(t);
Step 5更新H(t)。執(zhí)行t:t+1,然后返回到step 2。
4算例分析
依據(jù)統(tǒng)計(jì)數(shù)據(jù),對(duì)模型參數(shù)進(jìn)行賦值,通過(guò)算例來(lái)直觀反映博弈雙方行動(dòng)集合都發(fā)生變化時(shí)的博弈運(yùn)動(dòng)模型。國(guó)際市場(chǎng)2012年稀土需求量約13萬(wàn)噸,平均每月需求量1.038萬(wàn)噸,出口成本大概21萬(wàn)元/噸。對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,A=1038(十噸),C=210(萬(wàn)元/十噸)。另外2012年6月到2013年3月馬來(lái)西亞和中國(guó)的稀土產(chǎn)能如表5-1,令2012年6月為博弈運(yùn)動(dòng)模型的初始時(shí)刻,有q1(0)=186.0,q2(0)=303.6,T=9,將這些參數(shù)作為初始輸入,計(jì)算得π1(0)=57920.4,π2(0)=102948.8
有
H(0)=((186.0),(303.6)(57920.4)(102948.8))
然后進(jìn)入t=1時(shí)刻,博弈方選擇此時(shí)的出口量。依據(jù)冒險(xiǎn)策略的計(jì)算步驟Step 3,可以得出馬來(lái)西亞和中國(guó)采取冒險(xiǎn)策略時(shí)的稀土出口量分別為
此時(shí)π1(1)=81501.0,π2(1)=59862.1,有
H(1)=((186.0),(303.6),(57920.4),(102948.8);(338.6),(248.7),(81501.0),(59862.1))
依次可以計(jì)算出直到T時(shí)刻博弈方的各期決策值,繪制表5-2。依據(jù)表5-2中博弈雙方的決策值便可計(jì)算博弈方采取不同策略時(shí)各期的收益值,同時(shí),可以得到運(yùn)動(dòng)軌跡H(t)。冒險(xiǎn)策略下總收益分別為661898.6萬(wàn)元和703489.0萬(wàn)元。同樣道理,依據(jù)保守策略計(jì)算方法可得雙方的各期決策值和收益,總收益分別為661530.3萬(wàn)元和703603.6萬(wàn)元。博弈雙方依據(jù)固定策略選擇出口量時(shí),總收益分別為679762.4萬(wàn)元和734437.6萬(wàn)元。另外,計(jì)算博弈方按實(shí)際產(chǎn)能進(jìn)行決策時(shí)的總收益分別為630233.1萬(wàn)元和683388.5萬(wàn)元,作為參照,對(duì)比博弈方采取不同策略的總收益,繪制成圖5。
表5-1 馬來(lái)西亞和中國(guó)稀土產(chǎn)能(單位/十噸)
注:A表示馬來(lái)西亞,B表示中國(guó),AC表示實(shí)際產(chǎn)能(Actual Capacity)
表5-2 不同策略下馬來(lái)西亞和中國(guó)的出口量(單位/十噸)
注:RS表示冒險(xiǎn)策略(Risky Strategy),CS表示保守策略(Conservative Strategy),SS表示固定策略(Stationary Strategy)
圖1 不同策略下博弈方的總收益
從圖1中可以看出,當(dāng)博弈雙方的行動(dòng)集合變化不確定時(shí),馬來(lái)西亞和中國(guó)采取冒險(xiǎn)策略、保守策略或固定策略的總收益都大于按產(chǎn)能出口時(shí)的總收益,這說(shuō)明文中給出的策略是可行的。圖1中冒險(xiǎn)策略和保守策略總收益基本相同,與理論分析的冒險(xiǎn)策略與保守策略等價(jià)的結(jié)論一致,并且可以看出,博弈方采取固定策略時(shí)的總收益明顯大于冒險(xiǎn)策略和保守策略,說(shuō)明文中構(gòu)建的博弈運(yùn)動(dòng)模型和求解方法是合理、有效的。這可以為稀土出口貿(mào)易提供一些啟示,出口國(guó)應(yīng)該采取相對(duì)穩(wěn)定的稀土出口量,可以構(gòu)建稀土貿(mào)易平臺(tái)、定期發(fā)布產(chǎn)能和出口信息,這些措施有利于稀土出口國(guó)獲得更多的收益和避免惡性競(jìng)爭(zhēng)。另外,當(dāng)單個(gè)博弈方的行動(dòng)集合變大、變小或者變化情形不確定時(shí),可以看作是雙方行動(dòng)集合都發(fā)生變化的特殊情境,不再贅述。
5結(jié)語(yǔ)
本文首先分析了馬來(lái)西亞的出口行動(dòng)集合變化的博弈運(yùn)動(dòng)模型,發(fā)現(xiàn)均衡狀態(tài)與經(jīng)典的納什均衡有很大的不同,在博弈運(yùn)動(dòng)模型中均衡狀態(tài)是一個(gè)運(yùn)動(dòng)轉(zhuǎn)移的過(guò)程。然后文章分析了博弈雙方的稀土生產(chǎn)不穩(wěn)定情形,探討了博弈雙方的行動(dòng)集合都發(fā)生變化的博弈運(yùn)動(dòng),給出稀土出口國(guó)應(yīng)該采取相對(duì)穩(wěn)定的出口量和發(fā)布的稀土產(chǎn)能等信息的應(yīng)對(duì)措施,這對(duì)于稀土貿(mào)易出口國(guó)應(yīng)對(duì)博弈對(duì)手行動(dòng)集合變化的新情況具有指導(dǎo)意義。當(dāng)然,本文只考慮了兩個(gè)博弈方的稀土出口競(jìng)爭(zhēng),對(duì)多個(gè)博弈方的行動(dòng)集合變化的博弈運(yùn)動(dòng)模型還要做進(jìn)一步研究。
參考文獻(xiàn):
[1] Schwalbe U, Walker P. Zermelo and the early history of game theory[J]. Games and Economic Behavior, 2001, 34(09): 123-137.
[2]Neumann J V, Zur theorie der gesellschaftsspiele[J]. Mathematische Annalen, 1928, 100(1): 295-320.
[3]Von Neumann J, Morgenstern O. Theory of games and economic behavior(commemorative edition)[M]. Princeton university press, 2007.
[4]Nash J. Non-cooperative games[J]. The Annals of Mathematics, 1951, 54(2): 286-295.
[5]Smith J M, Price G R. The logic of animal conflict[J]. Nature, 1973, 246: 15.
[6]Tse P K. China’s rare-earth industry[M]. US Department of the Interior, US Geological Survey, 2011.
[7]王正明,張?jiān)S靜.稀土資源稅對(duì)“寡頭”國(guó)出口市場(chǎng)勢(shì)力的影響研究[J].經(jīng)濟(jì)經(jīng)緯,2012,2(2):52-55.
[8]裴文琳, 孔銳. 我國(guó)稀土進(jìn)出口量與價(jià)格關(guān)聯(lián)度狀況分析[J].資源開(kāi)發(fā)與市場(chǎng), 2011, 7: 613-616.
[9]Elsadany A A. Competition analysis of a triopoly game with bounded rationality[J]. Chaos, Solitons & Fractals, 2012, 45(11): 1343-1348.
[10]Elsadany A A, Agiza H N, Elabbasy E M. Complex dynamics and chaos control of heterogeneous quadropoly game[J]. Applied Mathematics and Computation, 2013, 219(24): 11110-11118.
[11]盧亞麗.主從型Bertrand價(jià)格博弈模型及其動(dòng)力學(xué)分析[J].系統(tǒng)工程,2012,30(002):91-94.
[12]閆安,達(dá)慶利,裴鳳.多個(gè)企業(yè)同時(shí)博弈的動(dòng)態(tài)古諾模型的長(zhǎng)期產(chǎn)量解研究[J].管理工程學(xué)報(bào),2013,(1):94-98.
[13]Mallard G. Modelling cognitively bounded rationality: an evaluative taxonomy[J]. Journal of Economic Surveys, 2012, 26(4): 674-704.
[14]廖萍康,張衛(wèi)國(guó),謝百帥,閆杜娟.相異成本和廣義非線性需求下多寡頭古諾模型及應(yīng)用[J].運(yùn)籌與管理,2013,22(2):172-179.
[15]Anufriev M, Kopányi D, Tuinstra J. Learning cycles in Bertrand competition with differentiated commodities and competing learning rules[J]. Journal of Economic Dynamics and Control, 2013, 37(12): 2562-2581.
[16]Zschocke M S, Mantin B, Jewkes E M. Mature or emerging markets: competitive duopoly investment decisions[J]. European Journal of Operational Research, 2013, 228(2): 612-622.