李章呂 潘易欣
三門問題(Monty Hall problem)源于美國的一檔娛樂節(jié)目。該檔節(jié)目設(shè)置了A,B,C三扇門,其中一扇門后有一輛汽車,另外兩扇門后各有一頭羊。玩家若選中后面有車的那扇門即可獲得該汽車。游戲最開始讓玩家先選一扇門,然后在尚未打開這扇門的情況下,由主持人打開另外兩扇門后有羊的一扇(若兩扇門后都是羊則任意打開一扇),讓玩家看到門后的羊,并給玩家一次換門的機會。問題是:換門是否會增加玩家贏得汽車的概率?
從直觀上看,似乎玩家選擇的那扇門后有車的概率和主持人未打開的那扇門后有車的概率都是1/2。Krauss 和Wang 的實驗也表明,只有29% 的人選擇換門,且即便在換門的這群人里也很少有人覺知到換門贏得汽車的概率大于不換門([10])。然而,Gillman 等人的研究表明,在主持人打開那扇沒有車的門后,換門贏得汽車的概率更大。([6,5,12,8])這是一個非常反直觀的結(jié)果,引發(fā)了曠日持久的討論,不僅數(shù)學(xué)愛好者關(guān)注這個問題,心理學(xué)、經(jīng)濟學(xué)、計算機科學(xué)等領(lǐng)域的學(xué)者也對其進行了研究:實驗心理學(xué)家通過設(shè)計實驗來研究“害怕后悔”“錯誤表征”等心理因素對玩家的影響,進而解釋為什么有些玩家會選擇不換門([14]),但沒有給出具體方案來比較換門與不換門贏得汽車的概率;經(jīng)濟學(xué)家基于玩家對主持人動機的不信任來研究玩家與主持人之間的博弈,從而得出玩家不應(yīng)該換門的結(jié)論([11]),但并沒有給出非博弈視角下?lián)Q門與不換門贏得汽車的概率;計算機科學(xué)家利用R 語言對三門問題進行建模并進行大量的數(shù)據(jù)模擬,表明在獲得一定信息的前提下,改變最初選擇提高了贏得汽車的可能性([15]),但它沒有從演繹的角度向我們展現(xiàn)換門與不換門的概率分布1這里的具體做法是結(jié)合R 語言進行大量的編程模擬,并對模擬結(jié)果進行統(tǒng)計,發(fā)現(xiàn)換門贏得汽車的概率趨向于2/3,不換門贏得汽車的概率趨向于1/3。這實際上是一種歸納的方法。;數(shù)學(xué)家和邏輯學(xué)家主要基于貝葉斯定理,用條件概率來對先驗概率進行更新,并得出換門贏得汽車的概率更大([8]),但這種方案在運算過程和最終結(jié)果的呈現(xiàn)上不夠直觀。
為了更加直觀地呈現(xiàn)三門問題中換門與不換門各自贏得汽車的概率,本文擬用概率動態(tài)認知邏輯來為三門問題建立概率認知模型,并用概率更新模型來對其進行更新,從而將主體認知概率的變化過程細致地刻畫出來。
概率動態(tài)認知邏輯(Probabilistic Dynamic Epistemic Logic,簡稱PDEL)是一種將概率邏輯與動態(tài)認知邏輯相結(jié)合的邏輯系統(tǒng)。相比于一般的動態(tài)認知邏輯,PDEL 加入了概率內(nèi)容,其表達力更加豐富;相比于一般的概率邏輯,PDEL 將事件的概率處理成認知模型里的世界的概率,其更加直觀。
Halpern 和Tuttle([7])以及Fagin 和Halpern([4])將概率邏輯與靜態(tài)的認知邏輯相結(jié)合,建立了靜態(tài)概率認知邏輯;Kooi([9])和van Benthem([2])在靜態(tài)的概率認知邏輯基礎(chǔ)上,分別在其中加入了公開宣告和行動模型,使概率認知邏輯動態(tài)化,建立了概率動態(tài)認知邏輯;van Benthem、Gerbrandy 和Kooi([3])在概率動態(tài)認知邏輯的概率更新規(guī)則中又明確區(qū)分了先驗概率(prior probability)、發(fā)生概率(occurrence probability)和觀測概率(observation probability),明確定義了概率認知模型、概率更新模型和概率乘積更新規(guī)則,完善了PDEL 的語義內(nèi)容;Achimescu、Baltag 和Sack([1])將[3]中的單主體推廣到了多主體,使得PDEL可以刻畫多主體之間的互動。下面,我們在[3]的基礎(chǔ)上介紹PDEL 的模型與更新規(guī)則,在[1]的基礎(chǔ)上介紹PDEL 的語言和語義,為第三部分建立三門問題的概率認知模型奠定理論基礎(chǔ)。
定義1(概率動態(tài)認知邏輯的語言).給定一個主體集Ag,一個原子命題集At和一個有理數(shù)集Q,概率動態(tài)認知邏輯的語言可定義如下:
其中,p ∈At,i ∈Ag且α1,···,αn,β ∈Q。
根據(jù)這個定義,其它幾個概率公式可定義如下:
定義2(概率認知模型).給定一個主體集Ag和一個原子命題集At,概率認知模型M(S,~,P,V)定義如下:
S是一個有窮非空世界集;
~是主體i建立在S上的等價關(guān)系集;
P:Ag →(S →(S →[0,1])),P刻畫了主體i在S中某個世界上對S中任意世界的概率指派,一般表示為Pi(sm)(sn),其中sm,sn ∈S,m,n ∈N;V:At →?(S),V對每個原子命題指派一個S的子集。
與一般的認知模型相比,概率認知模型多了概率指派P。直觀上看,概率指派函數(shù)P表示的是主體在某個世界上對另一個世界指派概率,特別地,主體在任意一個世界上對S中所有世界的概率指派總和為1。[3] 將概率認知模型中的P指派的概率命名為先驗概率。
定義3(概率更新模型).給定一個主體集Ag和一個原子命題集At,概率更新模型A(E,~,Φ,pre,P)定義如下:
E是一個有窮非空事件集;
~是主體i建立在E上的等價關(guān)系集;
Φ 是E中事件發(fā)生的前提條件集,Φ?At,Φ 是兩兩不一致的公式集;
pre:Φ→(E →[0,1]),指前提條件p為真的情況下,事件e發(fā)生的概率,一般表示為pre(p,e),其中p ∈Φ,e ∈E,特別地,若M,s?p,則可以用pre(s,e)表示pre(p,e);
P:Ag →(E →(E →[0,1])),P刻畫了主體i在E中某個事件上對E中任意事件指派概率,一般表示為Pi(em)(en),其中em,en ∈E,m,n ∈N。
其中,[3]將概率更新模型中pre運算出來的結(jié)果命名為發(fā)生概率,將P指派的概率命名為觀測概率。主體在任意一個事件上對E中所有事件的概率指派(觀測概率)總和為1。
定義4(概率乘積更新規(guī)則).令M 是一個概率認知模型,A 是一個概率更新模型。概率更新模型A 對概率認知模型M 的更新規(guī)則如下:
更新后的概率認知模型M′M×A(S′,~′,P′,V ′)。
定義5(概率認知邏輯的語義).
上述PDEL 的語言和語義(定義1 和5)之所以借鑒[1]中的定義,是因為[3]采用的是帶等號的概率公式,但帶不等號的概率公式的表達力更為豐富。模型和更新規(guī)則(定義2、3、4)之所以借鑒[3]中的定義,是因為三門問題只涉及單主體,這樣可以保持語義的簡潔性。
我們將三門問題里的玩家視為認知主體?;诘诙糠纸o出的PDEL,首先建立三門問題的初始概率認知模型,然后根據(jù)主持人可能采取的行動來建立概率更新模型,最后求出更新后的概率認知模型,并將這個模型里概率賦值最高的世界作為主體的最優(yōu)選擇。
根據(jù)定義2,用a,b,c分別表示原子命題“車在A門后”“車在B門后”“車在C門后”。三門問題最初的概率認知模型M(S,~,P,V)如圖1 所示,其中S{sa,sb,sc}。根據(jù)無差別原則,在獲取更多信息之前,主體對命題a,b,c指派的概率是相等的,故對于sm,sn ∈S(m,n ∈{a,b,c}),都有Pi(sm)(sn)1/3。由于在同一個世界上,命題a,b,c有且只有一個為真,所以V(a){sa},V(b){sb},V(c){sc}。
圖1:三門問題的概率認知模型
根據(jù)定義3,在主體選擇A門的情況下,主持人打開B門或C門的概率更新模型A(E,~,Φ,pre,P),其中E{open B,open C},open B和open C分別表示“主持人打開了B門”和“主持人打開了C門”,Φ{a,b,c}。函數(shù)pre和概率指派函數(shù)P的值可以用全概率規(guī)則來計算。
令P(a)、P(b)、P(c)分別表示汽車在A門后的概率、汽車在B門后的概率、汽車在C門后的概率,則P(a)P(b)P(c)1/3;P(open B |a),P(open B |b),P(open B |c)分別表示汽車在A門后主持人打開B門的概率、汽車在B門后主持人打開B門的概率、汽車在C門后主持人打開B門的概率;P(open C | a)、P(open C |b)、P(open C |c)分別表示汽車在A門后主持人打開C門的概率、汽車在B門后主持人打開C門的概率、汽車在C門后主持人打開C門的概率。汽車所在的位置及主持人相應(yīng)的行動共有如下三種情況:
(1) 當汽車在A門后時,按照無差別原則,主持人打開B門和C門的概率是相等的,即P(open B |a)P(open C |a)1/2。
(2) 當汽車在B門后時,因為A門已經(jīng)被主體選中,所以主持人不可能打開A門,即P(open A | b)0;又因為主持人要打開一扇沒有車的門,所以他也不會打開B門,即P(open B | b)0;因此,主持人只能打開C門,即P(open C |b)1。
(3) 當汽車在C門后時,同理,P(open A|c)P(open C |c)0;因此,主持人只能打開B門,即P(open B |c)1。
根據(jù)全概率規(guī)則,在主體選擇A門的情況下,open B和open C發(fā)生的概率分別為:
根據(jù)[3],對于任意的p ∈Φ 和任意的e ∈E,PDEL 中pre(p,e)的值就等于概率邏輯中P(e|p)的值。因此,
根據(jù)[3],對于任意的em,en ∈E,PDEL 中Pi(em)(en)的值就等于概率邏輯中P(en)的值,因此,
概率更新模型A 可以用圖2 直觀地表示:
圖2:三門問題的概率更新模型
其中,虛線表示函數(shù)pre,分別表示在命題a,b,c為真的情況下,主體對事件open B和open C的概率指派,虛線上的數(shù)字是發(fā)生概率;實線表示主體對事件open B和open C的認知不可區(qū)分關(guān)系,實線右側(cè)的數(shù)字是觀測概率。
三門問題最初的概率認知模型M,在經(jīng)過概率更新模型A 更新后為M′(S′,~′,P′,V ′),該模型本來共有六個世界(如圖3 所示):
圖3:三門問題更新后的概率認知模型1
其中,世界(sa,open B)表示“車在A門后并且主持人打開了B門”,其余世界類似。
根據(jù)定義4 的第一條規(guī)則,需要刪去概率指派為0 的世界。由于pre(sb,open B)0 且pre(sc,open C)0,因此,應(yīng)該在世界集中刪去(sb,open B)和(sc,open C)。
再根據(jù)定義4 的第三條規(guī)則,世界(sa,open B)的概率為1/6,計算過程如下:
另外三個世界(sa,open C),(sb,open C),(sc,open B)的概率計算方法類似,它們的概率分別為1/6,1/3,1/3。
三門問題刪去概率指派為0 的世界后的概率認知模型M′(S′,~′,P′,V ′)如圖4 所示:
圖4:三門問題更新后的概率認知模型2
在主體選擇A門并且主持人打開B門的情況下,比較車在A門后和車在C門后的概率,就是比較(sa,open B)和(sc,open B)的概率。由圖4 可知,(sc,open B)的概率更高,因此主體應(yīng)該換為C門;同理,在主體選擇A門并且主持人打開C門的情況下,主體應(yīng)該換為B門。總之,在主體選中A門后,無論主持人打開哪一扇門,換門贏得汽車的概率都更高。
上述是在模型層面直觀地比較模型M′中各個世界的概率,下面我們基于語義定義來證明公式Pi(a)<Pi(?a)在模型M′中有效。
根據(jù)定義4 的第四條規(guī)則,V ′(a){(sa,open B),(sa,open C)},V ′(b){(sb,open C)},V ′(c){(sc,open B)}。又由于a,b,c在任意一個世界上有且只有一個為真,因此,
再根據(jù)定義5中關(guān)于概率公式的語義解釋,在模型M′中的任意一個世界(s,e)∈S′上,都有:
M′,(s,e)?Pi(a)1/3;
M′,(s,e)?Pi(?a)2/3。2其中,Pi(a)的值就是主體對(sa,open B)和(sa,open C)的概率指派之和,即1/6+1/6=1/3;Pi(?a)的值就是主體對(sb,open C)和(sc,open B)的概率指派之和,即1/3+1/3=2/3
因此,在主體最初選擇了A門且主持人打開了一扇沒有汽車的門后,汽車在A門后的概率要小于汽車不在A門后的概率,也就是說,主體選擇換門能提高贏得汽車的概率。
從三門問題最初的概率認知模型(圖1)到更新后的概率認知模型(圖4),清晰地刻畫了以下過程:在主持人沒有開門之前,任何一扇門后有車的概率都是1/3,所以主體選中的A門后有車的概率是1/3,而未被選中的那兩扇門后有車的概率是2/3,也就是P(A)1/3 和P(B)+P(C)2/3。當主持人打開一扇沒有汽車的門時,也就是確認了要么P(B)0 要么P(C)0。因此,要么P(B)2/3要么P(C)2/3,即換門會增加主體贏得汽車的概率。
本文結(jié)合[3]和[1],給出了PDEL 的語言和語義,并為三門問題建立了概率認知模型,清晰呈現(xiàn)了換門與不換門各自贏得汽車的概率(主體的認知概率分布),全面展現(xiàn)了三門問題的概率認知模型在概率更新模型下的變化過程,幫助我們更加直觀地理解了三門問題。這不僅體現(xiàn)了概率動態(tài)認知邏輯強大的表達力,亦為分析彩票悖論、睡美人難題等概率問題提供了借鑒方案。以彩票悖論為例(關(guān)于彩票悖論的邏輯結(jié)構(gòu)可參見[13]),可以利用本文所給的PDEL 語言和語義,為其建立初始概率認知模型M0,該模型里共有100 萬個世界,這些世界刻畫的都是它所對應(yīng)的那張彩票會中獎。然后將“否認第一張彩票會中獎”作為概率更新模型A0對M0進行更新,得到概率認知模型M1。M1刪除了刻畫“第一張彩票會中獎”的世界。接著將“否定第二張彩票會中獎”作為概率更新模型A1來更新M1,得到概率認知模型M2。如此更新下去,概率認知模型Mn?1(n100 萬)將只有一個世界,它刻畫的是“最后這張彩票會中獎”。這就表明,主體在否認其它彩票會中獎之后,不能再否認最后這一張彩票會中獎,否則會導(dǎo)致矛盾。