曹建美,馮晨嬌,王鳳翔
(山西財經(jīng)大學(xué)應(yīng)用數(shù)學(xué)學(xué)院,山西太原030006)
“概率論與數(shù)理統(tǒng)計”是研究隨機現(xiàn)象統(tǒng)計規(guī)律性的一門學(xué)科,因其抽象性強、題型靈活,需要扎實的“高等數(shù)學(xué)”基礎(chǔ),被大多數(shù)學(xué)生認(rèn)為是大學(xué)本科階段3門公共數(shù)學(xué)課程中最難學(xué)習(xí)的一門課程。數(shù)學(xué)建模是將實際問題抽象轉(zhuǎn)為數(shù)學(xué)問題,使用數(shù)學(xué)公式、圖形等進(jìn)行推導(dǎo)演繹進(jìn)而來研究實際問題的一種思想和方法[1]。將數(shù)學(xué)建模思想引入“概率論與數(shù)理統(tǒng)計”課程的教學(xué)改革,旨在增強大學(xué)生熟練運用數(shù)學(xué)知識解決實際問題的能力,培養(yǎng)學(xué)生的學(xué)習(xí)興趣,并進(jìn)一步培養(yǎng)學(xué)生的創(chuàng)新能力。概括起來,教師可在新課導(dǎo)入、知識應(yīng)用、課后拓展3個教學(xué)環(huán)節(jié)中結(jié)合數(shù)學(xué)建模進(jìn)行案例教學(xué)[2-3]。本文選用“貝葉斯公式”一節(jié),探討如何實施將數(shù)學(xué)建模思想引入“概率論與數(shù)理統(tǒng)計”課程的案例教學(xué)。
設(shè)B1,B2,…,Bn為Ω的一個分割,即B1,B2,…,Bn互不相容,且B i=Ω,如果P(A)>0,P(Bi)=0(i=1,2,…,n),則P(B i A)=,i=1,2,…,n。
證明:由條件概率的定義(所謂條件概率,是指在某事件B發(fā)生的條件下,求另一事件A的概率,記為P(A B))
對上式的分子用乘法公式、分母用全概率公式,P(ABi)=P(B i)P(A Bi)
P(A)=P(B i)P(A Bi)
P(B i A)=,i=1,2,…,n
結(jié)論得證。
介紹了貝葉斯公式后還需介紹全概率公式,因為全概率公式和貝葉斯公式是一組互逆公式。以下先了解全概率公式的概念。
設(shè)B1,B2,…,Bn為樣本空間Ω的一個分割,即B1,B2,…,Bn互不相容,且Bi=Ω,如果P(Bi)>0(i=1,2,…,n),則對任一事件A有P(A)=P(B i)P(A|B i)
證明:因為
A=AΩ=A
且AB1,AB2,…,ABn互不相容,所以由可加性得
P(A)=P
再將P(AB i)=P(B i)P(A|B i),i=1,2,…,n代入上式即得:
由證明可知,全概率公式就是貝葉斯公式的一種變形,它與貝葉斯公式是互逆應(yīng)用的,與貝葉斯公式一樣在實際生活中也有很廣泛的應(yīng)用。以下來探討貝葉斯公式在幾個方面的應(yīng)用。
1.3.1 貝葉斯公式的推廣
設(shè)當(dāng)試驗的隨機過程不少于兩個的時候,在影響目標(biāo)事件的每一個試驗過程中分別建立完備事件組,貝葉斯公式即可進(jìn)一步推廣。
1.3.2 貝葉斯公式推廣定理
設(shè)Ai(i=1,2,…,n)和Bj(j=1,2,…,n)是先后兩個試驗過程中的劃分,C為目標(biāo)事件。當(dāng)P(C)>0,P(Ai)>0,P(Bi)>0,P(AiBj)>0,i=1,2,…,n,j=1,2,…,m時,則有:
P(B j|C)=,j=1,2,…,m
P(A i B j|C)=,i=1,2,…,n,j=1,2,…,m
證明:(1)P(Ai|C)==
同理可以證明(2)、(3)。
整理文獻(xiàn)后,可把貝葉斯公式歸為兩種形式,即事件型和隨機變量型,這是就樣本本身的性質(zhì)而言的。上述推廣結(jié)論是由不同的技巧推廣而來的。從公式的條件出發(fā),討論拓寬公式應(yīng)用的面。在經(jīng)典的貝葉斯公式當(dāng)中要求事件列是“互不相容”的,這方面削弱了這一條件給出廣義的貝葉斯公式,無論相容與否都可以直接計算。從公式的形式出發(fā),增加公式的靈活度。例如:在經(jīng)典的貝葉斯公式中,樣本是離散的,但是實際計算當(dāng)中,遇到復(fù)雜事件的時候,就不太實用了,這時候可以把全概率公式推廣到隨機變量的情形。當(dāng)然,隨機變量有可能是離散的,或者是連續(xù)的,也可能是混合型隨機變量,所以可以再利用分布律來求解有關(guān)問題。從公式的計算輔助出發(fā),創(chuàng)新地利用公式的推廣,用在風(fēng)險模型的改進(jìn)、風(fēng)險計算和風(fēng)險過程的分析當(dāng)中。但是可以發(fā)現(xiàn),隨機變量的貝葉斯公式的推廣結(jié)論,要明顯少于事件型的推廣結(jié)論。一方面,隨機過程是一門很深很難的學(xué)科;另一方面,貝葉斯公式還是局限在概率的計算這個問題中,用于例子的一般計算,采用事件型就能夠完成。然而,隨著各個學(xué)科的相互滲透,事件型概率雖然已有較多的推廣形式值得學(xué)習(xí)和借鑒,但是當(dāng)遇到實際問題時,還是要對貝葉斯公式形式作一些新的變化,使之能更好地為計算和研究服務(wù)。
例1.由包括中國學(xué)者在內(nèi)的新冠病毒(COVID-19)緊急系統(tǒng)性綜述工作組完成的一項研究在《柳葉刀》雜志發(fā)表[4],該研究科學(xué)論證了保持1 m以上社交距離、戴口罩和眼睛防護(hù)是預(yù)防新冠病毒感染的有效手段。其中,戴口罩這樣一項在中國司空見慣的預(yù)防措施,在歐美國家卻成了較難實行的一項措施。試用概率知識解釋戴口罩的必要性。
分析(實際問題數(shù)學(xué)化):在一個高風(fēng)險地區(qū),假設(shè)該地區(qū)的居民能夠保持安全的社交距離與眼部防護(hù),如果已知一個人感染了新冠肺炎,求他是因為沒戴口罩被感染的概率。
之后,需要“設(shè)事件”,設(shè)B表示“居民感染新冠”,A1表示“居民佩戴口罩”,A2表示“居民不佩戴口罩”,則該數(shù)學(xué)問題是求P(A2|B)。
解:首先,對該問題進(jìn)行一些合理的假設(shè)。
①假設(shè)在一個偏好戴口罩的地區(qū),有95%的人習(xí)慣戴口罩,5%的人不習(xí)慣戴口罩;
②假設(shè)在一個不偏好戴口罩的地區(qū),有5%的人習(xí)慣戴口罩,95%的人不習(xí)慣戴口罩;
③假設(shè)在高風(fēng)險地區(qū),佩戴口罩時被感染的概率為3.1%,不戴口罩時被感染的概率為17.4%[4]。
根據(jù)條件概率公式,P(A2|B)=P(A2B)/P(B)。對于分子,根據(jù)乘法公式,可知P(A2B)=P(A2)P(B|A2),對于分母,要求P(B)。從題中可以看出,排除其他情況,有兩個情況可能會出現(xiàn)“居民感染新冠”這個結(jié)果,分別是情況1——居民佩戴口罩(A1),或情況2——居民未佩戴口罩(A2)。因此,“居民感染新冠”可包括兩種情況:居民佩戴著口罩同時被感染,或者居民未佩戴口罩同時被感染,即B=A1B+A2B,從而P(B)=P(A1B+A2B)。由于A1B與A2B不同時發(fā)生,故P(B)=P(A1B)+P(A2B)。使用乘法公式,P(A1B)=P(A1)P(B|A1),P(A2B)=P(A2)P(B|A2),得到P(B)=P(A1)P(B|A1)+P(A2)P(B|A2),這就是已經(jīng)學(xué)習(xí)過的全概率公式。將分子、分母分別代入,可得到P(A2|B)=P(A2)P(B|A2)/[P(A1)P(B|A1)+P(A2)P(B|A2)],即可推導(dǎo)得出貝葉斯公式。
如果是在不偏好佩戴口罩的地區(qū),由假設(shè),P(A1)=5%,P(A2)=95%,P(B|A1)=3.1%,P(B|A2)=17.4%,該概率為:
P(A2|B)=
為了便于學(xué)生比較,可引導(dǎo)學(xué)生自行計算“如果已知一個人感染了新冠肺炎,求他是戴口罩情況下被感染的概率”,即計算P(A1|B)。在一個偏好戴口罩的地區(qū),由假設(shè),P(A1)=95%,P(A2)=5%,P(B|A1)=3.1%,P(B|A2)=17.4%,該概率為:
P(A1|B)=
(4)模型應(yīng)用。
通過計算發(fā)現(xiàn),如果一個居民不幸感染了新冠,在不偏好戴口罩的地區(qū),他是在沒戴口罩情況下被感染的概率高達(dá)99.1%,而在偏好戴口罩的地區(qū),這一概率約為22.8%。這個結(jié)果充分驗證了西方國家和中國在預(yù)防新冠肺炎時面臨的防疫形勢,結(jié)果令人信服,同時從概率論的角度解釋了戴口罩進(jìn)行防疫的必要性。
在求解的過程中用到了一個公式:P(A2|B)=,即概率論中非常重要的貝葉斯公式。教師可繼續(xù)引導(dǎo)學(xué)生總結(jié)貝葉斯公式的使用條件、適用題型(執(zhí)果索因)、推廣形式(可推廣到n個原因)。
在解決實際問題的同時,通過數(shù)學(xué)建模思想,由淺入深,循序漸進(jìn)地推導(dǎo)出本次課程的主題內(nèi)容——貝葉斯公式,學(xué)生感覺公式的給出合情合理,避免了直接講解公式時學(xué)生感覺知識點的學(xué)習(xí)如無本之木、無源之水的困境。
例2.利用概率知識解釋“狼來了”的寓言故事中村民對放羊娃的信任度是如何下降的。
解:(1)模型假設(shè)。
①假設(shè)一個孩子是誠實的孩子的概率為0.8;②假設(shè)一個誠實的孩子會說謊的概率為0.1;③假設(shè)一個不誠實的孩子會說謊的概率為0.5。
(2)模型建立。
用A1表示“孩子是誠實的”,A2表示“孩子是不誠實的”,B表示“孩子說謊”,根據(jù)貝葉斯公式:
P(A1|B)=
(3)模型計算。
由假設(shè)可知,P(A1)=0.8,P(A2)=0.2,P(B|A1)=0.1,P(B|A2)=0.5,則放羊娃第一次說謊后,村民對其信任度為:P(A1|B)==0.444
在放羊娃第一次說謊后,在村民眼中,這個孩子是誠實的概率降為0.444,即此時可認(rèn)為P(A1)=0.444,P(A2)=0.556。繼續(xù)計算,放羊娃第二次說謊后,村民們對放羊娃的信任度:
P(A1|B)=≈0.138
(4)模型應(yīng)用。
放羊娃兩次說謊后,村民們對放羊娃的信任度從最初的0.8下降為0.138,所以這個故事的結(jié)局是悲慘的,放羊娃因為自己的一再說謊付出了生命的代價。本例是貝葉斯公式的一個應(yīng)用案例,通過對“狼來了”這一寓言故事進(jìn)行數(shù)學(xué)建模分析,既讓學(xué)生深刻理解了該寓言故事蘊含的“誠信做人”的深刻內(nèi)涵,同時還能幫助學(xué)生掌握貝葉斯公式的使用條件、適用題型,并培養(yǎng)學(xué)生利用所學(xué)數(shù)學(xué)知識解決實際問題的能力,極大地激發(fā)了學(xué)習(xí)興趣。
例3.垃圾郵件的識別、智能手機自動翻譯、語音識別等很多人工智能現(xiàn)象的關(guān)鍵算法核心都是貝葉斯公式。請各小組結(jié)合數(shù)學(xué)建模的思想和方法探討貝葉斯公式是如何應(yīng)用到這些實際問題中建模的,并提交小組報告一份。
這是一個開放性的課后拓展作業(yè),學(xué)生在課后可以查閱資料,小組討論,團(tuán)隊協(xié)作,結(jié)合數(shù)學(xué)建模的思想和方法完成一篇研究報告。限于篇幅,這里不再贅述。
貝葉斯公式在很多數(shù)學(xué)模型中有很重要的作用。對貝葉斯公式進(jìn)行仔細(xì)分析,用例子說明了它的用法及所適用的概型,為了解決實際問題的需要,將貝葉斯公式進(jìn)行了推廣,用例子說明了推廣的貝葉斯公式在實際應(yīng)用中所適用的概型比貝葉斯公式的更廣。因此,貝葉斯公式在數(shù)學(xué)模型的求解中有著十分廣泛的作用,它是數(shù)學(xué)模型中一個經(jīng)常會被用到的工具。社會在飛速發(fā)展,決策者必須綜合考察以往的信息及現(xiàn)狀從而做出綜合判斷,決策概率分析越來越顯示其重要性,其中,貝葉斯公式主要用于處理先驗概率與后驗概率,是進(jìn)行決策的重要工具。
教師在課堂教學(xué)各個環(huán)節(jié)中有意識地融入數(shù)學(xué)建模的思想和方法進(jìn)行案例教學(xué),將“概率論與數(shù)理統(tǒng)計”的理論知識與實際問題結(jié)合起來,可以達(dá)到3個方面的教學(xué)效果:第一,讓學(xué)生充分認(rèn)識到該課程的實際應(yīng)用,使得課程學(xué)習(xí)從“無用”變得“有用”;第二,讓學(xué)生逐步了解了數(shù)學(xué)建模的本質(zhì),掌握了數(shù)學(xué)建模的基本方法,培養(yǎng)了學(xué)生解決實際問題的能力和創(chuàng)新能力,激發(fā)了學(xué)習(xí)興趣,使得課程學(xué)習(xí)從“無趣”變得“有趣”;最后,學(xué)生對課程知識的理解得到深化,提高了學(xué)習(xí)效率,使得課程學(xué)習(xí)從“困難”變得“不難”。隨著教學(xué)活動的不斷深入,如何更加有效地融入數(shù)學(xué)建模的思想和方法,不斷提高教學(xué)質(zhì)量,這是需要進(jìn)一步探討和完善的地方。