摘 要 貝葉斯公式是解決“由果溯因”問題的一種重要方法,它在日常生活中的應(yīng)用非常廣泛。因此,如何引導(dǎo)學(xué)生理解并掌握貝葉斯公式,學(xué)以致用,解決實(shí)際問題,一直是課堂教學(xué)的重點(diǎn)與難點(diǎn)。因此本文通過實(shí)際生活中的典型問題引出貝葉斯公式,然后解釋公式的內(nèi)涵并且通過追溯公式的來歷來激發(fā)學(xué)生們的學(xué)習(xí)興趣,最后通過具體的實(shí)例來說明貝葉斯公式的應(yīng)用。通過生動(dòng)有趣的例子貫穿課堂,使同學(xué)們?cè)谳p松愉快的環(huán)境中獲取并熟練掌握數(shù)學(xué)知識(shí),從而提高課堂的教學(xué)效果,有效的完成教學(xué)目標(biāo)。
關(guān)鍵詞 貝葉斯公式 由果溯因 教學(xué)效果 教學(xué)目標(biāo)
中圖分類號(hào):G642 文獻(xiàn)標(biāo)識(shí)碼:A
在現(xiàn)實(shí)生活中,人們經(jīng)常會(huì)遇到已知結(jié)果尋找原因的問題。比如,在行政決策中,某個(gè)人死了,導(dǎo)致這個(gè)人死亡的原因可能是自殺、他殺、意外、疾病等等。那么,在這些原因當(dāng)中哪一個(gè)才是最可能的原因呢?又比如,某一條河水受到了污染,導(dǎo)致河水污染的原因可能是生活污水、工業(yè)廢水的排放,又或者說是農(nóng)藥、化肥、降水中污染物的流入,又或者說是其他的原因。那么這些原因當(dāng)中哪一個(gè)才是最可能的原因呢?
上述問題雖然背景各不相同,但是從數(shù)學(xué)的角度來看,都是一回事。即在結(jié)果發(fā)生的條件下,去尋找各個(gè)原因概率的大小。即已知結(jié)果尋找原因,這正是貝葉斯公式所要表達(dá)的基本思想。下面通過具體的例子,引出貝葉斯公式。
1引例:疾病診斷
小明發(fā)燒了,醫(yī)學(xué)常識(shí)告訴我們,導(dǎo)致一個(gè)人發(fā)燒的原因有很多。為簡(jiǎn)單起見,假設(shè)導(dǎo)致小明發(fā)燒的可能原因只有3個(gè):(1)可能是得了普通感冒;(2)可能是得了肺炎;(3)可能是得了風(fēng)疹。現(xiàn)在醫(yī)生要診斷小明發(fā)燒是由哪種疾病所導(dǎo)致的?
這類問題在實(shí)際生活中尤為常見,它是典型的“已知結(jié)果尋找原因”的問題。那么,如何去解決呢?
分析:首先引入隨機(jī)事件。設(shè)A=“小明發(fā)燒”這一事件,B1,B2,B3分別表示導(dǎo)致發(fā)燒的三個(gè)可能原因。如果要確定導(dǎo)致A發(fā)生的最可能原因,只需要計(jì)算出A事件發(fā)生的條件下,各個(gè)原因發(fā)生的可能性大小。也就是計(jì)算三個(gè)條件概率P(B1|A),P(B2|A),P(B3|A)。通過比較這三個(gè)概率,取值最大的所對(duì)應(yīng)的原因就是最可能的原因。
下面以發(fā)燒的條件下他得普通感冒的概率(P(B1|A))的求法為例:
上述推導(dǎo)過程中運(yùn)用了條件概率公式、乘法公式和全概率公式。從而得到發(fā)燒這一結(jié)果發(fā)生的條件下,它是由普通感冒這一原因引起的概率。
將所得到的式子一般化,假設(shè)導(dǎo)致A這一結(jié)果發(fā)生的所有可能原因有n個(gè),即為B1,B2,…,Bn,那么該如何計(jì)算A發(fā)生的條件下A發(fā)生的概率呢(P(Bi|A))?
通過這種設(shè)問的方式,將特殊情況一般化,很自然地引出了貝葉斯公式。
2貝葉斯公式
設(shè)試驗(yàn)E的樣本空間為,B1,B2,…,Bn,為的一個(gè)劃分,A為E的事件,且,,則:
(1)
在(1)式中,A表示某一結(jié)果的發(fā)生,B1,B2,…,Bn,是一個(gè)完備事件組,它是導(dǎo)致A這一結(jié)果發(fā)生的所有可能的原因。
將貝葉斯公式中分母的和式展開來寫,不難發(fā)現(xiàn),分子恰好是分母中的第i項(xiàng)。而分母應(yīng)用的是全概率公式,即全部原因的概率之和。那么,現(xiàn)在要求A這一結(jié)果發(fā)生的條件下,它是由第i個(gè)原因?qū)е碌目赡苄源笮?,自然是這一原因占所有原因的比例。
3貝葉斯公式的來歷
貝葉斯公式的創(chuàng)始人是貝葉斯·托馬斯,是名英國的牧師,是位業(yè)余的數(shù)學(xué)家。
在他去世的第二年,也就是1763年,有關(guān)貝葉斯公式的著作《機(jī)會(huì)問題的解法》才得以發(fā)表,但是當(dāng)時(shí)這一結(jié)果并沒有受到應(yīng)有的重視,這是因?yàn)樗谥髦酗@示的是:P(B|A)=P(AB)/P(A)。這只是乘法公式的一個(gè)變形。因?yàn)楫?dāng)時(shí)他已經(jīng)去世了,人們并沒有看出貝葉斯給出這個(gè)公式的初衷。
直到1774年,法國數(shù)學(xué)家拉普拉斯再一次總結(jié)了這一結(jié)果。從此,人們才意識(shí)到貝葉斯公式的重要性。
4貝葉斯公式的應(yīng)用
貝葉斯公式的應(yīng)用非常廣泛,在數(shù)據(jù)搜索、人工智能、產(chǎn)品檢驗(yàn)、疾病診斷、安全監(jiān)測(cè)教學(xué)分析等多方面都發(fā)揮著重要的作用。它不僅可以幫助人們尋找導(dǎo)致某一事件發(fā)生的最可能的原因;還可以通過后驗(yàn)概率來重新確認(rèn)人們之前不確定的事情,從而對(duì)事情進(jìn)行新的認(rèn)識(shí)。下面通過具體的例子來說明貝葉斯公式在實(shí)際中的應(yīng)用。
例1:設(shè)1,2,3三臺(tái)車床加工同一種零件,加工出來的零件混放在一起。已知三臺(tái)車床加工的零件分別占全部的45%,35%和20%,三臺(tái)車床的次品率依次為4%,2%和5%。現(xiàn)在從全部零件中任取一件,發(fā)現(xiàn)是次品,問該零件是由哪臺(tái)車床加工的可能性最大?
分析:發(fā)現(xiàn)一個(gè)零件是次品表示結(jié)果,而導(dǎo)致這一結(jié)果發(fā)生的原因有三個(gè):即第一臺(tái)車床加工的零件,第二臺(tái)車床加工的零件,第三臺(tái)車床加工的零件。哪一臺(tái)車床加工的可能性最大呢?這是已知結(jié)果尋找原因,可以利用貝葉斯公式去求解。
解:設(shè)全部加工的零件構(gòu)成樣本空間,A表示:“發(fā)現(xiàn)一件次品”,Bi表示:“所取零件是由第i臺(tái)車床加工的”(i=1,2,3)。由題意可知:
現(xiàn)在要求A發(fā)生的條件下Bi發(fā)生的概率:
由貝葉斯公式可得:
因?yàn)镻(B1|A)已經(jīng)大于0.5了,另外兩個(gè)原因的概率不可能超過0.5。因此該零件是由第一臺(tái)車床加工的可能性最大。
例2:貝葉斯公式在教學(xué)分析中的應(yīng)用。
假設(shè)某天老師講完一個(gè)重要的知識(shí)點(diǎn)后,做了個(gè)課堂檢測(cè)。老師請(qǐng)小明做了一道有4個(gè)選項(xiàng)的單項(xiàng)選擇題。對(duì)做選擇題,我們做這樣一個(gè)假設(shè):如果掌握知識(shí)點(diǎn)了,一定能做對(duì);而沒有掌握知識(shí)點(diǎn),也可能猜對(duì)。即不考慮掌握知識(shí)點(diǎn),但粗心算錯(cuò)或?qū)戝e(cuò)答案的可能。
做之前老師估計(jì)小明掌握知識(shí)點(diǎn)的可能性是20%。做完之后,老師一看,小明做對(duì)了。老師挺滿意的,但忍不免擔(dān)憂,小明是否是猜對(duì)的呀?于是老師請(qǐng)小明又做了一道相同知識(shí)點(diǎn)的選擇題。小明又做對(duì)了,這個(gè)時(shí)候老師認(rèn)為他掌握的可能性還是比較大的。那么,應(yīng)該如何解釋老師態(tài)度的逐步轉(zhuǎn)變呢?
解:將“做對(duì)題”這一事件記為A,“掌握知識(shí)點(diǎn)”記為B,“沒有掌握知識(shí)點(diǎn)”記為。則由題意可知:
。
(1)小明做第一道選擇題時(shí),,
小明做對(duì)題的條件下,掌握知識(shí)點(diǎn)的概率是0.5。顯然比0.2高,但就概率意義而言,0.5的值也不算大。所以小明做對(duì)題老師是滿意的,但是忍不免擔(dān)心,他是否是猜對(duì)的呀?
(2)對(duì)于小明做第二道選擇題,思路是一樣的。只是這里小明掌握知識(shí)點(diǎn)的概率,就是B的概率要看成0.5了(即P(B)=0.5)。用同樣的方法可得:
小明做對(duì)第二題的條件下掌握知識(shí)點(diǎn)的概率是0.8。這個(gè)概率值相對(duì)比較大了,所以老師認(rèn)為小明應(yīng)該掌握知識(shí)點(diǎn)了。
在這里出現(xiàn)了兩個(gè)B事件的概率。一個(gè)是結(jié)果發(fā)生前的無條件概率,稱為先驗(yàn)概率;另一個(gè)是結(jié)果發(fā)生之后的條件概率,稱為后驗(yàn)概率。也就是說在增加了結(jié)果發(fā)生這個(gè)新信息后,對(duì)原因概率的重新認(rèn)識(shí)。所以貝葉斯公式的作用也可以說成是由先驗(yàn)概率得到后驗(yàn)概率,再由后者去修正前者。比如,小明第一次做對(duì)題后,老師就是用后驗(yàn)概率0.5對(duì)先驗(yàn)概率0.2做了修正。第二次做對(duì)題,P(B)=0.5為先驗(yàn)概率,P(B|A)=0.8為后驗(yàn)概率。老師第二次態(tài)度的改觀,就是用后驗(yàn)概率0.8對(duì)先驗(yàn)概率0.5做了修正。
從0.2到0.5,再到0.8,數(shù)據(jù)很直觀地反映了老師態(tài)度的轉(zhuǎn)變過程。雖然在實(shí)際中,老師并非通過計(jì)算來完成這種修正,但道理是相同的。所以拉普拉斯曾經(jīng)說過,概率論只不過是把常識(shí)用數(shù)學(xué)公式表達(dá)出來。
5結(jié)束語
本文首先通過現(xiàn)實(shí)生活中尤為常見的例子——疾病診斷,引出貝葉斯公式,將特情況一般化,很自然地得到貝葉斯公式;然后介紹了貝葉斯公式的內(nèi)涵和來歷,以激發(fā)學(xué)生們的學(xué)習(xí)興趣;最后通過具體的實(shí)例來說明貝葉斯公式的作用。通過這種循序漸進(jìn)的教學(xué)方式,幫助同學(xué)們深入理解和靈活運(yùn)用貝葉斯公式,從而有效地提高教學(xué)質(zhì)量、完成教學(xué)目標(biāo)。
作者簡(jiǎn)介:李益清,(1978—),女,漢族,新疆奇臺(tái)人,研究生學(xué)歷,講師,主要從事能源經(jīng)濟(jì)的研究。
參考文獻(xiàn)
[1] 上海交通大學(xué)數(shù)學(xué)系.概率論與數(shù)量統(tǒng)計(jì)[M].北京:科學(xué)出版社,2018.
[2] 朱翼雋.概率論與數(shù)量統(tǒng)計(jì)[M].鎮(zhèn)江:江蘇大學(xué)出版社,2015.