摘要:《醉漢的腳步——隨機(jī)性如何主宰我們的生活》這本書既像一部精彩紛呈、跌宕起伏的好萊塢大片,又是一部回味悠長、發(fā)人深思的概率論科普著作,更是“跨學(xué)科綜合與實(shí)踐”案例的豐富呈現(xiàn)。閱讀這本書,可以充分感受到:世界既是確定的,又是隨機(jī)的%直覺常常是不可靠的,邏輯始終是無疑的;通過生動(dòng)的故事,可以領(lǐng)悟概率論的核心概念、基本思想。由此啟示概率與統(tǒng)計(jì)的教學(xué),讓學(xué)生更多地接觸自然界甚至人類社會(huì)中的大量案例,從隨機(jī)性的角度,用數(shù)學(xué)的方式觀察、思考、表達(dá),向?qū)W生滲透由案例體現(xiàn)的深刻的概念本質(zhì)、思想方法,特別是關(guān)于平均數(shù)、用頻率估計(jì)概率、因果關(guān)系與相關(guān)關(guān)系、條件概率與全概率公式等的概念本質(zhì)、思想方法。
關(guān)鍵詞:《醉漢的腳步》隨機(jī)與生活;概率與統(tǒng)計(jì);科普;教學(xué)
兩年前,北京師范大學(xué)統(tǒng)計(jì)學(xué)院趙楠教授推薦了《醉漢的腳步——隨機(jī)性如何主宰我們的生活》這本書,我即刻被它吸引。這兩年常常看、反復(fù)看,每次都有新的收獲。下面,先概述這本書的內(nèi)容,再分享我閱讀這本書的感悟。在此基礎(chǔ)上,談?wù)剬?duì)概率與統(tǒng)計(jì)教學(xué)的一些思考。
一、內(nèi)容概述
可以這樣說,這本書既像一部精彩紛呈、跌宕起伏的好萊塢大片《醉漢的腳步》,又是一部回味悠長、發(fā)人深思的概率論科普著作《隨機(jī)性如何主宰我們的生活》。
說其像好萊塢大片,是因?yàn)樽髡咦鲞^好萊塢大片的編劇,特別會(huì)講故事,講的故事很生動(dòng)、畫面感很強(qiáng)。就算是門外漢,也容易被故事的構(gòu)思、情節(jié)所吸引,不知不覺地深人隨機(jī)性的世界中,在作者的娓娓道來中感受什么是隨機(jī)、如何認(rèn)識(shí)隨機(jī)、如何理解隨機(jī)、如何解釋隨機(jī),辯證看待隨機(jī)與確定的關(guān)系。
說其是概率論科普著作,是因?yàn)檫@本書講述的是概率論的核心概念、基本思想和重要方法,以及它們發(fā)生和發(fā)展的脈絡(luò)。作者通過極其簡單的計(jì)算、易于理解的推理,表達(dá)隨機(jī)、解釋隨機(jī),融隨機(jī)性于生活的諸多方面,給我們提供關(guān)于自然界甚至人類社會(huì)的世界觀和方法論,教我們?nèi)绾瓮高^隨機(jī)性的目鏡審視世界。
也完全可以說,整本書就是“跨學(xué)科綜合與實(shí)踐”案例的呈現(xiàn),書中的案例來自生活的方方面面。
毫不夸張地說,這是目前我看到的最好的一本概率論科普著作。它是部經(jīng)典,很難超越,只會(huì)歷久彌新。雖然具有高中程度的概率知識(shí)就能看懂這本書,但是完全理解需要一定的時(shí)間和過程。讀懂這本書,定能真正認(rèn)識(shí)隨機(jī),并能讓有關(guān)內(nèi)容的教學(xué)更生動(dòng)、深刻。
這里順便說一下作者列納德·蒙洛迪諾。他是理論物理學(xué)家(看過很多數(shù)學(xué)科普著作后,我想很多人可能會(huì)有這樣的印象:理論物理學(xué)家的數(shù)學(xué)科普著作往往比純粹數(shù)學(xué)家的數(shù)學(xué)科普著作更生動(dòng)、深刻'任教于美國加州理工學(xué)院。他經(jīng)歷豐富,著述頗豐,有《歐幾里得之窗——從平行線到超空間的幾何學(xué)故事》《思維簡史——從叢林到宇宙》等,并與霍金合著《時(shí)間簡史(普及版)》。這些書都值得讀一讀。
二、閱讀感悟
(一)世界既是確定的,又是隨機(jī)的
學(xué)習(xí)任何一門學(xué)科都需要一定的世界觀、方法論,都需要關(guān)于這門學(xué)科的認(rèn)識(shí)論,學(xué)習(xí)概率與統(tǒng)計(jì)尤其如此。與代數(shù)、幾何研究數(shù)、形不一樣,概率與統(tǒng)計(jì)研究隨機(jī)現(xiàn)象,處理隨機(jī)數(shù)據(jù),盡管方法是演繹的,但推斷過程是歸納式的。這與代數(shù)、幾何是完全的演繹科學(xué)有很大的不同。所以,認(rèn)識(shí)概率與統(tǒng)計(jì)的哲學(xué)基礎(chǔ)既是重要的,更是必需的。
觀察世界、表達(dá)世界、思考世界、解釋世界,是人類認(rèn)識(shí)世界的具體表現(xiàn)。正如《普通高中數(shù)學(xué)課程標(biāo)準(zhǔn)(2017年版2020年修訂)》和《義務(wù)教育數(shù)學(xué)課程標(biāo)準(zhǔn)(2022年版'中提到的“三會(huì))會(huì)用數(shù)學(xué)的眼光觀察現(xiàn)實(shí)世界,會(huì)用數(shù)學(xué)的思維思考現(xiàn)實(shí)世界,會(huì)用數(shù)學(xué)的語言表達(dá)現(xiàn)實(shí)世界??创F(xiàn)實(shí)世界的視角是多元的,而且是隨著時(shí)空變化的,很難有絕對(duì)一成不變的視角,也很難有隨時(shí)隨地變化的視角。視角具有一'定的確定性,也有一'定的隨機(jī)性。整體上可以認(rèn)為,確定性是主旋律,但隨機(jī)性又不可或缺。
偶然與必然、原因與結(jié)果,是唯物辯證法的研究范疇,也是我們認(rèn)識(shí)現(xiàn)實(shí)世界確定性與隨機(jī)性的最大視角。
回顧科學(xué)史,我們不難發(fā)現(xiàn),因果關(guān)系的決定論是牛頓時(shí)代的產(chǎn)物。拉普拉斯對(duì)其進(jìn)行了提煉和升華,他的“決定論”是這樣表述的!世界的當(dāng)前狀態(tài),精確地決定了它未來的發(fā)展方向。假如一個(gè)智能體,在一個(gè)給定的時(shí)刻,知道了所有使世界運(yùn)行的力,以及世界的每一個(gè)組成體的位置;進(jìn)一步地,如果該智能體足夠強(qiáng)大,以至能對(duì)這些數(shù)據(jù)進(jìn)行分析,它就可以用同一個(gè)方程將宇宙中最大之天體及最小之原子的運(yùn)動(dòng)皆囊括其中:對(duì)于這個(gè)智能體而言,沒有什么是不確定的,而未來就如同過去一樣,呈現(xiàn)在它的眼前。”而我們知道,真正促使拉普拉斯作出這一番表達(dá)的恰恰不是決定論,而是隨機(jī)性。那時(shí)的科學(xué)家強(qiáng)烈地感受到隨機(jī)在科學(xué)觀察、科學(xué)實(shí)驗(yàn)中的巨大作用以及人類自身認(rèn)識(shí)的局限。正如這本書所述:
如果將決定論應(yīng)用到我們的日常生活中,那么它意味著我們將生活在這樣一個(gè)世界:在這個(gè)世界上,個(gè)人的素質(zhì)以及任何形勢或環(huán)境的性質(zhì),都將以直接而毫不含糊的方式導(dǎo)致精準(zhǔn)的后果。這是一個(gè)有序的世界,其中的任何事情都能被預(yù)見,并能通過計(jì)算求得。但拉普拉斯的夢想要成真,必須滿足幾個(gè)條件。首先,自然定律本身必須能夠給出一個(gè)確定的未來,而且我們必須掌握這些定律。其次,我們必須獲得那些完全描述了我們感興趣的系統(tǒng)的數(shù)據(jù),而且不允許有任何不可預(yù)見的因素。最后,我們必須有足夠的智慧或計(jì)算能力,能根據(jù)已知的數(shù)據(jù)描述現(xiàn)在的數(shù)據(jù),能通過定律計(jì)算它所確定的未來是何等模樣。①
統(tǒng)計(jì)學(xué)家C.R.勞從另外一個(gè)角度闡釋對(duì)確定性與隨機(jī)性的理解:“如果世界上的一切都是確定的,這個(gè)世界會(huì)是索然無味的;相反,正是充滿隨機(jī)性,這個(gè)世界才具有多樣性,人類的生活才豐富多彩。”同樣地,這本書中有如下表述!
在回顧生命中那些重大事件的細(xì)節(jié)時(shí),我們不難發(fā)現(xiàn)這類看似無足輕重卻導(dǎo)致巨大改變的隨機(jī)事件的存在。
與人類自身和人類社會(huì)有關(guān)的決定論,無法滿足那些拉普拉斯暗指的可預(yù)測性所需的條件。之所以如此,原因有以下幾點(diǎn)。首先,就目前所知,人類社會(huì)不像物理學(xué)那樣,由明確而基本的定律主宰。恰恰相反,人類的行為正如卡尼曼和特沃斯基一再證明的那樣,不僅無法預(yù)測,而且(從行為違背自身最大利益的意義上來說)常常是非理性的。其次,即使我們能夠像凱特勒所希望的那樣,發(fā)現(xiàn)主宰人類活動(dòng)的定律,我們也不可能精確獲知或控制生活中的各種因素。也就是說,我們跟洛倫茲一樣,無法得到預(yù)測所需的精確數(shù)據(jù)。第三,與人有關(guān)的事情是如此復(fù)雜,因此,哪怕我們真的了解了這些定律,獲取了這些數(shù)據(jù),能否完成必要的計(jì)算也是存疑的。因此,決定論對(duì)于人類活動(dòng)而言,是一個(gè)很糟糕的模型。或者按諾貝爾獎(jiǎng)獲得者馬克斯·玻恩的話來說:“相比于因果性,偶然性是一個(gè)更加基本的概念?!?/p>
“醉漢的腳步”是隨機(jī)過程的科學(xué)研究中所使用的一個(gè)基本模型。不過,它同樣為我們的日常生活提供了合適的模型,因?yàn)榫拖駪腋≡诓祭柿黧w中的花粉微粒那樣,我們也不斷地被隨機(jī)事件推動(dòng),先是走向這個(gè)方向,然后又通往那個(gè)方向。雖然我們?cè)谏鐣?huì)學(xué)數(shù)據(jù)中可以發(fā)現(xiàn)統(tǒng)計(jì)規(guī)律,但是對(duì)于某個(gè)具體的個(gè)人而言,未來仍然是無法預(yù)測的。對(duì)于某個(gè)具體的成就、工作、朋友或財(cái)政狀況等,機(jī)遇所占的功勞比許多人能認(rèn)識(shí)到的還要大。接下來,我將進(jìn)一步說明,現(xiàn)實(shí)生活中除了一些最簡單的情勢,我們都無法躲開那些不可預(yù)見或無法預(yù)測的力量。正是這些隨機(jī)力量的影響,以及我們對(duì)它們作出的反應(yīng),塑造了我們大部分的生命之路。!
(二)直覺常常是不可靠的,邏輯始終是無疑的
我們來看這樣一個(gè)問題:連續(xù)拋擲一枚質(zhì)地均勻的硬幣6次,出現(xiàn)下面哪一種情形的概率比較大?“反反反反反反”“正反反正反正”。我相信,很多人的直覺告訴他們,每次都出現(xiàn)反面的機(jī)會(huì)太小了,而出現(xiàn)“正反反正反正”的機(jī)會(huì)要大一些——尤其是后者出現(xiàn)正面、反面的次數(shù)恰好各占一半。實(shí)際上呢?邏輯告訴我們,出現(xiàn)兩種情形的概率都是",也就是機(jī)會(huì)相等。
上述問題告訴我們,直覺(經(jīng)驗(yàn))常常與邏輯沖突,尤其是在認(rèn)識(shí)隨機(jī)時(shí)。正如英國數(shù)學(xué)家Kapadia指出的那樣:“在概率論中,無論是概念還是比較簡單的應(yīng)用,到處都有令人困惑不已和違背直覺的說法。”"
邏輯始終是無疑的,而直覺(經(jīng)驗(yàn))常常并不可信,這是一條顛撲不破的永恒真理。因此,必須用邏輯來認(rèn)識(shí)隨機(jī),只有這樣,才能使我們更好地糾正直覺(經(jīng)驗(yàn)),更理性地把握隨機(jī)。正如作者在這本書前言中所述:
人類的直覺不適合處理涉及不確定性的情勢,這一事實(shí)遲至20世紀(jì)30年代就已為人所知。當(dāng)時(shí),研究者發(fā)現(xiàn),人們既不能構(gòu)造一個(gè)通過隨機(jī)性檢驗(yàn)的數(shù)列,也不能可靠地分辨某個(gè)給定數(shù)列是否是隨機(jī)的產(chǎn)物。一個(gè)新的學(xué)術(shù)領(lǐng)域在過去幾十年里逐漸浮出水面。這個(gè)領(lǐng)域研究的是,當(dāng)信息不冗整或不冗美時(shí),人們?nèi)绾芜M(jìn)行判斷與決策。研究證明,一旦偶然性牽涉其中,人們的思維處理通常就會(huì)表現(xiàn)出嚴(yán)重的缺陷。這些研究工作綜合了許多學(xué)科,如數(shù)學(xué)與傳統(tǒng)科學(xué),乃至認(rèn)知心理學(xué)、行為經(jīng)濟(jì)學(xué)以及現(xiàn)代神經(jīng)科學(xué)。?
拖著人類的直覺破浪前行,是一件困難的事。人類大腦本來的設(shè)計(jì),就是要給每一事件找出確定的理由,因此它難以接受無關(guān)或隨機(jī)因素造成的影響。要克服這一困難,我們首先就要認(rèn)識(shí)到,成敗有時(shí)并非來自過人的能力或無能,而是來自如經(jīng)濟(jì)學(xué)家阿爾欽所說的“幸運(yùn)的環(huán)境”。隨機(jī)過程就本性而言非常普通,在日常生活中也無所不在,但大多數(shù)人并不了解它,或者很少想到它。④
回憶我們學(xué)習(xí)隨機(jī)、經(jīng)歷隨機(jī)的過程,相信很多人都有過這樣的體會(huì):直覺的隨機(jī)并不是真正的隨機(jī),只有理性化,付諸邏輯,才能真正認(rèn)識(shí)隨機(jī);讓理性的隨機(jī)戰(zhàn)勝本能的認(rèn)識(shí)并不容易,要將錯(cuò)誤的原始直觀轉(zhuǎn)化科學(xué)的二階直觀',這是一個(gè)長期的過程。
(三)通過生動(dòng)的故事,領(lǐng)悟概率論的核心概念、基本思想
數(shù)學(xué)來源于生活,又應(yīng)用于生活,概率論尤其如此。生活(現(xiàn)實(shí))就是一個(gè)個(gè)故事,因此,科普作者(數(shù)學(xué)教師也是如此)要用通俗、生動(dòng)的語言講好關(guān)于數(shù)學(xué)來源與應(yīng)用的生活故事,使原本冰冷的形式表達(dá)、枯燥的符號(hào)運(yùn)算變?yōu)橐巳藙俚幕馃崴伎?,讓讀者(學(xué)生)沉浸其中,感悟本質(zhì)規(guī)律,體會(huì)思想方法。
講好故事是本事,會(huì)講故事的人是真正的“使人明白的明白之人”:要想讓讀者(學(xué)生)明白,首先必須自己明白;只有把讀者(學(xué)生)講明白了,才說明自己真正明白了。很多讀者(學(xué)生)之所以不明白,在很大程度上,可能是作者(教師)自己沒有真正明白,沒有講好屬于讀者(學(xué)生)也屬于自己的故事。
這本書中,關(guān)于概率論(隨機(jī)性)的生動(dòng)故事比比皆是,包括作者對(duì)自己家庭生活跌若起伏的描述。這里僅舉兩例。
一是“數(shù)學(xué)期望的故事”
20世紀(jì)60年代中期,一名90多歲高齡的法國婦女讓娜·卡爾梅,因急需生活費(fèi)而跟一個(gè)47歲的律師做了筆交易:她將自己的公寓低價(jià)賣給律師,律師則按月給她提供生活費(fèi),直到她過世。等到了那一天,她橫著出去,律師豎著進(jìn)來。律師肯定知道卡爾梅女士的壽命已超出法國人期望壽命達(dá)10年之多。不過,看來他大概并不了解貝葉斯定理,所以也不知道他所了解的這位女士在超過預(yù)期壽命的10年中去世的概率其實(shí)跟這筆買賣沒啥關(guān)系,而真正跟買賣有關(guān)的,是在這位女士已經(jīng)活到90歲的前提下,她的期望壽命大概還有6年。不過即便如此,律師也覺得這筆買賣不必?fù)?dān)心會(huì)虧本。因?yàn)樗嘈?,不管是哪個(gè)女人,如果她十來歲時(shí)就已經(jīng)在父親的店中遇見過文森特.凡高,那么他完全有理由相信,她跟凡高的再次會(huì)面一定用不了多長時(shí)間。
(據(jù)說該女士認(rèn)為我們的大藝術(shù)家“邋里邋遢,穿衣沒品,惹人討厭”。)
果不其然,在10年后,律師不得不另找一處住所棲身,而讓娜則用自己良好的健康狀況慶祝了她的第100個(gè)生日。盡管這時(shí)她的期望壽命只有差不多2年,但靠著律師的奉養(yǎng),她又度過了110歲的生日,而律師已經(jīng)67歲了。再過10年,律師漫長的等待終于到了頭,卻是他沒有猜中的結(jié)局。1995年,律師去世了,讓娜還活著。她自己的那一日最終于1997年8月4日到來了,這時(shí)她已是122歲高齡,比律師的壽命多了整整45個(gè)年頭。①
這個(gè)故事曲折動(dòng)人,生動(dòng)形象地說明了單個(gè)個(gè)體的期望壽命以及命運(yùn)是無法被預(yù)計(jì)的。只有從大群體采集數(shù)據(jù),并在大規(guī)模數(shù)據(jù)上進(jìn)行總體分析,具有規(guī)律性的模型才會(huì)浮現(xiàn)出來。
二是“正態(tài)分布的故事”
正態(tài)分布描述了許多系統(tǒng)中,系統(tǒng)的表現(xiàn)圍繞某中心值發(fā)生改變的行為方式,這個(gè)中心值就代表了系統(tǒng)最可能的輸出值。在《概率的哲學(xué)導(dǎo)論》一書中,拉普拉斯聲稱,這個(gè)新的數(shù)學(xué)分支能用于評(píng)判法庭證言、預(yù)測結(jié)婚率、計(jì)算保險(xiǎn)費(fèi)等問題。
(拉普拉斯構(gòu)想的繼承和發(fā)揚(yáng)者)凱特勒回到布魯塞爾后,開始搜集和分析人口統(tǒng)計(jì)數(shù)據(jù),并很快將注意力集中在法國政府于1827年開始發(fā)布的犯罪活動(dòng)記錄上……他不僅觀察了數(shù)據(jù)的平均值,還仔細(xì)研究了它們與平均值之間的偏離情況。不管研究對(duì)象是什么樣的,凱特勒都遇到了正態(tài)分布……他還發(fā)現(xiàn)一種現(xiàn)象,那就是一組數(shù)據(jù)的分布與正態(tài)分布之間的偏離,本身可能意味著一些不為人知的信息。在10萬名年輕法國人的身高數(shù)據(jù)中,當(dāng)把準(zhǔn)備應(yīng)征入伍的士兵的數(shù)量與他們的身高進(jìn)行對(duì)比時(shí),所得的鐘形曲線是扭曲的:身高剛剛超過5英尺2英寸的人數(shù)比鐘形曲線所預(yù)測的數(shù)量要少很多,而恰好小于這個(gè)身高的人數(shù)又太多了,就好像后者的出現(xiàn)是為了補(bǔ)償前者的不足。凱特勒論述道,這多出來的約2200個(gè)“矮子”的差異,應(yīng)該是造假或善意的捏造造成的,因?yàn)樯砀卟坏?英尺2英寸的人可以免服兵役。
幾十年后,偉大的法國數(shù)學(xué)家亨利·龐加萊,用凱特勒的方法逮到一個(gè)欺騙顧客的面包師。龐加萊每天都要買一條面包,買回來后,他會(huì)給面包稱一下重量,結(jié)果發(fā)現(xiàn)這些面包的平均重量大約為950克,而非廣告中所稱的1000克。他向管理部門投訴了此事。之后,他買到的面包變大了些??伤€是覺得有什么地方不太對(duì)勁。憑著只有著名學(xué)者或至少是獲得了終身教職的人才有的耐心,他在接下來的一年中,每天都仔細(xì)地稱量面包。盡管這些面包現(xiàn)在的平均重量十分接近1000克,但如果這個(gè)面包師的確是老老實(shí)實(shí)地隨機(jī)挑出一條面包賣給他,那么比這個(gè)平均重量更重些或更輕些的面包,其數(shù)量應(yīng)按誤差定律的鐘形曲線逐漸減少??升嫾尤R發(fā)現(xiàn),他的面包里偏輕的比例太少,而偏重的相應(yīng)過多。龐加萊由此得出結(jié)論,那個(gè)面包師其實(shí)并沒有停止制作缺斤少兩的面包,只不過總是拿手頭最大的一條面包打發(fā)他罷了。警察再次造訪了騙人的面包師,據(jù)報(bào)道所言,他表現(xiàn)出可想而知的震驚,并不出所料地同意改正自己的行為。!
這些以數(shù)學(xué)史為脈絡(luò)呈現(xiàn)的數(shù)學(xué)家故事不僅生動(dòng)有趣,而且充分展現(xiàn)了正態(tài)分布是如何被發(fā)現(xiàn)的以及有什么用。
生動(dòng)的故事使概率論的核心概念與規(guī)律、基本思想與方法的發(fā)生和發(fā)展脈絡(luò)成為豐富實(shí)踐(案例)大海、天空中的魚兒、鳥兒,任意遨游、自由飛翔。我們不妨簡單羅列一下故事支撐和串聯(lián)起來的有關(guān)知識(shí)和歷史!古典概型,事件的獨(dú)立性,概率的加法與乘法;卡爾達(dá)諾,《機(jī)遇博弈》,樣本空間,“三門問題”費(fèi)馬、帕斯卡,計(jì)數(shù)方法、數(shù)學(xué)期望;本福特定律,惠更斯、伯努利,大數(shù)定律與小數(shù)定律;事件的相關(guān)性,條件概率,假陽性、假陰性,先驗(yàn)概率、后驗(yàn)概率,貝葉斯公式;棣莫佛、拉普拉斯、高斯,二項(xiàng)分布,正態(tài)分布,中心極限定理;各朗特,威廉·配第,凱特勒,高爾頓,皮爾遜;統(tǒng)計(jì),相關(guān),回歸,檢驗(yàn);費(fèi)歇爾,顯著性檢驗(yàn)……
這些概率與統(tǒng)計(jì)的主要知識(shí)內(nèi)容反映的主要思想方法是從卡爾達(dá)諾以來幾百年人類智力活動(dòng)的結(jié)晶。每個(gè)知識(shí)背后都是人類豐富的實(shí)踐,都有講不完的故事。學(xué)習(xí)這些知識(shí)的我們是幸運(yùn)的,可以在一年甚至更短的時(shí)間跨越前人百年的艱苦探索。
讀完這本書,你會(huì)發(fā)現(xiàn)作者的多面:故事大王,深厚的歷史文化知識(shí),幽默、詼諧且有時(shí)帶點(diǎn)戲譫、調(diào)侃的語言表達(dá),敏銳的觀察,豐富的想象……以及極其理性的智者。當(dāng)然,作為讀者,感受隨機(jī)與生活的關(guān)系,認(rèn)識(shí)(理解)隨機(jī)永遠(yuǎn)是第一位的。唯此,才能把握生活。毫無疑問,生活中有很多我們想控制但無法控制的事情,有些事情的發(fā)生是必然的,而有些是隨機(jī)的。隨機(jī)如影隨形,雖然不確定,但是可以認(rèn)識(shí)。在這個(gè)意義上,隨機(jī)不是生活的主宰。相反,如果我們不能科學(xué)、準(zhǔn)確、全面、客觀地認(rèn)識(shí)隨機(jī),隨機(jī)真的就會(huì)主宰我們,使我們無法控制自己。就像高爾頓板上的一個(gè)個(gè)小球,盡管整體上小球的結(jié)局具有規(guī)律性,但是每個(gè)小球只能隨著一次次撞擊隨機(jī)游走。我想,這可能就是作者給這本書起的副標(biāo)題的“意有所指”之處:認(rèn)識(shí)隨機(jī),不被它主宰。
需要指出的是,全面概括這本書,闡述閱讀感悟,極其困難,幾乎是不可能完成的任務(wù),因?yàn)檫@本書字字珠璣、句句真經(jīng),完全表其主旨,只能全書照搬。真誠地希望無論是教師,還是大眾,特別是高中及以上的學(xué)生,都來讀讀它。你肯定受益終生!
三、對(duì)概率與統(tǒng)計(jì)教學(xué)的啟示
概率與統(tǒng)計(jì)都是研究隨機(jī)的科學(xué),概率研究隨機(jī)現(xiàn)象,統(tǒng)計(jì)研究隨機(jī)數(shù)據(jù)。兩者之間有明顯的不同:一般來說,概率是在總體概率分布已知的情況下,研究總體中樣本的概率分布;而統(tǒng)計(jì)是在總體未知的情況下,通過抽樣獲得樣本數(shù)據(jù)來估計(jì)總體中的參數(shù)或總體的概率分布。兩者之間又有緊密的聯(lián)系:概率理論的建立需要大量的統(tǒng)計(jì)事實(shí),而用樣本估計(jì)總體的統(tǒng)計(jì)方法需要在一定的概率意義指導(dǎo)下才能行之有效。從這個(gè)意義上說,概率與統(tǒng)計(jì)是不折不扣的“一枚硬幣的正反面”——互相依存才能成為一個(gè)整體。
目前,統(tǒng)計(jì)與概率已成為基礎(chǔ)教育階段數(shù)學(xué)學(xué)科中同數(shù)與代數(shù)、圖形與幾何等并駕齊驅(qū)的主要內(nèi)容。學(xué)生學(xué)習(xí)這部分具體知識(shí)并不困難,但要理解其思想方法,運(yùn)用思想方法描述、解釋自然界、人類社會(huì)的現(xiàn)象,并不容易?,F(xiàn)實(shí)生活中,我們常常忽視隨機(jī)的作用。這樣的例子比比皆是。比如,運(yùn)動(dòng)員在一次比賽中取得超出平時(shí)的好成績,是平時(shí)很少出現(xiàn)的結(jié)果在一次隨機(jī)試驗(yàn)中發(fā)生了,而不是什么諸如神啟、超人能力等因素的作用。同樣,平時(shí)成績很好、基礎(chǔ)非常扎實(shí)的一位學(xué)生在一次考試中成績不如意,但下次考試完全可能是另外一個(gè)結(jié)果,因?yàn)榭荚囀菍?duì)學(xué)生能力的一種測量,這種測量因?yàn)樵囶}的不同、學(xué)生的發(fā)揮等隨機(jī)因素產(chǎn)生不同的結(jié)果,而不是個(gè)人能力出了什么問題。
概率與統(tǒng)計(jì)研究的邏輯是定量化,工具是數(shù)學(xué)知識(shí),通過運(yùn)算、推理等獲得結(jié)論。它處理的是生活中大量的實(shí)際問題(解釋、預(yù)測現(xiàn)實(shí)情況,幫助人們作出決斷),包羅萬象,是一門不折不扣的“綜合與實(shí)踐”學(xué)科。因此,概率與統(tǒng)計(jì)的教學(xué),除了利用教材中的標(biāo)準(zhǔn)例子幫助學(xué)生理解概念、鞏固知識(shí)之外,還要讓學(xué)生更多地接觸自然界甚至人類社會(huì)中的大量案例,從隨機(jī)性的角度,用數(shù)學(xué)的方式觀察、思考、表達(dá)。基于教材,教師閱讀此書,可以把其中的案例,特別是由案例體現(xiàn)的深刻的概念本質(zhì)、思想方法,通過教學(xué)滲透給學(xué)生;學(xué)生閱讀本書,可以開闊視野,加深對(duì)教材中知識(shí)內(nèi)容的理解。
下面通過一些具體問題,說明概率與統(tǒng)計(jì)(主要是概率)教學(xué)中特別需要注意的概念本質(zhì)、思想方法。
第一,關(guān)于平均數(shù)。計(jì)算平均數(shù),無論算術(shù)平均數(shù)、幾何平均數(shù),還是加權(quán)平均數(shù)、調(diào)和平均數(shù)等,都不難。但是理解平均數(shù)的意義,需要經(jīng)歷較長的過程。
以算術(shù)平均數(shù)為例來說明。從運(yùn)算的角度看,算術(shù)平均數(shù)就是數(shù)據(jù)求和除以數(shù)據(jù)的個(gè)數(shù),學(xué)生在小學(xué)階段就會(huì)計(jì)算,但是解釋它的意義并不容易。很多人肯定會(huì)說,平均數(shù)是一組數(shù)的代表,表示數(shù)據(jù)的集中趨勢。但進(jìn)一步問:數(shù)據(jù)集中趨勢的意義是什么?很多人可能答不上來。這需要一定的功底和深人的思考。我的理解是,要從代數(shù)、概率、統(tǒng)計(jì)三個(gè)角度認(rèn)識(shí)它。代數(shù)角度:任何一個(gè)數(shù)據(jù)與平均數(shù)作差,所有差的代數(shù)和為0,這是它的代數(shù)意義。概率角度:一般來說,如果數(shù)據(jù)符合或近似符合正態(tài)分布,數(shù)據(jù)在平均數(shù)附近的可能性最大,這是它的概率意義。統(tǒng)計(jì)角度:數(shù)據(jù)與平均數(shù)的差的平方和最小,也就是平均數(shù)是由最小二乘法得到的;方差也是某種平均數(shù),表示的是數(shù)據(jù)與平均數(shù)的“平均距離”。
第二,關(guān)于最大可能性與用頻率估計(jì)概率。概率是隨機(jī)事件固有的屬性,無論是否能夠求出,它的真值都是客觀存在的。而且,在概率的意義下,任何事情的發(fā)生都是基于最大可能的。這是最基本的認(rèn)識(shí),是直觀(經(jīng)驗(yàn)'是基本事實(shí),沒法證明。例如,拋擲硬幣100次,正面朝上出現(xiàn)0—100次都有可能。
已知或假定每次拋擲正面朝上的概率之后,100次拋擲正面朝上的次數(shù)及其概率可以用二項(xiàng)分布嚴(yán)格刻畫。當(dāng)拋擲次數(shù)越來越多,如1000次、10000次……時(shí),二項(xiàng)分布逐漸趨近于正態(tài)分布。而且,直觀(經(jīng)驗(yàn))告訴我們,每次拋擲正面朝上的概率是0,100次拋擲正面朝上的次數(shù)是50的可能性最大。
雖然概率是隨機(jī)事件的固有屬性,但是在很多(尤其是比較復(fù)雜的)情況下,我們無法通過數(shù)學(xué)模型推理、計(jì)算出其發(fā)生的概率。這時(shí),根據(jù)概率的最大可能性意義,我們可以用頻率估計(jì)概率。下面我們從一般性的角度看這個(gè)問題。在一次隨機(jī)試驗(yàn)中,隨機(jī)事件A發(fā)生的概率為p,那么在n次獨(dú)立重復(fù)試驗(yàn)中,隨機(jī)事件A出現(xiàn)&次(0<々 同樣地,在簡單隨機(jī)抽樣中,我們常常講樣本的代表性,也就是每個(gè)個(gè)體等可能地被抽到。只有等可能地被抽到,才能保證樣本的數(shù)據(jù)分布與總體分布相似的可能性最大。注意,此處說的是可能性。實(shí)際上,有抽到極端數(shù)據(jù)的可能性,也就是樣本不具有代表性的可能性。 第三,關(guān)于大數(shù)定律與用頻率估計(jì)概率。與概率的真值相比,用頻率估計(jì)的概率有多接近呢?我們對(duì)這樣估計(jì)得到的概率的正確性,又應(yīng)該抱有多強(qiáng)的信念呢?這實(shí)際上是與之緊密相關(guān)的另外一個(gè)問題:我們的觀測結(jié)果能以多高的準(zhǔn)確度來體現(xiàn)造成這些結(jié)果的概率的真值呢?雅各布·伯努利認(rèn)為,我們有理由期望,隨著試驗(yàn)次數(shù)的增加,實(shí)際觀測到的各種結(jié)果出現(xiàn)的頻率,能越來越精確地體現(xiàn)概率的真值。那么,要通過觀測結(jié)果估計(jì)概率,我們至少需要做多少次實(shí)驗(yàn)?我們對(duì)這樣得到的結(jié)果的正確性,又抱有多大的把握呢?舉一個(gè)簡單的例子: 袋子里有100個(gè)除顏色外其他都相同的小球,其中白球60個(gè),黑球40個(gè)。有放回地抽取100次。 (1)抽到58%—62%的白球機(jī)會(huì)有多大?59%—61%呢? (2)如果是1000個(gè)或100萬個(gè)小球,那么對(duì)結(jié)果的信任又能增加多少? 我們當(dāng)然永遠(yuǎn)沒辦法100%確信這樣做得到的結(jié)果,但是我們能否足夠多次地抽取小球,從而有99.9999%的把握,保證抽到白色小球的比例在59.9%—60.1%之間?大數(shù)定律就是用來解決諸如此類的問題的。 在應(yīng)用大數(shù)定律之前,我們需要做兩個(gè)假設(shè)。首先,給定一個(gè)可容忍的誤差范圍。大量試驗(yàn)的結(jié)果與理論上的60%這一比例應(yīng)該有多接近呢?我們必須指定一個(gè)接近的范圍,比如60%±1%或2%或0.00001%。其次,必須明確對(duì)不確定性的容忍度。我們永遠(yuǎn)無法100%確定試驗(yàn)會(huì)給出我們想要的結(jié)果,但是我們有把握做到,比如在100次試驗(yàn)中獲得99次滿意的結(jié)果,或者在1000次試驗(yàn)中有999次結(jié)果是滿意的。 大數(shù)定律指出,我們總能夠通過足夠多次地取出小球,保證幾乎確定所得的白色小球比例接近60%,而不論“幾乎確定”和“接近”的定義是何等嚴(yán)苛。而且,在給定了這個(gè)“幾乎確定”和“接近”的具體數(shù)值后,大數(shù)定律還能給出用來計(jì)算這個(gè)“足夠”次數(shù)的數(shù)學(xué)公式。當(dāng)然,盡管大數(shù)定律能給出一個(gè)足以滿足任何要求的置信度與準(zhǔn)確度的試驗(yàn)次數(shù),但這并不意味著不能通過更少的試驗(yàn)來達(dá)到同樣的目標(biāo)。 無論高中還是初中,教學(xué)“用頻率估計(jì)概率”的內(nèi)容時(shí),教師都應(yīng)引出上面這些問題,講清楚上面的問題,哪怕不是完全的形式化、嚴(yán)密的推理,只是講述其中的道理,從而讓學(xué)生真正明白頻率與概率之間這種隨機(jī)、確定的關(guān)系。這個(gè)問題清楚了,概率與統(tǒng)計(jì)最基本的思想方法就豁然開朗了。 第四,關(guān)于因果關(guān)系與相關(guān)關(guān)系。我們知道,因果關(guān)系是一類重要的關(guān)系,主要表現(xiàn)就是邏輯推理,邏輯推理是構(gòu)建科學(xué)大廈的基礎(chǔ)。但是,對(duì)因果關(guān)系中因與果的認(rèn)識(shí),有時(shí)存在認(rèn)知顛倒,即分不清什么是因、什么是果,而且不以為然。這不是危言聳聽。比如,蒙洛迪諾做過幾年好萊塢編劇,那么他是因?yàn)樽鲞^好萊塢編劇,才會(huì)講關(guān)于隨機(jī)性的生動(dòng)故事呢,還是因?yàn)闀?huì)講故事,才被好萊塢看中做編劇呢?再如,招聘單位招聘人員時(shí)非常重視學(xué)生的教育背景,看到學(xué)生是“北清”畢業(yè),常常認(rèn)為他們非常優(yōu)秀,但是實(shí)際上,真正的原因是他們非常優(yōu)秀,才能進(jìn)人“北清”。 同樣地,生活中常常把檢查結(jié)果為陽性從而判斷患病的概率與患病后檢查結(jié)果為陽性的概率混為一談。這不僅出現(xiàn)在普通民眾中,有時(shí)也出現(xiàn)在一些專業(yè)人士中。其實(shí),檢查結(jié)果為陽性從而判斷患病的概率,通常遠(yuǎn)遠(yuǎn)小于患病后檢查結(jié)果為陽性的概率。例如,大量資料表明,群體中患某種疾病的概率是一個(gè)確定的值,而體檢結(jié)果的準(zhǔn)確率為90%,也就是說100個(gè)正常人中通常會(huì)查出10個(gè)陽性(假陽性'100個(gè)患病者中通常會(huì)查出10個(gè)陰性(假陰性'如果群體中患這種疾病的概率較小,那么由貝葉斯公式,或者通過簡單的頻率計(jì)算,容易得出,在體檢結(jié)果為陽性的前提下,患這種疾病的概率其實(shí)很小。這種對(duì)相關(guān)性的錯(cuò)誤認(rèn)識(shí)常常與對(duì)因果關(guān)系的錯(cuò)誤認(rèn)識(shí)有關(guān)。 第五,關(guān)于條件概率與全概率公式。在概率的問題中,我們還經(jīng)常遇到有放回抽樣與不放回抽樣。有放回抽樣相對(duì)簡單,理解通常不會(huì)有問題。而不放回抽樣理解起來并不容易。比如下面這個(gè)問題! 3張撲克牌中有1張中獎(jiǎng)牌,甲、乙、丙三人不放回地依次抽取,求甲、乙、丙三人中獎(jiǎng)的概率各是多少。 很多人直覺上認(rèn)為,先抽的人中獎(jiǎng)的可能性大,最后抽的人中獎(jiǎng)的可能性小。實(shí)際上,無論運(yùn)用古典概率模型,還是以條件概率為基礎(chǔ)的全概率公式,理性邏輯告訴我們,甲、乙、丙三人中獎(jiǎng)的概率相等,都是1。我們?cè)敿?xì)地分析一下: 古典概率模型的角度。假設(shè)3張撲克牌為A、B、C,它們的排列方式共有6種,即ABC、ACB、BAC、BCA、CAB、CBA。可見,3張牌在第1、2、3個(gè)位置都有2種可能,在所有的6種可能中都占1。所以,甲、乙、丙三人不論按什么順序,不放回地依次抽取,抽中任何一張牌的可能性都是1,自然抽中中獎(jiǎng)牌的概率也是1。 全概率公式的角度。甲抽中中獎(jiǎng)牌的概率是3。乙抽牌的情形有兩種:一種是甲中獎(jiǎng)的前提,另一種是甲沒有中獎(jiǎng)的前提。因此,乙中獎(jiǎng)的概率是上述兩種情形的概率和! 一個(gè)是0;另一個(gè)是甲沒有中獎(jiǎng)的概率3乘乙中獎(jiǎng)的概率1,即3。同樣地,丙只有在甲、乙都沒有中獎(jiǎng)的情況下才能中獎(jiǎng),因此,丙中獎(jiǎng)的概率是音x1x1=1。 類似的問題還有很多(如經(jīng)典的“三門問題”)。這類問題充分說明,直覺可以幫助我們發(fā)現(xiàn)問題、提出問題,但真正分析問題、解決問題還需要邏輯的強(qiáng)大力量。在某種程度上,直覺與邏輯也可以看作一枚硬幣的兩面,相依為伴,共同戰(zhàn)斗,幫助人類更好地認(rèn)識(shí)(理解)世界,把握世界。 (張勁松,人民教育出版社課程教材研究所,編審。)