[摘要]文章以一個典例的解答所產(chǎn)生的疑惑為起點,對二項分布與超幾何分布的區(qū)別與聯(lián)系進行深入剖析,并給出較為詳盡的解釋,對教師的教學起到積極的促進作用,最后簡單闡述了概率統(tǒng)計中總體分布教學的若干思考,
[關鍵詞]二項分布;超幾何分布;總體分布;釋疑
1呈現(xiàn)題目并闡述疑問的由來
題目為了解甲、乙兩廠的產(chǎn)品質量,抽檢人員采用分層抽樣的方法從甲、乙兩廠生產(chǎn)的產(chǎn)品中分別抽取14件和5件,測量產(chǎn)品中微量元素x,y的含量(單位:毫克),當產(chǎn)品中的微量元素含量滿足x≥175且y≥75時,該產(chǎn)品為優(yōu)等品,下表是乙廠的
5件產(chǎn)品的測量數(shù)據(jù):
(1)已知甲廠生產(chǎn)的產(chǎn)品共98件,求乙廠生產(chǎn)的產(chǎn)品數(shù)量:
(2)用上述樣本數(shù)據(jù)估計乙廠生產(chǎn)的優(yōu)等品的數(shù)量:
(3)從乙廠抽出的上述5件產(chǎn)品中再隨機抽取2件,求抽取的2件產(chǎn)品中優(yōu)等品數(shù)x的分布列與數(shù)學期望。
分析這道題目的前兩問是容易得到的,本文僅探討第(3)問,下面給出學生解決問題的過程中常見的兩種解答。
解法1由題意可知,抽取的5件產(chǎn)品中有2件優(yōu)等品,則x的可能取值為0.1.2。
產(chǎn)生上述兩種解法的原因是好多學生混淆了超幾何分布與二項分布,但是學生們還有一個疑惑:為什么兩種做法所得到的數(shù)學期望是一樣的?好多一線教師對此也不甚了解,這難道是巧合嗎?
我們不妨設產(chǎn)品中優(yōu)等品的件數(shù)為m,不是優(yōu)等品的件數(shù)為n,則在不放回和有放回的情況下,隨機變量x的分布列為
從上述定義中我們可以清楚地看到二者的本質區(qū)別:首先,超幾何分布描述的是不放回抽樣的問題,而二項分布描述的是有放回抽樣的問題:其次,超幾何分布中的概率計算實質上是古典概型問題,而二項分布實質上是相互獨立事件的概率計算問題。
基于上述本質區(qū)別,結合篇首題目的情境,我們容易知道解法一是正確的,在教學過程中,教師可以利用教材中的例題及習題引導學生進行深入探究,以便于他們更好地理解和區(qū)分這兩種分布,我們可以以人教A版教材59頁的習題為例作進一步的探討。
典例某批N件產(chǎn)品的次品率為2%,現(xiàn)從中任意地依次抽取3件進行檢驗,試問:當Ⅳ=500.5000.50000時,分別以放回和不放回的方式抽取,求恰好抽到1件次品的概率各是多少?
解析任意抽取3件產(chǎn)品,次品的件數(shù)記為隨機變量x
通過上述問題所得結果我們可以看到,當產(chǎn)品的數(shù)量N很大時,通過不放回抽樣所得結果與有放回抽樣所得結果非常接近(隨著Ⅳ的增大,近似的精度也在增大),可以認為超幾何分布近似為二項分布,這也與我們的主觀感受相符,因為當產(chǎn)品的總數(shù)很大而抽出的產(chǎn)品較少時,每次不放回的抽取1件產(chǎn)品后,次品率近似不變,這樣就可以近似看成每次抽樣的結果是相互獨立的,抽出產(chǎn)品中的次品件數(shù)近似服從二項分布,這也可以看作是兩種分布之問的內在聯(lián)系。
3概率統(tǒng)計中總體分布教學的若干思考
總體分布教學中的難點之一就是如何辨認合適的模型,所謂分布,它描述的是隨機變量的可能取值以及取相應值的概率,現(xiàn)行高中教材中共給出四種分布,其中兩點分布、超幾何分布和二項分布均屬于離散型隨機變量服從的分布,它們所對應的模型中都與兩種可能結果有關(如擲硬幣的“正面”與“反面”,抽取產(chǎn)品的“次品”與“正品”等),因此學生對上述模型認識模糊的話,就會混淆分布類型,教學過程中可以給出具體的情境以便于分清各分布之間的區(qū)別與聯(lián)系,這樣會更好地幫助學生做出正確的選擇,比如,我們在前面借助典例中提供的情境闡述超幾何分布與二項分布的根本區(qū)別是抽樣的過程中是否有放回,二者的聯(lián)系是如果產(chǎn)品數(shù)量很大,超幾何分布近似為二項分布,如果一共就取1件,那么結果不是“正品”就是“次品”,這時二者就是兩點分布了,同時,超幾何分布的概率計算涉及三個參數(shù)和三次的組合運算,而二項分布的概率計算僅含兩個參數(shù)和一次的組合數(shù)計算,所以在計算機技術尚未發(fā)展時,利用這兩種分布的近似關系可以大大簡化運算量,教學過程中要跟學生說清楚這么做的原因,說理充分才會使他們信服。
實際教學中,鑒于學生的認知水平,教師可以免去形式化的推導,適時借助信息技術讓學生有更為直觀的感受,比如,借助GeoGebra數(shù)學軟件通過改變產(chǎn)品總數(shù)N和次品個數(shù)等參數(shù)的數(shù)值就可以方便快捷地讓學生感受到超幾何分布與二項分布之間的近似,又如,正態(tài)分布屬于連續(xù)型隨機變量服從的分布,學生在理解上難度很大,教學過程中可以運用GeoGebra軟件讓學生感受它與熟悉的二項分布之間的聯(lián)系,使得正態(tài)分布的引入不是很唐突,并可以組織學生在課外利用軟件粗略地驗證結論(圖1):“當n很大(通常n>50),p不是太小,np>5.且n(1-p)>5時,可以用正態(tài)分布N(np,np(1-p))近似二項分布B(n,p)?!?/p>
概率統(tǒng)計學家Kapadia和Borovcnik曾經(jīng)說過:“概率是一個難教又難學的內容,…,在概率統(tǒng)計中,無論是其非常核心的部分,還是它的概念及其比較簡單的應用,到處都有似是而非和違背直覺的說法,”正因為如此,在高中階段的教學過程中,教師需要不斷地挖掘合適的情境來講解相關內容,讓學生真實地感受和合理地應用概率統(tǒng)計知識,真正做到以培養(yǎng)學生的數(shù)學素養(yǎng)為目的,為學生今后的可持續(xù)發(fā)展奠定良好的基礎。
作者簡介王洪軍(1983),男,山東省德州市人,中教一級,呼和浩特市名師工作室成員,呼和浩特市教研室數(shù)學中心組成員,高中新版教材核心編委(人教B版),獲全國、自治區(qū)、市教學基本功大賽獎項,參與國家級課題一項,省級課題兩項;主要從事中學數(shù)學教學研究,在《中學數(shù)學教學參考》《中學數(shù)學雜志》《中國數(shù)學教育》等期刊發(fā)表論文37篇,并有多篇論文獲國家級、省級一等獎。