許道云,秦永彬,劉長云
( 貴州大學(xué) 計算機科學(xué)與技術(shù)學(xué)院,貴州 貴陽 550025 )
學(xué)習(xí)《概率論與數(shù)理統(tǒng)計》應(yīng)該注意的若干問題(4)
——正態(tài)分布在抽樣分析中的地位
許道云,秦永彬,劉長云
( 貴州大學(xué) 計算機科學(xué)與技術(shù)學(xué)院,貴州 貴陽 550025 )
正態(tài)分布是隨機變量分布中基礎(chǔ)而且核心的分布。中心極限定理支持這樣的結(jié)果:通過統(tǒng)計的手段,對任一個隨機變量的分析和研究,可以借助于正態(tài)分布進行。在數(shù)理統(tǒng)計的抽樣分析中,由(標準)正態(tài)分布的統(tǒng)計量的適當組合,產(chǎn)生數(shù)理統(tǒng)計中的其他三大基礎(chǔ)分布。
正態(tài)分布; 中心極限定理; 三大基礎(chǔ)分布
為幫助工科學(xué)生理解《概率論與數(shù)理統(tǒng)計》中的一些基本而且重要的問題,并為教授這門課程的教師提供一些有用的參考,我們按照授課的內(nèi)容和順序,以系列文章的形式闡明本課程教學(xué)大綱要求內(nèi)容中的若干問題,以及這些問題在支撐整個教學(xué)內(nèi)容中的聯(lián)系和地位。
我們所選內(nèi)容限于《概率論與數(shù)理統(tǒng)計》(浙江大學(xué) 盛驟等編,高等教育出版社,第三版)的第一章至第八章,將以六篇系列教學(xué)研究文章完成我們對《概率論與數(shù)理統(tǒng)計》中若干問題和知識點的見解,其中不乏一些在相關(guān)參考文獻或教科書上沒有見到的新見解。教學(xué)實踐證明:這些見解對教與學(xué)是非常有效的。此系列文章的全部內(nèi)容都融進了我們的教學(xué)過程中,整理出來的目的是讓后續(xù)學(xué)生在學(xué)習(xí)時參考,其主要讀者對象是學(xué)生。
《概率論與數(shù)理論計》作為一門應(yīng)用數(shù)學(xué)課程,與其他數(shù)學(xué)課程一樣,有自身的一套“概念建立、性質(zhì)和定理提煉、計算公式、實際應(yīng)用”的體系。把握住其中關(guān)鍵概念的內(nèi)涵以及延伸的邏輯體系和方法,對于本課程的教與學(xué)至關(guān)重要。
通常,多數(shù)學(xué)生認為:由于《概率論與數(shù)理統(tǒng)計》研究的是隨機現(xiàn)象及其統(tǒng)計規(guī)律,所以該課程難學(xué)。實質(zhì)上,只要悟透其中每一部分的概念和計算公式的內(nèi)涵,就足夠完成大綱要求的學(xué)習(xí)內(nèi)容。從計算的角度而言,只需用到中學(xué)階段已經(jīng)學(xué)過的排列組合、以及大學(xué)一二年級學(xué)過的《高等數(shù)學(xué)》中的微積分計算。
我們將以一系列教學(xué)研究文章的形式,向?qū)W生進一步澄清《概率論與數(shù)理論計》中的一些基本概念的內(nèi)涵,幫助學(xué)生進一步悟透這些概念及相關(guān)的計算公式以及知識點之間的聯(lián)系,化難為易,使學(xué)生感受到:《概率論與數(shù)理論計》課程中要求的計算難度不會高于已經(jīng)學(xué)過的《高等數(shù)學(xué)》,消除學(xué)生對這門課程的“畏難”心態(tài),讓學(xué)生覺得這門課易學(xué),其計算難度沒有超過《高等數(shù)學(xué)》中的計算難度。同時,提高學(xué)生對這門課程的學(xué)習(xí)興趣,認識到它在以后實際工作中的作用。
該系列文章由如下六個部分構(gòu)成:
(1)概率概念的內(nèi)涵與分解計算;
(2)隨機變量與概率分布;
(3)隨機變量的數(shù)字特征和作用;
(4)正態(tài)分布在抽樣分析中的地位;
(5)三大分布在數(shù)理統(tǒng)計中的地位;
(6)極限性質(zhì)及其應(yīng)用。
本文為該系列教學(xué)研究文章之四,闡述正態(tài)分布在抽樣分析中的地位。正態(tài)分布是隨機變量分布中的基礎(chǔ)分布,中心極限定理支持“通過統(tǒng)計的手段,對任一個隨機變量的分析和研究,可以借助于正態(tài)分布進行”。在數(shù)理統(tǒng)計的抽樣分析中,由來自標準正態(tài)總體樣本的適當組合構(gòu)成的統(tǒng)計量,產(chǎn)生數(shù)理統(tǒng)計中的其他三大基礎(chǔ)分布(χ2(n),t( n),F( n, m)分布)。
性質(zhì)(5)在實際應(yīng)用中經(jīng)常會用到。如:100名學(xué)生參加《概率論與數(shù)理統(tǒng)計》考試,正常的結(jié)果是考試成績呈正態(tài)分布。粗略地說,指集中在及格以上某個分數(shù)段(如 60~79)的人數(shù)居多,而高分和低分兩端的人數(shù)較少。處理方法是將分數(shù)范圍(0~100)適當分為幾個分數(shù)段,然后統(tǒng)計各分數(shù)段人數(shù),折算出相應(yīng)比例。通常取分數(shù)段為:0~39,40~49,……,80~89,90~100,μ=70,5≤σ<10進行統(tǒng)計。
實際生活中很多現(xiàn)象表現(xiàn)為正態(tài)現(xiàn)象。如:一個人一生中的貢獻(或作為)與年齡(精力)密切相關(guān),主要集中在一個年齡段。
基于這樣的觀察,解釋了為什么數(shù)理統(tǒng)計中考慮(標準)正態(tài)分布的各種統(tǒng)計量下的分布。公式可改寫為:
正態(tài)分布、2χ分布、t-分布、F-分布為數(shù)理統(tǒng)計中的四大基礎(chǔ)分布。后三個分布均來自標準正態(tài)分布。
圖1 α?分位點
函數(shù)無對稱性,當n≥3時,密度函數(shù)的圖像如圖2所示。
圖2 2χ?分布密度函數(shù)
密度函數(shù)為:
函數(shù)無對稱性,密度函數(shù)的圖像為:
圖3 -分布的密度函數(shù)
從本質(zhì)上看,F(xiàn)分布仍然來源于標準正態(tài)分布。
χ2,t, F分布俗稱統(tǒng)計中的三大分布,從源頭上看,樣本均來自標準正態(tài)總體。
本文是我們有關(guān)《概率論與數(shù)理統(tǒng)計》系列教學(xué)研究文章的第四篇。主要強調(diào)正態(tài)分布在數(shù)理統(tǒng)計中的核心地位:中心極限定理支持任意分布總體抽樣的算術(shù)平均統(tǒng)計量近似服從正態(tài)分布;由標準正態(tài)總體樣本的適當組合構(gòu)成數(shù)理統(tǒng)計中的其他三大基礎(chǔ)分布(χ2,t, F分布)。所以,數(shù)理統(tǒng)計總是以正態(tài)總體作為研究對象展開。
[1] F. Chung, and L.Lu. Complex Graphs and Networks[M].Library of Cogress Cataloging-in-Publication Data,QA166.C484, 2006.
[2] 盛驟,謝式千,潘承毅.概率論與數(shù)理統(tǒng)計(第3版)[M].北京:高等教育出版社,2001.
[3] 盛驟,謝式千,潘承毅.概率論與數(shù)理統(tǒng)計——學(xué)習(xí)輔導(dǎo)與習(xí)題選解(第2、3版)[M].北京:高等教育出版社,2003.
[4] 謝婧,鈕鍵, 趙輝.概率論與數(shù)理統(tǒng)計——全程導(dǎo)學(xué)及習(xí)題全解(第3版)[M].北京:高等教育出版社,2006.
[5] M. Mitzenmacher, E. Upfal.概率與計算[M].史道濟,譯.北京:機械工業(yè)出版社,2007.
Several Issues on Studying Probability Theory and Mathematical Statistics (4) - The Status of Normal Distribution in Sampling Analysis
XU Dao-yun, QIN Yong-bin, LIU Chang-yun
( College of Computer Science and Technology, Guizhou University, Guiyang, Gouzhou 550025, China )
Normal distribution is base and core in random variable distribution. The central limit theorem supports that any random variable can be analyzed and researched by means of normal distribution via statistical method. In the sampling analysis of mathematical statistics, the appropriate combination of statistics of (standard)normal distribution produces the other three underlying distributions in mathematical statistics.
normal distribution;central limit theorem;three underlying distributions
(責(zé)任編輯 毛志)
O211 < class="emphasis_bold">文獻標識碼:A
A
1673-9639 (2011) 03-0112-05
2010-12-11
許道云(1959-),男,教授、南京大學(xué)博士,貴州大學(xué)計算機科學(xué)與技術(shù)學(xué)院院長,博士研究生指導(dǎo)教師。主要研究方向為計算復(fù)雜性、可計算分析。