許道云,秦永彬,劉長云
( 貴州大學(xué) 計算機科學(xué)與技術(shù)學(xué)院,貴州 貴陽 550025 )
學(xué)習(xí)《概率論與數(shù)理統(tǒng)計》應(yīng)該注意的若干問題(3)
——隨機變量的數(shù)字特征和作用
許道云,秦永彬,劉長云
( 貴州大學(xué) 計算機科學(xué)與技術(shù)學(xué)院,貴州 貴陽 550025 )
隨機變量形式上是定義在樣本空間上的一個實值函數(shù),與普通函數(shù)相類似,利用某些參數(shù)足以刻畫函數(shù)的內(nèi)在本質(zhì)特征。隨機變量數(shù)字特征的引入,其目的是想用某些特征參數(shù)刻畫隨機變量。數(shù)學(xué)期望是隨機變量數(shù)字特征參數(shù)的一個基礎(chǔ)的核心概念,常見的隨機變量數(shù)字特征形式上是隨機變量函數(shù)的數(shù)學(xué)期望。數(shù)學(xué)期望本質(zhì)上是加權(quán)平均計算,這為隨機變量數(shù)字特征的統(tǒng)計(近似)計算提供了計算模型。
數(shù)字特征; 計算; 作用
為幫助工科學(xué)生理解《概率論與數(shù)理統(tǒng)計》中的一些基本而且重要的問題,并為教授這門課程的教師提供一些有用的參考,我們按照授課的內(nèi)容和順序,以系列文章的形式闡明本課程教學(xué)大綱要求內(nèi)容中的若干問題,以及這些問題在支撐整個教學(xué)內(nèi)容中的聯(lián)系和地位。
我們所選內(nèi)容限于《概率論與數(shù)理統(tǒng)計》(浙江大學(xué) 盛驟等編, 高等教育出版社,第三版)的第一章至第八章,將以 6篇系列教學(xué)研究文章完成我們對《概率論與數(shù)理統(tǒng)計》中若干問題和知識點的見解,其中不乏一些在相關(guān)參考文獻(xiàn)或教科書上沒有見到的新見解。教學(xué)實踐證明:這些見解對教與學(xué)是非常有效的。此系列文章的全部內(nèi)容都融進(jìn)了我們的教學(xué)過程中,整理出來的目的是讓后續(xù)學(xué)生在學(xué)習(xí)時參考,其主要讀者對象是學(xué)生。
《概率論與數(shù)理論計》作為一門應(yīng)用數(shù)學(xué)課程,與其他數(shù)學(xué)課程一樣,有自身的一套“概念建立、性質(zhì)和定理提煉、計算公式、實際應(yīng)用”的體系。把握住其中關(guān)鍵概念的內(nèi)涵以及延伸的邏輯體系和方法,對于本課程的教與學(xué)至關(guān)重要。
通常,多數(shù)學(xué)生認(rèn)為:《概率論與數(shù)理統(tǒng)計》由于研究的是隨機現(xiàn)象及其統(tǒng)計規(guī)律,所以該課程難學(xué)。實質(zhì)上,只要悟透其中每一部分的概念和計算公式的內(nèi)涵。從計算的角度而言,只需用到中學(xué)階段已經(jīng)學(xué)過的排列組合、以及大學(xué)一二年級學(xué)過的《高等數(shù)學(xué)》中的微積分計算,就足夠完成大綱要求的學(xué)習(xí)內(nèi)容。
我們將以一系列教學(xué)研究文章的形式,向?qū)W生進(jìn)一步澄清《概率論與數(shù)理統(tǒng)計》中的一些基本概念的內(nèi)涵,幫助學(xué)生進(jìn)一步悟透這些概念和相關(guān)的計算公式以及知識點之間的聯(lián)系,化難為易,使學(xué)生感受到《概率論與數(shù)理統(tǒng)計》課程中要求的計算難度不會高于已經(jīng)學(xué)過的《高等數(shù)學(xué)》,消除學(xué)生對這門課程的“畏難”心態(tài),讓學(xué)生覺得這門課易學(xué),其計算難度沒有超過《高等數(shù)學(xué)》中的計算難度。同時,提高學(xué)生對這門課程的學(xué)習(xí)興趣,認(rèn)識到它在以后實際工作中的作用。
該系列文章由如下六個部分構(gòu)成:
(1)概率概念的內(nèi)涵與分解計算;
(2)隨機變量與概率分布;
(3)隨機變量的數(shù)字特征和作用;
(4)正態(tài)分布在抽樣分析中的地位;
(5)三大分布在數(shù)理統(tǒng)計中的地位;
(6)極限性質(zhì)及其應(yīng)用。
本文為該系列教學(xué)研究文章之三,闡述隨機變量以及隨機變量之間關(guān)系的特征表示。與一般事物一樣,抓住對象特征就能了解對象。
隨機變量形式上是定義在樣本空間上的一個實值函數(shù),與普通函數(shù)相類似,利用某些參數(shù)足以刻畫函數(shù)的內(nèi)在本質(zhì)特征。數(shù)學(xué)期望是隨機變量數(shù)字特征參數(shù)的一個基礎(chǔ)而核心的概念,常見的隨機變量數(shù)字特征形式上是隨機變量函數(shù)的數(shù)學(xué)期望。數(shù)學(xué)期望本質(zhì)上是加權(quán)平均計算,這為隨機變量數(shù)字特征的統(tǒng)計近似計算提供了計算模型。
隨機變量、分布、總體客觀上是對同一對象的不同表述,隨機變量數(shù)字特征參數(shù)決定了隨機變量。所以,數(shù)理統(tǒng)計中主要是對隨機變量數(shù)字特征參數(shù)計算估計進(jìn)行研究。
所謂特征:是想用少量的信息(近似地或完全地)表示一個大信息量對象。
比如:人的指紋特征是用少量的數(shù)據(jù)點去表現(xiàn)整個指紋圖像,只要滿足區(qū)分要求就足夠了;一條直線由無窮多個點構(gòu)成,然而從直線方程y=kx+b可知,只需用一對實數(shù)(k,b)就足以刻畫該直線;等等。
隨機變量通常表現(xiàn)為一個函數(shù)。但是,對于給定類型的分布,只要知道其中的某些參數(shù),就足以刻畫該隨機變量。而這樣的參數(shù)往往代表隨機變量某種內(nèi)在特性或物理背景,或隨機變量之間的某種內(nèi)在聯(lián)系。
在《概率論與數(shù)理統(tǒng)計》中,主要研究隨機變量的如下幾類數(shù)字特征(參數(shù))。
直觀上,一個常規(guī)事件的發(fā)生不提供任何信息,而一個未在預(yù)料中的事件的發(fā)生提供有信息。
對應(yīng)概率論中的確定與非確定事件,確定事件發(fā)生的結(jié)果預(yù)先可知道,所以,這樣的事件發(fā)生不提供任何信息。而非確定事件發(fā)生的結(jié)果預(yù)先不可知,于是非確定事件發(fā)生的結(jié)果提供有信息。1948年,香農(nóng)提出了“信息熵”概念,解決了對信息的量化問題。一條信息的信息量大小和它的不確定性有直接的關(guān)系。比如說,我們要搞清楚一件非常不確定的事,或是我們一無所知的事情,就需要了解大量的信息。相反,如果我們對某件事已經(jīng)有了較多的了解,則不需要太多的信息就能把它搞清楚。從這個角度,信息的度量可以刻畫事件發(fā)生的不確定性。
我們知道:概率論主要研究非確定事件發(fā)生的規(guī)律。隨機變量是用于描述非確定事件發(fā)生的基本數(shù)學(xué)工具。不同的隨機事件的發(fā)生提供有不同信息。如何量化這樣的信息是一個基本問題。
設(shè)X為一個離散型隨機變量,其分布為:
圖 1 事件發(fā)生概率與信息量關(guān)系
可見,事件發(fā)生的概率越小,信息量越大。事件發(fā)生的概率為1時,信息量為0。即確定事件發(fā)生不提供信息。
設(shè)X,Y為兩個離散型隨機變量,其分布分別為
事件X=xi,Y=yj的發(fā)生所提供的互信息量定義為:互信息量提供一種兩個事件發(fā)生的相互依賴信息量。
(1)如果事件X=xi,Y=yj獨立,則I(xi,yj)=0。
(2)如果事件Y=yj發(fā)生時,X=xi必然發(fā)生,則有I(xi,yj)=I(xi)。
用隨機變量描述不確定事件,那么如何量化整個隨機變量的不確定性呢?香農(nóng)提出的“信息熵”概念有效地解決了這個問題。他用事件發(fā)生的平均信息量定義熵,即,
其函數(shù)曲線見圖2。
可見,當(dāng)分布參數(shù)p=0.5時,對應(yīng)的0-1隨機變量X的熵最大,即事件發(fā)生的結(jié)果最不確定。而當(dāng)靠近0(或1)時,熵趨近于0。此表明:隨機變量X幾乎退化為一個確定量。
對于兩個隨機變量X,Y,如果H(X)<H(Y),則Y的不確定性比X的不確定性高。
隨機變量的數(shù)學(xué)期望形式上表現(xiàn)為隨機變量取值以概率值為權(quán)重的加權(quán)平均:
數(shù)理統(tǒng)計中將用到離散型加權(quán)平均的思想,用于數(shù)學(xué)期望參數(shù)的統(tǒng)計量估算方法。
數(shù)學(xué)期望的如下兩條性質(zhì)對計算有用:
方差用于刻畫隨機變量X取值與平均值E(X)的總體誤差。
方差的如下三條性質(zhì)對計算有用:
相關(guān)系數(shù)用于刻畫隨機變量X,Y的線性相關(guān)程度??梢宰C明:
由概率分布的定義,我們知道:
通常,我們只考慮某些具有代表性的分布類型。一般,分布中含有某些參數(shù),分布類型己知的情形下,不同參數(shù)對應(yīng)不同的分布。隨機變量的數(shù)字特征與這些分布參數(shù)有密切聯(lián)系。
隨機變量的數(shù)字特征可以用一個多項式形式的隨機變量函數(shù)的數(shù)學(xué)期望表示,如 k階原點矩E[Xk],k階中心矩E[(X?E(X))k],k+m階原點混合矩E[Xk Ym], k+m階中心混合矩E[(X?E(X))k(Y?E(Y))m]。
可見,數(shù)學(xué)期望在數(shù)字特征計算中是一個中心概念?;谶@一點,根據(jù)加權(quán)平均與數(shù)學(xué)期望的關(guān)系,數(shù)理統(tǒng)計中的矩估計方法和其他統(tǒng)計方法基本是源于這些關(guān)系。
為方便學(xué)生參考,我們將常見分布的數(shù)字特征總結(jié)在表1中。
隨機變量的數(shù)字特征之所以稱為特征,其理由是:在分布類型己知的情形下,一旦數(shù)字特征知道,分布就能決定。所以,數(shù)理統(tǒng)計中絕大部分內(nèi)容是在對分布類型及其參數(shù)進(jìn)行近似估算和分析研究。
對于分布參數(shù),參數(shù)的單點值近似,或取值范圍近似是數(shù)理統(tǒng)計關(guān)心的基本問題。在數(shù)理統(tǒng)計中,單點值和取值范圍的近似是用概率信度刻畫,即在什么樣的概率信度下,確保近似結(jié)果。這方面的分析我們將在另文中專題討論。
這里,我們考慮一種最簡單的近似方法:對同一試驗重復(fù)進(jìn)行,然后用實驗結(jié)果的平均值近似數(shù)學(xué)期望。
對于一個隨機變量X,如果它的數(shù)學(xué)期望E(X)=和方差D(X)=σ2均存在(注意:并非一定是正態(tài)分布),即使不知道分布的任何信息,數(shù)學(xué)期望和方差仍可近似計算,其原理來自于大數(shù)定律。對X對應(yīng)隨機試驗獨立地重復(fù)進(jìn)行,試驗n次的結(jié)果分別用 n個隨機變量X1,X2,......,Xn表示。則X1,X2,......,Xn為相互獨立,且與X同分布。從而有
切比雪夫大數(shù)定理從理論上解釋了為什么可以用頻率近似地作為概率的基本思想。我們以0-1分布為例解釋這一現(xiàn)象。
設(shè)事件A發(fā)生的概率為p,引入一個一個0-1隨機變量X:
表1 常見分布的數(shù)字特征
對于分布類型,根據(jù)中心極限定理,其近似估計與分布類型無關(guān),最終均可統(tǒng)一在正態(tài)分布(仍至標(biāo)準(zhǔn)正態(tài)分布)的框架之下。所以,我們可以這樣認(rèn)為:數(shù)理統(tǒng)計中的最核心的基礎(chǔ)分布是標(biāo)準(zhǔn)正態(tài)分布。這就是數(shù)理統(tǒng)計中只研究標(biāo)準(zhǔn)正態(tài)分布抽樣的各種組合的原因。
中心極限定理:設(shè)X1,X2,......,Xn,......為相互獨立的隨機變量序列,?i≥1,
值得注意的是:在此是固定的,從而當(dāng)n→+∞時,np→+∞并非是一個常數(shù)或有界。
本文是我們有關(guān)《概率論與數(shù)理統(tǒng)計》系列教學(xué)研究文章的第 3篇。主要闡述隨機變量的數(shù)字特征。用量化參數(shù)刻畫隨機變量的某些內(nèi)在特征。數(shù)學(xué)期望在數(shù)字特征計算中是一個中心概念,把握加權(quán)平均與數(shù)學(xué)期望的關(guān)系,對于理解其他特征參數(shù)的計算和估計、以及數(shù)理統(tǒng)計中的矩估計方法和其他統(tǒng)計法具有十分重要的意義。
[1] 盛驟,謝式千,潘承毅.概率論與數(shù)理統(tǒng)計(第3版)[M].北京:高等教育出版社,2001.
[2] 盛驟,謝式千,潘承毅.概率論與數(shù)理統(tǒng)計——學(xué)習(xí)輔導(dǎo)與習(xí)題選解(第2、3版)[M].北京:高等教育出版社,2003.
[3] 謝婧,鈕鍵,趙輝.概率論與數(shù)理統(tǒng)計——全程導(dǎo)學(xué)及習(xí)題全解(第3版)[M].北京:高等教育出版社,2006.
[4] M. Mitzenmacher, E. Upfal.概率與計算[M].史道濟(jì),譯.北京:機械工業(yè)出版社,2007.
Several Issues on Studying Probability Theory and Mathematical Statistics (3)--- Numerical characteristics of random variables and it’s role
XU Dao-yun, QIN Yong-bin, LIU Chang-yun
( College of Computer Science and Technology, Guizhou University, Guiyang, Gouzhou 550025, China )
Random variable is formally a real-valued function defined in the sample space. Much the same as normal function, the use of certain parameters is sufficient to describe the function of intrinsic characteristics. The purpose of introduction of digital features about random variables is to use some of the characteristic parameters characterize the random variable. Mathematical expectation is a basic core concepts of numerical characteristic parameters about random variable. Common numerical characteristics of random variables is formally mathematical expectation of random variable function. Mathematical expectation is essentially a weighted average basis, which provides a computational model for statistics (approximate) calculation about numerical characteristic of random variable.
numerical characteristics;calculation;function
(責(zé)任編輯 毛志)
O211 < class="emphasis_bold">文獻(xiàn)標(biāo)識碼:A
A
1673-9639 (2011) 02-0126-06
2010-12-11
許道云(1959-),男,教授、南京大學(xué)博士,貴州大學(xué)計算機科學(xué)與技術(shù)學(xué)院院長,博士研究生指導(dǎo)教師。主要研究方向為計算復(fù)雜性、可計算分析。