臧鴻雁, 張志剛, 李 娜
(北京科技大學 數理學院,北京 100083)
隨著數據科學的興起,概率論與數理統(tǒng)計的理論和方法越來越多地滲透到自然科學和社會科學的各個領域,成為這些領域解決實際問題的強有力工具.著名數學家拉普拉斯曾說過:“生活中絕大多數問題其實都是概率問題.”講好概率論與數理統(tǒng)計課程,對提升高校人才培養(yǎng)質量有著十分重要的作用.各高等院校的數學工作者積極探索概率論與數理統(tǒng)計課程的教學改革方法和課程中知識點的教學設計[1-3].
在概率論與數理統(tǒng)計課程教學中,隨機變量函數的分布是一個教學重點也是一個教學難點,很多數學工作者針對隨機變量函數的分布知識點的教學方法進行研究[4-6].[4]利用分布函數法構造一類適用于求解一維隨機變量函數分布的直觀解法,該方法基于數形結合思想構建統(tǒng)一方法求解一維隨機變量函數的分布,確定了幾類適用的場合,并給出了三個典型例題的應用過程.[5]針對X,Y分別是離散、連續(xù)不同類型的隨機變量的情形,如何求其函數g(X,Y)的分布的問題給出了求解方法和應用舉例.[6]中探討了一維連續(xù)型隨機變量函數的分布的求法及其在產生隨機數中的應用,關于隨機數的討論并未給出嚴格的數學證明和基于數值模擬的直觀結果.
荷蘭數學教育家弗萊登塔爾說:“真正的數學家,常常憑借數學的直覺思維做出各種猜想,然后加以驗證.猜想驗證是一種重要的數學教學方法.”本文針對一維連續(xù)型隨機變量這一知識點,先提出問題,依據數值模擬直觀猜測結果,再分析問題,理論證明驗證結果.最后以隨機數產生為目標,從理論分析到直觀的數值模擬結果,對連續(xù)型隨機變量函數的分布這一知識點進行了拓展研究.
引例同學們在畢業(yè)的時候,都會面臨著找工作的問題,假設有這樣一份工作,月薪方案為底薪0.4萬元加提成,提成為銷售額的10%,而月銷售額是個隨機變量X,假設其服從如下均勻分布X~U(2,4)(單位:萬元),求月薪超過7000元的概率?
首先,月薪是隨機變量Y,已知X~U(2,4),可以得到X的概率密度函數為
還有一個關鍵的信息是容易獲得的,那就是Y和X之間的函數關系Y=0.4+0.1X.所以這個問題的關鍵就是求月薪Y的分布.X經過這樣一個線性變換之后還會服從均勻分布嗎?下面用數據做數值模擬直觀觀察Y的分布.
用數據做實驗看直觀的結果.首先,用Matlab生成區(qū)間(2,4)上均勻分布隨機數,再對這些數據進行變換,做出變換后的數據的統(tǒng)計直方圖,如圖1.圖1(a)的變換函數為Y=0.4+0.1X.直觀感覺,均勻分布的數據變換經過變換Y=0.4+0.1X后看起來還是均勻分布.如果改變變換函數是不是還能得到均勻分布呢?比如變換函數取對數函數, 圖1(b)的變換函數為Y=lnX.由圖可見,經過變換Y=lnX之后看起來不再均勻.直觀的結論是否正確?能否在理論上得到這樣的結果?進一步探討理論上的解決問題的方法.
(a)Y=0.4+0.1X (b)y=lnX
問題是如何由X的概率密度fX(x)和Y與X的函數關系獲得Y的概率密度fY(y).直接建立X的概率密度和Y的概率密度之間的關系并不容易,概率密度函數與分布函數之間有關系,分布函數是由概率定義的,那是不是能從分布函數入手來間接尋找X與Y的概率密度之間的關系呢?關系的建立思路如圖2所示.這就是分布函數法的思路,具體的關系的建立見下面的例子和定理1所描述.
圖2 分布函數法思路圖
由前面的分析知道,可以從Y的分布函數FY(y)入手,再將Y替換為X的函數,從而轉換為X落入一個區(qū)間的概率,用FX(x)表示,詳細過程如下:
FY(y)=P{Y≤y}=P{0.4+0.1X≤y}=P{X≤10(y-0.4)}=FX(10(y-0.4)).
再兩邊對y求導,有
可見,Y~U(0.6,0.8),與前面的直觀感覺是一致的,從而很容易得到月薪超過7000元的概率為1/2.問題研究到這里就可以解決引例中的問題了,但研究不滿足于此,這種方法推廣到一般的函數,能得到什么樣的具有一般性的條件和結論呢?
很容易給出問題的一般描述,即已知X的概率密度fX(x)和Y與X的函數關系Y=g(X),求Y的概率密度fY(y).解決該問題的思路見圖2,從Y的分布函數入手.
FY(y)=P{Y≤y}=P{g(X)≤y}
進一步要想從不等式中解出X的表達式,必須加條件,如果y=g(x)單調遞增,則其存在反函數g-1,令g-1=h.則上式可以進一步推導
FY(y)=P{Y≤y}=P{g(X)≤y}=P{g-1(g(X))≤g-1(y)}=P{X≤h(y)}=FX(h(y)).
對上式兩邊對y求導,還需要補充條件,若h(y)是可導的,由復合函數求導公式,則有
fY(y)=F′Y(y)=fX(h(y))·h′(y).
這樣,很容易得到下面定理1.
定理1若隨機變量X的概率密度fX(x)在[a,b]外等于零,在區(qū)間[a,b]上恒有g′(x)>0,(注意:包含了前面推到所需要的兩個條件y=g(x)單調遞增和h(y)可導),則有結論
有了上述的啟發(fā)和推導,進一步提出問題:
(i)若y=g(x)單調遞減,會得到什么樣的結論?
(ii)若隨機變量X的概率密度fX(x)在(-∞,+∞)上都非零,上述結論有什么變化?
(iii)若y=g(x)不單調怎么辦?
以上問題讓學生自己去思考和拓展即可.另外,公式法的條件比較苛刻,[7]中給出了連續(xù)型隨機變量函數分布的更一般的公式法.
通過前面的分析,如果X~U(0,1),則X的線性函數也服從均勻分布,比如Y=2X+1,則Y~U(1,3),如圖3所示.
圖3 均勻分布的線性函數的分布
進一步思考,如果想由均勻分布得到指數分布,能不能找到相應的變換函數呢?為了回答這個問題,給出以下定理2.
定理2如果X的分布函數為F(x),且F(x)為嚴格單調遞增連續(xù)函數,令Y=F(X),則Y~U(0,1).(證明略)
基于上述定理,很容易得出以下結論:
如果Y~U(0,1),想利用Y得到其它分布的隨機變量,如果想獲得分布函數為F(x)的隨機變量X,則只需要做變換X=F-1(Y)即可.比如,X~U(0,1),想獲得參數為1的指數分布,其分布函數和反函數分別為
由參數為1的指數分布的分布函數的反函數形式,很容易找到變換函數為Y=-ln(1-X).所以,令Y=-ln(1-X),則Y服從參數為1的指數分布.用Matlab生成[0,1]上均勻分布的隨機數10000個,對這些隨機數進行Y=-ln(1-X)的變換,隨著數據量的增加,變換后的數據越來越接近指數分布,樣本概率密度和理論概率密度越來越接近,如圖4所示.數值模擬的結果,驗證了理論的正確性.
圖4 Y=-ln(1-X)的分布
隨機數應用領域十分廣泛,比如,彩票、博弈、通信、計算機仿真、計算物理學等,而以上結論為產生各種分布的隨機數提供了重要的理論依據.
關于隨機變量函數的分布教學設計中,本節(jié)的問題和解決問題的方法是否掌握?隨機變量的函數的分布中生成隨機數的拓展是否可以理解?是否有意義?本節(jié)課的收獲怎么樣等問題,筆者針對北京科技大學2019級的物聯(lián)網、信安、材控三個專業(yè)的160名左右的學生做了問卷調查,回收問卷145份,結果見圖5.
圖5 關于學生學習效果的調查問卷柱狀圖
由圖5可見,學生對本文提出的教學設計有較高的認可度.從圖5(c)的結果可以看出,盡管有些同學不能完全掌握本節(jié)的知識,但依然覺得關于隨機數的拓展是十分有必要的.學生對知識拓展的需求是比較強烈的,而課堂上增加知識拓展部分能夠提升知識的高階性和挑戰(zhàn)度.
本文針對概率論與數理統(tǒng)計課程中的連續(xù)型隨機變量函數的分布這個知識點進行了教學設計,提出問題,依據數值模擬直觀猜測結果,分析解決問題的思路,解決問題,推廣到更一般的問題描述,探索更一般解決問題的方法,以應用為導對知識進行了拓展.最后通過對學生的調查問卷顯示,本教學設計學生能夠使學生較好地掌握本節(jié)知識點,學會了解決問題的方法,得到的學生認可度較高,該教學設計方法可以類似推廣到其它知識點的教學設計中.
致謝作者非常感謝相關文獻對本文的啟發(fā)以及審稿專家提出的寶貴意見.