易利亞
(貴州大學人民武裝學院,貴陽 550025)
概率分布的實函數實現問題
易利亞
(貴州大學人民武裝學院,貴陽 550025)
基于一維隨機變量,通過闡釋概率分布實函數實現的內在本質,給出了概率分布實函數實現的一個充分必要條件,得到分布函數族及其連續(xù)性特征,揭示出概率論中分布函數定義所蘊含的合理性和深刻性.
概率論;概率分布的實函數實現;分布函數族;連續(xù)性
在柯爾莫哥洛夫將概率概括為“非負的、規(guī)范的、可列可加的集函數”后,概率便在測度論中獲得了最深刻的數學本質[1],這使得在一般意義下通過研究概率分布來達到對隨機現象統(tǒng)計規(guī)律性的揭示有了理論支撐.這就是分布函數問題.
分布函數問題更一般的提法是:概率分布的實函數實現問題.根據實分析理論,一定條件下幾乎處處相等的實函數都可作為給定隨機變量的概率分布函數,表明能實現概率分布的實函數具有特定的結構,它們有著區(qū)別于其它實函數的共同本質.然而概率論所定義的兩型分布函數F1(x)=P{ξ∈(-∞,x]}與F2(x)=P{ξ∈(-∞,x)}在連續(xù)性質上所表現出來的不一致,常使學習者對這種共同本質“莫衷一是”,這在一定意義上影響了分布函數概念認知的完備性.
基于此,筆者對概率分布的可實函數實現性、概率分布函數區(qū)別于其它實函數的本質特征、概率分布函數的內在結構三個方面進行了討論,給出了概率分布實函數實現的一個充分必要條件,揭示了分布函數的族結構及其連續(xù)性特征,以此來闡釋概率論所給定義的合理性和深刻意涵,旨在深化對分布函數概念的認識.
2.1 概率分布實函數實現的概念.
概率論在把隨機現象轉變成數學問題的過程中,經歷了兩次抽象.第一次抽象是通過引入隨機事件概念,建立起基于σ-代數的概率空間(Ω,F,P).第二次抽象是在(Ω,F,P)的基礎上,通過引入隨機變量概念,建立起從樣本空間Ω到實數集R上的映射關系,從而隨機現象的問題就可以借助Borelσ-代數,用實分析的思想和方法來加以討論.
如果說第一次抽象奠定了公理化概率論的基礎,那么第二次抽象的理論價值在于,它提示了隨機變量作為(基本)隨機事件的映射雖然是隨機而變的,它的值不能事先確定,但對于給定的x,事件{ξ∈(-∞,x]}(定義為{ω∈Ωξ(ω)∈(-∞,x]}∈F )或{ξ∈(-∞,x)}(定義為{ω∈Ω(ω)∈(-∞,x)}∈F )的概率遵循著某種“規(guī)則性”:兩型集{ξ∈(-∞,x]},{ξ∈(-∞,x)}的概率可由x按某種法則唯一地確定.這表明,概率分布總是可以實函數實現的.
但是,現有分布理論把這種可實函數實現性認知為隨機變量ξ取(-∞,x]型集或(-∞,x)型集時,其概率P(·)可用x的函數來“表示”,而當出現截然不同的連續(xù)性時,卻沒有對這種對立給出相應的闡釋.這不能不說是一個欠缺.
事實上,概率的測度本質決定了概率分布在一般意義下是不可能用實函數來“表示”的,因為倘若如此,概率就無需再言什么測度本質了.所給兩型定義實際上也并沒有完全實現用實函數來“表示”集函數,這從它們對概率分布的描述時不得不借助實函數的單側極限手段就可見出.
其實正是這種借助,剛好提示了概率分布實函數實現的內在規(guī)定性:隨機變量的概率分布只能是用實函數來“描述”的.兩型分布函數也僅是表明,第一型當點集取(-∞,x]型集時,概率P(·)的分布可用x的函數F1(x)來表示,而當點集取(-∞,x)時,就只能用F1(x-0)來表示了;同樣,第二型在點集取(-∞,x)時,概率P(·)的分布可用x的函數F2(x)來表示,而當點集取(-∞,x]時,就只能用F1(x+0)來表示.
因而從根本上講,概率分布所遵循的“規(guī)則性”決定了其實函數實現的單側極限表示性,這就是概率分布實函數實現的本質.換句話說,概率分布的實函數實現是通過實函數的單側極限表示來實現的.這種認識的合理性不僅可在F1(x),F2(x)描述同一隨機變量概率分布時所表現出來的差異中得到傳達,而且在L-S測度論中可以嚴格證明.
基于上面的認識,在概率空間(Ω,F,P)中,(-∞,x]或(-∞,x)型集的概率總可以用一個實函數的單側極限來表示,其一般形式為:
為此,可給出概率分布實函數實現的如下定義.
定義1 設ξ是(Ω,F,P)上的隨機變量,F(x)是定義在R上的函數.若
則稱P(·)的分布在R上是可實函數實現的,F(x)叫隨機變量ξ的概率分布函數,簡稱為分布函數.
此定義下的F(x)有著如下基本性質.
定理1 設F(x)是隨機變量ξ的分布函數,則
(i)F(x)單調不減;
(ii)F(-∞)=0,F(+∞)=1.
證(i)用反證法.假設F(x)非單調不減,則至少存在一點x0∈R,有
這與概率的非負性矛盾,所以原結論成立.
(ii)由結論(i),任給t>0,有定理1的重要意義在于,它揭示了概率分布函數區(qū)別于其它實函數的重要特征:它是定義在R上的非負、規(guī)范、單調不減函數.
應用L-S測度理論可以證明,定義在R上的非負、規(guī)范、單調不減函數F(x)所確定的L-S測度必是概率測度,因而F(x)必是該概率空間某一隨機變量的分布函數.讀者可參見文獻[2]自己給出證明.
2.2 概率分布實函數實現定理.
文獻[3]曾對引言中的兩型分布函數的異同作過具體比較.遺憾的是,該文作者未能進一步揭示出兩定義蘊涵著的統(tǒng)一本質.這就是下面的定理.
定理2(概率分布的實函數實現定理) 定義在R上的函數F(x)是給定隨機變量ξ的分布函數的充分必要條件是,F(x)可表示成如下形式:
這里,當在F(x)的連續(xù)點時,λ∈R;當在F(x)的間斷點時,λ∈[0,1].
證先證必要性.設F(x)是給定隨機變量ξ的分布函數,因為單調不減,故?x∈R,
則m,n均為非負數.當m,n不同時為0時,F(x)在x點非連續(xù).不妨設n≠0,有
同理可證,F(x-0)=P{ξ∈(-∞,x)}.所以由定義1知,F(x)是給定隨機變量ξ的分布函數.
定理2表明,概率分布函數值由(-∞,x]型集、(-∞,x)型集的概率值及參數λ完全確定,因而它深刻地反映了概率分布實函數實現的全部本質.
特別地,在定理2中,當λ=1時,F(x)=P{ξ∈(-∞,x]}=F1(x);當λ=0時,F(x) =P{ξ∈(-∞,x)}=F2(x).可見F1(x),F2(x)都是概率分布函數的特殊情形.
3.1關于連續(xù)性的若干結論.
下面是定理2的三個推論,它們較好地揭示了分布函數的連續(xù)性本質.
推論1 設F(x)是隨機變量ξ的分布函數,則F(x)在x0點連續(xù)的充分必要條件是
證由定理2知顯然成立.
稱概率值P{ξ=x0}為分布函數F(x)在x0點的躍度,它的一般形式為
推論2 設F(x)是隨機變量ξ的分布函數,x0是其間斷點,則當λ=1時,F(x)在x0點是右連續(xù)的;當λ=0時,F(x)在x0點是左連續(xù)的;當0<λ<1時,F(x)在x0點是無單側連續(xù)的.
證只證最后一個結論,用反證法.不妨設F(x)在x0點左連續(xù),則F(x0-0)=F(x0),有
得λP{ξ=x0}=0.而x0是間斷點,根據推論1,P{ξ=x0}≠0,故λ=0,與0<λ<1矛盾.
推論2表明,單側連續(xù)并非分布函數的本質屬性,兩型定義在連續(xù)性上的對立,實在是“黑馬”與“白馬”的對立,而在此推論下,“馬”的本質昭然若揭.
推論3 若隨機變量ξ的分布函數F(x)在R上連續(xù),則F(x)是唯一的.
證由推論1,當F(x)在R上連續(xù)時,?x∈R,P{ξ=x}=0.現假設ξ還有另一個分布函數G(x),則由定理2知,?λ,λ′∈R,λ≠λ′,有
綜上,能實現概率分布的實函數F(x)區(qū)別于其它實函數的根本特征在于:它(們)是定義在R上的非負、規(guī)范、單調不減、在有間斷點時可修改定義使其至少單側連續(xù)的函數.
3.2 分布函數族及其形式統(tǒng)一性.
運用實分析理論,可得到分布函數被稱為Lebesgue分解的一個結構[4],在那里,任何分布函數都可由三種基元函數(離散型分布函數、連續(xù)型分布函數和奇異型分布函數)迭加而成.這是一種分析結構意義下的分解.
我們當然也可在代數結構意義下剖析概率分布函數的結構.根據定理2和引言中的兩型定義,可得出如下關系式:
這里,當在F(x)的連續(xù)點時,λ∈R,當在F(x)的間斷點時,λ∈[0,1].可見定義1下的分布函數恰好是引言中兩型分布函數的線性組合.這表明能實現概率分布的實函數自成一族,它們有著較好的形式統(tǒng)一性.
至于分布函數族中λ的實際意義,我們以一個實例加以說明.
3.3 兩型分布函數定義的合理性.
下面從分布函數族出發(fā),對引言中兩型定義的合理性進行討論.
定理3 在分布函數族F(x)=λF1(x)+(1-λ)F2(x)中,對于給定的x,F1(x),F2(x)線性相關的充分必要條件是F(x)的躍度為0.
證必要性.由F1(x),F2(x)線性相關,有F1(x)=kF2(x)(k≠0),于是
注意到F(+∞)=1,F2(+∞)=1,故有1=λk+1-λ,所以k=1.從而F1(x)=F(x)=F2(x) ,即F(x-0)=F(x)=F(x+0),故F(x)在x點處連續(xù).由推論3知,P{ξ=x}=0.
充分性.顯然,當P{ξ=x}=0時,有F(x-0)=F(x)=F(x+0),即F1(x)=F2(x),所以F1(x),F2(x)線性相關.
此定理表明,分布函數族中的所有分布函數在連續(xù)點處的解析表達是同一的,而在不連續(xù)點處,則根據躍度定義和借助單側極限手段,可將整個分布函數族表達為如下形式:
可見,對整個分布函數族而言,F1(x),F2(x)各自都具有基元特征,因而從概率分布實函數實現的角度看,概率論中所給出的兩型分布函數定義是有著深刻的合理性的.
分布函數概念是概率論中一個十分重要的概念.盡管實分析理論已給出了一般測度意義下分布函數的特征,但對概率測度來說,多少顯得有些粗略,缺乏應有的完備性.本文基于一維隨機變量,系統(tǒng)地闡釋了概率分布實函數實現的內在本質,并通過這種闡釋,還原了現有概率論中不曾討論的分布函數族及其內在結構,并通過這種還原,揭示出概率論所給分布函數定義所蘊含的合理性和深刻性,這對完整理解分布函數概念,無疑地具有積極意義.
[1] 江澤堅,吳智權.實變函數論[M].北京:人民教育出版社,1979.
[2] 程其襄,張奠宙,魏國強,胡善文,王漱石.實變函數與泛函分析基礎[M].北京:高等教育出版社,2003.
[3] 陶應奇.兩種分布函數的比較[J].綿陽師范高等??茖W校學報,1999,18(2):18-19.
[4] 應堅剛,何萍.概率論[M].上海:復旦大學出版社,2006.
The Question on the Real Function Realization of Probability Distribution
YI L i-ya
(The People’s Armed College,Guizhou University,Guiyang 550025,China)
Based on one-dimensional random variables,the writer gives a sufficient and necessary condition on the real function realization of probability distribution,obtains the family and continuity characteristic of the distribution function, and reveals the rationality and profundity of the definition of the distribution function in probability theory through explaining the intrinsic nature of the real function realization of probability distribution.
probability theory;real function realization of probability distribution;family of the distribution function;continuity
O211.1
A
1672-1454(2011)03-0139-06
2008-05-16