唐 立,吳錦標(biāo)
(中南大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,長(zhǎng)沙 410012)
數(shù)理統(tǒng)計(jì)起源于19 世紀(jì),成熟于20 世紀(jì),是從實(shí)踐中逐步發(fā)展起來的一門數(shù)學(xué)學(xué)科。它不僅在理學(xué)門類統(tǒng)計(jì)專業(yè)課程中起著核心基礎(chǔ)的作用,數(shù)理統(tǒng)計(jì)還與其他學(xué)科結(jié)合,形成生物統(tǒng)計(jì)、經(jīng)濟(jì)統(tǒng)計(jì)等統(tǒng)計(jì)學(xué)派[1]。無論是理學(xué)門類的數(shù)理統(tǒng)計(jì),還是與其他學(xué)科結(jié)合的數(shù)理統(tǒng)計(jì),都是力求為所有的統(tǒng)計(jì)方法提供理論基礎(chǔ)。近幾十年來,統(tǒng)計(jì)學(xué)科及其應(yīng)用的內(nèi)容飛速地發(fā)展,我們數(shù)理統(tǒng)計(jì)的教學(xué)內(nèi)容理應(yīng)適應(yīng)這一要求,不斷探索與時(shí)俱進(jìn)的教學(xué)內(nèi)容并提升和拓展。
從文獻(xiàn)上來看,數(shù)理統(tǒng)計(jì)課程教學(xué)改革一直為人們所關(guān)注。但是教學(xué)改革的研究文章中,大家主要關(guān)注的是教學(xué)手段和教學(xué)方法的改進(jìn),對(duì)數(shù)理統(tǒng)計(jì)教學(xué)內(nèi)容提出改革的文章很少。我們這篇文章,以理學(xué)門類統(tǒng)計(jì)專業(yè)數(shù)理統(tǒng)計(jì)教學(xué)為例,針對(duì)目前數(shù)理統(tǒng)計(jì)教學(xué)內(nèi)容中可能存在的某些不足,提出對(duì)現(xiàn)有教學(xué)內(nèi)容的一些拓展建議,使得數(shù)理統(tǒng)計(jì)這門課程更好地與后續(xù)課程和統(tǒng)計(jì)學(xué)科發(fā)展相銜接,更好地發(fā)揮其基礎(chǔ)課程的重要作用。目前數(shù)理統(tǒng)計(jì)的教學(xué)內(nèi)容,除了預(yù)備知識(shí),主要由參數(shù)估計(jì)、假設(shè)檢驗(yàn)和方法應(yīng)用三部分構(gòu)成,接下來,我們主要針對(duì)這三個(gè)部分,分別探討教學(xué)內(nèi)容的拓展思路。
首先,我們來看看現(xiàn)在數(shù)理統(tǒng)計(jì)教學(xué)使用的教材情況,因?yàn)榻虒W(xué)內(nèi)容與教材是密切聯(lián)系的。世界上第一本數(shù)理統(tǒng)計(jì)教材公認(rèn)是1946 年H.克拉美編寫的《統(tǒng)計(jì)學(xué)的數(shù)學(xué)方法》,而我國(guó)的數(shù)理統(tǒng)計(jì)教材在20 世紀(jì)80 年代才開始走向成熟。其中代表教材有陳希孺、倪國(guó)熙[2]編著的《數(shù)理統(tǒng)計(jì)學(xué)教程》,以及魏宗舒[3]編著的《概率論與數(shù)理統(tǒng)計(jì)教程》等?,F(xiàn)在國(guó)內(nèi)有著豐富的數(shù)理統(tǒng)計(jì)相關(guān)教材,為老師授課、學(xué)生學(xué)好這門課程提供了良好的條件。但是經(jīng)過我們多年的教學(xué)發(fā)現(xiàn),這些教材內(nèi)容基本上一致,幾十年來變化不大,不能完全滿足統(tǒng)計(jì)學(xué)科發(fā)展和后續(xù)課程的要求。因此,我們有必要考慮在現(xiàn)有教學(xué)內(nèi)容的基礎(chǔ)上,進(jìn)行一些拓展。
數(shù)理統(tǒng)計(jì)理論知識(shí)是圍繞統(tǒng)計(jì)推斷展開的,統(tǒng)計(jì)推斷包含兩部分內(nèi)容——(非)參數(shù)估計(jì)和假設(shè)檢驗(yàn)。從參數(shù)估計(jì)這部分內(nèi)容來看,這些教材和教學(xué)內(nèi)容中涉及到的樣本,都是從總體中抽取的獨(dú)立樣本。也就是說,所有講解的知識(shí),都是建立在樣本獨(dú)立性的假設(shè)下。但是,隨著統(tǒng)計(jì)學(xué)科的發(fā)展,目前統(tǒng)計(jì)專業(yè)后續(xù)課程已經(jīng)越來越豐富,通常包含隨機(jī)時(shí)間序列分析、隨機(jī)過程、數(shù)據(jù)挖掘和大數(shù)據(jù)探索等課程。隨機(jī)時(shí)間序列分析和隨機(jī)過程的統(tǒng)計(jì)推斷需要數(shù)理統(tǒng)計(jì)理論的支撐,這個(gè)道理是不言而喻的[4]。另外,數(shù)據(jù)挖掘和大數(shù)據(jù)探索的一些核心算法同樣依賴于數(shù)理統(tǒng)計(jì)[5]。我們注意到,這幾門后續(xù)課程中涉及到的樣本數(shù)據(jù)經(jīng)常是同一總體中抽取的相關(guān)數(shù)據(jù),也就是說抽取的樣本數(shù)據(jù)不是獨(dú)立的。這種從同一總體中抽取的相關(guān)數(shù)據(jù)的統(tǒng)計(jì)推斷知識(shí),在現(xiàn)有的數(shù)理統(tǒng)計(jì)教材和教學(xué)中幾乎沒有提到,學(xué)生在學(xué)到這些后續(xù)課程的時(shí)候,可能會(huì)感覺到理論上有一定的跳躍。所以,我們建議探討如何在教學(xué)內(nèi)容中,適當(dāng)?shù)匮a(bǔ)充相關(guān)樣本數(shù)據(jù)的數(shù)理統(tǒng)計(jì)知識(shí),特別地,可以適當(dāng)?shù)匮a(bǔ)充相關(guān)數(shù)據(jù)的參數(shù)估計(jì)內(nèi)容。
例如,我們可以拓展教學(xué)內(nèi)容:介紹最簡(jiǎn)單情況下的相關(guān)序列的矩估計(jì)法。與獨(dú)立序列的矩估計(jì)法是用樣本的原點(diǎn)矩去估計(jì)總體的原點(diǎn)矩類似,這種相關(guān)序列的矩估計(jì)法,就是用樣本均值和樣本協(xié)方差,去估計(jì)序列理論上的均值和協(xié)方差。由此,學(xué)生可以了解到,相關(guān)序列的參數(shù)估計(jì)方法,可以由獨(dú)立序列的參數(shù)估計(jì)法延拓得到。
具體地,若記相關(guān)序列{Yn}理論上的均值為μ,協(xié)方差函數(shù)為
又設(shè)抽樣得到的樣本數(shù)據(jù)為{yn},其樣本協(xié)方差函數(shù)為
類似于現(xiàn)有數(shù)理統(tǒng)計(jì)中,獨(dú)立序列的矩估計(jì)法原理,是根據(jù)樣本的原點(diǎn)矩依概率收斂到總體的原點(diǎn)矩。對(duì)于最簡(jiǎn)單情況下的相關(guān)序列{Yn},同樣可以證明:相關(guān)序列的樣本均值n和樣本協(xié)方差函數(shù)(k),分別依概率收斂到相關(guān)序列理論上的均值μ 和協(xié)方差函數(shù)γ(k),即n→∞時(shí)
針對(duì)不同層次的學(xué)生,我們可以詳細(xì)或者簡(jiǎn)略地給出這些結(jié)果的證明。事實(shí)上,想要給出詳細(xì)的證明,我們只需在預(yù)備知識(shí)部分,引入最簡(jiǎn)單情況下相關(guān)序列的中心極限定理和大數(shù)定律即可[6]。顯然,這兩個(gè)極限定理是獨(dú)立序列的中心極限定理和大數(shù)定律的拓展。
可見,作為現(xiàn)有數(shù)理統(tǒng)計(jì)教學(xué)內(nèi)容中獨(dú)立樣本數(shù)據(jù)統(tǒng)計(jì)推斷的延拓,我們可以在參數(shù)估計(jì)等部分中,適當(dāng)?shù)赝卣瓜嚓P(guān)數(shù)據(jù)的理論和應(yīng)用,從而進(jìn)一步完善數(shù)理統(tǒng)計(jì)身為基礎(chǔ)課程的功能,為學(xué)生后續(xù)課程的學(xué)習(xí)埋下伏筆,打下基礎(chǔ)。這些拓展知識(shí),不只是對(duì)學(xué)生后續(xù)學(xué)習(xí)有很好的啟迪作用,也讓學(xué)生了解到統(tǒng)計(jì)方法之間的聯(lián)系,了解到統(tǒng)計(jì)理論和應(yīng)用發(fā)展的歷史進(jìn)程。
眾所周知,在參數(shù)和非參數(shù)的假設(shè)檢驗(yàn)中,似然比檢驗(yàn)法是個(gè)非常常用而又高效的方法,其在假設(shè)檢驗(yàn)中的地位等價(jià)于極大似然估計(jì)法在參數(shù)估計(jì)中的地位[7]?,F(xiàn)有的數(shù)理統(tǒng)計(jì)教學(xué)中,對(duì)參數(shù)估計(jì)中的極大似然估計(jì)是非常重視的,它一直是教學(xué)的一個(gè)重點(diǎn)內(nèi)容。但是在現(xiàn)有的數(shù)理統(tǒng)計(jì)教學(xué)中,對(duì)于在假設(shè)檢驗(yàn)中具有同等地位的似然比檢驗(yàn)法卻很少涉及。然而,學(xué)生在后續(xù)的學(xué)習(xí)和實(shí)踐中,極有可能會(huì)遇到只有用似然比檢驗(yàn)法才能較好解決的問題。所以,我們?nèi)裟茉跀?shù)理統(tǒng)計(jì)這門基礎(chǔ)課程教學(xué)中,就初步講授這一方法,讓學(xué)生留下一定的印象,后面不管是理論上還是實(shí)際中需要用到這一方法時(shí),學(xué)生都容易想到和接受。
似然比檢驗(yàn)法和廣義似然比檢驗(yàn)法(這里我們統(tǒng)稱為似然比檢驗(yàn)法)是一種業(yè)已成熟的假設(shè)檢驗(yàn)方法,其用途非常廣泛。該方法可以用于獨(dú)立數(shù)據(jù),也可以用于相關(guān)數(shù)據(jù),可以用于參數(shù)的假設(shè)檢驗(yàn),也常用于非參數(shù)的假設(shè)檢驗(yàn)。對(duì)于簡(jiǎn)單假設(shè)的檢驗(yàn),奈曼—皮爾遜引理證明了似然比檢驗(yàn)是最優(yōu)檢驗(yàn)。對(duì)于非簡(jiǎn)單假設(shè),最優(yōu)檢驗(yàn)往往不存在。而對(duì)于最優(yōu)檢驗(yàn)不存在的情形,似然比檢驗(yàn)常常也是表現(xiàn)最佳的。目前數(shù)理統(tǒng)計(jì)教材和教學(xué)中,對(duì)于似然比檢驗(yàn)法極少提及,只有個(gè)別教材中有基本概念和一、兩個(gè)例子。為了方便學(xué)生后續(xù)的學(xué)習(xí)和實(shí)踐,我們建議增強(qiáng)這一方面的教學(xué)內(nèi)容。
例如,我們可以在參數(shù)的假設(shè)檢驗(yàn)教學(xué)內(nèi)容中,增加參數(shù)似然比檢驗(yàn)法介紹。具體地,設(shè)總體密度函數(shù)為f(x,θ),θ∈Θ,檢驗(yàn)參數(shù)假設(shè)為
設(shè)x1,x2,…,xn為來自該總體的一組樣本,可構(gòu)造似然比檢驗(yàn)統(tǒng)計(jì)量為
式中:L(θ)為似然函數(shù)。
若H0成立,則上式中分子的值與分母的值應(yīng)該差異不大。若H0不成立,則上式中分子的值將遠(yuǎn)大于分母的值。所以,檢驗(yàn)的拒絕域取為
式中:c 為某個(gè)常數(shù),使得
式中:α 為檢驗(yàn)的顯著性水平。
在目前的數(shù)理統(tǒng)計(jì)教學(xué)中,關(guān)于參數(shù)的假設(shè)檢驗(yàn),我們主要講解了一個(gè)正態(tài)總體的均值和方差的假設(shè)檢驗(yàn),以及兩個(gè)正態(tài)總體均值差和方差比的假設(shè)檢驗(yàn)。這些假設(shè)檢驗(yàn)中用到檢驗(yàn)統(tǒng)計(jì)量時(shí),都是直接給出的,沒有推導(dǎo)它們的由來。事實(shí)上,這些檢驗(yàn)統(tǒng)計(jì)量,都可以由上述的參數(shù)似然比檢驗(yàn)統(tǒng)計(jì)量Λ 推導(dǎo)得到。所以,我們可以考慮增加一個(gè)小節(jié)的教學(xué)內(nèi)容,專門介紹用似然比檢驗(yàn)法來做所有正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)。這樣,既可以使學(xué)生更加深刻地體會(huì)現(xiàn)有的假設(shè)檢驗(yàn)方法,又可以讓學(xué)生掌握自己構(gòu)造檢驗(yàn)統(tǒng)計(jì)量的一般方法。
針對(duì)上述一、二部分拓展的教學(xué)內(nèi)容,我們可以在方法應(yīng)用部分進(jìn)一步舉例應(yīng)用這些方法,以便學(xué)生更加深入地理解和掌握這些方法。
1.針對(duì)相關(guān)數(shù)據(jù)參數(shù)估計(jì)拓展內(nèi)容的應(yīng)用
我們可以選擇將前面拓展的相關(guān)數(shù)據(jù)的參數(shù)估計(jì)方法應(yīng)用到最簡(jiǎn)單的一步線性相關(guān)模型中。具體地,一步線性相關(guān)模型可以表示為
式中:已知序列{εn}獨(dú)立同分布,且εn~N(0,σ2),|θ|<1,μ,σ2,θ 是未知參數(shù)。
這個(gè)模型正好與目前數(shù)理統(tǒng)計(jì)教學(xué)中的經(jīng)典內(nèi)容——一元線性回歸模型相呼應(yīng)。一元線性回歸模型使用的是獨(dú)立數(shù)據(jù)進(jìn)行參數(shù)估計(jì),而這個(gè)一步線性相關(guān)模型使用的是相關(guān)數(shù)據(jù)進(jìn)行參數(shù)估計(jì)。
這時(shí)注意到該模型理論上的協(xié)方差函數(shù)為
應(yīng)用前面介紹的參數(shù)估計(jì)的拓展內(nèi)容,即使用相關(guān)數(shù)據(jù)參數(shù)的矩估計(jì)方法,就可以得到一步線性相關(guān)模型中未知參數(shù)的估計(jì)。也就是說,只要令一步線性相關(guān)模型中序列{Yn}的樣本均值n和樣本協(xié)方差(k),等于序列的理論均值μ 和協(xié)方差γ(k),就可以估計(jì)出模型中的三個(gè)未知參數(shù)μ,σ2,θ。
2.針對(duì)拓展的似然比檢驗(yàn)法教學(xué)內(nèi)容的應(yīng)用
為了加強(qiáng)學(xué)生對(duì)似然比檢驗(yàn)法的理解,我們可以在方法應(yīng)用部分的教學(xué)中,舉一個(gè)似然比檢驗(yàn)法用于對(duì)兩類模型做出選擇判斷的例子。具體地,我們可以利用目前數(shù)理統(tǒng)計(jì)教學(xué)內(nèi)容中,已有的線性回歸模型來舉例。下面簡(jiǎn)單地介紹這個(gè)方法的應(yīng)用。
式中:εi,δi獨(dú)立同分布,且εi~N(0,σ2),δi~N(0,τ2),β0,β1,σ2,γ0,γ1,γ2,τ2為未知參數(shù)。
這時(shí),似然比檢驗(yàn)統(tǒng)計(jì)量取為
在H0成立的情況下,Λ 漸近服從自由度為1 的卡方分布,即Λ~χ2(1)。故在顯著性水平α 下,若,則拒絕H0,即選擇模型Yi=γ0+γ1xi+γ2zi+δi較合適。否則接受H0,即選擇模型Yi=β0+β1xi+εi較合適。
這個(gè)例子可以讓學(xué)生認(rèn)識(shí)到,似然比檢驗(yàn)法不但可以用于參數(shù)的假設(shè)檢驗(yàn),也可以用于非參數(shù)的假設(shè)檢驗(yàn),它是一個(gè)有著廣泛用途的重要方法。
1.加強(qiáng)與現(xiàn)實(shí)社會(huì)的聯(lián)系
數(shù)理統(tǒng)計(jì)課程教學(xué)內(nèi)容偏于理論,需要通過舉例說明,才能讓學(xué)生真正理解和掌握這些理論和方法。目前數(shù)理統(tǒng)計(jì)教學(xué)中需要舉例說明的地方很多,從參數(shù)估計(jì)到假設(shè)檢驗(yàn),再到方法應(yīng)用都大量存在。從教材上來看,一般的數(shù)理統(tǒng)計(jì)教材上的例題和習(xí)題都有一點(diǎn)年代久遠(yuǎn)了,更新不多。因此,我們建議在舉例說明這方面,進(jìn)一步加強(qiáng)與現(xiàn)實(shí)社會(huì)的聯(lián)系。這樣,既有利于提高學(xué)生的學(xué)習(xí)興趣,又能為學(xué)生理論聯(lián)系實(shí)際提供訓(xùn)練基礎(chǔ)。
特別地,在方法應(yīng)用部分,經(jīng)典的數(shù)理統(tǒng)計(jì)教學(xué)內(nèi)容包含方差分析和回歸分析兩部分。這里以方差分析為例來討論算例的拓展?,F(xiàn)有的方差分析舉例說明主要是在經(jīng)濟(jì)、生產(chǎn)等方面,實(shí)際上,該方法可以用于現(xiàn)實(shí)社會(huì)中各行各業(yè)的各種數(shù)據(jù)分析。比如,方差分析在醫(yī)學(xué)中就有著廣泛的運(yùn)用,解決了很多重要的問題[8]。而這類運(yùn)用,在目前數(shù)理統(tǒng)計(jì)教學(xué)中卻鮮少提及。所以,我們可以在這里考慮拓展一些醫(yī)學(xué)相關(guān)的例子。
具體地,我們可以針對(duì)某種醫(yī)學(xué)實(shí)驗(yàn)結(jié)果數(shù)據(jù),使用方差分析方法,找出對(duì)該實(shí)驗(yàn)結(jié)果影響較大的那些因素。例如,表1 所示的一組數(shù)據(jù),是在不同的縫合方法(因素A)、不同的縫合后的時(shí)間(因素B)下,得到的一組醫(yī)學(xué)實(shí)驗(yàn)結(jié)果。該實(shí)驗(yàn)結(jié)果是用神經(jīng)縫合后的軸突通過率來表示的。使用方差分析法就可以得到,不同的縫合方法或者不同的縫合后的時(shí)間及它們的交互效應(yīng)對(duì)實(shí)驗(yàn)結(jié)果,亦即軸突通過率是否有顯著性影響的結(jié)論。
表1 不同縫合方法和不同縫合后時(shí)間下的軸突通過率 %
2.充分利用統(tǒng)計(jì)軟件
數(shù)理統(tǒng)計(jì)目前的教學(xué)內(nèi)容中幾乎沒有提到如何使用統(tǒng)計(jì)軟件來實(shí)現(xiàn)各種方法的數(shù)據(jù)計(jì)算或者圖形演示等。事實(shí)上,現(xiàn)在幾乎所有數(shù)理統(tǒng)計(jì)教學(xué)內(nèi)容中方法的計(jì)算,都可以借助計(jì)算機(jī)和統(tǒng)計(jì)軟件來實(shí)現(xiàn)[9]。
例如,像上面提到的方差分析,在實(shí)際中都是用統(tǒng)計(jì)軟件來實(shí)現(xiàn)的。因?yàn)閷?shí)際中的數(shù)據(jù)往往比較多,無法用手算來實(shí)現(xiàn)。所以,適當(dāng)?shù)卦黾痈鞣N數(shù)理統(tǒng)計(jì)方法對(duì)應(yīng)的統(tǒng)計(jì)軟件操作介紹,有利于學(xué)生未來在實(shí)際問題中運(yùn)用這些方法。
又例如,課堂上介紹某個(gè)結(jié)果時(shí),若用統(tǒng)計(jì)軟件演示一下這個(gè)結(jié)果,可以讓學(xué)生印象更加深刻,也使知識(shí)點(diǎn)變得生動(dòng)有趣。比方說,正態(tài)性檢驗(yàn)中比較直觀的判斷方法,就是看數(shù)據(jù)的直方圖和qq 圖。正如圖1 和圖2演示的那樣,我們可以在教學(xué)時(shí)使用eviews 軟件來實(shí)現(xiàn)這一操作。
圖1 和圖2 分別演示的是某組數(shù)據(jù){Wn}的直方圖和qq 圖。從圖中可以看出,這組數(shù)據(jù){Wn}是大致服從正態(tài)分布的。但是,只看圖形來判斷數(shù)據(jù)的正態(tài)性,顯然是比較粗糙、不夠準(zhǔn)確的。所以,我們就自然地引導(dǎo)學(xué)生進(jìn)一步學(xué)習(xí)更為精準(zhǔn)、細(xì)致的方法了。
圖1 某組數(shù)據(jù){Wn}的直方圖
圖2 某組數(shù)據(jù){Wn}的qq 圖
可見,隨著計(jì)算機(jī)和統(tǒng)計(jì)軟件的發(fā)展,我們應(yīng)該將這一部分知識(shí)適當(dāng)?shù)匾霐?shù)理統(tǒng)計(jì)教學(xué)中,從而避免數(shù)理統(tǒng)計(jì)教學(xué)內(nèi)容與時(shí)代的發(fā)展脫節(jié)。
綜上所述,我們除了可以在現(xiàn)有數(shù)理統(tǒng)計(jì)教學(xué)內(nèi)容基礎(chǔ)上,在參數(shù)估計(jì)部分增加相關(guān)數(shù)據(jù)參數(shù)估計(jì)的內(nèi)容,在假設(shè)檢驗(yàn)部分加強(qiáng)似然比檢驗(yàn)法的介紹,在方法應(yīng)用部分補(bǔ)充前面增加的知識(shí)的運(yùn)用外,我們還建議加強(qiáng)數(shù)理統(tǒng)計(jì)教學(xué)內(nèi)容中各種例子與現(xiàn)實(shí)社會(huì)的聯(lián)系,以及統(tǒng)計(jì)軟件的使用等。
總之,我們探討了在數(shù)理統(tǒng)計(jì)教學(xué)內(nèi)容的主要方面:參數(shù)估計(jì)、假設(shè)檢驗(yàn)和方法應(yīng)用怎樣適當(dāng)?shù)赝卣?,以適應(yīng)統(tǒng)計(jì)學(xué)科的發(fā)展和后續(xù)課程的需求。不斷調(diào)整和拓展現(xiàn)有的數(shù)理統(tǒng)計(jì)教學(xué)內(nèi)容是一項(xiàng)必須而又重要的工作,我們這里只是做了一點(diǎn)初步的探討,拋磚引玉,希望與大家一起交流,共同促進(jìn)數(shù)理統(tǒng)計(jì)教學(xué)的發(fā)展。