曾惠芳,熊培銀
(湖南科技大學(xué) a.商學(xué)院;b.信息與電氣工程學(xué)院,湖南 湘潭 411201)
?
統(tǒng)計學(xué)課程教學(xué)的思考
曾惠芳a,熊培銀b
(湖南科技大學(xué) a.商學(xué)院;b.信息與電氣工程學(xué)院,湖南 湘潭 411201)
統(tǒng)計學(xué)是研究數(shù)據(jù)背后規(guī)律的一門科學(xué)。為使學(xué)生理解抽象的統(tǒng)計概念,培養(yǎng)統(tǒng)計思維,提高統(tǒng)計學(xué)修養(yǎng),圍繞統(tǒng)計學(xué)的概念,以生動形象的例子闡述數(shù)據(jù)的獲得,數(shù)據(jù)背后規(guī)律的刻畫,以及統(tǒng)計推斷的思想。
統(tǒng)計學(xué);規(guī)律性;隨機(jī)性;統(tǒng)計思維
統(tǒng)計學(xué)是研究如何獲取數(shù)據(jù)、分析數(shù)據(jù)、解釋數(shù)據(jù),從數(shù)據(jù)中提取信息、尋找規(guī)律性的科學(xué)。當(dāng)今,對統(tǒng)計學(xué)的理解、研究和實(shí)際應(yīng)用已經(jīng)擴(kuò)展到整個自然科學(xué)、社會科學(xué)、工程技術(shù)、管理、經(jīng)濟(jì)、藝術(shù)和文學(xué)等領(lǐng)域。統(tǒng)計學(xué)家威爾斯(H.G. Wells)曾指出:“就像讀和寫的能力一樣,將來有一天統(tǒng)計的思維方法會成為公民的必備能力。”[1]所以,學(xué)好統(tǒng)計學(xué)對學(xué)生來說具有深遠(yuǎn)的意義。統(tǒng)計學(xué)教學(xué)中應(yīng)注重抽象概念與生動例子的結(jié)合,提高學(xué)生的學(xué)習(xí)興趣。同時,培養(yǎng)學(xué)生的統(tǒng)計修養(yǎng),使其學(xué)會用統(tǒng)計思維觀察和認(rèn)識社會現(xiàn)象[2]。
統(tǒng)計學(xué)可以應(yīng)用于各領(lǐng)域。按薩維奇(L.J.Savage)的說法:“統(tǒng)計學(xué)基本上是寄生的,靠研究其他領(lǐng)域內(nèi)的工作而生存。這不是對統(tǒng)計學(xué)表示輕視,這是因?yàn)閷芏嗉闹鱽碚f,如果沒有寄生蟲就會死。對有的動物來說,如果沒有寄生蟲就不能消化它們的食物。因此,人類奮斗的很多領(lǐng)域,如果沒有統(tǒng)計學(xué),雖然不會死亡,但一定會變得很弱。”
統(tǒng)計學(xué)是一門非常實(shí)用的科學(xué),它的任務(wù)就是處理數(shù)據(jù)。那么什么是數(shù)據(jù)?拿擲骰子來說,擲骰子會得到什么值,是個隨機(jī)變量;而每次取得1~6點(diǎn)中任意點(diǎn)數(shù)的概率在理論上都是1/6(如果骰子均勻)。而在實(shí)際擲骰子過程中,如果擲100次,會得到100個由1~6點(diǎn)組成的數(shù)字串;再擲100次,又得到一個數(shù)字串,和前一次的結(jié)果很可能不一樣。這些試驗(yàn)結(jié)果就是數(shù)據(jù)。所以說,數(shù)據(jù)是關(guān)于變量的觀測值。
社會經(jīng)濟(jì)統(tǒng)計數(shù)據(jù)資料的來源主要有兩種渠道:一種是通過直接的調(diào)查獲得原始數(shù)據(jù),這是統(tǒng)計數(shù)據(jù)的直接來源,一般稱之為第一手或直接的統(tǒng)計數(shù)據(jù);另一種是別人調(diào)查的數(shù)據(jù),并將這些數(shù)據(jù)進(jìn)行加工和匯總后公布的數(shù)據(jù),通常稱之為第二手或間接的統(tǒng)計數(shù)據(jù)。一切間接的統(tǒng)計數(shù)據(jù)都是從直接的、第一手?jǐn)?shù)據(jù)過渡而來的。
我們處于一個大數(shù)據(jù)時代,每天都可以獲得大量的信息。應(yīng)該如何去認(rèn)識這些信息?如何在具有欺騙性的數(shù)據(jù)海洋中找到可靠有用的資料?怎樣憑借雙眼就能識破虛假的統(tǒng)計資料并揭穿它?對此,可以從五個方面對數(shù)據(jù)進(jìn)行探索檢驗(yàn)分析:1)數(shù)據(jù)是如何收集、記錄的?2)數(shù)據(jù)中含有測量誤差和記錄誤差嗎?有關(guān)測量值的概念和定義明確嗎?觀察值之間存在什么區(qū)別嗎?3)數(shù)據(jù)是真實(shí)的嗎?是所調(diào)查的原樣,還是以任何方式經(jīng)過人工偽造、編纂或修改過的?是否由觀察者自行決定刪除了任何觀察值?數(shù)據(jù)中是否存在任何或許會過度影響統(tǒng)計推斷的異常值?4)提供信息的觀察數(shù)據(jù)來自什么樣的總體?作為抽樣調(diào)查總體中所選定部分是否存在沒有回答的(部分或全部)?數(shù)據(jù)信息是來自單一總體,還是混合總體?與抽出樣本單位的識別和分類有關(guān)的因素都記錄下來了嗎?5)對所要調(diào)查研究的課題或是觀察數(shù)據(jù)的性質(zhì)是否存在任何先驗(yàn)信息?
任何對數(shù)據(jù)的探索和檢驗(yàn)分析都是為了了解數(shù)據(jù)的性質(zhì),剔除測量誤差、記錄誤差和異常值,檢驗(yàn)先驗(yàn)信息的有效性,檢測數(shù)據(jù)的真?zhèn)巍?shù)據(jù)的初始研究也用于檢驗(yàn)一個指定的模型的有效性或是對進(jìn)一步的數(shù)據(jù)分析選擇一個更合適的隨機(jī)概率模型或隨機(jī)概率模型族[3]。
統(tǒng)計學(xué)的重要作用是利用已有的數(shù)據(jù)來預(yù)測未來。利用已有的數(shù)據(jù)來預(yù)測未來,必須要找到一個恰當(dāng)?shù)慕y(tǒng)計模型,確切地說,就是一條分布曲線去擬合已有的數(shù)據(jù),然后用擬合的分布去預(yù)測在未來的觀察中各種值出現(xiàn)的可能性大小[4]。
例1:19世紀(jì)末,騎兵部隊(duì)是多數(shù)軍隊(duì)的一個組成部分,在騎兵部隊(duì)內(nèi)間或就有人被馬踢死。俄國統(tǒng)計學(xué)家博特基維茨對普魯士軍隊(duì)的10個騎兵部隊(duì)在1875~1894年這20年間的此類死亡情況進(jìn)行了記錄,并對此進(jìn)行了統(tǒng)計分析。表1給出了這200支騎兵部隊(duì)一年中被馬踢死的人數(shù)信息。
表1 200支騎兵部隊(duì)一年中被馬踢死的人數(shù)統(tǒng)計
在概率論中,大家對泊松分布產(chǎn)生的一般條件已有所了解,容易想到,200支騎兵部隊(duì)一年中被馬踢死的人數(shù),可以用一個泊松隨機(jī)變量來近似描述。也就是說,可以假設(shè)200支騎兵部隊(duì)一年中被馬踢死的人數(shù)的分布X近似泊松分布。
現(xiàn)在的問題是:上面的數(shù)據(jù)能否證實(shí)X具有泊松分布的假設(shè)是正確的?卡方檢驗(yàn)法是在總體X的分布未知時,根據(jù)來自總體的樣本,檢驗(yàn)關(guān)于總體分布的假設(shè)的一種檢驗(yàn)方法。
提出假設(shè)H0:X服從參數(shù)為λ的泊松分布。根據(jù)觀察結(jié)果,得參數(shù)λ的極大似然估計為
按參數(shù)λ為0.61的泊松分布,計算事件pi=Pr(X=i)的概率,pi的估計為
統(tǒng)計學(xué)的作用,一方面是對數(shù)據(jù)進(jìn)行概要的描述,另一方面是基于數(shù)據(jù)做出推斷,包括評價推斷的有效性。所謂統(tǒng)計推斷,是基于一個指定的隨機(jī)概率模型來估計未知參數(shù),進(jìn)行相應(yīng)的假設(shè)檢驗(yàn),預(yù)測未來的觀測值,以及做出決策等的統(tǒng)計方法。統(tǒng)計分析的目的是“從觀測得到的數(shù)據(jù)中提取有效的信息”。所記錄的數(shù)據(jù)中有時有某種缺陷,如存在記錄誤差和異常值,有時甚至可能是偽造的,一個統(tǒng)計學(xué)者首先應(yīng)做的是詳細(xì)考察或交叉檢驗(yàn)數(shù)據(jù),以便發(fā)現(xiàn)可能有的缺陷并了解數(shù)據(jù)的特征。下一步則是利用先驗(yàn)信息和交叉核實(shí)技術(shù),對數(shù)據(jù)提出一個合適的隨機(jī)概率模型。基于被選擇的模型進(jìn)行數(shù)據(jù)推斷分析,包括未知參數(shù)的估計,假設(shè)檢驗(yàn),對未來觀測值的預(yù)報以及做出決策[5]。
例2:一個魚塘的主人想知道池塘中有多少魚,他猜想數(shù)量在3 000條左右,但其實(shí)可能僅有它的一半,又或者是它的兩倍。逐一數(shù)魚是不可能的,那么他該怎么辦?
假設(shè)池塘中魚種的平均壽命大約為3年,所以花一個月左右的時間獲取魚的數(shù)量的過程,其出生與死亡數(shù)對總數(shù)量不會產(chǎn)生大的影響。他先捕到400條魚,貼上標(biāo)簽,再放回池塘。然后再從池塘捕300條魚,其中60條貼有標(biāo)簽。利用樣本比例估計總體比例,可得到魚塘中貼有標(biāo)簽的魚的比例的最佳估計為
統(tǒng)計學(xué)是一門十分實(shí)用的科學(xué),它并不是枯燥的數(shù)據(jù)和公式的堆砌。為了提高學(xué)生的學(xué)習(xí)興趣,調(diào)動學(xué)生學(xué)習(xí)的積極性與主動性,在教學(xué)的過程中,應(yīng)強(qiáng)調(diào)統(tǒng)計學(xué)的實(shí)用性,通過生動形象的例子和故事來表達(dá)統(tǒng)計思想。同時,應(yīng)注重實(shí)踐教學(xué),讓學(xué)生學(xué)會關(guān)注社會問題,并通過統(tǒng)計調(diào)查和統(tǒng)計分析,提高學(xué)生的統(tǒng)計應(yīng)用能力。
[1] C R 勞.統(tǒng)計與真理——怎樣運(yùn)用偶然性[M].北京:科學(xué)出版社,2004.
[2] 孫曉祥,惠英杰.數(shù)理統(tǒng)計課程教學(xué)中培養(yǎng)學(xué)生統(tǒng)計思維的幾點(diǎn)認(rèn)識[J].吉林農(nóng)業(yè)科技學(xué)院學(xué)報,2013,22(1):80-82.
[3] 劉旭華,田英,陳薇.對研究生數(shù)理統(tǒng)計課程教學(xué)的思考與探索[J].高等農(nóng)業(yè)教育,2010(7):76-78.
[4] 云霞.統(tǒng)計思維是現(xiàn)代人的標(biāo)簽[J].調(diào)研世界,2012(12):58-59.
[5] 劉娟.概率論與數(shù)理統(tǒng)計案例教學(xué)探討[J].當(dāng)代教育理論與實(shí)踐,2014,6(12):36-37.
(責(zé)任校對莫秀珍)
10.13582/j.cnki.1674-5884.2016.09.025
20150722
國家自然科學(xué)基金項(xiàng)目(41301421);湖南科技大學(xué)教學(xué)研究與改革項(xiàng)目(G31533)
曾惠芳(1981-),女,湖南邵陽人,副教授,主要從事貝葉斯統(tǒng)計研究。
F224.9, O212
A
1674-5884(2016)09-0078-03