鄒應軍,甘勝進
(福建技術師范學院a.體育學院;b.電子與信息工程學院,福建福清 350300)
隨著量化分析在體育活動評價中的重要性日益顯現(xiàn),體育統(tǒng)計迅速成為體育活動量化分析的一個有力工具,是從事體育教育與科研不可或缺的技能.許多高校甚至將《體育統(tǒng)計》這門課程納入本科生必修課程,并配備操作軟件EXCEL、SPSS、SAS等加以演示,取得了比較好的效果.然而,體育統(tǒng)計的理論基礎畢竟是數(shù)理統(tǒng)計,涉及到復雜的數(shù)學公式和推導,這對不具備高等數(shù)學基礎的體育科研與教育工作者來講,極具挑戰(zhàn)性,因此在體育統(tǒng)計應用過程中,常常出現(xiàn)跳過數(shù)據(jù)分布類型,直接利用軟件來處理樣本,這種做法既不符合數(shù)理統(tǒng)計規(guī)范,更不符合體育統(tǒng)計要求.再者,體育數(shù)據(jù)處理軟件EXCEL雖然簡潔,但在數(shù)據(jù)處理和統(tǒng)計圖表繪制方面表現(xiàn)欠佳;SPSS是菜單式軟件,不需要過多編寫程序,圖表輸出十分美觀,深受非統(tǒng)計類專業(yè)人士喜愛,但是其缺少靈活的數(shù)據(jù)分析;SAS雖然能通過手動編程靈活分析數(shù)據(jù),但是其內存占用較大,并且SPSS、SAS均為商用軟件,比較昂貴,但是大部分體育統(tǒng)計應用者利用破解版軟件進行體育統(tǒng)計分析,這在知識產權保護方面存在潛在風險.相比之下,R軟件完全共享免費,并且其強大的軟件包足以滿足統(tǒng)計分析要求,因此在統(tǒng)計學界扮演著舉足輕重的角色,其詳細使用說明請參看文獻[1-2].本文以體育統(tǒng)計中常見的T檢驗為例,借助統(tǒng)計軟件R來說明,利用T統(tǒng)計量作假設檢驗時需要注意的幾個問題,盡管已有相關體育統(tǒng)計方面文獻[3-8]對T檢驗做過注記,但是僅僅局限于依據(jù)定義概念對T檢驗作文字性描述.本文通過R軟件產生的偽隨機數(shù),模擬利用T檢驗后的名義顯著性水平來評價T檢驗效果,事實上利用統(tǒng)計模擬進行體育統(tǒng)計研究已有相關文獻[9].
標準T分布的定義[10]為:假定獨立同分布于標準正態(tài)分布,則服從自由度為n 的卡方分布,記為
通過T分布定義可得以下結論:①構造T分布的前提條件是總體為正態(tài)分布.②對于單樣本T分布而言,如果總體不服從正態(tài)分布,那么T1的精確分布也不是t分布,此時特別對于小樣本,如果仍然將T1看成t分布,那么統(tǒng)計推斷效果將大打折扣.如果樣本容量較 大,,依 據(jù) 中 心 極 限 定理可知,T1近似服從N(0,1),如果此時將T1看成t分布,那么對結果影響不大.③對于雙樣本T分布,如果兩獨立總體不服從正態(tài)分布,當兩樣本容量較大時,依據(jù)大數(shù)定律,再依據(jù)中心
T檢驗是在總體分布為正態(tài)情形下檢驗總體均值取值情況,或者兩個獨立齊性方差正態(tài)總體均值差異.前者為單樣本T檢驗,后者為兩樣本T檢驗.由于雙邊檢驗和單邊檢驗檢驗統(tǒng)計量一樣,其主要差別為拒絕域,故本文重點討論雙邊T檢驗.對于單樣本T檢驗而言,
無論是單樣本T檢驗還是雙樣本T檢驗,正態(tài)總體至關重要,判定樣本是否來自正態(tài)分布,R軟件一般采用Shapiro-Wilk正態(tài)性檢驗,例如社會體育專業(yè)某班35名學生《社會體育導論》考試成績?yōu)椋?7 69 93 62 71 81 46 66 70 69 75 73 69 88 60 71 85 75 74 79 77 74 82 79 73 60 69 64 50 69 73 91 91 86 64.先用頻率直方圖和Q-Q圖從直觀上判斷樣本是否來自正態(tài)分布總體,其R語言命令為:
f<-c(87,69,93,62,71,81,46,66,70,69,75,73,6 9,88,60,71,85,75,74,79,77,74,82,79,73,60,69,64,50,69,73,91,91,86,64)
par(mfrow=c(1,2))
hist(f,pro=T,main="社體導論成績頻率直方圖",xlab="成績",axes = TRUE)
lines(density(f))
qqnorm(f)
qqline(f)
圖1 頻率直方圖與正態(tài)Q-Q圖
圖1 為《社會體育導論》成績頻率直方圖與Q-Q圖,從左邊頻率直方圖來看,數(shù)據(jù)不是完全對稱,核密度曲線與正態(tài)分布密度函數(shù)有一定差異;從右邊Q-Q圖來看,數(shù)據(jù)點在直線附近波動,比較接近正態(tài)分布,這是從直觀上得到結論.進一步通過R語言命令shapiro.test(f)來檢驗樣本是否來自正態(tài)分布,其運行結果p值為0.4871,可以接受35名學生《社會體育導論》這門課的成績來自正態(tài)分布的論斷.
為了證實上述結論,選取顯著性水平α=0.05,在固定樣本容量n下,100次蒙特卡洛模擬接受原假設的次數(shù),如果原假設成立,則100次蒙特卡洛模擬大約有95次接受原假設,即接受原假設次數(shù)在95次附近波動,過大過小均不好,以上模擬再重復100次.在體育統(tǒng)計中,一般將n≥30作為大樣本,為了方便比較,以下統(tǒng)計模擬中既有小樣本,又有大樣本.圖2分別為總體X~N(4,1)和總體服從參數(shù)為1/4的指數(shù)分布下,采用單樣本T檢驗次數(shù)的箱線圖.其R語言程序代碼為:
b<-matrix(0,nr=100,nc=3)
m<-0
for(n in c(20,30,200)){
m<-m+1
s1<-0
for(j in 1:100){
s<-0
for(i in 1:100){
a<-rexp(n,0.25)
#a<-rnorm(n,4,1)
t<-(mean(a)-4)*sqrt(length(a))/sd(a)
if(pt(abs(t),length(a)-1,lower=F)>=0.025)s=s+1 }
s1[j]<-s}
b[,m]<-s1}
圖2左圖為總體正態(tài)分布,在樣本容量n分別為20、30、200下箱線圖,發(fā)現(xiàn)均在95附近波動.右圖為總體參數(shù)為1/4指數(shù)分布下利用T檢驗接受原假設次數(shù)箱線圖,從中可知,在小樣本下,表現(xiàn)得不令人滿意,隨著樣本容量增加,越來越向95靠攏.左圖中三種樣本容量下平均數(shù)分別為94.96 、95.63 、94.70,右圖中分別為92.15、 92.63、 94.58,顯然正態(tài)分布總體下T檢驗效果更好,當樣本容量比較大時,非正態(tài)總體下選用T檢驗效果也不錯,這進一步證實了1.1節(jié)中結論②.
圖2 正態(tài)分布總體與指數(shù)分布總體下,100次重復下,在各個樣本容量100次蒙特卡洛模擬中,利用單樣本T檢驗接受原假設次數(shù)的箱線圖.
圖3 分別為總體下,采用兩獨立樣本T檢驗,接受H0次數(shù)的箱線圖.其R語言程序與圖2類似,故省略.左圖為為兩樣本容量n1=n2,且分別為100、300、500下接受原假設次數(shù)的箱線圖,從圖中可知,其中位數(shù)均在95附近,采用T檢驗逼近的效果較好.右圖為,從圖中可知,接受原假設的次數(shù)的中位數(shù)均遠遠大于95,隨著逐漸變大并且差別不大時,接受原假設次數(shù)的中位數(shù)向95靠攏.
圖3 正態(tài)異方差總體下,100次重復下,在各個樣本容量100次蒙特卡洛模擬中,利用兩樣本T檢驗接受原假設次數(shù)的箱線圖.
圖4為兩非正態(tài)分布總體下,利用兩樣本T檢驗接受原假設的次數(shù)的箱線圖,兩非正態(tài)總體參數(shù)分別為1/20、1/4指數(shù)分布.左圖為兩指數(shù)分布總體樣本容量相等,分別為100、300、500時接受原假設次數(shù)的箱線圖,從中可以看出,均在95附近波動,檢驗效果比較符合預期.右圖為樣本容量不等,可以看出,檢驗效果極為糟糕,不過隨著樣本容量增大,兩樣本容量之間差別不大時,檢驗效果逐漸變好,這進一步驗證了1.1節(jié)中的結論③.
圖4 兩不同參數(shù)指數(shù)分布總體下,100次重復下,在各個樣本容量100次蒙特卡洛模擬中,利用兩樣本T檢驗接受原假設次數(shù)的箱線圖.
通過上述T檢驗理論分析以及統(tǒng)計模擬,在應用T檢驗進行體育統(tǒng)計應用之前,首先應該檢驗數(shù)據(jù)是否來自正態(tài)分布.如果正態(tài)性檢驗通過,便可應用單樣本T檢驗.如果正態(tài)性檢驗未通過,當兩樣本容量較大時,若兩樣本總體方差相等或者兩樣本容量相等,可應用雙樣本T檢驗.