朱 琳, 閆霏霏
(1.東華理工大學(xué) 理學(xué)院,江西 南昌330013;2.中國(guó)地質(zhì)大學(xué)(武漢)數(shù)學(xué)與物理學(xué)院,湖北武漢430074;3.華中科技大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,湖北武漢430074)
在高校的教學(xué)過程中,經(jīng)常要對(duì)成績(jī)、試卷或者其它材料進(jìn)行檢查分析,以便于對(duì)前一階段的教學(xué)狀況進(jìn)行評(píng)價(jià)及改進(jìn)。由于高校學(xué)生人數(shù)較多、范圍較廣,而時(shí)間、經(jīng)費(fèi)和精力有限,往往不能對(duì)全部情況進(jìn)行普查,只能進(jìn)行抽查。而目前抽樣時(shí),大部分高校使用的抽樣方法還是抽簽法,這種方法在被調(diào)查對(duì)象眾多的情況下,其費(fèi)時(shí)、費(fèi)力的弱點(diǎn)便非常明顯。本文通過高校中常需要抽樣的實(shí)際情況,結(jié)合抽樣調(diào)查理論,介紹了兩種抽樣方法并運(yùn)用SAS軟件(SAS 9.1.3版)進(jìn)行抽樣和推斷。SAS的抽樣功能比較強(qiáng)大,但現(xiàn)在市場(chǎng)上的SAS教材中介紹如何抽樣和推斷的不多,因此在文章中針對(duì)東華理工大學(xué)(以下簡(jiǎn)稱學(xué)校)的兩門公共數(shù)學(xué)課程的試卷抽樣及成績(jī)推斷給出了具體的實(shí)現(xiàn)過程。
在學(xué)校的課程設(shè)置中,概率論與數(shù)理統(tǒng)計(jì)屬于公共數(shù)學(xué)類課程,修課學(xué)生人數(shù)較多,但是期末試卷采取統(tǒng)一命題的形式,批改和成績(jī)登錄也都由大學(xué)數(shù)學(xué)教學(xué)部統(tǒng)一完成,批改后的試卷也集中保存。因此對(duì)試卷的抽樣調(diào)查不需要分批、分部門進(jìn)行,在對(duì)試卷情況和成績(jī)的調(diào)查時(shí)可用簡(jiǎn)單隨機(jī)抽樣法[1]進(jìn)行抽樣。
從有N個(gè)單元的總體(Y1,Y2,…,YN)中抽取n個(gè)單元(y1,y2,…,yn)作為樣本,一切可能的CnN種實(shí)現(xiàn)均有相同的概率出現(xiàn)。這時(shí)采用的無放回的等概率抽樣方式就是簡(jiǎn)單隨機(jī)抽樣。
在對(duì)2014年上半年學(xué)校南昌校區(qū)概率論與數(shù)理統(tǒng)計(jì)期末試卷進(jìn)行抽樣調(diào)查時(shí),有效考試(除了缺考、緩考等情況)的人數(shù)為1 844人,將這些學(xué)生名單作為總體(數(shù)據(jù)文件為gl201302)進(jìn)行抽樣。按照往常抽樣的習(xí)慣,抽取總?cè)藬?shù)的10%,也就是185人,將抽的樣本保存在臨時(shí)邏輯庫work下文件sample 中,用 SAS 的過程步 proc surveyselect[2-5]可以實(shí)現(xiàn),程序如下。
其中,proc surveyselect后的選項(xiàng)data指定被抽樣數(shù)據(jù)是臨時(shí)邏輯庫下的gl201302;method表明了所用的抽樣方法是簡(jiǎn)單隨機(jī)取樣(srs);rate表明抽樣比例為0.1(可用n=185代替);out表明樣本文件名,這里樣本數(shù)據(jù)存放在臨時(shí)邏輯庫下,文件名為Sample;seed=1234表明這次隨機(jī)抽樣的種子數(shù)是1234。
運(yùn)行程序后,被抽取的185位學(xué)生的名單信息保存在臨時(shí)邏輯庫下的數(shù)據(jù)文件sample中,試卷調(diào)查時(shí),只需對(duì)該文件中的學(xué)生試卷進(jìn)行調(diào)查。
與概率論與數(shù)理統(tǒng)計(jì)不同的是,學(xué)校高等數(shù)學(xué)的教學(xué)是針對(duì)不同的教學(xué)計(jì)劃而分批次進(jìn)行的,且不同批次的試卷的制定和批改均是分開的??紤]到不同批次之間的差異,在抽樣的時(shí)候需要用分層抽樣法[1]進(jìn)行抽樣。
分層抽樣是將大的總體分成若干小的總體,每一小總體成為一個(gè)層,在每層中抽取一個(gè)樣本,將各層的樣本合在一起組成原總體的一個(gè)分層樣本。有兩類情況適合進(jìn)行分層抽樣,一是各小的總體之間有明顯的差異,每層內(nèi)的各單元差異較小,層與層之間的差異較大;二是由于組織管理的方便,必須進(jìn)行分層。
對(duì)2014年上半年學(xué)校南昌校區(qū)高等數(shù)學(xué)Ⅱ期末試卷進(jìn)行抽樣時(shí),有效考試人數(shù)為3 288人,將這些學(xué)生名單作為總體(數(shù)據(jù)文件為gs201302)進(jìn)行抽樣。仍然抽取總?cè)藬?shù)的10%,也就是329人,將抽取的樣本保存到臨時(shí)邏輯庫,文件名為sample2。由于高等數(shù)學(xué)Ⅱ的教學(xué)是分5批進(jìn)行的,每批的人數(shù)不同,在分層(批)抽樣之前先統(tǒng)計(jì)每批的人數(shù)及每批的抽樣數(shù)。
每位同學(xué)的所屬批次記錄在變量_COL2中,可以用proc freq過程步進(jìn)行統(tǒng)計(jì)。
統(tǒng)計(jì)出的每批的總?cè)藬?shù)列在表1中。
表1 高等數(shù)學(xué)Ⅱ每批學(xué)生總?cè)藬?shù)
抽取每批的10%時(shí),抽取樣本數(shù)分別為138,76,36,53,26。
在進(jìn)行分層抽樣之前,先對(duì)數(shù)據(jù)gs201302按照分層變量_COL2進(jìn)行排序,這里用proc sort過程進(jìn)行排序。再用SAS的過程步proc surveyselect進(jìn)行分層抽樣。
用proc surveyselect進(jìn)行分層抽樣時(shí),method=srs表明每層內(nèi)仍然用簡(jiǎn)單隨機(jī)抽樣進(jìn)行抽樣;n后面列舉出每層要抽的樣本數(shù);其它的選項(xiàng)含義與前面相同。Strata后指明分層變量是_COL2。
抽取的329位學(xué)生的名單信息保存在臨時(shí)邏輯庫下的數(shù)據(jù)文件sample2中,同樣地,試卷調(diào)查時(shí),也只需這部分學(xué)生的試卷情況和成績(jī)進(jìn)行調(diào)查。
在對(duì)抽得的兩門課程的樣本試卷進(jìn)行調(diào)查后,往往希望通過樣本試卷的成績(jī)來對(duì)總體成績(jī)進(jìn)行估計(jì),通常需要估計(jì)的是總體的平均成績(jī)、優(yōu)秀率和不及格率。
(1)簡(jiǎn)單隨機(jī)樣本下的對(duì)總體的估計(jì)。在抽取簡(jiǎn)單隨機(jī)樣本后可以用簡(jiǎn)單估值法可得到樣本平均值,它是總體平均值的無偏估計(jì)中S2是總體方差。的一個(gè)無偏估計(jì)是,其中s2是樣本方差。
對(duì)抽到的文件sample中的185位同學(xué)的成績(jī)進(jìn)行調(diào)查后,將每位同學(xué)的成績(jī)保存至該文件,成績(jī)變量名為_COL8。對(duì)該成績(jī)進(jìn)行分析,估計(jì)出總體平均值也即是南昌校區(qū)該年級(jí)學(xué)生概率論與數(shù)理統(tǒng)計(jì)的平均成績(jī)及其95%的置信區(qū)間。用過程步 proc surveymeans[2]進(jìn)行實(shí)現(xiàn),程序如下:
這里,proc surveymeans后的選項(xiàng)data功能同上;total指定總體的人數(shù)1844;語句var后面列出要分析的變量名_COL8,也即是學(xué)生成績(jī)。
程序運(yùn)行后在結(jié)果窗口中可以看到對(duì)總體平均成績(jī)、其均方偏差和95%置信區(qū)間的估計(jì),見表2(數(shù)據(jù)保留三位小數(shù),下同)。
表2 概率論與數(shù)理統(tǒng)計(jì)平均成績(jī)的估計(jì)結(jié)果
從輸出結(jié)果可知,這次抽樣的樣本量是185,平均成績(jī)ˉy=66.403,平均成績(jī)的均方偏差v(ˉy)=1.555,總體平均分的 95% 置信區(qū)間是[63.335,69.471]也即是
這里需要注意的是在對(duì)sample2的數(shù)據(jù)進(jìn)行分析時(shí),層與層之間的抽樣比差別不大,因此校正前后的結(jié)果差別不大。如果是在每層的抽樣比差別比較大的情況下時(shí),加權(quán)是必要的。
從分析結(jié)果可知,這次抽樣的樣本量是329,均的值,這里α=0.05。而事實(shí)上,由大學(xué)數(shù)學(xué)教學(xué)部統(tǒng)計(jì)出來的該學(xué)期南昌校區(qū)概率論與數(shù)理統(tǒng)計(jì)總體平均分是67.643,可以看出包含在此置信區(qū)間內(nèi)。
(2)分層樣本下的對(duì)總體的估計(jì)。如果分層抽樣樣本是從每一層獨(dú)立抽取的,每一層內(nèi)抽取的是簡(jiǎn)單隨機(jī)樣本,且每層的總體平均值ˉY用簡(jiǎn)單估值時(shí),則估計(jì)量是的無偏估計(jì)。對(duì)應(yīng)的均方偏差為,而它的一個(gè)無偏估計(jì)為
對(duì)樣本sample2中的329位同學(xué)的高等數(shù)學(xué)Ⅱ試卷成績(jī)進(jìn)行調(diào)查統(tǒng)計(jì)后,要估計(jì)出總體平均成值及其95%的置信區(qū)間。與不分層的情況不同的是,在用過程步proc surveymeans進(jìn)行樣本分析之前,要先給出每批考試的總?cè)藬?shù)。
將每批考試的總?cè)藬?shù)讀入一個(gè)數(shù)據(jù)集groups。
程序運(yùn)行后在結(jié)果窗口中可以看到對(duì)總體成績(jī)、其均方偏差和95%置信區(qū)間的估計(jì)(見表3)。
表3 高等數(shù)學(xué)Ⅱ平均成績(jī)的估計(jì)結(jié)果
在抽樣的時(shí)候,由于抽樣個(gè)數(shù)是整數(shù),取整時(shí)造成實(shí)際上各層之間單元抽樣的概率并不相同。為了對(duì)結(jié)果進(jìn)行校正,可以將每層的抽樣概率的倒數(shù)作為權(quán)重對(duì)考試成績(jī)進(jìn)行加權(quán)。而用proc surveyselect進(jìn)行分層抽樣時(shí)各個(gè)樣本單元的抽樣比及其倒數(shù)(samplingweight)已經(jīng)包含在樣本數(shù)據(jù)中,所以在proc surveymeans過程中可以將該變量作為權(quán)重進(jìn)行計(jì)算,也即是在上面的語句中再加上weight samplingweight語句,可得到校正后的結(jié)果(見表4)。值,均值的均方偏差v(ˉy)=1.201,總體均值的95%置信區(qū)間是[59.648,64.373]。而事實(shí)上,大學(xué)數(shù)學(xué)教學(xué)部統(tǒng)計(jì)出來的該學(xué)期本科生高等數(shù)學(xué)Ⅱ成績(jī)均值為62.834,在此置信區(qū)間內(nèi),且與估計(jì)值絕對(duì)誤差僅有0.824。
表4 高等數(shù)學(xué)Ⅱ平均成績(jī)校正后的估計(jì)結(jié)果
在對(duì)成績(jī)進(jìn)行調(diào)查時(shí),往往還希望了解該課程的考試優(yōu)秀率(成績(jī)大于或等于90分)或不及格率(成績(jī)低于60分)。以調(diào)查不及格率為例,如果將不及格稱為特征,而我們要調(diào)查的這一特征的比例,其實(shí)就是符合該特征的個(gè)體的個(gè)數(shù)占總單元數(shù)的比例。令
則z=z1+z2+…+zn即為樣本中具有該特征的個(gè)體總數(shù)n1,而平均數(shù)是該樣本中具有該特征的單元的比例p,是總體中具有該特征的比例P的一個(gè)無偏估計(jì)。因此我們只需要將樣本中具有該特征的個(gè)體標(biāo)記出來,然后用前面介紹的proc surveymeans過程對(duì)總體進(jìn)行推斷即可。
要了解概率論與數(shù)理統(tǒng)計(jì)中考試不及格的學(xué)生占的比例,需要先生成一個(gè)數(shù)據(jù)集,將含有該課程成績(jī)的樣本中不及格的標(biāo)注出來,不妨取該變量名為 fail。
再用推斷概率論與數(shù)理統(tǒng)計(jì)平均成績(jī)的方法進(jìn)行分析即可,只需將分析的數(shù)據(jù)集換成sample3,分析的變量換成fail。
在輸出窗口看到的結(jié)果如表5所示。
表5 概率論與數(shù)理統(tǒng)計(jì)考試不及格率的推斷結(jié)果
從結(jié)果中可以知道,推斷總體中不及格比例為0.227,而該比例的 95% 置信區(qū)間為[0.169,0.285]。
而對(duì)于高等數(shù)學(xué)Ⅱ成績(jī)不及格的比例的推斷過程與之類似,只需要將proc surveymeans的分析方法換成2.2節(jié)中對(duì)分層樣本的分析即可。
SAS的surveyselect過程能實(shí)現(xiàn)的抽樣的方法較多,除了簡(jiǎn)單隨機(jī)抽樣(srs),可重復(fù)的簡(jiǎn)單隨機(jī)抽樣(urs)還有系統(tǒng)抽樣(sys)、序列抽樣(seq)、pps抽樣(pps)等抽樣方法[3]。在本文中介紹的兩種抽樣方法使用比較普遍,除了對(duì)試卷的抽樣,比如還有對(duì)大四畢業(yè)生的就業(yè)實(shí)習(xí)和畢業(yè)論文的抽查,由于這些材料由各個(gè)學(xué)院組織完成,因此材料抽查要在各學(xué)院分別進(jìn)行,這時(shí)要用分層抽樣法進(jìn)行抽樣。但如果抽樣時(shí)只抽取學(xué)院,且要以該學(xué)院的規(guī)模大小作為權(quán)重時(shí),使用pps抽樣比較恰當(dāng)。抽樣時(shí)具體選用哪種抽樣方法進(jìn)行抽樣要視應(yīng)用時(shí)的實(shí)際情況而定。
另外需要注意的是,在每次對(duì)同一個(gè)總體進(jìn)行抽樣的時(shí)候,如果種子數(shù)沒有指定,或者每次隨機(jī)抽取的時(shí)候給定的種子數(shù)不同,可能得到的抽樣結(jié)果不同。在對(duì)總體情況進(jìn)行推斷時(shí),在允許的條件下盡量多抽幾次樣本,對(duì)每次抽得樣本的分析結(jié)果取平均值來作為總體的估計(jì)值。
[1]孫山澤.抽樣調(diào)查[M].北京:北京大學(xué)出版社,2012:1-203.
[2]黨輝,郭家鋼.SAS統(tǒng)計(jì)軟件的SURVEYSELECT過程在血吸蟲病流行病學(xué)抽樣調(diào)查中的應(yīng)用[J].熱帶病與寄生蟲學(xué).2006,4(2):67-70.
[3]譚志軍,徐勇勇,等.應(yīng)用SAS和SPSS進(jìn)行復(fù)雜抽樣[J].中國(guó)衛(wèi)生統(tǒng)計(jì),2012,29(1):145-146.
[4]汪海波,等.SAS統(tǒng)計(jì)分析與應(yīng)用——從入門到精通[M].北京:人民郵電出版社,2011:411-438.
[5]王睿,賀佳.隨機(jī)抽樣方法的SAS實(shí)現(xiàn)[J].中國(guó)衛(wèi)生統(tǒng)計(jì),2007,24(1):85,93.