王本洋 (華南農業(yè)大學林學院,廣東 廣州 510642)
試卷質量分析的數(shù)學模型及其R語言實現(xiàn)
王本洋 (華南農業(yè)大學林學院,廣東 廣州 510642)
試卷質量分析具有成熟的數(shù)學模型,但由于計算項目多樣、過程繁瑣,多數(shù)情況下需要借助統(tǒng)計軟件完成分析過程。結合程序流程圖,介紹了試卷質量分析數(shù)學模型的R語言實現(xiàn),并以實例數(shù)據(jù)驗證其有效性。結果表明,基于R語言的程序腳本可以快速獲取多種基本描述性統(tǒng)計指標、正態(tài)性檢驗結果和難度、區(qū)分度、效度、信度等四度指標。R語言用于試卷質量分析可行、有效,相比其他大型商業(yè)統(tǒng)計軟件,具有明顯的便捷性。
試卷評價;描述性統(tǒng)計;四度指標;R軟件
試卷質量是保證考試成績客觀反映學生的知識、能力和素質狀況的關鍵[1]。試卷質量分析是試卷分析的重要內容之一[2],其分析過程涉及的計算方法有成熟的數(shù)學模型[1,3]。但由于計算項目多樣、計算過程繁瑣,多數(shù)情況下需要借助統(tǒng)計軟件完成分析過程。其中,SPSS軟件因其用戶界面友好,通過菜單操作即可實現(xiàn)絕大部分統(tǒng)計分析功能,因此其應用最為廣泛[4]。也有少數(shù)利用Matlab[5]等商業(yè)統(tǒng)計軟件進行試卷質量分析的研究報道。
但是在實際應用中,前述軟件或者安裝過程復雜,系統(tǒng)配置要求較高,分析過程復雜(如SAS,Matlab);或者操作雖簡單但步驟繁多(如SPSS,Eecel);并且都存在知識產(chǎn)權問題。因此,作為考試之后的一項重要常規(guī)性工作,試卷質量分析需要更加便捷、標準的分析環(huán)境。
R是一款完全免費、開源的統(tǒng)計軟件,由新西蘭Auckland大學的Robert Gentleman和Ross Ihaka 等開發(fā)。R語言支持多種格式數(shù)據(jù)(Eecel、 SPSS、S-Plus、SAS等)的讀取,與廣泛使用的統(tǒng)計軟件 S/S-Plus兼容,具有完整的數(shù)據(jù)處理、統(tǒng)計分析和統(tǒng)計制圖等功能。R的開源設計允許用戶根據(jù)需要編寫自己的程序包,并可上傳到網(wǎng)絡。R具備的平臺獨立性、開源性和可擴展性等特性[6]使得其在科學研究中得到越來越廣泛的應用。戴小華[6]運用R語言的GIS功能包生成了中國柑橘主要病蟲害的空間分布圖。金明和丁貴杰[7]介紹了基于R軟件平臺的馬尾松人工林林分材種結構預測系統(tǒng)。羅玫等[8]利用R語言可跨平臺操作以及對矩陣運算高速的特點,實現(xiàn)了改進的模糊綜合評價模型,驗證了其在不同操作系統(tǒng)下運行的可靠性及有效性?;赗語言的教學研究尚鮮見報道。
下面,筆者在介紹試卷質量分析常用指標的數(shù)學模型的基礎上,分析其R語言實現(xiàn)方法,最后以實例驗證基于R語言的程序腳本用于試卷質量分析的可行性、有效性和便捷性,為廣大教師進行試卷分析提供參考,并為基于R軟件的深入應用和研發(fā)提供借鑒。
根據(jù)教育測量理論[2],試卷質量分析的指標主要是四度,即難度(Difficulty)、區(qū)分度(Discrimination)、效度(Validity)和信度(Reliability)。試卷定量分析常用四度指標來進行,這是統(tǒng)計學方法在科學分析考試中的一種應用[3]。任治斌和單蓉[5]以教育統(tǒng)計與測量理論為基礎,根據(jù)學生考試原始成績,根據(jù)四度指標給出了試卷質量分析的數(shù)學模型。安萍莉等[1]選擇平均成績、標準差、全距、眾數(shù)、偏度、峰度、平均難度等作為分析指標,對考試成績進行了研究。
筆者選取試卷質量分析的主要指標12個,分為2類:第1是考試成績的基本描述性統(tǒng)計指標,包括成績的均值(Mean)、最小值(Min.)、最大值(Max.)、全距(Range)、標準差(S.D.)、峰度(Ku.)、偏度(Sk.)和成績分布正態(tài)性等8個指標;第2類是四度指標。各個指標的原始模型參見文獻[1,6]。
試卷質量分析數(shù)學模型的R語言實現(xiàn)(見圖1)由一段主調程序(Caller)、一個以函數(shù)形式存在的主程序(getPQind)、以及負責計算各指標的子函數(shù)(Function)構成。其中,子函數(shù)可以根據(jù)實際需要方便地增加或修改。
2.1Excel成績數(shù)據(jù)
在Excel中輸入成績數(shù)據(jù)(見圖2)。數(shù)據(jù)存放要求:①第1行為數(shù)據(jù)名稱;②第2行包含各題滿分數(shù)據(jù),非滿分數(shù)據(jù)的單元格可留空;③各題成績及總分數(shù)據(jù)存放于連續(xù)的列。為了簡化后續(xù)代碼編寫,最后將Excel文件另存為擴展名為csv的數(shù)據(jù)文件(如eg1.csv)備用。
圖1 試卷質量分析R語言實現(xiàn)流程 圖2 Excel成績數(shù)據(jù)
圖3 試卷質量分析的R語言腳本程序
2.2主調程序
首次使用時,需要在R軟件中新建一個程序腳本,把主調程序(圖3中的第1~2行)粘貼到該腳本中,備用。以后可重復使用該主調程序。 其中第2行應根據(jù)實際改為成績數(shù)據(jù)所在文件夾。
2.3主函數(shù)
主函數(shù)getPQind有6個參數(shù)(見表1),其中第1個參數(shù)為必要參數(shù),為待分析的成績數(shù)據(jù);其他5個參數(shù)根據(jù)實際情況可選擇性輸入(見圖3)。 主函數(shù)getPQind的源代碼約400行,由作者編寫,具有可重用性。
表1 主函數(shù)getPQind的6個參數(shù)
注:無默認值的參數(shù)為必要參數(shù);有默認值的參數(shù)為可選參數(shù)。
以文獻[5]中的數(shù)據(jù)為例,說明主調程序的使用方法,驗證分析結果的有效性。然后以華南農業(yè)大學林學院《旅游禮儀禮節(jié)》某次考試成績?yōu)槔?,介紹區(qū)分班級時試卷分析主函數(shù)getPQind的使用方法。
3.1案例1
根據(jù)文獻[5]準備成績數(shù)據(jù),運行圖3中的案例1代碼(第3~4行)即可獲得試卷質量分析有關指標(見圖4)。結果表明,該套試卷的考生成績不符合正態(tài)分布(p-value=0.03602),信度(ReliabilityAlpha)為0.6274。另外,試題及試卷難度為0.3071,總體區(qū)分度(PaperDiscrim2)為0.3731,以相關系數(shù)表示的試題效度(ValidityV)等其他數(shù)據(jù)與文獻結果一致。
3.2案例2
圖4 案例1的四度指標等試卷分析結果 圖5 案例2的四度指標等試卷分析結果
以華南農業(yè)大學林學院《旅游禮儀禮節(jié)》某次考試成績數(shù)據(jù)(圖2,部分)為例,說明主函數(shù)getPQind的高級使用方法。根據(jù)成績數(shù)據(jù),運行圖3中案例2代碼(第7~8行)即可獲得試卷質量分析有關指標(見圖5)。其中主函數(shù)getPQind參數(shù)的意義是:該次考試有5個班級(nclass=5)參加,標記班級的數(shù)據(jù)在第2列(nclasscol=2),成績數(shù)據(jù)從第3列開始連續(xù)存放(ncolfrom=3),共有4個題目(nparts=4),當前分析針對2班進行(nclasscode=2)。結果表明,該套試卷的考生成績符合正態(tài)分布(p-value=0.2382),試卷難度為0.1132;信度為0.3494;各題區(qū)分度分別為0.5961,0.5434,0.5228,0.6791,均大于0.4;以相關系數(shù)表示的效度值均小于0.2(僅第1題與第4題間相關系數(shù)0.4054>0.2)??傮w上該套試卷在2班表現(xiàn)為難度較低,信度中等,區(qū)分度和效度較高。
試卷分析是考試之后的一項重要工作,其結果是對考試工作進行總結并給予恰當評價的重要依據(jù)[3]。通過試卷分析,評價試題的難易程度,有助于改善和提高試題質量,并發(fā)現(xiàn)教學過程中的不足,改進教學方法,提高教學質量[3]。試卷質量分析項目較多樣,計算過程較繁瑣,需要借助統(tǒng)計軟件實現(xiàn)分析過程。SAS、Matlab、SPSS等大型統(tǒng)計軟件或者Excel軟件因為操作復雜或者存在知識產(chǎn)權問題,不適應常規(guī)的試卷質量分析工作。免費、開源的R軟件具有完整的數(shù)據(jù)處理、統(tǒng)計分析和統(tǒng)計制圖等功能,調用本文編寫的基于R語言的程序腳本,用戶只需要編寫或修改2行代碼即可獲得多項試卷質量分析指標。試卷質量分析數(shù)學模型的R語言實現(xiàn)利用了R軟件的統(tǒng)計環(huán)境,用于試卷質量分析可行、有效,相比其他大型商業(yè)統(tǒng)計軟件,具有明顯的便捷性。
[1]安萍莉,郭淑媛,王嗇,等.大學考試試題質量研究 [J].高等農業(yè)教育,2006(2): 43-48.
[2]陳玉琨.教育評價學 [M].北京: 人民教育出版社,1999.
[3]趙立新,陳文藝,郭子君.試卷質量的定量評價 [J].華南農業(yè)大學學報(社會科學版),2004(4): 136-141.
[4]劉翔,趙昆渝,李智東.用SPSS對理工科試卷進行分析與評價 [J].長江大學學報(自然科學版)理工卷,2008(1): 182-185.
[5]任治斌,單蓉.基于Matlab的試卷質量分析方法研究 [J].廣西民族師范學院學報,2011,28(3): 30-31.
[6]戴小華.基于R語言的中國柑橘主要病蟲害空間分布圖 [J].江西農業(yè)學報,2009,21(4): 76-83.
[7]金明,丁貴杰.馬尾松人工林林分材種結構預測系統(tǒng)在R軟件中的實現(xiàn) [J].貴州林業(yè)科技,2011,39(2): 1-5.
[8]羅玫,趙嵩正,蔣建洪.模糊綜合評價模型的R語言實現(xiàn) [J].航空計算技術,2011,(4): 56-61,66.
10.3969/j.issn.1673-1409(N).2012.08.038
TP311.1
A
1673-1409(2012)08-N114-03
2012-05-26
國家特色專業(yè)建設點——林學(教高函[201015]號)。
王本洋(1973-),男,1998年大學畢業(yè),博士,講師,現(xiàn)主要從事林學、高等教育學方面的教學與研究工作。
[編輯] 洪云飛