饒映雪
摘要:為了取得更好的教學(xué)效果,提升教學(xué)質(zhì)量,需要對教學(xué)效果進(jìn)行評價,而對試卷質(zhì)量和考試結(jié)果進(jìn)行科學(xué)化測度有助于檢驗教學(xué)效果。本文以SPSS為統(tǒng)計分析工具,通過成績分布直方圖、題目難度等指標(biāo)來科學(xué)化測度試卷質(zhì)量,直觀分析考試結(jié)果,從而掌握考試信息規(guī)律,借助試卷測度來評估教學(xué)效果,為課程教學(xué)效果的評價分析提供參考模式。
關(guān)鍵詞:教學(xué)效果;SPSS;測度
教育教學(xué)的基本目的在于培養(yǎng)人的綜合素質(zhì),豐富人的知識和才能,而對教學(xué)活動效果的評價是其中至關(guān)重要的組成部分,可以說教學(xué)效果評價是測評、促進(jìn)教學(xué)質(zhì)量的關(guān)鍵環(huán)節(jié)。對于教學(xué)效果的評價,最為傳統(tǒng)而有效的方式是考試,考試既可以檢驗學(xué)生的學(xué)習(xí)情況,也可以了解教師的教學(xué)效果和個人能力,因此考試這樣一種教學(xué)評估的方式雖然飽受詬病,卻仍然是不可或缺的重要手段。考試評估的科學(xué)合理與否,關(guān)系到教學(xué)效果評估的有效性與合理性,因此需要采用科學(xué)化的測度手段,利用教育統(tǒng)計學(xué)方法,在保證試卷出題質(zhì)量的基礎(chǔ)上,才能將考試結(jié)果作為檢驗學(xué)生、教師的重要指標(biāo)。本文以武漢市某高校某年級學(xué)生的79份《經(jīng)濟(jì)學(xué)原理》考試樣卷為樣本,借助統(tǒng)計學(xué)軟件SPSS進(jìn)行量化分析,旨在結(jié)合實例分析,探討在教學(xué)實踐中如何利用科學(xué)統(tǒng)計學(xué)方法,深入挖掘考試的有價值內(nèi)容,進(jìn)而促進(jìn)教學(xué)質(zhì)量的提升。
一、研究框架及數(shù)據(jù)處理
本文的研究主要借助SPSS統(tǒng)計學(xué)軟件,主要研究內(nèi)容包括試卷題型及分值構(gòu)建、考試成績錄入和分析結(jié)果輸出模塊等。
本次考試的試卷經(jīng)過初步構(gòu)建、中程調(diào)適最終得以形成。待檢驗的試卷題目總數(shù)為40,其中客觀題數(shù)為29,主觀題數(shù)為11。試卷題型及分?jǐn)?shù)結(jié)構(gòu)如表1??忌藬?shù)為79,有效樣本數(shù)為79。經(jīng)過客觀公正批改,形成實得成績。根據(jù)成績既定功效的不同,可以采用不同的成績統(tǒng)計匯總方法。首先在Excel文件中將數(shù)據(jù)錄入完畢,然后將其導(dǎo)入SPSS分析軟件。
(一)數(shù)據(jù)錄入
數(shù)據(jù)錄入需要視考量成績匯總用途而定,在匯總成績時如果主要考慮測評學(xué)生的學(xué)習(xí)能力,匯總錄入學(xué)生卷面總成績即可,如果考慮測度試卷的質(zhì)量,還需要進(jìn)一步匯總錄入試卷各小題的得分情況,生成更為細(xì)致具體的數(shù)據(jù)表。具體錄入操作規(guī)程為:進(jìn)入SPSS軟件后,點(diǎn)擊進(jìn)入數(shù)據(jù)編輯器,再點(diǎn)擊進(jìn)入Variable View標(biāo)簽,在變量命名定義界面里的Name標(biāo)題下標(biāo)注題號(Q1~Q40),總分項命名為Total,ID為學(xué)生的學(xué)號,Label標(biāo)題下添加定義內(nèi)容,完成定義設(shè)置后返回數(shù)據(jù)編輯器錄入數(shù)據(jù)。
數(shù)據(jù)錄入時,按序列一次輸入學(xué)生各題目的成績和總成績,依次輸入每位學(xué)生的成績,之后得到擴(kuò)展名為“sav”格式的文件。
(二)數(shù)據(jù)導(dǎo)入
SPSS格式文件的擴(kuò)展名為“sav”。人們一般不會直接將數(shù)據(jù)錄入SPSS系統(tǒng),因為sav格式的數(shù)據(jù)修改起來較xls文件顯得笨拙。所以在實際操作當(dāng)中,往往是直接將統(tǒng)計匯總完畢的數(shù)據(jù)導(dǎo)入SPSS用以分析。SPSS可以識別包括Microsoft Excel、Lotus、Sylk、SAS、dBase、Stata等格式的數(shù)據(jù)文件,其中以Excel文件使用最為廣泛。以Excel文件的導(dǎo)入為例,具體導(dǎo)入操作規(guī)程為:運(yùn)行File,找到Open選項,點(diǎn)擊Data進(jìn)入文件所在地,選擇文件類型為Excel或All Files,點(diǎn)選需要導(dǎo)入的文件,在彈出的對話框中勾選Read復(fù)選框,選擇OK按鈕,就可以顯示導(dǎo)入的文件內(nèi)容。其中需要注意的是,點(diǎn)選Read復(fù)選框可以將表格第一行變成變量名導(dǎo)入而非數(shù)據(jù)導(dǎo)入。
二、實驗步驟
(一)建立教學(xué)效果分布直方圖
在教育統(tǒng)計方法中,正態(tài)分布最為常見,在特定條件下的考試成績應(yīng)該也服從該規(guī)律。一般而言,學(xué)生考試成績平均分在75分區(qū)間,標(biāo)準(zhǔn)差通常在5~9區(qū)間,這樣的數(shù)據(jù)表明試卷的設(shè)置難易度較為合理,通常特定教學(xué)環(huán)境下、特定學(xué)生群體的真實成績都在這一范圍內(nèi)。
SPSS軟件中的具體操作程序為:運(yùn)行Analyze找到頻數(shù)表,導(dǎo)入Total,運(yùn)行菜單中的With normal curve 得到直方圖,從頻率表和直觀圖可以觀察考試成績的分布情況。本文研究的79名學(xué)生的成績情況來看,接近正態(tài)分布,結(jié)果符合統(tǒng)計學(xué)原理。
(二)題目難易度分析
難度(Difficulty)借助通過率或得分比來計算,對于選擇題等客觀題來說,一般是用通過率來表達(dá)難度的大小。以主觀題(Q30~Q40)為例,利用SPSS軟件的分析方法為:將Descriptives中的Q30~Q40選入Vaviable(s),得出均值,再建立 包含均值與滿分值的數(shù)據(jù)文件,輸入難度系數(shù)P和公式Mean/W,計算得出考試的難度統(tǒng)計結(jié)果。以本次考試為例,其難度統(tǒng)計結(jié)果詳情見表2。
通常考試試卷上試題的難度在0.5左右最為合適,如果考試的目的是為了選撥學(xué)習(xí)成績更好的學(xué)生,可以適當(dāng)提高試卷試題的難度,而如果考試的目的僅是為了衡量學(xué)生學(xué)習(xí)的達(dá)標(biāo)情況,則試題難度一般會相應(yīng)降低,并增加部分高難度試題來考察學(xué)生的差異情況。因此,試卷試題的難度系數(shù)多控制在0.3~0.8區(qū)間,且要拉開試題的難度系數(shù),以免同質(zhì)化的試題降低了試卷整體的區(qū)分力,既要有部分試題難度偏高,也要有部分試題難度偏低,使試卷難度有所分散。只有如此,試卷測評學(xué)生學(xué)習(xí)情況的作用才可以較好的實現(xiàn),也更容易掌握學(xué)生學(xué)習(xí)中暴露出的問題,體現(xiàn)出教師的教學(xué)情況。
從表2中我們可以發(fā)現(xiàn),本次試卷上的習(xí)題中以Q20題最難,難度系數(shù)0.06;而Q5等題偏難,難度系數(shù)在0.30以下;Q30題最簡單,難度系數(shù)為1.00,表明全部同學(xué)都得分;Q11等題偏簡單,難度系數(shù)在0.80以上。試卷整體的試題難易程度比較合理,同時難度系數(shù)低的題比較集中于主觀題類型上,這也可以體現(xiàn)出學(xué)生主觀題把握的比較準(zhǔn)確和出色。
(三)題目區(qū)分度分析
題目的區(qū)分度主要指的是試卷上的試題對學(xué)生學(xué)習(xí)情況的區(qū)分鑒別能力,區(qū)分度好的試題能夠更好的體現(xiàn)出學(xué)生學(xué)習(xí)情況的差異水平,因此區(qū)分度是試卷評價的重要因素,一個合理有效的試卷應(yīng)該具有較高的區(qū)分度。
利用SPSS軟件來計算試卷的區(qū)分度,如果是客觀題則可以在軟件中選擇Bivariate選項,然后選擇試題序號選項和Total字段進(jìn)入表達(dá)式,再選擇Spearman獲取輸出結(jié)果,而如果是主觀題,則需要進(jìn)入表達(dá)式后選擇Pearson。得到輸出結(jié)果后,能夠找出區(qū)分度數(shù)值,針對本次試卷試題的區(qū)分度情況來看,Q4等試題的區(qū)分度不高,可以考慮加以修改或是淘汰刪除處理。
(四)信度分析
信度反應(yīng)的是考試中隨機(jī)因素的影響,如果隨機(jī)因素影響比較小,則信度的數(shù)值就比較大,反之則信度小,隨機(jī)因素影響與信度成負(fù)相關(guān)。因此信度是一種衡量試卷穩(wěn)定性的數(shù)值,本次試卷的信度分析采用科隆巴赫α系數(shù),該系數(shù)能夠計算測驗內(nèi)部的各種一致性系數(shù),無需題目是記分型,因此應(yīng)用范圍十分廣泛。實際操作流程為:打開Analyze,從中點(diǎn)開Reliability Analysis,在信度分析對話框中選擇全部表示題目的字段,選用Alpha方法,從而求得信度系數(shù)。本次考試的信度系數(shù)為:Alpha=0.576。信度值的合理范圍為0.5~0.9,本次測試的信度系數(shù)為0.576,信度較低。
(五)效度分析
效度(Validity)是覆蓋面和權(quán)重在多大程度上體現(xiàn)了教學(xué)大綱的要求,能否有效檢驗考試能力水平。利用標(biāo)準(zhǔn)關(guān)聯(lián)效度法(predictive validity)進(jìn)行測度,把學(xué)生的平時成績作為效度分析的標(biāo)準(zhǔn),利用積差相關(guān)法求效度(Pearson法)。具體操作方法為先建立考試成績與平時成績表,其中Total為考試總分,PS為平時成績。在SPSS中單擊Analyze→Correlate→Bivariate,選擇Total和PS字段進(jìn)入表達(dá)式,然后在Correlation Coefficients中單擊Pearson。本次考試的試卷效度為0.593。效度只有高低之分,沒有全部有效和全部無效之分。效度的取值范圍在0至1之間。對于一次考試來說,其效度系數(shù)一般應(yīng)在0.4~0.7之間,值越大效度越高。
三、結(jié)語
根據(jù)測度結(jié)果進(jìn)行試卷調(diào)適,并對考試考評方法進(jìn)行改革,是試卷科學(xué)性測度的重要目的,有利于教學(xué)質(zhì)量和教師素質(zhì)的的提高。對考試考評的改革應(yīng)體現(xiàn)在以下三個方面:一是進(jìn)行全過程考核。對學(xué)生學(xué)習(xí)的全過程進(jìn)行考核,注重學(xué)生課堂參與度的評價,側(cè)重平時成績,特別是在翻轉(zhuǎn)課堂、模擬課堂中的小組學(xué)習(xí)參與、主題發(fā)言等。在《經(jīng)濟(jì)學(xué)原理》課程的考試中,以學(xué)生在課堂中的參與度設(shè)立評價指標(biāo),以自評和互評的方法按照權(quán)重和學(xué)生表現(xiàn)打分,以50%的比例計入總評成績。二是強(qiáng)化對知識與理論的應(yīng)用能力考核?!督?jīng)濟(jì)學(xué)原理》期末考試的題型多多傳統(tǒng)的單選題、多選題、簡答題、論述題等試題,缺少實踐能力考評,在改革過程中應(yīng)在注重考查基本知識與理論的基礎(chǔ)上,強(qiáng)化對知識與理論的應(yīng)用能力,將學(xué)生對當(dāng)前國民經(jīng)濟(jì)和生活中經(jīng)濟(jì)學(xué)的理解通過PPT講解的形式納入考核中,由老師對學(xué)生的表現(xiàn)和實踐進(jìn)行評分,作為最終成績的一部分。三是進(jìn)行操作性技能考核。依托學(xué)校和國家組織的大學(xué)生創(chuàng)新創(chuàng)業(yè)大賽等活動,對《經(jīng)濟(jì)學(xué)原理》課程進(jìn)行演講、行為模擬考試和辯論賽等活動,提升學(xué)生的職業(yè)技術(shù)能力。
(作者單位:中南民族大學(xué)公共管理學(xué)院)