李天頤 傅洪波 吳迪
摘 ?要:本研究從教學(xué)實踐出發(fā),針對形成性測試,提出一種可應(yīng)用于教學(xué)的實證模型。該模型以貝葉斯方法為指導(dǎo),結(jié)合先驗概率和后驗概率對教學(xué)行為的結(jié)果做出統(tǒng)計評估。該模型相應(yīng)的統(tǒng)計數(shù)據(jù)來源于日常測試。統(tǒng)計指標(biāo)是所謂的吸收概率指標(biāo),它由測試的難度系數(shù)轉(zhuǎn)化而來。在統(tǒng)計推斷過程中,還有效地結(jié)合了矩陣處理。該統(tǒng)計模型,可行性和操作性強,為大量的教學(xué)研究提供了思路和工具。本研究以醫(yī)學(xué)英語影視化詞匯教學(xué)課堂為例,以該模型為工具展開了實證研究。
關(guān)鍵詞:形成性測試;統(tǒng)計模型;醫(yī)學(xué)英語詞匯教學(xué)
中圖分類號:TP3-05;TP274 ? ? ?文獻標(biāo)識碼:A 文章編號:2096-4706(2019)06-0024-03
Abstract:Based on teaching practice and formative testing,this study proposes an empirical model which can be applied to teaching. Under the guidance of Bayesian method,the model makes statistical evaluation of the results of teaching behavior by combining the prior probability and the posterior probability.The corresponding statistical data of the model are derived from daily tests. Statistical indicators are so-called absorption probability indicators,which are transformed from the difficulty coefficient of the test.In the process of statistical inference,matrix processing is also effectively combined. The statistical model has strong feasibility and operability,and can provide ideas and tools for a large number of teaching research. This study takes the medical English film-based vocabulary teaching classroom as an example,and carries out an empirical study with the model as a tool.
Keywords:formative test;statistical model;medical English vocabulary teaching
0 ?引 ?言
目前看電影學(xué)習(xí)英語已成為中國“二語習(xí)得”者最受歡迎的附帶學(xué)習(xí)方式之一,教師在課間或課堂上播放英文電影也成為大學(xué)英語教學(xué)的常態(tài),醫(yī)學(xué)英語作為醫(yī)學(xué)生了解最新醫(yī)學(xué)動態(tài)的重要工具同樣也有豐富的醫(yī)學(xué)英語電影資源庫,如何有效利用這些醫(yī)學(xué)英語視頻,同時如何測評采用了醫(yī)學(xué)視頻資源的課堂教學(xué)效果及學(xué)生的學(xué)習(xí)效果,是國內(nèi)外學(xué)者亟待解決的問題。
傳統(tǒng)的終結(jié)性評價,一般由總結(jié)性考試產(chǎn)生,一方面其考核形式單調(diào),無法體現(xiàn)學(xué)生在學(xué)習(xí)過程中的主體地位,另一方面,反饋周期過長,教學(xué)組織者無法及時調(diào)控教學(xué),學(xué)生學(xué)習(xí)成績的提升效果也不明顯。而由形成性考核產(chǎn)生的形成性評價,既可實現(xiàn)對學(xué)習(xí)者和學(xué)習(xí)過程的全面監(jiān)測和反饋,同時也實現(xiàn)了對教學(xué)過程的監(jiān)測和反饋,便于教學(xué)組織者及時調(diào)控教學(xué)過程,提升教學(xué)質(zhì)量,因此,形成性評價逐漸成為教學(xué)評價體系中不可缺少的重要手段和當(dāng)前的教研熱點[1-4]。
形成性評價主要依托形成性測試。形成性測試主要對學(xué)習(xí)者的課程學(xué)習(xí)成果進行階段性考核,考核范圍針對課程中的一個單元或一個部分,考核內(nèi)容多樣化(作業(yè)、項目、課題、論文、實操、測試),形式靈活(線上或線下,單選,多選結(jié)合等),甚至還有各類考核的內(nèi)容選擇模式及相應(yīng)評價模式等[5-7]。
但我們分析認為,形成性考核方式雖然多樣化,但傳統(tǒng)的教學(xué)測試,仍然是最常用和最經(jīng)濟的手段,其客觀性、公平性和可靠性都有一定的保障。因此,現(xiàn)階段相應(yīng)的研究和實踐工作仍然是不斷地完善這種主流的形式,通過文獻調(diào)研發(fā)現(xiàn),國內(nèi)外這方面的相關(guān)研究報道幾乎為空白,因此,本研究擬在此問題上做出的相應(yīng)的探索。
1 ?模式的特征與運行
1.1 ?對知識體系進行劃分
首先,我們傳授的課程的知識體系一般是具有系統(tǒng)性的,而形成性測試,作為階段性考試,其考試內(nèi)容往往是針對課程中的一個單元或一個部分,因此,我們根據(jù)教學(xué)進程,對知識進行有計劃的劃分,并對該劃分的單元組織開展階段性核查。這種劃分其實也意味著對形成性測試完成了相應(yīng)的計劃與管理。
而為了更好的對劃分結(jié)果進行管理,我們引入知識矩陣,此矩陣元素為一個知識單元,元素及角標(biāo),比如a23,表示第2章第3節(jié)知識單元。矩陣元素中一些章長短不一,我們?nèi)∽畲笾倒?jié)數(shù)為矩陣列數(shù)。針對大量知識單元的測試結(jié)果處理后則可形成測評矩陣。矩陣的引入,一方面可以以類似表格的方式清晰、有序地組織教學(xué)及匹配形成性測試,另一方面可進行一定的矩陣處理,為前文提及的數(shù)據(jù)管理和后續(xù)處理,提供數(shù)學(xué)工具。
1.2 ?引入“吸收概率”
測評結(jié)果可以是原始的得分,但形成性考核靈活,時長、題型、得分設(shè)定也不一,這造成數(shù)據(jù)背景差異,而一定數(shù)量的學(xué)習(xí)者測評結(jié)果也有一定分布差異。對此,我們引入難度系數(shù)并轉(zhuǎn)化為最終的測評結(jié)果。難度系數(shù)本身是一個常見的測試分析指標(biāo),其本義只為反映試題的難易程度[8],即考生在一個試題或一份試卷中的失分程度。如滿分50分的試題,考生平均得分36分,則難度系數(shù)為36/50=0.72。
至此,認識“難度系數(shù)”定義后,我們可以創(chuàng)造性地把其再定義為所謂知識“吸收概率”,即表示整個學(xué)習(xí)群體對所學(xué)知識的吸收程度或掌握程度(或呈現(xiàn)的準(zhǔn)確率),同時也可反映教學(xué)者的教學(xué)效果,但前提條件是,形成性測試題主要考察學(xué)習(xí)者對教學(xué)知識的“重現(xiàn)準(zhǔn)確度”,避免復(fù)雜的技巧型和綜合型能力考試。這樣,“難度系數(shù)”被賦予新的內(nèi)涵。針對不同知識單元測試結(jié)果的“難度系數(shù)”矩陣,也可理解為“吸收概率”矩陣(見圖1,矩陣E),矩陣元素既代表學(xué)習(xí)群體在各個知識單元的獲取概率、又同時反映了教學(xué)效果,為整個教學(xué)提供了一個簡明的定量指標(biāo),當(dāng)然也為統(tǒng)計模型提供了統(tǒng)計指標(biāo)。
教學(xué)的實施為函數(shù)f(或稱為教學(xué)作用),其作用于知識矩陣A,作用結(jié)果為E(此處即為吸收概率矩陣)。
1.3 ?建立統(tǒng)計評測及推斷
(1)矩陣組織下的數(shù)據(jù),顯然便于找到相應(yīng)知識單元的學(xué)習(xí)效果信息,也可以挖掘整體的學(xué)習(xí)概況。而吸收概率的引入,當(dāng)然也更直觀的評價了教與學(xué)的質(zhì)量。比如,利用上述吸收概率矩陣,簡單求算術(shù)平均,立即得出整個課程體系的平均“吸收概率”。當(dāng)然還可討論標(biāo)準(zhǔn)差等一系列統(tǒng)計參數(shù),深入挖掘背后的統(tǒng)計信息,全方位的了解教與學(xué)的關(guān)系。
(2)利用上述測評吸收概率矩陣,實現(xiàn)不同教學(xué)行為的統(tǒng)計檢驗給你分析。我們既可以觀測某階段的學(xué)習(xí)或教學(xué)效果的差異,也可以對整體差異展開統(tǒng)計的假設(shè)檢驗,單因素的Z檢驗、T檢驗、秩檢驗、游程檢驗,多組分的方差分析[9,10]等,可對相應(yīng)的教學(xué)因素帶來的差異開展統(tǒng)計評價和實證研究。另外,我們設(shè)定的固定的知識矩陣,其測量對象也是固定的,不同的教學(xué)作用,產(chǎn)生對比結(jié)果,正好形成配對統(tǒng)計檢測。
(3)局部分析上,可通過觀察矩陣的相應(yīng)元素測評結(jié)果的聯(lián)動性,發(fā)現(xiàn)知識單元和整體的相關(guān)性,甚至知識單元之間的內(nèi)在關(guān)聯(lián)。
2 ?實例分析
依從上述的統(tǒng)計模式,我們在相應(yīng)的教學(xué)研究中,對同一個老師的兩個平行班級(A1、A2班)的醫(yī)學(xué)英語詞匯教學(xué),進行了對比性研究,實驗周期為九周,每周一次連堂四節(jié)課醫(yī)學(xué)英語課,每次課觀看醫(yī)學(xué)英語視頻時長為45分鐘。兩個班級的差異在于一個班級A2觀看的是趣味性較高的醫(yī)學(xué)英語視頻,另一個班級A1觀看的是趣味性較低的醫(yī)學(xué)英語視頻,但A1班和A2班分別觀看的九部醫(yī)學(xué)題材影片難度均相同。同時分別使用相同測試題對教學(xué)效果進行了形成性測試,測試題主要考察醫(yī)學(xué)詞匯習(xí)得,授課內(nèi)容的重現(xiàn)準(zhǔn)確度。其中A1班對應(yīng)的吸收概率矩陣A1,A2班對應(yīng)吸收概率矩陣A2,測試單元為九章。
我們分別做了下列計算和統(tǒng)計處理。
2.1 ?整體的平均吸收概率
由式可算得A1班平均吸收概率為0.703,A2班平均吸收概率為0.714,有一定的差異,A2班平均吸收概率略高,但從數(shù)值上看不明顯。
2.2 ?統(tǒng)計檢驗
本檢驗是觀察同一組樣本在處理前后的平均值的差異,由于數(shù)據(jù)是配對的,所以采用配對T檢驗,檢驗結(jié)果概率僅為0.07%。這意味著,兩者平均值統(tǒng)計差異是明顯的,超過99.93%概率是不同的。
2.3 ?局部分析
全局上統(tǒng)計檢驗差別是明顯的,我們也可以進行局部對比分析。我們發(fā)現(xiàn),兩個班級的吸收概率在剛開始的時候數(shù)據(jù)差別不大,也就是教學(xué)前期差別不明顯(前5次測試,平均吸收概率值皆為0.66,T檢驗無明顯差異),但后期差別逐漸顯現(xiàn)。這很可能是趣味值高的電影能夠吸引學(xué)生的注意力,引發(fā)學(xué)生的學(xué)習(xí)興趣,使學(xué)生學(xué)習(xí)更加專注,從而轉(zhuǎn)化為學(xué)生的學(xué)習(xí)動力。隨著學(xué)習(xí)的深入,學(xué)習(xí)效率的差異最終導(dǎo)致了吸收概率的差異。
在教學(xué)反饋交流中,學(xué)生也提及醫(yī)學(xué)英語視頻有助于他們對課堂聽講的內(nèi)容進行補漏,加深對醫(yī)學(xué)知識的理解和對醫(yī)學(xué)英語詞匯的記憶。資源匹配性和趣味性醫(yī)學(xué)影視資源使學(xué)習(xí)者的效率有了一定提升。高趣味性影視組A2班在形成性測試中,測試表現(xiàn)自然更為理想。當(dāng)然,形成性測試結(jié)果的反饋,讓我們也隨后終止了實驗,讓兩個平行班級,同時分享相應(yīng)的教學(xué)資源。
由以上的實例,我們不難發(fā)現(xiàn),以矩陣來組織數(shù)據(jù),不僅可以形成良好的數(shù)據(jù)匹配和索引,而且利用矩陣處理,能夠方便快速的搜尋、提取數(shù)據(jù),比如提取理論性教學(xué)與應(yīng)用性教學(xué)等章節(jié)的數(shù)據(jù)進行對比分析。而統(tǒng)計的關(guān)鍵,所謂的統(tǒng)計指標(biāo)“吸收概率”,其計算簡易,能直觀地顯示教與學(xué)的效果,與形成性測試可謂相得益彰。
3 ?結(jié) ?論
綜上所述,本研究設(shè)計出一個比較系統(tǒng)的匹配形成性測試的統(tǒng)計處理模型,通過矩陣對數(shù)據(jù)進行有效組織,通過相應(yīng)的統(tǒng)計指標(biāo),可快速的完成對形成性測試數(shù)據(jù)的統(tǒng)計分析與推斷。整個模型的數(shù)據(jù)處理簡單,操作簡練,使用的統(tǒng)計方法成熟。這不僅是對醫(yī)學(xué)英語詞匯教學(xué)形成性評價做出的有益探索,更是對大量的教育、教學(xué)理論以及不斷涌現(xiàn)的教育、教學(xué)的改革和探索,此模型提供了由形成性測評結(jié)果來驗證的現(xiàn)實性,為提升教育、教學(xué)研究的科學(xué)性、可測性、實證性提供了嶄新的途徑和思路。
參考文獻:
[1] Theofanos M,Quesenbery W. Towards the design of effective formative test reports [M].Usability Professionals’ Association,2005.
[2] Lam R. Formative Use of Summative Tests:Using Test Preparation to Promote Performance and Self-Regulation [J].The Asia-Pacific Education Researcher,2013,22(1):69-78.
[3] ZOU X,ZHANG X. Effect of different score reports of Web-based formative test on students’ self-regulated learning [J].Computers & Education,2013,66:54-63.
[4] 郭茜,楊志強.試論形成性評價及其對大學(xué)英語教學(xué)與測試的啟示 [J].清華大學(xué)教育研究,2003,24(5):103-108.
[5] 方圓.基于CDS自我評測的形成性評價探索 [J].教育科學(xué)(全文版),2016(6):00181.
[6] Roberts T S. The Use of multiple choice test for formative and summative assessment [M].Australian Computer Society,Inc.2006.
[7] Wise S L,Plake B S,Pozehl B J,et al. Providing Item Feedback in Computer-Based Tests:Effects of Initial Success and Failure [J].Educational and Psychological Measurement,1989,49(2):479-486.
[8] 艾小偉,王有遠.基于統(tǒng)計學(xué)習(xí)的試題難度系數(shù)修正算法 [J].計算機工程與應(yīng)用,2008,44(36):227-229.
[9] 盛驟,謝式千,潘承毅.概率論與數(shù)理統(tǒng)計第3版 [M].北京:高等教育出版社,2001.
[10] L.沃塞曼.現(xiàn)代非參數(shù)統(tǒng)計 [M].北京:科學(xué)出版社,2008.
作者簡介:李天頤(1978.07-),女,漢族,湖北人,講師,碩士,研究方向:應(yīng)用語言學(xué)、多媒體輔助外語教學(xué)和比較文化研究。