溫海英 黎光明
摘要:中小學(xué)新課程改革遇到了一些新問題,這些問題對中小學(xué)教學(xué)管理產(chǎn)生了一定的影響。教育測量理論中的測驗等值技術(shù),是解決中小學(xué)新課程改革中出現(xiàn)問題的途徑。測驗等值為實施新課程改革提供了保障。也方便了管理者。掌握測驗等值技術(shù)相對困難,造成了測驗等值技術(shù)在教學(xué)管理中的應(yīng)用相對滯后。
關(guān)鍵詞:中小學(xué)新課程;教學(xué)管理;測驗等值;課程改革
中圖分類號:G40-058.1文獻(xiàn)標(biāo)識碼:A文章編號:1005-5843(2009)01-0006-03
自新課程改革提出以來,全國部分地區(qū)中小學(xué)開始實施新課程,但仍有一部分地區(qū)中小學(xué)未實施新課程,這就給地區(qū)之間造成了不平衡。由此引發(fā)了新課程教學(xué)管理中的一些問題。這些問題既有其特殊性,也有其普遍性。需要用一些新的方法及理念來解決,本文提出用測驗等值方法來解決中小學(xué)新課程改革給教學(xué)管理帶來的一些問題。測驗等值是心理與教育測量學(xué)的重要技術(shù),在心理與教育測量實踐中,為了保證測驗的公平性和可比性,需要把不同測驗形式的分?jǐn)?shù)都轉(zhuǎn)換到同一個分?jǐn)?shù)系統(tǒng)上,測量學(xué)上把為達(dá)到這一目的而發(fā)展起來的一套專門技術(shù),稱為測驗等值。測驗等值在考試、題庫建設(shè)得到較為廣泛的應(yīng)用。但是,這種技術(shù)不僅可用于各類考試中,也可用于中小學(xué)新課程的教學(xué)管理中。
一、中小學(xué)新課程改革給教學(xué)管理帶來的一些問題
(一)不同地區(qū)因使用不同教材給中考招生帶來新問題
中考招生是升中考試中重要的一個環(huán)節(jié),但是由于各地區(qū)實施教材有差別,導(dǎo)致不同地區(qū)的考試試卷也有差別,而中考只能劃定一個分?jǐn)?shù)線。如何將不同地區(qū)的分?jǐn)?shù)進(jìn)行比較,是一個重要問題。例如,廣東省佛山市在2004~2006年間共有語文、數(shù)學(xué)和物理三科實施了新課程,但是并非所有佛山市的各地區(qū)都實施了新課程,其中僅有闡城、順德和南海三區(qū)實施了新課程,而高明區(qū)和三水區(qū)則沒有實施新課程,由于各地區(qū)實施的步驟不一致,帶來了中考招生的新問題,即課改實驗區(qū)與非實驗區(qū)考生考試試卷不同。給招生統(tǒng)一錄取工作造成了障礙。
新課程的實施給基礎(chǔ)教育帶來了新的觀念和思路,特別是隨著新課程的改革,教學(xué)管理機(jī)制開始轉(zhuǎn)型。但是,如何在教學(xué)管理中統(tǒng)籌地區(qū)間的不平衡,以及如何在教學(xué)管理中運用更實際的辦法改進(jìn)舊體制,這是我們在新課程改革背景下不得不思考的問題。
(二)不同年份的新課程改革使分?jǐn)?shù)可比性難于統(tǒng)一
新課程改革需要逐步穩(wěn)定地實施,但當(dāng)教育管理者需要比較不同年份學(xué)生的差異性時遇到了難題。這主要表現(xiàn)在以下幾點:
1.各科教材不同。因為使用教材的差異性造成了分?jǐn)?shù)難于統(tǒng)一在一個量綱之下,比如要比較不同年份不同科目分?jǐn)?shù)的差異時,由于性質(zhì)不同,無法將兩者分?jǐn)?shù)相提比論。
2.不同年份科目量綱不同。實際上,由于新課程的改革,當(dāng)教育管理者需要比較不同年份相同科目時。由于所采用的教材有別,所參考的體系有異,也不能直接通過觀察學(xué)生分?jǐn)?shù)來進(jìn)行比較。
(三)不同年級不同教育者對新課程教學(xué)評價難于統(tǒng)
新課程的教學(xué)評價規(guī)范統(tǒng)一,要求在各個水平對教師教學(xué)水平進(jìn)行有效評價。但是,在不同年級之間,由于實施的教材有別,班級差異明顯,如何體現(xiàn)一個教育者的教學(xué)水平,是一個值得研究的問題。如果需要比較不同年級教師之間教學(xué)水平差異,那么又該如何進(jìn)行呢?即使在相同年級相同班級,教師之間也存在著教學(xué)水平之間的差異,所有這些問題,在中小學(xué)新課程教學(xué)管理中都將遇到,對實施新課程教學(xué)管理評價有重要的意義,也是實施新課程重要的組成部分。
解決班級、年份、地區(qū)、教師、學(xué)科和年級等因素對分?jǐn)?shù)之間差異的比較是實施新課程改革重要的一步,它有助于檢驗中小學(xué)新課程改革實施的質(zhì)量,也有助于新課程在新環(huán)境中的應(yīng)用與推廣。因此,上面所提及的這些問題,需要用新的方法來解決。
二、用測驗等值解決中小學(xué)新課程出現(xiàn)的一些新問題
(一)測驗等值可解決不同試卷考試的可比性
人們有種種理由要求比較、解釋不同時間、不同地點、不同考生的測驗分?jǐn)?shù),以便對試卷或試題的質(zhì)量,對不同學(xué)年的考生水平作出公正的評價、合理的解釋。特別是高考、自考、中考這種規(guī)模大、影響廣的全國統(tǒng)一考試,它決定數(shù)百萬考生的命運因而備受社會各界關(guān)注。一年一度的中考招生考試是牽動全社會應(yīng)屆中考考生和考生家庭的大事,中考招生工作是一項社會關(guān)注度很高的工作。近年來,基礎(chǔ)教育課程改革在各地逐步實施,由于各地實施的步驟不一致,帶來了新問題,即課改實驗區(qū)與非實驗區(qū)考生考試試卷不同,但參加統(tǒng)一錄取帶來的新問題。例如,2004-2006年,參加佛山市中考的考生如何在中考的語文、數(shù)學(xué)、物理三個科目上劃定錄取分?jǐn)?shù)線,是心理與教育測量的研究重要內(nèi)容,即測驗等值研究。
測驗等值是將不同形式的測驗分?jǐn)?shù)轉(zhuǎn)換到同一個量綱上,如有兩個測驗X和Y,它們的題量、題型、試題難度和分?jǐn)?shù)分布等方面相近。進(jìn)行不同測驗間的等值,首先要確定欲等值的測驗,然后對兩測驗進(jìn)行等值前的分析,看兩測驗是否符合等值的條件。還需要對等值設(shè)計和方法進(jìn)行選擇,得出等值關(guān)系,再將一個測驗固定,將另外一個測驗的分?jǐn)?shù)轉(zhuǎn)換到所固定的測驗量綱上來。這樣,就可以把不同形式測驗分?jǐn)?shù)進(jìn)行高低比較。例如,根據(jù)2005年佛山市數(shù)學(xué)中考試卷,基于錨測驗非等組設(shè)計,其形式如圖1所示。
在錨測驗非等組等值設(shè)計之下,還可以比較等值方法的優(yōu)劣,如Tucker線性等值方法、Levine線性等值方法和等百位分?jǐn)?shù)等值(頻數(shù)估計)方法。在我們進(jìn)行的研究中,得出Tucker線性等值方法最優(yōu),所引入的等值誤差最小。其等值的關(guān)系是Y=0.86X+13.72。其中x表示課改實驗區(qū)的考生的得分,而Y表示課改非實驗區(qū)的考生的得分。如果已知實驗區(qū)或非實驗區(qū)的得分,就可以轉(zhuǎn)換到相應(yīng)的非實驗區(qū)或?qū)嶒瀰^(qū)分?jǐn)?shù)之上。通過測驗等值,中考不同地區(qū)相同年份的考生得分就可以進(jìn)行比較,也可以統(tǒng)一劃出一個分?jǐn)?shù)線,從而有利于中小學(xué)新課程的實施。
(二)測驗等值可解決不同年度考試的可比性
人們當(dāng)然想知道。各年度試卷的難度水平是否有變化?各年度考生的實際水平是否有提高?不同年度考試之間的考試分?jǐn)?shù)究竟有何關(guān)系?如果我們能夠把不同年度、不同考生的考試成績轉(zhuǎn)化到同一個單位系統(tǒng)上去,則上述問題就能得到解決。
可以設(shè)置“錨題”用于不同年度的比較,比較結(jié)果可以說明不同學(xué)生是否存在差異,學(xué)生能力在不同年度上是否有明顯的變化。特別是,可以預(yù)見新課程改革以后,這種效果是否明顯,這樣就能夠為深化教學(xué)管理提供理論依據(jù)。
錨題的建立是解決不同年度考試的可比性的關(guān)鍵,采用一定的測驗技術(shù)可將不同測驗上的分?jǐn)?shù)作出等值轉(zhuǎn)換。含有錨測驗的等值設(shè)計包括錨測驗隨機(jī)組設(shè)計及錨測驗非隨機(jī)組設(shè)計,錨測驗等值設(shè)計主要是通過“錨題”相連,
錨題的作用在于找到兩測驗的聯(lián)系紐帶。這種等值轉(zhuǎn)換的鏈條可能會跨越多個測驗與多個被試樣組,還可以跨越不同年份。這種做法,在美國的測驗等值中均有所體現(xiàn),如,美國大學(xué)人學(xué)委員會的學(xué)術(shù)能力傾向測驗(SAT)每年的分?jǐn)?shù)都通過一系列的等值轉(zhuǎn)換。轉(zhuǎn)化到1941年由11000名被試構(gòu)成的樣組的SAT分?jǐn)?shù)分布上去解釋。這種固定參照團(tuán)體在不同年份上進(jìn)行等值的做法對比較被試分?jǐn)?shù)與作有關(guān)決策提供了統(tǒng)一參照系,可以借用到中小學(xué)新課程教學(xué)與管理中。
(三)測驗等值用于不同年級不同科目的新課程教學(xué)評價
根據(jù)測驗等值的含義,可以在不同年級相同科目設(shè)置錨題進(jìn)行比較,不同教師所教班級可以通過錨題這個橋梁相互聯(lián)結(jié)起來。實際上,如果科目不一樣,要進(jìn)行教師教學(xué)能力的比較,就顯得困難得多。因為很難找到共同聯(lián)系紐帶。一般的做法是比較不同科目的差異系數(shù)或者標(biāo)準(zhǔn)分。但是這樣做仍然顯得不夠明顯,對教育管理者而言,理解是有困難的。測驗等值可以解決此類問題,但是在此種情況下,需要供用現(xiàn)代測量理論——IRT來進(jìn)行項目之間的等值。借用IRT對全卷不同科目進(jìn)行項目參數(shù)等值,使不同科目的題目都進(jìn)行量表化,得出刻畫它們的項目參數(shù),如難度、區(qū)分度和猜測度等。對這種科目差異較大的等值,一般稱為“垂直等值”。
將不同年級不同科目通過測驗等值方法進(jìn)行分?jǐn)?shù)轉(zhuǎn)換,有利于新課程教學(xué)評價,這種評價標(biāo)準(zhǔn)是建立在科學(xué)實踐之上??朔碎L期在教學(xué)中主觀評定的方法,這是因為通過測驗等值方法可以把所有科目所有年級分?jǐn)?shù)表示在同一個量綱之上,熟優(yōu)熟劣自然不言而喻了。因此,測驗等值為新課程教學(xué)評價提供了理論依據(jù)。
三、測驗等值對中小學(xué)新課程教學(xué)管理的啟示
(一)測驗等值為實施新課程改革提供了保障
推進(jìn)和實施新課程是中小學(xué)教學(xué)管理的重要步驟,是改變我國基礎(chǔ)教育存在一些不良現(xiàn)狀的重要措施。測驗等值為新課程提供了保障,具體表現(xiàn)在以下幾方面:
1.為從實施舊教材到新教材提供了“過渡”保障。新課程改革是一個逐步實施的一個過程,不同地區(qū)存在新老更替的過程,在這樣一個過程中分?jǐn)?shù)等值尤為重要。如果不解決好此類的問題,人們當(dāng)然會質(zhì)疑分?jǐn)?shù)的可比性,因為不同地區(qū)的考生使用的是不同試卷,而考試招生卻只一個分?jǐn)?shù)線。即便出現(xiàn)+分?jǐn)?shù)線,人們同樣也會質(zhì)疑二個分?jǐn)?shù)的等價性,因此必須解決好不同形式測驗量綱統(tǒng)一的問題,而測驗等值能夠很好地處理此類問題。
2.測驗等值為新課程教學(xué)評價提供了保障。根據(jù)測驗等值的基本思想和做法,教師教學(xué)水平高低的評價,不是獨立進(jìn)行,而是需要通過一定的紐帶聯(lián)系起來,這個聯(lián)系紐帶便是錨測驗。錨測驗將不同學(xué)科不同年級教師聯(lián)系起來,以使學(xué)生考試分?jǐn)?shù)能在同一個量綱之上?;谕粋€量綱這定,我們就可以將不同教師相應(yīng)學(xué)生的分?jǐn)?shù)及名次排列出來。
3.測驗等值為新課程的實施效果的評價提供了保障。新課程的實施效果可以通過不同年度學(xué)生的學(xué)生成績來反映。一種比較簡單的辦法是比較未實施新課程和實施新課程后的不同年度學(xué)生的考試成績。對于這兩種分?jǐn)?shù),我們不能作簡單的比較,而是需要將不同年度的學(xué)生成績轉(zhuǎn)換后進(jìn)行比較。如果學(xué)生成績較以前有提高,則可能意味著實施新課程有效果。反之,則效果不明顯。
(二)測驗等值可以提升教育管理水平,方便管理者
通過測驗等值對不同年度不同學(xué)科不同地區(qū)等分?jǐn)?shù)的比較,可以深挖新課程背景下一些基本信息,對評價新課程實施提供了量化支持,可以提升教育管理水平,同時也可以方便管理者。特別是測驗等值可用于不同年級不同教師教學(xué)水平的比較,這對實施新課程大有幫助,因為這就表明測驗等值可以應(yīng)用于具體實踐的教學(xué)中。例如,學(xué)校管理者可以要求不同年級教務(wù)長規(guī)定一些錨題(或者可以建立錨題題庫),利用這些錨題來建立不同班級不同教師不同科目下學(xué)生得分的聯(lián)結(jié)點,以便作為比較不同年級不同教師教學(xué)水平的基礎(chǔ)。這種做法可以大大提高評價的方便性和操作性,有利于促進(jìn)教育管理水平和方便管理者。
(三)掌握測驗等值技術(shù)相對困難,造成在教學(xué)管理中的應(yīng)用相對滯后
測驗等值的主要目的是轉(zhuǎn)換不同測驗的分?jǐn)?shù),這種做法類似于華氏溫度與攝氏溫度的轉(zhuǎn)換。但是在具體操作中,還需要理解許多技術(shù)上的問題,如不同等值設(shè)計的選擇、不同等值方法的選擇、不同等值標(biāo)準(zhǔn)誤的比較等,其中所涉及到的技術(shù)較具體,等值公式也較多,這給許多教學(xué)管理者造成了許多麻煩。因此,在我國,測驗等值仍然有待大力支持和研究。測驗等值在概念和操作上,理解較為困難,造成了測驗等值在教學(xué)管理中的應(yīng)用相對滯后。
但是,測驗等值并非應(yīng)該受到局限。在國外測驗等值在各類考試各類教育管理中已經(jīng)得到較大范圍的應(yīng)用。即便測驗等值在我國中小學(xué)新課程教學(xué)管理中的應(yīng)用有較多困難,也不能否認(rèn)測驗等值的作用。
責(zé)任編輯曙光