摘要:本研究應(yīng)用學(xué)業(yè)評(píng)價(jià)與課程標(biāo)準(zhǔn)一致性分析Webb模式,對(duì)我國(guó)新課程背景下的高考化學(xué)試題與課程標(biāo)準(zhǔn)一致性的狀況加以分析,旨在為推動(dòng)基于標(biāo)準(zhǔn)的化學(xué)學(xué)業(yè)評(píng)價(jià)改革提供有意義的參考。
關(guān)鍵詞:化學(xué)教學(xué);課程標(biāo)準(zhǔn);學(xué)業(yè)評(píng)價(jià)
文章編號(hào):1005-6629(2012)2-0057-04 中圖分類號(hào):G633.8 文獻(xiàn)標(biāo)識(shí)碼:B
1、問題的提出
當(dāng)前,基于標(biāo)準(zhǔn)的課程改革已經(jīng)成為世界各國(guó)課程改革的主旋律?;跇?biāo)準(zhǔn),意指一切要以標(biāo)準(zhǔn)為考察依據(jù)。在課程層面,指的是課程和教學(xué)的開發(fā)、設(shè)計(jì)、實(shí)施、評(píng)價(jià),以及課程培訓(xùn)和課程研究應(yīng)該與課程標(biāo)準(zhǔn)保持高度一致性。
無論是在國(guó)外還是在國(guó)內(nèi),作為評(píng)價(jià)課程核心內(nèi)容的學(xué)生學(xué)業(yè)評(píng)價(jià),歷來是課程改革的核心議題之一。在基于標(biāo)準(zhǔn)的課程改革背景下,更是將其推到風(fēng)口浪尖上。因?yàn)樵诓煌秸n程一致性系統(tǒng)中,評(píng)價(jià)課程與預(yù)期課程的一致性是至關(guān)重要的,不僅直接影響學(xué)生學(xué)業(yè)成就檢視的可信度,而且直接關(guān)系到預(yù)期課程與實(shí)施課程之間的匹配度。因此,作為基于標(biāo)準(zhǔn)的課程改革運(yùn)動(dòng)發(fā)端地的美國(guó),無論是聯(lián)邦政府還是州乃至到一個(gè)學(xué)校都非常重視學(xué)生學(xué)業(yè)評(píng)價(jià)與課程標(biāo)準(zhǔn)之間的一致性。為此,美國(guó)教育部與科學(xué)教育國(guó)家委員會(huì)合作,組建了課程與評(píng)價(jià)一致性分析協(xié)會(huì),促使一致性研究在美國(guó)的蓬勃發(fā)展。當(dāng)前美國(guó)開發(fā)了多種一致性分析工具,各州政府、教育行政組織以此來評(píng)估教師教學(xué)、學(xué)業(yè)評(píng)價(jià)等是否依據(jù)課程標(biāo)準(zhǔn),每年均要發(fā)表研究報(bào)告,作為政府決策之用。
從國(guó)內(nèi)來看,在政策層面上,《基礎(chǔ)教育課程改革綱要(試行)》明確指出:“課程標(biāo)準(zhǔn)是教材編寫、教學(xué)、評(píng)估和考試命題的依據(jù)”,這就為我國(guó)基于標(biāo)準(zhǔn)的學(xué)業(yè)評(píng)價(jià)提供了政策依據(jù);在研究層面上,基于標(biāo)準(zhǔn)的學(xué)業(yè)評(píng)價(jià)研究已引起課程專家、評(píng)價(jià)專家的重視,但目前相關(guān)研究主要還是集中于意義探討、國(guó)際經(jīng)驗(yàn)引進(jìn)介紹等起步階段的理論研究,少見有關(guān)學(xué)業(yè)評(píng)價(jià)與課程標(biāo)準(zhǔn)之間一致性方面的實(shí)證研究。那么,化學(xué)學(xué)科學(xué)業(yè)評(píng)價(jià)內(nèi)容與課程標(biāo)準(zhǔn)是否一致、他們之間的一致性水平如何、具體情況又是怎樣等等這些問題是我們?cè)谕七M(jìn)化學(xué)課程學(xué)業(yè)評(píng)價(jià)改革過程中亟需回答的問題。研究學(xué)業(yè)評(píng)價(jià)與課程標(biāo)準(zhǔn)的一致性無論是對(duì)于課程的自身完善,還是對(duì)于課程目標(biāo)在基礎(chǔ)教育中的達(dá)成度和匹配度,均將發(fā)揮積極的導(dǎo)向作用。
2、研究方法
2.1 分析模式的選定
目前國(guó)際上對(duì)學(xué)業(yè)評(píng)價(jià)進(jìn)行基于標(biāo)準(zhǔn)的一致性分析的模式主要有Webb、SEC和Achieve式三種。本研究選擇Webb分析模式作為分析試題內(nèi)容與課程標(biāo)準(zhǔn)之間一致性的研究工具,從知識(shí)種類、知識(shí)深度、知識(shí)廣度、知識(shí)分布的平衡性等維度進(jìn)行深入研究。之所以選擇Webb分析模式,主要是基于以下幾點(diǎn)原因:(1)Webb模式是其他各種一致性分析模式構(gòu)建的母體;(2)Webb模式具有系統(tǒng)的分析程序和方法,可靠性高;(3)Wehb模式應(yīng)用廣泛,充分體現(xiàn)其適用性。
2.2 研究對(duì)象的選定
高考作為課程評(píng)價(jià)的重要環(huán)節(jié),由于其地位的特殊性,對(duì)課程的實(shí)施發(fā)揮著“指揮棒”作用。因此,研究高考試題與課程標(biāo)準(zhǔn)之間的一致性,必將有利于推進(jìn)基于課程標(biāo)準(zhǔn)的學(xué)生學(xué)業(yè)評(píng)價(jià)改革。x省作為國(guó)家級(jí)第一批課改實(shí)驗(yàn)區(qū),距今已有7年,這期間也進(jìn)行了5次新課程之后的高考。因此,研究該省的高考試題與課程標(biāo)準(zhǔn)的一致性,對(duì)于其他進(jìn)入新課程高考改革的省市具有重要的借鑒意義。本文選取x省2007,2011兩年高考化學(xué)試題以及課程標(biāo)準(zhǔn)作為研究對(duì)象。
2.3 研究資料的編碼與分析
對(duì)知識(shí)內(nèi)容的分類采用中學(xué)典型的化學(xué)知識(shí)分類體系,包括以下四大領(lǐng)域:化學(xué)基本概念和基本理論、常見無機(jī)物及其應(yīng)用、常見有機(jī)物及其應(yīng)用、化學(xué)實(shí)驗(yàn)基礎(chǔ)。
本文將知識(shí)與技能的認(rèn)知水平分為三個(gè)層次Ⅲ,它們分別為:
知道(A):識(shí)別、記憶和回憶學(xué)習(xí)內(nèi)容,是對(duì)知識(shí)的初步認(rèn)識(shí)。對(duì)要“知道”的知識(shí),要求說出要點(diǎn)、大意、或在有關(guān)情景中能夠加以識(shí)別。
理解(B):初步把握學(xué)習(xí)內(nèi)容的由來、意義和主要特征,是對(duì)知識(shí)的一般認(rèn)識(shí)。對(duì)要“理解”的知識(shí),要求能明了知識(shí)的確切涵義并能運(yùn)用、分析、解決簡(jiǎn)單的實(shí)際問題。
掌握(c):以某一學(xué)習(xí)內(nèi)容為重點(diǎn),綜合其他內(nèi)容,解決比較復(fù)雜的自然科學(xué)問題,是對(duì)知識(shí)較系統(tǒng)的認(rèn)識(shí)。
確定了知識(shí)內(nèi)容與認(rèn)知水平的分類之后,研究者著手對(duì)課程標(biāo)準(zhǔn)和高考試題進(jìn)行編碼:
?、僬n程標(biāo)準(zhǔn)的編碼:編碼者為兩位化學(xué)課程與教學(xué)論專業(yè)碩士研究生。兩人對(duì)課程標(biāo)準(zhǔn)獨(dú)立進(jìn)行編碼,得到的數(shù)據(jù)用SPSS軟件處理,計(jì)算出斯皮爾曼相關(guān)系數(shù)為0.835,表明編碼結(jié)果具有較好的可靠性。然后兩人對(duì)于分歧點(diǎn)進(jìn)行討論,達(dá)成共識(shí)。
?、谠囶}編碼:樣本抽樣的數(shù)量,直接影響統(tǒng)計(jì)信息的可靠性。Webb模式所分析的測(cè)試題一般在60題以上,并且他們以選擇題居多。而x省的高考試題從題數(shù)上來說只有20多題,如果以原題數(shù)進(jìn)行編碼必然帶來較大的誤差。因此,本研究在具體的編碼過程中,以選項(xiàng)或填空中所考核的知識(shí)點(diǎn)為測(cè)驗(yàn)的項(xiàng)目數(shù)計(jì)數(shù)標(biāo)準(zhǔn)。例如,在一個(gè)選擇題的4個(gè)選項(xiàng)中,如果每個(gè)選項(xiàng)考察不同的知識(shí)點(diǎn)就記為4個(gè)項(xiàng)目;如果考察相同的知識(shí)點(diǎn)就記為一個(gè)項(xiàng)目;填空題的每一空記為一題,這樣可以獲得更多的項(xiàng)目數(shù),從而保證一定的信度。參加試題編碼的有兩位重點(diǎn)中學(xué)教師和一位課程與教學(xué)論碩士研究生,他們單獨(dú)進(jìn)行編碼。2007年高考試題編碼結(jié)果的斯皮爾曼相關(guān)系數(shù)為0.782,2011年高考試題編碼結(jié)果的斯皮爾曼相關(guān)系數(shù)為0.746,表明編碼結(jié)果具有較好的可靠性。獨(dú)立編碼之后,3人對(duì)存在的分歧點(diǎn)一一討論,并協(xié)商一致。
3、分析與討論
選用Webb分析模式,以x省2007年、2011年高考化學(xué)試題為對(duì)象,分析其與新課改的課程標(biāo)準(zhǔn)的一致性,具體如下:
3.1 知識(shí)種類的一致性
知識(shí)種類一致l生標(biāo)準(zhǔn)是用來判斷評(píng)價(jià)項(xiàng)目涉及的內(nèi)容主題范疇與課程標(biāo)準(zhǔn)中描述的內(nèi)容主題范疇是否一致。Webb模式認(rèn)為,知識(shí)種類一致性可接受水平是:擊中領(lǐng)域目標(biāo)的測(cè)驗(yàn)項(xiàng)目的平均數(shù)大于或等于6個(gè)項(xiàng)目,這說明知識(shí)種類一致性達(dá)到了可接受水平,即可判定為“是”(“是”為“一致”的結(jié)果);反之,小于6個(gè)項(xiàng)目,即可判定為“否”。從表1看出,無論是2007年還是2011年高考化學(xué)卷,化學(xué)基本概念和基本理論、常見無機(jī)物及其應(yīng)用、常見有機(jī)物及其應(yīng)用、化學(xué)實(shí)驗(yàn)基礎(chǔ)這4個(gè)領(lǐng)域試題擊中數(shù)目均大于6個(gè),說明知識(shí)種類達(dá)到一致性接受水平?!盎瘜W(xué)基本概念和基本理論”作為化學(xué)學(xué)科的基礎(chǔ)和骨架,在課程標(biāo)準(zhǔn)中所占內(nèi)容比重較大,因此,試題中擊中的項(xiàng)目數(shù)最多。總之,從各領(lǐng)域擊中的試題項(xiàng)目數(shù)看,基本與課程標(biāo)準(zhǔn)中各內(nèi)容所占比重成正比,體現(xiàn)了較好的一致性水平。
3.2 知識(shí)深度的一致性
知識(shí)深度的一致性標(biāo)準(zhǔn)被用來判斷所評(píng)價(jià)的認(rèn)知要求與課程標(biāo)準(zhǔn)中期望學(xué)生“應(yīng)當(dāng)知道什么”和“應(yīng)當(dāng)做什么”的目標(biāo)是否相一致。Webb模式中知識(shí)深度一致性可接受水平是:符合具體目標(biāo)深度水平的項(xiàng)目數(shù)的百分比的平均數(shù)大于或等于50%。從表2及圖2-1、2-2中我們可以看出,在知識(shí)內(nèi)容4個(gè)領(lǐng)域中,知識(shí)深度這一維度都達(dá)到了一致性水平,可見試題命題者在總體上能夠較好的把握試題的難度要求。其中,化學(xué)實(shí)驗(yàn)基礎(chǔ)這一領(lǐng)域深度把握最好,吻合度達(dá)到了90%以上,而在“化學(xué)基本概念和基本理論”領(lǐng)域,試題難度要求與課程標(biāo)準(zhǔn)有較大程度的偏差,高考試題高出課程標(biāo)準(zhǔn)要求的試題比例均在35%以上。例如“鹽類水解”這一知識(shí)點(diǎn),課程標(biāo)準(zhǔn)只要求達(dá)到“了解”水平,而相對(duì)應(yīng)的試題認(rèn)知要求達(dá)到“理解”層次。從2007、201 1這兩年的變化來看,常見無機(jī)物及其應(yīng)用、常見有機(jī)物及其應(yīng)用、化學(xué)實(shí)驗(yàn)基礎(chǔ)這三個(gè)領(lǐng)域的知識(shí)深度一致性水平在逐步提高,可能原因是:2007年是新課程高考命題的第一年,對(duì)知識(shí)深度的把握受傳統(tǒng)影響較深,4年之后這一情況有所改觀。
3.3 知識(shí)廣度的一致性
知識(shí)廣度的一致性標(biāo)準(zhǔn)被用來判斷課程標(biāo)準(zhǔn)中所涉及的知識(shí)跨度與學(xué)生為了正確回答評(píng)價(jià)項(xiàng)目所需的知識(shí)跨度是否相一致。Webb模式中知識(shí)廣度一致性可接受水平是:測(cè)驗(yàn)項(xiàng)目擊中具體目標(biāo)百分比的平均數(shù)大于或等于50%,如果達(dá)到了50%,則表明達(dá)到了知識(shí)廣度一致性可接受水平,即可判定為“是”;反之小于50%,即可判定知識(shí)廣度一致性可接受水平為“否”。從表3及圖3中可以看出,與上述兩個(gè)維度相比,知識(shí)廣度的一致性水平最低,其中2007年、2011年試題中的常見無機(jī)物及其應(yīng)用、常見有機(jī)物及其應(yīng)用以及2011年的化學(xué)實(shí)驗(yàn)基礎(chǔ)均未達(dá)到一致性可接受水平。究其原因,一方面與試題的容量有關(guān)。作為標(biāo)準(zhǔn)化試題,由于考試時(shí)間的限制,考題的數(shù)量也相應(yīng)受到限制,這就不可能使標(biāo)準(zhǔn)中所規(guī)定的知識(shí)在試題中面面俱到;二是與內(nèi)容領(lǐng)域在試卷中的分值比例有關(guān),常見無機(jī)物及其應(yīng)用、常見有機(jī)物及其應(yīng)用這兩個(gè)內(nèi)容領(lǐng)域在考試大綱中所占的分值比例較小,這就直接制約了試題的數(shù)量,而這兩個(gè)領(lǐng)域的具體目標(biāo)數(shù)較多,特別是“常見無機(jī)物及其應(yīng)用”具體目標(biāo)數(shù)甚至多于“化學(xué)基本概念和基本理論”,導(dǎo)致目標(biāo)擊中百分比例低;三是試題過分集中于核心知識(shí)點(diǎn)的考查,使得回答試題所要求的知識(shí)點(diǎn)不夠分散。
3.4 知識(shí)分布平衡性的一致性
知識(shí)廣度和種類的一致性標(biāo)準(zhǔn)僅僅考慮高考試題與課程標(biāo)準(zhǔn)中目標(biāo)的數(shù)目相對(duì)應(yīng),并沒有考慮課程內(nèi)容目標(biāo)是如何分布的。因此,Webb提出了知識(shí)分布平衡性標(biāo)準(zhǔn),它的假定前提是課程標(biāo)準(zhǔn)中知識(shí)的重要程度是沒有區(qū)別的,除非有特殊的聲明。它采用知識(shí)分布平衡性來衡量試題對(duì)應(yīng)課程標(biāo)準(zhǔn)內(nèi)容目標(biāo)的分布程度。Webb模式中知識(shí)分布平衡性的一致性可接受水平是:知識(shí)分布平衡性指數(shù)的平均數(shù)大于或等于0.70。如果知識(shí)分布平衡性指數(shù)的平均數(shù)大于或等于0.70,則說明達(dá)到了知識(shí)分布平衡性的一致性可接受水平,即可判定為“是”;反之如果小于0.70,可判定為“否”。如果知識(shí)分布平衡性指數(shù)的平均數(shù)在0.6-0.7之間,則可判定知識(shí)分布平衡性的一致性可接受水平為“弱標(biāo)準(zhǔn)”。從圖4中可以看出,化學(xué)基本概念和基本理論、常見無機(jī)物及其應(yīng)用、常見有機(jī)物及其應(yīng)用這三個(gè)領(lǐng)域,無論是2007年還是2011年高考,平衡性指數(shù)均大于0.7,說明知識(shí)分布具有較好的平衡性。而“化學(xué)實(shí)驗(yàn)基礎(chǔ)”的平衡性指數(shù)2007年為0.68、2011年為0.7,相對(duì)來說顯得較弱,這可能與有關(guān)實(shí)驗(yàn)的試題過分集中于某些目標(biāo)的考查有關(guān),如“能根據(jù)實(shí)驗(yàn)試題要求,設(shè)計(jì)、評(píng)價(jià)和改進(jìn)實(shí)驗(yàn)方案”這一目標(biāo)受到命題者的青睞,也許是這一目標(biāo)相對(duì)來說容易命題并且又能體現(xiàn)實(shí)驗(yàn)素養(yǎng)的考查。另外有些目標(biāo)兩年試題中均未涉及,如“實(shí)驗(yàn)室一般事故預(yù)防和處理”。
4、研究結(jié)論
從總體上看,例舉的高考化學(xué)試題與課程標(biāo)準(zhǔn)之間一致性水平較高,發(fā)揮了課程標(biāo)準(zhǔn)標(biāo)準(zhǔn)化、規(guī)范化的作用,體現(xiàn)了高考化學(xué)卷命題的嚴(yán)肅性、科學(xué)性。從具體來看,主要有以下幾點(diǎn)結(jié)論:
(1)考試內(nèi)容領(lǐng)域中,化學(xué)基本概念和基本理論領(lǐng)域的一致性水平最高,而常見無機(jī)物及其應(yīng)用、常見有機(jī)物及其應(yīng)用領(lǐng)域的一致性水平略顯不足;
(2)從一致性各維度來看,知識(shí)深度的一致性結(jié)果最好,均達(dá)到一致性的要求,但一致性水平處于50%~70%之間居多,仍需要有較大幅度的改進(jìn),而知識(shí)廣度的一致性水平最低,需要擴(kuò)大試題知識(shí)點(diǎn)的覆蓋度;
(3)從年份上看,2007、2011兩年一致性水平相當(dāng),體現(xiàn)了高考化學(xué)卷命題的平穩(wěn)性特征與要求。
總之,高考試題與課程標(biāo)準(zhǔn)之間一致性水平較高,但有較多的指標(biāo)剛邁過“合格線”或略高于“合格線”,與完全吻合的程度相比,仍有較大的改進(jìn)空間。在呼喚基于標(biāo)準(zhǔn)的今天,真正使學(xué)生學(xué)業(yè)評(píng)價(jià)做到有標(biāo)可依、有標(biāo)必依、執(zhí)標(biāo)必嚴(yán)、違標(biāo)必究,無論是對(duì)于學(xué)業(yè)評(píng)價(jià)的科學(xué)發(fā)展還是整個(gè)課程的順利推進(jìn)都具有重要意