徐 奉 先
2020 年,繼上海、浙江新高考方案落地后,北京、天津、山東、海南四省市也將實(shí)施進(jìn)入新高考后的首次考試,2021 年還將有河北、遼寧、江蘇、福建、湖北、湖南、廣東、重慶8 省市作為第三批試點(diǎn)實(shí)行新高考。高中學(xué)業(yè)水平選擇性考試是改革新方案中的重要一環(huán),也是改革的重點(diǎn)與難點(diǎn)?!秶?guó)務(wù)院關(guān)于深化考試招生制度改革的實(shí)施意見》明確指出:“學(xué)業(yè)水平考試主要檢驗(yàn)學(xué)生學(xué)習(xí)程度,是學(xué)生畢業(yè)和升學(xué)的重要依據(jù)??荚嚪秶采w國(guó)家規(guī)定的所有學(xué)習(xí)科目,引導(dǎo)學(xué)生認(rèn)真學(xué)習(xí)每門課程,避免嚴(yán)重偏科?!雹賴?guó)務(wù)院:《國(guó)務(wù)院關(guān)于深化考試招生制度改革的實(shí)施意見》,人民出版社,2014 年9 月。在新高考實(shí)行“兩依據(jù)一參考”的招生錄取模式下,需要從國(guó)家經(jīng)濟(jì)社會(huì)發(fā)展對(duì)提高全體國(guó)民素質(zhì)和人才培養(yǎng)質(zhì)量的新要求出發(fā),廣泛借鑒國(guó)際基礎(chǔ)教育課程改革趨勢(shì),避免出現(xiàn)大規(guī)模學(xué)生反復(fù)多考、放棄重要學(xué)科盲目追求A 等、大量高水平考生獲得過低等級(jí)分?jǐn)?shù)等問題。尤其后續(xù)的大部分省份都是在新課程標(biāo)準(zhǔn)頒布和新教材推行后實(shí)施新高考,更要提前做好專家團(tuán)隊(duì)和標(biāo)準(zhǔn)建設(shè),以免對(duì)新高考方案、學(xué)業(yè)水平考試、基礎(chǔ)教育以及高等教育帶來負(fù)面影響。本文擬從四個(gè)方面對(duì)新高考學(xué)業(yè)水平考試的技術(shù)框架進(jìn)行商榷。
由于新高考改革與課程改革同步,廣大即將加入新高考的省份就不能再基于老課標(biāo)進(jìn)行命題和考試;而新課標(biāo)提供的測(cè)量目標(biāo)主要針對(duì)核心素養(yǎng),還需要從教育測(cè)量和考試評(píng)價(jià)自身的特點(diǎn)和規(guī)律出發(fā),制定出具有可操作性的考試標(biāo)準(zhǔn),使其成為覆蓋基礎(chǔ)知識(shí)、關(guān)鍵能力、學(xué)科素養(yǎng)和核心價(jià)值的科學(xué)考查體系,使學(xué)業(yè)水平選擇性考試在人才選拔區(qū)分、評(píng)價(jià)和育人方面發(fā)揮更加積極的作用。
“基于標(biāo)準(zhǔn)的教育體系包括至少四個(gè)主要要素:課程標(biāo)準(zhǔn)、教學(xué)材料、課堂教學(xué)、考試評(píng)價(jià),所有這些組成要素需要整合成一個(gè)整體,互相配合,指導(dǎo)學(xué)生學(xué)習(xí)課程標(biāo)準(zhǔn)規(guī)定的學(xué)習(xí)內(nèi)容達(dá)到規(guī)定的要求。”②雷新勇:《從基于標(biāo)準(zhǔn)的基礎(chǔ)教育改革的視角審視課程標(biāo)準(zhǔn)和學(xué)業(yè)水平考試》,《考試研究》2009 年第1 期。舊課標(biāo)從嚴(yán)格意義上講是教學(xué)標(biāo)準(zhǔn),不是考試標(biāo)準(zhǔn),因?yàn)槠渲袥]有對(duì)于內(nèi)容標(biāo)準(zhǔn)和表現(xiàn)水平標(biāo)準(zhǔn)的明確描述。像高考這樣的常模參照考試,是將考生與考生進(jìn)行比較,而在基于標(biāo)準(zhǔn)的教育體系中,考試評(píng)價(jià)是將考生的表現(xiàn)與標(biāo)準(zhǔn)進(jìn)行比較。要達(dá)到這一目的,課程標(biāo)準(zhǔn)必須設(shè)置比較的標(biāo)準(zhǔn),表現(xiàn)水平標(biāo)準(zhǔn)就是這種比較的標(biāo)準(zhǔn)。它不但向?qū)W生闡述了學(xué)習(xí)的分層目標(biāo),也向教師闡述了教學(xué)應(yīng)該達(dá)到的要求。
表現(xiàn)水平標(biāo)準(zhǔn)的主要作用是向教師和學(xué)生傳達(dá)教學(xué)和學(xué)習(xí)應(yīng)該達(dá)到的程度,舊課標(biāo)在編訂過程中沒有設(shè)計(jì)表現(xiàn)水平描述,僅僅從知識(shí)與技能、過程與方法、情感態(tài)度價(jià)值觀三個(gè)維度設(shè)置了培養(yǎng)目標(biāo),但這三維目標(biāo)無法起到表現(xiàn)水平標(biāo)準(zhǔn)的作用。而此次修訂的新課程標(biāo)準(zhǔn)設(shè)置了學(xué)生學(xué)習(xí)能夠達(dá)到的不同目標(biāo)程度,為不同水平的學(xué)生提供了培養(yǎng)目標(biāo),也為考試評(píng)價(jià)的開展提供了參照標(biāo)準(zhǔn)。表現(xiàn)水平標(biāo)準(zhǔn)是標(biāo)準(zhǔn)參照考試命題、等級(jí)劃分、分?jǐn)?shù)報(bào)告和對(duì)等級(jí)內(nèi)涵進(jìn)行描述的重要依據(jù),這就要求作為參照標(biāo)準(zhǔn)的課程標(biāo)準(zhǔn)必須對(duì)學(xué)生經(jīng)過基礎(chǔ)教育階段學(xué)習(xí)后應(yīng)該達(dá)到的水平作出明確的界定。
課程標(biāo)準(zhǔn)的內(nèi)容標(biāo)準(zhǔn)的作用是規(guī)定學(xué)生應(yīng)該學(xué)習(xí)哪些內(nèi)容領(lǐng)域或主題,每一領(lǐng)域或主題具體包括哪些學(xué)習(xí)內(nèi)容,每一學(xué)習(xí)內(nèi)容應(yīng)達(dá)到什么認(rèn)知要求。內(nèi)容標(biāo)準(zhǔn)應(yīng)該可理解、可執(zhí)行、可完成、可測(cè)量。如果某一標(biāo)準(zhǔn)對(duì)某種評(píng)價(jià)手段,如紙筆考試而言不可測(cè),那么就無法用這種手段對(duì)其進(jìn)行評(píng)價(jià)。舊課標(biāo)的內(nèi)容標(biāo)準(zhǔn)對(duì)于學(xué)生應(yīng)該學(xué)習(xí)的內(nèi)容領(lǐng)域、內(nèi)容主題以及每一主題下的具體知識(shí)內(nèi)容規(guī)定得很明確,但對(duì)知識(shí)認(rèn)知要求的規(guī)定還停留在相當(dāng)模糊的階段。而新課標(biāo)不僅明確了學(xué)生在每一學(xué)科需要學(xué)習(xí)的知識(shí)和領(lǐng)域,也規(guī)定了學(xué)生在每一主題的學(xué)習(xí)結(jié)束后應(yīng)該達(dá)到的認(rèn)知水平,在一定程度上能夠保證教材、教學(xué)和考試評(píng)價(jià)與課程內(nèi)容標(biāo)準(zhǔn)的一致性。因此,內(nèi)容標(biāo)準(zhǔn)決定了試題考查的知識(shí)點(diǎn)及其絕對(duì)難度或認(rèn)知要求,也決定了整個(gè)試卷覆蓋的內(nèi)容領(lǐng)域、內(nèi)容主題、每個(gè)內(nèi)容主題的比例。如果學(xué)業(yè)水平選擇性考試的內(nèi)容要求與課程標(biāo)準(zhǔn)的內(nèi)容標(biāo)準(zhǔn)不一致,那么考試結(jié)果就不能反映考生的學(xué)習(xí)水平。
前文已論及,常模參照考試的本質(zhì)是將考生與考生進(jìn)行比較,而標(biāo)準(zhǔn)參照考試是將考生與課程標(biāo)準(zhǔn)的表現(xiàn)水平要求進(jìn)行比較,無論其他考生如何,衡量考生水平的標(biāo)準(zhǔn)是不變的,因此這個(gè)參照標(biāo)準(zhǔn)又稱為絕對(duì)標(biāo)準(zhǔn)。在標(biāo)準(zhǔn)參照考試的設(shè)計(jì)中,需要通過一個(gè)一般稱之為“標(biāo)準(zhǔn)設(shè)置(Standard Setting)”或“劃界分?jǐn)?shù)(Cut Score)設(shè)置”的過程,將考試分?jǐn)?shù)轉(zhuǎn)換為等級(jí),而不是簡(jiǎn)單地按照考生的百分位分?jǐn)?shù)劃分等級(jí)。用學(xué)業(yè)水平考試等級(jí)結(jié)果來評(píng)價(jià)學(xué)校的辦學(xué)績(jī)效,診斷學(xué)校教學(xué),為教學(xué)提供決策指導(dǎo),甚至選拔學(xué)生,已經(jīng)成為許多教育發(fā)達(dá)國(guó)家普遍的做法,我國(guó)實(shí)施學(xué)業(yè)考試制度采用這一做法可以說是順應(yīng)國(guó)際教育發(fā)展趨勢(shì),值得稱道。然而,學(xué)生從等級(jí)結(jié)果中獲得的個(gè)人、班級(jí)、學(xué)校學(xué)習(xí)水平和優(yōu)勢(shì)、弱勢(shì)等的信息,依賴于考試評(píng)價(jià)機(jī)構(gòu)對(duì)等級(jí)的內(nèi)涵解釋,后者參照的標(biāo)準(zhǔn)就是課程標(biāo)準(zhǔn)中的表現(xiàn)水平標(biāo)準(zhǔn)。
新課標(biāo)規(guī)定的知識(shí)內(nèi)容、培養(yǎng)目標(biāo)、學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)等都較舊課標(biāo)發(fā)生了很大變化,尤其新增的“學(xué)科核心素養(yǎng)”和“學(xué)業(yè)質(zhì)量”是其重點(diǎn)和亮點(diǎn),核心素養(yǎng)的提出,明確了各學(xué)科的育人目標(biāo),即:今后的高中教學(xué)應(yīng)以培養(yǎng)和發(fā)展學(xué)生的歷史學(xué)科素養(yǎng)為導(dǎo)向。新課標(biāo)在頒布和實(shí)施后,勢(shì)必會(huì)給基礎(chǔ)教育帶來一系列影響,教學(xué)的理念與方式、課程安排、學(xué)習(xí)效果檢驗(yàn)等環(huán)節(jié)都需要一一理清,才能適應(yīng)教育綜合改革的要求。新課標(biāo)的核心素養(yǎng),落實(shí)到學(xué)業(yè)水平選擇性考試,如何確??荚噧?nèi)容與課程標(biāo)準(zhǔn)的一致性,并有效考查學(xué)生核心素養(yǎng)的達(dá)成程度,在技術(shù)上也會(huì)衍生出許多需要破解的問題。如學(xué)業(yè)水平考試制度需要重新設(shè)計(jì),要讓學(xué)生通過每門課程的學(xué)習(xí)為自身的終身發(fā)展奠定基礎(chǔ)。具體到不同學(xué)習(xí)領(lǐng)域與課程,考試方式也需要根據(jù)學(xué)科課程性質(zhì)、特點(diǎn)進(jìn)行設(shè)計(jì),不再是基于綜合考試(如現(xiàn)行的文科/理科綜合模式)的架構(gòu)進(jìn)行命題藍(lán)圖設(shè)計(jì)。此外,從實(shí)踐上看,新課標(biāo)頒布后做到合理安排課程進(jìn)度和考試時(shí)間殊為不易,更應(yīng)該提前做好教學(xué)-考試的流程設(shè)計(jì)。
實(shí)施學(xué)業(yè)水平選擇性考試,設(shè)計(jì)初衷一是為了促進(jìn)學(xué)生認(rèn)真學(xué)習(xí)每門課程,避免嚴(yán)重偏科;二是推進(jìn)高中教學(xué)準(zhǔn)確把握學(xué)生的學(xué)習(xí)狀況,改進(jìn)教學(xué)管理;三是促進(jìn)高??茖W(xué)選拔適合學(xué)校特色和專業(yè)要求的學(xué)生,促進(jìn)高中、高校人才培養(yǎng)的有效銜接。這表明學(xué)業(yè)水平考試在功能上又有了新的拓展,在保留原有鑒定、監(jiān)測(cè)功能的基礎(chǔ)上,又添加了選拔的功能,由過去單純的終結(jié)性考試,變?yōu)榱思婢哌^程性與終結(jié)性二者合一的復(fù)合型考試。一般而言,在成績(jī)解釋上,畢業(yè)功能對(duì)應(yīng)標(biāo)準(zhǔn)參照測(cè)驗(yàn),升學(xué)功能對(duì)應(yīng)常模參照測(cè)驗(yàn)。不同的測(cè)驗(yàn)形式,試卷設(shè)計(jì)會(huì)有所不同。這對(duì)學(xué)業(yè)水平考試提出了新的嚴(yán)峻的挑戰(zhàn),無論是理論層面的頂層設(shè)計(jì)還是實(shí)踐層面的具體操作,都需要進(jìn)行新的界定和規(guī)范,最大化地保證選拔功能取向下的學(xué)業(yè)水平考試能為高考錄取提供公正、科學(xué)、嚴(yán)肅、權(quán)威的參考依據(jù)。學(xué)業(yè)水平選擇性考試兼具鑒定和選拔的功能,是在合格考強(qiáng)化基礎(chǔ)的前提下,凸顯不同高中學(xué)生在學(xué)業(yè)修習(xí)上的學(xué)科特長(zhǎng),體現(xiàn)學(xué)生的選擇性。選考成績(jī)計(jì)入考生總成績(jī),是高考統(tǒng)一錄取的依據(jù)之一。高等學(xué)校根據(jù)考生總成績(jī),按照招生章程和計(jì)劃,德智體美勞全面衡量,擇優(yōu)錄取。根據(jù)高考評(píng)價(jià)體系“立德樹人、服務(wù)選才、引導(dǎo)教學(xué)”的核心功能,學(xué)業(yè)水平選擇性考試功能可總結(jié)為三個(gè)方面。
一是立德樹人。學(xué)業(yè)水平選擇性考試全面貫徹落實(shí)黨的教育方針,加強(qiáng)理想信念、愛國(guó)主義、品德修養(yǎng)、知識(shí)見識(shí)、奮斗精神、綜合素質(zhì)教育,引導(dǎo)學(xué)生樹立正確的世界觀、人生觀,踐行社會(huì)主義核心價(jià)值觀,實(shí)現(xiàn)德智體美勞全面發(fā)展。二是服務(wù)選才。學(xué)業(yè)水平等級(jí)性考試通過科學(xué)的評(píng)價(jià),選拔出符合國(guó)家和高等教育需要的優(yōu)秀人才:具有家國(guó)情懷、國(guó)際視野和核心價(jià)值;具有必備知識(shí)、關(guān)鍵能力和學(xué)科素養(yǎng);具有求真務(wù)實(shí)、學(xué)以致用的優(yōu)秀品格和創(chuàng)新意識(shí)。通過落實(shí)國(guó)家人才選拔要求,保證人才選拔質(zhì)量;通過科學(xué)的命題設(shè)計(jì)和情境構(gòu)建,以及合理的評(píng)分標(biāo)準(zhǔn),促進(jìn)考試公平和合理分流。三是引導(dǎo)教學(xué)。學(xué)業(yè)水平選擇性考試立足于助力素質(zhì)教育發(fā)展,引導(dǎo)中學(xué)教學(xué)落實(shí)黨和國(guó)家對(duì)基礎(chǔ)教育的要求,培養(yǎng)社會(huì)主義合格建設(shè)者和接班人,堅(jiān)持正確的政治方向,著力培養(yǎng)和發(fā)展學(xué)生的必備知識(shí)、關(guān)鍵能力和學(xué)科素養(yǎng),促進(jìn)檢視教學(xué)效果,改進(jìn)教學(xué),提高質(zhì)量,啟發(fā)學(xué)生自主學(xué)習(xí)和探究性學(xué)習(xí),提高學(xué)習(xí)能力和創(chuàng)新能力,破除“唯分?jǐn)?shù)”“唯升學(xué)”的頑瘴痼疾,合理減輕學(xué)生負(fù)擔(dān)。
學(xué)業(yè)水平考試目前尚未建立國(guó)家標(biāo)準(zhǔn)或統(tǒng)一的全國(guó)性大量表,選擇性考試按人數(shù)比例劃分等級(jí)可能產(chǎn)生比較嚴(yán)重的分?jǐn)?shù)差距扭曲,按比例賦分帶來的利益博弈導(dǎo)致考生選擇理科科目的比例明顯下降,既不利于人才選拔,也極易對(duì)學(xué)生發(fā)展形成負(fù)面導(dǎo)向。各省市考試標(biāo)準(zhǔn)的建立,宜基于自身實(shí)際教情、學(xué)情、考情和參照國(guó)際通行做法,明確考生在高中階段所應(yīng)達(dá)到的學(xué)習(xí)水平,從而保證考試的信度和效度,助力高校人才選拔和確保公平。
盡管不同國(guó)家的政治體制、教育制度、教育管理方式、高校人才選拔方式等存在多方面的差異,但在全球化時(shí)代,經(jīng)濟(jì)社會(huì)的發(fā)展對(duì)人才提出了一些共性的要求,教育領(lǐng)域的人才選拔和培養(yǎng)呈現(xiàn)出一些共同的規(guī)律,學(xué)業(yè)水平考試的內(nèi)容和標(biāo)準(zhǔn)也體現(xiàn)出一些共同特征。這些特征體現(xiàn)了學(xué)業(yè)水平考試的設(shè)計(jì)、研制原則和程序,也反映了國(guó)際上學(xué)業(yè)水平考試改革和探索的一些共同趨勢(shì)。首先,各個(gè)國(guó)家和地區(qū)學(xué)業(yè)水平考試標(biāo)準(zhǔn)的設(shè)置都非常強(qiáng)調(diào)考試的設(shè)計(jì)和實(shí)施必須以相應(yīng)的教育階段和課程標(biāo)準(zhǔn)為依據(jù)。其次,學(xué)業(yè)水平考試在內(nèi)容框架、試題開發(fā)和評(píng)分標(biāo)準(zhǔn)等方面都必須嚴(yán)格按照相應(yīng)的課程標(biāo)準(zhǔn)進(jìn)行,需要明確每門考試課程的內(nèi)容標(biāo)準(zhǔn)和等級(jí)標(biāo)準(zhǔn)。在具體選考科目的設(shè)置上,大都采取了必考科目和自選考試科目相結(jié)合的模式。通過規(guī)定必修課程和必考科目,可以確保學(xué)生能夠形成基本的知識(shí)素養(yǎng)和學(xué)科能力,而選修課程和自選考試科目一方面減輕了學(xué)生的學(xué)習(xí)負(fù)擔(dān),另一方面也可以給學(xué)生一定的自由度,充分考慮到學(xué)生個(gè)性化發(fā)展的可能性。再次,課程內(nèi)容標(biāo)準(zhǔn)除了規(guī)定相關(guān)課程的學(xué)科內(nèi)容范圍之外,還要明確相應(yīng)內(nèi)容所涉及到的學(xué)生認(rèn)知水平和能力基礎(chǔ);等級(jí)標(biāo)準(zhǔn)要規(guī)定學(xué)生達(dá)到課程相應(yīng)內(nèi)容和認(rèn)知水平不同等級(jí)要求的具體特征,做到具體、明確、可操作性強(qiáng)。
基于上述情況,結(jié)合我國(guó)具體國(guó)情和現(xiàn)實(shí)情況,我們?cè)谄胀ǜ咧袑?shí)施學(xué)業(yè)水平考試時(shí),由于學(xué)業(yè)水平合格考已經(jīng)具備了認(rèn)定學(xué)生高中畢業(yè)標(biāo)準(zhǔn)達(dá)成程度的功能,選擇性考試就可以作為高等院校錄取學(xué)生依據(jù)的重要組成部分。學(xué)業(yè)水平選擇性考試應(yīng)該在合格考試強(qiáng)化基礎(chǔ)的前提下,凸顯學(xué)生在學(xué)業(yè)修習(xí)上的水平和學(xué)科特長(zhǎng),“突出個(gè)性”和強(qiáng)調(diào)區(qū)分度,充分體現(xiàn)以人為本、學(xué)其所好、考其所長(zhǎng)的原則。
學(xué)業(yè)水平選擇性考試的設(shè)計(jì)要首要考慮的基本問題就是標(biāo)準(zhǔn)的制訂。這里的“標(biāo)準(zhǔn)”前文已述及,通常包括兩方面的含義:其一是內(nèi)容標(biāo)準(zhǔn),其二是表現(xiàn)標(biāo)準(zhǔn)。內(nèi)容標(biāo)準(zhǔn)側(cè)重于某個(gè)年齡/年級(jí)的考生需要掌握的知識(shí)范圍或技能領(lǐng)域,主要關(guān)注是“是什么”的問題,通常以課程標(biāo)準(zhǔn),或考試大綱,或考試說明的形式進(jìn)行說明。表現(xiàn)標(biāo)準(zhǔn)側(cè)重于某特定等級(jí)(如合格、良好、優(yōu)秀等)的考生對(duì)某個(gè)知識(shí)或技能應(yīng)該掌握的程度。例如,美國(guó)多數(shù)州的課程表現(xiàn)標(biāo)準(zhǔn)包括四個(gè)水平或等第,即高級(jí)(advance)、熟練(proficient)、基本(basic)以及須改進(jìn)(need improvement)。表現(xiàn)標(biāo)準(zhǔn)是學(xué)業(yè)水平選擇性考試命題、等級(jí)劃分、分?jǐn)?shù)報(bào)告,和對(duì)等級(jí)內(nèi)涵進(jìn)行描述的依據(jù)。
其中,內(nèi)容標(biāo)準(zhǔn)的設(shè)定需要在研發(fā)標(biāo)桿試卷時(shí)完成,即考試管理部門需要組織學(xué)科專家和心理測(cè)量學(xué)專家,根據(jù)國(guó)家課程標(biāo)準(zhǔn)或考試大綱,精心編寫每個(gè)學(xué)科的考試標(biāo)準(zhǔn)。考試標(biāo)準(zhǔn)需要對(duì)考試的目的、對(duì)象、內(nèi)容、能力、形式、樣題樣卷、信度效度指標(biāo)要求、結(jié)果解釋和使用等作出具體規(guī)定,并提前向社會(huì)公布。其中,對(duì)學(xué)科內(nèi)容的層次化、結(jié)構(gòu)化的操作性定義是工作的重點(diǎn)。以美國(guó)共同核心課程標(biāo)準(zhǔn)(Common Core State Standards)為例,其中的高中數(shù)學(xué)內(nèi)容標(biāo)準(zhǔn)分三個(gè)層級(jí),第一層級(jí)包括數(shù)與量5、代數(shù)、函數(shù)、建模、幾何、概率與統(tǒng)計(jì)6 大類,第二層級(jí)是在每個(gè)小類下列出一系列要素,并對(duì)所有要素進(jìn)行解釋或示例。①The National Governors Association,the Council of Chief State School Officers,Common Core State Standards for Math,2016- 12- 06. http://www.corestandards.org/assets/CCSSI_Math%20Standards.pdf.尤其重要的是,這三個(gè)層級(jí)的所有要點(diǎn)都必須做編碼處理,以方便日后的題庫建設(shè)與自動(dòng)組卷工作,同時(shí)可為教學(xué)提供指南。待內(nèi)容標(biāo)準(zhǔn)被確定并且編碼工作完成以后,命題團(tuán)隊(duì)與心理測(cè)量學(xué)團(tuán)隊(duì)需要通力合作,編制考試藍(lán)圖(Test Blueprint)??荚囁{(lán)圖的作用是明確每個(gè)知識(shí)要點(diǎn)需要考查的題目數(shù)量及權(quán)重,以及需要考查的能力深度或復(fù)雜程度等。考試藍(lán)圖類似于工程建設(shè)中的施工圖紙,施工時(shí)的材料(考試題目)和結(jié)構(gòu)(試卷編排)等必須完全符合圖紙要求,也就是說,題目是可以變換的,但所要考查的內(nèi)容和深度是必須穩(wěn)定的。這是為日后的測(cè)驗(yàn)等值打基礎(chǔ)。
表現(xiàn)標(biāo)準(zhǔn)的設(shè)定則基于內(nèi)容標(biāo)準(zhǔn)以及考生總體或它的某個(gè)代表性樣本在標(biāo)桿試卷上的作答水平。也就是說,對(duì)于國(guó)家要求的各種水平等級(jí),例如A、B、C、D、E、F 等級(jí),首先必須從任務(wù)的重要程度以及題目的難易程度上,由學(xué)科專家作出初步判斷。然后通過分析總體或它的代表性樣本在標(biāo)桿試卷上的得分再作出調(diào)整。這項(xiàng)工作既可以在研制標(biāo)桿試卷的同時(shí)完成,也可以在正式考試實(shí)施之后完成。設(shè)定學(xué)業(yè)水平標(biāo)準(zhǔn)的主要作用在于避免出現(xiàn)選科選考過程中的“避難就易”“避強(qiáng)欺弱”等問題。例如,當(dāng)優(yōu)、良、合格等標(biāo)準(zhǔn)會(huì)因?yàn)榭忌后w的水平太高或太低而發(fā)生變動(dòng)時(shí),學(xué)生會(huì)選學(xué)或選考容易讓自己名列前茅的科目,因?yàn)檎憬?、上海的新高考方案中明確建議原始分?jǐn)?shù)最高的15%考生可獲得A 等。一旦等級(jí)標(biāo)準(zhǔn)不因考生群體的不同而不同,學(xué)業(yè)水平等級(jí)考中的許多亂象便可自動(dòng)消退。具體來說,表現(xiàn)標(biāo)準(zhǔn)的設(shè)定應(yīng)包括以下10 個(gè)步驟。②Hambleton R. K.,Jaeger R. M.,Plake B. S.,Mills C. N.,Handbook for Setting Standards on performance Assessments,Washington,DC:Council of Chief State Officers,2000.第一步,組建專家小組。根據(jù)測(cè)評(píng)目的,組建一個(gè)由教育管理者、學(xué)科專家和測(cè)評(píng)專家組成的有代表性的專家委員會(huì)或?qū)<倚〗M。第二步,準(zhǔn)備專家會(huì)議。選定一個(gè)標(biāo)準(zhǔn)設(shè)定方法,準(zhǔn)備培訓(xùn)資料,確定工作會(huì)議日程。第三步,編寫等級(jí)說明。專家組根據(jù)自己的學(xué)科知識(shí)和素養(yǎng),對(duì)表現(xiàn)水平為優(yōu)、良、合格等各等級(jí)的最低表現(xiàn)水平作出操作性的文字描述,形成工作中的指導(dǎo)文件。第四步,實(shí)習(xí)評(píng)定方法。組織專家組學(xué)習(xí)和掌握標(biāo)準(zhǔn)設(shè)定方法。通常需要專家試用推薦的標(biāo)準(zhǔn)設(shè)定方法,以便大家使用相同的評(píng)定規(guī)則。第五步,初步評(píng)定等級(jí)。專家對(duì)標(biāo)桿試卷中的每一道試題,按照標(biāo)準(zhǔn)設(shè)定的方法,初步評(píng)定各等級(jí)最低水平的學(xué)生答對(duì)各題的比例。初評(píng)結(jié)果經(jīng)過統(tǒng)計(jì)處理后形成綜合報(bào)告反饋給各位專家,以方便專家進(jìn)行下一輪的獨(dú)立評(píng)定。第六步,綜合多方信息。專家根據(jù)初評(píng)結(jié)果綜合報(bào)告,結(jié)合實(shí)測(cè)所得題目難度、區(qū)分度、題目特征曲線、客觀題選項(xiàng)分布等信息,再次運(yùn)用特定的標(biāo)準(zhǔn)設(shè)定方法,對(duì)每道題重新評(píng)定,形成第二次綜合報(bào)告。第七步,反復(fù)多輪討論。重復(fù)第五步和第六步多次,逐步形成穩(wěn)定的評(píng)定結(jié)果。第八步,終審評(píng)定結(jié)果。綜合各專家成員多次評(píng)定的結(jié)果,形成一份對(duì)各題的最終評(píng)定報(bào)告。通過統(tǒng)計(jì)處理,確定每個(gè)等級(jí)在標(biāo)桿試卷上的最低分?jǐn)?shù)要求。第九步,評(píng)估評(píng)定過程。在得到專家組的終審評(píng)定結(jié)果之后,各位專家還需要對(duì)自己的評(píng)定過程進(jìn)行一次獨(dú)立的檢查,包括對(duì)標(biāo)準(zhǔn)設(shè)定全部過程的自評(píng)、對(duì)評(píng)定工作的信心、對(duì)掌握和運(yùn)用評(píng)定方法的正確性等工作作出獨(dú)立評(píng)定。第十步,收集效度證據(jù)。對(duì)專家給出的評(píng)定結(jié)果,還需要收集其他獨(dú)立的證據(jù)進(jìn)行效度驗(yàn)證。一旦發(fā)現(xiàn)偏差,則需要對(duì)評(píng)定結(jié)果作出必要的微調(diào)。在此基礎(chǔ)上,才能形成標(biāo)準(zhǔn)設(shè)定的最終文件。值得說明的是,標(biāo)準(zhǔn)設(shè)定的工作耗時(shí)較長(zhǎng),所需要的專家人數(shù)也比較多,因此該項(xiàng)工作需要提前做好周詳安排。
學(xué)業(yè)水平考試的研發(fā)應(yīng)該嚴(yán)格按照心理與教育測(cè)量理論中的測(cè)驗(yàn)編制要求進(jìn)行,具體開發(fā)團(tuán)隊(duì)和機(jī)構(gòu)應(yīng)該提供考試內(nèi)容框架的確立,試題與考試內(nèi)容、能力水平的對(duì)應(yīng)性,試題的測(cè)量學(xué)特征(難度、區(qū)分度、試題偏差等)、考試過程、測(cè)驗(yàn)分?jǐn)?shù)或等級(jí)評(píng)定的質(zhì)量(信度、效度、可推廣性、公平性)等方面的相應(yīng)論證材料。為確保各省市學(xué)業(yè)水平選擇性考試質(zhì)量、過程和標(biāo)準(zhǔn)上的一致性,需要在教育部門領(lǐng)導(dǎo)和監(jiān)督下,任命或組建全國(guó)高中學(xué)業(yè)水平選擇性考試評(píng)估委員會(huì),具體負(fù)責(zé)(1)制定國(guó)家水平的學(xué)業(yè)水平選擇性考試質(zhì)量標(biāo)準(zhǔn);(2)審議和監(jiān)督各地學(xué)業(yè)水平考試質(zhì)量;(3)提供各地有關(guān)學(xué)業(yè)水平考試質(zhì)量問題的咨詢和審查等相關(guān)事宜??荚囄瘑T會(huì)應(yīng)建立起一支穩(wěn)定、質(zhì)量可靠、高度專業(yè)化的測(cè)量與評(píng)價(jià)隊(duì)伍,吸納課程專家、心理與教育測(cè)量專業(yè)人士參與,以確??荚囬_發(fā)和實(shí)施的質(zhì)量。此外,成立由各相關(guān)方面人士如家長(zhǎng)、教師專業(yè)人員等構(gòu)成的監(jiān)督和審議委員會(huì),負(fù)責(zé)對(duì)考試內(nèi)容、公平性、技術(shù)和評(píng)分標(biāo)準(zhǔn)等方面與環(huán)節(jié)進(jìn)行審查與監(jiān)督。在具體管理和實(shí)施中,可以考慮建立專門的考試協(xié)調(diào)者,并對(duì)考試管理者進(jìn)行相關(guān)的專業(yè)培訓(xùn)。明確規(guī)定每所學(xué)校的主考官的資格,以確保各地考試過程的一致性和考試質(zhì)量。
新高考背景下,作為學(xué)業(yè)水平選擇性考試的科目組合可達(dá)20 種之多,某些省市的考試次數(shù)較以往也有所增加,傳統(tǒng)的入闈命題將不再適應(yīng)新情況下的新要求。因此,學(xué)業(yè)水平選擇性考試必須提高適應(yīng)考試內(nèi)容改革的能力,充分發(fā)揮現(xiàn)代教育測(cè)量理論在試卷設(shè)計(jì)、分?jǐn)?shù)報(bào)告上的作用,創(chuàng)造條件為有需要的學(xué)生提供兩次甚至多次考試的機(jī)會(huì)。命題的實(shí)施應(yīng)考慮充分發(fā)揮題庫作用,建立與新課標(biāo)、新高考相適應(yīng)的題庫運(yùn)轉(zhuǎn)流程,探索日常命題和廣泛征題模式,并建立與學(xué)科對(duì)應(yīng)的資料庫。
新高考學(xué)業(yè)水平選擇性考試的題庫建設(shè)應(yīng)探索廣泛征題的工作模式,不僅有利于實(shí)施日?;},也能夠?qū)<蚁到y(tǒng)與社會(huì)系統(tǒng)相結(jié)合,最大限度地為國(guó)家題庫建設(shè)服務(wù)。題庫征題包括兩種方式,一種是面向社會(huì),以外部網(wǎng)絡(luò)為征題平臺(tái)的征集方式,一種是在定點(diǎn)高校院系以專家組為單位的定向試題征集。征題平臺(tái)的設(shè)計(jì),應(yīng)該有明確要求,如征題的需求、征題工作的協(xié)議、征題人員的身份驗(yàn)證、試題屬性、試題提交程序等等。關(guān)于題庫試題的標(biāo)準(zhǔn)和要求,命題者應(yīng)以課程標(biāo)準(zhǔn)、考試標(biāo)準(zhǔn)為依據(jù),做到測(cè)試目標(biāo)明確,科學(xué)規(guī)范。同時(shí)每一道試題的信息應(yīng)當(dāng)明確,例如:試題的內(nèi)容,考查的關(guān)鍵能力、考查的核心素養(yǎng)、價(jià)值觀念等等。試題的各個(gè)屬性(如:題型、內(nèi)容、答案、知識(shí)點(diǎn)、試題來源)應(yīng)當(dāng)完整,且與題庫建設(shè)各學(xué)科的屬性一致。關(guān)于定點(diǎn)高校征題人員的管理,應(yīng)組織學(xué)科專家、教育測(cè)量專家對(duì)命題人員進(jìn)行命題技術(shù)的專題培訓(xùn),命題部門提供征題軟件需求、學(xué)科考查內(nèi)容和能力要求、試題范例、征題要求、征題培訓(xùn)內(nèi)容等信息。
此外,應(yīng)盡快制定《學(xué)業(yè)水平選擇性考試題庫征題工作辦法》,在此基礎(chǔ)上,起草、制定征題平臺(tái)的需求、面向社會(huì)征題的管理辦法、定點(diǎn)院校征題的管理辦法、定點(diǎn)征題院校的布點(diǎn)計(jì)劃、題庫征題工作規(guī)劃等文件。通過一系列文件,把命題經(jīng)驗(yàn)科學(xué)化、規(guī)范化、標(biāo)準(zhǔn)化。
新高考實(shí)施后,隨著考試次數(shù)和試題數(shù)量的增加,對(duì)試題素材的消耗也隨之增加。為提高命題的工作效率,應(yīng)盡快建立起與題庫相配套的查重系統(tǒng)和試題素材資料庫。查重系統(tǒng)應(yīng)包括歷年試題、教材、社會(huì)通行的各種模擬考試題、練習(xí)題等;資料庫建設(shè)應(yīng)重點(diǎn)完善適合作為學(xué)業(yè)水平選擇性考試試題的素材搜集和整理,尤其是文字形式之外的圖畫、照片、統(tǒng)計(jì)圖表等等。以期創(chuàng)新試題情境設(shè)計(jì)和豐富呈現(xiàn)形式,激發(fā)考生的作答興趣。
針對(duì)本文所構(gòu)建的命題技術(shù)框架,筆者從學(xué)科評(píng)價(jià)體系的建設(shè)出發(fā),探討相關(guān)流程的具體操作運(yùn)用,以期為新高考省份提供參考借鑒。
2016 年開始,教育部考試中心探索構(gòu)建面向新高考的高考評(píng)價(jià)體系,其中的考查目標(biāo)包括“核心價(jià)值、學(xué)科素養(yǎng)、關(guān)鍵能力、必備知識(shí)”,回答高考“考什么”的問題。①姜鋼:《探索構(gòu)建高考評(píng)價(jià)體系,全方位推進(jìn)高考內(nèi)容改革》,《中國(guó)教育報(bào)》2016 年10 月11 日,第3 版。要使學(xué)業(yè)水平選擇性考試真正服務(wù)于基礎(chǔ)教育和高校招生,首先要基于高考評(píng)價(jià)體系的理論設(shè)計(jì),對(duì)高校人才選拔需求和基礎(chǔ)教育人才培養(yǎng)進(jìn)行調(diào)研,根據(jù)高校各專業(yè)的人才需求和基礎(chǔ)教育各學(xué)科的人才培養(yǎng)目標(biāo),確定學(xué)生在在完成高中階段學(xué)習(xí)后所必須具備的核心價(jià)值、學(xué)科素養(yǎng)、關(guān)鍵能力、必備知識(shí)。然后整合兩個(gè)層面的調(diào)研結(jié)果,確定高考各學(xué)科關(guān)于學(xué)生核心價(jià)值、學(xué)科素養(yǎng)、關(guān)鍵能力與必備知識(shí)的整體考查要求。
根據(jù)上一步研究所確定的學(xué)生核心價(jià)值、學(xué)科素養(yǎng)、關(guān)鍵能力、必備知識(shí)的內(nèi)涵與操作性定義,需要基于測(cè)量理論和考試規(guī)律對(duì)各主要學(xué)科進(jìn)行調(diào)研,提出能夠體現(xiàn)各學(xué)科核心價(jià)值、學(xué)科素養(yǎng)、關(guān)鍵能力、必備知識(shí)的典型情境與活動(dòng)原型。尤其情境作為實(shí)現(xiàn)學(xué)科考查目的和考查要求的載體,應(yīng)有利于讓學(xué)生更深刻地體會(huì)到現(xiàn)象、事實(shí)的意義,以及這些現(xiàn)象、事實(shí)與學(xué)科知識(shí)的內(nèi)在聯(lián)系,促進(jìn)深刻、精準(zhǔn)地分析問題和解決問題。
在這一環(huán)節(jié),需要設(shè)計(jì)基于各學(xué)科核心價(jià)值、學(xué)科素養(yǎng)、關(guān)鍵能力與必備知識(shí)的“雙向細(xì)目表”,形成各學(xué)科的考試命題方案與題型,并進(jìn)行取樣試測(cè),測(cè)試題型的適應(yīng)性,最終完成學(xué)業(yè)水平選擇性考試測(cè)評(píng)方案。這個(gè)流程包括以下環(huán)節(jié):(1)確定各學(xué)科核心價(jià)值、學(xué)科素養(yǎng)、關(guān)鍵能力與必備知識(shí)的“雙向細(xì)目表”,雙向細(xì)目表中每個(gè)知識(shí)與能力、素養(yǎng)的結(jié)合點(diǎn),就是學(xué)科活動(dòng)的基本單元。(2)確定各學(xué)科考核的具體內(nèi)容與題目類型,一般應(yīng)該包括三類題目。第一類是考查學(xué)生必備知識(shí)與關(guān)鍵能力的題目,主要是單項(xiàng)題目,可以稱為“考查學(xué)科素養(yǎng)的認(rèn)知要素的單項(xiàng)題目”,主要體現(xiàn)考查的基礎(chǔ)性。第二類是綜合考查必備知識(shí)、關(guān)鍵能力與情感態(tài)度價(jià)值觀的單項(xiàng)題目,可以稱為“考查學(xué)科素養(yǎng)的單項(xiàng)題目”,既可以體現(xiàn)基礎(chǔ)性與綜合性,也可以體現(xiàn)應(yīng)用性和創(chuàng)新性。第三類是考查學(xué)生在本學(xué)科典型的問題情境中綜合利用所學(xué)知識(shí)和素養(yǎng)、能力,以核心價(jià)值為指導(dǎo)處理復(fù)雜任務(wù)的學(xué)科素養(yǎng)的綜合題目。這類題目在解決問題的觀點(diǎn)態(tài)度上需要體現(xiàn)學(xué)生的核心價(jià)值觀水平,主要是綜合性主觀題,可以稱之為“考查學(xué)科素養(yǎng)的綜合性題目”,可以體現(xiàn)綜合性、應(yīng)用性與創(chuàng)新性。這類題目與以往的命題有很大的差異,問題情境的生態(tài)性(即對(duì)實(shí)踐的仿真性)、知識(shí)能力運(yùn)用的綜合性、問題解決的開放性、多樣性、核心價(jià)值的導(dǎo)向性等方面要融為一體,尤其是作答指向如何體現(xiàn)核心價(jià)值的引導(dǎo),更是全新的要求。(3)進(jìn)行取樣測(cè)試,確定各學(xué)科考核的具體內(nèi)容與題目類型的適合性。各學(xué)科根據(jù)考核的具體內(nèi)容與題目類型,設(shè)計(jì)出學(xué)業(yè)水平選擇性考試樣卷,大范圍取樣進(jìn)行測(cè)試,根據(jù)測(cè)試結(jié)果進(jìn)行項(xiàng)目分析與信效度分析,最后確定考核的內(nèi)容與題型。
隨著基礎(chǔ)教育課程改革的全面實(shí)施,考試評(píng)價(jià)制度改革也在逐步推進(jìn)。要做好學(xué)業(yè)水平考試,實(shí)現(xiàn)國(guó)務(wù)院提出的深化考試招生制度改革的目標(biāo),必須以教育心理學(xué)和測(cè)量學(xué)理論為支撐。所有工作都需要學(xué)科專家、測(cè)量學(xué)專家、教育管理工作者的通力合作,不可局限在普通高校高考招生的范疇之內(nèi)。應(yīng)探索建立學(xué)業(yè)水平選擇性考試自身的測(cè)量理論體系,使其成為具有全國(guó)統(tǒng)一標(biāo)準(zhǔn)、規(guī)范的測(cè)評(píng)體系及權(quán)威、嚴(yán)密高效的運(yùn)作體系,成為一種獨(dú)立的、具有高效度和高效率的、所認(rèn)定價(jià)值能直接兌現(xiàn)的權(quán)威性考試。