陳海曼,顧秀林
(上海師范大學(xué) 教育學(xué)院,上海 200234)
美國SBAC英語評價(jià)體系的特征和啟示
陳海曼,顧秀林
(上海師范大學(xué) 教育學(xué)院,上海 200234)
“智能平衡評估聯(lián)盟”基于《共同核心州立英語標(biāo)準(zhǔn)》開發(fā)出SBAC英語評價(jià)體系,該體系具有“以證據(jù)為中心、基于數(shù)字圖書館的形成性評價(jià)、設(shè)置合理有效的成就水平、強(qiáng)調(diào)表現(xiàn)性任務(wù)的運(yùn)用”四個特征。借鑒SBAC英語評價(jià)體系,我們可以有以下嘗試:堅(jiān)持學(xué)業(yè)成就評價(jià)體系和課程標(biāo)準(zhǔn)的一致性;探索基于證據(jù)的評價(jià);建立大范圍全方位的評價(jià)資源庫;設(shè)置合理成就水平;應(yīng)用表現(xiàn)性任務(wù)。
共同核心州立英語標(biāo)準(zhǔn);SBAC英語評價(jià)體系;特征;啟示
顧秀林,浙江嘉興人,上海師范大學(xué)教育學(xué)院碩士研究生,主要從事課程與教學(xué)論、教師教育研究。
美國原有州英語學(xué)科評價(jià)體系存在諸多問題,如只關(guān)注考試成績而忽視英語實(shí)際水平的提升,各州統(tǒng)考評價(jià)內(nèi)容不夠全面,以及測試結(jié)果滯后無法有效指導(dǎo)教學(xué)等。為此,美國政府于2010年9月通過“力爭上游計(jì)劃”(Race to the Top)撥款1.75億美元專項(xiàng)資金開發(fā) “智能平衡評估聯(lián)盟”(Smarter Balanced Assessment Consortium, SBAC),并基于《共同核心州立英語標(biāo)準(zhǔn)》(Common Core State Standards for English, CCSS, ELA)[1],開發(fā)出SBAC英語評價(jià)體系,以期全面改善英語教學(xué)質(zhì)量。
SBAC是由州主導(dǎo)的組織,由管理州負(fù)責(zé)主要的預(yù)算、政策和管理決策。管理州包括加利福尼亞、華盛頓等15個州,美屬維爾京群島和印度教育部。[2]每個管理州都必須履行和加州大學(xué)洛杉磯分校(University of California at Los Angeles, UCLA)簽署的學(xué)術(shù)合作備忘錄(Memorandum of Understanding),并且和所有成員州(除了管理州,還包括兩個合作州愛荷華州和北卡羅萊納州)共享服務(wù)——如項(xiàng)目管理、評估技術(shù)體系的維護(hù)和強(qiáng)化等。
SBAC英語評價(jià)體系包括終結(jié)性評價(jià)(Summative Test)、臨時性評價(jià)(Interim Test)和基于數(shù)字圖書館的形成性評價(jià)(Formative Assessment)。終結(jié)性測試(Summative test)或期終測試(End-of-year Tests),用于測評學(xué)生從3年級到高中的英語學(xué)習(xí)成就及其進(jìn)步情況。教師還可以通過靈活可選的臨時測試,檢測學(xué)生的學(xué)習(xí)進(jìn)步。[3]基于“數(shù)字圖書館”的形成性評價(jià)則是SBAC評價(jià)體系的主要組成部分。其中,數(shù)字圖書館是一個教師交流、共享教學(xué)資源、評價(jià)模型的網(wǎng)站。教師可全年使用數(shù)字圖書館(Digital Library)里的專業(yè)發(fā)展資料和教學(xué)資源等資源,以滿足學(xué)生學(xué)習(xí)發(fā)展的需要。[4]總的來說,總結(jié)性評價(jià)結(jié)果用途廣泛,如監(jiān)測學(xué)生對大學(xué)學(xué)習(xí)和以后就業(yè)的準(zhǔn)備程度,檢測學(xué)生的能力水平,衡量CCSS達(dá)標(biāo)程度等。而臨時性評價(jià)和形成性評價(jià)最初的目的就是支持教學(xué),提高學(xué)生學(xué)習(xí)水平,以最終達(dá)到總結(jié)性評價(jià)的高期望。具體關(guān)系如圖1 所示:
圖1 SBAC英語評價(jià)體系圖
SBAC還開發(fā)了形式豐富多樣、內(nèi)容生動有趣、主題貼近生活的測試題,以確保測試符合學(xué)生發(fā)展要求。此外,無論是終結(jié)性評價(jià)、臨時性評價(jià),還是基于數(shù)字圖書館的形成性評價(jià),教師都可以讓學(xué)生以電腦適性模式(Computer Adaptive Format)的方式接受個性化測試(關(guān)于“電腦適性模式”具體在下文介紹)。為了滿足特殊群體的評價(jià)需求,SBAC評價(jià)體系的附加支持部分,提供了適應(yīng)于殘疾學(xué)生和母語非英語的英語學(xué)習(xí)者(English Language Learners)的評價(jià)方式。[5]
1.以證據(jù)為中心
SBAC評價(jià)體系最大的特色在于在評價(jià)時以證據(jù)為中心(Evidence-centered Design,ECD)。ECD使得測試的設(shè)計(jì)集中于尋找證據(jù),使得整個設(shè)計(jì)過程趨于簡單,避免了其他內(nèi)容或形式性的干擾或影響(Williamson et al, 2003 )。[6]ECD雖早已出現(xiàn)在教育評估領(lǐng)域,但因其需要消耗大量人力、財(cái)力,且決策過程復(fù)雜,之前尚未大面積投入州教育評價(jià)工作中。然而,聯(lián)盟州教育工作者參與度廣,參與人員實(shí)力強(qiáng),政府給予財(cái)政支出,使得證據(jù)為中心的設(shè)計(jì)正式投入使用。
作為評估過程中的重要一步,聯(lián)盟總結(jié)了ECD的六大要點(diǎn),并將它們投入設(shè)計(jì)和發(fā)展智能平衡評價(jià)體系中。[7]這六大要點(diǎn)及其關(guān)系如圖2所示。
圖2 ECD六大要點(diǎn)[7]
ECD使得測試的目標(biāo)更加清晰準(zhǔn)確,每一個考察點(diǎn)都有相應(yīng)題目,針對性強(qiáng),提高了測試效度。同時它還可以提供更詳細(xì)、可信任的成績分析報(bào)告,不僅可以避免糾紛,還可以為教與學(xué)提供參考資料。
2.基于數(shù)字圖書館的形成性評價(jià)
數(shù)字圖書館是面向教育工作者,并由教育工作者收集和遞交教學(xué)指導(dǎo)和專業(yè)學(xué)習(xí)資源的網(wǎng)站。圖書館資源和CCSS的要求一致,幫助教育工作者實(shí)施形成性評價(jià),改善教學(xué)。圖書館鼓勵交流和合作,支持全國教育工作者分享教學(xué)資料和教學(xué)經(jīng)驗(yàn),互相點(diǎn)評等。
數(shù)字圖書館除了采用先進(jìn)技術(shù)建立一個資源豐富、交流通暢的網(wǎng)絡(luò)平臺以外,在實(shí)體上通過以下三步進(jìn)行具體建構(gòu):
(1)聯(lián)盟與專家組、成員州、K-12教育工作者和高等教育工作者合作,共同開發(fā)數(shù)字圖書館資源。[7]專家組幫助聯(lián)盟開發(fā)出專業(yè)學(xué)習(xí)和教學(xué)資源的質(zhì)量標(biāo)準(zhǔn)指南(Quality Criteria Guide)這兩份指南,用來協(xié)助教育工作者和專家們提交和審查數(shù)字圖書館的形成性資源。
(2)每個成員州由K-12教育工作者和高等教育工作者組成8~12人的州領(lǐng)導(dǎo)小組(State Leadership Teams, SLTs)。州領(lǐng)導(dǎo)小組負(fù)責(zé)為州教育工作者網(wǎng)(State Networks of Educators, SNEs)招聘和訓(xùn)練教育工作者。只有SNEs的成員教育工作者,才有資格向數(shù)字圖書館提交資料。這些資料投入使用前,需要經(jīng)歷三道審查。未能過關(guān)的資料將退回給提交者,并給予其反饋和改進(jìn)意見。
(3)最后,近1200名K-12教育工作者和高等教育工作者組成州教育工作者團(tuán),接受SBAC關(guān)于正確解讀評價(jià)體系的培訓(xùn)。
基于數(shù)字圖書館的形成性評價(jià),使教師的教和學(xué)生的學(xué)都能獲得動態(tài)反饋,及時調(diào)整教與學(xué)策略,提高學(xué)生課程學(xué)習(xí)效率。形成性評價(jià)具有四大特點(diǎn):闡明有意學(xué)習(xí),提取證據(jù),解釋證據(jù),依證據(jù)行動。其中,“闡明有意學(xué)習(xí)”有兩大要素:學(xué)習(xí)目標(biāo)和成功標(biāo)準(zhǔn)。學(xué)習(xí)目標(biāo)揭示了學(xué)生在課程結(jié)束后應(yīng)該知道什么,而成功標(biāo)準(zhǔn)則明確了師生可以使用的證據(jù)——鑒定學(xué)生如何通向?qū)W習(xí)目標(biāo)之路?!疤崛∽C據(jù)”是提供師生需要的信息,鑒定學(xué)生在通往有意學(xué)習(xí)目標(biāo)的路上,身處何處。解釋證據(jù)是師生解釋他們收集到的證據(jù),判斷學(xué)生是否達(dá)到學(xué)習(xí)目標(biāo)和學(xué)習(xí)成就標(biāo)準(zhǔn),辨別學(xué)生的已知和未知模塊。“依證據(jù)行動”是指師生使用動態(tài)反饋,決定下一步進(jìn)程。數(shù)字圖書館的每一項(xiàng)資源都為形成性評價(jià)的這四種性能服務(wù)。
3.設(shè)定合理有效的成就水平
聯(lián)盟開發(fā)了一套多步驟的成就水平設(shè)定(Achievement Level Setting)過程,依據(jù)學(xué)生在總結(jié)性評價(jià)中的表現(xiàn),設(shè)立分?jǐn)?shù)線將學(xué)生分為不同的成就水平。[7]具體步驟如下:
(1)第一步:在線討論
為了擴(kuò)大參與度,聯(lián)盟邀請了聯(lián)盟州的教育工作者、家長和其他一些市民,參與在線成就目標(biāo)設(shè)定。在線環(huán)節(jié)中,成千上萬的教師和其他相關(guān)團(tuán)體獨(dú)立評審測試題目,并提出建議——學(xué)生進(jìn)入大學(xué)和就業(yè)所需的表現(xiàn)水平。
(2)第二步:現(xiàn)場討論
教育工作組和其他成員州提名的合伙人商議和推薦四種成就水平的分?jǐn)?shù)線:1級(Level 1)、2級(Level 2)、3級(Level 3)、4級(Level 4)。
(3)第三步:跨年級評審
在現(xiàn)場討論之后,一個主要由教育工作者組成的小團(tuán)體開始評審第一步和第二步中推薦的成就水平??缒昙壴u審的目的——確保成就水平的設(shè)定,順利貫通各年級,準(zhǔn)確反映學(xué)生年復(fù)一年的進(jìn)步情況??缒昙壴u審的小組成員檢查之前的推薦項(xiàng)目,提出改善各年級成就水平連貫度的建議。
(4)第四步:州批準(zhǔn)
成員州最終評審、調(diào)整和批注推薦項(xiàng)目。在11年級成就水平設(shè)立過程中,高等教育領(lǐng)導(dǎo)者參與決策,以確保成就水平反映高校的期望。一個獨(dú)立的技術(shù)咨詢委員會和一名專家審計(jì)員,監(jiān)督這些過程是否合理實(shí)施。每個成員州必須決定是否采取聯(lián)盟成就水平或設(shè)置自己的成就標(biāo)準(zhǔn)。
雖然CCSS界定了學(xué)習(xí)進(jìn)階,描述了每個年級段所包含的內(nèi)容要求和技能要求,但是CCSS并未劃定學(xué)生應(yīng)該知道多少(掌握知識的程度),這才算是為大學(xué)學(xué)習(xí)和以后就業(yè)做好準(zhǔn)備。聯(lián)盟承擔(dān)起這項(xiàng)任務(wù),做大量研究,界定學(xué)生為入大學(xué)和就業(yè)做準(zhǔn)備所需掌握的知識、技術(shù)和能力。為達(dá)成這一目標(biāo),在2013年5月的合作大會(Collaboration Conference)中,管理州聯(lián)盟采用了成就水平說明(Achievement Level Descriptors, ALDs)。ALDs描述了在標(biāo)準(zhǔn)化測試中,學(xué)生應(yīng)達(dá)到了知識、技術(shù)和能力要求。[9]聯(lián)盟的ALDs劃分了四種成就級別:1級、2級、3級和4級。3級和4級的學(xué)生達(dá)到入大學(xué)和就業(yè)的準(zhǔn)備要求。除了報(bào)告分?jǐn)?shù),ALDs還具有其他的功能,如指導(dǎo)政策和標(biāo)準(zhǔn)設(shè)定(創(chuàng)設(shè)分?jǐn)?shù)線)以及試題開發(fā)。
為了展現(xiàn)這一整套目的,聯(lián)盟開發(fā)了一系列ALDs,各不相同但又互有聯(lián)系,表1就介紹了這四種類型的ALDs:
表1 四種類型的ALDs
四類ALDs的體系的輪廓和相互關(guān)系如圖3:
圖3 ALDs體系的輪廓和四種類型ALDs的相互關(guān)系[10]
之前,在測試開發(fā)環(huán)節(jié)的末期才創(chuàng)建ALDs,僅用來總結(jié)學(xué)生的表現(xiàn)。而新的改革使得ALDs創(chuàng)建于測試開發(fā)環(huán)節(jié)的早期,對學(xué)生表現(xiàn)的期望可以指導(dǎo)對測試的構(gòu)思和開發(fā)。ALDs是依據(jù)大學(xué)內(nèi)容準(zhǔn)備(College Content Readiness)的操作性定義以及策略框架來指導(dǎo)分?jǐn)?shù)解析。但SBAC尚未開發(fā)出職業(yè)準(zhǔn)備的操作性定義以及策略。不過,它正朝這個目標(biāo)努力。
4.強(qiáng)調(diào)表現(xiàn)性任務(wù)的運(yùn)用
SBAC創(chuàng)建了豐富多樣的試題類型,如選擇反應(yīng)測試題(Selected-response Items)、結(jié)構(gòu)反應(yīng)測試題(Constructed-response Questions)、非傳統(tǒng)反應(yīng)測試題(Non-traditional Response Questions)、表現(xiàn)性任務(wù)(Performance Tasks)等,并且這些測試題都以電腦適性模式(Computer Adaptive Format)的方式進(jìn)行。電腦適性模式是指:學(xué)生通過預(yù)先設(shè)定的軟件作答,當(dāng)學(xué)生正確回答問題時,將會出現(xiàn)更具挑戰(zhàn)性的題目;反之,則出現(xiàn)更簡單的題目。這樣個性化的測試,有助于學(xué)生展示所學(xué),在合理范圍內(nèi)爭取更多進(jìn)步。[11]
SBAC最具代表性的測試類型是表現(xiàn)性任務(wù)(Performance Tasks)。表現(xiàn)性任務(wù)測量學(xué)生的批判性思維和問題解決能力,學(xué)生將自己所學(xué)的知識和技能應(yīng)用于復(fù)雜的現(xiàn)實(shí)世界。[12]一個主題或方案串聯(lián)一系列問題或活動,這些活動用于測量學(xué)生能力,如理解深度、寫作和研究技巧、復(fù)雜分析能力。而傳統(tǒng)的測試題并不能充分測量學(xué)生的這些能力。這些表現(xiàn)性任務(wù)用時1到2課時,在電腦上完成(但并不是電腦適性模式)。表現(xiàn)性任務(wù)或由電腦自動打分,或由專業(yè)教師打分。它既可以在臨時性評價(jià)和總結(jié)性評價(jià)中使用,又可在數(shù)字圖書館中作為教學(xué)模型和創(chuàng)新的重要資源。例如SBAC提供的8年級英語表現(xiàn)性任務(wù)樣題,以“生產(chǎn)和使用便士(penny)的經(jīng)濟(jì)利弊”為話題,提供了4篇文獻(xiàn)資料,要求學(xué)生進(jìn)行自主探究。在第一部分,設(shè)置了三個問題,鼓勵學(xué)生使用證據(jù)理解文獻(xiàn)資料回答問題,檢測學(xué)生的批判思維能力和閱讀理解能力。如下:
案例 關(guān)于“生產(chǎn)和使用便士的經(jīng)濟(jì)利弊”話題的表現(xiàn)性任務(wù)[13]
話題:生產(chǎn)和使用便士(penny)的經(jīng)濟(jì)利弊
資料1:Penne wise, or 2.4 Cents Foolish? (作者:Jeff Sommer)
資料2:Is the Penny Worth It? (作者:Rachel Mancuso)
資料3:Give a Penny-Save the Day! (作者:Ted Waterhouse)
資料4:The Ever-Changing Penny (作者: Maria Story)
第一部分:
題目1:材料2說明了對美國消除便士的潛在影響, 請從文中提取兩個細(xì)節(jié),解釋材料2如何加深讀者對此的理解。
題目2:所有資料的主題都有關(guān)便士。學(xué)生打算研究降低生產(chǎn)便士的成本,參考哪項(xiàng)資料最合適?從你所選的資料中,選取兩條信息,支持你的回答。
題目3:填表。資料3和資料4是否支持以下觀點(diǎn)。
表2 生產(chǎn)系使用便士的經(jīng)濟(jì)利弊
第二部分:
以便士為主題,寫一篇議論文,并進(jìn)行報(bào)告展示。要求學(xué)生使用自己的話,清晰表達(dá)自己對“便士”看法。可以參考筆記和文獻(xiàn)資料,但注意引用格式。
第二部分同時還展示了需注意的問題和評分標(biāo)準(zhǔn),如組織/目的、證據(jù)/連貫、語言表達(dá)等。通過學(xué)生閱讀和理解一定文獻(xiàn)后,鼓勵學(xué)生自我創(chuàng)作、表達(dá)觀點(diǎn),有利于學(xué)生學(xué)以致用,同時注重學(xué)生對證據(jù)的使用,發(fā)展學(xué)生的批判思維能力和創(chuàng)新能力。
表現(xiàn)性任務(wù)是相對于僅僅以知識技能為主、強(qiáng)調(diào)客觀唯一答案的紙筆測試任務(wù)而言的。但它并不排斥紙筆測試,不追求復(fù)雜或難以操作。它強(qiáng)調(diào)評價(jià)目標(biāo)的正確性、可操作性和有效性,鼓勵學(xué)生使用高階思維技能,深入分析思考,推理探究,尋找支撐證據(jù)并綜合運(yùn)用。
1.堅(jiān)持學(xué)業(yè)成就評價(jià)體系和課程標(biāo)準(zhǔn)的一致性
學(xué)業(yè)成就評價(jià)體系和課程標(biāo)準(zhǔn)的一致性是評價(jià)結(jié)果有效性的重要指標(biāo)?;谡n程標(biāo)準(zhǔn)的評價(jià)是學(xué)業(yè)評價(jià)體系和課程標(biāo)準(zhǔn)“一致性”(alignment)的核心。[14]SBAC英語評價(jià)體系基于《共同核心州立英語標(biāo)準(zhǔn)》開發(fā)形成,評價(jià)理念以《共同核心州立英語標(biāo)準(zhǔn)》為向?qū)?,做到“為學(xué)習(xí)的評價(jià)”“對學(xué)習(xí)的評價(jià)”和“作為學(xué)習(xí)的評價(jià)”,致力于幫助學(xué)生為入學(xué)和就業(yè)做好準(zhǔn)備。評價(jià)技術(shù)也與評價(jià)標(biāo)準(zhǔn)調(diào)整一致,試題所檢測的知識技能范圍及其比例,與課程內(nèi)容標(biāo)準(zhǔn)的知識技能范圍及其比例相一致;完成試題需要的思維能力與課程準(zhǔn)備的思維能力相一致。不僅如此,SBAC英語評價(jià)體系在2016年4月發(fā)表了《智能平衡聯(lián)盟:一致性報(bào)告(修改稿)》,檢測、反饋和報(bào)告評價(jià)體系是否與課程標(biāo)準(zhǔn)保持一致性。[15]具體而言,涉及證據(jù)表述與內(nèi)容標(biāo)準(zhǔn)的一致性、測試藍(lán)圖和內(nèi)容標(biāo)準(zhǔn)一致性、證據(jù)表述和試題庫一致性、試題庫和內(nèi)容標(biāo)準(zhǔn)一致性等方面。新課標(biāo)提出培養(yǎng)學(xué)生“全面發(fā)展”“核心素養(yǎng)”的理念,但學(xué)業(yè)成就評價(jià)對這些理念的觀測差強(qiáng)人意,導(dǎo)致應(yīng)試化現(xiàn)象嚴(yán)重,和課程標(biāo)準(zhǔn)背道而馳。同時,對于評價(jià)體系是否與課程標(biāo)準(zhǔn)相一致的大規(guī)模檢測、反饋和報(bào)告較少,有待加強(qiáng)。
2.探索基于證據(jù)的評價(jià)方式
SBAC評價(jià)體系中基于證據(jù)的評價(jià)方法,使評價(jià)的過程集中于尋找證據(jù),評價(jià)更加科學(xué)、客觀、公正、操作性強(qiáng)。這種強(qiáng)調(diào)證據(jù)的界定、證據(jù)的選擇、證據(jù)的收集、證據(jù)的使用的評價(jià)方式是評價(jià)領(lǐng)域的一大創(chuàng)舉。我國英語評價(jià)體系也可以借鑒這種方式,形成以證據(jù)為中心的評價(jià)體系。我們認(rèn)為以證據(jù)為中心的英語評價(jià)體系可以從以下幾方面入手:(1)界定證據(jù)。根據(jù)具體學(xué)習(xí)內(nèi)容和學(xué)習(xí)目標(biāo)確定相應(yīng)的證據(jù)表現(xiàn),界定清楚哪些是證據(jù),哪些不是證據(jù)。(2)對證據(jù)進(jìn)行分類??梢愿鶕?jù)教學(xué)的三維目標(biāo)分為知識類證據(jù)、能力類證據(jù)和態(tài)度類證據(jù)。(3)獲取證據(jù)。不同類型的證據(jù)需要運(yùn)用不同的獲取方式。知識類證據(jù)可以采用紙筆測試的形式獲取。能力類證據(jù)可以通過具體問題解決情景中的行為表現(xiàn)中獲得。態(tài)度類證據(jù)是最復(fù)雜的一種證據(jù),需要在日常生活中對學(xué)生的行為表現(xiàn)的觀察、記錄來獲得。(4)使用證據(jù)。通過對收集上來的證據(jù)進(jìn)行分類、整理、分析,對學(xué)生的學(xué)習(xí)狀況進(jìn)行評判,形成評價(jià)的結(jié)果,并將評價(jià)的結(jié)果反饋于教學(xué),從而改進(jìn)教學(xué)。
3.建立大范圍全方位的評價(jià)資源庫
SBAC充分調(diào)動各方資源,通過競爭性資助,吸引聯(lián)盟州的參與,建立協(xié)助形成性評價(jià)實(shí)施的數(shù)字圖書館和總結(jié)性評價(jià)、臨時性評價(jià)所需要的評價(jià)項(xiàng)目資源庫。在大數(shù)據(jù)時代背景下,數(shù)字圖書館與傳統(tǒng)概念上的圖書館有所不同,其服務(wù)模式由被動、等待、共性化轉(zhuǎn)向積極主動、自動推送和個性化,提供再生信息服務(wù)。由傳統(tǒng)意義上只是共享資源的圖書館轉(zhuǎn)變?yōu)椴粌H是共享資源,而且是促進(jìn)教師合作的交流平臺。評價(jià)項(xiàng)目資源的開發(fā)參與人員包括教師、高等院校工作人員、學(xué)科專家、測量專家、職場代表和相關(guān)專業(yè)人士等。評價(jià)項(xiàng)目不限于選擇反應(yīng)型試題和結(jié)構(gòu)反應(yīng)型試題,還包括非傳統(tǒng)反應(yīng)測試題和表現(xiàn)性任務(wù)。SBAC在網(wǎng)上發(fā)布測試樣題和練習(xí)題等,確保學(xué)生具有公平的了解和接觸的權(quán)利。除此之外,還出臺成績水平設(shè)定和成就水平說明,更好地解讀評價(jià)結(jié)果和學(xué)生發(fā)展需要。針對評價(jià)資源發(fā)展現(xiàn)狀,我國應(yīng)積極調(diào)動各方資源,加大評價(jià)資源庫開發(fā)人員的廣泛度,豐富評價(jià)資源庫內(nèi)容,借鑒SBAC建立數(shù)字圖書館經(jīng)驗(yàn),建立大數(shù)據(jù)時代背景下的大型多功能的新型數(shù)字圖書館。
4.合理設(shè)定成就水平
SBAC評價(jià)體系中合理的設(shè)定成就水平是其一大亮點(diǎn)。其合理性具體表現(xiàn)為兩點(diǎn):(1)多方參與成就水平的設(shè)置;(2)成就水平設(shè)置多樣性。在成就水平的過程中聯(lián)盟通過在線討論、現(xiàn)場討論、跨年級討論等多次討論將一線教師、家長、社會成員都納入成就水平的設(shè)置上,盡可能使成就水平的設(shè)置符合不同群體的需求。在成就水平的表現(xiàn)上,不僅設(shè)置了不同水平之間分界線的臨界值A(chǔ)LDs,還設(shè)置了政策ALDs、范圍ALDs、報(bào)告ALDs,不同的ALDs都有不同的功能,這樣的成就水平設(shè)置能滿足多樣化的需求。在這方面,我國《義務(wù)教育英語課程標(biāo)準(zhǔn)(2011)》(后簡稱《標(biāo)準(zhǔn)》)的制定過程中更多是專家討論。因此,我們認(rèn)為應(yīng)該在《標(biāo)準(zhǔn)》制定過程中,納入教師、家長和社會其他成員等多種社會群體的參與,以反映更多的社會需求;在《標(biāo)準(zhǔn)》的制定上,應(yīng)當(dāng)針對政策制定者、試題編寫者、教師、家長等不同需求,制作不同的《標(biāo)準(zhǔn)》版本。
5.使用表現(xiàn)性任務(wù)
表現(xiàn)性任務(wù)能測量學(xué)生的批判性思維和問題解決能力。表現(xiàn)性任務(wù)讓學(xué)生基于真實(shí)的問題情境,運(yùn)用所學(xué)知識解決具體的問題。為了大量使用表現(xiàn)性任務(wù),聯(lián)盟編制了大量表現(xiàn)性任務(wù)的題目,形成表現(xiàn)性任務(wù)題庫。教師可以方便地使用題庫里的表現(xiàn)性任務(wù)對學(xué)生進(jìn)行考核。表現(xiàn)性任務(wù)的大量運(yùn)用是一種提高評價(jià)效能的可靠嘗試。為此,我國應(yīng)當(dāng)根據(jù)測試的目標(biāo)編制大量的表現(xiàn)性任務(wù)題目,通過網(wǎng)絡(luò)的途徑使教師能共享表現(xiàn)性任務(wù),以推廣表現(xiàn)性任務(wù)的使用。此外,我們也應(yīng)當(dāng)開發(fā)類似電腦適性模式這樣的軟件來輔助教學(xué)評價(jià),使其更加便利化、個性化。
[1] Common Core Standards Initiative. Common Core State Standards for English Language Arts & Literacy in History/Social Studies, and Technical Subjects[S]. Washington, D. C. : Common Core State Standards Initiative, 2010-06-02.
[2] Smarter Balanced Assessment Consortium. Smarter Balanced Assessment Governing Board Procedures[EB/OL]. [2015-07-30]. http://www.smarterbalanced.org/wp-content/uploads/2015/08/Smarter-Balanced-Governance.pdf
[3] Smarter Balanced Assessment Consortium. 2016-17 Interim Assessment Blocks Overview[EB/OL]. [2015-08]. http://www.smarterbalanced.org/wp-content/uploads/2015/08/Interim_Assessment_Blocks_overview.pdf
[4] Smarter Balanced Assessment Consortium. Digital Libaray[EB/OL]. [2015-09]. http://www.smarterbalanced.org/wp-content/uploads/2015/09/Digital-Library-Factsheet.pdf
[5] Smarter Balanced Assessment Consortium. Accessibility & Accommodations[EB/OL]. [2015-08]. http://www.smarterbalanced.org/wp-content/uploads/2015/08/SmarterBalanced_Accessibility_Factsheet.pdf
[6] Williamson, David M., Malcolm Bauer, Linda S. Steinberg, Robert J. Mislevy &John T. Behrens. 2003. Creating a Complex Measurement Model Using Evidence Centered Design. On-line: http://www.eric.ed.gov/ERICDocs/data/ericdocs2sql/content_storage_01/0000019b/80/1b/2c/09.pdf.
[7] Smarter Balanced Assessment Consortium. End of Grant Report[EB/OL]. [2015-07].http://www.smarterbalanced.org/wp-content/uploads/2015/08/SB-EndOfGrantReport-F2.pdf.
[8] Smarter Balanced Assessment Consortium. The Formative Assessment Process[EB/OL]. [2015-09]. http://www.smarterbalanced.org/wp-content/uploads/2015/09/Formative-Assessment-Process.pdf
[9] Smarter Balanced Assessment Consortium. Smarter Balanced Assessment Consortium: 2013-14 Technical Report[EB/OL]. [2016-01-14]. http://www.smarterbalanced.org/wp-content/uploads/2015/08/2013-14_Technical_Report.pdf
[10] Smarter Balanced Assessment Consortium. Smarter Balanced Assessment Consortium: Achievement Level Setting Final Report[EB/OL]. [2016-09-04]. http://www.smarterbalanced.org/wp-content/uploads/2016/05/ALS-Final-Report_no-Appendix.pdf
[11] Smarter Balanced Assessment Consortium. Smarter Balanced Assessment Consortium: English Language Arts & Literacy Computer Adaptive Test(CAT) and Performance Task (PT) Stimulus Specifications[EB/OL]. [2015-04] http://www.smarterbalanced.org/wp-content/uploads/2015/08/ELA-Stimulus-Specifications.pdf
[12] Measured Progress/ETS Collaborative. Smarter Balanced Assessment Consortium: Performance Task Specifications[EB/OL]. [2012-04-16] http://www.smarterbalanced.org/wp-content/uploads/2015/08/PerformanceTasksSpecifications.pdf
[13] Smarter Balanced Assessment Consortium. Smarter Balanced Assessment Consortium: English Language Arts Practice Test Scoring Guide Grade 8 Performance Task[EB/OL]. [2014-05-16] http://www.smarterbalanced.org/wp-content/uploads/2015/08/ELA-Stimulus-Specifications.pdf
[14] 胡根林,趙夢雷. 一致性研究:實(shí)現(xiàn)基于標(biāo)準(zhǔn)的評價(jià)——2015年語文教育論著評析之四[J].教育大參考,2016,(5):13-16.
[15] HumRRO. Smarter Balanced Assessment Consortium: Alignment Study Report[EB/OL]. [2016-04] http://www.smarterbalanced.org/wp-content/uploads/2016/05/Alignment-Study-Report_HumRRO.pdf
Characteristics and Inspirations of SBAC, ELA Assessment
CHEN Haiman,GU Xiulin
(Education College,Shanghai Normal University,Shanghai 200234)
Based on CCSS, ELA (Common Core State Standards for English language arts & literary in history/social studies science and technical subjects), SBAC (Smarter Balanced Assessment Consortium) has developed the ELA assessment. Generally, the ELA assessment has four typical characteristics: focusing on evidence; Digital Library as an important tool of formative assessment; reasonable and effective Achievement Level; and application of Performance Tasks. Learned from SBAC, ELA assessment, there are five suggestions for language achievement assessment in China: The consistency of academic achievement assessment and curriculum standards should be enhanced; evidence is worth emphasizing in assessment; comprehensive resource databases should be constructed in large scale; we ought to set reasonable and effective Achievement Level; and the setting and application of performance tasks are encouraged.
CCSS, ELA SBAC, characteristics, inspirations
陳海曼,安徽阜陽人,上海師范大學(xué)教育學(xué)院碩士研究生,主要從事英語學(xué)科課程與教學(xué)論、教師教育研究。