張林靜
(河北省教育科學研究所 評價部,河北 石家莊 050061)
基礎教育決定著一個國家的公民素質,人才質量是國家競爭力的核心要素。世界各國政府及國際組織都高度重視基礎教育,并通過國際測評項目來了解各國的基礎教育質量情況,如經濟合作與發(fā)展組織(簡稱OECD),為了監(jiān)控各成員國的基礎教育質量實施的國際學生評價項目(簡稱PISA);國際教育成就評價協(xié)會(IEA)主持的“國際數(shù)學與科學研究趨勢”簡稱TIMSS。世界各國和地區(qū)也將建立基礎教育質量監(jiān)測體系作為提高基礎教育質量的重要舉措,如美國、日本、法國、加拿大、新西蘭、芬蘭、中國香港等。改革開放以來,我國基礎教育得到快速發(fā)展,“兩基”攻堅的基本完成,基礎教育進入內涵發(fā)展階段,由注重規(guī)模轉向注重質量,教育質量在我國引起了高度重視,胡錦濤總書記在2010年全國教育工作會議上講到“全面提高教育質量,對建設教育強國、人力資源強國意義重大。要把提高質量作為教育改革和發(fā)展的核心任務……樹立以提高質量為核心的教育發(fā)展觀”?!鞍烟岣哔|量作為教育改革和發(fā)展的核心任務”被正式寫入《國家中長期教育改革和發(fā)展規(guī)劃綱要》。
2007年9月,由中央編辦批準,教育部依托北京師范大學,成立了基礎教育質量監(jiān)測中心(以下簡稱中心),負責我國的基礎教育質量監(jiān)測工作。中心依靠北京師范大學的優(yōu)勢資源,整合全國各優(yōu)秀師范院校、科研機構的知名專家和專業(yè)技術力量,組成了一支包括心理學、課程與教學、管理與評價、教育與心理測量等眾多國際、國內專家組成的專兼職相結合的專家團隊,在全國開展基礎教育質量監(jiān)測工作。
基礎教育質量監(jiān)測工作依據(jù)科學發(fā)展觀的要求,堅持依法監(jiān)測、服務決策,科學評價、重在導向,準確診斷、探求規(guī)律的原則,對基礎教育階段學生的學習質量和身心健康狀況以及影響學生發(fā)展的相關因素進行全面、系統(tǒng)、深入的監(jiān)測,準確地向國家報告基礎教育質量的現(xiàn)狀,為教育決策提供信息、依據(jù)和建議?,F(xiàn)階段對學生的思想品德和公民素養(yǎng)、身體和心理健康水平、學業(yè)水平和學習素養(yǎng)、藝術素養(yǎng)、實踐精神、創(chuàng)新能力六個方面進行監(jiān)測。
監(jiān)測工作的主要程序包括:監(jiān)測標準研制、監(jiān)測工具研發(fā)、抽樣、監(jiān)測實施、評卷與數(shù)據(jù)分析、撰寫發(fā)布報告。
監(jiān)測標準的制定依據(jù)國家的各項方針、政策、法律;義務教育階段各科課程標準和中小學心理健康教育指導綱要;國際、國內在學科成就和心理健康監(jiān)測方面的成功經驗與先進技術;考慮不同版本教材、各地師資水平、教學條件、學生個體差異、家庭狀況等因素;符合教育與心理測量學的專業(yè)要求。
監(jiān)測工具研發(fā)包括監(jiān)測工具目標的制定、監(jiān)測工具設計、監(jiān)測內容確定(即題目開發(fā))、監(jiān)測工具的技術分析。監(jiān)測標準的研制和監(jiān)測工具的研發(fā)均需經過嚴謹、科學的程序和方法,以保證工具的權威性與代表性。監(jiān)測工具包括試卷和問卷兩種類型。試卷即各學科知識測試卷,衡量學生學習的結果,用分數(shù)來表示。調查問卷用于了解與學生學習相關的、有意義的、穩(wěn)定的影響因素,以進行不同群體學生的特點分析。每份監(jiān)測工具均由指導手冊、測試卷、答題卷組成。組卷采取矩陣取樣技術,將一套完整的測試劃分為幾套測試卷,每個學生完成一個測試卷即可。
對被試學生樣本采取分階段、分層不等概率隨機抽取。以2010年八省基礎教育質量監(jiān)測抽樣方案為例,確定八省四年級、八年級學生為樣本總量。第一階段,將八省的所有區(qū)縣城市學生所占比例作為分層PPS進行抽樣;第二階段,將各區(qū)縣的學校以教學條件綜合指標為分層PPS進行抽樣;第三階段,在各學校內簡單隨機抽樣。
監(jiān)測實施也稱現(xiàn)場數(shù)據(jù)采集,是整個監(jiān)測工作中極為重要的一個環(huán)節(jié),要求監(jiān)測數(shù)據(jù)真實客觀、監(jiān)測工具嚴格保密、實施程序規(guī)范標準。全國統(tǒng)一測試時間,并由教育部基礎教育質量監(jiān)測中心向每個樣本縣派出國家視導員,負責督察和指導測試工作。
各樣本縣的監(jiān)測工具全部匯總至教育部基礎教育質量監(jiān)測中心,進行統(tǒng)一的數(shù)據(jù)清理與閱卷,閱卷結束后將對結果進行數(shù)據(jù)分析。數(shù)據(jù)分析密切跟蹤世界測評理論和技術發(fā)展,充分利用新的技術手段和方法,提高數(shù)據(jù)的利用率和科學性。數(shù)據(jù)呈現(xiàn)包括統(tǒng)計圖、統(tǒng)計表兩種方式。
監(jiān)測報告以文字、圖表等形式把監(jiān)測的過程、方法與結果表現(xiàn)出來。監(jiān)測報告要求格式規(guī)范、數(shù)據(jù)準確、結果推論慎重,文字表述通俗、嚴格遵守監(jiān)測保密要求。根據(jù)閱讀監(jiān)測報告者的需求不同,可以將監(jiān)測報告分為綜合性報告、專題類報告和基礎類報告。綜合性報告包括學科報告、結果摘要報告,例如,《2008年學生數(shù)學學習質量報告》。專題類報告包括專項報告、專項結果簡報、咨詢報告,例如《學生課業(yè)負擔報告》?;A類報告包括基礎數(shù)據(jù)報告、論證報告、技術報告,例如《學生數(shù)學學習質量監(jiān)測工具論證報告》。
建立了政府支持、獨立運轉的基礎教育質量監(jiān)測實施機制?;A教育質量監(jiān)測工作具有很強的專業(yè)性、獨立性,借鑒國外經驗結合我國國情,確立了國家教育督導團行政聯(lián)系、教育部基礎教育質量監(jiān)測中心具體實施的方式,監(jiān)測中心享有較獨立的專業(yè)自主權。
監(jiān)測標準的重要依據(jù)即義務教育階段各科課程標準,課程標準就是對學生在經過一段時間的學習后應該知道什么和能做什么的界定和描述,是國家對學生學習結果的統(tǒng)一的、基本的要求,是學生學業(yè)成就評價的依據(jù)。
測試目的即評估學生獲得的學習能力,診斷其長處和弱點。因此在學科領域測評中不僅重視學科課程目標的達成,更重視學生對學科知識與現(xiàn)實的聯(lián)系與應用能力。
包括學業(yè)成績、德智體美發(fā)展以及相關影響因素等內容,不僅注重對學業(yè)成績的分析,更重視對影響學業(yè)成績的各因素進行歸因分析、相關分析。
在參照國際知名評價項目PISA、TIMSS和世界各國基礎教育質量監(jiān)測的基礎上,遵循教育與心理測量學專業(yè)要求,采用試卷與問卷相結合的方式,既重視測試結果的呈現(xiàn)方式,又重視結果背后的歸因分析。
質量監(jiān)測不是統(tǒng)考統(tǒng)測,而是通過對全國所有目標學生進行科學抽樣,隨機抽取學生樣本,以獲得有代表性的結果。由前幾年的工作經驗看,每個省約有10個樣本縣,每個樣本縣有720名學生參加測試,以此標準,全國31個省(市、自治區(qū))參加測試,樣本學生量將達到22.32萬人。
一般的學科均以學生紙筆測試的形式進行,部分學科會有小樣本現(xiàn)場測試。如2011年的英語有小樣本的口語測試,體育有小樣本的學生體質健康和體育學力現(xiàn)場測試。
從監(jiān)測標準的制定、監(jiān)測工具的研發(fā)、抽樣、實施到數(shù)據(jù)分析與報告撰寫,均由國家監(jiān)測中心負責,在監(jiān)測實施階段,各省負責協(xié)助、配合中心做好本省的具體組織管理工作,包括前期的各類數(shù)據(jù)報送和現(xiàn)場數(shù)據(jù)采集?,F(xiàn)場數(shù)據(jù)采集時中心派出國家級視導員到樣本縣負責監(jiān)測工作的實施。
目前對監(jiān)測結果只在一定層面進行反饋,不對社會公布,即使公布也只會是全國整體情況和一些熱點難點問題,不會根據(jù)監(jiān)測結果對省、縣的教育工作進行排名排序、評優(yōu)評級,不允許學校在監(jiān)測前進行操練和應對。以此來解除參加監(jiān)測工作單位的顧慮,獲得真實數(shù)據(jù)。
監(jiān)測工具的開發(fā)動用了大量國家資源,開發(fā)成本很高,同時為了保證監(jiān)測數(shù)據(jù)的真實性和客觀性,監(jiān)測工具被定為國家“機密”,在監(jiān)測工具啟用前和使用后均為保密文件,數(shù)據(jù)采集過程嚴格控制。
通過對前期的試點監(jiān)測研究發(fā)現(xiàn):
第一,為國家評估基礎教育質量進行教育決策提供信息、依據(jù)和建議。如在課程標準達成度方面,監(jiān)測發(fā)現(xiàn):大部分學生在學科學習上達到了課程標準的基本要求,但優(yōu)秀學生的比例不高,學生的實際應用能力、問題解決能力比較弱。第二,為促進教育公平、制定教育政策提供科學依據(jù)。如監(jiān)測結果發(fā)現(xiàn):流動和留守兒童學業(yè)成績落后、學校感受和自我感受消極、欺負行為和網(wǎng)絡成癮嚴重、人際關系差。其中,隨單親流動的兒童和母親外出的留守兒童以上問題尤為突出。第三,可以揭示影響學生發(fā)展的相關因素,為探尋促進教育發(fā)展的途徑提供參考,為精細化的內涵管理提供依據(jù)。如監(jiān)測結果發(fā)現(xiàn):課程、師資狀況及學校的硬件設施是影響學生學業(yè)表現(xiàn)的重要因素。第四,為教育督導提供依據(jù),為教育決策提供參考。如對課業(yè)負擔的監(jiān)測發(fā)現(xiàn):課程及考試內容過深、過廣,學校和學生加班加點、周末補課、作業(yè)量超標現(xiàn)象普遍。
基礎教育質量監(jiān)測作為的一項新舉措,已經初步顯示了它對國家教育管理和改革發(fā)揮的重要作用,盡管還有一些需要不斷完善和改進的地方,但不可否認,它已成為改善與提高基礎教育質量的重要途徑之一。
[1]胡錦濤.在2010年全國教育工作會議上的講話.2012-09-08.
[2]教育部基礎教育質量監(jiān)測中心網(wǎng)站[EB/OL].http://www.eachina.org.cn/eac/zxjj.htm.
[3]張愛蘭.構建政府支持、獨立運轉的基礎教育質量監(jiān)測與保障機制[J].學校管理與發(fā)展,2010,(8).
[4]辛濤,李峰,李凌艷.基礎教育質量監(jiān)測的國際比較[J].北京師范大學學報(社會科學版),2007,(6).
[5]陳效民.基礎教育質量監(jiān)測的實踐要素探析[J].考試研究,2011,(6).
[6]張斌.基礎教育質量監(jiān)測和評價解決方案[J].中國教育信息化,2011,(18).