夏小俊 柏毅
(東南大學(xué)兒童發(fā)展與學(xué)習科學(xué)教育部重點實驗室,江蘇南京 210096)
在科學(xué)教育的諸多相關(guān)領(lǐng)域中,對學(xué)生科學(xué)素養(yǎng)的研究成為了現(xiàn)在最熱門的話題之一。無論是對學(xué)生科學(xué)素養(yǎng)的培養(yǎng),還是對學(xué)生科學(xué)素養(yǎng)的測評,都對各個國家的長期發(fā)展和民族素質(zhì)的提高有著根本的意義。目前國際上的主流科學(xué)素養(yǎng)測評框架包括了美國國家教育評測中心推出的NAEP項目、國際教育成就評價協(xié)會推出的TIMSS項目、世界經(jīng)濟合作與發(fā)展組織(簡稱OECD)推出的PISA項目以及澳大利亞的NAP項目,而我國也在2007年頒布了《全民科學(xué)素質(zhì)行動計劃綱要》[1],為提高公民科學(xué)素質(zhì)指出了宏觀的發(fā)展方向。
最初的測評方案都是基于紙筆測試的,為了符合時代發(fā)展潮流,NAEP在2011年起引入了基于計算機情境的測試試題[2],PISA也在2012年首次嘗試引入了基于計算機的問題解決測試[3]。這些試題往往通過計算機化的虛擬情境(如動畫、聲音和圖片等)來貼近真實生活。這些虛擬化的情境經(jīng)過精心設(shè)計之后,可供學(xué)生在計算機上進行自主的科學(xué)探究,采集并分析相關(guān)虛擬實驗數(shù)據(jù)。但完整的科學(xué)素養(yǎng)評測還必須考慮到其實用性和操作性,僅僅使用計算機的虛擬情境和工具是不足夠的。為了更好的評估學(xué)生的實際操作水平,本文將信息技術(shù)、網(wǎng)絡(luò)技術(shù)和傳感器技術(shù)等相結(jié)合構(gòu)建評測方案,并構(gòu)建相應(yīng)的網(wǎng)絡(luò)平臺,為后續(xù)的數(shù)據(jù)分析及合作研究提供支持。
本文中設(shè)計素養(yǎng)評測方案的理論基礎(chǔ)是ECD模型(Evidence-Centered Assessment Design)[4]。如圖1所示,ECD模式通常分為5個自模式:學(xué)生模式、證據(jù)模式、任務(wù)模式、組合模式和呈現(xiàn)模式[5]。
圖1 ECD 模型
以NAEP為例,從2003年起在評估方案中加入了富技術(shù)環(huán)境下的學(xué)生模式和證據(jù)模式[6],將要考察的能力重點分為探索能力、綜合推理能力和計算機能力。與此類似的是,在本文的方案中針對不同的知識點,設(shè)計不同的能力評測要求,其中在探索能力部分特別增加了對傳感器以及實驗器材操作的考核要求。
如圖2所示,本文的評測方案考慮了虛擬情境和實際動手操作的結(jié)合。首先在正式評測之前,學(xué)生會進行PISA2006科學(xué)素養(yǎng)樣題的預(yù)評測,以用作實驗數(shù)據(jù)的對比研究分析。正式評測開始之后,由計算機構(gòu)建的任務(wù)情境會呈現(xiàn)在學(xué)生面前,學(xué)生根據(jù)任務(wù)提示進行對應(yīng)的操作,如填寫客觀題、主觀題答案以及選擇合理的實驗器材。在實驗過程當中,傳感器會將數(shù)據(jù)通過對應(yīng)的數(shù)字化采集器傳送到計算機窗口。實驗結(jié)束之后,除了由計算機對客觀題進行自動評分之外,還將由主試對主觀題以及被試的操作能力進行綜合評分。
圖2 基于計算機和傳感器的實驗評測方案
在實驗過程當中,所有的主客觀評測數(shù)據(jù)都需要進行存儲以備后續(xù)分析使用,因此需要對整個評測設(shè)計一套合理、靈活而健壯的數(shù)據(jù)庫系統(tǒng)。根據(jù)前述的評測全過程要求,需要在數(shù)據(jù)庫當中保存的數(shù)據(jù)包括:主試的相關(guān)信息、被試的人口學(xué)數(shù)據(jù)、PISA預(yù)評測試題內(nèi)容、不同的具體評測方案內(nèi)容以及被試所進行的預(yù)評測和實測的數(shù)據(jù)結(jié)果。
因為不同的評測方案涉及到的學(xué)科背景可能完全不同,所采用的ECD模型的設(shè)計思路也由很大的區(qū)別,因此必須對每個方案進行獨立的數(shù)據(jù)表設(shè)計。一套完整的評測方案應(yīng)該包括主觀題(如問答題)、客觀題(如選擇題)以及數(shù)值填空題等基本題型,在數(shù)據(jù)庫的設(shè)計中分別用對應(yīng)的數(shù)據(jù)類型匹配即可。當被試開始評測時,從數(shù)據(jù)庫當中讀取對應(yīng)的評測內(nèi)容頁面,并逐步完成評測表單的填寫。
考慮到不可能所有的評分都由計算機自動完成(如傳感器操作能力、實驗中的科學(xué)探究能力等),在被試進行評測的過程中,主試應(yīng)密切觀察并適當紀錄,在評測完成之后,通過主試專用的管理入口完成數(shù)據(jù)的添加補充。
在默認情況下,系統(tǒng)可以通過Web的方式進行遠程訪問,但一旦大規(guī)模展開評測之后就很可能會面臨各種客觀條件的影響。具體可能的限制因素包括:評測現(xiàn)場沒有計算機或者數(shù)量有限、無Internet連接或者連接非常不穩(wěn)定等,為了解決這些實際的問題,在系統(tǒng)中增加對移動客戶端版本以及硬件接口的支持,并與Web系統(tǒng)一起構(gòu)建起了科學(xué)素養(yǎng)評測的云平臺。
如圖3所示,在缺乏PC或者網(wǎng)絡(luò)的情況下,基于安卓系統(tǒng)的平板電腦可充分代替計算機的作用。在這其中,有2個關(guān)鍵的技術(shù)問題:首先,平板電腦缺乏必要的硬件接口,因此在和數(shù)據(jù)采集器的通訊當中,使用了藍牙協(xié)議進行數(shù)據(jù)的讀取,從而保證了系統(tǒng)的便攜性;其次,使用安卓平板進行的素養(yǎng)評測方案使用了JAVA+SQLite離線數(shù)據(jù)庫的暫時寄存方式,而之前使用的WEB平臺采用的是PHP+MYSQL的架構(gòu),因此當評測結(jié)束回到網(wǎng)絡(luò)良好的狀態(tài)時,可通過應(yīng)用中預(yù)先編寫的JDBC接口將平板中的評測數(shù)據(jù)自動遷移到服務(wù)器上,使得所有的數(shù)據(jù)始終保持在“云端”,從而避免了數(shù)據(jù)分散或丟失的麻煩。
圖3 基于安卓客戶端的便攜式評測平臺
目前本平臺已經(jīng)被投入到了初步的實際評測工作當中,選擇了某所本科院校的近200名大一學(xué)生(分別來自3個不同的專業(yè)),并進行了2種方案的交叉評測。
PISA問卷預(yù)評測的數(shù)據(jù)分析:對樣本的測驗得分制進行Shapiro-Wilk(w檢驗),其顯著性得分Sig.為0.069(>0.05),滿足正態(tài)性分布的要求;對學(xué)生性別、年齡、高中文理分科、戶籍和是否獨生子女5個變量進行獨立樣本t檢驗,其得分均不造成顯著差異。因為我們的數(shù)據(jù)來源比較集中(均為同一學(xué)校的大一新生),出現(xiàn)這樣的情況是正常的。
某實際評測方案(金屬比熱容的比較)的數(shù)據(jù)分析:在相關(guān)性分析當中,可得到如下的結(jié)果:①PISA問卷中的物質(zhì)主題暨科學(xué)探究和科學(xué)解釋部分的得分交集,與實驗總得分在0.05水平上呈現(xiàn)正相關(guān),這個分析可以證明本方案可以有效地評測學(xué)生有關(guān)物質(zhì)系統(tǒng)的知識以及相關(guān)的科學(xué)探究能力;②PISA問卷中的物質(zhì)主題暨科學(xué)探究和科學(xué)解釋部分的得分交集,與實驗部分的理論知識得分也在0.05水平上呈現(xiàn)正相關(guān),這個分析可以證明本方案和PISA在評測學(xué)生的理論知識效果是吻合的;③實驗理論題得分和實驗操作題得分在0.05水平上呈現(xiàn)正相關(guān),這也證明了本實驗設(shè)計的內(nèi)部一致性;④PISA問卷中的物質(zhì)主題暨科學(xué)探究和科學(xué)解釋部分的得分交集,與實驗操作題得分并不呈現(xiàn)相關(guān),這也充分證明了PISA評測對實際操作能力考察的不足。
綜上所述,無論是平臺采集到的實測數(shù)據(jù)進行的分析,還是與PISA預(yù)評測數(shù)據(jù)的結(jié)果進行的對比分析,都證實了該平臺的可靠性和有效性。
科學(xué)素養(yǎng)的評測工作任重而道遠,本文的工作也處于剛剛起步的階段。在后續(xù)的工作當中,將逐步解決以下的幾個問題:在Web平臺上直接進行數(shù)據(jù)的閱讀和處理工作,并可通過數(shù)據(jù)挖掘的手段發(fā)現(xiàn)潛在的數(shù)據(jù)聯(lián)系;利用云計算技術(shù),保障數(shù)據(jù)的安全性和完整性,為數(shù)據(jù)共享提供了可靠的技術(shù)支撐;面向更多人群(如中小學(xué)生)、更多主題(物質(zhì)科學(xué)、生命科學(xué)、地球與空間科學(xué)和技術(shù)系統(tǒng))、更多的應(yīng)用場合(學(xué)校和科普活動)等進行科學(xué)的方案設(shè)計等。
針對學(xué)生科學(xué)素養(yǎng)的評測目前在國內(nèi)仍然主要處于理論研究階段,而如果想要真正地投入實踐,除了需要對教育理論本身的研究,更多地需要的是充分的ICT技術(shù)力量的支持。本文在該領(lǐng)域當中做出了嘗試性的工作,并取得了初步的有效成果,為進一步深入研究我國學(xué)生科學(xué)素養(yǎng)的情況打下了良好的基礎(chǔ)。
[1]袁汝兵,吳 循.各省(市)公眾科學(xué)素養(yǎng)調(diào)查綜述[J].中國科技論壇,2007(5):98-100.
[2]West Ed.Technology and Engineering Literacy Framework for the 2014 National Assessment of Educational Progress(Pre-Publication Edition)[J].CiteSeerX,2014.
[3]黃 華.PISA2012 基于計算機的數(shù)學(xué)素養(yǎng)測評分析[J].上海教育科研,2015(2):20-23.
[4]Mislevy R J,Almond R G,Lukas J F.A brief introduction to evidence‐centered design[J].ETS Research Report Series,2003(1):19-29.
[5]馮翠典.“以證據(jù)為中心”的教育評價設(shè)計模式簡介[J].上海教育科研,2012(8):12-16.
[6]Bennett R E,Persky H,Weiss A R,et al.Problem Solving in Technology-Rich Environments.A Report from the NAEP Technology-Based Assessment Project,Research and Development Series.NCES 2007-466[M].National Center for Education Statistics,2007.