陳超凡,關成華,2,湯學黎
(1.北京師范大學 經(jīng)濟與資源管理研究院,北京 100875; 2.北京師范大學 創(chuàng)新發(fā)展研究中心,珠海 519087;3.好未來教育科技集團 教育研究院,北京 100080)
在以“精準扶貧”為指導方略的眾多減貧舉措中,教育扶貧顯著提高了貧困人口的人力資本質(zhì)量和收入水平。盡管如此,我國仍面臨區(qū)域、城鄉(xiāng)、校際教育發(fā)展的不平衡不充分問題。教育差距短期內(nèi)會導致貧困群體勞動技能不足,長期則會加劇未來收入不均衡,[1]這將使得以防止返貧和解決相對貧困為主的新時期貧困治理目標面臨挑戰(zhàn)。[2]在我國扶貧開發(fā)政策轉(zhuǎn)型的當下,利用好現(xiàn)代信息技術(shù)資源,通過科技手段精準對接落后地區(qū)的教育需求,對于縮小教育差距、促進公平而有質(zhì)量教育目標的實現(xiàn)具有重要意義。
隨著教育信息化步入2.0時代,充分利用“互聯(lián)網(wǎng)+”、大數(shù)據(jù)、人工智能等現(xiàn)代信息技術(shù)手段,變革傳統(tǒng)教育模式,推進新技術(shù)與教育教學深度融合已成為新的目標。近年來,通過政府購買、學校配置、企業(yè)支持等形式,各類教育信息化扶貧項目在貧困地區(qū)的學生、教師、家長、農(nóng)民等群體中開展。然而,不論是理論還是實踐界更多的是從定性角度探討信息技術(shù)對教育發(fā)展的宏觀影響效應,[3]對具體的項目評估和干預有效性的考察十分稀缺。隨著各類新的教育信息化扶貧項目不斷涌現(xiàn),只有通過定量評估,才能明確這些新的教育扶貧項目是否能真正對接落后地區(qū)的教育需求,是否具有可復制推廣的可能性。
以智慧課堂、雙師教學為代表的干預項目是近年來企業(yè)在教育信息化扶貧領域的重要探索(1)本文的“智慧課堂”,是指通過給每位教師和學生配備裝有在線學習資源庫、教學互動等APP的平板電腦,利用平板電腦結(jié)合交互式電子白板輔助課堂教、學、測、練、評各個環(huán)節(jié)。同時,后臺利用大數(shù)據(jù)技術(shù)記錄和分析學生和教師的學習和教學數(shù)據(jù),這些數(shù)據(jù)可幫助教師分析學生學習狀況,從而更好地發(fā)現(xiàn)問題、把握授課節(jié)奏、改善教學成效。“雙師教學”又稱“雙師課堂”,是指基于互聯(lián)網(wǎng)遠程直播技術(shù),由線上和線下教師相互配合, 共同完成教學任務。線上教師一般來自發(fā)達地區(qū)一線城市的教學名師或本地區(qū)的優(yōu)秀教師,其承擔線上教學任務;線下教師一般為各班級當前的任課教師,其主要配合線上教師組織教學、答疑、批改作業(yè)等。。其中,智慧課堂主要針對的是落后地區(qū)優(yōu)質(zhì)學習資源不足、學生學習興趣不高、信息化素養(yǎng)較低等問題;雙師教學的目的性則更加明確,主要針對的是落后地區(qū)優(yōu)質(zhì)師資匱乏的問題。相比于信息化基礎設施建設,這些項目旨在利用互聯(lián)網(wǎng)、大數(shù)據(jù)、直播等新一代信息技術(shù),改變落后地區(qū)傳統(tǒng)的教學理念和模式,促進優(yōu)質(zhì)教育資源共享,以達到激發(fā)學習興趣、提升學業(yè)表現(xiàn)和消弭教育差距的目的。那么,智慧課堂和雙師教學能否提升落后地區(qū)學生的學業(yè)表現(xiàn)?本文將L企業(yè)于華北W縣開展的智慧課堂和雙師教學項目視為準自然實驗,利用雙重差分法首次對該類型項目的干預效果進行評估,從而為利用現(xiàn)代信息技術(shù)輔助教學,破解落后地區(qū)教育發(fā)展難題提供可參考的經(jīng)驗證據(jù)。
與本文密切相關的,主要有兩方面文獻。第一支文獻主要為對教育扶貧相關政策、項目的評價或評估。這類文獻以貧困地區(qū)的人力資本代際傳遞為主線,認為教育是提升人力資本、阻斷貧困代際傳遞、防止返貧的關鍵。在對教育扶貧政策或項目的考察中,一類研究主要采用定性或非實驗方法,對政策或項目的實施效果進行評價;[4-5]而另一類代表性研究則主要采用隨機干預實驗或準實驗方法,識別各類教育扶貧項目的“凈影響”。[6]在這個領域,以反貧困行動實驗室(J-PAL)為代表的研究團隊通過對教師培訓和激勵、[7-8]兒童營養(yǎng)與健康、[9-10]課后補習、[11]信息技術(shù)干預、[12]家庭和學校激勵[13-14]等在內(nèi)的各類項目的評估,發(fā)現(xiàn)干預項目有效提升了貧困群體多方面的教育產(chǎn)出,如提升入學率、提升認知和非認知能力、改善健康狀況等,且發(fā)現(xiàn)接受更多的教育可以提升勞動技能、增加收入,并相應地降低收入不平等、促進社會公平。[15]由于實驗方法對實驗設計和各類資源要求很高,不少學者也采用雙重差分估計、匹配估計、斷點回歸等準實驗方法對教育扶貧政策或項目的實施效果進行評估。[16-18]
第二支文獻聚焦于討論信息技術(shù)介入對學生學業(yè)表現(xiàn)的影響。關于該話題的定量分析已有很多,但多數(shù)研究沒有聚焦具體的信息技術(shù)干預方式。[19-20]與本文評估的兩個項目相關的,其一是雙師教學。目前,鮮有針對該教學模式的定量評估成果,現(xiàn)有研究基本為對該教學模式或?qū)嵺`案例的描述性分析;[21-22];其二是智慧課堂,與其最相關的研究為計算機輔助教學項目(Computer Assisted Learning,CAL)。在廣義上,與教育活動相關的在計算機上實現(xiàn)教與學的軟件項目都可以稱為CAL項目,[6]其目的在于使用計算機設備上已開發(fā)好的軟件提升學生某一方面的知識儲備或能力。目前,關于CAL對學業(yè)影響的評估并未形成一致結(jié)論。例如Banerjee 等發(fā)現(xiàn)CAL可以顯著提高學生的數(shù)學成績且具有持久效應,[11]而Lavy、Dynarski等的研究表明CAL對學生的學業(yè)表現(xiàn)沒有顯著影響甚至有負面影響。[23-24]國內(nèi)學者主要以陜西、青海等地的農(nóng)村學校為樣本,采用實驗方法評估CAL對學生學業(yè)和非學業(yè)表現(xiàn)的影響及機制。相關研究表明,CAL在不同程度上提升了不同學段學生在不同科目上的學業(yè)表現(xiàn),同時還提升了學生的自我效能感、教育期望、學習興趣等,但這些表現(xiàn)由于學生個體、家庭等異質(zhì)性而呈現(xiàn)差異。[25-26]
相比于以往文獻,本文的研究創(chuàng)新主要體現(xiàn)在以下三方面:第一,從視角來看,已有文獻關于教育扶貧效果的評估往往聚焦于宏觀政策或兒童早期發(fā)展、營養(yǎng)健康、教師培訓等領域,關于信息技術(shù)對學業(yè)表現(xiàn)影響的評估以CAL為主。然而,新一代信息技術(shù)飛速發(fā)展,CAL僅僅停留在傳統(tǒng)的計算機軟件輔助教與學層面,無法體現(xiàn)新時代的技術(shù)創(chuàng)新和新技術(shù)的教育應用。據(jù)文獻檢索,本文可能是國內(nèi)首篇評估智慧課堂和雙師教學對學生學業(yè)成績影響的文獻。第二,從方法來看,盡管一些學者對以上兩種教學模式的效果進行了分析,但大多使用的是定性分析方法,或是以師生的主觀感受作為評價指標進行描述性分析,缺少嚴謹科學的量化評估。本文將W縣的教育扶貧項目——智慧課堂和雙師教學視為準自然實驗,運用雙重差分模型(DID)、PSM-DID等方法,較好地緩解了內(nèi)生性與樣本選擇偏差等問題,得到信息技術(shù)干預對學生學業(yè)表現(xiàn)影響的凈效應。第三,在政策啟示方面,該項目評估能為落后地區(qū)教育決策者進一步推廣、復制典型經(jīng)驗提供基于數(shù)據(jù)的實證支撐。同時,由于智慧課堂、雙師教學的前期設備投入成本較高,評估結(jié)果不僅有助于決策者權(quán)衡項目成本和收益,也可激勵地方政府與學校、企業(yè)、公益組織等開展多元合作,讓現(xiàn)代信息技術(shù)成果更好地惠及落后地區(qū)教育發(fā)展、縮小數(shù)字教育鴻溝。
2019年,L企業(yè)(集團)選擇了我國華北的W縣為試點開展其教育科技助學項目——智慧課堂和雙師教學。W縣經(jīng)濟發(fā)展水平落后,2012年被列入國家扶貧開發(fā)重點工作縣,2018年W縣順利完成脫貧摘帽,但目前仍是教育部的定點扶貧縣之一。W縣人民政府高度重視教育現(xiàn)代化推動工作,教育信息化建設取得了一系列重要進展,基本解決了“三通”問題,通過系列教育幫扶項目,進一步轉(zhuǎn)變了師生傳統(tǒng)的“教”和“學”的理念,增強了師生的自我效能感。
2019年,W縣將包括智慧課堂、雙師教學等教學形式在內(nèi)的綜合性教育扶貧項目引入W縣中小學。2019年10月下旬,雙師教學項目在W縣A初級中學(本部校區(qū))、B高級中學正式投入使用。雙師教學根據(jù)A、B中學各自需要,選擇不同年級、班級、學科、時間段開展。在開展雙師教學項目之前,L企業(yè)分別為A、B中學搭建了2間雙師教室(2)雙師教學對信息化設備要求較高,除教室需配備計算機外,還需配備能夠支持遠程實時互動的交互式電子白板、收擴音設備、攝像頭、答題器等硬件設備,此外還需要借助雙師教學平臺等軟件開展教學。。開展雙師教學時,線下教師為各班級任課教師,線上教師均來自L企業(yè)選拔出的各學科優(yōu)秀教師(3)L企業(yè)為國內(nèi)教育行業(yè)領軍企業(yè)。參與該項目的“優(yōu)秀教師”為L企業(yè)的S級(Super)教師,這些教師教學經(jīng)驗豐富、全部具有碩士及以上學歷。。A、B中學根據(jù)自主選擇的科目,利用校內(nèi)課后時間每周開展一次2節(jié)課2小時的雙師教學(4)在雙師教學中,常規(guī)授課進度由線下教師把握,線上教師并不講授新的知識點,而是根據(jù)線下教師和學生需求,有針對性地對某些重難點知識進行補充教學和輔導。,每次參與學習的2個試點班的學生需要到雙師教室進行學習,試點班在一年內(nèi)固定不變。同年11月,L企業(yè)為A中學裝備了10個智慧教室,并為試點班的每位任課教師和學生都分配了平板電腦,平板電腦中安裝了可聯(lián)網(wǎng)的L企業(yè)內(nèi)部的各學科教學資源庫及教學互動軟件。11月18日,A中學開始正式使用智慧課堂教學。在這兩個項目運行過程中,L企業(yè)派駐1名專業(yè)技術(shù)人員常駐A中學,該名技術(shù)人員不僅負責處理設備運行卡頓、故障、軟硬件更新等問題,還負責每日課后為智慧課堂教師提供后臺大數(shù)據(jù)分析結(jié)果,以便于教師及時掌握學習和教學統(tǒng)計數(shù)據(jù)。此外,L企業(yè)還不定期指派具有豐富的信息化授課經(jīng)驗的教師到試點學校開展教師信息化教學培訓,以提升當?shù)亟處煹男畔⒓夹g(shù)應用能力和素養(yǎng)。
在中國貧困地區(qū)農(nóng)村學校開展的CAL相關項目評估表明,信息技術(shù)能在學生成績落后情況下顯著改善其學業(yè)表現(xiàn)和非學業(yè)表現(xiàn),對促進義務教育均衡發(fā)展、縮小城鄉(xiāng)教育差距具有很大的潛力。[6]因此,在理論上,作為應用現(xiàn)代信息技術(shù)比CAL更為領先的教學模式,無論是智慧課堂還是雙師教學項目,都有助于改善學生的學業(yè)表現(xiàn)、提升他們的教育產(chǎn)出。
第一,在資源供給層面,智慧課堂提供了更為豐富的教與學資源,教師可通過平板電腦中的教學資源庫接觸到更為豐富的教學資源,包括備課教案、重難點知識解讀、習題庫等,并可有針對性地將這些資源分享給學生,故學生也可接觸到更為豐富的學習資源。這不僅有助于提升教師授課水平,也有助于拓展學生視野、加深他們對知識的理解,從而提升學生的學業(yè)表現(xiàn)。雙師教學則提供了更為優(yōu)質(zhì)的教師資源,針對學生學習中的重難點問題進行有針對性地輔導,提升了學生對知識的理解和消化能力,從而促進學業(yè)改善。第二,在理念層面,兩個項目均有助于教師提升運用現(xiàn)代信息技術(shù)進行教學的理念和與時代接軌的素養(yǎng),也有助于學生變革學習方式,逐漸實現(xiàn)從被動地“輸入”轉(zhuǎn)變?yōu)橹鲃拥亍皩W習”。理念的更新將提升師生在數(shù)字化時代的自我效能感,提升教與學的熱情,從而對學業(yè)改善產(chǎn)生潛移默化的影響。其三,在教學模式上,智慧課堂中富有趣味性的數(shù)字學習資源、利用平板電腦進行課堂互動等可以激發(fā)學生學習興趣;而教師可利用平板電腦進行備課、布置和批改作業(yè),利用大數(shù)據(jù)分析精準把握教學情況和效果,提升了教學效率和質(zhì)量。雙師教學有利于教師學習新的教學方法、授課技巧、資源運用、課堂互動等,提升教學水平,而學生在與線上教師的互動中既體會到遠程直播教學帶來的樂趣,也倍加重視寶貴的學習機會。因此,兩個項目通過變革傳統(tǒng)教育教學模式,從教師和學生兩側(cè)提升了教育和學習質(zhì)量,有助于改善學生學業(yè)表現(xiàn)。
然而,信息技術(shù)手段的介入能提高學生學習成績不是必然的。首先,如果本地教師缺乏信息化教學經(jīng)驗或無法有效提升信息化教學的水平,反而可能會使課堂教學效率和質(zhì)量下降,導致其無法按照原有的講授進度完成教學任務,從而不利于提高學生成績;其次,新的信息化教具的使用需要一定的適應期,適應期內(nèi),學生可能由于新鮮感并不能專注于使用平板電腦的學習功能,而教師也會增加很多額外的學習硬件、軟件操作技巧的時間和負擔。原有的授課理念、方式、節(jié)奏被打亂,師生在適應新教學模式中增加了時間成本,學生的成績也可能因此出現(xiàn)下降。第三,由于雙師教學課程的加入可能會替代原本在提高學生成績方面更為有效的線下教學活動或占用學生自主學習時間。同時,并非所有學生都能適應線上直播教學,也并非所有科目都適合線上直播教學。[23]第四,兩個項目的干預效果很可能受到學生個人和家庭特征的影響而呈現(xiàn)出差異。綜上,盡管在理論上我們認為智慧課堂和雙師教學對學生學業(yè)表現(xiàn)的積極影響更大,但仍存在一些可能不利于提升學生學業(yè)表現(xiàn)的因素,還需通過嚴謹?shù)膶嵶C分析來進行檢驗。
本文將W縣的兩個教育科技助學項目分別視為準自然實驗。我們以試點班級為處理組,選擇與處理組特征盡可能相似的非試點班級作為控制組,利用雙重差分模型(Difference-in-differences,DID)分別檢驗這兩個項目對學生學業(yè)表現(xiàn)的影響效應。首先構(gòu)建如下模型:
Δscore=β0+β1treat+ε
(1)
其中,Δscore表示學生的學業(yè)表現(xiàn)變化,用學生評估期成績與基期成績的差值來衡量。在估計中,我們分別使用原始分數(shù)、標準化分數(shù)進行檢驗。同時,設置處理組與控制組虛擬變量treat,參與智慧課堂(或雙師教學)的學生定義為1,控制組學生定義為0。treat的系數(shù)β1即標準雙重差分估計量,如果β1顯著為正,則說明干預項目能夠顯著改善學生的學業(yè)表現(xiàn),如果為負或不顯著,說明項目開展不利于改善學生學業(yè)表現(xiàn)。ε為隨機誤差項。除模型(1)外,本文同時使用如下拓展模型進行估計:
Δscore=β0+β1treat+β2score_baseline+λX+ε
(2)
其中,score_baseline是基期的學生成績;X是一組控制變量向量,反映學生個體和家庭特征,包括學生年齡、性別、網(wǎng)課經(jīng)歷、父母的受教育年限、兄弟姐妹個數(shù)、家庭收入狀況、家中是否有臺式電腦、家中是否有平板電腦。遺憾的是,由于參與雙師教學項目的學生為2019年進入初三年級的兩個班,2020年我們開展項目調(diào)研時這兩個班的學生已經(jīng)畢業(yè),故難以收集到樣本學生的個人和其家庭信息。因此,本文僅使用模型(1)估計雙師教學項目對學生學業(yè)表現(xiàn)的影響,使用模型(1)和(2)估計智慧課堂項目對學業(yè)表現(xiàn)的影響。
進一步地,針對模型(2),采用傾向得分匹配-雙重差分法(PSM-DID)來估計智慧課堂項目的處理效應。PSM-DID將處理組和控制組的樣本匹配到傾向值相近的樣本,使其滿足共同支撐域假設,再使用DID,進而得到更準確的結(jié)果。[27-28]估計模型如下:
ΔscorePSM=β0+β1treat+β2score_baseline+λX+ε
(3)
由于W縣只有一所高級中學(B中學),在B中學2個班級開展的雙師教學項目中,我們難以在W縣找到與處理組具有相似特征的控制組樣本。同時,由于B中學原雙師教學科目于項目期間內(nèi)臨時更換,難以保證評估的連續(xù)性。因此,本文將兩個項目的評估都聚焦到A中學。2019年,A中學使用智慧課堂、雙師教學的年級分別為初一、初三年級。A中學初一年級共有32個班,其中有10個班的學生參與了智慧課堂項目。我們篩選出其他4個沒有進行項目干預的班級作為這10個處理組班級的控制組。參與雙師教學項目的班級為A中學初三年級的2個班。同樣,我們篩選出A中學E校區(qū)初三年級的4個班作為控制組進行分析(5)A中學共有兩個校區(qū),即本部校區(qū)和E校區(qū)。兩個校區(qū)都采用劃片入學制度,總體生源質(zhì)量并未有明顯差異。。
本文使用學生成績的變化作為智慧課堂與雙師教學項目實施效果的評價指標?;诤驮u估期成績數(shù)據(jù)在W縣教育局支持下,由A中學校方提供。圖1展示了智慧課堂和雙師教學項目開展和各階段考試的時間順序。在智慧課堂項目中,我們共收集到了A中學初一學生的5次考試成績,如圖1(a)所示,本文選取2019年11月4日的考試作為基期成績;并選取了第四次、第五次考試作為評估期成績。在智慧課堂項目的14個樣本班中,5次成績信息完整的學生人數(shù)為824人。2020年10月,在智慧課堂項目開始后,我們以在線調(diào)查的形式收集了這14個班級學生的基線特征信息。由于調(diào)查的信息全部為客觀信息,因此以后期問卷來收集干預前的數(shù)據(jù)是可行的。[29]在824名學生中,個人信息完整的學生共有756名。如圖1(b)所示,在雙師教學項目中,我們選取2019年6月的考試成績作為基期成績,并選取2020年1月的考試成績作為評估期成績。在6個樣本班中,3次成績信息完整的學生共有290人。綜上所述,在不考慮控制變量情況下,兩個項目評估共涉及1114名學生樣本數(shù)據(jù),而在考慮控制變量情況下,兩個項目評估共涉及1046名學生樣本數(shù)據(jù)。
圖1 智慧課堂和雙師教學項目時間軸
表1報告了智慧課堂、雙師教學項目處理組和控制組學生的基期特征。在智慧課堂項目中,兩組學生在成績、個人和家庭特征上的平衡性較弱。處理組學生的主科成績(數(shù)學、語文和英語分數(shù)之和)比控制組學生的成績高出6.03分。在學生個人和家庭特征方面,除性別外,兩組學生在其他特征上都存在顯著差異。因此,在實證分析部分,本文在模型中加入了學生個人和家庭特征變量,并控制了學生的基期特征(包括學生基期成績),來規(guī)避基期成績差異帶來的影響。此外,在穩(wěn)健性檢驗部分,本文驗證了雙重差分模型的平行趨勢假設,并使用PSM-DID進行了穩(wěn)健性檢驗。在雙師教學項目中,兩組學生在成績上的平衡性較弱,故后文將進一步對平行趨勢假設進行驗證。
表1 兩個項目處理組和控制組學生的基線特征比較
1. 基準回歸結(jié)果
表2報告了雙重差分模型(1)的估計結(jié)果,其中Panel A報告了項目干預后主科成績原始分數(shù)的變化、Panel B報告了標準化分數(shù)的變化。結(jié)果表明,在項目開始較短的一段時間內(nèi),智慧課堂教學方式會使學生成績下降。從原始成績來看,2019年11月(基期),處理組學生的主科成績(274.24)要高于控制組學生的成績(268.21)(6)后續(xù)的檢驗說明,處理組與控制組之間在基期成績上的差異并不影響結(jié)果的有效性。。然而,在2020年1月,處理組學生的主科成績(288.24)卻低于控制組學生的成績(291.56)。2019年11月到2020年1月處理組學生成績的變化(14.00)要顯著低于控制組學生成績的變化(23.35)。然而,在智慧課堂項目實施將近一年之后,2020年10月,處理組學生的主科成績之和(284.07)顯著高于控制組學生成績(274.62),且處理組學生從2019年11月至2020年10月的成績變化(9.82)比控制組學生的成績變化(6.41)顯著高出3.42分。從標準化成績來看,學生學業(yè)表現(xiàn)的變化也具有類似趨勢,即智慧課堂項目短期內(nèi)對學生學業(yè)表現(xiàn)產(chǎn)生了負面影響,隨著項目實施期變長,智慧課堂項目顯著改善了處理組學生的學業(yè)表現(xiàn)。
表2 智慧課堂項目干預下學生主科總分成績變化情況
進一步地,根據(jù)模型(2),我們加入一系列學生個人和家庭層面的控制變量進行估計。同樣,我們采用原始分數(shù)變化和標準化分數(shù)變化兩種方式衡量因變量,估計結(jié)果如表3所示(7)限于篇幅,以標準化分數(shù)變化為因變量的回歸結(jié)果未列出,可向作者索取。結(jié)果表明,基于標準化成績的考察也具有與表3類似的結(jié)果,智慧課堂項目在第一個評估期使學生主科成績標準分下降了0.124分,但在第二個評估期使標準化分數(shù)提高了0.056分,特別是對英語成績改善作用明顯,顯著提升英語成績0.325分。。此外,由于智慧課堂教學模式對學生不同科目成績的影響可能不同,因此我們還分別展示了智慧課堂項目對數(shù)學、語文、英語三個科目成績的影響。
表3顯示,在第(1)、(5)列中,即使在加入學生基期成績、學生個人和家庭特征變量之后,智慧課堂項目對學生學業(yè)表現(xiàn)的影響也呈現(xiàn)出隨時間的動態(tài)變化。在以2020 年1月考試成績作為評估期成績時,智慧課堂項目使學生的主科總分顯著下降了7.96分;而到第二個評估期(2020 年10月)時,智慧課堂項目對學生成績的影響變成了正向——使學生的主科總分上升了3.60分。該結(jié)果說明智慧課堂對學生學業(yè)表現(xiàn)的影響是顯著的,且隨著項目實施周期變長,項目的影響效果呈現(xiàn)由負向正的轉(zhuǎn)變,驗證了表1結(jié)果的穩(wěn)健性。然而,第(2)-(4)和(6)-(8)列的估計結(jié)果表明,智慧課堂項目對不同科目的影響存在差異。具體而言,智慧課堂對學生的數(shù)學成績沒有顯著影響。無論是在第一個評估期,還是第二個評估期,智慧課堂項目對數(shù)學成績的影響不顯著。與此相對,智慧課堂對兩類語言科目存在顯著影響,其中,對語文成績的影響始終是負向的。到2020年1月為止,智慧課堂項目的實施使學生的語文成績顯著下降4.69分;到2020年10月時,負面影響略有下降,使學生語文成績下降3.60分。與對語文成績的影響不同,智慧課堂對英語成績的影響一開始為負,此后轉(zhuǎn)為正向影響。事實上,我們還并不能準確分析為何智慧課堂對不同科目成績的影響存在顯著差異,但這種差異或許和教師對平板電腦的使用效率、不同科目自身的特點有關。調(diào)研中我們了解到,英語教師對平板的使用效率較高,且英語科目大多數(shù)習題為選擇題,教師可以很方便地利用平板電腦與學生開展更多的答題互動,且學生的答題正確率等也能實時反饋在教師的平板電腦中,從而教師能夠進行有針對性的講解。對數(shù)學科目而言,學生可能更依賴傳統(tǒng)的面授方式,更習慣教師通過板書的方式講解知識點和習題,而語文科目的閱讀、寫作等環(huán)節(jié)也可能更多依賴學生和教師之間有效的溝通交流以及書寫的練習。
表3 智慧課堂項目對學生成績的影響(原始成績變化)
2. 穩(wěn)健性檢驗
(1)平行趨勢檢驗。雙重差分估計的重要前提條件是處理組與控制組在項目實施前的學業(yè)表現(xiàn)不存在顯著差異或有相同的變化趨勢。為了說明平行趨勢假設成立,本文使用干預前的考試成績進行了檢驗。在基期(2019年11月)之前的10月份,A中學進行了一次考試,因而可以將10月考試當作基期,11月當作評估期進行檢驗。表4報告了相應的估計結(jié)果。Panel A結(jié)果中的因變量為原始分數(shù)變化,Panel B中為標準化分數(shù)變化。從(3)、(6)行可以看出,無論是原始分數(shù)還是標準化分數(shù),處理組和控制組的發(fā)展趨勢都沒有顯著差異。因此,在本文樣本和分組條件下,可以利用雙重差分模型評估智慧課堂項目對學生學業(yè)表現(xiàn)的影響。
表4 平行趨勢檢驗
(2)利用 PSM-DID 方法修正樣本選擇性偏誤。由于處理組和控制組學生的基期特征平衡性較弱,因而使用PSM-DID估計智慧課堂項目對學生學業(yè)表現(xiàn)的影響。本文選擇學生個人和家庭特征變量作為匹配變量,利用 PSM方法,按照1:1近鄰匹配有放回抽樣的方法對處理組進行匹配。經(jīng)過匹配,大多數(shù)變量的標準化偏差在匹配后顯著縮小且基本小于10%,不同變量處理組與對照組樣本均值差異不顯著,說明處理組與對照組樣本具有平衡性。
鑒于在估計結(jié)果上,以原始分數(shù)變化和以標準化分數(shù)變化衡量的因變量具有基本一致的結(jié)論,故在PSM-DID估計中,我們僅展示因變量形式為原始分數(shù)變化的估計結(jié)果。表5的(1)、(2)列分別報告了不同評估期的估計結(jié)果??梢钥吹剑肞SM-DID方法得到的結(jié)果與基準回歸結(jié)果較為接近。從三門主科的總分看,到2020年1月,智慧課堂項目的平均處理效應為-7.396;至2020年10月,平均處理效應變?yōu)?.288,且在5%的顯著性水平上顯著。分學科看,智慧課堂對學生數(shù)學成績的影響始終不顯著;對語文成績的影響始終顯著為負,但負面影響的程度在減小;對英語成績的影響在項目實施初期為負,之后變?yōu)檎颉?傮w來說,智慧課堂項目的影響向有益于學業(yè)表現(xiàn)的方向發(fā)展。一個可能的解釋是,轉(zhuǎn)換教學方式帶來的成效需要較長時間才能展現(xiàn)出來。PSM-DID的估計結(jié)果也再次論證了前文基準回歸結(jié)果的穩(wěn)健性。
表5 PSM-DID估計結(jié)果
(3)安慰劑檢驗。根據(jù)研究樣本,將824名學生隨機分配到處理組與控制組中,從而隨機產(chǎn)生一個智慧課堂項目的處理組名單,構(gòu)造“人為”的處理變量。基于模型(2),分別以原始分數(shù)變化和標準化分數(shù)變化為因變量,在兩個評估期分別進行1000次回歸。我們繪制了1000次回歸中人為構(gòu)造的處理變量treat的回歸系數(shù)和對應的P 值分布(8)限于篇幅,安慰劑檢驗圖未報告,有需要的可向作者索取。。可以發(fā)現(xiàn),不論是以哪個指標為因變量,隨機分配的估計值集中分布在零附近。因此,智慧課堂項目對學生學業(yè)表現(xiàn)具有顯著影響的結(jié)論是穩(wěn)健的,并未明顯受到其他遺漏變量的干擾。
3. 異質(zhì)性檢驗
我們基于學生個人和家庭特征控制變量進行異質(zhì)性檢驗(9)限于篇幅,異質(zhì)性檢驗結(jié)果未報告,有需要的可向作者索取。,發(fā)現(xiàn):在個人特征層面,智慧課堂項目對男生的正向影響大于女生,而不論是男生還是女生,該項目對學生英語成績的提升作用最為顯著。智慧課堂對男女生的不同影響可能是由于男女生在信息技術(shù)素養(yǎng)上的差異。相關研究表明,男生的信息技術(shù)素養(yǎng)要優(yōu)于女生[30-32],因而更容易掌握新的教學電子設備的應用,從而更快地通過新的教學形式提高學習效果。智慧課堂項目對有過網(wǎng)課經(jīng)歷的學生的主科總分影響正向顯著,對無網(wǎng)課經(jīng)歷學生主科總分的影響不顯著,但對其英語成績的影響是正向顯著的。此外,我們還檢驗了智慧課堂對學生成績不同分位點的影響,如圖2所示,智慧課堂對學業(yè)表現(xiàn)的促進作用呈現(xiàn)出一種先增強、后減弱、又增強的“N”型變化特征(10)限于篇幅,僅展示智慧課堂對評估期為2020年10月、因變量為原始主科分數(shù)變化的不同分位點的影響。。當成績分位水平處于0.3或更低時,智慧課堂對學業(yè)表現(xiàn)的影響較弱甚至不顯著,而分位水平處于0.5附近時,智慧課堂對學業(yè)表現(xiàn)影響程度達到最大但此后又開始減弱;當成績分位數(shù)超過0.9之后,項目的影響又顯著變大。因此,智慧課堂對成績位于中分位和高分位水平的學生的促進作用最大。從家庭特征來看,總體而言,父母受教育水平越高則學生受智慧課堂項目的積極影響越大;而項目給低收入家庭學生帶來的成績提升越大。以上結(jié)論從群體內(nèi)部差異的角度為利用現(xiàn)代信息技術(shù)改善家庭條件較差學生的學業(yè)表現(xiàn)提供了經(jīng)驗證據(jù)。
圖2 智慧課堂對不同分位點上學生成績的影響注:實線為分位數(shù)回歸系數(shù),陰影部分為對應的置信區(qū)間;長虛線為OLS回歸系數(shù),其上下兩條點狀虛線為其對應的置信區(qū)間。
本文使用模型(1)估計雙師教學項目對學生學業(yè)表現(xiàn)的影響。其中,基期成績采用2019年6月期末考試成績,評估期成績?yōu)榫嚯x中考最近的一次統(tǒng)考成績——2020年1月的期末考試成績。表6的結(jié)果顯示,雙師教學項目顯著提高了學生的主科總分成績和數(shù)學成績,但對學生的語文和英語成績沒有顯著影響(11)考察標準化成績時,雙師教學項目對英語成績有顯著負向影響,但平行趨勢檢驗未通過,故無法采用該結(jié)論。。當然,這一結(jié)果需要建立在滿足平行趨勢檢驗的基礎上。我們以樣本學生在2018年6月至2019年6月期間的成績變化來檢驗平行趨勢假設。如表7所示,主科、語文和數(shù)學成績都通過了平行趨勢檢驗(12)數(shù)學成績的平行趨勢檢驗負向顯著,也可認為通過檢驗,不過估計系數(shù)存在偏低問題,也就是雙師教學項目對數(shù)學成績的影響比估計值要更大。,英語成績未能通過平行趨勢檢驗。因此,通過平行趨勢檢驗的主科總分、語文和數(shù)學成績估計結(jié)果可以作為評估該項目成效的經(jīng)驗參考??梢钥吹?,總體而言,短期內(nèi)雙師教學項目對學生學業(yè)表現(xiàn)具有改善作用,在該項目僅僅進行了不到4個月的時間里,項目對學生成績的影響正向顯著——使學生的主科總分上升了4.88分、使數(shù)學成績提高了6.89分,而基于標準化分數(shù)的檢驗也得到了類似結(jié)論。
表6 雙師教學項目對學生成績的影響
表7 平行趨勢檢驗Ⅱ
我們并不否認這一估計結(jié)果的穩(wěn)健性仍有待考量。一是由于對該項目的考察時期較短,目前并不能得到該項目長期影響效應的證據(jù);二是由于我們?nèi)狈W生個人和家庭特征的相關控制變量,可能會忽略其他因素對該項目成效的影響。盡管如此,我們對雙師教學對學業(yè)表現(xiàn)短期影響效應的考察仍具有一定參考價值。
本文以某原國家級貧困縣、現(xiàn)教育部定點扶貧縣為考察對象,首次對該縣引入的兩個現(xiàn)代信息技術(shù)輔助教學項目——智慧課堂和雙師教學對學生學業(yè)表現(xiàn)的影響進行了實證檢驗。本文發(fā)現(xiàn),智慧課堂對學生學業(yè)表現(xiàn)的影響呈現(xiàn)出隨時間的動態(tài)變化,項目在實施初期對學生成績造成了負面影響,但隨著時間推移轉(zhuǎn)變?yōu)檎蛴绊懀陧椖繉嵤┙荒旰?,該項目使學生主科總分上升了3.60分。同時,智慧課堂對不同科目的影響存在差異,該項目對數(shù)學成績的影響不顯著、對語文成績的影響為負,而對英語成績的影響由負轉(zhuǎn)為正。從學生和家庭異質(zhì)性看,男生、有網(wǎng)課經(jīng)歷、成績位于中分位和高分位水平、父母受教育水平較高、家庭經(jīng)濟條件較差的學生更加受益于此項目。就雙師教學項目而言,該項目在短期內(nèi)顯著提高了學生的主科成績和數(shù)學成績,在進行了不到4個月的時間里,該項目使學生的主科總分上升了4.88分、使數(shù)學成績提高了6.89分,但其長期影響效應還需進一步考察??傮w而言,兩個項目均對學生學業(yè)表現(xiàn)產(chǎn)生了顯著影響,智慧課堂的突出影響體現(xiàn)在改善英語科目的學業(yè)表現(xiàn),而雙師教學的積極影響主要體現(xiàn)在改善數(shù)學科目的學業(yè)表現(xiàn)。上述結(jié)論蘊含的啟示在于:
第一,現(xiàn)代信息技術(shù)的發(fā)展可以為解決落后地區(qū)教育發(fā)展難題、推動基礎教育優(yōu)質(zhì)均衡提供新的機遇和工具。教育信息化是補齊教育短板的重要抓手,隨著教育信息化步入2.0時代,一方面,在信息化基礎設施建設中,要通過推動教育領域的網(wǎng)絡、平臺、資源、校園、應用和安全新基建,為新時代智慧教育發(fā)展提供堅實的基礎和應用環(huán)境支撐。例如,進一步完善智慧教學設施,提升通用教室的多媒體教學裝備水平,支持互動反饋、高清直播錄播等教學方式;普及符合技術(shù)標準和學習需要的個人學習終端,支撐網(wǎng)絡條件下個性化的教與學。另一方面,應重點考慮如何在教學理念、模式、內(nèi)容等“軟件”層面實現(xiàn)現(xiàn)代信息技術(shù)與教育教學的深度融合。要進一步創(chuàng)新教育資源和服務的供給方式,增強優(yōu)質(zhì)教育資源的有效供給和基礎數(shù)據(jù)的互聯(lián)互通。針對落后地區(qū)仍然存在的師資匱乏、優(yōu)質(zhì)學習資源不足、師生信息素養(yǎng)低等教育發(fā)展難題,在加強“三個課堂”應用的基礎上,整合優(yōu)化公共數(shù)字教育資源并共享利用社會個性化資源,要充分利用“互聯(lián)網(wǎng)+教育”大平臺,圍繞區(qū)域、學校和師生的教育教學需求,通過教育教學模式改革與創(chuàng)新,如采取智慧課堂、雙師教學等新方式和手段促進教育資源優(yōu)化配置、縮小區(qū)域和城鄉(xiāng)教育差距。鑒于一些有潛力的新項目具有較高的設備投入成本,可充分發(fā)揮多方力量,探索企業(yè)硬件平臺支持、政府和學校購買服務等新模式。
第二,要堅持以人為本,關注信息技術(shù)應用于教學給師生帶來的心理狀況、適應能力和差異化影響。智慧課堂項目在短期內(nèi)對學生學業(yè)表現(xiàn)有負面影響,可能的原因之一是項目實施初期,師生不論是在心理還是技術(shù)應用方面都存在不適應。為此,一方面,在引入信息技術(shù)輔助教學時,要密切關注師生心理狀態(tài)變化,積極開展相關輔導和培訓,提升技術(shù)的人文關懷。另一方面,要切實加強教師信息技術(shù)技能的專業(yè)培訓,推動教師在教學理念、方式、內(nèi)容方面的創(chuàng)新與突破,通過提升教師信息化素養(yǎng)進一步改善學生的課堂體驗,提高學習效果。同時,研究表明,信息技術(shù)輔助教學的實施效果呈現(xiàn)出學科、個體和家庭異質(zhì)性。為此,在引入數(shù)字化資源和信息化教學模式時,應根據(jù)不同學科特點有針對性地設計符合學習規(guī)律的課程資源和教學方式,并實現(xiàn)多種教育教學資源的組合應用。例如,對數(shù)學科目而言,學生與教師在課堂上的有效互動可帶來更佳的學習效果,因此在線下常規(guī)授課的同時,可利用雙師課堂開展遠程直播輔導,并鼓勵學生在課后通過數(shù)字化學習資源開展自主探索;而對于英語科目來說,重點利用智慧課堂所提供的數(shù)字資源以及教、學、測、練、評等功能開展教學,則能夠取得較好的學習效果。此外,還應關注項目實施對個體的差異化影響,向不同群體提供公平但有差異化的資源和服務,以提升現(xiàn)代信息技術(shù)輔助教學的包容性。
第三,要注重挖掘典型經(jīng)驗和案例,形成可復制推廣的經(jīng)驗,逐步擴大試點范圍。本文所評估的兩個項目均在華北某經(jīng)濟落后縣開展,實踐和評估均表明,項目在轉(zhuǎn)變落后地區(qū)師生教與學理念、改善學業(yè)表現(xiàn)中發(fā)揮了積極效果。這說明,遠程配置優(yōu)質(zhì)教育教學資源服務于落后地區(qū)的教育教學實踐,可顯著改善落后地區(qū)教育發(fā)展難題、縮小教育差距。特別是雙師教學,由于該模式能最大化優(yōu)質(zhì)師資的輻射效應,具有在落后地區(qū)大面積推廣的可行性。為此,應積極總結(jié)經(jīng)驗,建立和完善包含第三方專業(yè)評估機構(gòu)在內(nèi)的項目執(zhí)行反饋、評估機制,對教育幫扶項目的成本收益、實施效果、推廣復制可行性等進行科學評估。在此基礎上,可挑選一批經(jīng)濟和教育落后地區(qū)及農(nóng)村學校、教學點為試點,全力補齊硬件設施與軟件資源等方面的短板,綜合利用人工智能、云計算、大數(shù)據(jù)、虛擬現(xiàn)實等技術(shù),不斷提升課堂教學的智能化、共享性、互動性。同時,引入本地區(qū)或發(fā)達地區(qū)優(yōu)秀中小學、社會機構(gòu)的教師資源,通過政府購買,以在線直播形式定期服務于落后地區(qū)的教育教學實踐,逐步探索出可復制、可推廣的典型經(jīng)驗。