■ 潘慶紅 涂鳳嬌
湖南科技學院教師教育學院 永州 425199
我國自2016年開始在全國實行教師資格證統(tǒng)一考試制度,要求各級各類院校培養(yǎng)的師范生必須考試過關才能持證上崗?!敖處熧Y格考試是我國教師準入管理制度的重要環(huán)節(jié),銜接教師培養(yǎng)與聘用。教師培養(yǎng)是保障教師質量的源頭和關鍵,教師資格考試具有顯著的‘指揮棒’作用”[1]。教師準入制度的改變必然影響高校師范生人才培養(yǎng)機制,主要體現在學校要在教學模式,課程建設,實踐實訓等方面積極變革順應現實要求,對師范生則意味著其學業(yè)要求更高,國考制度全面推行以來,師范生的考證通過率間接反映了學生能否在本專業(yè)領域上崗的就業(yè)率,進而倒逼學校在人才培養(yǎng)模式上以質量為核心進行改革,強化教師教育特色。以關鍵字“師范生”+“教師資格”在知網文獻檢索顯示,高校師范生培養(yǎng)的質量監(jiān)控研究大多從人才培養(yǎng)模式、課程設置如何與教師資格證考綱對接,如何加強實踐教學提高師范生教師教育綜合素質等方面展開,還沒有基于學業(yè)數據分析對師范生培養(yǎng)過程進行質量監(jiān)控的研究。
隨著教育大數據、學習分析技術的快速發(fā)展,為精準監(jiān)測學習過程提供了充分的技術支持。“學習風險預警分析聚焦于學生個體,通過測量、收集、分析和報告學生的學習表現數據,找到其中的問題并對學生學習過程進行及時干預”[2],可以對學生起到預警作用,督促其采用有效的方法提高學業(yè)成績。同時也能夠用于教學過程分析,督促教師采取更加有效的教學策略[3]、教學水平和管理能力。教育部《教育信息化“十三五”規(guī)劃》(2016)中指出,要“依托網絡學習空間逐步實現對學生日常學習情況的大數據采集和分析,優(yōu)化教學模式”。通過利用師范生教育的過程數據進行數據挖掘,并進行學業(yè)預警,對那些有可能無法通過教師資格證考試的學生進行適當的督促和提醒,從而師生共同采取改進措施,以提高師范生教師資格證的通過率。
學業(yè)預警的核心是預測算法模型和學習分析模型。預測算法模型常用聚類、分類、貝葉斯網絡、決策樹、語義分析等。其中聚類、分類是學業(yè)預警研究中應用最多的算法模型。聚類適用于將自然態(tài)的無序學業(yè)數據依據相似性劃分出不同類別族群或成績區(qū)間,形成預測目標。分類則通過預測規(guī)則將對象歸類到目標族群或成績區(qū)間里。如武法提[4]等構建的學習預測模型對數字化學習環(huán)境中學生個性化學習特征、學習行為、學習內容到學習結果遞進分析,采用聚類分析將學生分為不同學習水平的群體,用決策樹、時間序列分析預測并得出分析報告。文獻檢索發(fā)現自2012年陸續(xù)出現將離群檢測技術運用于教育領域的研究,主要實現學生離群預警(學業(yè)成績)、教師離群預警(評教)等。例如Cheng 等[5]結合聚類算法和離群點檢測算法識別學習社區(qū)中的異常學習行為,用聚類方法將同類學習行為對象集中到相同族群中,對游離對象進行離群檢測,實現對學習行為異常的識別和預警。學習分析模型主要在學業(yè)預警中起到統(tǒng)一學習行為的度量,規(guī)范學習分析方法的作用。George Siemens[6]的學習分析循環(huán)模型包含采集、存儲、數據清洗、數據整合、分析、可視化呈現和行動七個部分,較為完整地呈現了學習預警必需的分析過程。在學習分析模型的應用層面,國外高校開發(fā)實現了多種學習預警系統(tǒng),如普渡大學開發(fā)的課程信號系統(tǒng)、可汗學院的學習儀表盤、海星預警系統(tǒng)等[7]。相對于國外理論與實證并重,研究內容和方法多樣,國內研究者更注重研究模型的系統(tǒng)性和完整性,但實證研究較為單一,預警系統(tǒng)的研發(fā)尚處于起步階段。如楊現民等構建知行情三維學習預警模型[2],將在線學習平臺中采集的數據分為知識、行為、情緒3 類,采用內容分析、社會網絡分析、語義分析等方法推測是否存在異常,從知識、行為和情緒3 方面對在線學習者進行全方位預警,是國內同類模型中較為全面的模型框架。袁安府[8]等提出由領導機制、預警幫扶和激勵機制3 方面組成學業(yè)預警幫扶機制來降低學生輟學率。
預警指標的選擇對學業(yè)預警結果具有重要影響,預警指標可歸納為3類,即人口統(tǒng)計學信息、過去的學習成績、學習過程數據[9]。其中學習過程數據屬于動態(tài)數據,既有在線學習環(huán)境中學習行為數據(如訪問時長、互動討論、下載上傳等),也有線下學習行為數據(如實踐實訓、課堂表現、科技活動等)。由于線上學習的數據容易采集且數據相對規(guī)范,數據驅動的學習預警研究對線上學習過程的預警和分析較多,缺乏以學習者為核心整合線上數據與傳統(tǒng)課堂環(huán)境下學習過程數據的挖掘研究。尤其對師范生培養(yǎng)來說,師范教育過程注重學科知識的掌握,更要持續(xù)不斷地提升教師職業(yè)素養(yǎng)和綜合能力,加強現實環(huán)境中教學技能訓練,此類線下學習過程數據是影響教師資格獲得的決定性因素。通過文獻檢索發(fā)現,師范生教師資格獲得相關研究大多集中在教師資格考試制度的理論研究、與國外教師資格準入制度的比較研究、“國考”制度的效應研究以及人才培養(yǎng)模式的變革等方面,幾乎沒有利用數據分析進行教師資格獲得風險監(jiān)控及其精準干預的研究。針對上述師范生學業(yè)預警研究的不足,本文參考楊現民、陸柳生等利用離群點檢測技術來預測預警學習者學業(yè)狀態(tài)的方法,以師范生教師資格(中學)獲得為目標,通過對師范生培養(yǎng)過程中線下學科成績的實時采集和離群挖掘分析,有效識別學習危機學生,便于教師了解學習者的學習情況并及時發(fā)現學習中存在的問題,通過精準干預機制有效引導學生學習,促進學生學業(yè)發(fā)展。
離群點檢測(Outlier Detection,OD)又被稱為異常檢測,是大數據分析中常用的手段之一。通過將數據集中與大部分數據特征屬性差異較大的異常數據(離群點)檢測出來,以識別不符合預期模式的數據集或觀察結果[10]。離群點檢測算法可以大致分為5 類:基于分布的離群點、基于深度的離群點、基于聚類的離群點、基于距離的離群點和基于密度的離群點[11]。根據擬解決問題的數據特征,本文采用基于密度的局部離群點檢測算法來判斷學生成績是否異常。若學生學業(yè)成績中多門科目不及格,且與其他學生成績數據偏離太多,則懷疑該生學業(yè)成績異常,進入預警隊列。
基于密度的局部離群點檢測算法通過定義局部離群點因子(Local Outlier Factor,LOF)反映樣本數據點的離群程度,并計算全部數據點的LOF 值,找出其中最大的值定義為離群點。具體來講,對數據集中任意樣本數據x,在x 周圍確定一個距離k,分析x 與k 范圍之內的相關的點,計算出每一個對象的離群因子,進而判斷出是否為離群點。在學生成績數據中,正常樣本點周圍平均密度與其鄰域內其他樣本點密度相差較小,而異常對象樣本點平均密度明顯不同于其鄰域內其他樣本點。
基于密度的局部離群點檢測方法具體實施起來分為5個步驟:計算每個對象與其他對象的歐氏距離,確定參數k的取值范圍,計算每個對象可達密度,計算每個對象LOF 值和對每個點的局部離群因子進行排序輸出。針對所有對象的最終LOF,選取異常的LOF 值所對應的學生作為可疑離群學生。
離群預警算法步驟如下[12-14]:
(1)定義樣本數據點x的第k距離:k_distance(x)
對于數據集D,將樣本點x與另一個對象o之間的距離記作d(x,o)。當1)至少存在k 個樣本點x'∈D{x}滿足d(x,x')≤d(x,o);2)至多存在k-1 個樣本點x'∈D{x}滿足d(x,x') (2)確定樣本點x的第k距離鄰域Nkdistance(x) 樣本點x 的第k 距離鄰域為所有到樣本點x 的距離小于等于x的第k距離的樣本點的集合,記作: 可達距離即兩個樣本點x 和o 之間的歐式距離或是x的第k距離,如式(2)所示: (4)計算樣本點x的可達密度lrdk(x),如式(3): 其中,|Nkdistance(x)|表示在x的第k鄰域內樣本點的個數。x的可達密度越高,表示x與其領域數據屬于同一簇的可能越高;密度越低,x是離群點的可能越高。 (5)計算x的局部離群因子lofk(x),如式(4): 基于學業(yè)成績的教師資格證獲得預警的具體方法是將師范生大一至大三的開設課程與教師資格證考綱模塊進行關聯,篩選出與考綱中知識模塊對應的課程,采集這些課程的考試成績,運用局部離群點檢測技術找出成績異常學生,結合離群數據分析和原因分析,進一步確定成績異常學生并將預警信息反饋至學生本人和教師,教師通過相應教學手段來干預離群對象,離群對象自身也引起重視采取措施改進學習行為,從而提高教師資格證國考通過率。 全國教師資格證考試在大部分省市一年兩考(3月、11月),個別省份理論考試一年一考(11月),各個高校在課程設置時,從畢業(yè)生畢業(yè)時能順利拿到教師資格證考慮,一般會將考綱所要求模塊涉及的課程安排在大三結束前。因此,本文師范生教師資格證獲得預警分析使用的數據源主要采集師范生大一至大三的、與考綱對應的課程考試成績,利用基于密度的離群點檢測算法對師范生6 學期的相應成績進行數據挖掘,找出可疑的離群學生,再進一步分析可疑學生學業(yè)成績,最終在所有學生中找出極有可能無法獲得教師資格證的學生。具體流程如圖1所示[15]。 圖1 預警流程 通過離群結果驗證課程合格情況與教師資格證獲得結果的相關性。分析離群學生的學業(yè)狀態(tài),確定離群學生,為教學工作者下一步工作做參考。 全國教師資格證(中學)考試有筆試與面試兩個環(huán)節(jié),筆試內容分為綜合素質、教育知識與能力和學科知識與教學能力3 個科目,面試內容主要是教育教學實際能力展示[16]。在綜合素質方面考查師范生教育理念、職業(yè)道德、法律法規(guī)知識、科學文化素養(yǎng)、語言表達、邏輯推理和信息處理等基本能力;在教育知識與能力方面考核教育教學、學生指導和班級管理的基本知識;在專業(yè)學科與教學能力方面考查學科領域的基本知識、教學設計實施評價的方法掌握情況,以及是否具備運用所學知識分析和解決教育教學實際問題的能力。教師資格獲得預警的思路就是將以上3個科目的考核目標和考核內容與師范生在校學習的課程相關聯,關聯課程的成績反映了學習的成效以及知識掌握程度,如果一個學生有多個關聯課程成績不佳,基本能反映該生在考試中將會遇到困難。樣本數據集(關聯課程)的確定依據是3門筆試科目的考試大綱,輔助依據是面試大綱。 我們在參考國內外文獻的基礎上,以高中數學教師資格證考試為例,全面分析了理學院數學與應用數學專業(yè)2016 級所開設全部63 門課程的教學大綱,將每門課程的教學要求、教學內容、教學重難點與教師資格證考綱的考試目標和模塊進行比對分析,初步建立了考綱模塊與課程內容的映射關系表,再征詢數學專業(yè)教師、教師教育專業(yè)教師、中學數學教師等專家意見,最終確定了考綱模塊與課程關聯表(表1),為構建預警數據集確定了方法。 表1 教師資格證考綱與課程關聯表 本次師范生教師資格證獲得預警實驗的對象是某地方性本科院校理學院數學與應用專業(yè)2016級,該專業(yè)共兩個班84 名學生,學業(yè)成績數據采集時間為2019年7月。該校組織學生參加教師資格證考試時間是2019年11月(大四上學期),為有效應對教師資格考試,與3個筆試科目相關聯的課程都安排在大一至大三完成,大四上學期主要進行教育實踐訓練和復習迎考。實驗中將獲取數據進行離群檢測后出現了若干可疑學生,教師資格證考試成績公布后比對分析這些可疑學生的教資考試通過情況,再次驗證該預警方法的準確性。 實驗數據來源于數學與應用專業(yè)2016 級學生1~6學期課程考試成績,原始數據中包含2 個班84 名學生的考試成績。其中,無上一級留級生,有4名從其他學院轉入學生,轉入學生在數據采集前已修完相關課程學分,故保留其成績。 根據上一節(jié)預警數據集確定方法,篩選出20 門課程,其中與教育知識與能力科目關聯課程2門,與綜合素質科目關聯課程4 門,與數學學科知識與能力科目關聯課程14門。(表2) 從教務管理系統(tǒng)導出全部20門課程成績數據后,進行數據預處理。第一步進行數據清洗,去掉3 名有申請緩考記錄且相應課程暫時沒有成績的學生,2 名有缺考且相應課程暫時沒有成績的學生,篩選出符合要求的78名學生的成績數據。在源數據中涉及部分學生成績重復值的問題,即一門課程有正??荚嚦煽兒脱a考成績,我們認為補考是在教資考試之前進行的,對于補考的復習也在某種程度上加深了該生對教資考試相關知識點的記憶,故本次實驗剔除正??荚嚦煽儯A羝溲a考成績。第二步缺失值處理,這里主要涉及個別學生的免修課程,以該課程的年級平均值來填充。第三步數據變換,將由“優(yōu)秀”、“良好”、“中等”、“及格”、“不及格”評價的課程成績轉化為相應的分數,此次的課程評價不涉及此類評價故跳過此步驟。 預處理完成后,教育知識與能力、綜合素質和數學學科知識所涉及的課程成績分布有不同差異,各科成績分布的直方圖如圖2 所示[12],課程直方圖排序與表2 順序一致。直方圖橫坐標表示分數0~100,間距為10,縱坐標表示各段分數所對應的密度。比較突出的是數學分析(二)不及格率高達15.66%,高等代數(二)和心理學不及格率均為7.23%。 圖2 各科成績分布的直方圖 表2 關聯課程 通過Python 中的NumPy、Pandas實現基于密度的局部離群點檢測算法對學生成績數據進行挖掘,使用Python 中的Matplotlib 的繪圖能力來展示結果。在本問題中,考慮到教育知識與能力、綜合素質相關課程和數學學科知識與能力包含課程內容不同,且各課程在知識的考察中所占百分比不同,本文使用了帶權重的歐氏距離測度[17], 其中,mn表示課程n({n∈[1-20],n為正整數)在教資考試中所占百分比,xn和on分別表示學生x 和學生o 的n 課程成績。 根據k的取值范圍,計算對象的LOF。規(guī)則為:在不同k 下計算每一個對象的LOF,然后選擇每個對象在不同k 下的最大LOF,將其作為對象的最終LOF。結果如圖3所示。橫縱軸分別表示對象和其LOF。從縱軸方向看,絕大部分對象的LOF 值位于區(qū)間[-0.4,0.1],對象LOF 值越大,對象的密度越來越小,意味著對象的離群程度越來越高[12]38。 圖3 每個對象的LOF 局部離群因子 從本次實驗結果中,我們獲得3 個較為典型的離群學生,3 名學生的關聯課程成績評估結果與教師資格考試結果是相一致的(表3、圖4),表3 中匯總了離群學生的學業(yè)成績中與教師資格證筆試3大科目關聯的危機課程門數,為了驗證試驗結論,表中也給出了學生參加教師資格證考試以后的未通過情況。 表3 典型離群學生學業(yè)信息匯總 圖4 為離群學生的20 門課程成績與年級平均成績的對比折線圖,橫坐標表示科目,科目順序與表1呈現順序一致,縱坐標表示成績,虛線表示每門課程的年級平均成績,實線表示離群學生的20 門課程實際成績,從圖示可看出3名離群學生的關聯課程成績幾乎全部位于年級平均線之下,有些課程分差達40分以上。 圖4 學生成績與年級平均成績對比折線圖 再進一步分析離群學生的學業(yè)成績顯示: 9 號學生離群特征最為突出,該生在數學學科知識與能力14 門關聯課程中正??荚? 門不及格,補考后仍有數學分析(二)、高等代數(一)、高等代數(二)和常微分方程4 門不及格。同時,該生有19 門課程成績低于各科平均分,其中有6 門課低于平均分20 分以上。該生關聯課程整體情況很差,尤其是學科知識的學習情況對于通過數學學科知識與能力的考試十分不利,心理學成績是補考之后才獲得通過。最終,教師資格證考試驗證預警結果,該生教育知識與能力和數學學科知識與教學能力兩個科目未通過筆試。 42 號學生心理學、數學分析(二)和高等代數(一)3門課程不及格,另有6 門關聯課程剛過60 分及格線,不排除教師在考試閱卷時有些許放水的可能,該生教育學課程僅60 分通過,在數學學科知識與能力考察的14 門課程中,該生有13 門學科課程成績低于年級平均分,學業(yè)狀態(tài)很差,要想通過數學學科知識與能力科目和教育知識與能力科目的考試著實要花一番功夫。最終在教師資格證考試中,該生僅綜合素質科目合格,其他兩個科目未能通過筆試。 45號學生20門關聯課程中8門及格但均低于63分,另有心理學、數學分析(二)、高等代數(一)、常微分方程4門不及格,尤其常微分方程與年級平均分相差49分,該生可能在教育知識與能力和數學學科知識與能力科目中因學業(yè)困難而無法通過。最終該生在教師資格證考試中3個科目都未通過。 (1)本研究豐富和完善了利用數據分析對在校生學業(yè)質量檢測預警的手段和方法。對師范生一至三年級的學業(yè)成績,通過建立教師資格證考綱考試內容和考試要求與學科課程的對應關系,采用基于密度的離群點檢測算法模型,以數學與應用專業(yè)學生的課程成績?yōu)閷嶒灅颖具M行數據挖掘,識別教師資格獲得存在危機的學生。研究結果顯示本文采用的預警方法通過對教師資格考察目標和內容密切相關課程的學業(yè)成績進行挖掘分析,可以識別出教師資格獲得危機的學生,引起學生對教師資格證考試備考的重視,對教師提供危機學生個別干預的依據,有利于教師精準施教,有針對性地采取幫扶措施。 (2)研究的主要創(chuàng)新在于將離群檢測算法應用于師范生教師資格獲得預測中。在預測模型中單門關聯課程成績對教師資格獲得影響的判斷依據采用了教師資格考試大綱中規(guī)定的知識點占比數值,算法上采用帶權重的歐氏距離測度來確定與鄰近點的距離。用該專業(yè)學生最終參加教師資格證考試成績來驗證預警模型的有效性,該算法模型對離群特征顯著的學生預測可達到100%,但對離群特征不明顯的學生識別率較低,預警規(guī)則需進一步優(yōu)化改善。 (1)建立分級預警機制。對標教師資格證考綱要求,分解培養(yǎng)方案中知識目標、能力目標,將面試和實踐教學納入預警指標體系,確定影響教師資格獲得的因素,并為每一個因素進行權重分配。優(yōu)化考綱中知識點和能力要求對應課程知識點的關聯規(guī)則,預警分級可以使干預時機提前,教師在危機初期即可介入。 (2)創(chuàng)建教育教學能力綜合學習網絡空間。學科課程成績反映專業(yè)知識的掌握,而教師職業(yè)認知和教學能力則需要通過教育見習、頂崗實習等現實教學場景中反復訓練得以發(fā)展。從大一開始通過建立教學技能訓練過程檔案,加強學習過程中實踐性學習狀態(tài)數據采集,納入與教學能力提升訓練相關的過程性數據、非結構化的學習定性數據。定量與定性評價相結合,當定性數據難以轉化為基于密度的離群檢測所需的空間分布特性時,則采用其他預警方法,多源數據集和多元預警方法能大幅提高預測的準確性,客觀全面反映師范生學業(yè)狀態(tài) (3)自動反饋與人工干預相結合。如果以教師資格獲得為導向通過學習過程數據挖掘得到危機預警,對危機的干預就是從目標到源頭的逆向工程,在此過程中干預以教師的幫扶為主,對知識查漏補缺,更重要是對不同危機學生進行有針對性的教學知識和能力的強化訓練。網絡學習空間中學業(yè)狀態(tài)的自動反饋不僅指學生接收到的學習過程評價報告、警示信息等,還包括對每次教師資格考試成績情況進行的內容分析和數據挖掘,是教師做出科學合理、差異化教學決策的重要依據。 綜上,師范生教師資格證的獲得是師范生職業(yè)發(fā)展的門檻,在國考背景下,要求師范生具有豐富的教育知識與學科能力,對其培養(yǎng)過程進行量化預測,對學業(yè)危機能及時預警和精準干預,貼合教育發(fā)展規(guī)律,也順應了智慧教育教學的時代要求。2 基于學業(yè)成績的教師資格證獲得預警方法
2.1 預警流程
2.2 數據集的確定
3 實驗與應用效果分析
3.1 數據獲取
3.2 離群點檢測
3.3 結果對比驗證
4 研究結論與建議
4.1 結論
4.2 建議