張冕 趙晨
摘?要:越來越多的高校使用學生對教師課堂教學的評價來作為評判教師課堂教學質(zhì)量的關鍵依據(jù)。多數(shù)高校學生評教系統(tǒng)中均同時包括數(shù)值信息的學生評分和非數(shù)值信息的學生評價文本,但出于信息收集與計算的方便,多數(shù)高校僅使用評分數(shù)值計算評教結(jié)果,本文使用了共4001條管理學原理課程的所有學生評教文本信息,對學生評教文本信息要素進行抽取,通過評價者異質(zhì)性判別,保證所抽取文本語義因素能適用于絕大多數(shù)學生所發(fā)布的評教信息,并使用多種方式判斷了所挖掘文本語義因素,對課堂教學評價歸類的預測有效性。
關鍵詞:評教信息;文本語義因素;機器學習
中圖分類號:G4?????文獻標識碼:A??????doi:10.19311/j.cnki.16723198.2024.03.079
0?引言
目前,基于人才培養(yǎng)在高校中的重要作用,各高校越來越重視教師課堂教學質(zhì)量,并且有越來越多的高校使用學生對教師課堂教學的評價來作為評判教師課堂教學質(zhì)量的關鍵依據(jù)。多數(shù)高校學生評教系統(tǒng)中同時包括數(shù)值信息的學生評分和非數(shù)值信息的學生評價文本,但出于信息收集與計算的方便,多數(shù)高校僅使用評分數(shù)值計算評教結(jié)果,這種僅依賴評教數(shù)值信息的方式會引發(fā)學生對評分標準理解不一致、學生評分隨意性強、評分區(qū)分度不高、評分結(jié)果過于簡單,導致教師不愿接受、難以反饋和持續(xù)改進等問題。
基于上述背景,本文希望挖掘?qū)W生評教中評價文本的語義信息,與評教中的數(shù)值評分共同作用,更全面、有效的利用學生評教中的各類信息,形成更為科學、系統(tǒng)的評教結(jié)果,并提升師生雙方對評教過程與評教結(jié)果的重視程度與認可程度,推動教師結(jié)合評教信息進行課堂教學的改進,持續(xù)推動課堂教學質(zhì)量和學生培養(yǎng)質(zhì)量的提升。
1?文獻綜述
目前與本文相關的國內(nèi)外已有研究,包括學生評教的意義和作用、學生評教的問題和優(yōu)化策略,及文本語義信息的挖掘運用等方面。
別敦榮(2017)強調(diào)學生評教是高校教學質(zhì)量保障的一項根本制度,它的建立使學生擁有了表達教學意愿的常規(guī)渠道,有助于高校樹立服務學生的辦學宗旨;陳佑清(2016)認為通過學生對課堂教學質(zhì)量的評判可以系統(tǒng)地促進教學改進,成為高校內(nèi)部教學質(zhì)量保障體系的重要環(huán)節(jié)。但目前在學生評教的實施過程中也出現(xiàn)了一些問題,例如江利(2020)從評教的功能定位、評教的指標體系、學生完成評教的意愿和態(tài)度、評教結(jié)果的反饋與運用等方面剖析了當前評教中的突出問題。
在信息管理的研究中,信息可以被分為數(shù)值信息與非數(shù)值信息兩類,Liberti(2019)認為數(shù)值信息收集過程簡單、便于理解,但表達內(nèi)容單一,非數(shù)值信息雖然難以收集,且需要置于特定的情境中理解,但能表達更豐富的內(nèi)容,二者需要結(jié)合使用。
2?研究方法與研究過程
鑒于本文的研究目的和研究對象,本文采用信息管理和機器學習中的文本語義因素挖掘、分類、預測的設計方法來完成,具體包括以下3個步驟:
首先,采用人工初始設定與機器關聯(lián)學習結(jié)合的方式挖掘?qū)W生評教信息中的文本語義因素,形成正向因素詞典與負向因素詞典。項目組將首先結(jié)合權威的正向與負向情感詞典內(nèi)容與課堂教學的特征,人工設定評教文本中正向與負向的典型詞匯各20個,例如,將“精彩、收獲、滿意”等作為典型正向詞匯;將“糟糕、無聊、不負責”等作為典型負向詞匯。之后,收集之前的大量已有學生評教文本信息,通過機器學習形成評語中出現(xiàn)的其他詞匯與初始正負向詞典的相關度矩陣,在給定相似性閾值θ時,當某一詞匯與初始正負向詞典的相關度超過閾值時即添加該詞進入相應詞典,形成完整的最終正向評教文本詞典與負向評教文本詞典。令初始詞典為KV,其中的初識詞匯為wi,詞匯相關矩陣為DTM,新添加詞匯為sck,則機器學習的基本程序為:
其次,本文將對于抽取出的文本語義因素進行評價者異質(zhì)性的判別,以求保證不同學生給出的評教文本中,同一詞組卻導致了不同文本語義關聯(lián)的情況不會顯著出現(xiàn)。
最后,本文將使用不同的預測模型,使用挖掘出的評教文本信息判別一個特定學生對教師課堂評價屬于“好的”或是“不好的”。
本文研究的數(shù)據(jù)使用了我校近2學期,即2022—2023學年的兩個學期中,管理學原理課程的所有學生評教文本信息,共4001條。使用上述方法完成文本語義因素評教的結(jié)果會將每一個學生對于管理學任課教師的課堂教學評價歸類為“好的”或是“不好的”兩類之一,并以特定教學班中教學評價歸類為“好的”比例作為課堂教學評價的輔助標準。
3?研究結(jié)果
3.1?文本語義因素的抽取
在使用本文第三部分描述的文本語義因素抽取過程對實際管理學原理課程學生評教文本信息進行抽取后,使用R程序中推薦的標準數(shù)值,將與初始設定詞語相關聯(lián)的其他詞語進入文本語義因素庫的閾值PMI(wi,wj)=log2P(wiwj)P(wi)P(wj)設定等于8,最終尋找到87個詞語構(gòu)成文本語義因素庫。
3.2?評價者異質(zhì)性判別
為了保證所抽取文本語義因素能適用于絕大多數(shù)學生所發(fā)布的評教信息,必須保證對于不同的評價者,即學生,可能使用的詞語沒有顯著的區(qū)別,因此,進行評價者異質(zhì)性的判別。
由于參與管理學原理課程學習與評教的均為我校大一學生,年齡上并無區(qū)別,不需要對評價者的年齡異質(zhì)性進行評判。本文對于另外兩方面的評價者異質(zhì)性進行的判別,一是性別,即男性或女性;二是課程學習情況,即期末考試合格或不合格,將這兩部分的子樣本分別進行文本語義因素抽取并進行對比,發(fā)現(xiàn)不同性別的評價者有84個詞語有重合,不同課程學習情況的評價者有85個詞語有重合,顯示了不存在明顯的評價者異質(zhì)性問題。
3.3?文本語義因素評教預測
最后,本文使用實際數(shù)據(jù),以所抽取的文本語義因素庫對于教師課堂教學進行預測,并歸類為“好的”或是“不好的”兩類之一。由于之前缺乏評教信息中的文本語義因素對評教結(jié)果影響的相關研究,因此本文分別使用線性預測模型與非線性預測模型來預測。在線性預測模型中,選擇了較常使用的Logistic回歸和Lasso回歸;在非線性預測模型中,選擇了較常使用的隨機森林(Random?Forest)和極端梯度增強(eXtreme?Gradient?Boosting)方式。分別進行回歸后,其預測顯著性如表1所示。
4?結(jié)論
本文使用了共4001條管理學原理課程的所有學生評教文本信息,對學生評教文本信息要素進行抽取,通過評價者異質(zhì)性判別保證所抽取文本語義因素能適用于絕大多數(shù)學生所發(fā)布的評教信息,并使用多種方式判斷了所挖掘文本語義因素對課堂教學評價歸類的預測有效性。但在獲取上述結(jié)論的同時,本文對評教文本信息的挖掘過程是否能推廣到其他課程中還有待進一步驗證,并且將通過文本信息作出的課堂分類結(jié)果如何與傳統(tǒng)的評分結(jié)果進行綜合,是很值得進一步探索的問題。
參考文獻
[1]趙平,鄔鵬.利益相關者視角下大數(shù)據(jù)技術驅(qū)動高校學生評教改革研究[J].上海教育評估研究,2020,9(06).
[2]江利.高校學生評教制度問題剖析及優(yōu)化策略研究[J].教育教學論壇,2020(35):1214.
[3]別敦榮.論“雙一流”建設[J].中國高教研究,2017(11):717.
[4]陳佑清.“學習中心課堂”教學過程組織的邏輯及其實現(xiàn)策略[J].全球教育展望,2016,45(10):4047.
[5]Liberti?J?M,Petersen?M?A.Information:?Hard?and?soft.The?Review?of?Corporate?Finance?Studies,2019,8(1):141.