蔣 甜 王亞敏
(皖南醫(yī)學院 外語教研室,安徽 蕪湖 241002)
將人工智能融入教學最早始于20 世紀70 年代。20 世紀80 年代,Sleeman&Brown 在其著作中提出了一個新的概念“智能導師系統(tǒng)”(Intelligent Tutoring System,ITS)[1]1-11。這是一種模仿教師的經(jīng)驗和方法來輔助教學工作的計算機系統(tǒng)。經(jīng)過諸多研究者不斷修正和完善,智能導師系統(tǒng)的概念和結構也越來越明確。本文采用劉清堂對“智能導師系統(tǒng)”的定義:利用人工智能技術模仿人類教師在教學中所承擔的角色,為學習者提供個性化學習指導,幫助不同需求和特征的學習者獲得知識和技能的一種智能化計算機輔助教學系統(tǒng)[2]。
一般認為,智能導師系統(tǒng)由4 個不同的模塊組成:學生模塊、專家模塊、教師模塊和用戶界面模塊[3]。
學生模塊作為智能導師系統(tǒng)的核心組成部分,是一個動態(tài)模型,包含對學生知識或行為的描述,包括他的誤解和知識差距;同時,還應該涵蓋盡可能多的關于學生認知和情感狀態(tài)及其在學習過程中變化的相關信息。收集學生信息的目的是確定學生的受教育水平及最適合的學習方法。智能導師系統(tǒng)服務于兩個基本目標:一是形成可根據(jù)學生實際情況適時調整的學習方案;二是指導學生解決問題。
專家模塊又稱領域知識模塊,包含要學習的主題領域概念、規(guī)則和解決問題的策略。專家模塊主要是專家知識的來源,以及作為評價學生表現(xiàn)或發(fā)現(xiàn)錯誤的標準等。因此,專家模塊首先就像一種資源庫。其次,專家模塊應與學生模塊中存儲的知識相平行。也就是說,當一個學生模塊被識別時,適用于該模塊的數(shù)據(jù)庫應該能夠很容易地呈現(xiàn)給用戶。關鍵問題在于對學生模型的推理能力,并逐漸使學習者適應對推理過程的解釋。可以說,專家模塊設計得越好越合適,整個系統(tǒng)功能就越好越健全。
教師模塊是對學生模塊與專家模塊的輔助。系統(tǒng)首先需要收集學生特征進行建模,為個性化教學奠定基礎,模擬人類教師針對不同學生情況執(zhí)行相應的教學指導。當學生的行為或知識與專家假定的行為或知識之間不匹配時,信號傳遞至教師模塊,教師模塊隨后采取糾正措施,依據(jù)教學原理,選擇合適的教學策略,從領域知識模塊中選擇合適的教學內容。該模塊關注的是如何合理有效地組織教學,即“如何教”的問題。
用戶界面模塊是智能導師系統(tǒng)的通信組件,用于控制學生與系統(tǒng)之間的交互。它在系統(tǒng)的內部表征和學生可以理解的界面語言之間進行雙向轉換。因為用戶界面可以決定智能導師系統(tǒng)的成敗,所以無論內部系統(tǒng)多么“智能”,人們都習慣于將其識別為智能導師系統(tǒng)中一個獨特組件。
國內對智能導師系統(tǒng)的研究大約開始于20 世紀80 年代末。以智能導師系統(tǒng)為關鍵詞,根據(jù)知網(wǎng)數(shù)據(jù)庫的搜索統(tǒng)計可知,對智能導師系統(tǒng)的研究主要可分為以下幾類:模塊化結構探討、領域知識構建、系統(tǒng)應用等。智能導師系統(tǒng)在教學方面的應用成效顯著,已經(jīng)廣泛應用于語言教學、醫(yī)學教學、計算機教學、數(shù)學教學等各個方面。具體對智能導師系統(tǒng)在英語教學中的研究不多,主要以劉清堂、梁迎麗等為主。劉清堂等對智能導師系統(tǒng)的發(fā)展歷程進行了梳理,詳細介紹了系統(tǒng)各組成部分的功能以及發(fā)展趨勢。此外,他們還以句酷批改網(wǎng)為例,對智能導師系統(tǒng)設計的有效性進行了評價分析。梁迎麗等對智能導師系統(tǒng)的研究主要集中于英語口語方面。他們設計了基于語音評測的英語口語智能導師系統(tǒng),可以通過自動化語音測評技術描述學生當前的口語技能水平,并依據(jù)學生模型向學生推薦個性化的口語學習資源。此外,蔣艷等對中國英語寫作教學智能導師系統(tǒng)句酷批改網(wǎng)進行分析,分析其工作原理并指出其作為智能導師系統(tǒng)所面臨的挑戰(zhàn)。
大學英語教學對智能導師系統(tǒng)的需求是急迫的,學生人數(shù)多、教師課時量多,相應地對學生個性化輔導的時間就極其有限,因此,在聽說讀寫譯各方面為學生提供即時反饋和指導必須借助一定的技術手段?;诖诵枨?,出現(xiàn)了一批針對不同語言技能而設計的智能導師系統(tǒng),如華南師范大學的“基于語音評測的英語口語智能導師系統(tǒng)”主要用于口語教學;還有由外語教學與研究出版社推出的iWrite(英語寫作教學與評閱系統(tǒng)),以及北京詞網(wǎng)科技有限公司開發(fā)的批改網(wǎng)等。
本文選取批改網(wǎng)作為研究對象,通過分析使用前后學生作文分數(shù)及兩個學期的學生批改網(wǎng)使用數(shù)據(jù),探討批改網(wǎng)作為智能導師系統(tǒng)的效果及改進 之處。
批改網(wǎng)(www.pigai.org)有著優(yōu)秀的專家模塊,即專業(yè)領域知識儲備。批改網(wǎng)以豐富的語料庫作為支撐,通過將學生文本與標準語料進行比對,可即時對作文進行打分并給出點評。經(jīng)過不斷研究和升級,批改網(wǎng)除了作文批改外,還一直在不斷探索新的題型,新增了漢譯英、摘要、論文寫作與朗讀、默寫、閱讀等測試。除對學生各項作業(yè)的批改和點評外,批改網(wǎng)在電腦及手機用戶端還設有應對英語四六級、考研、托福、雅思等各項考試的題庫以及各類英語課程及TED 演講、VOA 新聞等視音頻,可為學生自主學習提供最便捷的資源。
學生模塊方面,根據(jù)批改網(wǎng)數(shù)據(jù)統(tǒng)計,全國已有200 多所高校采用批改網(wǎng)輔助英語教學,截至2018 年1 月,批改網(wǎng)已累積批改作文接近4 億篇。此外,批改網(wǎng)每年還要舉辦百萬人同題的寫作活動。每個學生的作業(yè)匯成自己的學生模型,構成自己的學習數(shù)據(jù)。
教師模塊方面,批改網(wǎng)提供基于語料庫和云計算技術的英語作文自動在線批改服務。通過對比學生作文和標準語料庫,根據(jù)特定的算法評估學生作文分數(shù)并提供點評。從詞匯、句法、語篇結構、內容相關4 個層面對每篇文章進行打分、給出總體評價,并逐句點評和提出修改意見。每句具體從推薦表達、拓展辨析、學習提示、近義詞表達學習、標點警示、搭配錯誤等幾個方面進行點評和指導。教師可以根據(jù)批改網(wǎng)對學生作文各種參數(shù)的評估,進而做出更精準客觀的判斷和點評。批改網(wǎng)能夠有效提高教師批改英語作文的工作效率,有助于提高學生的英語寫作能力。此外,除了評分和學習指導外,批改網(wǎng)還有著強大的數(shù)據(jù)分析能力。教師可以直觀地了解每篇題目下學生的寫作表現(xiàn),可以查看每個學生得分、相似度、修改次數(shù)等7 個維度的具體表現(xiàn);也可以通過學期總評或班級診斷的數(shù)據(jù)圖表,從使用概況、維度數(shù)據(jù)、錯誤統(tǒng)計、學生用詞、瀏覽作文、學期成長等維度查看總體表現(xiàn)。其既能滿足終結性評估的需求,也能為學生個體和班級整體的形成性評估提供參考數(shù)據(jù)。
無論是電腦用戶端還是手機用戶端,無論是教師客戶端還是學生客戶端,批改網(wǎng)的用戶界面模塊都簡明清晰。學生可以通過班級號進去相應班級,在作業(yè)區(qū)域直接看到教師布置的各項作業(yè)要求;或直接通過作業(yè)號查找作業(yè),完成作業(yè)后可即時查看分數(shù)、評價及修改意見,也可根據(jù)修改意見修改后再次提交。除教師布置的作業(yè)外,學生還可自己選擇寫作、測試等各類活動,自主學習和檢測,或使用各類英語課程和音視頻資源完成自主學習。教師可以通過系統(tǒng)消息推薦優(yōu)秀作文、直接進行語音或文字點評,師生間能夠相互即時交流。
在某校2018 級某班60 名學生中進行批改網(wǎng)使用研究。首先對比分析使用前后兩次期末作文成績。其次,每個學期布置批改網(wǎng)作文4 篇,通過前后兩個學期的批改網(wǎng)數(shù)據(jù)統(tǒng)計,檢測批改網(wǎng)在教學中的應用效果及其優(yōu)勢和不足之處。
為探究使用前后的期末作文成績是否存在顯著差異,我們使用SPSS19.0 進行數(shù)據(jù)分析,采用獨立樣本t 檢驗,結果如表1 所示:t=2.683,P=0.008<0.05,故前后測成績存在顯著差異,具體表現(xiàn)為后測成績顯著優(yōu)于前測成績。由此可見,學生在批改網(wǎng)上的作文練習效果是比較明顯的。
表1 前后測成績的差異分析
表2 前后學期批改網(wǎng)作文數(shù)據(jù)
首先,詞匯豐富度、平均詞長與詞匯平均難度反映的都是詞匯使用情況。英語寫作能力一般在短期內難以得到大幅度提高,其中一個重要原因就是詞匯。一方面,詞匯的習得是一個漫長的過程;另一方面,詞匯從內化到外化更是一個質的變化。在英語寫作過程中,學生普遍習慣于將一些已經(jīng)學過的初級詞匯重復應用于大學階段的寫作中,即使是詞匯量較大的學生,他們也傾向于使用低級別詞匯,所以寫出的作文選詞單一、用詞重復、單調乏味[4]。囿于時間限制,教師對作文的批改多集中于打分、語法錯誤點評或內容評價等,很難做到詞匯推薦。前后學期批改網(wǎng)作文數(shù)據(jù)如表2 所示。
表2 顯示,學生在第二學期的作文中詞匯豐富度、平均詞長和詞匯平均難度均有所增加。其原因除學生通過學習增加詞匯量外,還在于“按句點評”里的推薦表達。例如,對常用的“teacher”,推薦表達“instructor/educator/lecturer”;推薦用“provided that”來代替常用的“if”。從批改網(wǎng)的數(shù)據(jù)可以看出,大多數(shù)學生會根據(jù)系統(tǒng)推薦詞匯進行一次甚至多次修改,如表3 中一個學期內4 篇作文的初版(修改前)與終版(最終修改后)數(shù)據(jù)對比,每篇詞匯豐富度都有所增加。
表3 初終版詞匯豐富度比較
其次,平均句長是一項比較容易理解的測量語言成熟程度的尺度。平均句長和從句密度也能反映學生的英語語言水平,表2 顯示,兩者都有增長,但數(shù)量不明顯。說明較之教師人工判斷,批改網(wǎng)對句子的統(tǒng)計比較便捷,可以為教師提供直觀的數(shù)量參考。但是,系統(tǒng)對句子的修改提示不足,不能直接為學生提供相關參考。因此,教師在此處需要發(fā)揮作用,可以選取若干范本做例子,引導學生進行句子修改,對過于簡單的句子用連接詞進行串聯(lián),將句子寫長寫難。
再次,在語法方面,表2 中的語法正確率皆為終版數(shù)據(jù)平均值,雖然差異不大,但通過其中一個學期的單個作文初版和終版數(shù)據(jù)對比,可以看到批改網(wǎng)系統(tǒng)對語法錯誤的提示是非常有價值的,如表4 所示。
表4 初終版語法正確率比較
另外,我們同時截取其中一個學期的4 篇作文語法糾正情況發(fā)現(xiàn),學生在初版作文中共發(fā)生錯誤904 處,通過自主修改,修正錯誤251 處,修正率達到27.8%。修正率從高到低分別為主謂搭配、副詞使用、動賓搭配、形容詞使用、介詞使用、時態(tài)錯誤、動詞使用等;而未修正的錯誤仍占72.2%。原因除了學生雖看到錯誤提醒但仍未主動修正外,還有一部分原因則是學生不知道如何修改,或未能正確修改,這也是教師需要發(fā)揮糾正作用的地方。教師需要根據(jù)系統(tǒng)提示,對學生予以一對一指導或集體指導。
根據(jù)以上數(shù)據(jù),我們可以看出批改網(wǎng)這個智能導師系統(tǒng)4 個模塊相應的優(yōu)勢和不足之處。
首先,在專家模塊方面,現(xiàn)在各類英語資源網(wǎng)站、公眾號、APP 等非常豐富,但基本只能作為資源庫存在,或者像iWrite、英語口語智能導師系統(tǒng)這些智能導師系統(tǒng)一般單一作為測試系統(tǒng)存在,對資源的推送不足。而批改網(wǎng)既可依據(jù)本身的語料庫實現(xiàn)文本和語音測試,又可作為學生學習資源庫來使用,功能實現(xiàn)了最大化。但專家模塊同時也存在一定的問題,比如:對復雜句子錯誤的識別不足。其根本原因還是在于專家模塊中對句子的分析主要集中在短語層面,主要識別搭配、主謂一致、單復數(shù)等常見錯誤,對句子整體的邏輯性和內容正確性分析不夠。后期,批改網(wǎng)在此方面還需要盡力完善,提高對復雜語言錯誤及內容的識別能力。
其次,在聽說讀寫譯這5 項基本語言技能中,學生模塊所記錄和積累的學生個人學習信息涵蓋了其中4 項。在口語表達方面,批改網(wǎng)中雖然增加了朗讀測試的功能,但目前只能檢測基本語音標準度,不能識別語音錯誤,缺少相關詳細點評,不利于學生在口語表達上的自我提高。同時,現(xiàn)在學生在應對四六級考試、考研英語以及雅思托福等出國考試中的口語要求越來越高,而非英語專業(yè)大學生的口語表達能力在5 項基本技能中仍處于最低水平。因此,學生也迫切需要一個既能檢測寫作、閱讀類技能,又能檢測口語表達能力的智能導師系統(tǒng)。這也是梁迎麗等開發(fā)的“英語口語智能導師系統(tǒng)”對批改網(wǎng)的可借鑒之處,如細化語音點評、增加口語話題表達檢測及人機對話等。
再次,教師模塊作為傳統(tǒng)教師角色的替代,已經(jīng)在很大程度上實現(xiàn)了真人批閱和輔導效果。精確到每個單詞、意群、句子的語法糾正、詞匯搭配、用詞推薦、句子銜接等,這是教師可以完成的,但囿于個人精力和時間的限制,很難對每個學生、每篇文章都做到精細批改;甚至在教師個人無法完成的大數(shù)據(jù)統(tǒng)計方面,為師生提供了諸多很有價值的數(shù)據(jù)參考,如詞匯豐富度、詞長、句長、從句密度、修改次數(shù)、修改前后各項數(shù)據(jù)對比等。這也是批改網(wǎng)作為智能導師系統(tǒng)最有價值之處。但因教師模塊依托于專家模塊及學生模塊,所以其不足之處亦與后兩者有關,如對復雜語法錯誤及語篇問題識別不足,口語檢測維度過于單一等。如果這些問題得以解決,教師模塊的輔導效果將更貼近教師真人教學。
最后,無論是電腦用戶端還是手機用戶端的界面模塊都做得清晰簡潔。資源分類、獲取都非常便捷,各類測試批改也都操作方便,甚至批改網(wǎng)的快速體驗界面,都能為用戶提供文章的即時檢測服務。尤其是手機用戶端目前已實現(xiàn)語音點評,極大提高了教師的工作效率。若教師在分析范文時,也能直接在手機用戶界面隨時調取文本及點評,并可一鍵分享至所有學生,這樣就更能體現(xiàn)智慧教學之長了。
通過以上數(shù)據(jù)可以看出,批改網(wǎng)對學生英語寫作水平的提升作用是明顯的。在目前的智慧教學時代,尤其是大學英語教學方面,單純依靠學習通、云班課、雨課堂等常見智慧教具是不夠的。這些智慧教具在課堂教學上比較便捷,可以及時獲得數(shù)據(jù)反饋,各種隨堂及課后測試也都能獲得即時的數(shù)據(jù)反饋和分析。但是,這些測試種類中的寫作、翻譯、口語表達等,在目前的智慧教具中是無法實現(xiàn)的,而這些正是批改網(wǎng)的強項。因此,可以說,批改網(wǎng)這樣的智能導師系統(tǒng)是智慧教學必不可少的工具。
人工智能可以為人類服務,但永遠無法替代人類。因此,學生和教師在使用智能導師系統(tǒng)時也不能一味地依賴,而是要合理加以利用,完成簡單但耗時耗力的批改行為;但對于系統(tǒng)無法解決的問題,如復雜書面語言錯誤、語音錯誤的識別和糾正、句子內容和邏輯性的判斷等,需要教師本人和人工智能系統(tǒng)互相支撐和補充,以實現(xiàn)教學效果最優(yōu)化。