胡飛
傳統(tǒng)的網(wǎng)上學(xué)習(xí)方式,在面對學(xué)生在線提問的時候,需要老師來理解學(xué)生的問題并做出答疑。這不光增加了老師的工作量,而且學(xué)生與在線學(xué)習(xí)系統(tǒng)之間的交互也無法做到隨時實時。本文利用深度學(xué)習(xí)技術(shù)來理解學(xué)生在線提交的問題,并且在沒有人工干預(yù)的情況下自動回答學(xué)生的問題。實現(xiàn)在線自主答疑。
1引言
我國對自主學(xué)習(xí)的系統(tǒng)研究,始于20世紀(jì)80年代。許多學(xué)者作了研究并在一些地方進行了實驗,取得了一定的成果。在1979年前后,我國就出現(xiàn)了不少以指導(dǎo)學(xué)生自主學(xué)習(xí)為目標(biāo)的教學(xué)實驗,如:上海育才中學(xué)段力佩等人總結(jié)的“讀讀、議儀、練練、講講”八字教學(xué)法;中科院心理研究所盧仲衡主持的“自學(xué)輔導(dǎo)教學(xué)”實驗研究;遼寧盤錦二中魏書生實施的“六步教學(xué)法”實驗;上海嘉定中學(xué)錢夢龍進行的“導(dǎo)學(xué)教學(xué)法”研究等。所有這些教學(xué)實驗都把“自主學(xué)習(xí)”作為教學(xué)的主要環(huán)節(jié),明確把培養(yǎng)學(xué)生的自主學(xué)習(xí)能力和發(fā)展學(xué)生的智力作為主要追求目標(biāo)。國內(nèi)目前各具特色的網(wǎng)絡(luò)自學(xué)平臺有:1)清華大學(xué)網(wǎng)絡(luò)自學(xué)平臺,它是由清華大學(xué)教育技術(shù)研究所開發(fā)的網(wǎng)絡(luò)自學(xué)平臺。該平臺包括網(wǎng)絡(luò)資源、網(wǎng)站、學(xué)生、課件資源和資料庫等構(gòu)建,通過完整的自學(xué)平臺和管理平臺來保證整個網(wǎng)絡(luò)教育的有序運行和管理。該平臺是一個先進的網(wǎng)絡(luò)自學(xué)基礎(chǔ)服務(wù)支撐平臺,可以開發(fā)一系列的網(wǎng)絡(luò)教學(xué)業(yè)務(wù)系統(tǒng),為課堂教學(xué)提供了有力的支撐。2)北京師范大學(xué)網(wǎng)絡(luò)自學(xué)平臺,它是由北京師范大學(xué)從2001年設(shè)立網(wǎng)絡(luò)教育學(xué)院,北京師范大學(xué)網(wǎng)絡(luò)教育學(xué)院利用網(wǎng)絡(luò)資源和資源平臺開展在職人員的繼續(xù)教育和在崗培訓(xùn),產(chǎn)生了廣泛的影響。北京師范大學(xué)的網(wǎng)絡(luò)自學(xué)平臺中包含課程資源、課件展示、精品課程、資源庫等功能,這種網(wǎng)絡(luò)自學(xué)方式將面授的優(yōu)勢和網(wǎng)絡(luò)的特點進行有機地結(jié)合,構(gòu)成了面授和網(wǎng)絡(luò)融為一體的獨特方式。平臺以構(gòu)建主義學(xué)習(xí)理論和系統(tǒng)方法淪為指導(dǎo)思想,便于學(xué)習(xí)者構(gòu)建他們的知識架構(gòu)。3)其它社會商業(yè)性質(zhì)的網(wǎng)絡(luò)自學(xué)平臺,例如網(wǎng)易云課堂、新浪公開課平臺等。
《基礎(chǔ)教育課程改革綱要(試行)》在論及基礎(chǔ)教育課程改革的具體目標(biāo)時指出:“改變課程實施過于強調(diào)接受學(xué)習(xí)、死記硬背、機械的現(xiàn)狀,倡導(dǎo)學(xué)生主動參與、樂于探究、勤于動手,培養(yǎng)學(xué)生搜集和處理信息的能力、獲取新知識的能力、分析和解決問題的能力以及交流與合作的能力?!?傳統(tǒng)的學(xué)習(xí)強調(diào)的是接受式的、被動式的學(xué)習(xí)方式,而自主學(xué)習(xí)改變過去的那種“過于強調(diào)接受學(xué)習(xí)”的傾向,倡導(dǎo)學(xué)生學(xué)會自主學(xué)習(xí)的方式去主動學(xué)習(xí)和接受新知識。在線自主學(xué)習(xí)則是借助互聯(lián)網(wǎng)技術(shù),把學(xué)生帶入網(wǎng)絡(luò)世界,借助互聯(lián)網(wǎng)、移動通信等技術(shù)讓學(xué)生接觸到更多學(xué)習(xí)內(nèi)容和知識,是互聯(lián)網(wǎng)+自主學(xué)習(xí)的完美結(jié)合。大數(shù)據(jù)為在線自主學(xué)習(xí)注入了新的活力。其借助深度學(xué)習(xí)等機器學(xué)習(xí)技術(shù)來分析大量學(xué)生的歷史學(xué)習(xí)記錄、學(xué)習(xí)內(nèi)容以及獲取到的知識點,從中尋找適合大眾的學(xué)習(xí)規(guī)律,同時再分析單個學(xué)生的學(xué)習(xí)軌跡,兩者結(jié)合來為學(xué)生推薦個性化的學(xué)習(xí)內(nèi)容。隨著教育信息化和互聯(lián)網(wǎng)技術(shù)的發(fā)展,基于網(wǎng)絡(luò)的學(xué)習(xí)方式成為用戶獲取知識的重要途徑和方法,學(xué)生不再是被動地在課堂上接受知識,而是通過各種方式(特別是互聯(lián)網(wǎng))主動參與到學(xué)習(xí)中。在線自主學(xué)習(xí)平臺也可作為課堂教學(xué)的延伸,它可以通過互聯(lián)網(wǎng)完成傳統(tǒng)的教學(xué),還能通過用戶線上參加的課程學(xué)習(xí)、考試競賽、試題練習(xí)、調(diào)查問卷和交流等情況,實現(xiàn)對用戶學(xué)習(xí)情況的全程跟蹤管理和對用戶學(xué)習(xí)培訓(xùn)需求的全面掌握?;诓煌哪繕?biāo),線上學(xué)習(xí)的方式也是多種多樣的,比如有虛擬課堂、錄像點播平臺和多媒體互動課程學(xué)習(xí)平臺等。在線教育不受時間和空間的限制,可以與線下教育想結(jié)合,實現(xiàn)傳統(tǒng)教學(xué)的延伸。
自動答疑是在線自主學(xué)習(xí)中重要一環(huán)。學(xué)生在線自主學(xué)習(xí)的時候所產(chǎn)生的疑問會以文字的形式發(fā)送給自主學(xué)習(xí)平臺。過去的方法都是等到老師上線以后再作答,或者對一些簡單的問題進行查詢表(look-up table)式回答。這種方式不光回答不夠準(zhǔn)確,而且有時間延遲,不利于實時解釋學(xué)生各種疑問。因為很多學(xué)習(xí)是在學(xué)生和老師之間通過一問一答的形式展開的。在本文中,我們利用深度學(xué)習(xí)技術(shù),讓軟件系統(tǒng)可以代替老師來理解學(xué)生的問題并且做出回答。
2 自動答疑
深度學(xué)習(xí)在自動答疑上的應(yīng)用實際上是其在自動問答系統(tǒng)上應(yīng)用的延伸。在1950年,英國著名的數(shù)學(xué)家圖靈在他發(fā)表的論文《Computing Machinery and Intelligence》中提出了機器智能的概念。他提出通過自然語言問答的形式來判斷機器是否具有智能,也就是大家熟知的”圖靈測試“。這可以看作最早的自動答疑模型。這以后,自動答疑系統(tǒng)不斷完善發(fā)展中,并逐漸出現(xiàn)在各種遠程在線教學(xué)平臺上。例如互聯(lián)網(wǎng)早期的留言板、BBS論壇、實時聊天等。但是,這些答疑方式很多都需要通過人工干預(yù)。這是由于計算機對自然語言理解的能力還不夠成熟造成的。為了理解在線自主學(xué)習(xí)中學(xué)生提出的問題,我們引入深度學(xué)習(xí)技術(shù)。深度學(xué)習(xí)依靠其強大的表征學(xué)習(xí)能力,能夠深度地學(xué)習(xí)文本的語義表示,并且很容易地通過模型計算來對語義表示做出理解,并生成文本回復(fù)。這就實現(xiàn)了無人工干預(yù)的自動在線答疑系統(tǒng)。谷歌和百度公司的在線機器翻譯就可以看作這樣一種系統(tǒng),它們學(xué)習(xí)并理解人類輸入的問題(語言A),然后自動計算并輸入問題的答案(語言B)。并且可以反復(fù)多次實現(xiàn)這一過程。這樣就實現(xiàn)了一問一答的形式,把問題轉(zhuǎn)換為答案(語言A轉(zhuǎn)換為語言B)。
3 利用深度學(xué)習(xí)技術(shù)來理解并解答問題
大部分傳統(tǒng)的在線自主學(xué)習(xí)平臺都是借鑒線下學(xué)習(xí)的方案來進行設(shè)計和實施。隨著互聯(lián)網(wǎng)技術(shù)的興起,各種網(wǎng)上學(xué)習(xí)平臺中生成了許多歷史學(xué)習(xí)記錄和相關(guān)的學(xué)習(xí)內(nèi)容,如何有效地挖掘這些數(shù)據(jù)來改進學(xué)習(xí)方案,提升學(xué)習(xí)效率,是目前擺在相關(guān)研究者面前的一個難題。另一方面,很多自主學(xué)習(xí)平臺為每個學(xué)生提供千篇一律的學(xué)習(xí)方案和學(xué)習(xí)體驗,或者簡單地分為幾個大類,粗暴地把一部分學(xué)生放入到某一類學(xué)習(xí)方案中,再或者還有一些自主學(xué)習(xí)平臺提供一些游戲化的手段來吸引學(xué)生。這些方法對于有個性需求的成年大學(xué)生來說,無法滿足他們個性化的學(xué)習(xí)需求。因為有些大學(xué)生在某些知識點上已經(jīng)積累了豐富的基礎(chǔ),不同的大學(xué)生對自我知識水平的提升有不同的訴求,這些都不是傳統(tǒng)的自主學(xué)習(xí)平臺可以滿足他們的。近年來大數(shù)據(jù)技術(shù)的蓬勃發(fā)展,特別是深度學(xué)習(xí)等機器學(xué)習(xí)的技術(shù)得到廣泛應(yīng)用,分析和處理這一類數(shù)據(jù)成為可能。深度學(xué)習(xí)對文本的表征學(xué)習(xí)能力為文本理解帶了技術(shù)保障。其中的跨思維向量模型(Skip-Thought Vectors, STV)更是這方面的佼佼者。STV模型有一個編碼器和兩個解碼器。任意取一段文本中連續(xù)的三句話,編碼器對中間一句話話進行編碼,生成一個向量。然后,這個向量分別輸入到兩個解碼器中,分別得到前后兩句話。把這個模型在文本大數(shù)據(jù)集上做訓(xùn)練,從訓(xùn)練出來的模型中取編碼器用于文本語義理解。當(dāng)一句話輸入這個編碼器以后得到的向量就是這句話的一個語義表示。我們可以把這個編碼器用于理解學(xué)生的提問。把學(xué)生的提問輸入到這個編碼器中就可以得到問題的向量表示。
用向量表示學(xué)生的提問,有利于計算機識別學(xué)生的問題。在識別和理解學(xué)生問題的基礎(chǔ)上,為了讓計算機能夠快速做出響應(yīng)并回答問題,我們需要再引入一個新的解碼器。我們把這個新的解碼器和之前的編碼器結(jié)合起來成為一個”編碼-解碼“模型,然后用一個問答數(shù)據(jù)集來訓(xùn)練這個模型。針對問答數(shù)據(jù)集中一條數(shù)據(jù)”問題:答案“,把“問題“輸入編碼器,編碼器輸出向量,然后把向量輸入解碼器,解碼器輸出一段文本,把這段文本和”答案“做對比得到的誤差反過來調(diào)整解碼器中的參數(shù)。如此反復(fù)訓(xùn)練,最后讓輸出的文本和”答案“之間的誤差逐漸縮小。最后我們得到一個訓(xùn)練好的”編碼-解碼“模型,這個模型可以用于在線理解學(xué)生問題并立即響應(yīng)并做出回答。這就好比有一個”老師“不知疲倦的不?;卮鹬鴮W(xué)生的提問,實現(xiàn)了隨時隨地在線和學(xué)生互動的功能。
(作者單位:重慶第二師范學(xué)院網(wǎng)絡(luò)中心)