于丹 閆曉宇 王艷秋 來關軍 肖鵬 王宇
摘? 要:基于Agent代理技術的對話機器人技術已經廣泛地應用于電子商務、在線教育和醫(yī)療服務等領域。不同領域對話機器人的功能既具有相似性,又具有差異性。本文首先介紹了對話機器人和機器人的區(qū)別與聯系,重點分析了功能性任務型對話機器人的發(fā)展、應用和實現方式,探討了對話機器人功能實現的理論基礎和關鍵技術。在此基礎上系統(tǒng)地探討了教育領域中任務型機器人的設計思路、具體功能和對應的技術框架等。
關鍵詞:任務型對話機器人;在線教育;智能導學
Abstract: Chatbot technology based on Agent technology has been widely used in many application fields such as e-commerce, online education and medical services. Functions of chatbot used in different fields have both similarities and differences. This paper first introduces the differences and connections between concepts of chatbots and robots, and then, analyzes the development, application and implementation of task-oriented chatbots. The theoretical basis and key technologies of realizing the functions of dialogue robot are discussed. After that, this paper describes the functions and corresponding technical framework of task-oriented chatbots in the field of education.
Keywords: task-oriented chatbots; online education; intelligent tutoring
1? ?引言(Introduction)
機器人對人類的發(fā)展起到了巨大的作用,可以幫助人類擺脫很多繁雜瑣碎的工作,將時間和精力轉移到一些更具有價值的事情上。隨著人工智能的發(fā)展,人與機器的交互也越來越多,機器可以通過多種模式的交互過程幫助人們完成一些任務,其中人機對話系統(tǒng),也稱為“對話機器人”,是產業(yè)界最為關注的領域之一。這類機器人本質上是Agent代理技術,而不是指傳統(tǒng)意義上的實物機器人,如機器臂、機器狗或運動機器人等[1,2]。
人機對話系統(tǒng)主要解決人與機器的對話與交流問題,借助自然語言進行信息的傳遞。人機對話系統(tǒng)的最終目標是希望人與機器之間交流順暢、自然,達到類似于人與人之間的語言交互[3]。由于人與人之間最重要的交流方式是對話,因此研究對話系統(tǒng)意義深遠。隨著人工智能理論和技術的飛躍發(fā)展和進步,對話系統(tǒng)將不斷向前發(fā)展,潛力無限。人機對話系統(tǒng)的深入研究不僅是科學進步的時代訴求,也是社會生產力變革時期的重要機遇。
完整的對話系統(tǒng)涉及豐富的多學科理論和技術,如計算機科學技術中的語音技術、計算機視覺技術、自然語言處理、知識工程、認知與推理,也包括心理科學和語言學中的各種理論[4-6]。人機對話機器人的研究與發(fā)展,尤其是對任務型對話機器人的探索,將有助于提升人機交互模式下的社會工作效率。隨著深度學習在各個領域的運用,其近期更是表現出對自然語言處理的顯著效果,讓對話機器人的發(fā)展有了新的突破方式。隨著深度學習的相關技術不斷創(chuàng)新和發(fā)展,對話機器人的助力作用將越來越顯著[1,3]。
文章主要圍繞任務型機器人功能實現所涉及的理論基礎、實現流程和關鍵技術展開探討,在此基礎上系統(tǒng)地探討教育領域中任務型機器人的設計實現框架、具備的功能和關鍵技術方案等。
2? 相關研究和技術(Related research and technology)
2.1? ?任務型對話機器人
任務型對話機器人(Task-oriented Chatbot),也稱任務型對話系統(tǒng)或多輪對話系統(tǒng),本質是一個為了滿足用戶某些具體需求(也就是任務)而產生的多輪對話的人機交互系統(tǒng)。這個人機交互系統(tǒng)通過理解、澄清等方式來確定用戶意圖,繼而通過答復、調用API等方式滿足用戶的需求,達成任務。為了完成這些任務,對話系統(tǒng)需要理解上下文信息并做出如澄清等行為,從而完成任務答復,或調用其他相關程序等待下一步的動作。系統(tǒng)利用各種各樣的任務來驅動和實現多輪對話。任務型對話機器人通常在相對獨立封閉的專業(yè)領域中使用,該類機器人需要在對話過程中理解、澄清、生成對話。
與任務型對話機器人相對,其他兩類機器人分別是閑聊型對話機器人(Chatbot)和問答型對話機器人(QAbot)[1,3]。閑聊型對話機器人主要與用戶進行沒有邊界限定的閑聊,目標是與用戶進行有意義的、自然的多輪次對話,通過產生有趣、富有個性化的答復內容,與用戶進行互動。相比于任務導向型對話機器人,閑聊型對話機器人主要以滿足用戶的情感需求為主,所涉及的問題或對話領域范圍更大,用戶意圖更模糊難識別,因此技術要求更高,實現的困難性更大。問答型對話機器人主要實現一問一答的對話形式,機器人對用戶提出的問題進行解析,在知識庫已有的內容中查找并返回正確答案。對于機器人而言,每次問答均是獨立的,與上下文信息無關。這類機器人主要是在購物等服務領域被廣泛使用。
當然,一個對話機器人并非只包含一種類型的對話,通常是多種對話類型的組合。多輪對話的本質是圍繞用戶意圖進行的,對于任務型對話系統(tǒng)的設計,則需要考慮意圖跳轉、多意圖任務、指代識別、槽位繼承等多種復雜的對話策略。
對于對話機器人來說,最核心的能力就是準確“感知”與正確“決策”。其中感知就是對問題的理解和邏輯推理,而決策就是根據對問題的感知進行的對話策略。用戶提出的問題主要包括三種類型:事實型問題、計算型問題和邏輯推理型問題。任務型對話機器人的評價關鍵是幫助用戶獲取相關信息和輔助決策的能力,背后的基礎是以知識庫為基礎資源的問答系統(tǒng)。
2.2? ?任務型對話機器人的實現方式
構建任務型對話機器人有兩種實現方式,分別為流水線方式Pipeline(也被稱為基于規(guī)則的實現方式)和端對端方式End-to-end[4,7-9]。
(1)流水線方式
基于規(guī)則的方式一般采用流程和模塊化的結構,核心模塊主要包括四個模塊,分別為自然語言理解、對話狀態(tài)追蹤、對話策略學習和自然語言生成?;谝?guī)則的構建方式雖然容易實現、可解釋性強,但各模塊之間相互獨立,不能靈活地進行聯合調優(yōu),誤差會逐層積累。隨著選取的交互方式的不同,如僅基于文本自然語言對話系統(tǒng)、基于語音對話系統(tǒng),或基于視頻語音融合,模塊和實現流程會有所變化或增減,如圖1所示。圖1給出了基于圖像、語音和文字等多模態(tài)數據的對話系統(tǒng)流程樣例。
表1歸納了不同對話系統(tǒng)的模塊構成,基于文本的對話系統(tǒng)僅包括四個模塊,隨著互動信息類型的增加,即隨著語音或視頻的加入,對話系統(tǒng)變得更加復雜和多元化。
(2)端對端方式
任務型對話機器人的另外一個實現方式是“端對端”的實現方法,即基于深度學習的端到端模式,通過構建一個從用戶端自然語言輸入到機器端自然語言輸出的整體映射關系,實現原始數據在輸入端進入模型,在輸出端得到結果的目標。這種方法的優(yōu)點是擴展性強和靈活性高,缺點是需要高質量地標注數據且對數據的數量要求很高,可解釋性也較差,因此使用的程度遠遠不及流水線方式?,F在的方式更多是兩種方式的融合,在流水線模式中融入很多子模塊的“端對端”模式。
2.3? ?教育領域中的對話機器人
由于教育領域中存在大量與學習相關的問答和查詢需求,相比于其他應用場景,對話機器人在教學領域的發(fā)展更廣泛,應用場景也更多,不僅可以通過語音進行交互,也可以僅僅通過文字之間的交互起到輔助教學、及時回答問題、引導學習的作用。
現階段教育領域的任務型對話機器人最熱門的研究和應用就是在線教育的智能導學系統(tǒng),它的雛形是20世紀中期出現的計算機輔助教學系統(tǒng)。隨著人工智能技術的發(fā)展和其在教育領域的深入應用,到20世紀末期發(fā)展成為具有認知能力的智能教學系統(tǒng)。當前的智能導學以實現個性化教學為主要目標,并在人工智能技術的推動下逐步完善。
國外智能導學的理論和應用研究起步較早。1973年,美國的Hartley和Sleeman教授等人提出了三模型結構,核心組件包括領域知識模型、學習者模型和教學模型。馬薩諸塞大學安姆斯特分校Woolf教授2018年又拓展出了人機接口模型,甚至還有專家將其發(fā)展到了五模型結構。與此同時,國外還開發(fā)了很多有影響力的應用產品,比如Meta Tutor、Protus、Andes和SimStuden等。
國內智能導學的研究主要集中在學生模型、知識表示、人機交互等方面,即從學習中具體問題的解決出發(fā)來探討相關智能導學的實現方案,如對學生學習狀態(tài)模型構建的研究、知識表示和知識庫構建、基于不同軟硬件下的人機交互等。有研究者基于深度學習技術、Agent技術和大數據技術,已經研發(fā)出了一些智能導學產品,具有代表性的有基于Web的日語導學系統(tǒng)、句酷批改網、Z+Z智能教學系統(tǒng)等。這些模型和系統(tǒng)普遍存在的問題是導學的個性化和智能化程度不高。
隨著學習理論和科學技術的發(fā)展,智能教學系統(tǒng)的教學模式從一對一擴展到了一對多、多對一,甚至多對多的形式,其適應范圍從學習者的認知性方面擴充到了情緒性和社會性方面。美國孟菲斯大學Graesser教授主持研發(fā)了智能導學系統(tǒng)AutoTutor,并以此為基礎開發(fā)了一系列學習領域包括計算機素養(yǎng)、科學推理等應用系統(tǒng)。胡祥恩2018年還提出了一種人工智能教育應用的新理論框架:學習者與教育資源對稱性假設,即學習者能夠在與教育資源(教學內容、學習環(huán)境、互動機制和學習過程)的互動中實現知識結構的最優(yōu)化,同時教育資源也能夠在這一互動中得以改進。除此之外,美國Boulder語言科技公司Ronald教授正主持開發(fā)Interactive Books和MindStar Book,專門針對解決非英語母語國家的英語教學智能導學問題。美國陸軍實驗室的Sottilare博士研究通用智能輔導框架,它是一個開源原型,在美歐國家有近30個機構參與GIFT的研究合作。從事相關研究的主要機構如表2所示。
3.1? ?教育對話機器人系統(tǒng)功能設計
在線教育學習過程中,學生會遇到很多問題,如學習環(huán)境沒有互動、沒有反饋(難以感知自己的狀態(tài))、不滿足個性化、趣味性低、沒有競爭激勵等。對于教師來說,在線教育時常遇到難以感知學習者學習狀態(tài)、評價學生困難、資料管理耗時耗力、在線教學組織困難、難以發(fā)現教學存在的盲點、不能因材施教等多類問題。對于管理者來說,需要實時感知在線教育的質量,實施對在線教學進行綜合評價、監(jiān)督教學效果、發(fā)現教學管理中存在的問題等操作。
用對話機器人的方式,可以非常直接和顯著地幫助學生、教師和管理者提升在線教育的效率。具體來說,對于不同用戶,由于需求不同應該有對應匹配的機器人,而不是由同一類機器人實現。為了解決學生、教師和管理者在線學習中所遇到問題,本文在表3中歸納了三類教育對話機器人需要解決的問題和匹配功能。
這三類對話系統(tǒng)既相互獨立,又緊密相關,本質上是一種能夠賦能在線教育的輔助教學對話系統(tǒng),本文將三類機器人統(tǒng)稱為“教育對話機器人”。教育對話機器人可以實時感知在線學習行為(如學習內容、學習時長、學習頻率、團隊學習的參與程度等),并實時反饋到大數據平臺進行學習行為分析和知識掌握程度分析。這一系統(tǒng)可以被植入任何一個開發(fā)系統(tǒng)中。
針對不同的用戶(學生、教師、教學管理者),教育對話機器人會扮演不同的身份,不同身份的機器人具有不同的功能,如圖2所示。
(1)伴讀機器人的功能
伴讀機器人為學生服務,主要提供知識問答、學習方案推薦等服務,實時向學生反饋學習過程中存在的問題,并提供個性化推薦。伴讀機器人將及時向學生反饋課程完成狀態(tài)、成績等信息,也會將學生個人知識掌握情況與全局知識圖譜融合,形成個性化的個人知識樹,及時將學習狀態(tài)反饋給學生。伴讀機器人為學生提供學習全程的個性化智能導學服務,可以發(fā)現學生自己不知道的學習“盲點”,根據每個人的學習狀態(tài)定制個性化學習路徑,讓學生看到自己的學習路徑,也能看到他人的學習路徑。例如,學生在學習完PCA(主成分分析)算法后,不清楚下一步應該再學習什么,伴讀機器人就會根據學生的過去學習成績、學習內容和學習狀態(tài),給出幾個建議的學習路徑計劃,如其他同學的常用學習路徑、適合他的最優(yōu)路徑或最短路徑等,供學生選擇。
群體學習時,伴讀機器人會及時反饋小組學習進度、個人學習狀態(tài)、對小組的貢獻率等群體學習信息。
學生可以利用伴讀機器人及時查詢學習過程中不會的知識點,通過點擊知識圖譜中的盲點,直接開始學習。如學生在學習支持向量機(Support Vector Machine,SVM)時遇到一個不熟悉的概念“損失函數”,可以直接向伴讀機器人提問“什么是損失函數”,伴讀機器人立即回答出對應的答案;點擊對應的盲點知識,系統(tǒng)就會展現與盲點相關的知識和對應的學習資源等。
伴讀機器人智能化還體現在可以將具有相似問題的學生自動組建“學習小組”,并從優(yōu)秀的學生中選出“助教”,構建學生群體學習社區(qū),形成互幫互助的社群,促進學習氛圍的良性循環(huán)。成績優(yōu)秀的學生可以直接在社區(qū)里建立學習小組,單獨為學習效果不好的學生補課。
(2)助教機器人的功能
助教機器人的服務對象是教師,它能夠協助教師完成教學資源的構建,并在教學過程中及時向教師反饋學生的異常學習行為。教師可以通過助教機器人快速地構建和修改知識圖譜,實時了解每個學生的學習進度和知識掌握情況;可以從數據中發(fā)現教學中可能存在的漏洞,有針對性地優(yōu)化教學內容。助教機器人可以自動回復學生的常見問題,在提高學生學習效率的同時又減少了教師的工作時間。
(3)質保機器人的功能
質保機器人主要為教學管理者服務,能夠提供多維度、多層級的綜合評估報告。質保機器人可以提供實時、多維度智慧綜合評價,能夠同時向學生、教師、教務管理人員提供學習行為大數據分析服務,反饋學習態(tài)度、學習進度、學習排名,從學校、學科等多個維度整體評價教師和教學單位的建設水平,通過大數據挖掘出可能存在的教學管理問題,輔助教學管理者制定教學改革方案。
通過整合為學生實時提供幫助的伴讀機器人、為教師實時提供幫助的助教機器人和為學校管理者實時提供幫助的質保機器人,可以構建完整的智慧在線教育生態(tài)系統(tǒng),極大地提高在線教育的效率。
3.2? ?教育對話機器人的算法流程設計
以上三類對話系統(tǒng)都依賴于大量的人工智能算法。對話機器人的算法流程(圖3)中,意圖分析、情緒分析等自然語言理解等方法能夠抽取出用戶所提問題的關鍵信息,基于這些關鍵信息可以完成對話狀態(tài)追蹤并選取合適的對話策略,實現上下文信息的融合。之后,根據問題的意圖,機器人會從數據庫中查詢回答問題所必需的信息,通過自然語言生成方法得到通順的回復句。此外,當用戶向機器人尋求推薦或想查詢評估報告時,對話機器人還可以與推薦系統(tǒng)和學習行為大數據分析算法聯動,給出用戶期望的回答。
3.3? ?跨模態(tài)語義融合理解及對話機器人的技術實現方案
對話系統(tǒng)使用最廣泛的方法為BERT(Bidirectional Encoder Representation from Transformers)、Bi-LSTM(Bidirectional Long-Short Term Memory)和注意力機制。由于在線教學場景人機互動涉及多種類型的數據,如文本、語音、表情、動作等,對話系統(tǒng)的實現必須要完成多模態(tài)語義融合理解后才能制定合理的對話策略。此外對話系統(tǒng)的內容自動生成,常常依賴于各個學科的領域知識圖譜和智能模糊查詢等技術。
對話系統(tǒng)的自適應性是系統(tǒng)被廣泛使用的前提和基礎。通過構建深度網絡模型,用樣本完成網絡訓練。感知學習者的多模態(tài)信息通過技術模型的嵌入層(Embedding)實現多模態(tài)數據對齊與融合輸入,再利用設計的跨模態(tài)BERT網絡對多模態(tài)數據進行雙向編碼表達,利用Bi-LSTM實現對上下文相關的語義編碼,然后再利用Self-attention網絡對多模態(tài)特征進行自動加強處理,最后通過Softmax處理輸出感知到的學習者跨模態(tài)特征。以基于深度網絡輸出的多模態(tài)融合語義特征為基礎,通過一個預先訓練好的淺層全連接神經網絡,來實現對學科知識圖譜的智能模糊查詢,利用網絡輸出解決人機互動中應答內容的自動生成技術,如圖4所示。
4? ?結論(Conclusion)
顯而易見,隨著人工智能技術的不斷改進和提升,人機互動的對話系統(tǒng)對人類社會發(fā)展的推動作用會更加顯著。由于人機互動對話系統(tǒng)對在線教育的發(fā)展起到了顯著的助推作用,與其他領域相比,教育領域中的對話機器人系統(tǒng)將會以更加迅猛的速度發(fā)展。
任務型對話機器人的未來發(fā)展將會與人工智能、大數據深度融合,在人工智能+大數據的有力推動下,向混合智能、個性化情感關懷和虛擬化方向發(fā)展。自動生成知識庫、減少知識庫運維的成本、對話系統(tǒng)的自學習性實現、自適應性改進、定制復雜的對話機器人將成為對話系統(tǒng)的研發(fā)重點。
本文提出的教育領域中的任務型對話機器人系統(tǒng)既可以獨立地作為智慧學習平臺,用于在線教育使用,也可以嵌入其他已有的在線教育平臺,用于其他教育平臺的改造和升級,帶動其他在線教育平臺提升教學效果。這樣的對話系統(tǒng)可以讓教師準備資源、考核學生和師生互動變得簡單實時,讓管理者評價教學質量變得容易,讓學習和教育變得智慧化。
參考文獻(References)
[1] 王浩暢,李斌.聊天機器人系統(tǒng)研究進展[J].計算機應用與軟件,2018,35(12):1-6.
[2] 趙陽洋,王振宇,王佩,等.任務型對話系統(tǒng)研究綜述[J].計算機學報,2020,43(10):1862-1896.
[3] 楊曉珍.任務型對話系統(tǒng)[D].武漢:華中師范大學,2019.
[4] 王堃,林民,李艷玲.端到端對話系統(tǒng)意圖語義槽聯合識別研究綜述[J].計算機工程與應用,2020,56(14):14-25.
[5] 吳雅婷.基于多任務學習和知識圖譜的對話技術研究[D].廈門:華僑大學,2020.
[6] 侯佳騰,常薇,林冠峰.基于自然語言理解技術的智能客服機器人的設計與實現[J].電子技術與軟件工程,2019(23):238-240.
[7] Hafezi Manshadi, Mohammad. Dealing with quantifier scope ambiguity in natural language understanding[D]. Rochester: University of Rochester, 2014.
[8] 夏艷輝,聶百勝,胡金鳳.中文開放域問答系統(tǒng)的問題分類研究[J].價值工程,2019,38(016):147-149.
[9] 侯沐瀾.面向自然語言理解的新槽值問題研究與應用[D].北京:北京郵電大學,2019.
作者簡介:
于? ?丹(1976-),女,博士,研究員.研究領域:數據分析與挖掘,人工智能.
閆曉宇(1995-),女,碩士,初級研究員.研究領域:自然語言處理,對話系統(tǒng).
王艷秋(1993-),女,碩士,初級研究員.研究領域:人工智能,數據挖掘.
來關軍(1984-),男,碩士,中級研究員.研究領域:大數據分析,人工智能.
肖? ?鵬(1993-),男,碩士,初級研究員.研究領域:計算機視覺,自然語言處理.
王? ?宇(1994-),男,碩士,初級研究員.研究領域:自然語言處理,人工智能.