摘 要:人工智能技術(shù)在高校的應(yīng)用場(chǎng)景越來(lái)越多,其中,語(yǔ)音識(shí)別和智能問(wèn)答技術(shù)的實(shí)現(xiàn),使得計(jì)算機(jī)可以與人類通過(guò)自然語(yǔ)言的方式進(jìn)行交流。微信公眾平臺(tái)具有大量用戶和信息獲取的便捷性,奠定了微信公眾平臺(tái)最佳且可靠的載體地位。文章基于微信公眾號(hào)對(duì)智能語(yǔ)音問(wèn)答系統(tǒng)進(jìn)行研究。
關(guān)鍵詞:智能問(wèn)答;人工智能;語(yǔ)音識(shí)別;微信公眾平臺(tái);知識(shí)庫(kù)
1 高校建設(shè)智能語(yǔ)音問(wèn)答系統(tǒng)的必要性
通過(guò)大量的需求調(diào)研發(fā)現(xiàn):首先,高校內(nèi)事務(wù)缺乏明確的辦事流程,遇到問(wèn)題不知道該找誰(shuí)、需要什么材料、怎么辦理;其次,學(xué)校有很多辦事指南,但是不規(guī)范,也不知道如何整理維護(hù),辦事指南缺乏高效的觸達(dá)通道,如何實(shí)現(xiàn)讓師生便捷獲取是需要解決的問(wèn)題。校園的各類信息不統(tǒng)一,唯一獲取信息的方法是到不同的地方、登錄不同的系統(tǒng)進(jìn)行相應(yīng)的操作。即便通過(guò)多媒體數(shù)字終端查詢,也存在著操作復(fù)雜、功能不全、使用率不高等問(wèn)題。
人工智能技術(shù)在高校的應(yīng)用場(chǎng)景越來(lái)越多,其中,語(yǔ)音識(shí)別和智能問(wèn)答技術(shù)的實(shí)現(xiàn),使得計(jì)算機(jī)可以與人類通過(guò)自然語(yǔ)言的方式進(jìn)行交流。不僅如此,微信公眾平臺(tái)具有大量用戶和信息獲取的便捷性,奠定了微信公眾平臺(tái)最佳且可靠的載體地位。高校建設(shè)智能語(yǔ)音問(wèn)答系統(tǒng),不但為師生提供方便、快捷的校內(nèi)資訊和信息咨詢服務(wù),而且從管理者的角度出發(fā),還包含了更深層次的含義:(1)有利于統(tǒng)計(jì)和收集師生提出的各類問(wèn)題,掌握師生目前的需求和所關(guān)心的問(wèn)題,從而為師生提供更優(yōu)質(zhì)的服務(wù)。同時(shí)師生的需求和所關(guān)心的問(wèn)題也能為學(xué)校的決策規(guī)劃、政策制度的制定提供依據(jù)和參考。(2)有利于促進(jìn)高校信息管理模式的變化,使得信息管理從松散型模式逐步轉(zhuǎn)向集約型模式。智能語(yǔ)音問(wèn)答系統(tǒng)必須有豐富的知識(shí)庫(kù)作為儲(chǔ)備,才能提供快速、精準(zhǔn)的查詢。目前知識(shí)是松散分布在各個(gè)平臺(tái)中的,通過(guò)建設(shè)智能語(yǔ)音問(wèn)答系統(tǒng)搭建知識(shí)倉(cāng)庫(kù),有助于將松散的知識(shí)都集中起來(lái)進(jìn)行高效且統(tǒng)一的管理。
本文依托南京城市職業(yè)學(xué)院作為實(shí)驗(yàn)環(huán)境平臺(tái),將該系統(tǒng)安裝部署在了南京城市職業(yè)學(xué)院微信公眾號(hào)中,目前已正式運(yùn)行。該系統(tǒng)結(jié)合AI,通過(guò)大量校園語(yǔ)料及文本積累,建立符合高校的算法模型,幫助用戶通過(guò)口語(yǔ)化語(yǔ)言獲取校內(nèi)事務(wù)。通過(guò)文獻(xiàn)調(diào)查和問(wèn)卷調(diào)查等多種方法,調(diào)研了在高校情景中,師生獲取信息的途徑及獲取的內(nèi)容,從而精準(zhǔn)定位師生需求,再有針對(duì)性地提供幫助。隨著人工智能在算法上優(yōu)化和進(jìn)步,智能語(yǔ)音問(wèn)答系統(tǒng)不僅能在語(yǔ)言表述上獲取表面信息,還能通過(guò)語(yǔ)義獲取更深層次的信息,這種優(yōu)化所帶來(lái)的進(jìn)步,也恰好給了智能語(yǔ)音問(wèn)答系統(tǒng)生長(zhǎng)的土壤與營(yíng)養(yǎng),使其生存下來(lái)。在智能語(yǔ)音問(wèn)答系統(tǒng)的改革與發(fā)展下,越來(lái)越廣泛地應(yīng)用在如智能家居、智能客服機(jī)器人等方面,逐步取代了人工客服,越發(fā)引起了學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注。成熟的智能語(yǔ)音問(wèn)答系統(tǒng)最終將幫助人類從大量重復(fù)性的勞動(dòng)中解放出來(lái),人類生產(chǎn)方式也會(huì)逐步改變,對(duì)社會(huì)的進(jìn)步是無(wú)法預(yù)計(jì)的。同時(shí),智能問(wèn)答系統(tǒng)也是構(gòu)建下一代智能世界不可或缺的一個(gè)重要角色[1]。
2 系統(tǒng)服務(wù)模式設(shè)計(jì)
互聯(lián)網(wǎng)信息爆炸式產(chǎn)生,深度學(xué)習(xí)技術(shù)快速發(fā)展,大量的數(shù)據(jù)和革新的技術(shù)給新一代問(wèn)答系統(tǒng)提供了發(fā)展的客觀條件。與此同時(shí),深層次的神經(jīng)網(wǎng)絡(luò)爆發(fā)式發(fā)展,用更深層的算法學(xué)習(xí)來(lái)獲得更深層的自然語(yǔ)言特征,賦予了神經(jīng)網(wǎng)絡(luò)更加強(qiáng)大的學(xué)習(xí)能力,其強(qiáng)大的學(xué)習(xí)能力,使得問(wèn)答系統(tǒng)得到了空前的關(guān)注。
2.1 智能語(yǔ)音問(wèn)答系統(tǒng)處理框架
不同類型的智能語(yǔ)音問(wèn)答系統(tǒng)在數(shù)據(jù)處理形式上是不一樣的。智能語(yǔ)音問(wèn)答系統(tǒng)需要解決3個(gè)基本問(wèn)題:如何使計(jì)算機(jī)理解自然語(yǔ)言準(zhǔn)確的語(yǔ)義,并在計(jì)算機(jī)中表現(xiàn)出來(lái);如何選擇最合適的回復(fù)答案;如何再將最合適的答案通過(guò)自然語(yǔ)言表現(xiàn)出來(lái)。
不同的智能語(yǔ)音問(wèn)答系統(tǒng)在處理不同的任務(wù)時(shí),各自有著不同的架構(gòu)體系,依據(jù)各架構(gòu)體系處理數(shù)據(jù)流的方式,可以分成3個(gè)模塊:提問(wèn)分析模塊,檢索模塊、答案抽取模塊[2]。
(1)提問(wèn)分析模塊,負(fù)責(zé)處理用戶的問(wèn)題,生成查詢關(guān)鍵詞,確定問(wèn)題答案的類型以及問(wèn)題的語(yǔ)義表示。
(2)檢索模塊,依據(jù)提問(wèn)分析模塊所轉(zhuǎn)換的語(yǔ)句,采用深化理解和結(jié)果檢索出備選答案。
(3)答案抽取模塊,執(zhí)行預(yù)先設(shè)計(jì)好的規(guī)則,對(duì)備選答案打分,返回出分?jǐn)?shù)最高的答案選項(xiàng)。
2.2 智能語(yǔ)音問(wèn)答系統(tǒng)的分類與技術(shù)
依據(jù)智能語(yǔ)音問(wèn)答系統(tǒng)的任務(wù)類別來(lái)分,可分為兩種:
(1)面向任務(wù)的智能語(yǔ)音問(wèn)答系統(tǒng),依據(jù)具體任務(wù)來(lái)安排實(shí)施,例如查詢圖書(shū)館信息、成績(jī)信息等。
(2)面向非任務(wù)的智能語(yǔ)音問(wèn)答系統(tǒng),主要作用是和人類進(jìn)行自然語(yǔ)言的交流,例如和機(jī)器人對(duì)話[3]。
2.3 面向非任務(wù)問(wèn)答系統(tǒng)的3種主要方法
(1)基于檢索的方法,從事先定義好的數(shù)據(jù)庫(kù)中,根據(jù)某種規(guī)則,選出最合適的答案。優(yōu)點(diǎn)是通俗易懂、易于解釋;缺點(diǎn)也很明顯,非常依賴事先定義的數(shù)據(jù)庫(kù)和檢索算法,如果數(shù)據(jù)質(zhì)量不高,那么很可能效果就很差。
(2)基于生成的方法,是當(dāng)前研究領(lǐng)域的一個(gè)主流熱點(diǎn),通過(guò)理解提出的問(wèn)題來(lái)生成適當(dāng)?shù)幕貜?fù),典型的生成模型有seq2seq,transformer等。優(yōu)點(diǎn)是不依賴定義好的數(shù)據(jù)庫(kù)、可以靈活回復(fù);缺點(diǎn)是容易生成一些無(wú)意義的回復(fù)和重復(fù)的回復(fù)等。
(3)基于檢索和生成混合的方法,結(jié)合檢索回復(fù)較為精確和生成回復(fù)較為靈活的優(yōu)點(diǎn),可以大大提升問(wèn)答系統(tǒng)的回復(fù)效率和性能,是智能語(yǔ)音問(wèn)答系統(tǒng)在實(shí)際中應(yīng)用最多的方法[4]。
3 校園智能問(wèn)答系統(tǒng)的設(shè)計(jì)思路
在校園環(huán)境中,成熟的智能語(yǔ)音問(wèn)答系統(tǒng)離不開(kāi)知識(shí)庫(kù)的建設(shè),校園知識(shí)庫(kù)是領(lǐng)域信息的模型化表示。相應(yīng)的技術(shù)難點(diǎn)在于如何理解用戶的意圖。需要對(duì)關(guān)鍵詞進(jìn)行準(zhǔn)確的提取,考慮在校園生活中發(fā)生問(wèn)題的重復(fù)、簡(jiǎn)單性,和現(xiàn)有的分詞算法,基于字符串匹配的分詞算法是比較合適的。在實(shí)際的高校環(huán)境應(yīng)用中,為每個(gè)問(wèn)題提供了至少兩種以上的回復(fù)答案。從各個(gè)業(yè)務(wù)系統(tǒng)中收集到的專業(yè)性回復(fù)信息,再對(duì)問(wèn)答庫(kù)中的語(yǔ)句進(jìn)去斷句處理、語(yǔ)法處理、相似統(tǒng)計(jì)等,防止出現(xiàn)錯(cuò)誤。最后根據(jù)微信公眾平臺(tái)提供的應(yīng)用程序編程接口(Application Programming Interface,API)調(diào)用,更加準(zhǔn)確地劃分業(yè)務(wù)模塊,減少各個(gè)模塊之間的數(shù)據(jù)交叉,大大提高了模塊的維護(hù)性,為知識(shí)庫(kù)的擴(kuò)展提供了便捷。
將智能語(yǔ)音問(wèn)答機(jī)器人部署在微信公眾平臺(tái)上,用戶在關(guān)注公眾號(hào)之后,可以在公眾號(hào)的對(duì)話界面通過(guò)語(yǔ)音提出問(wèn)題,智能語(yǔ)音問(wèn)答機(jī)器人就會(huì)開(kāi)始自動(dòng)識(shí)別問(wèn)題信息,再通過(guò)對(duì)比知識(shí)庫(kù)的數(shù)據(jù),對(duì)命中的問(wèn)題答案進(jìn)行判斷,再把命中的問(wèn)題答案文字或者圖片等形式發(fā)送給用戶。若知識(shí)庫(kù)中沒(méi)有命中到合適的答案,智能語(yǔ)音問(wèn)答機(jī)器人就會(huì)自動(dòng)存檔信息,再通過(guò)學(xué)習(xí)來(lái)不斷豐富知識(shí)庫(kù)。
4 智能語(yǔ)音問(wèn)答知識(shí)庫(kù)實(shí)現(xiàn)
4.1 校園信息的分類結(jié)構(gòu)及其呈現(xiàn)方式
以南京城市職業(yè)學(xué)院作為研究對(duì)象,通過(guò)信息整合和信息分類,分析了校園信息的分類結(jié)構(gòu)以及其呈現(xiàn)形式。
(1)信息的整合。將高校各業(yè)務(wù)平臺(tái)的信息收集、整理到知識(shí)庫(kù)后臺(tái),通過(guò)相應(yīng)的智能搜索算法,把信息進(jìn)行處理和篩選分類,再把結(jié)果信息顯示到微信公眾平臺(tái)的聊天界面。
(2)信息的分類及分類方法。根據(jù)以上調(diào)研結(jié)果,校園信息分為在校教職工和校內(nèi)學(xué)生兩大類,每類又根據(jù)信息屬性繼續(xù)細(xì)分。
4.2 知識(shí)庫(kù)構(gòu)建與管理
(1)知識(shí)庫(kù)構(gòu)建,是校園信息知識(shí)庫(kù)的重要設(shè)計(jì)流程。分類整理整個(gè)業(yè)務(wù)平臺(tái)信息,確定橫向線性流作為知識(shí)庫(kù)的中心流,再有機(jī)結(jié)合橫向流程和縱向模塊,使其成為存在多種檢索方式的知識(shí)庫(kù),并將其作為知識(shí)庫(kù)建設(shè)的重要目標(biāo)。
(2)知識(shí)庫(kù)管理,是知識(shí)庫(kù)的重要模塊。采用模塊化的設(shè)計(jì)方式,可以提高知識(shí)庫(kù)的交互性,方便知識(shí)庫(kù)的日常管理,讓操作維護(hù)界面合理、清晰。
4.3 知識(shí)庫(kù)的維護(hù)
提高知識(shí)庫(kù)操作員的技術(shù)水平,可以讓管理員們應(yīng)對(duì)并解決各類知識(shí)庫(kù)故障,提高運(yùn)維能力。知識(shí)庫(kù)不僅包含了知識(shí)的更新,還包含了知識(shí)庫(kù)自身的系統(tǒng)更新。在知識(shí)庫(kù)設(shè)計(jì)階段,必須包含知識(shí)庫(kù)未能檢索問(wèn)題的記錄功能,后臺(tái)運(yùn)行維護(hù)人員會(huì)通過(guò)新增的記錄更新知識(shí)庫(kù),保證了知識(shí)庫(kù)數(shù)據(jù)的不斷增長(zhǎng)和完善。
4.4 知識(shí)庫(kù)的評(píng)價(jià)
知識(shí)庫(kù)的評(píng)價(jià)以知識(shí)庫(kù)的安全、穩(wěn)定運(yùn)行為重要保障基礎(chǔ),以此保障、優(yōu)化知識(shí)庫(kù)的構(gòu)建能力。加強(qiáng)知識(shí)庫(kù)的運(yùn)行維護(hù)以及日常管理同樣重要,應(yīng)該加強(qiáng)知識(shí)庫(kù)日常巡檢,改善知識(shí)庫(kù)交互能力,構(gòu)建高效、穩(wěn)定的知識(shí)庫(kù),來(lái)保證本系統(tǒng)的安全運(yùn)行。
5 結(jié)語(yǔ)
微信公眾平臺(tái)代表的是人類交流的一種方式,也代表了互聯(lián)網(wǎng)的發(fā)展趨向。以智能移動(dòng)終端為主的新媒體在未來(lái)會(huì)有巨大的發(fā)展?jié)摿?。人工智能作為一種新的載體不斷傳播和繼承著高校文化,也在逐漸滲入師生們的工作、學(xué)習(xí)和生活中,不僅受到學(xué)生的追捧和青睞,還開(kāi)辟了校園服務(wù)交流媒介的新紀(jì)元。在科技發(fā)展的新時(shí)代,智能語(yǔ)言問(wèn)答是在獲取校園信息方面的一次重要嘗試,具有非常積極的意義。
基金項(xiàng)目:2019年江蘇省高等學(xué)校大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目;項(xiàng)目名稱:智能語(yǔ)音問(wèn)答系統(tǒng)的應(yīng)用與研究;項(xiàng)目編號(hào):201914001004Y。
作者簡(jiǎn)介:陸世堯(1986— ),男,江蘇南京人,工程師,學(xué)士;研究方向:軟件技術(shù)。
[參考文獻(xiàn)]
[1]胡蕊.大學(xué)生微信使用在高校教學(xué)中的應(yīng)用前景分析[J].北京青年政治學(xué)院學(xué)報(bào),2014(1):76-81.
[2]盛偉芳.校園微信公眾平臺(tái)運(yùn)營(yíng)策略研究[J].劍南文學(xué),2013(2):326-327.
[3]王磊,鄒鎧同.微信公眾平臺(tái)在高校中的應(yīng)用[J].電子技術(shù)與軟件工程,2014(7):42.
[4]朱智強(qiáng),朱廣賀.基于微信公共平臺(tái)的校園信息服務(wù)系統(tǒng)的研發(fā)[J].電子技術(shù)與軟件工程,2015(11):87.
Application and research of intelligent question and answer system based on WeChat public
Lu Shiyao
(Nanjing City Vocational College, Nanjing 211200, China)
Abstract:The application of artificial intelligence in colleges and universities is more and more, among which, the realization of speech recognition and intelligent question and answer technology makes the computer communicate with the human being through natural language. WeChat public platform has a large number of users and information acquisition convenience, which lays the best and reliable carrier position of the WeChat public platform. This paper studies the intelligent question and answer system based on the WeChat public number.
Key words:intelligent question and answer; artificial intelligence; speech recognition; WeChat public platform; knowledge base