史聰慧
摘要:深度學(xué)習(xí)是學(xué)習(xí)樣本數(shù)據(jù)的內(nèi)在規(guī)律和表示層次,它的最終目標(biāo)是讓機(jī)器能夠像人一樣具有分析學(xué)習(xí)能力,能夠識(shí)別文字、圖像和聲音等數(shù)據(jù)。在圖書(shū)館的參考咨詢(xún)服務(wù)中,引入智能機(jī)器人進(jìn)行服務(wù),不僅可以節(jié)約圖書(shū)館人力的投入,還可以提高服務(wù)質(zhì)量和效率。
關(guān)鍵詞:人工智能;參考咨詢(xún);深度學(xué)習(xí);圖書(shū)館
中圖分類(lèi)號(hào):G253
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2020)03-0205-02
隨著智能化時(shí)代到來(lái),人工智能(Artificial Intelligence,AD技術(shù)獲得了突破性進(jìn)展,并且逐步被運(yùn)用到各個(gè)行業(yè)各個(gè)領(lǐng)域。人工智能技術(shù)主要包括:機(jī)器學(xué)習(xí)(ML,Machine Learning)、神經(jīng)網(wǎng)絡(luò)、自然語(yǔ)言的處理、聚類(lèi)分析及模擬人類(lèi)思維方式等。深度學(xué)習(xí)(DL,Deep Learning)是機(jī)器學(xué)習(xí)領(lǐng)域中一個(gè)研究方向。近年來(lái),智慧圖書(shū)館與圖書(shū)館智能化服務(wù)成為圖書(shū)館發(fā)展的重要課題,機(jī)器學(xué)習(xí)的相關(guān)技術(shù)在圖書(shū)館的應(yīng)用將會(huì)從根本上改變當(dāng)前圖書(shū)館的服務(wù)方式,將會(huì)為讀者提供更加便捷更加豐富的知識(shí)服務(wù)。
1 深度學(xué)習(xí)與圖書(shū)館智能參考咨詢(xún)服務(wù)
1.1 深度學(xué)習(xí)概念及特點(diǎn)
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一種類(lèi)型,源于人工神經(jīng)網(wǎng)絡(luò)的研究,通過(guò)模擬人腦神經(jīng)元對(duì)于外界刺激的感知和傳導(dǎo)過(guò)程,即建立人工神經(jīng)網(wǎng)絡(luò),來(lái)獲取對(duì)事物的認(rèn)識(shí)、解釋和判斷。[1]通過(guò)圖像、聲音與文本的組合發(fā)現(xiàn)最淺層的特征,經(jīng)過(guò)機(jī)器的重組與記憶,形成更加抽象的深層的特征或表現(xiàn)形式,最后形成強(qiáng)大的數(shù)據(jù)組合。深度學(xué)習(xí)最后目的在于建立模擬人腦進(jìn)行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),它模仿人腦的機(jī)制來(lái)對(duì)聲音、圖像以及文本信息進(jìn)行解釋、理解、儲(chǔ)存,形成強(qiáng)大的知識(shí)庫(kù)。
深度學(xué)習(xí)是發(fā)現(xiàn)和挖掘已有數(shù)據(jù)的內(nèi)在規(guī)律和表示層次,它的最終目標(biāo)是讓機(jī)器能夠像人一樣具有分析學(xué)習(xí)能力,能夠識(shí)別文字、圖像和聲音等數(shù)據(jù)。深度學(xué)習(xí)是機(jī)器模仿人腦進(jìn)行知識(shí)記憶、數(shù)據(jù)關(guān)聯(lián)、信息檢索與海量存儲(chǔ),同時(shí)又比人腦具有更加快捷處理復(fù)雜數(shù)據(jù)的優(yōu)勢(shì),使得人工智能相關(guān)技術(shù)取得了很大進(jìn)步。
1.2 圖書(shū)館智能參考咨詢(xún)服務(wù)的發(fā)展現(xiàn)狀
圖書(shū)館服務(wù)中,參考咨詢(xún)服務(wù)是圖書(shū)館服務(wù)中的一項(xiàng)重要工作,而服務(wù)的響應(yīng)時(shí)間、服務(wù)的覆蓋面與服務(wù)的效果也成了衡量圖書(shū)館服務(wù)效果的一個(gè)非常重要的指標(biāo)。傳統(tǒng)的參考咨詢(xún)模式有人工咨詢(xún)與表單式咨詢(xún),隨著人力成本的提高、讀者服務(wù)體驗(yàn)要求的提升以及人工智能技術(shù)的發(fā)展,勞動(dòng)力密集型的參考咨詢(xún)服務(wù)已經(jīng)不能適應(yīng)未來(lái)發(fā)展,傳統(tǒng)的咨詢(xún)服務(wù)出現(xiàn)了很多存在不足方面:例如咨詢(xún)館員的配備數(shù)量有限;人工咨詢(xún)回復(fù)效率較低;咨詢(xún)工作受節(jié)假日等時(shí)間限制,導(dǎo)致讀者無(wú)法得到及時(shí)的信息答復(fù)。所以,為了彌補(bǔ)傳統(tǒng)參考咨詢(xún)模式的不足,圖書(shū)館開(kāi)始探索智能咨詢(xún)服務(wù)的模式,以實(shí)現(xiàn)圖書(shū)館對(duì)讀者的7*24小時(shí)的無(wú)間斷服務(wù)。目前,我國(guó)大部分圖書(shū)館常用的咨詢(xún)工具包括:博客、微信、QQ、IM咨詢(xún)與電話咨詢(xún)、郵件咨詢(xún)等方式,這些現(xiàn)代交流工具的運(yùn)用大大改善了傳統(tǒng)參考咨詢(xún)模式的效率與效能。[2]
隨著人工智能以及深度學(xué)習(xí)技術(shù)的引入,很多圖書(shū)館開(kāi)始在咨詢(xún)服務(wù)中引入機(jī)器人參與服務(wù)。智能咨詢(xún)機(jī)器人通過(guò)人機(jī)互動(dòng)接口接收讀者的提問(wèn),用機(jī)器語(yǔ)言描述讀者問(wèn)題,然后去知識(shí)庫(kù)進(jìn)行檢索,找到匹配答案后,返回給讀者若干個(gè)與咨詢(xún)問(wèn)題相匹配的答案,讀者點(diǎn)擊閱讀相關(guān)答案后,如若仍不能解決咨詢(xún)問(wèn)題,可通過(guò)點(diǎn)擊“人工咨詢(xún)”鏈接轉(zhuǎn)介人工咨詢(xún)館員繼續(xù)咨詢(xún)。目前,一些高校圖書(shū)館中開(kāi)始在圖書(shū)館服務(wù)中引入了機(jī)器人智能咨詢(xún),如:清華大學(xué)圖書(shū)館的“小圖”、深圳圖書(shū)館的“小圖丁”、上海交通大學(xué)圖書(shū)館基于MSN的智能聊天機(jī)器人、重慶文理學(xué)院圖書(shū)館基于實(shí)時(shí)虛擬參考咨詢(xún)服務(wù)機(jī)器人等。[3]
盡管這些機(jī)器人服務(wù)目前還存在許多弊端,甚至有些讀者因?yàn)闄C(jī)器人提供的答案不準(zhǔn)確,去嘲弄機(jī)器人。但是我們必須看到,未來(lái)在圖書(shū)館智能參考咨詢(xún)服務(wù)中,運(yùn)用機(jī)器人參與服務(wù)是一個(gè)必然趨勢(shì),智能機(jī)器人根據(jù)FAQ數(shù)據(jù)庫(kù)了解讀者需求,解答部分常規(guī)讀者的咨詢(xún)。應(yīng)用智能機(jī)器人技術(shù)可以節(jié)省圖書(shū)館人力物力的投入,減少咨詢(xún)館員的重復(fù)性勞動(dòng),提高咨詢(xún)服務(wù)質(zhì)量,實(shí)現(xiàn)圖書(shū)館的7x24小時(shí)的咨詢(xún)回復(fù)。
1.3 深度學(xué)習(xí)的關(guān)鍵技術(shù)
深度學(xué)習(xí)是機(jī)器模擬人腦進(jìn)行學(xué)習(xí)、記憶、歸類(lèi)、分析以及信息檢索,形成比人腦更加強(qiáng)大的知識(shí)庫(kù),在圖書(shū)館的智能參考咨詢(xún)服務(wù)中,涉及的關(guān)鍵技術(shù)有以下幾個(gè)方面:
(1)語(yǔ)音轉(zhuǎn)寫(xiě):把音頻數(shù)據(jù)轉(zhuǎn)化為文本數(shù)據(jù)的過(guò)程。機(jī)器人接收到讀者的提問(wèn),可以是自然語(yǔ)言形式的,也可以是文本形式的。如果機(jī)器人接收到的信息是語(yǔ)音形式的,就需要對(duì)音源進(jìn)行檢測(cè),提取音頻數(shù)據(jù)的關(guān)鍵特征,通過(guò)數(shù)字解碼、音素轉(zhuǎn)換、音節(jié)轉(zhuǎn)換、標(biāo)音轉(zhuǎn)換等操作,最后轉(zhuǎn)換成文字?jǐn)?shù)據(jù),目的是為了讓機(jī)器人準(zhǔn)確理解讀者需求,進(jìn)而去知識(shí)庫(kù)中尋找匹配答案。[4]
(2)文本分析:將非結(jié)構(gòu)化文本數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化或者標(biāo)準(zhǔn)化數(shù)據(jù)的過(guò)程。從非結(jié)構(gòu)化數(shù)據(jù)中檢索信息,以及對(duì)輸入文本進(jìn)行結(jié)構(gòu)化以得出模式和趨勢(shì),并對(duì)輸出數(shù)據(jù)進(jìn)行評(píng)估和解釋的過(guò)程。包括詞匯分析、分類(lèi)、聚類(lèi)、模式識(shí)別、標(biāo)簽、注釋、信息提取、鏈接和關(guān)聯(lián)分析、可視化和預(yù)測(cè)分析特征提取等。[5]
(3)文本聚類(lèi):在知識(shí)庫(kù)里,按照某一個(gè)特定的標(biāo)準(zhǔn),把相似問(wèn)法或相似答案的文本數(shù)據(jù)聚集在一個(gè)集群里。目的是為了咨詢(xún)機(jī)器人能夠儲(chǔ)存盡可能大量的數(shù)據(jù),以及輸出最準(zhǔn)確的答案。[6]
(4)問(wèn)答系統(tǒng):建立問(wèn)答系統(tǒng),包括知識(shí)庫(kù)掃描、問(wèn)題理解、問(wèn)題檢索與問(wèn)題解答等??朔鹘y(tǒng)搜索引擎的弊端,實(shí)現(xiàn)用戶采用自然語(yǔ)言進(jìn)行提問(wèn)或檢索,對(duì)讀者問(wèn)題進(jìn)行語(yǔ)義分析與理解,準(zhǔn)確快速定位讀者的真正需求,反饋精準(zhǔn)答案給讀者。涉及的技術(shù)包括:?jiǎn)柧浞治?,詞向量、依存句法,同義詞提取。自然語(yǔ)句生成等。[7]
2 基于深度學(xué)習(xí)的智能參考咨詢(xún)模式的步驟
智能咨詢(xún)服務(wù)的工作方式是,通過(guò)人機(jī)交互平臺(tái),接收讀者對(duì)機(jī)器人的提問(wèn),咨詢(xún)機(jī)器人把表達(dá)的自然語(yǔ)言提問(wèn)進(jìn)行關(guān)鍵詞提取分析,通過(guò)對(duì)FAQ數(shù)據(jù)庫(kù)檢索,將最相關(guān)的答案用簡(jiǎn)潔準(zhǔn)確的語(yǔ)言提供給讀者,在保證實(shí)時(shí)性的同時(shí),具有高度的精確性。本框架是通過(guò)自然智能的工作方式,實(shí)現(xiàn)三步平滑過(guò)渡。利用人機(jī)結(jié)合的操作模式,取代“單一自動(dòng)化”的切換模式。
(1)第一階段:大量咨詢(xún)館員坐席十少量訓(xùn)練館員坐席
如圖所示,第一階段設(shè)置大量的咨詢(xún)館員坐席對(duì)讀者進(jìn)行服務(wù);然后設(shè)置一部分訓(xùn)練館員坐席與咨詢(xún)機(jī)器人共同學(xué)習(xí)。訓(xùn)練館員不參與面對(duì)讀者的服務(wù),他的任務(wù)是把咨詢(xún)館員日常服務(wù)的信息按照一定規(guī)則編輯成文本數(shù)據(jù)的形式,把讀者提問(wèn)的方式與咨詢(xún)館員回答問(wèn)題的信息相互匹配,讓咨詢(xún)機(jī)器人進(jìn)行學(xué)習(xí)。該階段,咨詢(xún)機(jī)器人的工作就是學(xué)習(xí),像人腦神經(jīng)元一樣,通過(guò)文本分析、模式識(shí)別及聚類(lèi)等步驟,大量?jī)?chǔ)存信息,形成強(qiáng)大的知識(shí)庫(kù)。
(2)第二階段:咨詢(xún)機(jī)器人坐席十訓(xùn)練館員坐席+咨詢(xún)館員坐席
該階段,由一部分咨詢(xún)機(jī)器人坐席開(kāi)始參與智能服務(wù),逐漸減少咨詢(xún)館員坐席的數(shù)量。訓(xùn)練館員的工作主要是驗(yàn)證咨詢(xún)機(jī)器人服務(wù)的效果,如果有的答案不準(zhǔn)確,訓(xùn)練館員一方面反饋給智能機(jī)器人,重新去修正已儲(chǔ)存的信息;另一方面,把不準(zhǔn)確的服務(wù)轉(zhuǎn)介給咨詢(xún)館員,重新進(jìn)行服務(wù)。
這一階段,是咨詢(xún)機(jī)器人快速驗(yàn)證已學(xué)知識(shí)與不斷更新知識(shí)庫(kù)的過(guò)程。把一些關(guān)聯(lián)不準(zhǔn)確或者模糊的自然語(yǔ)言重新進(jìn)行標(biāo)記,形成新的規(guī)則,重新儲(chǔ)存進(jìn)機(jī)器人大腦中。該階段訓(xùn)練館員的工作非常重要,是驗(yàn)證咨詢(xún)機(jī)器人知識(shí)庫(kù)信息是否準(zhǔn)確的關(guān)鍵時(shí)期,也是驗(yàn)證咨詢(xún)館員工作的重要時(shí)期。
(3)第三階段:大量咨詢(xún)館員坐席十少量訓(xùn)練館員坐席+少量咨詢(xún)館員坐席
該階段,咨詢(xún)機(jī)器人大量參與參考咨詢(xún)服務(wù),保留少量訓(xùn)練館員席位與少量咨詢(xún)館員席位。對(duì)于讀者的提問(wèn),咨詢(xún)機(jī)器人大部分可以獨(dú)立解答。在提供服務(wù)的同時(shí),不斷更新知識(shí)庫(kù),像人腦一樣儲(chǔ)存知識(shí)、建立新知識(shí)的關(guān)聯(lián)、用新的知識(shí)體系覆蓋舊的知識(shí)體系,不斷擴(kuò)充知識(shí)庫(kù)的容量。另一方面,對(duì)于一些特別復(fù)雜的問(wèn)題或者是一些新的業(yè)務(wù)問(wèn)題,由訓(xùn)練館員進(jìn)行辨別,經(jīng)過(guò)驗(yàn)證以后,轉(zhuǎn)交給人工的咨詢(xún)館員進(jìn)行解答。人工咨詢(xún)館員解答完畢,再把新問(wèn)題與新答案反饋給訓(xùn)練館員,進(jìn)而去指導(dǎo)咨詢(xún)機(jī)器人進(jìn)行新一輪的學(xué)習(xí)。
該智能參考咨詢(xún)模式分三步走,逐步實(shí)現(xiàn)由人工咨詢(xún)館員提供服務(wù)到咨詢(xún)機(jī)器人服務(wù)為主,人工咨詢(xún)館員提供指導(dǎo)相結(jié)合的模式。既提升了圖書(shū)館參考咨詢(xún)服務(wù)的效率,也保證了服務(wù)的專(zhuān)業(yè)性與可控性
3 總結(jié)
物聯(lián)網(wǎng)與人工智能時(shí)代的到來(lái)推動(dòng)了智能服務(wù)的向前發(fā)展,采用智能機(jī)器人進(jìn)行實(shí)時(shí)參考咨詢(xún)服務(wù),是未來(lái)智慧圖書(shū)館服務(wù)的方向。圖書(shū)館在向智慧服務(wù)邁進(jìn)的同時(shí),我們也要意識(shí)到:不管科技發(fā)展到什么程度,都不能完全取代現(xiàn)實(shí)的咨詢(xún)館員,在大力開(kāi)發(fā)智能機(jī)器人功能的同時(shí),也要正確處理好咨詢(xún)機(jī)器人與現(xiàn)實(shí)咨詢(xún)館員的關(guān)系,要充分發(fā)揮現(xiàn)實(shí)咨詢(xún)館員的主導(dǎo)作用與主體地位。
參考文獻(xiàn):
[1]深度學(xué)習(xí).https://baikc.baidu.com/item/深度學(xué)習(xí)/3729729?fr=aladdin
[2]張文竹,邵波.智能機(jī)器人技術(shù)在圖書(shū)館信息服務(wù)中的應(yīng)用與研究述評(píng)[J]圖.書(shū)館學(xué)研究,2018(12):2-7.
[3]郭山,智能機(jī)器人技術(shù)在公共圖書(shū)館實(shí)時(shí)參考咨詢(xún)服務(wù)中的應(yīng)用[J].圖書(shū)館學(xué)研究,2017(10):58-61.
[4]郭利敏,劉煒,吳佩娟,等,機(jī)器學(xué)習(xí)在圖書(shū)館應(yīng)用初探:以Ten-sorFlow為例[J].大學(xué)圖書(shū)館學(xué)報(bào),2017,35(6):31-40.
[5]劉婷婷,朱文東,劉廣一,基于深度學(xué)習(xí)的文本分類(lèi)研究進(jìn)展[J].電力信息與通信技術(shù),2018,16(3):1-7.
[6]唐曉波,李新星,基于人工智能的知識(shí)服務(wù)研究[J].圖書(shū)館學(xué)研究,2017(13):26-31.
[7]夏元昉,基于深度學(xué)習(xí)的問(wèn)答系統(tǒng)技術(shù)研究[D].杭州:浙江大學(xué),2017.