摘要:圖書館新媒體平臺在開展讀者服務(wù)工作中發(fā)揮著重要作用。隨著新媒體平臺中的文本數(shù)據(jù)規(guī)模不斷增大,文本處理也變得更加復(fù)雜。為了實現(xiàn)圖書館新媒體平臺短文本的智慧化管理,本文根據(jù)圖書館新媒體平臺短文本特點提出基于深度學(xué)習(xí)的短文本分類方案,使其分類具有實時性和準確性,促進館員和讀者之間的多維互動,提升圖書館創(chuàng)新服務(wù)的內(nèi)涵和水平。
關(guān)鍵詞:圖書館;新媒體平臺;深度學(xué)習(xí);短文本分類;智慧化管理
一、引言
人工智能和互聯(lián)網(wǎng)技術(shù)時代背景下,各大圖書館為適應(yīng)高校教育智慧化發(fā)展趨勢,都在積極利用云計算、虛擬化、人工智能等技術(shù)所構(gòu)建的新媒體平臺開展讀者服務(wù),使館員與讀者的溝通交流有了重要的“新橋梁”[1]。新媒體平臺的應(yīng)用提升了圖書館信息傳播的智能化水平,增強了圖書館服務(wù)效能[2-3],與此同時新媒體平臺中的文本數(shù)據(jù)規(guī)模不斷增大,文本處理也變得更加復(fù)雜[4]。如何從中有效實現(xiàn)知識檢索是圖書情報管理領(lǐng)域的重要研究課題[5]。在圖書館新媒體平臺的文本中,一個重要的內(nèi)容是讀者的問題、回復(fù)和評論[6-7]。與數(shù)字論文、數(shù)字圖書等傳統(tǒng)數(shù)字資源不同,這些文本的字數(shù)少,屬于短文本類型。及時、精確地對這些短文本進行分類,可以協(xié)助用戶檢索并準確定位所需信息,及時處理突發(fā)問題,做到以人為本,創(chuàng)新服務(wù)[8]。
文本分類問題在20世紀50年代就已被提出,其概念是將輸入的文本通過計算機的算法并基于規(guī)定的分類標準來自動化歸類的流程,包括文本預(yù)處理、特征選擇、文本表示和分類器四個環(huán)節(jié)[9]??萍伎焖侔l(fā)展使得文本數(shù)量呈現(xiàn)指數(shù)增加,文本的類型種類繁多,如長文本、專業(yè)性文本和短文本等。面對復(fù)雜的文本數(shù)據(jù),文本分類的方法在持續(xù)進步。最初的文本分類方法主要是基于詞匹配的方法,之后發(fā)展為基于知識工程的方法,再發(fā)展為基于機器學(xué)習(xí)的方法[10-11]。隨著深度學(xué)習(xí)方法[12-13]的提出,學(xué)者們發(fā)現(xiàn),與傳統(tǒng)的機器學(xué)習(xí)方法相比,在深度學(xué)習(xí)的框架下文本數(shù)據(jù)的特征更易于被提取,同時存在大量可用于訓(xùn)練的樣本數(shù)據(jù),因此深度學(xué)習(xí)方法已經(jīng)較多地用于文本分類,特別是短文本分類之中。比如,胡吉明等[14]針對政策文本具有結(jié)構(gòu)復(fù)雜多樣、信息密度大及內(nèi)涵分布不均衡等特點,提出以LDA主題模型和注意力機制為核心的方案,實現(xiàn)政策性短文本的分類;賀波等[15]分析了商品文本具有句子較短、類別規(guī)模龐大、修飾詞較多的特點,提出一種改進的深度學(xué)習(xí)的方法,提高了商品文本分類的準確性。針對SAO短文本的語法結(jié)構(gòu)完整,但表征能力有限、領(lǐng)域?qū)V感匀?、可供提取的特征少的特點,張玉潔等[16]提出一種融合語義聯(lián)想和BERT的分類方法,使得SAO短文本分類效果達到最優(yōu)。上述研究表明基于深度學(xué)習(xí)的方法,短文本分類的準確性較好,同時也表明需要根據(jù)每種短文本的特點對深度學(xué)習(xí)方法進行有針對性的改進。
本文分析圖書館新媒體平臺短文本的特點,并根據(jù)這些特點提出基于深度學(xué)習(xí)的圖書館新媒體平臺短文本分類的解決方案,以期達到較好的分類效果,旨在提升圖書館創(chuàng)新服務(wù)的內(nèi)涵和水平,實現(xiàn)圖書館新媒體平臺短文本的智慧化管理。
二、圖書館新媒體平臺短文本的特點
網(wǎng)絡(luò)技術(shù)和電子信息技術(shù)的快速發(fā)展使得各種新媒體層出不窮,發(fā)揮著創(chuàng)新服務(wù)的功能。微信、微博、各類公眾號等如雨后春筍般落戶于各大圖書館的新媒體平臺,豐富了圖書館資源,拓展了服務(wù),也激發(fā)出讀者的體驗興趣,提高讀者的閱讀效率[17]。新媒體平臺的應(yīng)用使得圖書館服務(wù)方式產(chǎn)生較大改變,依靠新媒體強大的交互、即時、海量以及共享的特性,對讀者提出的問題、回復(fù)和評論等短文本信息進行實時分類,積極開展主動服務(wù)、線上服務(wù)和泛在服務(wù),將會成為各大圖書館的常態(tài)化工作??偟膩碚f,圖書館新媒體平臺的短文本具有以下特點:
(1) 短文本字數(shù)少,整體篇幅短,且常常不遵循語法規(guī)則,沒有足夠的信息進行統(tǒng)計推斷,特征詞較少,所提供的信息量相對較少,內(nèi)容具有稀疏性。
(2) 在不同時期,會產(chǎn)生不同的網(wǎng)絡(luò)詞匯。比如,“土豪” “秋天里的奶茶” “沖鴨” “錦鯉” “土味情話”等一些詞匯,這些詞匯都表現(xiàn)出短文本所具有的獨特特征,其用詞具有新穎性。
(3) 圖書館新媒體平臺上的短文本,讀者發(fā)布的一些問題、回復(fù)和評論等是可以定期處理的,但讀者發(fā)布的意見和投訴是需要緊急處理的,如讀者預(yù)約的座位被別人占用,公共空間有讀者身體突發(fā)不適,某閱覽室中有讀者遺失了貴重物品等。由此可見,短文本分類需要有很好的實時性,以便館員及時、合理地做出相應(yīng)決策。
(4) 短文本都有著較為簡潔的內(nèi)容,沒有固定的格式,文本的長短不同,并且還有很多簡稱、諧音出現(xiàn),其格式具有不規(guī)范性。
深度學(xué)習(xí)是人工智能的重要技術(shù)之一,已經(jīng)在圖書情報領(lǐng)域有廣泛的研究,目前已應(yīng)用于用戶信息服務(wù)、圖像識別和智能機器人等方面,在數(shù)字圖書資源的分類方面也有成功應(yīng)用[18-19]。為了實現(xiàn)對圖書館新媒體平臺短文本的有效分類,以下研究基于深度學(xué)習(xí)的文本分類的一般性方案。
三、基于深度學(xué)習(xí)的文本分類的一般性方案
隨著第三次人工智能研究浪潮的到來,學(xué)術(shù)界和國際知名搜索引擎公司投入大量資源開展研發(fā),相繼提出了很多特點鮮明的深度學(xué)習(xí)網(wǎng)絡(luò)。當(dāng)前深度學(xué)習(xí)技術(shù)已經(jīng)應(yīng)用于眾多領(lǐng)域,如圖形圖像識別、語音信號處理、無人駕駛、智能機器人等,并取得了顯著的成果。
在此背景下,2013年谷歌公司首次推出一種把文本轉(zhuǎn)換為向量的開源模型,即Word2Vec模型[20]。不同于傳統(tǒng)的詞袋模型,Word2Vec模型所得到的文本具有低維度和非稀疏的特點;同時Word2Vec模型中的兩種典型結(jié)構(gòu)都考慮到上下文之間的關(guān)聯(lián),能有效分辨同義詞和多義詞,使得該模型迅速成為自然語言處理領(lǐng)域應(yīng)用最廣泛的模型,其轉(zhuǎn)換出的文本向量適合作為深度網(wǎng)絡(luò)的輸入。
盡管Word2Vec模型所表示的詞語具有低維度和非稀疏的特點,但是文本由大量詞語所組成,這樣深度網(wǎng)絡(luò)的輸入數(shù)據(jù)依然是維度很高的向量,在一些情況下還會產(chǎn)生“維度災(zāi)難”。因此,適合于文本分類的深度網(wǎng)絡(luò),對其輸入的高維度必須具有降維處理的能力[21]。在眾多的深度學(xué)習(xí)網(wǎng)絡(luò)之中,卷積神經(jīng)網(wǎng)絡(luò)有著與眾不同的特點,它的卷積層和池化層具備較好的聚合和降維特征,因此其適合用于文本分類。根據(jù)以上分析,可以獲得深度學(xué)習(xí)背景下文本分類的一般性技術(shù)方案,如圖1所示。
首先經(jīng)過文本預(yù)處理環(huán)節(jié),獲取文本特征;接著通過Word2Vec模型把文本特征轉(zhuǎn)換為文本向量;文本向量作為深度為d層的卷積神經(jīng)網(wǎng)絡(luò)的輸入,經(jīng)過卷積、池化操作將文本向量特定區(qū)域內(nèi)的相鄰向量合并為單個值,在全連接層中,一般采用經(jīng)典的神經(jīng)網(wǎng)絡(luò)算法,池化層的輸出被映射至樣本分類空間,實現(xiàn)j種不同類型文本的分類。
上述一般性技術(shù)方案提供了在深度學(xué)習(xí)背景下文本分類的基本流程,若利用該方案開展圖書館新媒體平臺短文本分類,需要考慮短文本的內(nèi)容具有稀疏性、形式具有不規(guī)范性、用詞具有新穎性的特點,以確保分類的準確性。另外,傳統(tǒng)的數(shù)字資源的篇幅長,信息量大,在中文的分詞環(huán)節(jié)所消耗的時間多。大多數(shù)情況下傳統(tǒng)的數(shù)字資源也不需要被實時分類,因此一般對于文本分類的實時性沒有特別的要求[22]。所以利用該方案開展圖書館新媒體平臺短文本分類,還應(yīng)特別考慮短文本分類需要有很好的實時性的特點。總的來說,應(yīng)根據(jù)圖書館新媒體平臺短文本的特點開展針對性的改進,使得現(xiàn)代圖書館員能夠運用人工智能技術(shù)及時獲取讀者的需求,為讀者提供主動和精準的知識服務(wù)。
四、圖書館新媒體平臺短文本分類方案
在人工智能時代,智慧圖書館以數(shù)字化、網(wǎng)絡(luò)化信息技術(shù)為基礎(chǔ),以互聯(lián)、高效、便利為主要特征,構(gòu)建以大數(shù)據(jù)為驅(qū)動的智能信息服務(wù)生態(tài)環(huán)境,提供人機交互的智能化知識服務(wù)工作。為了提高圖書館新媒體平臺短文本分類的準確性,確保短文本分類的實時性,改進深度學(xué)習(xí)背景下文本分類的一般性方案,提出適用于圖書館新媒體平臺短文本分類的方案。
(一)利用知識庫的短文本預(yù)處理改進
傳統(tǒng)數(shù)字資源的文本預(yù)處理包括分詞、剔除無具體意義的詞和特征提取等環(huán)節(jié),利用jieba分詞、中國科學(xué)院ICTCLAS軟件可以獲得被處理為分割的、簡潔的詞語,以更好地表示文本特征。
由于圖書館新媒體平臺短文本的內(nèi)容具有稀疏性,其用詞具有新穎性,且常常不遵循語法規(guī)則,沒有足夠的信息進行統(tǒng)計推斷,傳統(tǒng)的文本預(yù)處理方法不易提取其文本特征[23]。經(jīng)過實驗統(tǒng)計發(fā)現(xiàn),短文本中的謂詞、形容詞等成分為短文本的分類提供了重要的依據(jù)。由于知識庫中包含了基本事實、規(guī)則、常識等知識,是由相關(guān)領(lǐng)域?qū)<姨峁┑?,同時知識庫中的知識具有有序化、易利用的特點,便于進行有關(guān)領(lǐng)域知識的采集、整理和提取,因此可以利用知識庫對文本進行適當(dāng)擴展。具體來說,利用知識庫對短文本進行概念化,并將概念化結(jié)果與相關(guān)成分向量表示進行組合,由此計算組合后文本與原短文本的語義相似度,最終將組合后文本標注為與之相似程度最高的樣本的類別。最后利用分詞軟件獲得短文本特征,由此改進文本預(yù)處理環(huán)節(jié)。如圖2所示。
圖2中,知網(wǎng)和Word Net屬于人工整理的知識庫,是由相關(guān)領(lǐng)域?qū)<覙?gòu)建,可信度很高,可以確保短文本特征擴展的準確性。但是知網(wǎng)和Word Net相對更新速度較慢,內(nèi)容涵蓋不夠全面,不能很好地解釋新穎的網(wǎng)絡(luò)詞語??紤]到維基百科和百度百科等是由互聯(lián)網(wǎng)大規(guī)模真實文本構(gòu)成的,由全世界的開發(fā)者進行實時更新,并被全世界的使用者監(jiān)督,同時它們包含了復(fù)雜的鏈接結(jié)構(gòu),所以同時需要利用維基百科等互聯(lián)網(wǎng)知識庫識別新穎性的網(wǎng)絡(luò)詞語,對短文本進行擴展。
由上述分析可知,根據(jù)短文本的原有特征詞,再利用知識庫對其進行適當(dāng)擴展,可以有效處理短文本內(nèi)容稀疏性、用詞新穎性的問題。
(二)短文本分類實時性的提高
為確保短文本分類的實時性,經(jīng)Word2Vec模型轉(zhuǎn)換獲得的文本向量維度越小越好。當(dāng)傳統(tǒng)數(shù)字資源轉(zhuǎn)換時,Word2Vec模型的參數(shù)通常取默認值。比如詞向量的維度,其默認值一般是100,而跳躍窗口(當(dāng)前詞與其前后詞之間聯(lián)系的參數(shù))的默認值一般在10以內(nèi)。
由于短文本的長度短,因此詞向量維度的設(shè)置值可以大大減小;同時短文本的表達形式精簡,當(dāng)前詞與上下文之間的聯(lián)系程度不如傳統(tǒng)數(shù)字資源密切,因此跳躍窗口的值可以取很小或不取值。
通過優(yōu)化Word2Vec模型的參數(shù)設(shè)置,可以使短文本向量的維度減小,根據(jù)圖1可知,卷積神經(jīng)網(wǎng)絡(luò)輸入的維度也就減小了。由于短文本中相鄰詞聯(lián)系緊密,而距離遠的詞之間的關(guān)聯(lián)很弱。因此神經(jīng)元沒有必要感知全局輸入,只需與上層的部分神經(jīng)元相連接[24],如圖3所示。
圖3中,設(shè)短文本向量中包含n個獨立的詞,每個詞向量是m維,那么輸入端的維度是n×m維。為簡化表示,取輸入端為6維,第二層為3個節(jié)點,第三層為2個節(jié)點。在連接方式上,第二層的每個節(jié)點只與輸入端的2個節(jié)點相連接,第三層的每個節(jié)點只與第二層端的2個節(jié)點相連接。因此根據(jù)短文本的特點,采用這種局部連接的方法,可以有效降低卷積神經(jīng)網(wǎng)絡(luò)的計算量。
另外,考慮到短文本數(shù)據(jù)在各個局部之間具有共性特征,即在一部分學(xué)習(xí)到的特征同時能應(yīng)用到另一部分上。因此在短文本分類時,可以讓卷積神經(jīng)網(wǎng)絡(luò)的多個局部連接共享相同的權(quán)值,如圖3中的權(quán)值w1,w2,w3,w4都被多個連接所共享,可以繼續(xù)降低卷積神經(jīng)網(wǎng)絡(luò)的計算量。
根據(jù)上述分析可知,通過優(yōu)化Word2Vec模型的參數(shù)設(shè)置,并且引入局部權(quán)值連接和權(quán)值共享的改進思想,將有效減少參數(shù)數(shù)量,使運算變得簡潔、高效,確保短文本分類的實時性。
(三)短文本格式不規(guī)范性問題的解決方法
傳統(tǒng)數(shù)字資源文本分類模型的池化層多數(shù)采用最大池化法。但由于圖書館新媒體平臺短文本的格式具有不規(guī)范性,最大池化法可能會使得特征項的位置信息丟失。同時短文本中的強特征只會出現(xiàn)一次,導(dǎo)致丟失特征頻次信息,使得短文本分類的準確性降低。最后,由于短文本的長度不一,所對應(yīng)的文本向量維度不同,因此利用最大池化法,輸出特征的維度也不同。為把這些特征輸入后續(xù)的卷積層,常采用補零的方法使其維度相同,這種操作會給短文本分類帶來一些不確定性。
動態(tài)K最大池化法的思想是設(shè)置得分值,抽取濾波器中得分大于得分值的元素作為特征值[25]。由于短文本信息量少,采用動態(tài)K最大池化法,不僅可以使較多有用的特征信息保留下來,很好地保留特征值之間的相對位置信息,而且可以有效表示同一類特征出現(xiàn)多次的情形,這樣某些重要特征的強度就可以被表達出來。另外,動態(tài)K最大池化法所輸出的特征維度都是相同的維度,這就有效地避免了短文本長短不一帶來的影響,避免了對文本矩陣補零操作,減小了文本噪聲,使得池化層輸出更加準確。綜上所述,改進文本分類模型的池化層的常用方法,采用動態(tài)K最大池化法,可以有效處理短文本格式不規(guī)范性的問題,提高圖書館新媒體平臺短文本分類的準確性。
(四)應(yīng)用效果
根據(jù)圖書館新媒體平臺上短文本的特點,把短文本的類型分為五類。(1)問題求助類:讀者提問、求助、咨詢等方面的短文本。(2)閱讀交流類:讀者交流閱讀經(jīng)驗、心得等方面的短文本。(3)情感表達類:表達讀者的情感、情感疏導(dǎo)、心理健康等方面的短文本。(4)學(xué)習(xí)分享類:與讀者學(xué)習(xí)有關(guān)的,如學(xué)習(xí)目標、心得、困惑等方面的短文本。(5)突發(fā)事件類:需要第一時間處理的,如讀者身體不適,讀者發(fā)生矛盾,水電安全隱患等短文本。
利用數(shù)千條圖書館新媒體平臺的短文本組成數(shù)據(jù)集,通過人工標注的方法給出每個短文本相應(yīng)的分類標簽。把數(shù)據(jù)集的80%作為訓(xùn)練集,20%作為測試集,利用一般文本分類方案和本文提出的方案分別對文本分類效果進行測試,本文提出方案的訓(xùn)練時間小于一般文本分類方案;本文提出方案的準確率為93.5%,而一般文本分類方案準確率為90.8%,表明本文提出的方案是有效的,有利于實現(xiàn)對圖書館新媒體平臺短文本的智慧化管理。
五、結(jié)語
圖書館新媒體平臺是圖書館移動服務(wù)、用戶互動的重要形式。在各種媒體融合環(huán)境下,依托圖書館新媒體平臺功能,高校圖書館應(yīng)及時關(guān)注讀者發(fā)送的問題、回復(fù)和評論等短文本信息,對其進行及時和精準的分類。
在第三次人工智能研究和應(yīng)用的浪潮中,智慧圖書館及其服務(wù)體系是圖書館界革新式發(fā)展的目標,深度學(xué)習(xí)的方法在圖書情報領(lǐng)域有較多應(yīng)用,是處理文本分類的一種有效方法。根據(jù)圖書館新媒體平臺短文本的特點,需針對基于深度學(xué)習(xí)文本分類的一般性方案開展三個方面的改進: (1) 利用知識庫改進文本預(yù)處理環(huán)節(jié),適應(yīng)短文本的內(nèi)容具有稀疏性和用詞具有新穎性的特點;(2) 優(yōu)化Word2Vec模型的參數(shù)設(shè)置,減小卷積神經(jīng)網(wǎng)絡(luò)的計算量,確保短文本分類的實時性;(3) 采用動態(tài)K最大池化方法,處理短文本格式不規(guī)范性的問題。
通過改進,可使圖書館新媒體平臺短文本分類具有實時性,提高分類的準確性,使相關(guān)館員更快而又合理地做出相應(yīng)的決策,促進館員和讀者之間的多維互動,提升圖書館創(chuàng)新服務(wù)的內(nèi)涵和水平,有利于實現(xiàn)對圖書館新媒體平臺短文本的智慧化管理。
參考文獻:
[1]張春麗. 基于新媒體平臺的高校圖書館讀者服務(wù)優(yōu)化研究[J]. 河南圖書館學(xué)刊,2020,40(9):58-60.
[2]劉勁節(jié), 于洪洋, 常盛. 基于新媒體平臺的公共圖書館閱讀推廣社會合作模式: 以長春市圖書館為例[J]. 圖書館學(xué)研究,2020(24):59-63.
[3]呂美霞, 王磊. 高校圖書館與公共圖書館微信公眾平臺比較研究[J]. 圖書情報工作,2019,63(13):52-65.
[4]程雅倩, 黃瑋, 金曉祥, 等. 5G環(huán)境下高校圖書館自媒體平臺多標簽文本分類方法研究[J]. 情報科學(xué),2022,40(2):155-161.
[5]劉愛琴, 馬小寧. 基于概率主題模型的短文本自動分類系統(tǒng)構(gòu)建[J]. 國家圖書館學(xué)刊,2020,29(6):102-112.
[6]王鑫. “雙一流”高校圖書館信息素養(yǎng)教育平臺建設(shè)現(xiàn)狀及發(fā)展策略研究[J]. 圖書館研究,2021,51(1):86-91.
[7]李愛明, 吳珣. 新型冠狀病毒肺炎疫情背景下公共圖書館健康信息服務(wù)研究: 以湖北省十二所地級市公共圖書館微信公眾平臺健康信息服務(wù)為例[J]. 大學(xué)圖書情報學(xué)刊,2020,38(6):23-26.
[8]黃雨生. 基于讀者需求的圖書館新媒體服務(wù)內(nèi)容評價體系構(gòu)建[J]. 圖書情報導(dǎo)刊,2022,7(1):1-7.
[9]徐菲菲, 陳賽紅. 中文文本主題聚類算法研究綜述[J]. 上海電力大學(xué)學(xué)報,2021,37(6):613-619.
[10]杜思佳, 于海寧, 張宏莉. 基于深度學(xué)習(xí)的文本分類研究進展[J]. 網(wǎng)絡(luò)與信息安全學(xué)報,2020,6(4):1-13.
[11]劉紅光, 馬雙剛, 劉桂鋒. 基于機器學(xué)習(xí)的專利文本分類算法研究綜述[J]. 圖書情報研究,2016,9(3):79-86.
[12]HINTON G E, SALAKHUTDINOV R R. Reducing the dimensionality of data with neural networks[J]. Science,2006,313:504-507.
[13]ZHANG X, ZHAO J B, LECUN Y. Character-level Convolutional Networks for Text Classification[C]//Proceedings of the 28th International Conference on Neural Information Processing Systems, Montreal, Canada: MIT Press, 2015: 649–657.
[14]胡吉明, 付文麟, 錢瑋, 等. 融合主題模型和注意力機制的政策文本分類模型[J]. 情報理論與實踐,2021,44(7):159-165.
[15]賀波, 馬靜, 李馳. 基于融合特征的商品文本分類方法研究[J]. 情報理論與實踐,2020,43(11):162-168.
[16]張玉潔, 白如江, 劉明月, 等. 融合語義聯(lián)想和BERT的圖情領(lǐng)域SAO短文本分類研究[J]. 圖書情報工作,2021,65(16):118-129.
[17]王微. 圖書館自媒體平臺咨詢服務(wù)優(yōu)化探究[J]. 四川圖書館學(xué)報,2021(6):73-77.
[18]徐彤陽, 尹凱. 基于深度學(xué)習(xí)的數(shù)字圖書館文本分類研究[J]. 情報科學(xué),2019,37(10):13-19.
[19]李建偉. 基于深度學(xué)習(xí)的智慧圖書館智能信息服務(wù)系統(tǒng)研究[J]. 圖書館學(xué)刊,2019,41(1):116-121.
[20]MIKOLOV T, SUTSKEVER I, CHEN K, et al. Distributed Representations of Words and Phrases and their Composition-ality[C]//Proceedings of the 26th International Conference on Neural Information Processing Systems, Lake Tahoe, USA: MIT Press, 2013: 3111-3119.
[21]奉國和, 鄭偉. 文本分類特征降維研究綜述[J]. 圖書情報工作,2011,55(9):109-113.
[22]何力, 鄭灶賢, 項鳳濤, 等. 基于深度學(xué)習(xí)的文本分類技術(shù)研究進展[J]. 計算機工程,2021,47(2):1-11.
[23]沈煒域, 劉奇飛. 利用概念化的少樣本短文本分類研究[J]. 情報探索,2018(12):5-9.
[24]PHIL KIM. 深度學(xué)習(xí): 基于MATLAB的設(shè)計實例[M]. 北京: 北京航空航天大學(xué)出版社, 2018.
[25]袁銘陽, 周長勝, 黃宏博, 等. 卷積神經(jīng)網(wǎng)絡(luò)池化方法綜述[J]. 軟件工程與應(yīng)用,2020,9(5):13.