• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于權(quán)重詞向量與改進(jìn)TextCNN的中文新聞分類

    2023-09-15 03:34:06黃樹成
    軟件導(dǎo)刊 2023年9期
    關(guān)鍵詞:注意力語義卷積

    萬 錚,王 芳,黃樹成

    (江蘇科技大學(xué) 計(jì)算機(jī)學(xué)院,江蘇 鎮(zhèn)江 212114)

    0 引言

    文本分類是自然語言處理領(lǐng)域的一項(xiàng)基礎(chǔ)且重要的任務(wù),在新聞推薦、搜索引擎、垃圾郵件檢測(cè)等方面都有著重要應(yīng)用。盡管文本分類已經(jīng)有著多年的發(fā)展歷史,但仍存在著一些不足之處。目前文本分類仍是自然語言處理領(lǐng)域研究的一個(gè)熱點(diǎn)問題。文本分類是指通過一定的算法,給輸入的文本分配一個(gè)或多個(gè)預(yù)先設(shè)定好的標(biāo)簽[1]。若只為每個(gè)文本分配一個(gè)標(biāo)簽,則稱為單標(biāo)簽文本分類;若為每個(gè)文本分配一個(gè)及以上的標(biāo)簽,則稱為多標(biāo)簽文本分類。

    隨著信息技術(shù)的快速發(fā)展,人們進(jìn)入了一個(gè)信息爆炸的時(shí)代,互聯(lián)網(wǎng)已經(jīng)成為人們?nèi)粘I钪蝎@取信息的主要途徑之一。其中絕大部分信息都是以文本形式存在的,面對(duì)著鋪天蓋地的文本信息,光靠人力維護(hù)是不可能的。那么如何通過機(jī)器自動(dòng)將這些文本信息進(jìn)行分類以方便人們更好地獲取,成為當(dāng)下的一個(gè)研究難題。人們最先把機(jī)器學(xué)習(xí)方法用于文本分類,如改進(jìn)的TF-IDF、支持向量機(jī)[2]、樸素貝葉斯[3]等。傳統(tǒng)的機(jī)器學(xué)習(xí)分類方法將整個(gè)文本分類問題拆分成特征工程和分類器兩部分。特征工程分為文本預(yù)處理、特征提取、文本表示3 部分,最終目的是把文本轉(zhuǎn)換成計(jì)算機(jī)可理解的數(shù)字,并封裝足夠用于分類的信息,再進(jìn)行分類[4]。雖然這些方法在一定程度上解決了文本分類問題,但仍存在著一些弊端。這些方法過于依賴人工設(shè)計(jì)的特征,并且對(duì)于文本的表示還存在數(shù)據(jù)稀疏和特征向量緯度過高的問題,對(duì)于網(wǎng)絡(luò)新聞中出現(xiàn)的大量新詞不能很好地表示其語義特征。

    隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)展,涌現(xiàn)出越來越多性能良好的深度學(xué)習(xí)模型。這些模型不僅能很好地解決傳統(tǒng)機(jī)器學(xué)習(xí)方法存在的數(shù)據(jù)稀疏和特征向量維度過高的問題,而且準(zhǔn)確度也明顯提升。但是單一的深度學(xué)習(xí)模型也有其局限性,如TextCNN 只關(guān)注到了局部信息,而往往會(huì)忽略掉全局語義,造成分類效果不佳。基于此,本文提出一種混合多神經(jīng)網(wǎng)絡(luò)的BA-InfoCNN-BiLSTM 模型。

    1 相關(guān)工作

    若想要讓計(jì)算機(jī)處理語句或文檔,首先需要將這些語句或文檔轉(zhuǎn)換成數(shù)字,將字或詞轉(zhuǎn)換為向量的過程稱為詞嵌入。最開始采用One-Hot 編碼,用于判斷文本中是否具有該詞語。后來發(fā)展成根據(jù)詞語在文本中的分布情況對(duì)詞進(jìn)行表示。近年來,隨著深度學(xué)習(xí)的發(fā)展,直接推動(dòng)了詞嵌入技術(shù)的變革,使得分布式的詞語表達(dá)得到了大量使用。分布式表示可以克服獨(dú)熱表示的缺點(diǎn),解決了詞匯表示與位置無關(guān)的問題。分布式表示通過計(jì)算向量之間的距離(歐氏距離、余弦距離)體現(xiàn)詞與詞之間的相似性。Bengio 等[5]最早使用神經(jīng)網(wǎng)絡(luò)來構(gòu)建語言模型。2013 年,Mikolov 等[6]提出一種淺層神經(jīng)網(wǎng)絡(luò)概模型Word2Vec,其包括Continuous Bag-of-Words[7]和 Skip-Gram[8]兩種模型訓(xùn)練方法,通過分布式假設(shè)(如果兩個(gè)詞的上下文是相似的,其語義也是相似的)直接學(xué)習(xí)詞的詞向量,同時(shí)為了減少輸出層的計(jì)算量,使用層次softmax 和負(fù)采樣對(duì)其進(jìn)行優(yōu)化。但該方式只考慮了文本的局部信息,未能有效利用整體信息。針對(duì)此問題,Pennington 等[9]提出全局詞向量(Global Vectors,Glove)模型,同時(shí)考慮了文本的局部信息與整體信息。但無論是Word2Vec 還是Glove,本質(zhì)上都是一種靜態(tài)的詞嵌入方式,無法解決一詞多義的問題。2018年,谷歌提出的BERT 模型解決了一詞多義的問題[10]。BERT 模型通過聯(lián)合調(diào)節(jié)所有層中的左右上下文來預(yù)訓(xùn)練未標(biāo)記的文本深度雙向表示,此外還通過組裝長(zhǎng)句作為輸入,增強(qiáng)了對(duì)長(zhǎng)距離語義的理解。

    在捕獲文本特征方面,Hochreiter 等[11]提出的長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)解決了梯度爆炸和梯度消失問題;Kalchbrenner 等[12]提出動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)模型處理長(zhǎng)度不同的文本,將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于NLP;Kim[13]提出文本分類模型TextCNN,該模型結(jié)構(gòu)更簡(jiǎn)單,利用多個(gè)大小不同的卷積核提取文本中的特征,然后對(duì)這些不同粒度的特征進(jìn)行池化操作,從而得到更準(zhǔn)確的局部特征;陳珂等[14]利用多通道卷積神經(jīng)網(wǎng)絡(luò)模型,從多方面的特征表示學(xué)習(xí)輸入句子的文本信息;Long 等[15]將雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)與多頭注意力機(jī)制相結(jié)合對(duì)社交媒體文本進(jìn)行分類,克服了傳統(tǒng)機(jī)器學(xué)習(xí)中的不足。本文在前人研究的基礎(chǔ)上,通過融入前文信息對(duì)傳統(tǒng)的TextCNN 作出了改進(jìn)。

    2 模型設(shè)計(jì)

    本文提出的BA-InfoCNN-BiLSTM 模型通過在詞嵌入層后加入注意力機(jī)制進(jìn)行殘差連接來提升重要詞的比重,再通過改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)與雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)分別提取局部和全局特征,最后將特征進(jìn)行融合后用于分類。模型整體結(jié)構(gòu)如圖1 所示,由輸入層、BERT 嵌入層、權(quán)重詞向量層、改進(jìn)的卷積層、雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)層和輸出層組成。

    Fig.1 BA-InfoCNN-BiLSTM model structure圖1 BA-InfoCNN-BiLSTM 模型結(jié)構(gòu)

    2.1 詞嵌入層

    本模型嵌入層的目的是將文本轉(zhuǎn)化為詞向量,首先需要解決的問題就是分詞。對(duì)于英文文本,單詞與單詞之間本就以空格隔開,所以英文文本不需要進(jìn)行額外的分詞操作。與英文文本不同的是,中文文本是由字構(gòu)成,字本身就可以表達(dá)出一定的含義,而字與字之間又可以組成詞,表達(dá)出新的語義。如今兩種比較流行的分詞方式是:一是像英文文本分詞那樣,以字為粒度,直接將文本中的字映射為一個(gè)向量,這種做法雖然方便,但是往往會(huì)割裂文本中字與字所組成的詞的意思;二是利用像Jieba 這樣的分詞工具先對(duì)文本進(jìn)行分詞,再將得到的詞轉(zhuǎn)化為詞向量,但這種方式存在著更嚴(yán)重的弊端,因?yàn)榉衷~的好壞會(huì)在很大程度上影響最后的分類結(jié)果。

    如今的分詞工具對(duì)于陌生詞的分詞效果較差,在專業(yè)名詞上更是嚴(yán)重依賴于用戶構(gòu)建的詞典,并且對(duì)長(zhǎng)詞的分詞效果較差。而新聞標(biāo)題中往往會(huì)產(chǎn)生大量新詞,嚴(yán)重影響分詞的正確性,從而干擾最后的分類效果。因此,模型使用基于字粒度的詞嵌入方式來彌補(bǔ)該弊端。BERT 的中文版本正是以字為單位進(jìn)行嵌入的,十分適合作為嵌入層。BERT 的兩大功能分別是預(yù)訓(xùn)練和微調(diào)。預(yù)訓(xùn)練有兩大任務(wù):一是掩碼語言模型,即隨機(jī)遮掩一部分詞,然后讓模型預(yù)測(cè)這些詞;二是下一句預(yù)測(cè),即判斷兩個(gè)句子之間是否有上下文關(guān)系來增強(qiáng)模型對(duì)句子的理解能力。微調(diào)則是在進(jìn)行下游任務(wù)時(shí),模型不斷調(diào)整其參數(shù)的過程,但由于BERT 的結(jié)構(gòu)是由12 個(gè)Transformer 編碼器構(gòu)成,計(jì)算量較大,十分消耗時(shí)間,所以本實(shí)驗(yàn)過程中并沒有選擇進(jìn)行微調(diào),而只是使用在大規(guī)模語料上預(yù)訓(xùn)練過的BERT 模型參數(shù)完成字到詞向量的轉(zhuǎn)換。設(shè)有文本T={t1,t2,t3...tn},文本長(zhǎng)度為n,將其送入BERT 模型,得到該文本的詞向量矩陣E={e1,e2,e3...en}。矩陣大小是n*d,其中d 是每個(gè)字的維度。然后將BERT 生成的矩陣E作為注意力層的輸入。

    2.2 權(quán)重詞向量層

    本模型在BERT 之后引入注意力機(jī)制。注意力機(jī)制最早是由Bahdanau 等提出的,用于模擬人腦的注意力模型,最早用于圖像處理方面。Vaswani 等[16]提出的Transformer便是基于自注意力機(jī)制獲得單詞間的長(zhǎng)距離依賴關(guān)系。本模型之所以在嵌入層后引入注意力機(jī)制,是由于在嵌入層中只使用了BERT 在其他語料上預(yù)訓(xùn)練得到的詞向量。但是為了避免大量運(yùn)算,在實(shí)驗(yàn)過程中并沒有進(jìn)行微調(diào),沒有發(fā)揮BERT 中自注意力機(jī)制的作用,而在新的語義環(huán)境中,每個(gè)詞在新聞標(biāo)題中的重要程度也會(huì)有所不同。所以在得到詞向量之后,需要通過注意力機(jī)制對(duì)字詞權(quán)重重新進(jìn)行分配,以體現(xiàn)不同詞對(duì)文本全局語義特征的重要程度。注意力分?jǐn)?shù)計(jì)算如式(1)所示。其中,Wa是可訓(xùn)練參數(shù),ba是偏置項(xiàng),tanh 是激活函數(shù),va是可學(xué)習(xí)的上下文向量。at是經(jīng)過softmax 函數(shù)后得到的ei的權(quán)重(見式(2)),然后將每個(gè)詞向量加權(quán)后進(jìn)行殘差連接得到si(見式(3)),最后將得到加權(quán)的詞嵌入矩陣S={s1,s2,s3...sn}分別送入改進(jìn)的卷積層和Bi-LSTM 層。

    2.3 改進(jìn)的卷積層

    在注意力機(jī)制之后引入改進(jìn)的TextCNN 來提升模型對(duì)特征的捕捉能力。TextCNN 能夠通過使用不同大小的卷積核實(shí)現(xiàn)對(duì)N-Gram 特征的提取,從而獲取到不同層級(jí)的語義特征。但其短板是TextCNN 通過卷積只能獲得文本的局部依賴關(guān)系,而忽視了遠(yuǎn)距離語義的影響。所以針對(duì)該問題,本模型對(duì)TextCNN 的卷積層進(jìn)行了一些改進(jìn)。從整體上而言,對(duì)語義的理解是以從左到右的順序進(jìn)行的,所以進(jìn)行卷積操作的詞之前的文本信息是十分重要的。為解決TextCNN 只關(guān)注局部信息的問題,在進(jìn)行卷積操作的過程中,通過不斷融入前文信息來提升模型性能。InfoCNN 過程如圖2所示。

    Fig.2 InfoCNN process圖2 InfoCNN過程

    首先根據(jù)詞向量矩陣S={s1,s2,s3...sn}生成其前文語義矩陣R={r0,r1,r2...rn},如式(4)所示:

    其中,r0為零向量,然后用全連接層進(jìn)行降維,得到前文信息向量G={g0,g1,g2...gn}。接著再用窗口大小為2、3、4 的卷積核W 進(jìn)行卷積操作,每次卷積操作得到特征ci,提取局部特征的公式如式(5)所示:

    其中,h為卷積核Wh滑動(dòng)窗口的大小,卷積核Wh的大小是h*d,d是詞向量維度。Si:i+h-1為從S中第i行到i+h-1行的局部文本矩陣,bh為偏置項(xiàng),f代表非線性激活函數(shù)。最后,結(jié)合提取的局部特征和前文信息特征,最終得到的卷積結(jié)果ui如式(6)所示:

    最后,在得到的結(jié)果U中,采用最大值池化策略獲取每個(gè)通道的最大值,將這些值送入最后的輸出層。

    2.4 BiLSTM 層

    由于循環(huán)神經(jīng)網(wǎng)絡(luò)特別適合處理序列數(shù)據(jù),已被成功應(yīng)用于自然語言處理等眾多時(shí)序問題中。為了能有效解決傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)的梯度消失或爆炸問題,本模型使用Bi-LSTM 對(duì)BERT 和注意力機(jī)制得到的權(quán)重詞向量矩陣進(jìn)行特征提取。長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。

    Fig.3 LSTM structure圖3 LSTM 結(jié)構(gòu)

    該網(wǎng)絡(luò)有3 個(gè)門:一是遺忘門,用來控制上一時(shí)刻Ct-1保存到當(dāng)前時(shí)刻Ct的特征信息,如式(7)所示;二是輸入門,其控制了此時(shí)網(wǎng)絡(luò)的輸入Xt保存到當(dāng)前時(shí)刻Ct的特征信息,計(jì)算方式如式(8)、式(9)所示;三是輸出門,用來控制當(dāng)前時(shí)刻Ct的輸出值Yt,計(jì)算方式如式(10)—式(12)所示:

    但由于長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)當(dāng)前時(shí)刻的輸出信息是由前一時(shí)刻的輸出信息和當(dāng)前時(shí)刻的輸入信息共同決定的,即當(dāng)前時(shí)刻的輸出信息只考慮了該時(shí)刻與該時(shí)刻之前的信息,而沒有考慮該時(shí)刻之后的信息,沒有充分利用上下文信息。為了解決這一問題,Graves 等[17]提出雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)。雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)通過正向和逆向的LSTM 獲得第t時(shí)刻正向隱藏層狀態(tài)向量Ylt與逆向隱藏層狀態(tài)向量Yrt,并將Ylt和Yrt拼接起來作為最終的隱藏層狀態(tài)向量Yt,該向量包含了上下文信息。計(jì)算方式如式(13)所示:

    2.5 輸出層

    模型最后的輸出層是把改進(jìn)的卷積層得到的結(jié)果與Bi-LSTM 層得到的結(jié)果進(jìn)行拼接融合,然后引入全連接層進(jìn)行降維,之后用Dropout 方法讓降維后的特征向量以一定的概率失活,從而避免出現(xiàn)過擬合現(xiàn)象。最后送入softmax函數(shù)[18]進(jìn)行分類,得到最終的預(yù)測(cè)結(jié)果。

    3 實(shí)驗(yàn)與分析

    3.1 實(shí)驗(yàn)數(shù)據(jù)集

    為了驗(yàn)證本模型在新聞主題文本分類任務(wù)上的有效性,本文使用兩個(gè)以新聞為主題的數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),如表1所示。

    Table 1 Data set information表1 數(shù)據(jù)集信息

    (1)新浪新聞數(shù)據(jù)集。新浪新聞數(shù)據(jù)集中的數(shù)據(jù)來自于新浪新聞2018—2022 年間產(chǎn)生的新聞標(biāo)題。通過收集這些新聞標(biāo)題,然后經(jīng)反復(fù)篩選壓縮及過濾后,整理生成新浪新聞數(shù)據(jù)集。該數(shù)據(jù)集共包含20 萬條短文本,分為電子競(jìng)技、地產(chǎn)、體育、股市、科學(xué)、財(cái)經(jīng)、時(shí)事、教育、政治、明星10個(gè)類別,每類包含2萬條數(shù)據(jù)。

    (2)搜狐新聞數(shù)據(jù)集。通過網(wǎng)絡(luò)開源搜狐新聞數(shù)據(jù)集進(jìn)行數(shù)據(jù)清洗,去除部分缺少標(biāo)簽的數(shù)據(jù),并去除新聞內(nèi)容,只保留新聞主題。數(shù)據(jù)集包含旅游、電子競(jìng)技、地產(chǎn)、軍事、體育、股市、科學(xué)、財(cái)經(jīng)、時(shí)事、教育、政治、明星共 12個(gè)類別。

    3.2 實(shí)驗(yàn)設(shè)置

    (1)實(shí)驗(yàn)環(huán)境。本實(shí)驗(yàn)在PyCharm 上進(jìn)行代碼編寫,編程語言選擇Python 3.7 版本,深度學(xué)習(xí)框架選擇Pytorch 1.1 版本,CPU 型號(hào)為AMD EPYC 7302 16-Core Processor,內(nèi)存為252GB,GPU 型號(hào)為GeForce RTX 3080,顯存為10GB。

    (2)實(shí)驗(yàn)參數(shù)。由于模型使用BERT 的中文版本進(jìn)行詞嵌入,所以詞向量的維度設(shè)為768。卷積層中使用3 種大小不同的二維卷積核,卷積核的高度分別為2、3 和4,卷積核寬度與詞向量維度相同,每種卷積核的數(shù)量為256。BiLSTM 層中的隱藏單元個(gè)數(shù)為128,dropout 的參數(shù)大小設(shè)置為0.1。每次訓(xùn)練的批次batch_size 大小為128,學(xué)習(xí)率大小為0.000 5,每句話的最大長(zhǎng)度為32,epoch 數(shù)為3。

    3.3 實(shí)驗(yàn)結(jié)果與分析

    本文將BA-InfoCNN-BiLSTM 模型與當(dāng)前較流行的幾種分類方法進(jìn)行了比較。

    (1)TextCNN。由Kim[13]提出的TextCNN 在CNN 概念的基礎(chǔ)上,讓卷積核寬度與詞向量維度保持一致進(jìn)行特征提取,然后拼接最大值池化后的特征,最后送入softmax 函數(shù)進(jìn)行分類。

    (2)TextRNN。由Liu[19]提出的TextRNN 在LSTM 概念的基礎(chǔ)上,取單向LSTM 最后一個(gè)時(shí)間步的隱藏層狀態(tài)向量作為新聞標(biāo)題的語義表示,然后將該向量送入softmax 函數(shù)中進(jìn)行分類。

    (3)DPCNN。由Johnson 等[20]提出的一種通過增加卷積神經(jīng)網(wǎng)絡(luò)的深度來獲取長(zhǎng)距離語義關(guān)系的模型。

    (4)FastText。Facebook 于2016 年開源的一種文本分類方法,F(xiàn)astText 在保證與CNN 和RNN 等深層網(wǎng)絡(luò)同等準(zhǔn)確率的基礎(chǔ)上,提升了訓(xùn)練速度。

    (5)Att-BiLSTM。通過在雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)后引入注意力機(jī)制,對(duì)雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)提取的特征分配不同權(quán)重,從而突出重要詞的作用。

    (6)BERT。BERT 是一個(gè)多層雙向的Transformer Encoder 模型,主要分為兩個(gè)階段:預(yù)訓(xùn)練和微調(diào)。在預(yù)訓(xùn)練階段,模型會(huì)在大量沒有標(biāo)注的語料上進(jìn)行訓(xùn)練;在微調(diào)階段,模型會(huì)對(duì)預(yù)訓(xùn)練得到的參數(shù)進(jìn)行初始化,然后在進(jìn)行下游任務(wù)過程中對(duì)參數(shù)進(jìn)行調(diào)整。

    本文使用準(zhǔn)確率作為評(píng)估指標(biāo),實(shí)驗(yàn)結(jié)果如表2、圖4所示。

    Table 2 Accuracy表2 準(zhǔn)確率 %

    Fig.4 Experimental results圖4 實(shí)驗(yàn)結(jié)果

    BA-InfoCNN-BiLSTM 模型在新浪新聞數(shù)據(jù)集和搜狐新聞數(shù)據(jù)集上分別獲得了95.07%與84.95%的準(zhǔn)確率。與前6 個(gè)模型相比,BA-InfoCNN-BiLSTM 模型取得了最好的效果。與6 個(gè)模型中效果最好的Bert 模型相比,BA-Info-CNN-BiLSTM 模型在新浪新聞數(shù)據(jù)集上的準(zhǔn)確率提升了0.66%,在搜狐新聞數(shù)據(jù)集上的準(zhǔn)確率提升了0.71%,從而證明了BA-InfoCNN-BiLSTM 模型通過在詞嵌入后加入注意力機(jī)制補(bǔ)充詞的重要程度,再分別捕獲多粒度下的局部信息和全局語義信息,可以有效提升模型的準(zhǔn)確率。

    3.4 消融實(shí)驗(yàn)

    為了驗(yàn)證BA-InfoCNN-BiLSTM 模型中不同組件對(duì)于模型的有效性,本文通過消融實(shí)驗(yàn)進(jìn)行驗(yàn)證。BA-BiLSTM為原模型中去掉了改進(jìn)TextCNN 層的模型,僅將BiLSTM最后一個(gè)時(shí)間步的隱藏狀態(tài)向量作為全局語義特征用于分類輸出。BERT-InfoCNN-BiLSTM 為原模型中去掉了注意力機(jī)制的模型,在嵌入層后使用改進(jìn)的TextCNN 層和BiLSTM 層分別捕捉局部與全局特征,將兩種特征融合后輸出。BA-InfoCNN 為原模型中去掉了BiLSTM 層的模型,使用改進(jìn)的TextCNN 層捕捉多個(gè)粒度下的局部語義特征并將其用于分類,同時(shí)將輸出改為直接輸出。BA-CNNBiLSTM 為了去掉原模型中對(duì)TextCNN 的改進(jìn)部分,使用融合后的結(jié)果用于分類。消融實(shí)驗(yàn)結(jié)果如表3所示。

    Table 3 Ablation experiment results表3 消融實(shí)驗(yàn)結(jié)果 %

    首先將BA-BiLSTM 的實(shí)驗(yàn)結(jié)果與本文提出的BA-InfoCNN-BiLSTM(以下簡(jiǎn)稱BAIB)進(jìn)行對(duì)比,在兩個(gè)數(shù)據(jù)集上BAIB 的效果都明顯優(yōu)于BA-BiLSTM,說明提取局部信息對(duì)分類結(jié)果有一定影響。將BA-InfoCNN 的實(shí)驗(yàn)結(jié)果與BAIB 相比,BAIB 的效果要優(yōu)于BA-InfoCNN,說明BiLSTM能夠有效提取全文信息特征,提升模型效果。BAIB 去除注意力機(jī)制之后的效果也不如BAIB,說明使用注意力機(jī)制凸出詞在句子中的重要性對(duì)于提升分類效果也是很有必要的。最有意義的是,將沒有改進(jìn)的BAA-CNN-BiLSTM 融合模型與BAIB 進(jìn)行比較,發(fā)現(xiàn)融入前文信息的卷積網(wǎng)絡(luò)分類更準(zhǔn)確,模型對(duì)文本語義的理解更充分。

    4 結(jié)語

    本文提出的文本分類模型BA-InfoCNN-BiLSTM 通過融合改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò),解決了傳統(tǒng)的單一深度學(xué)習(xí)網(wǎng)絡(luò)提取信息不充分、分類效果差的問題。相比于其他融合模型,本模型直接在詞嵌入后加入注意力機(jī)制,生成權(quán)重詞向量,突出重要詞對(duì)整體語義的影響,然后分別送入卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò),同時(shí)對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行了改進(jìn)。在進(jìn)行卷積操作過程中融入部分前文信息,讓卷積神經(jīng)網(wǎng)絡(luò)不再僅關(guān)注局部信息。最終的實(shí)驗(yàn)結(jié)果表明,該方法對(duì)分類的準(zhǔn)確率有一定提升。接下來為了使模型得到進(jìn)一步優(yōu)化,可以從以下方面入手:考慮到文本進(jìn)行分類時(shí),文中存在較多干擾信息以及一些專業(yè)性較強(qiáng)的名詞,可以在詞向量動(dòng)態(tài)訓(xùn)練過程中加入對(duì)抗擾動(dòng),以進(jìn)一步提升生成的新聞文本詞向量的魯棒性以及表征能力。

    猜你喜歡
    注意力語義卷積
    讓注意力“飛”回來
    基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
    語言與語義
    從濾波器理解卷積
    電子制作(2019年11期)2019-07-04 00:34:38
    基于傅里葉域卷積表示的目標(biāo)跟蹤算法
    “揚(yáng)眼”APP:讓注意力“變現(xiàn)”
    A Beautiful Way Of Looking At Things
    “上”與“下”語義的不對(duì)稱性及其認(rèn)知闡釋
    認(rèn)知范疇模糊與語義模糊
    一種基于卷積神經(jīng)網(wǎng)絡(luò)的性別識(shí)別方法
    国产91av在线免费观看| 久久精品国产亚洲网站| 久久久精品免费免费高清| 亚洲成色77777| 亚洲精品亚洲一区二区| 国产亚洲午夜精品一区二区久久 | 大又大粗又爽又黄少妇毛片口| 国产探花极品一区二区| 黄片无遮挡物在线观看| 亚洲av一区综合| 在线 av 中文字幕| 成人综合一区亚洲| 永久网站在线| xxx大片免费视频| 午夜亚洲福利在线播放| 欧美成人精品欧美一级黄| kizo精华| 久久精品人妻少妇| 国产亚洲最大av| 最后的刺客免费高清国语| 在线亚洲精品国产二区图片欧美 | 视频中文字幕在线观看| 建设人人有责人人尽责人人享有的 | 国产黄片视频在线免费观看| 亚洲精品456在线播放app| 国产成人午夜福利电影在线观看| 久久久午夜欧美精品| 夫妻午夜视频| 一级黄片播放器| 亚洲三级黄色毛片| 91久久精品电影网| 久久久国产一区二区| 能在线免费看毛片的网站| 久久久久久久大尺度免费视频| 免费看不卡的av| 亚洲精品aⅴ在线观看| 色吧在线观看| 亚洲精品国产av成人精品| 熟妇人妻不卡中文字幕| 国产男女超爽视频在线观看| 少妇人妻久久综合中文| 亚洲综合精品二区| videos熟女内射| 网址你懂的国产日韩在线| 亚洲天堂av无毛| 91久久精品国产一区二区三区| 好男人在线观看高清免费视频| 亚洲图色成人| 在线a可以看的网站| 亚洲成人中文字幕在线播放| 久久久久久久精品精品| 免费看日本二区| 91狼人影院| 身体一侧抽搐| 97在线视频观看| 国产淫片久久久久久久久| 久久精品国产a三级三级三级| 女人久久www免费人成看片| 国产一区二区在线观看日韩| av卡一久久| 在线亚洲精品国产二区图片欧美 | 国产av国产精品国产| 日本爱情动作片www.在线观看| 中文欧美无线码| 亚洲综合色惰| 亚洲精品国产色婷婷电影| 黄色怎么调成土黄色| 插阴视频在线观看视频| 免费观看无遮挡的男女| 视频中文字幕在线观看| 亚洲综合精品二区| 免费黄色在线免费观看| 欧美3d第一页| 内射极品少妇av片p| 亚洲成人精品中文字幕电影| 久久久久久久精品精品| 精品99又大又爽又粗少妇毛片| 不卡视频在线观看欧美| 99热网站在线观看| 成年人午夜在线观看视频| 又黄又爽又刺激的免费视频.| 插逼视频在线观看| 久久久久久久午夜电影| 亚洲欧美一区二区三区国产| 内射极品少妇av片p| 亚洲成人中文字幕在线播放| 国产成人a∨麻豆精品| 亚洲久久久久久中文字幕| 尾随美女入室| 高清视频免费观看一区二区| 久久久久久久国产电影| 麻豆乱淫一区二区| 婷婷色av中文字幕| 亚洲在线观看片| 亚洲最大成人中文| 国产黄色免费在线视频| 少妇人妻久久综合中文| 男女国产视频网站| 嫩草影院入口| 久久久色成人| 国产视频内射| 成人亚洲精品av一区二区| 亚洲人成网站高清观看| av在线亚洲专区| 日本黄大片高清| 精品一区二区免费观看| 精品久久久久久久久av| 嫩草影院入口| 亚洲欧美日韩另类电影网站 | 我要看日韩黄色一级片| 亚洲婷婷狠狠爱综合网| 熟女人妻精品中文字幕| 晚上一个人看的免费电影| 国产在线男女| 美女脱内裤让男人舔精品视频| 中文字幕av成人在线电影| 久久久成人免费电影| 中国三级夫妇交换| 边亲边吃奶的免费视频| 欧美亚洲 丝袜 人妻 在线| 我的女老师完整版在线观看| 97精品久久久久久久久久精品| 欧美zozozo另类| 男人爽女人下面视频在线观看| 51国产日韩欧美| 亚洲不卡免费看| a级一级毛片免费在线观看| 少妇高潮的动态图| 久久久亚洲精品成人影院| 免费看a级黄色片| 国产精品国产三级国产av玫瑰| 亚洲av一区综合| 国产精品久久久久久精品电影小说 | 国产精品一及| 超碰av人人做人人爽久久| 18禁动态无遮挡网站| 三级男女做爰猛烈吃奶摸视频| 中国三级夫妇交换| 成年免费大片在线观看| 欧美区成人在线视频| 在线观看三级黄色| 色视频www国产| 精品酒店卫生间| 国产精品一及| 欧美丝袜亚洲另类| 久久久久久久久久久免费av| 国产黄a三级三级三级人| 在线免费观看不下载黄p国产| av在线亚洲专区| 又大又黄又爽视频免费| 亚洲国产色片| 成年版毛片免费区| 国产亚洲午夜精品一区二区久久 | www.色视频.com| 2021少妇久久久久久久久久久| 久久久精品免费免费高清| 少妇人妻一区二区三区视频| 国产在视频线精品| 成人一区二区视频在线观看| 少妇丰满av| 国内精品宾馆在线| 日韩,欧美,国产一区二区三区| 久久99热这里只有精品18| 2021少妇久久久久久久久久久| 欧美变态另类bdsm刘玥| 国产一区二区在线观看日韩| 人妻少妇偷人精品九色| 国产伦理片在线播放av一区| 亚洲一级一片aⅴ在线观看| 国产成人aa在线观看| 欧美激情国产日韩精品一区| 色吧在线观看| 香蕉精品网在线| 日本免费在线观看一区| 69人妻影院| 乱码一卡2卡4卡精品| 永久免费av网站大全| 青春草亚洲视频在线观看| 日本三级黄在线观看| 日本免费在线观看一区| 一级毛片久久久久久久久女| 免费少妇av软件| 亚洲一区二区三区欧美精品 | 你懂的网址亚洲精品在线观看| 久久久国产一区二区| 成人鲁丝片一二三区免费| 在线a可以看的网站| 一级毛片电影观看| 又爽又黄a免费视频| 亚洲激情五月婷婷啪啪| 18禁裸乳无遮挡免费网站照片| 亚洲av中文字字幕乱码综合| 精品久久久久久电影网| 亚洲人与动物交配视频| 在线a可以看的网站| 久久久精品94久久精品| 亚洲天堂国产精品一区在线| 日韩av不卡免费在线播放| 欧美激情在线99| 亚洲在线观看片| 2021天堂中文幕一二区在线观| 成人无遮挡网站| 成人欧美大片| 久久久久精品久久久久真实原创| 国内精品宾馆在线| 久久久久久久久久久免费av| 成人漫画全彩无遮挡| 久久久久久久久久久丰满| 天天躁夜夜躁狠狠久久av| 卡戴珊不雅视频在线播放| 青春草视频在线免费观看| 精品人妻视频免费看| 国产亚洲av嫩草精品影院| 小蜜桃在线观看免费完整版高清| 爱豆传媒免费全集在线观看| 国产亚洲一区二区精品| 国产又色又爽无遮挡免| 国产精品久久久久久精品电影| 日韩 亚洲 欧美在线| 看十八女毛片水多多多| 国产精品爽爽va在线观看网站| 蜜桃久久精品国产亚洲av| 国产爱豆传媒在线观看| 国产成人a∨麻豆精品| 人妻 亚洲 视频| 99热国产这里只有精品6| 在线 av 中文字幕| 99精国产麻豆久久婷婷| 久久6这里有精品| 青春草视频在线免费观看| 久久精品国产自在天天线| 久久久久网色| 欧美最新免费一区二区三区| 亚洲av电影在线观看一区二区三区 | 亚洲精品日韩在线中文字幕| 嫩草影院入口| 国产一区二区三区综合在线观看 | 亚洲国产精品成人久久小说| 久久久久久久久久人人人人人人| 久久99热这里只频精品6学生| 天堂网av新在线| 少妇被粗大猛烈的视频| 久久久久性生活片| 午夜福利在线观看免费完整高清在| 欧美日韩视频高清一区二区三区二| 国产日韩欧美在线精品| 久久久久久伊人网av| 色视频www国产| 三级国产精品欧美在线观看| 91在线精品国自产拍蜜月| 成人欧美大片| 成人国产av品久久久| 亚洲精品日韩av片在线观看| 99热全是精品| 久久久久久九九精品二区国产| 六月丁香七月| 欧美+日韩+精品| 大码成人一级视频| 久久久久久久大尺度免费视频| 精品人妻偷拍中文字幕| 久久国内精品自在自线图片| 一个人看的www免费观看视频| 国产男女内射视频| 国产乱人偷精品视频| 免费高清在线观看视频在线观看| 日本欧美国产在线视频| 成人亚洲欧美一区二区av| 中国国产av一级| 亚洲在线观看片| 国产男女超爽视频在线观看| 亚洲av男天堂| av免费在线看不卡| 亚洲不卡免费看| 免费看a级黄色片| 亚洲四区av| 亚洲色图av天堂| 久久久精品欧美日韩精品| 国产高清三级在线| av免费在线看不卡| 日日啪夜夜爽| 久久久久精品久久久久真实原创| 欧美3d第一页| 免费看a级黄色片| 国产片特级美女逼逼视频| 欧美日韩视频精品一区| 国产中年淑女户外野战色| 色网站视频免费| 最近中文字幕高清免费大全6| 80岁老熟妇乱子伦牲交| 亚洲内射少妇av| 国产大屁股一区二区在线视频| 美女主播在线视频| 免费在线观看成人毛片| 亚洲一区二区三区欧美精品 | 亚洲激情五月婷婷啪啪| 人妻少妇偷人精品九色| 肉色欧美久久久久久久蜜桃 | 中文天堂在线官网| 好男人在线观看高清免费视频| 老司机影院毛片| 午夜免费鲁丝| 欧美人与善性xxx| 国产亚洲午夜精品一区二区久久 | 又粗又硬又长又爽又黄的视频| 三级国产精品片| 欧美 日韩 精品 国产| 亚洲不卡免费看| 一个人看的www免费观看视频| 亚洲一级一片aⅴ在线观看| 黄色视频在线播放观看不卡| 十八禁网站网址无遮挡 | 国产v大片淫在线免费观看| 美女脱内裤让男人舔精品视频| 各种免费的搞黄视频| 在线 av 中文字幕| 国产午夜精品一二区理论片| 国产真实伦视频高清在线观看| 亚洲,一卡二卡三卡| 久久久久久久国产电影| 波野结衣二区三区在线| 亚洲国产欧美在线一区| 国产精品99久久99久久久不卡 | tube8黄色片| 国产爱豆传媒在线观看| 免费大片18禁| av线在线观看网站| 国产精品一区二区性色av| 日韩欧美精品免费久久| 在线天堂最新版资源| 性插视频无遮挡在线免费观看| 国产精品99久久久久久久久| 天美传媒精品一区二区| 日韩国内少妇激情av| 日韩强制内射视频| 久久久欧美国产精品| 男女边吃奶边做爰视频| 亚洲丝袜综合中文字幕| 国产av不卡久久| 观看免费一级毛片| 国产成年人精品一区二区| 国产综合懂色| 亚洲伊人久久精品综合| 中文在线观看免费www的网站| 草草在线视频免费看| 亚洲精品国产av蜜桃| 日本午夜av视频| 亚洲精品中文字幕在线视频 | 欧美变态另类bdsm刘玥| 国产精品爽爽va在线观看网站| 午夜免费观看性视频| 五月玫瑰六月丁香| 黄色欧美视频在线观看| 日本猛色少妇xxxxx猛交久久| 黄色欧美视频在线观看| 亚洲精品乱码久久久v下载方式| 亚洲av国产av综合av卡| 国产视频内射| 国产真实伦视频高清在线观看| 青春草国产在线视频| 日韩一本色道免费dvd| 精品一区二区三区视频在线| 天天躁夜夜躁狠狠久久av| 丝袜脚勾引网站| 日本黄大片高清| 亚洲四区av| 午夜福利在线观看免费完整高清在| 国语对白做爰xxxⅹ性视频网站| 欧美日韩综合久久久久久| 毛片一级片免费看久久久久| .国产精品久久| 色播亚洲综合网| 看十八女毛片水多多多| 日韩欧美精品免费久久| 亚洲欧美精品自产自拍| 乱系列少妇在线播放| 边亲边吃奶的免费视频| 少妇 在线观看| 亚洲av国产av综合av卡| 欧美3d第一页| 少妇丰满av| 免费黄网站久久成人精品| 黄片wwwwww| 中文字幕免费在线视频6| 欧美日韩精品成人综合77777| 特大巨黑吊av在线直播| 免费播放大片免费观看视频在线观看| 国产乱人偷精品视频| 久久久久久伊人网av| videos熟女内射| 亚洲一级一片aⅴ在线观看| 又黄又爽又刺激的免费视频.| 日韩三级伦理在线观看| 中文字幕久久专区| a级毛片免费高清观看在线播放| 80岁老熟妇乱子伦牲交| 国产精品精品国产色婷婷| 人妻一区二区av| 午夜免费鲁丝| 亚洲av二区三区四区| 97热精品久久久久久| 最近中文字幕2019免费版| 亚洲欧美日韩卡通动漫| 久久久欧美国产精品| 中文精品一卡2卡3卡4更新| 免费黄频网站在线观看国产| 2018国产大陆天天弄谢| 国产在线男女| 午夜免费鲁丝| 欧美高清成人免费视频www| 我的女老师完整版在线观看| 国产高清三级在线| 中文精品一卡2卡3卡4更新| 精品99又大又爽又粗少妇毛片| 亚洲精品亚洲一区二区| 成年免费大片在线观看| 又大又黄又爽视频免费| 丝袜喷水一区| 国产男女内射视频| 亚洲国产精品999| 观看美女的网站| 欧美激情久久久久久爽电影| 大片免费播放器 马上看| 99精国产麻豆久久婷婷| 精品一区二区三区视频在线| 亚洲精品久久久久久婷婷小说| 国产亚洲一区二区精品| 久久精品久久久久久噜噜老黄| 久久精品国产a三级三级三级| av免费在线看不卡| av专区在线播放| 中国国产av一级| 免费看光身美女| 69av精品久久久久久| 色综合色国产| 亚洲综合精品二区| 精品人妻偷拍中文字幕| 婷婷色av中文字幕| 亚洲国产av新网站| 精品一区二区三卡| 一级二级三级毛片免费看| 色5月婷婷丁香| 国产av国产精品国产| 三级男女做爰猛烈吃奶摸视频| 99久久精品国产国产毛片| 中文天堂在线官网| 精品人妻熟女av久视频| 你懂的网址亚洲精品在线观看| 国产成人a∨麻豆精品| 亚洲性久久影院| 亚洲一级一片aⅴ在线观看| 18禁动态无遮挡网站| 91aial.com中文字幕在线观看| 日韩免费高清中文字幕av| 免费大片黄手机在线观看| 欧美性猛交╳xxx乱大交人| 黄色欧美视频在线观看| 亚洲伊人久久精品综合| 欧美 日韩 精品 国产| 国产爱豆传媒在线观看| 18禁裸乳无遮挡免费网站照片| 亚洲,欧美,日韩| 国产一区二区亚洲精品在线观看| 观看免费一级毛片| 视频区图区小说| 午夜爱爱视频在线播放| 欧美三级亚洲精品| 69人妻影院| 亚洲无线观看免费| 亚洲欧洲日产国产| 亚洲精品,欧美精品| 在线观看免费高清a一片| 日本免费在线观看一区| 少妇人妻精品综合一区二区| 亚洲成人中文字幕在线播放| 国产综合懂色| 国产视频首页在线观看| 成人高潮视频无遮挡免费网站| 丰满少妇做爰视频| 男女啪啪激烈高潮av片| 中文字幕制服av| 18禁裸乳无遮挡动漫免费视频 | 国产精品精品国产色婷婷| 精品酒店卫生间| 大香蕉97超碰在线| av在线观看视频网站免费| 亚洲人成网站在线播| 五月玫瑰六月丁香| 伦精品一区二区三区| 国产精品久久久久久av不卡| 欧美精品一区二区大全| 国产精品久久久久久久久免| 国产精品一及| 亚洲精华国产精华液的使用体验| 天天躁日日操中文字幕| 成人毛片60女人毛片免费| 日本黄色片子视频| 高清日韩中文字幕在线| 免费看不卡的av| 在线观看免费高清a一片| 身体一侧抽搐| 亚洲精品中文字幕在线视频 | 在线天堂最新版资源| 狂野欧美白嫩少妇大欣赏| 欧美日韩精品成人综合77777| 国产高清三级在线| 18禁在线播放成人免费| 人体艺术视频欧美日本| 麻豆乱淫一区二区| 精品一区二区免费观看| 国产午夜精品一二区理论片| 男男h啪啪无遮挡| 大话2 男鬼变身卡| 国产69精品久久久久777片| 精品久久久久久电影网| 赤兔流量卡办理| 色播亚洲综合网| 边亲边吃奶的免费视频| 中文字幕亚洲精品专区| av又黄又爽大尺度在线免费看| 国产成人午夜福利电影在线观看| 亚洲精品影视一区二区三区av| 亚洲av欧美aⅴ国产| 晚上一个人看的免费电影| 亚洲精品色激情综合| 国产成人一区二区在线| 午夜福利视频1000在线观看| 国产精品成人在线| av在线老鸭窝| 综合色丁香网| 在线天堂最新版资源| a级毛色黄片| 日日撸夜夜添| av在线亚洲专区| 亚洲综合精品二区| 亚洲欧美精品专区久久| 日日啪夜夜爽| 青春草亚洲视频在线观看| 成人亚洲欧美一区二区av| 午夜激情福利司机影院| 亚洲国产精品专区欧美| 午夜免费男女啪啪视频观看| 欧美xxxx黑人xx丫x性爽| 亚洲精品日韩在线中文字幕| 久久精品国产鲁丝片午夜精品| 亚洲精品国产成人久久av| av福利片在线观看| 日韩一区二区三区影片| 我的女老师完整版在线观看| 人妻一区二区av| 大香蕉97超碰在线| 哪个播放器可以免费观看大片| 天堂网av新在线| 亚洲精品久久午夜乱码| 高清欧美精品videossex| av在线观看视频网站免费| 国产综合懂色| 国产精品女同一区二区软件| 国产有黄有色有爽视频| 欧美3d第一页| 啦啦啦在线观看免费高清www| 亚洲国产日韩一区二区| 国产人妻一区二区三区在| 日韩中字成人| 大又大粗又爽又黄少妇毛片口| av在线播放精品| 国产免费一级a男人的天堂| 国产v大片淫在线免费观看| 国产av不卡久久| 成人高潮视频无遮挡免费网站| 麻豆成人午夜福利视频| 国产精品无大码| 中文字幕久久专区| 久久韩国三级中文字幕| 1000部很黄的大片| 中文字幕亚洲精品专区| 久久久精品94久久精品| 亚洲成人av在线免费| 日韩一区二区三区影片| 各种免费的搞黄视频| 亚洲欧美日韩东京热| 国产 精品1| 国产精品久久久久久精品电影| 亚洲无线观看免费| 在现免费观看毛片| 免费播放大片免费观看视频在线观看| 国产精品国产av在线观看| 一本久久精品| 日本午夜av视频| 久久久精品免费免费高清| 亚洲国产最新在线播放| 国产精品偷伦视频观看了| 国产色婷婷99| 在线观看免费高清a一片| 日日啪夜夜撸| 国产日韩欧美在线精品| 国产免费视频播放在线视频| 国产精品国产三级专区第一集| 在线观看人妻少妇| 少妇裸体淫交视频免费看高清| 国内精品美女久久久久久| 18禁动态无遮挡网站| 男女国产视频网站| av.在线天堂| 国产91av在线免费观看| 我要看日韩黄色一级片| 在线看a的网站| 亚洲图色成人| 国产综合精华液| 欧美精品人与动牲交sv欧美| av黄色大香蕉| 国产黄片视频在线免费观看| 久久热精品热| 久久久a久久爽久久v久久| 国精品久久久久久国模美| 男女边摸边吃奶|