• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    多主題下基于LSTM語(yǔ)義關(guān)聯(lián)的長(zhǎng)文本過濾研究

    2019-11-18 05:22:50曹春萍
    關(guān)鍵詞:評(píng)論性依賴度語(yǔ)義

    曹春萍,武 婷

    (上海理工大學(xué) 光電信息與計(jì)算機(jī)工程學(xué)院,上海 200082)

    0 引 言

    近年來,隨著社交網(wǎng)絡(luò)愈來愈繁榮,如何從海量文本中進(jìn)行信息提取受到越來越多的關(guān)注。文本過濾作為更多文本分析的前序工作,成為了自然語(yǔ)言處理工作的研究熱點(diǎn)之一[1]。隨著互聯(lián)網(wǎng)進(jìn)入Web 2.0時(shí)代,互聯(lián)網(wǎng)用戶使用網(wǎng)絡(luò)分享知識(shí)、經(jīng)驗(yàn)、意見、感受等,越來越多的主觀性評(píng)論文章充斥網(wǎng)絡(luò)。與科學(xué)性文章不同,評(píng)論性文章不僅包含多個(gè)主題而且含有很多與主題無關(guān)的句子,過濾掉這些句子可以提高后續(xù)文本分析的效率,所以對(duì)評(píng)論性文章內(nèi)容進(jìn)行文本過濾是進(jìn)行文本分析中很重要的一步。目前對(duì)文本過濾的研究已經(jīng)有很多,但是在長(zhǎng)文本過濾方面仍存在一些亟待解決的問題,如多主題、句子間語(yǔ)義關(guān)聯(lián)等問題造成長(zhǎng)文本過濾困難。因此,對(duì)評(píng)論性文章進(jìn)行文本過濾依然具有很大的研究?jī)r(jià)值。

    為了從文本中篩選出有用的信息,越來越多的學(xué)者采用自然語(yǔ)言處理技術(shù)進(jìn)行文本過濾。傳統(tǒng)的基于規(guī)則的過濾方法,性能好壞依賴于復(fù)雜的人工規(guī)則和特征工程[2]。評(píng)論性文章內(nèi)容冗長(zhǎng)雜亂,領(lǐng)域性不強(qiáng)等特點(diǎn)使得設(shè)計(jì)規(guī)則和提取特征都非常困難。此外,每個(gè)文本都有對(duì)應(yīng)的主題,利用主題模型可以提取文本主題,根據(jù)文本主題進(jìn)行過濾,雖然采用機(jī)器學(xué)習(xí)的方法能在主題分類達(dá)到很好的效果,但是仍然依賴人工抽取特征,對(duì)專家經(jīng)驗(yàn)要求較高[3]。深度神經(jīng)網(wǎng)絡(luò)模型在自然語(yǔ)言處理方面的巨大成功,使得研究人員將其應(yīng)用于文本過濾。深度神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的特征學(xué)習(xí)能力,能夠克服人工特征抽取的困難[4]。但是對(duì)于評(píng)論性長(zhǎng)文本過濾,不同的模型和數(shù)據(jù)處理方法會(huì)對(duì)過濾效果產(chǎn)生不同的影響。

    文中主要針對(duì)的是評(píng)論性文章多主題且句子語(yǔ)義關(guān)聯(lián)造成的長(zhǎng)文本過濾困難的問題。多主題是指一篇文章中涉及到多個(gè)主題,如游記中通常會(huì)有景色、住宿、美食和交通等多個(gè)主題;如果使用傳統(tǒng)主題模型進(jìn)行過濾,可能會(huì)把具有語(yǔ)義關(guān)聯(lián)的句子篩選掉,這樣會(huì)影響后續(xù)的方面級(jí)情感分析工作。因此,需要采用新方法來提高長(zhǎng)文本過濾的準(zhǔn)確率。對(duì)此,文中提出結(jié)合單層神經(jīng)網(wǎng)絡(luò)和具有兩個(gè)隱藏層的長(zhǎng)短記憶網(wǎng)絡(luò)的深度網(wǎng)絡(luò)模型(A-HLSTM)用于長(zhǎng)文本過濾任務(wù)中,利用其可以進(jìn)行多主題分類及上下文語(yǔ)義分析的能力,完成評(píng)論性文章的過濾。

    1 相關(guān)研究

    傳統(tǒng)的文本過濾方法主要分為兩大類,基于規(guī)則的過濾方法和基于統(tǒng)計(jì)的過濾方法[5]。其中基于規(guī)則的過濾方法是專家根據(jù)需求設(shè)置匹配規(guī)則,然后通過實(shí)驗(yàn)反饋的信息完善規(guī)則[6]?;诮y(tǒng)計(jì)的方法利用人工標(biāo)注的語(yǔ)料庫(kù),通過統(tǒng)計(jì)經(jīng)驗(yàn)的理論進(jìn)行文本過濾[7]。早期的方法存在很多缺點(diǎn),例如規(guī)則的制定需要依靠很多專家的經(jīng)驗(yàn),且有的特征可能考慮的并不全面,另外這些模型計(jì)算和語(yǔ)料庫(kù)的規(guī)模成正比,計(jì)算量很大,效率很低。

    隨著機(jī)器學(xué)習(xí)在自然語(yǔ)言中的廣泛應(yīng)用,許多學(xué)者將機(jī)器學(xué)習(xí)技術(shù)應(yīng)用于文本過濾。一些學(xué)者將此問題看作多分類問題,通常使用支持向量機(jī)(SVM)、k近鄰分類算法等。文獻(xiàn)[8]在涉恐信息文本的研究中將文本過濾視為分類問題,采用k近鄰分類算法進(jìn)行過濾;文獻(xiàn)[9]提出基于主題分類的文本過濾方法,篩選出文本內(nèi)容的最優(yōu)特征項(xiàng)集合,利用SVM分類技術(shù)過濾。文獻(xiàn)[1]利用文本分類系統(tǒng)創(chuàng)建特定領(lǐng)域過濾器,減少了手動(dòng)注釋的訓(xùn)練數(shù)據(jù)量。以上幾種方法都不能體現(xiàn)語(yǔ)義,導(dǎo)致文本相似度計(jì)算一直很低,因此,一些學(xué)者又提出了基于語(yǔ)義的文本過濾方法。文獻(xiàn)[10]提出了多詞-貝葉斯分類算法,將詞與詞之間的關(guān)系作為重要參考項(xiàng),克服了傳統(tǒng)分類器對(duì)語(yǔ)義分析的忽視;文獻(xiàn)[11]提出基于多謂詞語(yǔ)義框架文本過濾算法,利用文本依存句法分析進(jìn)行語(yǔ)義分析,提高了文本過濾的準(zhǔn)確率。這些方法雖然對(duì)文本過濾的準(zhǔn)確率有所提高,但不能發(fā)現(xiàn)深層次特征并且算法計(jì)算量較大,計(jì)算時(shí)間很長(zhǎng),導(dǎo)致算法的計(jì)算效率很低。

    最近,深度學(xué)習(xí)在自然語(yǔ)言處理方面的巨大成功使得研究人員將其應(yīng)用于文本過濾,因?yàn)樗梢詮拇罅繑?shù)據(jù)訓(xùn)練中學(xué)習(xí)并判別特征,并且可以考慮到整體上下文信息。然而,對(duì)于深度學(xué)習(xí)在評(píng)論性文章這類長(zhǎng)文本過濾的研究很少,但深度學(xué)習(xí)在其他自然語(yǔ)言處理中的應(yīng)用給了筆者很大的啟發(fā)。眾所周知,好的詞向量作為輸入可以改善神經(jīng)網(wǎng)絡(luò)模型,Pennington等提出的GloVe詞向量構(gòu)造了一個(gè)全局的詞共現(xiàn)矩陣,能夠融合文本的全局信息和局部上下文信息[12]。目前,用于自然語(yǔ)言處理的神經(jīng)網(wǎng)絡(luò)模型主要是RNN和LSTM,RNN可以考慮序列的上下文信息,但RNN在訓(xùn)練過程中梯度向量的分量可能會(huì)在長(zhǎng)序列上指數(shù)增長(zhǎng)或消失[13]。LSTM可以解決RNN的梯度問題,但仍然會(huì)忘記距離當(dāng)前序列較遠(yuǎn)的信息,尤其在處理長(zhǎng)文本任務(wù)中這個(gè)問題更加明顯[14]。為了能存儲(chǔ)更遠(yuǎn)距離的信息,各種模型被用來提高LSTM存儲(chǔ)遠(yuǎn)程信息的能力。例如,文獻(xiàn)[15]提出將外部存儲(chǔ)器加入LSTM中,但外部存儲(chǔ)器矩陣龐大,性能不佳;文獻(xiàn)[16]提出基于注意力機(jī)制的雙向LSTM來處理文檔級(jí)情感分析任務(wù);文獻(xiàn)[17]提出了緩存長(zhǎng)短記憶神經(jīng)網(wǎng)絡(luò)(CLSTM)模型,引入緩存機(jī)制來捕獲長(zhǎng)文本中的整體語(yǔ)義信息。

    綜上所述,這些都是基于一層LSTM并對(duì)其結(jié)構(gòu)稍加改變。受這些研究的啟發(fā),文中提出結(jié)合單層神經(jīng)網(wǎng)絡(luò)和分層長(zhǎng)短記憶網(wǎng)絡(luò)的深度網(wǎng)絡(luò)模型用于長(zhǎng)文本過濾任務(wù)中。利用詞語(yǔ)層LSTM網(wǎng)絡(luò)模型可以得到具有語(yǔ)義的句向量,第二層主題依賴度計(jì)算模型、句子層LSTM網(wǎng)絡(luò)以第一層得到的句向量作為輸入,既可以獲得句子與各主題類別的依賴度,同時(shí)也通過句子層LSTM網(wǎng)絡(luò)挖掘整個(gè)文章中的長(zhǎng)距離依賴關(guān)系,有效提高長(zhǎng)文本過濾的性能。

    2 模 型

    2.1 模型整體框架

    評(píng)論性長(zhǎng)文本過濾問題主要是在評(píng)論性文章中將無主題且與其他句子語(yǔ)義關(guān)聯(lián)低的句子過濾掉。文中旨在研究如何能更好地對(duì)長(zhǎng)文本進(jìn)行過濾,主要用LSTM模型提取詞語(yǔ)間的語(yǔ)義形成句向量,然后進(jìn)行主題判斷和語(yǔ)義關(guān)聯(lián)。模型的整體框架如圖1所示。

    圖1 長(zhǎng)文本過濾結(jié)構(gòu)

    數(shù)據(jù)處理的第一步是將預(yù)處理后的全部數(shù)據(jù)進(jìn)行分詞,然后用GloVe進(jìn)行詞向量訓(xùn)練,將訓(xùn)練好的詞向量作為第一層LSTM模塊的輸入;接著將詞向量經(jīng)過LSTM模型進(jìn)行訓(xùn)練,得到具有語(yǔ)義的句向量,并將此句向量分別作為主題依賴度計(jì)算模型和句子層LSTM的輸入;然后通過主題依賴度模型計(jì)算,得到句子于主題類別的概率;經(jīng)過句子層LSTM進(jìn)一步得到完整的句子語(yǔ)義關(guān)系表示;最后綜合考慮主題依賴和語(yǔ)義關(guān)聯(lián)兩個(gè)因素實(shí)現(xiàn)長(zhǎng)文本過濾。

    2.2 詞語(yǔ)層LSTM層

    模型的第一層是LSTM模塊,該層主要用來接收最初的詞向量數(shù)據(jù),將游記文本語(yǔ)料庫(kù)中的詞語(yǔ)用GloVe訓(xùn)練得到詞向量表示,通過LSTM模型訓(xùn)練后得到連續(xù)的句向量。如圖2所示,LSTM主要包含三個(gè)門單元(輸入門、輸出門、遺忘門)和一個(gè)記憶單元。

    圖2 LSTM標(biāo)準(zhǔn)結(jié)構(gòu)

    一般地,每個(gè)LSTM單元的計(jì)算公式如下:

    ft=σ(Wfxt+Ufht-1+bf)

    (1)

    it=σ(Wixt+Uiht-1+bi)

    (2)

    ot=σ(Woxt+Uoht-1+bo)

    (3)

    (4)

    (5)

    ht=ottanh(ct)

    (6)

    其中,σ表示sigmod激活函數(shù);tanh表示雙曲正切激活函數(shù);Wf、Wi、Wo、Uf、Ui、Uo分別表示輸入門、忘記門、輸出門的權(quán)重矩陣;bf、bi、bo表示輸入門、忘記門、輸出門的偏置向量;ht表示t時(shí)刻的輸出。

    詞語(yǔ)層LSTM接收一個(gè)以詞語(yǔ)為單位的句子作為網(wǎng)絡(luò)的序列化輸入,每個(gè)LSTM單元的輸入由上個(gè)單元隱藏層的輸出和本次輸入的詞向量組成,詞語(yǔ)層LSTM可以得到句子內(nèi)部詞語(yǔ)之間的相互關(guān)系。文中提出的詞語(yǔ)層LSTM網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。

    圖3 詞語(yǔ)層LSTM結(jié)構(gòu)

    2.3 主題依賴度計(jì)算模塊

    模型的第二層的第一部分是主題依賴度計(jì)算層,用來將句子與其所屬主題類別以加權(quán)的形式聯(lián)接,再通過softmax函數(shù)得到句子對(duì)于類別的概率分布,即句子的主題依賴度向量。

    圖4所示的主題依賴度計(jì)算模型實(shí)際上是基于單層神經(jīng)網(wǎng)絡(luò)的softmax分類器,輸入為句向量,輸出是句向量對(duì)于主題類別的概率。圖模型的輸入為詞語(yǔ)層LSTM訓(xùn)練得到的句向量,輸出Y是一維實(shí)向量,Y的計(jì)算公式為

    Y=W·si+b

    (7)

    其中,W是權(quán)重矩陣,b為偏置項(xiàng)。

    圖4 主題依賴度計(jì)算模型

    輸出Y經(jīng)過sigmoid及softmax函數(shù),得到屬于各類別的概率。softmax的輸出公式為:

    (8)

    2.4 句子層LSTM網(wǎng)絡(luò)

    模型第二層的另一部分是句子層LSTM網(wǎng)絡(luò),用來對(duì)句子關(guān)系進(jìn)行編碼。詞語(yǔ)層LSTM網(wǎng)絡(luò)可以有效獲取句子內(nèi)部詞語(yǔ)之間的關(guān)系,但對(duì)于評(píng)論性文檔長(zhǎng)距離語(yǔ)義關(guān)聯(lián)的問題,僅僅依靠詞語(yǔ)層LSTM網(wǎng)絡(luò)難以正確識(shí)別句子間的語(yǔ)義關(guān)系,因此,文中使用句子層LSTM來進(jìn)一步挖掘句子之間的依賴關(guān)系。將詞語(yǔ)層LSTM輸出的句向量作為句子層LSTM的輸入,得到的隱藏層輸出矩陣作為文檔表示,文檔表示被用作文檔級(jí)語(yǔ)義關(guān)聯(lián)的特征,將其饋送到輸出長(zhǎng)度為關(guān)聯(lián)等級(jí)的線性層,并添加softmax層輸出語(yǔ)義強(qiáng)關(guān)聯(lián)、弱關(guān)聯(lián)、不關(guān)聯(lián)的概率。softmax函數(shù)計(jì)算如式9所示,其中C是語(yǔ)義關(guān)聯(lián)程度劃分。

    (9)

    2.5 過濾度計(jì)算

    句子的過濾度值綜合考慮句子屬于主題類別的概率值和語(yǔ)義關(guān)聯(lián)度,過濾度越低,這類句子對(duì)后續(xù)文本分析任務(wù)的貢獻(xiàn)度也較低。為了提高后續(xù)文本分析任務(wù)的效率,因此需要過濾掉過濾度值低的句子。經(jīng)過前兩個(gè)模塊的訓(xùn)練,已經(jīng)得到了每個(gè)句子主題依賴度和語(yǔ)義關(guān)聯(lián)度,文中提出將主題依賴度向量的均方差與語(yǔ)義關(guān)聯(lián)度之和作為過濾度,對(duì)于句子s,其過濾度計(jì)算如下:

    (10)

    其中,k為主題類別數(shù);atti[r]為si對(duì)主題類別r的依賴度;a為主題依賴度均值,為1/k;di為句子語(yǔ)義關(guān)聯(lián)度。

    文中設(shè)置超參數(shù)threshold來控制過濾度,在實(shí)驗(yàn)中使用交叉驗(yàn)證法來更新threshold對(duì)比其對(duì)過濾效果的影響。

    2.6 模型訓(xùn)練

    文中通過隨機(jī)梯度下降進(jìn)行模型訓(xùn)練,其中損失函數(shù)是監(jiān)督交叉熵誤差。要避免出現(xiàn)過度擬合,過度擬合意味著模型將訓(xùn)練數(shù)據(jù)(包括噪聲數(shù)據(jù))進(jìn)行超分割,從而獲得最低成本。但是,總體規(guī)律會(huì)被忽略,對(duì)于未知數(shù)據(jù),如測(cè)試數(shù)據(jù),該模型不能很好地執(zhí)行。為了克服這一問題,文中在所有參數(shù)中加入L2正則化,用于限制權(quán)重的大小,使得模型不能隨機(jī)擬合訓(xùn)練數(shù)據(jù)中的隨機(jī)噪聲。設(shè)y是待過濾句子的預(yù)測(cè)類別,z是待過濾句子的實(shí)際類別。訓(xùn)練目標(biāo)是盡量減少所有訓(xùn)練文本中y和z之間的交叉熵誤差。

    (11)

    3 實(shí) 驗(yàn)

    3.1 數(shù)據(jù)處理

    通過使用網(wǎng)絡(luò)爬蟲軟件在馬蜂窩上采集了關(guān)于上海的游記2 000篇,并使用Stanford CoreNLP進(jìn)行標(biāo)記和分詞,并將數(shù)據(jù)集分為80/10/10用于訓(xùn)練、驗(yàn)證和測(cè)試。訓(xùn)練集主要用于訓(xùn)練模型、避免過度擬合,使用驗(yàn)證數(shù)據(jù)集來進(jìn)一步確定模型的參數(shù)并在不同的參數(shù)下評(píng)估模型過濾效果,不能根據(jù)測(cè)試集的結(jié)果調(diào)整參數(shù)。

    3.2 實(shí)驗(yàn)設(shè)置

    對(duì)于參數(shù)配置,使用GloVe詞向量來初始化實(shí)驗(yàn)數(shù)據(jù)中的詞向量,其中每個(gè)詞向量為300維的連續(xù)值。對(duì)于模型初始化,從均勻分布[-0.1,0.1]之間隨機(jī)采樣初始化所有矩陣,并使用隨機(jī)梯度下降法來更新所有參數(shù)。文中使用Adagrad作為優(yōu)化器,其初始學(xué)習(xí)率設(shè)置為0.01。

    3.3 對(duì)比實(shí)驗(yàn)

    將文中方法和機(jī)器學(xué)習(xí)算法以及典型的機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)模型進(jìn)行了對(duì)比實(shí)驗(yàn):

    (1)NB(Na?ve Bayesian,樸素貝葉斯):樸素貝葉斯是一種常見的機(jī)器學(xué)習(xí)分類算法,使用詞袋模型收集特征。

    (2)SVM(Support Vector Machine,支持向量機(jī)):文中對(duì)文獻(xiàn)[9]提出的SVM算法加以修改,使用詞袋模型收集特征并且使用LibLinear訓(xùn)練SVM分類器。

    (3)RNN:文獻(xiàn)[13]提出的RNN是對(duì)連續(xù)文本進(jìn)行建模的基本方法。

    (4)LSTM:文獻(xiàn)[14]提出的LSTM是具有存儲(chǔ)單元和三個(gè)門機(jī)制的遞歸神經(jīng)網(wǎng)絡(luò)。

    (5)2-layer LSTM:文獻(xiàn)[16]提出的2-layer LSTM模型中,為了讓第二層LSTM捕獲輸入序列的長(zhǎng)期依賴關(guān)系,第一層LSTM單元的隱藏層輸出矩陣在同一時(shí)間步驟中輸入第二層LSTM中。

    (6)CLSTM:文獻(xiàn)[17]提出的CLSTM旨在通過緩存機(jī)制捕獲遠(yuǎn)程信息,它將存儲(chǔ)器分為若干組,并且不同的遺忘率(過濾器)分成不同的組。

    3.4 實(shí)驗(yàn)結(jié)果與分析

    3.4.1 不同模型對(duì)比實(shí)驗(yàn)結(jié)果分析

    文中使用準(zhǔn)確度和MSE(mean square error,均方誤差)來評(píng)估模型,其中準(zhǔn)確度是衡量文本過濾的標(biāo)準(zhǔn)指標(biāo)。MSE是一種測(cè)量平均誤差的便捷方法。由此,通過評(píng)估數(shù)據(jù)的變化度,MSE值越小,表明實(shí)驗(yàn)?zāi)P偷目煽啃栽礁摺?/p>

    (12)

    文中對(duì)比了不同模型下長(zhǎng)文本過濾的準(zhǔn)確度和MSE,結(jié)果如表1所示。

    表1 不同模型下長(zhǎng)文本過濾的準(zhǔn)確度和MSE

    從表1可以發(fā)現(xiàn):

    (1)對(duì)比了兩種機(jī)器學(xué)習(xí)算法(NB和SVM),可以發(fā)現(xiàn)SVM比NB有更好的過濾效果。機(jī)器學(xué)習(xí)方法幾乎能達(dá)到LSTM相同的效果,但它需要大量的特征工程。標(biāo)記有效特征是一項(xiàng)非?;A(chǔ)的工作,機(jī)器學(xué)習(xí)分類器的性能很大程度上取決于數(shù)據(jù)表示和特征的選擇,但神經(jīng)網(wǎng)絡(luò)模型可以根據(jù)數(shù)據(jù)的特征自動(dòng)學(xué)習(xí),這是它被廣泛應(yīng)用的原因。

    (2)在循環(huán)神經(jīng)網(wǎng)絡(luò)中,由于梯度消失問題,RNN在長(zhǎng)文本建模方面表現(xiàn)最差。相比而言,LSTM有更好的性能,這表明內(nèi)部存儲(chǔ)器和三個(gè)門的結(jié)構(gòu)在長(zhǎng)文本建模中的作用很關(guān)鍵。

    (3)提出的A-HLSTM深度分層網(wǎng)絡(luò)模型具有最佳性能,比Bi-LSTM提升了1.4%。

    (4)在雙向體系結(jié)構(gòu)中,長(zhǎng)文本模型可以向前和向后捕獲特征,因此,Bi-LSTM比單向模型具有更好的性能。在雙向模型中,文中模型具有良好的性能,準(zhǔn)確度達(dá)到46.3%。

    (5)在時(shí)間復(fù)雜度和參數(shù)數(shù)量方面,A-HLSTM和2-layer LSTM都有兩個(gè)隱藏層,但A-HLSTM比2-layer LSTM需要更少的計(jì)算資源,卻達(dá)到了更高的準(zhǔn)確率。與完全連通層比,該模型僅使用第一層輸出的句子向量作為第二層的輸入,因此該模型具有較少的參數(shù)和計(jì)算時(shí)間。

    3.4.2 threshold值對(duì)文本過濾的影響

    圖5是用文中算法進(jìn)行過濾后的文本長(zhǎng)度、句子數(shù)占過濾前文本的比例隨threshold的變化情況。實(shí)驗(yàn)結(jié)果表明,當(dāng)threshold為3.1×10-4時(shí),沒有任何句子被過濾;當(dāng)threshold為5.0×10-4時(shí),過濾后的文本長(zhǎng)度是過濾前的42.13%,過濾后的句子數(shù)是過濾前的42.49%,并且文本長(zhǎng)度變化和句子數(shù)變化趨勢(shì)基本一致,說明文中算法過濾質(zhì)量較好,沒有出現(xiàn)集中過濾短句或者長(zhǎng)句的現(xiàn)象。

    圖5 threshold值對(duì)文本過濾的影響

    3.4.3 詞向量的影響

    眾所周知,神經(jīng)網(wǎng)絡(luò)的輸入是詞向量,詞向量的選擇對(duì)優(yōu)秀的文檔表示至關(guān)重要。為了了解不同詞向量對(duì)模型的影響,文中選擇隨機(jī)初始化向量,word2vec模型(CBOW和Skipgram)和GolVe在兩種模型(LSTM和A-HLSTM)上做了對(duì)比實(shí)驗(yàn)。所有詞向量都是300維,結(jié)果見表2

    表2 不同詞向量下LSTM,A-HLSTM的文本過濾準(zhǔn)確率

    從表2中可以發(fā)現(xiàn),word2vec和GloVe比隨機(jī)初始化向量表現(xiàn)更優(yōu)。這表明上下文信息對(duì)詞向量學(xué)習(xí)的重要性。此外,還可以看出GloVe在這兩個(gè)模型上的準(zhǔn)確度略有提高,這充分說明一個(gè)好的詞向量需要考慮全局上下文信息。

    文中還對(duì)比了不同維度的GloVe向量(50/100/200/300)。表3和表4分別給出文本過濾準(zhǔn)確度和時(shí)間成本,可以發(fā)現(xiàn)200維詞向量比50和100維表現(xiàn)更好,而300維詞向量沒有顯著改進(jìn)。此外,A-HLSTM比LSTM花費(fèi)更多的時(shí)間,因?yàn)锳-HLSTM的參數(shù)數(shù)量更多,但它們有更高的準(zhǔn)確率。

    表3 不同維度GloVe詞向量下LSTM、A-HLSTM的文本過濾準(zhǔn)確率

    表4 不同維度GloVe詞向量下LSTM、A-HLSTM的訓(xùn)練時(shí)間成本(單位:分鐘)

    4 結(jié)束語(yǔ)

    社交網(wǎng)絡(luò)上存在大量的分享個(gè)人經(jīng)驗(yàn)的長(zhǎng)文本,如游記等,這些長(zhǎng)文本與專業(yè)文獻(xiàn)不同,主題類別多且語(yǔ)義間的關(guān)聯(lián)性強(qiáng)。因此,為了更好地進(jìn)行下一步的方面級(jí)情感分析工作,先對(duì)其進(jìn)行文本過濾。首先通過詞語(yǔ)層LSTM網(wǎng)絡(luò)獲得句子內(nèi)部詞語(yǔ)之間的關(guān)系并得到具有語(yǔ)義的句向量,然后將句向量輸入主題依賴度計(jì)算模型和句子層LSTM網(wǎng)絡(luò)模型,進(jìn)而得到句子與各主題類別的依賴度以及待過濾句子與其他句子之間的關(guān)聯(lián)。最后在游記數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果驗(yàn)證了文中模型的有效性。

    猜你喜歡
    評(píng)論性依賴度語(yǔ)義
    語(yǔ)言與語(yǔ)義
    電視新聞評(píng)論性節(jié)目的選題與傳播策略
    活力(2019年17期)2019-11-26 00:42:34
    評(píng)論性作文深入闡述的三點(diǎn)切口
    法律德語(yǔ)翻譯的層次化策略——以法律判決書的評(píng)論性文本翻譯為例
    虛擬現(xiàn)實(shí)技術(shù)在裝備培訓(xùn)中的應(yīng)用研究
    基于要素報(bào)酬的農(nóng)戶自然資源依賴度評(píng)價(jià)研究
    “上”與“下”語(yǔ)義的不對(duì)稱性及其認(rèn)知闡釋
    認(rèn)知范疇模糊與語(yǔ)義模糊
    基于模糊軟集合的區(qū)域信息生產(chǎn)力效能關(guān)鍵因素分析
    《草原》征集評(píng)論性作品
    草原(2011年4期)2011-11-21 00:30:00
    久久亚洲精品不卡| 琪琪午夜伦伦电影理论片6080| 叶爱在线成人免费视频播放| 久99久视频精品免费| 色av中文字幕| 午夜日韩欧美国产| 久久婷婷成人综合色麻豆| 久久国产精品男人的天堂亚洲| 岛国视频午夜一区免费看| 精品免费久久久久久久清纯| 中出人妻视频一区二区| 岛国在线观看网站| 美女大奶头视频| 黑丝袜美女国产一区| 桃红色精品国产亚洲av| 高清在线国产一区| 一二三四在线观看免费中文在| 无遮挡黄片免费观看| 国产三级黄色录像| 午夜精品在线福利| 精品第一国产精品| 国产亚洲av高清不卡| av在线播放免费不卡| 少妇裸体淫交视频免费看高清 | 中文字幕高清在线视频| 不卡一级毛片| 欧美黄色片欧美黄色片| 国产欧美日韩一区二区精品| 波多野结衣巨乳人妻| 丝袜在线中文字幕| videosex国产| 欧美黄色淫秽网站| 日韩精品中文字幕看吧| 黄色女人牲交| 嫁个100分男人电影在线观看| 久久伊人香网站| 岛国在线观看网站| 少妇被粗大的猛进出69影院| 大型av网站在线播放| 亚洲成国产人片在线观看| 香蕉久久夜色| 亚洲国产看品久久| 中国美女看黄片| www.精华液| 亚洲一区中文字幕在线| 国产精品98久久久久久宅男小说| 在线观看免费视频网站a站| а√天堂www在线а√下载| 在线av久久热| 天天一区二区日本电影三级 | 亚洲天堂国产精品一区在线| 妹子高潮喷水视频| 亚洲av日韩精品久久久久久密| 欧美日韩一级在线毛片| 亚洲国产日韩欧美精品在线观看 | 天天添夜夜摸| 亚洲欧美精品综合久久99| 波多野结衣巨乳人妻| 伊人久久大香线蕉亚洲五| 色综合站精品国产| 久久精品国产99精品国产亚洲性色 | 亚洲专区字幕在线| 村上凉子中文字幕在线| 69av精品久久久久久| 欧美成人免费av一区二区三区| 无限看片的www在线观看| 国产三级在线视频| 亚洲av第一区精品v没综合| 精品久久蜜臀av无| 国产精品国产高清国产av| 国产又色又爽无遮挡免费看| 日韩大码丰满熟妇| 窝窝影院91人妻| 一进一出抽搐gif免费好疼| 99在线人妻在线中文字幕| 国产欧美日韩一区二区精品| 美国免费a级毛片| 91成人精品电影| 成在线人永久免费视频| 无人区码免费观看不卡| 天天添夜夜摸| 亚洲专区中文字幕在线| 在线视频色国产色| 天堂动漫精品| 色播亚洲综合网| 免费不卡黄色视频| 免费观看精品视频网站| 9热在线视频观看99| 欧美日韩黄片免| 好男人电影高清在线观看| 午夜福利欧美成人| 国内久久婷婷六月综合欲色啪| 亚洲人成电影免费在线| 女警被强在线播放| 久久草成人影院| 久久久久国产一级毛片高清牌| 亚洲avbb在线观看| 看免费av毛片| 成人免费观看视频高清| 岛国视频午夜一区免费看| 亚洲激情在线av| 亚洲av成人av| 亚洲人成77777在线视频| 日韩av在线大香蕉| 后天国语完整版免费观看| 欧美中文综合在线视频| 午夜日韩欧美国产| 亚洲成人免费电影在线观看| 天天躁狠狠躁夜夜躁狠狠躁| 美女高潮喷水抽搐中文字幕| 国产高清有码在线观看视频 | 一级毛片精品| 亚洲国产高清在线一区二区三 | 国产一级毛片七仙女欲春2 | 欧美中文日本在线观看视频| 一边摸一边抽搐一进一出视频| 久久精品aⅴ一区二区三区四区| 国产精品香港三级国产av潘金莲| 亚洲国产欧美一区二区综合| 国产激情欧美一区二区| 美女免费视频网站| 精品欧美国产一区二区三| 国产激情欧美一区二区| 国产又爽黄色视频| 禁无遮挡网站| 国产亚洲精品一区二区www| 啦啦啦免费观看视频1| 久久久久久久久久久久大奶| 成人欧美大片| 久热这里只有精品99| 一本久久中文字幕| 国产亚洲精品av在线| 欧美av亚洲av综合av国产av| 久久久久国内视频| 精品卡一卡二卡四卡免费| 国产又爽黄色视频| 99精品久久久久人妻精品| 香蕉久久夜色| 欧美黑人精品巨大| 欧美日韩福利视频一区二区| 欧美国产精品va在线观看不卡| 一区二区日韩欧美中文字幕| 午夜精品在线福利| 少妇熟女aⅴ在线视频| 日韩欧美一区二区三区在线观看| 欧美色视频一区免费| 女人爽到高潮嗷嗷叫在线视频| 国产不卡一卡二| 国产亚洲av嫩草精品影院| 亚洲中文日韩欧美视频| 两个人免费观看高清视频| 波多野结衣一区麻豆| 精品国产国语对白av| 欧美在线黄色| 69精品国产乱码久久久| 欧美日韩瑟瑟在线播放| 变态另类丝袜制服| 午夜成年电影在线免费观看| 伊人久久大香线蕉亚洲五| 亚洲欧美一区二区三区黑人| 欧美最黄视频在线播放免费| 亚洲精品久久成人aⅴ小说| 久久九九热精品免费| 国产亚洲精品综合一区在线观看 | 国产亚洲精品第一综合不卡| 中文亚洲av片在线观看爽| 在线天堂中文资源库| 成人国语在线视频| 身体一侧抽搐| 亚洲av熟女| 欧美久久黑人一区二区| 夜夜爽天天搞| 亚洲天堂国产精品一区在线| 午夜影院日韩av| 夜夜爽天天搞| 一级毛片精品| 1024香蕉在线观看| 欧美中文日本在线观看视频| 一进一出抽搐gif免费好疼| 性色av乱码一区二区三区2| 亚洲第一电影网av| 亚洲伊人色综图| 母亲3免费完整高清在线观看| 久久热在线av| 国产精品香港三级国产av潘金莲| x7x7x7水蜜桃| 一区二区三区激情视频| 满18在线观看网站| 成人精品一区二区免费| 亚洲,欧美精品.| 一级作爱视频免费观看| 欧美激情久久久久久爽电影 | 一本综合久久免费| 一二三四社区在线视频社区8| 99久久精品国产亚洲精品| 欧美精品亚洲一区二区| 久久中文字幕人妻熟女| 夜夜躁狠狠躁天天躁| 涩涩av久久男人的天堂| 欧美乱妇无乱码| 国产熟女xx| 精品国产美女av久久久久小说| 非洲黑人性xxxx精品又粗又长| 美女国产高潮福利片在线看| 露出奶头的视频| √禁漫天堂资源中文www| 少妇粗大呻吟视频| 十八禁人妻一区二区| 欧美日本视频| 国产欧美日韩精品亚洲av| www国产在线视频色| 久久精品91蜜桃| av在线天堂中文字幕| 黄色丝袜av网址大全| www.自偷自拍.com| 一区二区三区精品91| 热re99久久国产66热| 国产高清激情床上av| 欧美日韩福利视频一区二区| 最近最新中文字幕大全免费视频| 国产亚洲欧美精品永久| 少妇粗大呻吟视频| 一区二区三区精品91| 无限看片的www在线观看| 99精品欧美一区二区三区四区| 亚洲人成伊人成综合网2020| 每晚都被弄得嗷嗷叫到高潮| 视频在线观看一区二区三区| 热re99久久国产66热| 色综合亚洲欧美另类图片| 老司机午夜十八禁免费视频| 少妇粗大呻吟视频| 国产精华一区二区三区| 不卡av一区二区三区| www.999成人在线观看| 中出人妻视频一区二区| 女人高潮潮喷娇喘18禁视频| 久99久视频精品免费| 国产精品免费视频内射| 久久人妻熟女aⅴ| 我的亚洲天堂| 久久天堂一区二区三区四区| 国产97色在线日韩免费| 国产一级毛片七仙女欲春2 | 亚洲精品国产色婷婷电影| 亚洲少妇的诱惑av| 亚洲一卡2卡3卡4卡5卡精品中文| 精品少妇一区二区三区视频日本电影| 亚洲av第一区精品v没综合| 精品国内亚洲2022精品成人| 日本欧美视频一区| 国产成人一区二区三区免费视频网站| 妹子高潮喷水视频| 高清毛片免费观看视频网站| 亚洲精品一卡2卡三卡4卡5卡| 亚洲av电影在线进入| av天堂久久9| 色在线成人网| 中文字幕人妻熟女乱码| 亚洲电影在线观看av| 亚洲七黄色美女视频| 波多野结衣巨乳人妻| 色综合亚洲欧美另类图片| 久久这里只有精品19| 国产午夜福利久久久久久| 69av精品久久久久久| 99久久99久久久精品蜜桃| 欧美黄色片欧美黄色片| 日韩欧美国产在线观看| av在线播放免费不卡| 免费不卡黄色视频| 乱人伦中国视频| 精品欧美国产一区二区三| 777久久人妻少妇嫩草av网站| 国产精品自产拍在线观看55亚洲| 国产精品野战在线观看| 久久久水蜜桃国产精品网| 国产精品 欧美亚洲| 涩涩av久久男人的天堂| 一区在线观看完整版| 又紧又爽又黄一区二区| 亚洲黑人精品在线| 欧美乱码精品一区二区三区| 日韩视频一区二区在线观看| 黄片播放在线免费| 欧美老熟妇乱子伦牲交| 日本在线视频免费播放| 日本 av在线| e午夜精品久久久久久久| 久久久久久人人人人人| 欧美成狂野欧美在线观看| 亚洲av五月六月丁香网| 亚洲国产精品成人综合色| 亚洲午夜理论影院| 成人亚洲精品一区在线观看| 看片在线看免费视频| 人人妻人人爽人人添夜夜欢视频| 制服人妻中文乱码| 久久精品国产清高在天天线| 久久久久精品国产欧美久久久| 啦啦啦免费观看视频1| 性少妇av在线| 黑人巨大精品欧美一区二区蜜桃| 欧美日韩福利视频一区二区| ponron亚洲| 高清毛片免费观看视频网站| 亚洲色图av天堂| 国产伦人伦偷精品视频| 久久久久久久久中文| 日本精品一区二区三区蜜桃| 九色国产91popny在线| 精品人妻在线不人妻| 欧美中文日本在线观看视频| 成人三级黄色视频| 欧美中文日本在线观看视频| 亚洲国产精品sss在线观看| 无人区码免费观看不卡| 亚洲午夜精品一区,二区,三区| 欧美黑人欧美精品刺激| 12—13女人毛片做爰片一| 亚洲 国产 在线| 亚洲性夜色夜夜综合| aaaaa片日本免费| 91在线观看av| 久久中文字幕一级| 日韩欧美在线二视频| 真人做人爱边吃奶动态| 久久久久亚洲av毛片大全| 满18在线观看网站| 午夜免费鲁丝| 国产在线观看jvid| 亚洲成av人片免费观看| 又黄又粗又硬又大视频| 久久精品国产清高在天天线| 精品无人区乱码1区二区| 岛国在线观看网站| 国产精品香港三级国产av潘金莲| 最近最新免费中文字幕在线| 九色国产91popny在线| 日本 av在线| 一卡2卡三卡四卡精品乱码亚洲| 人人妻,人人澡人人爽秒播| 一进一出抽搐动态| www.自偷自拍.com| av片东京热男人的天堂| 久久久国产欧美日韩av| 欧美色欧美亚洲另类二区 | 久久精品91无色码中文字幕| 国产乱人伦免费视频| 欧美在线一区亚洲| 欧美不卡视频在线免费观看 | 亚洲狠狠婷婷综合久久图片| 欧美乱码精品一区二区三区| 性色av乱码一区二区三区2| 国产精品亚洲美女久久久| 亚洲av电影在线进入| 精品高清国产在线一区| 99国产综合亚洲精品| 欧美日本视频| 免费女性裸体啪啪无遮挡网站| 国产亚洲精品av在线| 成在线人永久免费视频| 老司机深夜福利视频在线观看| 黄色视频,在线免费观看| 91在线观看av| 精品免费久久久久久久清纯| 老熟妇乱子伦视频在线观看| 欧美成人一区二区免费高清观看 | 非洲黑人性xxxx精品又粗又长| 大型黄色视频在线免费观看| 精品一区二区三区四区五区乱码| 国产男靠女视频免费网站| 操美女的视频在线观看| 欧美av亚洲av综合av国产av| 成年女人毛片免费观看观看9| 久久人人精品亚洲av| 97超级碰碰碰精品色视频在线观看| 国产精品影院久久| 欧美黄色淫秽网站| 国产又色又爽无遮挡免费看| 国产片内射在线| 国产精品久久久久久精品电影 | 中文亚洲av片在线观看爽| 十八禁人妻一区二区| 成人特级黄色片久久久久久久| 亚洲人成电影观看| 麻豆久久精品国产亚洲av| 欧美人与性动交α欧美精品济南到| 丝袜在线中文字幕| 久久久精品国产亚洲av高清涩受| 天天躁狠狠躁夜夜躁狠狠躁| 亚洲国产中文字幕在线视频| 国产91精品成人一区二区三区| 级片在线观看| 中文字幕人妻丝袜一区二区| 国产激情欧美一区二区| 天天添夜夜摸| 岛国在线观看网站| 日韩大码丰满熟妇| 成人av一区二区三区在线看| 精品国产一区二区久久| 村上凉子中文字幕在线| 美女扒开内裤让男人捅视频| 国产一卡二卡三卡精品| 一级毛片女人18水好多| 亚洲av电影在线进入| 国产成+人综合+亚洲专区| 国产高清有码在线观看视频 | 久久午夜综合久久蜜桃| 久久久水蜜桃国产精品网| 一级毛片高清免费大全| 黄频高清免费视频| 欧美不卡视频在线免费观看 | 此物有八面人人有两片| 十分钟在线观看高清视频www| 免费少妇av软件| √禁漫天堂资源中文www| 18禁国产床啪视频网站| 精品国内亚洲2022精品成人| 久久中文字幕人妻熟女| 老司机在亚洲福利影院| 香蕉国产在线看| 成人av一区二区三区在线看| 亚洲成a人片在线一区二区| 成人三级黄色视频| 在线播放国产精品三级| 在线免费观看的www视频| 人妻丰满熟妇av一区二区三区| 国产一区二区激情短视频| 黑人操中国人逼视频| 51午夜福利影视在线观看| 亚洲色图av天堂| 高清毛片免费观看视频网站| 日韩免费av在线播放| 夜夜夜夜夜久久久久| 免费少妇av软件| 亚洲第一电影网av| 啦啦啦 在线观看视频| 在线观看舔阴道视频| 最近最新中文字幕大全免费视频| 777久久人妻少妇嫩草av网站| 中国美女看黄片| 亚洲精品中文字幕在线视频| 性少妇av在线| avwww免费| av天堂久久9| 啦啦啦 在线观看视频| 国产亚洲精品av在线| av视频在线观看入口| 亚洲人成网站在线播放欧美日韩| 亚洲一卡2卡3卡4卡5卡精品中文| 午夜福利18| 美女扒开内裤让男人捅视频| 中文字幕人妻丝袜一区二区| 咕卡用的链子| 一级,二级,三级黄色视频| 亚洲一区二区三区色噜噜| 热99re8久久精品国产| 成人三级黄色视频| av天堂久久9| 久久香蕉国产精品| 久久精品亚洲熟妇少妇任你| 一边摸一边抽搐一进一小说| 欧美一区二区精品小视频在线| 欧美黄色淫秽网站| 婷婷六月久久综合丁香| 国内精品久久久久精免费| 国产精品自产拍在线观看55亚洲| 国产精品一区二区精品视频观看| 久9热在线精品视频| 最好的美女福利视频网| 亚洲国产中文字幕在线视频| 亚洲av成人av| 国产免费男女视频| 嫁个100分男人电影在线观看| 男人舔女人的私密视频| 婷婷丁香在线五月| 黄片小视频在线播放| 看片在线看免费视频| 日本a在线网址| 午夜两性在线视频| bbb黄色大片| 国产真人三级小视频在线观看| 久久久久精品国产欧美久久久| 啦啦啦 在线观看视频| 中文字幕精品免费在线观看视频| 久久久久久久久久久久大奶| 女人被躁到高潮嗷嗷叫费观| 亚洲成国产人片在线观看| 国产欧美日韩一区二区三| 免费一级毛片在线播放高清视频 | 国产一级毛片七仙女欲春2 | 日韩精品中文字幕看吧| 女生性感内裤真人,穿戴方法视频| 搡老熟女国产l中国老女人| 亚洲精华国产精华精| ponron亚洲| 婷婷丁香在线五月| 十八禁网站免费在线| 国产成+人综合+亚洲专区| 这个男人来自地球电影免费观看| 伊人久久大香线蕉亚洲五| 一卡2卡三卡四卡精品乱码亚洲| 91精品三级在线观看| 亚洲专区字幕在线| 国产精华一区二区三区| 91成人精品电影| 午夜久久久久精精品| videosex国产| 一级a爱视频在线免费观看| 免费在线观看黄色视频的| 午夜福利欧美成人| 国产激情欧美一区二区| 亚洲aⅴ乱码一区二区在线播放 | 黑人巨大精品欧美一区二区mp4| 国产极品粉嫩免费观看在线| 亚洲精品久久成人aⅴ小说| 亚洲精品av麻豆狂野| 18禁美女被吸乳视频| 国产午夜福利久久久久久| 欧美丝袜亚洲另类 | 久久国产亚洲av麻豆专区| 男女下面插进去视频免费观看| 亚洲中文字幕一区二区三区有码在线看 | 女同久久另类99精品国产91| 热99re8久久精品国产| 日本 av在线| 看片在线看免费视频| 久久久久久久久久久久大奶| 自线自在国产av| 久久伊人香网站| 久久精品人人爽人人爽视色| 九色亚洲精品在线播放| 热99re8久久精品国产| 黄色女人牲交| 国产亚洲精品av在线| 又大又爽又粗| 午夜福利18| 黄片播放在线免费| 亚洲欧美一区二区三区黑人| 亚洲成人久久性| 精品欧美一区二区三区在线| 亚洲熟妇熟女久久| 97人妻天天添夜夜摸| 热99re8久久精品国产| 国产免费av片在线观看野外av| 午夜日韩欧美国产| 日韩高清综合在线| 欧美日本亚洲视频在线播放| 国产成人av激情在线播放| 久久精品国产亚洲av高清一级| 丝袜在线中文字幕| 国产激情久久老熟女| 久久久久久国产a免费观看| 国产精品一区二区精品视频观看| 精品一区二区三区四区五区乱码| 宅男免费午夜| av电影中文网址| 久久午夜亚洲精品久久| 午夜福利欧美成人| 一区二区三区国产精品乱码| 久久天躁狠狠躁夜夜2o2o| 乱人伦中国视频| 久久国产精品人妻蜜桃| а√天堂www在线а√下载| 国产精品综合久久久久久久免费 | 久久人人精品亚洲av| 人人澡人人妻人| 亚洲精品中文字幕一二三四区| 99久久久亚洲精品蜜臀av| 午夜福利成人在线免费观看| videosex国产| 夜夜看夜夜爽夜夜摸| 狂野欧美激情性xxxx| АⅤ资源中文在线天堂| 九色亚洲精品在线播放| 桃色一区二区三区在线观看| www.999成人在线观看| 免费无遮挡裸体视频| aaaaa片日本免费| 99精品欧美一区二区三区四区| 女性被躁到高潮视频| 国产欧美日韩综合在线一区二区| 色综合亚洲欧美另类图片| 久久精品亚洲精品国产色婷小说| 久久久国产成人免费| 午夜福利一区二区在线看| 91在线观看av| 如日韩欧美国产精品一区二区三区| 亚洲第一av免费看| 国产1区2区3区精品| 亚洲人成电影观看| 欧美在线黄色| 亚洲国产欧美网| 久久九九热精品免费| 男女下面进入的视频免费午夜 | 在线观看66精品国产| 久久久国产成人精品二区| 国产午夜精品久久久久久| 精品不卡国产一区二区三区| 久久草成人影院| videosex国产| 国产午夜福利久久久久久| 午夜久久久在线观看| 久久中文字幕一级| 女人被躁到高潮嗷嗷叫费观| 亚洲精品国产色婷婷电影| 51午夜福利影视在线观看| 欧美+亚洲+日韩+国产| 久久人妻av系列| 欧美成人性av电影在线观看| 久久久久亚洲av毛片大全| 国内精品久久久久精免费| 午夜福利在线观看吧| 美女免费视频网站|