• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于BERT-MLDFA的內(nèi)容相近類目自動分類研究*
    ——以《中圖法》E271和E712.51為例

    2022-04-14 02:00:10李湘東石健孫倩茹賀超城
    數(shù)字圖書館論壇 2022年2期
    關(guān)鍵詞:中圖法類目語義

    李湘東 石健 孫倩茹 賀超城

    (1. 武漢大學(xué)信息管理學(xué)院,武漢 430072;2. 武漢大學(xué)電子商務(wù)研究與發(fā)展中心,武漢 430072)

    基于科學(xué)分類體系的分類法在網(wǎng)絡(luò)信息資源的系統(tǒng)組織和知識導(dǎo)航中具有重要作用。但隨著數(shù)字資源的激增,人工分類組織效率低下導(dǎo)致其中一些資源網(wǎng)關(guān)已停止服務(wù),迫切需要自動分類技術(shù)來解決上述問題[1]。在《中國圖書館分類法》(以下簡稱《中圖法》)中,同一大類的眾多下位類之間內(nèi)容十分相近、語義關(guān)聯(lián)度大、區(qū)分度小[2],這些下位類在自動分類研究中稱為內(nèi)容相近類目,是人工分類和自動分類的共同難點。

    《中圖法》中存在大量內(nèi)容相近類目,例如E大類下的E271(中國陸軍)和E712.51(美國陸軍)。這兩個類別的書目信息雖然都是陸軍主題,但所使用的詞語里大多沒有明確提及中國或美國等地區(qū)概念,難以在E大類的二級層次分類時予以區(qū)分至E2或者E7之中,更多是通過“游擊隊”和“野戰(zhàn)排”、“坑道戰(zhàn)中使用手榴彈”和“叢林戰(zhàn)中使用手雷”等細微語義差別來區(qū)分,給基于機器學(xué)習方法的自動分類任務(wù)造成極大的困難。為切實提高區(qū)分兩個內(nèi)容相近類目文本之間細微語義差別的能力,本文以《中圖法》中兩個內(nèi)容相近類目的書目信息作為分類對象,針對目前主流的BERT(Bidirectional Encoder Representations from Transformers)深度學(xué)習模型不能充分利用學(xué)習到的全部語義信息的缺點,通過多層級注意力機制對BERT不同層參數(shù)進行動態(tài)融合,提出改進的BERT-MLDFA(BERT with Multi-Layers Dynamic Fusion based on Attention)模型,并在該模型的基礎(chǔ)上對任務(wù)數(shù)據(jù)集進一步預(yù)訓(xùn)練,提高分類效果。本研究提出的方法是實現(xiàn)3個及以上內(nèi)容相近類目之間自動分類的核心技術(shù),是實現(xiàn)《中圖法》自動分類的基礎(chǔ)性研究。

    1 研究現(xiàn)狀及意義

    在《中圖法》的自動分類研究中,分類的對象一般是由題名、關(guān)鍵詞和摘要等構(gòu)成的文本信息,分類方法包括經(jīng)典機器學(xué)習方法和深度學(xué)習方法。有學(xué)者[3-6]使用最近鄰(K Nearest Neighbor,KNN)、樸素貝葉斯(Naive Bayes,NB)、支持向量機(Support Vector Machine,SVM)等經(jīng)典機器學(xué)習分類算法中的一種或多種在《中圖法》分類體系下對圖書、網(wǎng)頁或者其他類型的文獻進行自動分類。近些年,基于長短期記憶模型(Long Short-Term Memory,LSTM)、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)和BERT等深度學(xué)習模型在自動分類領(lǐng)域取得了極大的成功,鄧三鴻等[7]、郭利敏[8]和羅鵬程等[9]分別將LSTM、CNN和BERT用于《中圖法》自動分類中,均取得了不錯的分類效果。以上研究有一個共同點,即這些分類研究的對象一般是《中圖法》上位類和中位類中比較容易區(qū)分的類別,沒有聚焦于下位類中內(nèi)容相近類目之間的難分類對象上。然而,《中圖法》龐大的分類體系本身以及其特有的復(fù)分仿分機制使得同一大類下具有眾多下位類,這些下位類別之間的主題非常接近、難以區(qū)分。因此,在自動分類時需要模型能夠捕捉《中圖法》內(nèi)容相近類目文本之間的細微語義差別。在《中圖法》內(nèi)容相近類目分類方面,已有為數(shù)不多的相關(guān)研究是基于經(jīng)典機器學(xué)習方法的,李湘東等[10]基于KNN、NB和SVM經(jīng)典機器學(xué)習方法實現(xiàn)內(nèi)容相近類目的分類;此外,還通過改進互信息特征選擇法實現(xiàn)內(nèi)容相近類目特征提取,并結(jié)合KNN分類算法實現(xiàn)內(nèi)容相近類目的分類[11],尚未見使用深度學(xué)習方法的相關(guān)研究。這些經(jīng)典機器學(xué)習方法在處理文本時未考慮詞語的上下文語義信息,而LSTM、CNN和BERT深度學(xué)習方法在一定程度上考慮了詞語的上下文語義關(guān)系或者局部語義關(guān)系,在捕捉細微語義差別的能力上強于經(jīng)典機器學(xué)習方法。因此,《中圖法》內(nèi)容相近類目自動分類需要探索使用深度學(xué)習方法,以取得更好的分類效果。

    《中圖法》中內(nèi)容相近類目由2個及以上類目構(gòu)成,需要二分類或者多分類技術(shù)對其進行自動分類。3個及以上類目的多分類問題可以通過一對一分解轉(zhuǎn)換為多組二分類問題,因此二分類是多分類的基礎(chǔ)[12]。目前,二分類技術(shù)主要集中在自動分類研究中的情感二分類上[11],例如微博評論情感分析等。在兩類擇一的分類目標上以及兩個類目的文本內(nèi)容高度相似方面,情感二分類與《中圖法》中兩個內(nèi)容相近類目的自動分類極為相似。實際上,李湘東等[10-11]就是針對《中圖法》中兩個內(nèi)容相近類目的分類時使用了二分類技術(shù)。Li[13]和Ling[14]等指出微博情感分析實際上是一個將微博評論信息歸類為積極或者消極的二分類問題,歸類的難點在于評論信息中存在一些相似性極高卻從屬不同情感詞,以及同一個詞語在不同的語義環(huán)境下表達相反的情感,這些詞語造成不同類目之間文本的高度相似性?,F(xiàn)有研究[15-17]通過LSTM、CNN和BERT等深度學(xué)習模型獲取這些詞語在文中的語義信息,并應(yīng)用于微博情感分析,取得了不錯的分類效果,其中BERT表現(xiàn)最好。為了解釋BERT為何能夠取得很好的分類效果,Jawahar等[18]證明了具有12層級結(jié)構(gòu)的BERT的不同層學(xué)習到了不同的語義信息,在BERT的底層、中間層和頂層分別學(xué)習到了表面特征、句法特征和語義特征,BERT利用頂層學(xué)習的語義特征信息為BERT的分類效果打下了良好的基礎(chǔ)。但是BERT在做分類任務(wù)時,只利用最后一層參數(shù)進行分類,忽略了BERT其他層學(xué)習的語義信息。為了利用這些語義信息,李寧健等[19]通過CNN連接BERT的12層層級結(jié)構(gòu),提出BERT-MLF模型,并將該模型應(yīng)用于情感分析任務(wù)中,取得了比BERT更好的分類效果。然而,BERT-MLF中的CNN結(jié)構(gòu)不能為BERT不同層學(xué)習到的語義信息分配不同的權(quán)重,對BERT不同層參數(shù)進行動態(tài)融合時,在去除部分噪聲語義信息的同時可能會丟失關(guān)鍵語義信息,從而導(dǎo)致分類性能下降?;诙鄬蛹壸⒁饬C制對BERT的12層參數(shù)賦予不同的權(quán)重是一個很好的思路,能為關(guān)鍵語義信息和噪聲語義信息做自適應(yīng)的權(quán)重分配,進而提升分類效果。本文使用的BERT是在使用中文維基百科等一般性語料上進行預(yù)訓(xùn)練所生成的,中文維基百科在內(nèi)容上涵蓋各學(xué)科領(lǐng)域以及社會生活的各個方面,具有較強的通用性,但也不能保證在面對文獻分類等特定任務(wù)時具有較強的專指性。為此,需要針對具體的任務(wù)在上述中文維基百科等一般性語料的基礎(chǔ)上進一步追加任務(wù)數(shù)據(jù)集繼續(xù)進行預(yù)訓(xùn)練(Task-Adaptive Pretraining,以下簡稱“TAPT操作”)[20]。TAPT操作使BERT及其改進模型在具體任務(wù)上具有較強的專指性,通過擴大TAPT操作時任務(wù)數(shù)據(jù)集的內(nèi)容使得模型在該任務(wù)上的專指性范圍更廣,或者通過更換TAPT操作的任務(wù)數(shù)據(jù)集使得模型在各自的任務(wù)上都具有各自相應(yīng)的專指性,因此BERT及其改進模型結(jié)合TAPT操作可以適用于任務(wù)范圍的擴大以及任務(wù)的更換,具有較強普適性。因此,針對《中圖法》內(nèi)容相近類目分類,BERT及其改進模型結(jié)合TAPT操作,分類效果可以得到更大程度的提升。

    基于在《中圖法》內(nèi)容相近類目分類中缺乏并且需要深度學(xué)習方法的現(xiàn)狀,同時內(nèi)容相近類目分類研究主要集中在二分類方向上,本文在實驗對象的選擇上使用《中圖法》兩個內(nèi)容相近類目開展二分類,并采用LSTM、CNN、BERT深度學(xué)習模型對其進行自動分類,比較這些深度學(xué)習方法相對于KNN、NB和SVM經(jīng)典機器學(xué)習方法的優(yōu)越性。針對BERT相比于LSTM、CNN分類效果更好并且BERT未能充分利用全部語義信息的現(xiàn)狀,本文基于注意力機制對BERT不同層參數(shù)進行動態(tài)融合,提出改進的BERT-MLDFA模型。針對BERT及其改進模型結(jié)合TAPT操作可以更大程度提升分類效果,文本在BERT-MLDFA模型的基礎(chǔ)上進行TAPT操作,以優(yōu)化對《中圖法》內(nèi)容相近類目進行自動分類的效果。本文在《中圖法》兩個內(nèi)容相近類目之間進行二分類研究,為實現(xiàn)3個或3個以上內(nèi)容相近類目之間的自動分類打下更好的基礎(chǔ),具有較強的理論意義和實踐價值。

    2 基于深度學(xué)習的自動分類框架

    2.1 基于LSTM和CNN的自動分類框架

    LSTM和CNN是文本分類中兩個基礎(chǔ)且經(jīng)典的深度學(xué)習模型,但在《中圖法》內(nèi)容相近類目自動分類中缺乏相關(guān)的應(yīng)用研究。LSTM模型是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),采用遺忘門、輸入門和輸出門3個門控函數(shù)獲取文本序列的時序關(guān)系,從而取得文本特征之間的上下文信息。CNN主要由輸入層、卷積層、池化層組成,卷積層通過卷積核獲取特征之間的局部信息。LSTM忽略了特征之間的局部信息,CNN忽略了特征之間的上下文信息,因此二者在自動分類中各有優(yōu)劣[21]。LSTM和CNN在自動分類時,通常結(jié)合Word2Vec詞嵌入模型,以獲取更好的分類效果,成為慣用的分類方法[22-23]。因此,針對《中圖法》內(nèi)容相近類目自動分類,本文首先采用典型的深度學(xué)習模型LSTM和CNN,結(jié)合Word2Vec詞嵌入模型,設(shè)計相關(guān)研究框架,如圖1所示。

    圖1 基于LSTM和CNN的自動分類框架

    基于LSTM和CNN的文本分類過程主要分為如下4個步驟。

    (1)構(gòu)建詞語特征集合。具體包括,對訓(xùn)練集和測試集的文本使用python的jieba詞庫進行分詞,并采用哈工大停用詞表對分詞結(jié)果去停用詞,得到訓(xùn)練集和測試集的詞語特征集合。

    (2)詞嵌入表示。具體包括,針對前述步驟(1)得到的訓(xùn)練集和測試集的詞語特征集合,使用在維基百科語料上訓(xùn)練的Word2Vec詞嵌入模型對其進行詞嵌入表示,得到訓(xùn)練集和測試集的詞嵌入特征表示集合。

    (3)創(chuàng)建并訓(xùn)練模型。具體包括,創(chuàng)建LSTM和CNN分類模型,并將前述步驟(2)得到的訓(xùn)練集文本的詞嵌入表示集合輸入到神經(jīng)網(wǎng)絡(luò)模型中的詞嵌入層作為LSTM和CNN的輸入,然后對模型進行訓(xùn)練,得到訓(xùn)練好的LSTM和CNN神經(jīng)網(wǎng)絡(luò)模型。

    (4)分類預(yù)測。具體包括,將前述步驟(2)得到的測試集文本的詞嵌入表示集合輸入到前述步驟(3)中已經(jīng)訓(xùn)練好的LSTM和CNN神經(jīng)網(wǎng)絡(luò)模型中進行分類預(yù)測,得到分類結(jié)果。

    2.2 基于BERT的自動分類框架

    BERT是基于雙向的Transformer模塊結(jié)合而成的多層級結(jié)構(gòu)[24],在預(yù)訓(xùn)練過程中,采用遮罩語言模型(Masked Language Model,MLM)和下一句預(yù)測(Next Sentence Prediction,NSP)生成深度的雙向語言表征,通過位置編碼獲取特征的上下文位置關(guān)系,從而根據(jù)上下文得到特征的動態(tài)向量表示,在自動分類上取得了比LSTM和CNN更好的效果,成為目前的主流模型。為了提升《中圖法》內(nèi)容相近類目自動分類效果,本文采用BERT模型并設(shè)計研究框架,如圖2所示。

    圖2 基于BERT的自動分類框架

    基于BERT模型的自動分類過程主要分為如下4個步驟。

    (1)構(gòu)建BERT特征向量表示。將訓(xùn)練集和測試集文本按照BERT預(yù)訓(xùn)練模型的輸入格式進行預(yù)處理,構(gòu)造特征向量表示,特征向量包括字向量、分段向量和位置編碼向量3個部分。

    (2)創(chuàng)建模型。創(chuàng)建BERT分類模型,并將BERT預(yù)訓(xùn)練模型權(quán)重初始化到BERT模型中。BERT模型結(jié)合TAPT操作,則將初始化權(quán)重之后的BERT模型進一步在任務(wù)數(shù)據(jù)集上預(yù)訓(xùn)練,預(yù)訓(xùn)練包括MLM任務(wù)和NSP任務(wù)[24],并將權(quán)重更新到BERT模型中。

    (3)訓(xùn)練模型。將前述步驟(1)得到的訓(xùn)練集BERT特征向量表示輸入到前述步驟(2)中創(chuàng)建的BERT模型中進行訓(xùn)練,對BERT參數(shù)進行微調(diào),得到訓(xùn)練好的BERT分類模型。

    (4)分類預(yù)測。具體包括,將前述步驟(1)得到的測試集BERT特征向量表示輸入到前述步驟(3)中訓(xùn)練好的BERT模型中進行分類預(yù)測,得到分類結(jié)果。

    2.3 基于改進的BERT-MLDFA的自動分類框架

    在做分類任務(wù)時,BERT只在最后一層參數(shù)上連接全連接層做分類,忽略了其他層學(xué)習的語義信息。為了進一步提升《中圖法》內(nèi)容相近類目的分類效果,本文對EBRT模型進行改進,提出一種改進的BERTMLDFA模型,該方法基于注意力機制對BERT不同層特征進行融合,在融合過層中賦予不同層特征不同的權(quán)重并且權(quán)重在訓(xùn)練過程中自適應(yīng)更新,從而可以充分利用BERT不同層學(xué)習的語義信息,得到語義信息豐富的特征表示,使得模型更好地學(xué)習和區(qū)分內(nèi)容相近類目的文本類別?;诟倪M的BERT-MLDFA模型自動分類框架如圖3所示。

    圖3 基于BERT-MLDFA的自動分類框架

    BERT-MLDFA模型首先將BERT的12層的每一層參數(shù)都經(jīng)過最大池化計算,得到隱含狀態(tài)h作為注意力機制層的輸入,基于注意力機制為12層參數(shù)賦予不同的權(quán)重,得到融合特征C,融合特征C經(jīng)過全連接層和softmax計算,通過兩次Dropout取平均值作為最終分類概率,兩次Dropout比率分別取值為0.1和0.2。

    基于BERT-MLDFA模型的文本分類過程和BERT模型大致保持一致,需要將步驟(2)中創(chuàng)建的BERT模型替換為BERT-MLDFA模型,在使用BERT預(yù)訓(xùn)練模型對BERT模型進行初始化的同時,需要隨機初始化BERT-MLDFA模型中的注意力機制層參數(shù)。

    3 實驗設(shè)計與分析

    3.1 實驗材料與評價方法

    本文的實驗對象是《中圖法》中E271與E712.51兩個類目,其原因在于這兩個類目的典型性以及與過往研究在分類效果上的可比性。從文本用詞方面看,這兩個類同屬軍事主題,僅有中國和美國地區(qū)不同,文本用詞相似,導(dǎo)致文本內(nèi)容十分相近(見表1),因此,E271與E712.51能夠比較好地代表使用自動方法難以區(qū)分的同一大類下的眾多相似的下位類。從《中圖法》體系結(jié)構(gòu)上看,在二級類目上,E7的專類復(fù)分表與E2雖然并不完全一致(這也是未直接仿E2分的原因),但體系極其類似,具體到E271和E712.51兩個類目,雖然在類目體系上不是復(fù)分仿分,但屬于相同的主題,這與《中圖法》對于地區(qū)與主題的復(fù)分仿分機制所產(chǎn)生的眾多類目在內(nèi)容的高度相似性上是一致的,在這兩個類目上檢驗的自動分類方法可以有效地應(yīng)用于其他復(fù)分仿分機制所產(chǎn)生的類目。從實驗的嚴謹性上看,這兩個類作為內(nèi)容相近類目的分類對象,已有基于經(jīng)典機器學(xué)習方法的相關(guān)成果,將其與本文的研究方法進行對比分析,以科學(xué)地驗證深度學(xué)習方法相比于經(jīng)典機器學(xué)習方法的優(yōu)越性以及本文方法的有效性。

    表1 E271與E712.51數(shù)據(jù)樣本

    本文從維普數(shù)據(jù)庫中提取E271和E712.51兩個內(nèi)容極為相近的語料作為實驗的數(shù)據(jù)來源。其中,一共搜集E271的文檔共616篇,E712.51文檔1 366篇。每篇文檔包括題名、關(guān)鍵詞和摘要三部分信息,且兩類文本數(shù)據(jù)集不存在交叉現(xiàn)象。對文本長度按照字符數(shù)進行統(tǒng)計,文本長度最短為37字符,最長為664字符,80%的文本長度集中在50~300字符之間。

    以圖書為例,即便擁有1 000萬種(不含復(fù)本)圖書的大型圖書館,在《中圖法》5萬多個類目中,平均每一個類目不到200冊,因此,針對少樣本的自動分類方法研究必須考慮今后應(yīng)用時的可供實際使用的數(shù)據(jù)量。在實驗對象的樣本數(shù)量選擇上,本文選擇訓(xùn)練集的數(shù)量為200篇。為保證實驗結(jié)果不受隨機性和不平衡數(shù)據(jù)的影響,本文采用平衡數(shù)據(jù)集并將實驗材料分為5組,每組實驗材料在E271和E712.51中隨機抽取200篇文檔作為訓(xùn)練集,為保證訓(xùn)練集和測試集的文本無重復(fù),在剩余的文檔中隨機抽取100篇文檔作為測試集。分別對5組實驗材料進行實驗,記錄每組實驗結(jié)果,取5組實驗結(jié)果的平均值作為最終實驗結(jié)果。

    為驗證本文提出方法對內(nèi)容相近類目分類的有效性,本文綜合準確率和召回率計算F1值[25],由于實驗材料中兩個類目的文本數(shù)量相等,宏平均F1值(Macro_F1)和微平均F1值(Micro_F1)保持一致,因此本文以Macro_F1值代表實驗的分類效果,Macro_F1值越接近于1,分類效果越好。

    3.2 實驗環(huán)境及參數(shù)設(shè)置

    本文實驗基于Ubuntu操作系統(tǒng),顯存的大小為16G,并以Python編程語言和Torch1.8深度學(xué)習框架搭建神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。在預(yù)備實驗中,確定了LSTM、CNN、BERT及其改進模型的超參數(shù),包括學(xué)習率、批處理大小、訓(xùn)練迭代次數(shù)、文本最大長度等。LSTM和CNN的超參數(shù)取值分別為1e-3、60、30、512,BERT及其改進模型的超參數(shù)取值分別為2e-5、9、10、512。

    3.3 實驗結(jié)果與分析

    對于內(nèi)容相近類目的二分類,本文設(shè)置三組對比實驗。首先,基于LSTM、CNN和BERT等深度學(xué)習方法對《中圖法》的E271和E712.51進行自動分類,研究深度學(xué)習方法相比于KNN、NB和SVM等經(jīng)典機器學(xué)習方法的優(yōu)越性;其次,本文基于注意力機制對BERT不同層參數(shù)進行動態(tài)融合,提出改進的BERT-MLDFA模型,并與基于CNN對BERT不同層參數(shù)進行融合的BERT-MLF模型進行對比,分析本文方法的優(yōu)越性;最后,在BERT預(yù)訓(xùn)練模型的基礎(chǔ)上,進一步在E271和E712.51的書目信息上預(yù)訓(xùn)練,對比分析TAPT操作的效果。

    第一組對比實驗的基準實驗是基于KNN、NB和SVM等經(jīng)典機器學(xué)習分類算法的分類效果,因此取文獻[11]中在不同參數(shù)組合下的最優(yōu)結(jié)果作為基準實驗結(jié)果,并與本文采用的LSTM、CNN和BERT深度學(xué)習方法取得的實驗結(jié)果進行比較。KNN、NB和SVM的Macro_F1值分別為0.951、0.959和0.963,LSTM、CNN和BERT的Macro_F1值分別為0.966、0.964和0.980。從實驗結(jié)果可以看出,針對《中圖法》內(nèi)容相近類目分類,在KNN、NB、SVM經(jīng)典機器學(xué)習方法中,SVM表現(xiàn)最好,相比于KNN和NB,Macro_F1值分別提升1.2%和0.4%;在LSTM、CNN、BERT深度學(xué)習方法中,BERT表現(xiàn)最好,相比于LSTM和CNN,Macro_F1值分別提升1.4%和1.6%;本文采用的3種深度學(xué)習方法整體優(yōu)于3種經(jīng)典機器學(xué)習方法,BERT相比于SVM的Macro_F1值提升1.7%。

    第二組的對比實驗是BERT、BERT-MLF模型與本文提出的BERT-MLDFA模型分類效果對比,3個模型的Macro_F1值分別為0.980、0.981和0.983。從實驗結(jié)果可以看出,針對《中圖法》內(nèi)容相近類目分類,本文提出的BERT-MLDFA模型表現(xiàn)最好,相比于BERT提升0.3%,相比于BERT-MLF提升0.2%,在BERT的0.980的基線效果上更接近于1。

    第三組對比實驗是對比分析TAPT操作在BERT及其改進模型中的效果。BERT、BERT-MLF和BERTMLDFA結(jié)合TAPT操作的Macro_F1值分別為0.983、0.983和0.987。從實驗結(jié)果可以看出,BERT及其改進模型進行TAPT操作之后,Macro_F1值都有所提升,其中BERT-MLDFA結(jié)合TAPT提升最明顯,相比于BERT-MLDFA提升0.4%,相比于BERT提升0.7%。同時,由于《中圖法》中數(shù)目數(shù)量巨大,例如對于一個有1 000萬種圖書的大型圖書館,在《中圖法》5萬多個類目中,即使是0.7%的提升,也有可能使7萬本圖書被正確分類,能夠帶來巨大的時間和經(jīng)濟效益,因此具有很強的現(xiàn)實意義。

    從以上三組對比實驗分析可以得出以下3個結(jié)論。

    (1)在《中圖法》內(nèi)容相近類目自動分類中,深度學(xué)習方法的分類效果優(yōu)于經(jīng)典機器學(xué)習方法。

    (2)在《中圖法》內(nèi)容相近類目自動分類中,本文提出的改進的BERT-MLDFA模型表現(xiàn)最好,基于注意力機制對BERT不同層參數(shù)進行動態(tài)融合時可以結(jié)合文本的表面特征、句法特征、語義特征,能夠捕捉關(guān)聯(lián)度大、區(qū)分度小的文本之間的細微語義差別,證明了BERT-MLDFA在解決內(nèi)容相近類目分類問題時的優(yōu)越性。

    (3)BERT及其改進模型在模型初始化權(quán)重之后,進行TAPT操作,即使用內(nèi)容相似類目的E271和E712.51數(shù)據(jù)集繼續(xù)進行預(yù)訓(xùn)練,可以進一步提升內(nèi)容相近類目分類效果。針對其他內(nèi)容相似類目進行分類,可以將E271和E712.51數(shù)據(jù)集更換為《中圖法》上其他內(nèi)容相似類目的數(shù)據(jù)集,因此,BERT及其改進模型結(jié)合TAPT操作具有較強普適性,可以有效應(yīng)用于《中圖法》以及其他內(nèi)容相近類目分類中。

    4 結(jié)語

    針對內(nèi)容相近類目的分類是《中圖法》分類系統(tǒng)中一個十分重要的研究方向。由于內(nèi)容相近類目文本之間關(guān)聯(lián)度大、區(qū)分度小,在語義信息上只有細微差別,給自動分類帶來了極大的困難。本文以《中圖法》中E271和E712.51兩個類別作為兩個典型的內(nèi)容相近類目,展開自動分類研究。實驗結(jié)果表明,LSTM、CNN和BERT深度學(xué)習方法比KNN、NB、SVM更好;在深度學(xué)習方法中,BERT比LSTM和CNN更好;BERTMLDFA模型能夠獲取內(nèi)容相近類目文本之間的細微語義差別,相比于BERT分類效果進一步提升;BERTMLDFA結(jié)合TAPT操作具有較強普適性,可以取得更好的分類效果。本文方法可以較好地應(yīng)用于《中圖法》以及內(nèi)容相近類目分類中,但是BERT-MLDFA模型對BERT的不同層參數(shù)自適應(yīng)的權(quán)重是如何分配的缺乏深入研究,導(dǎo)致該模型的可解釋性不足是本文研究的一個局限。進一步探索本文提出的BERT-MLDFA模型的可解釋性以及在其他更多內(nèi)容相近類目中的應(yīng)用,成為未來的研究重點。

    猜你喜歡
    中圖法類目語義
    本期練習題類目參考答案及提示
    語言與語義
    “上”與“下”語義的不對稱性及其認知闡釋
    認知范疇模糊與語義模糊
    《中圖法》第5版交替類目研究綜述
    黃三角、長三角、珠三角明、清及民國通志一級類目比較*
    圖書館論壇(2015年2期)2015-01-03 01:43:00
    知識圖譜視角下《中國圖書館分類法》研究演進與思考
    DDC22與CLC5化學(xué)類目映射分析
    《中圖法》與《中分表》修訂信息(連載3)
    我刊與《中圖法》編委會合作開設(shè)“中圖法信息”專欄
    日本与韩国留学比较| 嫩草影院入口| 精品无人区乱码1区二区| 亚洲精品乱码久久久v下载方式| 精品久久久久久久人妻蜜臀av| 亚洲中文字幕日韩| 色综合亚洲欧美另类图片| 欧美性感艳星| 最近的中文字幕免费完整| 国产高清三级在线| 国产极品精品免费视频能看的| 国产一区二区三区av在线| 国国产精品蜜臀av免费| 国产麻豆成人av免费视频| 国产又黄又爽又无遮挡在线| 国产精品一区二区在线观看99 | 99热精品在线国产| 国产v大片淫在线免费观看| 天堂影院成人在线观看| 在线天堂最新版资源| 成人国产麻豆网| 听说在线观看完整版免费高清| 国产精品久久久久久精品电影小说 | 内地一区二区视频在线| a级一级毛片免费在线观看| 国产一级毛片七仙女欲春2| 久久精品夜夜夜夜夜久久蜜豆| 成年女人永久免费观看视频| 水蜜桃什么品种好| a级一级毛片免费在线观看| 中文天堂在线官网| 久久久精品94久久精品| 午夜激情欧美在线| 中文资源天堂在线| 成人三级黄色视频| 最近中文字幕高清免费大全6| 三级国产精品片| 亚洲av中文字字幕乱码综合| 午夜福利在线在线| 青青草视频在线视频观看| 少妇人妻精品综合一区二区| 久久亚洲国产成人精品v| 男女啪啪激烈高潮av片| 我要看日韩黄色一级片| 久久草成人影院| 国产伦理片在线播放av一区| 日本色播在线视频| 亚洲国产精品成人综合色| 一级av片app| 欧美人与善性xxx| 日产精品乱码卡一卡2卡三| 丰满乱子伦码专区| 日本黄色片子视频| 欧美日韩国产亚洲二区| 少妇被粗大猛烈的视频| 在线观看美女被高潮喷水网站| 少妇熟女欧美另类| 亚洲av中文字字幕乱码综合| 久久欧美精品欧美久久欧美| 视频中文字幕在线观看| 精品99又大又爽又粗少妇毛片| 久久精品国产亚洲av涩爱| 久久99蜜桃精品久久| 激情 狠狠 欧美| 免费黄色在线免费观看| 天堂av国产一区二区熟女人妻| 国产免费一级a男人的天堂| 国产成年人精品一区二区| 亚洲精品国产av成人精品| 久久久久久久久久久丰满| 国产精品1区2区在线观看.| 婷婷六月久久综合丁香| 精品欧美国产一区二区三| 老女人水多毛片| 精品国产露脸久久av麻豆 | 国产成人精品婷婷| 国产真实乱freesex| 成人一区二区视频在线观看| 亚洲乱码一区二区免费版| 青春草亚洲视频在线观看| 国产69精品久久久久777片| 日韩在线高清观看一区二区三区| 午夜福利高清视频| 成人漫画全彩无遮挡| 国产乱来视频区| 人人妻人人看人人澡| 亚洲激情五月婷婷啪啪| 观看美女的网站| 男人狂女人下面高潮的视频| 久久久久久久久久久免费av| 亚洲av免费在线观看| 国产精品熟女久久久久浪| 国产成人精品一,二区| 亚洲欧美精品自产自拍| 淫秽高清视频在线观看| 亚洲国产成人一精品久久久| 你懂的网址亚洲精品在线观看 | 久久久久久久久中文| 神马国产精品三级电影在线观看| av在线播放精品| 蜜桃久久精品国产亚洲av| h日本视频在线播放| 日韩制服骚丝袜av| 国产片特级美女逼逼视频| 啦啦啦韩国在线观看视频| 国产乱人视频| 免费观看性生交大片5| 特大巨黑吊av在线直播| 国产白丝娇喘喷水9色精品| 婷婷六月久久综合丁香| 国产精品美女特级片免费视频播放器| 久久精品国产亚洲av涩爱| 26uuu在线亚洲综合色| 99国产精品一区二区蜜桃av| 国产日韩欧美在线精品| 免费看a级黄色片| 一个人免费在线观看电影| 久热久热在线精品观看| 人体艺术视频欧美日本| 久久精品综合一区二区三区| 18禁动态无遮挡网站| 国产毛片a区久久久久| 午夜a级毛片| 日韩高清综合在线| 欧美变态另类bdsm刘玥| 深夜a级毛片| 欧美激情在线99| 亚洲精品乱码久久久v下载方式| 插逼视频在线观看| 久久久久久大精品| 又爽又黄无遮挡网站| 色综合色国产| 国产国拍精品亚洲av在线观看| 亚洲成人久久爱视频| 高清视频免费观看一区二区 | 69av精品久久久久久| 亚洲美女搞黄在线观看| 日本免费在线观看一区| 久久久精品欧美日韩精品| 免费看av在线观看网站| 亚洲色图av天堂| av免费在线看不卡| 好男人在线观看高清免费视频| 日韩一区二区视频免费看| 2022亚洲国产成人精品| 久久久精品大字幕| 成人三级黄色视频| 能在线免费看毛片的网站| 久久精品熟女亚洲av麻豆精品 | 久久亚洲精品不卡| 日韩av在线大香蕉| 国产视频内射| 日韩一区二区三区影片| 国产精品.久久久| 久久精品久久久久久噜噜老黄 | av在线亚洲专区| 人人妻人人澡欧美一区二区| 国产男人的电影天堂91| 日韩成人av中文字幕在线观看| 99久国产av精品国产电影| 18禁动态无遮挡网站| 不卡视频在线观看欧美| 国产乱人视频| 综合色av麻豆| 国产精品熟女久久久久浪| 天堂影院成人在线观看| 特级一级黄色大片| 日韩人妻高清精品专区| 日韩精品青青久久久久久| 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 成年免费大片在线观看| 午夜精品一区二区三区免费看| 三级经典国产精品| 男女啪啪激烈高潮av片| 国产成人91sexporn| 久久久精品94久久精品| 最后的刺客免费高清国语| 成人鲁丝片一二三区免费| 麻豆一二三区av精品| 永久网站在线| 亚洲美女视频黄频| 狂野欧美白嫩少妇大欣赏| 特级一级黄色大片| 变态另类丝袜制服| 免费黄网站久久成人精品| 国产免费一级a男人的天堂| 在线观看美女被高潮喷水网站| 级片在线观看| 黄片无遮挡物在线观看| 亚洲最大成人手机在线| 女人久久www免费人成看片 | 亚洲国产精品合色在线| 亚洲内射少妇av| 欧美成人精品欧美一级黄| 色网站视频免费| 亚洲国产欧美人成| 国产又黄又爽又无遮挡在线| 3wmmmm亚洲av在线观看| 国产成人aa在线观看| www.av在线官网国产| 国产亚洲91精品色在线| 欧美成人午夜免费资源| 亚洲乱码一区二区免费版| 18禁裸乳无遮挡免费网站照片| 美女被艹到高潮喷水动态| av国产免费在线观看| 男人的好看免费观看在线视频| 日日摸夜夜添夜夜添av毛片| 美女黄网站色视频| 亚洲精品456在线播放app| 中文亚洲av片在线观看爽| 国产视频首页在线观看| 成人美女网站在线观看视频| 亚洲欧美成人综合另类久久久 | 精品久久久久久久久亚洲| 禁无遮挡网站| 国产精品乱码一区二三区的特点| 国产一区二区亚洲精品在线观看| 直男gayav资源| 亚洲精品乱码久久久久久按摩| 嫩草影院入口| 亚洲无线观看免费| 国产国拍精品亚洲av在线观看| 干丝袜人妻中文字幕| 国产极品精品免费视频能看的| 午夜亚洲福利在线播放| 国产欧美日韩精品一区二区| 美女国产视频在线观看| 国产精品伦人一区二区| 日韩欧美 国产精品| av在线播放精品| 免费人成在线观看视频色| 最新中文字幕久久久久| 久久久国产成人精品二区| 欧美日韩一区二区视频在线观看视频在线 | 人人妻人人看人人澡| 99热网站在线观看| 麻豆精品久久久久久蜜桃| 精品不卡国产一区二区三区| 狠狠狠狠99中文字幕| 可以在线观看毛片的网站| 久久精品久久久久久噜噜老黄 | 欧美bdsm另类| 国产精品国产三级国产专区5o | 麻豆乱淫一区二区| 国产免费福利视频在线观看| av国产久精品久网站免费入址| 亚洲国产日韩欧美精品在线观看| 国产成人精品婷婷| 国产又黄又爽又无遮挡在线| 久久亚洲精品不卡| 超碰97精品在线观看| 午夜福利在线观看免费完整高清在| 一级毛片久久久久久久久女| 久久这里有精品视频免费| www.色视频.com| 免费在线观看成人毛片| 国产女主播在线喷水免费视频网站 | 午夜福利在线观看吧| 日韩欧美在线乱码| 天堂√8在线中文| 亚洲图色成人| 久久99精品国语久久久| 男人和女人高潮做爰伦理| 国产精品乱码一区二三区的特点| 欧美性猛交╳xxx乱大交人| 十八禁国产超污无遮挡网站| 搡女人真爽免费视频火全软件| 午夜激情欧美在线| 欧美一区二区精品小视频在线| 六月丁香七月| 伦理电影大哥的女人| a级毛片免费高清观看在线播放| 高清在线视频一区二区三区 | 国产精品一区www在线观看| 久久久久久久久久久免费av| 成人午夜高清在线视频| 色5月婷婷丁香| 亚洲国产欧洲综合997久久,| 尤物成人国产欧美一区二区三区| 日韩精品有码人妻一区| 欧美成人免费av一区二区三区| 欧美精品一区二区大全| 99久久精品国产国产毛片| 99久久九九国产精品国产免费| 舔av片在线| 大又大粗又爽又黄少妇毛片口| 精品国产三级普通话版| 午夜精品国产一区二区电影 | 亚洲精品aⅴ在线观看| 国产亚洲最大av| 麻豆成人午夜福利视频| 国产激情偷乱视频一区二区| 爱豆传媒免费全集在线观看| 精品人妻一区二区三区麻豆| 久久99热这里只有精品18| 成年免费大片在线观看| 神马国产精品三级电影在线观看| 亚洲人与动物交配视频| 两个人的视频大全免费| 亚洲国产最新在线播放| 少妇熟女aⅴ在线视频| 欧美一区二区国产精品久久精品| 黄色欧美视频在线观看| 国产一区亚洲一区在线观看| 日韩欧美国产在线观看| 免费观看a级毛片全部| 简卡轻食公司| 国产av码专区亚洲av| 成人午夜高清在线视频| 亚洲性久久影院| 97在线视频观看| 国产高清三级在线| 亚洲av免费在线观看| 99久久人妻综合| 成人三级黄色视频| 蜜桃亚洲精品一区二区三区| 亚洲自拍偷在线| 亚洲欧美一区二区三区国产| 国产一级毛片七仙女欲春2| 欧美成人一区二区免费高清观看| 成年版毛片免费区| 91精品伊人久久大香线蕉| 成年人免费黄色播放视频| 久久热在线av| 97超碰精品成人国产| 一级片'在线观看视频| 极品少妇高潮喷水抽搐| 精品一区二区三区四区五区乱码 | 成人毛片60女人毛片免费| 热re99久久国产66热| 亚洲在久久综合| 久久热在线av| 欧美激情国产日韩精品一区| 黑人欧美特级aaaaaa片| 国产不卡av网站在线观看| 一级片'在线观看视频| 国产精品久久久av美女十八| 亚洲一级一片aⅴ在线观看| 亚洲伊人色综图| 欧美日韩精品成人综合77777| 国产精品国产三级国产专区5o| 亚洲精品乱码久久久久久按摩| av女优亚洲男人天堂| 亚洲欧美一区二区三区黑人 | av黄色大香蕉| 色婷婷av一区二区三区视频| 十八禁高潮呻吟视频| 草草在线视频免费看| 欧美 日韩 精品 国产| 制服诱惑二区| 18禁动态无遮挡网站| 日本色播在线视频| 午夜精品国产一区二区电影| 精品国产乱码久久久久久小说| 国产无遮挡羞羞视频在线观看| 婷婷色麻豆天堂久久| 少妇 在线观看| 男女啪啪激烈高潮av片| 人妻系列 视频| 日韩av在线免费看完整版不卡| 国产精品99久久99久久久不卡 | 精品国产露脸久久av麻豆| 久久精品国产综合久久久 | 女性被躁到高潮视频| 插逼视频在线观看| 免费日韩欧美在线观看| 男的添女的下面高潮视频| 老司机亚洲免费影院| 日本黄大片高清| 一级毛片我不卡| 国产精品一区二区在线观看99| 国产精品久久久久久av不卡| 国产成人精品在线电影| 午夜福利影视在线免费观看| 欧美xxⅹ黑人| 国产成人aa在线观看| 22中文网久久字幕| 久久精品夜色国产| 日本与韩国留学比较| 免费看av在线观看网站| 成人黄色视频免费在线看| 啦啦啦啦在线视频资源| 一区在线观看完整版| 欧美 日韩 精品 国产| av福利片在线| 伊人久久国产一区二区| 久久久久视频综合| 午夜福利乱码中文字幕| 欧美另类一区| 久久av网站| 青春草亚洲视频在线观看| 免费在线观看完整版高清| 黄片播放在线免费| av有码第一页| 国产在视频线精品| 满18在线观看网站| 亚洲欧美日韩另类电影网站| 制服诱惑二区| 国产欧美日韩一区二区三区在线| 亚洲av成人精品一二三区| 国产爽快片一区二区三区| 日韩不卡一区二区三区视频在线| 日本91视频免费播放| 精品久久蜜臀av无| 考比视频在线观看| 观看美女的网站| 亚洲精品美女久久久久99蜜臀 | 色网站视频免费| 亚洲欧美清纯卡通| 久久99一区二区三区| 人妻少妇偷人精品九色| 免费人妻精品一区二区三区视频| 女人被躁到高潮嗷嗷叫费观| 美女国产视频在线观看| 青春草视频在线免费观看| 欧美另类一区| 久久精品国产亚洲av涩爱| 久久 成人 亚洲| 免费高清在线观看日韩| 五月天丁香电影| a级毛片在线看网站| 国产精品国产三级国产专区5o| 91aial.com中文字幕在线观看| 国产精品蜜桃在线观看| 亚洲伊人久久精品综合| 成人综合一区亚洲| av一本久久久久| 色5月婷婷丁香| 亚洲,一卡二卡三卡| 免费av不卡在线播放| 99九九在线精品视频| 午夜福利在线观看免费完整高清在| av女优亚洲男人天堂| freevideosex欧美| 中文字幕制服av| 少妇人妻久久综合中文| 日韩电影二区| 久久久久人妻精品一区果冻| 国产欧美亚洲国产| 夜夜骑夜夜射夜夜干| 精品福利永久在线观看| 人妻一区二区av| 狂野欧美激情性xxxx在线观看| 99re6热这里在线精品视频| 在线观看免费高清a一片| 国产男女超爽视频在线观看| 曰老女人黄片| 欧美精品一区二区免费开放| 亚洲av在线观看美女高潮| av又黄又爽大尺度在线免费看| 日韩欧美一区视频在线观看| 黑人欧美特级aaaaaa片| 波野结衣二区三区在线| 在现免费观看毛片| 亚洲一区二区三区欧美精品| 中文字幕制服av| 99久久中文字幕三级久久日本| 夜夜爽夜夜爽视频| 欧美精品av麻豆av| 午夜福利视频在线观看免费| 欧美另类一区| www.av在线官网国产| 最近手机中文字幕大全| 纵有疾风起免费观看全集完整版| 热99国产精品久久久久久7| 90打野战视频偷拍视频| 观看美女的网站| 尾随美女入室| 国产男女内射视频| 丝袜喷水一区| 日本wwww免费看| 999精品在线视频| 国产精品无大码| 免费黄色在线免费观看| 亚洲av欧美aⅴ国产| www日本在线高清视频| 成人亚洲欧美一区二区av| av国产精品久久久久影院| 亚洲久久久国产精品| 精品第一国产精品| 久久这里有精品视频免费| 国产成人精品婷婷| 一级爰片在线观看| 久久久久久伊人网av| 乱人伦中国视频| 国产精品秋霞免费鲁丝片| 久久久久久久大尺度免费视频| 大香蕉久久成人网| 久久久久国产精品人妻一区二区| 日韩av不卡免费在线播放| 曰老女人黄片| 视频在线观看一区二区三区| 欧美日韩亚洲高清精品| 亚洲国产欧美在线一区| 久久久久久久久久成人| 久久午夜福利片| 满18在线观看网站| 亚洲精品中文字幕在线视频| 国产精品国产三级国产av玫瑰| 国产成人午夜福利电影在线观看| 最近中文字幕高清免费大全6| 一级毛片黄色毛片免费观看视频| 人妻系列 视频| 久久这里只有精品19| 免费少妇av软件| av天堂久久9| 90打野战视频偷拍视频| 九色亚洲精品在线播放| 视频区图区小说| 成年女人在线观看亚洲视频| 免费观看性生交大片5| 肉色欧美久久久久久久蜜桃| 一级黄片播放器| 亚洲av成人精品一二三区| 在线观看免费视频网站a站| 亚洲 欧美一区二区三区| 欧美xxⅹ黑人| 婷婷成人精品国产| 精品久久蜜臀av无| 在线精品无人区一区二区三| 亚洲综合精品二区| av在线观看视频网站免费| 十八禁高潮呻吟视频| 伦理电影免费视频| 国产高清不卡午夜福利| 秋霞在线观看毛片| 一区二区av电影网| av视频免费观看在线观看| 美女福利国产在线| 日韩av不卡免费在线播放| 内地一区二区视频在线| 欧美少妇被猛烈插入视频| 日韩熟女老妇一区二区性免费视频| 下体分泌物呈黄色| 成人国产麻豆网| 两个人免费观看高清视频| 亚洲色图综合在线观看| 天天操日日干夜夜撸| 中文字幕制服av| 国产精品免费大片| 久久久久久久久久久免费av| 亚洲人与动物交配视频| 菩萨蛮人人尽说江南好唐韦庄| 成年女人在线观看亚洲视频| 久久国产亚洲av麻豆专区| 22中文网久久字幕| 丝瓜视频免费看黄片| 精品一区在线观看国产| 色网站视频免费| 99热这里只有是精品在线观看| 极品人妻少妇av视频| 亚洲精品一二三| 大片免费播放器 马上看| 22中文网久久字幕| 99久久人妻综合| 国产精品一区二区在线不卡| 国产有黄有色有爽视频| 国产无遮挡羞羞视频在线观看| 国产一区亚洲一区在线观看| 欧美日本中文国产一区发布| 老司机亚洲免费影院| 欧美人与性动交α欧美精品济南到 | 美女视频免费永久观看网站| 国产成人精品婷婷| 日韩熟女老妇一区二区性免费视频| 51国产日韩欧美| 国产极品粉嫩免费观看在线| 欧美变态另类bdsm刘玥| 性色avwww在线观看| 欧美精品一区二区免费开放| 日韩视频在线欧美| 亚洲欧美日韩卡通动漫| 天天操日日干夜夜撸| 欧美成人午夜免费资源| 国产精品一区二区在线不卡| 狠狠婷婷综合久久久久久88av| 亚洲精品中文字幕在线视频| 九色成人免费人妻av| 人人妻人人澡人人爽人人夜夜| 久久人人爽人人片av| 一本—道久久a久久精品蜜桃钙片| 精品少妇黑人巨大在线播放| 老司机亚洲免费影院| 国产极品粉嫩免费观看在线| 午夜免费男女啪啪视频观看| 亚洲精品国产av成人精品| av免费观看日本| 80岁老熟妇乱子伦牲交| 美国免费a级毛片| 波多野结衣一区麻豆| 久久这里有精品视频免费| 久久精品国产综合久久久 | 丁香六月天网| 久久99热这里只频精品6学生| 亚洲av欧美aⅴ国产| 高清在线视频一区二区三区| 欧美日韩视频高清一区二区三区二| 男女下面插进去视频免费观看 | 亚洲欧洲日产国产| 最近中文字幕2019免费版| 婷婷成人精品国产| 色哟哟·www| 亚洲成色77777| 欧美3d第一页| 国产亚洲午夜精品一区二区久久| 色94色欧美一区二区| 久久久精品区二区三区| 精品久久蜜臀av无| 国产白丝娇喘喷水9色精品| 三级国产精品片| 大片电影免费在线观看免费| 免费高清在线观看日韩| 国产无遮挡羞羞视频在线观看| 精品久久国产蜜桃|