• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    英文文獻的《中圖法》分類號自動標注研究
    ——基于文本增強與類目映射策略

    2022-07-03 04:00:32蔣彥廷吳鈺潔
    數(shù)字圖書館論壇 2022年5期
    關鍵詞:英文分類文本

    蔣彥廷 吳鈺潔

    (1. 成都航空職業(yè)技術學院,成都 610100;2. 北京師范大學文學院,北京 100875)

    隨著經濟社會發(fā)展與各領域國際交流日益深化,中國進口外文文獻規(guī)模不斷擴大。在紙質文獻方面,根據(jù)國家統(tǒng)計局《中國統(tǒng)計年鑒》的數(shù)據(jù),2020年中國進口外文圖書超過3 200萬冊[1]。2017—2019年,國家圖書館年均訂閱紙質西文文獻超過4.9萬種。在電子文獻方面,截至2019年底,國家圖書館外購數(shù)據(jù)庫中的外文電子圖書超過51萬種,電子論文超過120萬篇[2]。

    大量引入外文文獻,對圖書館或文獻數(shù)據(jù)庫的分類、編目工作提出了較高的要求,也給相關工作人員帶來了較重的負擔[3]。與中文文獻的分類編目相比,加工整理外文文獻的難度要更大:一是不同語言、文化之間存在隔閡;二是國內外圖書分類體系不同,國內大部分圖書館、電子數(shù)據(jù)庫依據(jù)《中國圖書館分類法》(以下簡稱“《中圖法》”)給文獻分類。絕大部分中文圖書版權頁的圖書在版編目(Cataloguing In Publication,CIP)數(shù)據(jù),都標注了《中圖法》分類號(以下簡稱“中圖分類號”)。而許多英文圖書依據(jù)的是《杜威十進制分類法》(Dewey Decimal Classification)或《美國國會圖書館分類法》(Library of Congress Classification,以下簡稱“《國會圖書館分類法》”),與《中圖法》并未建立直接聯(lián)系。

    給英文文獻標注中圖分類號,能保持國內圖書館圖書管理的一致性,方便讀者查閱瀏覽。故本文提出一種基于預訓練語言模型BERT(Bidirectional Encoder Representations from Transformers)與文本增強和類目映射策略的英文文獻的中圖分類號自動標注方法。

    1 相關工作

    1.1 國內的英文文獻分類情況調研

    2022年初筆者調研了全國代表性圖書館、文獻數(shù)據(jù)庫網站,展現(xiàn)給讀者的英文文獻分類方法如表1所示。

    表1 國內代表性圖書館、文獻數(shù)據(jù)庫網站采用的英文文獻分類體系

    《中圖法》是樹狀圖書資料分類體系,1975年出版第1版,截至2010年已出版到第5版[4],包括22個一級類目、250多個二級類以及更多的小類?!秶鴷D書館分類法》是美國國會圖書館編制的綜合性分類法,包括21個基本大類,每個大類以單個字母作為標記[5]?!吨袊茖W院圖書館圖書分類法》(以下簡稱“《科圖法》”),在1958年出版了第1版,采用阿拉伯數(shù)字為類目的標記符號,包括25大類和更多的小類?!抖磐M制分類法》將知識分為10個大類,以三位數(shù)字代表分類碼,截至2004年已出版到第22版。

    調查發(fā)現(xiàn):第一,在文獻管理的實際工作中,絕大多數(shù)圖書館與文獻數(shù)據(jù)庫網站給英文文獻分類時,都依據(jù)《中圖法》;第二,另外有一些機構雖然兼用《中圖法》《杜威十進制分類法》《國會圖書館分類法》,但也有主次之分(一方面,給英文圖書編制索書號時,仍主要參考《中圖法》,而《國會圖書館分類法》與《杜威十進制分類法》的分類號僅在圖書數(shù)據(jù)庫中作為次要字段出現(xiàn);另一方面,這些機構網站中的一部分英文圖書僅有中圖分類號,而缺失《國會圖書館分類法》分類號);第三,《科圖法》目前在國內圖書情報機構中的使用率比《中圖法》《國會圖書館分類法》《杜威十進制分類法》低。

    筆者認為,國內圖書館、文獻數(shù)據(jù)庫主要采用《中圖法》給英文文獻分類的原因,一是為了保持與中文文獻分類的一致性,以我為主,為我所用。中外文文獻采用統(tǒng)一的分類號,能提升檢索效率,為科學計量提供便利,幫助發(fā)現(xiàn)學科新興熱點與學科交叉領域[6]。二是對實體圖書館而言,圖書分類號往往是編制索書號的重要基礎。國內熟悉《中圖法》的讀者更多,依據(jù)《中圖法》編制索書號,也能方便讀者查閱文獻。上述調研也反映出給英文文獻標注中圖分類號的必要性。

    1.2 分類法類目映射相關研究

    類目映射(classification mapping)指的是在不同知識分類體系的分類號之間建立聯(lián)系的過程。這對外文圖書的中圖分類號標注也有所裨益。

    在映射方法方面,類目映射方法可以分為人工標注與自動映射。人工標注雖然總體上準確率較高,但依賴具體的專業(yè)知識,工作量艱巨,標注效率有限[7]。自動映射方法又可以分為4個小類。①基于分類號同現(xiàn)的方法:當同一批圖書文獻同時標注了兩個體系的分類號時,這兩個體系的分類號就能建立一定聯(lián)系[8]。②基于類目相似度的方法:將分類法的每個條目用若干主題詞或句子來描述。通過計算不同類目間詞句的相似程度,就可以得到兩類分類號的匹配度[9]。③基于交叉檢索的方法:收集分類法A下面某個分類號a的文獻集合,用該文獻集合的關鍵詞去檢索另一種分類法B表示的文檔。統(tǒng)計出檢索中分類法B中的高頻分類號“b1,b2,b3,…,bn”,就能建立起它們與分類號a之間的關聯(lián)。但這種映射方法的準確率與覆蓋率不高,且往往建立的是一對多的關系[10]。④基于機器學習的類目映射方法。該方法對標注了某個分類號a的文本信息進行訓練,得到這個類目的文本二類分類器,然后用該分類器對另一個分類法的類目“b1,b2,b3,…,bn”標識的語料進行分類。分析分類結果,判斷類目a與類目“b1,b2,b3,…,bn”之間是否能映射[11]。

    在映射的分類體系方面,目前已有學者探索了《中圖法》與國際專利分類法(International Patent Classification,IPC)[9,11],《中圖法》與《杜威十進制分類法》[7,12],《中圖法》與《國會圖書館分類法》[13-14]之間的類目映射工作。但由于每種分類法層次復雜,類目眾多,加之不同的分類法在編制原則、體系結構、語言文化、類目顆粒度等方面存在差異,相關研究尚無法給出全面的、精確的類目映射結果。以童劉奕等[14]在教育、心理、數(shù)學領域的分析結果為例,從《中圖法》到《國會圖書館分類法》建立的799對類目映射關系中,僅有24.5%是完全等同的關系。這意味著無法僅根據(jù)類目映射單一方法,給英文文獻標注中圖分類號。

    1.3 基于機器學習的文獻分類技術相關研究

    文獻分類是自然語言處理(Natural Language Processing,NLP)里文本分類技術的子領域。在算法模型方面,BP神經網絡、支持向量機[15-16]、決策樹(DT)[17]、長短期記憶(LSTM)[18]和BERT模型以及改進的預訓練模型[19-20]已被應用到圖書、論文的分類任務中。在文獻語種與分類號方面,目前已有較多依據(jù)《中圖法》給中文圖書分類的研究[15,18-19],以及依據(jù)《國會圖書館分類法》[16]《杜威十進制分類法》[17]給英文文獻分類的嘗試。

    總的來看,目前的研究只依據(jù)單一體系,給單一語種的文獻分類,還沒有給英文文獻自動標注中圖分類號的探索。究其原因,英文圖書、論文在出版時并不自帶中圖分類號,僅在引進中國的圖書館或文獻數(shù)據(jù)庫時,才會由相關工作人員標注歸類。這導致既有的標注中圖分類號的英文文獻數(shù)據(jù)十分稀缺。

    1.4 文本數(shù)據(jù)增強技術相關研究

    在文本數(shù)據(jù)稀疏的情況下,運用文本數(shù)據(jù)增強(Data Augmentation for Text)技術有助于提高文本分類的效果。文本增強具體包括回譯、獨立或依賴上下文的詞匯替換[20-21]、隨機噪聲注入[22]、同類文本交叉增強[23]、強化學習[24]等方法。其中基于回譯、詞匯替換、強化學習的文本增強方法,需要依賴外部的算法、知識庫或預訓練模型,具有一定成本。另外,依據(jù)分類法的文獻分類是一個較為特殊的領域,尚未有學者提出專門針對該領域的文本增強方法。

    2 英文文獻分類與文本增強方法框架

    本文的英文文獻分類與文本增強方法框架如圖1所示。以下將詳細介紹文獻分類方法與各文本增強方法。

    圖1 英文文獻分類與文本增強方法框架

    在文獻分類方法方面,筆者基于BERT預訓練模型加全連接網絡(Fully-Connected Network,F(xiàn)CN)分類器,實現(xiàn)除A類“馬列主義,毛澤東思想,鄧小平理論”和Z類“綜合性圖書”之外的中圖法一級分類號B到X的20類文獻分類。BERT是谷歌2018年發(fā)布的基于文本特征提取器Transformer的預訓練語言模型,它極大改善了文本語義表示的效果,并在文本分類等各項下游任務中取得了明顯突破[25]。一個英文文本輸入該模型后,模型提取頂層的符號[CLS]的768維特征向量v作為該文本的向量表示,再后接一個768×n(n為文本類別數(shù)量)的全連接層矩陣W,得到一個n維的向量x,最后通過Softmax函數(shù)歸一化,輸出文本向量v屬于某個類別c的概率P(c| v)見公式(1),其中Softmax函數(shù)見公式(2)。

    筆者將比較基于BERT的分類模型與支持向量機(Support Vector Machine,SVM)模型、全連接神經網絡模型、Fasttext模型[26]、RoBERTa模型、壓縮輕量化的DistilBERT模型的效果。由于BERT等預訓練模型在文本預處理時會采用Wordpiece算法[27],將英文單詞切分為子詞,不再需要詞干化的預處理步驟。筆者只在文本輸入SVM與Fasttext模型前,使用NLTK自然語言處理工具庫(nltk.org)將每個單詞詞干化。

    文本增強策略一:如前所述,標注中圖分類號的英文文獻數(shù)據(jù)十分稀缺,但標注中圖分類號的中文文獻(圖書、論文等)資源比較豐富。因此筆者嘗試采用中文文獻英譯的方式,擴充英文數(shù)據(jù)集。采用蔣彥廷等[19]采集整理的中文圖書分類數(shù)據(jù)集,調用百度翻譯、阿里云翻譯、訊飛翻譯的應用程序接口,在保留中圖分類號的同時,分別英譯中文文獻的標題、關鍵詞以擴充數(shù)據(jù),并對比基于3種翻譯接口的文本增強方法,在文本分類任務上的效果。

    類目映射策略:除了將標注中圖分類號的中文文獻英譯的文本增強方法,還可以通過類目映射,將英文圖書的《國會圖書館分類法》的分類號轉化為中圖分類號(見表2)。首先,筆者從古登堡電子書項目網站(gutenberg.org),采集了大量英文圖書的標題、關鍵詞與《國會圖書館分類法》的分類號。其次,筆者邀請了兩位熟悉外文文獻編目的圖書館館員,請他們依據(jù)工作經驗,建立了106條映射規(guī)則,盡可能將這些書目的《國會圖書館分類法》分類號單向映射到《中圖法》上。由于現(xiàn)階段只針對《中圖法》一級分類號進行分類,因此采取“就上不就下”的映射方式:對于《國會圖書館分類法》的類目a與《中圖法》的類目b,當人工難以判定a與b是否等同(a=b),且難以判定a是否為b的真子集(a?b)時,就讓類目a向b的某個上位類c建立映射關系,以保證類目a的含義基本與c等同,或者a的含義能被c囊括。在映射類目顆粒度較粗的情況下,保證映射的穩(wěn)妥性。

    表2 《國會圖書館分類法》到《中圖法》的類目映射表(部分)

    通過上述類目映射方法,最終將古登堡電子書項目網站里19 870冊英文圖書的《國會圖書分類法》分類號轉換成中圖分類號。這批文本數(shù)據(jù)將添加到訓練集中來增強模型的能力。具體實驗結果將在3.2節(jié)敘述。

    文本增強策略二:前兩個策略,需要依賴外部的數(shù)據(jù)集(中文文獻數(shù)據(jù)集、標注《國會圖書館分類法》的英文文獻數(shù)據(jù)集)。而文本增強策略二將不再依賴外部的文獻數(shù)據(jù),該策略受到Karimi等[22]的啟發(fā),具體步驟為:按照對于單詞數(shù)為n的文本,按30%的比例,在文本中隨機插入0.3n(向下取整)個的標點符號。標點符號從集合{ “.”, “;”, “?”, “:”, “!”, “,” }中隨機選擇。隨機插入標點符號的文本就作為新的樣本,加入訓練集中。筆者認為,由于標點符號也參與了BERT模型預訓練,存在于模型的詞表中,因此在文本分類模型的訓練階段時,向文本插入標點符號,相當于加入了語義均衡的適量噪聲信息。這有利于增強模型的泛化能力,從而改進文獻分類的效果。

    隨機插入標點的方法不依賴任何外部數(shù)據(jù)集與預訓練模型,實現(xiàn)十分簡易。為驗證該方法的有效性,筆者比較其與其他5種文本增強策略的效果。

    (1)基于transformer的回譯。采用2個基于transformer特征提取器[28]的機器翻譯預訓練模型,分別為opusmt-en-zh(英譯中,1.41GB,模型地址:huggingface.co/Helsinki-NLP/opus-mt-en-zh)、opus-mt-zh-en(中譯英,852MB,模型地址:huggingface.co/Helsinki-NLP/opus-mt-zh-en)。采用“英→中→英”回譯路徑,給每個文本生成一個語義近似的文本。

    (2)同類文本交叉(crossover)重組。每個文本對半切分,同類文本的片段兩兩交叉,合成新文本。這在保證類別標簽基本正確的前提下,改變文本表述合成新樣本。

    (3)隨機插入語法詞(grammatical words)。該方法與文本增強策略二隨機插入標點類似,只是將隨機插入的token集合改為{the,and,of,to,in,on,about,a}。集合中大都是實義較弱,語法功能更強的詞,旨在增強模型的泛化能力,提高模型分類的精度。

    (4)基于word2vec詞向量的隨機換詞。選用的預訓練詞向量模型來自GitHub網站(模型地址:github.com/JiangYanting/Pretrained_gensim_word2vec)。對于每個單詞數(shù)為n的原始文本,隨機選中0.3n(向下取整)個除連詞、介詞、人稱代詞、be動詞等停用詞以外的詞語w,利用詞向量模型計算與詞語w相似度最高的另一個詞語w1。用詞語w1替換w,生成近義的新文本。

    (5)基于BERT遮罩語言模型的新詞隨機插入。利用BERT-base-uncased的遮罩語言模型(Masked Language Model,MLM)[25]。對于每個單詞數(shù)為n的原始文本,隨機將每個文本中0.1n(向上取整)個非停用詞替換為[MASK]遮罩符號,用MLM模型預測該符號背后可能的詞語。最后為保證原有信息不損失,將文本還原,并在曾被MLM選中的詞后面,插入MLM預測的新詞語。

    3 實驗結果與分析

    根據(jù)Frank等[16]、鄧三鴻等[18]對中英文文獻的分類經驗,每個文本輸入的字段為標題和若干反映主題的關鍵詞時,分類效果基本達到最佳水平,摘要字段對文本分類的提升效果不明顯。筆者從國家圖書館網站采集了中圖法20類,共計36 459冊文獻的標題與關鍵詞。這些文獻絕大部分為圖書專著,極少數(shù)為論文集。各類文獻的數(shù)量從高到低依次為:“T工業(yè)技術”“F經濟”“R醫(yī)藥衛(wèi)生”“D政治法律”“B哲學宗教心理”“O數(shù)理科學與化學”“G文化科學教育”“Q生物科學”“J藝術”“C社科總論”“K歷史地理”“I文學”“H語言文字”“P天文地球科學”“S農業(yè)科學”“X環(huán)境安全”“U交通運輸”“V航空航天”“E軍事”“N自然科學總論”。

    筆者按20%的比例,從36 459冊文獻中劃分出測試集7 292冊。測試集中各類文獻數(shù)量的比例與訓練集保持一致。在后續(xù)文本增強過程中,只擴充訓練數(shù)據(jù),測試集始終保持不變。

    3.1 基于原始文獻數(shù)據(jù)的分類實驗

    將每冊文獻的標題與關鍵詞作為輸入模型的文本。各模型的參數(shù)設置如下:支持向量機的種類為線性SVM;全連接網絡的激活函數(shù)為ReLU函數(shù),最大迭代次數(shù)為200次;Fasttext模型向量維數(shù)為300,學習率參數(shù)lr為0.1,ngram參數(shù)為2-gram,損失函數(shù)為Softmax;三種預訓練模型初始學習率均為2e-5,每批訓練的規(guī)模batch size為32,從訓練集中切分出驗證集的比例為10%。預訓練模型均訓練到損失在驗證集上不再下降為止。測試集上的正確率與宏F1值分數(shù)表現(xiàn)如表3所示。

    表3 基于原始文獻數(shù)據(jù)的分類實驗結果

    第一,無論文本預處理時是否詞干化,基于SVM和FCN的分類效果均不理想,而Fasttext模型在詞干化后,正確率與宏F1值分別提升約5.7%與8%。第二,雖然Fasttext模型的正確率接近BERT等預訓練模型,但在宏F1值表現(xiàn)上仍比BERT-base-uncased模型低了約14%。這說明BERT模型處理類別不均衡的文本分類任務時,較Fasttext效果更好。第三,在3個預訓練模型中,BERT-base-uncased在正確率與宏F1值指標上均取得最佳效果。而DistilBERT模型雖然大小只有BERTbase-uncased模型的約60%,但在分類表現(xiàn)上與后者十分接近。在硬件性能條件有限時,采用DistilBERT模型也不失為良好的折中策略。第四,我們也嘗試了文本詞干化后再輸入預訓練模型訓練,但分類效果并不及未做詞干化時。這也證明預訓練模型Wordpiece切分子詞方法的良好效果。

    統(tǒng)計基于BERT模型分類時,各類別文獻的宏F1值表現(xiàn)如圖2所示。

    圖2 基于BERT的各類別文獻分類F1值

    第一,雖然如前所述,“T工業(yè)技術”“F經濟”類的文獻數(shù)量分別位居第1、2名,但其分類的表現(xiàn)并不在前5之列。第二,雖然“H語言文字”“J藝術”“I文學”“P天文地球科學”類文獻數(shù)量排名分別位列第13、9、12、14位,但它們的分類表現(xiàn)分別高居第1、2、4、5位。第三,“E軍事”“V航空航天”“X環(huán)境安全”和“N自然科學總論”類的文獻受限于數(shù)據(jù)量不足,分類的表現(xiàn)還不太理想。綜上所述,T類、F類文獻主題較為廣泛,自動分類對數(shù)據(jù)量的要求較高。而H、J、I、P類文獻的主題較為集中,提升分類效果所依賴的數(shù)據(jù)量相對較少。

    在后續(xù)文本增強實驗中,將沿用表3中表現(xiàn)最佳的BERT-base-uncased模型,觀察其效果提升情況。

    3.2 英譯中文文獻、類目映射數(shù)據(jù)增強后的實驗

    基于第2章所述的文本增強策略一,調用訊飛翻譯、阿里云翻譯與百度翻譯的API,分別將45 570冊標注中圖分類號的中文圖書的標題、關鍵詞翻譯成英文,擴充到訓練集中?;诘?章所述的類目映射策略,將19 870冊英文圖書的《國會圖書館分類法》分類號轉換成中圖一級分類號。表4記錄了與原始數(shù)據(jù)集的分類結果相比,文本增強、類目映射擴充數(shù)據(jù)后的指標提升情況。

    表4 英譯中文文獻、類目映射策略后的效果上升幅度

    采用訊飛翻譯、阿里云翻譯和百度翻譯英譯中文文獻,擴充訓練集后,文獻分類的正確率均有提升。具體而言,訊飛翻譯API的效果略優(yōu)于另外兩種,在正確率與宏F1值指標上分別有2.31%與2.95%的提升。這證明了英譯中文文獻的數(shù)據(jù)增強策略的有效性。雖然類目映射擴充的數(shù)據(jù)量不及中文文獻英譯的方法,但在宏F1值指標上也有0.85%的提升。而將訊飛翻譯、類目映射2種方法結合后,模型正確率與宏F1值分別上升2.75%與3.50%,分別達到87.36%與84.35%。一方面,英譯中文文獻和類目映射能有效改善模型分類的效果;另一方面,效果的提升也反過來證明了機器翻譯和類目映射的準確性。

    3.3 隨機插入標點文本增強策略與其他策略的對比實驗

    在經由文本增強策略一和類目映射,訓練集規(guī)模達到94 587條的基礎上,進而使用第2章所述的文本隨機插入標點方法,給每個文本生成一個新文本,從而使整個訓練集規(guī)模增加一倍。同時,比較了第2章所述的其余5種文本增強方法,具體實驗結果如表5所示。

    表5 6種使訓練數(shù)據(jù)增加100%的文本增強策略效果比較

    可以看出,基于transformer模型的回譯、同類文本交叉重組的2種策略效果較其余策略略差。而隨機插入標點的方法有著最佳表現(xiàn),正確率與宏F1值分別達到90.69%與88.22%,在中圖法20類一級分類號分類的任務上,基本達到實用水平。而向原文本隨機插入語法詞的策略,也有不錯的表現(xiàn),在6種方法里位居第2名。

    向原文本插入標點或語法詞,不依賴任何預訓練模型或復雜的算法,卻表現(xiàn)不俗。我們認為這可能是由BERT模型預訓練的方式所決定的:在BERT的遮罩語言模型預訓練階段,標點、語法詞參與了預訓練,在模型的詞表中也能查詢到它們的記錄。由于標點符號和語法詞缺乏實義,與它們相鄰的詞語分布無明顯特征規(guī)律。這意味著它們的向量表示不會向任何一類文獻的主題偏斜。在模型訓練階段,向文本插入標點符號與語法詞,相當于加入了語義均衡的噪聲信息,十分有利于增強模型的泛化能力,從而顯著提升分類效果。

    4 英文文獻的中圖分類號自動標注小程序設計

    筆者匯總了文本增強和類目映射策略擴充的文本數(shù)據(jù),在BERT-base-uncased基礎上,訓練了一個英文文獻分類模型,并使用Python語言的tkinter、Pillow與Pyintaller工具庫,開發(fā)了一個給英文文獻批量自動標注《中圖法》20類一級分類號的小程序(地址:github.com/JiangYanting/English_books_classification_Program)。用戶將每冊英文文獻的標題與關鍵詞按一冊一行的格式寫入txt文本文件,上傳該txt文件后,系統(tǒng)能在極短時間里,自動標注每冊英文文獻的中圖分類號,并給出預測的概率。預測完畢后,可將預測結果自動保存為txt文件。該小程序界面簡潔,使用方便,輸出的文件每行各字段之間用制表符分隔,便于存儲在Excel、MySQL等結構化數(shù)據(jù)表中。該程序已初步在某高校圖書館得以應用,有助于提高圖書編目、跨語言知識管理與檢索的效率,有效減輕文獻數(shù)據(jù)庫與圖書館工作人員的負擔。

    5 總結

    給英文文獻標注中圖分類號是文獻知識管理中十分實用、必要的環(huán)節(jié),但又面臨訓練數(shù)據(jù)不足的問題。本文為基于BERT的文本分類模型提出中文文獻的機器翻譯方法、《國會圖書館分類法》到《中圖法》的類目映射方法、原始英文文本插入標點或語法詞以增強分類模型泛化能力的方法。實驗表明,3種策略均能有效提高自動分類的效果。向原文本隨機插入標點或語法詞的數(shù)據(jù)增強方法簡易有效,效果優(yōu)于原文本回譯方法、基于BERT語言模型的完形填空方法、同類別文本拆分重組的方法、基于詞向量的近義詞替換方法。通過3種策略,分類模型的正確率與宏F1值分別提升約6.1%與7.4%。在未來的工作中,筆者將進一步擴大數(shù)據(jù)規(guī)模,優(yōu)化模型效果,以實現(xiàn)粒度更細的中圖分類號標注功能。

    猜你喜歡
    英文分類文本
    分類算一算
    在808DA上文本顯示的改善
    分類討論求坐標
    基于doc2vec和TF-IDF的相似文本識別
    電子制作(2018年18期)2018-11-14 01:48:06
    數(shù)據(jù)分析中的分類討論
    教你一招:數(shù)的分類
    英文摘要
    鄱陽湖學刊(2016年6期)2017-01-16 13:05:41
    英文摘要
    英文摘要
    財經(2016年19期)2016-08-11 08:17:03
    英文摘要
    色尼玛亚洲综合影院| 国产精品久久电影中文字幕| 国产99久久九九免费精品| 国产精品亚洲av一区麻豆| e午夜精品久久久久久久| 美女 人体艺术 gogo| 无人区码免费观看不卡| 日本一本二区三区精品| 熟妇人妻久久中文字幕3abv| 亚洲最大成人中文| 一区二区三区高清视频在线| 欧美精品亚洲一区二区| 女人高潮潮喷娇喘18禁视频| www.999成人在线观看| 夜夜爽天天搞| 亚洲欧美精品综合久久99| 99国产精品99久久久久| 老汉色∧v一级毛片| 国产又爽黄色视频| 欧美性猛交╳xxx乱大交人| 欧美日韩一级在线毛片| 国产激情欧美一区二区| 国产爱豆传媒在线观看 | 日韩精品免费视频一区二区三区| 18禁美女被吸乳视频| 热99re8久久精品国产| 精品一区二区三区av网在线观看| 亚洲国产高清在线一区二区三 | 国产国语露脸激情在线看| 精品一区二区三区av网在线观看| 亚洲精品在线美女| 午夜福利一区二区在线看| 亚洲欧美一区二区三区黑人| 精品午夜福利视频在线观看一区| 久久精品亚洲精品国产色婷小说| 久久久国产欧美日韩av| 听说在线观看完整版免费高清| 麻豆成人午夜福利视频| 高潮久久久久久久久久久不卡| 亚洲专区国产一区二区| 国产91精品成人一区二区三区| 69av精品久久久久久| 亚洲一区高清亚洲精品| 免费在线观看视频国产中文字幕亚洲| 久久欧美精品欧美久久欧美| 国产亚洲欧美在线一区二区| 精品一区二区三区四区五区乱码| 亚洲国产欧美网| 欧美一区二区精品小视频在线| 国产精品二区激情视频| 别揉我奶头~嗯~啊~动态视频| 91大片在线观看| 亚洲欧美精品综合一区二区三区| 国产一卡二卡三卡精品| 青草久久国产| 久久人妻av系列| 少妇 在线观看| 久久精品夜夜夜夜夜久久蜜豆 | 满18在线观看网站| 亚洲国产精品久久男人天堂| 美女国产高潮福利片在线看| 两个人免费观看高清视频| 两个人视频免费观看高清| e午夜精品久久久久久久| 精品卡一卡二卡四卡免费| 午夜福利高清视频| 亚洲性夜色夜夜综合| 国产成人av教育| 99国产精品99久久久久| 亚洲成人精品中文字幕电影| 国产黄色小视频在线观看| 国产区一区二久久| 欧美激情久久久久久爽电影| 久久精品国产亚洲av香蕉五月| 满18在线观看网站| 国产激情久久老熟女| 美女国产高潮福利片在线看| 国产91精品成人一区二区三区| 免费搜索国产男女视频| 性欧美人与动物交配| 一级毛片精品| 国产亚洲av高清不卡| 亚洲国产精品sss在线观看| 免费电影在线观看免费观看| 久久久国产欧美日韩av| 欧美三级亚洲精品| 亚洲午夜理论影院| 制服人妻中文乱码| 桃色一区二区三区在线观看| 后天国语完整版免费观看| 一夜夜www| 中文字幕人妻丝袜一区二区| 成人三级黄色视频| 老熟妇仑乱视频hdxx| 精品福利观看| 黑人操中国人逼视频| 最近最新中文字幕大全电影3 | 欧美+亚洲+日韩+国产| 美女大奶头视频| 国产精品,欧美在线| 色综合站精品国产| 亚洲欧美日韩高清在线视频| 午夜激情福利司机影院| 美女扒开内裤让男人捅视频| 精品久久蜜臀av无| 99久久精品国产亚洲精品| 免费看日本二区| 亚洲国产中文字幕在线视频| 久久香蕉激情| 特大巨黑吊av在线直播 | 成人av一区二区三区在线看| 亚洲成av片中文字幕在线观看| 午夜免费激情av| 黄色丝袜av网址大全| 超碰成人久久| 午夜视频精品福利| 国产av一区二区精品久久| 日韩欧美一区视频在线观看| 久久人妻福利社区极品人妻图片| 亚洲人成77777在线视频| 欧美乱妇无乱码| 国产aⅴ精品一区二区三区波| 亚洲午夜精品一区,二区,三区| 久久香蕉精品热| 国产不卡一卡二| 俄罗斯特黄特色一大片| 热99re8久久精品国产| 国产亚洲欧美精品永久| 99精品在免费线老司机午夜| 精品不卡国产一区二区三区| 国产精品香港三级国产av潘金莲| 国产爱豆传媒在线观看 | 老司机在亚洲福利影院| 亚洲在线自拍视频| 亚洲va日本ⅴa欧美va伊人久久| 麻豆成人av在线观看| 亚洲精品在线观看二区| 两个人免费观看高清视频| 国产一区二区三区在线臀色熟女| 免费看十八禁软件| 十分钟在线观看高清视频www| 国内精品久久久久精免费| 亚洲最大成人中文| 一区二区三区高清视频在线| 亚洲精品中文字幕一二三四区| 精品久久久久久成人av| 少妇粗大呻吟视频| 亚洲黑人精品在线| 亚洲av中文字字幕乱码综合 | 成人18禁在线播放| 亚洲av成人不卡在线观看播放网| 国产精品 国内视频| 观看免费一级毛片| 午夜影院日韩av| 国产成人精品无人区| 级片在线观看| 亚洲真实伦在线观看| 两个人视频免费观看高清| 欧美大码av| 欧美一区二区精品小视频在线| 极品教师在线免费播放| 91大片在线观看| 国产精品综合久久久久久久免费| 亚洲第一欧美日韩一区二区三区| 亚洲国产日韩欧美精品在线观看 | 精品久久久久久久久久久久久 | 中亚洲国语对白在线视频| 午夜免费鲁丝| 国产不卡一卡二| 一区二区三区精品91| 可以在线观看毛片的网站| 最好的美女福利视频网| 国产精华一区二区三区| 熟妇人妻久久中文字幕3abv| 天堂动漫精品| 一卡2卡三卡四卡精品乱码亚洲| 国产亚洲精品久久久久久毛片| 久久精品影院6| 最新在线观看一区二区三区| 日本黄色视频三级网站网址| 免费看美女性在线毛片视频| 精品国产乱子伦一区二区三区| 国产精品影院久久| 国产成人影院久久av| 国产精品电影一区二区三区| 一区福利在线观看| 免费在线观看成人毛片| 午夜激情av网站| 波多野结衣高清作品| 欧美色欧美亚洲另类二区| 老司机在亚洲福利影院| 嫩草影院精品99| 国产成人啪精品午夜网站| 国产99白浆流出| 黑丝袜美女国产一区| 国产精品永久免费网站| 国产av在哪里看| 中亚洲国语对白在线视频| 日日摸夜夜添夜夜添小说| 97人妻精品一区二区三区麻豆 | 亚洲色图av天堂| 中文字幕人妻丝袜一区二区| 亚洲avbb在线观看| www.自偷自拍.com| 99riav亚洲国产免费| 国产激情偷乱视频一区二区| 午夜免费观看网址| 老司机午夜福利在线观看视频| 中文亚洲av片在线观看爽| 免费高清在线观看日韩| 久久久久久久久免费视频了| 一a级毛片在线观看| 欧美成狂野欧美在线观看| 亚洲一区二区三区不卡视频| 亚洲精品美女久久久久99蜜臀| 国产视频内射| 丝袜在线中文字幕| a级毛片在线看网站| 精品国内亚洲2022精品成人| avwww免费| 最近在线观看免费完整版| 亚洲av成人一区二区三| 久久精品国产亚洲av香蕉五月| 国产国语露脸激情在线看| 国产精品98久久久久久宅男小说| 国产精品自产拍在线观看55亚洲| 一级毛片女人18水好多| 久热这里只有精品99| 国产国语露脸激情在线看| 国产黄片美女视频| 叶爱在线成人免费视频播放| 中文字幕久久专区| 久久精品国产清高在天天线| 性欧美人与动物交配| 亚洲三区欧美一区| 91成年电影在线观看| 国产高清videossex| 国产精品影院久久| 中文字幕人妻熟女乱码| 成人特级黄色片久久久久久久| 嫩草影院精品99| 观看免费一级毛片| 久久精品夜夜夜夜夜久久蜜豆 | 欧美另类亚洲清纯唯美| 午夜免费成人在线视频| 99在线视频只有这里精品首页| 老司机深夜福利视频在线观看| 一二三四社区在线视频社区8| 欧美成人免费av一区二区三区| 一进一出抽搐gif免费好疼| 一个人观看的视频www高清免费观看 | 久久天躁狠狠躁夜夜2o2o| 一区二区三区国产精品乱码| 中文字幕人妻丝袜一区二区| 伦理电影免费视频| 日韩精品免费视频一区二区三区| 久久这里只有精品19| 国产视频一区二区在线看| 叶爱在线成人免费视频播放| 一级毛片高清免费大全| 在线免费观看的www视频| 欧美丝袜亚洲另类 | av电影中文网址| 1024香蕉在线观看| 午夜成年电影在线免费观看| 日韩成人在线观看一区二区三区| 午夜老司机福利片| 国产精品综合久久久久久久免费| 久久九九热精品免费| 欧美 亚洲 国产 日韩一| 国产欧美日韩精品亚洲av| 精品久久久久久成人av| 搡老岳熟女国产| 女警被强在线播放| 12—13女人毛片做爰片一| 日本 欧美在线| 中文资源天堂在线| 91成年电影在线观看| 欧美久久黑人一区二区| 午夜福利一区二区在线看| 国产精品亚洲av一区麻豆| 精品电影一区二区在线| 真人一进一出gif抽搐免费| 国产精品98久久久久久宅男小说| 91av网站免费观看| 国产亚洲精品一区二区www| 亚洲av成人av| 高潮久久久久久久久久久不卡| 午夜a级毛片| 夜夜夜夜夜久久久久| 亚洲一区二区三区色噜噜| 亚洲精品中文字幕一二三四区| 人人妻人人看人人澡| 欧美黑人欧美精品刺激| 最新美女视频免费是黄的| 日韩精品免费视频一区二区三区| 精品日产1卡2卡| 女人高潮潮喷娇喘18禁视频| 免费在线观看成人毛片| 波多野结衣高清无吗| 好男人在线观看高清免费视频 | 国产麻豆成人av免费视频| 动漫黄色视频在线观看| 大香蕉久久成人网| 午夜两性在线视频| 18美女黄网站色大片免费观看| 熟妇人妻久久中文字幕3abv| 91av网站免费观看| 国产免费男女视频| 少妇裸体淫交视频免费看高清 | 日韩国内少妇激情av| av有码第一页| 99精品在免费线老司机午夜| 变态另类丝袜制服| 国产精品电影一区二区三区| 岛国视频午夜一区免费看| 色尼玛亚洲综合影院| 欧美乱码精品一区二区三区| 亚洲国产欧洲综合997久久, | 亚洲av日韩精品久久久久久密| 久久国产精品人妻蜜桃| 午夜免费观看网址| 国产又黄又爽又无遮挡在线| 精品乱码久久久久久99久播| 精品午夜福利视频在线观看一区| 美女午夜性视频免费| 首页视频小说图片口味搜索| 欧美日本亚洲视频在线播放| 首页视频小说图片口味搜索| 成人三级黄色视频| 特大巨黑吊av在线直播 | 制服人妻中文乱码| 亚洲,欧美精品.| 久久久久精品国产欧美久久久| 国产一区在线观看成人免费| 婷婷丁香在线五月| 国产野战对白在线观看| 国内精品久久久久久久电影| 人人妻,人人澡人人爽秒播| 久99久视频精品免费| 麻豆久久精品国产亚洲av| 亚洲五月婷婷丁香| 国产99白浆流出| 在线观看免费日韩欧美大片| 不卡一级毛片| 后天国语完整版免费观看| 日本黄色视频三级网站网址| 一本一本综合久久| 欧美亚洲日本最大视频资源| av福利片在线| 12—13女人毛片做爰片一| 男人操女人黄网站| 一进一出抽搐gif免费好疼| 国产欧美日韩一区二区精品| 99久久久亚洲精品蜜臀av| 两性夫妻黄色片| 精品国产亚洲在线| 99在线视频只有这里精品首页| 亚洲精品国产区一区二| 国产真实乱freesex| 亚洲中文字幕一区二区三区有码在线看 | 中文字幕人成人乱码亚洲影| 精品午夜福利视频在线观看一区| 国产一区在线观看成人免费| 欧洲精品卡2卡3卡4卡5卡区| 久久99热这里只有精品18| 欧美中文综合在线视频| 草草在线视频免费看| 欧美另类亚洲清纯唯美| 国产精品久久久人人做人人爽| 一卡2卡三卡四卡精品乱码亚洲| 美女午夜性视频免费| 欧美成人免费av一区二区三区| 久久国产精品男人的天堂亚洲| 国产v大片淫在线免费观看| 日韩成人在线观看一区二区三区| 国产单亲对白刺激| 国内揄拍国产精品人妻在线 | 色在线成人网| 成人亚洲精品av一区二区| 美女午夜性视频免费| 午夜福利成人在线免费观看| 国产精品久久久人人做人人爽| 高清在线国产一区| 宅男免费午夜| 50天的宝宝边吃奶边哭怎么回事| 亚洲熟妇熟女久久| 亚洲av片天天在线观看| 免费观看人在逋| 两性午夜刺激爽爽歪歪视频在线观看 | 一夜夜www| 在线十欧美十亚洲十日本专区| 少妇裸体淫交视频免费看高清 | 黄网站色视频无遮挡免费观看| 亚洲五月婷婷丁香| 久久久久久人人人人人| 99久久国产精品久久久| 欧美日本亚洲视频在线播放| 成人亚洲精品av一区二区| 国产主播在线观看一区二区| 制服人妻中文乱码| 久久久水蜜桃国产精品网| 男女那种视频在线观看| 99在线人妻在线中文字幕| 免费一级毛片在线播放高清视频| 俄罗斯特黄特色一大片| 国产精品国产高清国产av| 69av精品久久久久久| 午夜激情av网站| 视频在线观看一区二区三区| 精品国产超薄肉色丝袜足j| 久9热在线精品视频| 亚洲成人久久性| 亚洲成人久久爱视频| 午夜福利在线在线| www国产在线视频色| 久久国产精品男人的天堂亚洲| 亚洲男人的天堂狠狠| 国产蜜桃级精品一区二区三区| 最新美女视频免费是黄的| 一二三四社区在线视频社区8| 免费一级毛片在线播放高清视频| 俄罗斯特黄特色一大片| 曰老女人黄片| 18禁裸乳无遮挡免费网站照片 | 夜夜爽天天搞| 999久久久精品免费观看国产| 在线观看日韩欧美| 亚洲真实伦在线观看| 久久草成人影院| 午夜a级毛片| 国产aⅴ精品一区二区三区波| 十八禁网站免费在线| 亚洲成人久久爱视频| 12—13女人毛片做爰片一| 三级毛片av免费| 国产亚洲精品第一综合不卡| 91麻豆av在线| 国产91精品成人一区二区三区| 人妻丰满熟妇av一区二区三区| 琪琪午夜伦伦电影理论片6080| 女人爽到高潮嗷嗷叫在线视频| 丝袜美腿诱惑在线| 老熟妇乱子伦视频在线观看| 国产亚洲av嫩草精品影院| 国产成人欧美| 国产视频内射| 国产精品香港三级国产av潘金莲| 日本一本二区三区精品| or卡值多少钱| 国产精品国产高清国产av| www.www免费av| 亚洲国产欧美日韩在线播放| 亚洲成a人片在线一区二区| 99re在线观看精品视频| 欧美久久黑人一区二区| a级毛片a级免费在线| 日本熟妇午夜| 俺也久久电影网| 国内少妇人妻偷人精品xxx网站 | 日本一区二区免费在线视频| 国产在线观看jvid| 91大片在线观看| 国产精品九九99| 久久精品亚洲精品国产色婷小说| 麻豆av在线久日| 12—13女人毛片做爰片一| 国产视频内射| 国产蜜桃级精品一区二区三区| 高潮久久久久久久久久久不卡| or卡值多少钱| 国语自产精品视频在线第100页| 一边摸一边抽搐一进一小说| 一区二区三区高清视频在线| www国产在线视频色| 一进一出好大好爽视频| 丁香六月欧美| av视频在线观看入口| 国产精品亚洲一级av第二区| 18禁黄网站禁片午夜丰满| 亚洲国产精品sss在线观看| √禁漫天堂资源中文www| 88av欧美| 国产精品亚洲美女久久久| 麻豆av在线久日| 老熟妇仑乱视频hdxx| 狂野欧美激情性xxxx| 国产免费av片在线观看野外av| 欧美最黄视频在线播放免费| 久久人妻福利社区极品人妻图片| 精品少妇一区二区三区视频日本电影| 欧美日韩一级在线毛片| 国产又爽黄色视频| 久久热在线av| 俄罗斯特黄特色一大片| 在线观看免费视频日本深夜| 三级毛片av免费| 在线观看一区二区三区| 国产99久久九九免费精品| 欧美日韩乱码在线| 亚洲 欧美 日韩 在线 免费| 免费在线观看成人毛片| 在线永久观看黄色视频| 黄色毛片三级朝国网站| cao死你这个sao货| 午夜视频精品福利| 成人亚洲精品av一区二区| 十八禁网站免费在线| 男人操女人黄网站| 日韩成人在线观看一区二区三区| 精品第一国产精品| 俄罗斯特黄特色一大片| 午夜两性在线视频| 桃色一区二区三区在线观看| 亚洲成人国产一区在线观看| 色综合婷婷激情| 日本 欧美在线| 天天躁夜夜躁狠狠躁躁| 国产成人啪精品午夜网站| 黄色视频不卡| 国产精品国产高清国产av| 1024手机看黄色片| 亚洲第一av免费看| 淫妇啪啪啪对白视频| 精品国产乱码久久久久久男人| 国产精品亚洲一级av第二区| 欧美色欧美亚洲另类二区| 免费av毛片视频| 国产亚洲精品综合一区在线观看 | 亚洲欧洲精品一区二区精品久久久| 国产三级黄色录像| 欧美精品亚洲一区二区| 久久久精品国产亚洲av高清涩受| 国产免费av片在线观看野外av| 男男h啪啪无遮挡| a级毛片在线看网站| www.自偷自拍.com| 伦理电影免费视频| av在线天堂中文字幕| 黄网站色视频无遮挡免费观看| 国产视频内射| 亚洲av美国av| 久久精品亚洲精品国产色婷小说| 青草久久国产| 国产又爽黄色视频| 窝窝影院91人妻| 亚洲黑人精品在线| 男人舔奶头视频| 亚洲欧洲精品一区二区精品久久久| or卡值多少钱| 夜夜看夜夜爽夜夜摸| 成人国语在线视频| 亚洲av成人av| 免费无遮挡裸体视频| 无人区码免费观看不卡| 国产精品久久久久久精品电影 | 中亚洲国语对白在线视频| 亚洲av成人不卡在线观看播放网| 国产人伦9x9x在线观看| 久久中文字幕人妻熟女| 亚洲中文字幕一区二区三区有码在线看 | 女生性感内裤真人,穿戴方法视频| 色老头精品视频在线观看| 国产精品美女特级片免费视频播放器 | 不卡av一区二区三区| 亚洲色图 男人天堂 中文字幕| 国产真人三级小视频在线观看| 国产精品电影一区二区三区| 男女视频在线观看网站免费 | 久久中文字幕人妻熟女| 精品国产超薄肉色丝袜足j| 欧美一级毛片孕妇| 国产午夜精品久久久久久| 亚洲精品一卡2卡三卡4卡5卡| 亚洲人成伊人成综合网2020| 黄片小视频在线播放| 国产亚洲精品一区二区www| 久久午夜亚洲精品久久| 久久狼人影院| 国内精品久久久久精免费| 亚洲人成77777在线视频| 岛国在线观看网站| 免费女性裸体啪啪无遮挡网站| 最近最新中文字幕大全免费视频| 亚洲精品一卡2卡三卡4卡5卡| 国产精华一区二区三区| 色哟哟哟哟哟哟| 97超级碰碰碰精品色视频在线观看| 国产真人三级小视频在线观看| 伦理电影免费视频| 长腿黑丝高跟| 在线观看舔阴道视频| 亚洲aⅴ乱码一区二区在线播放 | 不卡一级毛片| 亚洲成a人片在线一区二区| 国产免费av片在线观看野外av| 黄片播放在线免费| 亚洲精品国产精品久久久不卡| 在线观看舔阴道视频| 91av网站免费观看| 女性被躁到高潮视频| 中亚洲国语对白在线视频| 日韩免费av在线播放| 亚洲男人的天堂狠狠| 久久香蕉国产精品| av电影中文网址| 久久精品91无色码中文字幕| 动漫黄色视频在线观看| 午夜激情福利司机影院| 一级a爱片免费观看的视频| 天堂影院成人在线观看| 欧美激情极品国产一区二区三区| 欧美乱色亚洲激情| 中亚洲国语对白在线视频| 国产精品综合久久久久久久免费|