• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    中文分詞研究綜述

    2021-04-23 05:51:18王佳楠梁永全
    軟件導(dǎo)刊 2021年4期
    關(guān)鍵詞:歧義分詞準(zhǔn)確度

    王佳楠,梁永全

    (山東科技大學(xué)計算機科學(xué)與工程學(xué)院,山東青島 266590)

    0 引言

    隨著自然語言處理的發(fā)展,分詞作為基礎(chǔ)任務(wù)成為研究重點,中文因其復(fù)雜性和特殊性成為分詞熱點話題。中國知網(wǎng)和Web of Science 的相關(guān)論文顯示,自2010 年分詞研究達(dá)到小高峰后,中文分詞研究熱度再次緩步增長,見圖1、圖2。但是,作為自然語言處理的基礎(chǔ)任務(wù),分詞究竟有沒有必要,Li 等[1]在2019 年ACL 會議上提出此觀點,并在機器翻譯、文本分類、句子匹配和語言建模4 個NLP任務(wù)上驗證分詞的非必要性,但這并不說明分詞研究不再有意義。詞級別模型欠佳表現(xiàn)在數(shù)據(jù)稀疏、過擬合、OOV以及數(shù)據(jù)遷移能力缺乏等,要解決此類問題,提高分詞性能仍有重大意義,例如谷歌提出的知識圖譜概念。知識圖譜強大的語義關(guān)聯(lián)能力為網(wǎng)絡(luò)搜索提供便利。知識圖譜本質(zhì)是一種語義網(wǎng)絡(luò),用圖的形式描述客觀事物,由邊和節(jié)點組成。邊一般指關(guān)系和屬性,節(jié)點指概念和實體。現(xiàn)實中,書本和網(wǎng)頁中的內(nèi)容屬于非結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù),無法直接構(gòu)建知識圖譜,分詞成為構(gòu)建知識圖譜的第一步。英文通過空格區(qū)分單詞,中文則需要根據(jù)上下文信息理解分詞,但這對于計算機而言相當(dāng)困難。

    Fig.1 Statistics on the number of word segmentation documents of CNKI圖1 中國知網(wǎng)分詞文獻(xiàn)數(shù)量統(tǒng)計

    Fig.2 Statistics on the number of word segmentation documents in Web of Science圖2 Web of Science 分詞文獻(xiàn)數(shù)量統(tǒng)計

    本文通過詳細(xì)閱讀近20 年文獻(xiàn)資料,總結(jié)歸納中文分詞的瓶頸和算法,提出新的瓶頸及改進(jìn)方向。

    1 中文分詞瓶頸

    1.1 粒度選擇

    由于中文的復(fù)雜性,分詞時粒度的選擇尤為重要。目前分詞粒度分為粗粒度和細(xì)粒度兩類,例如“中華人民共和國”,粗粒度:中華人民|共和國;細(xì)粒度:中華|人民|共和國。

    雖然人類閱讀不會發(fā)生障礙,但對于計算機來說,尤其是當(dāng)分詞用于搜索引擎時,細(xì)粒度可能導(dǎo)致搜索準(zhǔn)確率降低;當(dāng)用于知識圖譜構(gòu)建時則導(dǎo)致圖譜復(fù)雜性增加,準(zhǔn)確度降低。

    1.2 分詞歧義

    歧義字段在中文中普遍存在,而歧義字段又是中文切分的一個難點。梁南元教授[2]最早對歧義字段進(jìn)行了兩種基本定義:

    (1)交集型切分歧義。漢字串ASB 稱作交集型切分歧義,如果滿足AS、SB 同時為詞(A、S、B 分別為漢字串),此時漢字串S 稱作交集串。如句子“人民生活幸福”,分詞的可能結(jié)果有:

    Eg1:人民|生活|幸福

    Eg2:人|民生|活|幸福

    如果由計算機判斷,則“人民”和“民生”皆為可能詞匯,就會造成交集型歧義。

    (2)組合型切分歧義。漢字串AB 稱作多義組合型切分歧義,如果滿足A、B、AB 同時為詞,如“校友會”一詞:

    Eg1:我|在|校友會|工作

    Eg2:我|的|校友|會|來

    “校友”和“會”可以單獨成詞,也可組合成詞,就造成了組合型歧義。

    歧義字段給分詞帶來極大困擾,想要作出正確的切分判斷,需要結(jié)合上下文語境,甚至韻律、語氣、重音、停頓等,這對機器來說無疑是困難的。

    1.3 未登錄詞識別

    未登錄詞有兩種,一種指已有的詞表中沒有收錄的詞,另一種指訓(xùn)練語料中未曾出現(xiàn)過的詞,而后一種也可被稱作集外詞(Out of Vocabulary,OOV),即訓(xùn)練集以外的詞。未登錄詞通常包含以下幾種類型:

    (1)新出現(xiàn)的普通詞匯。隨著時代變遷,語言不斷發(fā)展,詞匯也在更新,尤其是網(wǎng)絡(luò)用語中層出不窮的新詞,這對分詞甚至自然語言處理都是一大挑戰(zhàn)。

    (2)專有名詞。如人名、地名以及組織機構(gòu)名稱等。

    (3)專業(yè)名詞和研究領(lǐng)域名稱。將分詞運用到某些特定領(lǐng)域或?qū)I(yè),需要特定的領(lǐng)域詞典。

    (4)其它專用名詞。如新產(chǎn)生的產(chǎn)品名、電影名稱、書籍名稱等。

    由此可見,粒度選擇、歧義消除和未登錄詞識別是干擾中文分詞的重要原因。孫茂松等[3]發(fā)現(xiàn)在真實語料庫中,由未登錄詞造成的分詞錯誤是歧義切分的5 倍以上,提高未登錄詞識別對提升分詞性能有重大影響。

    2 傳統(tǒng)分詞方法

    2.1 基于規(guī)則的分詞方法

    基于規(guī)則的匹配方法又稱為機械分詞方法或基于字典的分詞方法,就是按照一定的規(guī)則將測試的字段與機器詞典中的詞條相匹配。

    1984 年梁南元教授根據(jù)漢俄翻譯機器提到的6-5-4-3-2-1 分詞方法,利用詞典中最長詞的長度作為匹配字段長度進(jìn)行匹配,成功則輸出,失敗則去掉匹配字段中的最后一個字,繼續(xù)匹配,直到全部切分為止,稱為最大匹配法,并首次將最大匹配法用于中文分詞任務(wù),實現(xiàn)了我國第一個自動漢語分詞系統(tǒng)CDWS。除此之外,還有逆向最大匹配法和雙向最大匹配法。

    基于詞典的分詞方法直觀簡單,可以通過增減詞典調(diào)整最終的分詞效果。當(dāng)詞典直接決定分詞結(jié)果的好壞時,詞典的構(gòu)造就成了重中之重,即使到現(xiàn)在詞典的作用仍然不可磨滅。

    分詞的詞典機制主要有:基于整詞二分、基于TRIE 索引樹以及基于逐字二分。2000 年孫茂松等通過實驗比較3 種詞典機制,認(rèn)為基于逐字二分的分詞詞典機制簡潔、高效,能較好地滿足實用型漢語自動分詞系統(tǒng)需要;2001 年楊文峰等[4]則認(rèn)為原始的3 種詞典機制在更新時維護成本較高且效率較低,故根據(jù)PATRICIA tree 的數(shù)據(jù)結(jié)構(gòu)設(shè)計一種新的分詞詞典機制,可以實現(xiàn)快速查詢及快速更新功能;2003 年李慶虎等[5]提出雙子哈希機制,在不提升現(xiàn)有詞典機制空間復(fù)雜度和維護復(fù)雜度基礎(chǔ)上,提高了中文分詞的速度和效率。

    隨后,通過改進(jìn)分詞詞典提高分詞性能的文章層出不窮。雖然基于詞典的分詞方法簡潔高效、操作簡單,但是準(zhǔn)確度不高,不能很好地處理歧義切分和未登錄詞識別。

    2.2 基于統(tǒng)計的分詞方法

    基于統(tǒng)計的分詞方法是把每個詞看作字組成,相鄰的字在語料庫中出現(xiàn)的次數(shù)越多,就越可能是一個詞。

    Mashall 于1993 年提出了CLAWS 算法,利用概率統(tǒng)計模型對語料庫的詞性進(jìn)行自動標(biāo)注;Derose[6]在CLAWS算法基礎(chǔ)上提出WOLSUNGA 算法。此后,中文分詞利用統(tǒng)計方法在詞性標(biāo)注方面取得了巨大成就。2002 年第一屆SIGHAN 會議召開后,Xue 等[7]第一次提出基于字標(biāo)注分詞,成為中文分詞領(lǐng)域的重要方法。一年后,在最大熵模型上實現(xiàn)基于字標(biāo)注的分詞系統(tǒng),在2003 年的bakeoff測評中取得好成績,之后發(fā)表論文詳細(xì)闡述了基于字標(biāo)注的分詞模型。序列標(biāo)注就是將每個中文單字標(biāo)注為B(),I(),O(),E(),S()的形式,以此進(jìn)行分詞,開啟了分詞領(lǐng)域新模式。

    目前,基于統(tǒng)計的字序列標(biāo)注分詞方法最常用的步驟如下:①構(gòu)建語言模型;②對句子作單詞劃分,對劃分結(jié)果利用隱馬爾可夫(Hidden Markov Model,HMM)或條件隨機場(Conditional Random Field,CRF)等進(jìn)行概率計算,獲得概率最大分詞方式。

    其中,HMM 模型是利用已分詞的訓(xùn)練集訓(xùn)練模型,得到三概率矩陣,利用維特比算法和三概率矩陣分析測試集標(biāo)簽,利用標(biāo)簽進(jìn)行分詞,最常用的結(jié)巴分詞就是基于此模型;此后,Peng 等(2004)又將CRF 引入分詞學(xué)習(xí)中。CRF 模型較于HMM 模型能更好地利用上下文信息,以及外部信息特征完成實驗。

    基于統(tǒng)計的分詞方法可以很好地識別未登錄詞和消除歧義,但是統(tǒng)計模型復(fù)雜度高,運行周期長,依賴人工特征提取。隨著計算機運行速度加快,神經(jīng)網(wǎng)絡(luò)逐漸進(jìn)入分詞領(lǐng)域。

    3 神經(jīng)網(wǎng)絡(luò)分詞法

    2001 年,Bengio 等[8]提出第一個神經(jīng)語言模型——前饋神經(jīng)語言模型,并誕生了詞嵌入這一概念,隨后又提出一種基于神經(jīng)網(wǎng)絡(luò)變種的概率語言模型,將神經(jīng)網(wǎng)絡(luò)引入自然語言處理任務(wù)。神經(jīng)網(wǎng)絡(luò)因其自動學(xué)習(xí)特征,避免了傳統(tǒng)的特征構(gòu)建,早在20 世紀(jì)就有學(xué)者試圖在中文分詞任務(wù)中運用神經(jīng)網(wǎng)絡(luò),但是分詞速度不理想。到了21 世紀(jì),隨著技術(shù)提升以及深度學(xué)習(xí)的發(fā)展,神經(jīng)網(wǎng)絡(luò)在中文分詞領(lǐng)域有了重大進(jìn)步。自序列標(biāo)注方法在bakeoff 測試中取得優(yōu)異成績后,將神經(jīng)網(wǎng)絡(luò)與序列標(biāo)注相結(jié)合成為中文分詞領(lǐng)域的通用框架。

    2011 年Collobert 等[9]為改善以往每個NLP 任務(wù)需要設(shè)計構(gòu)造新模型的思想,提出一種可以推廣到其它多種NLP 任務(wù)中的多層神經(jīng)網(wǎng)絡(luò)體系結(jié)構(gòu);2013 年Zheng 等[10]在Collobert 的基礎(chǔ)上,為減少學(xué)習(xí)算法對特征提取的依賴性,將整個句子作為輸入進(jìn)行多層特征提取,得到抽象的特征表示,同時提出了Perceptron-Style 算法,并首次探討利用以上模型算法在中文分詞和詞性標(biāo)注任務(wù)中與CRF統(tǒng)計模型比較速度上的優(yōu)劣;2014 年,Pei 等[11]在此基礎(chǔ)上提出了最大邊緣張量神經(jīng)網(wǎng)絡(luò)模型,模型模擬了標(biāo)簽和上下文字符之間的交互,以獲得更多的語義信息,加快訓(xùn)練速度,防止過擬合,提高了準(zhǔn)確度。

    但是,這些算法受限于輸入窗口大小,無法利用文本的時間序列信息進(jìn)行分詞,遞歸神經(jīng)網(wǎng)絡(luò)(Recursive Neural Network,RNN)的分詞方法應(yīng)運而生。遞歸神經(jīng)網(wǎng)絡(luò)利用順序信息,在處理新輸入信息的同時存儲上一時刻信息。利用當(dāng)前輸入和上一時刻輸出,同時得到這一時刻輸出。利用遞歸神經(jīng)網(wǎng)絡(luò)可以在序列標(biāo)記任務(wù)中考慮序列信息,提高分詞準(zhǔn)確度。

    2015 年,為了對輸入上下文進(jìn)行建模,Chen 等[12]提出門控遞歸神經(jīng)網(wǎng)絡(luò)模型,利用重置門和更新門控制信息的傳送和抽取。而為了解決神經(jīng)網(wǎng)絡(luò)利用固定窗口而忽視長距離信息問題,在Sutskever 等[13]基礎(chǔ)上提出在分詞領(lǐng)域運用長短時記憶網(wǎng)絡(luò)(Long-short-term memory,LSTM)思想,成為分詞領(lǐng)域里程碑式的進(jìn)步。

    LSTM 是在RNN 基礎(chǔ)上提出的。雖然RNN 已經(jīng)在語音識別、語言建模和文本生成方面取得巨大成就,但是由于梯度消失和梯度爆炸導(dǎo)致很難訓(xùn)練長距離信息,LSTM則允許網(wǎng)絡(luò)學(xué)習(xí)何時忘記先前信息以及何時在給定信息的情況下更新存儲單元,將重要信息保留在存儲單元中以避免窗口大小限制,可以很好地應(yīng)用在分詞領(lǐng)域;Chen等[14]在一般模型(包括字嵌入層、神經(jīng)網(wǎng)絡(luò)層和標(biāo)簽推理層)基礎(chǔ)上在網(wǎng)絡(luò)層運用LSTM,從精確度(precision)、召回率(recall)、FI 值以及OVV 召回率4 個方面評估,發(fā)現(xiàn)與最新模型相比,LSTM 可以利用較小的窗口獲得最好的性能。

    但是LSTM 分詞模型自提出后并沒有在分詞領(lǐng)域得到廣泛研究與應(yīng)用,直到2016 年Yao 等[15]為了充分利用上下文信息進(jìn)行分詞才提出了雙向LSTM;早在2015 年,為解決詞性標(biāo)注問題,Huang 等[16]提出雙向LSTM-CRF 模型,實驗證明該模型在詞性標(biāo)注上的準(zhǔn)確度要優(yōu)于當(dāng)前模型,最高可達(dá)到97.55%;隨后,Xu[17]提出一種基于依賴的門控遞歸網(wǎng)絡(luò),將LSTM 和門控遞歸神經(jīng)網(wǎng)絡(luò)相結(jié)合;黃丹丹等[18]將注意力機制融入雙向LSTM-CRF 模型;Zhang等[19]第一次提出將Lattice LSTM 應(yīng)用到中文實體識別中;Yang 等[20]在Zhang 的基礎(chǔ)上提出在Lattice LSTM 中加入子詞編碼,發(fā)現(xiàn)使用Lattice+word(詞)或Lattice+subword(子詞)替換字符信息后模型性能更好,并提出將具有域詞典的Lattice LSTM 結(jié)構(gòu)用于跨領(lǐng)域分詞的可行性。

    2018 年,新型語言模型BERT 刷新了11 項NLP 任務(wù)的性能記錄。Huang 等[21]提出采用多準(zhǔn)則的學(xué)習(xí)方法進(jìn)行中文分詞,利用BERT 進(jìn)行預(yù)訓(xùn)練產(chǎn)生詞向量進(jìn)行特征提取,對BERT 模型進(jìn)行層級修剪來平衡分割速度和準(zhǔn)確度,同時采集不同準(zhǔn)則的數(shù)據(jù)集,捕獲每個數(shù)據(jù)集的異構(gòu)分段標(biāo)準(zhǔn)以及公共知識,最后利用CRF 推理層得到最佳標(biāo)簽序列。這種方法不僅提高了分詞性能,加快了計算速度,還減小了模型尺度。BERT 為中文分詞開創(chuàng)了新的突破口,大幅提高了分詞準(zhǔn)確度。

    基于神經(jīng)網(wǎng)絡(luò)的分詞模型經(jīng)過近20 年的研究已趨于成熟,研究人員在序列標(biāo)注、網(wǎng)絡(luò)模型以及推理機制等方面不斷改進(jìn),大大提高了中文分詞的準(zhǔn)確度。但是分詞速度和跨領(lǐng)域分詞等方面仍然存在不足。

    4 中文分詞新的瓶頸

    隨著計算機技術(shù)的發(fā)展,分詞領(lǐng)域的準(zhǔn)確度也隨之提高,但是通過增加模型內(nèi)部復(fù)雜度來提高準(zhǔn)確度,損害了運行速度;除此之外,未登錄詞的影響仍然存在,專業(yè)名詞的識別失誤在跨領(lǐng)域分詞中尤為明顯。

    4.1 跨領(lǐng)域分詞

    自從將神經(jīng)網(wǎng)絡(luò)應(yīng)用到中文分詞領(lǐng)域,隨著網(wǎng)絡(luò)模型的不斷改進(jìn),中文分詞的準(zhǔn)確度大大提升,歧義切分的影響逐漸縮小,但是未登錄詞的識別方法仍需改進(jìn),尤其在跨領(lǐng)域分詞任務(wù)中。

    2018 年,Ma 等[22]使用雙向LSTM(Bi-LSTM)模型進(jìn)行中文分詞,但未提出新的模型或改進(jìn)模型,而是在LSTM 模型基礎(chǔ)上預(yù)訓(xùn)練字向量、Dropout 和調(diào)整超參數(shù)以達(dá)到State-of-the-art(SOTA),詳細(xì)比較了3 種技術(shù)對性能的影響。預(yù)訓(xùn)練字向量(詞向量)已經(jīng)成為NLP 任務(wù)的基礎(chǔ)工作,例如Word2vec、ELMO、BERT 等,都是對字向量訓(xùn)練的提升算法,實驗發(fā)現(xiàn)預(yù)訓(xùn)練字向量對性能優(yōu)化貢獻(xiàn)最大。針對不同的數(shù)據(jù)集調(diào)整參數(shù)可以很好地提高模型的準(zhǔn)確度。最新的分詞模型大約三分之一的錯誤來自注釋不一致問題,三分之二由詞匯不足造成,使用外部詞典或知識庫非常重要,而調(diào)整模型結(jié)構(gòu)對這類錯誤幾乎毫無用處;Zhang 等[23]提出結(jié)合字典的神經(jīng)網(wǎng)絡(luò)分詞,該方法可以解決由詞稀少引起的問題,并在模型應(yīng)用于不同的域時僅需添加額外的域特定詞典,其它參數(shù)可保持不變。該方法在跨域CWS 任務(wù)中得到明顯改進(jìn),也恰恰證明了Ma 等關(guān)于詞匯不足的重要性結(jié)論。

    Zhao 等[24]提出結(jié)合未標(biāo)記和部分標(biāo)記數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)用于跨領(lǐng)域中文分詞方法。發(fā)現(xiàn)在跨域分詞中,Bi-LSMT+LM(未標(biāo)記)+PL(部分標(biāo)記)在大部分測試集中具有最佳性能,同時在域內(nèi)數(shù)據(jù)分詞中有最佳性能。未標(biāo)記和部分標(biāo)記數(shù)據(jù)的結(jié)合應(yīng)用,為跨域分詞乃至域內(nèi)分詞提供了一種新的研究方向。

    跨領(lǐng)域分詞瓶頸主要來自于OOV 的原始瓶頸,專有名詞的限制使該瓶頸不可能完全消除,增加領(lǐng)域詞典可以很好地解決跨領(lǐng)域分詞問題。隨著科技進(jìn)步,強大知識庫的構(gòu)建使運用外部輔助方法變得越來越簡便。但是,不同領(lǐng)域的通用分詞算法仍需進(jìn)一步研究。

    4.2 分詞速度

    速度是任何系統(tǒng)不可避免的熱點問題,分詞模型的高準(zhǔn)確率導(dǎo)致復(fù)雜的模型層出不窮,損害了分詞速度,即使在CPU 運算速度不斷提高的情況下,LSTM 分詞模型運行時間仍可達(dá)3 天,Bi-LSTM 的時間也達(dá)17 個小時,而CRF的加入使模型運行速度更加緩慢。分詞作為自然語言處理的基礎(chǔ)步驟,不僅需要高準(zhǔn)確度,運行速度也是目前研究熱點。

    2016 年,Cai 等[25]提出一種新穎的神經(jīng)網(wǎng)絡(luò)模型,構(gòu)建句子完整的切分歷史,直接在結(jié)果上進(jìn)行建??砂l(fā)現(xiàn)訓(xùn)練和測試速度慢的原因。隨后提出一種貪婪神經(jīng)詞分割器,通過去掉不必要的設(shè)計建立更有效的字符組合模型,大幅降低訓(xùn)練和運行時間[26]。

    劉志明等[27]提出一種最簡門單元模型,在LSTM 基礎(chǔ)上刪除輸出門,將隱藏狀態(tài)和細(xì)胞狀態(tài)合并,輸入門和遺忘門合為更新門以簡化網(wǎng)絡(luò)結(jié)構(gòu)。結(jié)果顯示MGU 精度并無大的差異,而推理速度是LSTM 模型的3 倍,訓(xùn)練耗時則是LSTM 的1/2,證明通過簡化模型提高訓(xùn)練速度減少訓(xùn)練時間的方法是可行的。

    除此之外,循環(huán)神經(jīng)網(wǎng)絡(luò)在長距離信息保存上的優(yōu)越性,使得NLP 中循環(huán)神經(jīng)網(wǎng)絡(luò)占主要地位,但實際上卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)能更好地理解語義信息,并利用稀疏連接縮短運算時間,提高效率。文獻(xiàn)[28]為改進(jìn)人工設(shè)計特征提取,采用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行特征提取并取得較好效果;涂文博等[29]驗證了采用無池化卷積神經(jīng)網(wǎng)絡(luò)的速度是池化層卷積神經(jīng)網(wǎng)絡(luò)的4 倍左右;王星等[30]認(rèn)為目前的分詞模型只利用到漢字,字根和五筆等深層次特征也應(yīng)考慮在內(nèi)。采用膨脹卷積神經(jīng)網(wǎng)絡(luò),使用CRF 進(jìn)行解碼,結(jié)果表明準(zhǔn)確度和速度都高于Bi-LSTM 模型。可見,卷積神經(jīng)網(wǎng)絡(luò)早已進(jìn)入分詞領(lǐng)域。

    對于分詞速度的影響因素主要有網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜性以及解碼方式。目前,分詞準(zhǔn)確度已達(dá)到相當(dāng)高的水平,因此在保證準(zhǔn)確率的前提下,速度成為分詞研究的重要方向,而卷積神經(jīng)網(wǎng)絡(luò)對速度和準(zhǔn)確率的兼顧性使其具有極大的研究價值。

    5 結(jié)語

    分詞技術(shù)正在逐步改進(jìn)?;谠~典分詞的機械分詞方法操作簡單,實現(xiàn)快速,但利用已有的詞典直接匹配獲取存在領(lǐng)域局限性,并且歧義性和局外詞匯識別差。基于統(tǒng)計分詞的監(jiān)督學(xué)習(xí)算法改進(jìn)了歧義等問題,將分詞轉(zhuǎn)換為序列標(biāo)注問題,CRF 模型和HMM 模型成為統(tǒng)計分詞的主要方法。近年,神經(jīng)網(wǎng)絡(luò)的出現(xiàn)使分詞準(zhǔn)確度有了極大提高,但在Bi-LSTM+CRF 算法應(yīng)用于分詞領(lǐng)域后,準(zhǔn)確度的提升空間逐步變小,如表1 所示。

    Table 1 F1 value of participle in each document表1 各文獻(xiàn)分詞F1 值

    雖然各文獻(xiàn)所用方法存在外部差異,如外加字典、預(yù)處理、Dropout 等,但結(jié)果波動不大。由此可見,目前分詞領(lǐng)域研究已經(jīng)趨于成熟,作為基礎(chǔ)任務(wù)可滿足絕大部分NLP問題研究。但是,分詞性能和速度存在不一致性,而卷積神經(jīng)網(wǎng)絡(luò)由于速度優(yōu)勢,近年也常應(yīng)用于自然語言處理領(lǐng)域并取得顯著成效。

    中文分詞研究應(yīng)該兼顧準(zhǔn)確度與速度,在兩者之間選擇平衡點,卷積神經(jīng)網(wǎng)絡(luò)在速度上的優(yōu)勢勢必會給分詞領(lǐng)域帶來重大改進(jìn)。

    猜你喜歡
    歧義分詞準(zhǔn)確度
    eUCP條款歧義剖析
    中國外匯(2019年12期)2019-10-10 07:26:58
    結(jié)巴分詞在詞云中的應(yīng)用
    智富時代(2019年6期)2019-07-24 10:33:16
    幕墻用掛件安裝準(zhǔn)確度控制技術(shù)
    建筑科技(2018年6期)2018-08-30 03:40:54
    English Jokes: Homonyms
    值得重視的分詞的特殊用法
    動態(tài)汽車衡準(zhǔn)確度等級的現(xiàn)實意義
    “那么大”的語義模糊與歧義分析
    高爐重量布料準(zhǔn)確度的提高
    天津冶金(2014年4期)2014-02-28 16:52:58
    對電子天平的誤差及保證其稱量準(zhǔn)確度的探討
    機電信息(2014年35期)2014-02-27 15:54:30
    高考分詞作狀語考點歸納與疑難解析
    老司机在亚洲福利影院| 亚洲国产精品成人久久小说| 中文字幕高清在线视频| 99久久综合免费| 两个人看的免费小视频| 啦啦啦中文免费视频观看日本| 一级毛片电影观看| 91老司机精品| 9191精品国产免费久久| 人妻人人澡人人爽人人| 亚洲国产精品成人久久小说| 热re99久久精品国产66热6| 亚洲精品成人av观看孕妇| 五月天丁香电影| 欧美国产精品va在线观看不卡| 夜夜骑夜夜射夜夜干| 91九色精品人成在线观看| 亚洲国产成人一精品久久久| 久久鲁丝午夜福利片| 母亲3免费完整高清在线观看| 日韩大码丰满熟妇| 麻豆国产av国片精品| 如日韩欧美国产精品一区二区三区| 视频区图区小说| 狂野欧美激情性xxxx| 国产亚洲欧美精品永久| 国产激情久久老熟女| 国产高清国产精品国产三级| 熟女少妇亚洲综合色aaa.| 国产成人啪精品午夜网站| www.熟女人妻精品国产| 美女扒开内裤让男人捅视频| 91老司机精品| 啦啦啦中文免费视频观看日本| 国产免费视频播放在线视频| 好男人视频免费观看在线| 2021少妇久久久久久久久久久| 不卡av一区二区三区| 免费日韩欧美在线观看| 久热爱精品视频在线9| 妹子高潮喷水视频| 精品人妻熟女毛片av久久网站| 18在线观看网站| 国产男女内射视频| 久久国产精品影院| 宅男免费午夜| 天天躁夜夜躁狠狠久久av| 大码成人一级视频| 黄色视频在线播放观看不卡| 久久精品熟女亚洲av麻豆精品| 成年美女黄网站色视频大全免费| 一本—道久久a久久精品蜜桃钙片| 精品高清国产在线一区| 国产亚洲av片在线观看秒播厂| 久久精品人人爽人人爽视色| 性少妇av在线| 国产精品久久久久成人av| 日本五十路高清| 亚洲人成77777在线视频| 国产极品粉嫩免费观看在线| 天天躁日日躁夜夜躁夜夜| 成人国产一区最新在线观看 | 成人国产av品久久久| 视频区图区小说| 免费在线观看日本一区| 91字幕亚洲| 国产精品九九99| 两性夫妻黄色片| 国产高清国产精品国产三级| 飞空精品影院首页| videosex国产| 在线av久久热| 女性被躁到高潮视频| 一个人免费看片子| 国产免费福利视频在线观看| 国产精品免费大片| 亚洲精品国产av成人精品| 手机成人av网站| 亚洲精品第二区| 亚洲av综合色区一区| 91字幕亚洲| 午夜影院在线不卡| www.av在线官网国产| 人体艺术视频欧美日本| 又大又爽又粗| 久久久久久亚洲精品国产蜜桃av| 亚洲国产精品一区三区| 国产精品久久久久成人av| 狂野欧美激情性bbbbbb| 91成人精品电影| 国产精品久久久人人做人人爽| 国产欧美日韩精品亚洲av| 精品国产一区二区三区久久久樱花| 国产成人精品久久二区二区91| 亚洲五月婷婷丁香| 国产成人欧美在线观看 | 女性生殖器流出的白浆| 少妇人妻久久综合中文| 丝袜脚勾引网站| 欧美变态另类bdsm刘玥| 久久性视频一级片| 免费在线观看日本一区| www.自偷自拍.com| 大型av网站在线播放| 欧美中文综合在线视频| 亚洲国产欧美日韩在线播放| 肉色欧美久久久久久久蜜桃| av网站在线播放免费| 午夜激情av网站| 久久天堂一区二区三区四区| 亚洲欧美成人综合另类久久久| 天天躁日日躁夜夜躁夜夜| 国产免费又黄又爽又色| 国产精品成人在线| 婷婷色综合www| 男人添女人高潮全过程视频| 欧美成狂野欧美在线观看| 日日爽夜夜爽网站| 亚洲国产毛片av蜜桃av| 欧美亚洲 丝袜 人妻 在线| 精品少妇久久久久久888优播| 午夜精品国产一区二区电影| 美女脱内裤让男人舔精品视频| 成年女人毛片免费观看观看9 | 成在线人永久免费视频| √禁漫天堂资源中文www| 日韩一区二区三区影片| 国产精品九九99| 国产97色在线日韩免费| 国产视频一区二区在线看| 亚洲成av片中文字幕在线观看| 国产国语露脸激情在线看| 一区二区三区乱码不卡18| 免费少妇av软件| 男女边摸边吃奶| 校园人妻丝袜中文字幕| 黑人巨大精品欧美一区二区蜜桃| 99国产精品一区二区蜜桃av | 日韩熟女老妇一区二区性免费视频| 成年人黄色毛片网站| 国产亚洲午夜精品一区二区久久| 午夜激情久久久久久久| 亚洲 欧美一区二区三区| 国产高清视频在线播放一区 | 日韩一卡2卡3卡4卡2021年| av不卡在线播放| 久久久欧美国产精品| 后天国语完整版免费观看| 国产成人a∨麻豆精品| 搡老岳熟女国产| 久久精品成人免费网站| 王馨瑶露胸无遮挡在线观看| av视频免费观看在线观看| 国产色视频综合| 青春草亚洲视频在线观看| 黄网站色视频无遮挡免费观看| 亚洲av日韩精品久久久久久密 | 另类精品久久| videosex国产| 欧美大码av| 久久久久久久国产电影| 国产精品 国内视频| 黄色a级毛片大全视频| 乱人伦中国视频| 男的添女的下面高潮视频| 两个人看的免费小视频| 少妇精品久久久久久久| 波多野结衣一区麻豆| 一级毛片我不卡| 精品国产一区二区三区四区第35| 99精品久久久久人妻精品| 国语对白做爰xxxⅹ性视频网站| 国产真人三级小视频在线观看| 日韩大码丰满熟妇| 亚洲精品国产av成人精品| 人妻 亚洲 视频| av福利片在线| 秋霞在线观看毛片| 中文字幕人妻丝袜制服| 亚洲精品av麻豆狂野| 日本91视频免费播放| 欧美精品人与动牲交sv欧美| 久久午夜综合久久蜜桃| 搡老岳熟女国产| 成年人黄色毛片网站| 一本久久精品| 日韩,欧美,国产一区二区三区| 久久久久久亚洲精品国产蜜桃av| 悠悠久久av| 黄频高清免费视频| 人人妻人人添人人爽欧美一区卜| 欧美在线黄色| 99热国产这里只有精品6| www日本在线高清视频| 久久av网站| 性少妇av在线| 晚上一个人看的免费电影| 51午夜福利影视在线观看| 黑人欧美特级aaaaaa片| 91成人精品电影| 嫁个100分男人电影在线观看 | 色精品久久人妻99蜜桃| 免费一级毛片在线播放高清视频 | 亚洲精品一区蜜桃| 成人黄色视频免费在线看| av不卡在线播放| 国产成人一区二区在线| 国产精品三级大全| av在线老鸭窝| 在线观看免费午夜福利视频| 麻豆乱淫一区二区| 大型av网站在线播放| 黄色a级毛片大全视频| 亚洲欧美色中文字幕在线| 制服诱惑二区| 一级黄色大片毛片| 免费女性裸体啪啪无遮挡网站| 久久影院123| 国产亚洲精品第一综合不卡| 中文字幕人妻熟女乱码| 国产视频一区二区在线看| 国产精品av久久久久免费| 久久国产精品人妻蜜桃| av天堂在线播放| 亚洲av国产av综合av卡| 欧美精品啪啪一区二区三区 | 天堂中文最新版在线下载| 高潮久久久久久久久久久不卡| av在线老鸭窝| 国产一区二区在线观看av| 欧美成人午夜精品| 亚洲av日韩在线播放| 亚洲精品av麻豆狂野| 亚洲精品久久成人aⅴ小说| 久久精品久久久久久噜噜老黄| 欧美日韩精品网址| 大陆偷拍与自拍| 精品一区二区三区av网在线观看 | 男人爽女人下面视频在线观看| 国产在线免费精品| 久久久久久久久免费视频了| 国产主播在线观看一区二区 | 欧美黑人精品巨大| 18禁裸乳无遮挡动漫免费视频| 丰满饥渴人妻一区二区三| 肉色欧美久久久久久久蜜桃| 色播在线永久视频| 亚洲精品美女久久av网站| 亚洲欧洲日产国产| 日本欧美视频一区| 日本一区二区免费在线视频| 精品少妇一区二区三区视频日本电影| 欧美xxⅹ黑人| 一本综合久久免费| 免费高清在线观看日韩| 日日摸夜夜添夜夜爱| 赤兔流量卡办理| 一本—道久久a久久精品蜜桃钙片| 丝袜在线中文字幕| 国产黄频视频在线观看| 一级黄色大片毛片| 母亲3免费完整高清在线观看| 9191精品国产免费久久| 女人久久www免费人成看片| 国产人伦9x9x在线观看| 久久久精品免费免费高清| 亚洲免费av在线视频| 国产精品久久久久久精品古装| 国产成人精品无人区| 男男h啪啪无遮挡| 免费看不卡的av| 成人国语在线视频| 久热爱精品视频在线9| 在线天堂中文资源库| 黑人巨大精品欧美一区二区蜜桃| 成人亚洲精品一区在线观看| 亚洲成国产人片在线观看| 欧美日韩精品网址| 男女无遮挡免费网站观看| 亚洲激情五月婷婷啪啪| 日本av手机在线免费观看| 精品人妻1区二区| 亚洲av日韩精品久久久久久密 | 久久国产精品人妻蜜桃| 国产视频一区二区在线看| 国产免费又黄又爽又色| 欧美成狂野欧美在线观看| 免费一级毛片在线播放高清视频 | 欧美黑人精品巨大| 久久精品亚洲av国产电影网| 啦啦啦在线免费观看视频4| 国产免费又黄又爽又色| 久久精品国产亚洲av高清一级| www.精华液| 蜜桃国产av成人99| 国产精品av久久久久免费| 免费久久久久久久精品成人欧美视频| 欧美日韩av久久| 免费看不卡的av| 麻豆国产av国片精品| 欧美激情 高清一区二区三区| 少妇裸体淫交视频免费看高清 | 人人妻人人澡人人看| av国产久精品久网站免费入址| 妹子高潮喷水视频| 午夜福利在线免费观看网站| 久久这里只有精品19| 九色亚洲精品在线播放| 国产在线视频一区二区| 日韩制服骚丝袜av| 亚洲精品日本国产第一区| 国产精品久久久人人做人人爽| 久久性视频一级片| 久久99热这里只频精品6学生| 久久久久久久国产电影| av有码第一页| 久久久国产一区二区| 欧美亚洲日本最大视频资源| 精品国产一区二区三区久久久樱花| 91麻豆av在线| 韩国高清视频一区二区三区| 人人妻人人澡人人爽人人夜夜| 国产男人的电影天堂91| 天天躁日日躁夜夜躁夜夜| 狠狠精品人妻久久久久久综合| 欧美人与善性xxx| 极品人妻少妇av视频| 亚洲欧美中文字幕日韩二区| 欧美黄色片欧美黄色片| 国产色视频综合| 国产1区2区3区精品| 精品人妻一区二区三区麻豆| 国产精品av久久久久免费| 成人国语在线视频| 亚洲国产最新在线播放| 国产主播在线观看一区二区 | 婷婷色综合www| 国产精品久久久av美女十八| 99国产精品一区二区蜜桃av | 老司机在亚洲福利影院| 亚洲成人国产一区在线观看 | 日韩中文字幕欧美一区二区 | 免费一级毛片在线播放高清视频 | 精品久久久精品久久久| 精品国产乱码久久久久久男人| 99久久99久久久精品蜜桃| 一二三四社区在线视频社区8| 久久影院123| 久久天堂一区二区三区四区| 丰满迷人的少妇在线观看| 免费看不卡的av| 丰满人妻熟妇乱又伦精品不卡| 美女午夜性视频免费| 精品欧美一区二区三区在线| 国产淫语在线视频| 男女国产视频网站| 精品视频人人做人人爽| 多毛熟女@视频| 人妻 亚洲 视频| 国产精品 欧美亚洲| 国产淫语在线视频| 精品一区在线观看国产| 久久亚洲国产成人精品v| 国产精品一区二区在线不卡| 高清视频免费观看一区二区| 久久久久久久精品精品| 五月开心婷婷网| 国产av国产精品国产| 国产一区二区三区综合在线观看| 日日爽夜夜爽网站| 久久国产精品大桥未久av| av国产久精品久网站免费入址| 老司机影院毛片| 亚洲av片天天在线观看| 肉色欧美久久久久久久蜜桃| 美女国产高潮福利片在线看| 日韩av不卡免费在线播放| 97精品久久久久久久久久精品| 久久久久久久久久久久大奶| 亚洲熟女毛片儿| 亚洲人成电影观看| 亚洲国产欧美日韩在线播放| 久久久精品国产亚洲av高清涩受| 97在线人人人人妻| 视频区图区小说| 另类精品久久| 男女免费视频国产| 久久青草综合色| 亚洲精品久久成人aⅴ小说| 国产激情久久老熟女| 欧美黑人精品巨大| 两个人看的免费小视频| 大香蕉久久网| 91九色精品人成在线观看| 欧美激情高清一区二区三区| 9热在线视频观看99| 老鸭窝网址在线观看| 欧美精品亚洲一区二区| 免费人妻精品一区二区三区视频| 久久久久久人人人人人| 精品国产一区二区久久| 亚洲成人免费av在线播放| 两人在一起打扑克的视频| 嫩草影视91久久| av片东京热男人的天堂| 男女无遮挡免费网站观看| 国产精品欧美亚洲77777| 成人午夜精彩视频在线观看| 亚洲av电影在线观看一区二区三区| 欧美激情 高清一区二区三区| 黄色a级毛片大全视频| 岛国毛片在线播放| 亚洲精品国产av成人精品| 国产免费福利视频在线观看| 亚洲专区国产一区二区| 成人手机av| 老司机靠b影院| 亚洲av成人精品一二三区| av在线app专区| 91麻豆av在线| 国产主播在线观看一区二区 | 女性生殖器流出的白浆| 欧美乱码精品一区二区三区| 天堂中文最新版在线下载| 成年人午夜在线观看视频| 母亲3免费完整高清在线观看| 一边摸一边做爽爽视频免费| 精品熟女少妇八av免费久了| 涩涩av久久男人的天堂| 一级片'在线观看视频| 日韩欧美一区视频在线观看| 我的亚洲天堂| videosex国产| 女性被躁到高潮视频| 日韩av在线免费看完整版不卡| 激情视频va一区二区三区| 欧美日韩福利视频一区二区| 亚洲av在线观看美女高潮| 国产精品人妻久久久影院| 久久精品熟女亚洲av麻豆精品| 大片电影免费在线观看免费| 亚洲精品成人av观看孕妇| 久久精品国产亚洲av高清一级| 国产高清国产精品国产三级| 午夜福利乱码中文字幕| e午夜精品久久久久久久| 建设人人有责人人尽责人人享有的| 最近最新中文字幕大全免费视频 | 日本91视频免费播放| 又大又黄又爽视频免费| 久久久精品区二区三区| 欧美精品一区二区大全| 老司机深夜福利视频在线观看 | 国产亚洲精品久久久久5区| 丰满少妇做爰视频| 在线天堂中文资源库| 激情五月婷婷亚洲| 成人午夜精彩视频在线观看| 亚洲综合色网址| 精品亚洲成国产av| 欧美日韩一级在线毛片| 秋霞在线观看毛片| 老鸭窝网址在线观看| 国产精品熟女久久久久浪| 精品国产一区二区三区久久久樱花| 亚洲色图综合在线观看| 亚洲国产精品999| 久久久精品94久久精品| 午夜福利乱码中文字幕| 熟女少妇亚洲综合色aaa.| 在线观看一区二区三区激情| 操美女的视频在线观看| 日本五十路高清| 国产成人91sexporn| av线在线观看网站| 免费不卡黄色视频| 亚洲欧美色中文字幕在线| 国产男人的电影天堂91| 青春草视频在线免费观看| 国产不卡av网站在线观看| 成人国语在线视频| 久久精品熟女亚洲av麻豆精品| 操美女的视频在线观看| 99九九在线精品视频| 大香蕉久久网| 久久精品久久精品一区二区三区| 女性生殖器流出的白浆| 天天躁日日躁夜夜躁夜夜| 亚洲视频免费观看视频| 亚洲av成人精品一二三区| 日韩一区二区三区影片| 精品国产乱码久久久久久男人| 国产精品 欧美亚洲| 无遮挡黄片免费观看| 国产一区二区在线观看av| 亚洲 国产 在线| 老司机午夜十八禁免费视频| 久久久国产欧美日韩av| 色婷婷av一区二区三区视频| 欧美日韩黄片免| 国产一区二区三区av在线| 狠狠精品人妻久久久久久综合| 欧美日韩视频精品一区| 啦啦啦啦在线视频资源| 一区在线观看完整版| 乱人伦中国视频| 国产一区亚洲一区在线观看| 精品人妻一区二区三区麻豆| 免费在线观看黄色视频的| 性色av一级| 日韩大码丰满熟妇| 欧美日韩黄片免| 麻豆国产av国片精品| 悠悠久久av| 亚洲欧洲国产日韩| 999久久久国产精品视频| 男人操女人黄网站| 国产精品久久久久久精品古装| 成人黄色视频免费在线看| 韩国精品一区二区三区| 爱豆传媒免费全集在线观看| 一区二区日韩欧美中文字幕| 丰满迷人的少妇在线观看| 一二三四社区在线视频社区8| 一区二区三区四区激情视频| 亚洲国产日韩一区二区| 国产精品欧美亚洲77777| 国产真人三级小视频在线观看| 一级片'在线观看视频| 欧美精品高潮呻吟av久久| 国产麻豆69| 韩国精品一区二区三区| 菩萨蛮人人尽说江南好唐韦庄| 日韩制服丝袜自拍偷拍| 国产熟女午夜一区二区三区| 晚上一个人看的免费电影| 在线观看免费午夜福利视频| 韩国精品一区二区三区| 亚洲国产av影院在线观看| videos熟女内射| 少妇的丰满在线观看| 国产xxxxx性猛交| 国产亚洲欧美精品永久| 两个人免费观看高清视频| 欧美另类一区| 国产又色又爽无遮挡免| 男女边吃奶边做爰视频| 1024香蕉在线观看| 久久久久久久久免费视频了| 人人妻人人爽人人添夜夜欢视频| 50天的宝宝边吃奶边哭怎么回事| 99国产精品免费福利视频| 脱女人内裤的视频| 夫妻性生交免费视频一级片| 最近手机中文字幕大全| 男女下面插进去视频免费观看| 午夜激情av网站| 亚洲五月婷婷丁香| 涩涩av久久男人的天堂| 人人澡人人妻人| 亚洲av日韩在线播放| 午夜视频精品福利| 一级毛片 在线播放| 欧美97在线视频| 中文字幕最新亚洲高清| 99国产精品免费福利视频| 国产成人a∨麻豆精品| 国产精品av久久久久免费| 午夜福利影视在线免费观看| 男女之事视频高清在线观看 | 蜜桃国产av成人99| 女警被强在线播放| 老熟女久久久| 七月丁香在线播放| 国产真人三级小视频在线观看| 男女高潮啪啪啪动态图| 中文字幕人妻丝袜一区二区| 久久久久精品国产欧美久久久 | 精品免费久久久久久久清纯 | www.自偷自拍.com| 国产国语露脸激情在线看| av电影中文网址| 99国产精品一区二区蜜桃av | 80岁老熟妇乱子伦牲交| 久久影院123| 美女高潮到喷水免费观看| 咕卡用的链子| 精品福利永久在线观看| 啦啦啦啦在线视频资源| 少妇人妻久久综合中文| 精品国产一区二区三区四区第35| 久久ye,这里只有精品| 岛国毛片在线播放| 2021少妇久久久久久久久久久| 欧美精品人与动牲交sv欧美| 激情视频va一区二区三区| 国产成人一区二区三区免费视频网站 | 又黄又粗又硬又大视频| 男女下面插进去视频免费观看| 日韩中文字幕欧美一区二区 | 老司机靠b影院| av片东京热男人的天堂| 久久久精品免费免费高清| 亚洲 欧美一区二区三区| 天天添夜夜摸| 亚洲精品日本国产第一区| 欧美日韩成人在线一区二区| 亚洲国产成人一精品久久久| 亚洲国产av新网站| 国产xxxxx性猛交| 久久久久精品国产欧美久久久 | 在线观看一区二区三区激情| 久久国产精品人妻蜜桃| 久久精品人人爽人人爽视色| 热99国产精品久久久久久7|