• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于神經(jīng)網(wǎng)絡(luò)的預(yù)警領(lǐng)域分詞仿真算法

    2022-01-22 02:15:44陳靜雯馬福民
    計(jì)算機(jī)仿真 2021年12期
    關(guān)鍵詞:哈希分詞詞典

    陳靜雯,馬福民,劉 新,李 娟

    (1.江蘇省突發(fā)事件預(yù)警信息發(fā)布中心,江蘇 南京 210008;2.南京財(cái)經(jīng)大學(xué)信息工程學(xué)院,江蘇 南京,210023)

    1 引言

    分詞是自然語言處理技術(shù)的基礎(chǔ)性工作,其結(jié)果直接影響后續(xù)的文本質(zhì)量控制、本體構(gòu)建、知識提取、輔助決策和輿情監(jiān)控等工作。預(yù)警信息發(fā)布作為國家十三五規(guī)劃[1]應(yīng)急體系建設(shè)中的重要一環(huán),文本的正確性校驗(yàn)及信息分析至關(guān)重要。然而,面對預(yù)警信息第一時(shí)間準(zhǔn)確發(fā)布、快速發(fā)布的需求,預(yù)警文本專業(yè)術(shù)語、組合詞較多的獨(dú)特性以及一定規(guī)模語料庫的缺失,給面向預(yù)警領(lǐng)域的分詞方法帶來了巨大挑戰(zhàn)。如何在提高預(yù)警領(lǐng)域分詞效果的同時(shí),兼顧分詞效率成為當(dāng)前的研究熱點(diǎn)。

    根據(jù)分詞文本是否涉及特定專業(yè)領(lǐng)域,中文分詞問題可以分為兩種類型:通用領(lǐng)域分詞方法和特定領(lǐng)域分詞方法。前者主要采用基于詞典的機(jī)械分詞方法或基于統(tǒng)計(jì)的分詞方法。機(jī)械分詞方法分詞速度快且易于實(shí)現(xiàn),但詞典的構(gòu)造結(jié)構(gòu)對分詞速度有著直接的影響。為進(jìn)一步提高分詞算法的效率,Zhou等[2]提出了一種雙字哈希詞典機(jī)制,在不提升已有詞典空間復(fù)雜度與維護(hù)復(fù)雜度的情況下,提高了中文分詞的效率。Chen等[3]深入分析最大匹配分詞算法的不足,根據(jù)首字詞長遞減原則構(gòu)造雙字哈希詞典,并設(shè)計(jì)了相應(yīng)的快速最大匹配分詞算法,分詞速度大幅提高。機(jī)械分詞算法在大多數(shù)情況下是合理的,但由于不涉及語法及語義知識,不具備歧義處理能力,容易引發(fā)一些切分錯(cuò)誤。

    為彌補(bǔ)機(jī)械分詞的不足,基于統(tǒng)計(jì)的分詞方法將分詞問題轉(zhuǎn)化為序列標(biāo)注問題,將語料庫中漢字的共現(xiàn)頻率作為切分依據(jù),能夠有效處理歧義并識別未登錄詞。常用方法包括條件隨機(jī)場、隱馬爾科夫[4-6]以及基于深度學(xué)習(xí)的長短期記憶神經(jīng)網(wǎng)絡(luò)[7]、卷積神經(jīng)網(wǎng)絡(luò)[8]分詞模型等。然而,當(dāng)隱藏狀態(tài)數(shù)為N,預(yù)測狀態(tài)為NT時(shí),條件隨機(jī)場模型和隱馬爾科夫模型的時(shí)間復(fù)雜度為,計(jì)算量較高,神經(jīng)網(wǎng)絡(luò)模型的計(jì)算量則更為龐大。

    由于通用詞典和通用語料庫的限制,通用分詞方法的領(lǐng)域適應(yīng)性較差,直接將通用分詞方法應(yīng)用于專業(yè)領(lǐng)域文本,其分詞效果會(huì)急劇下降。為此,諸多學(xué)者將領(lǐng)域信息引入通用分詞方法,嘗試研究針對特定領(lǐng)域的分詞模型[9-11]。Gong等[12]在馬爾科夫模型的基礎(chǔ)上,構(gòu)建石油領(lǐng)域術(shù)語集,結(jié)合領(lǐng)域詞典和互信息校準(zhǔn)粗分結(jié)果,實(shí)現(xiàn)對石油領(lǐng)域術(shù)語和組合詞的精確識別,為預(yù)警領(lǐng)域分詞提供了思路。Zhang等[13]采用雙向長短期記憶網(wǎng)絡(luò)對3774條預(yù)警信息文本數(shù)據(jù)集(約30萬余字)進(jìn)行訓(xùn)練,提出了一種針對預(yù)警文本的分詞算法。遺憾的是,算法過度依賴統(tǒng)計(jì)結(jié)果,語料庫的規(guī)模限制了分詞效果[3]。不同于石油文本,預(yù)警信息是一個(gè)非常狹窄的領(lǐng)域,以江蘇省為例,2018年度全年預(yù)警共11683條,漢字量不足200萬,且并未完成預(yù)警文本的人工語料標(biāo)注工作,大規(guī)模語料庫構(gòu)建困難重重。因此,文獻(xiàn)[13]的分詞結(jié)果在準(zhǔn)確率、召回率上都無法滿足預(yù)警信息準(zhǔn)確校驗(yàn)的需求(P僅為87%)。針對這一問題,Lan等[14]詳細(xì)論證了較小規(guī)模語料庫在糾正場景中的可用性,提出了一種領(lǐng)域糾正器框架,第一階段使用通用分詞方法對文本進(jìn)行粗分,可由任意一種分詞器完成;第二階段引入領(lǐng)域語料,利用LSTM模型構(gòu)建領(lǐng)域糾正器,獲得了較好的分詞性能和魯棒性。在此基礎(chǔ)上,文獻(xiàn)[15]使用GRU代替LSTM,在一定程度上加快了訓(xùn)練速度。仍存在的問題是,上述兩種領(lǐng)域糾正器分詞模型在兩個(gè)階段分別使用基于統(tǒng)計(jì)和神經(jīng)網(wǎng)絡(luò)的分詞方法,在分詞效率上仍無法滿足預(yù)警信息第一時(shí)間快速發(fā)布的需求。

    本文以領(lǐng)域糾正器分詞模型為理論基礎(chǔ),深入探索預(yù)警文本特性,將詞頻作為權(quán)重信息,對文獻(xiàn)[3]的雙字哈希詞典構(gòu)造方法進(jìn)行改進(jìn),適用于預(yù)警文本的有效詞語排列位置大幅前移,匹配成功率得到極大提高。利用最大匹配分詞算法進(jìn)行粗分,相對于完全依賴統(tǒng)計(jì)結(jié)果的領(lǐng)域適應(yīng)模型[12],分詞效率進(jìn)一步提高。在領(lǐng)域糾正階段,為彌補(bǔ)LSTM模型[13]在小規(guī)模語料庫上應(yīng)用效果較弱以及單向GRU模型[15]忽略了未來語義信息的缺陷,采用雙向GRU模型提高了算法的領(lǐng)域適應(yīng)性。對比實(shí)驗(yàn)證明了分詞結(jié)果及分詞速度的優(yōu)越性。

    2 領(lǐng)域糾正器框架

    本章將介紹領(lǐng)域糾正器框架(Domain Corrector Frame-work,DCF)及其形式化說明。

    領(lǐng)域糾正器框架由兩部分組成:通用分詞過程、領(lǐng)域糾正過程。圖1展示了領(lǐng)域糾正器框架的工作流程。其中,通用分詞過程僅對文本進(jìn)行初步分詞,可由任意一種分詞器來完成。在獲得初步分詞結(jié)果后,領(lǐng)域糾正過程通過由統(tǒng)計(jì)模型實(shí)現(xiàn)的“糾正器”預(yù)測出針對通用分詞結(jié)果的糾正動(dòng)作序列,結(jié)合預(yù)先定義的糾正邏輯逐字修改分詞結(jié)果,最終得到符合特定領(lǐng)域的分詞輸出。

    圖1 領(lǐng)域糾正器框架流程圖

    領(lǐng)域糾正器框架不依賴于構(gòu)建通用分詞器時(shí)使用的語料資源和建模方法,大大降低了對訓(xùn)練資源的要求。其形式化說明如下所述。

    2.1 通用分詞過程

    給定一個(gè)字符輸入序列xc=c1,c2,…,cn,經(jīng)過通用分詞過程輸出原始的分詞結(jié)果,并將其轉(zhuǎn)換為分詞標(biāo)簽序列ys=ls1,ls2,…,lsn,其中l(wèi)s∈LS,Ls={B,N},B代表詞首字,N代表詞中字或者詞尾部。如分詞結(jié)果“江蘇省/氣象臺(tái)/發(fā)布/寒潮/藍(lán)色/預(yù)警/信號”對應(yīng)的分詞標(biāo)簽序列為“B,N,N,B,N,N,B,N,B,N,B,N,B,N,B,N”。

    2.2 領(lǐng)域糾正過程

    通用分詞過程結(jié)束后,xc和ys同時(shí)被送入稱之為“糾正器”的糾正模塊,以預(yù)測糾正標(biāo)簽序列yC=lC1,lC2,…,lCn,其中l(wèi)C∈LC,LC={U,LI,D} ,表示糾正動(dòng)作的類型,U表示無需糾正,I表示插入字前空格,D表示刪除字前空格。例如對文本“我市區(qū)域空氣質(zhì)量”的通用分詞結(jié)果為“我市區(qū)/域/空氣/質(zhì)量”,準(zhǔn)確分詞結(jié)果應(yīng)為“我市/區(qū)域/空氣/質(zhì)量”,則期望的糾正序列為“U,U,I,D,U,U,U,U”,可由CRF、LSTM等模型實(shí)現(xiàn)。

    3 基于領(lǐng)域糾正器框架的預(yù)警分詞模型

    3.1 分詞模型思想

    文獻(xiàn)[13]利用已有合法預(yù)警文本數(shù)據(jù)集和開放域通用公開數(shù)據(jù)集進(jìn)行建模,設(shè)計(jì)了一種基于Bi-LSTM-CRF的預(yù)警信息分詞算法,是目前針對預(yù)警文本分詞效果最好的一種算法,分詞準(zhǔn)確率達(dá)到0.87、召回率達(dá)到0.89。由于沒有進(jìn)一步探究預(yù)警文本獨(dú)有的特點(diǎn),分詞算法在準(zhǔn)確率和召回率上仍有提高的空間。此外,該算法的高準(zhǔn)確率建立在龐大建模數(shù)據(jù)集的基礎(chǔ)上,分詞速度較慢,距離預(yù)警信息第一時(shí)間快速發(fā)布的需求仍有差距。引入領(lǐng)域糾正器思想,在一定程度上解決了上述問題。

    深入分析近五年的預(yù)警信息文本可以發(fā)現(xiàn)其存在如下特點(diǎn):1)本文由通用詞匯及預(yù)警領(lǐng)域詞匯組成,通用詞匯占比較大;2)易產(chǎn)生歧義的部分通常伴有領(lǐng)域詞匯,如2.2節(jié)的“區(qū)域空氣質(zhì)量”;3)預(yù)警發(fā)布相關(guān)法律規(guī)定對預(yù)警信息文本從內(nèi)容及形式上作出了限制,因此,相當(dāng)程度上的通用詞語在預(yù)警文本中不會(huì)出現(xiàn),如人民日報(bào)語料庫收錄的“歷史”、“人民”、“科技大學(xué)”等。

    考慮預(yù)警信息文本特點(diǎn)并兼顧算法效率,利用機(jī)械分詞算法作為通用分詞器對預(yù)警本文進(jìn)行快速粗分較為合適。在3.2節(jié)提出了一種基于權(quán)重的雙字哈希詞典構(gòu)造方法,進(jìn)一步提高粗分效率。領(lǐng)域糾正階段,將近五年發(fā)布的預(yù)警文本作為語料庫進(jìn)行建模,語料庫的領(lǐng)域針對性對提高分詞準(zhǔn)確率幫助較高;使用運(yùn)算效率較高的雙向GRU模型進(jìn)行建模,分詞速度進(jìn)一步提高。

    3.2 權(quán)重雙字哈希字典構(gòu)造

    詞典結(jié)構(gòu)對機(jī)械分詞算法的效率有著舉足輕重的影響。由3.1節(jié)的分析可知,通用詞典中大部分詞語并不會(huì)在預(yù)警文本中出現(xiàn),遍歷整個(gè)詞典的匹配機(jī)制嚴(yán)重影響切分速度。但考慮到防災(zāi)減災(zāi)事業(yè)的發(fā)展及政策變更可能會(huì)產(chǎn)生相對于歷史預(yù)警文本的未登錄詞,縮減通用詞典詞量并不合適。為在一定程度上提高通用分詞階段的分詞效率,設(shè)計(jì)了一種基于權(quán)重的字典構(gòu)造方法。通過對已有合法預(yù)警本文的詞頻統(tǒng)計(jì)(出現(xiàn)次數(shù)總計(jì)),將詞頻作為權(quán)重信息,在雙字哈希的基礎(chǔ)上,標(biāo)注詞典正文的權(quán)重信息,按權(quán)重逆序排列,大幅度減少匹配次數(shù)。詞典結(jié)構(gòu)如圖2所示。

    圖2 基于權(quán)重的詞典結(jié)構(gòu)

    3.3 雙向GRU領(lǐng)域糾正器

    文獻(xiàn)[13]將已有合法預(yù)警數(shù)據(jù)和開放域通用公開數(shù)據(jù)集作為輸入,通過LSTM-CRF模型訓(xùn)練預(yù)警分詞模型。預(yù)警語料庫的規(guī)模不足導(dǎo)致領(lǐng)域適應(yīng)性較弱,復(fù)雜的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)則導(dǎo)致模型耗時(shí)較長。文獻(xiàn)[15]使用結(jié)構(gòu)較為簡單的GRU-CRF模型構(gòu)造領(lǐng)域糾正器,在加快訓(xùn)練速度的時(shí)候減少了模型過度擬合的可能性,在小規(guī)模語料庫上的應(yīng)用效果相對LSTM-CRF模型較優(yōu)。然而,單向GRU模型僅攜帶過去的語義信息,并未考慮到未來語義對分詞結(jié)果的影響。針對規(guī)模較小的預(yù)警語料庫,本文采用雙向GRU-CRF模型,充分利用預(yù)警語義信息的同時(shí)兼顧模型構(gòu)建效率。

    3.3.1 Embedding層

    該層由兩種不同的Embedding組成:漢字Embedding和分詞標(biāo)簽Embedding,分別記為Ec∈R|D|×dc以及El∈R|Ls|×dl,其中|D|表示漢字字典的大小。一個(gè)漢字字符cl或一個(gè)分詞標(biāo)簽lSt的前向數(shù)值向量為vLct和vLlt,逆序輸入的漢字Embedding和分詞標(biāo)簽Embedding得到后向數(shù)值向量為vRct和vRlt。使用四詞位標(biāo)簽集Ls={B,M,E,S},其中,B,M,E,S分別表示詞首字、詞中字、詞尾字和單字詞。

    3.3.2 輸入層

    在輸入層對詞向量和標(biāo)簽向量進(jìn)行兩次拼接。第一步將時(shí)刻前向向量vLct和vLlt,后向向量vRct和vRlt拼接為前向詞-標(biāo)簽向量vLclt和后向詞-標(biāo)簽向量vRclt。第二步將上下文窗口[t-k1,t+k2]中的k1+k2+1個(gè)向量拼接成前向GRUL、后向RGRUR和最終的輸入向量vinput,即

    vLclt=[vLct,vLlt],vRclt=[vRct,vRlt]

    GRUL=[vLclt-k1,vLclt-k1+1,…,vLclt-k2-1,vLclt-k2]

    GRUR=[vRclt-k1,vRclt-k1+1,…,vRclt-k2-1,vRclt-k2]

    vinput={[vLclt-k1,vRclt-k1],[vLclt-k1+1,vRclt-k1+1],…

    3.3.3 隱藏層

    隱藏層分別從序列的首端和尾端運(yùn)行,某一時(shí)刻的輸出同時(shí)考慮過去和未來的上下文信息,在序列標(biāo)注的任務(wù)上表現(xiàn)的更加優(yōu)秀。GRU單元通過更新門和重置門來控制信息流動(dòng),計(jì)算過程如下:

    更新門

    zt=σ(Wz·[st-1,vinput])

    重置門

    rt=σ(Wr·[st-1,vinput])

    狀態(tài)更新

    3.3.4 CRF層

    CRF層可推斷糾正序列的最優(yōu)標(biāo)記,進(jìn)一步提高分詞正確率。隱藏表征向量序列h經(jīng)過線性映射后可得到一元?jiǎng)莺瘮?shù)φnn(yCt,X)。而二元?jiǎng)莺瘮?shù)可由矩陣A∈R|LC|×|LC|來表達(dá),Ai,j表示從糾正標(biāo)簽i轉(zhuǎn)移到標(biāo)簽j的分值。對于給定的糾正序列yC,其由輸入決定的條件概率計(jì)算如下

    3.4 算法描述

    算法1 快速預(yù)警信息分詞算法(FCWS_ WI)

    輸入:字符串x=c1c2…cn,c表示一個(gè)單字

    輸出:分詞結(jié)果S=s1s2…sm,s表示一個(gè)詞

    1) 對輸入的字符串,采用權(quán)重哈希雙子詞典及相應(yīng)的最大匹配分詞算法,計(jì)算得到通用分詞階段的粗分結(jié)果M=m1m2…mp。

    算法工作流程如圖3所示。

    圖3 FCWS_ WI算法工作流程

    4 仿真分析

    為滿足預(yù)警信息第一時(shí)間準(zhǔn)確發(fā)布的需求,本文提出了一種基于預(yù)警領(lǐng)域知識的權(quán)重哈希雙字詞典,通過減少通用分詞過程的匹配次數(shù)降低分詞算法計(jì)算量;構(gòu)建已有合法預(yù)警文本語料庫,提出了一種基于雙向GRU-CRF的預(yù)警領(lǐng)域糾正器模型,從快速性、準(zhǔn)確性兩方面對現(xiàn)有的面向預(yù)警領(lǐng)域的分詞方法進(jìn)行了優(yōu)化。實(shí)驗(yàn)階段將從上述兩方面分別開展。

    4.1 算法快速性對比

    本文算法FCWS_WI,在通用分詞階段構(gòu)造了適用于預(yù)警文本的領(lǐng)域詞典,匹配計(jì)算量大幅度縮減;為提高領(lǐng)域適應(yīng)性,在領(lǐng)域糾正階段,針對性的采用已有合法預(yù)警文本作為語料庫,相對于文獻(xiàn)[13]的Bi-LSTM-CRF_WI算法語料庫規(guī)模較小,神經(jīng)網(wǎng)絡(luò)訓(xùn)練速度較快,進(jìn)一步提高到了算法效率。

    本節(jié)首先對比不同領(lǐng)域詞典下的粗分效果,再對現(xiàn)有領(lǐng)域分詞算法的計(jì)算時(shí)間進(jìn)行對比。

    實(shí)驗(yàn)選用江蘇省2013年至2018年合法預(yù)警信息文本作為語料庫,記為DB1,構(gòu)建本文權(quán)重哈希雙字詞典,將2019年合法預(yù)警信息文本作為測試數(shù)據(jù),記為DB2。以上數(shù)據(jù)集均通過江蘇省氣象局預(yù)報(bào)員進(jìn)行語義校準(zhǔn)。數(shù)據(jù)集特征如表1所示。

    表1 數(shù)據(jù)集

    為證明本文引入權(quán)重信息構(gòu)造詞典的領(lǐng)域優(yōu)勢,實(shí)驗(yàn)將對比三種哈希結(jié)構(gòu)詞典:雙字哈希(記為Dic_Hash)、字長雙字哈希(記為Dic_ HashLen)以及本文提出的權(quán)重雙字哈希(記為Dic_HashWei)的粗分效率。三種詞典分詞結(jié)果示例如表2所示,平均計(jì)算時(shí)間見圖4。

    表2 三種詞典結(jié)果分詞結(jié)果示例

    圖4 不同樣本數(shù)量三種結(jié)構(gòu)詞典平均分詞時(shí)間

    由表2的分詞結(jié)果及圖4的平均分詞時(shí)間可知,三種詞典的不同構(gòu)造方式,并不改變詞語在詞典中的相對位置,詞語長度信息和權(quán)重信息的引入旨在縮小有效匹配范圍,加快分詞速度,對分詞結(jié)果不構(gòu)成任何影響。如圖4所示,本文所提出的Dic_HashWei詞典結(jié)構(gòu)對分詞效率有著較大的貢獻(xiàn),計(jì)算時(shí)間明顯快于采用Dic_ Hash和Dic_ HashLen兩種詞典結(jié)構(gòu)。由于缺乏領(lǐng)域知識,基于Dic_ Hash和Dic_ HashLen兩種詞典的分詞算法在每一次匹配時(shí)都需遍歷整個(gè)詞典(概率),而基于Dic_HashFre的分詞算法在每一次匹配時(shí)都有極大的概率在小規(guī)模的搜索范圍內(nèi)匹配到目標(biāo)詞語,隨著數(shù)據(jù)集樣本數(shù)量的增加,后者的計(jì)算時(shí)間大幅下降,在搜索的快速性方面具有明顯的優(yōu)勢。

    在此基礎(chǔ)上,對比本文算法FCWS_WI與通用分詞算法MTE-CRFs[4]以及領(lǐng)域分詞算法:現(xiàn)有預(yù)警分詞算法Bi-LSTM-CRF_WI[13]、石油領(lǐng)域分詞算法HMM_O[12]、文獻(xiàn)[15]中的領(lǐng)域糾正器算法(記為:DCF-GRU)在算計(jì)效率上的表現(xiàn)。實(shí)驗(yàn)結(jié)果如圖5所示。

    圖5 不同樣本數(shù)量五種分詞算法平均計(jì)算時(shí)間

    圖5的結(jié)果表明,由機(jī)械分詞算法、權(quán)重哈希雙字詞典和雙向GRU-CRF模型建立的分詞算法FCWS_WI能夠快速的得到預(yù)警文本的分詞結(jié)果。在樣本數(shù)量為22242時(shí),領(lǐng)域分詞算法HMM_O、DCF-GRU、Bi-LSTM-CRF_WI平均分詞時(shí)間接近本文FCWS_WI算法的5倍、8倍和13倍。更進(jìn)一步的,即使是相對領(lǐng)域分詞算法計(jì)算較為簡單通用分詞算法MTE-CRFs,其計(jì)算時(shí)間也是本文算法的2倍。相較而言,本文FCWS_WI分詞算法更好的滿足了預(yù)警信息第一時(shí)間發(fā)布的需求。

    4.2 算法效果對比

    4.2.1 評價(jià)指標(biāo)

    文本使用準(zhǔn)確率、召回率和F值評價(jià)分詞算法性能。其中,準(zhǔn)確率是分詞正確的單詞數(shù)與分詞結(jié)果總數(shù)的比率,衡量分詞結(jié)果的查準(zhǔn)率;召回率是分詞正確的單詞數(shù)與實(shí)際單詞總數(shù)的比率,衡量的是分詞結(jié)果的查全率。取值在0到1之間,越接近1準(zhǔn)確率或召回率越高,具體定義如下:

    4.2.2 預(yù)警領(lǐng)域分詞結(jié)果

    實(shí)驗(yàn)中用DB1訓(xùn)練分詞模型,DB2作為測試數(shù)據(jù),分別對比算法Bi-LSTM-CRF_WI、HMM_O以及本文算法FCWS_WI的分詞效果。部分分詞結(jié)果如表3所示。

    表3 五種中文分詞算法分詞結(jié)果

    在該段預(yù)警文本中,含有“大到暴雨”、“大暴雨”、“強(qiáng)降水”、“部分地區(qū)”等預(yù)警常用詞語常用詞匯和“將出現(xiàn)”、等歧義短語,紅色標(biāo)注錯(cuò)誤分詞結(jié)果。通用分詞算法MTE-CRFs未考慮預(yù)警領(lǐng)域語義,對比領(lǐng)域分詞算法分詞能力較差。同時(shí)使用通用語料庫和領(lǐng)域語料庫訓(xùn)練模型的Bi-LSTM-CRF_WI算法、HMM_ O算法以及未考慮未來語義的DCF-GRU算法,在預(yù)警文本的切分上仍存在偏差。反觀本文FCWS_WI算法,由于在訓(xùn)練模型時(shí)僅使用預(yù)警領(lǐng)域語料,領(lǐng)域適應(yīng)性較強(qiáng),上述詞語均被有效識別并切分。三種算法的準(zhǔn)確率、召回率和F值如表4所列。

    表4 準(zhǔn)確率、召回率及F值對比(單位:100%)

    本文算法準(zhǔn)確率、召回率及F值的結(jié)果都高于Bi-LSTM-CRF_WI算法和HMM_O算法,且都高于90%,進(jìn)一步說明了本文算法在分詞效果上的優(yōu)越性。

    5 結(jié)束語

    作為國家應(yīng)急體系的重要工作之一,預(yù)警信息的第一時(shí)間快速發(fā)布,對預(yù)警領(lǐng)域分詞算法的效率和準(zhǔn)確性作出了較高的要求。將領(lǐng)域糾正器模型作為理論基礎(chǔ),分析預(yù)警文本特性,提出了一種針對預(yù)警信息的領(lǐng)域分詞模型。①引入權(quán)重信息構(gòu)建哈希雙字詞典,在保證切分結(jié)果不變的前提下大幅度縮減匹配計(jì)算量,粗分效率提高可達(dá)6倍。② 僅采用已有合法預(yù)警文本構(gòu)建領(lǐng)域語料庫,選用小規(guī)模語料庫應(yīng)用效果較優(yōu)的GRU模型進(jìn)行建模,結(jié)構(gòu)較為簡單,分詞速度相對于現(xiàn)有領(lǐng)域分詞器提高了5-13倍。③考慮到未來語義信息對分詞結(jié)果的影響,構(gòu)建雙向GRU-CRF模型,進(jìn)一步提高領(lǐng)域適應(yīng)性,在準(zhǔn)確率、召回率和F值方面較現(xiàn)有分詞算法提高5.06%、2.78%和3.9%。下一步工作是研究如何從領(lǐng)域語料中進(jìn)一步提取語義信息,提高未登錄詞的處理能力。

    猜你喜歡
    哈希分詞詞典
    米沃什詞典
    文苑(2019年24期)2020-01-06 12:06:50
    結(jié)巴分詞在詞云中的應(yīng)用
    評《現(xiàn)代漢語詞典》(第6版)
    詞典例證翻譯標(biāo)準(zhǔn)探索
    值得重視的分詞的特殊用法
    基于OpenCV與均值哈希算法的人臉相似識別系統(tǒng)
    基于維度分解的哈希多維快速流分類算法
    基于同態(tài)哈希函數(shù)的云數(shù)據(jù)完整性驗(yàn)證算法
    一種基于Bigram二級哈希的中文索引結(jié)構(gòu)
    高考分詞作狀語考點(diǎn)歸納與疑難解析
    在线观看一区二区三区激情| 69精品国产乱码久久久| 中文字幕人妻丝袜制服| 日本-黄色视频高清免费观看| 久久这里有精品视频免费| 久久久精品免费免费高清| 亚洲丝袜综合中文字幕| 亚洲三级黄色毛片| 午夜视频国产福利| 少妇被粗大的猛进出69影院 | 国产极品天堂在线| 人人妻人人爽人人添夜夜欢视频 | 男人狂女人下面高潮的视频| 婷婷色av中文字幕| 美女视频免费永久观看网站| 亚洲图色成人| 亚洲人与动物交配视频| 黄色怎么调成土黄色| 高清欧美精品videossex| 狠狠精品人妻久久久久久综合| 国产伦理片在线播放av一区| 日日啪夜夜撸| 综合色丁香网| 99热这里只有精品一区| 三级经典国产精品| 精品久久久久久电影网| 插阴视频在线观看视频| 精品亚洲成a人片在线观看| h日本视频在线播放| 最黄视频免费看| 亚洲精品国产色婷婷电影| 久久久久久久久久久久大奶| 天天躁夜夜躁狠狠久久av| 七月丁香在线播放| 久久国内精品自在自线图片| 国产精品麻豆人妻色哟哟久久| 波野结衣二区三区在线| 各种免费的搞黄视频| 少妇猛男粗大的猛烈进出视频| 如何舔出高潮| 夫妻性生交免费视频一级片| 国产成人91sexporn| 美女福利国产在线| 国产亚洲av片在线观看秒播厂| h日本视频在线播放| 亚洲美女视频黄频| 一级毛片我不卡| 国产日韩欧美亚洲二区| 国产成人精品无人区| 五月玫瑰六月丁香| 中文乱码字字幕精品一区二区三区| 国产精品麻豆人妻色哟哟久久| 夜夜看夜夜爽夜夜摸| 日日撸夜夜添| av国产久精品久网站免费入址| 99热这里只有精品一区| 中文字幕人妻丝袜制服| 色哟哟·www| 欧美日韩av久久| 久久精品熟女亚洲av麻豆精品| 国产精品一二三区在线看| 老女人水多毛片| 九九在线视频观看精品| 少妇人妻久久综合中文| 91精品伊人久久大香线蕉| 在线亚洲精品国产二区图片欧美 | 亚洲美女黄色视频免费看| 免费大片18禁| 极品教师在线视频| 国产欧美亚洲国产| 国产成人免费观看mmmm| 一本大道久久a久久精品| 在线观看人妻少妇| 亚洲精品自拍成人| 精品少妇久久久久久888优播| 嘟嘟电影网在线观看| 国产一区二区三区综合在线观看 | 这个男人来自地球电影免费观看 | 美女视频免费永久观看网站| 亚洲av二区三区四区| 日韩精品有码人妻一区| 美女cb高潮喷水在线观看| 亚洲国产毛片av蜜桃av| 日韩人妻高清精品专区| 国产日韩一区二区三区精品不卡 | 高清在线视频一区二区三区| 欧美三级亚洲精品| 久久久精品94久久精品| 亚洲av不卡在线观看| 精品少妇黑人巨大在线播放| 久久久久精品久久久久真实原创| 嫩草影院入口| 日本91视频免费播放| 免费观看av网站的网址| 男女国产视频网站| 国产精品久久久久久久久免| 夫妻性生交免费视频一级片| 午夜激情久久久久久久| 在线观看www视频免费| 久久久久久久久久成人| 精品一区二区免费观看| a 毛片基地| 国产又色又爽无遮挡免| 国产一区二区在线观看日韩| 春色校园在线视频观看| 国产欧美日韩精品一区二区| 汤姆久久久久久久影院中文字幕| 91在线精品国自产拍蜜月| 蜜桃久久精品国产亚洲av| 人人妻人人澡人人爽人人夜夜| 女人精品久久久久毛片| 在线免费观看不下载黄p国产| 国产精品人妻久久久久久| 欧美日韩在线观看h| 国精品久久久久久国模美| 亚洲美女搞黄在线观看| 三级国产精品欧美在线观看| 狂野欧美激情性xxxx在线观看| 建设人人有责人人尽责人人享有的| 一个人看视频在线观看www免费| 国内揄拍国产精品人妻在线| 2021少妇久久久久久久久久久| 青春草视频在线免费观看| 男女啪啪激烈高潮av片| 黄色怎么调成土黄色| 黑人巨大精品欧美一区二区蜜桃 | 久久鲁丝午夜福利片| 国内揄拍国产精品人妻在线| 国内精品宾馆在线| 国产毛片在线视频| 99热网站在线观看| 久久精品夜色国产| h日本视频在线播放| 久久久久视频综合| 99热这里只有是精品在线观看| 精品少妇黑人巨大在线播放| 一本—道久久a久久精品蜜桃钙片| 成年人午夜在线观看视频| 久久毛片免费看一区二区三区| 国产精品成人在线| 一区二区三区乱码不卡18| 久久婷婷青草| 久久久久精品久久久久真实原创| 精品一区二区三区视频在线| 伊人久久精品亚洲午夜| 高清av免费在线| 少妇熟女欧美另类| 99精国产麻豆久久婷婷| 欧美少妇被猛烈插入视频| 亚洲欧美清纯卡通| 在线观看www视频免费| 国产黄片美女视频| 国产亚洲午夜精品一区二区久久| 91精品国产九色| a 毛片基地| 久久精品国产亚洲网站| 高清午夜精品一区二区三区| 日韩强制内射视频| 丝袜喷水一区| 欧美日韩在线观看h| 一区二区三区免费毛片| 久久精品熟女亚洲av麻豆精品| av播播在线观看一区| 亚洲高清免费不卡视频| 久久亚洲国产成人精品v| 少妇丰满av| 一本大道久久a久久精品| 亚洲人成网站在线观看播放| 最新中文字幕久久久久| 欧美精品亚洲一区二区| 99国产精品免费福利视频| www.色视频.com| av女优亚洲男人天堂| 尾随美女入室| 日韩制服骚丝袜av| 建设人人有责人人尽责人人享有的| 亚洲经典国产精华液单| 欧美精品国产亚洲| 亚洲精品乱码久久久v下载方式| 午夜福利在线观看免费完整高清在| 国产亚洲91精品色在线| 欧美3d第一页| 欧美精品人与动牲交sv欧美| 嫩草影院入口| 久久这里有精品视频免费| 最黄视频免费看| 在现免费观看毛片| 内射极品少妇av片p| 一级毛片 在线播放| 欧美xxxx性猛交bbbb| 看免费成人av毛片| 97在线视频观看| 纯流量卡能插随身wifi吗| 午夜福利网站1000一区二区三区| 日日摸夜夜添夜夜爱| 秋霞伦理黄片| 日韩精品有码人妻一区| 久久99热6这里只有精品| 免费av不卡在线播放| 多毛熟女@视频| 亚洲人成网站在线播| 亚洲av日韩在线播放| 免费久久久久久久精品成人欧美视频 | 狂野欧美激情性bbbbbb| 亚洲美女搞黄在线观看| 伊人久久精品亚洲午夜| 亚洲精品,欧美精品| 在线观看国产h片| 我要看黄色一级片免费的| 久久精品国产a三级三级三级| 波野结衣二区三区在线| 亚洲国产av新网站| 99久久综合免费| 成年av动漫网址| 伊人久久精品亚洲午夜| 日韩中字成人| 美女福利国产在线| 亚洲精品乱码久久久v下载方式| 国产精品.久久久| 精品国产一区二区久久| 国产免费视频播放在线视频| 国产91av在线免费观看| 亚洲中文av在线| 少妇人妻久久综合中文| 久久人人爽人人片av| 成人亚洲欧美一区二区av| 成人18禁高潮啪啪吃奶动态图 | 99久久精品一区二区三区| 99热国产这里只有精品6| 亚洲国产色片| 99视频精品全部免费 在线| 免费av中文字幕在线| 欧美成人午夜免费资源| 深夜a级毛片| 男人爽女人下面视频在线观看| 成年人免费黄色播放视频 | 国产乱人偷精品视频| 亚洲av中文av极速乱| 能在线免费看毛片的网站| 午夜免费男女啪啪视频观看| 自拍欧美九色日韩亚洲蝌蚪91 | 国产一区亚洲一区在线观看| 高清毛片免费看| 日韩av在线免费看完整版不卡| 毛片一级片免费看久久久久| 另类亚洲欧美激情| 少妇的逼好多水| 久久精品国产鲁丝片午夜精品| 汤姆久久久久久久影院中文字幕| 亚洲欧美中文字幕日韩二区| av福利片在线观看| 亚洲欧美日韩卡通动漫| 亚洲性久久影院| 大片电影免费在线观看免费| 精品亚洲成a人片在线观看| 国产精品无大码| 亚洲国产色片| 国产成人精品久久久久久| 久久97久久精品| 午夜免费观看性视频| 日韩制服骚丝袜av| 热re99久久精品国产66热6| 国产免费一级a男人的天堂| 精品少妇内射三级| 国产精品不卡视频一区二区| 日韩av免费高清视频| 国产在线一区二区三区精| av播播在线观看一区| 曰老女人黄片| 日本-黄色视频高清免费观看| 一二三四中文在线观看免费高清| 久久亚洲国产成人精品v| 中文精品一卡2卡3卡4更新| 三上悠亚av全集在线观看 | 久久精品国产亚洲av天美| 国产黄频视频在线观看| 中文乱码字字幕精品一区二区三区| 欧美最新免费一区二区三区| 少妇猛男粗大的猛烈进出视频| 中文资源天堂在线| 伦理电影免费视频| 国产欧美日韩精品一区二区| 久久人人爽人人爽人人片va| 又黄又爽又刺激的免费视频.| 美女主播在线视频| 国产69精品久久久久777片| 国产成人精品久久久久久| 精品少妇内射三级| 国产白丝娇喘喷水9色精品| 免费大片18禁| 国产成人一区二区在线| 国产精品欧美亚洲77777| 精品人妻一区二区三区麻豆| 一区二区av电影网| 久久久久久久国产电影| 日本色播在线视频| 人妻系列 视频| 天堂中文最新版在线下载| 在线观看免费高清a一片| 久久av网站| 免费av中文字幕在线| 在线观看一区二区三区激情| 久久久久视频综合| 乱人伦中国视频| 成人黄色视频免费在线看| 99热全是精品| 蜜臀久久99精品久久宅男| 熟女人妻精品中文字幕| av网站免费在线观看视频| 欧美 亚洲 国产 日韩一| 黄色日韩在线| 少妇猛男粗大的猛烈进出视频| 内射极品少妇av片p| 五月玫瑰六月丁香| 亚洲人与动物交配视频| 国产日韩欧美在线精品| av女优亚洲男人天堂| 岛国毛片在线播放| 欧美另类一区| 国产在线一区二区三区精| 亚洲真实伦在线观看| 99久久精品国产国产毛片| 欧美激情极品国产一区二区三区 | 麻豆成人av视频| 国产真实伦视频高清在线观看| 午夜老司机福利剧场| 欧美+日韩+精品| 国产一区亚洲一区在线观看| 国产精品久久久久久精品电影小说| 人人妻人人澡人人爽人人夜夜| 国产精品一区二区在线不卡| 极品少妇高潮喷水抽搐| 欧美精品一区二区免费开放| 亚洲国产精品成人久久小说| 亚洲久久久国产精品| 亚洲自偷自拍三级| 亚洲欧美一区二区三区国产| 国产精品.久久久| 国产女主播在线喷水免费视频网站| 欧美少妇被猛烈插入视频| 夜夜爽夜夜爽视频| 少妇的逼好多水| 日韩视频在线欧美| 午夜久久久在线观看| 成人综合一区亚洲| 亚洲内射少妇av| 亚洲三级黄色毛片| 男女边吃奶边做爰视频| 99久久精品一区二区三区| 大片电影免费在线观看免费| 噜噜噜噜噜久久久久久91| 色视频www国产| 男人舔奶头视频| 狂野欧美激情性bbbbbb| 蜜臀久久99精品久久宅男| 少妇熟女欧美另类| 欧美日韩在线观看h| 亚洲成人一二三区av| 欧美精品一区二区免费开放| 特大巨黑吊av在线直播| 国产亚洲5aaaaa淫片| 人妻少妇偷人精品九色| 一级,二级,三级黄色视频| 国产黄色视频一区二区在线观看| 亚洲精品久久久久久婷婷小说| 秋霞在线观看毛片| av在线观看视频网站免费| 在线免费观看不下载黄p国产| 亚洲精品视频女| 亚洲精品第二区| a级毛片在线看网站| 下体分泌物呈黄色| 久久久午夜欧美精品| 韩国av在线不卡| 亚洲精品亚洲一区二区| 啦啦啦啦在线视频资源| av福利片在线| 成年av动漫网址| 国产伦精品一区二区三区视频9| 99热这里只有精品一区| 桃花免费在线播放| 亚洲av成人精品一区久久| xxx大片免费视频| 大又大粗又爽又黄少妇毛片口| 777米奇影视久久| 欧美一级a爱片免费观看看| av免费在线看不卡| videos熟女内射| 亚洲精品乱久久久久久| 久久婷婷青草| 亚洲av电影在线观看一区二区三区| 午夜免费男女啪啪视频观看| 美女xxoo啪啪120秒动态图| 欧美人与善性xxx| 久久精品久久精品一区二区三区| 黄色日韩在线| 热99国产精品久久久久久7| 一级毛片黄色毛片免费观看视频| 性色avwww在线观看| 国产熟女欧美一区二区| 日本爱情动作片www.在线观看| www.av在线官网国产| av卡一久久| 久久精品国产亚洲av涩爱| 欧美另类一区| 国产探花极品一区二区| 好男人视频免费观看在线| 国产av精品麻豆| 一本大道久久a久久精品| 三级国产精品欧美在线观看| 少妇人妻精品综合一区二区| 国产精品无大码| 在线亚洲精品国产二区图片欧美 | 热re99久久国产66热| 亚洲av二区三区四区| 一本久久精品| 熟女电影av网| 亚洲成人手机| 欧美+日韩+精品| 精品人妻熟女毛片av久久网站| 最新中文字幕久久久久| 国产无遮挡羞羞视频在线观看| 午夜福利网站1000一区二区三区| 亚洲欧美清纯卡通| 免费av不卡在线播放| 久久青草综合色| 久久久久久久亚洲中文字幕| 五月伊人婷婷丁香| 亚洲精品中文字幕在线视频 | 国产一区二区在线观看av| 久久久久精品性色| 一级毛片黄色毛片免费观看视频| 精品少妇久久久久久888优播| 熟女av电影| 国产男人的电影天堂91| 晚上一个人看的免费电影| 亚洲真实伦在线观看| 最后的刺客免费高清国语| 久久久久网色| av在线观看视频网站免费| 如何舔出高潮| 最近最新中文字幕免费大全7| 大又大粗又爽又黄少妇毛片口| 国产亚洲最大av| 亚洲久久久国产精品| av卡一久久| 国产免费福利视频在线观看| 99热6这里只有精品| 国产熟女午夜一区二区三区 | 高清午夜精品一区二区三区| 性色avwww在线观看| 成人毛片a级毛片在线播放| 自拍偷自拍亚洲精品老妇| 免费黄色在线免费观看| 男女边摸边吃奶| 免费看av在线观看网站| 又大又黄又爽视频免费| 国产色婷婷99| 久久午夜综合久久蜜桃| 欧美日本中文国产一区发布| 在线观看免费高清a一片| 日本免费在线观看一区| 久久久久国产精品人妻一区二区| 日本色播在线视频| 亚洲国产欧美日韩在线播放 | 80岁老熟妇乱子伦牲交| 国产高清有码在线观看视频| av天堂中文字幕网| 国产成人aa在线观看| 久久国产乱子免费精品| 亚洲精品中文字幕在线视频 | 亚洲国产成人一精品久久久| 亚洲一级一片aⅴ在线观看| 日韩欧美一区视频在线观看 | 美女脱内裤让男人舔精品视频| 欧美日韩av久久| 欧美日韩视频精品一区| 国产色爽女视频免费观看| 国产成人精品婷婷| 久久精品国产亚洲av涩爱| 能在线免费看毛片的网站| 22中文网久久字幕| 免费看av在线观看网站| 成人国产av品久久久| h日本视频在线播放| 老司机亚洲免费影院| 亚洲av欧美aⅴ国产| 国产一级毛片在线| 中国三级夫妇交换| 少妇的逼水好多| 久久 成人 亚洲| 国产免费福利视频在线观看| 超碰97精品在线观看| 少妇人妻一区二区三区视频| 香蕉精品网在线| 久久精品国产自在天天线| 黑人巨大精品欧美一区二区蜜桃 | 国产视频首页在线观看| 亚洲精品456在线播放app| 这个男人来自地球电影免费观看 | 最新中文字幕久久久久| 国产精品伦人一区二区| 自拍偷自拍亚洲精品老妇| 国产无遮挡羞羞视频在线观看| 亚洲美女黄色视频免费看| 最后的刺客免费高清国语| 女人久久www免费人成看片| 好男人视频免费观看在线| 夫妻性生交免费视频一级片| 丰满少妇做爰视频| 亚洲欧美日韩东京热| 校园人妻丝袜中文字幕| 免费大片黄手机在线观看| 综合色丁香网| 亚洲欧美日韩东京热| 在现免费观看毛片| 99视频精品全部免费 在线| 亚洲高清免费不卡视频| .国产精品久久| 欧美日韩国产mv在线观看视频| 插逼视频在线观看| 久久午夜福利片| 色网站视频免费| 最近手机中文字幕大全| 肉色欧美久久久久久久蜜桃| 中文字幕精品免费在线观看视频 | 久久久久久久国产电影| 五月伊人婷婷丁香| 九九爱精品视频在线观看| 国产一区二区在线观看av| 丁香六月天网| 欧美精品国产亚洲| 人妻 亚洲 视频| 欧美少妇被猛烈插入视频| kizo精华| 精品少妇久久久久久888优播| 性高湖久久久久久久久免费观看| 久久韩国三级中文字幕| 久久国产精品大桥未久av | 欧美日韩综合久久久久久| 午夜老司机福利剧场| 亚洲第一区二区三区不卡| 麻豆成人午夜福利视频| 亚洲成人av在线免费| 26uuu在线亚洲综合色| 噜噜噜噜噜久久久久久91| 久久久国产欧美日韩av| 国产女主播在线喷水免费视频网站| 亚洲四区av| 黄色日韩在线| 插阴视频在线观看视频| 日本黄大片高清| 丝袜脚勾引网站| 久久久午夜欧美精品| 亚洲成人一二三区av| 久久精品久久久久久噜噜老黄| 欧美成人午夜免费资源| 亚洲伊人久久精品综合| 亚洲av在线观看美女高潮| 亚洲自偷自拍三级| 秋霞伦理黄片| 中国国产av一级| 看免费成人av毛片| 国产免费一区二区三区四区乱码| 国产熟女欧美一区二区| 下体分泌物呈黄色| 免费高清在线观看视频在线观看| 欧美成人精品欧美一级黄| av福利片在线| 极品少妇高潮喷水抽搐| 国产亚洲欧美精品永久| 亚洲精华国产精华液的使用体验| 天美传媒精品一区二区| 伦理电影大哥的女人| 亚洲精品第二区| 亚洲一级一片aⅴ在线观看| 国产探花极品一区二区| 精品人妻熟女av久视频| 久久久久久久久大av| 国产伦理片在线播放av一区| 亚洲av免费高清在线观看| 欧美bdsm另类| 国产午夜精品一二区理论片| 婷婷色综合www| 国产一区二区在线观看日韩| 国产午夜精品一二区理论片| 美女cb高潮喷水在线观看| 欧美日韩精品成人综合77777| 午夜视频国产福利| 春色校园在线视频观看| 99热国产这里只有精品6| 80岁老熟妇乱子伦牲交| 亚洲精品国产av成人精品| 美女主播在线视频| 国产精品国产av在线观看| 我要看黄色一级片免费的| 日韩伦理黄色片| 国产又色又爽无遮挡免| 日本欧美国产在线视频| 亚洲av成人精品一二三区| 久久av网站| 黄色视频在线播放观看不卡| 亚洲综合色惰| 国产精品99久久久久久久久| 欧美精品亚洲一区二区| 丰满人妻一区二区三区视频av| 日本黄色日本黄色录像| 最近2019中文字幕mv第一页| 我的女老师完整版在线观看| 九草在线视频观看| 免费黄色在线免费观看| av又黄又爽大尺度在线免费看| 亚洲av二区三区四区| 成人二区视频| 精品一区在线观看国产|