• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于中文預(yù)訓(xùn)練的安全事件實(shí)體識(shí)別研究

    2021-07-10 05:49:16董林靖黑新宏王一川劉雁孝
    信息安全研究 2021年7期
    關(guān)鍵詞:模型

    朱 磊 董林靖 黑新宏 王一川 彭 偉 劉雁孝 盤 隆

    1(西安理工大學(xué) 西安 710048) 2(陜西省網(wǎng)絡(luò)計(jì)算與安全技術(shù)重點(diǎn)實(shí)驗(yàn)室(西安理工大學(xué)) 西安 710048)3(深圳市騰訊計(jì)算機(jī)系統(tǒng)有限公司 廣東深圳 518054)

    隨著我國城市中各種各樣的安全突發(fā)事件不斷增多,形成了大量的案例文本信息.現(xiàn)階段公共安全事件輿情中的知識(shí)與信息不能有效地抽取和復(fù)用,無法為公共安全事件管理提供充分的協(xié)助和預(yù)警.在現(xiàn)有的自然語言處理研究領(lǐng)域,對(duì)中文公共安全事件領(lǐng)域的語料分析研究[1]較少.命名實(shí)體識(shí)別是領(lǐng)域工作中的基礎(chǔ),直接影響自然語言處理任務(wù)中語法分析、語義分析和關(guān)系抽取任務(wù)的性能,其主要的目的是從非結(jié)構(gòu)化文本中識(shí)別預(yù)定義實(shí)體[2].

    基于規(guī)則和詞典的命名實(shí)體識(shí)別方法[3]主要是人工構(gòu)建有限規(guī)則,結(jié)合專家構(gòu)建的實(shí)體詞匯表,對(duì)每條規(guī)則設(shè)置權(quán)重,然后通過實(shí)體與規(guī)則的匹配程度來進(jìn)行實(shí)體類型分類.但是人工制定這些規(guī)則的成本較大,構(gòu)建詞匯表與數(shù)據(jù)量相差懸殊,經(jīng)過制訂固定的規(guī)則模板來識(shí)別出結(jié)構(gòu)復(fù)雜的命名實(shí)體;這樣的方法雖然準(zhǔn)確率相對(duì)較高,然而工作量巨大,可行性較低;其次,人為制訂的規(guī)則模板復(fù)用性太低,不同領(lǐng)域數(shù)據(jù)結(jié)構(gòu)可能不同,將此規(guī)則模板遷移至其他領(lǐng)域不適用.

    基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)的方法可以將命名實(shí)體識(shí)別任務(wù)當(dāng)作詞組級(jí)別的多分類任務(wù),先使用模型識(shí)別出實(shí)體的邊界,再使用分類器對(duì)文本中的命名實(shí)體進(jìn)行分類[4];或者將命名實(shí)體識(shí)別任務(wù)當(dāng)作字符級(jí)別的序列標(biāo)注任務(wù)[5]:首先,根據(jù)領(lǐng)域數(shù)據(jù)人為預(yù)先定義若干個(gè)實(shí)體類別,對(duì)于文本中每個(gè)字符可以有多個(gè)候選的類別標(biāo)簽;然后根據(jù)每個(gè)字符在實(shí)體中的位置,確定每個(gè)字符的標(biāo)簽,最終將1組字符的標(biāo)簽整理在一起,獲得識(shí)別出的實(shí)體和實(shí)體所屬類別[6].

    基于神經(jīng)網(wǎng)絡(luò)模型的深度學(xué)習(xí)[7]使用詞向量來表示詞語的方法,加入詞向量減少了人為特征工程的工作量,能夠潛移默化地發(fā)現(xiàn)人工選擇特征時(shí)未包含的語義信息.該方法還解決了在基于詞典方法中由于高維度向量空間而出現(xiàn)的數(shù)據(jù)密度稀疏的問題,并且能夠?qū)⒉煌Y(jié)構(gòu)的文本轉(zhuǎn)化為相同維度大小的矩陣進(jìn)行向量表示.

    為了研究中文公共安全事件的命名實(shí)體識(shí)別方法,本文分析了《中文突發(fā)事件語料庫》,將預(yù)訓(xùn)練模型作為研究重點(diǎn).在對(duì)比了現(xiàn)有基于BERT模型的工作[8]基礎(chǔ)上,本文提出了優(yōu)化的中文預(yù)訓(xùn)練模型RoBERTa+完成公共安全領(lǐng)域的預(yù)訓(xùn)練任務(wù).具體地,將更新的安全領(lǐng)域詞典和10萬條新聞?wù)Z料嵌入到預(yù)訓(xùn)練模型中,同時(shí)使用動(dòng)態(tài)的全詞覆蓋機(jī)制修正網(wǎng)絡(luò)參數(shù).將預(yù)訓(xùn)練語言模型以及輸出的動(dòng)態(tài)詞向量作為下游命名實(shí)體識(shí)別任務(wù)的輸入進(jìn)行微調(diào).接著采用BiLSTM-CRF模型提取文本的上下文關(guān)系,并標(biāo)注出實(shí)體字符的類別.經(jīng)實(shí)驗(yàn)證明,基于領(lǐng)域預(yù)訓(xùn)練的公共安全事件命名實(shí)體識(shí)別的性能均得到了提升.

    1 模型結(jié)構(gòu)

    1.1 RoBERTa模型

    BERT模型是基于Transformer模型的雙向編碼器表示[9],其結(jié)構(gòu)如圖1所示.BERT模型能夠?qū)W習(xí)句子中詞和詞之間的上下文關(guān)系,當(dāng)處理1個(gè)詞時(shí),能同時(shí)考慮到當(dāng)前詞的前一個(gè)詞和后一個(gè)詞的信息,從整體獲取詞的語義特征.

    圖1 Transformer編碼單元Encoder

    Transformer編碼單元主要運(yùn)用了多層Self-Attention機(jī)制,其中Self-Attention機(jī)制為輸入向量的每個(gè)單詞學(xué)習(xí)一個(gè)權(quán)重.雙向的Transformer編碼器的連接組成BERT模型結(jié)構(gòu),它可以獲取所在層中的左右2側(cè)語境.

    1.2 Bi-LSTM算法

    Hochreiter等人[10]在1997年提出了長短時(shí)記憶網(wǎng)絡(luò)(long short-term memory,LSTM)能夠解決循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)在時(shí)間維度上出現(xiàn)的梯度消失問題.LSTM主要利用其特有的3個(gè)門結(jié)構(gòu)來保持和更新狀態(tài),以達(dá)到長期記憶功能,并能夠選擇性地遺忘部分歷史信息.LSTM模型將部分輸入信息與通過遺忘門、輸入門和輸出門獲得的狀態(tài)結(jié)合形成輸出狀態(tài),從而達(dá)到可以比RNN捕獲更長距離的依賴信息.此外,為了同時(shí)反映每個(gè)字符與上文信息和下文信息之間的關(guān)系,Graves等人[11]提出了BiLSTM模型.將文本向量按照從左向右及從右向左的順序分別輸入正序及逆序LSTM單元.BiLSTM模型可以考慮上下文2個(gè)方向的信息,綜合輸出字標(biāo)簽得分向量.

    1.3 CRF算法

    Lafferty等人[12]在2001年首次提出條件隨機(jī)場(chǎng)模型CRF,條件隨機(jī)場(chǎng)模型在自然語言處理領(lǐng)域中主要應(yīng)用是文本序列化標(biāo)注.條件隨機(jī)場(chǎng)可以實(shí)現(xiàn)在給定一組隨機(jī)的X的條件下,它能夠輸出目標(biāo)Y的條件概率分布.在命名實(shí)體識(shí)別任務(wù)中使用CRF模型主要是為了給BiLSTM模型輸出的每組預(yù)測(cè)標(biāo)簽添加一些實(shí)體內(nèi)位置約束,從而保證每組預(yù)測(cè)標(biāo)簽的有序性.

    事實(shí)上,相鄰字標(biāo)簽之間是存在約束關(guān)系的.如圖2所示,例如標(biāo)簽“B-PER”和標(biāo)簽“I-LOC”相鄰,文本開頭的字標(biāo)簽不可能是“I-”標(biāo)簽或者“O”標(biāo)簽.CRF模型能夠自動(dòng)學(xué)習(xí)到各字標(biāo)簽之間的約束信息,利用每個(gè)字標(biāo)簽的得分與字標(biāo)簽之間的轉(zhuǎn)移得分來計(jì)算不同標(biāo)簽序列出現(xiàn)的概率,從中選取出現(xiàn)概率最大的序列,并將具有合法性的序列作為文本最優(yōu)標(biāo)簽序列.

    圖2 CRF線性鏈?zhǔn)浇Y(jié)構(gòu)圖

    1.4 PreTrain100K+RoBERTa+-BiLSTM-CRF模型

    為了提升公共安全領(lǐng)域事件實(shí)體的識(shí)別效率,本文在公開的新聞?lì)I(lǐng)域數(shù)據(jù)集上進(jìn)行預(yù)訓(xùn)練,對(duì)RoBERTa進(jìn)行優(yōu)化,提出基于領(lǐng)域預(yù)訓(xùn)練的公共安全領(lǐng)域命名實(shí)體識(shí)別模型.在提出的模型中:首先對(duì)輸入字符進(jìn)行向量映射,接著使用RoBERTa進(jìn)行預(yù)訓(xùn)練,生成預(yù)訓(xùn)練語言模型及含有語義的動(dòng)態(tài)字詞向量;然后使用BiLSTM對(duì)輸入信息進(jìn)行上下文特征提取,對(duì)每一個(gè)字符輸出每個(gè)預(yù)定義類的標(biāo)簽預(yù)測(cè)分值;最后,使用CRF自動(dòng)學(xué)習(xí)轉(zhuǎn)移特征,通過添加約束條件保證預(yù)測(cè)的標(biāo)簽順序的合法性,選取最優(yōu)標(biāo)注序列生成實(shí)體識(shí)別結(jié)果.模型結(jié)構(gòu)如圖3所示:

    國家對(duì)建筑材料的質(zhì)量有著嚴(yán)格的規(guī)定和劃分,個(gè)別企業(yè)也有自己的材料使用質(zhì)量標(biāo)準(zhǔn),但是個(gè)別施工單位為了追求額外效益,會(huì)有意無意地在工程項(xiàng)目建設(shè)過程中使用一些不規(guī)范的工程材料,造成工程項(xiàng)目的最終質(zhì)量存在問題。

    圖3 RoBERTa-BiLSTM-CRF模型結(jié)構(gòu)

    RoBERTa 模型的輸入是由3種embedding相加得到:token embeddings,segment embeddings,position embeddings.token embeddings是詞向量,第1個(gè)單詞是 CLS 標(biāo)志,可以用于分類任務(wù);segment embeddings用來區(qū)分2種句子,可以用于以2個(gè)句子為輸入的分類任務(wù);position embeddings表示位置.3種embedding都是通過訓(xùn)練得來的.

    本文提出PreTrain100K+RoBERTa+-BiLSTM-CRF模型主要是對(duì)RoBERTa模型進(jìn)行改進(jìn),采用數(shù)據(jù)增強(qiáng)的方式加強(qiáng)深度學(xué)習(xí)模型對(duì)公共安全領(lǐng)域的命名識(shí)別能力.在爬取的部分公共安全事件詞典的基礎(chǔ)上,對(duì)RoBERT進(jìn)行了2步改進(jìn):1)將原始的單字符掩碼機(jī)制修改為全詞掩碼機(jī)制,并在分詞函數(shù)中引入公共安全事件實(shí)體詞典;2)對(duì)改進(jìn)的RoBERTa模型進(jìn)行領(lǐng)域預(yù)訓(xùn)練,即在爬取的10萬條新聞?wù)Z料庫上進(jìn)行詞掩蓋預(yù)訓(xùn)練任務(wù).

    RoBERTa模型在輸入時(shí)采用動(dòng)態(tài)掩碼機(jī)制,該機(jī)制采用以字符為單位進(jìn)行切分.在生成訓(xùn)練樣本時(shí),句中的詞會(huì)被切分為多個(gè)詞組,并且這些詞組會(huì)被隨機(jī)掩碼.但是中文和英文的區(qū)別是英文最小的單位是一個(gè)單詞,而中文最小的單位是以字為粒度進(jìn)行切分,單個(gè)字可能不包含完整的語義信息.在中文中包含語義信息的單位是詞,詞是由1個(gè)或多個(gè)字組成,并且1個(gè)完整的句子中詞和詞之間沒有明顯的邊界標(biāo)志.

    本文采用全詞掩碼機(jī)制來替換字符掩碼機(jī)制.如果1個(gè)完整的詞的部分子詞被掩碼,那么意味著同屬于該詞的其他部分也應(yīng)該被掩蓋掉.基于這個(gè)中文語法,全詞掩碼使模型能夠更好地學(xué)習(xí)中文語言表述方式.具體實(shí)例如表1所示:

    學(xué)校對(duì)實(shí)驗(yàn)教學(xué)的管理是根本性管理。對(duì)是否能夠真正實(shí)現(xiàn)、實(shí)踐實(shí)戰(zhàn)能力強(qiáng)的應(yīng)用型專業(yè)人才培養(yǎng)目標(biāo),具有根本性、決定性作用。

    表1 全詞Mask

    針對(duì)表1的情況,在全詞掩碼機(jī)制中,首先對(duì)文本進(jìn)行分詞操作,并且在分詞過程中引入公共安全事件的實(shí)體詞典,使其能全詞掩碼機(jī)制預(yù)測(cè)時(shí)保留公共安全事件文本實(shí)體完整的語義,具體模型結(jié)構(gòu)如圖4所示:

    圖4 PreTrain100K+RoBERTa+模型結(jié)構(gòu)

    同時(shí),為了增強(qiáng)中文相關(guān)背景知識(shí)的遷移和學(xué)習(xí),本文以公開的微軟亞洲研究院MSRA數(shù)據(jù)集、人民日?qǐng)?bào)語料集和今日頭條中文新聞數(shù)據(jù)集作為預(yù)訓(xùn)練語料.新聞?wù)Z料中也包含公共安全事件的語料,與本文特定任務(wù)語料十分相關(guān),方便用于領(lǐng)域預(yù)訓(xùn)練.這些新聞?wù)Z料包含了10萬條未標(biāo)注的新聞,將這些語料輸入到RoBERTa-base版本[13]預(yù)訓(xùn)練模型中.在大規(guī)模無標(biāo)注的語料上采用自監(jiān)督的方式訓(xùn)練語言模型,并且將訓(xùn)練后的語言模型與下游任務(wù)模型連接,采用微調(diào)方式調(diào)優(yōu)模型參數(shù).在預(yù)訓(xùn)練語料中,MSRA語料集包含46 365條數(shù)據(jù),人民日?qǐng)?bào)語料集包含23 061條數(shù)據(jù),今日頭條新聞數(shù)據(jù)集包含30 626條數(shù)據(jù),共計(jì)10萬余條語料數(shù)據(jù).

    2 實(shí)驗(yàn)設(shè)計(jì)及分析

    2.1 實(shí)驗(yàn)環(huán)境

    本文使用Python語言和Tensorflow框架.實(shí)驗(yàn)運(yùn)行環(huán)境為Win10操作系統(tǒng),內(nèi)存64GB,處理器型號(hào)為lntel?CoreTMi7-10700CPU@2.90 GHz,GPU顯卡型號(hào)為NVIDIAGeForceRTX2080Ti.

    2.2 實(shí)驗(yàn)數(shù)據(jù)

    本文的實(shí)驗(yàn)數(shù)據(jù)是公開的安全事件案例《中文突發(fā)事件語料庫》(Chinese Emergency Corpus,CEC).CEC[14]數(shù)據(jù)集共有332條公共安全事件實(shí)例,該數(shù)據(jù)集含有5類預(yù)定義的實(shí)體.針對(duì)denoter,time,location,participant,object標(biāo)簽進(jìn)行命名實(shí)體識(shí)別,將標(biāo)簽分別簡記為DEN,TIME,LOC,PAR,OBJ,分別表示行為、時(shí)間、位置、參與者和對(duì)象.

    在實(shí)驗(yàn)中,根據(jù)CEC實(shí)例數(shù)目對(duì)文檔進(jìn)行劃分,在332條數(shù)據(jù)集中選取30條規(guī)范作為驗(yàn)證集,其次對(duì)332條數(shù)據(jù)集按7∶3的比例劃分訓(xùn)練集和測(cè)試集,具體數(shù)目信息如表2所示:

    表2 數(shù)據(jù)集類別及字符數(shù)

    注:362條數(shù)據(jù)中有30條重復(fù)實(shí)例.

    2.3 標(biāo)注策略

    本文以漢字作為輸入單元,標(biāo)注體系選用經(jīng)典的BIO方法.BIO是B(begin),I(intermediate),O(other)的縮寫,其中,begin指所識(shí)別對(duì)象開始位置上的字符,intermediate指所識(shí)別對(duì)象最中間的字符,other指所識(shí)別對(duì)象中的非實(shí)體字符.本文數(shù)據(jù)集中5類預(yù)定義實(shí)體轉(zhuǎn)化的待預(yù)測(cè)標(biāo)簽如表3所示:

    表3 待預(yù)測(cè)標(biāo)簽

    2.4 評(píng)價(jià)標(biāo)準(zhǔn)

    實(shí)體邊界和實(shí)體標(biāo)注是NER評(píng)估主要的方向.在預(yù)測(cè)過程中,只有當(dāng)實(shí)體標(biāo)簽的類型與預(yù)定義的實(shí)體類型完全一致時(shí),才判斷該實(shí)體預(yù)測(cè)正確.NER的評(píng)價(jià)指標(biāo)為:Accuracy(精確率)、Precision(準(zhǔn)確率)、Recall(召回率)和F1值.具體公式為

    (1)

    (2)

    (3)

    (4)

    其中:TP統(tǒng)計(jì)實(shí)體實(shí)際標(biāo)簽和預(yù)測(cè)標(biāo)簽都是正確的實(shí)體數(shù)目;TN統(tǒng)計(jì)實(shí)體實(shí)際標(biāo)簽和預(yù)測(cè)標(biāo)簽都是錯(cuò)誤的實(shí)體數(shù)目;FP統(tǒng)計(jì)實(shí)體實(shí)際標(biāo)簽是錯(cuò)誤的但預(yù)測(cè)的標(biāo)簽是正確的實(shí)體數(shù)目;FN統(tǒng)計(jì)實(shí)體實(shí)際標(biāo)簽是正確的但預(yù)測(cè)的標(biāo)簽是錯(cuò)誤的數(shù)目.

    2.5 參數(shù)選取

    深度學(xué)習(xí)的效果很大程度上取決于參數(shù)調(diào)節(jié)的好壞.深度學(xué)習(xí)超參數(shù)中最重要的2個(gè)可調(diào)參數(shù)是學(xué)習(xí)率和批樣本數(shù)量.由于硬件限制,批樣本數(shù)量的選取存在上限.針對(duì)RoBERTa-BiLSTM-CRF模型,在機(jī)器上訓(xùn)練:當(dāng)batch_size>22時(shí),就會(huì)出現(xiàn)內(nèi)存溢出;當(dāng)batch_size=22時(shí),既可以保證不發(fā)生內(nèi)存溢出,還能夠保證GPU利用率達(dá)到90%以上.因此本文將確定batch_size的大小,分別研究學(xué)習(xí)率和迭代次數(shù)對(duì)模型擬合度的影響.

    2.5.1 學(xué)習(xí)率對(duì)模型訓(xùn)練的影響

    學(xué)習(xí)率在模型迭代訓(xùn)練中把握著整個(gè)過程的學(xué)習(xí)進(jìn)度,直接關(guān)系到模型的可優(yōu)化空間.同時(shí),將學(xué)習(xí)率調(diào)至最優(yōu)才能夠讓梯度下降得最快.設(shè)置不同學(xué)習(xí)率觀察RoBERTa-BiLSTM-CRF模型的準(zhǔn)確率、精確率、召回率和F1值變化,實(shí)驗(yàn)結(jié)果對(duì)比如圖5所示:

    圖5 學(xué)習(xí)率對(duì)模型性能的影響

    在圖5中,當(dāng)學(xué)習(xí)率大于10-4時(shí),準(zhǔn)確率不超30%,精確率、召回率和F1值都不到10%.以指數(shù)形式逐漸減小學(xué)習(xí)率,當(dāng)學(xué)習(xí)率等于10-4時(shí),準(zhǔn)確率和F1值達(dá)到最優(yōu).但是當(dāng)學(xué)習(xí)率小于10-5時(shí),性能在不斷下降.所以,本文的模型將學(xué)習(xí)率設(shè)置為最優(yōu)值10-4.

    2.5.2 迭代次數(shù)對(duì)模型訓(xùn)練的影響

    用全部數(shù)據(jù)對(duì)模型進(jìn)行多次完整的訓(xùn)練稱為迭代訓(xùn)練.確定batch_size和learning_rate的大小,多次改變迭代次數(shù)的大小,觀察模型的準(zhǔn)確率的變化情況.在實(shí)驗(yàn)中,設(shè)定迭代次數(shù)范圍為[50,350],從50開始步長為50依次增大設(shè)置,實(shí)驗(yàn)結(jié)果如圖6所示.

    圖6 迭代次數(shù)對(duì)模型性能的影響

    從圖6可以看出,當(dāng)?shù)螖?shù)為250時(shí),準(zhǔn)確率和F1都達(dá)到最優(yōu).同時(shí),在250次時(shí)模型性能已經(jīng)趨于穩(wěn)定,并且波動(dòng)較小,所以將迭代次數(shù)設(shè)置為250為最佳.

    除了學(xué)習(xí)率和迭代次數(shù),模型的其他參數(shù)同樣通過類似的部分實(shí)驗(yàn)獲取,具體超參數(shù)設(shè)定如表4所示:

    表4 參數(shù)值設(shè)置

    2.6 實(shí)驗(yàn)過程及結(jié)果分析

    本文針對(duì)中文公共突發(fā)事件語料庫CEC進(jìn)行分析,通過對(duì)中文預(yù)訓(xùn)練模型的優(yōu)化,構(gòu)建公共安全領(lǐng)域的PreTrain100K+RoBERTa+-BiLSTM-CRF模型.在實(shí)現(xiàn)中,我們選擇BiLSTM-CRF,BERT-BiLSTM-CRF和未加領(lǐng)域預(yù)訓(xùn)練的RoBERTa+-BiLSTM-CRF等模型作為對(duì)比實(shí)驗(yàn),具體的實(shí)驗(yàn)結(jié)果如表5所示.

    表5 實(shí)體識(shí)別模型實(shí)驗(yàn)結(jié)果對(duì)比 %

    首先,對(duì)比BiLSTM-CRF和BERT-CRF模型的實(shí)驗(yàn)結(jié)果,后者的F1值比前者高10.85%.由此可看出,BERT模型[15]依據(jù)單詞上下文計(jì)算的表示向量,比Word2Vec直接在此表中查找某個(gè)詞的表示向量更具有語義信息.因此,后者的效果要優(yōu)于前者.

    對(duì)比BERT-CRF,增加了BiLSTM模型,性能得到了顯著提高,F(xiàn)1值提高了8.41%.這種情況說明了在BERT預(yù)訓(xùn)練模型后直接使用CRF模型,缺少BiLSTM學(xué)習(xí)觀測(cè)序列上的依賴關(guān)系,整個(gè)模型在觀測(cè)序列上學(xué)習(xí)力就會(huì)下降.相比較BERT-BiLSTM-CRF,RoBERTa的預(yù)訓(xùn)練效果性能更好,從結(jié)果可以得到RoBERTa-BiLSTM-CRF模型將精確率提高了0.66%,F(xiàn)1值提高了0.85%.因?yàn)樵娴腂ERT依賴隨機(jī)掩碼和預(yù)測(cè)token,在數(shù)據(jù)預(yù)處理期間執(zhí)行1次掩碼,得到1個(gè)靜態(tài)掩碼;借助于動(dòng)態(tài)掩碼機(jī)制,RoBERTa模型對(duì)預(yù)訓(xùn)練語料中的實(shí)體名詞進(jìn)行不同概率和順序的多次訓(xùn)練,從而增強(qiáng)安全領(lǐng)域的實(shí)體名詞嵌入表示.因此,后者表現(xiàn)優(yōu)于前者.對(duì)比加入原始版的RoBERTa的模型,本文改進(jìn)的RoBERTa+-BiLSTM-CRF模型的F1值表現(xiàn)較好.說明了加入實(shí)體詞典的全詞Mask機(jī)制能夠保留領(lǐng)域?qū)嶓w完整的語義,對(duì)下游公共安全事件命名實(shí)體識(shí)別任務(wù)有一定的提升.

    對(duì)比RoBERTa+-BiLSTM-CRF模型,本文提出的PreTrain100K+RoBERTa+-BiLSTM-CRF模型將準(zhǔn)確率和F1值分別提高了0.28%和0.29%.說明了對(duì)RoBERTa+模型在大規(guī)模的無標(biāo)注語料上進(jìn)行領(lǐng)域預(yù)訓(xùn)練后能夠在一定程度上使模型學(xué)習(xí)到公共安全領(lǐng)域文本的領(lǐng)域特征,進(jìn)而提升命名實(shí)體識(shí)別的性能.同時(shí),實(shí)驗(yàn)結(jié)果對(duì)比提升效果較小,說明領(lǐng)域預(yù)訓(xùn)練語料不足,需要大量相關(guān)領(lǐng)域數(shù)據(jù)進(jìn)行充分預(yù)訓(xùn)練.

    3 結(jié) 論

    本文主要是對(duì)公共安全領(lǐng)域進(jìn)行中文命名實(shí)體識(shí)別研究,提出了改進(jìn)的命名實(shí)體識(shí)別模型PreTrain100K+RoBERTa+-BiLSTM-CRF.在對(duì)原始的RoBERTa模型進(jìn)行領(lǐng)域預(yù)訓(xùn)練優(yōu)化過程中,加入公共安全領(lǐng)域詞典的全詞Mask機(jī)制,并且對(duì)相關(guān)的10萬條中文語料庫進(jìn)行預(yù)訓(xùn)練,使PreTrain100K+RoBERTa+模型具備更好的中文語言模型能力.然后,將生成的預(yù)訓(xùn)練語言模型和領(lǐng)域?qū)嶓w輸入到BiLSTM-CRF模型[16]中進(jìn)行實(shí)體識(shí)別訓(xùn)練.該模型在中文突發(fā)事件語料庫CEC上取得了較好的性能.

    未來計(jì)劃在擴(kuò)充公共安全事件語料的基礎(chǔ)上再進(jìn)行預(yù)訓(xùn)練模型的優(yōu)化,并且還計(jì)劃在命名實(shí)體識(shí)別任務(wù)中加入領(lǐng)域?qū)嶓w關(guān)系特征,從而提升公共安全領(lǐng)域的信息識(shí)別能力.

    猜你喜歡
    模型
    一半模型
    一種去中心化的域名服務(wù)本地化模型
    適用于BDS-3 PPP的隨機(jī)模型
    提煉模型 突破難點(diǎn)
    函數(shù)模型及應(yīng)用
    p150Glued在帕金森病模型中的表達(dá)及分布
    函數(shù)模型及應(yīng)用
    重要模型『一線三等角』
    重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
    3D打印中的模型分割與打包
    校园春色视频在线观看| 欧美不卡视频在线免费观看| 人人妻人人澡人人爽人人夜夜 | 久久韩国三级中文字幕| 狂野欧美白嫩少妇大欣赏| 欧洲精品卡2卡3卡4卡5卡区| 亚洲欧美日韩东京热| 最好的美女福利视频网| 成人漫画全彩无遮挡| 久99久视频精品免费| 乱码一卡2卡4卡精品| 国产成人freesex在线 | 久久人妻av系列| 成年版毛片免费区| 黄片wwwwww| 免费大片18禁| 国产精品美女特级片免费视频播放器| 天堂av国产一区二区熟女人妻| 熟女电影av网| 日本精品一区二区三区蜜桃| 1024手机看黄色片| 99热这里只有是精品50| 亚洲一区二区三区色噜噜| 男女做爰动态图高潮gif福利片| 搡老妇女老女人老熟妇| 又爽又黄无遮挡网站| 国产亚洲精品综合一区在线观看| 人人妻人人澡欧美一区二区| 我要搜黄色片| 老司机福利观看| 搞女人的毛片| 久久精品久久久久久噜噜老黄 | 丝袜喷水一区| 全区人妻精品视频| 波多野结衣高清作品| 国产精华一区二区三区| 国产成人a区在线观看| 国产老妇女一区| 国内揄拍国产精品人妻在线| 一区二区三区免费毛片| 丝袜喷水一区| 在线观看av片永久免费下载| av在线天堂中文字幕| 午夜激情福利司机影院| 国产精品亚洲美女久久久| 男人舔奶头视频| 麻豆国产97在线/欧美| 麻豆国产av国片精品| 成人综合一区亚洲| 日韩一本色道免费dvd| 九色成人免费人妻av| 老司机影院成人| 又黄又爽又刺激的免费视频.| 亚洲人成网站在线播放欧美日韩| 亚州av有码| 一本久久中文字幕| 联通29元200g的流量卡| 婷婷精品国产亚洲av在线| 久久久久久久午夜电影| 久久精品国产亚洲网站| 亚洲最大成人中文| 亚洲欧美成人综合另类久久久 | 国产成人福利小说| 麻豆乱淫一区二区| 黄色一级大片看看| 3wmmmm亚洲av在线观看| 插阴视频在线观看视频| 青春草视频在线免费观看| 亚洲一区二区三区色噜噜| 五月玫瑰六月丁香| 久久精品夜色国产| 搡老熟女国产l中国老女人| 亚洲中文字幕日韩| 久久精品国产自在天天线| 久久久精品94久久精品| 欧美成人一区二区免费高清观看| 可以在线观看的亚洲视频| 热99re8久久精品国产| 噜噜噜噜噜久久久久久91| av在线亚洲专区| 91午夜精品亚洲一区二区三区| 天堂动漫精品| 久久韩国三级中文字幕| 亚洲欧美中文字幕日韩二区| 国产 一区 欧美 日韩| 国产在线男女| 欧美一区二区精品小视频在线| 色吧在线观看| av视频在线观看入口| 久99久视频精品免费| 国产在视频线在精品| 成人永久免费在线观看视频| 在线观看免费视频日本深夜| 婷婷色综合大香蕉| 岛国在线免费视频观看| 免费在线观看成人毛片| 99精品在免费线老司机午夜| 午夜影院日韩av| 97超视频在线观看视频| 久久午夜福利片| 国产v大片淫在线免费观看| 美女被艹到高潮喷水动态| 中文亚洲av片在线观看爽| 亚洲美女黄片视频| 有码 亚洲区| 日韩亚洲欧美综合| 成人亚洲精品av一区二区| 国产av麻豆久久久久久久| 国产精品综合久久久久久久免费| АⅤ资源中文在线天堂| 18禁裸乳无遮挡免费网站照片| 国产91av在线免费观看| 中国美白少妇内射xxxbb| 日韩成人伦理影院| 色5月婷婷丁香| 悠悠久久av| 亚洲av五月六月丁香网| 又爽又黄a免费视频| 少妇的逼水好多| 成人毛片a级毛片在线播放| 亚洲av.av天堂| 久久精品综合一区二区三区| 最后的刺客免费高清国语| 精品人妻熟女av久视频| 看黄色毛片网站| 一进一出抽搐gif免费好疼| 一进一出好大好爽视频| 美女黄网站色视频| 美女xxoo啪啪120秒动态图| 春色校园在线视频观看| 男女边吃奶边做爰视频| 欧美在线一区亚洲| 国模一区二区三区四区视频| 国产亚洲欧美98| 亚洲成av人片在线播放无| 日本黄大片高清| av国产免费在线观看| 露出奶头的视频| 亚洲欧美日韩高清专用| 一级黄片播放器| 国产精品一区二区三区四区久久| 国产一区二区在线av高清观看| 亚洲国产欧美人成| 99久久精品国产国产毛片| 晚上一个人看的免费电影| 欧美日韩国产亚洲二区| 日韩一区二区视频免费看| 18禁裸乳无遮挡免费网站照片| 国内久久婷婷六月综合欲色啪| 欧美+日韩+精品| 国产极品精品免费视频能看的| 欧美日韩精品成人综合77777| 欧美一区二区国产精品久久精品| 亚洲精品久久国产高清桃花| 中文字幕免费在线视频6| 国内精品一区二区在线观看| 少妇人妻一区二区三区视频| av在线天堂中文字幕| 在线看三级毛片| 看片在线看免费视频| 亚洲欧美精品自产自拍| 国产黄a三级三级三级人| 久久99热6这里只有精品| 亚洲精品一卡2卡三卡4卡5卡| 国产成年人精品一区二区| 少妇人妻精品综合一区二区 | 久久久欧美国产精品| 97人妻精品一区二区三区麻豆| 欧美xxxx黑人xx丫x性爽| 成人综合一区亚洲| 亚洲成人精品中文字幕电影| 在线免费十八禁| 成人永久免费在线观看视频| 少妇的逼好多水| 又爽又黄无遮挡网站| 国产亚洲精品久久久久久毛片| 成人特级av手机在线观看| 老司机午夜福利在线观看视频| 成人亚洲欧美一区二区av| 精品久久国产蜜桃| 一本精品99久久精品77| 欧美日本亚洲视频在线播放| 好男人在线观看高清免费视频| 欧美绝顶高潮抽搐喷水| 国产黄a三级三级三级人| 国产精品伦人一区二区| 九九在线视频观看精品| 两个人视频免费观看高清| 国产色爽女视频免费观看| 神马国产精品三级电影在线观看| 亚洲精品国产av成人精品 | 精品久久久久久久末码| 国产午夜精品论理片| av免费在线看不卡| 一级黄片播放器| 免费av不卡在线播放| 九色成人免费人妻av| 精品日产1卡2卡| 亚洲一区二区三区色噜噜| 男女之事视频高清在线观看| 国产欧美日韩精品一区二区| 久久精品国产自在天天线| 国产淫片久久久久久久久| 精品少妇黑人巨大在线播放 | 久久99热这里只有精品18| 成人性生交大片免费视频hd| 插逼视频在线观看| 淫秽高清视频在线观看| 国内精品久久久久精免费| av天堂在线播放| 高清毛片免费观看视频网站| 在线播放无遮挡| 免费av毛片视频| 一级黄片播放器| 国产熟女欧美一区二区| 一级毛片久久久久久久久女| 天堂av国产一区二区熟女人妻| 日本 av在线| 亚洲成人久久爱视频| 大香蕉久久网| 少妇裸体淫交视频免费看高清| 丝袜喷水一区| 久久精品国产亚洲av香蕉五月| 精品无人区乱码1区二区| 国产精品1区2区在线观看.| 亚洲最大成人av| 国产av一区在线观看免费| av天堂在线播放| 禁无遮挡网站| 变态另类成人亚洲欧美熟女| а√天堂www在线а√下载| 青春草视频在线免费观看| 欧美bdsm另类| 夜夜夜夜夜久久久久| 免费观看在线日韩| 欧美成人a在线观看| 在线国产一区二区在线| 十八禁网站免费在线| 午夜福利成人在线免费观看| av在线观看视频网站免费| 99久久精品国产国产毛片| 一个人看视频在线观看www免费| 欧美精品国产亚洲| 国产在视频线在精品| 欧美日韩在线观看h| 亚洲国产精品成人久久小说 | 91麻豆精品激情在线观看国产| 干丝袜人妻中文字幕| 永久网站在线| 两个人视频免费观看高清| 免费一级毛片在线播放高清视频| 免费不卡的大黄色大毛片视频在线观看 | av黄色大香蕉| avwww免费| 中文字幕精品亚洲无线码一区| 国产视频一区二区在线看| 美女xxoo啪啪120秒动态图| 中文字幕久久专区| 午夜a级毛片| 在线免费观看不下载黄p国产| 国产视频一区二区在线看| 男女之事视频高清在线观看| 色5月婷婷丁香| 日本精品一区二区三区蜜桃| 欧美高清性xxxxhd video| 女同久久另类99精品国产91| 精品久久久久久久久av| 亚洲天堂国产精品一区在线| ponron亚洲| 丰满乱子伦码专区| 女同久久另类99精品国产91| av在线天堂中文字幕| 蜜桃亚洲精品一区二区三区| 黄色配什么色好看| 最新中文字幕久久久久| 舔av片在线| 精品一区二区免费观看| 亚洲精品一区av在线观看| 国产成人a∨麻豆精品| 日韩一区二区视频免费看| 久久这里只有精品中国| 国产精品美女特级片免费视频播放器| 看十八女毛片水多多多| 亚洲自偷自拍三级| 极品教师在线视频| 一进一出抽搐gif免费好疼| 免费搜索国产男女视频| 青春草视频在线免费观看| 精华霜和精华液先用哪个| 1024手机看黄色片| 熟妇人妻久久中文字幕3abv| 国产一区亚洲一区在线观看| 99热6这里只有精品| 黄色欧美视频在线观看| 一a级毛片在线观看| 午夜激情欧美在线| 在线天堂最新版资源| 免费大片18禁| 亚洲人成网站高清观看| 少妇人妻一区二区三区视频| 99久国产av精品国产电影| 国产精品人妻久久久久久| 久久久成人免费电影| 色视频www国产| 成人亚洲欧美一区二区av| 久久中文看片网| 日本撒尿小便嘘嘘汇集6| 国产精品亚洲一级av第二区| 欧美性猛交黑人性爽| 国产久久久一区二区三区| 九九在线视频观看精品| 美女xxoo啪啪120秒动态图| 精品久久久久久久久久久久久| 国产女主播在线喷水免费视频网站 | 色噜噜av男人的天堂激情| 亚洲精品国产av成人精品 | 亚洲精品国产成人久久av| 免费黄网站久久成人精品| 国产女主播在线喷水免费视频网站 | 偷拍熟女少妇极品色| 久久久久精品国产欧美久久久| 亚洲成人久久性| 日韩成人av中文字幕在线观看 | 一进一出好大好爽视频| 免费在线观看成人毛片| 国语自产精品视频在线第100页| 亚洲国产欧美人成| 老司机午夜福利在线观看视频| 91久久精品电影网| 久久九九热精品免费| 女同久久另类99精品国产91| 美女内射精品一级片tv| 国产精品一区二区三区四区免费观看 | 国产精品一区二区免费欧美| 日韩三级伦理在线观看| 国内精品久久久久精免费| 精品乱码久久久久久99久播| 观看免费一级毛片| 亚洲av美国av| 淫妇啪啪啪对白视频| 我的女老师完整版在线观看| 日本一本二区三区精品| 我的女老师完整版在线观看| 久久久久久久亚洲中文字幕| АⅤ资源中文在线天堂| 真人做人爱边吃奶动态| 露出奶头的视频| 国产在线男女| 欧美性猛交╳xxx乱大交人| 免费av观看视频| 色综合站精品国产| 国产在线男女| 俄罗斯特黄特色一大片| 一个人看视频在线观看www免费| 欧美性感艳星| 欧美人与善性xxx| 在线观看美女被高潮喷水网站| 国产午夜精品论理片| 99九九线精品视频在线观看视频| 国产精品亚洲美女久久久| 国产精品女同一区二区软件| 日韩,欧美,国产一区二区三区 | 最近视频中文字幕2019在线8| 赤兔流量卡办理| 国产一区二区在线av高清观看| 免费人成在线观看视频色| 国产国拍精品亚洲av在线观看| 国产探花在线观看一区二区| 色综合站精品国产| 日韩成人伦理影院| av在线播放精品| 天天一区二区日本电影三级| 男女视频在线观看网站免费| 国产视频一区二区在线看| 插阴视频在线观看视频| 国产精品一区二区性色av| 久久午夜亚洲精品久久| 成人av一区二区三区在线看| 美女 人体艺术 gogo| 此物有八面人人有两片| 成年免费大片在线观看| 精品久久久久久久久亚洲| 如何舔出高潮| 国产蜜桃级精品一区二区三区| 精品久久久久久久久久久久久| 日日撸夜夜添| 黄色欧美视频在线观看| 九九热线精品视视频播放| 亚洲成av人片在线播放无| 国产精品精品国产色婷婷| 久久亚洲国产成人精品v| 听说在线观看完整版免费高清| 国产亚洲精品av在线| 乱人视频在线观看| 天天一区二区日本电影三级| 国产精品久久视频播放| 国产成人精品久久久久久| 亚洲国产色片| 亚洲av中文av极速乱| 精品无人区乱码1区二区| 亚洲精品一区av在线观看| 又爽又黄无遮挡网站| 欧美日韩精品成人综合77777| 精品99又大又爽又粗少妇毛片| 男女下面进入的视频免费午夜| 欧美国产日韩亚洲一区| 日本精品一区二区三区蜜桃| 少妇的逼水好多| 亚洲性夜色夜夜综合| 国产精品亚洲美女久久久| 狠狠狠狠99中文字幕| 大香蕉久久网| 午夜福利视频1000在线观看| 精品人妻偷拍中文字幕| 最新在线观看一区二区三区| 日本 av在线| 国产综合懂色| 色哟哟·www| 中国美白少妇内射xxxbb| 日本a在线网址| 色综合色国产| 久久国内精品自在自线图片| 91午夜精品亚洲一区二区三区| 日本撒尿小便嘘嘘汇集6| 搡老岳熟女国产| 欧美国产日韩亚洲一区| 久久精品影院6| 午夜日韩欧美国产| 天美传媒精品一区二区| 一级黄色大片毛片| 最近在线观看免费完整版| 国产三级中文精品| 精品日产1卡2卡| 国产成人91sexporn| 亚洲在线观看片| a级毛片免费高清观看在线播放| 亚洲精华国产精华液的使用体验 | 国产91av在线免费观看| 深夜精品福利| 欧美日本视频| 99国产精品一区二区蜜桃av| av.在线天堂| 18禁裸乳无遮挡免费网站照片| 国产精品一区二区性色av| 91久久精品国产一区二区成人| 伊人久久精品亚洲午夜| 日韩高清综合在线| 在线观看av片永久免费下载| 中出人妻视频一区二区| 国产精品久久久久久精品电影| 亚洲在线自拍视频| 国产精品精品国产色婷婷| 大香蕉久久网| 国产精品嫩草影院av在线观看| 波多野结衣高清无吗| 性欧美人与动物交配| 精华霜和精华液先用哪个| 亚洲国产精品国产精品| 国产一区二区在线av高清观看| 欧美日韩国产亚洲二区| videossex国产| 亚洲中文字幕一区二区三区有码在线看| 国产黄色视频一区二区在线观看 | 在线观看av片永久免费下载| 中出人妻视频一区二区| 丰满人妻一区二区三区视频av| 国产精品野战在线观看| 91在线精品国自产拍蜜月| 99视频精品全部免费 在线| 国产亚洲av嫩草精品影院| 日韩av不卡免费在线播放| 极品教师在线视频| 亚洲av免费在线观看| 麻豆一二三区av精品| 久久综合国产亚洲精品| 欧美区成人在线视频| 国产成人aa在线观看| av中文乱码字幕在线| 欧美高清性xxxxhd video| 波多野结衣高清作品| 久久久久免费精品人妻一区二区| 精品久久久久久久末码| 国产乱人视频| 欧美成人免费av一区二区三区| 99久久中文字幕三级久久日本| 精品久久久久久久人妻蜜臀av| 91在线精品国自产拍蜜月| 欧美日韩一区二区视频在线观看视频在线 | 亚洲欧美清纯卡通| 欧美+亚洲+日韩+国产| 久久精品国产99精品国产亚洲性色| 久久这里只有精品中国| 国产伦精品一区二区三区四那| 午夜亚洲福利在线播放| 欧美区成人在线视频| 最近的中文字幕免费完整| 3wmmmm亚洲av在线观看| 日韩大尺度精品在线看网址| 免费大片18禁| av.在线天堂| 国产精品一二三区在线看| 久久精品国产亚洲av香蕉五月| 成人欧美大片| 岛国在线免费视频观看| 人妻夜夜爽99麻豆av| 欧美中文日本在线观看视频| 高清日韩中文字幕在线| 国产亚洲精品av在线| videossex国产| 亚洲精品亚洲一区二区| 亚洲人成网站在线播| 国产精品一区二区三区四区久久| 国产免费男女视频| 一本一本综合久久| 久久国产乱子免费精品| 国产色婷婷99| 一区二区三区四区激情视频 | 国产精品三级大全| 国产毛片a区久久久久| 亚洲欧美日韩高清专用| 日本色播在线视频| 亚洲在线自拍视频| 69人妻影院| 人妻夜夜爽99麻豆av| 99久国产av精品| 国产精品一区二区三区四区久久| 伊人久久精品亚洲午夜| 国产欧美日韩一区二区精品| 亚洲精品日韩av片在线观看| 国产成人a区在线观看| 国产黄色小视频在线观看| 国产精品久久久久久久电影| 免费看av在线观看网站| 久久久久久久久久黄片| 成人永久免费在线观看视频| 99久国产av精品国产电影| 美女大奶头视频| 日韩大尺度精品在线看网址| 久久6这里有精品| 麻豆久久精品国产亚洲av| 欧美中文日本在线观看视频| 天堂动漫精品| 黄色一级大片看看| 亚洲人与动物交配视频| 丰满的人妻完整版| av在线亚洲专区| 亚洲最大成人手机在线| 婷婷色综合大香蕉| 99久久精品一区二区三区| 久久韩国三级中文字幕| 久久欧美精品欧美久久欧美| 老女人水多毛片| 一级毛片久久久久久久久女| 亚洲一区二区三区色噜噜| 女的被弄到高潮叫床怎么办| 国产一区二区激情短视频| 人人妻人人澡人人爽人人夜夜 | 91久久精品电影网| 高清毛片免费看| 中文字幕熟女人妻在线| 在线天堂最新版资源| 成人二区视频| 九色成人免费人妻av| 一个人看的www免费观看视频| 国产成人aa在线观看| 丰满的人妻完整版| 欧美+日韩+精品| 国产片特级美女逼逼视频| 成人国产麻豆网| 久久久久久久久中文| 一本久久中文字幕| 亚洲精品成人久久久久久| 啦啦啦韩国在线观看视频| 毛片一级片免费看久久久久| 蜜臀久久99精品久久宅男| 国产又黄又爽又无遮挡在线| 69人妻影院| 大型黄色视频在线免费观看| 久久久久久久久久久丰满| 偷拍熟女少妇极品色| 我的老师免费观看完整版| 亚洲美女搞黄在线观看 | 国产高清不卡午夜福利| 干丝袜人妻中文字幕| 国产黄a三级三级三级人| 欧美最新免费一区二区三区| 美女高潮的动态| 亚洲内射少妇av| 亚洲成人av在线免费| 成人二区视频| 成年女人永久免费观看视频| 99视频精品全部免费 在线| 91精品国产九色| 精品久久国产蜜桃| 国产亚洲精品久久久久久毛片| 老司机午夜福利在线观看视频| 亚洲国产欧美人成| 亚洲中文字幕日韩| 午夜福利成人在线免费观看| 激情 狠狠 欧美| 精品一区二区三区人妻视频| 亚洲图色成人| 偷拍熟女少妇极品色| 一进一出抽搐gif免费好疼| 天堂影院成人在线观看| 日日干狠狠操夜夜爽| 欧美又色又爽又黄视频| 国产高清三级在线| 久久韩国三级中文字幕| 亚洲乱码一区二区免费版| 欧美最黄视频在线播放免费| 中国美女看黄片| 婷婷色综合大香蕉| 91在线观看av| 成人性生交大片免费视频hd|