• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    一種面向法律文書(shū)的命名實(shí)體識(shí)別方法

    2023-09-04 09:33:02萬(wàn)玉晴
    關(guān)鍵詞:語(yǔ)料命名粒度

    王 霄 萬(wàn)玉晴

    (太極計(jì)算機(jī)股份有限公司 北京 100102)

    0 引 言

    近年來(lái),深度神經(jīng)網(wǎng)絡(luò)在人工智能多個(gè)應(yīng)用領(lǐng)域表現(xiàn)出了優(yōu)越的性能,作為自然語(yǔ)言處理重要任務(wù)之一的命名實(shí)體識(shí)別(Named Entity Recognition,NER),也出現(xiàn)很多基于深度學(xué)習(xí)的研究成果,與傳統(tǒng)的基于規(guī)則的方法或者基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)的方法相比,深度神經(jīng)網(wǎng)絡(luò)模型具有更好的泛化性、更少的人工特征依賴(lài)等優(yōu)點(diǎn),在各領(lǐng)域命名實(shí)體識(shí)別中得到了廣泛的應(yīng)用。

    目前法院對(duì)所積累的海量電子卷宗具有結(jié)構(gòu)化、知識(shí)化的迫切需求,法律文書(shū)命名實(shí)體主要包含人名、地名和機(jī)構(gòu)名等通用實(shí)體,以及案件名、案由和法律條文等領(lǐng)域?qū)嶓w。法律文書(shū)命名實(shí)體識(shí)別的主要問(wèn)題在于:1) 不同命名實(shí)體之間長(zhǎng)度差別大,使得語(yǔ)言表示的語(yǔ)義粒度對(duì)模型訓(xùn)練效果影響較大,造成不同命名實(shí)體的識(shí)別性能差異大的問(wèn)題。2) 在不同案件類(lèi)型的卷宗文書(shū)中,命名實(shí)體的上下文特征具有顯著差異,造成模型應(yīng)用在不同類(lèi)型案件卷宗上的魯棒性較差。3) 當(dāng)前法律文書(shū)的標(biāo)注語(yǔ)料不充足。

    針對(duì)前兩點(diǎn)問(wèn)題,本文從輸入模型的語(yǔ)言表示入手,對(duì)不同尺度的嵌入表示,以及結(jié)合方式的有效性進(jìn)行了研究驗(yàn)證,形成涵蓋字向量、詞向量和主題向量三個(gè)語(yǔ)義粒度的語(yǔ)言表示。對(duì)于標(biāo)注語(yǔ)料匱乏問(wèn)題,文本從模型訓(xùn)練入手,使用一種輔助優(yōu)化的訓(xùn)練方式,減少模型對(duì)人工標(biāo)注語(yǔ)料的依賴(lài)?;谝陨涎芯?jī)?nèi)容,訓(xùn)練了適用于法律文書(shū)的命名實(shí)體識(shí)別模型。

    1 相關(guān)工作

    命名實(shí)體識(shí)別是實(shí)現(xiàn)信息抽取的主要技術(shù)手段,其研究方法種類(lèi)很多,當(dāng)前獲取很好性能及研究熱情的方法是基于深度學(xué)習(xí)命名實(shí)體識(shí)別方法。例如:Hammerto[1]使用一種序列自組織圖模型SARDNET訓(xùn)練單詞表示向量,輸入LSTM模型進(jìn)行命名實(shí)體識(shí)別。Collobertd等[2]通過(guò)訓(xùn)練詞向量來(lái)完成多個(gè)序列標(biāo)注任務(wù),提出了窗口和句子兩種方法,在后者的模型中加入了一層卷積神經(jīng)網(wǎng)絡(luò)以獲取全局特征。Ma等[3]預(yù)訓(xùn)練了詞向量和單詞的字符級(jí)表示,組合了CNN,BiLSTM和CRF進(jìn)行命名實(shí)體識(shí)別。Kuru等[4]提出的CHarNER模型,是使用字符級(jí)的語(yǔ)義單元輸入雙向LSTM的技術(shù)方案。Huang等[5]系統(tǒng)研究了序列標(biāo)注任務(wù)在多種基于LSTM模型的性能,證明了BiLSTM-CRF模型的健壯性。Chiu等[6]提出了BiLSTM-CNNs的模型架構(gòu)進(jìn)行命名實(shí)體識(shí)別,其中CNNs用來(lái)獲取字符級(jí)的語(yǔ)義特征向量,并與原有的詞向量結(jié)合,BiLSTM用于NER預(yù)測(cè)。Lample等[7]提出兩種模型用于命名實(shí)體識(shí)別,第一種是BiLSTM結(jié)合CRF的模型結(jié)構(gòu),另一種是基于轉(zhuǎn)換的分塊模型。上述模型均在各種領(lǐng)域命名實(shí)體識(shí)別的應(yīng)用中得到過(guò)驗(yàn)證,例如:Liu等[8]使用KNN結(jié)合CRF的模型在推特文本中進(jìn)行命名實(shí)體識(shí)別;李麗雙等[9]通過(guò)結(jié)合深度神經(jīng)網(wǎng)絡(luò)構(gòu)建CNN-BILSTM-CRF模型對(duì)生物醫(yī)學(xué)命名實(shí)體進(jìn)行識(shí)別;梁立榮等[10]構(gòu)建層疊條件隨即場(chǎng)模型CCRF,用于醫(yī)院電子病歷文本信息抽取獲取了較為理想的效果;龔啟文等[11]結(jié)合循環(huán)神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)了BiRNN-CRF算法模型來(lái)提取法院命名實(shí)體。

    基于深度學(xué)習(xí)的命名實(shí)體識(shí)別模型通常接受的是數(shù)學(xué)化的語(yǔ)言表示,即通過(guò)Word2vec[12]、GloVe[13]和BERT[14]等方法訓(xùn)練得到的字、詞和句等不同語(yǔ)義單元粒度的嵌入向量,向量中包含的語(yǔ)義特征對(duì)模型識(shí)別性能具有非常關(guān)鍵的影響。因此,一些學(xué)者的研究工作是如何獲取具有更好語(yǔ)義特征的向量表示,例如:Alexandrescu等[15]提出了一種新型的神經(jīng)概率語(yǔ)言模型,學(xué)習(xí)從單詞和顯式單詞因子到連續(xù)空間的映射關(guān)系,將其用于單詞預(yù)測(cè)。Luong等[16]提出結(jié)合RNN與NLM的模型,在學(xué)習(xí)形態(tài)感知的單詞表示時(shí),同時(shí)考慮其上下文信息。Huang等[17]提出一種新的神經(jīng)網(wǎng)絡(luò)架構(gòu),通過(guò)結(jié)合局部和全局文檔上下文來(lái)學(xué)習(xí)詞嵌入,并通過(guò)學(xué)習(xí)每個(gè)單詞的多個(gè)嵌入,以得到不同語(yǔ)義下的詞向量表示。Li等[18]提出了兩種組件增強(qiáng)的漢字嵌入模型及其雙字?jǐn)U展,通過(guò)對(duì)詞相似性和文本分類(lèi)的評(píng)估驗(yàn)證了模型的有效性。Chen等[19]提出一種中文字符增強(qiáng)型詞嵌入模型(CWE),通過(guò)結(jié)合詞內(nèi)部信息,解決字符歧義和非組成詞的問(wèn)題??梢钥闯?大多相關(guān)研究關(guān)注的重點(diǎn)在于,如何結(jié)合外部信息來(lái)豐富詞向量蘊(yùn)含的語(yǔ)義特征,但對(duì)不同粒度語(yǔ)義單元如何有效結(jié)合上關(guān)注較少。

    2 數(shù)據(jù)采集與標(biāo)注

    目前針對(duì)司法領(lǐng)域命名實(shí)體識(shí)別任務(wù),還沒(méi)有數(shù)量充分的標(biāo)注語(yǔ)料集,本文的語(yǔ)料數(shù)據(jù)主要來(lái)源于中國(guó)裁判文書(shū)網(wǎng),共計(jì)2 200份案件判決書(shū),其中包含民事、刑事和執(zhí)行三種類(lèi)型的案件。在實(shí)體標(biāo)注上,本文面向司法領(lǐng)域需求,設(shè)定5類(lèi)命名實(shí)體:人名(Nr)、地名(Ns)、機(jī)構(gòu)名(Nt)、案件名(Nc)和法律條文(Nl),采用BIOES方式進(jìn)行標(biāo)注,對(duì)語(yǔ)料分別進(jìn)行字標(biāo)注和詞標(biāo)注,如圖1所示。在詞標(biāo)注中使用HanLP開(kāi)發(fā)工具進(jìn)行分詞。

    原告/O:/O萬(wàn)?娟/S-Nr,/O女/O,/O1979/O年/O?月/O?日/O出生/O,/O漢族/O,/O戶(hù)籍地/O浙江省/B-Ns麗水市/I-Ns蓮?區(qū)/I-Ns黃?村/I-Ns ??號(hào)/E-Ns,/O 現(xiàn)/O 住/O 陜西省西安市甘亭街道辦事處/B-Ns ??村/I-Ns ?/I-Ns 組/I-Ns ?/I-Ns 街/I-Ns ???號(hào)/E-Ns。/O 委托/O 訴訟/O 代理人/O:/O 陳?/B-Nr 進(jìn)/E-Nr,/O 浙江??律師事務(wù)所律師/S-Nt。/O

    在標(biāo)注方式上,本文采用人工標(biāo)注和自動(dòng)標(biāo)注兩種方式,人工標(biāo)注語(yǔ)料集中包含200份裁判文書(shū),經(jīng)過(guò)人工標(biāo)注和檢驗(yàn),獲取高質(zhì)量標(biāo)注語(yǔ)料集。對(duì)于另2 000份文書(shū),根據(jù)法律文書(shū)中一些半結(jié)構(gòu)化特點(diǎn)和關(guān)鍵詞典,使用正則表達(dá)式和詞性標(biāo)注工具定義了相應(yīng)啟發(fā)式規(guī)則,例如:當(dāng)事人姓名和機(jī)構(gòu)名前通常會(huì)有“原告”“被告”這樣的訴訟地位;地名前通常會(huì)有“住址”“籍貫”等詞出現(xiàn);案件名通常由當(dāng)事人名稱(chēng)和案由名稱(chēng)組合而成;法律條文更是具有典型的結(jié)構(gòu)化特征?;谶@些啟發(fā)式規(guī)則開(kāi)發(fā)了相應(yīng)命名實(shí)體的自動(dòng)標(biāo)注工具,可以快速獲取標(biāo)注語(yǔ)料集,但其標(biāo)注質(zhì)量,尤其在召回率上與人工標(biāo)注語(yǔ)料相比有一定差距。

    3 基于多粒度語(yǔ)義的法律文書(shū)NER模型及訓(xùn)練方法

    目前被廣泛使用NER模型是基于BiLSTM-CRF[5]的網(wǎng)絡(luò)結(jié)構(gòu),并在各領(lǐng)域應(yīng)用中得到驗(yàn)證。本文面向法律文書(shū)命名實(shí)體識(shí)別的3個(gè)主要問(wèn)題,有針對(duì)性地對(duì)BiLSTM-CRF模型進(jìn)行改進(jìn),并以該模型作為實(shí)驗(yàn)對(duì)比的基準(zhǔn)方法。

    3.1 多粒度語(yǔ)義單元的結(jié)合方式

    本文采集了一個(gè)包含400多萬(wàn)份裁判文書(shū)的中文語(yǔ)料集,采用Word2vec的Skip-gram模型,分別訓(xùn)練得到司法領(lǐng)域詞向量和字向量模型,向量維度均為200維。

    根據(jù)基準(zhǔn)方法BiLSTM-CRF模型在標(biāo)注語(yǔ)料上的表現(xiàn)來(lái)看,使用字向量對(duì)較短的命名實(shí)體(例如人名)具有更好的識(shí)別效果,而對(duì)于法律文書(shū)中地名、機(jī)構(gòu)名較長(zhǎng)的特點(diǎn),采用詞向量效果更好一些。分析主要原因在于:詞向量忽略了詞內(nèi)字的語(yǔ)義信息,另外,分詞質(zhì)量對(duì)采用詞向量的識(shí)別結(jié)果有很大影響,但另一方面,以單字作為語(yǔ)義單元的歧義性較大,可見(jiàn)詞向量和字向量各有優(yōu)劣,兩種語(yǔ)義單元相結(jié)合可以包含更全面的信息表示。

    另外,不同案件類(lèi)型的裁判文書(shū)中,命名實(shí)體的上下文具有顯著差異,這種差異特征無(wú)法在細(xì)粒度語(yǔ)義單元中得到很好的表示,需要結(jié)合更大粒度的語(yǔ)義信息。目前句向量的構(gòu)造通?;谠~向量,即句子粒度在語(yǔ)義上和詞的作用相近,而且不同類(lèi)型案件的文書(shū)中,大多數(shù)句子間的類(lèi)型差異并不明顯,因此從案件類(lèi)型語(yǔ)義差異上考慮,篇章級(jí)的主題信息比句子粒度的語(yǔ)義信息具有更好的補(bǔ)充作用。本文使用LDA[20](Latent Dirichlet Allocation)模型的統(tǒng)計(jì)推理過(guò)程分別基于中文詞和字構(gòu)建主題模型。

    1) 基于LDA模型的主題向量模型,如圖2所示。

    LDA模型的訓(xùn)練語(yǔ)料是根據(jù)設(shè)定的主題,從Word2vec訓(xùn)練語(yǔ)料集中篩選出的子集,本文只選取了民事、刑事、執(zhí)行三類(lèi)案件的裁判文書(shū),再根據(jù)案件審理階段分為一審、非一審兩種情況,設(shè)定主題個(gè)數(shù)為6。Word2vec模型是通過(guò)語(yǔ)料中上下文對(duì)詞或字的語(yǔ)義表示,而LDA模型是針對(duì)所選定的主題及對(duì)應(yīng)語(yǔ)料,獲取主題在詞或字上的語(yǔ)義表示。以詞為例,按圖2所示構(gòu)建基于詞的主題模型,首先做出以下設(shè)定:

    θ~Dir(α)

    (1)

    φ~Dir(β)

    (2)

    Z~P(θ)

    (3)

    W~P(Z,φ)

    (4)

    Dir=f(x1,x2,…,xK;α1,α2,…,αK)=

    (5)

    式中:θ是裁判文書(shū)中主題的概率分布,該分布是服從參數(shù)為α的Dirichlet分布的變量,如式(5)所示,α為K維向量,即對(duì)于任一篇裁判文書(shū)d,其主題分布為:θd=Dirichlet(α);同樣設(shè)定φ是主題中詞的概率分布,該分布是服從參數(shù)為β的Dirichlet分布的變量,β為V維向量,V表示文書(shū)語(yǔ)料集的詞典長(zhǎng)度,即對(duì)于任一主題z,其詞分布為φz=Dirichlet(β);Z是服從θ分布的主題變量,對(duì)文檔d中的第n個(gè)詞,可以從θd中得到主題編號(hào)zdn的分布:zdn=multi(θd),zdn∈{1,2,…,K};W是服從Z和φ分布的詞變量,可以得到詞wdn的概率分布:wdn=multi(φzdn),本文設(shè)定K=6?;谝陨显O(shè)定,可以得到如式(6)所示的聯(lián)合概率關(guān)系。

    P(W,Z,θ,φ;α,β)=

    (6)

    式中:K為主題數(shù);M為裁判文書(shū)數(shù);N為文書(shū)中的詞數(shù),W是唯一可以觀察到的量,Z、θ、φ是中間隱含變量,α、β是需要確定的超參數(shù)。對(duì)式(6)進(jìn)一步處理:

    (7)

    (8)

    本文要計(jì)算的就是超參α、β的極大似然估計(jì)值:

    (9)

    通過(guò)以上方法分別得到了字、詞和篇章三種粒度上的語(yǔ)義信息表示,對(duì)此,本文提出以下兩種結(jié)合方式分別獲取詞向量和字向量。

    (10)

    (11)

    式中:i是指詞在句子中的位置;j是指字在詞中的位置;n是指詞的字?jǐn)?shù)。

    (12)

    3.2 BiLSTM-Attention-CRF模型

    以上過(guò)程確定了模型的輸入向量,在模型的結(jié)構(gòu)上,本文在基準(zhǔn)模型BiLSTM-CRF中增加了Attention[21-22]機(jī)制。BiLSTM可以預(yù)測(cè)出每個(gè)語(yǔ)義單元屬于不同標(biāo)簽的概率,但無(wú)法感知標(biāo)簽之間的關(guān)聯(lián)性,在BiLSTM上接入CRF,使得模型在計(jì)算最優(yōu)標(biāo)簽序列時(shí),考慮到標(biāo)簽組合的合理性,這種合理性體現(xiàn)在CRF的轉(zhuǎn)移矩陣中。在BiLSTM和CRF之間加入Attention機(jī)制,可以在語(yǔ)義單元特征中加入全局注意力信息,為CRF計(jì)算最優(yōu)路徑時(shí)突出關(guān)鍵詞的影響。

    (13)

    (14)

    (15)

    得到雙向LSTM提取的特征狀態(tài)值,進(jìn)入全連接層,該層在基于輔助優(yōu)化的訓(xùn)練中,具有融合輔助特征到統(tǒng)一維度的作用。

    (16)

    ha=dense(hm)=φ(θahm+ba)

    (17)

    α=softmax(ha)

    (18)

    (19)

    (20)

    (21)

    式中:A為CRF的轉(zhuǎn)移矩陣,P為BiLSTM-Attention輸出的標(biāo)注概率矩陣??梢杂?jì)算把輸入句子x標(biāo)記為序列y的概率為:

    (22)

    式中:Yx是句子x所有可能的標(biāo)注序列集合。根據(jù)式(22)得到如下對(duì)數(shù)似然函數(shù):

    (23)

    CRF在預(yù)測(cè)中使用Viterbi算法來(lái)求解最優(yōu)路徑,即得到概率最大的一組標(biāo)注序列:

    (24)

    3.3 基于輔助優(yōu)化的模型訓(xùn)練方式

    針對(duì)司法標(biāo)注語(yǔ)料匱乏問(wèn)題,文本采用輔助優(yōu)化[24-25]的訓(xùn)練方式,借助快速獲取的自動(dòng)標(biāo)注語(yǔ)料集提高模型性能,減少模型對(duì)人工標(biāo)注語(yǔ)料的依賴(lài)。訓(xùn)練過(guò)程如圖3所示。

    圖3 基于輔助優(yōu)化的模型訓(xùn)練方式

    hi,main=BiLSTMmain(xi)

    (25)

    hi,aux=BiLSTMaux(xi)

    (26)

    (27)

    當(dāng)輸入的句子是自動(dòng)標(biāo)注語(yǔ)料時(shí),只執(zhí)行輔助任務(wù),當(dāng)輸入來(lái)自人工標(biāo)注語(yǔ)料集時(shí),會(huì)同時(shí)執(zhí)行主任務(wù)和輔助任務(wù),因此訓(xùn)練依據(jù)的損失函數(shù)是兩者損失函數(shù)的加權(quán)組合,λ是一個(gè)可調(diào)控的組合系數(shù)。對(duì)λ在[0,1]區(qū)間取值,通過(guò)實(shí)驗(yàn)對(duì)比發(fā)現(xiàn),當(dāng)λ取值0.65時(shí),本文模型獲取最高的F1值,因此設(shè)λ=0.65。

    lossauxopt=λlossmain+(1-λ)lossaux

    (28)

    4 實(shí)驗(yàn)與結(jié)果分析

    本文從人工標(biāo)注語(yǔ)料集中隨機(jī)選取150份裁判文書(shū)作為NER主任務(wù)的訓(xùn)練語(yǔ)料,剩余50份用于測(cè)試,自動(dòng)標(biāo)注語(yǔ)料集中全部2 000份文書(shū)用于輔助任務(wù)訓(xùn)練。另外,根據(jù)句長(zhǎng)分布情況,無(wú)論以詞還是字作為語(yǔ)義單元,模型接收的句子長(zhǎng)度設(shè)為200。數(shù)據(jù)集情況如表1所示。

    表1 數(shù)據(jù)集情況

    4.1 實(shí)驗(yàn)設(shè)置

    為了驗(yàn)證本文方法的識(shí)別效果,實(shí)驗(yàn)?zāi)P蜁r(shí)采用相同數(shù)據(jù)集,以及相同參數(shù)設(shè)置,如表2所示。評(píng)測(cè)采用在NER任務(wù)上廣泛使用的指標(biāo):Precision、Recall和F1。

    表2 模型參數(shù)設(shè)置

    4.2 結(jié)果分析

    本文以BiLSTM-CRF為基準(zhǔn)方法,對(duì)比測(cè)試BiLSTM-Attention-CRF網(wǎng)絡(luò)結(jié)構(gòu)增加輔助優(yōu)化訓(xùn)練前后的識(shí)別效果,分別采用詞向量、結(jié)合字及主題信息的詞向量、結(jié)合詞及主題信息的字向量,三種語(yǔ)義表示進(jìn)行測(cè)試,結(jié)果如表3所示,其中指標(biāo)是對(duì)所有實(shí)體識(shí)別結(jié)果的統(tǒng)計(jì)。

    表3 模型結(jié)果對(duì)比(%)

    可以看出,與基準(zhǔn)方法相比,增加了Attention機(jī)制的模型實(shí)驗(yàn)效果更好,根據(jù)模型分析,CRF學(xué)到的是標(biāo)簽之間的轉(zhuǎn)移概率,而Attention機(jī)制在每個(gè)語(yǔ)義單元特征中加入全局注意力信息,為CRF計(jì)算最優(yōu)路徑時(shí)突出句中關(guān)鍵詞的作用,弱化非關(guān)鍵詞的影響。以表4中的標(biāo)注語(yǔ)料為例,基準(zhǔn)模型對(duì)當(dāng)事人現(xiàn)住地址識(shí)別為:“陜西省西安市甘亭街道辦事處/B-Ns **村/E-Ns */O 組/O */O 街/O ***號(hào)/O”,而增加Attention的模型識(shí)別結(jié)果與標(biāo)注語(yǔ)料一致,對(duì)比結(jié)果分析:語(yǔ)料中存在較多以某村為結(jié)尾的地名,使得學(xué)習(xí)到的基準(zhǔn)模型沒(méi)有標(biāo)注完整,但Attention機(jī)制對(duì)后半段地址的強(qiáng)化作用起到了修正的效果。

    表4 各實(shí)體結(jié)果對(duì)比(%)

    另外,從結(jié)果可以看出,使用本文提出的結(jié)合多粒度語(yǔ)義單元信息的表示方式,實(shí)驗(yàn)結(jié)果明顯由于詞本身的向量表示,證明了多個(gè)粒度上的語(yǔ)義信息對(duì)NER任務(wù)的有效性。對(duì)本文提出的兩種結(jié)合方式比較,結(jié)合詞及主題信息的字向量比結(jié)合字及主題信息的詞向量具有更好的效果,為了更好地分析原因,采用BiLSTM-Attention-CRF+輔助優(yōu)化的方式,對(duì)本文設(shè)定的5種實(shí)體類(lèi)型分別統(tǒng)計(jì)指標(biāo)值進(jìn)行對(duì)比,如表4所示。

    從各實(shí)體識(shí)別結(jié)果分析,使用字向量?jī)?yōu)于詞向量的原因主要有三方面:一是法律文書(shū)中人名實(shí)體較多,這種短實(shí)體更適用于字向量,例如基于詞向量會(huì)把表4中的一處人名標(biāo)注為“委托/O 訴訟/O 代理人/O:/O 陳*/S-Nr 進(jìn)O”,而基于字向量得到正確結(jié)果;二是在同樣規(guī)模的語(yǔ)料中,字相比于詞具有更短的詞典,可以得到更充分的訓(xùn)練;三是分詞結(jié)果并非完全準(zhǔn)確。

    5 結(jié) 語(yǔ)

    本文深入探究了法律文書(shū)命名實(shí)體識(shí)別的主要問(wèn)題,并針對(duì)具體問(wèn)題提出相應(yīng)的解決方法。對(duì)于識(shí)別模型在不同案件類(lèi)型的文書(shū)中魯棒性差的問(wèn)題,采用LDA模型獲取主題向量,提供篇章級(jí)粒度的語(yǔ)義信息。對(duì)于語(yǔ)義表示涵蓋信息片面的問(wèn)題,提出了兩種多粒度語(yǔ)義單元結(jié)合方式:結(jié)合字及主題信息的詞向量、結(jié)合詞及主題信息的字向量,為模型輸入提供了更全面的語(yǔ)義表示。對(duì)于法律文書(shū)命名實(shí)體識(shí)別標(biāo)注語(yǔ)料不充足的問(wèn)題,采用基于輔助優(yōu)化的模型訓(xùn)練方式,減少模型對(duì)人工標(biāo)注語(yǔ)料的依賴(lài)。在模型上采用BiLSTM-Attention-CRF網(wǎng)絡(luò)結(jié)構(gòu),通過(guò)增加Attention機(jī)制,為每個(gè)語(yǔ)義單元特征中加入全局注意力信息,從而強(qiáng)化了句中關(guān)鍵詞對(duì)當(dāng)前標(biāo)簽判斷的作用。最后通過(guò)實(shí)驗(yàn)證明,本文提出的各種優(yōu)化方法都是有效的,在現(xiàn)有分詞工具的性能基礎(chǔ)上,采用結(jié)合詞及主題信息的字向量作為BiLSTM-Attention-CRF模型的輸入語(yǔ)義表示,可以獲取最好的識(shí)別效果。

    雖然本文在模型結(jié)構(gòu)、輸入表示、訓(xùn)練方式進(jìn)行了優(yōu)化研究,但在具體參數(shù)上還可以進(jìn)一步通過(guò)細(xì)化實(shí)驗(yàn),對(duì)最優(yōu)方案進(jìn)行深入研究,比如在多粒度語(yǔ)義單元的結(jié)合方式上,本文采用的是淺層結(jié)合的方式,可以嘗試如CNN和RNN這類(lèi)深層結(jié)合方式進(jìn)行對(duì)比測(cè)試。另外,輔助優(yōu)化語(yǔ)料數(shù)量對(duì)主任務(wù)影響的關(guān)系,也需要進(jìn)行更深入的研究。

    猜你喜歡
    語(yǔ)料命名粒度
    粉末粒度對(duì)純Re坯顯微組織與力學(xué)性能的影響
    命名——助力有機(jī)化學(xué)的學(xué)習(xí)
    基于矩陣的多粒度粗糙集粒度約簡(jiǎn)方法
    有一種男人以“暖”命名
    東方女性(2018年3期)2018-04-16 15:30:02
    為一條河命名——在白河源
    基于語(yǔ)料調(diào)查的“連……都(也)……”出現(xiàn)的語(yǔ)義背景分析
    基于粒度矩陣的程度多粒度粗糙集粒度約簡(jiǎn)
    華語(yǔ)電影作為真實(shí)語(yǔ)料在翻譯教學(xué)中的應(yīng)用
    《苗防備覽》中的湘西語(yǔ)料
    國(guó)內(nèi)外語(yǔ)用學(xué)實(shí)證研究比較:語(yǔ)料類(lèi)型與收集方法
    一边摸一边抽搐一进一小说| 男女午夜视频在线观看| 亚洲 国产 在线| 99国产极品粉嫩在线观看| 亚洲成人精品中文字幕电影| 亚洲成人国产一区在线观看| 叶爱在线成人免费视频播放| 给我免费播放毛片高清在线观看| 性色av乱码一区二区三区2| 国产成人一区二区三区免费视频网站| 国产片内射在线| 国产激情欧美一区二区| 国产精品99久久99久久久不卡| 色哟哟哟哟哟哟| 波多野结衣av一区二区av| 欧美日韩中文字幕国产精品一区二区三区| 99精品久久久久人妻精品| 欧美久久黑人一区二区| 色老头精品视频在线观看| 欧美又色又爽又黄视频| 国产精品,欧美在线| 国产精品精品国产色婷婷| 一边摸一边抽搐一进一小说| 欧美黄色淫秽网站| 亚洲 欧美一区二区三区| 一本综合久久免费| 欧美一区二区精品小视频在线| 精品国产一区二区三区四区第35| 嫩草影院精品99| 1024视频免费在线观看| 在线av久久热| 久久国产亚洲av麻豆专区| 亚洲午夜精品一区,二区,三区| 每晚都被弄得嗷嗷叫到高潮| 久久99热这里只有精品18| 国产精品日韩av在线免费观看| 日本 欧美在线| 国产极品粉嫩免费观看在线| 中文在线观看免费www的网站 | 久久热在线av| 成年版毛片免费区| 在线视频色国产色| 麻豆一二三区av精品| 亚洲最大成人中文| 国产av在哪里看| 亚洲成人国产一区在线观看| 国产精品久久久久久人妻精品电影| 91国产中文字幕| 欧美中文日本在线观看视频| 看黄色毛片网站| 一二三四在线观看免费中文在| 亚洲精品在线观看二区| 欧美激情极品国产一区二区三区| 久久久久九九精品影院| 中出人妻视频一区二区| 99久久99久久久精品蜜桃| 日本成人三级电影网站| 99re在线观看精品视频| 久久人妻福利社区极品人妻图片| 一进一出抽搐动态| 亚洲在线自拍视频| 婷婷精品国产亚洲av| 777久久人妻少妇嫩草av网站| 亚洲av成人不卡在线观看播放网| 日韩三级视频一区二区三区| 最近最新免费中文字幕在线| 国产单亲对白刺激| 久久久久免费精品人妻一区二区 | 啦啦啦 在线观看视频| 日本a在线网址| 欧美日韩一级在线毛片| 黄色a级毛片大全视频| 欧美精品啪啪一区二区三区| 国产精品久久久久久亚洲av鲁大| 村上凉子中文字幕在线| 欧美日本亚洲视频在线播放| 久久午夜综合久久蜜桃| 欧美久久黑人一区二区| 亚洲av中文字字幕乱码综合 | 久久久国产欧美日韩av| 在线永久观看黄色视频| 国产av不卡久久| 黄色视频,在线免费观看| 视频区欧美日本亚洲| 满18在线观看网站| av福利片在线| 欧美中文日本在线观看视频| 在线播放国产精品三级| 一区二区三区国产精品乱码| 欧美精品亚洲一区二区| 精品国产超薄肉色丝袜足j| 此物有八面人人有两片| 亚洲成人国产一区在线观看| 国产午夜精品久久久久久| 90打野战视频偷拍视频| 99国产综合亚洲精品| 黄色视频,在线免费观看| 亚洲av第一区精品v没综合| 欧美zozozo另类| 欧美黑人巨大hd| 日本a在线网址| 99国产精品一区二区蜜桃av| 制服丝袜大香蕉在线| 天天添夜夜摸| 女性生殖器流出的白浆| 国产午夜精品久久久久久| a级毛片a级免费在线| 久久久久久久午夜电影| 欧美黑人欧美精品刺激| 天天添夜夜摸| 欧美成人一区二区免费高清观看 | 精品无人区乱码1区二区| 国产精品久久电影中文字幕| 成人一区二区视频在线观看| 亚洲国产精品合色在线| 国产午夜福利久久久久久| 一级a爱片免费观看的视频| 日韩欧美三级三区| 国产高清有码在线观看视频 | 日韩精品青青久久久久久| 一区二区日韩欧美中文字幕| 国产精品日韩av在线免费观看| 亚洲国产欧美一区二区综合| 黄色片一级片一级黄色片| 国产v大片淫在线免费观看| 91老司机精品| 亚洲国产精品合色在线| 99久久久亚洲精品蜜臀av| 久久婷婷人人爽人人干人人爱| 亚洲人成77777在线视频| 十八禁人妻一区二区| 老司机午夜十八禁免费视频| 成人18禁在线播放| 久久精品亚洲精品国产色婷小说| 精品福利观看| 少妇粗大呻吟视频| 午夜福利高清视频| 欧美日本亚洲视频在线播放| 色综合亚洲欧美另类图片| 长腿黑丝高跟| 亚洲激情在线av| 啦啦啦 在线观看视频| 成在线人永久免费视频| 国产成人精品无人区| 午夜免费激情av| 69av精品久久久久久| 成年人黄色毛片网站| 特大巨黑吊av在线直播 | 老鸭窝网址在线观看| 一进一出抽搐动态| 丁香六月欧美| 成人国产一区最新在线观看| 久久久久久大精品| 国产精品亚洲av一区麻豆| 91九色精品人成在线观看| 大型黄色视频在线免费观看| 亚洲精品美女久久av网站| 久久婷婷人人爽人人干人人爱| 免费观看人在逋| 日本 欧美在线| 免费人成视频x8x8入口观看| 国产在线观看jvid| 少妇被粗大的猛进出69影院| www.999成人在线观看| 国产午夜精品久久久久久| 久久亚洲真实| 一进一出抽搐动态| 精品第一国产精品| 亚洲最大成人中文| av中文乱码字幕在线| 久热这里只有精品99| 欧美日韩中文字幕国产精品一区二区三区| 91av网站免费观看| 中亚洲国语对白在线视频| 别揉我奶头~嗯~啊~动态视频| 久久久久久亚洲精品国产蜜桃av| 亚洲男人的天堂狠狠| 啦啦啦韩国在线观看视频| 一二三四在线观看免费中文在| 波多野结衣高清无吗| 久久久久久久久久黄片| 色播亚洲综合网| 国产熟女午夜一区二区三区| 精品午夜福利视频在线观看一区| 亚洲av片天天在线观看| 亚洲国产高清在线一区二区三 | 免费一级毛片在线播放高清视频| 香蕉久久夜色| 两性午夜刺激爽爽歪歪视频在线观看 | 最新美女视频免费是黄的| 成人亚洲精品av一区二区| 啦啦啦观看免费观看视频高清| 亚洲色图av天堂| 中文亚洲av片在线观看爽| 日本免费一区二区三区高清不卡| 亚洲熟女毛片儿| 亚洲第一av免费看| 日韩三级视频一区二区三区| 中文字幕另类日韩欧美亚洲嫩草| bbb黄色大片| 午夜久久久久精精品| 亚洲成a人片在线一区二区| 黄色丝袜av网址大全| 757午夜福利合集在线观看| 中文资源天堂在线| 夜夜看夜夜爽夜夜摸| 999久久久国产精品视频| 国产蜜桃级精品一区二区三区| 欧美日韩中文字幕国产精品一区二区三区| 宅男免费午夜| 99国产精品一区二区蜜桃av| 成在线人永久免费视频| 亚洲精品一卡2卡三卡4卡5卡| 天堂动漫精品| av有码第一页| 最近在线观看免费完整版| 久久香蕉激情| 黄片播放在线免费| 国产免费男女视频| 欧美 亚洲 国产 日韩一| 99国产精品一区二区三区| 亚洲中文字幕日韩| 国产又色又爽无遮挡免费看| 黄色视频,在线免费观看| 啪啪无遮挡十八禁网站| 99国产精品一区二区蜜桃av| 日韩有码中文字幕| 国产精品 欧美亚洲| 久热爱精品视频在线9| 久久中文看片网| 99在线视频只有这里精品首页| netflix在线观看网站| 久久人人精品亚洲av| 欧美性猛交╳xxx乱大交人| 国产单亲对白刺激| 久久久久国产精品人妻aⅴ院| 午夜福利一区二区在线看| 亚洲久久久国产精品| 99久久无色码亚洲精品果冻| 精品第一国产精品| 亚洲真实伦在线观看| 日日干狠狠操夜夜爽| 国产精品 欧美亚洲| 黑人巨大精品欧美一区二区mp4| 国产成年人精品一区二区| 国产成人精品久久二区二区91| 日韩一卡2卡3卡4卡2021年| 色播在线永久视频| 好男人电影高清在线观看| a级毛片a级免费在线| 成人亚洲精品av一区二区| 侵犯人妻中文字幕一二三四区| 变态另类成人亚洲欧美熟女| 每晚都被弄得嗷嗷叫到高潮| 草草在线视频免费看| 久久久久亚洲av毛片大全| 国产三级在线视频| 亚洲第一av免费看| 亚洲狠狠婷婷综合久久图片| 国产av又大| www.999成人在线观看| 狠狠狠狠99中文字幕| 亚洲人成电影免费在线| 欧美成人免费av一区二区三区| 十分钟在线观看高清视频www| 精品高清国产在线一区| 亚洲一区二区三区色噜噜| 香蕉av资源在线| 久久久久国内视频| 久9热在线精品视频| 国内久久婷婷六月综合欲色啪| 国产成+人综合+亚洲专区| 亚洲 国产 在线| 国产成年人精品一区二区| 久久精品成人免费网站| 成人三级做爰电影| 99精品在免费线老司机午夜| 欧美日韩精品网址| 久久精品夜夜夜夜夜久久蜜豆 | 亚洲专区中文字幕在线| 久久精品夜夜夜夜夜久久蜜豆 | 国产又黄又爽又无遮挡在线| 国产亚洲精品一区二区www| 欧美亚洲日本最大视频资源| 啦啦啦 在线观看视频| 免费在线观看黄色视频的| 国产成人精品久久二区二区免费| 久久精品91蜜桃| 久久久水蜜桃国产精品网| 99久久国产精品久久久| 亚洲一区二区三区不卡视频| 免费电影在线观看免费观看| 国产高清videossex| 国产真人三级小视频在线观看| 亚洲人成伊人成综合网2020| 色哟哟哟哟哟哟| 视频在线观看一区二区三区| 精品国产国语对白av| 男女下面进入的视频免费午夜 | 日韩成人在线观看一区二区三区| 国产伦人伦偷精品视频| 国产高清videossex| 亚洲人成网站在线播放欧美日韩| 丰满的人妻完整版| 两性夫妻黄色片| 亚洲国产日韩欧美精品在线观看 | 在线免费观看的www视频| 国产熟女午夜一区二区三区| 国产激情欧美一区二区| 日韩欧美国产一区二区入口| av在线天堂中文字幕| 真人一进一出gif抽搐免费| 久久久久国产一级毛片高清牌| 人人妻人人看人人澡| 欧美一区二区精品小视频在线| 日韩欧美一区二区三区在线观看| 亚洲av熟女| e午夜精品久久久久久久| 精品一区二区三区av网在线观看| 亚洲av中文字字幕乱码综合 | 久久久久久久午夜电影| 1024手机看黄色片| 99久久综合精品五月天人人| 在线观看舔阴道视频| 18禁观看日本| 欧美性猛交黑人性爽| 欧美中文日本在线观看视频| 国产爱豆传媒在线观看 | 最近在线观看免费完整版| 好看av亚洲va欧美ⅴa在| 黄色女人牲交| 国内精品久久久久久久电影| 嫩草影视91久久| 最近最新免费中文字幕在线| 亚洲午夜理论影院| 色综合亚洲欧美另类图片| 久久这里只有精品19| 可以在线观看毛片的网站| 99re在线观看精品视频| 免费在线观看黄色视频的| 国产乱人伦免费视频| 在线永久观看黄色视频| 桃色一区二区三区在线观看| 精品一区二区三区视频在线观看免费| 亚洲aⅴ乱码一区二区在线播放 | 日韩国内少妇激情av| 国产成年人精品一区二区| 欧美丝袜亚洲另类 | 日韩欧美国产一区二区入口| 男女做爰动态图高潮gif福利片| 欧美激情 高清一区二区三区| 青草久久国产| 欧美日本视频| 亚洲精品美女久久久久99蜜臀| 亚洲男人的天堂狠狠| 黄色成人免费大全| 叶爱在线成人免费视频播放| 91老司机精品| 午夜影院日韩av| 色精品久久人妻99蜜桃| 人人妻人人看人人澡| 免费电影在线观看免费观看| 成人三级做爰电影| 日本五十路高清| 99久久无色码亚洲精品果冻| 好看av亚洲va欧美ⅴa在| 婷婷精品国产亚洲av在线| 国产成人影院久久av| 中文字幕精品免费在线观看视频| 1024香蕉在线观看| 久99久视频精品免费| netflix在线观看网站| 国产精品香港三级国产av潘金莲| 好男人在线观看高清免费视频 | 人人妻,人人澡人人爽秒播| 黄色视频,在线免费观看| 婷婷丁香在线五月| 少妇粗大呻吟视频| 狠狠狠狠99中文字幕| 黑人欧美特级aaaaaa片| 国产又爽黄色视频| 草草在线视频免费看| 欧美激情高清一区二区三区| 中文字幕高清在线视频| 男人舔女人下体高潮全视频| 国产亚洲欧美98| 国产精品免费视频内射| 国产一区二区三区视频了| 丝袜人妻中文字幕| 欧美乱码精品一区二区三区| 亚洲精品粉嫩美女一区| 亚洲av电影不卡..在线观看| 亚洲人成网站在线播放欧美日韩| cao死你这个sao货| 国产精品野战在线观看| 欧美激情 高清一区二区三区| 一级作爱视频免费观看| 看免费av毛片| 欧美性猛交黑人性爽| 啦啦啦观看免费观看视频高清| 日韩成人在线观看一区二区三区| 精品欧美一区二区三区在线| 日本免费一区二区三区高清不卡| 老鸭窝网址在线观看| 侵犯人妻中文字幕一二三四区| 欧美性猛交╳xxx乱大交人| 又黄又粗又硬又大视频| 欧美午夜高清在线| 美女扒开内裤让男人捅视频| 搞女人的毛片| 50天的宝宝边吃奶边哭怎么回事| 国产亚洲精品一区二区www| 99国产极品粉嫩在线观看| 精品久久久久久久毛片微露脸| 一本一本综合久久| 国产高清videossex| 少妇 在线观看| 岛国视频午夜一区免费看| 久9热在线精品视频| 国产人伦9x9x在线观看| 亚洲中文字幕一区二区三区有码在线看 | 成人三级黄色视频| 亚洲精品色激情综合| 青草久久国产| 国产视频内射| 亚洲国产欧美网| 此物有八面人人有两片| 美女高潮喷水抽搐中文字幕| 国产精品久久视频播放| 久久热在线av| 国产成人欧美| 老汉色av国产亚洲站长工具| 桃色一区二区三区在线观看| 国产亚洲精品一区二区www| 长腿黑丝高跟| 精品国产国语对白av| 欧美激情高清一区二区三区| 搡老熟女国产l中国老女人| av有码第一页| 亚洲人成网站高清观看| 久久99热这里只有精品18| 亚洲免费av在线视频| 悠悠久久av| 亚洲一码二码三码区别大吗| 女性被躁到高潮视频| 日韩av在线大香蕉| 午夜成年电影在线免费观看| 久久热在线av| 国产私拍福利视频在线观看| 国产精品电影一区二区三区| 少妇裸体淫交视频免费看高清 | 欧美乱码精品一区二区三区| 欧美黑人巨大hd| 国产99白浆流出| 女警被强在线播放| 啦啦啦免费观看视频1| www.熟女人妻精品国产| 亚洲精品美女久久av网站| 亚洲av中文字字幕乱码综合 | 亚洲人成网站在线播放欧美日韩| 久99久视频精品免费| 午夜福利18| √禁漫天堂资源中文www| 免费在线观看完整版高清| 亚洲精品av麻豆狂野| 香蕉丝袜av| 国产精品国产高清国产av| www.www免费av| ponron亚洲| 十分钟在线观看高清视频www| 亚洲片人在线观看| 国产99久久九九免费精品| 久久久久久大精品| 老熟妇乱子伦视频在线观看| 国产av又大| 最好的美女福利视频网| 亚洲第一电影网av| 国产午夜精品久久久久久| 中文字幕精品免费在线观看视频| 99riav亚洲国产免费| 亚洲专区中文字幕在线| 色av中文字幕| 国产欧美日韩精品亚洲av| 91九色精品人成在线观看| 色播亚洲综合网| 身体一侧抽搐| 成年免费大片在线观看| 在线永久观看黄色视频| 精品久久久久久久人妻蜜臀av| 一夜夜www| 亚洲中文字幕日韩| 在线看三级毛片| 草草在线视频免费看| 99精品在免费线老司机午夜| 日日干狠狠操夜夜爽| 国产亚洲精品久久久久久毛片| 国产成人av教育| 欧美在线黄色| 人人澡人人妻人| 99国产综合亚洲精品| 一级a爱视频在线免费观看| 欧美日韩一级在线毛片| 人人妻,人人澡人人爽秒播| aaaaa片日本免费| 国产三级在线视频| 免费在线观看亚洲国产| 麻豆成人av在线观看| 村上凉子中文字幕在线| 一级作爱视频免费观看| 午夜福利在线在线| 国产成人av教育| 麻豆久久精品国产亚洲av| 可以在线观看的亚洲视频| 少妇粗大呻吟视频| 亚洲国产精品成人综合色| 99国产精品99久久久久| 亚洲中文av在线| 国产成人精品久久二区二区免费| a级毛片a级免费在线| 男人操女人黄网站| 中文字幕最新亚洲高清| 一区二区三区国产精品乱码| 香蕉av资源在线| 欧美国产日韩亚洲一区| 久久亚洲精品不卡| 十分钟在线观看高清视频www| 波多野结衣高清无吗| 国产精品自产拍在线观看55亚洲| 久99久视频精品免费| 亚洲专区国产一区二区| 高清毛片免费观看视频网站| 妹子高潮喷水视频| 无人区码免费观看不卡| 亚洲自拍偷在线| 亚洲男人的天堂狠狠| 一区二区日韩欧美中文字幕| 黄色丝袜av网址大全| 香蕉av资源在线| √禁漫天堂资源中文www| 男女做爰动态图高潮gif福利片| 国产精品 欧美亚洲| 国产精品香港三级国产av潘金莲| 色精品久久人妻99蜜桃| 真人一进一出gif抽搐免费| 国产亚洲精品久久久久久毛片| 黄片大片在线免费观看| 国产午夜福利久久久久久| 久久久国产成人免费| 黄色 视频免费看| 欧美乱妇无乱码| 精品电影一区二区在线| 99久久精品国产亚洲精品| 成人三级黄色视频| 法律面前人人平等表现在哪些方面| 久久天堂一区二区三区四区| 人人澡人人妻人| 久久香蕉国产精品| 国产成人精品久久二区二区免费| 听说在线观看完整版免费高清| 国产精品亚洲美女久久久| 国产成人精品无人区| 少妇 在线观看| 亚洲精品久久国产高清桃花| 动漫黄色视频在线观看| 欧美色视频一区免费| 精品电影一区二区在线| xxxwww97欧美| 日韩 欧美 亚洲 中文字幕| 日本在线视频免费播放| 岛国视频午夜一区免费看| 国产激情欧美一区二区| 亚洲人成77777在线视频| 757午夜福利合集在线观看| 最近最新免费中文字幕在线| 999久久久精品免费观看国产| 国产极品粉嫩免费观看在线| 亚洲自拍偷在线| 欧美国产日韩亚洲一区| 88av欧美| 欧美精品啪啪一区二区三区| 日本一区二区免费在线视频| 国产高清激情床上av| 欧美日本视频| 国产av又大| 欧美黑人精品巨大| 9191精品国产免费久久| 一区二区三区精品91| 啦啦啦免费观看视频1| 麻豆一二三区av精品| 日韩大码丰满熟妇| 在线视频色国产色| 人妻丰满熟妇av一区二区三区| 亚洲aⅴ乱码一区二区在线播放 | 一区二区日韩欧美中文字幕| 亚洲国产日韩欧美精品在线观看 | 国产三级在线视频| 怎么达到女性高潮| 色精品久久人妻99蜜桃| 色在线成人网| 免费在线观看日本一区| 啪啪无遮挡十八禁网站| 欧美日本亚洲视频在线播放| 国内精品久久久久精免费| av超薄肉色丝袜交足视频| 午夜影院日韩av| 国产精品电影一区二区三区| 这个男人来自地球电影免费观看| 一级a爱片免费观看的视频| 男男h啪啪无遮挡| 成人手机av| 久久狼人影院| 久久精品国产综合久久久| 99在线视频只有这里精品首页| 国产精品久久久人人做人人爽| 中文字幕精品免费在线观看视频|