• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    一種解決命名實(shí)體識(shí)別數(shù)據(jù)集類別標(biāo)記失衡的方法

    2020-01-10 03:17:26許麗丹劉嘉勇
    關(guān)鍵詞:父代個(gè)數(shù)類別

    許麗丹, 劉嘉勇, 何 祥

    (1.四川大學(xué)網(wǎng)絡(luò)空間安全學(xué)院, 成都 610065; 2.四川大學(xué)電子信息學(xué)院, 成都 610065)

    1 引 言

    命名實(shí)體識(shí)別是自然語(yǔ)言處理領(lǐng)域中一項(xiàng)重要任務(wù),經(jīng)過(guò)幾十年的研究發(fā)展已取得了顯著成果[1-5].但是目前已有的研究較少關(guān)注命名實(shí)體識(shí)別數(shù)據(jù)集數(shù)據(jù)類別標(biāo)記不平衡這類數(shù)據(jù)分布問(wèn)題[6].數(shù)據(jù)類別標(biāo)記不平衡[7]是指一個(gè)類別的數(shù)據(jù)量與屬于另一類別的數(shù)據(jù)量差距較大,且小樣本量類呈現(xiàn)出的信息更具價(jià)值.數(shù)據(jù)類別標(biāo)記不平衡會(huì)影響統(tǒng)計(jì)學(xué)習(xí)模型的效果,導(dǎo)致模型更關(guān)注多數(shù)類別數(shù)據(jù),忽略少數(shù)類別數(shù)據(jù)[7-16].在分類問(wèn)題中解決數(shù)據(jù)類別標(biāo)記不平衡的方法主要有以下三類: (1) 采樣方法,包括欠采樣和過(guò)采樣方法[7];(2) 改進(jìn)統(tǒng)計(jì)學(xué)習(xí)算法,包括one-class學(xué)習(xí)方法[8],修改算法的代價(jià)[9]以及集成學(xué)習(xí)[10];(3) 特征選擇,通過(guò)收集最佳特征子集[11]以實(shí)現(xiàn)最佳性能.

    針對(duì)序列數(shù)據(jù),Tomanek等人通過(guò)主動(dòng)學(xué)習(xí),在數(shù)據(jù)標(biāo)記階段盡可能平衡地標(biāo)記數(shù)據(jù)[12].Douzas等人使用條件對(duì)抗生成模型為少數(shù)類別數(shù)據(jù)生成更多數(shù)據(jù)以緩解數(shù)據(jù)失衡[13],但這種方法模型復(fù)雜、計(jì)算代價(jià)大.Gliozzo假設(shè)頻繁出現(xiàn)的單詞一般不提供文本具體信息,也不會(huì)是實(shí)體.可以過(guò)濾掉這些詞以減小非實(shí)體類單詞與實(shí)體類單詞比值[14].Maragoudakis等人使用Tomek連接法在訓(xùn)練階段減少訓(xùn)練集中不必要的負(fù)面樣本[15].Akkasi等人[6]提出了平衡欠采樣方法,該方法保留句子邏輯短語(yǔ)結(jié)構(gòu)以及句子間相關(guān)性,并在四個(gè)生物醫(yī)學(xué)數(shù)據(jù)集上分別實(shí)驗(yàn)比較隨機(jī)欠采樣、SWF[14]和平衡欠采樣三種欠采樣方法的效果并證明了調(diào)節(jié)數(shù)據(jù)集中實(shí)體類單詞和實(shí)體類單詞比例可以改善模型效果.然而這種方法直接剔除數(shù)據(jù)集中非實(shí)體單詞或語(yǔ)句,可能破壞文本的短語(yǔ)結(jié)構(gòu),丟失有價(jià)值的數(shù)據(jù).

    針對(duì)已有方法可能造成的信息丟失問(wèn)題,本文通過(guò)改造遺傳算法[17]用于序列文本合成,提出了一種基于遺傳算法的數(shù)據(jù)類別標(biāo)記平衡方法,本文簡(jiǎn)稱CBM-GA(class balance method based on genetic algorithm).該方法保留所有原始語(yǔ)料,利用遺傳算法基因重組、繁衍行為特點(diǎn),充分挖掘類別平衡文本特征,盡可能維持語(yǔ)句中實(shí)體短語(yǔ)結(jié)構(gòu)的同時(shí),合成新文本以擴(kuò)充原始數(shù)據(jù)集.實(shí)驗(yàn)表明,本文提出的方法有效緩解數(shù)據(jù)集類別標(biāo)記不平衡問(wèn)題,提高命名實(shí)體識(shí)別任務(wù)性能.

    2.1 類別平衡方法框架

    本文提出的數(shù)據(jù)類別平衡方法CBM-GA框架如圖1所示,首先對(duì)原始數(shù)據(jù)集進(jìn)行篩選,獲得合適的父代樣本集,通過(guò)適應(yīng)度函數(shù)評(píng)估樣本并按照其適應(yīng)度函數(shù)值排序獲得有序父代樣本集.從有序父代樣本集中隨機(jī)選擇樣本形成父代樣本對(duì),經(jīng)過(guò)交叉和變異操作生成新樣本,再次使用適應(yīng)度函數(shù)評(píng)估新樣本,抽取適應(yīng)度函數(shù)值高的新樣本集合更新下一輪文本合成操作所需的父代樣本集,如此循環(huán)N次.最后將第N輪生成新樣本數(shù)據(jù)集和原始數(shù)據(jù)集合并產(chǎn)生擴(kuò)充數(shù)據(jù)集,用于命名實(shí)體識(shí)別.

    圖1 CBM-GA框架圖Fig.1 Method framework

    2.2 類別平衡方法原理

    2.2.1 數(shù)據(jù)篩選 現(xiàn)有用于命名實(shí)體識(shí)別研究的公開(kāi)數(shù)據(jù)集中實(shí)體單詞個(gè)數(shù)遠(yuǎn)小于非實(shí)體單詞個(gè)數(shù),且包含大量無(wú)實(shí)體單詞、類別嚴(yán)重失衡的語(yǔ)句[6].直接使用這樣的數(shù)據(jù)集進(jìn)行文本合成會(huì)增加后續(xù)操作代價(jià),降低文本合成效果.因此需要進(jìn)行文本篩選,初步獲取類別分布相對(duì)平衡的文本集合作為父代樣本集.

    如何評(píng)估文本類別標(biāo)記平衡的程度是首先需要解決的問(wèn)題,Akkasi等人[6]用非實(shí)體單詞個(gè)數(shù)和實(shí)體單詞個(gè)數(shù)比值來(lái)評(píng)估文本類別標(biāo)記平衡性,如式(1)所示.

    (1)

    式(1)中,WO表示語(yǔ)句中非實(shí)體單詞個(gè)數(shù);分母WE表示語(yǔ)句實(shí)體單詞個(gè)數(shù).本文將R值作為文本平衡性的衡量指標(biāo),R值越大文本類別越不平衡.

    統(tǒng)計(jì)分析常用數(shù)據(jù)集CoNLL2003[18]、JNLPBA[19]中語(yǔ)句的非實(shí)體單詞個(gè)數(shù)與實(shí)體單詞個(gè)數(shù)比值R和語(yǔ)句單詞總數(shù)的關(guān)系,我們可以得出以下結(jié)論:文本單詞個(gè)數(shù)越多,R值越大,文本類別越不平衡,兩者近似反比例關(guān)系,如圖2所示.

    圖2 兩個(gè)常用數(shù)據(jù)集文本R值與文本單詞個(gè)數(shù)關(guān)系圖

    Fig.2 Relationship between the textRvalue of two common datasets and the number of text words

    圖2中橫軸表示語(yǔ)句的單詞總數(shù),縱軸表示語(yǔ)句中非實(shí)體單詞個(gè)數(shù)與實(shí)體單詞個(gè)數(shù)的比值.實(shí)線、虛線分別表示JNLPBA、CoNLL2003數(shù)據(jù)集的文本R值與文本長(zhǎng)度的關(guān)系,二者整體呈上升趨勢(shì).當(dāng)文本單詞個(gè)數(shù)超過(guò)60,文本的R值波動(dòng)幅度變大;當(dāng)文本單詞個(gè)數(shù)超過(guò)100,JNLPBA數(shù)據(jù)集的R值均處于劇烈波動(dòng)狀態(tài),CoNLL2003數(shù)據(jù)集R值快速增長(zhǎng),表明此時(shí)文本類別較不平衡,使用這樣的數(shù)據(jù)進(jìn)行后續(xù)操作將不利于合成類別均衡的新文本.

    因此,為了減少后續(xù)文本合成操作的計(jì)算代價(jià),提高合成效率,數(shù)據(jù)篩選過(guò)程中需要剔除類別嚴(yán)重失衡的數(shù)據(jù).結(jié)合上述分析,數(shù)據(jù)篩選具體流程如下.

    (1) 計(jì)算每個(gè)語(yǔ)句中實(shí)體單詞個(gè)數(shù),剔除不含實(shí)體單詞的語(yǔ)句;

    (2) 剔除單詞個(gè)數(shù)超過(guò)100的語(yǔ)句.

    2.2.2 適應(yīng)度評(píng)估 適應(yīng)度函數(shù),在遺傳算法中用以評(píng)估給定解決方案與所需問(wèn)題最佳解決方案的接近程度[17].CBM-GA方法使用適應(yīng)度函數(shù)作為評(píng)估指標(biāo)以評(píng)估樣本的平衡性,并將類別標(biāo)記平衡條件引入適應(yīng)度函數(shù)中,使得算法尋優(yōu)過(guò)程中嘗試構(gòu)造類別分布平衡的新樣本.定義適應(yīng)度函數(shù)f如式(2)所示.

    f=sigmoid(Rs-R)+λ×sigmoid(R-Rr)

    (2)

    式(2)中,R為式(1)定義的語(yǔ)句非實(shí)體單詞和實(shí)體單詞的比值;Rs是合成文本R值上限值;Rr是合成文本R值下限值;λ是Rr權(quán)重系數(shù).式(2)借助sigmoid函數(shù)控制合成樣本的R值在[Rr,Rs]范圍內(nèi).

    由圖2分析可知文本單詞個(gè)數(shù)不應(yīng)過(guò)長(zhǎng),因此向適應(yīng)度函數(shù)中添加單詞個(gè)數(shù)小于100的限制,如式(3)所示.

    (3)

    式(3)中,L表示語(yǔ)句單詞個(gè)數(shù)限制函數(shù);l表示當(dāng)前樣本單詞個(gè)數(shù).relu函數(shù)限制合成文本的長(zhǎng)度.適應(yīng)度函數(shù)引入單詞個(gè)數(shù)限制,如式(4)所示.

    f=sigmoid(Rs-R)+λ×sigmoid(R-Rr)+

    (4)

    式(4)中,μ是L的權(quán)重系數(shù),用以控制類別平衡條件和單詞個(gè)數(shù)限制的重要性差異.

    2.2.3 文本合成 CBM-GA方法文本合成過(guò)程主要是通過(guò)一系列選擇、交叉和變異操作合成數(shù)據(jù)標(biāo)記平衡的數(shù)據(jù).其中,選擇操作從有序父代樣本集合中抽取父代樣本構(gòu)建父代樣本對(duì)集合;交叉操作將父代樣本對(duì)進(jìn)行組合以生成新樣本;變異操作調(diào)整新樣本的單詞順序,向樣本中添加更多隨機(jī)性.

    CBM-GA方法將文本視為染色體,將單詞及其實(shí)體標(biāo)記類型視為染色體上的基因.如圖3所示.每個(gè)框內(nèi)上行表示單詞,下行表示對(duì)應(yīng)實(shí)體類型標(biāo)記[17],二者共同構(gòu)成一個(gè)完整的基因.基因構(gòu)成染色體,又稱之為樣本.將數(shù)據(jù)集中每個(gè)文本視為樣本,數(shù)據(jù)集視為樣本群體.

    為了便于后續(xù)分析,定義樣本染色體x=(x1,x2,…,xn),其中,xi是包含單詞及其對(duì)應(yīng)實(shí)體類型標(biāo)記的基因,n是染色體長(zhǎng)度.

    1) 選擇操作

    在選擇步驟中,遍歷有序父代樣本集并按照比例選擇方法[20]隨機(jī)選擇兩個(gè)父代樣本構(gòu)成父代樣本對(duì),從而構(gòu)成父代樣本對(duì)集合.

    圖3 染色體示意圖
    Fig.3 Chromosome schematic diagram

    圖4 交叉過(guò)程示意圖Fig.4 Crossover schematic diagram

    2) 交叉操作

    在交叉階段,對(duì)父代樣本對(duì)集合中每個(gè)父代樣本對(duì)采用隨機(jī)交叉策略進(jìn)行單詞序列相互交換,以產(chǎn)生新樣本,如圖4所示.

    為避免實(shí)體短語(yǔ)被切分而導(dǎo)致命名實(shí)體模糊、歧義等問(wèn)題,CBM-GA方法修改基因組合規(guī)則,限制單詞交換位置僅為開(kāi)始,結(jié)尾以及O標(biāo)記[18]的非實(shí)體單詞位置以確保實(shí)體單詞結(jié)構(gòu)完整交換.因此首先根據(jù)父樣本1的實(shí)體標(biāo)記類型,構(gòu)建交換位置集合l.并隨機(jī)從l中抽取交叉發(fā)生的開(kāi)始、結(jié)束位置以得到單詞序列如圖中黑色框單詞序列,將其與父樣本2合并生成新樣本x′.

    x′=x1[lstart:lend]+x2

    (6)

    式(6)中,x1表示父樣本1;x2表示父樣本2;lstart、lend分別表示從交換位置集合l隨機(jī)抽取的開(kāi)始、結(jié)束位置;x′表示新樣本.

    3) 變異操作

    本文采用隨機(jī)交換單詞位置的方式實(shí)現(xiàn)變異.具體操作為:設(shè)定一個(gè)變異概率α,對(duì)交叉得到的新樣本x′,隨機(jī)產(chǎn)生一個(gè)[0,1]區(qū)間上的隨機(jī)數(shù)r,如果r<α,則隨機(jī)交換新樣本x′兩個(gè)單詞的位置.最終生成樣本如式(7)所示.

    (7)

    式(7)表明當(dāng)r<α?xí)r,隨機(jī)選定兩個(gè)單詞位置i、k,交換x′中兩個(gè)位置的單詞從而實(shí)現(xiàn)變異操作,反之則不進(jìn)行變異.

    綜上分析,CBM-GA方法完整表述如算法1.

    算法1 CBM-GA方法

    輸入原始訓(xùn)練樣本集合S;參數(shù)Rs、Rr、λ、μ、循環(huán)次數(shù)N、變異概率α、合成樣本集合大小La

    輸出擴(kuò)展的新樣本集合A

    Begin

    初始化迭代次數(shù)n:n=0

    (1) 遍歷原始訓(xùn)練樣本S,過(guò)濾不含實(shí)體單詞及文本單詞個(gè)數(shù)超過(guò)100的語(yǔ)句,獲得父代樣本集D;

    (2) 遍歷父代樣本集D,根據(jù)式(4)計(jì)算每個(gè)語(yǔ)句的適應(yīng)值并排序,得到有序父代樣本集D1;

    (3) 使用比例選擇法隨機(jī)從D1中抽取兩個(gè)父代樣本組成的父代樣本對(duì)集合;

    (4) 遍歷父代樣本對(duì)集合:

    (a) 針對(duì)父代樣本對(duì)(p1,p2),分別從p1、p2樣本的開(kāi)始、結(jié)尾及非實(shí)體單詞的位置集合中隨機(jī)選擇位置變量以截取單詞序列;

    (b) 將單詞序列合并成新樣本T;

    (c) 以概率α交換T中任意兩個(gè)位置的單詞,并將T加入新樣本集合G;

    (5) 遍歷G,根據(jù)式(4)計(jì)算每個(gè)新語(yǔ)句的適應(yīng)值.抽取適應(yīng)值最高的La個(gè)樣本的集合替換D1、G,迭代次數(shù)n加1;

    (6) 如果n

    End

    為了驗(yàn)證CBM-GA方法的有效性,排除單一數(shù)據(jù)集影響,實(shí)驗(yàn)采用命名實(shí)體識(shí)別研究中常用數(shù)據(jù)集CoNLL2003[18]和JNLPBA[19]進(jìn)行實(shí)驗(yàn).數(shù)據(jù)集基本統(tǒng)計(jì)信息如表1所示.

    表1 數(shù)據(jù)集統(tǒng)計(jì)信息表

    如表1所示, CoNLL 2003已分配好訓(xùn)練集、驗(yàn)證集和測(cè)試集;JNLPBA僅劃分了訓(xùn)練集和測(cè)試集.本文從JNLPBA中隨機(jī)抽取1/3數(shù)據(jù)作為驗(yàn)證集.

    本文實(shí)驗(yàn)平臺(tái)為ubuntu16.04系統(tǒng)服務(wù)器,GPU為GeForce GTX 1070,顯存8 G.實(shí)驗(yàn)?zāi)P褪褂胻ensorflow框架構(gòu)建.

    3.2 實(shí)驗(yàn)評(píng)價(jià)指標(biāo)

    Akkasi等人提出平衡欠采樣方法以緩解數(shù)據(jù)集的類別失衡問(wèn)題,從而改善命名實(shí)體識(shí)別的效果,其借助命名實(shí)體識(shí)別評(píng)價(jià)指標(biāo)作為最終的方法有效性衡量指標(biāo)[6].本文沿用該評(píng)價(jià)指標(biāo)來(lái)論證CBM-GA方法的有效性.命名實(shí)體識(shí)別一般采用精準(zhǔn)率(prec)、召回率(recall)和F1值作為模型性能評(píng)估指標(biāo)[1-5].本文使用的模型評(píng)價(jià)指標(biāo)定義如下.

    (8)

    (9)

    (10)

    3.3 實(shí)驗(yàn)參數(shù)設(shè)置與尋優(yōu)

    根據(jù)2.2節(jié)定義,CBM-GA方法實(shí)現(xiàn)過(guò)程涉及參數(shù):合成樣本R值上限Rs,合成樣本R值下限Rr,Rr值權(quán)重λ,L的權(quán)重系數(shù)μ,合成樣本集合大小La,變異概率α以及循環(huán)次數(shù)N.

    根據(jù)Whitley等人的經(jīng)驗(yàn)[17],本文實(shí)驗(yàn)將α設(shè)為0.01.為給其它參數(shù)設(shè)置合理的取值,實(shí)驗(yàn)基于Bi-LSTM-CRF模型[2]使用貝葉斯優(yōu)化[16]尋優(yōu)方法來(lái)設(shè)置參數(shù).具體操作如下.

    1) 分別以1為步長(zhǎng),設(shè)置Rs,Rr的取值范圍為[0,30];以500為步長(zhǎng),設(shè)置La的取值范圍為[500,2000];以0.1為步長(zhǎng),設(shè)置λ取值范圍為[0,1];以1為步長(zhǎng),設(shè)置循環(huán)次數(shù)N取值范圍為[1,10],構(gòu)建參數(shù)集合;

    2) 基于Bi-LSTM-CRF模型使用貝葉斯優(yōu)化尋優(yōu)方法以F1值為指標(biāo),對(duì)參數(shù)集合進(jìn)行尋優(yōu).選取驗(yàn)證集實(shí)驗(yàn)結(jié)果中F1值最大的參數(shù)作為后續(xù)實(shí)驗(yàn)參數(shù).

    圖5 參數(shù)Rs選擇實(shí)驗(yàn)結(jié)果Fig.5 Results of Rs selection

    以CoNLL 2003數(shù)據(jù)集的Rs參數(shù)選取為例,以1為步長(zhǎng),設(shè)置Rs取值區(qū)間為[0,30],繪制不同Rs對(duì)應(yīng)F1值分布圖,如圖5所示.

    根據(jù)圖5可知,當(dāng)Rs為15時(shí),合成的數(shù)據(jù)集進(jìn)行命名實(shí)體識(shí)別F1值最高,因此選定Rs=15.由此思路選擇其他參數(shù),最終參數(shù)取值如表2所示.

    表2 數(shù)據(jù)集參數(shù)表

    3.4 實(shí)驗(yàn)測(cè)試結(jié)果

    實(shí)驗(yàn)使用Bi-LSTM-CRF模型作為基準(zhǔn)模型.為了驗(yàn)證CBM-GA方法的有效性和優(yōu)異性,分別設(shè)計(jì)了2組對(duì)比實(shí)驗(yàn).且為了避免偶然因素影響,實(shí)驗(yàn)結(jié)果均為5次重復(fù)實(shí)驗(yàn)結(jié)果.具體如下.

    為了驗(yàn)證CBM-GA方法的有效性,設(shè)計(jì)基準(zhǔn)模型和CBM-GA方法對(duì)比實(shí)驗(yàn).

    1) 基準(zhǔn)實(shí)驗(yàn):使用基準(zhǔn)模型分別對(duì)CoNLL2003、JNLPBA建模;

    2) CBM-GA方法實(shí)驗(yàn):使用基準(zhǔn)模型分別對(duì)CBM-GA方法作用后的兩數(shù)據(jù)集建模;

    針對(duì)CoNLL 2003數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果如表3所示,CBM-GA方法相比基準(zhǔn)模型在保持精確率幾乎不變的情況下,召回率提升3.26%,F(xiàn)1值提高1.70%;針對(duì)JNLPBA數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果如表4所示,CBM-GA方法雖然造成精確率的小幅下降,但其召回率提高了2.44%,最終F1值增加了1.03%.

    為了驗(yàn)證CBM-GA方法表現(xiàn)優(yōu)于已有平衡欠采樣、隨機(jī)過(guò)采樣方法,設(shè)計(jì)以下對(duì)比實(shí)驗(yàn).

    1) 隨機(jī)過(guò)采樣方法實(shí)驗(yàn):使用隨機(jī)過(guò)采樣方法擴(kuò)充原始CoNLL 2003、JNLPBA,獲取與CBM-GA方法相同規(guī)模的擴(kuò)充數(shù)據(jù)集,并使用基準(zhǔn)模型其建模;

    2) 平衡欠采樣方法實(shí)驗(yàn).使用平衡欠采樣方法處理原始兩數(shù)據(jù)集獲得新樣本集合,并隨機(jī)采樣新樣本集合擴(kuò)充原始數(shù)據(jù)集以獲取與CBM-GA方法相同規(guī)模的擴(kuò)充數(shù)據(jù)集,使用基準(zhǔn)模型其建模;

    優(yōu)異性驗(yàn)證實(shí)驗(yàn)結(jié)果如表5和表6所示,針對(duì)CoNLL 2003數(shù)據(jù)集,CBM-GA方法召回率比平衡欠采樣高2.98%,比隨機(jī)過(guò)采樣方法高3.29%,F(xiàn)1值均超出1.76%以上;針對(duì)JNLPBA,CBM-GA方法召回率比平衡欠采樣高1.78%,比隨機(jī)過(guò)采樣方法高2.25%,F(xiàn)1值均超出0.97%以上.

    綜上實(shí)驗(yàn)分析驗(yàn)證了CBM-GA方法可以有效提高模型召回率,改善命名實(shí)體識(shí)別效果,相比已有方法表現(xiàn)更優(yōu)異.

    表3 CoNLL 2003數(shù)據(jù)集上有效性驗(yàn)證結(jié)果

    表4 JNLPBA數(shù)據(jù)集上有效性驗(yàn)證結(jié)果

    表5 CoNLL 2003數(shù)據(jù)集上優(yōu)異性驗(yàn)證結(jié)果

    表6 JNLPBA數(shù)據(jù)集上優(yōu)異性驗(yàn)證結(jié)果

    3.5 結(jié)果分析

    進(jìn)一步分析實(shí)驗(yàn)結(jié)果,以CoNLL 2003數(shù)據(jù)集為例,繪制基準(zhǔn)、CBM-GA實(shí)驗(yàn)接收者操作特征曲線(receiver operating characteristic curve,ROC)[21]如圖6所示.

    圖6 ROC曲線Fig.6 ROC of baseline and CBM-GA

    分別計(jì)算兩條ROC曲線對(duì)應(yīng)AUC[22]值如表7所示.

    表7 AUC值

    圖6和表7更一步證明CBM-GA模型通過(guò)緩解實(shí)體類和非實(shí)體類單詞個(gè)數(shù)的不平衡問(wèn)題,有效地改善了命名實(shí)體識(shí)別的效果.

    從時(shí)間代價(jià)分析,CBM-GA算法增廣CoNLL 2003數(shù)據(jù)集需2.42 min,增廣JNLPBA數(shù)據(jù)集訓(xùn)練需2.4 min,相比Bi-LSTM-CRF模型訓(xùn)練每epoch需32 s,50個(gè)epoch需要26.7 min,CBM-GA算法的運(yùn)行成本是可以接受的.數(shù)據(jù)類別標(biāo)記失衡是普遍存在于開(kāi)源數(shù)據(jù)集的問(wèn)題,但目前關(guān)于命名實(shí)體識(shí)別任務(wù)上的數(shù)據(jù)標(biāo)記失衡研究較少.本文針對(duì)這一現(xiàn)狀創(chuàng)新性地改造遺傳算法,提出了保持文本實(shí)體短語(yǔ)結(jié)構(gòu)的CBM-GA方法.實(shí)驗(yàn)結(jié)果表明,CBM-GA方法在文本數(shù)據(jù)預(yù)處理階段有效緩解數(shù)據(jù)集類別標(biāo)記失衡問(wèn)題,改善模型召回率并進(jìn)一步提高命名實(shí)體識(shí)別性能.該方法可以應(yīng)用在其它序列標(biāo)注任務(wù)上如分詞、機(jī)器翻譯等中.

    猜你喜歡
    父代個(gè)數(shù)類別
    農(nóng)村家庭父代在家庭現(xiàn)代性轉(zhuǎn)型中的作用研究
    中國(guó)高等教育的代際傳遞及其內(nèi)在機(jī)制:“學(xué)二代”現(xiàn)象存在嗎?
    延遲退休決策對(duì)居民家庭代際收入流動(dòng)性的影響分析
    ——基于人力資本傳遞機(jī)制
    怎樣數(shù)出小正方體的個(gè)數(shù)
    等腰三角形個(gè)數(shù)探索
    怎樣數(shù)出小木塊的個(gè)數(shù)
    怎樣數(shù)出小正方體的個(gè)數(shù)
    男孩偏好激勵(lì)父代掙取更多收入了嗎?
    ——基于子女?dāng)?shù)量基本確定的情形
    服務(wù)類別
    論類別股東會(huì)
    商事法論集(2014年1期)2014-06-27 01:20:42
    亚洲成人av在线免费| videos熟女内射| 观看免费一级毛片| 黄色日韩在线| 久久精品国产自在天天线| 精品久久久久久久久av| 男人和女人高潮做爰伦理| 久久精品国产亚洲av天美| kizo精华| 日产精品乱码卡一卡2卡三| 国产男女内射视频| 欧美xxxx性猛交bbbb| 极品少妇高潮喷水抽搐| 国产精品久久久久久久电影| 亚洲自偷自拍三级| 亚洲国产色片| 亚洲av成人精品一区久久| 大陆偷拍与自拍| 成人国产麻豆网| 日日爽夜夜爽网站| 高清毛片免费看| 欧美日本中文国产一区发布| 最黄视频免费看| 狂野欧美激情性xxxx在线观看| 亚洲精品日本国产第一区| 一个人免费看片子| 精品国产一区二区三区久久久樱花| 最新中文字幕久久久久| 精品卡一卡二卡四卡免费| 婷婷色av中文字幕| 岛国毛片在线播放| 极品人妻少妇av视频| 男男h啪啪无遮挡| 国产精品久久久久久久久免| 看十八女毛片水多多多| 国产成人免费观看mmmm| 精品卡一卡二卡四卡免费| 亚洲图色成人| 日本免费在线观看一区| 啦啦啦在线观看免费高清www| 午夜福利影视在线免费观看| 精品久久久噜噜| 免费观看在线日韩| 色哟哟·www| 在线 av 中文字幕| 国产成人午夜福利电影在线观看| 国产一区二区三区av在线| 精品久久久久久久久av| 国产 精品1| 亚洲av成人精品一区久久| 亚洲第一区二区三区不卡| 七月丁香在线播放| 在现免费观看毛片| 蜜桃在线观看..| 亚洲精品视频女| 黑人猛操日本美女一级片| 乱系列少妇在线播放| 男女无遮挡免费网站观看| 男女免费视频国产| av一本久久久久| 最近2019中文字幕mv第一页| 高清视频免费观看一区二区| 国产精品无大码| 人人澡人人妻人| 国产精品久久久久久精品古装| 亚洲无线观看免费| 少妇被粗大猛烈的视频| 免费观看无遮挡的男女| 亚洲精品国产av蜜桃| 少妇高潮的动态图| 女人精品久久久久毛片| 久久久久精品性色| 亚洲精华国产精华液的使用体验| 五月伊人婷婷丁香| 亚洲精品国产av成人精品| 一级爰片在线观看| 亚洲精品乱码久久久久久按摩| 多毛熟女@视频| 日韩 亚洲 欧美在线| 在线观看免费视频网站a站| 欧美精品一区二区大全| 多毛熟女@视频| 亚洲精品第二区| 嫩草影院新地址| 一级黄片播放器| 亚洲精华国产精华液的使用体验| 国产欧美日韩综合在线一区二区 | 欧美 日韩 精品 国产| 内射极品少妇av片p| 国产 一区精品| 亚洲,一卡二卡三卡| 午夜精品国产一区二区电影| 中文字幕人妻丝袜制服| 成人特级av手机在线观看| 99热6这里只有精品| 色5月婷婷丁香| 如日韩欧美国产精品一区二区三区 | 久久这里有精品视频免费| 日韩熟女老妇一区二区性免费视频| 免费大片黄手机在线观看| 精品国产露脸久久av麻豆| 一级,二级,三级黄色视频| 一区二区三区精品91| 草草在线视频免费看| 日韩中文字幕视频在线看片| 伦理电影免费视频| 国产视频内射| 夫妻性生交免费视频一级片| 国产男女内射视频| 久久精品久久久久久久性| 亚洲性久久影院| 亚洲熟女精品中文字幕| 婷婷色综合www| 日韩电影二区| 国产真实伦视频高清在线观看| 亚洲色图综合在线观看| 亚洲国产毛片av蜜桃av| 欧美精品一区二区大全| 国产综合精华液| 狠狠精品人妻久久久久久综合| av天堂中文字幕网| 夫妻午夜视频| 欧美日韩亚洲高清精品| 成人亚洲欧美一区二区av| 久久久久视频综合| 久久99热6这里只有精品| 精品人妻熟女毛片av久久网站| 日韩伦理黄色片| 亚洲国产最新在线播放| 午夜视频国产福利| 美女主播在线视频| 国产精品熟女久久久久浪| 少妇的逼水好多| 国产 一区精品| 嫩草影院入口| 80岁老熟妇乱子伦牲交| 视频区图区小说| 午夜福利影视在线免费观看| 亚洲国产精品999| 91aial.com中文字幕在线观看| 日日爽夜夜爽网站| 秋霞伦理黄片| 精品国产乱码久久久久久小说| 成人无遮挡网站| 国产色婷婷99| 亚洲精品久久久久久婷婷小说| 午夜免费鲁丝| 亚洲三级黄色毛片| 91aial.com中文字幕在线观看| 六月丁香七月| 久久毛片免费看一区二区三区| 男人舔奶头视频| 欧美国产精品一级二级三级 | 97超碰精品成人国产| 精品国产一区二区三区久久久樱花| 成人毛片a级毛片在线播放| 亚洲熟女精品中文字幕| 午夜激情久久久久久久| 亚洲国产最新在线播放| 99热这里只有是精品在线观看| 亚洲av成人精品一区久久| 亚洲欧美日韩东京热| 在线看a的网站| 女人精品久久久久毛片| 一级毛片久久久久久久久女| 国产在视频线精品| 国产无遮挡羞羞视频在线观看| 日韩视频在线欧美| 插逼视频在线观看| 综合色丁香网| 成年女人在线观看亚洲视频| 国产精品秋霞免费鲁丝片| 久久久久网色| 精品酒店卫生间| 一本—道久久a久久精品蜜桃钙片| 久久久久国产精品人妻一区二区| 黑丝袜美女国产一区| √禁漫天堂资源中文www| 婷婷色av中文字幕| 欧美精品人与动牲交sv欧美| 99久久综合免费| 日韩电影二区| 精品一区二区免费观看| 日本黄色片子视频| 日韩欧美 国产精品| 免费观看性生交大片5| videos熟女内射| 这个男人来自地球电影免费观看 | 亚洲精品中文字幕在线视频 | 国产av国产精品国产| 久久久a久久爽久久v久久| 国产精品国产三级专区第一集| 午夜福利视频精品| 夜夜爽夜夜爽视频| 免费播放大片免费观看视频在线观看| 曰老女人黄片| 精品国产露脸久久av麻豆| 国产视频首页在线观看| 九九爱精品视频在线观看| 国产免费一级a男人的天堂| 久久99热这里只频精品6学生| 极品少妇高潮喷水抽搐| 五月伊人婷婷丁香| 国产日韩欧美视频二区| 国产精品一区二区性色av| 人人澡人人妻人| 日本91视频免费播放| 日日啪夜夜撸| 99久久综合免费| 午夜免费男女啪啪视频观看| 亚洲精品色激情综合| 欧美丝袜亚洲另类| 99视频精品全部免费 在线| 国产高清国产精品国产三级| av在线老鸭窝| 一区二区av电影网| 国产视频内射| 天天操日日干夜夜撸| 久久久久久久精品精品| 男男h啪啪无遮挡| 大又大粗又爽又黄少妇毛片口| 国产精品福利在线免费观看| 国语对白做爰xxxⅹ性视频网站| 国产伦理片在线播放av一区| 国产国拍精品亚洲av在线观看| 三上悠亚av全集在线观看 | 丝袜在线中文字幕| 99视频精品全部免费 在线| 99九九线精品视频在线观看视频| 久久婷婷青草| 久久久久视频综合| 精品亚洲乱码少妇综合久久| 亚洲精品日韩av片在线观看| 麻豆乱淫一区二区| 久久女婷五月综合色啪小说| 蜜桃久久精品国产亚洲av| 国产精品成人在线| 最近中文字幕2019免费版| 秋霞在线观看毛片| 美女cb高潮喷水在线观看| 亚洲,一卡二卡三卡| 美女xxoo啪啪120秒动态图| 亚洲国产精品一区三区| 我要看日韩黄色一级片| 最新中文字幕久久久久| 肉色欧美久久久久久久蜜桃| 自线自在国产av| 亚洲高清免费不卡视频| 亚洲欧洲国产日韩| 七月丁香在线播放| 精华霜和精华液先用哪个| 两个人的视频大全免费| av黄色大香蕉| 女性被躁到高潮视频| 日日摸夜夜添夜夜爱| 中文欧美无线码| 岛国毛片在线播放| 高清在线视频一区二区三区| 久久久久久久久久久丰满| 久久国内精品自在自线图片| 久久人妻熟女aⅴ| 狂野欧美激情性xxxx在线观看| 国产av一区二区精品久久| 简卡轻食公司| 天堂8中文在线网| 噜噜噜噜噜久久久久久91| 又大又黄又爽视频免费| 日本色播在线视频| 永久免费av网站大全| 久久精品国产亚洲av涩爱| 男女无遮挡免费网站观看| 成人二区视频| 啦啦啦中文免费视频观看日本| 在线观看国产h片| 欧美性感艳星| 国产黄片视频在线免费观看| 噜噜噜噜噜久久久久久91| 丰满人妻一区二区三区视频av| 国产永久视频网站| 国产成人精品福利久久| 亚洲精品国产av蜜桃| 亚洲av不卡在线观看| 99久久人妻综合| 国产精品99久久久久久久久| 国产精品国产av在线观看| 99久久人妻综合| 99热全是精品| 下体分泌物呈黄色| 日韩免费高清中文字幕av| 久久韩国三级中文字幕| 日韩三级伦理在线观看| 亚洲精品自拍成人| 男的添女的下面高潮视频| 成人毛片a级毛片在线播放| 国产精品偷伦视频观看了| 美女国产视频在线观看| 国产免费福利视频在线观看| 久久这里有精品视频免费| av在线app专区| 日本91视频免费播放| 一级毛片aaaaaa免费看小| 在线观看一区二区三区激情| 日本欧美视频一区| av在线老鸭窝| 久久 成人 亚洲| 国产精品成人在线| 久久av网站| 亚洲丝袜综合中文字幕| 成人综合一区亚洲| 免费人成在线观看视频色| 精品亚洲成a人片在线观看| 国产日韩一区二区三区精品不卡 | 欧美日韩一区二区视频在线观看视频在线| 亚洲精品乱码久久久v下载方式| 国精品久久久久久国模美| 永久免费av网站大全| 蜜桃久久精品国产亚洲av| 免费av中文字幕在线| 这个男人来自地球电影免费观看 | 制服丝袜香蕉在线| 超碰97精品在线观看| 99久久中文字幕三级久久日本| 亚洲精品一二三| 国产在视频线精品| 亚洲熟女精品中文字幕| 国产在线男女| 秋霞在线观看毛片| 亚洲精品国产av蜜桃| 亚洲三级黄色毛片| 99国产精品免费福利视频| 99精国产麻豆久久婷婷| 日本与韩国留学比较| 免费观看av网站的网址| 国产精品久久久久久精品电影小说| 亚洲欧美精品自产自拍| 久久久久久久久久人人人人人人| 天天躁夜夜躁狠狠久久av| 蜜臀久久99精品久久宅男| 欧美精品人与动牲交sv欧美| 午夜日本视频在线| 国产精品.久久久| 自线自在国产av| 九草在线视频观看| 欧美精品人与动牲交sv欧美| 久久精品国产自在天天线| 亚洲综合色惰| xxx大片免费视频| 在线观看三级黄色| 夜夜看夜夜爽夜夜摸| 成年av动漫网址| 免费黄色在线免费观看| 涩涩av久久男人的天堂| 18禁动态无遮挡网站| 啦啦啦视频在线资源免费观看| 国国产精品蜜臀av免费| 一级a做视频免费观看| 免费av中文字幕在线| 亚洲欧美日韩卡通动漫| 国产精品国产三级国产av玫瑰| 大话2 男鬼变身卡| 国产成人freesex在线| 又黄又爽又刺激的免费视频.| 青春草国产在线视频| 91久久精品国产一区二区成人| 丰满乱子伦码专区| 亚洲国产精品一区三区| 婷婷色综合www| 中文资源天堂在线| 精品久久久久久电影网| 一本久久精品| 国产成人精品一,二区| 国产免费一级a男人的天堂| 2018国产大陆天天弄谢| 丰满饥渴人妻一区二区三| 一个人看视频在线观看www免费| av免费观看日本| 欧美日韩国产mv在线观看视频| 男人添女人高潮全过程视频| 成人黄色视频免费在线看| 亚洲国产精品成人久久小说| 伦精品一区二区三区| 亚洲一级一片aⅴ在线观看| 99热6这里只有精品| 国产熟女欧美一区二区| 偷拍熟女少妇极品色| 国产欧美日韩一区二区三区在线 | 中文字幕人妻熟人妻熟丝袜美| 亚洲电影在线观看av| 噜噜噜噜噜久久久久久91| 在线观看人妻少妇| 国产精品偷伦视频观看了| 一区二区三区乱码不卡18| 国产精品国产av在线观看| 人人妻人人澡人人看| 成人无遮挡网站| 在线观看人妻少妇| 我的老师免费观看完整版| 97在线视频观看| 色视频www国产| 大香蕉久久网| 我的女老师完整版在线观看| 国内精品宾馆在线| 日韩一区二区视频免费看| 国产精品国产三级专区第一集| 偷拍熟女少妇极品色| 91成人精品电影| av在线观看视频网站免费| 大香蕉97超碰在线| 国产欧美亚洲国产| 一级毛片 在线播放| 亚洲国产色片| 国产精品人妻久久久久久| 国产精品福利在线免费观看| 嫩草影院新地址| 亚洲精品乱码久久久v下载方式| 精品国产一区二区三区久久久樱花| 日韩中文字幕视频在线看片| 亚洲欧美中文字幕日韩二区| 国产av一区二区精品久久| 自拍偷自拍亚洲精品老妇| 免费观看性生交大片5| 伊人久久国产一区二区| 男女免费视频国产| 日韩强制内射视频| 极品教师在线视频| 99精国产麻豆久久婷婷| 夫妻午夜视频| 女的被弄到高潮叫床怎么办| 国产免费福利视频在线观看| 精品少妇久久久久久888优播| 国产日韩欧美在线精品| 免费观看a级毛片全部| 女性被躁到高潮视频| 女人久久www免费人成看片| 久久久久久久久大av| 人妻少妇偷人精品九色| 国产伦理片在线播放av一区| 99热网站在线观看| 麻豆成人午夜福利视频| 久久国产精品大桥未久av | 中文字幕制服av| 欧美精品一区二区大全| 黄色毛片三级朝国网站 | 成人国产麻豆网| 日韩一区二区三区影片| 大话2 男鬼变身卡| av卡一久久| 免费看光身美女| 国产精品欧美亚洲77777| 久久精品国产亚洲av天美| 在线观看免费日韩欧美大片 | 亚洲色图综合在线观看| 十八禁高潮呻吟视频 | 国产免费视频播放在线视频| 精品一品国产午夜福利视频| 日韩中字成人| 国产美女午夜福利| 人体艺术视频欧美日本| 午夜免费鲁丝| 久久久欧美国产精品| 国产男人的电影天堂91| 国产精品99久久99久久久不卡 | 免费大片18禁| 少妇精品久久久久久久| av播播在线观看一区| 亚洲精品日本国产第一区| h日本视频在线播放| 天堂8中文在线网| 桃花免费在线播放| 超碰97精品在线观看| 久久免费观看电影| 高清欧美精品videossex| 日本黄色日本黄色录像| 一边亲一边摸免费视频| 黑人巨大精品欧美一区二区蜜桃 | 久久99一区二区三区| 老司机影院毛片| 嫩草影院新地址| 日本欧美视频一区| 日韩中字成人| 亚洲国产精品成人久久小说| 十八禁网站网址无遮挡 | 婷婷色av中文字幕| 永久网站在线| 黄色怎么调成土黄色| 国产精品麻豆人妻色哟哟久久| 只有这里有精品99| 高清欧美精品videossex| 久久久久久久久久成人| 日韩大片免费观看网站| 婷婷色av中文字幕| 三级国产精品欧美在线观看| 人人澡人人妻人| 亚洲三级黄色毛片| 国内揄拍国产精品人妻在线| 久久精品夜色国产| 成人亚洲欧美一区二区av| 噜噜噜噜噜久久久久久91| 亚洲精品一区蜜桃| 久久免费观看电影| 欧美日韩国产mv在线观看视频| 欧美老熟妇乱子伦牲交| 一级毛片 在线播放| 婷婷色av中文字幕| 成年美女黄网站色视频大全免费 | 男女边吃奶边做爰视频| 国产在线一区二区三区精| 亚洲精品,欧美精品| 99久久精品国产国产毛片| 久久精品国产亚洲av涩爱| 久久久久人妻精品一区果冻| 国产成人精品一,二区| 日韩不卡一区二区三区视频在线| 亚洲精品中文字幕在线视频 | 我要看日韩黄色一级片| av视频免费观看在线观看| 亚洲国产欧美在线一区| 男人添女人高潮全过程视频| 又粗又硬又长又爽又黄的视频| 男人添女人高潮全过程视频| 日韩av免费高清视频| 国产av一区二区精品久久| 18+在线观看网站| 亚洲综合色惰| 欧美一级a爱片免费观看看| 又大又黄又爽视频免费| 国产一级毛片在线| 日本av免费视频播放| 亚洲不卡免费看| 精品午夜福利在线看| 蜜桃在线观看..| 日日爽夜夜爽网站| 国产白丝娇喘喷水9色精品| 大片免费播放器 马上看| 99九九在线精品视频 | 日韩大片免费观看网站| 高清在线视频一区二区三区| av福利片在线| 晚上一个人看的免费电影| 亚洲一区二区三区欧美精品| 久久久久网色| 成年美女黄网站色视频大全免费 | 国产日韩一区二区三区精品不卡 | 91精品国产九色| 深夜a级毛片| 国产精品伦人一区二区| 久久国产乱子免费精品| 美女视频免费永久观看网站| 国产熟女午夜一区二区三区 | 免费在线观看成人毛片| 天天操日日干夜夜撸| 亚洲va在线va天堂va国产| 插逼视频在线观看| 中文字幕精品免费在线观看视频 | 下体分泌物呈黄色| 亚洲第一区二区三区不卡| 久久午夜福利片| 国产白丝娇喘喷水9色精品| 欧美日韩视频高清一区二区三区二| 少妇的逼水好多| 亚洲欧洲日产国产| 午夜影院在线不卡| av免费在线看不卡| 又黄又爽又刺激的免费视频.| 免费久久久久久久精品成人欧美视频 | 成人综合一区亚洲| 免费不卡的大黄色大毛片视频在线观看| 中文字幕人妻熟人妻熟丝袜美| 亚洲国产精品专区欧美| 91成人精品电影| 亚洲精品乱久久久久久| 成年女人在线观看亚洲视频| 大片电影免费在线观看免费| 日韩一区二区视频免费看| a级毛片免费高清观看在线播放| 80岁老熟妇乱子伦牲交| 丰满乱子伦码专区| 少妇被粗大的猛进出69影院 | 热99国产精品久久久久久7| 亚洲欧美精品自产自拍| 黄色视频在线播放观看不卡| av在线播放精品| 中文资源天堂在线| 男女国产视频网站| 午夜福利,免费看| 国产高清有码在线观看视频| av有码第一页| 一区二区三区乱码不卡18| av.在线天堂| av女优亚洲男人天堂| 欧美精品一区二区大全| 丝袜脚勾引网站| 男女啪啪激烈高潮av片| 99热6这里只有精品| 久久国产乱子免费精品| 99热这里只有精品一区| 国产一区二区在线观看av| 又爽又黄a免费视频| 桃花免费在线播放| 成人美女网站在线观看视频| 啦啦啦在线观看免费高清www| 国产色婷婷99| 男女国产视频网站| 亚洲久久久国产精品| 亚洲成人手机| 三级国产精品欧美在线观看| av卡一久久| 亚洲欧美一区二区三区黑人 | 最近2019中文字幕mv第一页| 亚洲av欧美aⅴ国产| 狂野欧美激情性bbbbbb| 国产午夜精品久久久久久一区二区三区| 国产无遮挡羞羞视频在线观看| 久久国产乱子免费精品| 亚洲av不卡在线观看|