• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于Senna-BiLSTM-CRF的測(cè)井實(shí)體抽取方法研究

    2022-01-09 06:26:16尚福華曹茂俊
    關(guān)鍵詞:語料測(cè)井實(shí)體

    尚福華,金 泉,曹茂俊

    (東北石油大學(xué) 計(jì)算機(jī)與信息技術(shù)學(xué)院,黑龍江 大慶 163318)

    0 引 言

    應(yīng)用地球物理方法主要包括重、磁、電、震、測(cè)井,其中測(cè)井主要是通過利用巖層的聲學(xué)、異電、電化學(xué)以及放射性等地球物理特性,作為測(cè)量地球物理參數(shù)的方法。測(cè)井?dāng)?shù)據(jù)處理與綜合解釋,則是指通過之前設(shè)定的地質(zhì)任務(wù),使用計(jì)算機(jī)技術(shù)來完成相關(guān)的測(cè)井資料自動(dòng)處理操作,并結(jié)合錄井、地質(zhì)和開發(fā)相關(guān)的資料進(jìn)行綜合處理分析解釋,以解決有用礦藏、地層劃分和油氣儲(chǔ)集層的評(píng)價(jià)及其勘探開發(fā)中其他相關(guān)的地質(zhì)與工程技術(shù)問題[1]?,F(xiàn)有的機(jī)器學(xué)習(xí)算法抽取模型大多是針對(duì)句法和詞法等淺層特征,采用這些方式通常存在需要復(fù)雜的人工定義特征等問題。深度學(xué)習(xí)模型可以通過在簡(jiǎn)單的網(wǎng)絡(luò)結(jié)構(gòu)基礎(chǔ)上實(shí)現(xiàn)復(fù)雜函數(shù)的逼近,擁有從大規(guī)模數(shù)據(jù)集中學(xué)習(xí)數(shù)據(jù)集本質(zhì)特征的能力,從而能夠大大減少工作量,減少人工定義特征的重復(fù)性工作。隨著數(shù)據(jù)量的迅速累積,大數(shù)據(jù)、深度學(xué)習(xí)等技術(shù)快速發(fā)展,知識(shí)圖譜與這些先進(jìn)的技術(shù)相結(jié)合,正在成為未來人工智能發(fā)展的熱門方向之一[2]。

    知識(shí)抽取是構(gòu)建知識(shí)圖譜極其重要的步驟。知識(shí)抽取包含如下基本任務(wù):命名實(shí)體抽取、屬性抽取、關(guān)系抽取以及事件抽取等,主要任務(wù)是從一些非結(jié)構(gòu)化文本中抽取出需要的、有效的結(jié)構(gòu)化信息。知識(shí)抽取也是自然語言處理領(lǐng)域中的一個(gè)重要領(lǐng)域,而自然語言處理領(lǐng)域與深度學(xué)習(xí)是密不可分的,知識(shí)抽取也與深度學(xué)習(xí)有著密不可分的關(guān)系。命名實(shí)體抽取是知識(shí)抽取過程中的首要內(nèi)容,也是構(gòu)建知識(shí)圖譜必不可少的基礎(chǔ),其中抽取出來的實(shí)體的好壞將很大程度影響最終構(gòu)成的知識(shí)圖譜的質(zhì)量。研究測(cè)井實(shí)體抽取問題對(duì)于研究如何構(gòu)建測(cè)井領(lǐng)域知識(shí)圖譜有著非比尋常的意義。Zhao Yahui等人[3]構(gòu)建了一種基于知識(shí)庫的電影命名實(shí)體類型發(fā)現(xiàn)關(guān)聯(lián)系統(tǒng)。Yang Tao等人[4]研究了某些特定領(lǐng)域?qū)嶓w識(shí)別與實(shí)體連接的評(píng)估任務(wù)。Guo Shu等人[5]研究實(shí)現(xiàn)了一種在競(jìng)賽中通過增強(qiáng)規(guī)則來實(shí)現(xiàn)關(guān)系學(xué)習(xí)的方法。Yilahun Hankiz等人[6]研究實(shí)現(xiàn)了一種將維吾爾語領(lǐng)域本體和漢語領(lǐng)域本體結(jié)合的混合構(gòu)建方法。Zhao Jiapeng等人[7]研究實(shí)現(xiàn)了一種在句法樹的基礎(chǔ)上進(jìn)行個(gè)人關(guān)系抽取的方法。李明浩等人[8]研究實(shí)現(xiàn)了一種基于LSTM-CRF模型的中醫(yī)醫(yī)案癥狀術(shù)語識(shí)別方法。張心怡等人[9]研究實(shí)現(xiàn)了一種面向煤礦的實(shí)體識(shí)別與關(guān)系抽取模型。張海楠等人[10]研究實(shí)現(xiàn)了一種基于深度學(xué)習(xí)的中文命名實(shí)體識(shí)別方法。

    在測(cè)井解釋領(lǐng)域,尚福華等人研究了面向測(cè)井處理解釋領(lǐng)域的本體構(gòu)建方法,該文章提出了一種將領(lǐng)域本體與測(cè)井處理解釋的具體應(yīng)用需求相結(jié)合的領(lǐng)域本體構(gòu)建方法,具有非常高的參考價(jià)值[11]。但用本體方法來構(gòu)建領(lǐng)域性知識(shí)圖譜,通常有大量的非結(jié)構(gòu)化數(shù)據(jù)需要處理,用本體構(gòu)建方法很難進(jìn)行處理。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,采用深度學(xué)習(xí)來進(jìn)行實(shí)體抽取,降低了數(shù)據(jù)標(biāo)注的難度,提高了訓(xùn)練效率,并在其他領(lǐng)域取得了很好的效果,表明深度學(xué)習(xí)非常適合對(duì)非結(jié)構(gòu)化文本數(shù)據(jù)進(jìn)行抽取、分析。因此,文中提出一種基于Senna詞向量+BiLSTM+CRF的方法對(duì)測(cè)井非結(jié)構(gòu)文本數(shù)據(jù)中的命名實(shí)體進(jìn)行抽取。

    1 長短期記憶網(wǎng)絡(luò)

    循環(huán)神經(jīng)網(wǎng)絡(luò)( recurrent neural network,RNN)是一種廣泛應(yīng)用于自然語言處理(NLP)、圖像識(shí)別、語言認(rèn)知等相關(guān)的深度學(xué)習(xí)技術(shù)及其他相關(guān)領(lǐng)域的新型人工神經(jīng)網(wǎng)絡(luò),最早提出的時(shí)間要追溯到20世紀(jì)80年代[12]。RNN的主要目的就是識(shí)別大量數(shù)據(jù)運(yùn)行時(shí)的先后次序特性,利用這種模式對(duì)未來各種可能發(fā)生的情形進(jìn)行預(yù)測(cè)。RNN可以處理從初始輸入到終始輸入的每一個(gè)數(shù)據(jù),這與前饋神經(jīng)網(wǎng)絡(luò)相當(dāng)類似。

    從理論上看,RNN能夠在序列的整個(gè)歷史中對(duì)連續(xù)信息進(jìn)行建模,但是在序列長度比較長時(shí),RNN可能會(huì)出現(xiàn)兩種情況,一種是梯度不斷地增長,無限趨近于無窮,這很容易產(chǎn)生梯度爆炸的問題。另一種情況則是前一種情況的反向極端,梯度不斷減小,無限趨近于零,很容易造成梯度消失的問題。針對(duì)上述兩種情況,有學(xué)者曾在20世紀(jì)90年代提出使用長短期記憶網(wǎng)絡(luò)(long-short term memory network,LSTM)來替代循環(huán)神經(jīng)網(wǎng)絡(luò),在經(jīng)過不斷改進(jìn)后被廣泛應(yīng)用,它是目前使用最多的RNN變體之一[13]。LSTM的神經(jīng)元通常由存儲(chǔ)器單元、輸入門、輸出門、忘記門四部分組成。

    圖1 LSTM總體框架

    2 測(cè)井領(lǐng)域?qū)嶓w抽取模型

    2.1 測(cè)井領(lǐng)域命名實(shí)體特征

    通過與測(cè)井領(lǐng)域?qū)<覝贤ń涣骷安殚喆罅繙y(cè)井文獻(xiàn),最終筆者選定以下幾類實(shí)體來做測(cè)井實(shí)體抽取實(shí)驗(yàn)分類標(biāo)準(zhǔn),分別為領(lǐng)域知識(shí)、區(qū)域知識(shí)、通用知識(shí)。通過這三大類別實(shí)體對(duì)樣本數(shù)據(jù)進(jìn)行人工標(biāo)注,文中采用BIO標(biāo)注。測(cè)井命名實(shí)體的抽取問題最終轉(zhuǎn)化為對(duì)已知文本中的三大類標(biāo)記實(shí)體進(jìn)行分類的問題。文中采用Senna詞向量方法對(duì)文本中的測(cè)井實(shí)體進(jìn)行描述,采用BiLSTM-CRF模型對(duì)實(shí)體進(jìn)行分類,實(shí)現(xiàn)測(cè)井命名實(shí)體抽取的方法,如表1所示。

    表1 命名實(shí)體標(biāo)注方法

    2.2 實(shí)體抽取框架

    因?yàn)槭占降臄?shù)據(jù)集,無法直接放入模型中參與訓(xùn)練,所以必須對(duì)語料進(jìn)行一些處理,讓收集到的文本數(shù)據(jù)變成能夠被機(jī)器識(shí)別的形式,才能放入到模型中進(jìn)行訓(xùn)練。首先對(duì)從語料庫中獲取到的語料進(jìn)行一系列預(yù)處理操作,之后進(jìn)行分詞,再對(duì)分詞后的語料文本進(jìn)行詞性標(biāo)注[15],得到詞性標(biāo)注后的語料文本,再將該語料文本轉(zhuǎn)化為Senna詞向量,作為BiLSTM網(wǎng)絡(luò)模型的輸入向量,通過BiLSTM網(wǎng)絡(luò)模型的訓(xùn)練,輸出發(fā)射分?jǐn)?shù),可表示BiLSTM將每個(gè)字符預(yù)測(cè)為某個(gè)標(biāo)簽的概率。再通過CRF層將BiLSTM的Emission_score作為輸入,輸出符合標(biāo)注轉(zhuǎn)移約束條件的、最大可能的預(yù)測(cè)標(biāo)注序列。實(shí)體抽取框架如圖2所示。

    圖2 測(cè)井命名實(shí)體抽取框架

    2.3 Senna詞向量+BiLSTM+CRF

    Senna詞向量+BiLSTM+CRF模型主要由模型輸入層、雙向長短時(shí)記憶網(wǎng)絡(luò)(Bi-LSTM)和條件隨機(jī)場(chǎng)(CRF)層組成。模型輸入的是字符特征,輸出的是每個(gè)字符對(duì)應(yīng)的預(yù)測(cè)標(biāo)簽。

    2.3.1 模型輸入層

    在模型輸入層,文中主要采用詞嵌入機(jī)制對(duì)輸入的非結(jié)構(gòu)化文本數(shù)據(jù)進(jìn)行處理,最開始使用的是字向量,但是效果不太好,所以改用Senna詞向量。Senna模型中不僅提出了使用word embedding作為構(gòu)建方法,同時(shí)還提出可以從神經(jīng)網(wǎng)絡(luò)語言模型的角度去解決自然語言處理領(lǐng)域任務(wù)。Senna中,每個(gè)詞可以從lookup table直接查找到對(duì)應(yīng)的向量,為保證訓(xùn)練效果,當(dāng)句子太長、超過設(shè)定的句子長度時(shí)要截?cái)啵?dāng)句子太短、未達(dá)到設(shè)定的句子長度時(shí)要填充,本項(xiàng)目使用O進(jìn)行填充。

    2.3.2 BiLSTM層

    BiLSTM接收每個(gè)字符的embedding,同時(shí)預(yù)測(cè)每個(gè)字符對(duì)5個(gè)標(biāo)注標(biāo)簽的概率。

    BiLSTM是Bi-directional Long Short-Term Memory的縮寫,包括前向LSTM和后向LSTM[16],常常在自然語言處理、深度學(xué)習(xí)領(lǐng)域相關(guān)任務(wù)中用來建模上下文信息。

    將詞的表示轉(zhuǎn)為句子的表示,可以采用迭代相加的方法,即將所有詞的表示相加在一起求和,也可以采用取平均值的方式,但是采用這些方法存在一個(gè)很大的問題,即忽視掉了詞語在句子中的前后位置,從而影響對(duì)整個(gè)句子意思的理解。比如句子“我并不認(rèn)為她有多么優(yōu)秀”?!安弧弊质菍?duì)后面詞語“優(yōu)秀”的否定修飾,即該句子的情感色彩是悲觀的,整個(gè)句子表達(dá)的意思是否定的,這與原來句子想要表達(dá)的意思截然不同,而使用LSTM模型則可以避免這種情況,因?yàn)長STM模型可以更好地捕捉到較長一段距離詞語之間的依賴關(guān)系,LSTM在學(xué)習(xí)訓(xùn)練的過程中能夠?qū)W到需要記憶哪些信息和需要遺忘掉哪些信息。

    但是使用LSTM對(duì)句子進(jìn)行建模的過程中還存在著一個(gè)比較嚴(yán)重的問題:LSTM是單向的,無法編碼當(dāng)前位置往后的信息,也就是只能學(xué)習(xí)到上文的信息,而學(xué)習(xí)不到下文的信息。比如,“這個(gè)賓館亂的不行”,這個(gè)句子中的“不行”是對(duì)“亂”這個(gè)形容詞的一種修飾,通過LSTM是獲取不到這個(gè)消息理解的,LSTM只能獲得單向的消息理解,要么是從前往后,要么是從后往前,而通過BiLSTM則可以更好地捕捉到雙向的語義依賴?yán)斫狻?/p>

    前向的LSTM與后向的LSTM結(jié)合成BiLSTM。比如,對(duì)“測(cè)井是記錄鉆入地幔的過程”這句話進(jìn)行編碼:

    前向的LSTML依次輸入“測(cè)井”,“是”,“記錄”,“鉆入地?!保暗摹?,“過程”,得到六個(gè)向量{hL0,hL1,hL2,hL3,hL4,hL5}。后向的LSTMR依次輸入“過程”,“的”,“鉆入地?!保坝涗洝?,“是”,“測(cè)井”,得到六個(gè)向量{hR0,hR1,hR2,hR3,hR4,hR5}。最后將前向和后向的隱向量進(jìn)行拼接得到{[hL0,hR5],[hL1,hR4],[hL2,hR3],[hL3,hR2],[hL4,hR1],[hL5,hR0]},即{h0,h1,h2,h3,h4,h5}。

    在BiLSTM-CRF中,一般使用一層的雙向LSTM就完全足夠了。因此,BiLSTM對(duì)輸入embeddings的特征提取過程如圖3所示。

    圖3 BiLSTM對(duì)embeddings的特征提取過程

    開頭就提到,BiLSTM接收每個(gè)字符的embedding,同時(shí)預(yù)測(cè)每個(gè)字符對(duì)5個(gè)標(biāo)注標(biāo)簽的概率。但是,應(yīng)該知道上述BiLSTM對(duì)輸入embeddings的特征提取得到的拼接向量維度大小為num_directions*hidden_size。為了將輸入表示為每個(gè)字符與其對(duì)應(yīng)各個(gè)類別的分?jǐn)?shù),則需要在BiLSTM層加入一個(gè)全連接層,通過softmax將向量映射為一個(gè)5維的分布概率,如圖4所示。

    這一步,似乎已經(jīng)得到了最終結(jié)果,即通過BiLSTM已經(jīng)找到每個(gè)單詞對(duì)應(yīng)的最大標(biāo)簽類別,但實(shí)際上,通過直接選擇該步驟最大概率的標(biāo)簽類別得到的結(jié)果并不理想,最后的標(biāo)簽序列和想要的有不少出入。原因如下,雖然LSTM能夠通過前向加后向的設(shè)置學(xué)習(xí)到觀測(cè)序列之間的依賴,但softmax層的輸出是相互獨(dú)立的,輸出與其他層輸出并沒有影響,只是在每一步單純地挑選一個(gè)最大概率值的label輸出,這樣的模型顯然無法學(xué)習(xí)到輸出的標(biāo)注之間的轉(zhuǎn)移依賴關(guān)系(標(biāo)簽的概率轉(zhuǎn)移矩陣)以及序列標(biāo)注的約束條件,比如句子的開頭應(yīng)該是“B”或者“O”,絕不能是“I”。為此,非常有必要引入CRF層學(xué)習(xí)序列標(biāo)注的約束條件,通過學(xué)習(xí)轉(zhuǎn)移特征考慮輸出label之間的順序性,確保預(yù)測(cè)結(jié)果的有效性。

    2.3.3 CRF層

    CRF是一個(gè)序列化標(biāo)注算法,接收一個(gè)輸入序列如X=(x1,x2,…,xn)并且輸出目標(biāo)序列Y=(y1,y2,…,yn),也能被看作是一種seq2seq模型。

    NER問題就是條件隨機(jī)場(chǎng)問題,即給定自然語言序列X,用最大概率的標(biāo)注序列Y用來表示NER標(biāo)注結(jié)果。設(shè)P(Y|X)為線性鏈條件隨機(jī)場(chǎng),則在隨機(jī)變量X取值為x的條件下,隨機(jī)變量Y取值為y的條件概率具有如下形式:

    (1)

    其中:

    (2)

    式中,sl和tk是該條件概率的特征函數(shù),μl和λk是與其對(duì)應(yīng)的權(quán)值,Z(x)是規(guī)范化因子,求和是對(duì)所有可能的輸出序列進(jìn)行操作;tk是在邊上定義的特征函數(shù),被稱為特征轉(zhuǎn)移,通常依賴于前一個(gè)位置和當(dāng)前位置;sl是在節(jié)點(diǎn)上定義的特征函數(shù),被稱為狀態(tài)特征,通常只依賴于當(dāng)前位置,其中sl和tk二者皆依賴于位置,屬于局部特征函數(shù)。通常局部特征函數(shù)sl和tk可以取的值為1或0;當(dāng)特征函數(shù)滿足特征條件時(shí)則取值為1,否則取值為0。條件隨機(jī)場(chǎng)完全由特征函數(shù)tk,sl和對(duì)應(yīng)的權(quán)值λk,μl確定。

    上述公式中有三個(gè)需要特別注意的部分:tk,sl和Z(x),理解這三個(gè)部分是理解BiLSTM-CRF模型中CRF的關(guān)鍵。

    在該例子中,輸入x分別為c0,c1,c2,c3,c4,理想輸出y為B,I,O,O,B。

    Z(x)稱規(guī)范化因子或配分函數(shù)。在公式(5)中,“Z(x)是規(guī)范化因子,求和是在所有可能的輸出序列上進(jìn)行的”。其本質(zhì)為所有可能的路徑組合,由于輸入序列長度為5,標(biāo)注類型個(gè)數(shù)也為5,因此該圖共有3 125條不同路徑。每條路徑通過exp(*)計(jì)算每條路徑的得分,加和得到Z(x)。

    sl是節(jié)點(diǎn)上的狀態(tài)特征,取決于當(dāng)前節(jié)點(diǎn);tk是邊上的轉(zhuǎn)移特征,取決于當(dāng)前節(jié)點(diǎn)和前一個(gè)節(jié)點(diǎn)。根據(jù)它們的定義,可以很自然地將它們與BiLSTM-CRF中的Emission Score和Transition Score匹配:Emission Score是由BiLSTM生成的、對(duì)當(dāng)前字符標(biāo)注的概率分布;Transition Score是加入CRF約束條件、字符標(biāo)注之間的概率轉(zhuǎn)移矩陣。從這個(gè)角度分析,BiLSTM-CRF本質(zhì)就是一個(gè)CRF模型,只不過用BiLSTM得到狀態(tài)特征值sl,用反向傳播算法更新轉(zhuǎn)移特征值tk。

    在模型訓(xùn)練過程中,模型損失函數(shù)定義如下:

    (3)

    (4)

    其中,Pi,yi和Ayi-1,yi分別表示標(biāo)注序列y中yi的Emission Score和Transition Score,通過查找上圖中BiLSTM的“Emission Score”和“序列標(biāo)注轉(zhuǎn)移矩陣”可以得到每個(gè)字符位置的得分,整個(gè)序列相加得到score(x,y)。

    模型訓(xùn)練過程中最大化對(duì)數(shù)似然函數(shù):

    (5)

    2.3.4 真實(shí)路徑得分

    ∑EmissionScores=P0,START+P1,B+P2,I+P3,O+P4,O+P5,B+P6,END

    (6)

    ∑TransitionScores=PSTART,B+PB,I+PI,O+PO,O+PO,B+PB,END

    (7)

    EmissionScores來自BiLSTM層的輸出,P0,START和P6,END的初始值設(shè)為0;TransitionScores來自CRF層;將真實(shí)路徑中這兩類數(shù)加和,即可得到真實(shí)路徑得分。

    2.3.5 所有路徑得分

    這種方式顯然效率非常低,在該例子中,僅有5個(gè)字符和5個(gè)標(biāo)注序列,就已經(jīng)有了3 125種路徑組合,在實(shí)際工作中,一定會(huì)有更長的序列和更多的標(biāo)注標(biāo)簽,因此提高計(jì)算效率是非常有必要的??梢酝ㄟ^分?jǐn)?shù)累積的方法來提高效率,即先計(jì)算出到達(dá)c0的所有路徑的總得分,然后計(jì)算c0→c1的所有路徑的得分,依此類推,直到計(jì)算出所有路徑的得分,這就是需要的結(jié)果。

    最終Senna詞向量+BiLSTM+CRF的模型如圖5所示。

    圖5 最終詞向量+BiLSTM+CRF模型

    3 實(shí)驗(yàn)與分析

    3.1 實(shí)驗(yàn)描述

    文中使用的語料為測(cè)井勘探院得到的測(cè)井解釋知識(shí)庫、測(cè)井資料處理解釋等相關(guān)測(cè)井領(lǐng)域非結(jié)構(gòu)化知識(shí)。經(jīng)過處理之后的文本數(shù)據(jù)大約為200 K,轉(zhuǎn)化為詞向量后的數(shù)據(jù)大小為17 M。其中12 M作為訓(xùn)練語料,5 M作為測(cè)試語料。

    具體步驟如下:

    (1)通過測(cè)井勘探院得到的測(cè)井解釋知識(shí)庫文檔資料以及收集到的測(cè)井資料處理解釋等測(cè)井領(lǐng)域的非結(jié)構(gòu)化知識(shí),作為語料庫。

    (2)對(duì)語料庫中的數(shù)據(jù)進(jìn)行預(yù)處理,首先利用Jieba分詞工具對(duì)語料庫中的數(shù)據(jù)進(jìn)行分詞處理,對(duì)處理后的樣本數(shù)據(jù)再通過Senna轉(zhuǎn)化為對(duì)應(yīng)的詞向量,最后作為文中所使用的深度神經(jīng)網(wǎng)絡(luò)模型的輸入向量。

    (3)標(biāo)注數(shù)據(jù)。將數(shù)據(jù)集中的實(shí)體類型分為三類:領(lǐng)域名詞、區(qū)域知識(shí)、通用知識(shí),代碼分別為LY、QY、TY。利用BIO標(biāo)注方法進(jìn)行標(biāo)記,具體標(biāo)注方法如表1所示。依據(jù)BIO標(biāo)注方法,“測(cè)井?dāng)?shù)據(jù)是油田勘探開發(fā)必不可少的寶貴資源,是建設(shè)數(shù)字油田的關(guān)鍵信息之一”。這句話應(yīng)該標(biāo)注為“測(cè)/B-LY 井/I-LY 數(shù)/I-LY 據(jù)/I-LY 是/O 油/B-LY 田/I-LY 勘/I-LY 探/I-LY 開/I-LY 發(fā)/I-LY 必/O 不/O 可/O 少/O 的/O 寶/O 貴/O 資/O 源/O,/O 是/O 建/O 設(shè)/O 數(shù)/B-TY 字/I-TY 油/I-TY 田/I-TY 的/O 關(guān)/O 鍵/O 信/O 息/O 之/O 一/O 。/O”。

    (4)訓(xùn)練網(wǎng)絡(luò)模型。

    測(cè)井命名實(shí)體識(shí)別需要對(duì)句子進(jìn)行分詞。句子分詞之后的詞向量作為BiLSTM網(wǎng)絡(luò)的輸入?yún)?shù),經(jīng)過BiLSTM網(wǎng)絡(luò)進(jìn)行特征提取,輸出的是每個(gè)單詞對(duì)應(yīng)的預(yù)測(cè)標(biāo)簽,最后經(jīng)過CRF約束,輸出最優(yōu)標(biāo)簽序列。

    3.2 實(shí)驗(yàn)設(shè)計(jì)與評(píng)價(jià)標(biāo)準(zhǔn)

    為了驗(yàn)證文中提出的測(cè)井實(shí)體抽取模型的實(shí)際效果,本次實(shí)驗(yàn)通過使用BiLSTM-CRF模型和詞向量-BiLSTM-CRF模型進(jìn)行對(duì)照實(shí)驗(yàn)。

    評(píng)估指標(biāo)主要采取召回率(R,Recall)、精確率(P,Precision)、F1三項(xiàng)指標(biāo)。它們各自的定義如下所示:

    (8)

    (9)

    F1指標(biāo)是一種衡量分類總體效果的常用評(píng)估方法,其公式為:

    (10)

    3.3 實(shí)驗(yàn)結(jié)果

    文中一共進(jìn)行了3組實(shí)驗(yàn),分別使用如下所述的主要模型:BiLSTM-CRF模型、詞向量-BiLSTM-CRF模型和提出的Senna詞向量-BiLSTM-CRF模型,同時(shí)使用不同的詞向量維度來作為不同組的對(duì)比數(shù)據(jù),第一組的詞向量維度設(shè)置為100,第二組的詞向量維度設(shè)置為200,第三組的詞向量維度設(shè)置為250。實(shí)驗(yàn)多組結(jié)果匯總?cè)绫?所示。

    表2 不同方法在不同詞向量維度的評(píng)估指標(biāo)值比較

    通過對(duì)比分析以上3組匯總實(shí)驗(yàn)結(jié)果,當(dāng)詞向量維度設(shè)置為200時(shí),精確率、召回率、F1值均達(dá)到三組最好效果,再繼續(xù)增加詞向量維度,設(shè)置為250時(shí),效果并沒有提高,甚至比維度為200時(shí)的效果更差。從精確率、召回率、F1三者橫向?qū)Ρ鹊慕嵌瓤?,精確率效果比召回率效果普遍好一些。詞向量-BiLSTM-CRF模型的精確率、召回率、F1對(duì)比單向的LSTM-CRF模型都有更好的效果,同時(shí)文中提出的Senna詞向量-BiLSTM-CRF比使用隨機(jī)生成的詞向量效果更好一些。綜上分析,文中使用的測(cè)井命名實(shí)體抽取模型取得了不錯(cuò)的效果。

    4 結(jié)束語

    針對(duì)現(xiàn)有的BiLSTM-CRF模型以及詞向量-BiLSTM-CRF模型,文中使用了一種基于Senna詞向量-BiLSTM-CRF的測(cè)井命名實(shí)體抽取模型。通過將Senna詞向量嵌入到雙向長短期記憶網(wǎng)絡(luò)提取文本特征信息,通過雙向長短期記憶網(wǎng)絡(luò)模型的訓(xùn)練,輸出發(fā)射分?jǐn)?shù),可表示BiLSTM將每個(gè)字符預(yù)測(cè)為某個(gè)標(biāo)簽的概率。CRF層將BiLSTM的Emission Score作為輸入,輸出符合標(biāo)注轉(zhuǎn)移約束條件的、最大可能的預(yù)測(cè)標(biāo)注序列,在一定程度上提高了對(duì)測(cè)井實(shí)體的抽取效果。采用Senna詞向量比隨機(jī)生成詞向量訓(xùn)練效果更好。

    猜你喜歡
    語料測(cè)井實(shí)體
    本期廣告索引
    八扇區(qū)水泥膠結(jié)測(cè)井儀刻度及測(cè)井?dāng)?shù)據(jù)處理
    中國煤層氣(2021年5期)2021-03-02 05:53:12
    前海自貿(mào)區(qū):金融服務(wù)實(shí)體
    中國外匯(2019年18期)2019-11-25 01:41:54
    實(shí)體的可感部分與實(shí)體——兼論亞里士多德分析實(shí)體的兩種模式
    兩會(huì)進(jìn)行時(shí):緊扣實(shí)體經(jīng)濟(jì)“釘釘子”
    振興實(shí)體經(jīng)濟(jì)地方如何“釘釘子”
    基于語料調(diào)查的“連……都(也)……”出現(xiàn)的語義背景分析
    華語電影作為真實(shí)語料在翻譯教學(xué)中的應(yīng)用
    基于測(cè)井響應(yīng)評(píng)價(jià)煤巖結(jié)構(gòu)特征
    中國煤層氣(2015年4期)2015-08-22 03:28:01
    中石油首個(gè)全國測(cè)井行業(yè)標(biāo)準(zhǔn)發(fā)布
    韩国av在线不卡| 丰满乱子伦码专区| 免费看光身美女| 人妻一区二区av| 在线观看一区二区三区激情| 老师上课跳d突然被开到最大视频| 午夜精品国产一区二区电影| 久久久久精品性色| 在现免费观看毛片| 视频中文字幕在线观看| 一级毛片电影观看| 国产精品欧美亚洲77777| 爱豆传媒免费全集在线观看| 日本与韩国留学比较| 身体一侧抽搐| 亚洲成色77777| 九草在线视频观看| 99国产精品免费福利视频| 国产免费又黄又爽又色| 男人添女人高潮全过程视频| av黄色大香蕉| 欧美3d第一页| 建设人人有责人人尽责人人享有的 | 日韩电影二区| 丝袜喷水一区| 伊人久久国产一区二区| 国产 一区 欧美 日韩| 干丝袜人妻中文字幕| 免费看av在线观看网站| 18禁动态无遮挡网站| 国产v大片淫在线免费观看| 亚洲精品456在线播放app| 免费看av在线观看网站| 国产一级毛片在线| 亚洲国产成人一精品久久久| 亚洲av综合色区一区| 蜜桃亚洲精品一区二区三区| 色视频www国产| 成人二区视频| 精品亚洲乱码少妇综合久久| 青春草视频在线免费观看| h视频一区二区三区| av专区在线播放| 亚洲精品一二三| 亚洲欧美成人精品一区二区| 国产乱人偷精品视频| 久久精品国产鲁丝片午夜精品| 国产深夜福利视频在线观看| 99久久人妻综合| 六月丁香七月| 亚洲精品国产色婷婷电影| 亚洲aⅴ乱码一区二区在线播放| 日韩 亚洲 欧美在线| 久久精品国产亚洲网站| 黄色欧美视频在线观看| 国产精品99久久久久久久久| 国产爱豆传媒在线观看| 日日撸夜夜添| 精品久久久久久久久av| 王馨瑶露胸无遮挡在线观看| 性色av一级| 观看免费一级毛片| 久久这里有精品视频免费| 人人妻人人爽人人添夜夜欢视频 | 麻豆精品久久久久久蜜桃| 久热久热在线精品观看| 亚洲国产精品国产精品| 美女中出高潮动态图| 日韩电影二区| 日韩欧美一区视频在线观看 | 午夜精品国产一区二区电影| 纯流量卡能插随身wifi吗| 午夜精品国产一区二区电影| 极品少妇高潮喷水抽搐| 国产免费又黄又爽又色| 亚洲精华国产精华液的使用体验| 欧美+日韩+精品| 精品熟女少妇av免费看| 成人毛片60女人毛片免费| 1000部很黄的大片| 欧美精品一区二区大全| 午夜日本视频在线| 少妇人妻 视频| www.色视频.com| 久久久久久久久大av| 国产精品女同一区二区软件| 成人特级av手机在线观看| 午夜福利视频精品| 国产成人aa在线观看| 日日啪夜夜爽| 干丝袜人妻中文字幕| 亚洲欧美日韩另类电影网站 | 九九爱精品视频在线观看| 晚上一个人看的免费电影| 男女无遮挡免费网站观看| 小蜜桃在线观看免费完整版高清| 久久精品国产亚洲av涩爱| 伦理电影大哥的女人| 国产乱人视频| 久久久久精品久久久久真实原创| 欧美国产精品一级二级三级 | 久久青草综合色| 成年人午夜在线观看视频| 国产久久久一区二区三区| 久久这里有精品视频免费| 在线天堂最新版资源| 蜜臀久久99精品久久宅男| 亚洲美女黄色视频免费看| 丰满人妻一区二区三区视频av| 国国产精品蜜臀av免费| 久久国内精品自在自线图片| 99热全是精品| 久久久久久久大尺度免费视频| 高清在线视频一区二区三区| av视频免费观看在线观看| 看免费成人av毛片| 亚洲成人av在线免费| 看免费成人av毛片| 久久国产精品大桥未久av | 边亲边吃奶的免费视频| 久久99蜜桃精品久久| 中文精品一卡2卡3卡4更新| 日韩不卡一区二区三区视频在线| 777米奇影视久久| 卡戴珊不雅视频在线播放| 亚洲av免费高清在线观看| 如何舔出高潮| 国产精品国产av在线观看| 午夜免费男女啪啪视频观看| 一个人看的www免费观看视频| 欧美老熟妇乱子伦牲交| 夜夜爽夜夜爽视频| 欧美+日韩+精品| 婷婷色麻豆天堂久久| 我的女老师完整版在线观看| 久久综合国产亚洲精品| 亚洲va在线va天堂va国产| 欧美成人午夜免费资源| 国产成人午夜福利电影在线观看| 亚洲人成网站在线播| 如何舔出高潮| 国产又色又爽无遮挡免| 国产一区有黄有色的免费视频| 亚洲国产日韩一区二区| 边亲边吃奶的免费视频| 十分钟在线观看高清视频www | 全区人妻精品视频| 欧美老熟妇乱子伦牲交| 男女边摸边吃奶| av卡一久久| 午夜老司机福利剧场| 少妇熟女欧美另类| av在线app专区| 日韩欧美一区视频在线观看 | av免费观看日本| 国产av一区二区精品久久 | av专区在线播放| 80岁老熟妇乱子伦牲交| 99热6这里只有精品| 亚洲美女视频黄频| 一级毛片电影观看| 偷拍熟女少妇极品色| 精品少妇久久久久久888优播| 美女cb高潮喷水在线观看| 女人十人毛片免费观看3o分钟| 五月天丁香电影| 国产 一区 欧美 日韩| 黄色日韩在线| av在线观看视频网站免费| 大片电影免费在线观看免费| 午夜福利视频精品| 99久国产av精品国产电影| 少妇人妻精品综合一区二区| 精品人妻一区二区三区麻豆| 国产一区二区三区综合在线观看 | 男女无遮挡免费网站观看| 久久久久久久大尺度免费视频| 精品一区二区三卡| 一级毛片黄色毛片免费观看视频| 日韩av在线免费看完整版不卡| 欧美精品国产亚洲| 少妇裸体淫交视频免费看高清| 老司机影院成人| 亚洲美女搞黄在线观看| 国产精品不卡视频一区二区| 黄色日韩在线| 国产 一区精品| 久久影院123| 卡戴珊不雅视频在线播放| 日韩亚洲欧美综合| 色视频www国产| 人妻 亚洲 视频| 欧美三级亚洲精品| av免费观看日本| 男女国产视频网站| videossex国产| 蜜桃亚洲精品一区二区三区| 18+在线观看网站| 久久精品人妻少妇| 国产精品福利在线免费观看| 成人毛片60女人毛片免费| 亚洲国产av新网站| 欧美一区二区亚洲| 亚洲精品国产av成人精品| 人妻 亚洲 视频| 亚洲精品日韩av片在线观看| 91午夜精品亚洲一区二区三区| 中文精品一卡2卡3卡4更新| 最近中文字幕高清免费大全6| 蜜桃久久精品国产亚洲av| 九九在线视频观看精品| 中文精品一卡2卡3卡4更新| 99热6这里只有精品| 精品亚洲成a人片在线观看 | 日韩欧美 国产精品| 少妇人妻 视频| 欧美xxxx黑人xx丫x性爽| 极品少妇高潮喷水抽搐| 国产女主播在线喷水免费视频网站| 久久影院123| 免费观看的影片在线观看| 高清在线视频一区二区三区| 午夜福利在线观看免费完整高清在| 日韩不卡一区二区三区视频在线| 激情五月婷婷亚洲| 赤兔流量卡办理| 国产女主播在线喷水免费视频网站| 亚洲av.av天堂| 国产 精品1| 中国美白少妇内射xxxbb| 亚洲第一区二区三区不卡| 亚洲欧洲日产国产| 97精品久久久久久久久久精品| 精品亚洲成a人片在线观看 | 91久久精品国产一区二区三区| 国产精品国产三级国产专区5o| 80岁老熟妇乱子伦牲交| 日韩av不卡免费在线播放| 黄色怎么调成土黄色| 99热全是精品| 人妻一区二区av| 视频区图区小说| 偷拍熟女少妇极品色| 欧美国产精品一级二级三级 | 亚洲美女搞黄在线观看| 两个人的视频大全免费| 日韩强制内射视频| 中文字幕制服av| 永久网站在线| 国产精品女同一区二区软件| 亚洲av综合色区一区| 亚洲最大成人中文| 久久人妻熟女aⅴ| 大码成人一级视频| 国产亚洲一区二区精品| 国产伦在线观看视频一区| 男人舔奶头视频| 久久6这里有精品| 99热这里只有精品一区| 国产在线免费精品| 3wmmmm亚洲av在线观看| 亚洲婷婷狠狠爱综合网| 又黄又爽又刺激的免费视频.| 国产高清不卡午夜福利| 我的女老师完整版在线观看| 日韩 亚洲 欧美在线| av专区在线播放| 男女啪啪激烈高潮av片| 国产男女内射视频| 国产美女午夜福利| 性色av一级| 亚洲色图av天堂| 国产精品一及| 一本一本综合久久| 高清毛片免费看| 黄色配什么色好看| 少妇被粗大猛烈的视频| 久久韩国三级中文字幕| av线在线观看网站| 国产伦精品一区二区三区四那| 国产毛片在线视频| 中文欧美无线码| 男女国产视频网站| 三级国产精品片| 中文资源天堂在线| 婷婷色综合大香蕉| av在线播放精品| 午夜精品国产一区二区电影| 高清视频免费观看一区二区| 欧美精品一区二区免费开放| 天堂8中文在线网| 乱码一卡2卡4卡精品| freevideosex欧美| 老司机影院成人| 国产精品一区二区三区四区免费观看| av又黄又爽大尺度在线免费看| 欧美 日韩 精品 国产| 汤姆久久久久久久影院中文字幕| 国产 精品1| 免费观看av网站的网址| 能在线免费看毛片的网站| 亚洲国产日韩一区二区| 日本av手机在线免费观看| 另类亚洲欧美激情| av一本久久久久| 国产日韩欧美在线精品| 亚洲av成人精品一二三区| 男人狂女人下面高潮的视频| 少妇人妻一区二区三区视频| 久久精品久久久久久久性| 国产高潮美女av| 美女内射精品一级片tv| 久久久久久久久久久免费av| av卡一久久| 日韩,欧美,国产一区二区三区| 91久久精品国产一区二区三区| 大又大粗又爽又黄少妇毛片口| 久久久久久伊人网av| 在线亚洲精品国产二区图片欧美 | 欧美三级亚洲精品| 婷婷色综合www| 欧美最新免费一区二区三区| 毛片一级片免费看久久久久| 黄色日韩在线| 欧美日韩国产mv在线观看视频 | 五月天丁香电影| 插逼视频在线观看| 少妇猛男粗大的猛烈进出视频| 亚洲在久久综合| 亚洲欧洲日产国产| av视频免费观看在线观看| 五月玫瑰六月丁香| 成人美女网站在线观看视频| 各种免费的搞黄视频| 高清毛片免费看| 99热国产这里只有精品6| 嘟嘟电影网在线观看| 汤姆久久久久久久影院中文字幕| 国产视频内射| 精品人妻视频免费看| 好男人视频免费观看在线| 成人免费观看视频高清| 午夜福利视频精品| 老司机影院毛片| 免费观看无遮挡的男女| 一个人看的www免费观看视频| 国产av国产精品国产| 国产在线视频一区二区| 久久 成人 亚洲| 日韩国内少妇激情av| 精品久久国产蜜桃| 人妻 亚洲 视频| 麻豆国产97在线/欧美| 美女中出高潮动态图| 在线观看三级黄色| 成人综合一区亚洲| 有码 亚洲区| 黄色欧美视频在线观看| 久久人人爽人人爽人人片va| 久热这里只有精品99| 菩萨蛮人人尽说江南好唐韦庄| 欧美成人午夜免费资源| 七月丁香在线播放| 亚洲第一av免费看| 2018国产大陆天天弄谢| 日韩一区二区视频免费看| 中文精品一卡2卡3卡4更新| 免费少妇av软件| 中文精品一卡2卡3卡4更新| 夜夜爽夜夜爽视频| 欧美少妇被猛烈插入视频| 久久这里有精品视频免费| 国产精品欧美亚洲77777| 日韩电影二区| 日韩强制内射视频| 在线精品无人区一区二区三 | 国产av精品麻豆| 六月丁香七月| 欧美日韩一区二区视频在线观看视频在线| 美女cb高潮喷水在线观看| 99视频精品全部免费 在线| 丰满少妇做爰视频| 三级国产精品欧美在线观看| 最近2019中文字幕mv第一页| 国产极品天堂在线| 啦啦啦啦在线视频资源| 3wmmmm亚洲av在线观看| 尤物成人国产欧美一区二区三区| 亚洲自偷自拍三级| 成人午夜精彩视频在线观看| 成人漫画全彩无遮挡| 伦精品一区二区三区| 国产精品女同一区二区软件| 亚洲中文av在线| 欧美成人a在线观看| 秋霞伦理黄片| 深爱激情五月婷婷| 日韩欧美一区视频在线观看 | 人妻系列 视频| 午夜日本视频在线| 国产69精品久久久久777片| 自拍偷自拍亚洲精品老妇| 亚洲av综合色区一区| 五月伊人婷婷丁香| 丝瓜视频免费看黄片| 亚洲美女视频黄频| 在线观看一区二区三区激情| 国产精品免费大片| 亚洲精华国产精华液的使用体验| 亚洲自偷自拍三级| 成人一区二区视频在线观看| 成人18禁高潮啪啪吃奶动态图 | 狂野欧美白嫩少妇大欣赏| 午夜福利在线在线| 亚洲精品456在线播放app| av国产免费在线观看| 亚洲精品乱码久久久v下载方式| 色婷婷av一区二区三区视频| 中文字幕久久专区| 国产高清国产精品国产三级 | 婷婷色综合www| 在线看a的网站| 最近2019中文字幕mv第一页| 国产精品无大码| 91精品国产九色| 日韩伦理黄色片| 九九爱精品视频在线观看| 久久99热这里只有精品18| 亚洲国产毛片av蜜桃av| 成人特级av手机在线观看| 91狼人影院| 高清不卡的av网站| 日本免费在线观看一区| 下体分泌物呈黄色| av播播在线观看一区| 国产欧美日韩一区二区三区在线 | 哪个播放器可以免费观看大片| 免费黄网站久久成人精品| 99久久中文字幕三级久久日本| 男人添女人高潮全过程视频| 成人影院久久| 人妻制服诱惑在线中文字幕| 插阴视频在线观看视频| 91久久精品电影网| 建设人人有责人人尽责人人享有的 | 久久精品熟女亚洲av麻豆精品| 91久久精品国产一区二区三区| 欧美人与善性xxx| 男男h啪啪无遮挡| 久久女婷五月综合色啪小说| 中文乱码字字幕精品一区二区三区| 亚洲一区二区三区欧美精品| 中文字幕制服av| 我的女老师完整版在线观看| a级一级毛片免费在线观看| 超碰av人人做人人爽久久| 黄色一级大片看看| 国产在视频线精品| 国产永久视频网站| 欧美 日韩 精品 国产| 亚洲国产精品专区欧美| h视频一区二区三区| 中国国产av一级| 不卡视频在线观看欧美| 欧美日韩国产mv在线观看视频 | 美女视频免费永久观看网站| 精品久久久久久电影网| 联通29元200g的流量卡| 偷拍熟女少妇极品色| h日本视频在线播放| 在现免费观看毛片| 日产精品乱码卡一卡2卡三| 欧美极品一区二区三区四区| av免费在线看不卡| 久久久精品免费免费高清| 国产精品爽爽va在线观看网站| 亚洲av免费高清在线观看| 日韩欧美 国产精品| 免费黄色在线免费观看| 欧美精品一区二区免费开放| av黄色大香蕉| 91久久精品国产一区二区三区| 精品少妇黑人巨大在线播放| 亚洲va在线va天堂va国产| 国产乱人视频| 极品教师在线视频| 在线观看一区二区三区| 亚洲人成网站高清观看| 国产精品一区二区在线不卡| 女性生殖器流出的白浆| 简卡轻食公司| 国产一区二区在线观看日韩| 国产免费又黄又爽又色| 观看美女的网站| 人体艺术视频欧美日本| 男人爽女人下面视频在线观看| 街头女战士在线观看网站| 欧美精品亚洲一区二区| 少妇丰满av| 成人综合一区亚洲| 最近中文字幕高清免费大全6| 你懂的网址亚洲精品在线观看| 亚洲欧美一区二区三区国产| 最新中文字幕久久久久| 亚洲丝袜综合中文字幕| 亚洲精品久久午夜乱码| 大话2 男鬼变身卡| 美女高潮的动态| 日日撸夜夜添| 另类亚洲欧美激情| 嫩草影院入口| 国内少妇人妻偷人精品xxx网站| 国产精品久久久久久久久免| 五月玫瑰六月丁香| 一个人看视频在线观看www免费| 最近手机中文字幕大全| 日日啪夜夜撸| 老熟女久久久| 精品一区在线观看国产| .国产精品久久| 黄色视频在线播放观看不卡| 美女主播在线视频| 精品视频人人做人人爽| 精品少妇久久久久久888优播| 夜夜看夜夜爽夜夜摸| 建设人人有责人人尽责人人享有的 | 91在线精品国自产拍蜜月| 午夜福利在线观看免费完整高清在| 成年免费大片在线观看| 亚洲精品乱久久久久久| 国产伦理片在线播放av一区| 97热精品久久久久久| 在线观看av片永久免费下载| 香蕉精品网在线| 黑人高潮一二区| 国产精品99久久久久久久久| av不卡在线播放| 国产黄频视频在线观看| videos熟女内射| 丰满迷人的少妇在线观看| 国产男女超爽视频在线观看| 少妇熟女欧美另类| 色吧在线观看| 99re6热这里在线精品视频| 2021少妇久久久久久久久久久| 深夜a级毛片| 夜夜爽夜夜爽视频| 免费观看无遮挡的男女| 日韩一本色道免费dvd| 亚洲人成网站在线播| 多毛熟女@视频| 亚洲成色77777| 99热6这里只有精品| 99热网站在线观看| 人妻一区二区av| 亚洲av免费高清在线观看| 日本午夜av视频| 成人一区二区视频在线观看| 午夜福利视频精品| 午夜日本视频在线| 老女人水多毛片| 成人漫画全彩无遮挡| 亚洲第一区二区三区不卡| 国产精品久久久久久久久免| 国产精品免费大片| 波野结衣二区三区在线| 人妻少妇偷人精品九色| 日韩不卡一区二区三区视频在线| 免费看不卡的av| 最近手机中文字幕大全| 免费观看a级毛片全部| 国产色婷婷99| 久久6这里有精品| 日韩av不卡免费在线播放| av黄色大香蕉| 日韩成人av中文字幕在线观看| 在线看a的网站| 久久久久久人妻| 噜噜噜噜噜久久久久久91| 亚洲电影在线观看av| 如何舔出高潮| 有码 亚洲区| 老司机影院毛片| 欧美3d第一页| 国产精品免费大片| 老司机影院毛片| 妹子高潮喷水视频| 又粗又硬又长又爽又黄的视频| 成人免费观看视频高清| 人妻系列 视频| 亚洲av福利一区| 亚洲在久久综合| 欧美精品亚洲一区二区| 日日撸夜夜添| 国产一区二区三区综合在线观看 | 婷婷色麻豆天堂久久| 国产色爽女视频免费观看| 汤姆久久久久久久影院中文字幕| 精品亚洲成a人片在线观看 | 成年美女黄网站色视频大全免费 | 久久久久性生活片| 黑人高潮一二区| 女人久久www免费人成看片| 午夜激情福利司机影院| 一区在线观看完整版| 人妻 亚洲 视频| 插阴视频在线观看视频| 观看av在线不卡| 80岁老熟妇乱子伦牲交| 婷婷色综合www| 在线观看一区二区三区| 熟女av电影| 五月天丁香电影| 亚洲国产精品专区欧美| 国产成人freesex在线|