• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于文獻的地質(zhì)實體關系抽取方法研究

    2017-11-01 06:12:32呂鵬飛王春寧朱月琴
    中國礦業(yè) 2017年10期
    關鍵詞:監(jiān)督方法模型

    呂鵬飛,王春寧,朱月琴

    (1.中國地質(zhì)圖書館,北京 100083;2.中國科學院大學,北京 100049;3.中國地質(zhì)調(diào)查局發(fā)展研究中心,北京 100037;4.國土資源部地質(zhì)信息技術重點實驗室,北京 100037)

    基于文獻的地質(zhì)實體關系抽取方法研究

    呂鵬飛1,2,王春寧1,朱月琴3,4

    (1.中國地質(zhì)圖書館,北京100083;2.中國科學院大學,北京100049;3.中國地質(zhì)調(diào)查局發(fā)展研究中心,北京100037;4.國土資源部地質(zhì)信息技術重點實驗室,北京100037)

    實體關系抽取是信息抽取的一項重要內(nèi)容,通過實體關系的抽取能夠發(fā)現(xiàn)文本中的有價值信息。本文在分析和比較了有監(jiān)督、無監(jiān)督、弱監(jiān)督以及開放式等關系抽取方法的原理和特點的基礎上,建立了基于文獻的地質(zhì)實體關系抽取模型:采用統(tǒng)計語言模型作為關系抽取方式、采用Bootstrapping算法作為關系擴展方式。最后據(jù)此進行了關聯(lián)關系發(fā)現(xiàn)和關系擴展發(fā)現(xiàn)實驗。

    文獻;關系抽??;統(tǒng)計語言模型;Bootstrapping

    進入大數(shù)據(jù)時代,隨著獲取數(shù)據(jù)的規(guī)模、范圍和深度在不斷寬展和延伸,人們關注的重點開始從起初數(shù)據(jù)的積累,向挖掘數(shù)據(jù)的深層次價值、實現(xiàn)數(shù)據(jù)的“增值”轉(zhuǎn)變。在成礦預測領域,同樣面臨這樣的問題,地質(zhì)調(diào)查工作的成果基本上是信息性的成果,地質(zhì)調(diào)查工作者在百年的工作實踐中,積累了海量的成果報告、勘查資料、文獻等數(shù)據(jù)資源,這些數(shù)據(jù)資源中蘊含著豐富的地質(zhì)信息,如何在成礦規(guī)律和預測的研究過程中充分利用這些數(shù)據(jù)?如何將數(shù)據(jù)轉(zhuǎn)化為新的認識或知識,為地質(zhì)找礦實踐提供積極的數(shù)據(jù)支撐。本文論述了一套基于文獻的地質(zhì)實體關系抽取模型的研究方法,嘗試通過建立地質(zhì)實體的關聯(lián)關系網(wǎng)絡實現(xiàn)發(fā)現(xiàn)潛在知識的目的。

    1 關系抽取綜述

    為了解決從文本數(shù)據(jù)中獲取有價值的信息,信息抽取技術應運而生。信息抽取被定義為從非結構化信息中獲取結構化數(shù)據(jù)的過程[1]。信息抽取一般包含兩個任務:實體識別和關系抽取。實體識別是通過自然語言處理技術從文本中提取實體要素,而關系抽取是在實體識別的基礎上結合語義環(huán)境提取出實體之間的關系[2]。Etzioni認為關系抽取是分析檢查文本中的實體對,并判斷它們之間是否存在關系[3]。通過實體識別獲得的一個個離散的實體要素對于理解文本語義、發(fā)現(xiàn)有價值的知識點毫無幫助。有價值的信息往往是通過實體間的關系來體現(xiàn)的,比如在成礦預測研究中礦種和特定生物的關聯(lián)關系、和巖石的伴生關系等。此外,關系抽取在很多領域具有應用價值。例如在檢索系統(tǒng)中,傳統(tǒng)的檢索方式是基于關鍵詞的匹配檢索,而關系抽取技術則可以實現(xiàn)智能語義檢索。比如輸入“石墨烯”不光可以得到關鍵詞里含有石墨烯的文本資料,還可以得到類似“前沿技術”、“知名學者”、“研究機構”等結果。此外,實體關系抽取在自動問答、自動標引、機器翻譯方面具有重要的研究意義。

    關系抽取技術路線經(jīng)歷了從模式、詞典等簡單方法到機器學習、基于本體的關系抽取等復雜方法,從基于分詞、句法等匹配的淺表分析到基于語義的深層分析的發(fā)展過程[4]。基于模式和詞典的方式準確率較高,但要求前期制定細致的規(guī)則和語料,而且跨領域移植很困難;本體是對信息資源進行語義化和有序化,理想化的本體包含實體及其關系,但由于本體構建需要投入巨大的工作量,目前仍然沒有較為成熟的體系和應用。機器學習采用自然語言處理中的統(tǒng)計語言模型作為基礎,實質(zhì)上是一個源于數(shù)據(jù)的模型訓練過程。機器學習的關系抽取方式是通過對大量文本數(shù)據(jù)進行抽取、轉(zhuǎn)換、分析和模型化處理,從中自動分析獲得規(guī)律,并利用規(guī)律對未知數(shù)據(jù)進行預測,從中提取出有助于關聯(lián)分析的關鍵性數(shù)據(jù)。它的優(yōu)勢是入手簡易、效率較高。采用機器學習的關系抽取方法按照對人工干預標注數(shù)據(jù)的依賴的程度可以分為:有監(jiān)督關系抽取、遠距離監(jiān)督關系抽取、半監(jiān)督關系抽取[5]。此外,近來隨著大數(shù)據(jù)的理念和落地應用日趨成熟,開放式關系抽取方式開始興起,下面分別做介紹。

    1.1 有監(jiān)督關系抽取

    有監(jiān)督的關系抽取方法是最基本的機器學習方法,思路是在已標注的語料上建立機器學習模型,然后使用模型在目標文本里進關系識別。有監(jiān)督的學習效率較高,但前期需要大量的工作量投入人工標注語料。這種方法的問題在于適用于訓練語料豐富的領域,所以跨領域移植性較弱。其典型算法諸如決策樹、人工神經(jīng)網(wǎng)絡和支持向量機等算法,已廣泛用于機器學習及模式識別、人工智能等領域中[6]。

    1.2 遠距離監(jiān)督關系抽取

    遠距離監(jiān)督又叫弱監(jiān)督或無監(jiān)督,它不需要建立人工標注的關系模型,是以預先定義關系模式和關系實例作為種子,通過機器學習,發(fā)現(xiàn)新的關系模板和實例。實現(xiàn)過程首先根據(jù)實體對出現(xiàn)的上下文將相似度高的實體對聚為一類,然后選擇具有代表性的詞語來標記這種關系[7]。遠距離監(jiān)督關系抽取一般基于統(tǒng)計語言模型的關系抽取思想。遠距離監(jiān)督關系抽取方法克服了費時費力的人工語料標注環(huán)節(jié),不需要或需要很少預先處理的語料支撐,能自動地提取文本中包含的實體關系。而且由于不依賴于特定的訓練語料,該方法對各領域的適應性很高。相較于有監(jiān)督的關系抽取方法,遠距離監(jiān)督關系抽取方法的缺點是準確率較低。

    1.3 半監(jiān)督關系抽取

    顧名思義,人工干預標注程度基于有監(jiān)督和無監(jiān)督之間的方法我們稱之為半監(jiān)督的關系抽取方法,半監(jiān)督實體關系抽取無需大規(guī)模標注語料,只需人工標注少量關系實例,適用于缺乏標注語料的實體關系抽取。最典型的實例是Bootstrapping算法。Bootstrapping源于“重抽樣”的統(tǒng)計思想,即通過現(xiàn)有模式不斷擴展出新的模式,屬于啟發(fā)式的方法[8]。

    1.4 開放式關系抽取

    傳統(tǒng)的關系抽取方式是有“限定”作為先決條件的,限定的范圍包括:目標數(shù)據(jù)的范圍、實體的類型、限特點定的關系等。而在網(wǎng)絡時代,我們面對的是大量的無規(guī)則、開放的數(shù)據(jù),因而有學者提出了開放式關系抽取的思想,主要基于以下特點:目標數(shù)據(jù)開放,不再限定數(shù)據(jù)的領域范圍和數(shù)量;抽取類型開放,不在限定抽取的實體、關系類型。自動識別、分析、抽取語義類型[9]。開放式關系抽取方法是順應大數(shù)據(jù)時代要求的產(chǎn)物,一經(jīng)提出引起了廣泛的關注,但至今成熟應用的案例還不多。

    1.5 關系抽取方法比較

    以上的關系抽取方法各有優(yōu)缺點,關系抽取方法的選擇需要結合語料準備和應用需要具體問題具體分析,通過比較分析得出以下結論。

    1) 由于地質(zhì)領域缺乏較為齊整的人工標注的地質(zhì)信息本體,因此排除有監(jiān)督關系抽取的方法。

    2) 傳統(tǒng)開放域抽取的方法基本上都是基于語法分析,而中文的短語結構分析和依存關系分析的水平還未能達到應用的水平。故本項目考慮改進傳統(tǒng)的開放域抽取方法,引入統(tǒng)計語言方法代替語法規(guī)則的方法。故采用基于統(tǒng)計語言模型的關系抽取方式。

    3) 基于Bootstrapping的方法可以很好的結合人的先驗知識和龐大語料帶來的統(tǒng)計效果,而且便于人去使用和修改,此外結合領域當中的關系專業(yè)性較強的特點,借助Bootstrapping方法可以利用龐大的語料對于人為規(guī)定的實體關系進行擴展,從而快速實現(xiàn)信息的同種關系抽取。因此,選擇基于Bootstrapping的方法進行關系擴展。

    2 實體關系抽取模型研究

    2.1 統(tǒng)計語言模型算法

    2.1.1 統(tǒng)計語言模型算法研究

    統(tǒng)計語言模型最早是由賈里尼克提出,他認為一個句子是否合理,就看它的可能性大小,這個可能性就是概率[10]。簡單來說,統(tǒng)計語言模型就是可能出現(xiàn)的句子或其他語言學單位的一個概率分布。統(tǒng)計語言模型可以形式化統(tǒng)一表示為式(1)。

    p(S)=p(w1,w2,…,wn)=

    p(S)就是用來計算句子S概率的模型。那么,如何計算p(wi|w1,w2,…,wi-1),最簡單的辦法就是采用極大似然估計(Maximum Likelihood Estimate,MLE),見式(2)。

    p(wi|w1,w2,…,wi-1)=

    (2)

    其中,count(w1,w2,…wi)表示詞序(w1,w2,…,wi)在語料庫中出現(xiàn)的頻率。但由于數(shù)據(jù)稀疏和參數(shù)空間過大,導致實際中無法得到應用。所以,實際中通常采用N元語法模型(N-Gram),它采用馬爾科夫假設:語言中每個單詞只與其前面N-1的上下文有關。假設下一個詞的出現(xiàn)只依賴它前面的一個詞,即二元語法模型(BiGram),則有式(3)。

    p(S)=p(w1)p(w2|w1)p(w3|w1,w2)…

    p(wn|w1,w2,…,wn-1)=

    (3)

    理論上講,N值越大計算出來的值精確度越高。但是隨著N值的增大,模型的復雜度也越大[7]。具體來說計算p(w1)、p(w2)很容易,但是當N=3時,計算p(w3|w1,w2)已經(jīng)有些困難了,當N>3時,計算量將變的非常大。所以對于N的選擇:理論上越大越好;經(jīng)驗上Trigram(三元模型)用的最多;原則上能有Bigram解決的,就不用Trigram。

    2.1.2 構建基于統(tǒng)計語言模型的關系抽取模型

    在實驗中采用三元語法模型,滿足二元馬爾科夫假設。具體操作步驟如下所示。

    1) 分詞,對每個句子進行分詞;過濾出名詞、動詞和介詞。

    2) 對關系詞進行過濾,過濾出不及物動詞(例如,奔跑)以及以人為主語的詞(例如,看見)。

    3) 獲得關系三元組可能集合:句子中所有n-v/p-n結構的三元組,不考慮相鄰關系。

    并計算獲得的所有三元組的聯(lián)合概率作為該三元組的得分(用二元語法模型);獲得關系三元組的候選集合:找出得分最高的n-v/p-n三元組作為候選的關系三元組。

    4) 確定關系三元組:通過規(guī)則,對關系三元組的候選集合進行過濾,得到關系三元組,目前主要通過兩條規(guī)則進行過濾:對于抽取出來的n1-(v/p)-n2結構,如果n1和n2之間距離超過5,我們認為這個關系較弱而舍棄;對于抽取出來的n1-(v/p)-n2結果,如果n2后面是一個動詞,我們認為這個關系抽取的不完整故舍棄。例如:“我對他說,明天放假”,會抽取出來“我-對-他”的關系三元組,而這個關系不完整。

    5) 關系三元組置信度計算:加入評分函數(shù),計算抽取的關系三元組的置信度。評分函數(shù)利用統(tǒng)計語言模型統(tǒng)計關系對出現(xiàn)的次數(shù),并參與聯(lián)合概率計算:如式(3)所示,語言中每個單詞只與其前面n-1的上下文有關。接下來的關鍵問題就是如何計算Pp(wn|wn-1)?,F(xiàn)在有了大量機讀文本后,這個問題變得很簡單,只要數(shù)計算(wn,wn-1)在統(tǒng)計的文本中出現(xiàn)了多少次,以及wn-1本身在同樣的文本中前后相鄰出現(xiàn)了多少次,然后用兩個數(shù)相除就可以了p(wn|wn-1)=p(wn,wn-1)/p(wn-1)。

    關系抽取流程如圖1所示。

    圖1 基于統(tǒng)計語言模型的關系抽取模型流程圖

    2.2 Bootstrapping算法

    2.2.1 Bootstrapping算法研究

    統(tǒng)計語言模型解決的是關系抽取的問題,而Bootstrapping解決的是關系擴展的問題。Bootstrapping首先利用少量已標記樣本的特征及其結果度量建立初始學習模型,主要的思路是通過人工指定幾個初始的種子,隨后系統(tǒng)會尋找滿足人工提供種子的句式模板,利用得到的模板找到新的種子不斷的迭代下去,最終達到舉一反三的目的。該方法的缺點是對初始關系種子的質(zhì)量要求較高。比如我們現(xiàn)在知道“中國-北京”,“美國-華盛頓”兩個國家-首都的關系,但是還想知道所有其他的國家-首都關系,那么就可以用Bootstrapping方法,以“中國-北京”,“美國-華盛頓”為基礎,可以找到語料中幾乎所有的國家-首都關系。

    2.2.2 構建基于Bootstrapping算法的關系擴展模型

    依據(jù)Bootstrapping算法的基本思想,設計算法流程共分為以下幾個步驟:上下文構建階段、模板抽取階段、候選種子抽取階段和候選種子評分階段。

    1) 上下文構建階段。上下文構建階段主要是利用一種前綴字典樹的數(shù)據(jù)結構來存儲種子的前后的文字,在抽取上下文的時候,只選擇在同一個分句當中的內(nèi)容即任何標點符號都作為邊界處理。前綴字典樹是一種壓縮存儲的數(shù)據(jù)結構,他的特征在于父節(jié)點是子節(jié)點的前綴。構造兩個字典樹,分別存儲種子之前的文字和之后的文字。

    2) 模板抽取階段。模板抽取階段主要是利用上下文構建得到的兩個字典樹,找到滿足所有種子的最長的句式模板。

    3) 候選種子抽取階段。候選種子抽取階段主要是利用找到的句式模板,在整個語料中找到滿足句式句子并利用句式抽出去對應位置的種子,作為候選種子。

    4) 候選種子評分階段。候選種子評分階段主要是利用隨機游走的方法從圖中進行迭代直到到達圖中的任何一點的概率收斂。在這里的圖的結構如下:共有三種類型的節(jié)點,分別為文檔、句式和候選種子,文檔和句式之間的關系是包含,句式和種子之間的關系是抽取,文檔和種子的關系是含有。具體如圖2所示。

    在具體算法的實施過程中,首先由人工給出2~3個種子,每次迭代的過程中,從已有的種子集合中抽取三個種子并加上上一次迭代得到的分數(shù)最高的種子作為本次迭代的初始種子,利用上述的四個階段提取種子,每次僅選取最高的一個加入到種子集合當中。具體抽取流程如圖3所示。

    圖2 種子評分所采用的隨機游走方法結構圖

    圖3 基于Bootstrapping算法的關系擴展模型流程圖

    3 關系抽取實驗

    實驗的目的是從文獻數(shù)據(jù)中發(fā)現(xiàn)潛在的關聯(lián)關系,建立實體間的關聯(lián)網(wǎng)絡,為成礦預測工作提供未被發(fā)現(xiàn)的、有價值的新知識點。根據(jù)前期需求調(diào)研,本次實驗將圍繞發(fā)現(xiàn)并驗證“金礦”和“生物”兩個領域間的關系展開。

    3.1 數(shù)據(jù)源準備

    目標數(shù)據(jù)源主要有兩類:第一類為生物和金礦會議文獻,生物會議文獻約44 640篇,金礦會議文獻約1 647篇,大小共約457 M;第二類為生物和金礦期刊文獻,生物期刊文獻約387 660篇,金礦期刊文獻約28 740篇,大小共約9.54 G。文獻類型為txt類型。

    3.2 實驗環(huán)境

    1) 服務器配置:CPU:Intel Xeon E5-2609 V3,內(nèi)存:24 GB。

    2) 操作系統(tǒng):RedHat 4.4.7-4(Linux內(nèi)核版本2.6.32) 64位。

    3) 數(shù)據(jù)庫:MySQL 5.6。

    4) 分布式搜索引擎:ElasticSearch2.3.4。

    5) 開發(fā)環(huán)境:MyEclipse 2015、Java版本:1.8.0.131。

    3.3 關聯(lián)關系發(fā)現(xiàn)實驗

    3.3.1 實驗描述

    發(fā)現(xiàn)“金礦”與“微生物”領域關鍵詞之間的關聯(lián)關系。

    3.3.2 實驗步驟

    1) 獲得候選關系對集合,在詞典里提取金礦和微生物詞表,并進行兩兩配對。

    2) 獲得可能關系對集合,挑選出語料中關系對至少同現(xiàn)10次的關系對和所有同現(xiàn)的語句。

    3) 確定關系,采用統(tǒng)計語言模型的方法在關系對同現(xiàn)的語句中抽取關系詞,用來表達關系對的關系。每個同現(xiàn)語句至多抽取一個關系,每個關系對可能有多個關系詞,這些詞統(tǒng)統(tǒng)保留(因為是關系發(fā)現(xiàn),沒有足夠的證據(jù)表明哪個關系詞是錯誤的)。

    4) 關系過濾,對于句子中關系對距離過遠的關系丟棄。

    3.3.3 實驗結果

    實驗結果如圖4、圖5所示。

    圖4 “金礦”與“微生物”關聯(lián)關系發(fā)現(xiàn)結果

    圖5 “金礦”與“微生物”關聯(lián)關系發(fā)現(xiàn)結果改進

    在隨后的實驗中,考慮到此次研究的目的是新知識發(fā)現(xiàn),限定關系對至少出現(xiàn)10次以上并不能很好的發(fā)現(xiàn)新知識(出現(xiàn)頻次高的一般不是新知識),故在實驗中取消了至少出現(xiàn)10詞的過濾規(guī)則。

    3.3.4 實驗分析

    本次實驗的目的是發(fā)現(xiàn)分析“金礦”和“微生物”間的關系,驗證并完善基于統(tǒng)計語言模型的關系抽取模型。下一步改進方向包括以下兩方面。

    1) 無用關系去除??梢酝ㄟ^不斷完善停用詞表來實現(xiàn)。

    2) 關系的歸類分析。在目前的統(tǒng)計語言模型中沒有考慮關系的歸類,遍歷出的關系維度很大,考慮引入基于業(yè)務專家指導的關系聚類技術,提高模型的實用性。

    3.4 關系擴展發(fā)現(xiàn)實驗

    3.4.1 實驗描述

    驗證基于Bootstrapping算法的關系擴展模型,主思路如下:提供兩對關系對(種子),模型將會自動擴展這兩對關系對,并根據(jù)提交的關系對(種子)進行搜索,查詢到由此生成的句式模板和候選集合(候選關系)。根據(jù)篩選得到的候選集合(候選關系)進行判定。

    3.4.2 實驗步驟

    1) 關系對(種子)提交。人工提交一個關系對(種子),模型自動識別判斷交的關系對(種子)關系。

    2) 定義抽取模板。根據(jù)關系對(種子)抽取一個模板,再根據(jù)這個模板抽取其對應的候選關系,如發(fā)現(xiàn)新關系在進行種子提交和定義新抽取模板,如此循環(huán),直到再也無法抽取出模板為止。

    3) 句式模板抽取。根據(jù)模板中的兩個關系實體通過Elastic Search(IK分詞器的Elastic Search搜索引擎,下同)來搜索文獻中包含這兩個實體的句子。只要輸入的關系實體之間有相關關系,則這兩個關系實體可以抽出至少一個模板。當兩對關系都被抽取過模板之后,需要對模板集合中的對應字段進行檢索,僅保留對應于兩個種子的模板。最后利用得到的模板進行候選集合(候選關系)的抽取工作

    4) 候選關系對抽取。根據(jù)待抽取模板在Elastic Search中查找包含該模板的句子。再利用模板的類型和內(nèi)容決定需要過濾的部分,過濾掉多余的字符串,只保留生成的關系。

    5) 關系判定。然后對生成的關系進行清理,除去不完整的關系對(如關系實體殘缺、關系實體有標點)。

    3.4.3 實驗結果

    輸入“礦石-黃鐵礦”、“礦石-黃銅礦”關系對作為種子。實驗結果如圖6所示。

    圖6 輸入關系對(種子)表的關系對

    3.4.4 實驗分析

    1) 實驗驗證了在給定的關系對(種子)在適當?shù)年P系條件下,可以根據(jù)其定義抽取模板,進而抽取新的候選關系對的過程。抽取的關系和模板保存在數(shù)據(jù)庫中的“cgl_seed_relation”表中, rel_template字段記錄了抽取出的關系,而rel_ent1和rel_ent1分別對應了關系中的arg0和arg1。

    2) 候選集合(候選關系對)中某個關系對出現(xiàn)的頻率遠高于其它的關系對,這種高頻結果可能是前人已經(jīng)總結過的成果,可以直接利用起來。相應的如果某個關系對在一些高頻模板中出現(xiàn)的頻率很低,這樣的關系對可能還沒有被挖掘出價值,因此可以作為新的研究的重點。

    3) 在實驗中我們發(fā)現(xiàn)抽取出的模板和候選關系對有一些在語義上不連貫。產(chǎn)生該情況的原因一部分是中文亂碼,另一部分是由于生成的模板中只有虛詞(模板中只有介詞的情況多見)。在下一階段中我們需要進一步使用NLP相關算法對生成的結果加以限制。

    4 結 論

    地質(zhì)文獻是地質(zhì)調(diào)查工作的成果的重要載體和呈現(xiàn)方式,很多研究發(fā)現(xiàn)都是通過對地質(zhì)文獻研究分析而誕生的。本文通過建立地質(zhì)實體關系抽取模型的方式自動發(fā)現(xiàn)分析地質(zhì)文獻中實體間的關系并進行了實驗驗證。關系抽取模型包括了關系抽取模型和關系擴展模型兩部分:關系抽取模型采用了極大似然估計的三元統(tǒng)計語言模型收取出候選關系集合,并通過制定過濾規(guī)則和評分函數(shù)進行關系的過濾和排序;關系擴展模型采用了Bootstrapping算法,在試驗中將人工定義的種子模板通過檢索Elastic Search來發(fā)現(xiàn)擴展新的關系模板。在后續(xù)的工作中,需要加入不同領域、體裁、規(guī)模的文本擴充試驗,以驗證方法的可移植性和實用性;同時需要進一步優(yōu)化算法模型,研究關系分析過濾以及關系歸類算法,提升實驗精度。最終的目的是通過統(tǒng)計語言模型發(fā)現(xiàn)成礦預測領域有價值的關系,再通過關系擴展模型進行關系擴展,實現(xiàn)發(fā)現(xiàn)新知識,為成礦預測提供積極數(shù)據(jù)支持的目的。

    [1] Jurafsky D,Martin J H.Speech and Language Processing.An Introduction to Natural Language Processing,Computational Linguistics and Speech Recognition (Draft)[C]∥Prentice Hall PTR.1999:638-641.

    [2] 馮志偉.當前自然語言處理發(fā)展的幾個特點[J].華文教學與研究,2006(1):34-40.

    [3] A Culotta,A McCallum,J Betz.Integrating probabilistic extraction models and data mining to discover relations and patterns in text[C]∥In:Proceedings of the main conference on Human Language Technology Conference of the North American Chapter of the Association of Computational Linguistics,Association for Computational Linguistics,New York.2006.

    [4] 徐健,張智雄.典型關系抽取系統(tǒng)的技術方法解析[J].數(shù)字圖書館論壇,2008(9):13-18.

    [5] 劉方馳,鐘志農(nóng),雷霖,吳燁.基于機器學習的實體關系抽取方法[J].兵工自動化,2013,32(9):57-62.

    [6] Natalia K.Review of Relation Extraction Methods:What is New Out There?[J].Communications in Computer & Information Science,2014,436(1):15-28.

    [7] 王晶.無監(jiān)督的中文實體關系抽取研究[D].上海:華東師范大學,2012.

    [8] 劉珍,王若愚,劉瓊.基于Bootstrapping的因特網(wǎng)流量分類方法[J].北京郵電大學學報,2014(5):66-70.

    [9] 秦兵,劉安安,劉挺.無指導的中文開放式實體關系抽取[J].計算機研究與發(fā)展,2015(5):1029-1035.

    [10] 吳軍.數(shù)學之美[M].北京:人民郵電出版社,2015:28.

    Studyongeologicentityrelationextractionmethodbasedonliterature

    LYU Pengfei1,2,WANG Chunning1,ZHU Yueqin3,4

    (1.National Geological Library of China,Beijing 100083,China;2.University of Chinese Academy of Sciences,Beijing 100049,China;3.Development and Research Center,China Geological Survey,Beijing 100037,China;4.Key Laboratory of Geological Information Technology of Ministry of Land and Resources,Beijing 100037,China)

    Relation extraction is an important section of information extraction,which play an crucial role in valuable information discovering.On the ground of analyzing and comparing,including supervised methods,unsupervised methods,self-supervise methods and open information extraction methods,this essay has built a Geologic Entity Relation Extraction Model,using statistical language models for relation extraction and bootstrapping models for relation extension.Finally,according to the above analysis,the experiment of incidence relation discovery and relation extension discovery were carried out.

    literature;relation extraction;metallogenic prognosis;statistical language model;bootstrapping model

    P208

    A

    1004-4051(2017)10-0167-06

    2017-06-27責任編輯趙奎濤

    國土資源部公益性行業(yè)科研專項項目資助(編號:201511079);國家重點研發(fā)計劃“基于‘地質(zhì)云’平臺的深部找礦知識挖掘”資助(編號:2016YFC0600510)

    呂鵬飛(1978-),男,碩士研究生,高級工程師,主要從事地質(zhì)文獻數(shù)據(jù)分析與挖掘方面的研究工作,E-mail:23690271@qq.com。

    朱月琴(1975-),女,博士,高級工程師,主要從事地質(zhì)大數(shù)據(jù)、地圖綜合與可視化研究工作,E-mail:yueqinzhu@163.com。

    猜你喜歡
    監(jiān)督方法模型
    一半模型
    重要模型『一線三等角』
    突出“四個注重” 預算監(jiān)督顯實效
    人大建設(2020年4期)2020-09-21 03:39:12
    重尾非線性自回歸模型自加權M-估計的漸近分布
    監(jiān)督見成效 舊貌換新顏
    人大建設(2017年2期)2017-07-21 10:59:25
    夯實監(jiān)督之基
    人大建設(2017年9期)2017-02-03 02:53:31
    可能是方法不對
    3D打印中的模型分割與打包
    用對方法才能瘦
    Coco薇(2016年2期)2016-03-22 02:42:52
    四大方法 教你不再“坐以待病”!
    Coco薇(2015年1期)2015-08-13 02:47:34
    人妻系列 视频| 亚洲av福利一区| 日日啪夜夜撸| 男人舔奶头视频| 日韩av在线免费看完整版不卡| 日韩av在线免费看完整版不卡| av播播在线观看一区| 国产高清三级在线| 在线观看人妻少妇| av专区在线播放| 麻豆成人av视频| 少妇高潮的动态图| 色网站视频免费| 寂寞人妻少妇视频99o| 国产av码专区亚洲av| 久久久久久久久久久免费av| 国产精品一区二区在线观看99| 久久精品国产亚洲av涩爱| 内射极品少妇av片p| 久久久久久久久久人人人人人人| 插逼视频在线观看| 亚洲三级黄色毛片| 国产黄色视频一区二区在线观看| 国产男人的电影天堂91| 久久久久久九九精品二区国产| 国产亚洲av片在线观看秒播厂| 日韩亚洲欧美综合| 日韩av免费高清视频| 一区在线观看完整版| 老司机影院毛片| 午夜免费男女啪啪视频观看| 伊人久久国产一区二区| 少妇熟女欧美另类| 在线亚洲精品国产二区图片欧美 | 亚洲在久久综合| 女性生殖器流出的白浆| 网址你懂的国产日韩在线| 在线天堂最新版资源| 久久久久久九九精品二区国产| 国产精品福利在线免费观看| 日本wwww免费看| 午夜激情久久久久久久| 我要看日韩黄色一级片| 国产成人a∨麻豆精品| 高清欧美精品videossex| 在线免费观看不下载黄p国产| 欧美丝袜亚洲另类| 97精品久久久久久久久久精品| 99热这里只有是精品在线观看| 国产91av在线免费观看| 国产成人精品一,二区| 80岁老熟妇乱子伦牲交| 十八禁网站网址无遮挡 | 亚洲av日韩在线播放| 国产亚洲5aaaaa淫片| 18禁裸乳无遮挡动漫免费视频| 日韩强制内射视频| 日韩免费高清中文字幕av| 成年免费大片在线观看| 中文在线观看免费www的网站| 久久久欧美国产精品| 一个人看的www免费观看视频| 男的添女的下面高潮视频| 国产精品av视频在线免费观看| 亚洲内射少妇av| 久久 成人 亚洲| 国产精品久久久久久精品电影小说 | 在线免费十八禁| 干丝袜人妻中文字幕| 又爽又黄a免费视频| 国产精品人妻久久久久久| 久久久久久久久久久免费av| 永久免费av网站大全| 国产精品无大码| 亚洲国产精品专区欧美| 男女国产视频网站| 久久 成人 亚洲| 日韩亚洲欧美综合| 三级国产精品片| 国产色爽女视频免费观看| 免费看不卡的av| 亚洲av二区三区四区| 我的老师免费观看完整版| 国产精品无大码| 亚洲精品日韩av片在线观看| 一本色道久久久久久精品综合| 久久ye,这里只有精品| 亚洲成人手机| 亚洲人与动物交配视频| 精品99又大又爽又粗少妇毛片| 免费人成在线观看视频色| av视频免费观看在线观看| 国产成人精品福利久久| 亚洲第一区二区三区不卡| 国产色婷婷99| 国产 精品1| 少妇熟女欧美另类| 精品亚洲成a人片在线观看 | 97超视频在线观看视频| 欧美另类一区| 日韩欧美精品免费久久| 夜夜骑夜夜射夜夜干| 久久久久网色| 亚洲人成网站在线播| tube8黄色片| h视频一区二区三区| 国产精品.久久久| 亚洲国产高清在线一区二区三| 国产免费福利视频在线观看| 国产黄频视频在线观看| 日韩中文字幕视频在线看片 | a级一级毛片免费在线观看| 成人亚洲欧美一区二区av| 亚洲成色77777| 国产黄色免费在线视频| 亚洲欧美成人综合另类久久久| 国产精品三级大全| 18禁在线无遮挡免费观看视频| 国产成人aa在线观看| 国产日韩欧美亚洲二区| 人妻一区二区av| 在线天堂最新版资源| 在线观看免费日韩欧美大片 | 成人午夜精彩视频在线观看| 尾随美女入室| 亚洲第一区二区三区不卡| 婷婷色综合大香蕉| 2018国产大陆天天弄谢| av卡一久久| 免费在线观看成人毛片| av在线app专区| 久久久久久久久久成人| 身体一侧抽搐| 免费观看a级毛片全部| 亚州av有码| 久久99热这里只频精品6学生| 99久久精品国产国产毛片| 99热这里只有是精品在线观看| 精品亚洲乱码少妇综合久久| 午夜免费男女啪啪视频观看| 在线天堂最新版资源| 少妇被粗大猛烈的视频| 国产男女内射视频| 国产免费视频播放在线视频| 在现免费观看毛片| 久久久久久久大尺度免费视频| 久久久欧美国产精品| 精品国产一区二区三区久久久樱花 | 欧美人与善性xxx| 在线看a的网站| 国产成人91sexporn| 久久人人爽av亚洲精品天堂 | 日韩欧美 国产精品| 亚洲综合色惰| 嫩草影院新地址| 熟女人妻精品中文字幕| 少妇精品久久久久久久| 伦理电影大哥的女人| 免费高清在线观看视频在线观看| 日韩大片免费观看网站| 大陆偷拍与自拍| 日韩av在线免费看完整版不卡| 成人国产av品久久久| av在线观看视频网站免费| 久久国产乱子免费精品| 亚洲内射少妇av| 嫩草影院新地址| 少妇 在线观看| av黄色大香蕉| 久久av网站| 高清黄色对白视频在线免费看 | 亚洲欧美日韩无卡精品| 一级片'在线观看视频| 精品久久久精品久久久| 性色av一级| 青春草视频在线免费观看| 一级毛片黄色毛片免费观看视频| 免费人妻精品一区二区三区视频| 丰满乱子伦码专区| 18禁裸乳无遮挡免费网站照片| 成年免费大片在线观看| 男女无遮挡免费网站观看| 成人亚洲欧美一区二区av| 深夜a级毛片| 丰满乱子伦码专区| 夜夜骑夜夜射夜夜干| 内地一区二区视频在线| 欧美老熟妇乱子伦牲交| 国产女主播在线喷水免费视频网站| av国产免费在线观看| 亚洲国产欧美人成| 男男h啪啪无遮挡| 麻豆乱淫一区二区| 国产在线男女| 日本黄大片高清| 九九久久精品国产亚洲av麻豆| 观看美女的网站| 免费黄色在线免费观看| 99热这里只有是精品50| 网址你懂的国产日韩在线| 成人黄色视频免费在线看| 国产精品一区二区在线不卡| 亚洲国产色片| av在线app专区| h日本视频在线播放| 欧美日韩精品成人综合77777| 六月丁香七月| 少妇人妻精品综合一区二区| 男女无遮挡免费网站观看| 欧美日韩一区二区视频在线观看视频在线| 日韩中字成人| 一本—道久久a久久精品蜜桃钙片| 日韩成人av中文字幕在线观看| 免费黄色在线免费观看| 国产欧美日韩精品一区二区| 天堂中文最新版在线下载| 日韩三级伦理在线观看| 女人十人毛片免费观看3o分钟| 青春草国产在线视频| 国产成人a区在线观看| 精品一区二区三卡| av在线app专区| 大又大粗又爽又黄少妇毛片口| 精品国产露脸久久av麻豆| 国产成人91sexporn| 午夜福利视频精品| 国产v大片淫在线免费观看| 中国美白少妇内射xxxbb| 男女边摸边吃奶| 国产成人精品婷婷| 国内精品宾馆在线| 国产大屁股一区二区在线视频| 国产精品久久久久久久电影| 日韩不卡一区二区三区视频在线| 国产免费视频播放在线视频| 女的被弄到高潮叫床怎么办| 欧美老熟妇乱子伦牲交| 午夜福利高清视频| 国国产精品蜜臀av免费| 国产淫片久久久久久久久| 日本欧美视频一区| 夜夜看夜夜爽夜夜摸| 国产精品国产三级国产av玫瑰| 精品久久久久久久末码| 精品亚洲成a人片在线观看 | 色视频在线一区二区三区| 婷婷色av中文字幕| 黑丝袜美女国产一区| 亚洲精品色激情综合| 最近2019中文字幕mv第一页| 国产伦在线观看视频一区| 日韩精品有码人妻一区| 日日摸夜夜添夜夜爱| 欧美3d第一页| 欧美日本视频| 日韩人妻高清精品专区| 777米奇影视久久| 老司机影院成人| 日韩视频在线欧美| 亚洲av欧美aⅴ国产| 亚洲精品国产成人久久av| 少妇 在线观看| 另类亚洲欧美激情| 亚洲精品乱码久久久久久按摩| 一级a做视频免费观看| 久久久久精品性色| 亚洲精品一二三| 国产精品福利在线免费观看| 中国国产av一级| 成人二区视频| 久久久久国产网址| 亚洲av成人精品一二三区| 18禁在线无遮挡免费观看视频| 国产大屁股一区二区在线视频| 精品熟女少妇av免费看| 99热网站在线观看| 插阴视频在线观看视频| 国产日韩欧美亚洲二区| 夜夜看夜夜爽夜夜摸| 成人国产av品久久久| 久久久久久伊人网av| 亚洲欧美日韩卡通动漫| 纯流量卡能插随身wifi吗| 欧美激情极品国产一区二区三区 | 亚洲精品国产色婷婷电影| 日韩一区二区三区影片| 在线精品无人区一区二区三 | 秋霞在线观看毛片| 中国美白少妇内射xxxbb| 亚洲av国产av综合av卡| 国产精品欧美亚洲77777| 精品人妻熟女av久视频| 国产午夜精品一二区理论片| 一级毛片黄色毛片免费观看视频| 日日啪夜夜撸| 18禁在线播放成人免费| 男人狂女人下面高潮的视频| 99re6热这里在线精品视频| 国产黄频视频在线观看| 91精品国产国语对白视频| 久久精品国产亚洲av天美| 国产成人freesex在线| 亚洲欧洲国产日韩| 国产在视频线精品| h视频一区二区三区| 欧美亚洲 丝袜 人妻 在线| 观看美女的网站| 男人狂女人下面高潮的视频| www.av在线官网国产| 一区二区av电影网| av国产久精品久网站免费入址| 久久久久久人妻| 全区人妻精品视频| 大码成人一级视频| 狂野欧美激情性bbbbbb| 国产成人午夜福利电影在线观看| 国产精品偷伦视频观看了| 久久久久久久精品精品| 亚洲精品一区蜜桃| 激情五月婷婷亚洲| 久久精品国产亚洲网站| 国产伦在线观看视频一区| 最新中文字幕久久久久| 中文字幕精品免费在线观看视频 | 精品一品国产午夜福利视频| av线在线观看网站| 人人妻人人看人人澡| 国产黄频视频在线观看| 久久6这里有精品| 中文字幕人妻熟人妻熟丝袜美| 久久人妻熟女aⅴ| 大片电影免费在线观看免费| 久久精品夜色国产| 国产精品不卡视频一区二区| 精华霜和精华液先用哪个| 王馨瑶露胸无遮挡在线观看| 一个人免费看片子| 中文天堂在线官网| 丰满迷人的少妇在线观看| 久久久久久久国产电影| 国产黄片美女视频| 五月伊人婷婷丁香| 一二三四中文在线观看免费高清| 亚洲av综合色区一区| 熟女av电影| 国产精品一区二区性色av| 亚洲伊人久久精品综合| 国产高清有码在线观看视频| 少妇 在线观看| 亚洲性久久影院| 男女下面进入的视频免费午夜| 99久久精品国产国产毛片| 欧美日本视频| 草草在线视频免费看| 亚洲国产精品成人久久小说| 亚洲无线观看免费| 亚洲怡红院男人天堂| 国产人妻一区二区三区在| 免费看光身美女| 一本色道久久久久久精品综合| 国产中年淑女户外野战色| 亚洲经典国产精华液单| 亚洲国产欧美在线一区| 亚洲成人一二三区av| av.在线天堂| 噜噜噜噜噜久久久久久91| 午夜精品国产一区二区电影| 国产av码专区亚洲av| 一级毛片 在线播放| 韩国av在线不卡| 性高湖久久久久久久久免费观看| 国产精品国产三级国产av玫瑰| 下体分泌物呈黄色| 人人妻人人爽人人添夜夜欢视频 | 伦理电影大哥的女人| 亚洲内射少妇av| 亚洲精品中文字幕在线视频 | 亚洲少妇的诱惑av| 成年美女黄网站色视频大全免费| 久久ye,这里只有精品| 三上悠亚av全集在线观看| 最近最新中文字幕大全免费视频 | 1024香蕉在线观看| 又大又黄又爽视频免费| 欧美性长视频在线观看| 91麻豆精品激情在线观看国产 | 亚洲男人天堂网一区| 极品人妻少妇av视频| 久久国产精品影院| videosex国产| 亚洲国产中文字幕在线视频| 黄色 视频免费看| 人成视频在线观看免费观看| 看免费av毛片| 男人添女人高潮全过程视频| 亚洲美女黄色视频免费看| 亚洲精品日本国产第一区| 久久久国产精品麻豆| 夫妻午夜视频| 超碰97精品在线观看| 视频区欧美日本亚洲| 欧美另类一区| 自线自在国产av| av网站免费在线观看视频| 一级毛片我不卡| 尾随美女入室| 中文精品一卡2卡3卡4更新| 国产欧美日韩一区二区三区在线| 永久免费av网站大全| 中文字幕av电影在线播放| 精品国产一区二区三区四区第35| 美女主播在线视频| 热99国产精品久久久久久7| 亚洲久久久国产精品| 成人三级做爰电影| 久久久久久久国产电影| 日韩av不卡免费在线播放| 精品国产国语对白av| 熟女av电影| 亚洲免费av在线视频| 丰满饥渴人妻一区二区三| 51午夜福利影视在线观看| 亚洲中文日韩欧美视频| 宅男免费午夜| 国产精品亚洲av一区麻豆| 午夜视频精品福利| 亚洲国产欧美一区二区综合| 看免费av毛片| 考比视频在线观看| 十分钟在线观看高清视频www| 亚洲精品国产区一区二| 亚洲黑人精品在线| 大片免费播放器 马上看| 国产精品国产av在线观看| 操美女的视频在线观看| 国产精品久久久久久精品古装| 国产亚洲精品久久久久5区| 亚洲欧洲精品一区二区精品久久久| 在线观看人妻少妇| 欧美日韩成人在线一区二区| 一边摸一边抽搐一进一出视频| av有码第一页| 国产日韩一区二区三区精品不卡| 欧美精品高潮呻吟av久久| 一区在线观看完整版| 久久久久国产精品人妻一区二区| 中文字幕人妻丝袜制服| 亚洲 欧美一区二区三区| 亚洲视频免费观看视频| 一本色道久久久久久精品综合| 亚洲精品中文字幕在线视频| 丝袜美腿诱惑在线| 高潮久久久久久久久久久不卡| 国产主播在线观看一区二区 | 国产精品一二三区在线看| 久久鲁丝午夜福利片| 男女国产视频网站| 国产亚洲av片在线观看秒播厂| 国产精品成人在线| 国产精品免费视频内射| 久久中文字幕一级| 91精品国产国语对白视频| 精品亚洲成国产av| av欧美777| 一区二区三区精品91| 国产精品久久久久久精品电影小说| 亚洲精品美女久久久久99蜜臀 | 亚洲国产精品国产精品| 日韩人妻精品一区2区三区| 欧美日韩视频高清一区二区三区二| 久久久精品免费免费高清| 国产一区亚洲一区在线观看| 国产在线一区二区三区精| 69精品国产乱码久久久| 欧美精品亚洲一区二区| 中文字幕人妻丝袜制服| 啦啦啦在线免费观看视频4| 人妻一区二区av| 日韩av免费高清视频| 亚洲成人免费av在线播放| 久久精品久久久久久噜噜老黄| 热re99久久精品国产66热6| 亚洲精品自拍成人| 美女国产高潮福利片在线看| 国产免费现黄频在线看| 国产日韩一区二区三区精品不卡| 男人添女人高潮全过程视频| 亚洲av男天堂| 欧美+亚洲+日韩+国产| 制服诱惑二区| 秋霞在线观看毛片| 亚洲av欧美aⅴ国产| 又黄又粗又硬又大视频| 亚洲精品美女久久av网站| 青春草亚洲视频在线观看| 一区二区日韩欧美中文字幕| 亚洲国产欧美在线一区| 精品亚洲成a人片在线观看| 国产国语露脸激情在线看| 晚上一个人看的免费电影| 亚洲五月婷婷丁香| 欧美精品亚洲一区二区| 满18在线观看网站| 不卡av一区二区三区| 波野结衣二区三区在线| 国精品久久久久久国模美| 亚洲成人国产一区在线观看 | 欧美97在线视频| 七月丁香在线播放| 亚洲专区中文字幕在线| 中文欧美无线码| 久久精品久久久久久久性| 十八禁人妻一区二区| 热99国产精品久久久久久7| 叶爱在线成人免费视频播放| 日日夜夜操网爽| 亚洲精品美女久久av网站| 久热这里只有精品99| 一边亲一边摸免费视频| 天天影视国产精品| 亚洲成国产人片在线观看| videos熟女内射| 菩萨蛮人人尽说江南好唐韦庄| 三上悠亚av全集在线观看| 精品熟女少妇八av免费久了| 飞空精品影院首页| 麻豆国产av国片精品| 丰满饥渴人妻一区二区三| 嫁个100分男人电影在线观看 | 1024视频免费在线观看| 黄色视频在线播放观看不卡| 亚洲一码二码三码区别大吗| 在现免费观看毛片| 国产免费福利视频在线观看| 久久精品亚洲熟妇少妇任你| 99精国产麻豆久久婷婷| 91九色精品人成在线观看| 精品久久久久久久毛片微露脸 | 久久这里只有精品19| 午夜免费成人在线视频| 精品一区二区三区四区五区乱码 | videosex国产| 国产成人免费无遮挡视频| 亚洲中文av在线| 啦啦啦中文免费视频观看日本| 欧美激情极品国产一区二区三区| 免费在线观看日本一区| 中文字幕人妻丝袜一区二区| 日本av手机在线免费观看| 深夜精品福利| 啦啦啦中文免费视频观看日本| 岛国毛片在线播放| 丁香六月欧美| 美女高潮到喷水免费观看| 免费一级毛片在线播放高清视频 | 欧美亚洲 丝袜 人妻 在线| 亚洲专区国产一区二区| 亚洲精品自拍成人| 国产无遮挡羞羞视频在线观看| 69精品国产乱码久久久| 老熟女久久久| 首页视频小说图片口味搜索 | 可以免费在线观看a视频的电影网站| 精品人妻1区二区| 久久这里只有精品19| 乱人伦中国视频| 视频区图区小说| 新久久久久国产一级毛片| 成人国产av品久久久| 国产精品国产三级专区第一集| 一二三四在线观看免费中文在| 亚洲国产欧美一区二区综合| 午夜激情av网站| 大型av网站在线播放| 9热在线视频观看99| 国产精品久久久久久人妻精品电影 | 丝袜脚勾引网站| 久久精品成人免费网站| 午夜激情av网站| 十八禁人妻一区二区| 婷婷成人精品国产| 操出白浆在线播放| 亚洲国产精品国产精品| 一本—道久久a久久精品蜜桃钙片| 国产xxxxx性猛交| √禁漫天堂资源中文www| 亚洲,欧美精品.| 脱女人内裤的视频| 性高湖久久久久久久久免费观看| 99久久99久久久精品蜜桃| 你懂的网址亚洲精品在线观看| 亚洲自偷自拍图片 自拍| 亚洲一码二码三码区别大吗| 欧美日韩av久久| 国产黄色免费在线视频| 一级黄片播放器| 国产色视频综合| 另类精品久久| 国产成人av教育| 亚洲av在线观看美女高潮| 十分钟在线观看高清视频www| av欧美777| 亚洲av电影在线观看一区二区三区| 亚洲精品美女久久久久99蜜臀 | 深夜精品福利| 在线观看免费高清a一片| 国产成人啪精品午夜网站| 国产在线一区二区三区精| 精品欧美一区二区三区在线| 亚洲国产看品久久| 欧美大码av| 久久鲁丝午夜福利片| 亚洲精品国产av成人精品| 伊人亚洲综合成人网| 丰满饥渴人妻一区二区三|