• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于GATE的中文事件抽取方法

    2017-11-04 07:30:48張海玉
    關(guān)鍵詞:詞表分詞文檔

    黃 海,張海玉

    (1.廣東培正學(xué)院教務(wù)處,廣東 廣州 510830;2.太原理工大學(xué)財經(jīng)學(xué)院信息系,山西 太原 030024)

    基于GATE的中文事件抽取方法

    黃 海1,張海玉2

    (1.廣東培正學(xué)院教務(wù)處,廣東 廣州 510830;2.太原理工大學(xué)財經(jīng)學(xué)院信息系,山西 太原 030024)

    事件抽取是信息抽取領(lǐng)域的重要研究方向,針對目前網(wǎng)頁文檔中文事件抽取的關(guān)鍵問題,提出利用開源的通用文本處理框架(GATE)進行中文事件抽取的方法,設(shè)計GATE中文事件處理流程,開發(fā)GATE插件,解決中文分詞與詞性標注、領(lǐng)域詞典、中文抽取規(guī)則設(shè)計等關(guān)鍵技術(shù),實現(xiàn)了中文事件的類型識別和元素抽取。并以四類政治事件為例,進行中文事件抽取實驗。實驗結(jié)果表明,基于GATE的中文事件抽取具有良好的通用性,能夠取得了較好的抽取效果。

    信息抽??;GATE;事件抽?。恢形姆衷~;規(guī)則匹配

    引言

    隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,網(wǎng)絡(luò)數(shù)據(jù)呈現(xiàn)爆炸式的發(fā)展態(tài)勢,大量的信息以文本的形式呈現(xiàn)在人們面前。為了應(yīng)對信息爆炸帶來的挑戰(zhàn),迫切需要一些自動化的技術(shù)幫助人們在海量數(shù)據(jù)中迅速找到其所需要的信息。信息抽取成為了從文本中自動獲取信息的一種重要手段,它是指從一段文本中抽取指定的數(shù)據(jù)、事實等信息,形成結(jié)構(gòu)化的數(shù)據(jù)并存入數(shù)據(jù)庫中,供用戶查詢和使用的過程[1]。事件抽取(Event Extraction)是信息抽取的一個重要研究方向,主要研究如何從含有事件信息的自由文本中抽取出用戶所需要的事件信息,將文本中描述的事件以結(jié)構(gòu)化的形式呈現(xiàn)出來[2]。

    事件抽取的常見方法之一是模式匹配法,它利用模式規(guī)則集進行事件類型或事件元素的匹配,事件抽取模式體現(xiàn)了語言知識和領(lǐng)域知識的融合。Chinatsu Aone[3]利用可配置的模式生成模塊和基于模式的標注工具設(shè)計了一個大規(guī)模點對點關(guān)系和事件抽取系統(tǒng);Ernest Arendarenko等[4]利用本體作為GATE詞典,設(shè)計基于JAPE的事件識別規(guī)則,進行了商業(yè)領(lǐng)域的事件抽??;梁晗[5]提出了一種基于框架的信息抽取模式并建立統(tǒng)一的災(zāi)難性事件框架,利用框架的繼承-歸納特性簡化系統(tǒng)實現(xiàn)過程。吳平博[6]等人利用句型模板的抽取規(guī)則從文本中抽取時間短語、空間短語和事件信息,并討論了事件的合并的問題。孫榮[7]等提出一種基于抽取規(guī)則對句子中的事件信息進行抽取的方法,利用本體對動詞與事件角色匹配規(guī)則、事件角色抽取規(guī)則、時間信息抽取規(guī)則和地點信息抽取規(guī)則進行定義,然后應(yīng)用這些規(guī)則抽取句子中的動詞詞義信息、事件角色信息、時間信息和地點信息。

    本文提出利用文本工程通用框架GATE來進行中文事件抽取工作,研究自然文本處理框架GATE的基本結(jié)構(gòu)和基于GATE的事件抽取流程,分析GATE在中文事件抽取領(lǐng)域中的不足,并構(gòu)建了基于ICTCLAS的中文分詞組件、領(lǐng)域詞表和事件抽取規(guī)則。以四類國際政治事件為例,進行了中文政治事件抽取實驗。

    1 信息抽取及GATE概述

    1.1 信息抽取

    信息抽取是一種文本處理技術(shù),它通過對非結(jié)構(gòu)化的自由文本數(shù)據(jù)進行處理,獲得結(jié)構(gòu)化的信息數(shù)據(jù)。信息抽取能夠幫助人們快速獲取所需要信息,同時能夠?qū)π畔⑦M行分析和組織,提高文本數(shù)據(jù)的可用性[8]。

    人類是以事件為單位認識和理解客觀世界的,事件是隨著時間變化的具體事實,涉及到多方面的事物概念,事件間具有內(nèi)在的聯(lián)系,事件由動作、概念、關(guān)系組成。事件數(shù)據(jù)在國際關(guān)系、地緣政治、地理信息應(yīng)用等領(lǐng)域中有著廣泛的應(yīng)用[9,10],因此從互聯(lián)網(wǎng)文本抽取領(lǐng)域事件數(shù)據(jù)具有重要意義。

    1.2 GATE概述

    GATE(General Architecture for Text Engineering,文本工程通用框架)項目開始于1995年英國的謝菲爾德大學(xué),經(jīng)歷了十多年的不斷發(fā)展,憑借其優(yōu)秀的組織架構(gòu)和開源的優(yōu)勢,GATE已經(jīng)被應(yīng)用于廣泛的研究和項目開發(fā),在科研、教育、商業(yè)等領(lǐng)域獲得廣泛應(yīng)用[11]。

    GATE將其框架內(nèi)所有的自然語言處理軟件資源劃分為不同的幾種組件,這些組件是通過Java Beans的形式來實現(xiàn)的,其集合被稱為CREOLE(a Collection of Reusable Objects for Language Engineering)。CREOLE在GATE中分為三種形式:語言組件(LR),處理組件(PR)和可視化組件(VR):語言組件是指僅僅與數(shù)據(jù)相關(guān)的資源,如詞表、文檔和本體等;處理組件指數(shù)據(jù)處理程序或者算法,如產(chǎn)生器、轉(zhuǎn)換器、分析器和語言識別器等??梢暬M件指構(gòu)成GATE的可視化界面GUI的相關(guān)資源。

    JAPE(a Java Annotation Patterns Engine,Java標注模式引擎)是GATE的規(guī)則定義語言,它能夠利用GATE生成的Token、LookUp、Person、Date等標注,使得其可以更精確、更廣泛的覆蓋面抽取信息[12]。一個JAPE語法由一系列的語句組成,每個語句都是一個由模式/行為規(guī)則組成的集合。這些語句按順序運行,形成了一組標注有限狀態(tài)機的轉(zhuǎn)換[13]。語句的左側(cè)部分(LHS:Left Hand Side)由一些標注匹配模式組成,右側(cè)部分(RHS:Right Hand Side)是匹配后執(zhí)行的操作,LHS和RHS以-->符號隔開。JAPE的匹配操作能夠使用Java代碼描述,這在很大程度上擴展了JAPE對規(guī)則的復(fù)雜處理能力。

    2 基于GATE的中文事件抽取關(guān)鍵技術(shù)

    GATE為英文文檔資源提供了信息處理流程實例ANNIE,它是基于規(guī)則的信息抽取系統(tǒng),使用有限狀態(tài)算法和 JAPE語言來實現(xiàn)各種不同的信息抽取任務(wù)[14]。ANNIE采用流水線工作方式,嚴格按照順序經(jīng)過分詞 (Tokeniser)、詞表查詢(Gazetteer Lookup)、 分句 (Sentence Splitter)、 詞性標注(POS Tagger)、 語義標注 (Semantic Tagger)、 共指消解(Ortho Matcher)、代詞消引(Pronominal Coreferencer)之后,實現(xiàn)英文文檔的信息抽取[15]。

    但ANNIE并不能有效處理中文文檔,它在解決中文信息抽取有以下不足:1)缺乏對中文分詞處理的良好支持,目前的版本并不能實現(xiàn)真正意義上的中文分詞;2)中文詞表不夠完善,缺少特定領(lǐng)域內(nèi)的專有名詞詞表;3)命名實體識別過程中,針對英文特點的JAPE規(guī)則不能有效支持中文的命名實體識別。

    針對以上不足,基于GATE的中文事件抽取系統(tǒng)需要完成以下三項關(guān)鍵技術(shù):1)有效處理中文分詞與詞性標注的問題;2)設(shè)計專業(yè)、完善的中文領(lǐng)域詞表;3)針對中文特點重寫JAPE抽取規(guī)則,提高事件識別和抽取的準確率。

    2.1 中文分詞與詞性標注

    與英文等以空格作為詞間天然分隔符的語言不同,漢語中詞與詞之間不存在明確的分隔標記,而是形成一個連續(xù)的漢字字符串,因此必須對中文文本進行分詞處理。中文分詞就是將連續(xù)的漢字序列按照一定的規(guī)范重新組合成詞序列的過程,中文詞性標注是指為中文文本中的每一個詞增添一個合適的標記,用以說明它的詞性,如名詞、動詞、形容詞等,因此,中文詞法分析是中文信息處理的基礎(chǔ)與關(guān)鍵。

    中文分詞是中文事件抽取的基礎(chǔ),目前已有相關(guān)論文[13,16,17]對GATE的中文分詞問題進行了研究,但其解決方法都是使用中文分詞工具提前對文檔進行分詞預(yù)處理,以空格將各個詞分隔,組成英文文本的空格分割格式,然后使用GATE默認的Unicode Tokeniser分詞器根據(jù)空格對文檔重新分詞。這種方法需要提前對文檔進行預(yù)處理,增加了人工操作的復(fù)雜度,而且以空格劃分的分詞文檔無法獲取每個詞的詞性信息,因此無法在抽取規(guī)則中使用詞的POS屬性,影響了信息抽取的精度。

    本文基于中科院計算所的中文分詞工具ICTCLAS,開發(fā)了GATE的中文分詞組件來進行中文文檔的分詞與詞性標注。ICTCLAS(Institute of Computing Technology,Chinese Lexical Analysis System)是中國科學(xué)院計算技術(shù)研究所在多年研究工作積累的基礎(chǔ)上研制出的漢語詞法分析系統(tǒng),它由C++編寫,主要功能包括中文分詞、詞性標注、命名實體識別、新詞識別、同時支持用戶詞表,分詞正確率高達97.58%,未登錄詞識別召回率均高于90%,其中中國人名的識別召回率接近98%,處理速度為31.5Kbytes/s。

    GATE調(diào)用ICTCLAS進行中文分詞的流程如下:

    (1)讀取GATE中的文檔內(nèi)容

    GATE中待處理的文本以文檔(Document)對象保存,文檔對象的內(nèi)容(context)以純文本的形式記錄了文檔的原始信息,這些原始文本是分詞軟件輸入的數(shù)據(jù)流。

    (2)調(diào)用ICTCLAS庫

    ICTCLAS是純C++開發(fā)的庫,為了在Java環(huán)境的GATE中使用,本文使用JNI技術(shù)來調(diào)用ICTCLAS庫,JNI(Java Native Interface)是一個本機編程接口,它允許Java代碼使用以其它語言編寫的代碼和代碼庫。ICTCLAS工具提供了ParagraphProcessing()和FileProcessing()兩個接口,分別處理文本段落或者文件,本文使用ParagraphProcessing()接口來處理GATE中的文檔內(nèi)容。

    (3)解析ICTCLAS處理結(jié)果

    ICTCLAS的ParagraphProcessing()函數(shù)對輸入的句子進行分詞并輸出,輸出結(jié)果為“單詞/POS”形式。例如句子“中國是世界上人口最多的國家。”的分詞結(jié)果為 “中國/ns是/v世界/n上/f人口/n最/d多/a的/u國家/n。/w”,需要根據(jù)數(shù)據(jù)格式來解析每個分詞的起始位置、結(jié)束位置和POS詞性信息。

    (4)增加Token標注和Feature值

    GATE的文檔標注集包含起始節(jié)點(start Node)、結(jié)束節(jié)點(end Node)、ID、類型(type)以及特征鍵值對(FeatureMap)等信息,根據(jù)(3)中解析的結(jié)果,利用GATE的接口函數(shù)在Document中增加相應(yīng)的Token標注,并設(shè)置起始節(jié)點、結(jié)束節(jié)點和特征值。

    2.2 領(lǐng)域詞表設(shè)計

    詞表是GATE進行事件抽取的重要資源,詞表的豐富完整影響著抽取的效果。詞表是一組包含了事物名詞的集合,如城市名稱、組織名稱、日期等等。詞表一方面描述了領(lǐng)域內(nèi)的專有名詞,另一方面可以表達各類概念名詞之間的關(guān)系,并將其映射到領(lǐng)域本體中。

    詞表是事件抽取的重要元素,詞表的豐富和準確程度直接關(guān)系著事件抽取的效果。事件抽取需要使用的詞表包括命名實體詞表和事件觸發(fā)詞詞表兩類,事件觸發(fā)詞(Event Trigger)是指用來清晰地表示所發(fā)生的事情的詞,通常為動詞。

    GATE中的詞表由*.lst文件、mappings.def文件和lists.def文件三類文本文件組成。*.lst文件定義實體,每個*.lst文件代表一個實體類型,以“詞表”的形式對應(yīng)領(lǐng)域知識中的概念實例。mapings.def描述*.lst文件和領(lǐng)域本體概念之間的關(guān)系。lists.def為*.lst文件的索引文件,指明每個*.lst文件所對應(yīng)的主類(majorType)和子類(minorType)類型,以“:”分割。在GATE中進行命名實體標注的時候,這些文件將會被編譯成有限狀態(tài)自動機,有限狀態(tài)自動識別出的文本片段將會以Lookup標簽標注出,并增加相應(yīng)的特征值[18]。

    2.3 抽取規(guī)則設(shè)計

    事件抽取主要包含事件類型識別和事件元素抽取兩部分內(nèi)容,其中,事件類型識別是事件元素抽取的基礎(chǔ),事件元素抽取是事件抽取的主要內(nèi)容。事件類別識別是指從文本中檢測出事件句,并依據(jù)一定的特征判斷其所歸屬的類別。事件類別識別是典型的分類問題,其重點在于事件句的檢測和事件句的分類[19]?,F(xiàn)有的檢測事件句的方法主要是基于觸發(fā)詞的方法。觸發(fā)詞是指在文本中清晰的表示事件發(fā)生的詞語。在自然文本中,除句子中的謂語動詞外,其他成分的動詞也有可能作為事件觸發(fā)詞。事件元素抽取是事件抽取的核心任務(wù),它從眾多命名實體(Entity)、時間表達式(Time Expression)和屬性值(Value)中識別出真正的事件元素,并給予其準確的角色標注。事件要素限定在事件范圍(Event Extent)之內(nèi),事件范圍通常以具有完整意義的句子或者分句為邊界。

    事件觸發(fā)詞是決定事件類別的重要特征,因此事件類別識別任務(wù)可以轉(zhuǎn)換為事件觸發(fā)詞類別的識別。在抽取事件信息時,根據(jù)觸發(fā)詞確定所屬事件類別,并調(diào)用相應(yīng)的規(guī)則進行匹配。

    基于規(guī)則的事件抽取方法的核心是尋找事件模板。模板指自然語言中描述事件的模式特征。在設(shè)計事件規(guī)則時,首先整理出語句的模式特征,然后將模式轉(zhuǎn)換為JAPE規(guī)則描述語言。例如“2014年9月11日,國家主席習(xí)近平在杜尚別會見俄羅斯總統(tǒng)普京。”這一會見事件,其模式為“時間短語+標點符號+名詞+人名+介詞+地名+會見動作+國家+名詞+人名”,其中事件發(fā)生的時間為“2014年9月11日”,地點為“杜尚別”,主語為“習(xí)近平”,賓語為“普京”,按照JAPE語言其匹配規(guī)則表示為:

    Rule:MeetingRule1

    (

    ({Date.kind=="date"}):tagdate

    {Token.category=="wd"}

    ({Token.category=="n"})+

    ({Person}):tagSubject

    {Token.category=="p"}

    ({Location}):tagLoc

    {Lookup.majorType==diplomacy}

    {Country}

    {Token.category=="n"}

    ({Person}):tagObject

    {Token.category=="wj"}

    ):tag

    -->

    :tagdate.Politic={element=Date,rule=MeetingRule1},

    :tagSubject.Politic={element=Subject,rule=MeetingRule1},

    :tagLoc.Politic={element=Location,rule=MeetingRule1},

    :tagObject.Politic={element=Object,rule=MeetingRule1},

    :tag.Politic={type=Meet,rule=MeetingRule1}

    圖1展示了外交部網(wǎng)站新聞“習(xí)近平會見俄羅斯總統(tǒng)普京”一文中的會見事件抽取結(jié)果,事件抽取結(jié)果保存在EVENT標注集中,標注名稱“Politic”表明事件為政治事件,事件子類使用type屬性標識,事件元素使用element屬性標識,共包括時間(Date)、地點(Location)、主體(Object)、客體(Subject)四個元素。

    圖1 會見事件抽取結(jié)果Figure1 Meeting Event Extract Result

    3 實驗及評估

    為了驗證GATE在中文事件抽取中的作用,設(shè)計了國際政治中四類常見事件抽取進行實驗:訪問、會見、抗議、沖突,這四類事件代表了國際關(guān)系中常見的事件,是研究國際關(guān)系、地緣政治的重要數(shù)據(jù)資源。

    本文分別從外交部、新華網(wǎng)、鳳凰網(wǎng)等權(quán)威新聞門戶網(wǎng)站收集了訪問、會見、抗議和沖突四類事件數(shù)據(jù)語料,將各類語料數(shù)據(jù)分成標注語料和測試語料兩部分,基于標注語料來總結(jié)整理規(guī)則、設(shè)計觸發(fā)詞詞典。各類事件的語料情況和觸發(fā)詞情況如表1所示。

    表1 四類事件語料情況

    實驗結(jié)果采用MUC在自然語言處理領(lǐng)域的三大評測指標進行衡量,即準確率(P)、召回率(R)和綜合值(F),具體定義如下:

    各類事件抽取的準確率、召回率和綜合值結(jié)果如表3所示。

    表2 事件抽取結(jié)果

    通過表3可以看出:(1)使用GATE能夠很好地進行中文事件抽取,訪問、會見、抗議三類事件的抽取結(jié)果正確率和召回率都在80%以上;(2)事件抽取的效果主要受規(guī)則的覆蓋程度影響。試驗中的沖突事件比較分散,涉及的規(guī)則模式也比較多,語料中的規(guī)則不能完全覆蓋全部的沖突事件,造成沖突事件的召回率較低。因此在基于規(guī)則的事件抽取中,語法規(guī)則庫的設(shè)計和完善是提高抽取正確率和召回率的關(guān)鍵。

    4 結(jié)束語

    事件抽取是從文本中獲取領(lǐng)域數(shù)據(jù)的重要途徑,本文針對GATE在中文事件抽取中的不足,利用ICTCLAS中文分詞工具開發(fā)了GATE處理組件,進行中文分詞與詞性標注、設(shè)計地緣事件的分類體系和事件詞表、構(gòu)造地緣事件抽取規(guī)則,進行地緣事件信息的抽取?;谀J狡ヅ涞氖录槿》椒ǖ囊粋€主要問題是抽取模式不能完全覆蓋全部句式,本文基于語料中國際政治事件的表達句式總結(jié)了若干條抽取規(guī)則,但這些規(guī)則的覆蓋面仍不能完全覆蓋全部事件。本文的下一步工作是對事件模式進行擴展完善,通過種子規(guī)則來實現(xiàn)啟發(fā)式的規(guī)則擴展,以提高事件抽取的召回率。

    [1]Qian Liu.Hui Jiao.Hui-Bo Jia.Research on Approaches of Information Extraction System[J].Application Research of Computers.2007,24(7):6-9.(劉遷、焦慧、賈惠波.信息抽取技術(shù)的發(fā)展現(xiàn)狀及構(gòu)建方法的研究[J].計算機應(yīng)用研究,2007,24(7):6-9.)

    [2]Gang Wu.Research and Application on Chinese Topic Event Extraction[D].Suzhou:Soochow University,2009.(吳剛.基于主題的中文事件抽取技術(shù)研究及應(yīng)用[D].蘇州:蘇州大學(xué),2009.)

    [3]Aone Chinatsu,Ramos-Santacruz Mila.REES:a largescale relation and event extraction system[C].Association for Computational Linguistics,2000.

    [4]Arendarenko Ernest.Kakkonen Tuomo.Ontology-Based Information and Event Extraction for Business Intelligence[C].Varna,Bulgaria:2012.

    [5]Han Liang.Qun-Xiu Chen.Ping-Bo Wu.Information Extraction System Based on Event Frame[J].JOURNAL OF CHINESE INFORMATION PROCESSING.2006(02):40-46.(梁晗、陳群秀、吳平博、基于事件框架的信息抽取系統(tǒng)[J].中文信息學(xué)報,2006(02):40-46.)

    [6]Ping-Bo Wu、Qun-Xiu Chen、Liang Ma.Research on Extraction and Integration of Developing Event Based on Analysis of Space-time Information[J].JOURNAL OF CHINESE INFORMATION PROCESSING.2006(01):21-28.(吳平博、陳群秀、馬亮.基于時空分析的線索性事件的抽取與集成系統(tǒng)研究[J].中文信息學(xué)報,2006(01):21-28.)

    [7]Rong Sun,Wen Zhou,Zong-Tian Liu.Using Rules to Extract Event Information from Sentences[J].Journal of Chinese Computer Systems.2011(11):2309-2314.(孫榮、周文、劉宗田.用規(guī)則抽取句子中事件信息[J].小型微型計算機系統(tǒng),2011(11):2309-2314.)

    [8]Li Long,Hongshen Pang.JOURNAL OF LIBRARY SCIENCE.2008,30(5):13-16.(龍麗、龐弘燊.國外Web信息抽取研究綜述[J].圖書館學(xué)刊,2008,30(5):13-16.)

    [9]Zhen-Feng Wang.Geographic Event Inofrmaiton Retrieval Based on ontology[D].Wuhan:Wuhan University,2009.(王振峰.基于本體的地理事件信息檢索 [D].武漢:武漢大學(xué),2009.)

    [10]Xiaoya An、Ying Li、Qun Sun等.Research on Geographical Event Model for Spatial Data Active Updating[J].Acta Scientiarum Naturalium Universitatis Pekinensis.2011(03):491-498.(安曉亞、李穎、孫群等.面向空間數(shù)據(jù)主動更新的地理事件模型研究 [J].北京大學(xué)學(xué)報 (自然科學(xué)版),2011(03):491-498.)

    [11]Dongxing Xu.A Gate-based lnformation Extraction System:Research and Implementation[D].Shanghai:East China Normal University,2007.(徐東興.基于Gate框架的信息抽取系統(tǒng)的研究與實現(xiàn) [D].上海:華東師范大學(xué),2007.)

    [12]Lan Chen.Research and Implementation of Ontologybased lnformation Extraction System[D].ChengDu:University of Electronic Science and Technology of China,2004.(陳蘭.基于ontology的信息抽取系統(tǒng)的研究與實現(xiàn)[D].成都:電子科技大學(xué),2004.)

    [13]Sa Li.The Implementation of the Chinese Information Extraction System Based on GATE[D].Beijing:Graduate U-niversity of Chinese Academy of Sciences,2006.(李颯.基于GATE的中文信息抽取系統(tǒng)的開發(fā)和實現(xiàn) [D].北京:中國科學(xué)院研究生院,2006.)

    [14]Jing Chen.Research of Ontology-based lnformation Extraction[D].Suzhou:Soochow University,2007.(陳靜.基于本體的信息抽取研究[D].蘇州:蘇州大學(xué),2007.)

    [15]Cunningham Hamish,Maynard Diana,Bontcheva Kalina,et al.Developing Language Processing Components with GATE[EB/OL].2014.

    [16]Analysis of State-of-the-Art Knowledge Extraction Technologies[J].NEW TECHNOLOGY OF LIBRARY AND INFORMATION SERVICE.2008(08):2-11.(張智雄、吳振新、劉建華等.當前知識抽取的主要技術(shù)方法解析[J].現(xiàn)代圖書情報技術(shù),2008(08):2-11.)

    [17]Bilong Wen,Yunjing Li,Qichao Wang等.Oil Field Information Extraction Based GATE[J].Computer&Digitial Engineering.2014(07):1223-1227.(文必龍.李云靜.王琪超等.基于GATE的油田信息抽取技術(shù)研究 [J].計算機與數(shù)字工程,2014(07):1223-1227.)

    [18]Hui Nie,Guipeng Huang.Automatic Web Information Extraction Based on GATE Semantic Annotation[J].2010(05):110-114.(聶卉、黃貴鵬.基于GATE語義標注的Web信息的自動抽取[J].圖書情報工作,2010(05):110-114.)

    [19]Xu-Yang Xu,Yong-Feng Han,Wen-Zheng Song.Overview and Prospect of Event Extraction Technology[J].Journal of Information Engineering University.2011(01):113-118.(許旭陽、韓永峰、宋文政.事件抽取技術(shù)的回顧與展望[J].信息工程大學(xué)學(xué)報,2011(01):113-118.)

    Study on the Chinese Event Extraction Method based on GATE

    HUANG Hai1,ZHANG Haiyu2
    (1.Guangdong peizheng college office,Guangzhou Guangdong 510830;2.Tai Yuan University of Technology,Taiyuan Shanxi 030024)

    Event extraction is one of the most important research field in information extraction.Aiming at the key problem of Chinese event extraction in the web page document,a method of Chinese event extraction with General Architecture for Text Engineering (GATE)is proposed.The procedure of GATE Chinese event is designed,several GATE plug-in are developed to solve key technologies of Chinese word segmentation and part of speech tagging,domain dictionary and Chinese extraction rule design.This paper take five category political events extraction for instance,make an events extraction experiment.The result shows that Chinese event extraction method based on GATE can apply universally and have a good result.

    information extraction;GATE;event extraction;Chinese tokenizer;rule matching

    TP391 文獻標識碼:A 文章編號:2095-7327(2017)-05-0041-06

    黃海(1987-),男,江西南昌人,廣東培正學(xué)院教師,研究方向:計算機科學(xué)與技術(shù)。

    張海玉(1978-),女,山西臨縣人,太原理工大學(xué)財經(jīng)學(xué)院副教授,碩士,研究方向:人工智能,物聯(lián)網(wǎng)。

    編輯:董剛

    猜你喜歡
    詞表分詞文檔
    有人一聲不吭向你扔了個文檔
    A Chinese-English List of the Sports Programmes in Winter Olympics 冬奧會項目名稱漢英對照詞表
    英語世界(2021年13期)2021-01-12 05:47:51
    結(jié)巴分詞在詞云中的應(yīng)用
    智富時代(2019年6期)2019-07-24 10:33:16
    基于RI碼計算的Word復(fù)制文檔鑒別
    值得重視的分詞的特殊用法
    敘詞表與其他詞表的互操作標準
    Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
    高考分詞作狀語考點歸納與疑難解析
    國外敘詞表的應(yīng)用與發(fā)展趨勢探討*
    不讓他人隨意下載Google文檔
    電腦迷(2012年4期)2012-04-29 06:12:13
    人体艺术视频欧美日本| 日韩中文字幕视频在线看片| xxx大片免费视频| 国产一区二区在线观看av| 亚洲精品乱久久久久久| 亚洲av男天堂| 亚洲综合色网址| 777米奇影视久久| 中国国产av一级| 精品少妇内射三级| 男人爽女人下面视频在线观看| 久热爱精品视频在线9| 建设人人有责人人尽责人人享有的| 欧美日韩亚洲高清精品| 天天躁狠狠躁夜夜躁狠狠躁| 美女视频免费永久观看网站| 在线观看一区二区三区激情| 日韩电影二区| 老汉色av国产亚洲站长工具| 亚洲国产精品一区二区三区在线| 男女之事视频高清在线观看 | 97在线人人人人妻| 久热这里只有精品99| 80岁老熟妇乱子伦牲交| 成人免费观看视频高清| 日韩av在线免费看完整版不卡| 男人操女人黄网站| 中文字幕色久视频| 9色porny在线观看| 我要看黄色一级片免费的| 下体分泌物呈黄色| 晚上一个人看的免费电影| 女的被弄到高潮叫床怎么办| 日韩欧美一区视频在线观看| 午夜福利在线免费观看网站| 亚洲一码二码三码区别大吗| 亚洲色图 男人天堂 中文字幕| 一级毛片 在线播放| 18禁裸乳无遮挡动漫免费视频| av天堂久久9| 国产免费视频播放在线视频| 中国国产av一级| 99国产综合亚洲精品| 一区二区三区乱码不卡18| 欧美少妇被猛烈插入视频| bbb黄色大片| 国产黄色免费在线视频| 久久女婷五月综合色啪小说| 少妇被粗大的猛进出69影院| 中文字幕亚洲精品专区| 91精品伊人久久大香线蕉| 日韩制服骚丝袜av| 国产精品二区激情视频| 搡老岳熟女国产| 亚洲少妇的诱惑av| 国产精品一二三区在线看| 国产老妇伦熟女老妇高清| 嫩草影院入口| 亚洲成人免费av在线播放| 国产又色又爽无遮挡免| 热99久久久久精品小说推荐| 精品国产一区二区三区久久久樱花| 午夜福利网站1000一区二区三区| 久久这里只有精品19| 2018国产大陆天天弄谢| 亚洲精品av麻豆狂野| 99久国产av精品国产电影| 国产精品一二三区在线看| 在线观看一区二区三区激情| 人人妻人人澡人人爽人人夜夜| 日韩av不卡免费在线播放| av免费观看日本| 狂野欧美激情性xxxx| 啦啦啦中文免费视频观看日本| www日本在线高清视频| 少妇人妻精品综合一区二区| 在线观看人妻少妇| 捣出白浆h1v1| 日韩av不卡免费在线播放| 亚洲国产av新网站| 成年女人毛片免费观看观看9 | 国产不卡av网站在线观看| 深夜精品福利| 伊人亚洲综合成人网| 亚洲国产av新网站| 国产成人av激情在线播放| 99久国产av精品国产电影| 天天躁夜夜躁狠狠躁躁| a级片在线免费高清观看视频| 色网站视频免费| 汤姆久久久久久久影院中文字幕| 国产精品成人在线| 一边亲一边摸免费视频| 9191精品国产免费久久| 亚洲成人一二三区av| 巨乳人妻的诱惑在线观看| 精品酒店卫生间| 伊人亚洲综合成人网| 国产成人91sexporn| 国产亚洲最大av| 高清欧美精品videossex| 水蜜桃什么品种好| 日本91视频免费播放| 国产精品二区激情视频| 一级片免费观看大全| 日韩不卡一区二区三区视频在线| 欧美久久黑人一区二区| 老司机深夜福利视频在线观看 | 国产 一区精品| 中国三级夫妇交换| xxxhd国产人妻xxx| 97人妻天天添夜夜摸| 亚洲图色成人| 亚洲第一青青草原| 成年女人毛片免费观看观看9 | 国产精品二区激情视频| 天天操日日干夜夜撸| 亚洲精品,欧美精品| 国产男女内射视频| 日韩欧美精品免费久久| 高清在线视频一区二区三区| 亚洲人成77777在线视频| 十八禁人妻一区二区| xxx大片免费视频| 精品卡一卡二卡四卡免费| 一级黄片播放器| 欧美在线黄色| 欧美日韩综合久久久久久| 免费观看a级毛片全部| 国产激情久久老熟女| 欧美乱码精品一区二区三区| 欧美亚洲日本最大视频资源| 国产毛片在线视频| 久久这里只有精品19| 久久精品亚洲熟妇少妇任你| 午夜福利一区二区在线看| 国产黄频视频在线观看| 精品久久久精品久久久| 久久毛片免费看一区二区三区| 狠狠婷婷综合久久久久久88av| 国产熟女午夜一区二区三区| 制服人妻中文乱码| 国语对白做爰xxxⅹ性视频网站| 精品国产超薄肉色丝袜足j| 国产亚洲精品第一综合不卡| 欧美最新免费一区二区三区| 一区二区av电影网| 国产av国产精品国产| 亚洲精品第二区| 搡老岳熟女国产| 在线天堂最新版资源| 中文字幕人妻熟女乱码| 观看美女的网站| 国产黄色视频一区二区在线观看| 日韩欧美一区视频在线观看| 纵有疾风起免费观看全集完整版| av又黄又爽大尺度在线免费看| 日本猛色少妇xxxxx猛交久久| 精品少妇内射三级| 亚洲图色成人| 九草在线视频观看| 99精品久久久久人妻精品| 国产成人啪精品午夜网站| 一区二区三区四区激情视频| 欧美日韩亚洲高清精品| 精品少妇黑人巨大在线播放| 国产av码专区亚洲av| 日韩伦理黄色片| 天堂8中文在线网| 欧美精品亚洲一区二区| 一区福利在线观看| 亚洲中文av在线| 中文欧美无线码| 亚洲国产中文字幕在线视频| 日韩欧美精品免费久久| 亚洲美女搞黄在线观看| 亚洲av日韩精品久久久久久密 | 妹子高潮喷水视频| 两个人免费观看高清视频| 制服丝袜香蕉在线| 免费不卡黄色视频| 丰满少妇做爰视频| 波多野结衣av一区二区av| 亚洲国产日韩一区二区| 久久久久精品久久久久真实原创| 在线观看国产h片| 午夜激情av网站| 国产日韩欧美亚洲二区| 国产伦人伦偷精品视频| 色婷婷av一区二区三区视频| 美国免费a级毛片| 伊人久久国产一区二区| 欧美日本中文国产一区发布| 美女主播在线视频| 久久99热这里只频精品6学生| 亚洲三区欧美一区| 国产成人午夜福利电影在线观看| 国产精品国产三级专区第一集| www.熟女人妻精品国产| 一本大道久久a久久精品| 自线自在国产av| www.av在线官网国产| 丝袜人妻中文字幕| 午夜久久久在线观看| 国产在视频线精品| 91成人精品电影| 叶爱在线成人免费视频播放| 免费不卡黄色视频| 亚洲av国产av综合av卡| 黄片无遮挡物在线观看| 中国国产av一级| 最近的中文字幕免费完整| 人妻 亚洲 视频| 久久精品国产亚洲av高清一级| 久久这里只有精品19| 91精品伊人久久大香线蕉| 欧美亚洲日本最大视频资源| 看十八女毛片水多多多| 十分钟在线观看高清视频www| 女人爽到高潮嗷嗷叫在线视频| 免费黄网站久久成人精品| 性高湖久久久久久久久免费观看| 精品一区二区三区四区五区乱码 | 秋霞伦理黄片| 日本午夜av视频| 亚洲国产中文字幕在线视频| 女的被弄到高潮叫床怎么办| 国产av精品麻豆| 人成视频在线观看免费观看| 久久狼人影院| 纵有疾风起免费观看全集完整版| 国产免费一区二区三区四区乱码| 亚洲,欧美,日韩| 一本色道久久久久久精品综合| 韩国高清视频一区二区三区| 欧美在线一区亚洲| 最近手机中文字幕大全| 啦啦啦 在线观看视频| 午夜久久久在线观看| 嫩草影视91久久| 日韩一本色道免费dvd| 国产免费一区二区三区四区乱码| 欧美人与善性xxx| 精品久久蜜臀av无| 高清在线视频一区二区三区| 国产黄频视频在线观看| 国产精品一区二区精品视频观看| 叶爱在线成人免费视频播放| 精品少妇久久久久久888优播| 日韩精品免费视频一区二区三区| 久久久久精品久久久久真实原创| 999精品在线视频| av网站免费在线观看视频| 卡戴珊不雅视频在线播放| 精品人妻在线不人妻| 亚洲国产av新网站| 女的被弄到高潮叫床怎么办| 91国产中文字幕| 超碰成人久久| 国产有黄有色有爽视频| 国产1区2区3区精品| 亚洲视频免费观看视频| av又黄又爽大尺度在线免费看| 久久久久久久国产电影| 两性夫妻黄色片| 五月天丁香电影| 国产精品一区二区在线观看99| 国产亚洲最大av| 国产精品久久久av美女十八| 亚洲伊人久久精品综合| 国产精品国产三级国产专区5o| 亚洲欧美精品自产自拍| 久久国产亚洲av麻豆专区| a级片在线免费高清观看视频| xxx大片免费视频| 韩国精品一区二区三区| 亚洲熟女精品中文字幕| 欧美成人午夜精品| 日韩av在线免费看完整版不卡| 欧美人与性动交α欧美软件| 欧美日韩亚洲综合一区二区三区_| 久久久久久久久免费视频了| 亚洲成人国产一区在线观看 | 日日爽夜夜爽网站| 久久av网站| www.精华液| 亚洲少妇的诱惑av| 国产一区二区在线观看av| 欧美亚洲日本最大视频资源| 亚洲美女黄色视频免费看| 亚洲欧美清纯卡通| 在线天堂最新版资源| 国产男女内射视频| 亚洲av综合色区一区| 色网站视频免费| 高清不卡的av网站| 国产探花极品一区二区| 综合色丁香网| 免费在线观看完整版高清| 国产成人啪精品午夜网站| tube8黄色片| 成人国产麻豆网| 久久久久久免费高清国产稀缺| 午夜福利网站1000一区二区三区| 老司机影院成人| 午夜福利在线免费观看网站| 亚洲婷婷狠狠爱综合网| 亚洲av电影在线进入| 91老司机精品| 99re6热这里在线精品视频| 国产精品三级大全| 人妻 亚洲 视频| 国产男人的电影天堂91| 日日啪夜夜爽| 极品人妻少妇av视频| 如何舔出高潮| 波多野结衣一区麻豆| 亚洲熟女毛片儿| 日韩av不卡免费在线播放| 热99国产精品久久久久久7| 女人久久www免费人成看片| 国产人伦9x9x在线观看| 在线观看免费视频网站a站| 桃花免费在线播放| 亚洲专区中文字幕在线 | videos熟女内射| 久久久精品国产亚洲av高清涩受| 亚洲av成人不卡在线观看播放网 | 视频在线观看一区二区三区| 欧美精品亚洲一区二区| 日韩av在线免费看完整版不卡| av女优亚洲男人天堂| 丝袜美腿诱惑在线| 一区二区三区乱码不卡18| 欧美最新免费一区二区三区| 日韩欧美精品免费久久| av.在线天堂| 丰满少妇做爰视频| 中文字幕另类日韩欧美亚洲嫩草| 国产精品久久久久成人av| 日韩熟女老妇一区二区性免费视频| 国产日韩一区二区三区精品不卡| 1024香蕉在线观看| 久久综合国产亚洲精品| 人人妻人人爽人人添夜夜欢视频| 精品少妇久久久久久888优播| 国产毛片在线视频| 久久久久久久精品精品| 成人午夜精彩视频在线观看| 欧美国产精品一级二级三级| 日韩精品免费视频一区二区三区| 夫妻午夜视频| 欧美变态另类bdsm刘玥| 亚洲精品国产一区二区精华液| 欧美97在线视频| 亚洲综合色网址| 日本欧美视频一区| 久久久国产一区二区| 高清在线视频一区二区三区| 一本—道久久a久久精品蜜桃钙片| 国产日韩欧美亚洲二区| 精品午夜福利在线看| 欧美精品高潮呻吟av久久| 操美女的视频在线观看| 欧美精品高潮呻吟av久久| 爱豆传媒免费全集在线观看| 美女中出高潮动态图| 在线观看三级黄色| 两个人免费观看高清视频| 多毛熟女@视频| 考比视频在线观看| 久久影院123| 少妇被粗大的猛进出69影院| 亚洲情色 制服丝袜| 亚洲成人国产一区在线观看 | 亚洲成人一二三区av| 制服诱惑二区| 久久久久久人妻| 日本wwww免费看| 人人妻,人人澡人人爽秒播 | 免费av中文字幕在线| 两个人免费观看高清视频| 男女高潮啪啪啪动态图| 久久久欧美国产精品| av网站在线播放免费| 在线观看一区二区三区激情| 大片电影免费在线观看免费| 一区二区日韩欧美中文字幕| 高清av免费在线| 国产日韩欧美亚洲二区| 爱豆传媒免费全集在线观看| 国产精品久久久av美女十八| 男女边吃奶边做爰视频| 亚洲男人天堂网一区| 黑人欧美特级aaaaaa片| 国产在线视频一区二区| 精品国产国语对白av| 天天添夜夜摸| 老司机亚洲免费影院| 亚洲一码二码三码区别大吗| 亚洲欧美日韩另类电影网站| 波多野结衣一区麻豆| 国产欧美日韩一区二区三区在线| 精品国产一区二区久久| 国产乱人偷精品视频| 国产成人91sexporn| 无遮挡黄片免费观看| 日韩大片免费观看网站| h视频一区二区三区| 国产视频首页在线观看| 不卡视频在线观看欧美| 热re99久久国产66热| 精品国产露脸久久av麻豆| 亚洲综合精品二区| 老鸭窝网址在线观看| 少妇人妻精品综合一区二区| 日本色播在线视频| av在线app专区| 成人国语在线视频| 日韩电影二区| 国产精品女同一区二区软件| 伦理电影大哥的女人| 欧美乱码精品一区二区三区| 交换朋友夫妻互换小说| 天堂俺去俺来也www色官网| 亚洲av国产av综合av卡| 侵犯人妻中文字幕一二三四区| 母亲3免费完整高清在线观看| 亚洲欧美一区二区三区国产| 国产 一区精品| www.自偷自拍.com| 亚洲一级一片aⅴ在线观看| 亚洲国产看品久久| 在线观看国产h片| 国产一区二区三区综合在线观看| 精品少妇内射三级| 满18在线观看网站| 国产精品一二三区在线看| 99精品久久久久人妻精品| 国产在线一区二区三区精| 一本—道久久a久久精品蜜桃钙片| 精品视频人人做人人爽| 天堂8中文在线网| 久久久久久久久久久免费av| 在现免费观看毛片| 国产黄色免费在线视频| 999久久久国产精品视频| 精品久久久久久电影网| 久久精品熟女亚洲av麻豆精品| 一级毛片电影观看| 欧美日本中文国产一区发布| 午夜福利影视在线免费观看| 伊人亚洲综合成人网| 亚洲精品在线美女| 色婷婷av一区二区三区视频| 日韩一区二区视频免费看| 国产精品一区二区在线不卡| 黄色视频不卡| 一区二区三区乱码不卡18| 欧美精品一区二区大全| 精品国产乱码久久久久久男人| 午夜福利影视在线免费观看| 母亲3免费完整高清在线观看| 天堂俺去俺来也www色官网| 最黄视频免费看| 在线观看人妻少妇| 黑人猛操日本美女一级片| 久久精品国产亚洲av涩爱| 美女福利国产在线| 老司机影院毛片| 美女国产高潮福利片在线看| 这个男人来自地球电影免费观看 | 中文字幕人妻熟女乱码| 亚洲成人免费av在线播放| 制服丝袜香蕉在线| 一边摸一边做爽爽视频免费| 大香蕉久久成人网| 久久久久久人人人人人| 99热网站在线观看| 日韩电影二区| 我的亚洲天堂| 午夜福利在线免费观看网站| a级毛片黄视频| 超色免费av| 嫩草影视91久久| 高清av免费在线| 亚洲在久久综合| 午夜福利影视在线免费观看| 亚洲精品自拍成人| 悠悠久久av| 狂野欧美激情性xxxx| 1024香蕉在线观看| 热re99久久国产66热| 亚洲精品aⅴ在线观看| 黄网站色视频无遮挡免费观看| 午夜老司机福利片| 国产色婷婷99| 综合色丁香网| 在线天堂最新版资源| 秋霞在线观看毛片| 日本一区二区免费在线视频| 亚洲国产毛片av蜜桃av| 国产日韩一区二区三区精品不卡| 国产精品一区二区在线观看99| 欧美日韩av久久| 中文字幕人妻熟女乱码| 亚洲第一av免费看| 欧美日韩视频高清一区二区三区二| 色94色欧美一区二区| 国产 精品1| 别揉我奶头~嗯~啊~动态视频 | 亚洲专区中文字幕在线 | 国产在线视频一区二区| 亚洲自偷自拍图片 自拍| av在线观看视频网站免费| 自线自在国产av| 精品午夜福利在线看| 在线精品无人区一区二区三| 夜夜骑夜夜射夜夜干| 一区二区三区精品91| 亚洲图色成人| 激情五月婷婷亚洲| 亚洲成色77777| 亚洲精品日本国产第一区| 街头女战士在线观看网站| 在线观看人妻少妇| 成人18禁高潮啪啪吃奶动态图| 天天添夜夜摸| 欧美成人午夜精品| 99久久精品国产亚洲精品| 久久精品aⅴ一区二区三区四区| 高清不卡的av网站| 交换朋友夫妻互换小说| 中文字幕制服av| 美女扒开内裤让男人捅视频| 十八禁网站网址无遮挡| 一本大道久久a久久精品| 成人手机av| videos熟女内射| 国产一区二区 视频在线| 久久国产精品大桥未久av| 国产精品一区二区精品视频观看| 亚洲欧美成人综合另类久久久| 欧美黑人精品巨大| 热re99久久国产66热| 麻豆av在线久日| 高清在线视频一区二区三区| 制服人妻中文乱码| 欧美日韩一区二区视频在线观看视频在线| 建设人人有责人人尽责人人享有的| 十分钟在线观看高清视频www| 熟女av电影| 精品久久久精品久久久| 91国产中文字幕| 在线观看一区二区三区激情| xxxhd国产人妻xxx| 纵有疾风起免费观看全集完整版| 久久久久久久大尺度免费视频| 国产男人的电影天堂91| 九草在线视频观看| 黄色视频在线播放观看不卡| 人人妻人人澡人人看| 国产精品国产av在线观看| 中文字幕av电影在线播放| 国产女主播在线喷水免费视频网站| 午夜精品国产一区二区电影| 免费久久久久久久精品成人欧美视频| 啦啦啦 在线观看视频| 97人妻天天添夜夜摸| 精品一区二区三区四区五区乱码 | 亚洲人成77777在线视频| 国产精品国产三级国产专区5o| 亚洲成国产人片在线观看| 亚洲精品美女久久av网站| 9热在线视频观看99| 日本wwww免费看| 宅男免费午夜| 日韩免费高清中文字幕av| 成人黄色视频免费在线看| 欧美在线黄色| 毛片一级片免费看久久久久| 亚洲人成电影观看| 巨乳人妻的诱惑在线观看| 国产免费视频播放在线视频| 又大又爽又粗| 久久久国产欧美日韩av| 色视频在线一区二区三区| 交换朋友夫妻互换小说| 精品亚洲乱码少妇综合久久| 精品一区二区三区av网在线观看 | 午夜福利影视在线免费观看| 成人黄色视频免费在线看| 日韩欧美一区视频在线观看| 精品久久久精品久久久| 日本午夜av视频| 亚洲人成网站在线观看播放| 无限看片的www在线观看| av福利片在线| av视频免费观看在线观看| 亚洲欧美清纯卡通| 精品国产乱码久久久久久小说| av视频免费观看在线观看| 中文字幕精品免费在线观看视频| 成人黄色视频免费在线看| 国产av一区二区精品久久| 婷婷色综合www| 观看av在线不卡| 国产不卡av网站在线观看| 热99国产精品久久久久久7| 少妇人妻 视频| 国产一卡二卡三卡精品 | 波野结衣二区三区在线| 麻豆精品久久久久久蜜桃| 国产亚洲欧美精品永久| 90打野战视频偷拍视频|