• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于GATE的中文事件抽取方法

    2017-11-04 07:30:48張海玉
    關(guān)鍵詞:詞表分詞文檔

    黃 海,張海玉

    (1.廣東培正學(xué)院教務(wù)處,廣東 廣州 510830;2.太原理工大學(xué)財經(jīng)學(xué)院信息系,山西 太原 030024)

    基于GATE的中文事件抽取方法

    黃 海1,張海玉2

    (1.廣東培正學(xué)院教務(wù)處,廣東 廣州 510830;2.太原理工大學(xué)財經(jīng)學(xué)院信息系,山西 太原 030024)

    事件抽取是信息抽取領(lǐng)域的重要研究方向,針對目前網(wǎng)頁文檔中文事件抽取的關(guān)鍵問題,提出利用開源的通用文本處理框架(GATE)進行中文事件抽取的方法,設(shè)計GATE中文事件處理流程,開發(fā)GATE插件,解決中文分詞與詞性標注、領(lǐng)域詞典、中文抽取規(guī)則設(shè)計等關(guān)鍵技術(shù),實現(xiàn)了中文事件的類型識別和元素抽取。并以四類政治事件為例,進行中文事件抽取實驗。實驗結(jié)果表明,基于GATE的中文事件抽取具有良好的通用性,能夠取得了較好的抽取效果。

    信息抽??;GATE;事件抽?。恢形姆衷~;規(guī)則匹配

    引言

    隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,網(wǎng)絡(luò)數(shù)據(jù)呈現(xiàn)爆炸式的發(fā)展態(tài)勢,大量的信息以文本的形式呈現(xiàn)在人們面前。為了應(yīng)對信息爆炸帶來的挑戰(zhàn),迫切需要一些自動化的技術(shù)幫助人們在海量數(shù)據(jù)中迅速找到其所需要的信息。信息抽取成為了從文本中自動獲取信息的一種重要手段,它是指從一段文本中抽取指定的數(shù)據(jù)、事實等信息,形成結(jié)構(gòu)化的數(shù)據(jù)并存入數(shù)據(jù)庫中,供用戶查詢和使用的過程[1]。事件抽取(Event Extraction)是信息抽取的一個重要研究方向,主要研究如何從含有事件信息的自由文本中抽取出用戶所需要的事件信息,將文本中描述的事件以結(jié)構(gòu)化的形式呈現(xiàn)出來[2]。

    事件抽取的常見方法之一是模式匹配法,它利用模式規(guī)則集進行事件類型或事件元素的匹配,事件抽取模式體現(xiàn)了語言知識和領(lǐng)域知識的融合。Chinatsu Aone[3]利用可配置的模式生成模塊和基于模式的標注工具設(shè)計了一個大規(guī)模點對點關(guān)系和事件抽取系統(tǒng);Ernest Arendarenko等[4]利用本體作為GATE詞典,設(shè)計基于JAPE的事件識別規(guī)則,進行了商業(yè)領(lǐng)域的事件抽??;梁晗[5]提出了一種基于框架的信息抽取模式并建立統(tǒng)一的災(zāi)難性事件框架,利用框架的繼承-歸納特性簡化系統(tǒng)實現(xiàn)過程。吳平博[6]等人利用句型模板的抽取規(guī)則從文本中抽取時間短語、空間短語和事件信息,并討論了事件的合并的問題。孫榮[7]等提出一種基于抽取規(guī)則對句子中的事件信息進行抽取的方法,利用本體對動詞與事件角色匹配規(guī)則、事件角色抽取規(guī)則、時間信息抽取規(guī)則和地點信息抽取規(guī)則進行定義,然后應(yīng)用這些規(guī)則抽取句子中的動詞詞義信息、事件角色信息、時間信息和地點信息。

    本文提出利用文本工程通用框架GATE來進行中文事件抽取工作,研究自然文本處理框架GATE的基本結(jié)構(gòu)和基于GATE的事件抽取流程,分析GATE在中文事件抽取領(lǐng)域中的不足,并構(gòu)建了基于ICTCLAS的中文分詞組件、領(lǐng)域詞表和事件抽取規(guī)則。以四類國際政治事件為例,進行了中文政治事件抽取實驗。

    1 信息抽取及GATE概述

    1.1 信息抽取

    信息抽取是一種文本處理技術(shù),它通過對非結(jié)構(gòu)化的自由文本數(shù)據(jù)進行處理,獲得結(jié)構(gòu)化的信息數(shù)據(jù)。信息抽取能夠幫助人們快速獲取所需要信息,同時能夠?qū)π畔⑦M行分析和組織,提高文本數(shù)據(jù)的可用性[8]。

    人類是以事件為單位認識和理解客觀世界的,事件是隨著時間變化的具體事實,涉及到多方面的事物概念,事件間具有內(nèi)在的聯(lián)系,事件由動作、概念、關(guān)系組成。事件數(shù)據(jù)在國際關(guān)系、地緣政治、地理信息應(yīng)用等領(lǐng)域中有著廣泛的應(yīng)用[9,10],因此從互聯(lián)網(wǎng)文本抽取領(lǐng)域事件數(shù)據(jù)具有重要意義。

    1.2 GATE概述

    GATE(General Architecture for Text Engineering,文本工程通用框架)項目開始于1995年英國的謝菲爾德大學(xué),經(jīng)歷了十多年的不斷發(fā)展,憑借其優(yōu)秀的組織架構(gòu)和開源的優(yōu)勢,GATE已經(jīng)被應(yīng)用于廣泛的研究和項目開發(fā),在科研、教育、商業(yè)等領(lǐng)域獲得廣泛應(yīng)用[11]。

    GATE將其框架內(nèi)所有的自然語言處理軟件資源劃分為不同的幾種組件,這些組件是通過Java Beans的形式來實現(xiàn)的,其集合被稱為CREOLE(a Collection of Reusable Objects for Language Engineering)。CREOLE在GATE中分為三種形式:語言組件(LR),處理組件(PR)和可視化組件(VR):語言組件是指僅僅與數(shù)據(jù)相關(guān)的資源,如詞表、文檔和本體等;處理組件指數(shù)據(jù)處理程序或者算法,如產(chǎn)生器、轉(zhuǎn)換器、分析器和語言識別器等??梢暬M件指構(gòu)成GATE的可視化界面GUI的相關(guān)資源。

    JAPE(a Java Annotation Patterns Engine,Java標注模式引擎)是GATE的規(guī)則定義語言,它能夠利用GATE生成的Token、LookUp、Person、Date等標注,使得其可以更精確、更廣泛的覆蓋面抽取信息[12]。一個JAPE語法由一系列的語句組成,每個語句都是一個由模式/行為規(guī)則組成的集合。這些語句按順序運行,形成了一組標注有限狀態(tài)機的轉(zhuǎn)換[13]。語句的左側(cè)部分(LHS:Left Hand Side)由一些標注匹配模式組成,右側(cè)部分(RHS:Right Hand Side)是匹配后執(zhí)行的操作,LHS和RHS以-->符號隔開。JAPE的匹配操作能夠使用Java代碼描述,這在很大程度上擴展了JAPE對規(guī)則的復(fù)雜處理能力。

    2 基于GATE的中文事件抽取關(guān)鍵技術(shù)

    GATE為英文文檔資源提供了信息處理流程實例ANNIE,它是基于規(guī)則的信息抽取系統(tǒng),使用有限狀態(tài)算法和 JAPE語言來實現(xiàn)各種不同的信息抽取任務(wù)[14]。ANNIE采用流水線工作方式,嚴格按照順序經(jīng)過分詞 (Tokeniser)、詞表查詢(Gazetteer Lookup)、 分句 (Sentence Splitter)、 詞性標注(POS Tagger)、 語義標注 (Semantic Tagger)、 共指消解(Ortho Matcher)、代詞消引(Pronominal Coreferencer)之后,實現(xiàn)英文文檔的信息抽取[15]。

    但ANNIE并不能有效處理中文文檔,它在解決中文信息抽取有以下不足:1)缺乏對中文分詞處理的良好支持,目前的版本并不能實現(xiàn)真正意義上的中文分詞;2)中文詞表不夠完善,缺少特定領(lǐng)域內(nèi)的專有名詞詞表;3)命名實體識別過程中,針對英文特點的JAPE規(guī)則不能有效支持中文的命名實體識別。

    針對以上不足,基于GATE的中文事件抽取系統(tǒng)需要完成以下三項關(guān)鍵技術(shù):1)有效處理中文分詞與詞性標注的問題;2)設(shè)計專業(yè)、完善的中文領(lǐng)域詞表;3)針對中文特點重寫JAPE抽取規(guī)則,提高事件識別和抽取的準確率。

    2.1 中文分詞與詞性標注

    與英文等以空格作為詞間天然分隔符的語言不同,漢語中詞與詞之間不存在明確的分隔標記,而是形成一個連續(xù)的漢字字符串,因此必須對中文文本進行分詞處理。中文分詞就是將連續(xù)的漢字序列按照一定的規(guī)范重新組合成詞序列的過程,中文詞性標注是指為中文文本中的每一個詞增添一個合適的標記,用以說明它的詞性,如名詞、動詞、形容詞等,因此,中文詞法分析是中文信息處理的基礎(chǔ)與關(guān)鍵。

    中文分詞是中文事件抽取的基礎(chǔ),目前已有相關(guān)論文[13,16,17]對GATE的中文分詞問題進行了研究,但其解決方法都是使用中文分詞工具提前對文檔進行分詞預(yù)處理,以空格將各個詞分隔,組成英文文本的空格分割格式,然后使用GATE默認的Unicode Tokeniser分詞器根據(jù)空格對文檔重新分詞。這種方法需要提前對文檔進行預(yù)處理,增加了人工操作的復(fù)雜度,而且以空格劃分的分詞文檔無法獲取每個詞的詞性信息,因此無法在抽取規(guī)則中使用詞的POS屬性,影響了信息抽取的精度。

    本文基于中科院計算所的中文分詞工具ICTCLAS,開發(fā)了GATE的中文分詞組件來進行中文文檔的分詞與詞性標注。ICTCLAS(Institute of Computing Technology,Chinese Lexical Analysis System)是中國科學(xué)院計算技術(shù)研究所在多年研究工作積累的基礎(chǔ)上研制出的漢語詞法分析系統(tǒng),它由C++編寫,主要功能包括中文分詞、詞性標注、命名實體識別、新詞識別、同時支持用戶詞表,分詞正確率高達97.58%,未登錄詞識別召回率均高于90%,其中中國人名的識別召回率接近98%,處理速度為31.5Kbytes/s。

    GATE調(diào)用ICTCLAS進行中文分詞的流程如下:

    (1)讀取GATE中的文檔內(nèi)容

    GATE中待處理的文本以文檔(Document)對象保存,文檔對象的內(nèi)容(context)以純文本的形式記錄了文檔的原始信息,這些原始文本是分詞軟件輸入的數(shù)據(jù)流。

    (2)調(diào)用ICTCLAS庫

    ICTCLAS是純C++開發(fā)的庫,為了在Java環(huán)境的GATE中使用,本文使用JNI技術(shù)來調(diào)用ICTCLAS庫,JNI(Java Native Interface)是一個本機編程接口,它允許Java代碼使用以其它語言編寫的代碼和代碼庫。ICTCLAS工具提供了ParagraphProcessing()和FileProcessing()兩個接口,分別處理文本段落或者文件,本文使用ParagraphProcessing()接口來處理GATE中的文檔內(nèi)容。

    (3)解析ICTCLAS處理結(jié)果

    ICTCLAS的ParagraphProcessing()函數(shù)對輸入的句子進行分詞并輸出,輸出結(jié)果為“單詞/POS”形式。例如句子“中國是世界上人口最多的國家。”的分詞結(jié)果為 “中國/ns是/v世界/n上/f人口/n最/d多/a的/u國家/n。/w”,需要根據(jù)數(shù)據(jù)格式來解析每個分詞的起始位置、結(jié)束位置和POS詞性信息。

    (4)增加Token標注和Feature值

    GATE的文檔標注集包含起始節(jié)點(start Node)、結(jié)束節(jié)點(end Node)、ID、類型(type)以及特征鍵值對(FeatureMap)等信息,根據(jù)(3)中解析的結(jié)果,利用GATE的接口函數(shù)在Document中增加相應(yīng)的Token標注,并設(shè)置起始節(jié)點、結(jié)束節(jié)點和特征值。

    2.2 領(lǐng)域詞表設(shè)計

    詞表是GATE進行事件抽取的重要資源,詞表的豐富完整影響著抽取的效果。詞表是一組包含了事物名詞的集合,如城市名稱、組織名稱、日期等等。詞表一方面描述了領(lǐng)域內(nèi)的專有名詞,另一方面可以表達各類概念名詞之間的關(guān)系,并將其映射到領(lǐng)域本體中。

    詞表是事件抽取的重要元素,詞表的豐富和準確程度直接關(guān)系著事件抽取的效果。事件抽取需要使用的詞表包括命名實體詞表和事件觸發(fā)詞詞表兩類,事件觸發(fā)詞(Event Trigger)是指用來清晰地表示所發(fā)生的事情的詞,通常為動詞。

    GATE中的詞表由*.lst文件、mappings.def文件和lists.def文件三類文本文件組成。*.lst文件定義實體,每個*.lst文件代表一個實體類型,以“詞表”的形式對應(yīng)領(lǐng)域知識中的概念實例。mapings.def描述*.lst文件和領(lǐng)域本體概念之間的關(guān)系。lists.def為*.lst文件的索引文件,指明每個*.lst文件所對應(yīng)的主類(majorType)和子類(minorType)類型,以“:”分割。在GATE中進行命名實體標注的時候,這些文件將會被編譯成有限狀態(tài)自動機,有限狀態(tài)自動識別出的文本片段將會以Lookup標簽標注出,并增加相應(yīng)的特征值[18]。

    2.3 抽取規(guī)則設(shè)計

    事件抽取主要包含事件類型識別和事件元素抽取兩部分內(nèi)容,其中,事件類型識別是事件元素抽取的基礎(chǔ),事件元素抽取是事件抽取的主要內(nèi)容。事件類別識別是指從文本中檢測出事件句,并依據(jù)一定的特征判斷其所歸屬的類別。事件類別識別是典型的分類問題,其重點在于事件句的檢測和事件句的分類[19]?,F(xiàn)有的檢測事件句的方法主要是基于觸發(fā)詞的方法。觸發(fā)詞是指在文本中清晰的表示事件發(fā)生的詞語。在自然文本中,除句子中的謂語動詞外,其他成分的動詞也有可能作為事件觸發(fā)詞。事件元素抽取是事件抽取的核心任務(wù),它從眾多命名實體(Entity)、時間表達式(Time Expression)和屬性值(Value)中識別出真正的事件元素,并給予其準確的角色標注。事件要素限定在事件范圍(Event Extent)之內(nèi),事件范圍通常以具有完整意義的句子或者分句為邊界。

    事件觸發(fā)詞是決定事件類別的重要特征,因此事件類別識別任務(wù)可以轉(zhuǎn)換為事件觸發(fā)詞類別的識別。在抽取事件信息時,根據(jù)觸發(fā)詞確定所屬事件類別,并調(diào)用相應(yīng)的規(guī)則進行匹配。

    基于規(guī)則的事件抽取方法的核心是尋找事件模板。模板指自然語言中描述事件的模式特征。在設(shè)計事件規(guī)則時,首先整理出語句的模式特征,然后將模式轉(zhuǎn)換為JAPE規(guī)則描述語言。例如“2014年9月11日,國家主席習(xí)近平在杜尚別會見俄羅斯總統(tǒng)普京。”這一會見事件,其模式為“時間短語+標點符號+名詞+人名+介詞+地名+會見動作+國家+名詞+人名”,其中事件發(fā)生的時間為“2014年9月11日”,地點為“杜尚別”,主語為“習(xí)近平”,賓語為“普京”,按照JAPE語言其匹配規(guī)則表示為:

    Rule:MeetingRule1

    (

    ({Date.kind=="date"}):tagdate

    {Token.category=="wd"}

    ({Token.category=="n"})+

    ({Person}):tagSubject

    {Token.category=="p"}

    ({Location}):tagLoc

    {Lookup.majorType==diplomacy}

    {Country}

    {Token.category=="n"}

    ({Person}):tagObject

    {Token.category=="wj"}

    ):tag

    -->

    :tagdate.Politic={element=Date,rule=MeetingRule1},

    :tagSubject.Politic={element=Subject,rule=MeetingRule1},

    :tagLoc.Politic={element=Location,rule=MeetingRule1},

    :tagObject.Politic={element=Object,rule=MeetingRule1},

    :tag.Politic={type=Meet,rule=MeetingRule1}

    圖1展示了外交部網(wǎng)站新聞“習(xí)近平會見俄羅斯總統(tǒng)普京”一文中的會見事件抽取結(jié)果,事件抽取結(jié)果保存在EVENT標注集中,標注名稱“Politic”表明事件為政治事件,事件子類使用type屬性標識,事件元素使用element屬性標識,共包括時間(Date)、地點(Location)、主體(Object)、客體(Subject)四個元素。

    圖1 會見事件抽取結(jié)果Figure1 Meeting Event Extract Result

    3 實驗及評估

    為了驗證GATE在中文事件抽取中的作用,設(shè)計了國際政治中四類常見事件抽取進行實驗:訪問、會見、抗議、沖突,這四類事件代表了國際關(guān)系中常見的事件,是研究國際關(guān)系、地緣政治的重要數(shù)據(jù)資源。

    本文分別從外交部、新華網(wǎng)、鳳凰網(wǎng)等權(quán)威新聞門戶網(wǎng)站收集了訪問、會見、抗議和沖突四類事件數(shù)據(jù)語料,將各類語料數(shù)據(jù)分成標注語料和測試語料兩部分,基于標注語料來總結(jié)整理規(guī)則、設(shè)計觸發(fā)詞詞典。各類事件的語料情況和觸發(fā)詞情況如表1所示。

    表1 四類事件語料情況

    實驗結(jié)果采用MUC在自然語言處理領(lǐng)域的三大評測指標進行衡量,即準確率(P)、召回率(R)和綜合值(F),具體定義如下:

    各類事件抽取的準確率、召回率和綜合值結(jié)果如表3所示。

    表2 事件抽取結(jié)果

    通過表3可以看出:(1)使用GATE能夠很好地進行中文事件抽取,訪問、會見、抗議三類事件的抽取結(jié)果正確率和召回率都在80%以上;(2)事件抽取的效果主要受規(guī)則的覆蓋程度影響。試驗中的沖突事件比較分散,涉及的規(guī)則模式也比較多,語料中的規(guī)則不能完全覆蓋全部的沖突事件,造成沖突事件的召回率較低。因此在基于規(guī)則的事件抽取中,語法規(guī)則庫的設(shè)計和完善是提高抽取正確率和召回率的關(guān)鍵。

    4 結(jié)束語

    事件抽取是從文本中獲取領(lǐng)域數(shù)據(jù)的重要途徑,本文針對GATE在中文事件抽取中的不足,利用ICTCLAS中文分詞工具開發(fā)了GATE處理組件,進行中文分詞與詞性標注、設(shè)計地緣事件的分類體系和事件詞表、構(gòu)造地緣事件抽取規(guī)則,進行地緣事件信息的抽取?;谀J狡ヅ涞氖录槿》椒ǖ囊粋€主要問題是抽取模式不能完全覆蓋全部句式,本文基于語料中國際政治事件的表達句式總結(jié)了若干條抽取規(guī)則,但這些規(guī)則的覆蓋面仍不能完全覆蓋全部事件。本文的下一步工作是對事件模式進行擴展完善,通過種子規(guī)則來實現(xiàn)啟發(fā)式的規(guī)則擴展,以提高事件抽取的召回率。

    [1]Qian Liu.Hui Jiao.Hui-Bo Jia.Research on Approaches of Information Extraction System[J].Application Research of Computers.2007,24(7):6-9.(劉遷、焦慧、賈惠波.信息抽取技術(shù)的發(fā)展現(xiàn)狀及構(gòu)建方法的研究[J].計算機應(yīng)用研究,2007,24(7):6-9.)

    [2]Gang Wu.Research and Application on Chinese Topic Event Extraction[D].Suzhou:Soochow University,2009.(吳剛.基于主題的中文事件抽取技術(shù)研究及應(yīng)用[D].蘇州:蘇州大學(xué),2009.)

    [3]Aone Chinatsu,Ramos-Santacruz Mila.REES:a largescale relation and event extraction system[C].Association for Computational Linguistics,2000.

    [4]Arendarenko Ernest.Kakkonen Tuomo.Ontology-Based Information and Event Extraction for Business Intelligence[C].Varna,Bulgaria:2012.

    [5]Han Liang.Qun-Xiu Chen.Ping-Bo Wu.Information Extraction System Based on Event Frame[J].JOURNAL OF CHINESE INFORMATION PROCESSING.2006(02):40-46.(梁晗、陳群秀、吳平博、基于事件框架的信息抽取系統(tǒng)[J].中文信息學(xué)報,2006(02):40-46.)

    [6]Ping-Bo Wu、Qun-Xiu Chen、Liang Ma.Research on Extraction and Integration of Developing Event Based on Analysis of Space-time Information[J].JOURNAL OF CHINESE INFORMATION PROCESSING.2006(01):21-28.(吳平博、陳群秀、馬亮.基于時空分析的線索性事件的抽取與集成系統(tǒng)研究[J].中文信息學(xué)報,2006(01):21-28.)

    [7]Rong Sun,Wen Zhou,Zong-Tian Liu.Using Rules to Extract Event Information from Sentences[J].Journal of Chinese Computer Systems.2011(11):2309-2314.(孫榮、周文、劉宗田.用規(guī)則抽取句子中事件信息[J].小型微型計算機系統(tǒng),2011(11):2309-2314.)

    [8]Li Long,Hongshen Pang.JOURNAL OF LIBRARY SCIENCE.2008,30(5):13-16.(龍麗、龐弘燊.國外Web信息抽取研究綜述[J].圖書館學(xué)刊,2008,30(5):13-16.)

    [9]Zhen-Feng Wang.Geographic Event Inofrmaiton Retrieval Based on ontology[D].Wuhan:Wuhan University,2009.(王振峰.基于本體的地理事件信息檢索 [D].武漢:武漢大學(xué),2009.)

    [10]Xiaoya An、Ying Li、Qun Sun等.Research on Geographical Event Model for Spatial Data Active Updating[J].Acta Scientiarum Naturalium Universitatis Pekinensis.2011(03):491-498.(安曉亞、李穎、孫群等.面向空間數(shù)據(jù)主動更新的地理事件模型研究 [J].北京大學(xué)學(xué)報 (自然科學(xué)版),2011(03):491-498.)

    [11]Dongxing Xu.A Gate-based lnformation Extraction System:Research and Implementation[D].Shanghai:East China Normal University,2007.(徐東興.基于Gate框架的信息抽取系統(tǒng)的研究與實現(xiàn) [D].上海:華東師范大學(xué),2007.)

    [12]Lan Chen.Research and Implementation of Ontologybased lnformation Extraction System[D].ChengDu:University of Electronic Science and Technology of China,2004.(陳蘭.基于ontology的信息抽取系統(tǒng)的研究與實現(xiàn)[D].成都:電子科技大學(xué),2004.)

    [13]Sa Li.The Implementation of the Chinese Information Extraction System Based on GATE[D].Beijing:Graduate U-niversity of Chinese Academy of Sciences,2006.(李颯.基于GATE的中文信息抽取系統(tǒng)的開發(fā)和實現(xiàn) [D].北京:中國科學(xué)院研究生院,2006.)

    [14]Jing Chen.Research of Ontology-based lnformation Extraction[D].Suzhou:Soochow University,2007.(陳靜.基于本體的信息抽取研究[D].蘇州:蘇州大學(xué),2007.)

    [15]Cunningham Hamish,Maynard Diana,Bontcheva Kalina,et al.Developing Language Processing Components with GATE[EB/OL].2014.

    [16]Analysis of State-of-the-Art Knowledge Extraction Technologies[J].NEW TECHNOLOGY OF LIBRARY AND INFORMATION SERVICE.2008(08):2-11.(張智雄、吳振新、劉建華等.當前知識抽取的主要技術(shù)方法解析[J].現(xiàn)代圖書情報技術(shù),2008(08):2-11.)

    [17]Bilong Wen,Yunjing Li,Qichao Wang等.Oil Field Information Extraction Based GATE[J].Computer&Digitial Engineering.2014(07):1223-1227.(文必龍.李云靜.王琪超等.基于GATE的油田信息抽取技術(shù)研究 [J].計算機與數(shù)字工程,2014(07):1223-1227.)

    [18]Hui Nie,Guipeng Huang.Automatic Web Information Extraction Based on GATE Semantic Annotation[J].2010(05):110-114.(聶卉、黃貴鵬.基于GATE語義標注的Web信息的自動抽取[J].圖書情報工作,2010(05):110-114.)

    [19]Xu-Yang Xu,Yong-Feng Han,Wen-Zheng Song.Overview and Prospect of Event Extraction Technology[J].Journal of Information Engineering University.2011(01):113-118.(許旭陽、韓永峰、宋文政.事件抽取技術(shù)的回顧與展望[J].信息工程大學(xué)學(xué)報,2011(01):113-118.)

    Study on the Chinese Event Extraction Method based on GATE

    HUANG Hai1,ZHANG Haiyu2
    (1.Guangdong peizheng college office,Guangzhou Guangdong 510830;2.Tai Yuan University of Technology,Taiyuan Shanxi 030024)

    Event extraction is one of the most important research field in information extraction.Aiming at the key problem of Chinese event extraction in the web page document,a method of Chinese event extraction with General Architecture for Text Engineering (GATE)is proposed.The procedure of GATE Chinese event is designed,several GATE plug-in are developed to solve key technologies of Chinese word segmentation and part of speech tagging,domain dictionary and Chinese extraction rule design.This paper take five category political events extraction for instance,make an events extraction experiment.The result shows that Chinese event extraction method based on GATE can apply universally and have a good result.

    information extraction;GATE;event extraction;Chinese tokenizer;rule matching

    TP391 文獻標識碼:A 文章編號:2095-7327(2017)-05-0041-06

    黃海(1987-),男,江西南昌人,廣東培正學(xué)院教師,研究方向:計算機科學(xué)與技術(shù)。

    張海玉(1978-),女,山西臨縣人,太原理工大學(xué)財經(jīng)學(xué)院副教授,碩士,研究方向:人工智能,物聯(lián)網(wǎng)。

    編輯:董剛

    猜你喜歡
    詞表分詞文檔
    有人一聲不吭向你扔了個文檔
    A Chinese-English List of the Sports Programmes in Winter Olympics 冬奧會項目名稱漢英對照詞表
    英語世界(2021年13期)2021-01-12 05:47:51
    結(jié)巴分詞在詞云中的應(yīng)用
    智富時代(2019年6期)2019-07-24 10:33:16
    基于RI碼計算的Word復(fù)制文檔鑒別
    值得重視的分詞的特殊用法
    敘詞表與其他詞表的互操作標準
    Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
    高考分詞作狀語考點歸納與疑難解析
    國外敘詞表的應(yīng)用與發(fā)展趨勢探討*
    不讓他人隨意下載Google文檔
    電腦迷(2012年4期)2012-04-29 06:12:13
    亚洲激情五月婷婷啪啪| 97人妻天天添夜夜摸| 亚洲精品久久久久久婷婷小说| 另类精品久久| 精品国产国语对白av| 一级毛片黄色毛片免费观看视频| 中文字幕精品免费在线观看视频 | 免费黄色在线免费观看| 亚洲美女视频黄频| 18+在线观看网站| 亚洲精品视频女| 亚洲少妇的诱惑av| xxxhd国产人妻xxx| 久久99蜜桃精品久久| 两个人免费观看高清视频| 在线 av 中文字幕| 人妻少妇偷人精品九色| 插逼视频在线观看| 丝袜美足系列| 91午夜精品亚洲一区二区三区| 女的被弄到高潮叫床怎么办| 国产精品女同一区二区软件| 欧美日韩成人在线一区二区| 2021少妇久久久久久久久久久| 女性生殖器流出的白浆| 国产成人午夜福利电影在线观看| 热99国产精品久久久久久7| 一级a做视频免费观看| 久久国产精品大桥未久av| 少妇人妻精品综合一区二区| 国产精品三级大全| 黄色配什么色好看| 18禁裸乳无遮挡动漫免费视频| 国产精品麻豆人妻色哟哟久久| 午夜福利视频精品| 国国产精品蜜臀av免费| 婷婷色麻豆天堂久久| 久久久久久久久久成人| 99热网站在线观看| 99re6热这里在线精品视频| 欧美精品亚洲一区二区| 久久久精品94久久精品| 色94色欧美一区二区| 欧美成人午夜精品| 中国国产av一级| 色5月婷婷丁香| 国产精品一区www在线观看| 国产福利在线免费观看视频| 国产成人精品一,二区| 成人国产麻豆网| 22中文网久久字幕| 亚洲久久久国产精品| 欧美激情 高清一区二区三区| 亚洲五月色婷婷综合| 大香蕉97超碰在线| 人人妻人人添人人爽欧美一区卜| 超色免费av| 精品国产露脸久久av麻豆| 色94色欧美一区二区| 美女脱内裤让男人舔精品视频| av在线app专区| 日韩在线高清观看一区二区三区| 日韩精品免费视频一区二区三区 | 插逼视频在线观看| av线在线观看网站| 亚洲综合色网址| 欧美精品人与动牲交sv欧美| 亚洲精品美女久久av网站| 国产精品不卡视频一区二区| 丰满饥渴人妻一区二区三| 精品久久久精品久久久| 黄片播放在线免费| 搡老乐熟女国产| 制服人妻中文乱码| 日韩av免费高清视频| 一级片免费观看大全| 国产有黄有色有爽视频| 2022亚洲国产成人精品| 美女大奶头黄色视频| 波多野结衣一区麻豆| 观看av在线不卡| 色哟哟·www| 免费不卡的大黄色大毛片视频在线观看| 国产一区二区三区综合在线观看 | 少妇 在线观看| 精品午夜福利在线看| 国产成人精品福利久久| 91精品三级在线观看| 亚洲精品美女久久久久99蜜臀 | 国产精品久久久av美女十八| 97精品久久久久久久久久精品| 日韩伦理黄色片| 成人亚洲精品一区在线观看| videos熟女内射| 美女视频免费永久观看网站| 国语对白做爰xxxⅹ性视频网站| 女性生殖器流出的白浆| 国产高清三级在线| 两个人看的免费小视频| 少妇人妻 视频| 22中文网久久字幕| 国产精品蜜桃在线观看| 亚洲综合精品二区| 久久午夜综合久久蜜桃| 国产精品免费大片| 国产精品人妻久久久影院| 大香蕉久久网| 欧美97在线视频| 久久精品国产亚洲av天美| 97在线视频观看| 26uuu在线亚洲综合色| 午夜av观看不卡| 国产精品国产三级专区第一集| 少妇高潮的动态图| 免费看不卡的av| 欧美成人精品欧美一级黄| 青青草视频在线视频观看| 97在线视频观看| 欧美人与性动交α欧美精品济南到 | 又黄又粗又硬又大视频| 亚洲欧美日韩卡通动漫| 精品国产乱码久久久久久小说| 99视频精品全部免费 在线| 老熟女久久久| 午夜精品国产一区二区电影| 蜜桃国产av成人99| 国产精品久久久久久精品古装| 国产男人的电影天堂91| 欧美亚洲 丝袜 人妻 在线| 亚洲人成77777在线视频| 亚洲欧美成人精品一区二区| 天天躁夜夜躁狠狠躁躁| 啦啦啦啦在线视频资源| 激情五月婷婷亚洲| 亚洲精品色激情综合| 亚洲熟女精品中文字幕| 婷婷色麻豆天堂久久| 国产免费一级a男人的天堂| 精品国产一区二区三区四区第35| 中文字幕亚洲精品专区| 麻豆乱淫一区二区| 最近手机中文字幕大全| 亚洲美女视频黄频| 制服丝袜香蕉在线| 国产成人精品福利久久| 18+在线观看网站| 国产黄色视频一区二区在线观看| 国产精品女同一区二区软件| 成人手机av| 国产女主播在线喷水免费视频网站| 国产爽快片一区二区三区| 午夜激情av网站| 久久国内精品自在自线图片| 国产精品秋霞免费鲁丝片| 日本与韩国留学比较| 成人毛片a级毛片在线播放| 国产精品久久久久久精品古装| 成年人午夜在线观看视频| 丝袜脚勾引网站| 国产亚洲精品久久久com| 日本欧美国产在线视频| 亚洲婷婷狠狠爱综合网| 日韩av免费高清视频| av电影中文网址| 国语对白做爰xxxⅹ性视频网站| 亚洲精品久久午夜乱码| 亚洲av男天堂| 黑人高潮一二区| 免费人妻精品一区二区三区视频| 日本免费在线观看一区| 久久av网站| 亚洲中文av在线| 久久精品国产亚洲av涩爱| 午夜福利乱码中文字幕| kizo精华| 久久久久国产网址| 日韩视频在线欧美| 在线观看一区二区三区激情| 国产日韩欧美亚洲二区| 国产一区有黄有色的免费视频| 精品一区二区三区视频在线| 2021少妇久久久久久久久久久| 我要看黄色一级片免费的| 9热在线视频观看99| 秋霞在线观看毛片| 男人爽女人下面视频在线观看| av一本久久久久| 日本猛色少妇xxxxx猛交久久| 桃花免费在线播放| 少妇人妻 视频| 精品久久久久久电影网| 69精品国产乱码久久久| 日本av免费视频播放| 日韩制服骚丝袜av| 亚洲精品美女久久av网站| 亚洲精品美女久久av网站| 日韩成人伦理影院| 免费看av在线观看网站| 精品国产国语对白av| 少妇的丰满在线观看| 日日撸夜夜添| 大陆偷拍与自拍| 男的添女的下面高潮视频| 尾随美女入室| 国产成人aa在线观看| 日本av手机在线免费观看| 久久影院123| 欧美性感艳星| 一本—道久久a久久精品蜜桃钙片| 亚洲av欧美aⅴ国产| 国产av精品麻豆| 国产成人精品福利久久| 国产淫语在线视频| 一个人免费看片子| 欧美精品高潮呻吟av久久| 亚洲国产看品久久| 日韩精品免费视频一区二区三区 | 黄网站色视频无遮挡免费观看| 日韩一区二区三区影片| 免费日韩欧美在线观看| 国产精品久久久久成人av| 亚洲成人一二三区av| 高清在线视频一区二区三区| 国产一区有黄有色的免费视频| 黑人巨大精品欧美一区二区蜜桃 | 亚洲av在线观看美女高潮| 亚洲欧美色中文字幕在线| 蜜桃在线观看..| 日本黄色日本黄色录像| 色网站视频免费| 精品少妇黑人巨大在线播放| 另类亚洲欧美激情| 国产午夜精品一二区理论片| 宅男免费午夜| 午夜福利,免费看| 日韩欧美一区视频在线观看| 欧美日韩综合久久久久久| 男女下面插进去视频免费观看 | 国产欧美日韩综合在线一区二区| 国产女主播在线喷水免费视频网站| 性高湖久久久久久久久免费观看| 黄色一级大片看看| 在线观看人妻少妇| 亚洲丝袜综合中文字幕| 日日啪夜夜爽| 丝袜喷水一区| 热99久久久久精品小说推荐| 精品熟女少妇av免费看| 丝袜人妻中文字幕| 在线观看三级黄色| 亚洲欧美清纯卡通| 日本欧美国产在线视频| 在线亚洲精品国产二区图片欧美| 少妇熟女欧美另类| 日韩欧美精品免费久久| 日韩,欧美,国产一区二区三区| 一个人免费看片子| 久久精品熟女亚洲av麻豆精品| 国产精品久久久久成人av| 曰老女人黄片| 久久人人爽人人片av| 亚洲综合精品二区| 中文字幕精品免费在线观看视频 | 91精品国产国语对白视频| 免费观看性生交大片5| av卡一久久| 日韩中文字幕视频在线看片| 最近最新中文字幕免费大全7| 日本黄大片高清| 国产黄色免费在线视频| 国产精品成人在线| 久久精品久久久久久噜噜老黄| 母亲3免费完整高清在线观看 | 久久久久精品性色| 久久 成人 亚洲| 99久久综合免费| 亚洲情色 制服丝袜| 综合色丁香网| 人人妻人人添人人爽欧美一区卜| 久久人人爽人人爽人人片va| 午夜av观看不卡| 一区二区av电影网| 七月丁香在线播放| 国产国拍精品亚洲av在线观看| 最新的欧美精品一区二区| 免费av不卡在线播放| 国产精品一区二区在线观看99| 久久久欧美国产精品| 巨乳人妻的诱惑在线观看| 亚洲少妇的诱惑av| 国产又爽黄色视频| 久久精品熟女亚洲av麻豆精品| 国产欧美日韩一区二区三区在线| 9191精品国产免费久久| 午夜91福利影院| 欧美性感艳星| 亚洲av成人精品一二三区| 只有这里有精品99| 成人黄色视频免费在线看| 日韩精品有码人妻一区| 欧美bdsm另类| 捣出白浆h1v1| 亚洲国产精品一区二区三区在线| 日韩熟女老妇一区二区性免费视频| 久久鲁丝午夜福利片| 一本一本久久a久久精品综合妖精 国产伦在线观看视频一区 | 精品少妇久久久久久888优播| 亚洲国产精品一区三区| 日本欧美国产在线视频| 人妻少妇偷人精品九色| 国产亚洲精品久久久com| 韩国高清视频一区二区三区| 韩国高清视频一区二区三区| 又黄又爽又刺激的免费视频.| 亚洲精品中文字幕在线视频| 伊人久久国产一区二区| 日韩一区二区视频免费看| 天天影视国产精品| 久久久久精品人妻al黑| 久久久久久久久久人人人人人人| 亚洲av日韩在线播放| 精品久久久久久电影网| 校园人妻丝袜中文字幕| 一区二区三区乱码不卡18| a 毛片基地| 亚洲欧美色中文字幕在线| 国产欧美亚洲国产| 国产极品天堂在线| 国产av国产精品国产| 久久精品久久久久久噜噜老黄| 国产av精品麻豆| 亚洲精品美女久久av网站| 菩萨蛮人人尽说江南好唐韦庄| 2021少妇久久久久久久久久久| 国产色爽女视频免费观看| 日本黄大片高清| 激情五月婷婷亚洲| 国产爽快片一区二区三区| 日韩,欧美,国产一区二区三区| 五月开心婷婷网| 边亲边吃奶的免费视频| 国产av国产精品国产| h视频一区二区三区| 亚洲美女黄色视频免费看| 观看美女的网站| 少妇人妻精品综合一区二区| 国产午夜精品一二区理论片| 成人黄色视频免费在线看| av卡一久久| 色吧在线观看| 国产精品熟女久久久久浪| 两个人免费观看高清视频| 亚洲熟女精品中文字幕| 咕卡用的链子| 久久国产精品男人的天堂亚洲 | 国产精品秋霞免费鲁丝片| 亚洲欧美中文字幕日韩二区| 欧美变态另类bdsm刘玥| 波野结衣二区三区在线| 亚洲熟女精品中文字幕| 亚洲av电影在线观看一区二区三区| 我要看黄色一级片免费的| 日本91视频免费播放| 在线天堂最新版资源| 2022亚洲国产成人精品| 成人国产麻豆网| 天美传媒精品一区二区| 亚洲国产精品成人久久小说| 韩国精品一区二区三区 | 久久精品久久久久久噜噜老黄| 日本猛色少妇xxxxx猛交久久| 久久国内精品自在自线图片| 狠狠精品人妻久久久久久综合| 另类亚洲欧美激情| 男女啪啪激烈高潮av片| 久久久国产一区二区| 欧美人与性动交α欧美软件 | 久久99蜜桃精品久久| 青青草视频在线视频观看| 高清毛片免费看| 十八禁网站网址无遮挡| 日本色播在线视频| 青青草视频在线视频观看| 久久久精品区二区三区| 精品少妇黑人巨大在线播放| 久久99蜜桃精品久久| 天堂8中文在线网| 亚洲精品中文字幕在线视频| 日韩,欧美,国产一区二区三区| 黄片无遮挡物在线观看| 久久精品久久精品一区二区三区| 大香蕉97超碰在线| 国产色婷婷99| 肉色欧美久久久久久久蜜桃| 又粗又硬又长又爽又黄的视频| 一区二区三区乱码不卡18| 精品亚洲成国产av| 亚洲国产精品一区二区三区在线| 日本vs欧美在线观看视频| 一区二区三区乱码不卡18| h视频一区二区三区| 日本wwww免费看| 97精品久久久久久久久久精品| 亚洲,欧美精品.| 汤姆久久久久久久影院中文字幕| 亚洲av福利一区| 美女国产高潮福利片在线看| 国产午夜精品一二区理论片| 丝袜人妻中文字幕| 久久人人爽av亚洲精品天堂| 国产一级毛片在线| 成人免费观看视频高清| 亚洲欧美成人综合另类久久久| 国产成人免费无遮挡视频| av在线app专区| 成年美女黄网站色视频大全免费| 十分钟在线观看高清视频www| 最后的刺客免费高清国语| 日日啪夜夜爽| 国产福利在线免费观看视频| 国产视频首页在线观看| 国产精品一二三区在线看| 亚洲伊人色综图| 午夜福利在线观看免费完整高清在| 我的女老师完整版在线观看| 99九九在线精品视频| 免费黄频网站在线观看国产| 亚洲av中文av极速乱| 成人影院久久| 亚洲人与动物交配视频| 久久精品国产亚洲av涩爱| 免费播放大片免费观看视频在线观看| 久久99热这里只频精品6学生| 欧美成人精品欧美一级黄| 色5月婷婷丁香| 国产精品 国内视频| 中国国产av一级| 美女视频免费永久观看网站| 国产精品.久久久| 日韩三级伦理在线观看| 在现免费观看毛片| 国产精品人妻久久久久久| 91国产中文字幕| 久久精品国产综合久久久 | 两性夫妻黄色片 | 免费看av在线观看网站| 在线天堂中文资源库| 十分钟在线观看高清视频www| 99久国产av精品国产电影| 亚洲三级黄色毛片| 国产女主播在线喷水免费视频网站| 黑人猛操日本美女一级片| 亚洲精品456在线播放app| 久久久久国产网址| 美女国产视频在线观看| 欧美精品亚洲一区二区| 亚洲,欧美精品.| av片东京热男人的天堂| 亚洲精品第二区| 亚洲经典国产精华液单| 哪个播放器可以免费观看大片| 国产精品人妻久久久影院| 人妻少妇偷人精品九色| 宅男免费午夜| 五月玫瑰六月丁香| 妹子高潮喷水视频| 大陆偷拍与自拍| av天堂久久9| 国产在线一区二区三区精| 边亲边吃奶的免费视频| 精品少妇久久久久久888优播| 欧美成人精品欧美一级黄| 你懂的网址亚洲精品在线观看| 大片电影免费在线观看免费| 欧美成人午夜精品| 黄色配什么色好看| 亚洲av男天堂| 免费黄色在线免费观看| 欧美日本中文国产一区发布| 亚洲一级一片aⅴ在线观看| 色婷婷久久久亚洲欧美| 国产精品不卡视频一区二区| 国产国语露脸激情在线看| 精品卡一卡二卡四卡免费| 精品国产一区二区三区四区第35| 人体艺术视频欧美日本| 伦理电影免费视频| 欧美日韩亚洲高清精品| 大香蕉久久成人网| 2021少妇久久久久久久久久久| 国产乱人偷精品视频| 97超碰精品成人国产| 久久久久久久久久久久大奶| 亚洲国产欧美在线一区| 亚洲人与动物交配视频| 亚洲成人av在线免费| 午夜激情久久久久久久| 18禁动态无遮挡网站| 天天躁夜夜躁狠狠久久av| 丰满少妇做爰视频| 捣出白浆h1v1| 国产精品三级大全| 国产精品国产三级国产专区5o| 国产精品.久久久| 免费大片18禁| 另类亚洲欧美激情| 精品久久国产蜜桃| 成人二区视频| 欧美最新免费一区二区三区| 伦理电影免费视频| 国产精品久久久av美女十八| 亚洲色图 男人天堂 中文字幕 | 如何舔出高潮| 永久免费av网站大全| 99久久综合免费| 国产探花极品一区二区| 伦理电影免费视频| 国产高清三级在线| 99热网站在线观看| 国产亚洲一区二区精品| 男的添女的下面高潮视频| 亚洲av免费高清在线观看| 色5月婷婷丁香| 亚洲国产欧美在线一区| 97在线人人人人妻| 日韩精品有码人妻一区| 少妇人妻精品综合一区二区| 午夜福利在线观看免费完整高清在| 日韩成人av中文字幕在线观看| 亚洲国产看品久久| 少妇的丰满在线观看| 自线自在国产av| 一区在线观看完整版| 久久精品久久久久久久性| 天天躁夜夜躁狠狠久久av| av不卡在线播放| 国产有黄有色有爽视频| 亚洲成人手机| 免费大片黄手机在线观看| 亚洲精品久久午夜乱码| 考比视频在线观看| 有码 亚洲区| tube8黄色片| av免费在线看不卡| 国产欧美日韩一区二区三区在线| 一区二区三区精品91| 狂野欧美激情性bbbbbb| 大话2 男鬼变身卡| 精品少妇内射三级| 大香蕉久久网| 欧美日韩视频高清一区二区三区二| 国产精品麻豆人妻色哟哟久久| 少妇人妻 视频| 亚洲美女搞黄在线观看| 欧美人与性动交α欧美精品济南到 | 精品人妻熟女毛片av久久网站| 成人国产av品久久久| 91精品伊人久久大香线蕉| 免费看光身美女| 黄色怎么调成土黄色| 久久毛片免费看一区二区三区| av片东京热男人的天堂| 精品亚洲成国产av| 国产欧美日韩综合在线一区二区| 一级黄片播放器| 你懂的网址亚洲精品在线观看| 亚洲成人手机| 人人妻人人澡人人爽人人夜夜| 美女xxoo啪啪120秒动态图| 一区二区日韩欧美中文字幕 | 国产片内射在线| 亚洲欧美成人精品一区二区| √禁漫天堂资源中文www| 亚洲国产看品久久| 亚洲综合色网址| 成人午夜精彩视频在线观看| 亚洲欧洲日产国产| 国产av一区二区精品久久| 精品一区在线观看国产| 亚洲精华国产精华液的使用体验| 五月玫瑰六月丁香| 涩涩av久久男人的天堂| 免费不卡的大黄色大毛片视频在线观看| 九九爱精品视频在线观看| 99热国产这里只有精品6| 在线亚洲精品国产二区图片欧美| 91国产中文字幕| 999精品在线视频| 少妇人妻 视频| 老熟女久久久| 国产成人91sexporn| 免费黄网站久久成人精品| 日本午夜av视频| 男人舔女人的私密视频| av福利片在线| 香蕉精品网在线| 精品国产一区二区久久| 精品人妻一区二区三区麻豆| 一级毛片 在线播放| 国产免费又黄又爽又色| 色哟哟·www| 80岁老熟妇乱子伦牲交| 多毛熟女@视频| 欧美激情 高清一区二区三区| 久久影院123| 欧美日本中文国产一区发布| 久久 成人 亚洲| 狠狠婷婷综合久久久久久88av| 高清不卡的av网站| 女性生殖器流出的白浆| av国产久精品久网站免费入址| 国产欧美亚洲国产| av卡一久久| 色94色欧美一区二区| 高清欧美精品videossex|