• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    面向中文開放領(lǐng)域的多元實(shí)體關(guān)系抽取研究

    2019-05-22 13:12:36姚賢明甘健侯徐堅(jiān)
    智能系統(tǒng)學(xué)報(bào) 2019年3期
    關(guān)鍵詞:賓語主語實(shí)體

    姚賢明,甘健侯,徐堅(jiān)

    (1. 曲靖師范學(xué)院 信息工程學(xué)院,云南 曲靖 655011; 2. 云南師范大學(xué) 民族教育信息化教育部重點(diǎn)實(shí)驗(yàn)室,云南 昆明 650500)

    實(shí)體關(guān)系抽取是指從文本中抽取實(shí)體與實(shí)體之間,實(shí)體與數(shù)值表達(dá)式之間的語義關(guān)系,這種語義關(guān)系體現(xiàn)了二者之間的相互作用[1]。例如“鄧兆祥游覽廬山”,其中“鄧兆祥”與“廬山”之間存在“游覽”關(guān)系[2]。

    實(shí)體關(guān)系抽取任務(wù)最早在1989年的MUC評測會議中被提出,在ACE、TAC等一系列評測會議的推動下,獲得了長足的發(fā)展,陸續(xù)提出了基于規(guī)則的[3-4]、基于支持向量機(jī)等有監(jiān)督的[5-6]和基于聚類等無監(jiān)督[7-8]實(shí)體關(guān)系獲取方法[9],本文稱這些方法為傳統(tǒng)方法。傳統(tǒng)方法主要是面向特定領(lǐng)域,預(yù)先定義了實(shí)體類型和關(guān)系類型,通過人工標(biāo)注訓(xùn)練數(shù)據(jù)提交給機(jī)器學(xué)習(xí)算法自動學(xué)習(xí)分類規(guī)則,從而實(shí)現(xiàn)文本中實(shí)體關(guān)系的自動識別。

    隨著互聯(lián)網(wǎng)的飛速發(fā)展,海量多源異構(gòu)信息構(gòu)成了互聯(lián)網(wǎng)的主體,機(jī)器翻譯、問答系統(tǒng)和知識庫等應(yīng)用系統(tǒng)的發(fā)展也逐漸面向互聯(lián)網(wǎng)開展相關(guān)研究,傳統(tǒng)方法已經(jīng)不能滿足現(xiàn)實(shí)的需求,因?yàn)樵诋?dāng)前環(huán)境中,實(shí)體類型、實(shí)體關(guān)系都是未知的,雖然有部分文章提出了上百種實(shí)體類型[10-11],對相關(guān)研究也產(chǎn)生了積極影響,但是仍然不能滿足現(xiàn)實(shí)中千變?nèi)f化的需求,因此開放域?qū)嶓w關(guān)系抽取任務(wù)被提出[9]。

    開放域?qū)嶓w關(guān)系抽取的發(fā)展正在經(jīng)歷2個(gè)階段[12-13]:二元實(shí)體關(guān)系抽取、多元實(shí)體關(guān)系抽取。

    二元實(shí)體關(guān)系抽取主要以抽取動詞為主,通常是從一句完整的語句中抽取到一對實(shí)體之間的關(guān)系。以 TextRunner[14]、KnowItAll[15]、WOE[16]、和Reverb[17-18]等為代表的系統(tǒng)已推動了二元實(shí)體關(guān)系抽取接近成熟。采用的方法主要包括遠(yuǎn)程監(jiān)督(distant supervision)和有監(jiān)督的方法。遠(yuǎn)程監(jiān)督[19-20]利用百科信息框的結(jié)構(gòu)化信息對非結(jié)構(gòu)化文本進(jìn)行自動標(biāo)注,訓(xùn)練識別模型,通過一定的技巧(trick)能達(dá)到較好的效果,該方法降低了人工標(biāo)注語料的繁重負(fù)擔(dān);有監(jiān)督的方法仍然以支持向量機(jī)等方法為主,但是在特征選擇方面,通常選擇句法、依存關(guān)系等具有領(lǐng)域通用性的特征[21-22],從而使其模型具有跨領(lǐng)域能力。

    多元實(shí)體關(guān)系指的是語句中多個(gè)實(shí)體之間存在的不同語義關(guān)系,因此多元實(shí)體關(guān)系抽取的任務(wù)是抽取這些實(shí)體之間的語義關(guān)系。相對于二元實(shí)體關(guān)系抽取來說,該任務(wù)具有更大的挑戰(zhàn)性。目前,多元實(shí)體關(guān)系的抽取還處于探索階段。文獻(xiàn)[23]在構(gòu)建Kraken系統(tǒng)的過程中,給出了多元實(shí)體關(guān)系抽取的基本思路如下:

    1)檢測事件短語。Kraken將動詞、修飾詞和介詞視為事件。

    2)檢測實(shí)體中心詞。Kraken從事件短語出發(fā),根據(jù)nsubject等依存關(guān)系找到實(shí)體中心詞。

    3)檢測實(shí)體全稱。Kraken從實(shí)體中心詞出發(fā),遞歸地查找所有向下連接的實(shí)體詞。

    最終,Kraken將實(shí)體全稱和事件短語組合成三元組,并將其視為抽取到的實(shí)體關(guān)系。以句子“Doublethink, a word that was coined by Orwell in the novel 1984, describes a fictional concept.”為例,使用該方法可獲得3個(gè)實(shí)體間的語義關(guān)系:

    關(guān)系 1:(Doublethink, was coined, by Orwell),關(guān)系 2:(Doublethink, was coined, in the novel 1984),關(guān)系 3:(Doublethink, describes, a fictional concept)[23]。

    從上面的結(jié)果可看出,相對于二元實(shí)體關(guān)系抽取僅僅只能抽取一對實(shí)體之間的語義關(guān)系而言,多元實(shí)體關(guān)系抽取能夠抽取到更多的實(shí)體之間的關(guān)系。在英文中,多元實(shí)體關(guān)系占據(jù)了40%的所有實(shí)體關(guān)系[24],因此,多元實(shí)體關(guān)系的抽取是實(shí)體關(guān)系抽取中一項(xiàng)十分重要的工作,而這也是今后實(shí)體關(guān)系發(fā)展的一個(gè)重要方向。目前,在英文的多元實(shí)體關(guān)系抽取方面已經(jīng)取得了初步的研究成果[25-29]。

    在中文領(lǐng)域,多元實(shí)體關(guān)系抽取方面目前鮮有提及,主要的工作集中在二元實(shí)體關(guān)系抽取[30-31]。本文以Kraken系統(tǒng)提供的方法為基礎(chǔ),結(jié)合中文自身的特點(diǎn),提出了基于依存語法的開放域多元實(shí)體關(guān)系抽取方法,本文將該方法應(yīng)用于民族、自然科學(xué)、法律、經(jīng)濟(jì)、人文歷史5個(gè)領(lǐng)域以驗(yàn)證該方法的有效性,實(shí)驗(yàn)結(jié)果表明,該方法具有一定的參考價(jià)值。

    1 中文多元實(shí)體關(guān)系抽取

    在英文的實(shí)體關(guān)系抽取中,主要以謂語作為實(shí)體之間關(guān)系的指示詞,因此在中文的關(guān)系抽取中沿用了該方法[32]。文獻(xiàn)[2]以謂語作為關(guān)鍵字,構(gòu)建上下文特征,訓(xùn)練識別器,實(shí)現(xiàn)了旅游領(lǐng)域的實(shí)體關(guān)系抽取,但是仍屬于有監(jiān)督的方法,而且針對的是二元關(guān)系抽取。文獻(xiàn)[33]利用依存分析結(jié)果,結(jié)合啟發(fā)規(guī)則實(shí)現(xiàn)三元組的抽取。文獻(xiàn)[34]以句法分析結(jié)果作為基礎(chǔ),以動詞為中心,抽取主謂賓結(jié)構(gòu),同時(shí)給出了句子中存在多個(gè)連續(xù)動詞的復(fù)雜情況下,抽取主謂賓結(jié)構(gòu)的解決方案,但是該文獻(xiàn)沒有詳細(xì)給出存在零指代的情況下獲取主語的方法??傮w而言,在中文實(shí)體關(guān)系抽取方面,仍然缺乏針對復(fù)雜中文句子結(jié)構(gòu)的有效實(shí)體關(guān)系抽取方法,在多元實(shí)體關(guān)系抽取方面更是缺乏相關(guān)研究。

    從中文句法結(jié)構(gòu)來看,主語、謂語和賓語構(gòu)成了句子的主體,是描述事實(shí)的基本組成單元。語句可以是由一個(gè)主謂賓構(gòu)成的簡單句子,也可以是由多個(gè)主謂賓構(gòu)成的復(fù)雜語句,復(fù)雜語句以動詞作為事件鏈,表述了實(shí)體(主語、賓語)之間的語義關(guān)系。

    以語句“1937年6月4日,周恩來第一次登上廬山,入住仙巖旅館,同蔣介石進(jìn)行國共第二次合作談判?!盵2]為例,其中包含了3個(gè)連續(xù)事件:登上→入住→進(jìn)行,對應(yīng)的實(shí)體關(guān)系分別為:(周恩來,登上,廬山)、(周恩來,入住,仙巖旅館)和(周恩來,進(jìn)行,國共第二次合作談判)。

    對于語句“到1910年的時(shí)候,美國科學(xué)家摩爾根,他研究果蠅的遺傳規(guī)律的時(shí)候發(fā)現(xiàn),遺傳信息是位于染色體上面,所以知道染色體跟遺傳有非常大的關(guān)系”,該句子的句法結(jié)構(gòu)分析結(jié)果如圖1和圖2所示(限于篇幅,本文將句法分析結(jié)果分割成為兩部分,兩部分的首尾以詞語“發(fā)現(xiàn)”作為連接點(diǎn))。從圖中的結(jié)果可以看出,各個(gè)單句之間不完全是以動詞為主的連續(xù)鏈結(jié)構(gòu)(COO),也包括以賓語(VOB)為主的連續(xù)鏈結(jié)構(gòu)。直觀上看,可得出如下2個(gè)重要事實(shí):事實(shí)1,(遺傳信息,位于,染色體上面);事實(shí)2,(染色體,跟遺傳有,關(guān)系)。另外更為重要的是,這兩個(gè)事實(shí)都是“德國科學(xué)家摩爾根”“發(fā)現(xiàn)”而“知道”的,因此,這里還存在另外一層實(shí)體與事實(shí)之間的關(guān)系(德國科學(xué)家摩爾根,發(fā)現(xiàn),事實(shí)1)和(德國科學(xué)家摩爾根,知道,事實(shí)2),展開即為(德國科學(xué)家摩爾根,發(fā)現(xiàn),(遺傳信息,位于,染色體上面))和(德國科學(xué)家摩爾根,知道,(染色體,跟遺傳有,關(guān)系))。除此之外,該句中還存在另外一個(gè)實(shí)體關(guān)系(德國科學(xué)家摩爾根,研究,果蠅遺傳規(guī)律),只是該實(shí)體關(guān)系隱藏在偏正結(jié)構(gòu)中。

    圖 1 句子依存句法分析結(jié)果(第1部分)Fig. 1 Dependency parsing analysis result for example sentence (part 1)

    圖 2 例句“到 1910 年的時(shí)候······”依存句法分析結(jié)果 (第 2 部分)Fig. 2 Dependency par sing analysis r esult for sentence “Dao4 1910 nian2 de1 shi2 hou4” (par t 2)

    通過以上的分析可知,實(shí)體關(guān)系在句子中呈現(xiàn)以下3個(gè)特點(diǎn):

    1)實(shí)體關(guān)系在謂語上表現(xiàn)為連續(xù)鏈結(jié)構(gòu)。所有連續(xù)的事件依照出現(xiàn)的先后順序以COO相互連接。

    2)實(shí)體關(guān)系在實(shí)體本身也可能存在蘊(yùn)含關(guān)系。作為實(shí)體關(guān)系中的實(shí)體,可能為一實(shí)體名稱,也可能為一事件,或者該事件本身又是一種迭代的結(jié)構(gòu)。

    3)存在一些游離狀態(tài)的實(shí)體關(guān)系。這些關(guān)系以松耦合的形式構(gòu)成句子的一部分。

    基于以上特點(diǎn),本文提出了基于依存語法的開放域多元實(shí)體關(guān)系抽取方法。該方法以哈工大LTP平臺的句法分析結(jié)果作為依據(jù),抽取句子中以主謂賓結(jié)構(gòu)為代表的實(shí)體關(guān)系,具體算法步驟為:

    1)句法分析。將句子提交到LTP平臺獲取句法分析結(jié)果。

    2)事件鏈獲取。獲取句法分析結(jié)果中的root節(jié)點(diǎn)作為入口,查找與該節(jié)點(diǎn)以LTP中定義的事件關(guān)系(COO,IS)相連接的動詞并添加到動詞集合。

    3)主謂賓獲取。依據(jù)LTP定義的主語角色(SBV)和賓語角色 (VOB,IOB,F(xiàn)OB),查找每個(gè)動詞的主語和賓語集合(可能存在多個(gè)主語和賓語并列的情形)。如果連接的角色是名詞則將其添加到對應(yīng)的主語或賓語集合,并查找其他并列的主語或賓語;如果連接的角色是動詞,則以該動詞作為root節(jié)點(diǎn),并跳轉(zhuǎn)到2)。

    4)實(shí)體關(guān)系獲取。將每次循環(huán)過程中獲取到的主謂賓添加到實(shí)體關(guān)系集合中,如果存在主語或賓語并列的情況,則進(jìn)行組合之后添加到實(shí)體關(guān)系集合中。

    5)順序掃描句子中所有尚未在上述步驟中查找到的動詞,將其作為root節(jié)點(diǎn),跳轉(zhuǎn)到2)。

    6)主語填充。利用一定的規(guī)則,對實(shí)體關(guān)系集合中缺乏主語(零指代)的主謂賓組合填充其主語。

    7)獲取主語和賓語的定語部分。依據(jù)LTP平臺定義的屬性角色(ATT)獲取主語和賓語的定語部分。

    8)輸出所有以主謂賓形式表示的實(shí)體關(guān)系。

    該算法的核心思想就是根據(jù)事件關(guān)系順序和遞歸地查找所有的主謂賓結(jié)構(gòu),然后獲取實(shí)體的修飾成分。值得注意的是,由于實(shí)體關(guān)系之間存在蘊(yùn)含關(guān)系,一個(gè)事實(shí)可能為另外一個(gè)事實(shí)的成分,需要采用迭代的方式來獲取,3)中最后獲取root節(jié)點(diǎn)就體現(xiàn)了該過程。該算法能夠有效地獲取句子中復(fù)雜的多元實(shí)體關(guān)系,避免無意義的實(shí)體關(guān)系對抽取結(jié)果的影響。

    2 實(shí)驗(yàn)結(jié)果分析

    作為目前比較新的研究方向,多元實(shí)體關(guān)系抽取尚缺乏權(quán)威的評測數(shù)據(jù),在中文領(lǐng)域中目前亦如此。為了獲得更加客觀公正的測試結(jié)果,同時(shí)也為了驗(yàn)證算法的跨領(lǐng)域抽取能力,本文選取了歷史、經(jīng)濟(jì)、民族、科技、法律5個(gè)領(lǐng)域的文本進(jìn)行測試。其中經(jīng)濟(jì)和科技的文本屬于口述性文本,民族領(lǐng)域文本來源于百度百科,法律文本則來自于法律條款,民族和法律領(lǐng)域的文本相對來說更加標(biāo)準(zhǔn)規(guī)范。

    本文從這些領(lǐng)域文本中選取了部分具有代表性的句子作為評測數(shù)據(jù),總共包含167個(gè)句子,其中包含多個(gè)實(shí)體關(guān)系的句子總數(shù)為149個(gè),客觀存在的實(shí)體關(guān)系總數(shù)為408對,抽取到的正確實(shí)體關(guān)系數(shù)量為214對,由此可見,該方法獲取到的數(shù)量遠(yuǎn)大于二元實(shí)體關(guān)系抽取。

    為了對具體領(lǐng)域的抽取效果有更直觀的印象,本文采用信息抽取中常用的指標(biāo)對系統(tǒng)性能進(jìn)行評估,即正確率、召回率和F值。3個(gè)指標(biāo)的數(shù)據(jù)來源于上述選取的167個(gè)句子。每個(gè)指標(biāo)在具體每個(gè)領(lǐng)域中的性能表現(xiàn)如表1所示。

    表 1 本文算法在不同領(lǐng)域中的表現(xiàn)Table 1 Performance of algorithm in this paper in different domains %

    從表1中數(shù)據(jù)可以看出,總體的指標(biāo)達(dá)到了60%左右,取得了一定的效果,也證明了本文中的方法具有一定可行性。在歷史領(lǐng)域的文本中性能較差,但在其他領(lǐng)域中都有不俗的表現(xiàn),而且在不同領(lǐng)域中的表現(xiàn)相對比較穩(wěn)定,說明該方法具有一定的跨領(lǐng)域能力。

    表2中列出了本文與其他文獻(xiàn)開放域?qū)嶓w關(guān)系抽取的性能對比結(jié)果。其中,ZORE是文獻(xiàn)[35]中提出的ZORE系統(tǒng),使用句法分析結(jié)果抽取中文開放域?qū)嶓w關(guān)系,與本文采用的方法類似,該系統(tǒng)的準(zhǔn)確率等指標(biāo)是性能最佳情況下的表現(xiàn),該文獻(xiàn)也是較早研究中文開放域?qū)嶓w關(guān)系抽取的工作之一;UnCORE是哈工大秦兵教授在文獻(xiàn)[30]中提出的面向大規(guī)模網(wǎng)絡(luò)文本的無指導(dǎo)中文開放式實(shí)體關(guān)系抽取模型,在該文獻(xiàn)中給出了正確率,但是因?yàn)槲谋疽?guī)模較大,無法統(tǒng)計(jì)召回率,因此相關(guān)指標(biāo)沒有給出;Kraken是文獻(xiàn)[23]在英文領(lǐng)域抽取多元實(shí)體關(guān)系的性能表現(xiàn),這也是英文多元實(shí)體關(guān)系抽取研究最早的工作之一。

    表 2 與其他開放域?qū)嶓w關(guān)系抽取系統(tǒng)性能對比Table 2 Comparisons with other open domain entity relation extraction systems %

    從表2中的數(shù)據(jù)可以看出,與ZORE相比,本文的召回率更高,體現(xiàn)出本文從文本中抽取到的實(shí)體關(guān)系數(shù)量更豐富,對于復(fù)雜句式效果更好,同時(shí)F值也更高。與UnCORE系統(tǒng)相比,本文的準(zhǔn)確率不高,但是UnCORE系統(tǒng)是在大規(guī)模文本環(huán)境下運(yùn)行的,數(shù)據(jù)的冗余性使得準(zhǔn)確率得以提升,而召回率和F值這些指標(biāo)卻無法統(tǒng)計(jì)。與Kraken系統(tǒng)相比,本文所有的指標(biāo)略有小幅下降,但是作為在中文領(lǐng)域中的一種嘗試,本文得到這樣的運(yùn)行表現(xiàn)證明該方法具有一定的參考價(jià)值。

    本文對實(shí)體關(guān)系抽取在不同領(lǐng)域錯(cuò)誤的原因進(jìn)行分析,對抽取到的實(shí)體關(guān)系的錯(cuò)誤部分與未抽取到的實(shí)體關(guān)系進(jìn)行了統(tǒng)計(jì),將錯(cuò)誤的原因大致分成6種情形,具體每種錯(cuò)誤在不同領(lǐng)域中的占比如表3所示。

    表 3 本文算法在不同領(lǐng)域中出現(xiàn)錯(cuò)誤的原因及占比統(tǒng)計(jì)Table 3 Case of errors and its proportion in different domain with method used in this paper %

    從表3可看出,導(dǎo)致錯(cuò)誤的原因比較集中,主要包括情形1、情形3和情形5,占比總和達(dá)到了79.67%,這也為今后的工作指明了方向。對于每種錯(cuò)誤的分析如下:

    情形1 動詞詞性導(dǎo)致的錯(cuò)誤,名動詞被標(biāo)注為動詞,導(dǎo)致名詞性短語難以正確識別。本文使用的分詞工具為哈爾濱工業(yè)大學(xué)LTP語言技術(shù)平臺[36]本地工具包(LTP4J),工具中動詞只包含一種類型“v”,該詞性分類體系與北京理工大學(xué)的NLPIR[37]采用的計(jì)算所漢語詞性標(biāo)記集不同,后者將動詞 (v)分成了 9種 (vd、vn、vshi、vyou、vf、vx、vi、vl、vg)類型,每種類型的動詞的作用更加清晰。本文使用LTP平臺的主要原因是該平臺具有句法分析、依存分析等功能,同時(shí)該平臺的分詞能力在本文所使用的語料中表現(xiàn)更佳。

    LTP平臺對句子“三線建設(shè),是1964年在毛澤東同志和中共中央的決策下進(jìn)行的一場以戰(zhàn)備為中心的經(jīng)濟(jì)建設(shè)戰(zhàn)略”的詞性標(biāo)注結(jié)果為:“三線/j建設(shè)/v,/wp 是/v 1964 年/nt······”,從本例中可以看出本句的主語為“三線建設(shè)”,但是由于“建設(shè)”的詞性為“v”,根據(jù)本文算法,會繼續(xù)尋找其主語,從而導(dǎo)致主語“三線建設(shè)”識別失敗,但是如果將其標(biāo)注為動名詞“vn”,則可以有效地提取到該主語。從表2中可以看出,該問題導(dǎo)致抽取失敗的占比達(dá)到了27.30%,其影響非常大。本文曾嘗試使用NLPIR對該問題進(jìn)行修復(fù),但是由于分詞結(jié)果不同,因此效果不佳。

    情形2 動詞相鄰,在位置上前后緊密連接。以句子“毛澤東所說的‘屁股’,是指基礎(chǔ)工業(yè)”,其分詞結(jié)果為“······,/wp 是/v 指/v 基礎(chǔ)/n 工業(yè)/v”。直觀上說,“是指”可作為本句中的謂語,然而由于在句法分析結(jié)果中二者是以VOB連接,因此會以情形1中相同的方式進(jìn)行處理,從而導(dǎo)致錯(cuò)誤的發(fā)生。

    情形3 實(shí)體詞(主語或賓語等)在句子的附加結(jié)構(gòu)中。以句子“從公元前21世紀(jì)以后,相繼出現(xiàn)了夏、商、西周幾個(gè)王朝”為例,本例中包含實(shí)體關(guān)系(公元前21世紀(jì)以后,出現(xiàn),夏王朝),此處時(shí)間“公元前21世紀(jì)以后”雖然不是主語,但是作為時(shí)間修飾成分,同樣也描述了基本的事實(shí),因此可作為實(shí)體關(guān)系而被抽取。但是在該句中,“從公元前21世紀(jì)以后”是作為ADV類型的狀中結(jié)構(gòu)存在,本文采用的方法無法抽取到實(shí)體“公元前21世紀(jì)以后”這種時(shí)間類型的實(shí)體詞。該情形是廣泛存在于多元實(shí)體關(guān)系抽取中的問題,在錯(cuò)誤中的總占比為32.96%,同時(shí)由于本文之前尚未定義該類型實(shí)體關(guān)系的抽取規(guī)則,幾乎所有的實(shí)體關(guān)系都沒有被檢測到,因此增加此類實(shí)體抽取規(guī)則將在很大程度上提升召回率。

    情形4 省略了主語情況下,主語的自動填充結(jié)果帶來的錯(cuò)誤。在中文行文中,省略語與指代是廣泛存在的現(xiàn)象,在實(shí)體關(guān)系抽取結(jié)果中占據(jù)非常大的比例。本文采用了簡單的規(guī)則來彌補(bǔ)此問題:在缺乏主語或存在代詞的情況下,向前一個(gè)語言片段尋找主語實(shí)體詞,將找到的第一個(gè)主語作為被省略的主語或代詞的實(shí)體詞,如果在一個(gè)句子中前面位置找不到實(shí)體詞,則向后尋找。例如:語句“漢族是中國的主體民族,是上古時(shí)期黃帝和炎帝部落的后裔”,該句第二個(gè)語言片段表達(dá)的是“漢族是上古時(shí)期黃帝和炎帝部落的后裔”,但是“漢族”本身是前一個(gè)語句的主語,通過本文的主語填充規(guī)則可以輕松地獲得事實(shí)(漢族,是,上古時(shí)期黃帝部落后裔)和(漢族,是,上古時(shí)期炎帝部落后裔)。該方法有效地降低了主語被省略的情況對實(shí)體抽取的影響。但是由于該方法過于簡單,也帶來了一些錯(cuò)誤,如找到錯(cuò)誤的主語,或主語找不到的情況。

    情形5 實(shí)體詞存在并列的情況。實(shí)體詞并列出現(xiàn)的現(xiàn)象在文本中是廣泛存在的,存在幾個(gè)并列關(guān)系就存在幾種事實(shí),而本文的抽取規(guī)則尚未完整地考慮到所有并列的情形,因此并列關(guān)系的存在對抽取結(jié)果產(chǎn)生了較大的影響。以句子“佤族主要分布云南省西南部的西盟、滄源、瀾滄、孟連、雙江、耿馬、永德、鎮(zhèn)康等縣”為例,本句包含多個(gè)事實(shí):(佤族,分布,云南省西南部西盟縣)、(佤族,分布,云南省西南部滄源縣)······(佤族,分布,云南省西南部鎮(zhèn)康縣),總共8個(gè)事實(shí),而本文的方法只能抽取到(佤族,分布,云南省西南部西盟縣)這個(gè)事實(shí),其余的7個(gè)事實(shí)則被忽略掉。由此可見,對并列結(jié)構(gòu)中實(shí)體關(guān)系的抽取會極大地降低召回率。從表2中的數(shù)據(jù)也可以看出,其在總的錯(cuò)誤中占比達(dá)到了19.41%,因此提升空間是巨大的。

    情形6 其他原因,包括由于句子邊界識別、未登錄詞、句子結(jié)構(gòu)復(fù)雜等原因而導(dǎo)致的無法識別的情形。該情形在民族與科技領(lǐng)域中存在的情況比較常見。

    3 結(jié)束語

    作為在中文開放領(lǐng)域中多元實(shí)體關(guān)系抽取的一種嘗試,本文從依存語法的角度出發(fā),通過對句法分析的結(jié)果進(jìn)行分析,抽取以主謂賓結(jié)構(gòu)為代表的多元實(shí)體關(guān)系,并獲得了一定的成效。同時(shí)本文對實(shí)驗(yàn)結(jié)果進(jìn)行了分析,總結(jié)了導(dǎo)致抽取失敗的5種主要情形,這也為今后的研究工作指明了方向。另外,本文只獲取了主語和賓語的定語部分,但是對補(bǔ)語和狀語沒有進(jìn)行抽取,這使得部分抽取結(jié)果理解比較困難,因此還需要進(jìn)一步優(yōu)化算法。

    猜你喜歡
    賓語主語實(shí)體
    談?wù)勔龑?dǎo)主語從句的連接詞的用法
    巧用無靈主語,讓續(xù)寫更靈動
    連詞that引導(dǎo)的賓語從句
    賓語從句及練習(xí)
    前海自貿(mào)區(qū):金融服務(wù)實(shí)體
    中國外匯(2019年18期)2019-11-25 01:41:54
    實(shí)體的可感部分與實(shí)體——兼論亞里士多德分析實(shí)體的兩種模式
    兩會進(jìn)行時(shí):緊扣實(shí)體經(jīng)濟(jì)“釘釘子”
    振興實(shí)體經(jīng)濟(jì)地方如何“釘釘子”
    中考試題中的賓語從句
    盤點(diǎn)高考中的特殊句式(二)
    青蘋果(2014年2期)2014-04-29 20:31:27
    插阴视频在线观看视频| 韩国av在线不卡| 免费播放大片免费观看视频在线观看| 高清午夜精品一区二区三区| 国产精品一区二区三区四区免费观看| 日韩在线高清观看一区二区三区| av专区在线播放| 国产欧美日韩精品一区二区| 国产视频内射| 一本一本综合久久| 欧美性感艳星| 我要看日韩黄色一级片| 国产精品国产三级国产av玫瑰| 99久久精品热视频| 国产成人91sexporn| 少妇丰满av| 亚洲美女视频黄频| 少妇丰满av| 我的女老师完整版在线观看| 久久久久久久久大av| 我的女老师完整版在线观看| 在线观看一区二区三区| av国产免费在线观看| 久久国产乱子免费精品| 中文欧美无线码| freevideosex欧美| 日韩欧美 国产精品| 午夜日本视频在线| 国产真实伦视频高清在线观看| 国产亚洲5aaaaa淫片| 亚洲精品,欧美精品| 久久99精品国语久久久| 蜜臀久久99精品久久宅男| 久久精品人妻少妇| 精品熟女少妇av免费看| 1000部很黄的大片| 日韩一本色道免费dvd| 国产永久视频网站| 日本与韩国留学比较| 国产精品无大码| 久久久久久伊人网av| 国产精品三级大全| 激情五月婷婷亚洲| 观看美女的网站| 一区二区三区四区激情视频| 大片免费播放器 马上看| 中文字幕精品免费在线观看视频 | 日本vs欧美在线观看视频 | 国产精品秋霞免费鲁丝片| 在线观看一区二区三区| 亚洲欧美日韩无卡精品| 亚洲美女视频黄频| 精品一区二区免费观看| 深夜a级毛片| 少妇人妻久久综合中文| 国产成人免费观看mmmm| 在线观看三级黄色| 伦理电影免费视频| 777米奇影视久久| 久久久久久九九精品二区国产| 在线观看美女被高潮喷水网站| 日韩中字成人| 精品亚洲成国产av| 国产乱人偷精品视频| 精品亚洲成国产av| 国产欧美日韩精品一区二区| 国产精品麻豆人妻色哟哟久久| 精品一区二区三卡| 国产又色又爽无遮挡免| 色5月婷婷丁香| 网址你懂的国产日韩在线| 全区人妻精品视频| 亚洲精品乱码久久久久久按摩| 亚洲天堂av无毛| 日日撸夜夜添| 2018国产大陆天天弄谢| 大码成人一级视频| 成人18禁高潮啪啪吃奶动态图 | 国产乱人偷精品视频| 久久久久久久亚洲中文字幕| 国产精品人妻久久久久久| 日日摸夜夜添夜夜添av毛片| 亚洲欧美日韩东京热| 老司机影院毛片| 在线观看av片永久免费下载| 久久99蜜桃精品久久| 国产精品av视频在线免费观看| 亚洲精品乱久久久久久| 国产精品爽爽va在线观看网站| 高清不卡的av网站| 嫩草影院入口| 国产中年淑女户外野战色| 99热这里只有精品一区| av在线老鸭窝| 国产精品国产av在线观看| 免费av不卡在线播放| 22中文网久久字幕| 黄片wwwwww| 亚洲内射少妇av| 舔av片在线| 夜夜骑夜夜射夜夜干| 日韩欧美精品免费久久| 久久久久网色| 国产中年淑女户外野战色| 国产欧美日韩一区二区三区在线 | 色婷婷av一区二区三区视频| 精品久久国产蜜桃| 国产黄片视频在线免费观看| 插阴视频在线观看视频| 国产在视频线精品| 国产人妻一区二区三区在| 欧美丝袜亚洲另类| 亚洲精品国产av蜜桃| 精品视频人人做人人爽| 久久精品国产亚洲av涩爱| av天堂中文字幕网| 亚洲精品自拍成人| 日本wwww免费看| av一本久久久久| 插阴视频在线观看视频| 国产淫片久久久久久久久| 一级av片app| 久久久a久久爽久久v久久| 中文资源天堂在线| 美女中出高潮动态图| 欧美激情极品国产一区二区三区 | 蜜臀久久99精品久久宅男| 亚洲国产精品专区欧美| 国产综合精华液| 国产在视频线精品| 国产精品久久久久久久久免| 久久久a久久爽久久v久久| 人人妻人人爽人人添夜夜欢视频 | 欧美一级a爱片免费观看看| 人人妻人人爽人人添夜夜欢视频 | 伊人久久国产一区二区| 91精品一卡2卡3卡4卡| 色网站视频免费| 免费高清在线观看视频在线观看| 亚洲av成人精品一二三区| 久久久久人妻精品一区果冻| 亚洲va在线va天堂va国产| 成人二区视频| 人妻 亚洲 视频| 欧美最新免费一区二区三区| 中文欧美无线码| 高清av免费在线| av卡一久久| 国产精品一二三区在线看| 久久精品国产亚洲av天美| 国产午夜精品一二区理论片| 亚洲中文av在线| 国产爱豆传媒在线观看| 精品国产三级普通话版| 精品一区在线观看国产| 春色校园在线视频观看| 在线免费观看不下载黄p国产| 中文在线观看免费www的网站| 欧美人与善性xxx| 国产免费一级a男人的天堂| 在线观看一区二区三区| 成人漫画全彩无遮挡| 亚洲aⅴ乱码一区二区在线播放| 中国美白少妇内射xxxbb| 日韩一区二区视频免费看| 熟女电影av网| 国产 一区精品| 国产精品三级大全| 性色avwww在线观看| 国产精品久久久久久久久免| 80岁老熟妇乱子伦牲交| 最近中文字幕2019免费版| 欧美亚洲 丝袜 人妻 在线| 国产成人免费观看mmmm| 91精品国产国语对白视频| 少妇熟女欧美另类| 观看免费一级毛片| 十八禁网站网址无遮挡 | 九九在线视频观看精品| 日本午夜av视频| 有码 亚洲区| 日本一二三区视频观看| 内地一区二区视频在线| 一级毛片aaaaaa免费看小| 黄色一级大片看看| 国产黄色免费在线视频| 精品午夜福利在线看| 国产成人免费无遮挡视频| 日韩一区二区三区影片| 新久久久久国产一级毛片| 人人妻人人爽人人添夜夜欢视频 | 久久国产精品男人的天堂亚洲 | 国产av码专区亚洲av| 精品人妻偷拍中文字幕| 黑人高潮一二区| 久久国产亚洲av麻豆专区| 久久精品国产亚洲网站| 免费人成在线观看视频色| 九草在线视频观看| 亚洲av中文av极速乱| 大码成人一级视频| 能在线免费看毛片的网站| 欧美成人精品欧美一级黄| h视频一区二区三区| 91精品一卡2卡3卡4卡| 亚洲无线观看免费| 国产高清不卡午夜福利| 亚洲成人中文字幕在线播放| 色哟哟·www| 精品一区二区三区视频在线| 亚洲国产毛片av蜜桃av| 黑丝袜美女国产一区| www.色视频.com| 91精品国产国语对白视频| 亚洲av综合色区一区| 人人妻人人看人人澡| 三级国产精品欧美在线观看| 久久久久视频综合| av卡一久久| 亚洲av综合色区一区| 国产成人午夜福利电影在线观看| 久久久久久九九精品二区国产| 国产男人的电影天堂91| 大片免费播放器 马上看| 在线亚洲精品国产二区图片欧美 | 夫妻午夜视频| 国产片特级美女逼逼视频| 老女人水多毛片| 国产熟女欧美一区二区| 我的女老师完整版在线观看| videossex国产| 涩涩av久久男人的天堂| 一个人看的www免费观看视频| 26uuu在线亚洲综合色| 黄色怎么调成土黄色| 免费看日本二区| 国产午夜精品一二区理论片| 国产免费一级a男人的天堂| 一本色道久久久久久精品综合| 六月丁香七月| 99久久人妻综合| 色综合色国产| 精品国产乱码久久久久久小说| 青青草视频在线视频观看| 免费黄色在线免费观看| 亚洲丝袜综合中文字幕| 久久久久视频综合| 麻豆成人午夜福利视频| 五月天丁香电影| av免费在线看不卡| 中文天堂在线官网| 伊人久久国产一区二区| 多毛熟女@视频| 高清黄色对白视频在线免费看 | 三级经典国产精品| 一区二区三区免费毛片| 国产精品国产三级国产av玫瑰| 汤姆久久久久久久影院中文字幕| 夫妻性生交免费视频一级片| 性色av一级| 免费观看无遮挡的男女| 蜜臀久久99精品久久宅男| 男人添女人高潮全过程视频| 如何舔出高潮| 欧美精品亚洲一区二区| 男男h啪啪无遮挡| 少妇人妻一区二区三区视频| av专区在线播放| 在线 av 中文字幕| 一二三四中文在线观看免费高清| 亚洲美女黄色视频免费看| 五月开心婷婷网| 久久久a久久爽久久v久久| 一级毛片我不卡| 国产精品一区二区在线不卡| 久久人人爽av亚洲精品天堂 | 高清日韩中文字幕在线| 国产亚洲一区二区精品| 免费观看av网站的网址| 日本爱情动作片www.在线观看| av在线app专区| 这个男人来自地球电影免费观看 | 久久99热这里只频精品6学生| 亚洲第一av免费看| 欧美日韩视频精品一区| 下体分泌物呈黄色| 欧美最新免费一区二区三区| 久久99热这里只频精品6学生| 国产伦精品一区二区三区四那| 一区二区av电影网| 亚洲精品成人av观看孕妇| 亚洲成人av在线免费| 丰满迷人的少妇在线观看| 国产一区有黄有色的免费视频| 免费观看a级毛片全部| 在线免费十八禁| 国产精品一区二区在线观看99| 一级毛片黄色毛片免费观看视频| 黄色日韩在线| 国产又色又爽无遮挡免| 内地一区二区视频在线| 国产高清三级在线| 亚洲欧美日韩卡通动漫| 国产男女内射视频| 日韩不卡一区二区三区视频在线| 国产高潮美女av| 少妇的逼水好多| a级毛色黄片| 亚洲aⅴ乱码一区二区在线播放| 亚洲国产精品专区欧美| 精品国产三级普通话版| 国产精品偷伦视频观看了| 亚洲天堂av无毛| 两个人的视频大全免费| 黄色一级大片看看| 久久精品熟女亚洲av麻豆精品| 性色av一级| 简卡轻食公司| 亚洲欧美日韩另类电影网站 | av国产精品久久久久影院| 王馨瑶露胸无遮挡在线观看| 亚洲精品日本国产第一区| 免费看日本二区| av专区在线播放| 久久鲁丝午夜福利片| 久久久久久久久久成人| 国产免费福利视频在线观看| 男的添女的下面高潮视频| 寂寞人妻少妇视频99o| 亚洲成色77777| 亚洲国产色片| 午夜日本视频在线| 亚洲在久久综合| 少妇高潮的动态图| 国产精品99久久久久久久久| 欧美日韩视频精品一区| 综合色丁香网| 美女视频免费永久观看网站| 国产在线视频一区二区| 国内少妇人妻偷人精品xxx网站| 免费久久久久久久精品成人欧美视频 | 伊人久久国产一区二区| 日本-黄色视频高清免费观看| 黑人高潮一二区| 少妇 在线观看| 久久亚洲国产成人精品v| 精品国产三级普通话版| 中文乱码字字幕精品一区二区三区| 国产又色又爽无遮挡免| 黄片wwwwww| 国内精品宾馆在线| 熟女av电影| 亚洲欧洲日产国产| 秋霞伦理黄片| 噜噜噜噜噜久久久久久91| av专区在线播放| 有码 亚洲区| 日韩视频在线欧美| 99热国产这里只有精品6| 久久久久精品性色| av视频免费观看在线观看| 80岁老熟妇乱子伦牲交| 最黄视频免费看| 中文字幕精品免费在线观看视频 | 极品教师在线视频| 亚洲经典国产精华液单| 中文精品一卡2卡3卡4更新| 热re99久久精品国产66热6| 国产成人一区二区在线| av又黄又爽大尺度在线免费看| 香蕉精品网在线| 日产精品乱码卡一卡2卡三| 性色avwww在线观看| 久久毛片免费看一区二区三区| 一区在线观看完整版| 亚洲va在线va天堂va国产| 久久av网站| 国产一区亚洲一区在线观看| 亚洲精品456在线播放app| 1000部很黄的大片| 免费观看无遮挡的男女| 国产在线男女| 少妇人妻久久综合中文| 韩国高清视频一区二区三区| 99精国产麻豆久久婷婷| 能在线免费看毛片的网站| 黑丝袜美女国产一区| 亚洲高清免费不卡视频| 成人亚洲精品一区在线观看 | 国产淫语在线视频| 中文精品一卡2卡3卡4更新| 精品视频人人做人人爽| 国产成人精品婷婷| 夜夜爽夜夜爽视频| 黑人猛操日本美女一级片| 久久久精品免费免费高清| 日韩强制内射视频| 欧美高清成人免费视频www| 又粗又硬又长又爽又黄的视频| 久久精品国产鲁丝片午夜精品| 色吧在线观看| 亚洲丝袜综合中文字幕| 舔av片在线| 国产伦理片在线播放av一区| 久久99热这里只频精品6学生| 国产成人精品福利久久| 天天躁日日操中文字幕| 久久女婷五月综合色啪小说| 亚洲欧美清纯卡通| 在线看a的网站| 中文乱码字字幕精品一区二区三区| 午夜福利高清视频| 国产视频内射| 美女主播在线视频| 国产久久久一区二区三区| 99久久中文字幕三级久久日本| 国产亚洲av片在线观看秒播厂| 一本色道久久久久久精品综合| 久久久久久久亚洲中文字幕| 有码 亚洲区| 国产精品不卡视频一区二区| 久久6这里有精品| 国产黄片美女视频| 18禁裸乳无遮挡免费网站照片| 夜夜看夜夜爽夜夜摸| 国产精品久久久久成人av| 男的添女的下面高潮视频| 丝袜脚勾引网站| 亚洲精品视频女| 韩国高清视频一区二区三区| 亚洲av成人精品一二三区| 国产乱人偷精品视频| 18禁裸乳无遮挡动漫免费视频| 成年女人在线观看亚洲视频| 国产精品一区二区在线不卡| 少妇高潮的动态图| 国产精品久久久久成人av| 久久热精品热| 蜜桃亚洲精品一区二区三区| 日本wwww免费看| 国产成人精品一,二区| 免费久久久久久久精品成人欧美视频 | 麻豆成人av视频| 哪个播放器可以免费观看大片| 国产美女午夜福利| 插逼视频在线观看| 一二三四中文在线观看免费高清| 蜜桃在线观看..| 久久久久久久久大av| 国产精品一二三区在线看| 我的老师免费观看完整版| 日韩亚洲欧美综合| 亚洲精品视频女| 精品人妻熟女av久视频| 免费观看在线日韩| 久久人人爽av亚洲精品天堂 | 中国三级夫妇交换| av不卡在线播放| 久久精品国产鲁丝片午夜精品| 久久精品夜色国产| 亚洲欧美一区二区三区黑人 | 欧美三级亚洲精品| av在线播放精品| 亚洲国产毛片av蜜桃av| 这个男人来自地球电影免费观看 | 国模一区二区三区四区视频| 黄色一级大片看看| 久久人人爽av亚洲精品天堂 | 亚洲电影在线观看av| 亚洲伊人久久精品综合| 欧美成人a在线观看| 亚洲精品一区蜜桃| 波野结衣二区三区在线| 成人国产麻豆网| 一二三四中文在线观看免费高清| 特大巨黑吊av在线直播| 内射极品少妇av片p| 免费观看a级毛片全部| 啦啦啦中文免费视频观看日本| 欧美3d第一页| 人妻制服诱惑在线中文字幕| 最黄视频免费看| 99久久综合免费| 亚洲精品乱码久久久v下载方式| 看十八女毛片水多多多| 视频区图区小说| 在线观看免费高清a一片| 午夜精品国产一区二区电影| www.av在线官网国产| 欧美日韩精品成人综合77777| 国精品久久久久久国模美| 欧美日韩亚洲高清精品| 黄色配什么色好看| 国产黄频视频在线观看| 欧美性感艳星| 一级av片app| 国产黄片美女视频| 日韩大片免费观看网站| 国产淫片久久久久久久久| 午夜视频国产福利| 国产精品国产三级专区第一集| 亚洲av电影在线观看一区二区三区| 亚洲欧美一区二区三区国产| 日韩在线高清观看一区二区三区| 欧美精品一区二区免费开放| 免费观看性生交大片5| 国产欧美日韩一区二区三区在线 | 国产精品爽爽va在线观看网站| 人人妻人人看人人澡| 男女边吃奶边做爰视频| 在线观看免费视频网站a站| 欧美少妇被猛烈插入视频| 成人午夜精彩视频在线观看| 日韩av在线免费看完整版不卡| 久久综合国产亚洲精品| 欧美成人午夜免费资源| 亚洲第一区二区三区不卡| 啦啦啦在线观看免费高清www| 国产成人aa在线观看| 中文资源天堂在线| 看非洲黑人一级黄片| av国产久精品久网站免费入址| 亚洲第一av免费看| 免费高清在线观看视频在线观看| 女人十人毛片免费观看3o分钟| 免费黄频网站在线观看国产| 午夜福利网站1000一区二区三区| 亚洲av电影在线观看一区二区三区| 亚洲国产成人一精品久久久| av.在线天堂| 欧美另类一区| 久久久久久久大尺度免费视频| 你懂的网址亚洲精品在线观看| 精品久久久久久久久av| 热re99久久精品国产66热6| 亚洲成人av在线免费| 九色成人免费人妻av| 如何舔出高潮| 身体一侧抽搐| 丰满迷人的少妇在线观看| 伊人久久国产一区二区| 亚洲激情五月婷婷啪啪| av在线播放精品| 美女中出高潮动态图| 亚洲美女黄色视频免费看| 亚洲国产最新在线播放| 另类亚洲欧美激情| 菩萨蛮人人尽说江南好唐韦庄| 在线免费十八禁| 99re6热这里在线精品视频| 亚洲av.av天堂| 最近的中文字幕免费完整| .国产精品久久| 狂野欧美激情性xxxx在线观看| 亚洲美女搞黄在线观看| 天天躁夜夜躁狠狠久久av| 少妇猛男粗大的猛烈进出视频| 久久这里有精品视频免费| 最黄视频免费看| 水蜜桃什么品种好| 久久国产精品大桥未久av | av免费观看日本| 亚洲av免费高清在线观看| 久久久久久久久久成人| 国产成人精品婷婷| 蜜桃久久精品国产亚洲av| 日韩av在线免费看完整版不卡| 六月丁香七月| 欧美高清成人免费视频www| 国产精品一及| 国产v大片淫在线免费观看| 中文天堂在线官网| 亚洲婷婷狠狠爱综合网| 色5月婷婷丁香| 黑人高潮一二区| 在线亚洲精品国产二区图片欧美 | 一级片'在线观看视频| 国产精品国产三级国产专区5o| 五月开心婷婷网| 国内揄拍国产精品人妻在线| 热99国产精品久久久久久7| 伦理电影大哥的女人| 成人特级av手机在线观看| 国产 一区 欧美 日韩| 亚洲欧美日韩无卡精品| 国产精品嫩草影院av在线观看| 精品酒店卫生间| 美女xxoo啪啪120秒动态图| 日本欧美视频一区| 成人国产麻豆网| 免费看av在线观看网站| 日韩av不卡免费在线播放| 夜夜骑夜夜射夜夜干| 亚洲国产日韩一区二区| 在线观看国产h片| 久久国产精品男人的天堂亚洲 | 麻豆成人av视频| 黑人猛操日本美女一级片| 一级爰片在线观看| 少妇人妻 视频| 国产69精品久久久久777片| 国产女主播在线喷水免费视频网站| 成人无遮挡网站| 久久久久国产网址| 激情 狠狠 欧美| 日韩电影二区| 一本—道久久a久久精品蜜桃钙片| 国产精品久久久久久久久免| 男人舔奶头视频| 国产精品一区www在线观看| 人体艺术视频欧美日本| 欧美成人a在线观看| 精品酒店卫生间| 亚洲欧美日韩卡通动漫| 一个人看视频在线观看www免费|