• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于長(zhǎng)句簡(jiǎn)化的中文開放關(guān)系抽取

    2023-03-04 06:37:32熊建華韓永國(guó)寇露彥吳昌述
    關(guān)鍵詞:子句長(zhǎng)句利用

    熊建華,韓永國(guó),廖 競(jìng),寇露彥,吳昌述

    (西南科技大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,四川 綿陽 621010)

    0 引 言

    信息抽取(Information Extraction,IE)利用計(jì)算機(jī)技術(shù)來識(shí)別文檔的有效信息,并將這些信息轉(zhuǎn)換成適合計(jì)算機(jī)的存儲(chǔ)、處理和檢索的結(jié)構(gòu)化形式。信息抽取開辟了更加豐富的知識(shí)使用方式,有助于高效、有效地分析海量文本數(shù)據(jù)。信息抽取任務(wù)依照抽取內(nèi)容可以劃分為:命名實(shí)體識(shí)別、事件抽取、關(guān)系抽取等。關(guān)系抽取是其中的重要子任務(wù)之一,主要目的是從文本中抽取實(shí)體之間的語義關(guān)系,通過三元組的形式對(duì)文本中包含的知識(shí)進(jìn)行組織。開放關(guān)系抽取是指在不事先定義關(guān)系類型的情況下,直接對(duì)語料進(jìn)行關(guān)系數(shù)據(jù)的抽取。相比于傳統(tǒng)關(guān)系抽取,開放關(guān)系抽取能充分利用開放語料,擴(kuò)展出更多的關(guān)系類型,為自然語言處理的下游任務(wù)提供更好的支持。

    開放關(guān)系抽取最早是在英文領(lǐng)域提出的。在英文開放關(guān)系抽取研究中出現(xiàn)了TextRunner[1]、WOE[2]、Reverb[3]、ClauseIE[4]、OLLIE[5]等多種經(jīng)典系統(tǒng)。其中,TextRunner與Reverb都是利用詞性標(biāo)記和正則表達(dá)式制定抽取規(guī)則進(jìn)行抽取。ClauseIE通過英語語法知識(shí)將句子分解為子句進(jìn)行抽取。WOE與OLLIE是基于自監(jiān)督學(xué)習(xí)的抽取系統(tǒng),利用已有的高質(zhì)量關(guān)系數(shù)據(jù)標(biāo)注數(shù)據(jù),構(gòu)建訓(xùn)練數(shù)據(jù)集,然后從訓(xùn)練數(shù)據(jù)集中學(xué)習(xí)關(guān)系抽取的模板。近年來,有學(xué)者嘗試使用深度學(xué)習(xí)網(wǎng)絡(luò)對(duì)開放關(guān)系進(jìn)行端對(duì)端的抽取。文獻(xiàn)[6]中利用編碼器-解碼器框架進(jìn)行開放關(guān)系抽取。該方法可以不定義任何抽取模式,直接進(jìn)行抽取。文獻(xiàn)[7]利用BERT和多頭注意注意力機(jī)制融合句子和謂語特征,通過序列標(biāo)注的方法進(jìn)行開放關(guān)系抽取。

    相比于英文開放關(guān)系抽取,中文開放關(guān)系抽取研究仍然處于起步階段,且中文開放關(guān)系抽取人工標(biāo)記數(shù)據(jù)集較少,大部分研究仍然采用基于規(guī)則和模板的方式進(jìn)行無監(jiān)督的抽取。文獻(xiàn)[8]中提出了一種無監(jiān)督的中文開放關(guān)系抽取方法。該方法利用實(shí)體距離、關(guān)系詞位置等特征抽取候選關(guān)系數(shù)據(jù),隨后利用信息增益、句式規(guī)則進(jìn)行關(guān)系過濾。該方法在大規(guī)模網(wǎng)絡(luò)文本語料中的準(zhǔn)確率達(dá)到了80%。文獻(xiàn)[9]首次提出多元組的中文開放關(guān)系抽取,首先,識(shí)別出語料中的基本名詞短語作為實(shí)體詞,將句子中的謂語動(dòng)詞作為候選關(guān)系詞;然后,根據(jù)句法規(guī)則將與關(guān)系詞相連的所有實(shí)體都添加到關(guān)系組中,可以同時(shí)抽取二元組和多元組。該方法在百度百科數(shù)據(jù)集上的抽取準(zhǔn)確率達(dá)到了 81%。文獻(xiàn)[10]以句法分析結(jié)果的根節(jié)點(diǎn)為入口,遞歸查找所有動(dòng)詞的主語、賓語成分,再根據(jù)句法規(guī)則進(jìn)行補(bǔ)充調(diào)整,最終有效地獲取句子中復(fù)雜的多元實(shí)體關(guān)系。文獻(xiàn)[11]從手工標(biāo)注的少量地質(zhì)領(lǐng)域數(shù)據(jù)學(xué)習(xí)關(guān)系抽取模板進(jìn)行開放關(guān)系抽取,有效解決了地質(zhì)領(lǐng)域關(guān)系復(fù)雜的問題。文獻(xiàn)[12]首次將中文開放關(guān)系抽取視為序列生成任務(wù),利用指針生成網(wǎng)絡(luò)對(duì)文本進(jìn)行端對(duì)端的抽取。然而該方法仍然是在基于模板抽取的數(shù)據(jù)集上進(jìn)行訓(xùn)練的。

    綜上所述,目前中文開放關(guān)系抽取的主要方法都是基于規(guī)則和模板的,這些方法需要以自然語言處理工具的處理結(jié)果為基礎(chǔ)進(jìn)行抽取。然而自然語言處理工具在處理復(fù)雜長(zhǎng)句時(shí),分詞、詞性標(biāo)注、句法分析的準(zhǔn)確率都明顯下降,嚴(yán)重影響關(guān)系抽取的質(zhì)量。另一方面,在復(fù)雜長(zhǎng)句中通常存在多個(gè)關(guān)系數(shù)據(jù),現(xiàn)有的開放關(guān)系抽取模板很難做到全面覆蓋。因此,該文借助序列到序列神經(jīng)網(wǎng)絡(luò)模型將復(fù)雜長(zhǎng)句簡(jiǎn)化為多個(gè)結(jié)構(gòu)簡(jiǎn)單的子句,然后,利用自然語言處理工具對(duì)每個(gè)子句分別進(jìn)行處理,最后,通過詞性、句法等約束實(shí)現(xiàn)開放關(guān)系抽取。

    1 長(zhǎng)句簡(jiǎn)化數(shù)據(jù)集構(gòu)建

    目前中文領(lǐng)域暫時(shí)沒有長(zhǎng)句簡(jiǎn)化相關(guān)的數(shù)據(jù)集。該文使用手工標(biāo)注和回譯策略兩種方法構(gòu)建了一個(gè)中文長(zhǎng)句簡(jiǎn)化語料庫(kù)。

    首先,采用2019年中文維基百科的數(shù)據(jù),進(jìn)行長(zhǎng)句簡(jiǎn)化數(shù)據(jù)集的手工標(biāo)注。中文維基百科數(shù)據(jù)的內(nèi)容豐富,詞語、句法相對(duì)規(guī)范,數(shù)據(jù)量大是中文自然語言處理研究中常用的數(shù)據(jù)集,具有一定的權(quán)威性和可靠性。在進(jìn)行手工標(biāo)注前,需要先對(duì)中文維基百科數(shù)據(jù)進(jìn)行預(yù)處理。如圖1所示,首先,對(duì)數(shù)據(jù)按句號(hào)進(jìn)行分句;然后,使用哈工大的LTP(Language Technology Platform)工具對(duì)句子進(jìn)行分詞,篩選出詞數(shù)大于30的句子;最后,利用LTP對(duì)句子進(jìn)行實(shí)體識(shí)別,篩選出包含兩個(gè)以上實(shí)體的句子,確保選出的句子包含關(guān)系數(shù)據(jù)。

    圖1 維基百科數(shù)據(jù)預(yù)處理流程

    通過對(duì)篩選后的復(fù)雜長(zhǎng)句分析發(fā)現(xiàn),大多數(shù)句子都可以采用分解法和指稱法[13]進(jìn)行手工簡(jiǎn)化。分解法是將長(zhǎng)句中的復(fù)雜成分獨(dú)立開來,與相應(yīng)的成分構(gòu)成若干短句。以語句“狐猴科是哺乳綱靈長(zhǎng)目的一科,是樹棲動(dòng)物,主要分布于非洲的馬達(dá)加斯加島”為例。前方主語和后方的并列短語可以直接拆分為結(jié)構(gòu)獨(dú)立的子句:“狐猴科屬于哺乳綱靈長(zhǎng)目”“狐猴科是樹棲動(dòng)物”“狐猴科主要分布于非洲的馬達(dá)加斯加島”。指稱法是指將長(zhǎng)句中的復(fù)雜成分用一個(gè)詞語來指代,與相應(yīng)的成分構(gòu)成“總說”的單句,再把復(fù)雜成分一一展開形成“分說”的單句,變成“總分句群”。以語句“龍卷風(fēng)是在極不穩(wěn)定天氣下由空氣強(qiáng)烈對(duì)流運(yùn)動(dòng)而產(chǎn)生的一種伴隨著高速旋轉(zhuǎn)的漏斗狀云柱的強(qiáng)風(fēng)渦旋”為例,先抽取出句子主干“龍卷風(fēng)是一種強(qiáng)風(fēng)渦旋”,再對(duì)句子中的復(fù)雜成分進(jìn)行分說“龍卷風(fēng)由空氣強(qiáng)烈對(duì)流運(yùn)動(dòng)產(chǎn)生”“龍卷風(fēng)伴隨漏斗狀云柱”。

    從預(yù)處理后的長(zhǎng)句數(shù)據(jù)中隨機(jī)抽取出4 000條長(zhǎng)度大于30的句子,并按照上述方法對(duì)篩選出的句子進(jìn)行手工簡(jiǎn)化。

    第二,利用回譯的方法,從英文的長(zhǎng)句簡(jiǎn)化語料中獲取原始數(shù)據(jù),再?gòu)闹泻Y選出2 000條數(shù)據(jù)。這一部分語料來源于WikiSpilt[14]。WikiSpilt數(shù)據(jù)集是從英文維基百科編輯歷史數(shù)據(jù)中收集而來的,包含100萬條句子簡(jiǎn)化實(shí)例。首先,利用谷歌翻譯接口對(duì)原始數(shù)據(jù)集進(jìn)行翻譯,刪除翻譯后詞語缺失、重復(fù)、翻譯錯(cuò)誤的噪聲數(shù)據(jù)。然后,利用LTP工具對(duì)句子進(jìn)行分詞和實(shí)體識(shí)別,篩選出實(shí)體數(shù)目大于2且原始句子長(zhǎng)度大于30的句子及其簡(jiǎn)化子句,再?gòu)闹须S機(jī)挑選出2 000條數(shù)據(jù)。最后,將兩部分?jǐn)?shù)據(jù)合并得到6 000條長(zhǎng)句簡(jiǎn)化數(shù)據(jù)。

    2 基于長(zhǎng)句簡(jiǎn)化的中文開放關(guān)系抽取

    關(guān)系抽取模型的大致工作流程如圖2所示。以圖中句子“斯坦福大學(xué)于1891年由時(shí)任加州參議員及州長(zhǎng)的鐵路大亨利蘭·史丹福和他的妻子創(chuàng)辦”為例。先通過長(zhǎng)句簡(jiǎn)化模型將句子簡(jiǎn)化為“斯坦福大學(xué)于1891年創(chuàng)辦”“斯坦福大學(xué)由亨利蘭·史丹福創(chuàng)辦”“亨利蘭·史丹福時(shí)任加州州長(zhǎng)”三條簡(jiǎn)單句。隨后再利用關(guān)系抽取算法對(duì)每個(gè)子句進(jìn)行抽取,得到關(guān)系三元組數(shù)組:(斯坦福大學(xué),創(chuàng)辦于,1891年);(亨利蘭·史丹福,創(chuàng)辦,斯坦福大學(xué));(加州,州長(zhǎng),亨利蘭·史丹福)。接下來將對(duì)長(zhǎng)句簡(jiǎn)化模型、關(guān)系抽取兩個(gè)部分內(nèi)容分別進(jìn)行介紹。

    圖2 基于長(zhǎng)句簡(jiǎn)化的關(guān)系抽取流程

    2.1 長(zhǎng)句簡(jiǎn)化模型

    目前關(guān)于中文復(fù)雜長(zhǎng)句的簡(jiǎn)化主要是利用符號(hào)進(jìn)行分割[15-17]。但基于符號(hào)分割的句子,僅能分割出原本結(jié)構(gòu)獨(dú)立的子句,部分結(jié)構(gòu)不獨(dú)立的子句中仍然包含有關(guān)系數(shù)據(jù)。并且根據(jù)對(duì)上文構(gòu)建的復(fù)雜長(zhǎng)句數(shù)據(jù)集的統(tǒng)計(jì)發(fā)現(xiàn),在復(fù)雜長(zhǎng)句中還存在許多沒有逗號(hào)的句子??梢娎梅?hào)進(jìn)行長(zhǎng)句簡(jiǎn)化存在著較大的局限性。因此,該文借鑒英文長(zhǎng)句簡(jiǎn)化的思想[18-20],直接利用機(jī)器翻譯領(lǐng)域的序列到序列神經(jīng)網(wǎng)絡(luò)模型對(duì)長(zhǎng)句簡(jiǎn)化任務(wù)進(jìn)行建模,將其作為單語言的翻譯任務(wù)。

    現(xiàn)有的序列到序列模型通常采用RNN與LSTM神經(jīng)網(wǎng)絡(luò),存在編碼器結(jié)構(gòu)過于簡(jiǎn)單以及編碼階段信息利用率低的問題,在語料資源較少的情況下,性能較差。BERT[21]模型通過結(jié)合多維語義特征獲取詞向量,可以得到更細(xì)粒度的文本上下文表示,極大地提升了模型的特征提取能力。如圖3所示,該文以BERT的雙向Transformer結(jié)構(gòu)作為基礎(chǔ),構(gòu)建序列到序列模型。由于本身結(jié)構(gòu)限制,BERT模型通常只用于輸入編碼,并不能直接適用于文本生成任務(wù)。因此,采用UniLM[22]的seq2seq Mask機(jī)制對(duì)BERT的Transformer結(jié)構(gòu)進(jìn)行改造,僅對(duì)輸入部分的第二段文本進(jìn)行下三角遮掩。這樣當(dāng)Mask字段處在第一段文本時(shí),模型可以利用文本中的所有token信息進(jìn)行預(yù)測(cè)。當(dāng)Mask字段處在第二段文本時(shí),模型可以利用第一段文本的全部token信息,同時(shí)還可以利用Mask字段本身和它左側(cè)的全部token信息。通過這種方式,可以實(shí)現(xiàn)序列到序列的效果。

    圖3 長(zhǎng)句簡(jiǎn)化模型結(jié)構(gòu)

    為了減少不必要的計(jì)算,加快模型訓(xùn)練速度,對(duì)BERT模型的vocab.txt文件進(jìn)行了精簡(jiǎn),只保留語料中使用到的token。訓(xùn)練階段,將復(fù)雜句S1和簡(jiǎn)單句子集S2連接成一個(gè)序列,以[SOS]s1[EOS]s2[EOS]的格式輸入,S2中各個(gè)子句間使用“?!边M(jìn)行分割。根據(jù)詞表獲取序列的Token后,再對(duì)序列的詞、位置、Segment(用于區(qū)分輸入序列和目標(biāo)序列)進(jìn)行embedding計(jì)算,最后將三種embedding求和得到最終的文本向量。英文中各個(gè)單詞本身帶有分隔符,而中文詞語通常由多個(gè)字詞連接組成。原始的BERT模型在預(yù)訓(xùn)練過程中,采用的是以字粒度為基礎(chǔ)的Mask方式,會(huì)分割原本完整的中文詞語。因此,引入BERT-WWM[23]預(yù)訓(xùn)練模型參數(shù),BERT-WWM利用全詞Mask方式進(jìn)行訓(xùn)練,將同一詞語進(jìn)行整體遮掩,能更好地保證中文句子的語義完整性。

    在預(yù)測(cè)階段,加載訓(xùn)練好的模型權(quán)重,輸入待簡(jiǎn)化長(zhǎng)句進(jìn)行預(yù)測(cè),在解碼時(shí)利用beamSearch搜索算法優(yōu)化預(yù)測(cè)序列得到簡(jiǎn)化句子集。

    2.2 關(guān)系抽取

    在關(guān)系抽取部分,仍然采用與主流開放關(guān)系抽取一致的思路,利用詞性、句法規(guī)則進(jìn)行抽取。然而與傳統(tǒng)方法不同的是,該文抽取的句子是經(jīng)過長(zhǎng)句簡(jiǎn)化模型處理得到的,句子結(jié)構(gòu)簡(jiǎn)單且類型大致相同。因此,不需要制定豐富、完備的范式,僅需要制定簡(jiǎn)潔規(guī)則進(jìn)行抽取即可。關(guān)系抽取算法的具體步驟為:

    (1)利用LTP工具處理簡(jiǎn)化后的句子,獲取詞性標(biāo)注,依存句法分析的結(jié)果。

    (2)獲取句子的主語和賓語作為基礎(chǔ)實(shí)體。將與句子核心詞相連的實(shí)體詞作為起點(diǎn)向前搜索,如果存在與實(shí)體詞具有定中關(guān)系的名詞、名詞性動(dòng)詞等,則將其與起點(diǎn)的實(shí)體詞組合成語義完整的實(shí)體。

    (3)根據(jù)依存句法分析結(jié)果找到句子的核心詞。

    (4)以核心詞為起點(diǎn),對(duì)與之相連的詞語進(jìn)行判斷。如果存在并列的動(dòng)詞或者動(dòng)補(bǔ)結(jié)構(gòu)的介詞,則將其與核心詞組合成新的關(guān)系詞,如果不存在則直接將核心詞作為關(guān)系詞。

    (5)將關(guān)系詞與對(duì)應(yīng)實(shí)體組成關(guān)系三元組輸出。

    (6)將各個(gè)子句中抽取出的關(guān)系數(shù)據(jù)進(jìn)行合并成關(guān)系數(shù)組輸出。

    綜上所述,關(guān)系抽取算法首先按照主謂賓的句法結(jié)構(gòu)進(jìn)行了抽取,然后在此基礎(chǔ)上,對(duì)存在定中結(jié)構(gòu)的實(shí)體詞進(jìn)行了補(bǔ)充,對(duì)關(guān)系詞相連接的動(dòng)詞和介詞進(jìn)行了處理。

    3 實(shí)驗(yàn)與分析

    從構(gòu)建的長(zhǎng)句簡(jiǎn)化數(shù)據(jù)集中抽取出1 000條句子對(duì)作為長(zhǎng)句簡(jiǎn)化的測(cè)試集,其余5 000條作為訓(xùn)練集。關(guān)系抽取部分,從長(zhǎng)句簡(jiǎn)化的1 000條測(cè)試數(shù)據(jù)中抽取出2 479條關(guān)系數(shù)據(jù),作為關(guān)系抽取的測(cè)試集。

    長(zhǎng)句簡(jiǎn)化部分,采用哈工大的BERT-WWM預(yù)訓(xùn)練參數(shù),設(shè)置最大序列長(zhǎng)度為70,Epochs設(shè)為55,初始學(xué)習(xí)率為1e-5,Beam_search解碼時(shí)的Beam_size為5。選取SARI值、BLUE值和訓(xùn)練時(shí)間作為長(zhǎng)句簡(jiǎn)化模型的評(píng)估指標(biāo)。SARI值通過對(duì)比原句、參考子句、預(yù)測(cè)子句中的詞語計(jì)算句子的簡(jiǎn)化性。BLUE值是字符串相似性度量,可以衡量簡(jiǎn)化子句與原句的相似性。

    選用了如下三種基準(zhǔn)模型進(jìn)行長(zhǎng)句簡(jiǎn)化對(duì)比實(shí)驗(yàn):

    (1)Seq2Seq+Attention:該模型將序列到序列框架與注意力機(jī)制結(jié)合,是目前研究文本生成任務(wù)的標(biāo)準(zhǔn)結(jié)構(gòu)模型。

    (2)Pointer-Generator:該模型在Seq2Seq模型的基礎(chǔ)上,通過指針網(wǎng)絡(luò)選擇生成詞,能有效解決生成過程中出現(xiàn)的未登錄詞的情況。

    (3)BERT+LSTM:該模型采用Seq2Seq基礎(chǔ)架構(gòu),將Encoder替換為雙向Transformer編碼,Decoder 采用LSTM。使用BERT模型對(duì)編碼端參數(shù)進(jìn)行初始化處理,解碼端從初始狀態(tài)訓(xùn)練。

    如表1所示,提出的長(zhǎng)句簡(jiǎn)化模型測(cè)試結(jié)果的SARI值和BLUE值分別為76.67%和60.65%,相比其他基準(zhǔn)模型有較好的提升。此外,所提模型的訓(xùn)練時(shí)間相比其他模型也有所減少,這是因?yàn)锽ERT模型提供了更豐富的上下文信息,使模型能更快收斂。

    表1 長(zhǎng)句簡(jiǎn)化模型對(duì)比實(shí)驗(yàn)結(jié)果

    關(guān)系抽取部分,將準(zhǔn)確率(P)、召回率(R)和F1值作為關(guān)系抽取模型的評(píng)估指標(biāo),計(jì)算公式如下:

    (1)

    (2)

    (3)

    其中,C1表示抽取結(jié)果中正確的關(guān)系條數(shù),C2表示抽取的總的關(guān)系條數(shù),C3表示測(cè)試集中存在的關(guān)系總數(shù),F(xiàn)1值是準(zhǔn)確率和召回率的調(diào)和平均值。

    選取了CORE[24]、DSNFS[25]系統(tǒng)進(jìn)行開放關(guān)系抽取對(duì)比,CORE利上下文信息及句法結(jié)構(gòu)信息進(jìn)行開放關(guān)系抽取,取得了較好的效果。DSNFS對(duì)中文中存在的特殊語言現(xiàn)象進(jìn)行了總結(jié),提出了一種基于依存語義范式的抽取方法,可以對(duì)網(wǎng)絡(luò)文本進(jìn)行無監(jiān)督的靈活的抽取。為了了解長(zhǎng)句簡(jiǎn)化方法對(duì)開放關(guān)系抽取方法的改進(jìn)效果,將兩種模型分別在原始長(zhǎng)句和簡(jiǎn)化后的句子上進(jìn)行實(shí)驗(yàn)。將在簡(jiǎn)化句子的實(shí)驗(yàn)結(jié)果表示為CORE-SS和DSNFS-SS。

    從表2可以看出,文中關(guān)系抽取方法準(zhǔn)確率最高,召回率僅次于DSNFS-SS,這是因?yàn)镈SNFS的抽取規(guī)則更加全面,可以覆蓋更多的情況。而CORE-SS與DSNFS-SS相比直接在復(fù)雜長(zhǎng)句上進(jìn)行抽取的CORE與DSNFS效果有較大的提升。說明基于長(zhǎng)句簡(jiǎn)化的關(guān)系抽取方法,能夠有效地提升開放關(guān)系抽取系統(tǒng)對(duì)復(fù)雜長(zhǎng)句的抽取效果。

    表2 開放關(guān)系抽取對(duì)比實(shí)驗(yàn)結(jié)果 %

    最后,對(duì)抽取中的錯(cuò)誤關(guān)系數(shù)據(jù)和未抽取出的關(guān)系數(shù)據(jù)進(jìn)行了分析,分析結(jié)果如表3所示。其中35%的錯(cuò)誤是由關(guān)系詞識(shí)別錯(cuò)誤產(chǎn)生的,由于該文僅選擇了動(dòng)詞詞性的詞語作為關(guān)系詞,而部分句子中的關(guān)系詞是與動(dòng)詞相鄰的名詞作為關(guān)系指示詞。其中28%的錯(cuò)誤源于嵌套實(shí)體,由于在復(fù)雜長(zhǎng)句中,除了句子本身結(jié)構(gòu)復(fù)雜導(dǎo)致的句子長(zhǎng)度增長(zhǎng)外,還存在句子中實(shí)體詞較長(zhǎng)的情況。該文僅利用自然語言處理工具進(jìn)行了簡(jiǎn)單的實(shí)體識(shí)別,沒有處理實(shí)體由多個(gè)實(shí)體嵌套的情形。20%由詞性標(biāo)注導(dǎo)致的錯(cuò)誤,由于中文中部分詞既可以做動(dòng)詞又可以做名詞,自然語言處理工具對(duì)這類詞的識(shí)別容易出錯(cuò)。13%錯(cuò)誤來自簡(jiǎn)化句子內(nèi)容缺失,由于長(zhǎng)句簡(jiǎn)化模型在句子生成過程中,遺失了部分內(nèi)容,從而將錯(cuò)誤傳遞給了關(guān)系抽取模塊。4%由句法分析錯(cuò)誤導(dǎo)致,經(jīng)過長(zhǎng)句簡(jiǎn)化后,大部分的句子都能夠得到正確的句法分析結(jié)果,然而仍然存在少量句子句法分析錯(cuò)誤。

    表3 錯(cuò)誤分析

    4 結(jié)束語

    該文提出了一種基于長(zhǎng)句簡(jiǎn)化的中文開放關(guān)系抽取方法。首先,利用序列到序列模型對(duì)復(fù)雜長(zhǎng)句進(jìn)行化簡(jiǎn),然后,針對(duì)化簡(jiǎn)后的句子進(jìn)行開放關(guān)系抽取。實(shí)驗(yàn)結(jié)果表明,該方法能有效提高開放關(guān)系抽取對(duì)復(fù)雜長(zhǎng)句抽取的準(zhǔn)確率和召回率。此外,對(duì)實(shí)驗(yàn)結(jié)果中的錯(cuò)誤進(jìn)行了歸納總結(jié),為之后的研究提供了參考。

    猜你喜歡
    子句長(zhǎng)句利用
    命題邏輯中一類擴(kuò)展子句消去方法
    利用min{a,b}的積分表示解決一類絕對(duì)值不等式
    命題邏輯可滿足性問題求解器的新型預(yù)處理子句消去方法
    利用一半進(jìn)行移多補(bǔ)少
    利用數(shù)的分解來思考
    Roommate is necessary when far away from home
    西夏語的副詞子句
    西夏學(xué)(2018年2期)2018-05-15 11:24:42
    這樣分析含同位語的長(zhǎng)句
    吼唱在關(guān)中大地上的“秦腔”——論小說《白鹿原》中長(zhǎng)句和排比句的秦腔韻味
    命題邏輯的子句集中文字的分類
    99精品欧美一区二区三区四区| 极品教师在线免费播放| 日韩中文字幕欧美一区二区| 在线国产一区二区在线| 一区二区三区国产精品乱码| 99精品在免费线老司机午夜| 一卡2卡三卡四卡精品乱码亚洲| 非洲黑人性xxxx精品又粗又长| 免费看十八禁软件| 69av精品久久久久久| 国产精品av久久久久免费| 免费搜索国产男女视频| www.自偷自拍.com| 中文字幕精品免费在线观看视频| 国产成人精品久久二区二区免费| 久久 成人 亚洲| 亚洲色图综合在线观看| 高潮久久久久久久久久久不卡| 亚洲av电影不卡..在线观看| 国内精品久久久久久久电影| 欧美乱妇无乱码| 亚洲人成电影观看| 一个人观看的视频www高清免费观看 | 中文字幕人妻丝袜一区二区| 亚洲国产毛片av蜜桃av| 午夜精品国产一区二区电影| 纯流量卡能插随身wifi吗| 黑人巨大精品欧美一区二区蜜桃| 亚洲全国av大片| 妹子高潮喷水视频| 9热在线视频观看99| 亚洲一区中文字幕在线| 超碰成人久久| 咕卡用的链子| 国产精品野战在线观看| 啦啦啦韩国在线观看视频| 日日夜夜操网爽| 波多野结衣巨乳人妻| 欧美日本视频| 99国产精品99久久久久| 亚洲精品国产色婷婷电影| 色综合欧美亚洲国产小说| 免费久久久久久久精品成人欧美视频| 欧美一级毛片孕妇| 成人国语在线视频| 成熟少妇高潮喷水视频| 国产高清videossex| 级片在线观看| 午夜免费鲁丝| 91精品国产国语对白视频| 看片在线看免费视频| 91在线观看av| 久久久久国产精品人妻aⅴ院| 岛国在线观看网站| 国产精品一区二区精品视频观看| 一二三四在线观看免费中文在| 老司机在亚洲福利影院| 麻豆成人av在线观看| 午夜两性在线视频| 亚洲欧美激情在线| 久久香蕉精品热| 久久婷婷成人综合色麻豆| 嫩草影视91久久| 国产亚洲精品第一综合不卡| 国产在线观看jvid| 国产精品久久久久久精品电影 | 少妇被粗大的猛进出69影院| 久热这里只有精品99| 黄片小视频在线播放| 国产精品九九99| 丝袜美腿诱惑在线| 欧美日韩乱码在线| 啪啪无遮挡十八禁网站| 久久精品91无色码中文字幕| 18美女黄网站色大片免费观看| 18美女黄网站色大片免费观看| 后天国语完整版免费观看| 国产欧美日韩一区二区精品| bbb黄色大片| 亚洲欧美激情综合另类| 国产97色在线日韩免费| 精品久久蜜臀av无| 高清在线国产一区| 精品第一国产精品| 亚洲av片天天在线观看| 午夜福利影视在线免费观看| av免费在线观看网站| 欧美亚洲日本最大视频资源| 999久久久国产精品视频| 99国产极品粉嫩在线观看| 亚洲欧美日韩无卡精品| 国产精品香港三级国产av潘金莲| 国产一区在线观看成人免费| 国产精品二区激情视频| 国产精品日韩av在线免费观看 | 色播在线永久视频| 91精品国产国语对白视频| 精品卡一卡二卡四卡免费| 欧美绝顶高潮抽搐喷水| 久久香蕉精品热| 999久久久国产精品视频| 国产精品久久久久久亚洲av鲁大| 啦啦啦免费观看视频1| 黄片小视频在线播放| 欧美日本中文国产一区发布| 色老头精品视频在线观看| 国产精品1区2区在线观看.| 色婷婷久久久亚洲欧美| 美女国产高潮福利片在线看| 久久久久久免费高清国产稀缺| 午夜福利高清视频| 婷婷六月久久综合丁香| 天堂动漫精品| 99国产精品免费福利视频| 国产欧美日韩精品亚洲av| 大型黄色视频在线免费观看| 亚洲精品一卡2卡三卡4卡5卡| 亚洲欧美日韩高清在线视频| 窝窝影院91人妻| 美国免费a级毛片| 日韩国内少妇激情av| 在线观看66精品国产| 久久香蕉精品热| 午夜视频精品福利| 亚洲国产毛片av蜜桃av| 巨乳人妻的诱惑在线观看| 国产一卡二卡三卡精品| 黄色视频不卡| 色综合站精品国产| 亚洲欧美一区二区三区黑人| 男人的好看免费观看在线视频 | 亚洲 欧美 日韩 在线 免费| 波多野结衣高清无吗| 黑人巨大精品欧美一区二区蜜桃| 亚洲国产毛片av蜜桃av| 国产精品一区二区三区四区久久 | 又黄又粗又硬又大视频| 变态另类成人亚洲欧美熟女 | 丝袜美腿诱惑在线| 亚洲七黄色美女视频| 18禁裸乳无遮挡免费网站照片 | 在线观看免费视频网站a站| 午夜a级毛片| 亚洲狠狠婷婷综合久久图片| cao死你这个sao货| 又大又爽又粗| 99在线视频只有这里精品首页| x7x7x7水蜜桃| 法律面前人人平等表现在哪些方面| 日本撒尿小便嘘嘘汇集6| 正在播放国产对白刺激| 人人澡人人妻人| 男男h啪啪无遮挡| 欧美日韩精品网址| 91字幕亚洲| 国产蜜桃级精品一区二区三区| 天堂动漫精品| 一夜夜www| 99riav亚洲国产免费| 欧美日韩福利视频一区二区| 亚洲成a人片在线一区二区| 成人18禁在线播放| 国产亚洲精品av在线| 欧美成人午夜精品| 99国产极品粉嫩在线观看| av欧美777| 亚洲熟妇中文字幕五十中出| 日韩精品免费视频一区二区三区| 久久久久久久午夜电影| 欧美性长视频在线观看| 91大片在线观看| 国产成人系列免费观看| 国产精品亚洲一级av第二区| 亚洲美女黄片视频| 老汉色av国产亚洲站长工具| 夜夜爽天天搞| e午夜精品久久久久久久| 制服人妻中文乱码| 日韩国内少妇激情av| 亚洲一区二区三区色噜噜| 99re在线观看精品视频| 国产精品日韩av在线免费观看 | 黑人操中国人逼视频| 亚洲欧美日韩另类电影网站| 波多野结衣av一区二区av| 午夜福利,免费看| 男女之事视频高清在线观看| bbb黄色大片| 久久久久久久久免费视频了| 国产亚洲精品一区二区www| 国产精品国产高清国产av| 大型黄色视频在线免费观看| 久久精品aⅴ一区二区三区四区| 亚洲精品国产精品久久久不卡| 日本 欧美在线| 日本撒尿小便嘘嘘汇集6| 脱女人内裤的视频| 国语自产精品视频在线第100页| 午夜福利高清视频| 国产真人三级小视频在线观看| videosex国产| 在线观看日韩欧美| 国产精品亚洲av一区麻豆| 怎么达到女性高潮| 久久香蕉精品热| 国产不卡一卡二| 满18在线观看网站| 99久久国产精品久久久| 伦理电影免费视频| 日韩精品中文字幕看吧| 色在线成人网| 亚洲精品美女久久av网站| 亚洲精品久久国产高清桃花| 中文字幕色久视频| 日日夜夜操网爽| 国产成人欧美| 丰满的人妻完整版| 久久久久久久精品吃奶| 欧美黄色淫秽网站| 亚洲在线自拍视频| 亚洲欧美激情在线| 日本 av在线| av视频在线观看入口| 欧美色视频一区免费| 高清在线国产一区| 曰老女人黄片| 亚洲精品一区av在线观看| 日韩三级视频一区二区三区| 18美女黄网站色大片免费观看| 亚洲一区高清亚洲精品| 国产精品野战在线观看| 国产午夜福利久久久久久| 两个人免费观看高清视频| 嫩草影院精品99| 精品国产一区二区久久| 久久国产亚洲av麻豆专区| 午夜精品国产一区二区电影| 国产精品,欧美在线| av视频在线观看入口| 久久草成人影院| 咕卡用的链子| 18禁观看日本| 男女床上黄色一级片免费看| a级毛片在线看网站| 国产成人欧美在线观看| 精品久久久久久久人妻蜜臀av | 美女午夜性视频免费| 露出奶头的视频| 后天国语完整版免费观看| 久久午夜综合久久蜜桃| 黄色成人免费大全| 欧美在线黄色| 久久中文字幕人妻熟女| 如日韩欧美国产精品一区二区三区| 欧美国产日韩亚洲一区| 国产精品乱码一区二三区的特点 | 久久性视频一级片| 日本三级黄在线观看| 中文字幕精品免费在线观看视频| 亚洲专区中文字幕在线| 久久精品影院6| 久9热在线精品视频| 国内精品久久久久精免费| 亚洲中文字幕日韩| 少妇被粗大的猛进出69影院| 国产精品久久久久久人妻精品电影| 久久久精品国产亚洲av高清涩受| 精品国产乱子伦一区二区三区| 一边摸一边做爽爽视频免费| 亚洲国产看品久久| 51午夜福利影视在线观看| 女人被狂操c到高潮| 麻豆一二三区av精品| 自线自在国产av| 国产精品九九99| 日韩有码中文字幕| 免费观看精品视频网站| 老司机靠b影院| 天堂动漫精品| 波多野结衣一区麻豆| 国产精品一区二区免费欧美| 亚洲电影在线观看av| 色综合亚洲欧美另类图片| 国产精品久久久久久人妻精品电影| 人妻久久中文字幕网| 欧美 亚洲 国产 日韩一| 久久人人精品亚洲av| 国产精品av久久久久免费| 精品午夜福利视频在线观看一区| 国产亚洲精品av在线| 国产欧美日韩一区二区三区在线| 国产精品日韩av在线免费观看 | 好看av亚洲va欧美ⅴa在| 欧美+亚洲+日韩+国产| videosex国产| 国内精品久久久久久久电影| 亚洲一区二区三区不卡视频| 国产男靠女视频免费网站| 国产成人精品在线电影| 亚洲免费av在线视频| 熟妇人妻久久中文字幕3abv| 搡老岳熟女国产| 香蕉丝袜av| 夜夜夜夜夜久久久久| 亚洲国产日韩欧美精品在线观看 | 国产麻豆成人av免费视频| 色综合婷婷激情| 亚洲自拍偷在线| 久久精品国产亚洲av高清一级| 精品久久蜜臀av无| 天堂√8在线中文| 51午夜福利影视在线观看| 色av中文字幕| 欧美性长视频在线观看| 一级a爱片免费观看的视频| 搡老妇女老女人老熟妇| 99久久综合精品五月天人人| 少妇 在线观看| 黄色视频不卡| 国产亚洲欧美98| 99国产精品一区二区三区| 国产成人系列免费观看| av在线天堂中文字幕| 校园春色视频在线观看| 成人18禁高潮啪啪吃奶动态图| 麻豆成人av在线观看| 日韩 欧美 亚洲 中文字幕| 亚洲欧美一区二区三区黑人| 人妻久久中文字幕网| 精品福利观看| 久久精品aⅴ一区二区三区四区| 久久精品国产亚洲av高清一级| 天堂影院成人在线观看| 久热爱精品视频在线9| 久久精品aⅴ一区二区三区四区| 大型av网站在线播放| 高清在线国产一区| 亚洲国产欧美日韩在线播放| 长腿黑丝高跟| 欧美日韩福利视频一区二区| 9191精品国产免费久久| av中文乱码字幕在线| 久久精品国产亚洲av高清一级| 亚洲精品国产一区二区精华液| 一级黄色大片毛片| 国产欧美日韩精品亚洲av| 操美女的视频在线观看| 欧美国产精品va在线观看不卡| 亚洲视频免费观看视频| 午夜福利视频1000在线观看 | 99国产极品粉嫩在线观看| 黄频高清免费视频| 中文字幕色久视频| 亚洲一区中文字幕在线| 99热只有精品国产| av福利片在线| 亚洲一区二区三区不卡视频| 丁香欧美五月| 丝袜人妻中文字幕| 日韩大尺度精品在线看网址 | 国产av又大| 色综合婷婷激情| 国产精品久久久av美女十八| 1024视频免费在线观看| 啦啦啦韩国在线观看视频| 亚洲精品中文字幕在线视频| 成人亚洲精品一区在线观看| 亚洲av电影不卡..在线观看| 麻豆成人av在线观看| 国产精品九九99| 精品久久蜜臀av无| 久热爱精品视频在线9| www.999成人在线观看| 免费在线观看亚洲国产| 欧美 亚洲 国产 日韩一| 欧美黄色片欧美黄色片| bbb黄色大片| 亚洲午夜精品一区,二区,三区| 少妇被粗大的猛进出69影院| 后天国语完整版免费观看| 国产亚洲精品av在线| 亚洲片人在线观看| 99香蕉大伊视频| 午夜福利影视在线免费观看| 一区福利在线观看| 国产欧美日韩一区二区精品| 国产亚洲精品综合一区在线观看 | 自拍欧美九色日韩亚洲蝌蚪91| 国产乱人伦免费视频| 一二三四社区在线视频社区8| 老司机午夜福利在线观看视频| 69精品国产乱码久久久| 老司机福利观看| 亚洲三区欧美一区| 日韩欧美免费精品| 亚洲情色 制服丝袜| 最好的美女福利视频网| 免费看十八禁软件| 丝袜美足系列| 男女做爰动态图高潮gif福利片 | 我的亚洲天堂| 亚洲国产精品sss在线观看| 真人一进一出gif抽搐免费| 欧美乱码精品一区二区三区| 少妇被粗大的猛进出69影院| 无人区码免费观看不卡| 欧美激情久久久久久爽电影 | 熟女少妇亚洲综合色aaa.| 亚洲国产欧美日韩在线播放| 高清黄色对白视频在线免费看| 日韩大尺度精品在线看网址 | 99久久国产精品久久久| 国产精品98久久久久久宅男小说| 国产一区二区在线av高清观看| 一卡2卡三卡四卡精品乱码亚洲| 成人av一区二区三区在线看| 嫩草影院精品99| 老司机福利观看| 亚洲全国av大片| a级毛片在线看网站| 看片在线看免费视频| 丰满的人妻完整版| 性欧美人与动物交配| 麻豆成人av在线观看| 久久久精品欧美日韩精品| 两个人看的免费小视频| 男女午夜视频在线观看| 国产成人影院久久av| 热re99久久国产66热| 亚洲激情在线av| 国产亚洲欧美精品永久| 久久人人97超碰香蕉20202| 午夜福利在线观看吧| 亚洲自偷自拍图片 自拍| 亚洲av日韩精品久久久久久密| 久久久久精品国产欧美久久久| 国产三级在线视频| 久久香蕉激情| 国产精品99久久99久久久不卡| 大陆偷拍与自拍| 久久青草综合色| 亚洲男人天堂网一区| 色av中文字幕| av天堂在线播放| 国产精华一区二区三区| 女人爽到高潮嗷嗷叫在线视频| 亚洲熟妇中文字幕五十中出| 校园春色视频在线观看| 99久久久亚洲精品蜜臀av| 亚洲 国产 在线| 18禁美女被吸乳视频| 制服人妻中文乱码| 亚洲国产精品999在线| 精品熟女少妇八av免费久了| 日韩精品中文字幕看吧| 国产在线精品亚洲第一网站| 国产日韩一区二区三区精品不卡| 国产99白浆流出| 狠狠狠狠99中文字幕| 国内精品久久久久精免费| 成人特级黄色片久久久久久久| 国产一卡二卡三卡精品| 国产精品亚洲av一区麻豆| 欧美日本视频| 精品人妻1区二区| 久久久久九九精品影院| 老司机深夜福利视频在线观看| 国产成年人精品一区二区| 少妇的丰满在线观看| 每晚都被弄得嗷嗷叫到高潮| 狠狠狠狠99中文字幕| 麻豆一二三区av精品| 在线永久观看黄色视频| 国产精品亚洲av一区麻豆| 一进一出抽搐gif免费好疼| 高清黄色对白视频在线免费看| 日日摸夜夜添夜夜添小说| 国产免费av片在线观看野外av| 免费不卡黄色视频| 国产亚洲av高清不卡| 99国产综合亚洲精品| 我的亚洲天堂| 日本 av在线| 两人在一起打扑克的视频| 成人特级黄色片久久久久久久| 大陆偷拍与自拍| 黄色a级毛片大全视频| 少妇被粗大的猛进出69影院| 久久精品国产99精品国产亚洲性色 | 国产欧美日韩一区二区精品| 97人妻天天添夜夜摸| 亚洲人成77777在线视频| 天堂影院成人在线观看| 亚洲成人精品中文字幕电影| 国产欧美日韩一区二区精品| 麻豆成人av在线观看| 亚洲九九香蕉| 真人做人爱边吃奶动态| 国产主播在线观看一区二区| 操美女的视频在线观看| 久久婷婷成人综合色麻豆| 夜夜爽天天搞| 麻豆一二三区av精品| 亚洲第一青青草原| 久久久久国产一级毛片高清牌| 亚洲国产欧美日韩在线播放| 免费观看人在逋| 丁香六月欧美| 国产欧美日韩一区二区三| 中出人妻视频一区二区| 精品电影一区二区在线| 日韩大码丰满熟妇| 757午夜福利合集在线观看| 国产精品日韩av在线免费观看 | 日韩精品免费视频一区二区三区| 99在线视频只有这里精品首页| 国产精品免费视频内射| 大型av网站在线播放| 国产熟女xx| 国产成人精品在线电影| 久久青草综合色| 88av欧美| 黄色丝袜av网址大全| 国产一区在线观看成人免费| 在线av久久热| 亚洲精品在线观看二区| 午夜免费激情av| 老熟妇乱子伦视频在线观看| а√天堂www在线а√下载| 久久精品亚洲精品国产色婷小说| 成人亚洲精品一区在线观看| 一级毛片精品| 亚洲人成77777在线视频| 精品卡一卡二卡四卡免费| 午夜福利免费观看在线| 国产1区2区3区精品| 黄色视频不卡| 国产99久久九九免费精品| 99在线人妻在线中文字幕| 中文字幕av电影在线播放| 亚洲精品国产精品久久久不卡| 黑人欧美特级aaaaaa片| 亚洲,欧美精品.| 国产成人啪精品午夜网站| 精品国产一区二区三区四区第35| 亚洲avbb在线观看| 美女免费视频网站| 欧美日韩亚洲国产一区二区在线观看| 亚洲第一av免费看| 欧美黄色淫秽网站| 久久国产乱子伦精品免费另类| 日本撒尿小便嘘嘘汇集6| 国产精品久久久久久亚洲av鲁大| 非洲黑人性xxxx精品又粗又长| 999久久久国产精品视频| 欧美日韩福利视频一区二区| 动漫黄色视频在线观看| 日韩高清综合在线| 精品国产超薄肉色丝袜足j| 国产精华一区二区三区| 手机成人av网站| 免费女性裸体啪啪无遮挡网站| 精品国产国语对白av| 大陆偷拍与自拍| 国产成+人综合+亚洲专区| 亚洲精品中文字幕一二三四区| 亚洲最大成人中文| 日韩av在线大香蕉| 成人国产综合亚洲| 母亲3免费完整高清在线观看| 欧美日韩精品网址| 日韩高清综合在线| 亚洲国产高清在线一区二区三 | 久热这里只有精品99| 夜夜夜夜夜久久久久| 99久久久亚洲精品蜜臀av| 精品熟女少妇八av免费久了| 99久久久亚洲精品蜜臀av| 午夜精品久久久久久毛片777| 午夜福利高清视频| 国产精品秋霞免费鲁丝片| 午夜福利高清视频| 极品人妻少妇av视频| 久久国产乱子伦精品免费另类| 中出人妻视频一区二区| 国产又色又爽无遮挡免费看| 国产精品永久免费网站| 国产蜜桃级精品一区二区三区| 9色porny在线观看| АⅤ资源中文在线天堂| 午夜成年电影在线免费观看| 色综合亚洲欧美另类图片| 午夜免费鲁丝| 国产精品爽爽va在线观看网站 | 伦理电影免费视频| 亚洲精品国产一区二区精华液| 欧美av亚洲av综合av国产av| 欧洲精品卡2卡3卡4卡5卡区| 精品国产美女av久久久久小说| 高潮久久久久久久久久久不卡| 亚洲第一青青草原| 看免费av毛片| 嫩草影院精品99| 757午夜福利合集在线观看| 搡老妇女老女人老熟妇| 午夜激情av网站| 国产精华一区二区三区| 纯流量卡能插随身wifi吗| 操美女的视频在线观看| 国产真人三级小视频在线观看| 多毛熟女@视频| 美女高潮喷水抽搐中文字幕| 国产激情欧美一区二区| 日韩视频一区二区在线观看| 欧美 亚洲 国产 日韩一|