• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于長(zhǎng)句簡(jiǎn)化的中文開放關(guān)系抽取

    2023-03-04 06:37:32熊建華韓永國(guó)寇露彥吳昌述
    關(guān)鍵詞:子句長(zhǎng)句利用

    熊建華,韓永國(guó),廖 競(jìng),寇露彥,吳昌述

    (西南科技大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,四川 綿陽 621010)

    0 引 言

    信息抽取(Information Extraction,IE)利用計(jì)算機(jī)技術(shù)來識(shí)別文檔的有效信息,并將這些信息轉(zhuǎn)換成適合計(jì)算機(jī)的存儲(chǔ)、處理和檢索的結(jié)構(gòu)化形式。信息抽取開辟了更加豐富的知識(shí)使用方式,有助于高效、有效地分析海量文本數(shù)據(jù)。信息抽取任務(wù)依照抽取內(nèi)容可以劃分為:命名實(shí)體識(shí)別、事件抽取、關(guān)系抽取等。關(guān)系抽取是其中的重要子任務(wù)之一,主要目的是從文本中抽取實(shí)體之間的語義關(guān)系,通過三元組的形式對(duì)文本中包含的知識(shí)進(jìn)行組織。開放關(guān)系抽取是指在不事先定義關(guān)系類型的情況下,直接對(duì)語料進(jìn)行關(guān)系數(shù)據(jù)的抽取。相比于傳統(tǒng)關(guān)系抽取,開放關(guān)系抽取能充分利用開放語料,擴(kuò)展出更多的關(guān)系類型,為自然語言處理的下游任務(wù)提供更好的支持。

    開放關(guān)系抽取最早是在英文領(lǐng)域提出的。在英文開放關(guān)系抽取研究中出現(xiàn)了TextRunner[1]、WOE[2]、Reverb[3]、ClauseIE[4]、OLLIE[5]等多種經(jīng)典系統(tǒng)。其中,TextRunner與Reverb都是利用詞性標(biāo)記和正則表達(dá)式制定抽取規(guī)則進(jìn)行抽取。ClauseIE通過英語語法知識(shí)將句子分解為子句進(jìn)行抽取。WOE與OLLIE是基于自監(jiān)督學(xué)習(xí)的抽取系統(tǒng),利用已有的高質(zhì)量關(guān)系數(shù)據(jù)標(biāo)注數(shù)據(jù),構(gòu)建訓(xùn)練數(shù)據(jù)集,然后從訓(xùn)練數(shù)據(jù)集中學(xué)習(xí)關(guān)系抽取的模板。近年來,有學(xué)者嘗試使用深度學(xué)習(xí)網(wǎng)絡(luò)對(duì)開放關(guān)系進(jìn)行端對(duì)端的抽取。文獻(xiàn)[6]中利用編碼器-解碼器框架進(jìn)行開放關(guān)系抽取。該方法可以不定義任何抽取模式,直接進(jìn)行抽取。文獻(xiàn)[7]利用BERT和多頭注意注意力機(jī)制融合句子和謂語特征,通過序列標(biāo)注的方法進(jìn)行開放關(guān)系抽取。

    相比于英文開放關(guān)系抽取,中文開放關(guān)系抽取研究仍然處于起步階段,且中文開放關(guān)系抽取人工標(biāo)記數(shù)據(jù)集較少,大部分研究仍然采用基于規(guī)則和模板的方式進(jìn)行無監(jiān)督的抽取。文獻(xiàn)[8]中提出了一種無監(jiān)督的中文開放關(guān)系抽取方法。該方法利用實(shí)體距離、關(guān)系詞位置等特征抽取候選關(guān)系數(shù)據(jù),隨后利用信息增益、句式規(guī)則進(jìn)行關(guān)系過濾。該方法在大規(guī)模網(wǎng)絡(luò)文本語料中的準(zhǔn)確率達(dá)到了80%。文獻(xiàn)[9]首次提出多元組的中文開放關(guān)系抽取,首先,識(shí)別出語料中的基本名詞短語作為實(shí)體詞,將句子中的謂語動(dòng)詞作為候選關(guān)系詞;然后,根據(jù)句法規(guī)則將與關(guān)系詞相連的所有實(shí)體都添加到關(guān)系組中,可以同時(shí)抽取二元組和多元組。該方法在百度百科數(shù)據(jù)集上的抽取準(zhǔn)確率達(dá)到了 81%。文獻(xiàn)[10]以句法分析結(jié)果的根節(jié)點(diǎn)為入口,遞歸查找所有動(dòng)詞的主語、賓語成分,再根據(jù)句法規(guī)則進(jìn)行補(bǔ)充調(diào)整,最終有效地獲取句子中復(fù)雜的多元實(shí)體關(guān)系。文獻(xiàn)[11]從手工標(biāo)注的少量地質(zhì)領(lǐng)域數(shù)據(jù)學(xué)習(xí)關(guān)系抽取模板進(jìn)行開放關(guān)系抽取,有效解決了地質(zhì)領(lǐng)域關(guān)系復(fù)雜的問題。文獻(xiàn)[12]首次將中文開放關(guān)系抽取視為序列生成任務(wù),利用指針生成網(wǎng)絡(luò)對(duì)文本進(jìn)行端對(duì)端的抽取。然而該方法仍然是在基于模板抽取的數(shù)據(jù)集上進(jìn)行訓(xùn)練的。

    綜上所述,目前中文開放關(guān)系抽取的主要方法都是基于規(guī)則和模板的,這些方法需要以自然語言處理工具的處理結(jié)果為基礎(chǔ)進(jìn)行抽取。然而自然語言處理工具在處理復(fù)雜長(zhǎng)句時(shí),分詞、詞性標(biāo)注、句法分析的準(zhǔn)確率都明顯下降,嚴(yán)重影響關(guān)系抽取的質(zhì)量。另一方面,在復(fù)雜長(zhǎng)句中通常存在多個(gè)關(guān)系數(shù)據(jù),現(xiàn)有的開放關(guān)系抽取模板很難做到全面覆蓋。因此,該文借助序列到序列神經(jīng)網(wǎng)絡(luò)模型將復(fù)雜長(zhǎng)句簡(jiǎn)化為多個(gè)結(jié)構(gòu)簡(jiǎn)單的子句,然后,利用自然語言處理工具對(duì)每個(gè)子句分別進(jìn)行處理,最后,通過詞性、句法等約束實(shí)現(xiàn)開放關(guān)系抽取。

    1 長(zhǎng)句簡(jiǎn)化數(shù)據(jù)集構(gòu)建

    目前中文領(lǐng)域暫時(shí)沒有長(zhǎng)句簡(jiǎn)化相關(guān)的數(shù)據(jù)集。該文使用手工標(biāo)注和回譯策略兩種方法構(gòu)建了一個(gè)中文長(zhǎng)句簡(jiǎn)化語料庫(kù)。

    首先,采用2019年中文維基百科的數(shù)據(jù),進(jìn)行長(zhǎng)句簡(jiǎn)化數(shù)據(jù)集的手工標(biāo)注。中文維基百科數(shù)據(jù)的內(nèi)容豐富,詞語、句法相對(duì)規(guī)范,數(shù)據(jù)量大是中文自然語言處理研究中常用的數(shù)據(jù)集,具有一定的權(quán)威性和可靠性。在進(jìn)行手工標(biāo)注前,需要先對(duì)中文維基百科數(shù)據(jù)進(jìn)行預(yù)處理。如圖1所示,首先,對(duì)數(shù)據(jù)按句號(hào)進(jìn)行分句;然后,使用哈工大的LTP(Language Technology Platform)工具對(duì)句子進(jìn)行分詞,篩選出詞數(shù)大于30的句子;最后,利用LTP對(duì)句子進(jìn)行實(shí)體識(shí)別,篩選出包含兩個(gè)以上實(shí)體的句子,確保選出的句子包含關(guān)系數(shù)據(jù)。

    圖1 維基百科數(shù)據(jù)預(yù)處理流程

    通過對(duì)篩選后的復(fù)雜長(zhǎng)句分析發(fā)現(xiàn),大多數(shù)句子都可以采用分解法和指稱法[13]進(jìn)行手工簡(jiǎn)化。分解法是將長(zhǎng)句中的復(fù)雜成分獨(dú)立開來,與相應(yīng)的成分構(gòu)成若干短句。以語句“狐猴科是哺乳綱靈長(zhǎng)目的一科,是樹棲動(dòng)物,主要分布于非洲的馬達(dá)加斯加島”為例。前方主語和后方的并列短語可以直接拆分為結(jié)構(gòu)獨(dú)立的子句:“狐猴科屬于哺乳綱靈長(zhǎng)目”“狐猴科是樹棲動(dòng)物”“狐猴科主要分布于非洲的馬達(dá)加斯加島”。指稱法是指將長(zhǎng)句中的復(fù)雜成分用一個(gè)詞語來指代,與相應(yīng)的成分構(gòu)成“總說”的單句,再把復(fù)雜成分一一展開形成“分說”的單句,變成“總分句群”。以語句“龍卷風(fēng)是在極不穩(wěn)定天氣下由空氣強(qiáng)烈對(duì)流運(yùn)動(dòng)而產(chǎn)生的一種伴隨著高速旋轉(zhuǎn)的漏斗狀云柱的強(qiáng)風(fēng)渦旋”為例,先抽取出句子主干“龍卷風(fēng)是一種強(qiáng)風(fēng)渦旋”,再對(duì)句子中的復(fù)雜成分進(jìn)行分說“龍卷風(fēng)由空氣強(qiáng)烈對(duì)流運(yùn)動(dòng)產(chǎn)生”“龍卷風(fēng)伴隨漏斗狀云柱”。

    從預(yù)處理后的長(zhǎng)句數(shù)據(jù)中隨機(jī)抽取出4 000條長(zhǎng)度大于30的句子,并按照上述方法對(duì)篩選出的句子進(jìn)行手工簡(jiǎn)化。

    第二,利用回譯的方法,從英文的長(zhǎng)句簡(jiǎn)化語料中獲取原始數(shù)據(jù),再?gòu)闹泻Y選出2 000條數(shù)據(jù)。這一部分語料來源于WikiSpilt[14]。WikiSpilt數(shù)據(jù)集是從英文維基百科編輯歷史數(shù)據(jù)中收集而來的,包含100萬條句子簡(jiǎn)化實(shí)例。首先,利用谷歌翻譯接口對(duì)原始數(shù)據(jù)集進(jìn)行翻譯,刪除翻譯后詞語缺失、重復(fù)、翻譯錯(cuò)誤的噪聲數(shù)據(jù)。然后,利用LTP工具對(duì)句子進(jìn)行分詞和實(shí)體識(shí)別,篩選出實(shí)體數(shù)目大于2且原始句子長(zhǎng)度大于30的句子及其簡(jiǎn)化子句,再?gòu)闹须S機(jī)挑選出2 000條數(shù)據(jù)。最后,將兩部分?jǐn)?shù)據(jù)合并得到6 000條長(zhǎng)句簡(jiǎn)化數(shù)據(jù)。

    2 基于長(zhǎng)句簡(jiǎn)化的中文開放關(guān)系抽取

    關(guān)系抽取模型的大致工作流程如圖2所示。以圖中句子“斯坦福大學(xué)于1891年由時(shí)任加州參議員及州長(zhǎng)的鐵路大亨利蘭·史丹福和他的妻子創(chuàng)辦”為例。先通過長(zhǎng)句簡(jiǎn)化模型將句子簡(jiǎn)化為“斯坦福大學(xué)于1891年創(chuàng)辦”“斯坦福大學(xué)由亨利蘭·史丹福創(chuàng)辦”“亨利蘭·史丹福時(shí)任加州州長(zhǎng)”三條簡(jiǎn)單句。隨后再利用關(guān)系抽取算法對(duì)每個(gè)子句進(jìn)行抽取,得到關(guān)系三元組數(shù)組:(斯坦福大學(xué),創(chuàng)辦于,1891年);(亨利蘭·史丹福,創(chuàng)辦,斯坦福大學(xué));(加州,州長(zhǎng),亨利蘭·史丹福)。接下來將對(duì)長(zhǎng)句簡(jiǎn)化模型、關(guān)系抽取兩個(gè)部分內(nèi)容分別進(jìn)行介紹。

    圖2 基于長(zhǎng)句簡(jiǎn)化的關(guān)系抽取流程

    2.1 長(zhǎng)句簡(jiǎn)化模型

    目前關(guān)于中文復(fù)雜長(zhǎng)句的簡(jiǎn)化主要是利用符號(hào)進(jìn)行分割[15-17]。但基于符號(hào)分割的句子,僅能分割出原本結(jié)構(gòu)獨(dú)立的子句,部分結(jié)構(gòu)不獨(dú)立的子句中仍然包含有關(guān)系數(shù)據(jù)。并且根據(jù)對(duì)上文構(gòu)建的復(fù)雜長(zhǎng)句數(shù)據(jù)集的統(tǒng)計(jì)發(fā)現(xiàn),在復(fù)雜長(zhǎng)句中還存在許多沒有逗號(hào)的句子??梢娎梅?hào)進(jìn)行長(zhǎng)句簡(jiǎn)化存在著較大的局限性。因此,該文借鑒英文長(zhǎng)句簡(jiǎn)化的思想[18-20],直接利用機(jī)器翻譯領(lǐng)域的序列到序列神經(jīng)網(wǎng)絡(luò)模型對(duì)長(zhǎng)句簡(jiǎn)化任務(wù)進(jìn)行建模,將其作為單語言的翻譯任務(wù)。

    現(xiàn)有的序列到序列模型通常采用RNN與LSTM神經(jīng)網(wǎng)絡(luò),存在編碼器結(jié)構(gòu)過于簡(jiǎn)單以及編碼階段信息利用率低的問題,在語料資源較少的情況下,性能較差。BERT[21]模型通過結(jié)合多維語義特征獲取詞向量,可以得到更細(xì)粒度的文本上下文表示,極大地提升了模型的特征提取能力。如圖3所示,該文以BERT的雙向Transformer結(jié)構(gòu)作為基礎(chǔ),構(gòu)建序列到序列模型。由于本身結(jié)構(gòu)限制,BERT模型通常只用于輸入編碼,并不能直接適用于文本生成任務(wù)。因此,采用UniLM[22]的seq2seq Mask機(jī)制對(duì)BERT的Transformer結(jié)構(gòu)進(jìn)行改造,僅對(duì)輸入部分的第二段文本進(jìn)行下三角遮掩。這樣當(dāng)Mask字段處在第一段文本時(shí),模型可以利用文本中的所有token信息進(jìn)行預(yù)測(cè)。當(dāng)Mask字段處在第二段文本時(shí),模型可以利用第一段文本的全部token信息,同時(shí)還可以利用Mask字段本身和它左側(cè)的全部token信息。通過這種方式,可以實(shí)現(xiàn)序列到序列的效果。

    圖3 長(zhǎng)句簡(jiǎn)化模型結(jié)構(gòu)

    為了減少不必要的計(jì)算,加快模型訓(xùn)練速度,對(duì)BERT模型的vocab.txt文件進(jìn)行了精簡(jiǎn),只保留語料中使用到的token。訓(xùn)練階段,將復(fù)雜句S1和簡(jiǎn)單句子集S2連接成一個(gè)序列,以[SOS]s1[EOS]s2[EOS]的格式輸入,S2中各個(gè)子句間使用“?!边M(jìn)行分割。根據(jù)詞表獲取序列的Token后,再對(duì)序列的詞、位置、Segment(用于區(qū)分輸入序列和目標(biāo)序列)進(jìn)行embedding計(jì)算,最后將三種embedding求和得到最終的文本向量。英文中各個(gè)單詞本身帶有分隔符,而中文詞語通常由多個(gè)字詞連接組成。原始的BERT模型在預(yù)訓(xùn)練過程中,采用的是以字粒度為基礎(chǔ)的Mask方式,會(huì)分割原本完整的中文詞語。因此,引入BERT-WWM[23]預(yù)訓(xùn)練模型參數(shù),BERT-WWM利用全詞Mask方式進(jìn)行訓(xùn)練,將同一詞語進(jìn)行整體遮掩,能更好地保證中文句子的語義完整性。

    在預(yù)測(cè)階段,加載訓(xùn)練好的模型權(quán)重,輸入待簡(jiǎn)化長(zhǎng)句進(jìn)行預(yù)測(cè),在解碼時(shí)利用beamSearch搜索算法優(yōu)化預(yù)測(cè)序列得到簡(jiǎn)化句子集。

    2.2 關(guān)系抽取

    在關(guān)系抽取部分,仍然采用與主流開放關(guān)系抽取一致的思路,利用詞性、句法規(guī)則進(jìn)行抽取。然而與傳統(tǒng)方法不同的是,該文抽取的句子是經(jīng)過長(zhǎng)句簡(jiǎn)化模型處理得到的,句子結(jié)構(gòu)簡(jiǎn)單且類型大致相同。因此,不需要制定豐富、完備的范式,僅需要制定簡(jiǎn)潔規(guī)則進(jìn)行抽取即可。關(guān)系抽取算法的具體步驟為:

    (1)利用LTP工具處理簡(jiǎn)化后的句子,獲取詞性標(biāo)注,依存句法分析的結(jié)果。

    (2)獲取句子的主語和賓語作為基礎(chǔ)實(shí)體。將與句子核心詞相連的實(shí)體詞作為起點(diǎn)向前搜索,如果存在與實(shí)體詞具有定中關(guān)系的名詞、名詞性動(dòng)詞等,則將其與起點(diǎn)的實(shí)體詞組合成語義完整的實(shí)體。

    (3)根據(jù)依存句法分析結(jié)果找到句子的核心詞。

    (4)以核心詞為起點(diǎn),對(duì)與之相連的詞語進(jìn)行判斷。如果存在并列的動(dòng)詞或者動(dòng)補(bǔ)結(jié)構(gòu)的介詞,則將其與核心詞組合成新的關(guān)系詞,如果不存在則直接將核心詞作為關(guān)系詞。

    (5)將關(guān)系詞與對(duì)應(yīng)實(shí)體組成關(guān)系三元組輸出。

    (6)將各個(gè)子句中抽取出的關(guān)系數(shù)據(jù)進(jìn)行合并成關(guān)系數(shù)組輸出。

    綜上所述,關(guān)系抽取算法首先按照主謂賓的句法結(jié)構(gòu)進(jìn)行了抽取,然后在此基礎(chǔ)上,對(duì)存在定中結(jié)構(gòu)的實(shí)體詞進(jìn)行了補(bǔ)充,對(duì)關(guān)系詞相連接的動(dòng)詞和介詞進(jìn)行了處理。

    3 實(shí)驗(yàn)與分析

    從構(gòu)建的長(zhǎng)句簡(jiǎn)化數(shù)據(jù)集中抽取出1 000條句子對(duì)作為長(zhǎng)句簡(jiǎn)化的測(cè)試集,其余5 000條作為訓(xùn)練集。關(guān)系抽取部分,從長(zhǎng)句簡(jiǎn)化的1 000條測(cè)試數(shù)據(jù)中抽取出2 479條關(guān)系數(shù)據(jù),作為關(guān)系抽取的測(cè)試集。

    長(zhǎng)句簡(jiǎn)化部分,采用哈工大的BERT-WWM預(yù)訓(xùn)練參數(shù),設(shè)置最大序列長(zhǎng)度為70,Epochs設(shè)為55,初始學(xué)習(xí)率為1e-5,Beam_search解碼時(shí)的Beam_size為5。選取SARI值、BLUE值和訓(xùn)練時(shí)間作為長(zhǎng)句簡(jiǎn)化模型的評(píng)估指標(biāo)。SARI值通過對(duì)比原句、參考子句、預(yù)測(cè)子句中的詞語計(jì)算句子的簡(jiǎn)化性。BLUE值是字符串相似性度量,可以衡量簡(jiǎn)化子句與原句的相似性。

    選用了如下三種基準(zhǔn)模型進(jìn)行長(zhǎng)句簡(jiǎn)化對(duì)比實(shí)驗(yàn):

    (1)Seq2Seq+Attention:該模型將序列到序列框架與注意力機(jī)制結(jié)合,是目前研究文本生成任務(wù)的標(biāo)準(zhǔn)結(jié)構(gòu)模型。

    (2)Pointer-Generator:該模型在Seq2Seq模型的基礎(chǔ)上,通過指針網(wǎng)絡(luò)選擇生成詞,能有效解決生成過程中出現(xiàn)的未登錄詞的情況。

    (3)BERT+LSTM:該模型采用Seq2Seq基礎(chǔ)架構(gòu),將Encoder替換為雙向Transformer編碼,Decoder 采用LSTM。使用BERT模型對(duì)編碼端參數(shù)進(jìn)行初始化處理,解碼端從初始狀態(tài)訓(xùn)練。

    如表1所示,提出的長(zhǎng)句簡(jiǎn)化模型測(cè)試結(jié)果的SARI值和BLUE值分別為76.67%和60.65%,相比其他基準(zhǔn)模型有較好的提升。此外,所提模型的訓(xùn)練時(shí)間相比其他模型也有所減少,這是因?yàn)锽ERT模型提供了更豐富的上下文信息,使模型能更快收斂。

    表1 長(zhǎng)句簡(jiǎn)化模型對(duì)比實(shí)驗(yàn)結(jié)果

    關(guān)系抽取部分,將準(zhǔn)確率(P)、召回率(R)和F1值作為關(guān)系抽取模型的評(píng)估指標(biāo),計(jì)算公式如下:

    (1)

    (2)

    (3)

    其中,C1表示抽取結(jié)果中正確的關(guān)系條數(shù),C2表示抽取的總的關(guān)系條數(shù),C3表示測(cè)試集中存在的關(guān)系總數(shù),F(xiàn)1值是準(zhǔn)確率和召回率的調(diào)和平均值。

    選取了CORE[24]、DSNFS[25]系統(tǒng)進(jìn)行開放關(guān)系抽取對(duì)比,CORE利上下文信息及句法結(jié)構(gòu)信息進(jìn)行開放關(guān)系抽取,取得了較好的效果。DSNFS對(duì)中文中存在的特殊語言現(xiàn)象進(jìn)行了總結(jié),提出了一種基于依存語義范式的抽取方法,可以對(duì)網(wǎng)絡(luò)文本進(jìn)行無監(jiān)督的靈活的抽取。為了了解長(zhǎng)句簡(jiǎn)化方法對(duì)開放關(guān)系抽取方法的改進(jìn)效果,將兩種模型分別在原始長(zhǎng)句和簡(jiǎn)化后的句子上進(jìn)行實(shí)驗(yàn)。將在簡(jiǎn)化句子的實(shí)驗(yàn)結(jié)果表示為CORE-SS和DSNFS-SS。

    從表2可以看出,文中關(guān)系抽取方法準(zhǔn)確率最高,召回率僅次于DSNFS-SS,這是因?yàn)镈SNFS的抽取規(guī)則更加全面,可以覆蓋更多的情況。而CORE-SS與DSNFS-SS相比直接在復(fù)雜長(zhǎng)句上進(jìn)行抽取的CORE與DSNFS效果有較大的提升。說明基于長(zhǎng)句簡(jiǎn)化的關(guān)系抽取方法,能夠有效地提升開放關(guān)系抽取系統(tǒng)對(duì)復(fù)雜長(zhǎng)句的抽取效果。

    表2 開放關(guān)系抽取對(duì)比實(shí)驗(yàn)結(jié)果 %

    最后,對(duì)抽取中的錯(cuò)誤關(guān)系數(shù)據(jù)和未抽取出的關(guān)系數(shù)據(jù)進(jìn)行了分析,分析結(jié)果如表3所示。其中35%的錯(cuò)誤是由關(guān)系詞識(shí)別錯(cuò)誤產(chǎn)生的,由于該文僅選擇了動(dòng)詞詞性的詞語作為關(guān)系詞,而部分句子中的關(guān)系詞是與動(dòng)詞相鄰的名詞作為關(guān)系指示詞。其中28%的錯(cuò)誤源于嵌套實(shí)體,由于在復(fù)雜長(zhǎng)句中,除了句子本身結(jié)構(gòu)復(fù)雜導(dǎo)致的句子長(zhǎng)度增長(zhǎng)外,還存在句子中實(shí)體詞較長(zhǎng)的情況。該文僅利用自然語言處理工具進(jìn)行了簡(jiǎn)單的實(shí)體識(shí)別,沒有處理實(shí)體由多個(gè)實(shí)體嵌套的情形。20%由詞性標(biāo)注導(dǎo)致的錯(cuò)誤,由于中文中部分詞既可以做動(dòng)詞又可以做名詞,自然語言處理工具對(duì)這類詞的識(shí)別容易出錯(cuò)。13%錯(cuò)誤來自簡(jiǎn)化句子內(nèi)容缺失,由于長(zhǎng)句簡(jiǎn)化模型在句子生成過程中,遺失了部分內(nèi)容,從而將錯(cuò)誤傳遞給了關(guān)系抽取模塊。4%由句法分析錯(cuò)誤導(dǎo)致,經(jīng)過長(zhǎng)句簡(jiǎn)化后,大部分的句子都能夠得到正確的句法分析結(jié)果,然而仍然存在少量句子句法分析錯(cuò)誤。

    表3 錯(cuò)誤分析

    4 結(jié)束語

    該文提出了一種基于長(zhǎng)句簡(jiǎn)化的中文開放關(guān)系抽取方法。首先,利用序列到序列模型對(duì)復(fù)雜長(zhǎng)句進(jìn)行化簡(jiǎn),然后,針對(duì)化簡(jiǎn)后的句子進(jìn)行開放關(guān)系抽取。實(shí)驗(yàn)結(jié)果表明,該方法能有效提高開放關(guān)系抽取對(duì)復(fù)雜長(zhǎng)句抽取的準(zhǔn)確率和召回率。此外,對(duì)實(shí)驗(yàn)結(jié)果中的錯(cuò)誤進(jìn)行了歸納總結(jié),為之后的研究提供了參考。

    猜你喜歡
    子句長(zhǎng)句利用
    命題邏輯中一類擴(kuò)展子句消去方法
    利用min{a,b}的積分表示解決一類絕對(duì)值不等式
    命題邏輯可滿足性問題求解器的新型預(yù)處理子句消去方法
    利用一半進(jìn)行移多補(bǔ)少
    利用數(shù)的分解來思考
    Roommate is necessary when far away from home
    西夏語的副詞子句
    西夏學(xué)(2018年2期)2018-05-15 11:24:42
    這樣分析含同位語的長(zhǎng)句
    吼唱在關(guān)中大地上的“秦腔”——論小說《白鹿原》中長(zhǎng)句和排比句的秦腔韻味
    命題邏輯的子句集中文字的分類
    久久久色成人| 久久中文看片网| 深夜精品福利| 欧美zozozo另类| 精品无人区乱码1区二区| 高清毛片免费看| 色5月婷婷丁香| 12—13女人毛片做爰片一| 久久中文看片网| 成人无遮挡网站| 一卡2卡三卡四卡精品乱码亚洲| 国产午夜精品论理片| 亚洲欧美精品自产自拍| 日韩三级伦理在线观看| 99久国产av精品国产电影| 国产av一区在线观看免费| 亚洲国产精品合色在线| 欧美+亚洲+日韩+国产| 91麻豆精品激情在线观看国产| 91久久精品国产一区二区成人| 少妇熟女欧美另类| 国产亚洲精品av在线| 九九热线精品视视频播放| 亚洲在线观看片| 亚洲一区高清亚洲精品| 一级毛片我不卡| 性色avwww在线观看| 亚洲精品色激情综合| .国产精品久久| 男女边吃奶边做爰视频| 色哟哟哟哟哟哟| 亚洲aⅴ乱码一区二区在线播放| 午夜老司机福利剧场| av视频在线观看入口| 深爱激情五月婷婷| 91久久精品国产一区二区三区| 欧美bdsm另类| 国产极品精品免费视频能看的| 观看免费一级毛片| 在线免费观看不下载黄p国产| 干丝袜人妻中文字幕| 成年免费大片在线观看| 国产久久久一区二区三区| 国产成人精品一,二区 | 日韩中字成人| 在线免费观看的www视频| 久久久久久久午夜电影| 亚洲五月天丁香| а√天堂www在线а√下载| 欧美日韩乱码在线| 国产一级毛片在线| 白带黄色成豆腐渣| 美女黄网站色视频| 亚洲欧美中文字幕日韩二区| 国产激情偷乱视频一区二区| 日韩精品青青久久久久久| 国产成人福利小说| 能在线免费观看的黄片| 搞女人的毛片| 久久精品国产亚洲av香蕉五月| 狠狠狠狠99中文字幕| 性欧美人与动物交配| 色5月婷婷丁香| 国产精品无大码| 免费看美女性在线毛片视频| 夜夜夜夜夜久久久久| 亚洲国产高清在线一区二区三| 1000部很黄的大片| 国产黄a三级三级三级人| 久久久久网色| 男女那种视频在线观看| 亚洲中文字幕日韩| 国产一区二区在线av高清观看| 久久久色成人| 国产亚洲精品av在线| 亚洲自拍偷在线| 69人妻影院| 亚洲av不卡在线观看| 亚洲最大成人中文| 国产精品久久久久久精品电影| 午夜老司机福利剧场| 午夜久久久久精精品| 三级男女做爰猛烈吃奶摸视频| 亚洲精品日韩av片在线观看| 一级毛片久久久久久久久女| 国产久久久一区二区三区| 黄色配什么色好看| 少妇人妻一区二区三区视频| а√天堂www在线а√下载| 国产精品久久久久久久久免| 国产老妇女一区| av免费在线看不卡| 一本一本综合久久| 99热这里只有是精品50| 91午夜精品亚洲一区二区三区| 成人特级av手机在线观看| 99热6这里只有精品| 波多野结衣巨乳人妻| 日韩一本色道免费dvd| 久久精品影院6| 麻豆成人午夜福利视频| 久久久久久久久久成人| 最新中文字幕久久久久| 一边摸一边抽搐一进一小说| av专区在线播放| 亚洲中文字幕一区二区三区有码在线看| 亚洲av免费在线观看| 少妇猛男粗大的猛烈进出视频 | 久久人人精品亚洲av| 日韩三级伦理在线观看| 青春草国产在线视频 | 亚洲18禁久久av| 欧美zozozo另类| 国产精品永久免费网站| 女同久久另类99精品国产91| 97超视频在线观看视频| 日韩 亚洲 欧美在线| 久久久久久久久久久丰满| 一级黄色大片毛片| 亚洲精品粉嫩美女一区| 在线免费观看不下载黄p国产| 小蜜桃在线观看免费完整版高清| avwww免费| 日韩欧美精品免费久久| 99久久人妻综合| av.在线天堂| 亚洲国产欧美在线一区| av女优亚洲男人天堂| 国产激情偷乱视频一区二区| 看非洲黑人一级黄片| 欧美xxxx黑人xx丫x性爽| 国产亚洲av片在线观看秒播厂 | 又黄又爽又刺激的免费视频.| 永久网站在线| 欧美性猛交╳xxx乱大交人| 国产精品伦人一区二区| 老熟妇乱子伦视频在线观看| 国产黄a三级三级三级人| 亚洲成a人片在线一区二区| 特级一级黄色大片| 国产成人91sexporn| 老司机影院成人| 国产av麻豆久久久久久久| 亚洲精品乱码久久久久久按摩| 亚洲精品国产成人久久av| 99热6这里只有精品| 伊人久久精品亚洲午夜| 在线免费观看的www视频| 亚洲欧美中文字幕日韩二区| 国产毛片a区久久久久| 国产精品av视频在线免费观看| 免费大片18禁| 老师上课跳d突然被开到最大视频| 夜夜看夜夜爽夜夜摸| 亚洲av免费在线观看| 毛片女人毛片| kizo精华| 日韩中字成人| 国产亚洲av嫩草精品影院| 欧美一级a爱片免费观看看| 两个人的视频大全免费| 69av精品久久久久久| 天堂影院成人在线观看| 久久精品人妻少妇| 国产成人a∨麻豆精品| 高清在线视频一区二区三区 | 村上凉子中文字幕在线| 女人十人毛片免费观看3o分钟| 九九爱精品视频在线观看| 国产精品久久久久久久电影| 少妇裸体淫交视频免费看高清| 亚洲欧美精品综合久久99| 人人妻人人澡人人爽人人夜夜 | 夜夜看夜夜爽夜夜摸| 久久精品综合一区二区三区| 韩国av在线不卡| 久久久久久久久久成人| 黑人高潮一二区| 最近的中文字幕免费完整| 成人永久免费在线观看视频| 日韩欧美三级三区| 1024手机看黄色片| 国产精品乱码一区二三区的特点| 国产高清视频在线观看网站| 成人亚洲精品av一区二区| 亚洲中文字幕日韩| 我要搜黄色片| 成人美女网站在线观看视频| 久久99精品国语久久久| 99久久无色码亚洲精品果冻| av专区在线播放| 亚洲欧美日韩无卡精品| 午夜精品在线福利| 一个人看视频在线观看www免费| 久久亚洲精品不卡| 一本一本综合久久| 中国美白少妇内射xxxbb| 亚洲精品粉嫩美女一区| 可以在线观看的亚洲视频| 成人午夜精彩视频在线观看| eeuss影院久久| 亚洲欧美日韩卡通动漫| 免费人成在线观看视频色| 亚洲av中文av极速乱| 成人午夜高清在线视频| 亚洲在线观看片| 亚洲精品久久久久久婷婷小说 | 嫩草影院精品99| 欧美成人精品欧美一级黄| 国产老妇女一区| 成人特级av手机在线观看| 国产精品蜜桃在线观看 | 天美传媒精品一区二区| 欧洲精品卡2卡3卡4卡5卡区| 久久热精品热| 亚洲婷婷狠狠爱综合网| 日韩大尺度精品在线看网址| 男女下面进入的视频免费午夜| 精品一区二区三区视频在线| 伊人久久精品亚洲午夜| 国国产精品蜜臀av免费| 如何舔出高潮| 亚洲精品日韩在线中文字幕 | 日本成人三级电影网站| 久久精品综合一区二区三区| 99久国产av精品| 久久精品91蜜桃| 有码 亚洲区| 久久精品国产亚洲网站| 日本黄色视频三级网站网址| 激情 狠狠 欧美| 色尼玛亚洲综合影院| 国产精品综合久久久久久久免费| 亚洲婷婷狠狠爱综合网| 免费av观看视频| 丰满的人妻完整版| 一级av片app| 精品熟女少妇av免费看| 免费人成视频x8x8入口观看| 国产色婷婷99| 少妇被粗大猛烈的视频| 一进一出抽搐动态| 小说图片视频综合网站| 在线观看美女被高潮喷水网站| 亚洲av成人精品一区久久| 精品久久久久久久久亚洲| 97热精品久久久久久| 亚洲精华国产精华液的使用体验 | 啦啦啦韩国在线观看视频| 欧美日本亚洲视频在线播放| 免费观看的影片在线观看| 亚洲在线自拍视频| 哪个播放器可以免费观看大片| 在现免费观看毛片| 少妇熟女aⅴ在线视频| 99在线人妻在线中文字幕| 校园春色视频在线观看| 日产精品乱码卡一卡2卡三| 亚洲va在线va天堂va国产| 亚洲国产日韩欧美精品在线观看| 国产成年人精品一区二区| 桃色一区二区三区在线观看| 亚洲欧美精品自产自拍| 欧美一区二区亚洲| 精品国内亚洲2022精品成人| 久久精品国产亚洲av香蕉五月| 久久久久网色| 久久精品国产亚洲av涩爱 | 中国美白少妇内射xxxbb| av免费在线看不卡| 成人亚洲精品av一区二区| ponron亚洲| 亚洲欧美日韩卡通动漫| 日韩成人伦理影院| 又粗又硬又长又爽又黄的视频 | 欧美精品一区二区大全| 性色avwww在线观看| av在线亚洲专区| 亚洲av男天堂| 久久精品国产亚洲av天美| 国产精品无大码| 国产人妻一区二区三区在| 国产精品国产高清国产av| 少妇的逼好多水| 欧美极品一区二区三区四区| 精品久久久久久久人妻蜜臀av| 日韩精品有码人妻一区| 麻豆乱淫一区二区| ponron亚洲| 最后的刺客免费高清国语| 久久精品国产亚洲av涩爱 | 欧美不卡视频在线免费观看| 18禁在线播放成人免费| 国产在线男女| 亚洲自偷自拍三级| 久久久a久久爽久久v久久| 亚洲精品成人久久久久久| 精品人妻熟女av久视频| 国产一级毛片七仙女欲春2| 99久久无色码亚洲精品果冻| 国内精品一区二区在线观看| 国产黄色小视频在线观看| 一级毛片aaaaaa免费看小| 久久久久久伊人网av| 免费看av在线观看网站| 日韩av不卡免费在线播放| 久久国内精品自在自线图片| 九九在线视频观看精品| 精品久久久久久久末码| 国内精品久久久久精免费| 中文字幕av成人在线电影| 校园人妻丝袜中文字幕| 麻豆av噜噜一区二区三区| 一区二区三区免费毛片| 青春草亚洲视频在线观看| 国产91av在线免费观看| 老熟妇乱子伦视频在线观看| 九九久久精品国产亚洲av麻豆| av卡一久久| 精品无人区乱码1区二区| 欧美成人a在线观看| 国产单亲对白刺激| 亚洲性久久影院| 草草在线视频免费看| 性色avwww在线观看| 丝袜喷水一区| 一级黄片播放器| 国产在线男女| 精品一区二区三区人妻视频| 深夜a级毛片| 一个人看的www免费观看视频| 精品一区二区三区人妻视频| 美女黄网站色视频| 男女视频在线观看网站免费| 久久精品国产亚洲av天美| 男女啪啪激烈高潮av片| 国产成人a∨麻豆精品| 国产精品野战在线观看| 久久久久国产网址| 国产成人精品一,二区 | 精品免费久久久久久久清纯| 亚洲久久久久久中文字幕| 亚洲中文字幕日韩| 亚洲无线在线观看| 一级av片app| 小说图片视频综合网站| 国产av不卡久久| 成年免费大片在线观看| 亚洲最大成人中文| 99久久中文字幕三级久久日本| 国产片特级美女逼逼视频| 在线a可以看的网站| 欧美日韩乱码在线| 麻豆成人av视频| 一级毛片电影观看 | 99热精品在线国产| 爱豆传媒免费全集在线观看| 干丝袜人妻中文字幕| 日本成人三级电影网站| 69av精品久久久久久| 99久久精品一区二区三区| 只有这里有精品99| 亚洲欧美中文字幕日韩二区| 边亲边吃奶的免费视频| 午夜福利视频1000在线观看| 三级经典国产精品| 成人午夜高清在线视频| 久久久久久久久久久免费av| 久久6这里有精品| 特级一级黄色大片| 少妇裸体淫交视频免费看高清| 久久久久久久久中文| 麻豆国产97在线/欧美| 老师上课跳d突然被开到最大视频| 最新中文字幕久久久久| 啦啦啦啦在线视频资源| 国产精品无大码| 欧美色欧美亚洲另类二区| 99久久久亚洲精品蜜臀av| 久久久久九九精品影院| 国产熟女欧美一区二区| 性色avwww在线观看| h日本视频在线播放| 国产黄片视频在线免费观看| 熟妇人妻久久中文字幕3abv| 校园人妻丝袜中文字幕| 免费看光身美女| 我要搜黄色片| 少妇熟女aⅴ在线视频| 免费大片18禁| 中文字幕av在线有码专区| 国产一区亚洲一区在线观看| 十八禁国产超污无遮挡网站| av又黄又爽大尺度在线免费看 | 亚洲av成人精品一区久久| 99热网站在线观看| 丝袜喷水一区| 国产精品人妻久久久影院| 天堂网av新在线| 国产蜜桃级精品一区二区三区| 亚洲久久久久久中文字幕| 国产高清激情床上av| 中文字幕免费在线视频6| 国产不卡一卡二| 晚上一个人看的免费电影| 久久国产乱子免费精品| 男人狂女人下面高潮的视频| 亚洲精品日韩av片在线观看| 亚洲av不卡在线观看| 久久精品夜夜夜夜夜久久蜜豆| 桃色一区二区三区在线观看| 波多野结衣高清无吗| 国产中年淑女户外野战色| 久久久午夜欧美精品| 女人被狂操c到高潮| 国产一区二区三区av在线 | 美女国产视频在线观看| av在线老鸭窝| 国产成年人精品一区二区| 99热这里只有是精品50| 少妇的逼好多水| 可以在线观看毛片的网站| 麻豆国产97在线/欧美| 美女被艹到高潮喷水动态| 久久精品影院6| 免费人成在线观看视频色| 一边亲一边摸免费视频| 看片在线看免费视频| 成人漫画全彩无遮挡| 看片在线看免费视频| 欧美一区二区亚洲| 国产黄片美女视频| 毛片女人毛片| 国产极品天堂在线| 亚洲一区高清亚洲精品| eeuss影院久久| 国内久久婷婷六月综合欲色啪| 婷婷亚洲欧美| 国产亚洲精品久久久久久毛片| 69av精品久久久久久| 黄色一级大片看看| 免费搜索国产男女视频| 黄色日韩在线| 日韩欧美精品免费久久| 寂寞人妻少妇视频99o| 国内精品宾馆在线| 波多野结衣高清无吗| 国产69精品久久久久777片| 国产一区二区三区av在线 | 免费观看a级毛片全部| 亚洲精品456在线播放app| 看非洲黑人一级黄片| 在线播放国产精品三级| 国产成人精品婷婷| 国产午夜精品一二区理论片| 我要搜黄色片| 亚洲色图av天堂| 国产精品久久久久久av不卡| 国产亚洲精品久久久久久毛片| 日韩亚洲欧美综合| 久久久久久九九精品二区国产| 51国产日韩欧美| 日韩精品青青久久久久久| 亚洲成a人片在线一区二区| 只有这里有精品99| 久久草成人影院| 一区福利在线观看| 久久人妻av系列| 精品久久国产蜜桃| 欧美日韩国产亚洲二区| 嫩草影院入口| 欧美日韩一区二区视频在线观看视频在线 | 最新中文字幕久久久久| 午夜久久久久精精品| 国产成人91sexporn| 老师上课跳d突然被开到最大视频| www.色视频.com| 精品久久久久久久久久免费视频| 国产在视频线在精品| 欧美色欧美亚洲另类二区| 国产黄片美女视频| 最近中文字幕高清免费大全6| 看黄色毛片网站| 久久久久久国产a免费观看| 真实男女啪啪啪动态图| eeuss影院久久| 麻豆av噜噜一区二区三区| 久久热精品热| 久久九九热精品免费| 国产白丝娇喘喷水9色精品| 在线观看美女被高潮喷水网站| 赤兔流量卡办理| 亚洲精品色激情综合| 亚洲av电影不卡..在线观看| 麻豆成人av视频| 国产一级毛片七仙女欲春2| 国产一区二区在线观看日韩| 免费看日本二区| 2021天堂中文幕一二区在线观| 午夜免费激情av| .国产精品久久| 女人十人毛片免费观看3o分钟| av在线亚洲专区| 狂野欧美激情性xxxx在线观看| av专区在线播放| 美女国产视频在线观看| 亚洲一区高清亚洲精品| 欧美精品一区二区大全| 亚洲欧美日韩高清专用| 精品熟女少妇av免费看| 18禁裸乳无遮挡免费网站照片| 欧美激情久久久久久爽电影| 国产精品人妻久久久影院| 久久久国产成人精品二区| 欧美+亚洲+日韩+国产| 成人av在线播放网站| 国产精品久久久久久久电影| 精品久久久久久久末码| 国产探花极品一区二区| 校园人妻丝袜中文字幕| 亚洲,欧美,日韩| 深爱激情五月婷婷| 亚洲成av人片在线播放无| 亚洲一级一片aⅴ在线观看| 九九爱精品视频在线观看| 精品人妻视频免费看| 嘟嘟电影网在线观看| 日韩欧美精品v在线| 国产精品久久久久久精品电影小说 | 日韩,欧美,国产一区二区三区 | 69av精品久久久久久| 岛国毛片在线播放| 欧美在线一区亚洲| 久久久久国产网址| 欧美一区二区国产精品久久精品| 国产色婷婷99| 国产伦精品一区二区三区视频9| 男人狂女人下面高潮的视频| 国产爱豆传媒在线观看| 麻豆国产av国片精品| 国产高潮美女av| 可以在线观看的亚洲视频| 中文字幕av成人在线电影| 麻豆乱淫一区二区| 22中文网久久字幕| 中文字幕精品亚洲无线码一区| 女同久久另类99精品国产91| 18禁裸乳无遮挡免费网站照片| 变态另类成人亚洲欧美熟女| 午夜福利在线观看吧| 在线a可以看的网站| 久久午夜福利片| 婷婷精品国产亚洲av| 18禁在线无遮挡免费观看视频| 看免费成人av毛片| 69人妻影院| 亚洲经典国产精华液单| 天美传媒精品一区二区| 日韩,欧美,国产一区二区三区 | 嫩草影院新地址| 麻豆成人av视频| 欧美一区二区亚洲| 成人永久免费在线观看视频| 亚洲最大成人av| 久久精品久久久久久噜噜老黄 | 欧美最黄视频在线播放免费| 亚洲最大成人av| 99久久九九国产精品国产免费| 午夜精品在线福利| 国产亚洲5aaaaa淫片| 一级黄片播放器| eeuss影院久久| 级片在线观看| 亚洲内射少妇av| 午夜免费男女啪啪视频观看| 青青草视频在线视频观看| 久久久久国产网址| 一区二区三区免费毛片| 国内精品美女久久久久久| 一本久久精品| 精品一区二区三区人妻视频| 日韩 亚洲 欧美在线| 国产午夜精品久久久久久一区二区三区| 免费大片18禁| 卡戴珊不雅视频在线播放| 美女脱内裤让男人舔精品视频 | 久久99热6这里只有精品| 国内少妇人妻偷人精品xxx网站| 在线免费观看不下载黄p国产| 男人舔女人下体高潮全视频| 黄色欧美视频在线观看| 欧美性猛交╳xxx乱大交人| 免费av不卡在线播放| 国产成人aa在线观看| avwww免费| 十八禁国产超污无遮挡网站| 久久中文看片网| 日韩成人伦理影院| 狠狠狠狠99中文字幕| 黄色一级大片看看| 99在线视频只有这里精品首页| av天堂在线播放| 欧美另类亚洲清纯唯美| 99在线人妻在线中文字幕| 国产精品乱码一区二三区的特点| 国产亚洲av嫩草精品影院| 亚洲精品自拍成人| 精品99又大又爽又粗少妇毛片| 精品一区二区免费观看| 人人妻人人看人人澡| 美女内射精品一级片tv| 国产精品综合久久久久久久免费| 国产精品久久久久久久久免| 亚洲精品色激情综合| 色5月婷婷丁香|