• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    一種細(xì)粒度的漢語語義角色標(biāo)注數(shù)據(jù)集的構(gòu)建方法

    2022-02-03 13:50:18曹存根
    中文信息學(xué)報(bào) 2022年12期
    關(guān)鍵詞:中樞例句語料

    宋 衡,曹存根,王 亞,王 石

    (1. 中國(guó)科學(xué)院 計(jì)算技術(shù)研究所 智能信息處理重點(diǎn)實(shí)驗(yàn)室,北京 100190;2. 中國(guó)科學(xué)院大學(xué),北京 100049)

    0 引言

    語義理解和分析是自然語言處理的重要目標(biāo)之一,其致力于獲取給定文本所蘊(yùn)含的語義信息,并以計(jì)算機(jī)能理解的某種方式進(jìn)行展示[1]。目前,語義理解和分析的研究主要包括深層語義分析和淺層語義分析,其中深層語義分析的相關(guān)工作主要包括語義依存分析(Semantic Dependency Parsing,SDP)[2]和普適概念認(rèn)知標(biāo)注(Universal Conceptual Cognitive Annotation,UCCA)[3]等。然而,深層語義分析存在語義層次涉及范圍廣,難以用良好的形式化方法展示所有的語義信息等問題,甚至受限于當(dāng)前的技術(shù)水平,短期內(nèi)難以形成具有較強(qiáng)實(shí)用性的成果[4]。在淺層語義分析方面,目前主要的實(shí)現(xiàn)方式是語義角色標(biāo)注(Semantic Role Labeling,SRL)[5],具有多語言通用、表現(xiàn)形式自然、語義結(jié)構(gòu)穩(wěn)定以及相關(guān)模型和算法研究深入等優(yōu)點(diǎn)。目前,語義角色標(biāo)注技術(shù)被廣泛地應(yīng)用于知識(shí)抽取、機(jī)器翻譯、自動(dòng)文本摘要、信息檢索和自動(dòng)問答等多種下游任務(wù)。

    作為實(shí)現(xiàn)淺層語義分析的基礎(chǔ),標(biāo)有語義角色的語料資源至關(guān)重要,其可以極大地促進(jìn)語義分析相關(guān)模型和算法的測(cè)試與研究。目前,國(guó)外比較知名的語義角色數(shù)據(jù)集資源包括FrameNet[6]、Proposition Bank[7]和NomBank[8]等。國(guó)內(nèi)的語義角色數(shù)據(jù)集有Chinese Proposition Bank[9]、山西大學(xué)漢語框架語義知識(shí)庫[10]、北京大學(xué)中文網(wǎng)庫[11]、蘇州大學(xué)漢語開放謂詞論元數(shù)據(jù)集[4]以及中科院計(jì)算所的基于語義分類和描述框架(Framework of Semantic Taxonomy and Description,F(xiàn)STD)的知識(shí)庫[13,22]。相較于國(guó)外的語義角色標(biāo)注數(shù)據(jù)集,國(guó)內(nèi)的語義角色語料資源增加較為緩慢,且大部分語義角色語料資源沒有被公開。受限于較長(zhǎng)的標(biāo)注語料,現(xiàn)有的語義角色標(biāo)注數(shù)據(jù)集存在語料標(biāo)注精度和粒度的問題,主要體現(xiàn)在三個(gè)方面:

    第一,語料標(biāo)注所用的語義角色種類不夠豐富,導(dǎo)致標(biāo)注的語料在語義上存在偏差。例如,對(duì)于句子“我家安裝了百兆寬帶”,現(xiàn)有語義角色分類體系將句子成分“我家”標(biāo)注成施事,這在語義上是不正確的,因?yàn)椤拔壹摇辈皇钦嬲惭b寬帶的主體,而是我家“雇用”了寬帶安裝人員來進(jìn)行寬帶安裝。我們將在第2節(jié)回顧這個(gè)問題。

    第二,現(xiàn)有的大部分語義角色數(shù)據(jù)集標(biāo)注所用的語料存在多個(gè)謂詞,但在實(shí)際語義角色標(biāo)注時(shí),只標(biāo)注語句中的其中一個(gè)謂詞及其相關(guān)語義角色,而其他謂詞以及相關(guān)的語義角色則未予標(biāo)注。顯然,這種標(biāo)注方式會(huì)丟失語料中那部分沒有進(jìn)行語義角色標(biāo)注的句子成分的語義信息。我們將在第3節(jié)回顧這個(gè)問題。

    第三,現(xiàn)有的大部分語義角色數(shù)據(jù)集標(biāo)注方式單一,僅為語料中句子的每個(gè)成分標(biāo)注一個(gè)語義角色,而忽略了某些句子成分可能同時(shí)扮演多個(gè)語義角色的問題。以下面兩個(gè)句子為例:

    例句1: 女警誤殺了隊(duì)友

    例句2: 女警槍殺了歹徒

    從常規(guī)語義角色標(biāo)注的角度來看,兩個(gè)句子中的成分“女警”都是施事;但從語義角色受損還是受益的角度來看,例句1中的 “女警”是個(gè)受損者,而例句2中的“女警”是個(gè)受益者。又如:

    例句3: 八路軍主力退守沂蒙山

    常規(guī)來看,“沂蒙山”是被防守的對(duì)象,因此“沂蒙山”是受事,但是從另一層語義去理解,“沂蒙山”是八路軍主力到達(dá)的地點(diǎn),則“沂蒙山”還應(yīng)該是宿事。我們將在第3節(jié)回顧這個(gè)問題。

    為了解決上述語義角色標(biāo)注數(shù)據(jù)集存在的問題,并更好地滿足語義理解分析和知識(shí)獲取等研究需要[12-15],本文提出了一種細(xì)粒度的漢語語義角色數(shù)據(jù)集構(gòu)建方法,并利用該方法初步構(gòu)建了一個(gè)漢語語義角色數(shù)據(jù)集。本文的主要貢獻(xiàn)如下:

    (1) 基于對(duì)已有的語義角色分類體系的分析和實(shí)際語料的考察,本文提出了一種改進(jìn)的漢語語義角色分類體系。該體系將語義角色分為中樞語義角色和周邊語義角色,并且將周邊語義角色分為主要周邊語義角色和輔助周邊語義角色。此外,基于細(xì)粒度語義分析的需要以及語義角色標(biāo)注難度的權(quán)衡,我們將主要周邊語義角色的種類分為32種,其中包括7個(gè)全新的主要周邊語義角色以及5個(gè)常用但經(jīng)過重新定義的主要周邊語義角色。改進(jìn)的漢語語義角色分類體系解決了現(xiàn)有語義角色數(shù)據(jù)集語義角色種類不夠豐富的問題。

    (2) 本文提出的細(xì)粒度的漢語語義角色數(shù)據(jù)集構(gòu)建方法包括中樞語義的色標(biāo)注和主要周邊語義角色標(biāo)注、輔助周邊語義角色標(biāo)注、語義角色的雙重標(biāo)注以及不確定語義事件的語義角色標(biāo)注等四個(gè)步驟,其中輔助周邊語義角色標(biāo)注、語義角色的雙重標(biāo)注以及不確定語義事件的語義角色標(biāo)注解決了現(xiàn)有的大部分語義角色數(shù)據(jù)集標(biāo)注方式單一的問題,為我們標(biāo)注的語料帶來更細(xì)粒度的語義信息。此外,我們還提出了主要周邊語義角色關(guān)系約束的概念,有助于設(shè)計(jì)算法對(duì)語料庫中標(biāo)注的語句自動(dòng)地進(jìn)行初步審查,減輕后期人工復(fù)審的壓力。

    (3) 我們初步構(gòu)建了一個(gè)擁有9 550條語句的漢語語義角色數(shù)據(jù)集。相較于現(xiàn)有的漢語語義角色數(shù)據(jù)集,我們的語義角色數(shù)據(jù)集中標(biāo)注的語料擁有更細(xì)粒度的語義信息。細(xì)粒度的語義信息不僅體現(xiàn)在我們標(biāo)注的語義角色數(shù)據(jù)集中擁有更豐富的主要周邊語義角色類型,還體現(xiàn)在我們語義角色數(shù)據(jù)集標(biāo)注步驟的多樣性。

    (4) 我們采用Bi-LSTM+CRF的基線模型在構(gòu)建好的漢語語義角色數(shù)據(jù)集和Chinese Proposition Bank數(shù)據(jù)集上進(jìn)行了關(guān)于主要周邊語義角色的基準(zhǔn)實(shí)驗(yàn)。我們還分析了基線模型在本文語義角色數(shù)據(jù)集識(shí)別出錯(cuò)誤的語句,并針對(duì)這些識(shí)別出錯(cuò)的語句提出了解決這些錯(cuò)誤的思路。

    本文的組織結(jié)構(gòu)如下: 第1節(jié)介紹了相關(guān)研究。第2節(jié)概述了一種改進(jìn)的漢語語義角色分類體系。第3節(jié)詳細(xì)介紹了半自動(dòng)的細(xì)粒度的漢語語義角色數(shù)據(jù)集構(gòu)建方法。第4節(jié)進(jìn)行了關(guān)于主要周邊語義角色的基準(zhǔn)實(shí)驗(yàn)。第5節(jié)總結(jié)全文并提出未來工作。

    1 相關(guān)研究

    1.1 語義角色分類體系相關(guān)研究

    為了從語義的角度彌補(bǔ)轉(zhuǎn)換生成語法的不足,菲爾墨(C.J.Fillmore)于1968年發(fā)表了著作《格辨》[16],并提出了格語法,他認(rèn)為“格”能夠真正構(gòu)成自然語言深層結(jié)構(gòu)中的語法關(guān)系,最初格的種類主要包括6種,分別為施事格、工具格、客體格、處所格、承受格和使動(dòng)格。后來菲爾墨對(duì)其進(jìn)行了完善,提出了一個(gè)含有13種格的體系[17],新增加的格有感受格、源點(diǎn)格、終點(diǎn)格和受益格等?!案瘛北举|(zhì)上就是本文中的語義角色。

    國(guó)內(nèi)學(xué)者針對(duì)漢語的特點(diǎn)對(duì)語義角色及其分類體系進(jìn)行了大量研究。朱曉亞[18]認(rèn)為事件的語義結(jié)構(gòu)由動(dòng)核及其相關(guān)的動(dòng)詞元語義成分構(gòu)成,她定義了14種動(dòng)元的語義角色。袁毓林[19]將語義角色稱為論元,他總結(jié)了現(xiàn)代漢語的17種論元,并對(duì)這些論元的語義定義和句法特征進(jìn)行了詳細(xì)的解釋和說明。魯川[20]將語義角色稱為事元,他將事元分為中樞事元和周邊事元,并以中樞事元作為現(xiàn)代漢語基本句模的分類標(biāo)準(zhǔn)。魯川總結(jié)了26種中樞事元和26種周邊事元。劉茂福等[21]在認(rèn)知科學(xué)和題元理論的基礎(chǔ)上,總結(jié)了16種原子事件的語義角色類型。由此看出,國(guó)內(nèi)各個(gè)學(xué)者提出的語義角色分類體系的差異主要在于語義角色類型的數(shù)量和具體語義角色術(shù)語的定義方面,其本質(zhì)是語義角色分類粗粒度和細(xì)粒度的抉擇。

    1.2 語義角色相關(guān)知識(shí)庫構(gòu)建現(xiàn)狀

    國(guó)外比較知名的語義角色相關(guān)知識(shí)庫有FrameNet、Proposition Bank和NomBank等。FrameNet[6]是美國(guó)加州大學(xué)伯克利分校構(gòu)建的基于真實(shí)語料庫的計(jì)算機(jī)詞典,它以框架語義作為理論基礎(chǔ),能夠描述具有相同或相似語義角色的單詞。Proposition Bank[7]是美國(guó)濱夕法尼亞大學(xué)建立的一個(gè)集語義詞典和標(biāo)注語料庫于一身的論元角色語義知識(shí)庫,它以動(dòng)詞詞典為標(biāo)注基礎(chǔ),以Penn TreeBankⅡ?yàn)闃?biāo)注底層,以動(dòng)詞的論元角色為標(biāo)注對(duì)象。NomBank[8]是美國(guó)紐約大學(xué)構(gòu)建的語義知識(shí)庫,它采用了和Proposition Bank大致相同的框架集,幾乎涵蓋了賓州樹庫中所有標(biāo)注過的名詞,并詳細(xì)描述和定義了名詞的論元結(jié)構(gòu)。

    國(guó)內(nèi)學(xué)者對(duì)漢語語義角色知識(shí)庫也進(jìn)行了大量的研究,主要有Chinese Proposition Bank、山西大學(xué)漢語框架語義知識(shí)庫、北大網(wǎng)庫以及蘇州大學(xué)漢語開放謂詞論元數(shù)據(jù)集等。Chinese Proposition Bank[9]基本繼承了Proposition Bank的標(biāo)注體系,將語義角色分為核心語義角色和附屬語義角色。其中,核心語義角色以Arg0~Arg5進(jìn)行標(biāo)注,附屬語義角色以ArgM作為前綴進(jìn)行標(biāo)注。山西大學(xué)的漢語框架語義知識(shí)庫[10]是以C.J.Fillmore的框架語義學(xué)為基礎(chǔ),以FrameNet為參照的漢語詞匯語義知識(shí)庫,它由框架庫、句子庫和詞元庫構(gòu)成。北京大學(xué)中文網(wǎng)庫[11]是北京大學(xué)袁毓林主持建立的漢語語義關(guān)系標(biāo)注語料庫,它在北京大學(xué)漢語句法分析樹庫的基礎(chǔ)上進(jìn)行語義標(biāo)注,北京大學(xué)中文網(wǎng)庫一共定義了21種論元角色。蘇州大學(xué)漢語開放謂詞論元數(shù)據(jù)集[4]為了達(dá)到輕量級(jí)的目的,根據(jù)句子上下文信息直接標(biāo)注謂詞相關(guān)的論元角色,并采用基于詞的論元單位表示,避免了論元角色標(biāo)注任務(wù)對(duì)謂詞語義框架的依賴和對(duì)片段邊界確定困難的問題。

    遺憾的是,目前國(guó)內(nèi)大部分語義角色的相關(guān)數(shù)據(jù)集都沒有公開。本文提出了一種細(xì)粒度的漢語語義角色數(shù)據(jù)集構(gòu)建方法,相較于現(xiàn)有的語義角色數(shù)據(jù)集,我們的語義角色數(shù)據(jù)集中標(biāo)注的語料具有更細(xì)粒度的語義信息,能夠更好地滿足語義理解分析和知識(shí)獲取等研究工作的需要[12-15]。

    2 一種改進(jìn)的漢語語義角色分類體系

    在本文的漢語語義角色分類體系中,我們首先將語句中的語義角色分為兩大類: 中樞語義角色(Pivotal Semantic Role,PSR)和周邊語義角色(Peripheral Semantic Roles,PSRs),再將周邊語義角色分為主要周邊語義角色(Principal Peripheral Semantic Roles,PPSR)和輔助周邊語義角色(Auxiliary Peripheral Semantic Roles,APSR),下面分別進(jìn)行介紹。

    2.1 中樞語義角色

    中樞語義角色表示的是語句的中樞,它在漢語句子中扮演著謂詞的角色。中樞語義角色是一個(gè)句子的主干,并且一個(gè)句子中只能有一個(gè)中樞語義角色。本文的中樞語義角色的選取是根據(jù)課題組構(gòu)建的一種基于語義分類和描述框架FSTD的知識(shí)庫[13,22]中的語義類而確定的,其范圍主要包括動(dòng)詞和形容詞。FSTD中的語義類是以魯川[20]定義的26種中樞事元為基礎(chǔ),并借助《同義詞詞林》和《形容詞詞典》等漢語詞典進(jìn)行補(bǔ)充而完成的。

    2.2 周邊語義角色2.2.1 主要周邊語義角色

    主要周邊語義角色表示語句中樞的關(guān)鍵周邊語義角色。一個(gè)語句中可能存在多個(gè)主要周邊語義角色。主要周邊語義角色類型的確定是語義角色數(shù)據(jù)集構(gòu)建過程中最重要也是最復(fù)雜的工作之一。我們需要在主要周邊語義角色的種類數(shù)量方面尋找一個(gè)平衡,即在能夠保證獲得必要的語義信息的同時(shí),盡可能地精簡(jiǎn)主要周邊語義角色的種類。如果主要周邊語義角色的種類過少,會(huì)造成無法準(zhǔn)確地獲取文本的語義信息,造成后期知識(shí)抽取和問答系統(tǒng)等下游任務(wù)無法順利進(jìn)行。例如,在“歹徒搶劫了銀行”和“歹徒搶劫了珠寶”這兩個(gè)句式很相似的句子中,Chinese Proposition Bank把“銀行”和“歹徒”都理解為受事(AGR1),這是不合理的,因?yàn)檫@兩個(gè)句子在語義上表達(dá)的意思不同: “歹徒搶劫了銀行”蘊(yùn)含的語義是歹徒從銀行中拿走了很多銀行的貴重物品,而“歹徒搶劫了珠寶”蘊(yùn)含的意思是歹徒拿走了珠寶,這就導(dǎo)致了在計(jì)算機(jī)問答系統(tǒng)中,如果輸入“歹徒搶劫了銀行”,問計(jì)算機(jī)“銀行現(xiàn)在屬于誰?”。鑒于“歹徒搶劫了珠寶”中受事“珠寶”現(xiàn)在已經(jīng)屬于施事“歹徒”的設(shè)計(jì),計(jì)算機(jī)同樣會(huì)回答受事“銀行”現(xiàn)在屬于“歹徒”,這種回答顯然是錯(cuò)誤的。而如果主要周邊語義角色的種類過多,又會(huì)增加標(biāo)注人員對(duì)主要周邊語義角色標(biāo)注的難度。在參考了朱曉亞[18]、袁毓林[19]、魯川[20]、劉茂福[21]等學(xué)者以及我們先前設(shè)計(jì)[13,22]的語義角色分類體系,并經(jīng)過實(shí)際的漢語語料考察與驗(yàn)證后,我們最終確定了32個(gè)主要周邊語義角色類型(表1),包括本文提出的7個(gè)全新的主要周邊語義角色,即雇施事、代施事、變事、空間、屬性、性質(zhì)和值事(在表1中以+標(biāo)記),以及本文重新定義的5個(gè)常見主要周邊語義角色(在表1中以*標(biāo)記),即受事、客事、源事、宿事以及向事。為了在實(shí)際語料標(biāo)注過程中能夠準(zhǔn)確并容易地區(qū)分確定這些主要周邊語義角色類型,我們還在表1中給出了它們的判斷標(biāo)準(zhǔn)以及例句。

    表1 主要周邊語義角色種類匯總表

    續(xù)表

    續(xù)表

    2.2.2 輔助周邊語義角色

    輔助周邊語義角色表示在事件中損失利益(受損者)或者獲得收益(受益者)的語義角色。事實(shí)上,在實(shí)際語義角色標(biāo)注過程中,我們經(jīng)常遇到一些句子成分在語句中損失利益或獲得收益。對(duì)于這些句子成分,除了需要標(biāo)注必要的主要周邊語義角色外,我們還應(yīng)該標(biāo)注相關(guān)的輔助周邊語義角色,即受益者(Benefactive)或者受損者(Malefactive)。例如,在“法輪功傷害了無數(shù)的家庭”這個(gè)句子中,句子成分“無數(shù)的家庭”被標(biāo)注為受事,但是它還扮演著“受損者”的角色。通過結(jié)合事件中的主要周邊語義角色和輔助周邊語義角色,我們可以更直觀地得到事件的語義關(guān)系。

    3 一種半自動(dòng)的漢語語義角色數(shù)據(jù)集構(gòu)建方法

    在本節(jié)中,我們基于第2節(jié)中改進(jìn)的漢語語義角色分類體系,進(jìn)行漢語語義角色數(shù)據(jù)集的構(gòu)建?;诩?xì)粒度的語義分析和知識(shí)獲取等任務(wù)的需要[12-15],在參考了現(xiàn)有的漢語語義角色標(biāo)注方法后,我們提出了一套詳細(xì)的細(xì)粒度的漢語語義角色標(biāo)注流程,如圖1所示。在從漢語語料庫中提取出相關(guān)漢語語料后,本文提出的漢語語義角色的標(biāo)注流程主要分為四個(gè)環(huán)節(jié): ①中樞語義角色和主要周邊語義角色標(biāo)注; ②輔助周邊語義角色標(biāo)注; ③語義角色的雙重標(biāo)注; ④不確定語義事件的語義角色標(biāo)注。

    圖1 漢語語義角色的標(biāo)注流程

    3.1 語料收集與整理

    我們課題組經(jīng)過周丹[12]、臧良俊[13]、王亞[14]以及方芳[15]等同學(xué)的科研工作,積累了一個(gè)良好的漢語語義角色標(biāo)注語料庫,用于研究和測(cè)試新的語義角色標(biāo)注和知識(shí)獲取算法。該漢語語義角色標(biāo)注語料庫中的語料來源于商業(yè)網(wǎng)站、門戶網(wǎng)站、新聞網(wǎng)站等,涉及如汽車(1)汽車之家,https://www.autohome.com.cn/和數(shù)碼產(chǎn)品(2)泡泡網(wǎng),http://www.pcpop.com/的介紹、各種新聞(3)新浪新聞,https://news.sina.com.cn/以及百科知識(shí)(4)百度百科,https://baike.baidu.com/文檔等。我們用這個(gè)漢語語義角色標(biāo)注語料庫作為本文漢語語義角色標(biāo)注數(shù)據(jù)集構(gòu)建的語料資源。

    現(xiàn)有的大部分漢語語義角色標(biāo)注數(shù)據(jù)集在語義角色標(biāo)注方面是粗粒度的,這造成了其在后續(xù)的語義分析、知識(shí)獲取和自動(dòng)問答等應(yīng)用中存在缺陷。例如,在Chinese Proposition Bank中標(biāo)注的一條語句“河北省/NR/B-ARG0 科學(xué)院/NN/I-ARG0 微生物/NN/I-ARG0 研究所/NN/I-ARG0 所長(zhǎng)/NN/I-ARG0 劉榮昌/NR/I-ARG0 研究員/NN/E-ARG0 ,/PU/O 從/P/O 一九八四年/NT/O 開始/VV/O 與/P/O 科研/NN/O 人員/NN/O 苦心/AD/O 鉆研/VV/O ,/PU/O 篩選/VV/O 出/VV/O 兩/CD/O 株/M/O 分解/VV/O 土壤/NN/O 礦物/NN/O 鉀/NN/O 能力/NN/O 很/AD/O 強(qiáng)/VA/O 的/DEC/O 硅酸鹽/NN/O 菌株/NN/O ,/PU/O 采用/VV/O 當(dāng)代/NN/O 最新/JJ/O 發(fā)酵/NN/O 工藝/NN/O ,/PU/O 于/P/B-ARGM-TMP 一九八八年/NT/E-ARGM-TMP 在/P/B-ARGM-LOC 國(guó)內(nèi)/NN/E-ARGM-LOC 率先/AD/S-ARGM-ADV 生產(chǎn)/VV/rel 出/VV/O 首/OD/B-ARG1 批/M/I-ARG1 硅酸鹽/NN/I-ARG1 菌劑/NN/I-ARG1 生物/NN/I-ARG1 鉀肥/NN/E-ARG1 。/PU/O”中,存在“篩選”“采用”“生產(chǎn)”等多個(gè)中樞語義角色,但只標(biāo)注了“生產(chǎn)”這一中樞語義角色,這會(huì)丟失很多語義信息。例如,在問答系統(tǒng)中問計(jì)算機(jī)“劉榮昌采用了什么工藝生產(chǎn)了硅酸鹽菌劑生物鉀肥?”,由于語義角色標(biāo)注的不完整,計(jì)算機(jī)無法回答這個(gè)問題??紤]到較長(zhǎng)的語句不便于細(xì)粒度的語義分析與標(biāo)注,因此在本文語義角色標(biāo)注語料庫建設(shè)初期的語料篩選方面,與現(xiàn)有的語義角色數(shù)據(jù)集所用的語料相比,我們選取的語句絕大部分只有一個(gè)中樞語義角色且其句子的平均長(zhǎng)度較短。對(duì)于較長(zhǎng)的句子,我們會(huì)通過句中逗號(hào)、分號(hào)和句號(hào)等標(biāo)點(diǎn)符號(hào)進(jìn)行截?cái)?,如果截?cái)嗪蟮姆志淙匀痪邆渫暾恼Z義信息,我們將選取該截?cái)嗪蟮姆志溥M(jìn)行語義角色標(biāo)注。盡管我們選取語句的平均長(zhǎng)度短于現(xiàn)有的其他語義角色數(shù)據(jù)集中的語句,但我們標(biāo)注的語句蘊(yùn)含更細(xì)節(jié)的語義信息,這不僅體現(xiàn)在我們的主要周邊語義角色種類更豐富,還體現(xiàn)在我們?cè)黾恿溯o助周邊語義角色標(biāo)注、語義角色的雙重標(biāo)注以及不確定語義事件的語義角色標(biāo)注的標(biāo)注方式,能夠?yàn)闃?biāo)注的語句挖掘更多的語義信息,這是現(xiàn)有其他語義角色數(shù)據(jù)集不具備的優(yōu)勢(shì),也是本文的創(chuàng)新之處。在未來的工作中,我們會(huì)考慮長(zhǎng)語料的細(xì)粒度語義角色標(biāo)注。

    3.2 基于語義分類與描述框架的中樞和主要周邊語義角色標(biāo)注方法

    為了滿足各個(gè)領(lǐng)域Web文本語義分析與知識(shí)獲取方法的研究需求,我們課題組構(gòu)建了一種基于語義分類和描述框架FSTD的知識(shí)庫[13,22]。FSTD設(shè)計(jì)了一種不限于具體領(lǐng)域的通用語義文法。該文法是一組由語義非終結(jié)符、詞類非終結(jié)符、常量終結(jié)符組成的序列,其中,語義非終結(jié)符是指形為“<主要周邊語義角色: 類型>”的非終結(jié)符,“類型”是充當(dāng)主要周邊語義角色的對(duì)象的類型。詞類非終結(jié)符表示一組語義相同的詞語。常量終結(jié)符是一組字符串,可以是一個(gè)或多個(gè)詞語。例如,<施事: 認(rèn)知主體><買詞類>[了]<受事: 物體|服務(wù)>表示的是“買”事件的一個(gè)語義文法?!?施事: 認(rèn)知主體>”和“<受事: 物體|服務(wù)>”為文法中的語義非終結(jié)符,“<買詞類>”為詞類非終結(jié)符,“[了]”為常量終結(jié)符。其中,施事后的對(duì)象類型“認(rèn)知主體”和受事后的對(duì)象類型“物體|服務(wù)”為對(duì)主要周邊語義角色類型所做的語義限制,主要周邊語義角色是語義層面上的定義,而對(duì)象類型是知識(shí)層面上的定義。

    基于FSTD的語義文法,方芳[15]實(shí)現(xiàn)了一個(gè)魯棒Earley語義解析器,能夠?qū)o定的中文文本進(jìn)行解析。魯棒Earley語義解析器是基于Earley算法進(jìn)行改進(jìn)而產(chǎn)生的語義解析器,加入了容錯(cuò)解析等功能,用于判斷一個(gè)中文文本是否可以被TSTD中的語義文法所識(shí)別,并生成識(shí)別后的語義解析樹。目前語義分類與描述框架FSTD的語義文法在公開的Web數(shù)據(jù)上覆蓋率已經(jīng)達(dá)到71.4%[15],即能解析語料庫中的大部分句子,對(duì)于無法解析的句子,則通知FSTD維護(hù)人員進(jìn)行語義文法的擴(kuò)充。

    考慮到中樞語義角色和主要周邊語義角色是FSTD語義文法中的重要組成部分,本文充分利用FSTD中的語義文法和魯棒Earley語義解析器對(duì)給定中文文本進(jìn)行中樞語義角色和主要周邊語義角色的自動(dòng)標(biāo)注,具體標(biāo)注過程如下:

    (1) 首先對(duì)待標(biāo)注的漢語語句用FoolNLTK(5)https://github.com/rockyzhengwu/FoolNLTK進(jìn)行分詞和詞性標(biāo)注。例如,語句“胡老師祝愿大家新年快樂”的分詞結(jié)果為“胡/nr1 老師/n 祝愿/v 大家/rr 新年/t 快樂/an”。

    (2) 利用魯棒Earley語義解析器對(duì)分詞后的語句進(jìn)行自動(dòng)解析,得到語義解析樹。圖2給出了“胡老師祝愿大家新年快樂”的最優(yōu)語義解析樹。

    圖2 FSTD語義文法解析得出的最優(yōu)解析樹

    (3) 從最優(yōu)語義解析樹中獲得語句中相關(guān)成分的語義角色信息,產(chǎn)生一個(gè)初步的語義角色標(biāo)注框架,參見圖3。

    圖3 從最優(yōu)解析樹中產(chǎn)生的語義角色標(biāo)注框架

    (4) 由于目前魯棒Earley語義解析器得到的最優(yōu)語義解析樹正確率只有58%左右,因此,我們需要對(duì)圖3中得到的初步語義角色標(biāo)注框架進(jìn)行人工審核。通過人工修改和補(bǔ)充,我們獲得關(guān)于語句“胡老師祝愿大家新年快樂”的語義角色標(biāo)注結(jié)果,如圖4所示。語義角色標(biāo)注框架主要包含5個(gè)部分,分別為: ①輸入部分defframe表示待標(biāo)注的原始語句; ②分詞結(jié)果表示的是對(duì)原始語句進(jìn)行分詞后的結(jié)果; ③中樞語義角色標(biāo)識(shí)句子成分“祝愿”是中樞語義角色; ④主要周邊語義角色標(biāo)識(shí)句子成分對(duì)應(yīng)的主要周邊語義角色,例如,句子成分“胡老師”是施事等。此外,我們還保留了FSTD語義文法中主要周邊語義角色的對(duì)象的類型,如充當(dāng)施事“胡老師”的類型是認(rèn)知主體等; ⑤為了便于后期對(duì)標(biāo)注語句的審查和理解,我們手動(dòng)地在標(biāo)注結(jié)果中增加“標(biāo)注依據(jù)”,表示標(biāo)注這些主要周邊語義角色所參考的標(biāo)準(zhǔn)。

    圖4 從最優(yōu)解析樹中得到的標(biāo)注結(jié)果

    基于FSTD語義文法的語義角色標(biāo)注方法只能標(biāo)注句子中的中樞和主要周邊語義角色,而對(duì)于輔助周邊語義角色、語義角色的雙重標(biāo)注以及不確定語義事件的語義角色標(biāo)注這類語義性更強(qiáng)的標(biāo)注,需要采用人工的方法進(jìn)行手動(dòng)標(biāo)注。

    3.3 輔助周邊語義角色標(biāo)注

    如第2節(jié)所述,在實(shí)際語義角色標(biāo)注過程中,經(jīng)常會(huì)遇到句子成分在事件中損失利益或者獲得收益。為了獲得這部分語義信息,我們必須為其標(biāo)注相關(guān)輔助周邊語義角色,即受益者或者受損者,下面我們進(jìn)行詳細(xì)說明。

    定義1(受益者,Benefactive): 受益者表示的是在事件中樞語義角色動(dòng)作發(fā)生之后,自身價(jià)值取向增加的周邊語義角色。具體地,在事件E中,存在周邊語義角色PSRs和中樞語義角色PSR,如果PSRs初始自身價(jià)值為V1,在中樞語義角色PSR動(dòng)作發(fā)生之后,PSRs自身價(jià)值發(fā)生了變化,其值的大小變成了V2,且V2>V1,則周邊語義角色PSRs在輔助周邊語義角色中被標(biāo)注為受益者。

    定義2(受損者,Malefactive): 受損者表示的是在事件中樞語義角色動(dòng)作發(fā)生之后,自身價(jià)值取向減少的周邊語義角色。具體地,在事件E中,存在周邊語義角色PSRs和中樞語義角色PSR,如果PSRs初始自身價(jià)值為V1,而在中樞語義角色PSR動(dòng)作發(fā)生之后,PSRs自身價(jià)值發(fā)生了變化,其值的大小變成了V2,且V2

    基于定義1和2,如果一個(gè)周邊語義角色在事件中樞語義角色動(dòng)作發(fā)生之后,自身價(jià)值取向增加,則我們將其標(biāo)注為輔助周邊語義角色“受益者”。反之,我們則將其標(biāo)注為輔助周邊語義角色“受損者”。我們?cè)趫D4的標(biāo)注結(jié)果上進(jìn)行輔助周邊語義角色的手工標(biāo)注,如圖5所示,句子成分“大家”是受益者。

    圖5 輔助周邊語義角色“受益者”的標(biāo)注

    輔助周邊語義角色的標(biāo)注非常重要,通過與主要周邊語義角色的配合,我們可以更準(zhǔn)確地推理出給定文本所要表達(dá)的語義信息。例如,在圖5中,我們知道文本“胡老師祝愿大家新年快樂”一共被標(biāo)注了施事、向事與客事,同時(shí)向事對(duì)應(yīng)的句子成分“大家”被標(biāo)注成了受益者,那么從這3個(gè)主要周邊語義角色和1個(gè)輔助周邊語義角色,我們可以推導(dǎo)出給定文本蘊(yùn)含著“施事傳達(dá)了良好的信息給向事”“施事對(duì)向事是友好的”等更詳細(xì)的語義信息。

    在對(duì)語料的標(biāo)注過程中,我們發(fā)現(xiàn)標(biāo)注人員在標(biāo)注輔助周邊語義角色“受益者”和“受損者”存在立場(chǎng)問題。下面我們以一個(gè)例句進(jìn)行說明。

    例句4: 紅軍攻占了陽新縣城

    例句4的中樞語義角色是“攻占”,兩個(gè)主要周邊語義角色“紅軍”和“陽新縣城”分別是施事和受事。然而,在對(duì)“陽新縣城”進(jìn)行輔助周邊語義角色的判別時(shí),我們課題組的標(biāo)注人員產(chǎn)生了分歧: 部分標(biāo)注人員認(rèn)為“陽新縣城”是“受損者”,因?yàn)椤瓣栃驴h城”是被攻擊方,被攻擊表示自身價(jià)值受損。另一部分標(biāo)注人員覺得“陽新縣城”是“受益者”,他們給出的理由是“紅軍”是正義的一方,攻打陽新縣城能夠解放陽新縣城的人民,擺脫陽新縣城被統(tǒng)治者統(tǒng)治的狀態(tài)。事實(shí)上,標(biāo)注人員產(chǎn)生分歧的根本緣由是他們所處的立場(chǎng)不同,認(rèn)為“陽新縣城”是“受損者”的標(biāo)注人員所處的立場(chǎng)是陽新縣城現(xiàn)在統(tǒng)治者的立場(chǎng),陽新縣城被攻擊會(huì)動(dòng)搖統(tǒng)治者的地位。而認(rèn)為“陽新縣城”是“受益者”的標(biāo)注人員所處的立場(chǎng)是紅軍和陽新縣城百姓的立場(chǎng),陽新縣城被攻擊能夠解放陽新縣城的百姓,紅軍能夠給他們更好的生活。在標(biāo)注輔助周邊語義角色時(shí),對(duì)于這類因?yàn)闃?biāo)注立場(chǎng)不同而存在分歧的語料,我們采用績(jī)效風(fēng)險(xiǎn)的方法進(jìn)行處理,即站在中立者的角度進(jìn)行輔助周邊語義角色的標(biāo)注,在沒有任何確定信息的情況下,為了不犯錯(cuò),盡量減少標(biāo)注。

    3.4 語義角色的雙重標(biāo)注

    語義角色的雙重標(biāo)注是基于我們對(duì)課題組語料審查分析過程中發(fā)現(xiàn)的一個(gè)特殊語義現(xiàn)象,它能夠?yàn)槲谋菊Z義理解挖掘更多的語義信息。語義角色的雙重標(biāo)注意味著在為事件角色標(biāo)注了一個(gè)主要周邊語義角色后,還需要為這個(gè)事件角色添加另一個(gè)主要周邊語義角色。我們以引言中的例句3“八路軍主力已退守沂蒙山”進(jìn)行說明。

    例句3的中樞語義角色是“退守”,它有兩個(gè)主要周邊語義角色,分別為“八路軍主力”和“沂蒙山”?!鞍寺奋娭髁Α笔恰巴耸亍眲?dòng)作的發(fā)起者,因此“八路軍主力”是施事,然而,由于“退守”是一個(gè)復(fù)合動(dòng)詞,它的釋義為“后退并防守”,其語義重心更偏向于“防守”,因此該事件對(duì)應(yīng)的客體“沂蒙山”為“受事”。這樣的標(biāo)注方法可以讓計(jì)算機(jī)理解“沂蒙山”是“八路軍主力”防守并保護(hù)的對(duì)象,然而,在問答系統(tǒng)中,如果計(jì)算機(jī)被問“八路軍主力現(xiàn)在所處的位置在哪里?”,由于“沂蒙山”被標(biāo)注成“受事”,計(jì)算機(jī)就無法回答這個(gè)問題。這是由于在理解“退守”時(shí),我們理解其語義更偏向于“防守”造成的,但是“退守”還有另一層“后退”的意思,它解釋了八路軍現(xiàn)在所處的位置。因此,為了解決這個(gè)問題,我們提出了語義角色雙重標(biāo)注的語義角色標(biāo)注方法,即沂蒙山不僅被標(biāo)注為受事(第一個(gè)標(biāo)注的主要周邊語義角色),還被標(biāo)注為宿事(第二個(gè)標(biāo)注的主要周邊語義角色),如圖6所示。

    圖6 主要周邊語義角色的雙重標(biāo)注

    圖6中主要周邊語義角色的雙重標(biāo)注方式能夠?yàn)橹形奈谋菊Z義的理解帶來更多的語義信息,我們不僅知道沂蒙山是“八路軍主力”防守的對(duì)象,還知道八路軍主力正處于沂蒙山。需要注意的是,不是所有的語句都具有需要雙重標(biāo)注的語義角色,這類語句一般具有一些特殊的中樞語義角色,在我們對(duì)課題組語料庫審查的過程中,我們發(fā)現(xiàn)這些特殊的中樞語義角色通常以復(fù)合動(dòng)詞的形式存在。

    3.5 不確定語義事件的語義角色標(biāo)注

    不確定語義事件指存在歧義的事件,一般需要結(jié)合上下文消除歧義。然而,就單個(gè)事件而言,事件中被標(biāo)注的語義角色是獨(dú)立的且與上下文中的其他事件的語義角色無關(guān),這是不正常的。在語義角色標(biāo)注過程中,我們發(fā)現(xiàn)造成不確定語義事件發(fā)生的原因主要有兩個(gè): ①中樞語義角色造成事件語義不確定性; ②周邊語義角色造成事件語義不確定性。下面,我們分別進(jìn)行介紹。

    (1) 中樞語義角色造成的事件語義不確定性: 指因中樞語義角色多義性造成其所在事件存在語義不確定性。下面我們給出一個(gè)例句進(jìn)行說明。

    例句5: 康諾利拜訪了教父皮爾斯

    在例句5中,它的中樞語義角色是“拜訪”。 然而,在現(xiàn)代漢語中,“拜訪”有兩個(gè)基本釋義: ①短時(shí)間看望(到長(zhǎng)輩或親友等處問候); ②指敬詞,表示看望并談話。因此,要完成例句5中語義角色標(biāo)注,我們必須結(jié)合上下文。下面,我們?yōu)槔?補(bǔ)充上下文,形成事鏈[20]例句6和例句7:

    例句6: 教父皮爾斯很有人緣,有一天路過他家時(shí),康諾利拜訪了教父皮爾斯,教父皮爾斯很開心。

    例句7: 康諾利遇到了一些困惑,康諾利拜訪了教父皮爾斯,教父皮爾斯的一席話讓康諾利茅塞頓開。

    對(duì)于例句6和例句7,我們可以知道,例句6中“拜訪”是基本釋義中的“短時(shí)間看望(到長(zhǎng)輩或親友等處問候)”,例句7“拜訪”是基本釋義中的“指敬詞,表示看望并談話”。因此,對(duì)于這類擁有二義性中樞語義角色的語句,且沒有足夠上下文信息支撐標(biāo)注人員確定事件代表的語義信息,我們需要標(biāo)注可能的主要周邊語義角色以便表示句子完整的語義信息,如圖7所示。按照對(duì)例句6和例句7的理解,我們進(jìn)行了兩種不同的語義角色標(biāo)注方式: ①如果“拜訪”被理解為“短時(shí)間看望(到長(zhǎng)輩或親友等處問候)”,則“康諾利”被標(biāo)注為施事,而“教父皮爾斯”被標(biāo)注為向事以及受益者; ②如果“拜訪”被理解為“指敬詞,表示看望并談話”,則“康諾利”同時(shí)被標(biāo)注為施事以及受益者,而“教父皮爾斯”被標(biāo)注為源事。

    圖7 中樞語義角色多義性的語義角色標(biāo)注

    (2) 周邊語義角色造成的事件語義不確定性: 指的是因?yàn)橹苓呎Z義角色存在多義性造成了其所在事件存在語義不確定性。對(duì)于這種情況,需要結(jié)合上下文并進(jìn)行詞義消歧才能準(zhǔn)確地完成語義角色的標(biāo)注。下面我們給出一個(gè)例句進(jìn)行說明。

    例句8: 熊貓破壞了系統(tǒng)硬盤數(shù)據(jù)

    在例句8中,句中的成分“熊貓”存在多語義性,因?yàn)檫@個(gè)詞既可以指代哺乳動(dòng)物熊貓,也可以指代計(jì)算機(jī)蠕蟲病毒熊貓。如果句中的成分“熊貓”指的是哺乳動(dòng)物,那么其對(duì)應(yīng)的語義角色是施事(施事的判斷標(biāo)準(zhǔn)①)。如果句中的成分“熊貓”指的是計(jì)算機(jī)蠕蟲病毒,那么其對(duì)應(yīng)的語義角色是代施事(代施事的判斷標(biāo)準(zhǔn)③)。因此,對(duì)于這類事件語料,我們參照?qǐng)D7的標(biāo)注方式,增加另一種標(biāo)注以便表示其完整的語義信息,并在注釋中進(jìn)行說明,如圖8所示。

    圖8 周邊語義角色多義性的語義角色標(biāo)注

    3.6 語義角色標(biāo)注后的審查

    在我們進(jìn)行語義角色標(biāo)注的過程中,我們發(fā)現(xiàn)語義角色在語料中的出現(xiàn)和分布存在一定的規(guī)律,我們將這種規(guī)律稱為語義角色約束。語義角色約束可以幫助我們?cè)O(shè)計(jì)相關(guān)算法對(duì)語料庫中標(biāo)注的語料自動(dòng)地進(jìn)行初步審查,減輕后期人工復(fù)審的壓力。目前,我們發(fā)現(xiàn)3種語義角色約束關(guān)系,分別為主體客體數(shù)量約束、主要周邊語義角色搭配約束、中樞語義角色模式一致性約束。為了能夠清晰地表示這三種語義角色約束關(guān)系,我們以節(jié)點(diǎn)作為語義角色,以邊作為約束關(guān)系,繪制了語義關(guān)系約束圖,如圖9所示。下面我們介紹這三種約束關(guān)系。

    圖9 主要周邊語義角色關(guān)系約束圖

    (1) 主體客體數(shù)量約束: 指在只有一個(gè)中樞語義角色的語句中,主體或者客體中的主要周邊語義角色出現(xiàn)的個(gè)數(shù)必須均小于2。例如,在只有一個(gè)中樞語義角色的語句中,施事和雇施事作為主體不能同時(shí)出現(xiàn),受事和客事作為客體不能同時(shí)出現(xiàn)等。

    (2) 主要周邊語義角色搭配約束: 在我們的語義角色標(biāo)注體系中,有些語義角色是搭配使用的,這些搭配使用的語義角色在只有一個(gè)中樞語義角色的語句中會(huì)同時(shí)出現(xiàn)。在我們對(duì)語料進(jìn)行語義角色標(biāo)注的過程中,我們發(fā)現(xiàn)常見搭配使用的語義角色包括{領(lǐng)事屬事}(6){a?b}表示有語義角色a必定存在b;{ab}表示有語義角色b必定存在a;{ab}表示語義角色a和語義角色b必然同時(shí)存在。、{屬性值事}、{感事?客事}、{當(dāng)事連事}、{(施事,致事)?意圖}、{施事|代施事|當(dāng)事(客事,源事)}、{施事|代施事(受事,源事)}、{施事|代施事(客事|受事,向事)}等。例如,在只有一個(gè)中樞語義角色的語句中,如果出現(xiàn)了領(lǐng)事但沒有出現(xiàn)屬事,則該語句的語義角色可能標(biāo)注錯(cuò)誤,反之亦然。

    (3) 中樞語義角色模式一致性約束: 指對(duì)于中樞語義角色語義相近的語句,其標(biāo)注的主要周邊語義角色類型應(yīng)該是相同的,即兩個(gè)中樞語義角色意思相近的語句共享同樣的主要周邊語義角色類型。例如,在以“祝福”為中樞語義角色的語句中,其對(duì)應(yīng)的主要周邊語義角色有施事、向事和客事,那么在以“祝愿”為中樞語義角色的語句中,其對(duì)應(yīng)的主要周邊語義角色也應(yīng)該是施事、向事和客事。

    上述語義角色約束關(guān)系只能初步地找出可能標(biāo)注出錯(cuò)的語料,并不能最終確定是否真的標(biāo)注出錯(cuò)或者是句子中的哪個(gè)成分是錯(cuò)誤的標(biāo)注。因此,接下來需要通過人工的方法進(jìn)行最終標(biāo)注結(jié)果的確定,即人工復(fù)審確認(rèn)。人工復(fù)審確認(rèn)主要是為了提高語義角色標(biāo)注的一致性,復(fù)審人員由另一個(gè)標(biāo)注人員擔(dān)任,其在復(fù)審過程中被要求對(duì)復(fù)審的句子重新進(jìn)行標(biāo)注。如果復(fù)審人員標(biāo)注的每個(gè)句子成分對(duì)應(yīng)的語義角色標(biāo)簽與初次標(biāo)注結(jié)果一致,則確認(rèn)該句標(biāo)注完成,否則讓課題組的權(quán)威老師進(jìn)行判定。我們用Kappa系數(shù)[23]衡量語義角色標(biāo)簽標(biāo)注的一致性,通過對(duì)數(shù)據(jù)標(biāo)注的結(jié)果進(jìn)行統(tǒng)計(jì)分析,初次標(biāo)注人員和復(fù)審人員標(biāo)注相同語義角色標(biāo)簽的Kappa系數(shù)為0.819 6,表明人工標(biāo)注具有較好的一致性,達(dá)到了我們預(yù)期的目標(biāo)。

    4 基準(zhǔn)實(shí)驗(yàn)

    基于第3節(jié)的漢語語義角色數(shù)據(jù)集構(gòu)建方法,截至撰寫本論文時(shí),我們一共完成了9 550條漢語語句的語義角色標(biāo)注,初步形成了一個(gè)細(xì)粒度的語義角色標(biāo)注數(shù)據(jù)集。在這個(gè)數(shù)據(jù)集中,目前一共擁有9 423個(gè)中樞語義角色,29 142個(gè)主要周邊語義角色,3 745個(gè)輔助周邊語義角色、172條語句被進(jìn)行了語義角色的雙重標(biāo)注以及104條語句被進(jìn)行了不確定語義事件的語義角色標(biāo)注。

    目前,在語義角色數(shù)據(jù)集的研究應(yīng)用方面,主要周邊語義角色的自動(dòng)識(shí)別被廣泛研究。為了測(cè)試我們標(biāo)注語料的合理性以及構(gòu)建的語義角色數(shù)據(jù)集的有效性,我們用本文的語義角色數(shù)據(jù)集進(jìn)行了關(guān)于主要周邊語義角色自動(dòng)識(shí)別的基準(zhǔn)實(shí)驗(yàn)。具體實(shí)驗(yàn)過程如下:

    我們將主要周邊語義角色的自動(dòng)識(shí)別問題看作是序列標(biāo)注問題。對(duì)于上述標(biāo)注完成的語義角色數(shù)據(jù)集,我們采用BIOES的方式進(jìn)行轉(zhuǎn)換,其中B表示開始,I表示中間,E表示結(jié)尾,S表示單個(gè)分詞詞語,O表示其他,用于標(biāo)記與中樞語義角色和主要周邊語義角色無關(guān)的分詞詞語。我們將中樞語義角色對(duì)應(yīng)的句子成分標(biāo)注為Pivot。此外,對(duì)于語義角色雙重標(biāo)注和不確定語義事件的語義角色標(biāo)注的語料,我們選取其第一種標(biāo)注方式進(jìn)行BIOES轉(zhuǎn)換。對(duì)于圖5中的例句,最后轉(zhuǎn)換得到的BIOES的格式如圖10所示:

    圖10 主要周邊語義角色對(duì)應(yīng)的BIOES格式

    基于上述轉(zhuǎn)化后BIOES格式的主要周邊語義角色數(shù)據(jù)集,我們采用了一個(gè)經(jīng)典的序列標(biāo)注模型Bi-LSTM+CRF(7)https://github.com/scofield7419/sequence-labeling-BiLSTM-CRF作為基線模型進(jìn)行主要周邊語義角色的自動(dòng)識(shí)別工作??紤]到在現(xiàn)有的中文語義角色數(shù)據(jù)集中,Chinese Proposition Bank 1.0(CPB 1.0)是公開的且被廣泛地應(yīng)用于中文語義角色自動(dòng)識(shí)別的研究中,我們用這個(gè)基線模型將本文的語義角色數(shù)據(jù)集與CPB 1.0進(jìn)行了比較。表2展示的是本文語義角色數(shù)據(jù)集和CPB 1.0的構(gòu)建差異對(duì)比。

    表2 本文語義角色數(shù)據(jù)集和CPB 1.0的構(gòu)建差異對(duì)比

    從表2中可以看出,本文語義角色數(shù)據(jù)集目前在標(biāo)注規(guī)模上還小于CPB 1.0,但在語義角色標(biāo)簽種類數(shù)量和語義角色標(biāo)簽密度(語義角色標(biāo)簽數(shù)/標(biāo)簽總數(shù),數(shù)值越小代表語義角色數(shù)據(jù)集中的O標(biāo)簽越多)都大于CPB 1.0,這表明本文的語義角色數(shù)據(jù)集擁有比CPB 1.0更細(xì)粒度的語義信息。由于目前我們的語義角色數(shù)據(jù)集只有9 550條語句,為了更好地體現(xiàn)出比較效果,我們從CPB 1.0中隨機(jī)選取了9 550條語句,保證其數(shù)量與我們的數(shù)據(jù)集數(shù)量相同。我們將我們構(gòu)建的語義角色數(shù)據(jù)集和CPB 1.0中的9 550條語句隨機(jī)打亂,并按照7∶2∶1的比例劃分為訓(xùn)練集和驗(yàn)證集和測(cè)試集,最后得到擁有6 685條語句的訓(xùn)練集,擁有1 910條語句的驗(yàn)證集以及擁有955條語句的測(cè)試集。我們采用準(zhǔn)確率(Precision,P)、召回率(Recall,R)以及F1值來衡量最終的定量實(shí)驗(yàn)效果。Bi-LSTM+CRF的基線模型在兩個(gè)數(shù)據(jù)集上的定量實(shí)驗(yàn)效果如表3所示。

    表3 Bi-LSTM+CRF的基線模型在兩個(gè)數(shù)據(jù)集上的定量實(shí)驗(yàn)效果 (單位: %)

    從表3中我們可以看出,無論對(duì)于CPB 1.0還是本文語義角色數(shù)據(jù)集,基于BERT(8)https://github.com/google-research/bert#pre-trained-models的預(yù)訓(xùn)練模型均能夠很明顯地提高主要周邊語義角色的識(shí)別準(zhǔn)確率和召回率。此外,我們還注意到,采用同樣的Bi-LSTM+CRF基線模型和預(yù)訓(xùn)練模型,本文的語義角色數(shù)據(jù)集在包括準(zhǔn)確率、召回率以及F1值三個(gè)方面均比CPB 1.0好,但這并不能說明本文語義角色數(shù)據(jù)集的語義角色識(shí)別任務(wù)比CPB 1.0容易,出現(xiàn)表3中的實(shí)驗(yàn)效果是因?yàn)楸疚恼Z義角色數(shù)據(jù)集在初步構(gòu)建時(shí)所選用語料的長(zhǎng)度比CPB 1.0短,而Bi-LSTM+CRF基線模型更容易捕捉短句中詞與詞之間的上下文依賴關(guān)系。事實(shí)上,本文構(gòu)建的語義角色數(shù)據(jù)集在主要周邊語義角色識(shí)別方面比CPB 1.0更具挑戰(zhàn)性,這是因?yàn)楸疚恼Z義角色數(shù)據(jù)集的主要周邊語義角色的種類比CPB 1.0更細(xì)致,蘊(yùn)含的語義信息也更細(xì)膩,這增加了主要周邊語義角色自動(dòng)識(shí)別的難度。

    除了表3中的定量分析,我們還對(duì)Bi-LSTM+CRF基線模型在本文語義角色數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果進(jìn)行了定性錯(cuò)誤分析。我們初步將錯(cuò)誤類型分為兩種:

    (1) 與常識(shí)無關(guān)的錯(cuò)誤。例如,實(shí)驗(yàn)結(jié)果中存在將“李嬤嬤正在斥罵著宮人們”識(shí)別為“李/B-施事 嬤嬤/B-代施事 正在/O 斥罵/Pivot 著/O 宮/B-受事 人們/E-受事”,其錯(cuò)誤在于施事對(duì)應(yīng)句子成分后接上了代施事,辱罵對(duì)應(yīng)客體句子成分是向事,而不是受事。對(duì)于這種與常識(shí)無關(guān)的錯(cuò)誤,我們可以通過增大語義角色數(shù)據(jù)集的規(guī)模,設(shè)計(jì)更先進(jìn)的神經(jīng)網(wǎng)絡(luò)模型以及更具有針對(duì)性的損失函數(shù)等方法來解決。

    (2) 與常識(shí)有關(guān)的錯(cuò)誤。這種類型的錯(cuò)誤很難甚至無法通過基于神經(jīng)網(wǎng)絡(luò)統(tǒng)計(jì)模型的方法來解決,我們總結(jié)了實(shí)驗(yàn)結(jié)果中四個(gè)典型容易識(shí)別錯(cuò)位的案例,如表4所示。

    表4 因常識(shí)問題容易混肴出錯(cuò)的四個(gè)典型案例

    造成表4中與常識(shí)有關(guān)的語義角色識(shí)別錯(cuò)誤的根本原因在于: 作為一種淺層的語義分析方法,語義角色標(biāo)注在知識(shí)和常識(shí)的表達(dá)方面存在先天的缺陷,以“他搶劫了銀行”和“他搶劫了珠寶”這兩個(gè)句子為例,Bi-LSTM+CRF基線模型會(huì)將句子成分“珠寶”和“銀行”均識(shí)別為受事,但在我們的語義角色標(biāo)注體系中,“銀行”應(yīng)該被標(biāo)注為源事,“珠寶”應(yīng)該被標(biāo)注為受事,這種標(biāo)注方式在我們?nèi)四X中蘊(yùn)含的一個(gè)常識(shí)就是銀行是一個(gè)金融機(jī)構(gòu),他搶劫了銀行預(yù)示著他把銀行中的貴重物品拿走了,珠寶是一種貴重物品,他搶劫了珠寶預(yù)示著他把珠寶拿走了。這種知識(shí)和常識(shí)信息對(duì)語義分析至關(guān)重要,能夠很好地服務(wù)于后續(xù)關(guān)于語義方面的知識(shí)抽取和常識(shí)獲取等下游任務(wù)。

    為了能夠形式化地表示上述知識(shí)和常識(shí)信息,我們課題組在曹存根研究員的主持下正在研發(fā)一種全息事件網(wǎng)絡(luò)(Holographic Event Network,HEN),其致力于為深層的語義分析、知識(shí)獲取和常識(shí)獲取等研究打下基礎(chǔ)。HEN是一種包含過程事件網(wǎng)絡(luò)層和狀態(tài)事件網(wǎng)絡(luò)層的事件網(wǎng)絡(luò),其中狀態(tài)事件網(wǎng)絡(luò)層類似于一個(gè)常識(shí)圖譜,將實(shí)體、概念、屬性(值)作為節(jié)點(diǎn),而節(jié)點(diǎn)之間的連線被標(biāo)識(shí)為節(jié)點(diǎn)之間的關(guān)系,這些關(guān)系的種類主要基于ConceptNet5(9)https://github.com/commonsense/conceptnet5/wiki/Relations中的關(guān)系而確定。HEN不是本文工作重心,在此只做簡(jiǎn)要說明,后續(xù)課題組會(huì)發(fā)表文章時(shí)相關(guān)工作進(jìn)行詳細(xì)介紹。

    HEN的建立為解決上述因常識(shí)問題造成主要周邊語義角色識(shí)別出錯(cuò)的案例提供了思路。圖11表示的是案例“他搶劫了銀行”和“他搶劫了珠寶”到HEN狀態(tài)事件網(wǎng)絡(luò)層的映射。

    圖11 語義角色在HNN中被自動(dòng)檢查的過程

    對(duì)于這種類型的錯(cuò)誤,我們可以結(jié)合HEN并有針對(duì)性地利用規(guī)則的方式來進(jìn)行自動(dòng)檢查,其具體算法如算法1所示。在算法1中,步驟2~步驟3表示是對(duì)于如標(biāo)注為O和Pivot等不是主要周邊角色類型的句子成分,默認(rèn)檢查通過。步驟5表示的是將句子成分映射到HNT中的狀態(tài)事件網(wǎng)絡(luò)層。步驟7~12表示的是獲取與句子成分在HNT中映射節(jié)點(diǎn)存在指代、是子類和同義詞關(guān)系的節(jié)點(diǎn),并判斷這些節(jié)點(diǎn)的屬性是否滿足其所標(biāo)識(shí)主要周邊語義角色的判斷標(biāo)準(zhǔn),如果滿足,則識(shí)別檢查通過,反之則識(shí)別檢查不通過。例如,句子成分“珠寶”是可轉(zhuǎn)移物品和有價(jià)值物品的子類,其分別具有屬性價(jià)值和屬性可移動(dòng)性,可移動(dòng)性符合我們對(duì)受事的定義,因此,“珠寶”被標(biāo)注為受事的檢查通過。反之,句子成分“銀行”是金融機(jī)構(gòu)的子類,但是我們從HNN中只能知道金融機(jī)構(gòu)具有有價(jià)值的物品,并不能得出金融機(jī)構(gòu)具有屬性可移動(dòng)性,其不符合受事的定義,因此,“珠寶”被標(biāo)注為受事的自動(dòng)檢查無法通過。

    算法1 基于HNN的主要語義角色識(shí)別檢查算法輸入: S={w1/SR1,w1/SR2,…,w1/SRn},其中wi表示句子中第i個(gè)句子成分,SRi表示第i個(gè)句子成分被識(shí)別的主要周邊語義角色類型;PPSR={PPSR1,PPSR2,…,PPSRn},主要周邊語義角色類型集合;HNT_S=,其中N={1,2,3,…,m}表示HNT狀態(tài)事件網(wǎng)絡(luò)層的節(jié)點(diǎn)集合,NEjk表示節(jié)點(diǎn)j和節(jié)點(diǎn)k之間的關(guān)系;輸出: Result={Re1,Re2,…,Ren},其中Rei表示第i個(gè)句子成分是否識(shí)別正確,如果正確,則為True,反之則為False;1. for all wi/SRi in S do2. ifSRi not in PPSR then3. Rei←True ?不是周邊語義角色類型的句子成分,不需要檢查4. else5. No←HNT_S(wi)6. Relation←{指代,是指類,同義詞}7. NoSet←No∪Relation(No) ?得到Relation相關(guān)的節(jié)點(diǎn)8. for all Node in NoSet do9. if Node具有的屬性滿足SRi的判斷標(biāo)準(zhǔn) then10. Rei←True11. end12 ifRei==NULLthenRei←False13. end

    5 結(jié)束語

    語義角色數(shù)據(jù)集的構(gòu)建對(duì)自然語言語義分析和理解等研究有著重要的作用。本文深入研究了已有的語義角色分類體系,并對(duì)實(shí)際的漢語語料進(jìn)行了詳細(xì)的考察,提出了一種改進(jìn)的漢語語義角色分類體系。在此基礎(chǔ)上,以只有一個(gè)中樞語義角色的語料作為研究對(duì)象,提出了一種細(xì)粒度的漢語語義角色數(shù)據(jù)集構(gòu)建方法。細(xì)粒度的語義信息不僅體現(xiàn)在我們主要周邊語義角色種類的豐富性,還體現(xiàn)在我們語義角色標(biāo)注步驟的多樣性。最后,我們構(gòu)建了一個(gè)擁有9 950條語句的漢語語義角色數(shù)據(jù)集,并將其與公開的Chinese Proposition Bank語義角色數(shù)據(jù)集在一個(gè)Bi-LSTM+CRF的基線模型上進(jìn)行了關(guān)于主要周邊語義角色自動(dòng)識(shí)別的實(shí)驗(yàn)對(duì)比。此外,我們還分析了Bi-LSTM+CRF基線模型在本文語義角色數(shù)據(jù)集識(shí)別錯(cuò)誤的語句,并針對(duì)這些識(shí)別出錯(cuò)的語句初步提出了后期解決這些錯(cuò)誤的思路。

    目前,我們語義角色數(shù)據(jù)集的構(gòu)建還有較長(zhǎng)的路需要走,后期的工作重心將集中于擴(kuò)大語義角色數(shù)據(jù)集的規(guī)模,以及考慮如何更好地對(duì)多中樞語義角色的長(zhǎng)語料進(jìn)行細(xì)粒度的語義角色標(biāo)注。此外,利用已有的語義角色數(shù)據(jù)集,設(shè)計(jì)相關(guān)語義角色的自動(dòng)識(shí)別算法,提高語義角色識(shí)別的準(zhǔn)確率和召回率,并將其運(yùn)用于語義分析和知識(shí)獲取等下游任務(wù),也是我們未來的主要工作。

    猜你喜歡
    中樞例句語料
    試議文化中樞的博物館與“進(jìn)”“出”兩種行為
    英聲細(xì)語
    基于語料調(diào)查的“連……都(也)……”出現(xiàn)的語義背景分析
    好詞好句
    好詞好句
    小兒推拿治療中樞協(xié)調(diào)障礙163例
    華語電影作為真實(shí)語料在翻譯教學(xué)中的應(yīng)用
    好詞好句
    辨證取穴針刺治療對(duì)慢性緊張型頭痛中樞調(diào)控的影響
    《苗防備覽》中的湘西語料
    亚洲综合色惰| 在线观看三级黄色| 精品久久久久久久末码| 亚洲不卡免费看| 国产毛片在线视频| 国产永久视频网站| 久久久久久九九精品二区国产| 日韩av在线免费看完整版不卡| 国产成年人精品一区二区| 亚洲色图综合在线观看| 成人亚洲精品av一区二区| 久久久久久久久久成人| 国产精品成人在线| 久久久精品欧美日韩精品| 简卡轻食公司| 别揉我奶头 嗯啊视频| 十八禁网站网址无遮挡 | 欧美 日韩 精品 国产| 久久久欧美国产精品| 亚洲av欧美aⅴ国产| 国产欧美另类精品又又久久亚洲欧美| 99久国产av精品国产电影| 久久久久久久久久久丰满| 内射极品少妇av片p| 汤姆久久久久久久影院中文字幕| 久久人人爽av亚洲精品天堂 | 久热这里只有精品99| 欧美xxⅹ黑人| 亚洲伊人久久精品综合| 久久久久九九精品影院| 夜夜爽夜夜爽视频| 日韩人妻高清精品专区| 欧美另类一区| 国内精品宾馆在线| 日韩一区二区视频免费看| 国产午夜福利久久久久久| 亚洲国产精品专区欧美| 一本久久精品| 亚洲国产精品国产精品| 制服丝袜香蕉在线| 欧美少妇被猛烈插入视频| 在线 av 中文字幕| 成人欧美大片| 岛国毛片在线播放| 在线看a的网站| 久久鲁丝午夜福利片| 亚洲国产欧美在线一区| av免费观看日本| 在线看a的网站| 欧美精品人与动牲交sv欧美| 自拍偷自拍亚洲精品老妇| av福利片在线观看| 欧美高清成人免费视频www| 99re6热这里在线精品视频| 成人亚洲精品一区在线观看 | 午夜精品一区二区三区免费看| 一级毛片aaaaaa免费看小| 99久久精品一区二区三区| 国产欧美日韩精品一区二区| 免费av观看视频| 久久久久国产网址| 亚洲成色77777| 国产永久视频网站| 国产精品av视频在线免费观看| 欧美性感艳星| 国产亚洲精品久久久com| 少妇人妻精品综合一区二区| 亚洲国产精品999| 免费高清在线观看视频在线观看| av国产精品久久久久影院| 蜜桃亚洲精品一区二区三区| 波野结衣二区三区在线| 五月玫瑰六月丁香| 午夜爱爱视频在线播放| 色5月婷婷丁香| 日韩欧美精品v在线| 啦啦啦中文免费视频观看日本| 亚洲人成网站在线播| 精品酒店卫生间| 99久久精品热视频| 国内精品宾馆在线| 亚洲精品一二三| 自拍偷自拍亚洲精品老妇| 色视频在线一区二区三区| 一级av片app| 免费看光身美女| 99热国产这里只有精品6| 美女内射精品一级片tv| 亚洲av成人精品一区久久| 免费观看在线日韩| 一级毛片电影观看| 建设人人有责人人尽责人人享有的 | 久久ye,这里只有精品| 久久99热6这里只有精品| 欧美+日韩+精品| 日韩欧美精品v在线| 国产av国产精品国产| 亚洲av不卡在线观看| 99久久九九国产精品国产免费| 国内揄拍国产精品人妻在线| 色婷婷久久久亚洲欧美| 国产淫语在线视频| 日韩中字成人| 丝袜美腿在线中文| 国产 一区 欧美 日韩| 免费观看av网站的网址| 亚洲精品国产色婷婷电影| 99热这里只有是精品在线观看| 人妻一区二区av| 亚洲欧美精品专区久久| 免费观看无遮挡的男女| 久久久久久久亚洲中文字幕| 国产免费一级a男人的天堂| 国产成人福利小说| 国产一级毛片在线| 九九在线视频观看精品| 丰满乱子伦码专区| 久久久久久久大尺度免费视频| 成人免费观看视频高清| av免费在线看不卡| 国产精品一区www在线观看| 欧美高清成人免费视频www| 国产精品无大码| 亚洲国产精品成人综合色| av在线app专区| 亚洲第一区二区三区不卡| 亚洲内射少妇av| 久久久久久久久久久丰满| 亚洲国产日韩一区二区| 日本wwww免费看| 插阴视频在线观看视频| 一级毛片aaaaaa免费看小| 亚洲av中文av极速乱| 国产综合精华液| 午夜精品国产一区二区电影 | 日本av手机在线免费观看| 久久久久久久国产电影| 高清午夜精品一区二区三区| 激情五月婷婷亚洲| 国产精品久久久久久久久免| 欧美三级亚洲精品| 精品少妇久久久久久888优播| 直男gayav资源| 欧美xxⅹ黑人| 日韩强制内射视频| 99久久人妻综合| 亚洲电影在线观看av| 一边亲一边摸免费视频| 欧美3d第一页| 久久久久久久久久久免费av| 国产亚洲午夜精品一区二区久久 | 国产 一区精品| 天天躁日日操中文字幕| 免费看不卡的av| 成人黄色视频免费在线看| av在线播放精品| videos熟女内射| 永久免费av网站大全| 舔av片在线| 高清毛片免费看| 寂寞人妻少妇视频99o| 国产高清国产精品国产三级 | 国产白丝娇喘喷水9色精品| 一本色道久久久久久精品综合| 亚洲欧美一区二区三区国产| h日本视频在线播放| 大码成人一级视频| 国产精品蜜桃在线观看| 插逼视频在线观看| 一级毛片久久久久久久久女| 精品一区二区三卡| 日本与韩国留学比较| 国产精品久久久久久av不卡| 欧美潮喷喷水| 日本午夜av视频| 国产在视频线精品| 日韩欧美一区视频在线观看 | 午夜福利在线在线| 午夜福利视频1000在线观看| 日韩成人伦理影院| av又黄又爽大尺度在线免费看| 日韩一区二区三区影片| 亚洲欧美精品自产自拍| 欧美一区二区亚洲| 丝袜喷水一区| 久久99精品国语久久久| 欧美成人a在线观看| 国产探花在线观看一区二区| 亚洲熟女精品中文字幕| 中文乱码字字幕精品一区二区三区| 尾随美女入室| 国产成人91sexporn| 最近2019中文字幕mv第一页| 亚洲色图av天堂| 一级a做视频免费观看| 女的被弄到高潮叫床怎么办| 男女边摸边吃奶| 色播亚洲综合网| 亚洲在线观看片| 久久99蜜桃精品久久| 国产在视频线精品| 女人久久www免费人成看片| 日韩伦理黄色片| 国产片特级美女逼逼视频| 国产探花极品一区二区| 久久久精品94久久精品| 男女那种视频在线观看| 国产精品偷伦视频观看了| 日韩欧美精品免费久久| 搞女人的毛片| 国产欧美另类精品又又久久亚洲欧美| 一级av片app| 国产成人精品久久久久久| 国产精品女同一区二区软件| 午夜精品一区二区三区免费看| 亚洲天堂av无毛| 能在线免费看毛片的网站| 小蜜桃在线观看免费完整版高清| 美女国产视频在线观看| 超碰97精品在线观看| 免费观看在线日韩| 18禁在线无遮挡免费观看视频| 赤兔流量卡办理| 久久久成人免费电影| 韩国av在线不卡| 精品国产露脸久久av麻豆| 亚洲最大成人av| 97在线人人人人妻| av网站免费在线观看视频| 国精品久久久久久国模美| 成人美女网站在线观看视频| 国产成人91sexporn| 建设人人有责人人尽责人人享有的 | 亚洲性久久影院| 国产一区亚洲一区在线观看| 亚洲人成网站在线播| 中文字幕av成人在线电影| av在线播放精品| 亚洲av中文字字幕乱码综合| 中文精品一卡2卡3卡4更新| 中文字幕亚洲精品专区| 国产精品成人在线| 禁无遮挡网站| 内地一区二区视频在线| 三级国产精品欧美在线观看| 人人妻人人爽人人添夜夜欢视频 | 国产成人freesex在线| 色5月婷婷丁香| 久久国产乱子免费精品| 成人国产av品久久久| 国产伦理片在线播放av一区| 亚洲,欧美,日韩| 日本wwww免费看| 好男人在线观看高清免费视频| 久热这里只有精品99| 少妇丰满av| 国产在视频线精品| 国产欧美日韩精品一区二区| 欧美老熟妇乱子伦牲交| 亚洲欧美精品专区久久| 能在线免费看毛片的网站| 日韩视频在线欧美| 卡戴珊不雅视频在线播放| 简卡轻食公司| 可以在线观看毛片的网站| 26uuu在线亚洲综合色| 久久97久久精品| 亚洲av在线观看美女高潮| 久久精品人妻少妇| 午夜福利视频精品| 日韩电影二区| 深夜a级毛片| 男女啪啪激烈高潮av片| 久久久精品欧美日韩精品| 国产精品蜜桃在线观看| 久久这里有精品视频免费| 国产精品福利在线免费观看| 成人国产麻豆网| 高清欧美精品videossex| 中文字幕免费在线视频6| 欧美精品人与动牲交sv欧美| av国产精品久久久久影院| 丝瓜视频免费看黄片| 中文字幕久久专区| 涩涩av久久男人的天堂| 日本一本二区三区精品| 尾随美女入室| 1000部很黄的大片| 亚洲精品国产成人久久av| 水蜜桃什么品种好| 看免费成人av毛片| 亚洲av成人精品一二三区| 亚洲精品久久午夜乱码| 尤物成人国产欧美一区二区三区| av.在线天堂| 精品一区在线观看国产| 久久精品国产亚洲网站| 精品酒店卫生间| 国产成年人精品一区二区| 国内精品宾馆在线| 中文资源天堂在线| 日本色播在线视频| 亚洲综合精品二区| 欧美高清成人免费视频www| 免费播放大片免费观看视频在线观看| 性色avwww在线观看| 成人午夜精彩视频在线观看| 精品人妻视频免费看| 嫩草影院入口| 欧美潮喷喷水| 黄片wwwwww| 能在线免费看毛片的网站| 免费看不卡的av| 亚洲欧洲国产日韩| 色婷婷久久久亚洲欧美| 女的被弄到高潮叫床怎么办| 亚洲综合精品二区| 丝袜美腿在线中文| 又爽又黄a免费视频| 麻豆久久精品国产亚洲av| 黄色怎么调成土黄色| 欧美潮喷喷水| 日韩不卡一区二区三区视频在线| 国产人妻一区二区三区在| 九草在线视频观看| 久久久午夜欧美精品| 日韩强制内射视频| 国产精品久久久久久精品电影小说 | 人妻少妇偷人精品九色| 国产男女超爽视频在线观看| 观看美女的网站| 成人综合一区亚洲| 精华霜和精华液先用哪个| 黄色视频在线播放观看不卡| .国产精品久久| 成人国产av品久久久| 一区二区三区乱码不卡18| 国产伦理片在线播放av一区| 一级a做视频免费观看| 最近最新中文字幕大全电影3| 亚洲成人中文字幕在线播放| 亚洲精品影视一区二区三区av| 亚洲精品一二三| 精品午夜福利在线看| 99热6这里只有精品| 大陆偷拍与自拍| 久久99热这里只频精品6学生| 亚洲天堂国产精品一区在线| 2022亚洲国产成人精品| 毛片女人毛片| 女人久久www免费人成看片| 麻豆国产97在线/欧美| 亚洲不卡免费看| 神马国产精品三级电影在线观看| 免费观看的影片在线观看| 国产在线男女| 欧美日韩视频精品一区| av黄色大香蕉| 久久精品人妻少妇| 国产精品久久久久久av不卡| 中文字幕久久专区| 91aial.com中文字幕在线观看| 91久久精品国产一区二区三区| 在线观看av片永久免费下载| 一级毛片 在线播放| 成人二区视频| 国产有黄有色有爽视频| 麻豆国产97在线/欧美| 久久久a久久爽久久v久久| 久久久亚洲精品成人影院| 午夜免费鲁丝| 黄色欧美视频在线观看| 日韩中字成人| 亚洲国产精品成人综合色| 日韩成人伦理影院| a级毛片免费高清观看在线播放| 天堂网av新在线| 少妇人妻一区二区三区视频| 国产中年淑女户外野战色| 国产成人精品久久久久久| av在线播放精品| 高清视频免费观看一区二区| 一级片'在线观看视频| 伊人久久国产一区二区| 97人妻精品一区二区三区麻豆| 下体分泌物呈黄色| 亚洲av二区三区四区| 18禁在线播放成人免费| 欧美3d第一页| 国产毛片在线视频| 亚洲精品成人久久久久久| 丰满少妇做爰视频| 免费看不卡的av| 久久久久精品久久久久真实原创| 国产老妇伦熟女老妇高清| 波野结衣二区三区在线| 国产亚洲最大av| 丝袜喷水一区| 日本午夜av视频| 一级黄片播放器| 超碰av人人做人人爽久久| 国产日韩欧美亚洲二区| 久久99蜜桃精品久久| 成年人午夜在线观看视频| h日本视频在线播放| 99九九线精品视频在线观看视频| 成人美女网站在线观看视频| 又大又黄又爽视频免费| 亚洲成人一二三区av| 亚洲精品视频女| 亚洲欧美中文字幕日韩二区| 肉色欧美久久久久久久蜜桃 | 亚洲精品一区蜜桃| 91aial.com中文字幕在线观看| 熟女人妻精品中文字幕| 蜜臀久久99精品久久宅男| 日韩一区二区三区影片| 久久国产乱子免费精品| 国产乱人偷精品视频| 高清日韩中文字幕在线| 欧美97在线视频| 高清av免费在线| 成人午夜精彩视频在线观看| 天美传媒精品一区二区| 成人亚洲欧美一区二区av| 久久久久九九精品影院| 久久久亚洲精品成人影院| 麻豆精品久久久久久蜜桃| 亚洲精品日韩av片在线观看| 日日啪夜夜爽| 一级片'在线观看视频| 国产精品国产av在线观看| 在线观看国产h片| 欧美激情国产日韩精品一区| 亚洲高清免费不卡视频| 午夜福利网站1000一区二区三区| 久久人人爽人人片av| 日本色播在线视频| videos熟女内射| 国产国拍精品亚洲av在线观看| 日韩欧美一区视频在线观看 | 精品久久久久久久久av| 麻豆成人av视频| 免费观看无遮挡的男女| 午夜福利在线观看免费完整高清在| 精品人妻熟女av久视频| 深夜a级毛片| 国产在线一区二区三区精| 大码成人一级视频| 欧美老熟妇乱子伦牲交| 毛片一级片免费看久久久久| 亚洲国产高清在线一区二区三| 午夜爱爱视频在线播放| 少妇人妻一区二区三区视频| 中文字幕人妻熟人妻熟丝袜美| 大码成人一级视频| 日日摸夜夜添夜夜添av毛片| av国产精品久久久久影院| 最近中文字幕2019免费版| 男插女下体视频免费在线播放| 久久久久久久久久人人人人人人| 国产成人a∨麻豆精品| 国产白丝娇喘喷水9色精品| 亚洲av一区综合| 久热这里只有精品99| 成人特级av手机在线观看| 成人一区二区视频在线观看| 免费人成在线观看视频色| av专区在线播放| 国产男人的电影天堂91| av在线老鸭窝| 国产精品久久久久久精品电影| av线在线观看网站| 在线看a的网站| 亚洲成人久久爱视频| 亚洲精品乱码久久久久久按摩| 国产片特级美女逼逼视频| 免费观看av网站的网址| 一区二区三区乱码不卡18| 欧美三级亚洲精品| 国产成人福利小说| 亚洲精品一区蜜桃| 边亲边吃奶的免费视频| 精品人妻熟女av久视频| 亚洲一区二区三区欧美精品 | av在线亚洲专区| 色视频在线一区二区三区| 亚洲欧美成人精品一区二区| 日韩强制内射视频| 可以在线观看毛片的网站| 国产av不卡久久| 国产成人a区在线观看| 久久久国产一区二区| 成人一区二区视频在线观看| 2018国产大陆天天弄谢| 欧美97在线视频| 国产精品三级大全| 午夜视频国产福利| 国国产精品蜜臀av免费| 欧美变态另类bdsm刘玥| 夫妻午夜视频| 精品视频人人做人人爽| 大片电影免费在线观看免费| 99热这里只有精品一区| 亚洲自拍偷在线| 国产精品一二三区在线看| 只有这里有精品99| 人妻系列 视频| 汤姆久久久久久久影院中文字幕| 午夜激情福利司机影院| 亚洲精品亚洲一区二区| 国产中年淑女户外野战色| 国产精品国产三级专区第一集| 国产精品国产三级国产专区5o| 日本与韩国留学比较| 国产精品伦人一区二区| 美女主播在线视频| 成人亚洲精品av一区二区| 精华霜和精华液先用哪个| 亚洲国产成人一精品久久久| 男女下面进入的视频免费午夜| 久久久国产一区二区| 秋霞伦理黄片| 久久精品综合一区二区三区| 日韩视频在线欧美| 九色成人免费人妻av| 秋霞伦理黄片| 我要看日韩黄色一级片| 不卡视频在线观看欧美| 国精品久久久久久国模美| 成年版毛片免费区| 嫩草影院新地址| 身体一侧抽搐| 欧美极品一区二区三区四区| 精品久久国产蜜桃| 成人免费观看视频高清| 最近的中文字幕免费完整| 日本wwww免费看| 午夜免费男女啪啪视频观看| 丰满少妇做爰视频| 久久99蜜桃精品久久| 男女那种视频在线观看| 深爱激情五月婷婷| 亚洲欧美一区二区三区黑人 | 51国产日韩欧美| 精品国产三级普通话版| 久久精品熟女亚洲av麻豆精品| 欧美zozozo另类| 天天躁夜夜躁狠狠久久av| 99久久人妻综合| 嫩草影院精品99| 大陆偷拍与自拍| 国产亚洲一区二区精品| av又黄又爽大尺度在线免费看| 天天一区二区日本电影三级| 国产人妻一区二区三区在| 亚洲欧洲国产日韩| 97超碰精品成人国产| 亚洲va在线va天堂va国产| 中文欧美无线码| 亚洲人成网站高清观看| 亚洲,一卡二卡三卡| 国内少妇人妻偷人精品xxx网站| 丝瓜视频免费看黄片| 激情 狠狠 欧美| 精品国产一区二区三区久久久樱花 | 丝袜美腿在线中文| 亚洲激情五月婷婷啪啪| av黄色大香蕉| 少妇裸体淫交视频免费看高清| 亚洲欧美精品自产自拍| 在线亚洲精品国产二区图片欧美 | 国产毛片a区久久久久| 人妻少妇偷人精品九色| 亚洲伊人久久精品综合| 又黄又爽又刺激的免费视频.| 免费观看性生交大片5| 欧美精品一区二区大全| 成年av动漫网址| 我要看日韩黄色一级片| 亚洲欧美精品自产自拍| 免费黄网站久久成人精品| 成人特级av手机在线观看| 插逼视频在线观看| 如何舔出高潮| av一本久久久久| 亚洲电影在线观看av| 中文字幕亚洲精品专区| 国产视频首页在线观看| 精品国产露脸久久av麻豆| 男人狂女人下面高潮的视频| 色哟哟·www| 久久久久久久久久人人人人人人| 热re99久久精品国产66热6| 免费av毛片视频| 国产毛片在线视频| 久久久久精品性色| 欧美日韩在线观看h| 高清在线视频一区二区三区| 一级a做视频免费观看| 内射极品少妇av片p| 寂寞人妻少妇视频99o| 水蜜桃什么品种好| 日本色播在线视频| av黄色大香蕉| 欧美另类一区| 99久久九九国产精品国产免费| 能在线免费看毛片的网站| 成人毛片60女人毛片免费| 免费黄色在线免费观看| 99热国产这里只有精品6| 一级爰片在线观看| 青春草亚洲视频在线观看| 免费大片黄手机在线观看| 男插女下体视频免费在线播放|