• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于中英平行專利語(yǔ)料的短語(yǔ)復(fù)述自動(dòng)抽取研究

    2013-10-15 01:52:16劉知遠(yuǎn)孫茂松
    中文信息學(xué)報(bào) 2013年6期
    關(guān)鍵詞:組塊語(yǔ)料排序

    李 莉,劉知遠(yuǎn),孫茂松

    (清華大學(xué) 計(jì)算機(jī)系,智能技術(shù)與系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室;清華信息科學(xué)與技術(shù)國(guó)家實(shí)驗(yàn)室(籌),北京100084)

    1 引言

    專利語(yǔ)料是人類知識(shí)和技術(shù)的載體,信息量豐富,與專利語(yǔ)料相關(guān)的自然語(yǔ)言處理研究,包括長(zhǎng)句分割[1]、語(yǔ)義分詞[2-3]、翻譯對(duì)獲?。?]和分布相似度計(jì)算[5]等,已引起學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注。其中,短語(yǔ)復(fù)述自動(dòng)抽取是自然語(yǔ)言處理領(lǐng)域的重要研究課題之一,目前已經(jīng)被成功應(yīng)用到信息檢索、自動(dòng)問答、信息抽取、自動(dòng)文摘和機(jī)器翻譯等多個(gè)自然語(yǔ)言處理研究領(lǐng)域[6]。因而,本文希望展開基于中英平行專利語(yǔ)料的短語(yǔ)復(fù)述自動(dòng)抽取研究。

    復(fù)述,其英文名稱是paraphrase,有些學(xué)者也將其翻譯為改寫,對(duì)應(yīng)的名詞解釋是“解釋,釋義等”[6]。關(guān)于復(fù)述的具體定義,最早可追溯到20世紀(jì)80年代語(yǔ)言學(xué)家De Beaugrande等人曾給出的具體定義[7]。在自然語(yǔ)言處理領(lǐng)域,“復(fù)述”研究的主要是“短語(yǔ)以上,句子以下”的語(yǔ)言單元的同義現(xiàn)象[6]。Bazilay等人根據(jù)研究的語(yǔ)言單元粒度,將復(fù)述具體分為詞匯級(jí)、短語(yǔ)級(jí)和句子級(jí)三類[8]。本文重點(diǎn)關(guān)注短語(yǔ)級(jí)復(fù)述的自動(dòng)抽取。

    本文利用基于統(tǒng)計(jì)機(jī)器翻譯的復(fù)述抽取技術(shù)[9]實(shí)現(xiàn)中英平行專利語(yǔ)料的短語(yǔ)復(fù)述自動(dòng)抽取。該方法的基本思想是將對(duì)齊到同一目標(biāo)語(yǔ)言短語(yǔ)的兩個(gè)源語(yǔ)言短語(yǔ)視為互為短語(yǔ)復(fù)述。該方法的主要優(yōu)點(diǎn)是基于目前互聯(lián)網(wǎng)上大量存在的雙語(yǔ)平行語(yǔ)料,可以同時(shí)實(shí)現(xiàn)雙語(yǔ)短語(yǔ)復(fù)述自動(dòng)抽取。例如,對(duì)于我們的中英平行專利語(yǔ)料,清華大學(xué)計(jì)算機(jī)系可以同時(shí)實(shí)現(xiàn)中文短語(yǔ)復(fù)述自動(dòng)抽取和英文短語(yǔ)復(fù)述自動(dòng)抽取。同時(shí),該方法由于是基于短語(yǔ)的統(tǒng)計(jì)機(jī)器翻譯模型的擴(kuò)展,天然適用于短語(yǔ)級(jí)復(fù)述自動(dòng)抽取任務(wù)。但是,該方法也存在以下兩點(diǎn)不足之處。1)該方法依賴基于短語(yǔ)的統(tǒng)計(jì)機(jī)器翻譯,但目前基于短語(yǔ)的統(tǒng)計(jì)機(jī)器翻譯模型中的短語(yǔ)并不是語(yǔ)言學(xué)意義上的短語(yǔ)概念[10],因而抽取的短語(yǔ)復(fù)述中存在大量非語(yǔ)言單元,例如,“network device is”和“網(wǎng)絡(luò)設(shè)備為”等;2)該方法會(huì)受到對(duì)齊錯(cuò)誤和翻譯歧義的限制,經(jīng)常無法區(qū)分短語(yǔ)復(fù)述的抽取質(zhì)量[11]。

    針對(duì)該方法的兩點(diǎn)不足,我們分別引入基于組塊分析的過濾技術(shù)和基于分布相似度的重排序技術(shù)來改進(jìn)。組塊 (Chunk)是一種高于詞序列,低于短語(yǔ)的語(yǔ)法結(jié)構(gòu)[12]。組塊分析即將輸入句子中的所有詞都劃分到若干相應(yīng)的組塊中[13]。本文通過對(duì)中、英文專利語(yǔ)料分別進(jìn)行組塊分析,構(gòu)建中、英專利組塊表,并基于這兩個(gè)組塊表過濾短語(yǔ)復(fù)述結(jié)果中的非語(yǔ)言單元,提高短語(yǔ)復(fù)述抽取的準(zhǔn)確率。而為了解決第二個(gè)問題,我們利用分布相似度對(duì)抽取的短語(yǔ)復(fù)述結(jié)果重排序。基于分布相似度進(jìn)行復(fù)述抽取也是短語(yǔ)復(fù)述抽取的常用方法之一,基本思想是認(rèn)為出現(xiàn)在相同或相似上下文的兩個(gè)短語(yǔ)傾向于互為短語(yǔ)復(fù)述[14]。該方法借助大規(guī)模語(yǔ)料,可以較好區(qū)分短語(yǔ)復(fù)述的抽取質(zhì)量,但是卻容易將反義短語(yǔ)誤判定為復(fù)述結(jié)果[15]。幸運(yùn)的是,基于統(tǒng)計(jì)機(jī)器翻譯的方法得到的候選結(jié)果中較少包含反義短語(yǔ)[11]。因而基于分布相似度對(duì)候選短語(yǔ)復(fù)述結(jié)果重排序,在解決基于統(tǒng)計(jì)機(jī)器翻譯的方法無法區(qū)分短語(yǔ)復(fù)述的抽取質(zhì)量的不足的同時(shí),也回避了自身容易將反義短語(yǔ)誤判定為復(fù)述結(jié)果的不足。所以,本文基于分布相似度對(duì)短語(yǔ)復(fù)述結(jié)果重排序,以改進(jìn)基于統(tǒng)計(jì)機(jī)器翻譯的方法經(jīng)常無法區(qū)分短語(yǔ)復(fù)述的抽取質(zhì)量的不足。

    文章接下來的組織結(jié)構(gòu)如下:第2節(jié)介紹算法設(shè)計(jì);第3節(jié)介紹實(shí)驗(yàn)設(shè)計(jì);第4節(jié)介紹實(shí)驗(yàn)結(jié)果,第5節(jié)介紹相關(guān)工作,最后進(jìn)行總結(jié)。

    2 短語(yǔ)復(fù)述自動(dòng)抽取算法

    本文基于中英平行專利語(yǔ)料實(shí)現(xiàn)短語(yǔ)復(fù)述自動(dòng)抽取的算法流程如圖1所示。首先借助基于統(tǒng)計(jì)機(jī)器翻譯的短語(yǔ)復(fù)述抽取技術(shù),實(shí)現(xiàn)短語(yǔ)復(fù)述候選結(jié)果抽取,然后利用組塊分析技術(shù)過濾候選結(jié)果中的非語(yǔ)言單元。最后,基于分布相似度對(duì)過濾后的短語(yǔ)復(fù)述結(jié)果重排序,以解決對(duì)齊錯(cuò)誤和翻譯歧義引起的錯(cuò)誤。下面逐一介紹各流程的基本思想。

    圖1 算法流程圖

    2.1 基于統(tǒng)計(jì)機(jī)器翻譯的短語(yǔ)復(fù)述自動(dòng)抽取

    基于統(tǒng)計(jì)機(jī)器翻譯的短語(yǔ)復(fù)述自動(dòng)抽取技術(shù)是基于短語(yǔ)的統(tǒng)計(jì)機(jī)器翻譯模型[16]的擴(kuò)展,該方法的核心思想是將雙語(yǔ)平行語(yǔ)料進(jìn)行短語(yǔ)對(duì)齊后,將對(duì)齊到目標(biāo)語(yǔ)言(如英語(yǔ))下相同短語(yǔ)的源語(yǔ)言(如中文)下不同的短語(yǔ)視為互為短語(yǔ)復(fù)述。例如,圖2所示的例子,在該思想的引導(dǎo)下會(huì)將“網(wǎng)絡(luò)裝置”和“網(wǎng)絡(luò)設(shè)備”作為一對(duì)中文短語(yǔ)復(fù)述抽取出來。考慮到該方法包括短語(yǔ)對(duì)齊和復(fù)述抽取,下面依次介紹。

    圖2 基于雙語(yǔ)平行語(yǔ)料抽取短語(yǔ)復(fù)述

    2.1.1 短語(yǔ)對(duì)齊

    最早的統(tǒng)計(jì)機(jī)器翻譯模型是基于詞的[17]。在基于詞的統(tǒng)計(jì)機(jī)器翻譯模型下,一個(gè)源語(yǔ)言句子e翻譯為目標(biāo)語(yǔ)言句子f的翻譯概率是通過將所有可能的詞對(duì)齊(a,alignment首字母)條件下句對(duì)的翻譯概率疊加計(jì)算的。具體如公式(1)所示。

    隨著統(tǒng)計(jì)機(jī)器翻譯的發(fā)展,句子之間的翻譯概率逐漸使用更大的對(duì)齊文本塊(如短語(yǔ),這里的短語(yǔ)僅僅指詞序列,而不是語(yǔ)言學(xué)意義上的短語(yǔ))來進(jìn)行計(jì)算,其中基于對(duì)齊短語(yǔ)計(jì)算句對(duì)翻譯概率的統(tǒng)計(jì)機(jī)器翻譯模型即為基于短語(yǔ)的統(tǒng)計(jì)機(jī)器翻譯模型,也是目前主流的統(tǒng)計(jì)機(jī)器翻譯模型之一。實(shí)際上,基于短語(yǔ)的統(tǒng)計(jì)機(jī)器翻譯模型中的短語(yǔ)對(duì)齊也是基于詞對(duì)齊實(shí)現(xiàn)的,其基本思想是遞歸地將句對(duì)中詞對(duì)齊點(diǎn)相鄰的詞序列作為短語(yǔ)對(duì)齊結(jié)果[18]。例如,圖2所示的例子,因?yàn)樵~對(duì)齊點(diǎn)相鄰,會(huì)將“網(wǎng)絡(luò)設(shè)備”和“network device”作為一對(duì)短語(yǔ)對(duì)齊結(jié)果。類似地,“網(wǎng)絡(luò)設(shè)備為”和“network device is”也會(huì)被作為一對(duì)短語(yǔ)對(duì)齊結(jié)果?;诙陶Z(yǔ)對(duì)齊結(jié)果,可以很方便地實(shí)現(xiàn)雙語(yǔ)短語(yǔ)對(duì)抽取從而獲得短語(yǔ)表以用于下面的復(fù)述抽取。

    2.1.2 復(fù)述抽取

    基于統(tǒng)計(jì)機(jī)器翻譯的短語(yǔ)復(fù)述自動(dòng)抽取技術(shù)本質(zhì)上是將目標(biāo)語(yǔ)言的短語(yǔ)作為錨點(diǎn),找到短語(yǔ)對(duì)齊結(jié)果中與該錨點(diǎn)對(duì)齊的所有源語(yǔ)言短語(yǔ)作為候選復(fù)述結(jié)果。為了計(jì)算各個(gè)候選復(fù)述結(jié)果的概率值,Chris等人引入p(e2|e1)表示短語(yǔ)對(duì)<e1,e2>互為復(fù)述的概率,引入p(e|f)表示目標(biāo)語(yǔ)言短語(yǔ)f翻譯到源語(yǔ)言短語(yǔ)e的翻譯概率,反過來即為p(f|e)。之后Chris等人通過將所有錨點(diǎn)對(duì)應(yīng)的翻譯概率疊加計(jì)算短語(yǔ)對(duì)互為復(fù)述的概率,并挑選對(duì)應(yīng)概率值最大的短語(yǔ)e2作為e1的短語(yǔ)復(fù)述結(jié)果抽出。具體計(jì)算公式如式(2)所示:

    其中短語(yǔ)對(duì)翻譯概率p(e|f)基于最大似然概率計(jì)算,如式(3)所示。

    引言部分提到,因?yàn)榛诙陶Z(yǔ)的統(tǒng)計(jì)機(jī)器翻譯模型中的短語(yǔ)并不是源自任何深層次語(yǔ)言知識(shí)的短語(yǔ)概念,即并不一定是嚴(yán)格語(yǔ)言學(xué)意義的短語(yǔ)。例如,從圖2例子得到的短語(yǔ)“網(wǎng)絡(luò)設(shè)備為”和“network device is”,這樣就導(dǎo)致了我們基于統(tǒng)計(jì)機(jī)器翻譯進(jìn)行短語(yǔ)復(fù)述抽取得到的候選結(jié)果中,包含著大量非語(yǔ)言單元。所以,我們期望通過基于組塊分析的技術(shù)過濾其中的非語(yǔ)言單元。下面具體介紹。

    2.2 基于組塊分析過濾短語(yǔ)復(fù)述抽取結(jié)果

    組塊是一種語(yǔ)法結(jié)構(gòu),是符合一定語(yǔ)法功能的非遞歸短語(yǔ),任何一種組塊內(nèi)部都不包含其他類型的組塊[13]。例如,“網(wǎng)絡(luò)設(shè)備”就是一個(gè)名詞組塊。而組塊分析即將一段輸入文本劃分成一組互不重疊、非遞歸的組塊片段[19]。

    本文中,我們希望基于組塊分析技術(shù),限制抽取的短語(yǔ)復(fù)述結(jié)果是語(yǔ)言單元,而不僅僅是詞序列。即我們期望通過中、英組塊分析工具分別得到中文組塊列表和英文組塊列表,然后通過這兩個(gè)列表對(duì)上一步得到的短語(yǔ)復(fù)述結(jié)果進(jìn)行確認(rèn),僅僅保留在這兩個(gè)組塊列表中出現(xiàn)的短語(yǔ)復(fù)述結(jié)果。

    2.3 基于分布相似度重排序短語(yǔ)復(fù)述抽取結(jié)果

    引言部分提到,基于統(tǒng)計(jì)機(jī)器翻譯的短語(yǔ)復(fù)述抽取受限于對(duì)齊錯(cuò)誤和翻譯歧義,有時(shí)并不能很好的區(qū)分好、壞復(fù)述。特別在應(yīng)用于中英平行專利語(yǔ)料時(shí),翻譯歧義造成的中文短語(yǔ)復(fù)述抽取錯(cuò)誤比較明顯。例如,因?yàn)椤俺绦颉焙汀肮?jié)目”都被翻譯為“program”,導(dǎo)致“程序類型”和“節(jié)目類型”被作為一對(duì)短語(yǔ)復(fù)述抽取出來。為了消除翻譯歧義和對(duì)齊錯(cuò)誤等造成的影響,我們基于分布相似度對(duì)上一步過濾后的短語(yǔ)復(fù)述抽取結(jié)果進(jìn)行重排序以優(yōu)化短語(yǔ)復(fù)述抽取結(jié)果。

    基于分布相似度進(jìn)行短語(yǔ)復(fù)述抽取的基本思想是將上下文分布相同或相似的短語(yǔ)作為短語(yǔ)復(fù)述結(jié)果抽出。目前比較常用的分布相似度計(jì)算方法包括詞袋方法(bag-of-words approach)和上下文窗口(context window approach)方法等[20]。這兩種方法的基本思想都是計(jì)算短語(yǔ)的上下文矩陣,然后通過余弦相似度計(jì)算對(duì)應(yīng)上下文矩陣的相似度作為兩個(gè)短語(yǔ)的分布相似度。其中,詞袋方法對(duì)于每個(gè)短語(yǔ)p,收集以p為中心的上下文窗口中的每個(gè)詞,并將這些詞的頻度加入上下文矩陣。而上下文窗口方法則收集每個(gè)以p為中心的上下文窗口,并將這些上下文窗口的頻度加入上下文矩陣??紤]到上下文窗口方法更適用于海量語(yǔ)料,而我們是基于已有的中英平行專利語(yǔ)料計(jì)算短語(yǔ)復(fù)述的分布相似度,所以我們選擇詞袋方法,并基于該分布相似度對(duì)短語(yǔ)復(fù)述抽取結(jié)果進(jìn)行重排序。

    3 實(shí)驗(yàn)設(shè)計(jì)

    本文中,我們基于的中英平行專利語(yǔ)料包含5 867組中英平行專利文檔,每組包括一篇中文專利文檔和對(duì)應(yīng)的英文專利文檔。我們利用句子對(duì)齊工具[21]從中抽取中英平行句對(duì)252 790對(duì),并從中隨機(jī)抽取了46 543對(duì)句對(duì)進(jìn)行人工檢驗(yàn),得到對(duì)齊準(zhǔn)確率達(dá)到98.4%。

    下面我們按照?qǐng)D1所示的算法流程依次介紹我們具體的實(shí)驗(yàn)設(shè)計(jì)。

    3.1 基于統(tǒng)計(jì)機(jī)器翻譯的短語(yǔ)復(fù)述自動(dòng)抽取

    我們借助基于短語(yǔ)的統(tǒng)計(jì)機(jī)器翻譯開源工具M(jìn)oses[22]實(shí)現(xiàn)短語(yǔ)對(duì)齊和雙語(yǔ)短語(yǔ)對(duì)抽取,得到包含9 933 939對(duì)雙語(yǔ)短語(yǔ)對(duì)的短語(yǔ)表。正如前文提到的,這一步我們抽取得到的短語(yǔ)表中大部分是無意義的詞序列 (其中大量詞序列甚至包括標(biāo)點(diǎn)符號(hào)),而不是實(shí)際語(yǔ)言學(xué)意義上的短語(yǔ)。這些詞序列的存在不僅對(duì)于短語(yǔ)復(fù)述抽取無意義,而且增加了計(jì)算復(fù)雜度。所以在基于式(2)和式(3)進(jìn)行短語(yǔ)復(fù)述抽取之前,我們基于簡(jiǎn)單規(guī)則對(duì)短語(yǔ)表進(jìn)行過濾。我們定義的過濾規(guī)則如下:1)過濾短語(yǔ)表中包含中英標(biāo)點(diǎn)符號(hào)的短語(yǔ)對(duì);2)過濾短語(yǔ)表中在中文部分包含數(shù)字、英文字符的短語(yǔ)對(duì);

    3)過濾短語(yǔ)表中在英文部分包含非英文字符的短語(yǔ)對(duì);

    4)將中文部分相同,英文部分在忽略大小寫時(shí)相同的短語(yǔ)對(duì)合并。

    經(jīng)過這一步簡(jiǎn)單的基于規(guī)則過濾,我們保留下來的短語(yǔ)表僅包含2 850 237對(duì)雙語(yǔ)短語(yǔ)對(duì),規(guī)模約為原來短語(yǔ)表的28.69%。

    之后,我們通過式(2)和式(3),利用基于統(tǒng)計(jì)機(jī)器翻譯的短語(yǔ)復(fù)述抽取技術(shù),分別實(shí)現(xiàn)中文短語(yǔ)復(fù)述自動(dòng)抽取和英文短語(yǔ)復(fù)述自動(dòng)抽取。

    3.2 基于組塊分析技術(shù)過濾非語(yǔ)言單元

    因?yàn)榛诙陶Z(yǔ)的統(tǒng)計(jì)機(jī)器翻譯模型中的短語(yǔ)概念并不是實(shí)際語(yǔ)言學(xué)意義上的短語(yǔ),更多的是無意義的詞序列,而簡(jiǎn)單的基于規(guī)則過濾并不能保證保留下來的短語(yǔ)是語(yǔ)言學(xué)意義上的短語(yǔ)。所以,我們接下來基于組塊分析技術(shù)過濾中英短語(yǔ)復(fù)述結(jié)果中的非語(yǔ)言單元。

    在這一步驟中,我們使用CRFTagger[23]對(duì)英文專利語(yǔ)料進(jìn)行詞性標(biāo)注,使用THULAC[24]對(duì)中文專利語(yǔ)料進(jìn)行分詞和詞性標(biāo)注。對(duì)英文專利語(yǔ)料我們借助開源工具CRFChunk[25]進(jìn)行組塊分析,而對(duì)于中文專利語(yǔ)料,我們基于CRF模型,借助清華中文樹庫(kù)(Tsinghua Chinese Treebank)[26]訓(xùn)練了一個(gè)中文組塊分析器,并在清華中文樹庫(kù)上檢驗(yàn)了該分析器的效果,如表1所示??梢钥吹?,我們?cè)O(shè)計(jì)的中文組塊分析器在組塊識(shí)別上F1值基本都在85%以上,效果較好。

    我們通過中、英組塊分析工具分別得到中文組塊列表和英文組塊列表,然后通過這兩個(gè)列表對(duì)上一步得到的短語(yǔ)復(fù)述結(jié)果進(jìn)行確認(rèn),僅僅保留在這兩個(gè)組塊列表中出現(xiàn)的短語(yǔ)復(fù)述結(jié)果。

    表1 中文組塊分析器在清華中文樹庫(kù)評(píng)測(cè)效果

    3.3 基于分布相似度重排序短語(yǔ)復(fù)述抽取結(jié)果

    考慮到基于統(tǒng)計(jì)機(jī)器翻譯的短語(yǔ)復(fù)述抽取受限于對(duì)齊錯(cuò)誤和翻譯歧義,有時(shí)并不能很好地區(qū)分短語(yǔ)復(fù)述質(zhì)量。特別在應(yīng)用于中英平行專利語(yǔ)料時(shí),翻譯歧義造成的中文短語(yǔ)復(fù)述抽取錯(cuò)誤比較明顯。所以我們基于現(xiàn)有的中英平行專利語(yǔ)料,借助分布相似度中的詞袋方法對(duì)上一步過濾后的短語(yǔ)復(fù)述抽取結(jié)果進(jìn)行重排序。在具體實(shí)驗(yàn)中,我們重點(diǎn)關(guān)注中文短語(yǔ)復(fù)述抽取,并對(duì)比分析了不同上下文窗口大小時(shí)重排序的效果。具體見實(shí)驗(yàn)結(jié)果部分。

    4 實(shí)驗(yàn)結(jié)果

    為了驗(yàn)證基于統(tǒng)計(jì)機(jī)器翻譯的短語(yǔ)復(fù)述抽取,以及后面的兩個(gè)改進(jìn)策略(包括基于組塊分析的過濾技術(shù)以及基于分布相似度的重排序技術(shù))的效果。我們對(duì)排名前500的短語(yǔ)復(fù)述結(jié)果進(jìn)行人工標(biāo)注。以“E”標(biāo)注對(duì)應(yīng)的短語(yǔ)復(fù)述結(jié)果并不是語(yǔ)言學(xué)意義上的短語(yǔ);以“N”標(biāo)注雖然對(duì)應(yīng)的短語(yǔ)復(fù)述結(jié)果是語(yǔ)言學(xué)意義上的短語(yǔ),但是兩個(gè)短語(yǔ)并不互為復(fù)述;以“Y”標(biāo)注正確的短語(yǔ)復(fù)述結(jié)果。

    我們分別統(tǒng)計(jì)了基于統(tǒng)計(jì)機(jī)器翻譯的短語(yǔ)復(fù)述抽取和兩個(gè)改進(jìn)策略在前500個(gè)結(jié)果中的Precision、Recall和F1值。需要特別說明的是Recall值的計(jì)算,因?yàn)楹茈y計(jì)算準(zhǔn)確的Recall值,所以我們基于Pooling[27]方法。即我們將3個(gè)方法對(duì)應(yīng)的前500個(gè)結(jié)果中的所有正確結(jié)果作為結(jié)果池 (pool),然后基于這個(gè)結(jié)果池統(tǒng)計(jì)每個(gè)方法對(duì)應(yīng)的Recall值。下面我們依次分析兩個(gè)改進(jìn)策略的表現(xiàn)。

    4.1 基于組塊分析過濾非語(yǔ)言單元

    表2和表3分別展現(xiàn)了中文短語(yǔ)復(fù)述抽取結(jié)果的準(zhǔn)確率和英文短語(yǔ)復(fù)述抽取結(jié)果的準(zhǔn)確率??梢钥吹?,基于統(tǒng)計(jì)機(jī)器翻譯的短語(yǔ)復(fù)述抽取技術(shù)(表中簡(jiǎn)稱為復(fù)述抽?。┰谥?、英文上的準(zhǔn)確率分別為43.20%和43.60%,而經(jīng)過基于組塊分析過濾非語(yǔ)言單元(表中簡(jiǎn)稱為組塊過濾)后,準(zhǔn)確率分別上升至75.00%和52.40%,準(zhǔn)確率均有大幅提升,由此驗(yàn)證了基于組塊分析過濾非語(yǔ)言單元確實(shí)能夠改進(jìn)基于統(tǒng)計(jì)機(jī)器翻譯的短語(yǔ)復(fù)述抽取效果。這一點(diǎn)也可以通過改進(jìn)前后標(biāo)注為“E”的結(jié)果數(shù)大幅減少看出。

    表2 中文短語(yǔ)復(fù)述抽取結(jié)果人工評(píng)測(cè)(前500)

    表3 英文短語(yǔ)復(fù)述抽取結(jié)果人工評(píng)測(cè)(前500)

    但是,我們同時(shí)注意到,基于組塊分析過濾非語(yǔ)言單元的改進(jìn)策略在中文上的表現(xiàn)要優(yōu)于英文。關(guān)于這點(diǎn),我們經(jīng)過分析數(shù)據(jù)發(fā)現(xiàn),拼寫錯(cuò)誤以及英文語(yǔ)言環(huán)境中豐富的詞性變化是錯(cuò)誤率較高的原因之一。如“filer coefficients”和“filter coefficients”被作為一對(duì)短語(yǔ)復(fù)述抽取出來,但是其實(shí)前者是后者的錯(cuò)誤拼寫之一。再比如,雖然“alteration”和“modified”都是“改變”的意思,但是因?yàn)樵~性不同,并不能作為一對(duì)短語(yǔ)復(fù)述結(jié)果。而中文語(yǔ)言環(huán)境中幾乎不存在這樣的拼寫錯(cuò)誤、詞性變化,所以基于組塊分析過濾非語(yǔ)言單元的改進(jìn)策略在中文上的表現(xiàn)要優(yōu)于英文。

    4.2 基于分布相似度重排序短語(yǔ)復(fù)述結(jié)果

    考慮到該改進(jìn)策略在英文短語(yǔ)復(fù)述抽取中的有效性已經(jīng)被Chan等研究者證明[11]。下面我們重點(diǎn)分析該改進(jìn)策略在中文短語(yǔ)復(fù)述抽取上的效果。

    我們選用詞袋方法(表中簡(jiǎn)記為Bow)對(duì)4.1改進(jìn)后的前500個(gè)復(fù)述抽取結(jié)果進(jìn)行重排序,并對(duì)比分析不同上下文窗口大小時(shí)該改進(jìn)策略的效果。我們依次統(tǒng)計(jì)重排序前后短語(yǔ)復(fù)述抽取結(jié)果Top100、Top200、Top300、Top400的對(duì)應(yīng)的Precision、Recall和F1值,并在圖3中展示 (重排序技術(shù)并不會(huì)影響Top500對(duì)應(yīng)的準(zhǔn)確率)。圖3中Baseline是重排序前的準(zhǔn)確率,而BowN是利用上下文窗口大小為N時(shí)的詞袋方法重排序后的準(zhǔn)確率。

    從圖3中Precision、Recall和F1值的對(duì)比中,我們可以明顯看到利用分布相似度對(duì)短語(yǔ)復(fù)述結(jié)果重排序改進(jìn)了抽取效果。同時(shí),從Precision值的對(duì)比中可以較明顯的看到上下文窗口大小較小時(shí)的改進(jìn)效果要優(yōu)于上下文窗口大小較大時(shí)的改進(jìn)效果。我們猜測(cè)是因?yàn)楫?dāng)選定的上下文窗口大小較大時(shí),模糊了不互為短語(yǔ)復(fù)述的兩個(gè)短語(yǔ)的相似度差值。

    圖3 不同上下文窗口大小下基于分布相似度重排序短語(yǔ)復(fù)述結(jié)果的效果

    5 相關(guān)工作

    目前復(fù)述抽取的相關(guān)工作主要分為四大類,包括基于已有語(yǔ)言標(biāo)注資源 (如 WordNet[28]、How-Net[29]等)的復(fù)述抽?。?0-32];基于分布相似度的復(fù)述抽?。?3-34];基于譯文語(yǔ)料的復(fù)述抽?。?,35]和基于統(tǒng)計(jì)機(jī)器翻譯的復(fù)述抽?。?]。

    基于現(xiàn)有語(yǔ)言學(xué)資源的復(fù)述抽取精度較高,但是受到現(xiàn)有語(yǔ)言學(xué)資源的規(guī)模、主題甚至語(yǔ)言的限制,而且比較適用于詞匯級(jí)復(fù)述自動(dòng)抽取任務(wù)。

    基于分布相似度的復(fù)述抽取利用了目前海量的互聯(lián)網(wǎng)語(yǔ)料資源,計(jì)算方便直觀,但是缺點(diǎn)是容易將反義詞或反義短語(yǔ)作為復(fù)述結(jié)果抽取出來。

    基于譯文語(yǔ)料的復(fù)述抽取借助目前網(wǎng)絡(luò)存在的關(guān)于具體文章的多種譯文版本,通過句子對(duì)齊工具構(gòu)建復(fù)述抽取語(yǔ)料,之后借助上下文模版實(shí)現(xiàn)復(fù)述自動(dòng)抽取。該方法精度較高,同時(shí)適用于詞匯級(jí)、短語(yǔ)級(jí)和句子級(jí)復(fù)述自動(dòng)抽取,但是受限于譯文資源較少,對(duì)于缺乏多版本譯文資源的專利領(lǐng)域難以開展。

    基于統(tǒng)計(jì)機(jī)器翻譯的復(fù)述抽取基本思想是將目標(biāo)語(yǔ)言的短語(yǔ)視為錨,將對(duì)齊到同一錨的兩個(gè)源語(yǔ)言短語(yǔ)視為短語(yǔ)復(fù)述結(jié)果。該方法依賴基于短語(yǔ)的統(tǒng)計(jì)機(jī)器翻譯模型中的短語(yǔ)對(duì)齊和短語(yǔ)對(duì)抽取技術(shù),優(yōu)點(diǎn)包括1)對(duì)于每個(gè)短語(yǔ)都提供了可能的復(fù)述列表并且包含相應(yīng)的概率值,這樣在具體的任務(wù)中,用戶可以根據(jù)具體上下文選擇最合適的短語(yǔ)復(fù)述;2)該方法天然適用于短語(yǔ)級(jí)復(fù)述自動(dòng)抽?。?)該方法適用于任何雙語(yǔ)或多語(yǔ)平行語(yǔ)料,對(duì)于語(yǔ)料資源限制極少。但是,該方法也有著自己的不足之處,包括以下兩點(diǎn):1)其中的短語(yǔ)概念并不是嚴(yán)格語(yǔ)言學(xué)意義上的短語(yǔ)概念,大部分是無意義的詞序列,這樣就導(dǎo)致抽取的短語(yǔ)復(fù)述中存在大量非語(yǔ)言單元;2)該方法因?yàn)槭芟抻趯?duì)齊錯(cuò)誤和翻譯歧義,因此有些時(shí)候并不能很好地區(qū)分好、壞短語(yǔ)復(fù)述。對(duì)于第二點(diǎn)不足,Chan等研究者嘗試?yán)梅植枷嗨贫葘?duì)復(fù)述抽取結(jié)果重排序,并在英文短語(yǔ)復(fù)述抽取中驗(yàn)證了有效性[11]。

    6 結(jié)論

    本文利用基于統(tǒng)計(jì)機(jī)器翻譯的短語(yǔ)復(fù)述抽取技術(shù)從中英平行專利語(yǔ)料中抽取短語(yǔ)復(fù)述,并利用基于組塊分析的技術(shù)過濾短語(yǔ)復(fù)述抽取結(jié)果。而且,為了處理對(duì)齊錯(cuò)誤和翻譯歧義引起的短語(yǔ)復(fù)述抽取錯(cuò)誤,我們利用分布相似度對(duì)過濾后的短語(yǔ)復(fù)述結(jié)果進(jìn)行重排序。實(shí)驗(yàn)表明,基于統(tǒng)計(jì)機(jī)器翻譯的短語(yǔ)復(fù)述抽取在中英文上準(zhǔn)確率分別為43.20%和43.60%,而經(jīng)過基于組塊分析的過濾技術(shù)后準(zhǔn)確率分別提升至75.50%和52.40%。同時(shí),利用分布相似度的重排序算法也能夠有效改進(jìn)中文短語(yǔ)復(fù)述抽取效果。

    [1]張西龍,季鐸,王巖,等.英漢專利語(yǔ)料中長(zhǎng)句的分割[J].沈陽(yáng)航空航天大學(xué)學(xué)報(bào).2011,28(5):67-70.

    [2]張桂平,劉東生,尹寶生,等.面向?qū)@墨I(xiàn)的中文分詞技術(shù)的研究[J].中文信息學(xué)報(bào).2010,24(3):112-116.

    [3]岳金媛,徐金安,張玉潔.面向?qū)@墨I(xiàn)的漢語(yǔ)分詞技術(shù)研究[J].北京大學(xué)學(xué)報(bào):自然科學(xué)版.2013(1):159-164.

    [4]劉穎,鐵錚,余暢.漢英短語(yǔ)翻譯對(duì)的自動(dòng)抽?。跩].計(jì)算機(jī)應(yīng)用與軟件.2012,29(7):69-72.

    [5]郭麗.基于上下文的詞語(yǔ)相似度計(jì)算及其應(yīng)用 [D][D].沈陽(yáng)航空工業(yè)學(xué)院,2009.

    [6]劉挺,李維剛,張宇,等.復(fù)述技術(shù)研究綜述[J].中文信息學(xué)報(bào),2006,20(4):25-33.

    [7]De Beaugrande R,Dressler W.Introduction to text linguistics[Z].London:Longman,1981.

    [8]Bazilay R,Mckeown K R.Extracting paraphrases from a parallel corpus[C]//2001.

    [9]Bannard C,Callison-Burch C.Paraphrasing with bilingual parallel corpora[C]//2005.

    [10]宗成慶,張宵軍.統(tǒng)計(jì)機(jī)器翻譯[M].電子工業(yè)出版社,2012.

    [11]Chan T P,Callison-Burch C,Van Durme B.Reranking bilingually extracted paraphrases using monolingual distributional similarity[C].2011.

    [12]周強(qiáng),孫茂松,黃昌寧.漢語(yǔ)句子的組塊分析體系[J].計(jì)算機(jī)學(xué)報(bào).1999,22(11):1158-1165.

    [13]徐中一,胡謙,劉磊.基于CRF的中文組塊分析[J].吉林大學(xué)學(xué)報(bào):理學(xué)版.2007,45(3):416-420.

    [14]Katz J J.The philosophy of linguistics[M].Oxford University Press,1985.

    [15]Lin D,Pantel P.Discovery of inference rules for question-answering[J].Natural Language Engineering.2001,7(4):343-360.

    [16]Koehn P,Och F J,Marcu D.Statistical phrase-based translation[C].2003.

    [17]Brown P F,Pietra V J D,Pietra S A D,et al.The mathematics of statistical machine translation:Parameter estimation[J].Computational linguistics.1993,19(2):263-311.

    [18]Och F J,Ney H.A systematic comparison of various statistical alignment models[J].Computational linguistics.2003,29(1):19-51.

    [19]李珩,朱靖波,姚天順.基于SVM 的中文組塊分析[J].中文信息學(xué)報(bào).2004,18(2):1-7.

    [20]Agirre E,Alfonseca E,Hall K,et al.A study on similarity and relatedness using distributional and wordnet-based approaches[C].2009.

    [21]Li P,Sun M,Xue P.Fast-Champollion:A Fast and Robust Sentence Alignment Algorithm[C]//Proceedings of Beijing,China:Coling 2010Organizing Committee,2010.

    [22]Koehn P,Hoang H,Birch A,et al.Moses:Open source toolkit for statistical machine translation[C].2007.

    [23]Phan X H.Crftagger:Crf english pos tagger[J].A-vailable at crftagger.source forge.net,2006.

    [24]Kaixu Z,Maosong S.Unified Framework of Performing Chinese Word Segmentation and Part-of-Speech Tagging[J].CHINA COMMUNICATIONS,2012,9(3):1-9.

    [25]Phan X H.Crfchunker:Crf english phrase chunker[C].PACLIC,2006.

    [26]周強(qiáng).漢語(yǔ)句法樹庫(kù)標(biāo)注體系[J].中文信息學(xué)報(bào).2004,18(4):1-8.

    [27]Voorhees E M.The philosophy of information retrieval evaluation[C].2002.

    [28]Miller G A,Beckwith R,F(xiàn)ellbaum C,et al.Introduction to wordnet:An on-line lexical database[J].International journal of lexicography,1990,3(4):235-244.

    [29]Dong Z,Dong Q.HowNet[J].2000.

    [30]Hatzivassiloglou V,McKeown K R.Towards the automatic identification of adjectival scales:Clustering adjectives according to meaning[C]//Proceedings of the 31st annual meeting on Association for Computational Linguistics.Association for Computational Linguistics,1993:172-182.

    [31]田久樂,趙蔚.基于同義詞詞林的詞語(yǔ)相似度計(jì)算方法[J].吉林大學(xué)學(xué)報(bào):信息科學(xué)版.2010(06):602-608.

    [32]Blondel V D,Senellart P P.Automatic extraction of synonyms in a dictionary[J].vertex,2011,1:x1.

    [33]Pereira F,Tishby N,Lee L.Distributional clustering of English words[C]//Proceedings of the 31st annual meeting on Association for Computational Linguistics. Association for Computational Linguistics,1993:183-190.

    [34]Lin D.Automatic retrieval and clustering of similar words[C]//Proceedings of the 17th International Conference on Computational linguistics-Volume 2.Association for Computational Linguistics,1998:768-774..

    [35]Ibrahim A,Katz B,Lin J.Extracting structural paraphrases from aligned monolingual corpora[C]//Proceedings of the second international workshop on Paraphrasing-Volume 16.Association for Computational Linguistics,2003:57-64.

    猜你喜歡
    組塊語(yǔ)料排序
    排序不等式
    橫浪作用下大型上部組塊雙船浮托安裝動(dòng)力響應(yīng)特性試驗(yàn)研究
    恐怖排序
    節(jié)日排序
    刻舟求劍
    兒童繪本(2018年5期)2018-04-12 16:45:32
    基于語(yǔ)料調(diào)查的“連……都(也)……”出現(xiàn)的語(yǔ)義背景分析
    陸豐7-2油田導(dǎo)管架平臺(tái)上部組塊低位浮托安裝關(guān)鍵技術(shù)
    華語(yǔ)電影作為真實(shí)語(yǔ)料在翻譯教學(xué)中的應(yīng)用
    《苗防備覽》中的湘西語(yǔ)料
    國(guó)內(nèi)外語(yǔ)用學(xué)實(shí)證研究比較:語(yǔ)料類型與收集方法
    久久精品夜夜夜夜夜久久蜜豆 | 又紧又爽又黄一区二区| 久9热在线精品视频| 深夜精品福利| 巨乳人妻的诱惑在线观看| 欧美日韩国产亚洲二区| 久久午夜亚洲精品久久| 免费在线观看完整版高清| 在线观看66精品国产| 欧美久久黑人一区二区| 亚洲一码二码三码区别大吗| 国产精品久久久久久亚洲av鲁大| 国产1区2区3区精品| 一进一出抽搐动态| 日韩三级视频一区二区三区| 动漫黄色视频在线观看| 亚洲在线自拍视频| 国产熟女午夜一区二区三区| 国产欧美日韩一区二区三| 亚洲精品在线观看二区| 国产精品1区2区在线观看.| 欧美日韩国产亚洲二区| 日韩欧美国产在线观看| 一本一本综合久久| 国产精品av久久久久免费| 一级a爱片免费观看的视频| 国语自产精品视频在线第100页| 天堂av国产一区二区熟女人妻 | 他把我摸到了高潮在线观看| 色综合婷婷激情| 亚洲无线在线观看| 国产成+人综合+亚洲专区| 国产真实乱freesex| 在线免费观看的www视频| 国产伦在线观看视频一区| 亚洲七黄色美女视频| 午夜福利高清视频| 欧美另类亚洲清纯唯美| 长腿黑丝高跟| 日韩大尺度精品在线看网址| АⅤ资源中文在线天堂| 日韩大尺度精品在线看网址| 亚洲人成77777在线视频| 久热爱精品视频在线9| 国产精华一区二区三区| 久久欧美精品欧美久久欧美| 一区二区三区激情视频| 在线国产一区二区在线| 久久午夜综合久久蜜桃| 女人被狂操c到高潮| 69av精品久久久久久| 88av欧美| 久久久国产欧美日韩av| 国产一区二区三区视频了| 欧美日韩国产亚洲二区| 久久久国产成人精品二区| 俺也久久电影网| 露出奶头的视频| 久久这里只有精品中国| 欧美+亚洲+日韩+国产| 一本大道久久a久久精品| 男女那种视频在线观看| 久久久久性生活片| 香蕉国产在线看| 亚洲无线在线观看| 最好的美女福利视频网| 亚洲熟女毛片儿| 中文在线观看免费www的网站 | 欧美日韩亚洲国产一区二区在线观看| 一本久久中文字幕| 国产精品日韩av在线免费观看| 亚洲成人中文字幕在线播放| 日韩欧美 国产精品| 亚洲av中文字字幕乱码综合| 99久久国产精品久久久| 久久亚洲真实| 岛国视频午夜一区免费看| 午夜福利欧美成人| av中文乱码字幕在线| 搡老岳熟女国产| 欧美一区二区精品小视频在线| 久久香蕉精品热| 小说图片视频综合网站| 亚洲最大成人中文| 欧美日韩瑟瑟在线播放| 亚洲精品av麻豆狂野| 91在线观看av| 国产精品亚洲美女久久久| 国产在线精品亚洲第一网站| 日本在线视频免费播放| 女人被狂操c到高潮| 国产亚洲欧美98| 真人一进一出gif抽搐免费| 久久九九热精品免费| 男女视频在线观看网站免费 | 欧美一级毛片孕妇| 国产97色在线日韩免费| 青草久久国产| 制服丝袜大香蕉在线| 国产一区二区三区视频了| www.熟女人妻精品国产| 亚洲一码二码三码区别大吗| 成人亚洲精品av一区二区| 亚洲精品美女久久久久99蜜臀| 午夜免费成人在线视频| 国产成人精品久久二区二区免费| 免费在线观看亚洲国产| 99久久精品热视频| 欧美三级亚洲精品| 50天的宝宝边吃奶边哭怎么回事| 精品久久久久久久末码| 19禁男女啪啪无遮挡网站| 美女高潮喷水抽搐中文字幕| 国产一区二区在线观看日韩 | 国产一区二区三区在线臀色熟女| 麻豆国产97在线/欧美 | 桃红色精品国产亚洲av| 久久九九热精品免费| 国产真实乱freesex| 欧美极品一区二区三区四区| 校园春色视频在线观看| 夜夜夜夜夜久久久久| 99久久精品国产亚洲精品| 校园春色视频在线观看| 国产激情久久老熟女| 中文在线观看免费www的网站 | 国产亚洲精品第一综合不卡| 黄色 视频免费看| 久久久久久免费高清国产稀缺| 亚洲精品在线美女| 全区人妻精品视频| 日本五十路高清| 国产又色又爽无遮挡免费看| 一进一出好大好爽视频| 美女高潮喷水抽搐中文字幕| 天堂动漫精品| 久久久久久大精品| 日韩欧美免费精品| 国产成人精品无人区| 一夜夜www| 久久亚洲真实| 男人的好看免费观看在线视频 | 久热爱精品视频在线9| 777久久人妻少妇嫩草av网站| 亚洲国产高清在线一区二区三| 国内精品一区二区在线观看| 国产精品1区2区在线观看.| 中文亚洲av片在线观看爽| 99久久久亚洲精品蜜臀av| 不卡一级毛片| 亚洲成人免费电影在线观看| 身体一侧抽搐| 欧美三级亚洲精品| 男女午夜视频在线观看| 波多野结衣高清无吗| 一级a爱片免费观看的视频| 亚洲成人中文字幕在线播放| 国产蜜桃级精品一区二区三区| a级毛片a级免费在线| 俄罗斯特黄特色一大片| 18禁美女被吸乳视频| 精品免费久久久久久久清纯| 69av精品久久久久久| 在线观看免费日韩欧美大片| 丝袜人妻中文字幕| 别揉我奶头~嗯~啊~动态视频| 一级作爱视频免费观看| 国产69精品久久久久777片 | 狂野欧美白嫩少妇大欣赏| 中出人妻视频一区二区| 婷婷丁香在线五月| 欧美久久黑人一区二区| 一本综合久久免费| 色老头精品视频在线观看| 国产亚洲精品久久久久久毛片| 一区二区三区高清视频在线| 男人舔奶头视频| 日韩精品免费视频一区二区三区| 免费av毛片视频| 久久久水蜜桃国产精品网| 国产成人精品久久二区二区91| 一卡2卡三卡四卡精品乱码亚洲| 欧美乱码精品一区二区三区| 成人高潮视频无遮挡免费网站| 国产精品免费视频内射| 久久精品91蜜桃| 一进一出抽搐gif免费好疼| 在线观看一区二区三区| 国产主播在线观看一区二区| 国产免费av片在线观看野外av| 久久中文看片网| 国产精品一区二区三区四区久久| 听说在线观看完整版免费高清| 国产精品久久久久久人妻精品电影| 日韩有码中文字幕| av片东京热男人的天堂| 又爽又黄无遮挡网站| 高潮久久久久久久久久久不卡| 亚洲成a人片在线一区二区| 操出白浆在线播放| 亚洲av电影不卡..在线观看| 九色国产91popny在线| 中文字幕久久专区| 手机成人av网站| 午夜免费成人在线视频| 国产高清激情床上av| 十八禁网站免费在线| 天天添夜夜摸| 黄色视频,在线免费观看| 这个男人来自地球电影免费观看| 国产真实乱freesex| 欧美日韩亚洲国产一区二区在线观看| 免费观看精品视频网站| 国产精品99久久99久久久不卡| 免费在线观看影片大全网站| 午夜福利18| 天堂√8在线中文| 一个人免费在线观看电影 | 欧美日韩乱码在线| 亚洲色图 男人天堂 中文字幕| 亚洲avbb在线观看| 一区二区三区国产精品乱码| 精品福利观看| 国产野战对白在线观看| 中文字幕人妻丝袜一区二区| 日日干狠狠操夜夜爽| 欧美在线一区亚洲| 午夜精品在线福利| 欧美中文综合在线视频| 国产av麻豆久久久久久久| 欧美精品啪啪一区二区三区| 我的老师免费观看完整版| 亚洲乱码一区二区免费版| 欧美在线黄色| 亚洲精品久久成人aⅴ小说| 美女黄网站色视频| 日韩欧美免费精品| 久久久久性生活片| 免费一级毛片在线播放高清视频| 久久香蕉精品热| 少妇被粗大的猛进出69影院| 丝袜美腿诱惑在线| 精品欧美国产一区二区三| 国产单亲对白刺激| 精品国内亚洲2022精品成人| 欧美绝顶高潮抽搐喷水| 国产黄片美女视频| 欧美日韩黄片免| 日本免费一区二区三区高清不卡| 国产三级在线视频| 国产精品av视频在线免费观看| 亚洲性夜色夜夜综合| 日本 欧美在线| 亚洲人与动物交配视频| 99久久综合精品五月天人人| 黑人欧美特级aaaaaa片| 国产探花在线观看一区二区| 成人国产综合亚洲| 欧美在线黄色| 色精品久久人妻99蜜桃| 欧美另类亚洲清纯唯美| 欧美高清成人免费视频www| 久久国产精品影院| 人人妻人人澡欧美一区二区| 哪里可以看免费的av片| 18禁裸乳无遮挡免费网站照片| 欧美日韩亚洲国产一区二区在线观看| 亚洲中文日韩欧美视频| 天天躁夜夜躁狠狠躁躁| 国产黄a三级三级三级人| 久久久久国内视频| 成人三级做爰电影| 成人永久免费在线观看视频| 波多野结衣高清无吗| 精品久久久久久久毛片微露脸| 在线观看日韩欧美| 人妻丰满熟妇av一区二区三区| 久久国产精品影院| 国产欧美日韩一区二区三| 亚洲aⅴ乱码一区二区在线播放 | 欧美性长视频在线观看| 此物有八面人人有两片| 天堂动漫精品| 91国产中文字幕| 制服人妻中文乱码| 亚洲精品一卡2卡三卡4卡5卡| 欧美在线黄色| 亚洲av第一区精品v没综合| 女警被强在线播放| 久久久久久久久免费视频了| netflix在线观看网站| 黄色 视频免费看| 亚洲精品久久成人aⅴ小说| 久久久久久大精品| 99在线视频只有这里精品首页| 美女扒开内裤让男人捅视频| 免费观看精品视频网站| 国产精品乱码一区二三区的特点| 久久久久亚洲av毛片大全| 亚洲18禁久久av| 香蕉国产在线看| 免费观看精品视频网站| 18禁观看日本| 亚洲熟妇中文字幕五十中出| 国产伦人伦偷精品视频| 美女 人体艺术 gogo| 男男h啪啪无遮挡| 午夜视频精品福利| 99在线人妻在线中文字幕| 国产精华一区二区三区| 欧美大码av| 日韩中文字幕欧美一区二区| 黄片小视频在线播放| 18美女黄网站色大片免费观看| 欧美性长视频在线观看| 波多野结衣高清无吗| 最近视频中文字幕2019在线8| 在线看三级毛片| 久久精品亚洲精品国产色婷小说| 中文字幕人成人乱码亚洲影| www.www免费av| 欧美日韩国产亚洲二区| 婷婷精品国产亚洲av在线| 五月玫瑰六月丁香| 免费在线观看成人毛片| 欧美日韩国产亚洲二区| 五月伊人婷婷丁香| 国产精品日韩av在线免费观看| 麻豆成人午夜福利视频| 成人18禁高潮啪啪吃奶动态图| 熟妇人妻久久中文字幕3abv| 男人舔女人下体高潮全视频| 十八禁人妻一区二区| 男男h啪啪无遮挡| 精品国产美女av久久久久小说| 1024手机看黄色片| 女人爽到高潮嗷嗷叫在线视频| 国产精品av视频在线免费观看| 高清毛片免费观看视频网站| 国产激情偷乱视频一区二区| 少妇人妻一区二区三区视频| 亚洲精华国产精华精| 精品国产乱子伦一区二区三区| 国产三级中文精品| 欧美zozozo另类| 精品久久久久久久久久免费视频| 美女大奶头视频| 亚洲一卡2卡3卡4卡5卡精品中文| 搡老熟女国产l中国老女人| 国产精品久久久av美女十八| 久久精品成人免费网站| 免费在线观看日本一区| 日本五十路高清| 亚洲欧美一区二区三区黑人| 亚洲欧洲精品一区二区精品久久久| 人妻夜夜爽99麻豆av| 露出奶头的视频| 色尼玛亚洲综合影院| 日本五十路高清| 制服诱惑二区| 国产成人精品久久二区二区免费| 99re在线观看精品视频| 高清毛片免费观看视频网站| 在线国产一区二区在线| 巨乳人妻的诱惑在线观看| 男人的好看免费观看在线视频 | 国产av一区二区精品久久| 免费看美女性在线毛片视频| 精品久久久久久成人av| 999精品在线视频| 俄罗斯特黄特色一大片| 精品一区二区三区av网在线观看| 国产又色又爽无遮挡免费看| 欧美乱妇无乱码| 欧美日本视频| 婷婷六月久久综合丁香| 别揉我奶头~嗯~啊~动态视频| 超碰成人久久| 美女黄网站色视频| 国产精品美女特级片免费视频播放器 | 2021天堂中文幕一二区在线观| 波多野结衣高清作品| 亚洲五月婷婷丁香| 亚洲av成人一区二区三| 午夜a级毛片| 热99re8久久精品国产| 日本成人三级电影网站| 欧美性猛交黑人性爽| 国产av一区在线观看免费| 亚洲精品一区av在线观看| 制服丝袜大香蕉在线| 国产99久久九九免费精品| 国产主播在线观看一区二区| 久久这里只有精品19| 搞女人的毛片| 久久这里只有精品中国| 久久久久九九精品影院| 丁香六月欧美| 97人妻精品一区二区三区麻豆| 国产成人精品久久二区二区91| 亚洲天堂国产精品一区在线| 波多野结衣高清无吗| 久久精品成人免费网站| 久久热在线av| 日韩免费av在线播放| 久久久久久久精品吃奶| 级片在线观看| 国产爱豆传媒在线观看 | 在线播放国产精品三级| 精品少妇一区二区三区视频日本电影| 草草在线视频免费看| 91国产中文字幕| 日日夜夜操网爽| 男人舔奶头视频| 我要搜黄色片| 特大巨黑吊av在线直播| 在线a可以看的网站| 日韩欧美一区二区三区在线观看| 可以在线观看的亚洲视频| 夜夜看夜夜爽夜夜摸| 久久精品91无色码中文字幕| 久久久久免费精品人妻一区二区| 亚洲精品久久成人aⅴ小说| 国产亚洲av嫩草精品影院| 一区二区三区国产精品乱码| 午夜福利欧美成人| 99riav亚洲国产免费| 精品国内亚洲2022精品成人| 免费看a级黄色片| 18禁美女被吸乳视频| 99热这里只有精品一区 | 欧美色视频一区免费| 波多野结衣巨乳人妻| 色在线成人网| 男女视频在线观看网站免费 | 欧美在线黄色| 麻豆国产av国片精品| 在线观看舔阴道视频| 日本 av在线| 久久午夜亚洲精品久久| netflix在线观看网站| 亚洲美女视频黄频| 久久久精品国产亚洲av高清涩受| 免费无遮挡裸体视频| 免费高清视频大片| 在线观看日韩欧美| 天天一区二区日本电影三级| 天堂√8在线中文| 午夜久久久久精精品| avwww免费| 免费在线观看亚洲国产| 99久久久亚洲精品蜜臀av| 在线观看免费日韩欧美大片| 又黄又爽又免费观看的视频| 久久亚洲真实| 最近在线观看免费完整版| 亚洲午夜理论影院| 草草在线视频免费看| 久99久视频精品免费| 日韩国内少妇激情av| 岛国视频午夜一区免费看| 桃色一区二区三区在线观看| 中文亚洲av片在线观看爽| 国产亚洲精品久久久久5区| 啦啦啦韩国在线观看视频| 国产精品香港三级国产av潘金莲| 午夜精品在线福利| 老熟妇乱子伦视频在线观看| 床上黄色一级片| 日韩欧美在线二视频| ponron亚洲| 麻豆av在线久日| 日韩欧美在线乱码| 免费在线观看完整版高清| 精品日产1卡2卡| 国产精品久久久久久亚洲av鲁大| 国产欧美日韩一区二区精品| av福利片在线观看| 搡老妇女老女人老熟妇| 真人做人爱边吃奶动态| 美女黄网站色视频| 99热这里只有精品一区 | 黑人欧美特级aaaaaa片| 丁香欧美五月| 国产成人aa在线观看| 在线观看免费视频日本深夜| 亚洲性夜色夜夜综合| 人妻丰满熟妇av一区二区三区| 一a级毛片在线观看| 很黄的视频免费| 我的老师免费观看完整版| 欧美黑人巨大hd| 久久精品亚洲精品国产色婷小说| 免费在线观看完整版高清| 性欧美人与动物交配| 成人av一区二区三区在线看| 国产精品 国内视频| 一级毛片高清免费大全| 99精品欧美一区二区三区四区| 久久午夜综合久久蜜桃| 国产av一区二区精品久久| 亚洲欧美精品综合久久99| 欧美+亚洲+日韩+国产| 中亚洲国语对白在线视频| 亚洲国产日韩欧美精品在线观看 | 亚洲国产中文字幕在线视频| 欧美一区二区精品小视频在线| a级毛片在线看网站| 熟妇人妻久久中文字幕3abv| 国产欧美日韩精品亚洲av| 欧美一级毛片孕妇| 波多野结衣高清无吗| a在线观看视频网站| 亚洲自偷自拍图片 自拍| 床上黄色一级片| 日本一本二区三区精品| 草草在线视频免费看| 老司机午夜福利在线观看视频| 亚洲专区中文字幕在线| 99riav亚洲国产免费| 国产精品一区二区三区四区免费观看 | 天天一区二区日本电影三级| 精品乱码久久久久久99久播| 一卡2卡三卡四卡精品乱码亚洲| 久久人人精品亚洲av| 在线观看免费午夜福利视频| 女同久久另类99精品国产91| 欧美性猛交╳xxx乱大交人| 国产精品野战在线观看| 亚洲精品美女久久av网站| 国产又黄又爽又无遮挡在线| 国产真人三级小视频在线观看| 女警被强在线播放| 全区人妻精品视频| 成人午夜高清在线视频| 亚洲av中文字字幕乱码综合| 美女黄网站色视频| 成熟少妇高潮喷水视频| 神马国产精品三级电影在线观看 | 好看av亚洲va欧美ⅴa在| 老汉色av国产亚洲站长工具| 国产精品永久免费网站| 午夜福利欧美成人| 欧美黄色淫秽网站| 亚洲全国av大片| 国产熟女午夜一区二区三区| 久久香蕉精品热| 夜夜爽天天搞| 中文资源天堂在线| 国产精品日韩av在线免费观看| 中文在线观看免费www的网站 | 一本一本综合久久| 国产亚洲av高清不卡| 午夜福利在线观看吧| 欧美日韩精品网址| 成人午夜高清在线视频| 亚洲自偷自拍图片 自拍| 成在线人永久免费视频| 久久久久久久久中文| 亚洲国产欧美人成| 成人18禁在线播放| 精华霜和精华液先用哪个| 桃色一区二区三区在线观看| 又粗又爽又猛毛片免费看| 午夜福利视频1000在线观看| 精品福利观看| 国产成人精品久久二区二区91| 国产伦在线观看视频一区| 欧美日韩中文字幕国产精品一区二区三区| 黑人欧美特级aaaaaa片| 国产蜜桃级精品一区二区三区| 中出人妻视频一区二区| 久久国产乱子伦精品免费另类| 无人区码免费观看不卡| 久久久久久九九精品二区国产 | 无限看片的www在线观看| 久久久国产精品麻豆| 成人欧美大片| 国产高清视频在线观看网站| 久久国产精品人妻蜜桃| 99热只有精品国产| 日韩大尺度精品在线看网址| 亚洲熟妇熟女久久| 欧美最黄视频在线播放免费| 丰满人妻一区二区三区视频av | 亚洲最大成人中文| 性色av乱码一区二区三区2| 国产成+人综合+亚洲专区| 俄罗斯特黄特色一大片| 亚洲一区二区三区不卡视频| 欧美日韩乱码在线| 国产精品乱码一区二三区的特点| 最近最新中文字幕大全免费视频| 亚洲国产精品合色在线| 母亲3免费完整高清在线观看| 老司机在亚洲福利影院| 一边摸一边抽搐一进一小说| 在线观看免费视频日本深夜| 丝袜人妻中文字幕| 国产精品亚洲一级av第二区| 中文字幕av在线有码专区| 老汉色av国产亚洲站长工具| 国产精品野战在线观看| 久久香蕉国产精品| 欧美性长视频在线观看| av超薄肉色丝袜交足视频| 精品一区二区三区视频在线观看免费| 操出白浆在线播放| 97人妻精品一区二区三区麻豆| 欧美中文综合在线视频| 在线永久观看黄色视频| 免费观看精品视频网站| 免费看美女性在线毛片视频| 欧美性长视频在线观看| 国产成人影院久久av|