• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于篇章的中文地名識(shí)別研究

    2010-07-18 03:11:40唐旭日陳小荷
    中文信息學(xué)報(bào) 2010年2期
    關(guān)鍵詞:分詞語(yǔ)料閾值

    唐旭日,陳小荷,許 超,李 斌

    (南京師范大學(xué) 文學(xué)院,江蘇 南京 210097)

    1 引言

    地理要素如地形要素(山脈,河流等)、行政區(qū)劃、街道等的自動(dòng)識(shí)別是基于文本的地理信息挖掘的前提。各類(lèi)地理要素在自然語(yǔ)言中一般被標(biāo)示為地名或機(jī)構(gòu)名。因此,地理要素的識(shí)別可以看作是命名實(shí)體識(shí)別的一項(xiàng)子任務(wù)。而文本中地名信息往往多于機(jī)構(gòu)名稱(chēng),且許多機(jī)構(gòu)地名都包含地名,因此地名識(shí)別是基于文本的地理信息挖掘首先要面臨的任務(wù),其識(shí)別質(zhì)量的好壞也將影響機(jī)構(gòu)名的識(shí)別。

    在最近的幾年里,地名識(shí)別的研究受到高度重視,且頗有成效[1-12]??傮w看來(lái),地名識(shí)別的研究存在以下趨勢(shì):復(fù)雜統(tǒng)計(jì)模型的使用;統(tǒng)計(jì)模型與語(yǔ)言知識(shí)的結(jié)合;內(nèi)部結(jié)構(gòu)特征與上下文特征的結(jié)合?;诮y(tǒng)計(jì)模型的機(jī)器學(xué)習(xí)是當(dāng)前自然語(yǔ)言處理的主要技術(shù)來(lái)源,地名識(shí)別方面當(dāng)然也不例外。多個(gè)統(tǒng)計(jì)學(xué)習(xí)模型如隱馬爾科夫模型[8]、支持向量機(jī)[9]、最大熵[7]、條件隨機(jī)場(chǎng)(Conditional Random Fields,簡(jiǎn)寫(xiě)為CRFs)[11]等都被用于地名識(shí)別,且模型越來(lái)越復(fù)雜,存在多個(gè)模型集成使用,如文獻(xiàn)[13]將隱馬爾科夫模型與最大熵模型混合起來(lái)使用,或單個(gè)模型進(jìn)行層疊使用(如文獻(xiàn)[8]),或?qū)υ谢灸P瓦M(jìn)行修改,如文獻(xiàn)[10]所采用的最大間隔隱馬爾科夫模型(Max-margin H idden M arkov Model)等。從文獻(xiàn)看,層疊隱馬爾科夫模型、條件隨機(jī)場(chǎng)以及基于最大間隔的隱馬爾科夫模型在地名識(shí)別方面具有較大的優(yōu)勢(shì),但是由于訓(xùn)練語(yǔ)料和測(cè)試語(yǔ)料并不一致,所以還不能明確判斷各個(gè)模型之間的優(yōu)劣。地名識(shí)別的第二個(gè)趨勢(shì)是語(yǔ)言知識(shí)在統(tǒng)計(jì)模型中的充分應(yīng)用。各種語(yǔ)言資源如地名列表、地名用字、地名特征尾字(或地名通名)列表等以各種形式與統(tǒng)計(jì)模型結(jié)合起來(lái),如作為狀態(tài)標(biāo)注集合、特征判斷等。語(yǔ)言資源的加入有利于地名識(shí)別精度的提高。文獻(xiàn)[11]在CRFs模型的基礎(chǔ)上加入了特征尾字,文獻(xiàn)[8]采用角色標(biāo)注對(duì)地名進(jìn)行進(jìn)一步分類(lèi),區(qū)分了中國(guó)地名、音譯地名和其他地名,文獻(xiàn)[5]對(duì)帶特征詞地名和不帶特征詞地名的區(qū)分,對(duì)比試驗(yàn)都表明了識(shí)別精度獲得進(jìn)一步提高。地名識(shí)別的第三個(gè)趨勢(shì)是內(nèi)部結(jié)構(gòu)特征與上下文特征分析的結(jié)合。由于地名與其他類(lèi)型字串存在千絲萬(wàn)縷的聯(lián)系,僅依靠?jī)?nèi)部結(jié)構(gòu)分析不足以判斷其是否為一地名,因此,綜合考慮內(nèi)部結(jié)構(gòu)特征和外部上下文特征是提高識(shí)別精度的有效方法。較早的地名識(shí)別研究(如文獻(xiàn)[1])僅使用了地名內(nèi)部結(jié)構(gòu)的統(tǒng)計(jì)分析。而最近的研究中各種統(tǒng)計(jì)模型都使用了外部的上下文特征,其區(qū)別僅在于所考察的上下文的范圍?,F(xiàn)有的模型一般僅考察左右相鄰3~4個(gè)字的區(qū)間,而對(duì)于語(yǔ)言中長(zhǎng)距離依存關(guān)系的考察比較缺乏。

    本文提出了篇章地名識(shí)別的概念和系統(tǒng)實(shí)現(xiàn)方法。該方法以篇章作為地名識(shí)別參照系,包含簡(jiǎn)單地名識(shí)別和復(fù)雜地名識(shí)別兩個(gè)階段,其中簡(jiǎn)單地名由基于條件隨機(jī)場(chǎng)的簡(jiǎn)單地名識(shí)別模塊和基于篇章地名關(guān)系的簡(jiǎn)單地名識(shí)別模塊順序構(gòu)成。復(fù)雜地名識(shí)別由基于條件隨機(jī)場(chǎng)的復(fù)雜地名識(shí)別模塊構(gòu)成。該方法在三個(gè)方面進(jìn)行了有益探索:(1)在未分詞語(yǔ)料上直接識(shí)別。現(xiàn)有地名識(shí)別大多建立在分詞的基礎(chǔ)上,依賴(lài)于分詞預(yù)處理的精度。本文則嘗試?yán)靡宰譃閱挝坏耐獠啃畔?采用無(wú)分詞的地名識(shí)別策略;(2)區(qū)分簡(jiǎn)單地名和復(fù)雜地名,采用層疊條件隨機(jī)場(chǎng)順序處理簡(jiǎn)單地名和復(fù)雜地名;(3)將篇章地名關(guān)系這一長(zhǎng)距離依賴(lài)信息納入地名識(shí)別,突破了僅使用地名的左右鄰字信息的局限,為提高系統(tǒng)性能提供新的動(dòng)力。對(duì)比實(shí)驗(yàn)表明,采用上述策略的系統(tǒng)在整體上表現(xiàn)出良好性能,封閉測(cè)試和開(kāi)放測(cè)試中F值分別達(dá)到92.87%和89.76%,說(shuō)明綜合利用短距離和長(zhǎng)距離依存關(guān)系可以有效提高地名識(shí)別效果。研究同時(shí)還發(fā)現(xiàn),在地名性判斷中地名確信度低的字串對(duì)于地名識(shí)別干擾性較大,是導(dǎo)致地名識(shí)別精確度的降低的重要因素;應(yīng)用篇章地名關(guān)系進(jìn)行地名識(shí)別,能夠在保持識(shí)別精確度不變的情況下有效提高召回率。

    論文的第2節(jié)討論了簡(jiǎn)單地名與復(fù)雜地名的區(qū)分和無(wú)分詞地名識(shí)別策略,并給出了系統(tǒng)整體流程;第3、4、5節(jié)分別討論基于CRFs的簡(jiǎn)單地名標(biāo)注與文本分詞、基于篇章的簡(jiǎn)單地名識(shí)別和復(fù)雜地名識(shí)別;第6節(jié)給出了系統(tǒng)的試驗(yàn)結(jié)果及相關(guān)分析;第7節(jié)為結(jié)語(yǔ)。

    2 系統(tǒng)流程

    系統(tǒng)流程構(gòu)建以充分利用地名的內(nèi)部結(jié)構(gòu)信息及其外部語(yǔ)境信息為指導(dǎo)思想。在內(nèi)部構(gòu)造特征方面,漢語(yǔ)中地名存在兩種結(jié)構(gòu)類(lèi)型:簡(jiǎn)單地名和復(fù)雜地名。簡(jiǎn)單地名內(nèi)部由詞素構(gòu)成,成分結(jié)構(gòu)相對(duì)穩(wěn)定,構(gòu)成方法具有規(guī)律性,如“天安門(mén)”、“黃河”、“棗嶺鄉(xiāng)”等。復(fù)雜地名事實(shí)上是一種短語(yǔ)結(jié)構(gòu),由二個(gè)或多個(gè)詞組成,如“香港 特別 行政區(qū)”、“珠江三角洲”、“抗日戰(zhàn)爭(zhēng)紀(jì)念館”等。復(fù)雜地名中一般都包含簡(jiǎn)單地名。對(duì)北京大學(xué)1998年1至6月份《人民日?qǐng)?bào)》標(biāo)注語(yǔ)料(后簡(jiǎn)稱(chēng)為北大語(yǔ)料)中復(fù)雜地名分析顯示,語(yǔ)料庫(kù)中復(fù)雜地名中嵌套有簡(jiǎn)單地名的有4 935例,占復(fù)雜地名總數(shù)的83%。

    簡(jiǎn)單地名和復(fù)雜地名的結(jié)構(gòu)方式不同,應(yīng)采用不同的識(shí)別模式。本文借鑒了文獻(xiàn)[14]在進(jìn)行機(jī)構(gòu)名識(shí)別研究時(shí)的層疊條件隨機(jī)場(chǎng)方法,采用按層疊加條件隨機(jī)場(chǎng)模型,簡(jiǎn)單地名識(shí)別與復(fù)雜地名識(shí)別在系統(tǒng)的不同階段完成。分層結(jié)構(gòu)具有三個(gè)優(yōu)勢(shì)。首先,內(nèi)嵌在復(fù)雜地名中的簡(jiǎn)單地名獲得了與非內(nèi)嵌地名一致的處理方式,有助于緩解數(shù)據(jù)稀疏問(wèn)題;其次,分層處理可利用“復(fù)雜地名一般都包含簡(jiǎn)單地名”這一結(jié)構(gòu)性規(guī)律,在復(fù)雜地名識(shí)別時(shí)利用已識(shí)別的簡(jiǎn)單地名信息;此外,分層處理有利于分別針對(duì)簡(jiǎn)單地名和復(fù)雜地名的結(jié)構(gòu)特征與上下文信息識(shí)別進(jìn)行優(yōu)化處理,而不會(huì)彼此干擾。

    外部語(yǔ)境在地名識(shí)別中具有非常重要的作用。外部語(yǔ)境信息包括近距離依存關(guān)系和長(zhǎng)距離依存關(guān)系。本文通過(guò)采用無(wú)分詞地名識(shí)別策略和條件隨機(jī)場(chǎng)的特征模板設(shè)置來(lái)應(yīng)用近距離依存關(guān)系。現(xiàn)有命名實(shí)體識(shí)別研究[7-8,14]一般在進(jìn)行識(shí)別之前先做分詞處理。然而由于地名常為未登錄詞,分詞的結(jié)果對(duì)地名識(shí)別效果影響較大。采用無(wú)分詞識(shí)別策略,以漢字作為基本特征單位,顆粒度細(xì),能夠緩解以詞為單位造成的知識(shí)顆粒度大和數(shù)據(jù)稀疏問(wèn)題。試分析例1。

    例1 (a)到達(dá)鎮(zhèn)江 (b)抵達(dá)鎮(zhèn)江 (c)送達(dá)鎮(zhèn)江

    如在訓(xùn)練語(yǔ)料中包含例1(a),與例1(b),而不包含例1(c)時(shí),以“字”為基本特征單位的無(wú)分詞策略可利用兩次出現(xiàn)的“達(dá)”字作為上下文信息,而以詞為基本特征時(shí),例1(a)與例1(b)都不能為正確判斷例1(c)提供有用信息。有關(guān)條件隨機(jī)場(chǎng)的特征模板設(shè)置在第3節(jié)中詳細(xì)說(shuō)明。

    外部語(yǔ)境的另一個(gè)重要信息是長(zhǎng)距離依存關(guān)系。地名的長(zhǎng)距離依存關(guān)系還沒(méi)有被地名識(shí)別研究者所重視。在已有研究中,地名自動(dòng)識(shí)別所考慮的上下文語(yǔ)境一般為地名字串的左右鄰字。僅有個(gè)別研究涉及了如何利用篇章中地名重現(xiàn)的問(wèn)題,如文獻(xiàn)[7]提出“在同一篇文章內(nèi),同一個(gè)人名或地名往往反復(fù)出現(xiàn),已經(jīng)出現(xiàn)的專(zhuān)名應(yīng)該對(duì)文中其他地方的相同出現(xiàn)起指導(dǎo)提示作用”,并使用“動(dòng)態(tài)詞表”來(lái)記錄同一篇章中出現(xiàn)的地名或人名。文獻(xiàn)[13]也采用Cache方法對(duì)同一篇章中出現(xiàn)的命名實(shí)體進(jìn)行儲(chǔ)存。但是語(yǔ)篇中地名關(guān)系及其在地名識(shí)別中的應(yīng)用還缺乏系統(tǒng)性。

    本文認(rèn)為,地名長(zhǎng)距離依存關(guān)系的一種表現(xiàn)是篇章中地名語(yǔ)義關(guān)系,文獻(xiàn)[7]提及的篇章地名同現(xiàn)是篇章地名語(yǔ)義關(guān)系的一種類(lèi)型。篇章分析理論指出,篇章要完成其作為語(yǔ)言交際基本單位的功能,“必須具備語(yǔ)篇特征,它所表達(dá)的是整體意義。語(yǔ)篇中各成分是連貫的,而不是彼此無(wú)關(guān)的”[15]8。地名之間的語(yǔ)義關(guān)聯(lián)是篇章連貫性的一種表現(xiàn)。以篇章為單位進(jìn)行地名識(shí)別,可以利用篇章中地名之間存在的動(dòng)態(tài)地名關(guān)系與靜態(tài)地名關(guān)系有利于提高地名識(shí)別的效果。

    基于以上分析,圖1給出了地名識(shí)別流程。輸入文本首先進(jìn)入簡(jiǎn)單地名標(biāo)注與分詞一體化處理,并作為基于篇章的簡(jiǎn)單地名識(shí)別模塊的輸入,然后再進(jìn)行復(fù)雜地名識(shí)別。簡(jiǎn)單地名與文本分詞一體化處理、復(fù)雜地名識(shí)別兩個(gè)模塊以條件隨機(jī)場(chǎng)模型為依托,基于篇章的簡(jiǎn)單地名識(shí)別則利用了地名庫(kù),篇章地名關(guān)系庫(kù)和地名判斷模型。

    圖1 地名識(shí)別流程圖

    3 簡(jiǎn)單地名標(biāo)注與文本分詞一體化處理

    3.1 一體化標(biāo)注集

    地名標(biāo)注與文本分詞的不同之處在于文本分詞僅對(duì)詞邊界進(jìn)行標(biāo)記,而地名標(biāo)注增加了詞語(yǔ)的句法范疇標(biāo)記信息。然而兩者都通過(guò)對(duì)字符串潛在狀態(tài)標(biāo)記完成,因此,可以對(duì)地名標(biāo)記與文本分詞進(jìn)行一體化處理。例2給出了本文采用的一體化標(biāo)注形式的示例。

    例2.

    (a)引/S閩/B-ns江/E-ns水/S沖/B污/E線(xiàn)/B路/E西/S起/S閩/B-ns侯/C-ns縣/E-ns文/B-ns山/C-ns里/E-ns 、/S東/B-ns至/C-ns湖/B-ns前/C-ns河/E-ns。/S

    (b)黨/B-nt中/C-nt央/E-nt國(guó)/B-nt務(wù)/C-nt院/E-nt對(duì)/S太/B-ns湖/E-ns流/B域/E的/S污/B染/E問(wèn)/B題/E高/B度/E重/B視/E

    考慮到機(jī)構(gòu)名中也常常含有地名,表1中給出了本文采用的18位標(biāo)注集,分為地名、機(jī)構(gòu)名和其他三種類(lèi)型,每種類(lèi)型包含六個(gè)標(biāo)記。

    表1 簡(jiǎn)單地名標(biāo)注集

    3.2 模型獲取

    采用一體化標(biāo)注集,通過(guò)訓(xùn)練可獲取簡(jiǎn)單地名識(shí)別模型。本文采用了CRF++①CRF++是Taku Kudo采用C++語(yǔ)言編寫(xiě)的CRFs工具包,軟件包下載地址為h ttp://crfpp.sou rceforge.net。作為模型訓(xùn)練平臺(tái)。在標(biāo)注集確定情況下,影響識(shí)別結(jié)果的因素主要包括以下幾個(gè)方面:(1)訓(xùn)練語(yǔ)料大小及語(yǔ)料中地名分布情況;(2)勢(shì)函數(shù)選擇;(3)參數(shù)估算算法。訓(xùn)練語(yǔ)料的大小與模型的識(shí)別效果直接相關(guān),太小會(huì)遭遇到數(shù)據(jù)稀疏問(wèn)題,太大則可能包含噪音,訓(xùn)練時(shí)間也會(huì)大幅延長(zhǎng)。為此,我們選擇從語(yǔ)料中抽取僅包含地名的句子生成訓(xùn)練語(yǔ)料,從而在避免數(shù)據(jù)稀疏的情況下減少訓(xùn)練時(shí)間,同時(shí)也避免噪音的影響。

    依據(jù)CRFs模型[16-17],給定一觀(guān)察序列,其標(biāo)注序列的概率由一組勢(shì)函數(shù)確定:

    影響概率值P的因素是λ(權(quán)重向量)、狀態(tài)轉(zhuǎn)移勢(shì)函數(shù) t和狀態(tài)特征函數(shù) s。本文采用了 LBFGS參數(shù)評(píng)估算法獲取λ值。勢(shì)函數(shù)選擇在CRF++通過(guò)特征模板確定詳見(jiàn)表2。

    續(xù)表

    運(yùn)用獲取的CRFs簡(jiǎn)單地名識(shí)別模型,對(duì)輸入的文本進(jìn)行識(shí)別,即可獲得帶有分詞和地名、機(jī)構(gòu)名標(biāo)記的輸出結(jié)果,如例3。

    例3 歷史給上海/ns提供了新一輪發(fā)展機(jī)遇。

    4 基于篇章的簡(jiǎn)單地名識(shí)別

    基于篇章的簡(jiǎn)單地名識(shí)別以一體化處理結(jié)果為基礎(chǔ),利用篇章中地名之間的各種固有或概率語(yǔ)義關(guān)系重新考察地名標(biāo)注??疾彀▽?duì)已標(biāo)注地名字串的分析和未標(biāo)注地名字串的分析兩個(gè)方面。通過(guò)分析已標(biāo)注地名字串的組成結(jié)構(gòu)以及該字串是否與篇章中其他地名存在篇章語(yǔ)義關(guān)系,對(duì)標(biāo)注進(jìn)行修改,以提高標(biāo)注準(zhǔn)確率。對(duì)于未標(biāo)注字串,如果該字串可以作為地名使用,且與篇章中其他地名存在篇章語(yǔ)義關(guān)系,則修改該字串為地名,從而提高標(biāo)注召回率。分析未標(biāo)注字串又有兩種方案。一種方案是直接利用一體化處理所給出的地名標(biāo)注和文本分詞結(jié)果(如例3所示)。另一方案是不使用一體化處理中的分詞結(jié)果,而采用逆向最大匹配對(duì)非地名字串進(jìn)行重新切分,然后考察切分結(jié)果是否可能為地名,并將識(shí)別結(jié)果與原有識(shí)別結(jié)果合并。后面給出了基于篇章的簡(jiǎn)單地名識(shí)別流程。流程中步驟4分析已標(biāo)注地名字串,步驟5分析未標(biāo)注地名字串。兩個(gè)步驟相對(duì)獨(dú)立。

    由流程可知,基于篇章的簡(jiǎn)單地名識(shí)別,需要兩個(gè)關(guān)鍵組塊,其一是依據(jù)已識(shí)別地名集合 T獲取篇章地名擴(kuò)展集合T′。篇章地名擴(kuò)展集合的實(shí)質(zhì)是篇章地名同現(xiàn)集合,即在同一篇章中可能共同出現(xiàn)的地名集合。語(yǔ)篇的連貫性以及地名之間固有的語(yǔ)義關(guān)系,決定了同一篇章中一些地名會(huì)共同出現(xiàn)。第二個(gè)關(guān)鍵組塊是地名性判斷,即給定一個(gè)字串,在孤立語(yǔ)境中,通過(guò)對(duì)該字串的內(nèi)部結(jié)果分析,判斷該字串用作地名的概率。本文4.1節(jié)與4.2節(jié)詳細(xì)介紹兩個(gè)組塊的獲取方法。

    基于篇章的簡(jiǎn)單地名識(shí)別流程如下:

    步驟1:設(shè)定分詞方案一為直接使用一體化處理結(jié)果,方案二為使用逆向最大匹配;

    步驟2:給定一個(gè)篇章,通過(guò)簡(jiǎn)單地名標(biāo)注與文本分詞一體化處理得到分詞與標(biāo)注字串向量W;

    步驟3:對(duì)W進(jìn)行掃描,獲取已識(shí)別地名集合 T,并依據(jù)T和篇章地名關(guān)系,獲取篇章地名擴(kuò)展集合T′=f(T);

    步驟4:對(duì)W進(jìn)行掃描,并重復(fù)以下操作:

    4a.輸入下一字串β,如β為空,退出本流程,否則轉(zhuǎn)至4b;

    4b.如果字串β被標(biāo)注為地名,且β?T′,且地名性判斷中確信度小于預(yù)定閾值,則修改β標(biāo)注為非地名;

    步驟5:對(duì)W以句子S為單位重新掃描并執(zhí)行以下操作:

    5a.從S重復(fù)讀入字串β,如β為空,退出步驟5;否則,如采用方案一,轉(zhuǎn)至5b;如采用方案二,則對(duì)S使用逆向最大匹配分詞,并獲取對(duì)應(yīng)位置且包含β的字串β′,并令β=β′,并轉(zhuǎn)至5b;

    5b.如β已被識(shí)別為地名,轉(zhuǎn)至5a,否則,轉(zhuǎn)至5c;

    5c.對(duì)β進(jìn)行地名性判定,如確信度大于預(yù)定閾值,轉(zhuǎn)至 5d,否則,轉(zhuǎn)至5a;

    5d.如果β∈T′,則將β標(biāo)識(shí)為地名;轉(zhuǎn)至 5a;

    步驟6:在W中合并原有標(biāo)注地名與新標(biāo)注地名并輸出。

    4.1 篇章地名擴(kuò)展集合

    在簡(jiǎn)單地名識(shí)別過(guò)程已識(shí)別的地名組成篇章地名集合T。在 T基礎(chǔ)上,利用地名之間的同指關(guān)系、靜態(tài)地理關(guān)系和動(dòng)態(tài)地理關(guān)系,可以獲得篇章地名擴(kuò)展集合 T′,即

    其中CR(T)、SR(T)、DR(T)分別為依據(jù) T獲得的同指關(guān)系集合、靜態(tài)地理關(guān)系集合和動(dòng)態(tài)地理關(guān)系集合。

    地理實(shí)體的地名形式判斷算法:

    給定一地理實(shí)體的全稱(chēng)為C1C2…Cn-2Cn-1Cn,待定字串 C′=C′1C′2C′3…C′m-2C′m-1C′m,如果滿(mǎn)足如 下三 個(gè)條件,則稱(chēng)字串C′為α的一種表征形式:

    同指關(guān)系CR(T)基于如下事實(shí):某一地理實(shí)體往往以不同地名形式在同一語(yǔ)篇中反復(fù)出現(xiàn),從而形成不同地名形式之間的同指關(guān)系。例如,“西雙版納傣族自治州”、“西雙版納”、“西雙版納自治州”、“西雙版納州”都可以用來(lái)指向行政區(qū)劃“西雙版納傣族自治州”,而在文本中四種地名形式都可能出現(xiàn)。通過(guò)地理實(shí)體的地名形式判斷算法可以獲得地理實(shí)體的不同語(yǔ)言使用形式。地名形式判斷的基本思路是如果一個(gè)字符串長(zhǎng)度大于或等于2,且其首尾能夠與某一地理實(shí)體名稱(chēng)(參見(jiàn)表3name字段)模糊匹配,那么這一字符串被認(rèn)為是該地理實(shí)體的一種表征形式。同一地理實(shí)體的不同地名形式具有同指關(guān)系。

    靜態(tài)地理關(guān)系SR(T)是指不同地理要素之間由于天然的或人為的原因而形成的穩(wěn)定的地理關(guān)系。這種地理關(guān)系常被人們用來(lái)作為方位的參照體系。典型的靜態(tài)地理關(guān)系為行政區(qū)劃隸屬關(guān)系,例如“西雙版納傣族自治州”與“云南省”之間的隸屬關(guān)系。靜態(tài)地理關(guān)系是世界知識(shí)的一部分,本文采用地名庫(kù)作為靜態(tài)地理關(guān)系數(shù)據(jù)庫(kù)。該地名庫(kù)包含162 344個(gè)中國(guó)地理實(shí)體,地名庫(kù)結(jié)構(gòu)如表3所示。給定兩個(gè)地名,通過(guò)地名庫(kù)查詢(xún)可以判斷兩者是否存在行政區(qū)劃隸屬關(guān)系。

    表3 地理要素庫(kù)數(shù)據(jù)結(jié)構(gòu)

    動(dòng)態(tài)地理關(guān)系SR(T)是由于人們的社會(huì)活動(dòng)而形成的相互聯(lián)系,表現(xiàn)為兩個(gè)地名在同一篇章中出現(xiàn)。例如在同一語(yǔ)篇中,“中國(guó)”與“美國(guó)”、“英國(guó)”、“法國(guó)”之間的相互關(guān)聯(lián)是由于外交關(guān)系而形成的;“新疆”與“廣州”之間由于“廣州中國(guó)進(jìn)出口商品交易會(huì)”在同一語(yǔ)篇中形成的相互聯(lián)系。本文以標(biāo)注語(yǔ)料庫(kù)為數(shù)據(jù)基本來(lái)源,以語(yǔ)篇為單位,通過(guò)獲取語(yǔ)篇中地名的同現(xiàn)關(guān)系來(lái)獲取動(dòng)態(tài)地理關(guān)系,建立動(dòng)態(tài)地理關(guān)系數(shù)據(jù)庫(kù)。在實(shí)驗(yàn)中,我們從北大語(yǔ)料1至5月份語(yǔ)料中共抽取322 012個(gè)動(dòng)態(tài)地理關(guān)系對(duì)。其中既包括了國(guó)家與國(guó)家之間的地理關(guān)系,如“中國(guó)—美國(guó)”,也包括了我國(guó)內(nèi)部的地理關(guān)系,如“華北—石景山”。

    4.2 地名性判斷

    “字串”地名性判斷是在不考慮上下文的情況下,僅從字串內(nèi)部信息來(lái)考察一個(gè)字串被標(biāo)注為地名的概率。例如,“淥口”標(biāo)注為地名的概率遠(yuǎn)高于“宋本”。本文將字串的地名性判斷看作漢字潛在狀態(tài)標(biāo)注問(wèn)題,使用CRF++作為訓(xùn)練平臺(tái)建立基于條件隨機(jī)場(chǎng)的地名性判斷模型,表4給出了模型訓(xùn)練中地名的狀態(tài)標(biāo)記集合,非地名采用6位標(biāo)注集①例如:如/B果/E沒(méi)/B有/E工/B人/C階/D級(jí)/E的/S支/B持/E(B,C,D,I,E,S)。訓(xùn)練詞表采用從北大語(yǔ)料庫(kù)1至5月份語(yǔ)料抽取的詞表。運(yùn)用該模型對(duì)字串進(jìn)行地名性判斷,可以獲取兩類(lèi)重要信息:給定字串的最優(yōu)標(biāo)注和最優(yōu)標(biāo)注的確信度。最優(yōu)標(biāo)注確信度C f=P(標(biāo)注序列/觀(guān)察序列)為CRF中觀(guān)察字串序列采用最優(yōu)標(biāo)注序列的條件概率(文獻(xiàn)[17]給出了CRF中條件概率的定義)。例4給出了地名性判斷示例。

    表4 基于地名結(jié)構(gòu)的簡(jiǎn)單地名標(biāo)注集及示例

    例4:

    (a)民和縣 → 民/B-LMC和/I-LMC縣/ELCC確信度:94.80%

    (b)民和委 → 民/B和/C委/E,確信度:99.58%

    其中例4(a)在孤立語(yǔ)境中標(biāo)注為地名的確信度為94.80%,而例4(b)為非地名的確信度為99.58%。判斷為地名的字串所具有的確信度在基于篇章的簡(jiǎn)單地名識(shí)別流程中被用作閾值設(shè)置的依據(jù)。

    5 復(fù)雜地名識(shí)別

    復(fù)雜地名識(shí)別接受簡(jiǎn)單地名識(shí)別的輸出,其中包含簡(jiǎn)單地名標(biāo)注信息和分詞信息。復(fù)雜地名識(shí)別也通過(guò)條件隨機(jī)場(chǎng)模型識(shí)別。模型訓(xùn)練平臺(tái)、數(shù)據(jù)來(lái)源、參數(shù)獲取算法與簡(jiǎn)單地名相同。數(shù)據(jù)格式為“詞+[O|ns]+標(biāo)注”,其中O表示非地名,ns表示地名。狀態(tài)標(biāo)注集采用6位標(biāo)注集(S,B,I,E1,E,O)②S為獨(dú)立構(gòu)成地名字,B、E1、E和 I分別表示地名首詞,結(jié)尾倒數(shù)第2詞,尾詞和其他位置詞。如:香港/B-ns特別/E1-ns行政區(qū)/E-ns。O為非地名。。特征選擇見(jiàn)表5。

    表5 復(fù)雜地名CRFs模型特征選擇

    6 實(shí)驗(yàn)與分析

    6.1 層疊條件隨機(jī)場(chǎng)無(wú)分詞地名識(shí)別

    為方便比較,我們參照文獻(xiàn)[8],選擇北大語(yǔ)料1至5月份語(yǔ)料為訓(xùn)練語(yǔ)料,1月份語(yǔ)料為封閉測(cè)試語(yǔ)料,6月份語(yǔ)料為開(kāi)放測(cè)試語(yǔ)料。首先僅采用由條件隨機(jī)場(chǎng)簡(jiǎn)單地名識(shí)別模塊、復(fù)雜地名條件隨機(jī)場(chǎng)模塊組成的層疊條件隨機(jī)場(chǎng)模型進(jìn)行實(shí)驗(yàn)。表6給出了簡(jiǎn)單地名識(shí)別的實(shí)驗(yàn)結(jié)果,表7給出了復(fù)雜地名識(shí)別的實(shí)驗(yàn)結(jié)果,表8給出了層疊條件隨機(jī)場(chǎng)地名識(shí)別結(jié)果。

    表6 簡(jiǎn)單地名識(shí)別結(jié)果

    表7 復(fù)雜地名識(shí)別結(jié)果

    表8 綜合地名識(shí)別結(jié)果

    與已有研究相比,采用層疊條件隨機(jī)場(chǎng)無(wú)分詞策略在封閉測(cè)試和開(kāi)放測(cè)試都取得了較好的性能,開(kāi)放測(cè)試F值與已有類(lèi)似研究相比高出大約3%。表6、表7和表8中封閉測(cè)試和開(kāi)放測(cè)試F值變化不大,說(shuō)明模型性能相對(duì)穩(wěn)定。而表7顯示,在假定分詞和簡(jiǎn)單地名識(shí)別完全正確的情況下,復(fù)雜地名層級(jí)的識(shí)別精度可以達(dá)到98.86%和95.62%,說(shuō)明進(jìn)一步提高地名識(shí)別精度的突破口應(yīng)放在簡(jiǎn)單地名的識(shí)別方面。

    6.2 基于篇章的簡(jiǎn)單地名識(shí)別

    由第4節(jié)可知,基于篇章的簡(jiǎn)單地名識(shí)別包含對(duì)已標(biāo)注字串的考察和未標(biāo)注字串的考察兩個(gè)環(huán)節(jié),且每一環(huán)節(jié)都存在地名性判斷閾值設(shè)置問(wèn)題。此外,在對(duì)未標(biāo)注地名考察時(shí)還有兩種方案:基于一體化處理和基于最大匹配。實(shí)驗(yàn)首先考察了在一體化處理的基礎(chǔ)上不同閾值設(shè)置對(duì)簡(jiǎn)單地名識(shí)別結(jié)果的影響,在處理中省略基于篇章的簡(jiǎn)單地名識(shí)別流程中步驟4,而直接執(zhí)行步驟5。圖2、圖3分別給出了不同閾值在封閉測(cè)試和開(kāi)放測(cè)試中的識(shí)別結(jié)果??梢钥闯?隨著確信度閾值趨向于0,封閉測(cè)試和開(kāi)放測(cè)試中召回率和F值呈上升趨勢(shì),而精確率基本保持不變,說(shuō)明在對(duì)未標(biāo)注地名進(jìn)行判斷時(shí),僅依靠篇章地名關(guān)系就可以正確判斷未標(biāo)注地名是否為地名。

    圖2 步驟5不同閾值封閉測(cè)試結(jié)果

    圖3 步驟5不同閾值開(kāi)放測(cè)試結(jié)果

    為考察分詞錯(cuò)誤對(duì)于地名識(shí)別的影響,我們進(jìn)一步分別采用基于CRFs的一體化處理(CRFs)和逆向最大匹配(BMM)兩種方案進(jìn)行了試驗(yàn)(圖4、圖5)??梢钥闯?BMM在閾值為0.60時(shí)封閉測(cè)試時(shí)F值方面有小幅提高,而在開(kāi)放測(cè)試中與CRFs差距不明顯。BMM在召回率方面的優(yōu)勢(shì)較為明顯,這說(shuō)明分詞錯(cuò)誤對(duì)地名識(shí)別具有具有較大影響。但是BMM需要對(duì)文本進(jìn)行重新處理,處理時(shí)間會(huì)大幅延長(zhǎng)。

    圖4 封閉測(cè)試兩種方案測(cè)試結(jié)果

    圖5 開(kāi)放測(cè)試兩種方案測(cè)試結(jié)果

    在此基礎(chǔ)上,我們選擇以一體化處理結(jié)果為基礎(chǔ),在對(duì)未標(biāo)注地名考察時(shí)地名性判斷閾值設(shè)置為0,在處理時(shí)執(zhí)行基于篇章的簡(jiǎn)單地名識(shí)別流程中所有步驟,即包括步驟4和步驟5。表9和表10分別給出了在步驟4中地名性判斷閾值設(shè)置為不同閾值的結(jié)果。可以看出,在閾值設(shè)置為0.10時(shí),相對(duì)于閾值為0,即不對(duì)已識(shí)別地名進(jìn)行處理時(shí),系統(tǒng)召回率在封閉測(cè)試與開(kāi)放測(cè)試分別降低了 1.34%和1.67%,而精確率分別提高了1.85%和2.38%,F值提高0.35%;在閾值為0.5的情況下,精確度會(huì)得到進(jìn)一步的提高,召回率呈現(xiàn)下降趨勢(shì),F值也會(huì)下降。這說(shuō)明地名性判斷中確信度較低的地名會(huì)對(duì)地名識(shí)別精度產(chǎn)生較大影響,而將這一部分過(guò)濾后系統(tǒng)性能提高幅度較大。

    表9 已識(shí)別地名不同閾值封閉測(cè)試

    表10 已識(shí)別地名不同閾值開(kāi)放測(cè)試

    上述實(shí)驗(yàn)也說(shuō)明,使用一體化處理結(jié)果,在對(duì)已識(shí)別地名處理中地名判斷確信度閾值設(shè)置為0.1,對(duì)未識(shí)別地名處理中地名判斷確信度閾值設(shè)置為0時(shí),基于篇章地名識(shí)別達(dá)到最好效果,封閉測(cè)試精確率和F值分別比一體化處理結(jié)果提高 1.87%和1.58%,開(kāi)放測(cè)試精確率和F值分別提高2.33%和0.84%。

    6.3 系統(tǒng)綜合性能測(cè)試

    采用6.2節(jié)基于篇章識(shí)別地名處理的最優(yōu)設(shè)置,使用一體化處理結(jié)果,在對(duì)以識(shí)別地名處理中地名判斷確信度閾值設(shè)置為0.1,對(duì)未識(shí)別地名處理中地名判斷確信度閾值設(shè)置為0,對(duì)簡(jiǎn)單地名和復(fù)雜地名進(jìn)行了綜合實(shí)驗(yàn),表11給出了測(cè)試結(jié)果。與表7相比較,在封閉測(cè)試中,精確度提高 2.85%,召回率提高0.49,F值提高1.72%,開(kāi)放測(cè)試中,精確度提高2.45%,召回率下降0.33,F值提高1.16%。分析可以看出,過(guò)濾地名判斷確信度較低的地名,采用篇章地名關(guān)系進(jìn)行地名識(shí)別能夠有效地提高地名識(shí)別精確率。

    表11 加入地名關(guān)系后處理模塊的整體識(shí)別結(jié)果

    7 結(jié)語(yǔ)

    本文探討了以篇章為單位的地名識(shí)別策略和方法,以充分利用地名內(nèi)部結(jié)構(gòu)信息、左右近鄰字等短距離依存關(guān)系以及篇章地名關(guān)系這一長(zhǎng)距離依存關(guān)系為指導(dǎo)思想,構(gòu)建了中文地名識(shí)別系統(tǒng)。該系統(tǒng)采用無(wú)分詞策略,應(yīng)用條件隨機(jī)場(chǎng)作為基本模型,分別建立了基于條件隨機(jī)場(chǎng)的簡(jiǎn)單地名識(shí)別模塊、基于篇章的簡(jiǎn)單地名識(shí)別模塊和基于條件隨機(jī)場(chǎng)的復(fù)雜地名識(shí)別模塊。在基于篇章的簡(jiǎn)單地名識(shí)別模塊中,構(gòu)建了篇章地名語(yǔ)義關(guān)系知識(shí)庫(kù)和地名性判斷模塊。試驗(yàn)顯示,基于上述策略的地名識(shí)別系統(tǒng)在封閉測(cè)試和開(kāi)放測(cè)試中F值都達(dá)到了較高水平,說(shuō)明以充分利用短距離依存關(guān)系和長(zhǎng)距離依存關(guān)系的系統(tǒng)構(gòu)建方法能夠建立有效的地名識(shí)別模型。

    長(zhǎng)距離依存不僅表現(xiàn)在篇章地名關(guān)系方面,也表現(xiàn)在其他類(lèi)型的命名實(shí)體中,因此這一方法有可能應(yīng)用于其他類(lèi)型命名實(shí)體識(shí)別之中。此外,如果能夠建立基于條件隨機(jī)場(chǎng)的綜合考慮短距離和長(zhǎng)距離依賴(lài)關(guān)系的模型,有可能會(huì)使系統(tǒng)性能得到進(jìn)一步提升。這些是我們下一步的研究工作。

    [1] 劉開(kāi)瑛.中文文本自動(dòng)分詞與標(biāo)注[M].北京:商務(wù)印書(shū)館,2000.

    [2] 樂(lè)小虬,楊崇俊,劉冬林.空間命名實(shí)體的識(shí)別.計(jì)算機(jī)工程,2005,31:49-53.

    [3] 向曉雯,史曉東,曾華琳.一個(gè)統(tǒng)計(jì)與規(guī)則相結(jié)合的中文命名實(shí)體識(shí)別系統(tǒng)[J].計(jì)算機(jī)應(yīng)用,2005,25:2404-2406.

    [4] 莊明,老松楊,吳玲達(dá).一種統(tǒng)計(jì)和詞性相結(jié)合的命名實(shí)體發(fā)現(xiàn)方法[J].計(jì)算機(jī)應(yīng)用,2005,24:22-24.

    [5] 黃德根,孫迎紅.中文地名的自動(dòng)識(shí)別[J].計(jì)算機(jī)工程,2006,32:220-222.

    [6] 李麗雙,黃德根,陳春榮,楊元生.SVM 與規(guī)則相結(jié)合的中文地名自動(dòng)識(shí)別[J].中文信息學(xué)報(bào),2006,20(5):51-57.

    [7] 錢(qián)晶,張杰,張濤.基于最大熵的漢語(yǔ)人名地名識(shí)別方法研究[J].小型微型計(jì)算機(jī)系統(tǒng),2006,27:1761-1765.

    [8] 俞鴻魁,張華平,劉群,呂學(xué)強(qiáng),施水才.基于層疊隱馬爾科夫模型的中文命名實(shí)體識(shí)別[J].通信學(xué)報(bào),2006,27:87-94.

    [9] 李麗雙,黃德根,陳春榮,楊元生.基于支持向量機(jī)的中文文本中地名識(shí)別[J].大連理工大學(xué)學(xué)報(bào),2007,47:433-438.

    [10] L.Li,Z.Ding,and D.Huang.Recognizing Location Names from Chinese Texts Based on Max-M argin Network[C]//Proceedings of International Conference on Natural Language Processing and Know ledge Engineering 2008,Beijing,China,2008:325-331.

    [11] 馮元勇,孫樂(lè),張大鯤,李文波.基于小規(guī)模尾字特征的中文命名實(shí)體識(shí)別研究[J].電子學(xué)報(bào),2008,36:1833-1838.

    [12] 黃德根,岳廣玲,楊元生.基于統(tǒng)計(jì)的中文地名識(shí)別[J].中文信息學(xué)報(bào),2003,17(2):36-41.

    [13] 張曉艷,王挺,陳火旺.基于混合統(tǒng)計(jì)模型的漢語(yǔ)命名實(shí)體識(shí)別方法[J].計(jì)算機(jī)工程與科學(xué),2006,128:135-139.

    [14] 周俊生,戴新宇,尹存燕,陳家俊.基于層疊條件隨機(jī)場(chǎng)模型的中文機(jī)構(gòu)名自動(dòng)識(shí)別[J].電子學(xué)報(bào),2006,34:804-809.

    [15] 黃國(guó)文.語(yǔ)篇分析概要[M].長(zhǎng)沙:湖南教育出版社,1983.

    [16] H.M.W allach.Conditional Random Fields:An Introduction[R].University of Pennsy lvania,2004.

    [17] J.Lafferty,A.M cCallum,and F.Pereira.Conditional Random Fields:Probabilistic Models for Segmenting and Labeling Sequence Data[C]//International Con ferenceon Machine Learning,2001.

    猜你喜歡
    分詞語(yǔ)料閾值
    小波閾值去噪在深小孔鉆削聲發(fā)射信號(hào)處理中的應(yīng)用
    結(jié)巴分詞在詞云中的應(yīng)用
    基于自適應(yīng)閾值和連通域的隧道裂縫提取
    比值遙感蝕變信息提取及閾值確定(插圖)
    河北遙感(2017年2期)2017-08-07 14:49:00
    基于語(yǔ)料調(diào)查的“連……都(也)……”出現(xiàn)的語(yǔ)義背景分析
    值得重視的分詞的特殊用法
    室內(nèi)表面平均氡析出率閾值探討
    華語(yǔ)電影作為真實(shí)語(yǔ)料在翻譯教學(xué)中的應(yīng)用
    《苗防備覽》中的湘西語(yǔ)料
    國(guó)內(nèi)外語(yǔ)用學(xué)實(shí)證研究比較:語(yǔ)料類(lèi)型與收集方法
    国产深夜福利视频在线观看| 国产精品98久久久久久宅男小说| 91老司机精品| 欧美日韩福利视频一区二区| а√天堂www在线а√下载 | 欧美激情 高清一区二区三区| 久久久久久久国产电影| 精品国产国语对白av| 一级片'在线观看视频| 波多野结衣一区麻豆| 欧美人与性动交α欧美精品济南到| 欧美日韩视频精品一区| 成人国语在线视频| 人人妻人人添人人爽欧美一区卜| 久久久久国产精品人妻aⅴ院 | 制服诱惑二区| 欧美日韩福利视频一区二区| 国产成人影院久久av| 中文字幕另类日韩欧美亚洲嫩草| 日本黄色日本黄色录像| 人妻 亚洲 视频| 婷婷精品国产亚洲av在线 | 久久中文字幕人妻熟女| 女性生殖器流出的白浆| 亚洲中文av在线| 日韩熟女老妇一区二区性免费视频| 久久天堂一区二区三区四区| 欧美精品高潮呻吟av久久| 国产野战对白在线观看| 在线观看免费视频网站a站| 精品一品国产午夜福利视频| 捣出白浆h1v1| 国产成人精品久久二区二区91| 香蕉国产在线看| a级毛片在线看网站| 国产有黄有色有爽视频| 国产免费现黄频在线看| 亚洲精品一二三| 久久亚洲精品不卡| 一区福利在线观看| 国产又色又爽无遮挡免费看| 午夜福利乱码中文字幕| 在线观看一区二区三区激情| 18禁国产床啪视频网站| 久久久水蜜桃国产精品网| 俄罗斯特黄特色一大片| www.999成人在线观看| 精品国产美女av久久久久小说| 精品久久久久久,| 国产日韩欧美亚洲二区| 久久国产乱子伦精品免费另类| 国产蜜桃级精品一区二区三区 | 无人区码免费观看不卡| bbb黄色大片| 久久久精品国产亚洲av高清涩受| 日本撒尿小便嘘嘘汇集6| 91麻豆av在线| 正在播放国产对白刺激| 国产精品 欧美亚洲| av一本久久久久| 狂野欧美激情性xxxx| 精品午夜福利视频在线观看一区| 两人在一起打扑克的视频| 精品久久久久久电影网| 自拍欧美九色日韩亚洲蝌蚪91| 午夜久久久在线观看| www.精华液| 欧美大码av| 精品少妇久久久久久888优播| 丰满迷人的少妇在线观看| xxxhd国产人妻xxx| 国产1区2区3区精品| 色播在线永久视频| 久久精品亚洲精品国产色婷小说| 国产亚洲精品一区二区www | 国产免费现黄频在线看| 少妇裸体淫交视频免费看高清 | 99国产精品99久久久久| 国产成+人综合+亚洲专区| 亚洲欧美激情在线| 亚洲国产毛片av蜜桃av| 丰满的人妻完整版| 久久天堂一区二区三区四区| 老汉色av国产亚洲站长工具| 久久人妻福利社区极品人妻图片| 啪啪无遮挡十八禁网站| 国产精华一区二区三区| 成人手机av| 男人操女人黄网站| 男人操女人黄网站| 婷婷成人精品国产| 伊人久久大香线蕉亚洲五| 亚洲片人在线观看| 啦啦啦 在线观看视频| 老司机影院毛片| 又大又爽又粗| 黄片大片在线免费观看| 国产色视频综合| 精品熟女少妇八av免费久了| 女人被狂操c到高潮| 免费av中文字幕在线| 欧美乱码精品一区二区三区| 三上悠亚av全集在线观看| 国产免费av片在线观看野外av| 大陆偷拍与自拍| av福利片在线| av天堂久久9| 午夜91福利影院| 一级a爱视频在线免费观看| 一边摸一边做爽爽视频免费| 每晚都被弄得嗷嗷叫到高潮| 黄色女人牲交| 人人妻人人澡人人爽人人夜夜| 夜夜爽天天搞| 久99久视频精品免费| 精品久久蜜臀av无| 国产精品欧美亚洲77777| 精品第一国产精品| 老熟妇乱子伦视频在线观看| 丝瓜视频免费看黄片| 人妻 亚洲 视频| 国产免费现黄频在线看| 丝袜人妻中文字幕| 精品国产一区二区久久| 最新美女视频免费是黄的| 久久午夜综合久久蜜桃| 久久午夜综合久久蜜桃| 亚洲欧美一区二区三区久久| 手机成人av网站| ponron亚洲| 日韩成人在线观看一区二区三区| 欧美黑人精品巨大| 亚洲成人国产一区在线观看| 少妇裸体淫交视频免费看高清 | 亚洲av片天天在线观看| 欧美激情久久久久久爽电影 | 国产高清激情床上av| 欧美亚洲日本最大视频资源| 午夜视频精品福利| 日本欧美视频一区| 欧美黑人欧美精品刺激| 99国产综合亚洲精品| 母亲3免费完整高清在线观看| 成人黄色视频免费在线看| 日本vs欧美在线观看视频| 国产亚洲欧美精品永久| 黄色a级毛片大全视频| 亚洲自偷自拍图片 自拍| 国产精品久久久久久精品古装| 亚洲国产精品sss在线观看 | 久久精品亚洲精品国产色婷小说| 亚洲精品在线美女| 午夜福利欧美成人| 午夜福利在线免费观看网站| 国产成人精品无人区| 热99re8久久精品国产| 黄色毛片三级朝国网站| 亚洲精品中文字幕在线视频| 精品久久久久久,| 在线天堂中文资源库| 夜夜爽天天搞| av片东京热男人的天堂| 男女高潮啪啪啪动态图| 久久人人爽av亚洲精品天堂| 99国产精品一区二区三区| 激情视频va一区二区三区| 精品一区二区三卡| www.999成人在线观看| 69av精品久久久久久| 十分钟在线观看高清视频www| 王馨瑶露胸无遮挡在线观看| 水蜜桃什么品种好| 午夜精品国产一区二区电影| 国产主播在线观看一区二区| 国产男女超爽视频在线观看| 桃红色精品国产亚洲av| 777米奇影视久久| 欧美乱码精品一区二区三区| 婷婷成人精品国产| 久热这里只有精品99| 久久人妻福利社区极品人妻图片| 99香蕉大伊视频| 国产男女内射视频| 日韩免费高清中文字幕av| 不卡一级毛片| 日韩 欧美 亚洲 中文字幕| 国产成人精品在线电影| 久久午夜亚洲精品久久| 老司机福利观看| 韩国av一区二区三区四区| 成人av一区二区三区在线看| 他把我摸到了高潮在线观看| 一夜夜www| 久久久久国产一级毛片高清牌| 真人做人爱边吃奶动态| 又黄又爽又免费观看的视频| 99国产极品粉嫩在线观看| 国产欧美日韩一区二区三| 51午夜福利影视在线观看| 国产极品粉嫩免费观看在线| 久久人妻av系列| 国产在视频线精品| 不卡一级毛片| 黄色女人牲交| 天堂中文最新版在线下载| 免费在线观看黄色视频的| 欧美久久黑人一区二区| 免费日韩欧美在线观看| 不卡一级毛片| 欧美午夜高清在线| 男女之事视频高清在线观看| 性少妇av在线| 国产99久久九九免费精品| 日本黄色视频三级网站网址 | 精品熟女少妇八av免费久了| 国产片内射在线| 午夜激情av网站| 日韩成人在线观看一区二区三区| 人人妻人人澡人人爽人人夜夜| 青草久久国产| 久久久国产成人精品二区 | 看免费av毛片| 亚洲精品一卡2卡三卡4卡5卡| 美女午夜性视频免费| 久久人妻福利社区极品人妻图片| 美女 人体艺术 gogo| 精品少妇久久久久久888优播| 在线观看www视频免费| 国产精品二区激情视频| 国产一卡二卡三卡精品| 久久久久久久午夜电影 | cao死你这个sao货| 精品欧美一区二区三区在线| 午夜日韩欧美国产| 纯流量卡能插随身wifi吗| 美女高潮喷水抽搐中文字幕| 啪啪无遮挡十八禁网站| 国产男女内射视频| 又黄又粗又硬又大视频| 人人妻,人人澡人人爽秒播| 老汉色av国产亚洲站长工具| 交换朋友夫妻互换小说| 国产97色在线日韩免费| 国产1区2区3区精品| 精品国产超薄肉色丝袜足j| 一进一出好大好爽视频| 午夜亚洲福利在线播放| 视频区图区小说| 国产精品电影一区二区三区 | 这个男人来自地球电影免费观看| 精品午夜福利视频在线观看一区| av不卡在线播放| 婷婷精品国产亚洲av在线 | 黑人欧美特级aaaaaa片| 黄片播放在线免费| 精品国产亚洲在线| 18禁国产床啪视频网站| 国产色视频综合| 久久草成人影院| 国产成人啪精品午夜网站| 亚洲国产欧美一区二区综合| 一本一本久久a久久精品综合妖精| 国产精品久久久久成人av| 久9热在线精品视频| 午夜精品国产一区二区电影| 韩国av一区二区三区四区| 亚洲五月色婷婷综合| 美女午夜性视频免费| 狠狠婷婷综合久久久久久88av| x7x7x7水蜜桃| 久久 成人 亚洲| 12—13女人毛片做爰片一| 女人久久www免费人成看片| 免费在线观看亚洲国产| 精品卡一卡二卡四卡免费| 久久人人97超碰香蕉20202| 亚洲av第一区精品v没综合| √禁漫天堂资源中文www| 黑人巨大精品欧美一区二区mp4| 高清视频免费观看一区二区| 久久这里只有精品19| 亚洲专区国产一区二区| 岛国毛片在线播放| 国产精品美女特级片免费视频播放器 | 亚洲中文av在线| 18禁黄网站禁片午夜丰满| 啦啦啦在线免费观看视频4| 国产男靠女视频免费网站| 亚洲黑人精品在线| 免费av中文字幕在线| 黄色成人免费大全| 亚洲男人天堂网一区| 亚洲人成电影免费在线| netflix在线观看网站| 午夜福利视频在线观看免费| 最近最新中文字幕大全免费视频| 日韩欧美在线二视频 | 欧美日韩乱码在线| 可以免费在线观看a视频的电影网站| 亚洲va日本ⅴa欧美va伊人久久| 日韩欧美一区视频在线观看| 亚洲黑人精品在线| 人人澡人人妻人| 欧美日韩亚洲高清精品| 色94色欧美一区二区| 日韩大码丰满熟妇| 成人三级做爰电影| 一边摸一边抽搐一进一出视频| 午夜福利一区二区在线看| 久久九九热精品免费| 亚洲中文日韩欧美视频| 纯流量卡能插随身wifi吗| 黄色视频,在线免费观看| 女人精品久久久久毛片| 黑人操中国人逼视频| 亚洲第一av免费看| 18禁裸乳无遮挡免费网站照片 | 欧美丝袜亚洲另类 | √禁漫天堂资源中文www| 亚洲精品中文字幕在线视频| 欧美日韩乱码在线| 最新美女视频免费是黄的| 国产欧美日韩一区二区三区在线| www.999成人在线观看| 99久久精品国产亚洲精品| 国产在视频线精品| 免费在线观看完整版高清| 国产97色在线日韩免费| 久热爱精品视频在线9| 亚洲av日韩精品久久久久久密| 少妇的丰满在线观看| 美女国产高潮福利片在线看| 免费在线观看完整版高清| 18禁黄网站禁片午夜丰满| 国产精品乱码一区二三区的特点 | 精品少妇久久久久久888优播| 欧美av亚洲av综合av国产av| 这个男人来自地球电影免费观看| 欧美日韩国产mv在线观看视频| av视频免费观看在线观看| 99香蕉大伊视频| 久久午夜综合久久蜜桃| 免费在线观看影片大全网站| 久久国产精品大桥未久av| 欧美成人免费av一区二区三区 | 黄色视频不卡| 高清av免费在线| 亚洲午夜精品一区,二区,三区| 大香蕉久久网| 亚洲综合色网址| 国产精品国产高清国产av | 老司机福利观看| 老司机靠b影院| 久久人妻熟女aⅴ| 午夜免费鲁丝| 国产在线观看jvid| 国产精华一区二区三区| 日日摸夜夜添夜夜添小说| 亚洲第一av免费看| 欧美人与性动交α欧美精品济南到| 免费日韩欧美在线观看| 亚洲熟妇熟女久久| 在线av久久热| 欧美精品亚洲一区二区| 久久久水蜜桃国产精品网| 免费不卡黄色视频| 亚洲成人免费电影在线观看| 极品教师在线免费播放| 人妻久久中文字幕网| 亚洲精品在线美女| 久久人妻熟女aⅴ| 91老司机精品| 涩涩av久久男人的天堂| 视频在线观看一区二区三区| 一级毛片高清免费大全| 国产xxxxx性猛交| 一区在线观看完整版| 王馨瑶露胸无遮挡在线观看| 他把我摸到了高潮在线观看| 精品无人区乱码1区二区| 下体分泌物呈黄色| 在线天堂中文资源库| 精品欧美一区二区三区在线| 免费在线观看影片大全网站| 亚洲av熟女| 一级毛片高清免费大全| 欧美黑人精品巨大| 三级毛片av免费| 国产精品一区二区精品视频观看| 天堂√8在线中文| 成人三级做爰电影| 午夜精品国产一区二区电影| 中亚洲国语对白在线视频| 在线观看免费高清a一片| 美女午夜性视频免费| 午夜精品久久久久久毛片777| 99久久99久久久精品蜜桃| av视频免费观看在线观看| 99热网站在线观看| 国产99白浆流出| 亚洲中文av在线| 桃红色精品国产亚洲av| 久久 成人 亚洲| 男女午夜视频在线观看| 国产有黄有色有爽视频| av天堂久久9| 午夜福利视频在线观看免费| 后天国语完整版免费观看| 亚洲午夜精品一区,二区,三区| 成人免费观看视频高清| 高清av免费在线| 久久人人97超碰香蕉20202| 桃红色精品国产亚洲av| 欧美精品啪啪一区二区三区| 他把我摸到了高潮在线观看| 亚洲免费av在线视频| 久久久久久免费高清国产稀缺| 亚洲av第一区精品v没综合| 一级毛片精品| 久久亚洲精品不卡| 精品一区二区三区四区五区乱码| 日本黄色视频三级网站网址 | 亚洲色图av天堂| 成在线人永久免费视频| 亚洲在线自拍视频| 成年动漫av网址| 国产精品亚洲av一区麻豆| 三上悠亚av全集在线观看| 亚洲av欧美aⅴ国产| 国产亚洲精品一区二区www | 看免费av毛片| 久久精品国产清高在天天线| 久久久久国产一级毛片高清牌| 久久久久久久国产电影| 亚洲一区二区三区欧美精品| 好看av亚洲va欧美ⅴa在| 男女床上黄色一级片免费看| 色尼玛亚洲综合影院| 久久国产乱子伦精品免费另类| 日本一区二区免费在线视频| 亚洲欧美日韩另类电影网站| 交换朋友夫妻互换小说| 免费在线观看视频国产中文字幕亚洲| 国产成人精品在线电影| 亚洲欧美日韩高清在线视频| 免费在线观看亚洲国产| 久久精品亚洲熟妇少妇任你| 国产午夜精品久久久久久| 国产高清国产精品国产三级| 免费一级毛片在线播放高清视频 | 老司机影院毛片| 久久久久久久久免费视频了| 亚洲片人在线观看| 十分钟在线观看高清视频www| 999久久久国产精品视频| 91国产中文字幕| 亚洲色图av天堂| 亚洲七黄色美女视频| 看片在线看免费视频| 天堂动漫精品| 夜夜夜夜夜久久久久| 国产欧美日韩一区二区三区在线| 91国产中文字幕| 一级黄色大片毛片| 午夜亚洲福利在线播放| 热re99久久国产66热| 日本精品一区二区三区蜜桃| 亚洲欧洲精品一区二区精品久久久| 国产成人系列免费观看| 国产精品美女特级片免费视频播放器 | 777久久人妻少妇嫩草av网站| 亚洲精品中文字幕一二三四区| 亚洲午夜理论影院| 午夜福利,免费看| www.熟女人妻精品国产| 日韩 欧美 亚洲 中文字幕| 十分钟在线观看高清视频www| 女人高潮潮喷娇喘18禁视频| 久99久视频精品免费| 久久香蕉精品热| 国产成人精品无人区| 不卡av一区二区三区| 久久国产精品大桥未久av| 亚洲中文日韩欧美视频| 欧美黑人欧美精品刺激| 国产精品永久免费网站| 精品视频人人做人人爽| 欧美一级毛片孕妇| 丁香欧美五月| 精品一区二区三区四区五区乱码| 亚洲全国av大片| 女警被强在线播放| 国产成人欧美| 久久九九热精品免费| 变态另类成人亚洲欧美熟女 | 亚洲国产欧美日韩在线播放| 男人的好看免费观看在线视频 | 多毛熟女@视频| videos熟女内射| e午夜精品久久久久久久| 新久久久久国产一级毛片| 美女 人体艺术 gogo| 亚洲全国av大片| 美女 人体艺术 gogo| 亚洲全国av大片| 久久久国产成人免费| 亚洲熟女毛片儿| 18禁裸乳无遮挡免费网站照片 | 在线观看舔阴道视频| 99在线人妻在线中文字幕 | 日韩欧美三级三区| 久久人妻av系列| 亚洲成人国产一区在线观看| 久久影院123| 欧美老熟妇乱子伦牲交| 国产精品永久免费网站| 午夜福利乱码中文字幕| √禁漫天堂资源中文www| 亚洲精品久久成人aⅴ小说| 日韩欧美在线二视频 | 午夜成年电影在线免费观看| 亚洲精品久久成人aⅴ小说| 免费av中文字幕在线| 80岁老熟妇乱子伦牲交| 美女扒开内裤让男人捅视频| 两个人免费观看高清视频| www.熟女人妻精品国产| 另类亚洲欧美激情| 国产精品永久免费网站| 精品一品国产午夜福利视频| 高清av免费在线| 波多野结衣av一区二区av| 两人在一起打扑克的视频| 乱人伦中国视频| 国产成人av教育| 国产在线一区二区三区精| 极品人妻少妇av视频| 国产精品影院久久| 国产亚洲欧美98| 天天影视国产精品| 777米奇影视久久| 一区福利在线观看| 法律面前人人平等表现在哪些方面| 国产高清激情床上av| 免费av中文字幕在线| 亚洲精品久久成人aⅴ小说| 国产精品永久免费网站| 亚洲成人国产一区在线观看| 丰满迷人的少妇在线观看| 99热只有精品国产| 亚洲情色 制服丝袜| 久久久精品免费免费高清| 久久久久精品国产欧美久久久| 80岁老熟妇乱子伦牲交| 精品第一国产精品| 岛国毛片在线播放| 色播在线永久视频| 国产精品av久久久久免费| 午夜福利影视在线免费观看| 亚洲七黄色美女视频| 欧美日韩av久久| 嫁个100分男人电影在线观看| 超碰97精品在线观看| 一级作爱视频免费观看| 好男人电影高清在线观看| 欧美日韩视频精品一区| 嫩草影视91久久| 十分钟在线观看高清视频www| 巨乳人妻的诱惑在线观看| 亚洲国产中文字幕在线视频| 国产精品久久久人人做人人爽| 两个人看的免费小视频| 成年人免费黄色播放视频| 99国产精品99久久久久| 叶爱在线成人免费视频播放| 色老头精品视频在线观看| 久久精品91无色码中文字幕| 亚洲成人免费电影在线观看| 国产熟女午夜一区二区三区| av天堂在线播放| 中出人妻视频一区二区| 日韩欧美一区二区三区在线观看 | 中文亚洲av片在线观看爽 | 每晚都被弄得嗷嗷叫到高潮| 女人精品久久久久毛片| 久久精品熟女亚洲av麻豆精品| 正在播放国产对白刺激| 亚洲成av片中文字幕在线观看| 国产1区2区3区精品| 免费高清在线观看日韩| 老司机亚洲免费影院| 中国美女看黄片| 美女视频免费永久观看网站| 免费在线观看亚洲国产| 久久精品熟女亚洲av麻豆精品| 国产aⅴ精品一区二区三区波| 欧美日韩中文字幕国产精品一区二区三区 | 曰老女人黄片| 一边摸一边抽搐一进一小说 | 日韩人妻精品一区2区三区| 亚洲熟女毛片儿| 免费在线观看黄色视频的| 精品亚洲成a人片在线观看| 美女扒开内裤让男人捅视频| 18禁国产床啪视频网站| 脱女人内裤的视频| 免费高清在线观看日韩| 成年版毛片免费区| 欧美亚洲 丝袜 人妻 在线| 老汉色∧v一级毛片| 免费不卡黄色视频| 国产淫语在线视频| 国产精品 欧美亚洲| 十八禁网站免费在线| 欧美乱码精品一区二区三区|