• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    中文維基百科的實體分類研究

    2015-04-21 10:40:05徐志浩惠浩添錢龍華朱巧明
    中文信息學(xué)報 2015年5期
    關(guān)鍵詞:維基百科類別條目

    徐志浩,惠浩添,錢龍華,朱巧明

    (1. 蘇州大學(xué) 自然語言處理實驗室,江蘇 蘇州 215006;2. 蘇州大學(xué) 計算機科學(xué)與技術(shù)學(xué)院,江蘇 蘇州 215006)

    ?

    中文維基百科的實體分類研究

    徐志浩1,2,惠浩添1,2,錢龍華1,2,朱巧明1,2

    (1. 蘇州大學(xué) 自然語言處理實驗室,江蘇 蘇州 215006;2. 蘇州大學(xué) 計算機科學(xué)與技術(shù)學(xué)院,江蘇 蘇州 215006)

    維基百科實體分類對自然語言處理和機器學(xué)習(xí)具有重要的作用。該文采用機器學(xué)習(xí)的方法對中文維基百科的條目進(jìn)行實體分類,在利用維基百科頁面中半結(jié)構(gòu)化信息和無結(jié)構(gòu)化文本作為基本特征的基礎(chǔ)上,結(jié)合中文的特點使用擴展特征和語義特征來提高實體分類性能。在人工標(biāo)注的語料庫上的實驗表明,這些額外特征有效地提高了ACE分類體系上的實體分類性能,總體F1值達(dá)到96%,同時在擴展實體分類上也取得了較好的效果,總體F1值達(dá)95%。

    維基百科;實體分類;半結(jié)構(gòu)化信息;信息框

    1 引言

    維基百科作為一個開放的知識庫系統(tǒng),其中的條目都是對一個概念或者實體的內(nèi)容描述,每個條目的頁面中包含了豐富的結(jié)構(gòu)化、半結(jié)構(gòu)化的信息和文本資源。維基百科實體分類是指對維基百科中的條目進(jìn)行識別和分類,從中提取出各種類型的實體(如人物、組織、地名等)。對于這些實體的分類有助于進(jìn)一步從維基百科中挖掘出更豐富的信息(如實體關(guān)系、語義關(guān)系等),同時維基百科中豐富的文本也為自然語言處理和機器學(xué)習(xí)提供了高質(zhì)量的語料來源[1-2]。

    2 相關(guān)工作

    對維基百科條目進(jìn)行實體的識別和分類,目前主要有兩種方法: 基于啟發(fā)式規(guī)則的方法和基于機器學(xué)習(xí)的方法。早期的方法主要是基于規(guī)則,如Bunescu 和Pasca[3]利用了標(biāo)題首字母大寫等一系列規(guī)則來識別英文維基百科的某個條目是否是一個命名實體。Zirn等[4]進(jìn)一步利用分類框(Category)中心詞的單復(fù)數(shù)形式這一規(guī)則,他們認(rèn)為如果類別中心詞是以單數(shù)形式出現(xiàn)的,這個中心詞就是一個實體。Toral等[5]則首先提取條目摘要中的第一句(稱為定義句),并找出句中所有名詞在WordNet中的語義層次及類別來幫助確定條目所屬的實體類別?;谝?guī)則方法的缺點是缺乏靈活性,需要對不同的實體類型制定不同的規(guī)則,并且隨著規(guī)則的增多,不同規(guī)則之間可能會產(chǎn)生沖突。

    利用機器學(xué)習(xí)來進(jìn)行實體識別和分類可以克服這一缺點。Bhole[6]在維基百科條目文章的第一段和全文文本上,分別利用詞包(bag-of-words)模型,使用SVM進(jìn)行條目的實體分類工作。Tardif等[7]將維基百科的摘要文本作為基本特征,并使用了分類框、信息框(Infobox)和模板(Template)等內(nèi)容作為額外特征。Dakka 和 Cucerzan[8]則將條目中的詞匯、結(jié)構(gòu)化信息(如表格)、摘要等內(nèi)容作為特征進(jìn)行組合,來獲得最好的分類效果。在Tardif和Dakka的實驗中,都對比了使用SVM分類器和樸素貝葉斯分類器的實驗結(jié)果,他們的實驗結(jié)果都表明SVM的分類性能更好。

    上述工作都是針對英文維基百科上的實體識別和分類,目前還沒有中文維基百科上的實體分類工作。雖然和英文維基百科相比,中文維基百科的容量要小得多,但它對中文自然語言處理的潛力還沒有被充分挖掘出來,相關(guān)的工作也比較少[9-10]。因此,對中文維基百科的條目進(jìn)行實體識別和分類具有一定的研究價值。本文在傳統(tǒng)特征的基礎(chǔ)上,提出了一系列針對中文特點的有效特征,使用SVM分類器進(jìn)行中文維基百科的實體分類,取得了較好的結(jié)果。

    3 維基百科頁面格式

    維基百科中每個條目都是對一個概念或?qū)嶓w的描述,條目的內(nèi)容由網(wǎng)絡(luò)志愿者協(xié)作編撰,任何使用互聯(lián)網(wǎng)的用戶都可以編寫和修改維基百科條目的文章內(nèi)容。在編寫過程中,用戶須遵循維基百科的格式要求。圖1為一個典型的維基百科頁面格式,它具有豐富的半結(jié)構(gòu)化信息和非結(jié)構(gòu)化文本,其主要內(nèi)容有:

    圖1 維基百科頁面格式

    1. 信息框(Infobox): 信息框模板是一個總結(jié)性的提綱列表,總結(jié)了與條目相關(guān)的主題,亦或包含圖像、地圖等信息。信息框中內(nèi)容的格式為標(biāo)簽(label)與數(shù)據(jù)(data),例如“馬云”這個人物條目的信息框中有“出生 1964年9月10日”、“國籍 中華人民共和國”、“母校 杭州師范大學(xué)”、“職業(yè) 阿里巴巴集團董事局主席”等與主題相關(guān)的信息。

    2. 頁面分類(Category): 頁面分類中列出了條目所屬的類別,以及突出條目事物特征或是主題的相關(guān)類別。一個條目可以被分類到多個類別下,需要注意的是,該分類體系并非嚴(yán)格的層次體系,具有一定的隨意性。例如,“馬云”這個條目的分類有“1964年出生”、“在世人物”、“中國企業(yè)家”、“杭州人”、“阿里巴巴集團”等。

    3. 摘要(Abstract): 摘要是指某個維基百科條目文章的第一段,其內(nèi)容以簡明扼要的文句給出該條目的主要信息內(nèi)容。摘要中的第一句,往往會有類似“……是……”或“……為……”等句式,我們把這樣的句子稱為顯式定義句,也會有不出現(xiàn)“是”或“為”的隱式定義句。定義句中的中心詞,很有可能反映出條目所屬的類別。例如,“馬云”這個條目的定義句為“馬云(英文名: Jack Ma,1964年9月10日-)中華人民共和國企業(yè)家”,其中心詞為“企業(yè)家”,可以推斷出,該條目的類別是人物。

    4 基于SVM的實體分類

    與傳統(tǒng)機器學(xué)習(xí)的分類方法類似,本文將人工標(biāo)注類別的維基百科條目分為訓(xùn)練集和測試集,從中提取各種特征,利用詞包模型,構(gòu)造相應(yīng)的特征向量,然后使用SVM分類器從訓(xùn)練集的特征向量中學(xué)習(xí)得到分類模型,最后將該分類模型應(yīng)用到測試集的特征向量上,預(yù)測條目的實體類別,并計算分類方法的性能。基于機器學(xué)習(xí)方法的關(guān)鍵在于找出有效的特征來表示維基百科中的條目,本文除了使用維基百科頁面中獲取的基本特征之外,還使用了一些擴展特征和語義特征來幫助提高中文維基百科的實體分類性能,詳見表1。

    表1 維基百科中的實體分類特征

    續(xù)表

    4.1 基本特征

    本文使用了以下三個類別的基本特征,即信息框、分類框和摘要中的相關(guān)內(nèi)容,具體如下。

    1. InfoboxTitle: 信息框中的內(nèi)容對于實體類型具有很好的識別作用。信息框中的信息形式為“標(biāo)簽 數(shù)據(jù)”,我們提取其中的標(biāo)簽的內(nèi)容作為一個特征,而不提取數(shù)據(jù)本身。例如,對于“國籍 中華人民共和國”,取“國籍”作為特征,因為不同的人物,對應(yīng)的國籍是不同的,而“國籍”這個標(biāo)簽是共同擁有的。例如,對于“馬云”這個條目,從其信息框中提取到的特征詞為分別為“出生”、“國籍”、“母校”、“職業(yè)”、“凈資產(chǎn)”、“配偶”和“子女”,這些特征詞基本都是人物的相關(guān)信息。

    2. CategoryHead: 分類框中的信息對實體分類同樣具有明顯的識別作用。對于每一個類別,通過分詞處理后,取其中心詞(即最右邊一個詞)作為特征。例如,“1964年出生”,通過分詞取得中心詞“出生”作為一個特征。因此,“馬云”這個條目的分類框中得到的特征詞分別為“出生”、“人物”、“企業(yè)家”、“億萬富豪”、“領(lǐng)袖”、“校友”、“教師”、“人”、“姓”、“人士”、“博士”和“集團”等。

    3. AbstractHead: 除了上述半結(jié)構(gòu)化信息外,在維基百科的文章中的第一段(即該條目的摘要)也可起到一定的補充作用。對于摘要的處理,我們?nèi)∑涞谝痪洌ㄟ^分詞和詞性標(biāo)注,找出第一句的中心詞(最右邊的名詞)作為特征。特別地,當(dāng)?shù)谝痪涞木涫浇Y(jié)構(gòu)為“……是……”或“……為……”時,更能通過正則匹配輕松獲得該句中心詞。例如,從“馬云”這個條目的摘要中提取到的特征為“企業(yè)家”。

    4.2 擴展特征

    為了更好地對某些類別(特別是人名、地名、組織名等)的實體進(jìn)行識別,我們加入了下面有關(guān)條目標(biāo)題的擴展特征。前兩個特征是用來幫助提高人物類別的分類性能,而后兩個特征對所有實體類別均有效。

    1. IsChineseName: 加入了中文百家姓姓氏列表,將條目名的第一個或前兩個字是否屬于姓氏并且條目標(biāo)題長度在2到4個字符為一個二元特征。

    2. TitleContainsPeriod: 標(biāo)題是否含有分隔符號。維基百科的外國人名的條目,標(biāo)題中會使用 “? ”分隔外文姓氏和名字,因此將標(biāo)題中是否含有分隔符作為一個二元特征。

    以上兩個特征的加入,用來幫助提高Person類別的分類性能。

    3. TitleLastChar: 考慮到某些命名實體在名稱上的特殊性,例如,地名中“XX省”、“XX市”、“XX縣”,機構(gòu)名中“XX局”、“XX部”,最后一個字有極高的規(guī)律性。因此通過加入條目標(biāo)題的最后一個字和詞作為兩個特征,來幫助提高ORG、GPE等實體類別的分類性能。

    4. TitleLastWord: 某些實體名如“XX協(xié)會”、“XX大學(xué)”,“XX山脈”等,最后一個詞具有很強的規(guī)律性,因此通過加入標(biāo)題的最后一個詞作為特征,來幫助這類實體的分類。

    4.3 語義特征

    由于維基百科由網(wǎng)民以共享合作方式撰寫,因此對于同一個或者類似的含義,可能會用不同的詞進(jìn)行表達(dá),例如,“警察”、“警務(wù)人員”、“警官”都表達(dá)類似的含義,都指向人物這個類別,導(dǎo)致了特征詞稀疏問題。因此,有必要在基本特征中對表達(dá)類似概念的詞匯進(jìn)行泛化,方法是引入了同義詞詞林,將特征詞匯的語義代碼作為一個特征加入到系統(tǒng)中。

    《同義詞詞林》[11]是一部漢語分類詞典,其中每一條詞語都用一個編碼來表示其語義類別。本文所用的《詞林》為《詞林(擴展版)》,是哈工大信息檢索研究室在《同義詞詞林》的基礎(chǔ)上研制的。最終的詞表包含77 492條詞語,共分為12個大類,94個中類,1 428個小類,小類下再以同義原則劃分詞群,最細(xì)的級別為原子詞群。不同級別的分類結(jié)果可以為自然語言處理提供不同顆粒度的語義類別信息,本文選取詞林語義代碼的第二級和第三級(即語義代碼的前2和前4位)進(jìn)行實驗。

    5 實驗

    5.1 數(shù)據(jù)來源

    實驗中所使用的維基百科數(shù)據(jù)來自于維基百科網(wǎng)站上下載的2014年8月4日中文離線數(shù)據(jù)包。首先需要將原有數(shù)據(jù)包文件中的XML標(biāo)記去除,保留所需要的文本內(nèi)容。由于維基百科的內(nèi)容中混合了繁體和簡體中文,為了便于后期處理,需要將所有中文統(tǒng)一轉(zhuǎn)化為簡體,最后從中提取出每個條目的標(biāo)題、信息框、分類框和摘要等相關(guān)信息。其中,對摘要的首句使用進(jìn)行分詞和詞性標(biāo)注。

    我們從所有條目中隨機取出8 000個條目作為實驗數(shù)據(jù),通過規(guī)則匹配去除消歧頁面和列表頁面后,剩下7 612個條目,然后根據(jù)ACE的中文命名實體的分類體系對條目進(jìn)行類別的標(biāo)注。

    實驗所使用的實體分類體系,是在ACE定義的中文命名實體分類基礎(chǔ)上,結(jié)合Sekine的擴展命名實體分類體系[12],考慮到實際信息抽取的需要進(jìn)行設(shè)置的。其中,PER、ORG、GPE、LOC和FAC等為ACE定義的五大類實體,其余九類為擴展類別。如非特別指出,下列實驗中的實體分類是指五類ACE實體,其余都為非實體;而擴展實體分類時,14類為實體類別,其余為非實體。

    5.2 實驗設(shè)置

    所有實驗都按照五折交叉驗證方式進(jìn)行,即實驗數(shù)據(jù)被隨機分成大小相同的五份,訓(xùn)練集和測試集的比例為4∶1,使用的分類工具為LibSVM,且SVM的訓(xùn)練參數(shù)均采用默認(rèn)值。實體分類結(jié)果分別使用準(zhǔn)確率(P)、召回率(R)和調(diào)和平均值(F1)進(jìn)行評估,最后取五次實驗的平均值作為最終結(jié)果。

    5.3 實驗結(jié)果

    5.3.1 各個特征對分類性能的影響

    為了考察各個特征對分類性能的影響,本文分別進(jìn)行了加入和分離實驗,前者以信息框和分類框特征為基準(zhǔn)系統(tǒng),然后單獨加入每個特征,比較它和基準(zhǔn)系統(tǒng)之間的性能差異;而后者是以所有特征為基準(zhǔn)系統(tǒng),然后分離出單個特征,比較它和基準(zhǔn)系統(tǒng)之間的性能差異。實驗結(jié)果如表2所示,其中性能差異用P/R/F1的變化值來表示,每一列中性能變化的最大值用粗體表示,加入實驗的正值表示該特征是有益的,而分離實驗的負(fù)值表示該特征是有效的。為便于參考,表格的第1行列出了兩個基準(zhǔn)系統(tǒng)的P/R/F1性能。

    從表2可以看出,各個特征加入實驗時的性能貢獻(xiàn)比分離實驗時的性能貢獻(xiàn)要大得多,這是由于特征之間往往存在著冗余性, 單獨使用時性能提升很明顯,而同時使用則效果不顯著,此外:

    表2 加入和分離實驗中不同特征的性能影響

    1. 貢獻(xiàn)最大的特征是TitleLastChar,無論是加入還是分離,都對準(zhǔn)確率和召回率有明顯的影響,這主要是由于條目標(biāo)題的最后一個字對不同類別具有很高的區(qū)分性,特別是對于GPE類,如“XX省”,“XX市”等,標(biāo)題最后一個字具有很強的區(qū)分性。同樣TitleLastWord特征的貢獻(xiàn)也很穩(wěn)定,雖然沒有TitleLastChar特征那么大;

    2. 特征AbstractHead在加入實驗中的作用很明顯,但在分離實驗中的變化要小得多,這可能是由于該特征本身很有用,但它和其他特征之間具有一定的冗余性;

    3. 兩個人名特征的效果并未達(dá)到預(yù)期值。特征IsChineseName的加入提高了準(zhǔn)確率,但同時召回率也明顯降低。這是由于不少GPE條目的首字母也是中文姓氏,與部分人名產(chǎn)生混淆。不過,雖然它在加入實驗時降低總體性能,但在分離實驗時卻表現(xiàn)出對總體性能略有幫助。同樣,特征TitleContainsPeriod對分類性能也有提高。

    4. 兩個語義特征的表現(xiàn)不一致。特征CategoryHeadTyccl的貢獻(xiàn)比較穩(wěn)定,無論是加入還是分離實驗,都表現(xiàn)出對提高性能的有效性。而特征AbstractHeadTyccl的表現(xiàn)就不一致,盡管在加入實驗中提高了總體性能,但在分離實驗中刪去該特征反而提高了總體性能,可以認(rèn)為該特征過于泛化。

    5.3.2 不同類別的性能比較

    根據(jù)上述分離實驗中各特征的性能表現(xiàn),最后確定使用除AbstractHeadTyccl以外所有的其他特征,得到最好的分類性能如表3所示。

    從表3可以看到,系統(tǒng)最終取得的分類性能還是較高的,平均F1值超過了96%。其中,性能最高的兩個類別為PER和GPE,這是由于這兩種類型的實例數(shù)較多且其條目的特征有較高的一致性, 因此在SVM中得以比較好的訓(xùn)練;而性能相對較低的三類為ORG、LOC和FAC等,F(xiàn)1值分別約為91%、94%和93%,且是召回率明顯低于準(zhǔn)確度,這是因為這三個類別的條目種類形態(tài)較多而樣例又較少,無法得到充分的訓(xùn)練,另外這三個類別下,很多沒召回的條目往往是Category和Abstract中能提取的特征較少或是有噪聲,而標(biāo)題中提取的特征詞又很稀疏,最后由于沒有提取到有效特征導(dǎo)致無法召回,例如,條目“日本郵政公社”,其摘要和Category中獲取到的特征詞分別為“體”和“郵政”、“事業(yè)”,而標(biāo)題尾詞“公社”在訓(xùn)練樣例中又屬于稀疏的詞,導(dǎo)致其無法召回為ORG。

    表3 不同類別的分類性能

    5.3.3 擴展實體類別的分類性能

    表4列出了在14個擴展實體類別上的分類性能(使用的特征集與表3相同)和每個類別的實體數(shù)量及所占比例,表中除ACE實體類別外最高的P/R/F1性能用粗體標(biāo)出。

    表4 擴展類別上的分類性能

    從表4可以看出,擴展至14個實體類別后的P/R/F1平均值為96.63%/94.31%/95.45%,與五個實體大類的分類性能相比雖有降低,但幅度較小,這主要是由于非ACE的實體類別數(shù)量較少,占總數(shù)比例小于四分之一。對非ACE的九個實體類別,各個類別的F1值和其條目的數(shù)量,大致上呈現(xiàn)一個線性關(guān)系。即由于訓(xùn)練樣例太少,從而導(dǎo)致特征稀疏,召回率下降,因此分類性能不盡理想,進(jìn)一步分析發(fā)現(xiàn):

    1. Work of Art、Animal和Flora三個類別與ACE中的ORG實例數(shù)量接近,其中Work of Art的性能和ORG相當(dāng),因為Work of Art中包括了電影、音樂、書籍等多種藝術(shù)形式,因此特征較為多樣化,而相比之下實例數(shù)較少,因此無法對特征進(jìn)行很好的學(xué)習(xí),導(dǎo)致召回率較低。Animal和Flora兩類的性能相比ORG明顯高,因為動物和植物的實例在特征上較為一致,都包含“屬”、“種”、“動物”、“植物”等特征詞,但由于這兩類的特征很相似,因此錯分的實例主要集中在這兩類之間互相分錯。

    2. Game和Disease這兩個類別盡管數(shù)量不多(前者不到40,后者略大于10),但F1性能都在85%以上,這是由于它們的特征雖然數(shù)量少但較為一致。例如,Game類實體中均含有“游戲”“開發(fā)商”“平臺”等特征詞;而Disease類的Category中都有“疾病”這個特征詞。

    5.3.4 與英文維基的實體分類性能比較

    為了考察不同語言之間維基實體分類的難度,本文比較了中英文維基實體的分類性能。英文維基的實體分類中比較典型的是Tkatchenko等[13]的研究工作。他們總共劃分了18個實體類別,本文共劃分14個實體類別,兩者共有的類別共有9個,因此本文選取了中英文共有且實例數(shù)量較多的類別進(jìn)行比較,結(jié)果如表5所示。

    表5 中文和英文維基實體分類性能的比較

    ①由于本文的使用的實體分類體系和Tkatchenko論文的分類體系有所不同,Tkatchenko論文中ASTRAL_BODY和GEO_REGION兩個類別為本文類別LOC的兩個子類,故在對比時,將本文LOC的性能與其兩類的性能作比較。

    需要指出的是,兩者所使用的分類體系和數(shù)據(jù)集不一樣(英文中使用18個類別,5 294個條目,本文使用14個類別,7 612個條目),不過,我們還是可以看出,英文維基百科的擴展實體分類性能整體上都優(yōu)于中文。在PER和GPE兩個類別上,中英文的性能旗鼓相當(dāng);而在其他類別上,兩者之間的分類性能還有相當(dāng)差距。可能的原因是中文的PER在Category上的特征一致性較高,GPE在標(biāo)題特征上一致性較高,另外這兩類的訓(xùn)練樣例數(shù)量相對較多,因此得到了比較理想的分類性能,而相比之下,中文的ORG、LOC和FAC,樣例的形態(tài)較為多樣,另外訓(xùn)練樣例又較少,導(dǎo)致部分特征較為稀疏。

    由于中文和英文在形態(tài)和語法上的區(qū)別,使得在英文中使用的很好的特征和規(guī)則,在中文上未必有效。例如,在Bunescu 和Pasca的論文中使用的首字母大寫這一規(guī)則來判斷某個條目是否屬于實體就無法在中文中使用;在Tkatchenko的論文中,在對實體分類前,通過使用一系列規(guī)則對實體與非實體進(jìn)行二元分類,精度和召回率都達(dá)到了95%。另外由于受到中文分詞技術(shù)的限制,在提取Category和Abstract中心詞時會出現(xiàn)一些錯誤和偏差,導(dǎo)致噪聲的引入,影響分類性能,而在英文中,就不存在這樣的分詞問題。

    此外,英文維基百科的發(fā)展比中文維基百科的發(fā)展更好,其在內(nèi)容的正確性和完整性上都優(yōu)于中文維基百科。我們觀察到,未能召回的中文條目,很大一部分條目的頁面內(nèi)容十分少,并缺乏相應(yīng)的Category和Infobox等半結(jié)構(gòu)化信息,導(dǎo)致無法提取到這些條目的有效特征,從而無法對這一部分條目進(jìn)行正確分類。

    5.4 錯誤分析

    為了進(jìn)一步了解產(chǎn)生分類錯誤的原因,本文隨機選取了100個錯分的維基條目進(jìn)行分析,發(fā)現(xiàn)分類錯誤原因主要有以下幾個類別:

    1. 分類框信息不規(guī)范。維基條目的分類框內(nèi)容并非完全都是條目所屬的嚴(yán)格意義上的某個類別,還包括與條目相關(guān)的類別。例如,條目“世界新聞自由日”的分類框中有“聯(lián)合國教科文組織”,得到特征詞“組織”,此特征導(dǎo)致條目被錯分為ORG。這部分錯誤占總數(shù)的44%;

    2. 標(biāo)題名稱的不確定性。某些類別的條目標(biāo)題和其他類別的條目標(biāo)題特征相似,從而產(chǎn)生誤導(dǎo)。例如,條目“赫爾曼·凱斯滕獎”和“曹洞宗”被錯分為PER類別,但實際上它們只是含有PER類別的某些特征。這類錯誤占總數(shù)的30%。

    3. 類屬條目和實體條目的相似性。所謂類屬條目是對某一實體類別的描述,因而在特征上與實體條目相似。例如,條目“皇上”、“動作片演員”這類稱謂、職業(yè)類條目易被錯分為PER類別。這類錯誤占總數(shù)的13%;

    4. 其他較為個別或者無法明確歸類的錯誤,約占總數(shù)的13%。例如,語言中存在著一詞多義現(xiàn)象,因此多義詞作為一個統(tǒng)一的特征時,容易引起錯誤。例如,“組織”這個詞,可能屬于“機構(gòu)”這個概念,也可能屬于“生物體”的概念。

    6 結(jié)論

    本文利用維基百科條目中的半結(jié)構(gòu)化信息作為特征,并根據(jù)中文實體的特點加入擴展特征和語義特征,從而對中文維基百科條目進(jìn)行實體分類。實驗表明,這些特征可以有效提高維基實體分類的性能。其中對于ACE實體類別的分類性能F1值超過96%,達(dá)到了實用價值;而對于擴展實體類別,則還需要通過標(biāo)注更多的實例來提高實例數(shù)較少的類別的分類性能。

    目前的方法都是基于詞匯層面,還未考慮到句法和語義層面,因此今后的工作一方面可考慮挖掘句法和語義特征,以進(jìn)一步提高分類性能;另一方面,可利用該分類模型對所有的維基百科條目進(jìn)行實體分類,并將這些識別出的命名實體應(yīng)用到自然語言處理的其他任務(wù)中。

    [1] Nothman J, Curran J R, Murphy T. Transforming Wikipedia into named entity training data[C]//Proceedings of the Australian Language Technology Workshop. 2008: 124-132.

    [2] Nothman J. Learning named entity recognition from Wikipedia[D]. The University of Sydney Australia 7, 2008.

    [3] Bunescu R C, Pasca M. Using Encyclopedic Knowledge for Named entity Disambiguation[C]//Proceedings of the EACL. 2006, 6: 9-16.

    [4] Zirn C, Nastase V, Strube M. Distinguishing between instances and classes in the wikipedia taxonomy[M]. Springer Berlin Heidelberg, 2008.

    [5] Toral A, Munoz R. A proposal to automatically build and maintain gazetteers for Named Entity Recognition by using Wikipedia[J]. NEW TEXT Wikis and blogs and other dynamic text sources, 2006, 56.

    [6] Bhole A, Fortuna B, Grobelnik M, et al. Extracting named entities and relating them over time based on wikipedia[J]. Informatica (Slovenia), 2007, 31(4): 463-468.

    [7] Tardif S, Curran J R, Murphy T. Improved text categorisation for Wikipedia named entities[C]//Proceedings of the Australasian Language Technology Association Workshop 2009. 2009: 104.

    [8] Dakka W, Cucerzan S. Augmenting Wikipedia withNamed Entity Tags[C]//Proceedings of the IJCNLP. 2008: 545-552.

    [9] 諶志群, 高飛, 曾智軍. 基于中文維基百科的詞語相關(guān)度計算[J]. 情報學(xué)報, 2013, 31(12): 1265-1270.

    [10] 張葦如, 孫樂, 韓先培. 基于維基百科和模式聚類的實體關(guān)系抽取方法[J]. 中文信息學(xué)報, 2012, 26(2): 75-81.

    [11] 梅家駒. 同義詞詞林[M]. 上海: 上海辭書出版社, 1983.

    [12] Sekine S, Sudo K, Nobata C. Extended Named Entity Hierarchy[C]//Proceedings of the LREC. 2002.

    [13] Tkatchenko M, Ulanov A, Simanovsky A. Classifying Wikipedia entities into fine-grained classes[C]//Proceedings of the Data Engineering Workshops (ICDEW), 2011 IEEE 27th International Conference on. IEEE, 2011: 212-217.

    Classifying Named Entities on Chinese Wikipedia

    XU Zhihao1,2,HUI Haotian1,2,QIAN Longhua1,2,ZHU Qiaoming1,2

    (1.Natural Language Processing Lab of Soochow University,Suzhou,Jiangsu 215006,China;2. School of Computer Science & Technology,Soochow University,Suzhou,Jiangsu 215006,China)

    Classifying Wikipedia Entities is of great significance to NLP and machine learning. This paper presents a machine learning based method to classify the Chinese Wikipedia articles. Besides using semi-structured data and non-structured text as basic features, we also extend to use Chinese-oriented features and semantic features in order to improve the classification performance. The experimental results on a manually tagged corpus show that the additional features significantly boost the entity classification performance with the overall F1-measure as high as 96% on the ACE entity type hierarchy and 95% on the extended entity type hierarchy.

    Wikipedia; named entities classification; semi-structured data; Infobox

    徐志浩(1991—),通信作者,碩士研究生,主要研究領(lǐng)域為信息抽取。E-mail:20134227020@stu.suda.edu.cn惠浩添(1991—),碩士研究生,主要研究領(lǐng)域為信息抽取。E-mail:20134227019@stu.suda.edu.cn錢龍華(1966—),副教授,碩士生導(dǎo)師,主要研究領(lǐng)域為自然語言處理。E-mail:qianlonghua@suda.edu.cn

    1003-0077(2015)05-0091-07

    2015-07-08 定稿日期: 2015-09-08

    國家自然科學(xué)基金(61373096,90920004),江蘇省高校自然科學(xué)研究重大項目(11KJA520003)

    TP391

    A

    猜你喜歡
    維基百科類別條目
    維基百科影響司法
    英語世界(2023年10期)2023-11-17 09:18:46
    維基百科青年
    英語文摘(2021年8期)2021-11-02 07:17:46
    《詞詮》互見條目述略
    Can we treat neurodegenerative diseases by preventing an age-related decline in microRNA expression?
    服務(wù)類別
    新校長(2016年8期)2016-01-10 06:43:59
    APP
    論類別股東會
    商事法論集(2014年1期)2014-06-27 01:20:42
    中醫(yī)類別全科醫(yī)師培養(yǎng)模式的探討
    IBM的監(jiān)視
    意林(2014年2期)2014-02-11 11:09:17
    聚合酶鏈?zhǔn)椒磻?yīng)快速鑒別5種常見肉類別
    九色亚洲精品在线播放| 97人妻精品一区二区三区麻豆 | 男人舔女人的私密视频| 亚洲av美国av| tocl精华| 国产高清videossex| 91在线观看av| 欧美+亚洲+日韩+国产| 国产精品二区激情视频| 久久久久九九精品影院| √禁漫天堂资源中文www| 欧美绝顶高潮抽搐喷水| 伊人久久大香线蕉亚洲五| 国产成年人精品一区二区| av网站免费在线观看视频| 久久久精品国产亚洲av高清涩受| 人妻丰满熟妇av一区二区三区| 亚洲自偷自拍图片 自拍| 色婷婷久久久亚洲欧美| 免费在线观看视频国产中文字幕亚洲| 黑人巨大精品欧美一区二区蜜桃| 久久久精品欧美日韩精品| 国产欧美日韩一区二区精品| 丁香六月欧美| 身体一侧抽搐| 天堂√8在线中文| 黄片大片在线免费观看| 亚洲欧洲精品一区二区精品久久久| 欧美国产精品va在线观看不卡| 女人高潮潮喷娇喘18禁视频| 国产精品精品国产色婷婷| 操出白浆在线播放| 久久影院123| 亚洲欧美精品综合一区二区三区| 亚洲精品久久成人aⅴ小说| 黄频高清免费视频| 91麻豆av在线| 欧美日韩精品网址| 在线观看一区二区三区| av网站免费在线观看视频| 成人亚洲精品av一区二区| 亚洲va日本ⅴa欧美va伊人久久| av中文乱码字幕在线| 国产精品日韩av在线免费观看 | 午夜免费鲁丝| 韩国av一区二区三区四区| 老熟妇乱子伦视频在线观看| 97人妻精品一区二区三区麻豆 | 国产成人啪精品午夜网站| 国产精品一区二区三区四区久久 | 亚洲三区欧美一区| 成人国产一区最新在线观看| av天堂在线播放| 免费av毛片视频| 琪琪午夜伦伦电影理论片6080| av超薄肉色丝袜交足视频| av福利片在线| 性欧美人与动物交配| 午夜成年电影在线免费观看| 美女高潮到喷水免费观看| 国产午夜精品久久久久久| 日本a在线网址| 午夜免费激情av| av福利片在线| 午夜福利成人在线免费观看| 中文字幕久久专区| 欧美日本视频| 亚洲精品一卡2卡三卡4卡5卡| 日本黄色视频三级网站网址| 黄色 视频免费看| 成人特级黄色片久久久久久久| 亚洲 国产 在线| 亚洲自拍偷在线| 他把我摸到了高潮在线观看| 变态另类丝袜制服| 最近最新中文字幕大全免费视频| 久久性视频一级片| 在线观看日韩欧美| 女人精品久久久久毛片| 亚洲第一电影网av| 9191精品国产免费久久| 国产精品1区2区在线观看.| 女人被躁到高潮嗷嗷叫费观| 午夜视频精品福利| 国产精品综合久久久久久久免费 | 国产精品爽爽va在线观看网站 | 欧美激情 高清一区二区三区| 亚洲无线在线观看| a级毛片在线看网站| 亚洲人成电影免费在线| 在线av久久热| 久久热在线av| 亚洲一区二区三区不卡视频| 在线观看免费视频日本深夜| 韩国精品一区二区三区| 亚洲片人在线观看| 老汉色av国产亚洲站长工具| 国产精品av久久久久免费| 日本 欧美在线| 日本vs欧美在线观看视频| www.精华液| 中文字幕高清在线视频| 久久久久国产精品人妻aⅴ院| 悠悠久久av| 午夜福利欧美成人| 久久香蕉国产精品| 久久天躁狠狠躁夜夜2o2o| 老鸭窝网址在线观看| 一级,二级,三级黄色视频| 别揉我奶头~嗯~啊~动态视频| 成人18禁在线播放| 一本综合久久免费| 欧美一区二区精品小视频在线| 国产精品久久久久久精品电影 | 亚洲av电影在线进入| 国产成人影院久久av| 一进一出抽搐动态| 国产高清videossex| 国产成+人综合+亚洲专区| 亚洲人成网站在线播放欧美日韩| 精品人妻1区二区| avwww免费| 在线天堂中文资源库| 大型av网站在线播放| 欧美日韩一级在线毛片| 午夜成年电影在线免费观看| 看黄色毛片网站| 不卡av一区二区三区| 一区二区三区激情视频| 无遮挡黄片免费观看| 国产黄a三级三级三级人| 亚洲欧美一区二区三区黑人| 日本一区二区免费在线视频| 人人澡人人妻人| 手机成人av网站| 久久欧美精品欧美久久欧美| 国产精品,欧美在线| 久久亚洲真实| 久久草成人影院| 亚洲av片天天在线观看| 国产成人欧美| 国产精品,欧美在线| 国产精品久久久久久人妻精品电影| 国内精品久久久久久久电影| 丁香六月欧美| 成人特级黄色片久久久久久久| 亚洲片人在线观看| 久久人妻熟女aⅴ| 久久久国产成人精品二区| 我的亚洲天堂| 国产亚洲av高清不卡| 精品一品国产午夜福利视频| 久久久久久国产a免费观看| 欧美成狂野欧美在线观看| 丰满人妻熟妇乱又伦精品不卡| 国产精品乱码一区二三区的特点 | 三级毛片av免费| 一级毛片女人18水好多| 国产成人欧美| 欧美激情 高清一区二区三区| 啪啪无遮挡十八禁网站| 十分钟在线观看高清视频www| 91精品国产国语对白视频| av免费在线观看网站| 日本欧美视频一区| 亚洲av电影在线进入| 久9热在线精品视频| 久久伊人香网站| 热re99久久国产66热| 一边摸一边做爽爽视频免费| 丁香欧美五月| 亚洲aⅴ乱码一区二区在线播放 | 一二三四在线观看免费中文在| 自线自在国产av| 久久精品影院6| 一级,二级,三级黄色视频| 成人三级做爰电影| 亚洲国产日韩欧美精品在线观看 | 国产亚洲欧美在线一区二区| 少妇裸体淫交视频免费看高清 | 黑人巨大精品欧美一区二区mp4| 亚洲精品久久成人aⅴ小说| 国产精品av久久久久免费| 久久久国产成人免费| 久久人人爽av亚洲精品天堂| 欧美日韩瑟瑟在线播放| 97碰自拍视频| 亚洲视频免费观看视频| 免费观看人在逋| 国产97色在线日韩免费| 亚洲国产日韩欧美精品在线观看 | 久久青草综合色| 一级黄色大片毛片| 男女午夜视频在线观看| 亚洲熟妇中文字幕五十中出| www.www免费av| 色综合欧美亚洲国产小说| 91老司机精品| 女同久久另类99精品国产91| 波多野结衣高清无吗| 日韩三级视频一区二区三区| 男人的好看免费观看在线视频 | 变态另类丝袜制服| 一边摸一边抽搐一进一小说| 久久人妻av系列| 在线观看免费视频日本深夜| av在线播放免费不卡| 久久亚洲真实| 欧美另类亚洲清纯唯美| 无限看片的www在线观看| 亚洲 国产 在线| 大陆偷拍与自拍| 最新在线观看一区二区三区| 色播在线永久视频| 乱人伦中国视频| 女性生殖器流出的白浆| 中文字幕人妻熟女乱码| 99精品在免费线老司机午夜| 久久精品91蜜桃| 国产精品久久久久久精品电影 | 一区二区三区精品91| 欧美中文综合在线视频| 99国产精品99久久久久| 身体一侧抽搐| 亚洲av美国av| 99国产精品一区二区蜜桃av| 99久久综合精品五月天人人| 一级毛片精品| 少妇粗大呻吟视频| 国产不卡一卡二| 亚洲aⅴ乱码一区二区在线播放 | 亚洲成人国产一区在线观看| 久久天躁狠狠躁夜夜2o2o| 成人亚洲精品av一区二区| 一本综合久久免费| 此物有八面人人有两片| 久久久国产精品麻豆| 亚洲色图 男人天堂 中文字幕| 国内精品久久久久精免费| 国产99白浆流出| 亚洲国产精品999在线| 叶爱在线成人免费视频播放| 别揉我奶头~嗯~啊~动态视频| 久久久久久久久免费视频了| 国产亚洲av高清不卡| 国产欧美日韩一区二区三| 中国美女看黄片| 黄色丝袜av网址大全| 国产精品亚洲一级av第二区| 国产精品久久久久久精品电影 | 大香蕉久久成人网| 国内久久婷婷六月综合欲色啪| 亚洲欧美激情在线| 日韩 欧美 亚洲 中文字幕| 满18在线观看网站| 午夜福利成人在线免费观看| 手机成人av网站| 免费少妇av软件| 制服丝袜大香蕉在线| 操出白浆在线播放| 丁香六月欧美| 欧美一区二区精品小视频在线| 国产91精品成人一区二区三区| 日本 欧美在线| 午夜成年电影在线免费观看| 九色亚洲精品在线播放| 日韩精品免费视频一区二区三区| 亚洲黑人精品在线| 精品久久久久久成人av| 老熟妇乱子伦视频在线观看| 久久亚洲精品不卡| av超薄肉色丝袜交足视频| 校园春色视频在线观看| 欧美日韩精品网址| 色综合亚洲欧美另类图片| 中亚洲国语对白在线视频| 美女扒开内裤让男人捅视频| 在线观看免费视频日本深夜| 天堂动漫精品| 久久午夜亚洲精品久久| 久久 成人 亚洲| 嫩草影视91久久| 精品不卡国产一区二区三区| 日韩 欧美 亚洲 中文字幕| 老鸭窝网址在线观看| 欧美大码av| 夜夜看夜夜爽夜夜摸| 久久精品影院6| 人人妻人人澡人人看| 亚洲色图综合在线观看| 乱人伦中国视频| 日韩欧美免费精品| 亚洲一区高清亚洲精品| 欧美 亚洲 国产 日韩一| 97人妻精品一区二区三区麻豆 | 无限看片的www在线观看| 午夜影院日韩av| 啪啪无遮挡十八禁网站| 50天的宝宝边吃奶边哭怎么回事| 久久人人97超碰香蕉20202| 久久中文字幕一级| 亚洲人成伊人成综合网2020| 女性被躁到高潮视频| 他把我摸到了高潮在线观看| 欧美人与性动交α欧美精品济南到| 欧美日本视频| 一区二区日韩欧美中文字幕| 亚洲五月婷婷丁香| 黑人欧美特级aaaaaa片| 国产99白浆流出| 欧美激情极品国产一区二区三区| 久久久国产成人免费| 久久久久久久久中文| 精品国产超薄肉色丝袜足j| 国产亚洲欧美在线一区二区| 亚洲人成伊人成综合网2020| 欧美绝顶高潮抽搐喷水| 亚洲激情在线av| 可以在线观看的亚洲视频| 免费观看精品视频网站| 99久久久亚洲精品蜜臀av| 视频区欧美日本亚洲| 亚洲人成伊人成综合网2020| 少妇熟女aⅴ在线视频| 一a级毛片在线观看| 中文字幕人妻熟女乱码| 两性午夜刺激爽爽歪歪视频在线观看 | 岛国在线观看网站| 国产欧美日韩一区二区三| 欧美人与性动交α欧美精品济南到| netflix在线观看网站| 丁香欧美五月| 久久久久久久久久久久大奶| √禁漫天堂资源中文www| 妹子高潮喷水视频| 19禁男女啪啪无遮挡网站| 十分钟在线观看高清视频www| www日本在线高清视频| 88av欧美| 国产成人av教育| 老司机在亚洲福利影院| 99精品欧美一区二区三区四区| 午夜老司机福利片| 免费在线观看视频国产中文字幕亚洲| 国产高清激情床上av| 又大又爽又粗| 看片在线看免费视频| 亚洲成人精品中文字幕电影| 一级,二级,三级黄色视频| 中文字幕av电影在线播放| 无遮挡黄片免费观看| 日本 欧美在线| 制服人妻中文乱码| 999精品在线视频| 久久中文字幕人妻熟女| 久久伊人香网站| 丝袜在线中文字幕| 美女高潮到喷水免费观看| 99久久精品国产亚洲精品| 久热爱精品视频在线9| 欧美黄色片欧美黄色片| 很黄的视频免费| 精品福利观看| 欧美日本中文国产一区发布| 99在线视频只有这里精品首页| 午夜福利影视在线免费观看| 久久精品aⅴ一区二区三区四区| 欧美日韩福利视频一区二区| 无限看片的www在线观看| 一区二区日韩欧美中文字幕| av福利片在线| 99国产精品99久久久久| 两个人免费观看高清视频| 欧美日韩一级在线毛片| 欧美性长视频在线观看| 99国产精品免费福利视频| 久久草成人影院| 色哟哟哟哟哟哟| 免费女性裸体啪啪无遮挡网站| 成年女人毛片免费观看观看9| 久热爱精品视频在线9| 嫩草影院精品99| 天堂影院成人在线观看| 日韩免费av在线播放| 亚洲五月天丁香| 亚洲国产欧美网| 18禁国产床啪视频网站| 国产亚洲欧美98| 亚洲 欧美 日韩 在线 免费| 免费女性裸体啪啪无遮挡网站| 亚洲 欧美一区二区三区| avwww免费| 亚洲欧美激情综合另类| 亚洲精品一卡2卡三卡4卡5卡| 久久久久久久午夜电影| svipshipincom国产片| 国产精品久久久久久亚洲av鲁大| 这个男人来自地球电影免费观看| 久久精品国产综合久久久| 久久婷婷人人爽人人干人人爱 | 久久婷婷成人综合色麻豆| 51午夜福利影视在线观看| 高潮久久久久久久久久久不卡| 啦啦啦免费观看视频1| 成人手机av| 女性被躁到高潮视频| 国产精品九九99| 伦理电影免费视频| 日本五十路高清| 久久性视频一级片| 色婷婷久久久亚洲欧美| 国产黄a三级三级三级人| 91麻豆av在线| 乱人伦中国视频| 大香蕉久久成人网| 757午夜福利合集在线观看| 亚洲精品国产精品久久久不卡| 欧洲精品卡2卡3卡4卡5卡区| 成人国产一区最新在线观看| 国产精品 国内视频| 91九色精品人成在线观看| 亚洲男人天堂网一区| 国产成人欧美在线观看| 麻豆久久精品国产亚洲av| 欧美成人性av电影在线观看| 一级毛片高清免费大全| av视频免费观看在线观看| 97碰自拍视频| 日韩高清综合在线| 无限看片的www在线观看| 亚洲精品美女久久久久99蜜臀| 欧美另类亚洲清纯唯美| 999久久久国产精品视频| 午夜福利在线观看吧| 久久精品国产综合久久久| 精品乱码久久久久久99久播| 久久久久国产一级毛片高清牌| 999久久久精品免费观看国产| 69av精品久久久久久| 成人精品一区二区免费| 日韩欧美一区视频在线观看| 老鸭窝网址在线观看| 两个人看的免费小视频| 色在线成人网| 精品熟女少妇八av免费久了| 国产精品亚洲一级av第二区| tocl精华| 啦啦啦韩国在线观看视频| 国产男靠女视频免费网站| 夜夜爽天天搞| av电影中文网址| 国产精品九九99| 久久热在线av| 亚洲精品久久成人aⅴ小说| 操美女的视频在线观看| 色哟哟哟哟哟哟| www.www免费av| 亚洲一区中文字幕在线| 90打野战视频偷拍视频| 最近最新中文字幕大全电影3 | 两性午夜刺激爽爽歪歪视频在线观看 | 色播亚洲综合网| 国产激情欧美一区二区| 天堂动漫精品| 50天的宝宝边吃奶边哭怎么回事| 欧美黑人精品巨大| 中出人妻视频一区二区| 久久久久久免费高清国产稀缺| 亚洲一码二码三码区别大吗| 午夜福利影视在线免费观看| 亚洲熟妇熟女久久| 一区在线观看完整版| 亚洲 欧美 日韩 在线 免费| 欧美激情高清一区二区三区| 麻豆一二三区av精品| 少妇被粗大的猛进出69影院| 美女扒开内裤让男人捅视频| 91成人精品电影| 无人区码免费观看不卡| 日本免费一区二区三区高清不卡 | 亚洲av片天天在线观看| 国产一区二区三区综合在线观看| 成人18禁在线播放| 久久精品aⅴ一区二区三区四区| 精品久久蜜臀av无| 久久久国产欧美日韩av| 操出白浆在线播放| 身体一侧抽搐| 两性夫妻黄色片| 不卡一级毛片| 欧美乱妇无乱码| 欧美成人午夜精品| 国产成人精品久久二区二区91| 一本大道久久a久久精品| 久久精品人人爽人人爽视色| 啦啦啦韩国在线观看视频| 岛国视频午夜一区免费看| 亚洲欧洲精品一区二区精品久久久| 国产高清激情床上av| 美女扒开内裤让男人捅视频| 黄色 视频免费看| 真人一进一出gif抽搐免费| 亚洲三区欧美一区| 在线观看免费日韩欧美大片| 亚洲熟女毛片儿| 最近最新免费中文字幕在线| 岛国在线观看网站| 搡老妇女老女人老熟妇| 成人永久免费在线观看视频| 黄色视频,在线免费观看| 99久久99久久久精品蜜桃| 国产亚洲欧美在线一区二区| 精品国产乱子伦一区二区三区| 国产精品久久久久久精品电影 | 久久久久精品国产欧美久久久| 国产高清激情床上av| www.精华液| 男女下面进入的视频免费午夜 | 一本久久中文字幕| 一级黄色大片毛片| 午夜福利在线观看吧| 精品不卡国产一区二区三区| 久久精品成人免费网站| 国产精品99久久99久久久不卡| 两个人视频免费观看高清| 国产精品乱码一区二三区的特点 | 两性午夜刺激爽爽歪歪视频在线观看 | 中出人妻视频一区二区| 久久人人精品亚洲av| 国产区一区二久久| 涩涩av久久男人的天堂| x7x7x7水蜜桃| 日韩欧美国产一区二区入口| 99久久国产精品久久久| ponron亚洲| 午夜老司机福利片| 嫩草影视91久久| 夜夜夜夜夜久久久久| 在线视频色国产色| 人妻久久中文字幕网| 一a级毛片在线观看| www.精华液| 国产av一区二区精品久久| 午夜久久久久精精品| 久久天堂一区二区三区四区| 91大片在线观看| www.999成人在线观看| 国产99久久九九免费精品| 变态另类丝袜制服| 成人欧美大片| 亚洲,欧美精品.| 高潮久久久久久久久久久不卡| 啦啦啦 在线观看视频| 日日摸夜夜添夜夜添小说| 久久精品人人爽人人爽视色| 亚洲av片天天在线观看| 女性生殖器流出的白浆| 在线国产一区二区在线| videosex国产| 搡老熟女国产l中国老女人| 久久人妻福利社区极品人妻图片| 精品卡一卡二卡四卡免费| 久久久精品欧美日韩精品| 9191精品国产免费久久| 大陆偷拍与自拍| 不卡av一区二区三区| 丝袜美腿诱惑在线| 美国免费a级毛片| 嫩草影院精品99| 又黄又粗又硬又大视频| 亚洲精品中文字幕一二三四区| 手机成人av网站| 午夜福利在线观看吧| 国产视频一区二区在线看| 午夜精品在线福利| 老汉色∧v一级毛片| 国产欧美日韩综合在线一区二区| 日韩欧美国产一区二区入口| 十分钟在线观看高清视频www| 国产又爽黄色视频| 免费久久久久久久精品成人欧美视频| 男女做爰动态图高潮gif福利片 | 欧美精品啪啪一区二区三区| 亚洲欧美一区二区三区黑人| 手机成人av网站| 国产精品 国内视频| 亚洲欧美日韩另类电影网站| 一级,二级,三级黄色视频| 欧美精品亚洲一区二区| 国产精品 国内视频| 亚洲三区欧美一区| 久9热在线精品视频| 黑人巨大精品欧美一区二区蜜桃| 国产精品亚洲av一区麻豆| 精品一品国产午夜福利视频| 午夜久久久在线观看| 国产精品,欧美在线| 国产精品电影一区二区三区| 久久香蕉国产精品| 亚洲午夜理论影院| 免费看美女性在线毛片视频| 欧美精品啪啪一区二区三区| 免费看十八禁软件| 在线观看www视频免费| 无人区码免费观看不卡| 丁香欧美五月| 日韩欧美国产在线观看| 19禁男女啪啪无遮挡网站| 在线观看舔阴道视频| 日本a在线网址| 亚洲欧美日韩另类电影网站| 午夜精品久久久久久毛片777| 天天躁夜夜躁狠狠躁躁| 女人被狂操c到高潮| 午夜福利一区二区在线看|