• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于未登錄詞識(shí)別的微博評價(jià)短語抽取方法

    2017-07-10 10:27:27汪龍慶劉振宇
    關(guān)鍵詞:短語準(zhǔn)確率詞語

    汪龍慶 張 超 宋 暉* 劉振宇

    1(東華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 上海 201600)2(上海計(jì)算機(jī)軟件技術(shù)開發(fā)中心上海市計(jì)算機(jī)軟件評測重點(diǎn)實(shí)驗(yàn)室 上海 201112)

    基于未登錄詞識(shí)別的微博評價(jià)短語抽取方法

    汪龍慶1張 超1宋 暉1*劉振宇2

    1(東華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 上海 201600)2(上海計(jì)算機(jī)軟件技術(shù)開發(fā)中心上海市計(jì)算機(jī)軟件評測重點(diǎn)實(shí)驗(yàn)室 上海 201112)

    由于微博內(nèi)容話題分散,識(shí)別博文評論對象是微博情感分析研究的熱點(diǎn)和難點(diǎn)。研究表明未登錄詞識(shí)別是導(dǎo)致評價(jià)短語識(shí)別率低的重要原因之一。針對這種情況,提出一種基于文本詞序列的詞頻、凝聚度、左右自由度等統(tǒng)計(jì)特征學(xué)習(xí)未登錄詞識(shí)別模型的方法。實(shí)驗(yàn)結(jié)果表明,將自動(dòng)識(shí)別的微博文本中的未登錄詞加入基于CRFs的評價(jià)短語識(shí)別算法后,顯著地提高了評價(jià)短語識(shí)別的準(zhǔn)確率和召回率。未登錄詞的學(xué)習(xí)算法直接利用評價(jià)短語識(shí)別的標(biāo)注樣本,具有較強(qiáng)的可行性。

    微博 評價(jià)短語 未登錄詞 統(tǒng)計(jì)特征 CRFs

    ComputerSoftwareTechnology,Shanghai201112,China)

    0 引 言

    近年來微博作為一種新的分享和社交平臺(tái)越來越受到人們的關(guān)注,微博平臺(tái)以其時(shí)效性和靈活性經(jīng)常成為新事件和熱點(diǎn)話題的前沿陣地。

    人們在微博上發(fā)表對政治、經(jīng)濟(jì)、文化和社會(huì)等各個(gè)方面的觀點(diǎn)和看法,充分利用海量微博數(shù)據(jù)進(jìn)行用戶情感傾向性分析,對政府輿情監(jiān)控、企業(yè)廣告投放、用戶行為預(yù)測和信息決策提供了重要參考。微博不同于電商和新聞等專業(yè)領(lǐng)域網(wǎng)站,用戶發(fā)布的博文目標(biāo)分散、用語隨意,要對微博進(jìn)行情感傾向性分析,評價(jià)短語的識(shí)別變得尤為重要。

    評價(jià)短語的識(shí)別是從文本中自動(dòng)抽取出情感表達(dá)所針對的對象,是情感要素傾向性分析的基礎(chǔ),也是情感傾向性研究的重要任務(wù)之一[1-2]。針對評價(jià)短語的識(shí)別,目前大部分學(xué)者的研究主要是基于句法分析和關(guān)聯(lián)規(guī)則等方法。如倪茂樹等[3]提出一種基于關(guān)聯(lián)規(guī)則和極性分析的商品評論挖掘算法,利用詞與詞之間的關(guān)聯(lián)關(guān)系準(zhǔn)確定位每一個(gè)評價(jià)短語的具體位置。劉鴻宇等[4]則是采用網(wǎng)絡(luò)挖掘的PMI算法和名詞剪枝算法對候選評價(jià)短語進(jìn)行篩選。以上方法評價(jià)短語識(shí)別的準(zhǔn)確性都不高,其中影響抽取評價(jià)短語的重要原因之一是未登錄詞識(shí)別。在大規(guī)模中文文本的自動(dòng)分詞處理中,未登錄詞也是造成分詞錯(cuò)誤的一個(gè)重要原因。因此,提高未登錄詞識(shí)別的準(zhǔn)確性對于評價(jià)短語識(shí)別具有重要作用。

    漢語未登錄詞識(shí)別, 現(xiàn)有研究大多采用基于詞語結(jié)構(gòu)信息和基于規(guī)則的方法,也有利用未登錄詞上下文信息, 通過計(jì)算與已知詞類詞語上下文的相似度來進(jìn)行預(yù)測。依據(jù)模型和算法的不同, 歸納為以下3種方法:

    1) 基于統(tǒng)計(jì)的方法

    基于統(tǒng)計(jì)的方法,又稱為基于語料庫的方法,其主要思想是通過對大規(guī)模語料庫中的語言信息進(jìn)行獲取、學(xué)習(xí)和歸納,再使用統(tǒng)計(jì)方法進(jìn)行建模,最后使用建好的模型進(jìn)行詞性標(biāo)注。 Wang、Chen等通過尋找詞語的詞頻、剛性、“二元語法“統(tǒng)計(jì)模型等統(tǒng)計(jì)特征來進(jìn)行未登錄詞識(shí)別[5-7]。

    2) 基于規(guī)則的方法

    基于規(guī)則的方法主要是利用語言學(xué)家根據(jù)語言學(xué)原理和知識(shí)人工制定的一系列規(guī)則,在進(jìn)行文本標(biāo)注時(shí)通過匹配規(guī)則庫中的規(guī)則對文本進(jìn)行詞性標(biāo)注。賈自艷等通過單字、多字組合規(guī)則進(jìn)行未登錄詞識(shí)別[7]。王立希等提出了一種基于主題式搜索引擎的專業(yè)詞典庫發(fā)現(xiàn)新專業(yè)詞匯的方法,詳述了如何通過關(guān)聯(lián)規(guī)則挖掘來實(shí)現(xiàn)專業(yè)詞典庫的擴(kuò)展[8]。

    3) 基于統(tǒng)計(jì)和規(guī)則相結(jié)合的方法

    這類方法即是將以上兩種方法進(jìn)行結(jié)合,從而可以充分利用基于統(tǒng)計(jì)方法和基于規(guī)則方法的優(yōu)勢,使得在詞性標(biāo)注任務(wù)中既充分地發(fā)揮基于統(tǒng)計(jì)方法的優(yōu)勢,又能夠有效地利用語言學(xué)家編撰的語言規(guī)則。周蕾等介紹了一種基于知識(shí)和規(guī)則的混合模型[9],該方法分為兩個(gè)步驟:首先,對文本進(jìn)行分詞,對分詞結(jié)果中的碎片進(jìn)行全切分生成臨時(shí)詞典,并利用規(guī)則和頻度信息給臨時(shí)詞典中的每個(gè)字串賦權(quán)值,利用貪心算法獲得每個(gè)碎片的最長路徑,從而提取未登錄詞;然后,在上一步驟的基礎(chǔ)上,建立二元模型來提取由若干個(gè)詞組合而成的未登錄詞。

    基于規(guī)則的方法具有準(zhǔn)確率高的特點(diǎn),但規(guī)則的編寫和維護(hù)卻比較復(fù)雜。規(guī)則一般都是與領(lǐng)域相關(guān)的,通用性較差,這就導(dǎo)致基于規(guī)則的方法不易維護(hù)和移植。 基于統(tǒng)計(jì)的方法則具有領(lǐng)域關(guān)聯(lián)性小、使用規(guī)則少、可移植性好、應(yīng)用靈活等特點(diǎn),但需要大規(guī)模的語料進(jìn)行訓(xùn)練,同時(shí)也存在準(zhǔn)確率不高的問題。正因?yàn)榛谝?guī)則和基于統(tǒng)計(jì)兩種方法各有缺點(diǎn),現(xiàn)在多采用二者相結(jié)合的方法,以達(dá)到更好的識(shí)別效果。上述方法都依賴于不易得到的輔助工具,而且規(guī)則復(fù)雜,系統(tǒng)實(shí)現(xiàn)困難。針對以上存在的不足,本文提出了一種基于詞頻、凝聚度和左右自由度等統(tǒng)計(jì)特征學(xué)習(xí)未登錄詞識(shí)別模型的算法,然后在基于條件隨機(jī)場的評價(jià)短語識(shí)別算法中引入識(shí)別的新詞來提高微博中各種新出現(xiàn)的評價(jià)短語的識(shí)別性能,最后通過實(shí)驗(yàn)驗(yàn)證了算法的有效性。

    1 未登錄詞特征分析

    1.1 未登錄詞定義

    對于待確定的詞語,在和已有詞庫進(jìn)行比較后,如果已有詞庫不包含該待確定的詞,那么它就被認(rèn)為是未登錄詞UW。

    1.2 未登錄詞特征

    針對未登錄詞判別問題,本文提出了通過詞頻、停用字、凝聚度和自由度這四個(gè)維度進(jìn)行未登錄詞識(shí)別。

    凝聚度標(biāo)示著詞語的成詞能力,假設(shè)詞A出現(xiàn)的概率為P(A),詞B出現(xiàn)的概率為P(B),詞A與B同時(shí)出現(xiàn)的概率為P(AB)。若詞A和詞B獨(dú)立,則P(AB)=P(A)P(B);若P(AB)?P(A)P(B),這說明詞A與詞B并不是完全獨(dú)立,可能存在某種內(nèi)在的聯(lián)系。借助于這種思想,將詞A和B的內(nèi)部結(jié)合的緊密程度表示為 P(AB)/P(A)P(B),值越大說明詞A和B組成新詞或者成為新詞一部分的概率越大。

    錯(cuò)誤的切分方法會(huì)過高地估計(jì)片段的凝合程度。假設(shè)一個(gè)文本片段由ABC三個(gè)字依次組合而成。可能的組合方式就有A+BC和AB+C兩種,故將ABC的凝聚程度表示為P(ABC)/P(A)P(BC)和P(ABC)/P(A B)P(C)中的較小者。

    如果一個(gè)文本片段是一個(gè)單獨(dú)的詞,它應(yīng)該能夠反復(fù)地出現(xiàn)在各種不同的上下文中,具有非常豐富的左鄰字集合和右鄰字集合。本文把一個(gè)文本片段的自由運(yùn)用程度定義為它的左自由度和右自由度中的較小值。

    “自由度”是指一個(gè)字符串的鄰接集合中鄰接字種類的數(shù)量,自由度越大,表明字符串的邊界集合中字符的種類越多,即與該字符串相鄰的字符越復(fù)雜,那么該字符串成為邊界的可能性就越大,反之亦然。通常用信息熵來衡量邊界自由度大小。信息熵反映了一個(gè)事件的發(fā)生帶來的信息量。

    對于已有詞庫不包含的詞語,如果被判定為未登錄詞,首先,該詞語應(yīng)該不包括停用字;其次,詞語間的凝聚度能夠達(dá)到一定數(shù)值;最后,如果詞語能夠被判定為未登錄詞,則其自由度應(yīng)該足夠高,也就是結(jié)合能力較強(qiáng)。

    2 未登錄詞識(shí)別模型

    2.1 成詞維度定義

    一個(gè)文本片段要想成為一個(gè)詞,必須滿足多個(gè)條件。首先,漢語中沒有以“我、你、他”等這樣的代字開頭和結(jié)尾的詞語,在進(jìn)行未登錄詞判別時(shí)可以根據(jù)這樣的規(guī)則進(jìn)行過濾;其次,漢字詞語有一定的統(tǒng)計(jì)規(guī)律,可以結(jié)合這樣的規(guī)律進(jìn)行未登錄詞識(shí)別。最后,再綜合各種特征進(jìn)行未登錄詞的篩選。為了方便理解,定義1-定義4請參見文獻(xiàn)[8]。

    1) 停用字過濾

    漢語中某些詞性的詞本身并無具體的意義(見表1),其主要功能是用來幫助造句的,這些詞很少能夠用來組成新詞、新概念,在未登錄詞識(shí)別過程中可以借助這些常見停用字進(jìn)行過濾,減少計(jì)算的復(fù)雜度。

    表1 常見停用字列表

    2) 詞頻特征

    定義1 一個(gè)詞語w在上下文中出現(xiàn)的頻數(shù)被稱為詞頻,記作TF(w),其定義為:

    (1)

    3) 自由度

    記一個(gè)文本片段seg(i)={wi,…,wj},i

    定義2 文本片段seg(i)與左邊字符wi-1自由運(yùn)用程度為該文本片段的左自由度,記為LE(w),其定義為:

    (2)

    其中,w表示當(dāng)前文本片段,A為語料庫中位于w左邊的詞的集合,C(a,w)表示語料庫中詞語a與w同時(shí)出現(xiàn)的次數(shù)。

    定義3 文本片段seg(i)與右邊字符wj+1自由運(yùn)用程度為該文本片段的右自由度,記為RE(w),其定義為:

    (3)

    其中,w表示當(dāng)前詞,B為語料庫中位于w右邊的詞的集合,C(a,w)表示語料庫中詞語a與w同時(shí)出現(xiàn)的次數(shù)。

    定義4 記當(dāng)前文本片段seg(i)自由度為R(w),則其可定義為:

    R(w)=min{LE(w),RE(w)}

    (4)

    從左、右自由度的定義可以看出,如果一個(gè)詞的左右自由度都很大,則說明與該詞項(xiàng)左右相鄰的不同詞項(xiàng)個(gè)數(shù)比較多,并且相鄰頻率比較均勻,那么這個(gè)詞與左右相鄰的詞項(xiàng)構(gòu)成新詞的概率就比較低;反之,如果一個(gè)詞項(xiàng)的左右側(cè)上下文自由度中有一個(gè)較小(假設(shè)左側(cè)自由度較小),則說明該詞左側(cè)相鄰的不同詞項(xiàng)的頻率分布并不均勻,它與左側(cè)頻率相鄰較高的詞搭配成新詞的頻率就較高,因此可以得到當(dāng)前詞自由度的定義。

    4) 凝聚度

    一個(gè)詞語的內(nèi)部凝聚程度標(biāo)志著這個(gè)詞語的成詞能力,本文將這種內(nèi)部凝聚程度稱為詞語的凝聚度。

    定義5 記凝聚度為MI,其定義為:

    (5)

    歸一化處理:

    (6)

    (7)

    (8)

    其中,p(w1,w2)表示w1、w2同時(shí)出現(xiàn)的概率,p(w1)表示w1單獨(dú)出現(xiàn)的概率,p(w2)表示w2單獨(dú)出現(xiàn)的概率。則MI越大表示內(nèi)部凝固程度越高,w1、w2一起成詞的概率越高,構(gòu)詞能力越強(qiáng)。

    2.2 模型框架設(shè)計(jì)

    首先給出本文圖1所示未登錄詞識(shí)別的主要框架,其主要包括統(tǒng)計(jì)特征提取、標(biāo)注樣本集、模型訓(xùn)練和未登錄詞判別四個(gè)步驟。

    圖1 未登錄詞識(shí)別步驟

    由于微博數(shù)據(jù)的無規(guī)則性,所以首先需要經(jīng)過數(shù)據(jù)預(yù)處理得到預(yù)處理文本,主要包括無關(guān)字符的濾除和根據(jù)標(biāo)點(diǎn)進(jìn)行短句的切分,經(jīng)過數(shù)據(jù)預(yù)處理后,再進(jìn)行語料的標(biāo)注工作。具體的xml格式標(biāo)注示例如下:

    為了得到未登錄詞,首先需要提取出微博所有的n(n=2,3,4)元組,再結(jié)合規(guī)則過濾形成詞列表。具體過程為:對于每一個(gè)子句{w1,w2,…,wi,…,wn},其中wi表示一個(gè)漢字字符,n表示該子句包含的漢字的個(gè)數(shù);生成該子句的所有n元組(n=2,3,4),需要過濾停用字,過濾方法如下:如果待定片段首尾字符均不包含停用字,且不在待選詞列表中,則加入待選詞列表。給定漢字字符wi,首先判斷wi是不是停用字,如果是則直接進(jìn)行下一個(gè)字符wi+1的迭代,否則依次判斷二元組{wiwi+1}、三元組{wiwi+1wi+2}、四元組{wiwi+1wi+2wi+3}的尾字符wi+1、wi+2、wi+3是否是停用字,如果是非停用字且不被包含在待選詞列表則作為待選詞加入。關(guān)于句子“中華名族一定能夠?qū)崿F(xiàn)中國夢”,其n元組篩選過程如表2所示。

    表2 詞列表生成示例

    經(jīng)過基于單字的候選未登錄詞識(shí)別之后,中華、中國、中國夢被初步篩選為待選未登錄詞,算法1給出了基于單字的候選未登錄詞識(shí)別算法主要過程。

    算法1 基于單字的候選未登錄詞識(shí)別算法

    輸入:doc、pos、curLen、stopwords

    輸出:dic//候選未登錄詞詞典

    BEGIN

    01 //初始化抽取器,開始位置pos=0

    02 selecor = initSelector(doc, 0)

    03 //初始化最小、最大字符個(gè)數(shù)

    04 minChar=2, maxChar=4

    05 //初始化判別器,計(jì)算每一個(gè)字出現(xiàn)的位置

    06 judger = initJudger()

    07 WHILE(!selector.end())

    08 pos++

    09 curLen=minChar

    10 letter=selector.next()

    11 WHILE(curLen <=maxChar)

    12 letter=selector.next()

    13 //首尾字符是否包含停用字

    14 IF(letter∈stopwords ||

    15 doc.charAt(pos+count) ∈

    16 stopwords)

    17 THEN

    18 curLen ++

    19 continue

    20 END IF

    21 candidate=subString(doc,pos,count)

    22 IF(candidate∈dic) THEN

    23 curLen ++

    24 continue

    25 END IF

    26 dic.add(candidate)

    27 END WHILE

    28 END WHILE

    29 //依據(jù)單字上下文依次計(jì)算候選詞4個(gè)統(tǒng)計(jì)特征

    30 FOR each C∈dic

    31 TF=frequence(judger,C)

    32 MI=cohesievness(judger,C)

    33 LE=leftEntropy(judger,C)

    34 RE=rightEntropy(judger,C)

    35 END FOR

    2.3 判定算法

    經(jīng)過算法1的初步篩選可以得到待選詞列表,本部分通過SVM分類器和神經(jīng)網(wǎng)絡(luò)兩種模型對待選詞列表進(jìn)行訓(xùn)練,選擇準(zhǔn)確率高的一類模型作為未登錄詞判定模型,最后將未登錄詞識(shí)別算法應(yīng)用于所有的微博得到未登錄詞詞典。

    1) SVM分類判別

    輸入數(shù)據(jù)格式:{

    其中,

    0 1∶0.22 2∶0.33 3∶0.15 4∶0.19

    1 1∶0.61 2∶0.41 3∶0.74 4∶0.54

    0 1∶0.11 2∶0.21 3∶0.15 4∶0.23

    ……

    輸出數(shù)據(jù)格式為:{ }

    其中,label1表示標(biāo)注結(jié)果,label2表示預(yù)測結(jié)果

    使用SparkMLlib庫,本文實(shí)驗(yàn)流程如以下步驟所示:

    Step1 構(gòu)建Spark對象

    Step2 讀取樣本數(shù)據(jù),為LIBSVM格式

    Step3 樣本數(shù)據(jù)劃分訓(xùn)練樣本與測試樣本

    Step4 新建邏輯回歸模型,并訓(xùn)練

    Step5 對測試樣本進(jìn)行測試

    Step6 誤差計(jì)算

    Step7 保存模型

    Step8 加載模型,讀取輸入數(shù)據(jù)預(yù)測未登錄詞

    2) ANN判別

    同SVM算法,本文也是使用Spark MLlib庫作為ANN(人工神經(jīng)網(wǎng)絡(luò))的基本類庫進(jìn)行訓(xùn)練得到分類模型,再對測試樣本進(jìn)行未登錄詞識(shí)別工作。

    輸入數(shù)據(jù)格式:{,,,,

    輸出數(shù)據(jù)格式為:{,,, }

    輸出數(shù)據(jù)label1表示標(biāo)注的標(biāo)簽,label2表示神經(jīng)網(wǎng)絡(luò)預(yù)測的標(biāo)簽,right表示label2與label1相同,wrong表示label2與label1不同。

    3 評價(jià)短語識(shí)別

    條件隨機(jī)場是在2001年由JohnLafferty和AndrewMcCallum提出的一種無向圖模型,在中文分詞、命名實(shí)體識(shí)別(NER)、歧義消解等漢語自然語言處理任務(wù)中都有應(yīng)用,并有著良好的表現(xiàn)。 本文利用條件隨機(jī)場(CRFSuite)可對序列輸入標(biāo)注的特點(diǎn)[12],將未登錄詞識(shí)別問題轉(zhuǎn)化為轉(zhuǎn)化為待選詞邊界是否為未登錄詞邊界的問題。

    3.1 特征描述

    1)Word

    詞特征,即n-gram特征,本文采取當(dāng)前文本片段及其前后各兩個(gè)漢字分別作為特征,使用StanfordCoreNLP工具進(jìn)行n-gram特征的提取。

    2)PoS

    詞性標(biāo)注,POS標(biāo)簽提供這個(gè)詞有關(guān)詞性的標(biāo)簽信息,使用FudanNLP工具處理。

    3)WordCluster

    詞串聚類特征,本文采用word2vec工具分別對當(dāng)前詞及其前后各一個(gè)詞進(jìn)行聚類分析。

    4)WordDependency

    本文使用FudanNLP進(jìn)行中文依存關(guān)系分析,在依存關(guān)系分析中,有一些關(guān)鍵的關(guān)系可以確定很多的問題,比如主謂關(guān)系,可以比較容易地找到句子的結(jié)構(gòu)。當(dāng)然“的”字結(jié)構(gòu)也會(huì)表征很多歸屬信息,這些信息都可能在接下來的規(guī)則中用到。表3列出了一些關(guān)鍵的依存關(guān)系。

    表3 常見依存關(guān)系列表

    5)NER

    使用FudanNLP中文自然語言處理工具包進(jìn)行命名實(shí)體特征的識(shí)別。

    3.2 特征提取算法

    本文選取了n-gram、詞性、依存關(guān)系、聚類、命名實(shí)體五類特征,采用了FudanNLP、word2vec等工具包進(jìn)行了特征提取,算法2給出了具體的提取方法。

    算法2 評價(jià)短語識(shí)別特征提取算法

    輸入:doc//輸入微博文檔集

    輸出:featureList

    Begin

    01 //循環(huán)文檔集中的每一個(gè)句子C

    02 FOR each C∈doc

    03 //分詞,提取n-gram特征

    04 I = segment(C)

    05 words = ngram(I)

    06 //詞性特征

    07 posTags = POSTagger(I, "seg.m","pos.m" )

    08 //依存關(guān)系特征

    09 stree = JointParser(I, “models/dep.m”)

    10 //命名實(shí)體特征

    11 ners = NERTagger(I, "seg.m","pos.m")

    12 featurelist.add(I,words, posTags, stree, ners)

    13 END FOR

    14 //學(xué)習(xí)聚類特征

    15 learn = word2vec(doc)

    16 //保存模型

    17 vec = learn.saveModel()

    18 //加載模型

    19 vec.loadJavaModel()

    20 //聚類分析

    21 vector = vec.getWordVector()

    22 featureList.add(vector)

    23 Return featureList

    上述算法步驟03-05提取n-gram特征,06-07提取PoS詞性特征,08-09提取句子依存關(guān)系特征,10-11提取命名實(shí)體特征,14-21使用word2vec提取聚類特征,并將所有特征加入特征集,最后一步返回所有的特征列表。

    3.3 自定義特征模板

    使用評價(jià)短語識(shí)別特征提取算法提取特征,圖2列出了各種特征模板的組合。

    圖2 自定義特征模板組合

    圖2中,數(shù)字代表每個(gè)詞語的相對位置,w代表對應(yīng)位置詞語的n-gram特征,p代表對應(yīng)位置詞語的詞性特征,c代表對應(yīng)位置詞語的類別特征。不同特征的各種組合就形成了自定義特征模版。

    3.4CRFSuite模型數(shù)據(jù)規(guī)范化

    在文本標(biāo)注過程中,引入BIO三個(gè)符號(hào),將評價(jià)短語識(shí)別問題轉(zhuǎn)化為序列標(biāo)注問題。再將自定義特征模板和人工標(biāo)注標(biāo)簽規(guī)范化成CRFSuite的標(biāo)準(zhǔn)輸入格式,進(jìn)行n次迭代得到一個(gè)預(yù)測模型,其數(shù)據(jù)規(guī)范化之后輸入格式為:

    給定一個(gè)句子{W1,W2,…,Wi,…,Wn},Wi表示第i個(gè)詞語:

    B-TERMw[0]= W1w[1]= W2w[2]= W3w[0]|w[1]= W1| W2pos[0]=NNpos[1]=INpos[2]=DTpos[0]|pos[1]=NN|INpos[1]|pos[2]=IN|DTpos[0]|pos[1]|pos[2]=NN|IN|DT…

    4 實(shí)驗(yàn)結(jié)果及分析

    本實(shí)驗(yàn)搭建了一個(gè)微博情感要素分析平臺(tái),主要由未登錄詞識(shí)別和評價(jià)短語識(shí)別兩個(gè)模塊組成。

    4.1 實(shí)驗(yàn)數(shù)據(jù)集

    本實(shí)驗(yàn)采取的數(shù)據(jù)集是采用網(wǎng)絡(luò)爬蟲爬取的新浪微博一天的數(shù)據(jù),總工包括約800萬條微博,本文選取了其中3 000條微博,人工標(biāo)注了每條微博的評價(jià)短語,產(chǎn)生了3 000條數(shù)據(jù)的樣本集,用于未登錄詞識(shí)別算法和評價(jià)短語識(shí)別算法的有監(jiān)督學(xué)習(xí)數(shù)據(jù)集。其中,70%用來訓(xùn)練,其余作為測試。

    標(biāo)準(zhǔn)結(jié)果集有兩個(gè),分別是評測用的3 000條標(biāo)注結(jié)果和用于測試的微博數(shù)據(jù)。

    4.2 未登錄詞識(shí)別結(jié)果及分析

    未登錄詞識(shí)別中首先自動(dòng)對微博生語料進(jìn)行,再依次篩選出所有的n元組(其中n=2,3,4)。然后對每一個(gè)n元組計(jì)算它的詞頻TF、凝聚度MI、左自由度LE和右自由度RE這4個(gè)統(tǒng)計(jì)特征。最后使用人工神經(jīng)網(wǎng)絡(luò)和SVM在測試數(shù)據(jù)上進(jìn)行測試之后選擇性能較好的模型,并使用該模型用于所有的微博進(jìn)行未登錄詞識(shí)別,形成未登錄詞詞典。

    表4給出了使用ANN人工神經(jīng)網(wǎng)絡(luò)和SVM支持向量機(jī)進(jìn)行未登錄詞識(shí)別的準(zhǔn)確率、召回率和F值得具體數(shù)值。

    表4 未登錄詞識(shí)別效果比較ANN vs SVM

    從表4給出的未登錄詞識(shí)別效果對比圖可以直觀地看出不管是準(zhǔn)確率、召回率還是F值,人工神經(jīng)網(wǎng)絡(luò)的分類性能都要優(yōu)于SVM,因此本文選擇人工神經(jīng)網(wǎng)絡(luò)產(chǎn)生的未登錄詞識(shí)別模型。

    選定人工神經(jīng)網(wǎng)絡(luò)模型后,在800萬條微博中發(fā)現(xiàn)了2 156個(gè)未登錄詞,2-gram的二字詞1 452個(gè),占比67%;3-gram的三字詞549個(gè),占比25%;4-gram的四字詞155個(gè),占比8%。表5給出了部分高頻未登錄詞識(shí)別結(jié)果。

    表5 高頻未登錄詞識(shí)別結(jié)果示例

    4.3 評價(jià)短語識(shí)別結(jié)果及分析

    評價(jià)短語識(shí)別在中文分詞過程中,加入未登錄詞識(shí)別實(shí)驗(yàn)形成的未登錄詞詞典,接下來再依次進(jìn)行word、pos、word cluster、word dependency和ner特征的提取,將既有特征按照一定的規(guī)則組裝成特征模板,再運(yùn)用CRFSuite工具訓(xùn)練得到評價(jià)短語分類模型,最后對測試文檔進(jìn)行測試,得到評價(jià)短語。

    評價(jià)短語識(shí)別實(shí)驗(yàn),本文分成不加入未登錄詞和加入未登錄詞2大組,每一大組再分別依據(jù)word、 word + pos、 word + pos + cluster、word + pos + cluster + dep和word + pos + cluster + dep + ner的特征模板分成5小組對比進(jìn)行,準(zhǔn)確率、召回率和F值如表6所示。從表6可以看出,在逐步加入word、pos、cluster、dep和ner特征后,Baseline和在Baseline基礎(chǔ)上加入未登錄詞的評價(jià)短語識(shí)別實(shí)驗(yàn)的效果都有顯著提高。但總體性能加入未登錄詞處理之后要優(yōu)于Baseline實(shí)驗(yàn)。本文最終選定效果較好的word+pos+cluster+dep+ner最為系統(tǒng)的特征模板。

    表6 未加入未登錄詞處理的評價(jià)短語識(shí)別

    在加入未登錄詞前后的評價(jià)短語識(shí)別的準(zhǔn)確率和召回率分別如圖3和圖4所示。從圖3和圖4可以看出,加入詞性特征之后,無論是準(zhǔn)確率還是召回率都提升顯著,說明詞性特征對于評價(jià)短語識(shí)別的影響較大。相反,聚類特征對于準(zhǔn)確率的提升卻很小,基本上與Baseline實(shí)驗(yàn)處于同等水平。圖3和圖4都能看出加入未登錄詞之后的實(shí)驗(yàn)準(zhǔn)確率和召回率相對于Baseline實(shí)驗(yàn)都有明顯提高,本文方法的優(yōu)勢在于文本處理階段增加了分詞的準(zhǔn)確率,使得在評價(jià)短語識(shí)別階段能夠準(zhǔn)確有效地識(shí)別更多的評價(jià)對象。

    圖3 加入未登錄詞前后評價(jià)短語識(shí)別的準(zhǔn)確率

    圖4 加入未登錄詞前后評價(jià)短語識(shí)別的召回率

    從圖3和圖4均可以看出加入未登錄詞之后的評價(jià)短語識(shí)別準(zhǔn)確率和召回率均明顯高于加入之前的方法。由于本文采用了基于大規(guī)模語料的學(xué)習(xí)且考慮到每一個(gè)詞語的凝聚度、自由度等互信息,使得在第一階段未登錄詞識(shí)別部分效果顯著,在第二階段使用CRFSuite分類器預(yù)測目標(biāo)評價(jià)短語的準(zhǔn)確率和召回率大大提升,改進(jìn)后的性能提升明顯。

    5 結(jié) 語

    本文研究了情感分析領(lǐng)域的評價(jià)短語識(shí)別問題,發(fā)現(xiàn)未登錄詞的識(shí)別對評價(jià)短語識(shí)別的性能有較大影響。本文根據(jù)中文文法性實(shí)現(xiàn)了未登錄詞的四種特征:詞頻、凝聚度、左自由度、右自由度,通過學(xué)習(xí)訓(xùn)練樣本的這些統(tǒng)計(jì)特征自動(dòng)建立未登錄詞識(shí)別模型,然后將自動(dòng)識(shí)別的未登錄詞加入基于CRFs的評價(jià)短語識(shí)別算法。實(shí)驗(yàn)結(jié)果說明加入未登錄詞后對評價(jià)短語的抽取性能提升顯著。尤其對于用戶行文自由的微博數(shù)據(jù),未登錄詞出現(xiàn)頻繁,相對傳統(tǒng)的評價(jià)短語抽取方法,本文提出的模型能夠有較好的應(yīng)用前景。

    [1] 葉成緒,楊萍,劉少鵬.基于主題詞的微博熱點(diǎn)話題發(fā)現(xiàn)[J].計(jì)算機(jī)應(yīng)用與軟件,2016,33(2):46-50.

    [2] 曹勇剛,曹羽中,金茂忠,等.面向信息檢索的自適應(yīng)中文分詞系統(tǒng)[J].軟件學(xué)報(bào),2006,17(3):356-363.

    [3] 倪茂樹,林鴻飛.基于關(guān)聯(lián)規(guī)則和極性分析的商品評論挖掘[C]//全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議,2007.

    [4] Liu H,Zhao Y,Qin B,et al.Comment Target Extraction and Sentiment Classification[J].Journal of Chinese Information Processing,2010,24(1):84-88.

    [5] Wang M C,Huang C R,Chen K J.The identification and classification of unknown words in Chinese:an n-grams-based approach[J].Festschrift for Professor Akira Ikeya,1995:113-123.

    [6] Chen A.Chinese word segmentation using minimal linguistic knowledge[C]//Proceedings of the second SIGHAN workshop on Chinese language processing-Volume 17.Association for Computational Linguistics,2003:148-151.

    [7] 賈自艷,史忠植.基于概率統(tǒng)計(jì)技術(shù)和規(guī)則方法的新詞發(fā)現(xiàn)[J].計(jì)算機(jī)工程,2004,30(20):19-21.

    [8] 王立希,王建東,汪靜.基于數(shù)據(jù)挖掘的新詞發(fā)現(xiàn)[J].計(jì)算機(jī)應(yīng)用研究,2006,2(12):195-197.

    [9] 周蕾,朱巧明.基于統(tǒng)計(jì)和規(guī)則的未登錄詞識(shí)別方法研究[J].計(jì)算機(jī)工程,2007,33(8):196-198.

    [10] 李文坤,張仰森,陳若愚.基于詞內(nèi)部結(jié)合度和邊界自由度的新詞發(fā)現(xiàn)[J].計(jì)算機(jī)應(yīng)用研究,2015,32(8):51.

    [11] 林江豪,陽愛民,周詠梅,等.一種基于樸素貝葉斯的微博情感分類[J].計(jì)算機(jī)工程與科學(xué),2012,34(9):160-165.

    [12] 陳飛,劉奕群,魏超,等.基于條件隨機(jī)場方法的開放領(lǐng)域新詞發(fā)現(xiàn)[J].Journal of Software,2013,24(5).

    [13] 霍帥,張敏,劉奕群,等.基于微博內(nèi)容的新詞發(fā)現(xiàn)方法[J].模式識(shí)別與人工智能,2014,27(2):141-145.

    [14] Zou G,Liu Y,Liu Q,et al.Internet-oriented Chinese New Words Detection[J].Journal of Chinese Information Processing,2004,18(6):1-9.

    [15] Kong L,Ren F,Sun X,et al.Word Frequency Statistics Model for Chinese Base Noun Phrase Identification[M]//Intelligent Computing Methodologies,2014:635-644.

    [16] 謝麗星,周明,孫茂松.基于層次結(jié)構(gòu)的多策略中文微博情感分析和特征抽取[J].中文信息學(xué)報(bào),2012,26(1):73-83.

    A METHOD OF TARGET PHRASE EXTRACTION FROM MICROBLOG BASED ON UNKNOWN WORDS RECOGNITION

    Wang Longqing1Zhang Chao1Song Hui1*Liu Zhenyu2

    1(SchoolofComputerScienceandTechnology,DonghuaUniversity,Shanghai201600,China)2(ShanghaiKeyLaboratoryofComputerSoftwareTestingandEvaluating,ShanghaiDevelopmentCenterof

    As the topic of microblog content is scattered, the identification of microblog comment object is the hot and difficult point of microblog emotion analysis. The research shows that unknown words recognition is one of the important reasons leading to the low recognition rate of target phrase. To solve this problem, this paper proposes a method of learning unknown words recognition model based on statistical features such as word frequency, cohesion, left and right degrees of freedom. The experimental results show that the unknown words in the microblog text are automatically added to the target phrase recognition algorithm based on CRFs, and the accuracy and recall of the phrase recognition are improved remarkably. The learning algorithm of unknown words has strong feasibility by directly using annotated samples of target phrase recognition.

    Microblog Target phrase Unknown words Statistical feature CRFs

    2016-07-10。汪龍慶,碩士生,主研領(lǐng)域:文本挖掘。張超,碩士生。宋暉,教授。劉振宇,副研究員。

    TP3

    A

    10.3969/j.issn.1000-386x.2017.06.051

    猜你喜歡
    短語準(zhǔn)確率詞語
    容易混淆的詞語
    乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
    健康之家(2021年19期)2021-05-23 11:17:39
    不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
    2015—2017 年寧夏各天氣預(yù)報(bào)參考產(chǎn)品質(zhì)量檢驗(yàn)分析
    找詞語
    高速公路車牌識(shí)別標(biāo)識(shí)站準(zhǔn)確率驗(yàn)證法
    詞語欣賞
    一枚詞語一門靜
    久久欧美精品欧美久久欧美| 亚洲欧美日韩卡通动漫| 亚洲最大成人手机在线| 国产精品伦人一区二区| 免费av观看视频| 精品不卡国产一区二区三区| eeuss影院久久| 欧美性感艳星| a级毛色黄片| 99热这里只有是精品50| 全区人妻精品视频| 菩萨蛮人人尽说江南好唐韦庄 | 91久久精品电影网| 亚洲精品色激情综合| 午夜福利在线观看吧| 国产v大片淫在线免费观看| 亚洲丝袜综合中文字幕| av.在线天堂| 99久久精品热视频| 久久久久国内视频| 在线播放国产精品三级| 国产精品一区二区三区四区免费观看 | 国产精品国产三级国产av玫瑰| 亚洲av熟女| 亚洲成a人片在线一区二区| 亚洲丝袜综合中文字幕| 成人毛片a级毛片在线播放| 日日撸夜夜添| 99riav亚洲国产免费| 日本在线视频免费播放| h日本视频在线播放| 国产 一区精品| 国产av不卡久久| 国产成人影院久久av| 在线天堂最新版资源| 18禁黄网站禁片免费观看直播| 嫩草影院精品99| 午夜爱爱视频在线播放| 国产久久久一区二区三区| 搞女人的毛片| 成人三级黄色视频| 狠狠狠狠99中文字幕| 男人狂女人下面高潮的视频| 两性午夜刺激爽爽歪歪视频在线观看| 欧美日韩在线观看h| 男女边吃奶边做爰视频| 99久国产av精品国产电影| 蜜桃久久精品国产亚洲av| av在线亚洲专区| 日日啪夜夜撸| 99九九线精品视频在线观看视频| 51国产日韩欧美| 啦啦啦观看免费观看视频高清| 午夜福利在线观看免费完整高清在 | 我的女老师完整版在线观看| 69av精品久久久久久| 丝袜美腿在线中文| 成人亚洲精品av一区二区| 在线播放国产精品三级| 老熟妇乱子伦视频在线观看| 菩萨蛮人人尽说江南好唐韦庄 | 免费av毛片视频| av在线播放精品| 成年女人毛片免费观看观看9| 国产亚洲精品av在线| 天天躁夜夜躁狠狠久久av| 少妇的逼好多水| 男人和女人高潮做爰伦理| 亚洲在线自拍视频| 国产精品综合久久久久久久免费| 婷婷色综合大香蕉| 日日撸夜夜添| 99久久中文字幕三级久久日本| 午夜福利在线在线| 亚洲欧美日韩无卡精品| eeuss影院久久| 免费不卡的大黄色大毛片视频在线观看 | 免费高清视频大片| 偷拍熟女少妇极品色| 亚洲婷婷狠狠爱综合网| 国产欧美日韩一区二区精品| 欧美3d第一页| 成人国产麻豆网| av视频在线观看入口| 91精品国产九色| 一个人看视频在线观看www免费| 最好的美女福利视频网| 欧美一区二区亚洲| 亚洲欧美精品综合久久99| 国产精品99久久久久久久久| 精品久久久久久久久亚洲| 亚洲av第一区精品v没综合| 男人狂女人下面高潮的视频| 日本熟妇午夜| 国产成人91sexporn| 欧美成人一区二区免费高清观看| 真实男女啪啪啪动态图| 国内少妇人妻偷人精品xxx网站| 99在线人妻在线中文字幕| 国产人妻一区二区三区在| 青春草视频在线免费观看| 两个人的视频大全免费| 国产黄a三级三级三级人| 成人性生交大片免费视频hd| 国产激情偷乱视频一区二区| 欧美又色又爽又黄视频| 日本免费a在线| 精品日产1卡2卡| 久久久久国产网址| 久久久久久久久大av| 亚洲va在线va天堂va国产| 国产精品一区二区免费欧美| 一区二区三区高清视频在线| 听说在线观看完整版免费高清| 国产日本99.免费观看| 亚洲国产日韩欧美精品在线观看| 美女免费视频网站| 97热精品久久久久久| 精品人妻一区二区三区麻豆 | 男女之事视频高清在线观看| 内地一区二区视频在线| 在线a可以看的网站| 日韩欧美一区二区三区在线观看| 久久午夜亚洲精品久久| 色5月婷婷丁香| av国产免费在线观看| 夜夜爽天天搞| 大又大粗又爽又黄少妇毛片口| 成人毛片a级毛片在线播放| 一级毛片电影观看 | а√天堂www在线а√下载| 亚洲av不卡在线观看| 亚洲av二区三区四区| 久久中文看片网| 久久国内精品自在自线图片| 麻豆一二三区av精品| 人人妻,人人澡人人爽秒播| 成人特级av手机在线观看| 亚洲欧美清纯卡通| 哪里可以看免费的av片| 成人毛片a级毛片在线播放| 欧美最新免费一区二区三区| 特级一级黄色大片| 搞女人的毛片| 熟女电影av网| 国产三级在线视频| 国产一区亚洲一区在线观看| 听说在线观看完整版免费高清| 好男人在线观看高清免费视频| 精品人妻一区二区三区麻豆 | 成人av一区二区三区在线看| 久久精品国产99精品国产亚洲性色| 赤兔流量卡办理| 国产女主播在线喷水免费视频网站 | 亚洲一区二区三区色噜噜| 插逼视频在线观看| 1000部很黄的大片| 亚洲国产欧洲综合997久久,| 亚洲国产欧洲综合997久久,| 久久人人爽人人爽人人片va| 久久6这里有精品| 亚洲va在线va天堂va国产| 99热全是精品| av黄色大香蕉| 日日摸夜夜添夜夜添av毛片| 熟女电影av网| 美女免费视频网站| 欧美一区二区国产精品久久精品| 老司机影院成人| 内地一区二区视频在线| 欧美日本视频| 国产午夜福利久久久久久| 亚洲成人中文字幕在线播放| 精品久久久久久久久av| 97热精品久久久久久| 欧美中文日本在线观看视频| 国产精品电影一区二区三区| 你懂的网址亚洲精品在线观看 | 色综合亚洲欧美另类图片| 亚洲最大成人手机在线| 欧美绝顶高潮抽搐喷水| 婷婷六月久久综合丁香| 熟女人妻精品中文字幕| 亚洲经典国产精华液单| 一级毛片电影观看 | 亚洲五月天丁香| 久久久久久久久久久丰满| 亚洲国产精品合色在线| 国产毛片a区久久久久| 亚洲精品国产成人久久av| 精品一区二区三区视频在线| 欧美一级a爱片免费观看看| 午夜福利在线观看免费完整高清在 | 国内久久婷婷六月综合欲色啪| 老女人水多毛片| 欧美国产日韩亚洲一区| 亚洲欧美精品综合久久99| 内射极品少妇av片p| 嫩草影视91久久| 91麻豆精品激情在线观看国产| 久久久精品94久久精品| 性色avwww在线观看| 久久久久精品国产欧美久久久| 免费看光身美女| 搡女人真爽免费视频火全软件 | 亚洲图色成人| 免费人成在线观看视频色| 少妇的逼水好多| 亚洲第一区二区三区不卡| 亚洲精品成人久久久久久| 天堂√8在线中文| 禁无遮挡网站| 高清毛片免费看| 内射极品少妇av片p| 日本五十路高清| 亚洲国产欧美人成| 男插女下体视频免费在线播放| 九九爱精品视频在线观看| 一个人看视频在线观看www免费| 亚洲精品亚洲一区二区| 久久精品影院6| 日韩高清综合在线| 亚洲av中文字字幕乱码综合| 日韩中字成人| 国产精品一区www在线观看| 白带黄色成豆腐渣| 97在线视频观看| 亚洲久久久久久中文字幕| 成人毛片a级毛片在线播放| 狠狠狠狠99中文字幕| 久久久久久久亚洲中文字幕| 婷婷色综合大香蕉| 国产视频内射| 熟女电影av网| 亚洲aⅴ乱码一区二区在线播放| 亚洲欧美日韩高清在线视频| 日本 av在线| 国产成人aa在线观看| 婷婷亚洲欧美| 免费大片18禁| 日韩一区二区视频免费看| 一区福利在线观看| 国产中年淑女户外野战色| 99久久九九国产精品国产免费| 床上黄色一级片| 中文字幕免费在线视频6| 亚洲成人久久性| av卡一久久| 亚洲中文日韩欧美视频| 日日撸夜夜添| 老司机福利观看| 国产高清视频在线播放一区| 六月丁香七月| 欧美+日韩+精品| 亚洲精品色激情综合| 如何舔出高潮| 99国产极品粉嫩在线观看| 免费观看的影片在线观看| 内射极品少妇av片p| 十八禁网站免费在线| 亚洲av电影不卡..在线观看| 亚洲精品一区av在线观看| 午夜福利视频1000在线观看| 亚洲色图av天堂| 淫秽高清视频在线观看| 天堂网av新在线| 色噜噜av男人的天堂激情| 久久精品国产亚洲网站| 亚洲第一区二区三区不卡| 91在线精品国自产拍蜜月| 联通29元200g的流量卡| 国产精品国产三级国产av玫瑰| 亚洲欧美精品综合久久99| 亚洲av免费在线观看| 欧美3d第一页| 亚洲精品日韩在线中文字幕 | 老女人水多毛片| 深夜a级毛片| 麻豆国产av国片精品| 色综合色国产| 18禁在线播放成人免费| 午夜免费男女啪啪视频观看 | 日韩欧美在线乱码| 久久人人爽人人爽人人片va| 老师上课跳d突然被开到最大视频| 日产精品乱码卡一卡2卡三| 亚洲四区av| 大香蕉久久网| 69人妻影院| 免费av观看视频| 亚洲熟妇中文字幕五十中出| 国内久久婷婷六月综合欲色啪| 国产午夜精品久久久久久一区二区三区 | 国产色爽女视频免费观看| 美女免费视频网站| 一级av片app| 在线观看av片永久免费下载| 18禁裸乳无遮挡免费网站照片| 日韩在线高清观看一区二区三区| 成人国产麻豆网| 久久午夜亚洲精品久久| 中文亚洲av片在线观看爽| 天美传媒精品一区二区| 久久久久免费精品人妻一区二区| 亚洲综合色惰| 日韩 亚洲 欧美在线| av天堂中文字幕网| 久久久久久久午夜电影| 99久国产av精品| 99久久久亚洲精品蜜臀av| 久久久久国内视频| 欧美区成人在线视频| 岛国在线免费视频观看| 欧美绝顶高潮抽搐喷水| 超碰av人人做人人爽久久| 国产在线男女| 免费高清视频大片| 成人美女网站在线观看视频| 久久中文看片网| 欧美国产日韩亚洲一区| 国产高清激情床上av| 欧美中文日本在线观看视频| 久久人人精品亚洲av| av女优亚洲男人天堂| 人人妻人人澡人人爽人人夜夜 | 亚洲欧美成人精品一区二区| 国产精品三级大全| 中文字幕久久专区| 亚洲精品色激情综合| 免费看av在线观看网站| 欧美最新免费一区二区三区| 免费不卡的大黄色大毛片视频在线观看 | 99国产精品一区二区蜜桃av| 高清毛片免费看| 国产熟女欧美一区二区| 波多野结衣高清作品| 麻豆成人午夜福利视频| 日韩成人伦理影院| 成人三级黄色视频| 一个人观看的视频www高清免费观看| 乱码一卡2卡4卡精品| 老熟妇仑乱视频hdxx| 超碰av人人做人人爽久久| 日本三级黄在线观看| 白带黄色成豆腐渣| 亚洲av免费在线观看| 午夜激情福利司机影院| 欧美日韩国产亚洲二区| 草草在线视频免费看| 成人av在线播放网站| 久久精品91蜜桃| 性插视频无遮挡在线免费观看| 内射极品少妇av片p| 中国国产av一级| 青春草视频在线免费观看| 免费不卡的大黄色大毛片视频在线观看 | 午夜福利在线在线| 美女 人体艺术 gogo| 国产高潮美女av| 免费观看的影片在线观看| 精品不卡国产一区二区三区| 国产成人影院久久av| .国产精品久久| 69人妻影院| 亚洲欧美日韩东京热| 黄色视频,在线免费观看| 中文字幕av在线有码专区| 色哟哟·www| 青春草视频在线免费观看| 日韩三级伦理在线观看| 日韩大尺度精品在线看网址| 床上黄色一级片| 免费观看精品视频网站| eeuss影院久久| 国产精品美女特级片免费视频播放器| 白带黄色成豆腐渣| 国产精品一区二区三区四区久久| 精品欧美国产一区二区三| 亚洲性久久影院| 色吧在线观看| 别揉我奶头~嗯~啊~动态视频| 欧美人与善性xxx| 久久精品国产亚洲av香蕉五月| 午夜爱爱视频在线播放| 一个人看视频在线观看www免费| 日韩欧美三级三区| 麻豆av噜噜一区二区三区| 精品不卡国产一区二区三区| 九九热线精品视视频播放| 中文字幕免费在线视频6| ponron亚洲| 亚洲国产精品成人综合色| 精品一区二区三区av网在线观看| 人人妻人人澡欧美一区二区| 成人av在线播放网站| 悠悠久久av| 亚洲国产色片| 欧美+亚洲+日韩+国产| 少妇熟女欧美另类| 亚洲成人精品中文字幕电影| 久久草成人影院| 亚洲精品成人久久久久久| 亚洲欧美精品综合久久99| 午夜a级毛片| 亚洲人成网站在线播| eeuss影院久久| 亚洲人成网站在线播| 精品国产三级普通话版| 午夜久久久久精精品| 久久中文看片网| 十八禁国产超污无遮挡网站| 99在线人妻在线中文字幕| 国产精品电影一区二区三区| 亚洲最大成人av| 国产免费男女视频| 一个人观看的视频www高清免费观看| 看十八女毛片水多多多| 高清毛片免费观看视频网站| 国产高清视频在线播放一区| 韩国av在线不卡| 免费看a级黄色片| 国产精品一二三区在线看| 久久人人精品亚洲av| 老司机福利观看| 热99在线观看视频| 午夜久久久久精精品| 97超视频在线观看视频| 联通29元200g的流量卡| 国产精品精品国产色婷婷| 伦精品一区二区三区| 亚洲七黄色美女视频| 亚洲av五月六月丁香网| 久久国内精品自在自线图片| 日本免费一区二区三区高清不卡| 国产日本99.免费观看| 色在线成人网| 亚洲久久久久久中文字幕| 成人午夜高清在线视频| 一个人看的www免费观看视频| 18禁在线无遮挡免费观看视频 | 国产黄色视频一区二区在线观看 | 国产精品亚洲一级av第二区| 老司机影院成人| 男人舔奶头视频| 欧美3d第一页| 亚洲美女视频黄频| 久久精品国产鲁丝片午夜精品| 亚洲av美国av| 欧美潮喷喷水| 乱人视频在线观看| 国产免费男女视频| 性色avwww在线观看| 亚洲中文字幕一区二区三区有码在线看| 久久久色成人| 97碰自拍视频| 成人二区视频| 国产精品一及| a级一级毛片免费在线观看| 亚洲性夜色夜夜综合| 欧美人与善性xxx| 欧美成人a在线观看| 黄色配什么色好看| 99riav亚洲国产免费| .国产精品久久| 精品久久久久久久末码| 成年女人看的毛片在线观看| 人妻少妇偷人精品九色| 欧美又色又爽又黄视频| 欧美极品一区二区三区四区| 免费不卡的大黄色大毛片视频在线观看 | 搡老岳熟女国产| 别揉我奶头 嗯啊视频| 免费电影在线观看免费观看| 看黄色毛片网站| 我要搜黄色片| 在线观看66精品国产| 欧美色视频一区免费| 日本与韩国留学比较| 精品99又大又爽又粗少妇毛片| 99热网站在线观看| 国产精品电影一区二区三区| 在线观看美女被高潮喷水网站| 99热这里只有是精品50| 国产精品三级大全| 久久精品国产亚洲av涩爱 | 尤物成人国产欧美一区二区三区| 变态另类丝袜制服| 国产免费男女视频| 插阴视频在线观看视频| 久久欧美精品欧美久久欧美| 夜夜夜夜夜久久久久| 一a级毛片在线观看| av在线老鸭窝| or卡值多少钱| 亚洲专区国产一区二区| av女优亚洲男人天堂| 国产三级在线视频| 亚洲国产精品国产精品| 国内揄拍国产精品人妻在线| 性欧美人与动物交配| 最好的美女福利视频网| 在线免费观看不下载黄p国产| 日韩精品中文字幕看吧| 听说在线观看完整版免费高清| 国产成人a区在线观看| 久久精品国产亚洲av香蕉五月| 亚洲精品456在线播放app| 日韩av不卡免费在线播放| 国产精品嫩草影院av在线观看| 亚洲av五月六月丁香网| 亚洲国产精品成人综合色| 亚洲精华国产精华液的使用体验 | 久久久久久国产a免费观看| 午夜精品一区二区三区免费看| 亚洲av免费在线观看| 欧美另类亚洲清纯唯美| 久久人人精品亚洲av| 成人av在线播放网站| 成年女人看的毛片在线观看| 97热精品久久久久久| 不卡视频在线观看欧美| 最近视频中文字幕2019在线8| 看片在线看免费视频| 国产男人的电影天堂91| 国产av一区在线观看免费| 搡女人真爽免费视频火全软件 | 亚洲精品一卡2卡三卡4卡5卡| 日本爱情动作片www.在线观看 | 天美传媒精品一区二区| 国产午夜精品论理片| a级毛片免费高清观看在线播放| 99精品在免费线老司机午夜| 国产一区亚洲一区在线观看| 久久人妻av系列| 久久精品国产清高在天天线| 丝袜喷水一区| 欧美性猛交╳xxx乱大交人| 精品不卡国产一区二区三区| 99热6这里只有精品| 草草在线视频免费看| 国产伦精品一区二区三区四那| av在线播放精品| 精品一区二区三区人妻视频| 晚上一个人看的免费电影| 国产一区亚洲一区在线观看| 久久久久久久久久成人| 午夜老司机福利剧场| 欧美又色又爽又黄视频| 又爽又黄a免费视频| 成年女人永久免费观看视频| 黄色配什么色好看| 亚洲成人久久爱视频| 久久婷婷人人爽人人干人人爱| 看黄色毛片网站| 99riav亚洲国产免费| 国产午夜精品久久久久久一区二区三区 | 国产精品国产高清国产av| 好男人在线观看高清免费视频| 无遮挡黄片免费观看| 亚洲在线自拍视频| 精品免费久久久久久久清纯| 三级国产精品欧美在线观看| 蜜桃亚洲精品一区二区三区| 黑人高潮一二区| 亚洲最大成人中文| 亚洲国产色片| 一区福利在线观看| 赤兔流量卡办理| 99riav亚洲国产免费| 国产三级在线视频| 久久久久久久亚洲中文字幕| 国产精品女同一区二区软件| 日本黄大片高清| 女的被弄到高潮叫床怎么办| 亚洲熟妇中文字幕五十中出| 久久久久国产网址| 51国产日韩欧美| 色综合亚洲欧美另类图片| 在线播放无遮挡| 午夜免费激情av| 无遮挡黄片免费观看| 欧美一级a爱片免费观看看| 最近中文字幕高清免费大全6| 我的老师免费观看完整版| 亚洲av电影不卡..在线观看| 淫秽高清视频在线观看| 插逼视频在线观看| 欧美中文日本在线观看视频| 免费高清视频大片| 黄色日韩在线| 麻豆乱淫一区二区| 国产精品一及| 一个人看视频在线观看www免费| 日韩亚洲欧美综合| 草草在线视频免费看| 国产亚洲精品综合一区在线观看| 午夜老司机福利剧场| 色在线成人网| 天堂网av新在线| 国产成人a∨麻豆精品| 神马国产精品三级电影在线观看| 久久久久精品国产欧美久久久| 免费观看人在逋| 亚洲中文字幕一区二区三区有码在线看| 免费看av在线观看网站| 国产一区亚洲一区在线观看| 成年版毛片免费区| 国产亚洲欧美98| 国产成人福利小说| 国产亚洲精品久久久久久毛片| 免费看av在线观看网站| 男女边吃奶边做爰视频| 欧美日韩综合久久久久久| 99久国产av精品| 噜噜噜噜噜久久久久久91|