• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    一種結(jié)合隨機(jī)游走和粗糙決策的文本分類方法

    2019-06-06 05:46:34柴玉梅王黎明
    關(guān)鍵詞:詞匯分類文本

    韓 飛,柴玉梅 ,王黎明 ,劉 箴

    1(鄭州大學(xué) 信息工程學(xué)院, 鄭州 450001)2(寧波大學(xué) 信息科學(xué)與工程學(xué)院,浙江 寧波 315211)

    1 引 言

    伴隨著互聯(lián)網(wǎng)發(fā)展的熱潮以及人工智能領(lǐng)域技術(shù)的不斷革新,賦予機(jī)器情感已成為研究中的重要課題.情感分類作為其中的重要手段,在社會(huì)媒體處理領(lǐng)域有了良好的發(fā)展,如輿情監(jiān)控、商務(wù)決策等[1].由于各大主流媒體平臺(tái)的開放性,人們通常會(huì)在評(píng)論區(qū)表達(dá)其主觀情緒特征,因此針對(duì)用戶行為偏好的分析具有很高的研究價(jià)值[2,3].

    由于用戶在瀏覽網(wǎng)頁時(shí)其行為的隨機(jī)性與模糊性,有學(xué)者通過用戶對(duì)網(wǎng)頁的點(diǎn)擊行為進(jìn)行分析并建立模型,從而實(shí)現(xiàn)針對(duì)用戶行為的網(wǎng)頁排序,并取得了良好的效果.本文把隨機(jī)游走模型在網(wǎng)頁排序中的方法應(yīng)用在詞網(wǎng)絡(luò)圖的構(gòu)建中,結(jié)合粗糙集模型,把詞網(wǎng)絡(luò)圖構(gòu)建后的情感詞極性分析結(jié)果進(jìn)行離散化處理,并對(duì)屬性值進(jìn)行加權(quán),擴(kuò)充了隨機(jī)游走模型的使用范圍,通過最終的粗糙決策置信度對(duì)加權(quán)后的屬性文本進(jìn)行類別劃分.

    模糊性詞匯的判別一直是文本分類中的重要課題,本文通過對(duì)數(shù)據(jù)集的標(biāo)詞、分詞等處理,對(duì)詞匯進(jìn)行特征選擇,得到候選特征,提出基于擴(kuò)展隨機(jī)游走模型的情感詞極性判別算法,得到模糊性詞匯的情感極性,進(jìn)一步得到候選屬性集.結(jié)合詞匯情感極性,建立文本情感決策表.運(yùn)用粗糙集的知識(shí),對(duì)候選屬性進(jìn)行離散化處理,提出基于粗糙集的文本情感類別判定模型,從而得到最終文本情感分類.本文流程框架圖如圖1所示.

    2 相關(guān)工作

    文本情感分類是指通過分析文本中的立場、觀點(diǎn)、態(tài)度等主觀信息,挖掘文本中的情感傾向,從而對(duì)其傾向類別進(jìn)行判定,目前已經(jīng)提出了一系列的情感分類方法[4-8].

    圖1 文本類別判定流程框架圖Fig.1 Flow chart of text categorization decision

    由于社交媒體的開放性不斷增加,評(píng)論和博客可能被分為不同的極性組,如正、負(fù)和中性,以便從輸入數(shù)據(jù)集中提取信息. Tripathy等人[4]利用有監(jiān)督機(jī)器學(xué)習(xí)方法對(duì)這些評(píng)論進(jìn)行分類,使用樸素貝葉斯(Naive Bayes,NB),最大熵(Maximum Entropy,ME),隨機(jī)梯度下降(Stochastic Gradient Descent,SGD)和支持向量機(jī)(Support Vector Machine,SVM)方法,依據(jù)精度,召回率,F(xiàn)度量和準(zhǔn)確率等評(píng)價(jià)標(biāo)準(zhǔn),對(duì)不同方法的準(zhǔn)確性進(jìn)行了嚴(yán)格的考察.Turney等人[5]以情感詞為中心,采用點(diǎn)互式信息檢索(Pointwise Mutual Information,PMI)和潛在語義分析(Latent Semantic Analysis,LSA)兩種方法用于評(píng)估詞關(guān)聯(lián)度,并取得了較高的準(zhǔn)確率.在對(duì)情感類別劃分的基礎(chǔ)上,有些學(xué)者利用算法框架對(duì)情感分類結(jié)果進(jìn)行優(yōu)化.Silva等人[6]提出了一種半監(jiān)督學(xué)習(xí)框架,從無標(biāo)簽數(shù)據(jù)構(gòu)建的相似性矩陣中捕獲無監(jiān)督信息,并與分類器相結(jié)合,通過自訓(xùn)練算法來產(chǎn)生更好的情感分類結(jié)果.實(shí)驗(yàn)數(shù)據(jù)集從Twitter中選取,結(jié)果表明,提出的框架可以提高情感分類的準(zhǔn)確性.由于文本維度通常很龐雜,對(duì)特征的降維也是情感分類中必不可少的工作.吳鈺潔等人[7]通過建立一種概率圖模型,并用其對(duì)詞語中的情感概率值進(jìn)行計(jì)算,再通過信息熵公式歸一化其情感特征值,最后進(jìn)行情感分類,實(shí)驗(yàn)也表明其方法的有效性.在文本評(píng)論中,用戶偏好使得情感判定類別產(chǎn)生傾斜,Tian等人[8]提出了一種基于句子的實(shí)例轉(zhuǎn)移方法,通過使用輔助數(shù)據(jù)集(源數(shù)據(jù)集)來處理不平衡的正負(fù)文本產(chǎn)品評(píng)論數(shù)量.該方法結(jié)合了規(guī)則和監(jiān)督學(xué)習(xí)混合方法來識(shí)別每個(gè)產(chǎn)品評(píng)論的主題句,并將主題句的特征集添加到情感分類的特征空間.

    隨機(jī)游走模型是針對(duì)用戶瀏覽網(wǎng)頁的行為建立的抽象概念模型.Rao等人[9]提出一種基于單詞極性構(gòu)圖的問題求解框架,每個(gè)節(jié)點(diǎn)表示要確定其極性的單詞,并且可以有兩個(gè)標(biāo)簽:正或負(fù).Kok等人[10]提出了一種基于隨機(jī)游走模型的方法來學(xué)習(xí)雙語平行語料庫.文中采用隨機(jī)游走來計(jì)算達(dá)到釋義排序所需的平均步數(shù),而更好的“更接近”感興趣的詞組.隨機(jī)游走模型也可用于多標(biāo)簽分類學(xué)習(xí)中,鄭偉等人[11]提出了一種基于隨機(jī)游走模型的多標(biāo)簽分類算法,將多標(biāo)簽數(shù)據(jù)映射成為多標(biāo)簽隨機(jī)游走圖,有效解決多標(biāo)簽分類問題.

    粗糙集理論是一種比較新的處理模糊性和不確定性的軟計(jì)算工具,被認(rèn)為是前沿領(lǐng)域.基于粗糙集的離散化具有一定的特點(diǎn),必須滿足決策系統(tǒng)離散化的一致性要求.張嬌鵬等[12]提出一種面向數(shù)據(jù)取值更新的批處理機(jī)制,根據(jù)粗糙集和信息熵的概念,提出了一種面向數(shù)據(jù)取值動(dòng)態(tài)變化數(shù)據(jù)集的特征選擇方法,可一次處理一組變化數(shù)據(jù),拓展了粗糙集在特征選擇方向的應(yīng)用,實(shí)驗(yàn)證明了算法的有效性.Sun等人[13]提出了一種基于決策屬性的連續(xù)屬性離散化方法,該方法考慮了決策屬性的重要度,連續(xù)屬性依照重要度依次離散化,實(shí)驗(yàn)結(jié)果表明該方法有效減少斷點(diǎn)并提高識(shí)別精準(zhǔn)度.孫夢等人[14]提出了一種基于粗糙集的優(yōu)勢關(guān)系排序問題,利用向量相似度和并列對(duì)象準(zhǔn)則對(duì)排序向量進(jìn)行賦權(quán),得到最終排序結(jié)果.實(shí)驗(yàn)表明其方法的合理性.Chen等人[15]提出了一種區(qū)間數(shù)離散化算法,基于多屬性決策建立區(qū)間決策樣本,確定區(qū)間對(duì)象間的相似矩陣,并利用最小離散區(qū)間得到最終離散化結(jié)果,實(shí)驗(yàn)證明了算法的有效性.

    3 相關(guān)概念

    3.1 基于圖論的隨機(jī)游走模型

    隨機(jī)游走模型可以預(yù)測不同節(jié)點(diǎn)之間的潛在關(guān)系,也可應(yīng)用于文本分類中[16].通過構(gòu)建圖框架,進(jìn)而找出相鄰節(jié)點(diǎn)間的關(guān)系,每個(gè)節(jié)點(diǎn)可以用一個(gè)單詞進(jìn)行表示,如果有多關(guān)系節(jié)點(diǎn),那么就調(diào)整節(jié)點(diǎn)間的邊緣強(qiáng)度[17].

    使用隨機(jī)游走模型來識(shí)別單詞的極性,可以假定使用一個(gè)詞網(wǎng)絡(luò),其中一些詞被標(biāo)記為正或負(fù).在這個(gè)網(wǎng)絡(luò)中,如果有關(guān)聯(lián),兩個(gè)詞是相連的.不同來源的信息來決定兩個(gè)詞是否相關(guān).例如,一個(gè)詞的同義詞都是語義相關(guān)的,連接語義相關(guān)詞背后的隱藏信息是單詞往往有相似的極性.現(xiàn)在假定一個(gè)隨機(jī)游走者沿著網(wǎng)絡(luò)從一個(gè)未標(biāo)記的詞w開始,隨機(jī)游走一直持續(xù)到游走者走到標(biāo)記的詞為止.如果詞w是正的,那么隨機(jī)游走擊中一個(gè)正詞的概率就更高;如果w是負(fù)的,那么隨機(jī)游走擊中負(fù)詞的概率就更高.因此,如果詞w極性為正,那么從w開始到正節(jié)點(diǎn)的隨機(jī)游走的平均時(shí)間應(yīng)該比從w開始到負(fù)節(jié)點(diǎn)的隨機(jī)游走的平均時(shí)間小得多.如果w沒有明確的極性,可以說它是中性的.

    假設(shè)在詞關(guān)聯(lián)圖G中,從一個(gè)具有未知詞極性的節(jié)點(diǎn)i開始,在第一步后移動(dòng)到節(jié)點(diǎn)j的概率為Pij.如果我們重復(fù)隨機(jī)游走N次,則可以將正/負(fù)詞的游走結(jié)束次數(shù)的百分比作為其正/負(fù)極性的指標(biāo).從w開始的隨機(jī)游走到達(dá)正/負(fù)節(jié)點(diǎn)的平均時(shí)間也是其極性的指標(biāo).

    W是詞典中詞匯的集合,構(gòu)建一個(gè)圖G,其節(jié)點(diǎn)V都是W中的詞匯,邊E是對(duì)應(yīng)詞匯間的相關(guān)性.通過歸一化節(jié)點(diǎn)i之外的邊的權(quán)重,定義從節(jié)點(diǎn)i到節(jié)點(diǎn)j的轉(zhuǎn)移概率P[18]:

    (1)

    式中,k代表與i相鄰的所有節(jié)點(diǎn),P代表在第t步的節(jié)點(diǎn)i到第t+1步的節(jié)點(diǎn)j的轉(zhuǎn)移概率.注意到,權(quán)重Wij的矩陣是對(duì)稱的,而轉(zhuǎn)移概率矩陣P由于節(jié)點(diǎn)出度歸一化,不一定是對(duì)稱的.

    把首次達(dá)到目標(biāo)節(jié)點(diǎn)所用的時(shí)間h(i|k)定義為隨機(jī)游走者第一次進(jìn)入狀態(tài)節(jié)點(diǎn)k所用的步數(shù)平均數(shù)[19],初始i≠k.G=(V,E)是具有V個(gè)頂點(diǎn),E條邊的圖,頂點(diǎn)集S是V的子集,S∈V,在圖G中第i點(diǎn)開始游走,i不屬于S.因此,第一次到達(dá)目標(biāo)節(jié)點(diǎn)所用時(shí)間h(i|S)可以形式化描述為:

    (2)

    其中,Pij是i到j(luò)點(diǎn)的轉(zhuǎn)移概率,h(j|S)表示節(jié)點(diǎn)j第一次到達(dá)目標(biāo)節(jié)點(diǎn)S所用的時(shí)間.

    3.2 粗糙集基礎(chǔ)理論

    粗糙集是一種有效的數(shù)學(xué)工具,用于處理數(shù)據(jù)的不完整和不確定的信息,是由波蘭科學(xué)家Pawlak[20]在1982年提出.使用粗糙集時(shí),數(shù)據(jù)必須是離散的,但實(shí)際上決策表的大多數(shù)屬性是連續(xù)的,這一特性也大大限制了粗糙集的使用范圍,因此,連續(xù)的屬性應(yīng)該被替換為有限的語義變量,這就是連續(xù)屬性的離散化處理.在離散化過程中,為使屬性可以滿足粗糙集理論對(duì)屬性約簡和規(guī)則歸納的需求,需要依賴不同的離散化方法,如區(qū)域知識(shí)離散化、等距離散化、等頻離散化等.

    定義1.(信息集合系統(tǒng))一個(gè)信息集合系統(tǒng)可以用一個(gè)四元組表示:IS=,其中[21]:

    1)U為研究對(duì)象的非空有限集合,即論域.

    2)A為屬性的非空有限集合,即屬性集.

    3)V=∑a∈AVa為屬性A的值域,其中Va為屬性a∈A的值域.

    4)f:U×A→V為信息函數(shù),表示對(duì)每一個(gè)x∈U,a∈A,f(x,a)∈Va.

    如果A中的屬性表示為分類的結(jié)果,則信息系統(tǒng)IS被定義為DT=(U,C∪D,V,F(xiàn)),其中A=C∪D,C∩D=φ,C為條件屬性集,D為決策屬性集,該信息系統(tǒng)也被稱為決策表.

    定義2.(不可分辨關(guān)系)給予決策表DT=(U,C∪D,V,F(xiàn)),對(duì)于任意屬性集B?C∪D,則B的不可分辨關(guān)系IND(B)定義為[21]:

    IND(B)={(x,y)∈U×U:?a∈B(f(x,a)=f(y,a))}

    (3)

    不可分辨關(guān)系IND(B)把論域U劃分為相互不連接的子集,即等價(jià)類.IND(B)的所有等價(jià)類的集合記為U/IND(B),簡記為U/B.U/B也可稱之為IND(B)對(duì)論域U的劃分,對(duì)任意X?U,X/B={E∩X:E∈U/B∧E∩X≠?}稱為IND(B)對(duì)X的劃分.對(duì)任意x∈U,使得[x]B表示為IND(B)中包含x的等價(jià)類.

    (4)

    定義4.(正域)給予決策表DT=(U,C∪D,V,F(xiàn)),對(duì)于任意屬性集B?C∪D,稱POSB(D)為D的B正域.其所有對(duì)象為論域U的子集,使得U/D能準(zhǔn)確劃分來自屬性B的集合,其中[22]:

    (5)

    (6)

    定義5.(約簡)給予決策表DT=(U,C∪D,V,F(xiàn)),B?C∪D,a∈B,若IND(B)=IND(B-{a}),則a為B中冗余的,否則稱a為B中必要的.若任一a∈B都為B中必要的,且IND(C∪D)=IND(V),則稱B為V的一個(gè)約簡[23].

    定義6.(相對(duì)決策約簡) 給予決策表D=(U,C,D),B?C,a∈B,若B為D中獨(dú)立的,且POSB(D)=POSC(D),則稱B為C的一個(gè)D相對(duì)決策約簡.

    由于Pawlak的粗糙集模型更適合于處理含有離散屬性的數(shù)據(jù),所以在粗糙集中,連續(xù)屬性的離散化應(yīng)當(dāng)作為數(shù)據(jù)的預(yù)處理步驟.因此,連續(xù)屬性離散化是粗糙集中的一個(gè)重要工作.目前的離散化方法主要分為兩種,一種是在有監(jiān)督和無監(jiān)督框架內(nèi)的算法,一種是基于單變量和多變量的算法.

    有監(jiān)督算法通過考慮分類信息進(jìn)行離散屬性,如NB算法.在NB算法中,通過構(gòu)造切割點(diǎn)對(duì)所有屬性進(jìn)行排序.例如,連續(xù)屬性v的屬性值為r0,…,rn,決策類d(r0),…,d(rn),則v中的屬性切割點(diǎn)Ca=(ri+ri+1)/2,其中d(ri)≠d(ri+1),0≤i≤n-1.無監(jiān)督算法則不考慮分類信息,其效果沒有有監(jiān)督算法好,如EF(Entropy-Feature)算法[24].

    單變量算法在一個(gè)決策表中一次只考慮一個(gè)獨(dú)立的條件屬性,多變量算法則是同時(shí)考慮幾個(gè)條件屬性,通常情況下,多變量算法是考慮所有屬性在內(nèi)的.目前多數(shù)離散化算法都是單變量的,沒有考慮決策表中多依賴關(guān)系,因此會(huì)有丟失正確分類信息的風(fēng)險(xiǎn).傳統(tǒng)的連續(xù)屬性離散化方法一般分為4步:

    Step1.對(duì)連續(xù)屬性值按照某種規(guī)則進(jìn)行排序.

    Step2.初步確定連續(xù)屬性的切割點(diǎn)劃分.

    Step3.按照某種給定的標(biāo)準(zhǔn)繼續(xù)劃分切割點(diǎn) 或合并切割點(diǎn).

    Step4.如果Step 3得到判定標(biāo)準(zhǔn)的終止條件,則終止整個(gè)連續(xù)屬性離散化過程,否則繼續(xù)Step 3執(zhí)行.

    4 基于隨機(jī)游走模型的情感詞極性計(jì)算

    對(duì)于隨機(jī)游走模型在情感詞極性判別上的應(yīng)用,最重要的是需要構(gòu)建詞的圖框架,將數(shù)據(jù)映射成隨機(jī)游走圖,在圖框架中加入詞間的相關(guān)關(guān)系,進(jìn)而得到對(duì)未知詞極性的判別.其中,在進(jìn)行詞性判別前,需要對(duì)文本進(jìn)行特征選擇,以得到候選特征詞.在此基礎(chǔ)上,本文提出了基于擴(kuò)展隨機(jī)游走模型的情感詞極性判別算法,通過同義詞詞典構(gòu)建詞關(guān)聯(lián)圖,加入未知極性詞,計(jì)算隨機(jī)游走轉(zhuǎn)移概率,進(jìn)而預(yù)測未知單詞極性.

    4.1 特征選擇

    在文本分類中,特征詞及其類別傾向于服從CHI分布(Chi-squared Distribution),高CHI值意味著較高的特征分類能力,CHI值計(jì)算公式如下[25]:

    (7)

    其中N代表訓(xùn)練集大小;A代表屬于c類并且包含單詞t的文本數(shù)量;B代表不屬于c類并且不包含單詞t的文本數(shù)量;C代表屬于c類但不包含單、詞t的文本數(shù)量;D代表不屬于c類并且不包含單詞t的文本數(shù)量.

    盡管CHI在文本分類中有著較好的表現(xiàn),但仍有一些缺陷存在.首先,高頻詞的出現(xiàn)會(huì)導(dǎo)致高CHI值,但是它并不一定有較高的區(qū)分能力.其次,有些單詞在較少的文本中頻繁出現(xiàn),有著很好的區(qū)分能力,但CHI值偏低,導(dǎo)致被低估.通過對(duì)原始CHI記錄日志的處理,能有效降低高CHI值.改進(jìn)的CHI計(jì)算公式如下[26]:

    (8)

    其中,A+B代表包含單詞t的文本數(shù),N代表文本總數(shù).如果t在所有類別中都出現(xiàn)并且頻率很高,則其CHI值接近于0,因此可以篩選出來不具備特征屬性的高頻詞.

    4.2 詞匯情感極性判別

    基于隨機(jī)游走模型的描述以及對(duì)游走狀態(tài)的預(yù)測,本文提出基于擴(kuò)展隨機(jī)游走模型的情感詞極性判別算法.首先構(gòu)建一個(gè)詞匯關(guān)聯(lián)圖,并在圖中定義隨機(jī)游走.令S+和S-分別表示已經(jīng)標(biāo)記為正或負(fù)的目標(biāo)詞的兩組頂點(diǎn).

    對(duì)于任何給定的詞w,如前所述迭代地計(jì)算兩組Tn的h(w|S+)和h(w|S-). 然后將兩次Tn之間的比例用作給定字的正/負(fù)值的標(biāo)準(zhǔn).該方法可以很容易地從雙向分類(即正或負(fù))擴(kuò)展到三向分類(正,負(fù)或中性).通過設(shè)置正和負(fù)Tn比例的閾值λ,并且只有當(dāng)兩組Tn有明顯差異時(shí)才將單詞分為正或負(fù),否則將其分類為中性.圖的構(gòu)建采用哈工大社會(huì)計(jì)算與信息檢索研究中心提供的同義詞詞林(擴(kuò)展版),分別以Pos(w)、Neg(w)和Neu(w)來表示正、負(fù)和中性詞,算法如下:

    算法 1.基于擴(kuò)展隨機(jī)游走模型的情感詞極性判別算法(EDEW)

    輸入:詞關(guān)聯(lián)圖G(V,E);

    輸出:詞情感極性Sentiment(w).

    1 給定原始詞節(jié)點(diǎn)w,w∈V;

    2while(Pos(w)←φorNeg(w)←φ)

    3 從w出發(fā),隨機(jī)k個(gè)rw;

    4ifrw→Pos(w)then

    5E[h(w|S+)]←h*(w|S+);

    6endif;

    7elseifrw→Neg(w)then

    8E[h(w|S-)]←h*(w|S-);

    9endelse;

    10endwhile;

    11 設(shè)置擴(kuò)展參數(shù)λ(0<λ<1);

    12ifh*(w|S+)≤λh*(w|S-)then

    13Sentiment(w)←Pos(w);

    14endif;

    15elseifh*(w|S-)≤λh*(w|S+)then

    16Sentiment(w)←Neg(w);

    17endelse;

    18else

    19Sentiment(w)←Neu(w);

    20endelse

    在算法1中,結(jié)合詞關(guān)聯(lián)圖,得到最終詞匯情感極性.在1中,V表示詞關(guān)聯(lián)圖中節(jié)點(diǎn),w表示原始詞節(jié)點(diǎn);在3中,k表示隨機(jī)游走次數(shù),rw表示隨機(jī)游走的散列個(gè)數(shù);在45中表示如果其中一個(gè)游走散列到達(dá)目標(biāo)節(jié)點(diǎn)Pos(w),則游走結(jié)束,得到h(w|S+)的目標(biāo)期望值h*(w|S+).

    在二分類情況下,每個(gè)詞匯極性必須為正或負(fù),如果h*(w|S+)大于h*(w|S-),則該原始詞匯極性判定為負(fù),否則判定為正.這可以通過在算法1中設(shè)置擴(kuò)展參數(shù)λ=1來實(shí)現(xiàn).

    由于計(jì)算轉(zhuǎn)移概率P時(shí),需要?dú)w一化節(jié)點(diǎn)之外邊的權(quán)重W(0

    (9)

    其中,Pij表示從節(jié)點(diǎn)i到節(jié)點(diǎn)j歸一化后的游走權(quán)重值,Wkmin表示K次游走權(quán)重調(diào)整中的最小值,Wkmax表示K次游走權(quán)重調(diào)整中的最大值.

    4.3 獲取候選屬性及建立文本情感決策表

    在文本情感分類中,候選屬性集決定待分類的文本維度,通過特征選擇及情感詞極性判定,得到較低維度的文本,使得屬性集更具有代表性.候選屬性集的獲取步驟如下:

    Step1.對(duì)訓(xùn)練文本進(jìn)行分詞.

    Step2.根據(jù)式(8),計(jì)算詞匯CHI值,篩選詞征,得到候選特征集.

    Step3.通過EWPDA算法,得到候選特征集的情感極性權(quán)重,結(jié)合詞匯特征,進(jìn)而構(gòu)成候選屬性集.

    通過上述3個(gè)步驟,得到候選屬性集,由于在計(jì)算情感極性前,進(jìn)行了文本的特征選擇,所以得到的文本維度有了一定程度的約簡,降低了詞匯圖計(jì)算的時(shí)間復(fù)雜度.

    文本決策表[27]也叫作文本判定表,它可以把復(fù)雜的邏輯關(guān)系和多種條件組合的情況表達(dá)的比較明確,由于它邏輯結(jié)構(gòu)的嚴(yán)格性,可用于對(duì)文本屬性類別進(jìn)行判定.在文本情感分類中,常常將單個(gè)詞匯作為分類特征用以構(gòu)造文本表示向量,而情感詞匯對(duì)分類的貢獻(xiàn)要高于普通詞匯.因此,我們用來建立一種帶有特征情感詞匯極性的文本表示模型.

    表1 文本情感決策表Table 1 Decision table for text sentiment

    形式化該模型,一個(gè)文本Doci被表示為在一組屬性(F1,P1),(F2,P2),…,(Fn,Pn)下的取值所構(gòu)成的向量(wi1,…,wij,…,win),其中屬性(Fj,Pj)由特征Fj和其詞匯情感極性權(quán)重Pj組成,wij表示文本Doci在特征Fj下的權(quán)重,在表1中,“D”列表示文本的情感傾向類別,取“正”或者“反”.

    5 基于粗糙集的連續(xù)屬性離散化

    為了克服傳統(tǒng)離散化方法排序規(guī)則的復(fù)雜度問題,本文對(duì)傳統(tǒng)的離散化方法做出了改進(jìn),通過隨機(jī)游走模型中對(duì)游走邊的權(quán)重劃分,得到每個(gè)詞的游走權(quán)重,對(duì)于每個(gè)游走權(quán)重,結(jié)合候選特征詞,從而得候選屬性集C.第j個(gè)候選屬性表示為(Fj,Pj),結(jié)合不可分辨關(guān)系的定義,進(jìn)而得到等價(jià)類的劃分U/IND(B).為解決傳統(tǒng)離散化方法中切割點(diǎn)選取過多導(dǎo)致的數(shù)據(jù)冗余問題,本文提出基于情感詞極性權(quán)重序的屬性離散化算法,算法可以有效減少切割點(diǎn)數(shù)量,得到最優(yōu)的離散化決策表.

    對(duì)于決策表DT=(U,C∪D,V,F(xiàn)),其屬性B?C,hi∈B,則IND(h)在論域U中劃分的等價(jià)類表示為U/{hi}.

    算法 2.等價(jià)類計(jì)算

    輸入:DT=(U,C∪D,V,F(xiàn)),B?C,

    U={x1,…,xn};

    輸出:B對(duì)應(yīng)對(duì)象集U的劃分U/B.

    1 對(duì)對(duì)象集U進(jìn)行排序;

    2t←1,k←1,B1←{x1};

    3fori←2 tondo

    ifxi和xk對(duì)于B中的每個(gè)屬性具有相同值;

    Bt←Bt∪{xi};

    endif;

    else

    t←t+1;

    B←{xi};

    k←i;

    endelse;

    endfor;

    4U/B←Bt

    算法3.基于情感詞極性權(quán)重序的屬性離散化算法(ADPWS)

    輸入:決策表DT=(U,C∪D,V,F(xiàn)),

    U={x1,…,xn},C={h1,…,hm},

    B?C;

    輸出:決策表DT*=(U*,C*∪D*,V*,F(xiàn)*).

    1T={X1,…,X|T|},Xi?U,1≤i≤|T|,h是需要離散化的屬性,j←1;t←|T|;count←0;

    2whilej

    3low←Max({f(x,a):x∈Xj});

    4high←Min({f(x,a):x∈Xj+1});

    6 通過算法2計(jì)算Xj/(C-{h}),Xj+1/(C-{h})和(Xj∪Xj+1)/(C-{h});

    8count←count+1;

    9Ycoount←Xj∪Xj+1;

    10 在T中用Ycount取代Xj和Xj+1,j←j+2;

    11ifj=tthen

    12count←count+1,Ycount←Xj;

    13 在T中用Ycount取代Xj;

    14endif;

    15else

    16 獲取屬性切割點(diǎn)c=(low+high)/2,

    17P←P∪{c};

    18count←count+1,Ycount←Xj;

    19 在T中用Ycount取代Xj,把T分為兩個(gè)子集

    20T1={Y1,…,Ycount}和T2={Xj+1,…,Xt};

    21ifcount>1orj+1

    22 通過算法2計(jì)算U/{hi}={X1,…,Xq},并得到離散化屬性hi;

    23endif;

    24endelse;

    25endwhile;

    26 返回離散化決策表DT*

    在算法3中,結(jié)合等價(jià)類計(jì)算算法,最終得到離散化決策表DT*.在1中,T={X1,…,X|T|}為屬性h當(dāng)前區(qū)間集合;在3和4中,通過相鄰區(qū)間的最大值和最小值,進(jìn)而得到切割點(diǎn)的劃分c=(low+high)/2;通過5可以計(jì)算6中的正域,即基于(C-{h})的分類劃分.在7中判斷基于(C-{h})劃分下Xj,Xj+1的正域之和是否與Xj∪Xj+1相等.

    在算法3中,若用m,n分別表示C和U的基數(shù),在最壞情況下,1的算法時(shí)間復(fù)雜度為O(m×nlog2n),則整個(gè)算法的時(shí)間復(fù)雜度為O(m2×nlog2n).

    6 基于粗糙決策置信度的文本情感類別判定

    粗糙集理論包含了對(duì)信息系統(tǒng)的約簡,通過去除冗余信息,完成對(duì)規(guī)則的提取,實(shí)現(xiàn)在沒有任何先驗(yàn)知識(shí)基礎(chǔ)上的系統(tǒng)分類.在連續(xù)屬性離散化的過程中,也包含了對(duì)決策表的約簡,通過選擇切割點(diǎn)并且合并相鄰間隔區(qū)間,得到?jīng)Q策表中條件屬性的約簡.通過離散化后的決策表可以獲得知識(shí)系統(tǒng)中的隱含數(shù)據(jù),即決策規(guī)則,以此增加對(duì)新對(duì)象匹配的可能性.一般地,在文本數(shù)據(jù)處理過程中,不可避免的會(huì)出現(xiàn)“維數(shù)災(zāi)難”問題,在文本向量空間中,維數(shù)災(zāi)難問題就轉(zhuǎn)化為了高維特征空間的線性劃分問題,其維數(shù)的增加就會(huì)導(dǎo)致數(shù)據(jù)稀疏,從而引出屬性值匹配困難,這也是本節(jié)需要解決的問題.

    本節(jié)提出了基于粗糙決策置信度的文本情感類別判定算法,通過分類文本中的條件屬性及其游走權(quán)重值,找出文本在訓(xùn)練集中的等價(jià)類,并計(jì)算其決策類的置信度,然后計(jì)算在屬性特征及相對(duì)應(yīng)文本位置下的權(quán)重,構(gòu)造在決策類下的隸屬度函數(shù),得到最終的文本情感類別判定.通過計(jì)算在待分類文本中每個(gè)屬性的隸屬度,從而避免了多屬性值的匹配困難問題和其所引發(fā)的數(shù)據(jù)稀疏問題.

    定義7.(粗糙決策隸屬度)給予決策表DT=(U,C,D),其中B?C,j∈B,x∈U,其中屬性均為符號(hào)值屬性,j*為屬性j下的一個(gè)條件屬性,Cd為一個(gè)決策類,Cd={x∈U|C(x)=d},則

    (10)

    (11)

    其中,稱μcd為文本在決策類d下的粗糙決策置信度.情感極性權(quán)重Pj已經(jīng)歸一化,wij≠0,μcd(U)越接近于1,則表明其隸屬于決策類Cd的可信程度越高.

    算法4.基于粗糙決策置信度的文本類別判定算法(TCRDC)

    輸入:決策表DT*=(U*,C*,D*),待分類文本

    U*=(U1,U2…,Un);

    輸出:文本類別集合CPOS,CNEG.

    1CPOS,CNEG←?,i=1;

    2foreachU∈U*do

    3ifi≠nthen

    4 通過公式(14)計(jì)算μcd(Ui)的值;

    5i=i+1;

    6C(U)=μcPOS(Ui);

    7CPOS=CPOS∪argmax{μcPOS(Ui)};

    8endif;

    9elseifC(U)=μcNEG(Ui);

    10CNEG=CNEG∪argmax{μcNEG(Ui)};

    11 end else;

    12endfor

    在待分類文本U中,CPOS和CNEG分別表示正反兩種情感類別,由μcd(U)得到的正反兩類文本分別為:

    (12)

    其中:

    CPOS={x∈U|C(x)=POS}
    CNEG={x∈U|C(x)=NEG}

    (13)

    通過計(jì)算文檔的置信度,從而得到其隸屬于正反兩類文本的最大值,就是對(duì)于正反兩類文本的最大置信度的分類.

    7 實(shí)驗(yàn)結(jié)果與分析

    7.1 實(shí)驗(yàn)數(shù)據(jù)

    實(shí)驗(yàn)數(shù)據(jù)采用第6屆中文傾向性分析評(píng)測語料及第3屆自然語言處理與中文計(jì)算會(huì)議評(píng)測語料,記作COAE2014及NLPCC2014,在COAE2014中提取其中對(duì)食品飲料的評(píng)論文本400篇,其中正面文本200篇,負(fù)面文本200篇;在NLPCC2014中提取其中對(duì)音樂及電影的評(píng)論400篇,其中正面文本200篇,負(fù)面文本200篇,總計(jì)共800篇文本語料.由于評(píng)論中人群主要涉及對(duì)于食品飲料使用及電影觀看后的評(píng)價(jià),都是作為普通消費(fèi)者人群,因此具有一定的代表性.使用其中600篇語料作為訓(xùn)練數(shù)據(jù)集,剩余200篇作為測試數(shù)據(jù)集.通過分詞工具對(duì)所有文本進(jìn)行分詞及詞性標(biāo)注,并采用人工方式對(duì)文本情感類別進(jìn)行標(biāo)注,情感文本數(shù)據(jù)集如表2所示.

    表2 情感文本數(shù)據(jù)集Table 2 Emotional text dataset

    7.2 文本情感詞極性判別

    通過第3.1節(jié)介紹的方法后獲取候選文本屬性集,由于選取較少特征詞會(huì)損失一定的實(shí)驗(yàn)精度,選取過多特征詞雖不會(huì)對(duì)結(jié)果造成直接影響,但會(huì)造成數(shù)據(jù)冗余,提高算法的時(shí)間復(fù)雜度.王素格等[28]提出一種面向非平衡文本情感分類的TSF特征選擇方法,通過在COAE2014選取的圖書評(píng)論數(shù)據(jù)集,顯式組合正相關(guān)和負(fù)相關(guān)特征,去考量特征的平衡性用以表達(dá)文本信息.本文綜合文本數(shù)量及文本平衡性,為使特征詞的選擇能更好代表實(shí)驗(yàn)結(jié)果,因此在600篇訓(xùn)練數(shù)據(jù)集里,選取候選特征詞700個(gè),里面包括了積極詞匯特征數(shù)350個(gè),消極詞匯特征數(shù)350個(gè),部分詞匯特征如表3所示.

    表3 情感詞匯示例Table 3 Examples of emotional words

    自旋模型(Spin)、標(biāo)簽傳播方法(Label Propagation Algorithm,LP)都是針對(duì)情感詞的詞匯極性判別方法,Spin模型通過計(jì)算文本的近似概率函數(shù)去優(yōu)化被選參數(shù),只需少量種子詞就可高精度定義語義傾向,但該方法需要手動(dòng)標(biāo)注種子詞,在數(shù)據(jù)規(guī)模較大的情況下時(shí)間復(fù)雜度過高;LP方法是一種基于圖的半監(jiān)督學(xué)習(xí)方法,其基本思路是用已標(biāo)記節(jié)點(diǎn)的文本標(biāo)簽去預(yù)測未標(biāo)記節(jié)點(diǎn)的文本標(biāo)簽,但該方法缺少對(duì)文本標(biāo)簽信息的驗(yàn)證;而本文提出的RW方法可以通過隨機(jī)游走選取種子詞,并且對(duì)種子詞進(jìn)行十折交叉驗(yàn)證,來驗(yàn)證其準(zhǔn)確率.本文把訓(xùn)練數(shù)據(jù)集分為10份,每份含有特征詞匯80個(gè),通過7次十折交叉驗(yàn)證比較RW與Spin模型,LP方法的準(zhǔn)確率,如圖2所示.

    圖2 十折交叉驗(yàn)證準(zhǔn)確率對(duì)比Fig.2 Accuracy rate of ten fold cross-validation

    由圖2可以得出,不考慮參數(shù)影響,隨機(jī)游走算法通過十折交叉驗(yàn)證準(zhǔn)確率要優(yōu)于Spin模型和LP方法.在7次十折交叉驗(yàn)證中,由于分組數(shù)據(jù)的不同,其準(zhǔn)確率也會(huì)隨之波動(dòng),但每種算法波動(dòng)趨勢趨于一致,RW算法與其余兩組數(shù)據(jù)對(duì)比中,在數(shù)據(jù)的耐受性方面表現(xiàn)較好.

    在實(shí)驗(yàn)中,稱原始詞匯節(jié)點(diǎn)為種子詞,本文設(shè)計(jì)了針對(duì)不同方法的5組10種子詞實(shí)驗(yàn),通過求取不同種子詞的加權(quán)平均值,將RW算法與Spin模型、LP方法、SO-PMI方法的情感詞匯極性判別的準(zhǔn)確率進(jìn)行對(duì)比.其中,SO-PMI方法是將PMI引入計(jì)算詞語的情感傾向中,從而達(dá)到捕獲情感詞的目的,在本文中SO-PMI的計(jì)算公式為:

    (14)

    其中,w是具有未知極性的單詞,hitsw,pos是在搜索查詢給定單詞時(shí)返回的命中次數(shù)和提取的所有正種子詞.hitspos是搜索所有正種子詞時(shí)的命中數(shù),類似地定義了hitsw,neg和hitsneg.對(duì)比實(shí)驗(yàn)結(jié)果如圖3所示.

    圖3 不同方法中10種子詞結(jié)果對(duì)比 Fig.3 Comparison of ten seeds vocabulary in different methods

    在選取種子詞進(jìn)行驗(yàn)證的過程中,考慮到隨著SO-PMI方法中數(shù)據(jù)量的增加,其準(zhǔn)確率會(huì)有所上升,在選取SO-PMI方法中的數(shù)據(jù)時(shí)的數(shù)據(jù)量為1×107,屬于比較平均的數(shù)據(jù)量,而更高的數(shù)據(jù)量對(duì)結(jié)果對(duì)比影響較小.LP方法效果較差,隨機(jī)游走方法稍優(yōu)于Spin方法.總體來看,在對(duì)比這幾種經(jīng)典構(gòu)圖算法中,隨機(jī)游走算法為結(jié)果較優(yōu)的算法.

    雖然隨機(jī)游走在上述結(jié)果表現(xiàn)較好,但是未考慮參數(shù)對(duì)算法準(zhǔn)確率的影響,由于隨機(jī)游走模型中樣本K值和最大游走Step對(duì)最終情感極性判別的準(zhǔn)確率影響較大,并且最后特征的權(quán)重與步數(shù)有很大的相關(guān)關(guān)系,所以下面要討論K值及最大游走Step對(duì)隨機(jī)游走的準(zhǔn)確率的影響,如圖4所示.由于不同類別特征在訓(xùn)練時(shí)對(duì)λ的敏感度不同,實(shí)驗(yàn)通過不斷調(diào)整擴(kuò)展參數(shù)λ,在0.1-1.0之間進(jìn)行測試,在訓(xùn)練數(shù)據(jù)集中,選取λ=0.8能得到較為清晰的結(jié)果.

    圖4 參數(shù)對(duì)準(zhǔn)確率的影響Fig.4 Influence of the parameters on the accuracy

    從實(shí)驗(yàn)結(jié)果可以看出,不斷增加的Step與準(zhǔn)確率有一種先增后減的趨勢,而不斷增加的K值與準(zhǔn)確率成正比.在試驗(yàn)中設(shè)置初始Step為5,這是因?yàn)槿绻鸖tep小于5,則準(zhǔn)確率波動(dòng)太大,使得結(jié)果缺少可信度.由于Step越少,則從種子詞節(jié)點(diǎn)搜尋到正確情感詞匯極性的概率越大,所以Step的增加,會(huì)導(dǎo)致尋找到正確情感詞極性的概率變小,而當(dāng)Step取15左右時(shí),能得到較好的結(jié)果;而對(duì)于K值來說,由于最大散列數(shù)的增加,越大的K值使得能搜尋到正確結(jié)果的概率越大,實(shí)驗(yàn)結(jié)果也更加說明了Step及K值對(duì)準(zhǔn)確率的影響.

    7.3 文本情感決策表離散化

    通過計(jì)算情感詞極性傾向強(qiáng)度值,結(jié)合公式(9)計(jì)算隨機(jī)游走權(quán)重百分比,對(duì)每個(gè)特征在文本中的權(quán)重予以賦值[29],賦權(quán)之后的文本決策表如表4所示.

    表4 情感詞極性處理數(shù)據(jù)表示Table 4 Expression of emotion word processing data

    表4中共有訓(xùn)練文本600篇,包含特征選擇及權(quán)重處理后得到的700個(gè)特征,包括“好產(chǎn)品、努力、問題、呵護(hù)、關(guān)懷、激進(jìn)、圓滑、諷刺、強(qiáng)化、……”得到的特征文本矩陣為600×700,每個(gè)特征詞的情感極性權(quán)重均為歸一化后的結(jié)果,每個(gè)特征詞在文本所占比重也為歸一化后的結(jié)果.其值越接近1,則特征在文本中所占的比重越大.

    表5 離散化后的決策表Table 5 Decision table after discretization

    如表5所示,當(dāng)特征在文本下權(quán)重值為0,使得離散化后的特征權(quán)重仍然為0.可以看出,算法3能夠保證文本決策表離散化后的分類能力仍能保持不變.

    為了對(duì)比本方法的效果,將通過三個(gè)指標(biāo)進(jìn)行比對(duì),一是切割點(diǎn)的數(shù)量(CU);二是離散化時(shí)間(TI);三是屬性壓縮比率(RI),與本方法對(duì)比的三種經(jīng)典方法是NB、ME、EF.具體結(jié)果如表6所示.

    表6 離散化數(shù)據(jù)指標(biāo)對(duì)比Table 6 Data index comparison after discretization

    為了在試驗(yàn)中排除由于硬件問題導(dǎo)致的數(shù)據(jù)不穩(wěn)定,統(tǒng)一機(jī)器參數(shù)信息(OS:Windows 7;CPU:Inter(R) Pentium(R) CPU of 2.10 GHz;Memory:4GB)并對(duì)每個(gè)算法的計(jì)算時(shí)間都進(jìn)行了5次驗(yàn)證,最終結(jié)果取平均值.可以看出,ADPWS算法在切割點(diǎn)數(shù)量和數(shù)據(jù)屬性的壓縮比率上都優(yōu)于其他方法,但在時(shí)間花費(fèi)上沒有EF算法效果好.由此可以得出,ADPWS方法在切割點(diǎn)選取和屬性壓縮方面效果較好,但在運(yùn)行時(shí)間上還有進(jìn)一步的改進(jìn)空間.

    7.4 文本情感類別判定

    使用ADPWS算法對(duì)決策表DT進(jìn)行離散化后,得到離散化決策表DT*,離散化后的屬性為文本最終屬性,下一步通過粗糙決策置信度對(duì)測試集文本進(jìn)行表示,同時(shí)使用多種評(píng)價(jià)指標(biāo)對(duì)分類結(jié)果進(jìn)行對(duì)比,查準(zhǔn)率(P)、查全率(R)、F1值.同時(shí),使用多種分類算法與粗糙決策置信度方法進(jìn)行對(duì)比,SVM、K近鄰(k-Nearest Neighbor,KNN)、NB、文獻(xiàn)[30]的粗糙隸屬度分類方法(P-B).其中,F(xiàn)1值是

    (15)

    公式中α取1時(shí)的結(jié)果,F(xiàn)1值是取P值和R值的加權(quán)調(diào)和平均,F(xiàn)1值越大,則說明實(shí)驗(yàn)的方法越有效.實(shí)驗(yàn)還通過分析正類文本和負(fù)類文本的P值、R值、F1值,來得到更全面的測試評(píng)價(jià)指標(biāo),實(shí)驗(yàn)結(jié)果如圖5所示.

    圖5 不同分類方法結(jié)果對(duì)比Fig.5 Comparison of the classification results of different methods

    由圖5可以看出,在多評(píng)價(jià)指標(biāo)下,本文所提出的方法均取得了較好的效果,在負(fù)類查準(zhǔn)率、正類F1值指標(biāo)下均優(yōu)于其它幾種方法,幾種評(píng)價(jià)指標(biāo)下相比較于P-B方法、KNN方法的正確率有所提升,正確率提升約1.85%,表明數(shù)據(jù)離散化后的屬性分類能力與原屬性相比并沒有丟失.

    8 總 結(jié)

    文本情感分類問題,一直是研究的熱點(diǎn),如何提高分類效率,減少分類過程中的數(shù)據(jù)維度,同時(shí)又不損失精度,這是本文所需要解決的主要問題.隨機(jī)游走模型多用于排序問題,本文推廣了隨機(jī)游走模型,將文本空間轉(zhuǎn)化為詞匯圖,提出了基于擴(kuò)展隨機(jī)游走模型的情感詞極性判別算法,有效判別情感詞極性,最終得到候選屬性集;通過對(duì)候選屬性集的處理,結(jié)合特征權(quán)重,構(gòu)建情感詞匯決策表,提出基于情感詞極性權(quán)重序的屬性離散化算法,得到離散化決策表;為把離散化后的屬性特征進(jìn)行表示,提出粗糙決策置信度模型,對(duì)文本進(jìn)行最終決策分類.實(shí)驗(yàn)對(duì)算法進(jìn)行了分析,均取得了較優(yōu)的效果,但有些步驟仍有改進(jìn)的空間,比如離散化算法中的時(shí)間復(fù)雜度問題,通過進(jìn)一步的優(yōu)化應(yīng)能得到理想的效果.由于每個(gè)步驟都有可能對(duì)實(shí)驗(yàn)的最終分類結(jié)果造成精度的損失,如何提取整合方法中的優(yōu)點(diǎn)以提高整體精度,這也是今后工作的一個(gè)要點(diǎn).

    猜你喜歡
    詞匯分類文本
    分類算一算
    本刊可直接用縮寫的常用詞匯
    一些常用詞匯可直接用縮寫
    在808DA上文本顯示的改善
    本刊可直接用縮寫的常用詞匯
    分類討論求坐標(biāo)
    基于doc2vec和TF-IDF的相似文本識(shí)別
    電子制作(2018年18期)2018-11-14 01:48:06
    數(shù)據(jù)分析中的分類討論
    教你一招:數(shù)的分類
    文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
    香蕉国产在线看| 亚洲中文日韩欧美视频| 国产色视频综合| 免费高清在线观看日韩| 久久亚洲精品不卡| 免费少妇av软件| 黄网站色视频无遮挡免费观看| 亚洲五月色婷婷综合| 亚洲精品在线美女| 久久久久国产精品人妻一区二区| 日韩 亚洲 欧美在线| 欧美性长视频在线观看| 在线观看舔阴道视频| 在线观看舔阴道视频| 欧美精品啪啪一区二区三区 | 色婷婷久久久亚洲欧美| 亚洲欧美精品综合一区二区三区| 一边摸一边抽搐一进一出视频| 欧美日韩精品网址| 九色亚洲精品在线播放| 日韩一区二区三区影片| 伊人久久大香线蕉亚洲五| 日本91视频免费播放| 精品国产一区二区三区四区第35| 伊人亚洲综合成人网| 成人国产av品久久久| 热99国产精品久久久久久7| 久久人人97超碰香蕉20202| 国产精品二区激情视频| 制服诱惑二区| 日本av手机在线免费观看| 少妇 在线观看| 亚洲少妇的诱惑av| 国产免费av片在线观看野外av| 亚洲视频免费观看视频| 国产精品一区二区免费欧美 | 水蜜桃什么品种好| 少妇 在线观看| 天堂俺去俺来也www色官网| 妹子高潮喷水视频| 12—13女人毛片做爰片一| 99久久人妻综合| 亚洲精品一区蜜桃| 欧美av亚洲av综合av国产av| 美女中出高潮动态图| 欧美午夜高清在线| 国产精品.久久久| 日韩大码丰满熟妇| 青青草视频在线视频观看| 99热全是精品| 国产欧美日韩一区二区三 | 女人爽到高潮嗷嗷叫在线视频| 婷婷成人精品国产| 欧美成人午夜精品| 国产精品久久久久久精品古装| www.精华液| 久久精品成人免费网站| 成人手机av| 中文欧美无线码| 久久久国产成人免费| 色婷婷av一区二区三区视频| 各种免费的搞黄视频| 国产精品欧美亚洲77777| 正在播放国产对白刺激| 91老司机精品| 真人做人爱边吃奶动态| 欧美中文综合在线视频| 大片电影免费在线观看免费| 亚洲色图 男人天堂 中文字幕| 午夜老司机福利片| 久久久精品94久久精品| 精品卡一卡二卡四卡免费| 国产深夜福利视频在线观看| 亚洲国产精品一区二区三区在线| 午夜成年电影在线免费观看| 少妇 在线观看| 国产一卡二卡三卡精品| 69精品国产乱码久久久| 国产免费视频播放在线视频| tube8黄色片| 久久人妻熟女aⅴ| 一本色道久久久久久精品综合| 国产精品熟女久久久久浪| 天天影视国产精品| 18在线观看网站| 久久午夜综合久久蜜桃| 国产欧美日韩一区二区三区在线| 国产有黄有色有爽视频| 少妇的丰满在线观看| 免费在线观看视频国产中文字幕亚洲 | 免费黄频网站在线观看国产| 高清黄色对白视频在线免费看| 精品欧美一区二区三区在线| 精品少妇一区二区三区视频日本电影| 99re6热这里在线精品视频| av福利片在线| 亚洲成人手机| 国产亚洲精品第一综合不卡| 亚洲国产欧美一区二区综合| 久久久精品94久久精品| 国产高清视频在线播放一区 | 黄色视频在线播放观看不卡| 日本黄色日本黄色录像| 十分钟在线观看高清视频www| 在线十欧美十亚洲十日本专区| 青春草视频在线免费观看| av网站免费在线观看视频| 黑人猛操日本美女一级片| 黄网站色视频无遮挡免费观看| 国产一区二区三区综合在线观看| 精品国产一区二区久久| 女性被躁到高潮视频| 在线观看免费视频网站a站| 母亲3免费完整高清在线观看| 欧美国产精品一级二级三级| 18禁观看日本| 美女大奶头黄色视频| 正在播放国产对白刺激| av线在线观看网站| 久久天躁狠狠躁夜夜2o2o| 天堂8中文在线网| 久久久久久久大尺度免费视频| 亚洲中文av在线| 色婷婷av一区二区三区视频| 黑人巨大精品欧美一区二区mp4| 久久中文看片网| 在线观看免费午夜福利视频| 欧美国产精品va在线观看不卡| 精品一品国产午夜福利视频| 久久性视频一级片| 咕卡用的链子| 亚洲精品一二三| 在线观看免费日韩欧美大片| 男男h啪啪无遮挡| 午夜免费成人在线视频| 亚洲精华国产精华精| 久久热在线av| 少妇精品久久久久久久| 亚洲五月婷婷丁香| 又黄又粗又硬又大视频| 人妻一区二区av| 18禁黄网站禁片午夜丰满| 在线观看舔阴道视频| 精品一区二区三卡| 亚洲人成电影免费在线| 欧美精品啪啪一区二区三区 | 高清av免费在线| 黑人巨大精品欧美一区二区mp4| 日韩三级视频一区二区三区| e午夜精品久久久久久久| 一区二区三区四区激情视频| 欧美av亚洲av综合av国产av| 久久久久网色| 免费在线观看完整版高清| 一区二区av电影网| 两性午夜刺激爽爽歪歪视频在线观看 | 亚洲国产av新网站| 欧美日韩av久久| 中文字幕人妻丝袜一区二区| 大片电影免费在线观看免费| 国产高清视频在线播放一区 | 性色av一级| 女人久久www免费人成看片| 久久久久视频综合| 一边摸一边做爽爽视频免费| 色94色欧美一区二区| 2018国产大陆天天弄谢| 飞空精品影院首页| 欧美在线一区亚洲| 少妇猛男粗大的猛烈进出视频| 巨乳人妻的诱惑在线观看| 男女下面插进去视频免费观看| 中国国产av一级| 纯流量卡能插随身wifi吗| 精品免费久久久久久久清纯 | 欧美另类亚洲清纯唯美| 欧美 日韩 精品 国产| 美女脱内裤让男人舔精品视频| 丰满人妻熟妇乱又伦精品不卡| 欧美亚洲日本最大视频资源| 老鸭窝网址在线观看| 午夜免费鲁丝| 日韩电影二区| 黄色片一级片一级黄色片| 超碰成人久久| 日韩熟女老妇一区二区性免费视频| av又黄又爽大尺度在线免费看| 国产日韩欧美视频二区| 日韩欧美免费精品| 色视频在线一区二区三区| 久久精品国产a三级三级三级| cao死你这个sao货| 色视频在线一区二区三区| 午夜福利视频在线观看免费| 国产欧美日韩一区二区精品| 亚洲午夜精品一区,二区,三区| 国产精品二区激情视频| 免费av中文字幕在线| 自线自在国产av| 日韩人妻精品一区2区三区| 日本av手机在线免费观看| 搡老岳熟女国产| 国产精品成人在线| 一本综合久久免费| 男女床上黄色一级片免费看| 亚洲国产欧美在线一区| 91字幕亚洲| 纵有疾风起免费观看全集完整版| 欧美乱码精品一区二区三区| 亚洲精品一二三| 国产成人免费观看mmmm| 午夜精品国产一区二区电影| 日韩人妻精品一区2区三区| 国产成人精品久久二区二区免费| 亚洲国产精品999| e午夜精品久久久久久久| 亚洲熟女毛片儿| 黑丝袜美女国产一区| 久久久精品94久久精品| 搡老岳熟女国产| 99香蕉大伊视频| 欧美日韩精品网址| 免费高清在线观看日韩| 两个人看的免费小视频| 啦啦啦免费观看视频1| 国产黄频视频在线观看| 亚洲一区中文字幕在线| 国产精品自产拍在线观看55亚洲 | 免费久久久久久久精品成人欧美视频| 亚洲伊人色综图| 超色免费av| 人妻人人澡人人爽人人| 19禁男女啪啪无遮挡网站| 高清av免费在线| 好男人电影高清在线观看| 美女大奶头黄色视频| 99久久99久久久精品蜜桃| 午夜福利一区二区在线看| 操美女的视频在线观看| 久久人人97超碰香蕉20202| 亚洲av国产av综合av卡| 9热在线视频观看99| 精品久久久久久久毛片微露脸 | 日韩 欧美 亚洲 中文字幕| 精品熟女少妇八av免费久了| 啦啦啦啦在线视频资源| 男女边摸边吃奶| 国产成+人综合+亚洲专区| 美女高潮喷水抽搐中文字幕| 多毛熟女@视频| 涩涩av久久男人的天堂| 精品国产一区二区久久| 久久久久久久国产电影| 一区在线观看完整版| 曰老女人黄片| 少妇裸体淫交视频免费看高清 | 亚洲男人天堂网一区| av网站在线播放免费| 国产在线一区二区三区精| 久久性视频一级片| 麻豆乱淫一区二区| 麻豆av在线久日| 国产亚洲精品一区二区www | 热99久久久久精品小说推荐| 午夜久久久在线观看| 国产深夜福利视频在线观看| 99热国产这里只有精品6| 亚洲欧美精品综合一区二区三区| 51午夜福利影视在线观看| 99国产精品99久久久久| 99re6热这里在线精品视频| 国产亚洲午夜精品一区二区久久| 啦啦啦免费观看视频1| 久久久精品国产亚洲av高清涩受| 蜜桃国产av成人99| 欧美精品一区二区免费开放| 亚洲精品成人av观看孕妇| 亚洲欧美一区二区三区黑人| 91九色精品人成在线观看| 91精品三级在线观看| 日本猛色少妇xxxxx猛交久久| 亚洲国产欧美日韩在线播放| 99精国产麻豆久久婷婷| 免费久久久久久久精品成人欧美视频| 91老司机精品| 精品久久蜜臀av无| 亚洲欧美日韩高清在线视频 | 久久久精品区二区三区| 国产精品av久久久久免费| 国产熟女午夜一区二区三区| 亚洲精品av麻豆狂野| 亚洲精品国产区一区二| 男女床上黄色一级片免费看| 久久久国产成人免费| 日韩 亚洲 欧美在线| 老汉色av国产亚洲站长工具| 免费久久久久久久精品成人欧美视频| a级毛片黄视频| 人人妻人人爽人人添夜夜欢视频| 精品久久久久久电影网| 精品福利观看| h视频一区二区三区| 男人操女人黄网站| 国产在视频线精品| 欧美97在线视频| 亚洲激情五月婷婷啪啪| 久久国产亚洲av麻豆专区| 青春草视频在线免费观看| 日韩大码丰满熟妇| 国产av国产精品国产| 午夜影院在线不卡| 亚洲一卡2卡3卡4卡5卡精品中文| 亚洲精品av麻豆狂野| avwww免费| 国产精品秋霞免费鲁丝片| 亚洲精品国产av成人精品| 波多野结衣av一区二区av| 伊人亚洲综合成人网| 国产成人av激情在线播放| 精品亚洲乱码少妇综合久久| 国产有黄有色有爽视频| 人妻久久中文字幕网| 国产日韩欧美视频二区| 国产免费现黄频在线看| 18禁裸乳无遮挡动漫免费视频| 黄色视频在线播放观看不卡| 91精品三级在线观看| 女警被强在线播放| 老司机深夜福利视频在线观看 | 亚洲avbb在线观看| 亚洲国产欧美日韩在线播放| 日韩视频一区二区在线观看| 大片电影免费在线观看免费| 丁香六月天网| 精品久久蜜臀av无| 欧美97在线视频| 中文字幕色久视频| 男人添女人高潮全过程视频| 亚洲国产欧美在线一区| 国产一区有黄有色的免费视频| 亚洲国产av新网站| 精品亚洲成国产av| 一本色道久久久久久精品综合| 精品亚洲乱码少妇综合久久| 欧美黄色淫秽网站| 亚洲第一av免费看| 中文精品一卡2卡3卡4更新| 男女午夜视频在线观看| 桃花免费在线播放| 精品人妻一区二区三区麻豆| 亚洲成国产人片在线观看| 99国产极品粉嫩在线观看| 精品国产乱码久久久久久小说| 悠悠久久av| 制服诱惑二区| 狠狠精品人妻久久久久久综合| 精品国产乱码久久久久久小说| 久久久久久人人人人人| 日韩有码中文字幕| 欧美+亚洲+日韩+国产| av福利片在线| 亚洲精品国产av蜜桃| 99香蕉大伊视频| 久久久久久久大尺度免费视频| 欧美人与性动交α欧美精品济南到| 婷婷成人精品国产| 99热国产这里只有精品6| 天天躁夜夜躁狠狠躁躁| 99久久精品国产亚洲精品| 自线自在国产av| 一区二区av电影网| 久久久国产欧美日韩av| 狂野欧美激情性xxxx| 精品亚洲成国产av| 成人三级做爰电影| 热99久久久久精品小说推荐| 精品一区二区三区av网在线观看 | 香蕉丝袜av| 咕卡用的链子| 在线看a的网站| 国产精品熟女久久久久浪| 高清黄色对白视频在线免费看| 女性被躁到高潮视频| 人成视频在线观看免费观看| 一二三四在线观看免费中文在| 一级,二级,三级黄色视频| 亚洲精品第二区| 超色免费av| 另类精品久久| 精品国产乱码久久久久久小说| 欧美+亚洲+日韩+国产| 极品人妻少妇av视频| 精品亚洲成a人片在线观看| 操美女的视频在线观看| 男人添女人高潮全过程视频| 欧美精品av麻豆av| 人人妻人人爽人人添夜夜欢视频| 日日摸夜夜添夜夜添小说| 国产在线免费精品| 一本久久精品| 久久99一区二区三区| 国产精品一区二区精品视频观看| 18在线观看网站| 热re99久久精品国产66热6| 国产欧美日韩一区二区精品| 久久精品国产a三级三级三级| 女人精品久久久久毛片| avwww免费| 亚洲欧洲精品一区二区精品久久久| 亚洲成人国产一区在线观看| 色视频在线一区二区三区| 岛国毛片在线播放| 国产成+人综合+亚洲专区| 国产福利在线免费观看视频| 午夜两性在线视频| 69精品国产乱码久久久| 国产日韩欧美亚洲二区| 亚洲国产中文字幕在线视频| 91麻豆精品激情在线观看国产 | 亚洲九九香蕉| 欧美日韩精品网址| 成人手机av| 久久久久久久国产电影| 一本色道久久久久久精品综合| 亚洲国产看品久久| 久久热在线av| 国产免费现黄频在线看| 在线十欧美十亚洲十日本专区| 亚洲国产欧美一区二区综合| 国产精品久久久久久精品古装| 日本一区二区免费在线视频| 日本91视频免费播放| 久久久国产一区二区| 国产不卡av网站在线观看| 国产一区二区 视频在线| 日韩三级视频一区二区三区| 夜夜骑夜夜射夜夜干| 亚洲七黄色美女视频| 国产亚洲av高清不卡| 午夜福利在线观看吧| 亚洲三区欧美一区| 亚洲人成电影免费在线| 欧美精品高潮呻吟av久久| 国产精品欧美亚洲77777| 午夜福利,免费看| 免费一级毛片在线播放高清视频 | 国产男人的电影天堂91| 少妇被粗大的猛进出69影院| av在线播放精品| 91成年电影在线观看| 亚洲欧美清纯卡通| 久久久久久久久久久久大奶| 老汉色∧v一级毛片| 99久久国产精品久久久| 国产精品麻豆人妻色哟哟久久| 国产精品 欧美亚洲| 中文字幕人妻丝袜一区二区| 丰满少妇做爰视频| 最近最新免费中文字幕在线| 中文字幕制服av| 成人国语在线视频| 91麻豆精品激情在线观看国产 | 制服人妻中文乱码| 国产淫语在线视频| 一级片'在线观看视频| 日韩欧美一区视频在线观看| 青春草亚洲视频在线观看| 久久精品熟女亚洲av麻豆精品| 亚洲成国产人片在线观看| 久久毛片免费看一区二区三区| 精品国内亚洲2022精品成人 | 精品亚洲成国产av| 高清在线国产一区| 深夜精品福利| 99久久99久久久精品蜜桃| 纵有疾风起免费观看全集完整版| 婷婷色av中文字幕| 少妇人妻久久综合中文| 国产av一区二区精品久久| 精品一区二区三区av网在线观看 | 亚洲激情五月婷婷啪啪| 老熟妇仑乱视频hdxx| 成年女人毛片免费观看观看9 | 丰满饥渴人妻一区二区三| 日本wwww免费看| 国产一区有黄有色的免费视频| 成人影院久久| 免费高清在线观看日韩| 97精品久久久久久久久久精品| 如日韩欧美国产精品一区二区三区| 日本五十路高清| 2018国产大陆天天弄谢| 亚洲精品美女久久av网站| 欧美人与性动交α欧美软件| 久久性视频一级片| 久久久国产欧美日韩av| 亚洲av电影在线观看一区二区三区| 色94色欧美一区二区| 老司机在亚洲福利影院| 免费观看a级毛片全部| 极品少妇高潮喷水抽搐| 久久午夜综合久久蜜桃| 天天添夜夜摸| 国产日韩欧美视频二区| 日本撒尿小便嘘嘘汇集6| 亚洲精品久久成人aⅴ小说| 国产成人av激情在线播放| 国产有黄有色有爽视频| 天堂俺去俺来也www色官网| 免费不卡黄色视频| 亚洲精品久久成人aⅴ小说| av在线播放精品| 51午夜福利影视在线观看| 动漫黄色视频在线观看| av片东京热男人的天堂| 久久亚洲精品不卡| 中文字幕高清在线视频| av网站免费在线观看视频| 久久久久久人人人人人| 国产男女内射视频| 日韩三级视频一区二区三区| 美女国产高潮福利片在线看| 亚洲人成电影免费在线| 久久亚洲精品不卡| 热re99久久国产66热| 一级,二级,三级黄色视频| 伊人久久大香线蕉亚洲五| √禁漫天堂资源中文www| 日本黄色日本黄色录像| 在线 av 中文字幕| 亚洲天堂av无毛| 一个人免费看片子| 亚洲欧美日韩高清在线视频 | 亚洲精品国产一区二区精华液| 国产在线视频一区二区| 美女国产高潮福利片在线看| 国产欧美日韩综合在线一区二区| 欧美黑人精品巨大| 热re99久久国产66热| 麻豆av在线久日| av天堂在线播放| www.熟女人妻精品国产| 色94色欧美一区二区| 少妇 在线观看| 极品人妻少妇av视频| 1024香蕉在线观看| 夜夜骑夜夜射夜夜干| 如日韩欧美国产精品一区二区三区| 国产精品久久久av美女十八| 国产精品一区二区免费欧美 | 啦啦啦啦在线视频资源| av又黄又爽大尺度在线免费看| 国产在线视频一区二区| a 毛片基地| 日本wwww免费看| 亚洲视频免费观看视频| 夜夜骑夜夜射夜夜干| 国产av又大| 亚洲第一av免费看| 啦啦啦视频在线资源免费观看| 国产福利在线免费观看视频| 亚洲 国产 在线| 午夜成年电影在线免费观看| 国产一区二区三区在线臀色熟女 | 久久久精品国产亚洲av高清涩受| 久久久欧美国产精品| 午夜福利视频精品| 亚洲人成电影观看| 无遮挡黄片免费观看| xxxhd国产人妻xxx| 国产精品 国内视频| 97在线人人人人妻| 黄色a级毛片大全视频| 永久免费av网站大全| 嫩草影视91久久| 制服人妻中文乱码| 国产免费福利视频在线观看| 免费在线观看影片大全网站| 2018国产大陆天天弄谢| 亚洲人成77777在线视频| 国产亚洲一区二区精品| 可以免费在线观看a视频的电影网站| 日韩,欧美,国产一区二区三区| 水蜜桃什么品种好| 桃花免费在线播放| 欧美日本中文国产一区发布| 国产精品免费视频内射| 欧美黄色淫秽网站| 19禁男女啪啪无遮挡网站| 久久国产精品影院| 少妇的丰满在线观看| 国产一区二区激情短视频 | 国产成人一区二区三区免费视频网站| kizo精华| 五月天丁香电影| 久久这里只有精品19| 深夜精品福利| 老司机在亚洲福利影院| 国产区一区二久久| 黄色视频不卡| 国产精品免费视频内射| 国产成人欧美在线观看 | 亚洲精品一二三| 在线十欧美十亚洲十日本专区| 热99re8久久精品国产| 亚洲精品一二三| 国产老妇伦熟女老妇高清| 日韩制服骚丝袜av| 久久av网站| 9热在线视频观看99| 亚洲免费av在线视频| www.av在线官网国产| 亚洲熟女毛片儿| 熟女少妇亚洲综合色aaa.| 国产精品av久久久久免费|