• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于邏輯回歸的中文在線評(píng)論有效性檢測(cè)模型

    2015-06-09 20:18:34吳含前朱云杰
    關(guān)鍵詞:評(píng)論者主題詞分類

    吳含前 朱云杰 謝 玨

    (1東南大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院, 南京 210018)(2東南大學(xué)-蒙納士大學(xué)蘇州聯(lián)合研究生院, 蘇州 215123)

    ?

    基于邏輯回歸的中文在線評(píng)論有效性檢測(cè)模型

    吳含前1朱云杰1謝 玨2

    (1東南大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院, 南京 210018)(2東南大學(xué)-蒙納士大學(xué)蘇州聯(lián)合研究生院, 蘇州 215123)

    為了實(shí)現(xiàn)電子商務(wù)和社交網(wǎng)絡(luò)中文在線評(píng)論有效性的自動(dòng)化檢測(cè),提出了一種單一主題環(huán)境下基于邏輯回歸的垃圾評(píng)論檢測(cè)模型.中文在線評(píng)論有效性的檢測(cè)可以歸結(jié)為分類問題,結(jié)合中文在線評(píng)論的特點(diǎn)提取了9個(gè)特征以構(gòu)建分類模型;為獲取核心特征主題的相關(guān)度,采用基于關(guān)聯(lián)規(guī)則的評(píng)論名詞模式優(yōu)化了ICTCLAS中文分詞系統(tǒng)的主題識(shí)別,進(jìn)而利用交叉語言模型獲取在線評(píng)論主題相關(guān)度.實(shí)驗(yàn)中采取了人為標(biāo)定的1 000條評(píng)論作為樣本,把支持向量機(jī)分類模型作為對(duì)比進(jìn)行試驗(yàn),利用數(shù)據(jù)挖掘工具Weka進(jìn)行計(jì)算.結(jié)果表明,采用優(yōu)化評(píng)論名詞模式下基于邏輯回歸的垃圾評(píng)論檢測(cè)模型結(jié)果的準(zhǔn)確率達(dá)到83.54%,比支持向量機(jī)分類模型計(jì)算得到的準(zhǔn)確率高2.10%.

    在線評(píng)論有效性;邏輯回歸;關(guān)聯(lián)規(guī)則

    電子商務(wù)領(lǐng)域中,在線評(píng)論對(duì)網(wǎng)購用戶購買決策起著關(guān)鍵的影響作用.2013年中國(guó)網(wǎng)絡(luò)購物市場(chǎng)研究報(bào)告指出:直至2013年12月,國(guó)內(nèi)網(wǎng)購用戶達(dá)到3.02×109人,37.5%的用戶在購買不熟悉產(chǎn)品時(shí)主要考慮的是用戶評(píng)價(jià),其次為網(wǎng)站知名度和口碑[1].由于在線評(píng)論的好壞直接影響產(chǎn)品的銷售[2-3],電子商務(wù)網(wǎng)站中出現(xiàn)了大量誤導(dǎo)網(wǎng)購用戶的、具有惡意目的的評(píng)論;同時(shí),由于網(wǎng)購用戶規(guī)模巨大,在線評(píng)論數(shù)量的爆炸式遞增,增加了網(wǎng)購用戶識(shí)別評(píng)論有效性的難度.因此,如何實(shí)現(xiàn)在線評(píng)論有效性的自動(dòng)化識(shí)別成為了當(dāng)前學(xué)術(shù)界和工業(yè)界的研究熱點(diǎn).

    結(jié)合評(píng)論內(nèi)容及其評(píng)論發(fā)布者,研究者們從以下2個(gè)方面對(duì)評(píng)論的有效性展開研究:① 評(píng)論者異常行為的檢測(cè)[4-6],即通過研究評(píng)論者制造無效評(píng)論的方式和目的來發(fā)現(xiàn)無效評(píng)論者,從而識(shí)別無效評(píng)論;② 評(píng)論內(nèi)容的檢測(cè)[7-9],將評(píng)論有效性識(shí)別歸結(jié)為基于監(jiān)督學(xué)習(xí)的文本分類問題,通過構(gòu)建分類模型識(shí)別無效評(píng)論.針對(duì)基于評(píng)論者異常行為的檢測(cè),通常采取的方法包括:① 建立無效評(píng)論者檢測(cè)模型并對(duì)其打分[4],識(shí)別出無效評(píng)論制造者;② 采用關(guān)聯(lián)規(guī)則[5]發(fā)現(xiàn)異常評(píng)論模式并識(shí)別產(chǎn)生無效性評(píng)論行為,發(fā)現(xiàn)無效評(píng)論制造者.由于網(wǎng)站十分重視對(duì)評(píng)論者信息資源的保護(hù),在實(shí)際研究中難以完整獲取評(píng)論者的行為信息,故對(duì)實(shí)際評(píng)論者行為檢測(cè)的研究較為困難.基于評(píng)論內(nèi)容有效性的檢測(cè)是目前的研究重點(diǎn),最初工作可以追溯到Jindal等[7]對(duì)亞馬遜網(wǎng)站2.14×106位用戶編寫的5.8×106條英文評(píng)論中無效評(píng)論檢測(cè)的研究,給出了無效評(píng)論的定義,從評(píng)論內(nèi)容出發(fā)把無效評(píng)論劃分為不真實(shí)評(píng)論、僅針對(duì)品牌的評(píng)論以及無關(guān)評(píng)論3種類型,通過重復(fù)評(píng)論的檢測(cè)來識(shí)別不真實(shí)評(píng)論,并建立分類模型用于判別僅針對(duì)品牌的評(píng)論及無關(guān)評(píng)論.由于語言的差異性,這種基于英文評(píng)論的有效性檢測(cè)結(jié)果難以適用于在線中文評(píng)論的處理.

    本文研究了單一主題環(huán)境下中文在線評(píng)論有效性的檢測(cè)問題.首先,結(jié)合中文評(píng)論特點(diǎn),提取9個(gè)特征構(gòu)建了分類模型;然后,針對(duì)ICTCLAS中文分詞系統(tǒng)內(nèi)置名稱模式在單一主題中文評(píng)論環(huán)境下識(shí)別主題詞準(zhǔn)確度不高的問題,提出了一種具有更高精度的基于關(guān)聯(lián)規(guī)則的評(píng)論名詞模式,并采用交叉語言模型來判斷評(píng)論名詞與主題的相關(guān)度;最后,利用邏輯回歸分類模型來檢測(cè)中文在線評(píng)論的有效性.實(shí)驗(yàn)結(jié)果表明,該模型在中文在線評(píng)論的有效性檢測(cè)中能夠得到較高的檢測(cè)準(zhǔn)確率.

    1 評(píng)論有效性檢測(cè)分類模型

    1.1 邏輯回歸分類模型

    評(píng)論有效性檢測(cè)是一種典型的二值分類問題,通常利用分類模型進(jìn)行研究.分類模型是通過對(duì)已知類別數(shù)據(jù)集進(jìn)行學(xué)習(xí),構(gòu)造分類器來預(yù)測(cè)新數(shù)據(jù)的類別.數(shù)據(jù)集由特征值和類別組成,單條數(shù)據(jù)格式的表達(dá)式為{f1,f2,…,fn;y},其中,fj為特征值,y為類別.分類器可以采用邏輯回歸分類模型或者支持向量機(jī)分類模型來構(gòu)造.

    邏輯回歸分類模型可以描述為

    (1)

    式中,hθ(x)為預(yù)測(cè)值;x為分類模型特征向量;θ為特征向量系數(shù).

    邏輯回歸分類模型是基于最大似然估計(jì)來計(jì)算對(duì)應(yīng)特征向量系數(shù)的,即

    (2)

    (3)

    由式(2)和(3)可得

    (4)

    最大似然估計(jì)為

    (5)

    基于邏輯回歸分類模型求解的關(guān)鍵是確定特征向量系數(shù).因此,針對(duì)中文在線評(píng)論有效的檢測(cè)需要結(jié)合中文評(píng)論內(nèi)容的特點(diǎn)來提取相應(yīng)的特征向量.

    1.2 評(píng)論內(nèi)容特征提取

    Jindal等[7]在關(guān)于英文在線評(píng)論有效性的研究中,基于評(píng)論、評(píng)論者和評(píng)論對(duì)象提取了36個(gè)評(píng)論特征,其中包括了針對(duì)評(píng)論文本內(nèi)容的7個(gè)特征,即評(píng)論正向情感詞、評(píng)論負(fù)向情感詞、評(píng)論與產(chǎn)品特性的相似度、品牌名個(gè)數(shù)、數(shù)字個(gè)數(shù)、大寫個(gè)數(shù)和由大寫構(gòu)成的單詞個(gè)數(shù).由于語言的差異性,上述7個(gè)特征只有評(píng)論正向情感詞和評(píng)論負(fù)向情感詞適用于中文評(píng)論.評(píng)論具有主觀性,應(yīng)包含評(píng)論者的情緒;如果評(píng)論中沒有情感特征,則為客觀表述,應(yīng)被判別為無效評(píng)論.針對(duì)中文在線評(píng)論,本文通過獲取評(píng)論中的顯式情感詞[10]與中文情感詞庫[11]來判別評(píng)論的情感特征,從而獲取評(píng)論正向情感度和評(píng)論負(fù)向情感度,即評(píng)論中包含贊揚(yáng)產(chǎn)品的形容詞個(gè)數(shù)與貶低產(chǎn)品的形容詞個(gè)數(shù).

    本文將評(píng)論主題相關(guān)度作為評(píng)論特征,以量化中文在線評(píng)論與評(píng)論主題之間的相關(guān)程度.

    常規(guī)評(píng)論由評(píng)論對(duì)象和評(píng)論者態(tài)度構(gòu)成,應(yīng)具備一定的長(zhǎng)度.而現(xiàn)實(shí)的在線評(píng)論網(wǎng)站上,評(píng)論中往往只具備評(píng)論者態(tài)度而無評(píng)論對(duì)象.無效評(píng)論制造者為吸引人們的注意力,往往會(huì)編寫較長(zhǎng)的評(píng)論.因此,本文采用評(píng)論文本長(zhǎng)度作為評(píng)論特征向量之一,評(píng)論文本長(zhǎng)度即中文在線評(píng)論文本包含的字?jǐn)?shù).

    基于對(duì)實(shí)際評(píng)論的觀察和研究發(fā)現(xiàn),中文文本注重采用整齊的、排比的句型,多采用短句,評(píng)論者在編寫評(píng)論時(shí),必定會(huì)合理使用標(biāo)點(diǎn)符號(hào).而垃圾評(píng)論制造者在編寫沒有主題的評(píng)論時(shí),為快速表達(dá)出自己的想法和意愿,會(huì)產(chǎn)生不使用或?yàn)E用標(biāo)點(diǎn)符號(hào)的情況.因此,本文采用評(píng)論標(biāo)點(diǎn)數(shù)量和評(píng)論標(biāo)點(diǎn)符號(hào)差異數(shù)量作為評(píng)論特征向量,其中評(píng)論標(biāo)點(diǎn)數(shù)量是指評(píng)論中標(biāo)點(diǎn)符號(hào)的總個(gè)數(shù),評(píng)論標(biāo)點(diǎn)符號(hào)差異數(shù)量是指評(píng)論中標(biāo)點(diǎn)符號(hào)類型的個(gè)數(shù).

    同時(shí),本文還引入了Bhattarai等[12]檢測(cè)博客空間中垃圾評(píng)論使用的3個(gè)特征向量:評(píng)論詞重復(fù)率(即中文在線評(píng)論中重復(fù)的中文字出現(xiàn)的比例)、評(píng)論名詞率(即評(píng)論詞性標(biāo)注之后名詞所占的比例)和評(píng)論句子數(shù)量(即在線評(píng)論文本中句子的個(gè)數(shù)).

    基于上述分析,針對(duì)中文在線垃圾評(píng)論檢測(cè),本文共提取了9個(gè)評(píng)論內(nèi)容特征:評(píng)論正向情感度、評(píng)論負(fù)向情感度、評(píng)論主題相關(guān)度、評(píng)論文本長(zhǎng)度、評(píng)論標(biāo)點(diǎn)數(shù)量、評(píng)論標(biāo)點(diǎn)符號(hào)差異數(shù)量、評(píng)論詞重復(fù)率、評(píng)論名詞率以及評(píng)論句子數(shù)量.其中,評(píng)論主題相關(guān)度的處理最為關(guān)鍵和復(fù)雜.

    2 評(píng)論主題相關(guān)度

    2.1 評(píng)論主題詞的提取

    評(píng)論主題詞往往采用名詞來表示.目前,評(píng)論主題詞獲取的常用方式是通過中文分詞系統(tǒng)對(duì)評(píng)論進(jìn)行分詞、詞性標(biāo)注處理,然后提取分詞系統(tǒng)中內(nèi)置名詞模式標(biāo)示的名詞.ICTCLAS是我國(guó)最具代表性的中文分詞系統(tǒng),其包含中文分詞和詞性標(biāo)注的功能,分詞準(zhǔn)確率達(dá)到98.45%.ICTCLAS考慮了文本的通用性,沒有針對(duì)評(píng)論的特殊處理方式,因此很多評(píng)論主題詞無法被ICTCLAS內(nèi)置名詞模式標(biāo)示.

    以電影《速度與激情6》影評(píng)中的一條評(píng)論為例:“這個(gè)系列的任何一部,一點(diǎn)劇情都記不住.”該評(píng)論中出現(xiàn)的主題詞包括 “系列”、“一部”和“劇情”.通過ICTCLAS處理之后,評(píng)論顯示為:“這個(gè)/rz系列/n的/ude1 任何/rz一/m部/q,/wd一點(diǎn)/m劇情/n都/d記/v不/d住/vi./wj”.在這條評(píng)論中,評(píng)論主題詞 “一部”沒有被標(biāo)示出.考慮到相鄰2個(gè)詞性標(biāo)注的組合關(guān)系可以歸結(jié)為有序關(guān)聯(lián)規(guī)則問題,因此,本文采用一種改進(jìn)的Apriori算法以獲取評(píng)論名詞模式,從而在實(shí)際中提高中文評(píng)論主題詞的獲取精度.

    本文采用關(guān)聯(lián)規(guī)則[13]來尋找具有最小支持度的評(píng)論名詞模式.通過關(guān)聯(lián)規(guī)則可從大量數(shù)據(jù)中發(fā)現(xiàn)數(shù)據(jù)項(xiàng)之間的相關(guān)關(guān)系,其規(guī)則形式可以表示為

    X→Y

    式中,X,Y為數(shù)據(jù)集中的非空子集.支持度是關(guān)聯(lián)規(guī)則計(jì)算中的一個(gè)主要指標(biāo),即所計(jì)算的關(guān)聯(lián)規(guī)則模式必須滿足預(yù)先設(shè)置的最小支持度.最小支持度計(jì)算數(shù)學(xué)表達(dá)式為

    (6)

    式中,c為非空子集X和Y同時(shí)出現(xiàn)的次數(shù);n為數(shù)據(jù)集中記錄總數(shù).

    評(píng)論名詞模式是一種通過相鄰詞性標(biāo)注組合關(guān)系得到的名詞模式.本文首先采用ICTCLAS中文分詞系統(tǒng)對(duì)評(píng)論集進(jìn)行詞性標(biāo)注,然后采用Apriori算法獲取評(píng)論名詞模式.在Apriori算法中,主要采用以下步驟尋找關(guān)聯(lián)規(guī)則:① 生成任意2個(gè)非空子集(如X和Y)的并集,若其在所有數(shù)據(jù)集空間中出現(xiàn)的次數(shù)超過用戶預(yù)先指定的值,則把該并集歸類到頻繁集中;② 根據(jù)頻繁集生成關(guān)聯(lián)規(guī)則.由于評(píng)論名詞模式主要尋找相鄰詞性標(biāo)注的組合關(guān)系,采用Apriori算法在頻繁集生成過程中會(huì)產(chǎn)生大量的組合,這將導(dǎo)致Apriori算法性能下降.為此,本文對(duì)Apriori算法進(jìn)行了如下修改:① 將數(shù)據(jù)集合中各詞性標(biāo)注實(shí)現(xiàn)有序排列;② 頻繁集由相鄰詞性標(biāo)注構(gòu)成.由此便可有效降低頻繁集生成規(guī)模,從而提高Apriori算法效率.

    2.2 評(píng)論主題相關(guān)識(shí)別

    獲取評(píng)論主題詞后,需要判斷這些主題詞與評(píng)論主題的相關(guān)度,可用Zhai等[14]提出的交叉語言模型來判斷名詞與主題之間的關(guān)系.該模型假定一個(gè)文檔是由一個(gè)目標(biāo)短語向量和一個(gè)資料庫短語向量構(gòu)成的,即

    θ1=αθcorpus+βθquery

    (7)

    式中,θ1為從評(píng)論集合中獲取的名詞向量;θcorpus為資料庫名詞向量;θquery為與主題相關(guān)的名詞向量;α,β分別為對(duì)應(yīng)于θcorpus,θquery的系數(shù),且α+β=1.

    Zhang等[15]利用時(shí)間復(fù)雜度為O(klog(k))的算法來獲取交叉語言模型中的θ.交叉語言模型的簡(jiǎn)單表述為

    r=αp+βq

    (8)

    式中,r,p和q均為多維向量.

    為計(jì)算q,先假設(shè)fi,pi分別為r,p中第i個(gè)詞出現(xiàn)的頻度.計(jì)算步驟如下:

    ① 計(jì)算pi/fi,按照從大到小的方式排列,結(jié)果為f1/p1>f2/p3>…>fk/pk.

    ③ 計(jì)算得到

    將計(jì)算結(jié)果大于0的qi組成θquery,評(píng)論主題相關(guān)度可以通過計(jì)算單條評(píng)論中評(píng)論主題詞在θquery中的個(gè)數(shù)獲得.

    3 實(shí)驗(yàn)結(jié)果與分析

    本文以電影《速度與激情6》的影評(píng)為目標(biāo)評(píng)論對(duì)象進(jìn)行實(shí)驗(yàn).首先,選取1 000條影評(píng),讓5位研究生(編號(hào)為S1~S5)對(duì)其進(jìn)行人工標(biāo)示,將無效評(píng)論記為1,有效評(píng)論記為0;然后,將標(biāo)示結(jié)果求和后取平均值,當(dāng)平均值大于0.5時(shí)視為無效評(píng)論,反之則為有效評(píng)論.5位研究生對(duì)1 000條影評(píng)做出的有效評(píng)論和無效評(píng)論統(tǒng)計(jì)數(shù)量結(jié)果見表1.

    表1 評(píng)論樣本人工標(biāo)示的統(tǒng)計(jì)數(shù)量結(jié)果

    為了獲取評(píng)論主題相關(guān)度和評(píng)論情感分析,在將評(píng)論文本轉(zhuǎn)換為評(píng)論文本特征向量的過程中需要對(duì)評(píng)論進(jìn)行預(yù)處理.首先,構(gòu)建中文情感詞庫,根據(jù)該詞庫來判斷評(píng)論文本中形容詞的詞性.然后,利用時(shí)間復(fù)雜度為O(klog(k))的算法來建立評(píng)論主題詞庫,從而獲取評(píng)論主題相關(guān)度.除評(píng)論主題相關(guān)度和評(píng)論情感分析外,其他特征向量值都能直接從評(píng)論文本中獲取.

    本文采用支持向量機(jī)分類模型作為對(duì)比,驗(yàn)證基于邏輯回歸垃圾評(píng)論檢測(cè)模型的有效性.同時(shí),為了驗(yàn)證評(píng)論名詞模式在垃圾評(píng)論檢測(cè)中的效果,將ICTCLAS中文分詞系統(tǒng)的內(nèi)置名詞模式作為對(duì)比進(jìn)行實(shí)驗(yàn).實(shí)驗(yàn)共分5次進(jìn)行,每次對(duì)1 000條樣本評(píng)論進(jìn)行隨機(jī)排列,計(jì)算時(shí)采用開源的數(shù)據(jù)挖掘工具Weka,并利用基于十折交叉驗(yàn)證法來獲取垃圾評(píng)論檢測(cè)模型的準(zhǔn)確性.給定樣本評(píng)論的有效性檢測(cè)準(zhǔn)確率結(jié)果見表2.

    表2 樣本評(píng)論的有效性檢測(cè)準(zhǔn)確率 %

    由表2可知,采用本文提出的評(píng)論名詞模式較采用ICTCLAS中文分詞系統(tǒng)的內(nèi)置名詞模式在計(jì)算垃圾評(píng)論檢測(cè)模型時(shí)具有更高的準(zhǔn)確率.在4種情況的對(duì)比試驗(yàn)中,采用評(píng)論名詞模式下基于邏輯回歸的垃圾評(píng)論檢測(cè)模型準(zhǔn)確率(83.54%)最高,比支持向量機(jī)分類模型計(jì)算得到的準(zhǔn)確率高2.10%.

    4 結(jié)語

    目前國(guó)外學(xué)術(shù)界關(guān)于在線評(píng)論有效性的研究對(duì)象大都采用英文評(píng)論,由于語言的差異性,相關(guān)英文在線評(píng)論有效性檢測(cè)的研究成果難以推廣到中文評(píng)論的有效性檢測(cè)中.本文研究了單一主題環(huán)境下中文在線評(píng)論有效性的檢測(cè)問題.結(jié)合中文評(píng)論特點(diǎn),從評(píng)論文本內(nèi)容中提取9個(gè)特征向量來構(gòu)建邏輯回歸分類模型;針對(duì)核心特征向量評(píng)論主題相關(guān)度的研究過程中,利用一種改進(jìn)的Apriori算法來獲取評(píng)論名詞模式,從而提高了中文評(píng)論主題詞的識(shí)別精度,并基于交叉語言模型計(jì)算評(píng)論名詞與主題的相關(guān)度.實(shí)驗(yàn)結(jié)果表明,基于邏輯回歸的中文在線評(píng)論有效性檢測(cè)模型在評(píng)論有效性檢測(cè)中表現(xiàn)出較高的檢測(cè)準(zhǔn)確率.

    References)

    [1]中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心. 2013年中國(guó)網(wǎng)絡(luò)購物市場(chǎng)研究報(bào)告[EB/OL]. (2014-04-21)[2014-10-20]. http://www.cnnic.cn/hlwfzyj/hlwxzbg/dzswbg/201404/t20140421_46598.htm.

    [2]Karkare V Y, Gupta S R. A survey on product evaluation using opinion mining [J].InternationalJournalofComputerScienceandApplications, 2013, 6(2): 306-312.

    [3]Sheibani A A. Opinion mining and opinion spam: a literature review focusing on product reviews[C]//2012SixthInternationalSymposiumonTelecommunications(IST). Tehran, Iran, 2012: 1109-1113.

    [4]Lim E P, Nguyen V A, Jindal N, et al. Detecting product review spammers using rating behaviors[C]//Proceedingsofthe19thACMInternationalConferenceonInformationandKnowledgeManagement. New York, USA, 2010: 939-948.

    [5]Jindal N, Liu B, Lim E P. Finding unusual review patterns using unexpected rules[C]//Proceedingsofthe19thACMInternationalConferenceonInformationandKnowledgeManagement. New York, USA, 2010: 1549-1552.

    [6]Mukherjee A, Kumar A, Liu B, et al. Spotting opinion spammers using behavioral footprints[C]//Proceedingsofthe19thACMSIGKDDInternationalConferenceonKnowledgeDiscoveryandDataMining. New York, USA, 2013: 632-640.

    [7]Jindal N, Liu B. Opinion spam and analysis[C]//Proceedingsofthe2008InternationalConferenceonWebSearchandDataMining. New York, USA, 2008: 219-230.

    [8]Ott M, Cardie C, Hancock J T. Negative deceptive opinion spam[C]//NorthAmericanChapteroftheAssociationforComputationalLinguistics-HumanLanguageTechnologies. Atlanta, Georgia, 2013: 497-501.

    [9]Lin Y, Zhu T, Wang X, et al. Towards online review spam detection[C]//ProceedingsoftheCompanionPublicationofthe23rdInternationalConferenceonWorldWideWebCompanion. New York, USA, 2014: 341-342.

    [10]Liu B. Sentiment analysis and opinion mining [J].SynthesisLecturesonHumanLanguageTechnologies, 2012, 5(1): 1-167.

    [11]徐琳宏,林鴻飛,潘宇,等.情感詞匯本體的構(gòu)造[J].情報(bào)學(xué)報(bào),2008,27(2):180-185. Xu Linhong, Lin Hongfei, Pan Yu, et al. Constructing the affective lexicon ontology [J].JournaloftheChinaSocietyforScientificandTechnicalInformation, 2008, 27(2): 180-185. (in Chinese)

    [12]Bhattarai A, Rus V, Dasgupta D. Characterizing comment spam in the blogosphere through content analysis[C]//2009IEEESymposiumonComputationalIntelligenceinCyberSecurity. Nashville, TN, USA, 2009: 37-44.

    [13]AL-Zawaidah F H, Jbara Y H, Abu-Zanona M A. An improved algorithm for mining association rules in large databases [J].WorldofComputerScienceandInformationTechnology, 2011, 1(7): 311-316.

    [14]Zhai C, Lafferty J. Model-based feedback in the language modeling approach to information retrieval[C]//ProceedingsoftheTenthInternationalConferenceonInformationandKnowledgeManagement. New York, USA, 2001: 403-410.

    [15]Zhang Y, Xu W. Fast exact maximum likelihood estimation for mixture of language model[J].InformationProcessing&Management, 2008, 44(3): 1076-1085.

    Detection model of effectiveness of Chinese online reviews based on logistic regression

    Wu Hanqian1Zhu Yunjie1Xie Jue2

    (1School of Computer Science and Engineering, Southeast University, Nanjing 210018, China) (2Southeast University-Monash University Joint Graduate School, Suzhou 215123, China)

    In order to realize automated detection of the effectiveness of Chinese online reviews in the context of e-commerce and social networks, a spam detection model based on logistic regression to solve single topic classification problem is proposed. The detection of effectiveness of Chinese online reviews can be regarded as a classification problem. According to the characteristics of Chinese online reviews, nine features are extracted to build the classification model. In order to extract the core feature-topic relevance, an association rule based review term mode is utilized to optimize the topics identification in ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System). The cross language model is then used to retrieve relevancy between online review topics. In the experiment, a sample of 1 000 human-labeled reviews is used, and the support vector machine (SVM) classification model is adopted as a comparison. The calculation results of the data mining tool Weka demonstrate that the accuracy rate of the proposed logistic regression classification model based on the optimized review term classification mode is 83.54%, which is 2.10% higher than that of the SVM classification model.

    effectiveness of online review; logistic regression; association rule

    10.3969/j.issn.1001-0505.2015.03.004

    2014-12-05. 作者簡(jiǎn)介: 吳含前(1972—),男,博士,副教授,hanqian@seu.edu.cn.

    國(guó)家自然科學(xué)基金資助項(xiàng)目(60803057)、國(guó)家高技術(shù)研究發(fā)展計(jì)劃(863計(jì)劃)資助項(xiàng)目(2015AA015904).

    吳含前,朱云杰,謝玨.基于邏輯回歸的中文在線評(píng)論有效性檢測(cè)模型[J].東南大學(xué)學(xué)報(bào):自然科學(xué)版,2015,45(3):433-437.

    10.3969/j.issn.1001-0505.2015.03.004

    P315.69

    A

    1001-0505(2015)03-0433-05

    猜你喜歡
    評(píng)論者主題詞分類
    智珠2則
    分類算一算
    分類討論求坐標(biāo)
    基于D-S證據(jù)理論的電子商務(wù)虛假評(píng)論者檢測(cè)
    數(shù)據(jù)分析中的分類討論
    教你一招:數(shù)的分類
    基于情感特征和用戶關(guān)系的虛假評(píng)論者的識(shí)別
    基于評(píng)論關(guān)系圖的垃圾評(píng)論者檢測(cè)研究
    我校學(xué)報(bào)第32卷第5期(2014年10月)平均每篇有3.04個(gè)21世紀(jì)的Ei主題詞
    我校學(xué)報(bào)第32卷第6期(2014年12月)平均每篇有3.00個(gè)21世紀(jì)的Ei主題詞
    国产免费男女视频| 麻豆av噜噜一区二区三区| 亚洲天堂国产精品一区在线| 最新中文字幕久久久久| 真实男女啪啪啪动态图| 亚洲性夜色夜夜综合| 婷婷丁香在线五月| or卡值多少钱| 免费高清视频大片| 久久久成人免费电影| 男女下面进入的视频免费午夜| 国产爱豆传媒在线观看| 成人av一区二区三区在线看| 悠悠久久av| 欧美日本视频| 搞女人的毛片| 九九久久精品国产亚洲av麻豆| 国语自产精品视频在线第100页| 亚洲第一欧美日韩一区二区三区| 成年人黄色毛片网站| 亚洲五月婷婷丁香| 亚洲狠狠婷婷综合久久图片| 久久精品国产清高在天天线| 国内少妇人妻偷人精品xxx网站| 亚洲中文字幕日韩| 亚洲成av人片在线播放无| 欧美最黄视频在线播放免费| 老司机福利观看| 夜夜夜夜夜久久久久| 亚洲人成电影免费在线| 一个人免费在线观看电影| 性色avwww在线观看| 日本撒尿小便嘘嘘汇集6| 成人无遮挡网站| 中文字幕精品亚洲无线码一区| 精品无人区乱码1区二区| 国产视频内射| 真人一进一出gif抽搐免费| 给我免费播放毛片高清在线观看| a在线观看视频网站| 亚州av有码| 精品福利观看| 成熟少妇高潮喷水视频| 18美女黄网站色大片免费观看| 久久婷婷人人爽人人干人人爱| 内射极品少妇av片p| 国内精品久久久久精免费| 日韩大尺度精品在线看网址| 99久久成人亚洲精品观看| 午夜激情福利司机影院| 国产欧美日韩一区二区三| 欧美最新免费一区二区三区 | 嫩草影院入口| 国产精品女同一区二区软件 | 好男人电影高清在线观看| 国产精品99久久久久久久久| 看片在线看免费视频| 久久久精品大字幕| 欧美黄色淫秽网站| 久久精品综合一区二区三区| 亚洲成人久久性| 免费人成在线观看视频色| 中出人妻视频一区二区| 色综合欧美亚洲国产小说| 最新中文字幕久久久久| 亚洲人成网站在线播放欧美日韩| 伊人久久精品亚洲午夜| 国产免费男女视频| 窝窝影院91人妻| 美女 人体艺术 gogo| 欧美黑人欧美精品刺激| 不卡一级毛片| 好男人电影高清在线观看| 日韩欧美一区二区三区在线观看| 欧美黑人欧美精品刺激| 嫩草影院新地址| 午夜福利视频1000在线观看| 精品欧美国产一区二区三| 久久久久性生活片| 亚洲人成网站在线播| 丁香六月欧美| 国产av麻豆久久久久久久| 精品人妻一区二区三区麻豆 | 亚洲欧美日韩高清专用| 高清日韩中文字幕在线| 久久婷婷人人爽人人干人人爱| 欧美乱色亚洲激情| 校园春色视频在线观看| 亚洲av电影在线进入| 亚洲内射少妇av| 免费电影在线观看免费观看| 国产一区二区三区在线臀色熟女| 亚洲国产精品sss在线观看| 97碰自拍视频| 国产精品一区二区三区四区久久| 中文在线观看免费www的网站| 国产成人aa在线观看| 丝袜美腿在线中文| 51午夜福利影视在线观看| 草草在线视频免费看| 热99在线观看视频| 日本黄大片高清| 国产白丝娇喘喷水9色精品| 午夜视频国产福利| 欧美精品啪啪一区二区三区| 亚洲国产日韩欧美精品在线观看| 中文字幕av在线有码专区| 淫妇啪啪啪对白视频| 99精品在免费线老司机午夜| 91狼人影院| 国产毛片a区久久久久| 两性午夜刺激爽爽歪歪视频在线观看| 欧美最黄视频在线播放免费| 亚洲久久久久久中文字幕| 首页视频小说图片口味搜索| 国产亚洲精品久久久com| 亚洲最大成人av| 欧美日韩乱码在线| 亚洲国产色片| 国产av一区在线观看免费| 国产午夜精品论理片| 我的老师免费观看完整版| 久久精品久久久久久噜噜老黄 | 国产在线男女| av天堂中文字幕网| 日韩成人在线观看一区二区三区| 精品久久久久久久久亚洲 | 午夜激情欧美在线| h日本视频在线播放| 久久久久久久久大av| 给我免费播放毛片高清在线观看| 看黄色毛片网站| 亚洲真实伦在线观看| 观看美女的网站| 99久久精品国产亚洲精品| 99久久精品国产亚洲精品| 天天躁日日操中文字幕| 久99久视频精品免费| 一本久久中文字幕| 色播亚洲综合网| 亚洲av第一区精品v没综合| 久久精品影院6| 午夜福利免费观看在线| 久久婷婷人人爽人人干人人爱| eeuss影院久久| 国产精品一区二区三区四区久久| 国产精品精品国产色婷婷| 禁无遮挡网站| 亚洲欧美精品综合久久99| 免费av观看视频| 1000部很黄的大片| 久久精品影院6| 久9热在线精品视频| 一级av片app| 国产伦在线观看视频一区| 国产精品综合久久久久久久免费| 国产乱人视频| 久久亚洲精品不卡| av国产免费在线观看| 国产国拍精品亚洲av在线观看| a级毛片免费高清观看在线播放| 亚洲,欧美精品.| 精品乱码久久久久久99久播| 免费在线观看影片大全网站| 国产一区二区三区视频了| 亚洲精品亚洲一区二区| 亚洲av成人不卡在线观看播放网| 日本五十路高清| av在线观看视频网站免费| 免费av毛片视频| 欧美黄色片欧美黄色片| 嫩草影院新地址| 国产欧美日韩一区二区精品| 免费大片18禁| 日日干狠狠操夜夜爽| 制服丝袜大香蕉在线| 欧美极品一区二区三区四区| 国产老妇女一区| 亚洲无线在线观看| 国产在视频线在精品| 动漫黄色视频在线观看| 亚洲精品一区av在线观看| 国产极品精品免费视频能看的| 99久久99久久久精品蜜桃| 免费一级毛片在线播放高清视频| 欧美精品啪啪一区二区三区| 三级男女做爰猛烈吃奶摸视频| 成年版毛片免费区| 日日摸夜夜添夜夜添av毛片 | 亚洲五月婷婷丁香| 国产高清有码在线观看视频| 精品人妻熟女av久视频| 久久午夜福利片| 久久这里只有精品中国| 亚洲av日韩精品久久久久久密| 欧美一区二区亚洲| 亚洲人成网站在线播放欧美日韩| 99久久99久久久精品蜜桃| 国产精品亚洲美女久久久| 国产三级中文精品| 亚洲,欧美,日韩| 亚洲国产欧美人成| 欧美黑人巨大hd| 亚洲精品456在线播放app | 色在线成人网| 3wmmmm亚洲av在线观看| 超碰av人人做人人爽久久| 亚洲欧美激情综合另类| 国产精品野战在线观看| 久久精品国产清高在天天线| 蜜桃亚洲精品一区二区三区| 此物有八面人人有两片| 淫秽高清视频在线观看| a在线观看视频网站| 大型黄色视频在线免费观看| 国产野战对白在线观看| 天堂√8在线中文| 观看美女的网站| 蜜桃亚洲精品一区二区三区| 亚洲va日本ⅴa欧美va伊人久久| 99国产极品粉嫩在线观看| 亚洲国产欧洲综合997久久,| 少妇人妻精品综合一区二区 | 在线观看一区二区三区| xxxwww97欧美| 我的老师免费观看完整版| 51午夜福利影视在线观看| 国产精品一区二区免费欧美| 日韩中字成人| 一进一出抽搐动态| 小说图片视频综合网站| 久久久久久久精品吃奶| 中文字幕高清在线视频| 欧美黄色片欧美黄色片| 高清在线国产一区| 色在线成人网| 亚洲成人久久爱视频| 三级男女做爰猛烈吃奶摸视频| 亚洲国产欧美人成| 国产精品一区二区免费欧美| av欧美777| 最近在线观看免费完整版| 亚洲av五月六月丁香网| av在线天堂中文字幕| 久久久精品大字幕| 久久99热这里只有精品18| 美女高潮的动态| 人妻夜夜爽99麻豆av| 69av精品久久久久久| 色综合婷婷激情| 国产蜜桃级精品一区二区三区| 国产人妻一区二区三区在| 三级男女做爰猛烈吃奶摸视频| 午夜福利免费观看在线| 精品一区二区三区av网在线观看| 国产精品久久久久久亚洲av鲁大| 久久午夜亚洲精品久久| 成年版毛片免费区| 免费大片18禁| 在线观看舔阴道视频| 亚洲,欧美精品.| 色av中文字幕| 亚洲国产精品999在线| 久久性视频一级片| 国产乱人伦免费视频| 最近视频中文字幕2019在线8| 国产大屁股一区二区在线视频| 12—13女人毛片做爰片一| 丝袜美腿在线中文| 在线十欧美十亚洲十日本专区| 长腿黑丝高跟| 又爽又黄a免费视频| 搡老岳熟女国产| 午夜精品久久久久久毛片777| 757午夜福利合集在线观看| 亚洲精品粉嫩美女一区| 亚洲av电影不卡..在线观看| 搡老岳熟女国产| 别揉我奶头~嗯~啊~动态视频| 白带黄色成豆腐渣| 99国产精品一区二区蜜桃av| 在线观看舔阴道视频| 宅男免费午夜| 中出人妻视频一区二区| 自拍偷自拍亚洲精品老妇| 日韩亚洲欧美综合| 色哟哟哟哟哟哟| 亚洲精品久久国产高清桃花| 亚洲av五月六月丁香网| 免费人成视频x8x8入口观看| 黄色一级大片看看| 69人妻影院| 国产亚洲精品综合一区在线观看| 天堂√8在线中文| 国产在视频线在精品| 日韩中字成人| 久久久国产成人精品二区| 午夜福利高清视频| 能在线免费观看的黄片| 91久久精品电影网| 欧美日韩福利视频一区二区| 亚洲国产高清在线一区二区三| 69人妻影院| 亚洲无线观看免费| 欧美性猛交╳xxx乱大交人| 国产欧美日韩精品一区二区| 国产黄a三级三级三级人| 久久久久精品国产欧美久久久| 久久国产乱子伦精品免费另类| 国产人妻一区二区三区在| 夜夜看夜夜爽夜夜摸| 亚洲aⅴ乱码一区二区在线播放| 看片在线看免费视频| 波多野结衣高清作品| 国产综合懂色| 国产精品免费一区二区三区在线| 国产精品永久免费网站| 色综合亚洲欧美另类图片| 99热这里只有精品一区| 色噜噜av男人的天堂激情| 国产69精品久久久久777片| 日韩免费av在线播放| 桃红色精品国产亚洲av| 麻豆成人av在线观看| 观看美女的网站| 午夜日韩欧美国产| 黄色视频,在线免费观看| 亚洲在线自拍视频| 91麻豆精品激情在线观看国产| 婷婷丁香在线五月| 亚洲国产精品999在线| 成年免费大片在线观看| av在线观看视频网站免费| 狂野欧美白嫩少妇大欣赏| 国产高清视频在线播放一区| 麻豆国产av国片精品| 亚洲av二区三区四区| 99国产精品一区二区蜜桃av| 国产乱人伦免费视频| 69av精品久久久久久| 欧美日韩瑟瑟在线播放| 51午夜福利影视在线观看| 成人一区二区视频在线观看| 国产一区二区在线av高清观看| 精品人妻一区二区三区麻豆 | 内射极品少妇av片p| 俄罗斯特黄特色一大片| 看黄色毛片网站| 丰满乱子伦码专区| 国产精品人妻久久久久久| 国产精品日韩av在线免费观看| 老女人水多毛片| 我的女老师完整版在线观看| 午夜久久久久精精品| 国产欧美日韩一区二区三| 精品久久久久久成人av| 最新中文字幕久久久久| 精品人妻一区二区三区麻豆 | 97碰自拍视频| 亚洲欧美日韩高清专用| 国产高潮美女av| 禁无遮挡网站| 99久久久亚洲精品蜜臀av| 久久久国产成人免费| 熟女电影av网| 给我免费播放毛片高清在线观看| 亚洲 欧美 日韩 在线 免费| 欧美色视频一区免费| 免费在线观看影片大全网站| 色精品久久人妻99蜜桃| 看十八女毛片水多多多| 国产成人影院久久av| 白带黄色成豆腐渣| 91在线精品国自产拍蜜月| 男女那种视频在线观看| 亚洲精品一区av在线观看| 在线观看午夜福利视频| 人妻丰满熟妇av一区二区三区| 国产高潮美女av| 久久久久久久精品吃奶| 精品久久久久久久久久免费视频| 国产男靠女视频免费网站| 国产成人影院久久av| 国产精品人妻久久久久久| 黄片小视频在线播放| 久久草成人影院| 99久久久亚洲精品蜜臀av| 亚洲精华国产精华精| 欧美高清成人免费视频www| 亚洲国产欧洲综合997久久,| 欧美另类亚洲清纯唯美| 成人毛片a级毛片在线播放| 一本久久中文字幕| 免费无遮挡裸体视频| 一个人免费在线观看的高清视频| 99热这里只有是精品在线观看 | 午夜亚洲福利在线播放| 级片在线观看| 中文字幕人成人乱码亚洲影| 桃红色精品国产亚洲av| 成人美女网站在线观看视频| 久久欧美精品欧美久久欧美| 99riav亚洲国产免费| 成人一区二区视频在线观看| 日本与韩国留学比较| 国产精品嫩草影院av在线观看 | 日本在线视频免费播放| 免费看a级黄色片| 一本久久中文字幕| 亚洲国产精品合色在线| 有码 亚洲区| 午夜久久久久精精品| 少妇人妻一区二区三区视频| 美女cb高潮喷水在线观看| 欧美+日韩+精品| 国产主播在线观看一区二区| 日韩亚洲欧美综合| 欧美区成人在线视频| 欧美在线一区亚洲| .国产精品久久| 欧美xxxx黑人xx丫x性爽| 又紧又爽又黄一区二区| 俺也久久电影网| 欧美三级亚洲精品| 热99re8久久精品国产| 波多野结衣高清无吗| 又爽又黄无遮挡网站| 精品久久久久久,| 亚洲人成网站在线播| 国产私拍福利视频在线观看| 日日摸夜夜添夜夜添小说| 哪里可以看免费的av片| 99久久99久久久精品蜜桃| 听说在线观看完整版免费高清| 成人一区二区视频在线观看| 超碰av人人做人人爽久久| 白带黄色成豆腐渣| 亚洲av免费高清在线观看| 91字幕亚洲| 日本撒尿小便嘘嘘汇集6| 午夜福利18| 亚洲avbb在线观看| 国内揄拍国产精品人妻在线| 亚洲在线观看片| 午夜福利免费观看在线| 91九色精品人成在线观看| 少妇裸体淫交视频免费看高清| 国产伦精品一区二区三区四那| АⅤ资源中文在线天堂| 亚洲成av人片在线播放无| 亚洲欧美日韩卡通动漫| 亚洲精品在线美女| 99久久精品国产亚洲精品| 国产真实伦视频高清在线观看 | 精品久久久久久久久久久久久| 色吧在线观看| 波多野结衣巨乳人妻| 男女之事视频高清在线观看| 又黄又爽又免费观看的视频| 欧美色视频一区免费| 在线观看av片永久免费下载| xxxwww97欧美| www.色视频.com| 天堂网av新在线| 噜噜噜噜噜久久久久久91| 日韩国内少妇激情av| 午夜老司机福利剧场| 成人毛片a级毛片在线播放| 欧美丝袜亚洲另类 | 极品教师在线免费播放| 国产精品99久久久久久久久| 久久天躁狠狠躁夜夜2o2o| 波野结衣二区三区在线| 国产人妻一区二区三区在| 深夜a级毛片| 天堂影院成人在线观看| 精品久久国产蜜桃| 人妻制服诱惑在线中文字幕| 嫁个100分男人电影在线观看| 我的老师免费观看完整版| 日本黄色片子视频| 久久精品国产清高在天天线| 在线国产一区二区在线| 亚洲精华国产精华精| 动漫黄色视频在线观看| 在线免费观看不下载黄p国产 | 一区二区三区四区激情视频 | 日韩亚洲欧美综合| 亚洲欧美日韩无卡精品| av黄色大香蕉| or卡值多少钱| av天堂中文字幕网| 午夜激情福利司机影院| 国产伦精品一区二区三区视频9| 国产精品一区二区免费欧美| 亚洲av日韩精品久久久久久密| 特级一级黄色大片| 欧美xxxx黑人xx丫x性爽| 久久热精品热| 免费黄网站久久成人精品 | 小蜜桃在线观看免费完整版高清| 搡老妇女老女人老熟妇| 在线天堂最新版资源| 很黄的视频免费| 久久精品国产亚洲av香蕉五月| 最近最新中文字幕大全电影3| 久久精品影院6| 国产探花极品一区二区| 亚洲五月婷婷丁香| 波多野结衣高清无吗| 日韩欧美在线二视频| 有码 亚洲区| 黄色一级大片看看| 国产人妻一区二区三区在| 日韩中字成人| 日日夜夜操网爽| 舔av片在线| 亚洲色图av天堂| 一本一本综合久久| 精华霜和精华液先用哪个| 99热这里只有是精品50| 18禁在线播放成人免费| 日韩中文字幕欧美一区二区| 亚洲最大成人手机在线| 搡老岳熟女国产| 亚洲天堂国产精品一区在线| 欧美性猛交╳xxx乱大交人| 日本 av在线| 成人美女网站在线观看视频| 国内毛片毛片毛片毛片毛片| 国产毛片a区久久久久| 国产真实乱freesex| 欧美bdsm另类| 看片在线看免费视频| 毛片一级片免费看久久久久 | 日韩精品青青久久久久久| 亚洲av电影不卡..在线观看| 色哟哟·www| 看十八女毛片水多多多| 51国产日韩欧美| 99久久精品热视频| 在线播放无遮挡| 桃红色精品国产亚洲av| av中文乱码字幕在线| 国产又黄又爽又无遮挡在线| 黄色视频,在线免费观看| 国产精品1区2区在线观看.| 国产中年淑女户外野战色| 丰满的人妻完整版| 国产午夜精品论理片| 久久性视频一级片| 午夜影院日韩av| 亚洲在线自拍视频| 久久6这里有精品| 国产免费一级a男人的天堂| 精品日产1卡2卡| 亚洲国产欧美人成| 欧美精品啪啪一区二区三区| 久久午夜亚洲精品久久| 亚洲自拍偷在线| 十八禁国产超污无遮挡网站| 日本a在线网址| 国产精品久久久久久久电影| 国产69精品久久久久777片| 丰满人妻一区二区三区视频av| 韩国av一区二区三区四区| 18禁裸乳无遮挡免费网站照片| 日韩精品青青久久久久久| 一本精品99久久精品77| 欧美性猛交╳xxx乱大交人| 亚洲精品在线美女| 欧美极品一区二区三区四区| a级毛片免费高清观看在线播放| 看十八女毛片水多多多| 在线看三级毛片| 亚洲自偷自拍三级| 激情在线观看视频在线高清| 国产美女午夜福利| 国产私拍福利视频在线观看| 国产探花极品一区二区| 国产精品美女特级片免费视频播放器| 久久精品久久久久久噜噜老黄 | 久久精品人妻少妇| 中文在线观看免费www的网站| 极品教师在线免费播放| 日韩中文字幕欧美一区二区| 麻豆av噜噜一区二区三区| 天堂动漫精品| 黄色配什么色好看| 精品无人区乱码1区二区| 亚洲av美国av| 国产免费男女视频| 国产精品美女特级片免费视频播放器| 国产主播在线观看一区二区| 看黄色毛片网站| 久久九九热精品免费| 美女免费视频网站| 亚洲中文日韩欧美视频| 日韩欧美精品免费久久 | 日韩欧美在线二视频| 俄罗斯特黄特色一大片| 精品国产亚洲在线| 99久国产av精品| 淫秽高清视频在线观看| 亚洲第一区二区三区不卡| 精品久久久久久成人av| 欧美性感艳星| 国产精品综合久久久久久久免费| 亚洲不卡免费看| 日本免费a在线| 一进一出抽搐gif免费好疼| 欧美国产日韩亚洲一区| 男女之事视频高清在线观看| 日韩欧美 国产精品| 中文在线观看免费www的网站|