• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    新浪微博反垃圾中特征選擇的重要性分析

    2016-11-24 07:28:54張宇翔孫菀楊家海周達磊孟祥飛肖春景
    通信學報 2016年8期
    關(guān)鍵詞:分類特征用戶

    張宇翔,孫菀,楊家海,周達磊,孟祥飛,肖春景

    (1. 中國民航大學計算機科學與技術(shù)學院,天津 300300;2. 清華大學網(wǎng)絡科學與網(wǎng)絡空間研究院,北京 100084;3. 清華信息科學與技術(shù)國家實驗室,北京 100084;4. 北京郵電大學網(wǎng)絡技術(shù)研究院,北京 100876;5. 北京航空航天大學虛擬現(xiàn)實技術(shù)與系統(tǒng)國家重點實驗室,北京 100876)

    新浪微博反垃圾中特征選擇的重要性分析

    張宇翔1,2,3,孫菀1,楊家海2,3,周達磊4,孟祥飛5,肖春景1

    (1. 中國民航大學計算機科學與技術(shù)學院,天津 300300;2. 清華大學網(wǎng)絡科學與網(wǎng)絡空間研究院,北京 100084;3. 清華信息科學與技術(shù)國家實驗室,北京 100084;4. 北京郵電大學網(wǎng)絡技術(shù)研究院,北京 100876;5. 北京航空航天大學虛擬現(xiàn)實技術(shù)與系統(tǒng)國家重點實驗室,北京 100876)

    微博中的垃圾用戶非常普遍,其異常行為及生產(chǎn)的垃圾信息顯著降低了用戶體驗。為了提高識別準確率,已有研究或是盡可能多地定義特征,或是不斷嘗試提出新的分類檢測方法;那么,微博反垃圾問題的突破點優(yōu)先置于尋找分類特征還是改進分類檢測方法,是否特征越多檢測效果越好,新的方法是否可以顯著提高檢測效果。以新浪微博為例,試圖通過不同的特征選擇方法與不同的分類器組合實驗回答以上問題,實驗結(jié)果表明特征組的選擇較分類器的改進更為重要,需從內(nèi)容信息、用戶行為和社會關(guān)系多側(cè)面生成特征,且特征并非越多檢測效果越好,這些結(jié)論將有助于未來微博反垃圾工作的突破。

    新浪微博;特征生成;特征選擇;垃圾用戶檢測

    1 引言

    微博是一種近年來新興的在線社交網(wǎng)絡(online social network),用戶可通過Web、WAP等各種客戶端在其上組建個人社區(qū),并允許發(fā)布140字左右的文字更新信息,用戶之間通過建立單向或雙向的友好關(guān)系實現(xiàn)信息即時分享。

    在微博成為人們?nèi)粘=涣鞯闹匾绞街畷r,同時也成為垃圾用戶(spammer)發(fā)布非法廣告和垃圾消息的平臺。2013年7月,新華網(wǎng)報道[1]“新浪微博社區(qū)公約體系上線運行約一年時間,微博管理中心共接到超過1 500萬次的用戶舉報,其中垃圾廣告達到1 200多萬次,淫穢色情危害信息達到100多萬次”。根據(jù)人民網(wǎng)報道[2],大量虛假粉絲嚴重侵害用戶利益并影響微博生態(tài),2015年1月起新浪微博根據(jù)用戶舉報和數(shù)據(jù)分析清除垃圾粉絲。微博中垃圾問題非常嚴重,垃圾用戶的異常行為及生產(chǎn)的垃圾信息顯著降低了用戶體驗,增添了社會風險。

    學術(shù)界開展較早的反垃圾研究包括垃圾網(wǎng)頁檢測[3]、垃圾郵件過濾、虛假在線評論過濾[4]、網(wǎng)絡眾包(crowdsourcing)中的欺騙檢測[5]、傳統(tǒng)社交網(wǎng)絡(如人人網(wǎng)[6])中的垃圾過濾等,研究中用到的反垃圾方法對于微博中垃圾用戶檢測有一定的借鑒意義,但因為微博的構(gòu)成要件及其功能均不同于前述應用,故不能將其直接應用于微博反垃圾。

    微博反垃圾問題的解決非常困難,其原因主要有以下幾個方面:1)微博文字信息非常短,并且?guī)в写罅康牟灰?guī)范用語,因此微博文字內(nèi)容具有噪聲多、特征詞少等特點;2)簡短的文字信息中可包含頁面、圖片、音頻、視頻的鏈接,非法用戶將鏈接指向與文字信息不一致的垃圾內(nèi)容,加之目前廣泛使用的 URL縮短服務,很難做到機器自動鑒別鏈接指向內(nèi)容;3)垃圾制造者不斷創(chuàng)新,以更高明的方式躲避檢測,且更新周期越來越短[7]。

    微博反垃圾研究起步較晚,研究成果不多,而且已有研究絕大多數(shù)均是針對Twitter,少部分針對Myspace[8,9]、Facebook[8,10]、Foursquare[11]等。目前,鮮有針對新浪微博的反垃圾研究工作,盡管新浪微博與 Twitter在基本功能上較為相似,但在網(wǎng)民構(gòu)成、傳播內(nèi)容、轉(zhuǎn)發(fā)模式、開放性、好友管理、擴展功能等方面均存在較大差異[12~15],加之針對Twitter的反垃圾研究也處于研究初期,因此不能將 Twitter中的反垃圾方法直接用于新浪微博反垃圾中。

    在微博垃圾用戶檢測研究中,先要確定待檢測垃圾用戶所指的具體對象,是發(fā)布垃圾內(nèi)容(如虛假信息、垃圾鏈接等)者,還是僵尸、水軍等;接著通過微博提供的 API接口等方式采集檢測所需的數(shù)據(jù);最后選取有利于垃圾檢測的特征,利用機器學習方法對所有用戶進行分類檢測,確定垃圾用戶。

    微博反垃圾研究大都圍繞上述步驟展開,方法上的差異主要體現(xiàn)在最后一步。研究初期采用的方法是試圖找到能較好地區(qū)分正常用戶與垃圾用戶的少數(shù)幾個特征,通過設定恰當?shù)拈撝祦韰^(qū)分,如2011年,文獻[16]針對Twitter選取用戶發(fā)布連續(xù)消息的時間間隔(Timestamp gaplt;10 s)和文本內(nèi)容相似性(Levenshteinlt;5或Jaccard>0.6)2個特征,通過設置閾值來識別自動程序垃圾用戶,檢測結(jié)果的檢測精度為81.48%,召回率為82.07%。這種方法簡單易操作,但檢測效果不理想。

    隨后的研究從2個方面展開,一方面選取盡可能多的特征,然后利用分類算法對微博用戶進行分類檢測。如文獻[17]針對Twitter定義39個文本內(nèi)容和23個用戶行為特征,采用支持向量機(SVM,support vector machine)對用戶進行分類檢測,大約有70%的垃圾用戶和96%的正常用戶被正確檢測。文獻[9]針對Twitter選出1.2萬個文本內(nèi)容特征,分別采用 5種分類器進行檢測,決策樹(C4.5)的準確率為99.4%,檢測效果最佳。另一方面,針對所定義的特征不斷嘗試各種分類方法,除上述之外,包括樸素貝葉斯(Na?ve Bayes)[9]、k-最近鄰(k-NN,k-nearest neighbor)[18]、AdaBoost[19]、神經(jīng)網(wǎng)絡(neural network)[20]、隨機森林(random forest)[21]、數(shù)據(jù)流聚類方法(StreamKM++、Den-Stream)[22]等、混合馬爾可夫模型(mixture of Markov models)[23]等。

    研究結(jié)果存在如下2種現(xiàn)象:1)針對同一個社交網(wǎng)絡,同一個分類算法在不同的文獻中分類效果迥異,如針對Twitter反垃圾,貝葉斯方法在文獻[24]效果最佳,而在文獻[9]效果最差;2)針對不同的社交網(wǎng)絡,同一個分類算法的分類效果均為最佳,如針對Twitter和MySpace,Decorate分類器的檢測效果均最佳[25]。于是會有如下問題,解決微博反垃圾問題的突破點優(yōu)先置于尋找分類特征還是改進分類檢測方法,特征越多檢測效果是否越好,新穎的方法是否可以顯著提高檢測效果。

    本研究將以新浪微博為實例對該問題進行深入探討。首先,通過調(diào)用新浪微博開放的API接口收集新浪微博中山大學社區(qū)用戶的個人頁面信息,包括用戶個人資料、粉絲數(shù)、關(guān)注數(shù)、微博創(chuàng)建時間、微博內(nèi)容、微博數(shù)量,共計獲取了9萬個微博用戶的信息。接著,結(jié)合已有研究提出的區(qū)分度大的特征,從內(nèi)容信息、用戶行為和社會關(guān)系3個方面生成17個極具代表性的特征。最后,將7個特征選擇算法(其中6個為經(jīng)典算法,另外一個為本文提出的綜合特征選擇算法)與10個典型的分類識別學習算法組合進行實驗,從而回答上述問題。

    2 相關(guān)工作

    如前所述,早期的研究試圖找到少數(shù)幾個有利于分類檢測的關(guān)鍵特征(如文獻[16]),然而檢測效果非常不理想。鑒于此,研究者將特征的選取擴大到某個單一方面,常常會伴隨提出一些新穎的檢測方法。如文獻[26]檢測Twitter中熱門話題中的不相關(guān)內(nèi)容,僅選取文本特征,發(fā)現(xiàn)在5個典型的分類器中SVM的檢測準確率最高。文獻[27]檢測人人網(wǎng)中的垃圾用戶,僅考慮用戶的社會活動行為,引入活動數(shù)量矩陣(user-activity count matrix),矩陣的行向量表示一個特定用戶的活動數(shù)量,列向量對應不同類型的社會活動,采用矩陣分解和支持向量機相結(jié)合方法對用戶進行了分類檢測。文獻[28]僅局限于Twitter中推文內(nèi)容的情感特征,利用結(jié)合矩陣分解的優(yōu)化模型來識別垃圾。文獻[29]針對商業(yè)網(wǎng)站在線評論,根據(jù)文本內(nèi)容中 URL連接關(guān)系的變化使用無監(jiān)督方法識別垃圾。文獻[30]限于Twitter中推文中包括的URL,共定義9個相關(guān)特征,利用SVM進行分類檢測。2015年,SIGKDD中的文獻[23]針對Tagged.com中用戶在時序上的相關(guān)關(guān)系特征,利用混合馬爾可夫模型來識別垃圾用戶。2015年,SIGIR中的文獻[31]專注于Twitter中的Hashtag特征,先選用k-NN算法過濾掉明顯的垃圾信息,后利用最大期望算法(EM,expectation-maximization)識別剩余的難于識別的垃圾信息。

    僅使用少數(shù)幾個特征或某一特定方面的特征的反垃圾檢測不夠準確,因為垃圾用戶易于推斷反垃圾檢測的主要依據(jù)特征,進而有針對性地偽裝為合法用戶,從而避免檢測[29,32,33]。

    另一條研究主線是從多個側(cè)面定義盡可能多的特征,然后借助機器學習分類方法來檢測垃圾用戶。文獻[34]針對Twitter從文本內(nèi)容、用戶跟隨關(guān)系2個方面定義特征,利用優(yōu)化模型檢測垃圾用戶。文獻[35]對Twitter中新聞的可信度展開檢測,從文本內(nèi)容、用戶行為、主題和傳播 4類方面生成 74個特征,采用決策樹分類器對每條新聞的可信度進行檢測。文獻[36]從用戶拓撲、文本內(nèi)容和眾包 3方面生成18個特征,采用AdaBoost和支持向量機對垃圾信息進行分類檢測。文獻[25]針對 MySpace和Twitter中的垃圾用戶進行檢測,針對前者從個人注冊信息和私信文本內(nèi)容生成特征,針對后者從用戶行為和信息文本內(nèi)容生成特征,然后采用標準分類器對進行分類檢測,實驗表明不管是前者還是后者,Decorate分類器的檢測效果最佳。文獻[37]針對新浪微博垃圾用戶檢測,除了使用常用的特征(如URL鏈接比、關(guān)注粉絲比等)之外,還關(guān)注社交網(wǎng)絡傳播的有向特性,在此基礎上提出了基于統(tǒng)計特征與雙向投票的垃圾用戶檢測算法。2014年SIGIR中的文獻[38]利用 Web、郵件等中的垃圾信息進行特征映射遷移學習,采用矩陣分解與優(yōu)化模型結(jié)合的方式檢測Twitter等社交網(wǎng)絡中的垃圾。

    特征選取的范圍不同,采用的分類方法也不同。當特征類型單一時,有利于提出新穎的、高技術(shù)難度的分類方法,但受特征源單一的局限使容易被垃圾用戶識破,從而避免被檢測到。當特征類型多時,垃圾用戶不易于躲避檢測,同時也不利于提出新的分類方法??傊延醒芯客ǔR杂脩舴诸悪z測效果好壞為唯一目標,并沒有深入探討將研究重點優(yōu)先置于尋找分類特征還是改進分類方法會更有利于提高分類效果,本文以新浪微博為實例,對上述問題進行詳細討論。

    3 問題形式化描述

    3.1 問題形式化

    設微博用戶集為U={u1,u2,…,uN},其中,N為用戶數(shù)目。用戶ui擁有個人頁面Pi,包括個人資料、微博、關(guān)注/粉絲等信息。垃圾用戶檢測定義為根據(jù)事先抓取的用戶個人頁面 Pi和分類器Classifier預測用戶ui是正常用戶還是垃圾用戶,形式化為:Classifier∶ ui→{spammer,legitimate user}。

    3.2 垃圾用戶

    垃圾用戶通常是指在微博中展示、發(fā)表和傳播垃圾信息的用戶。通常不同的研究會從不同的角度賦予垃圾用戶不同的內(nèi)涵。

    本文根據(jù)微博的實情將垃圾用戶分為內(nèi)容垃圾、僵尸垃圾、封號垃圾3類。內(nèi)容垃圾主要傳播黃色信息、虛假中獎信息、不良網(wǎng)站鏈接。僵尸垃圾可分為文本僵尸和異常轉(zhuǎn)發(fā)用戶,主要以兜售粉絲為目的。封號垃圾是指被官方關(guān)停的垃圾用戶,多數(shù)是由自動程序產(chǎn)生。

    4 特征生成與分析

    對于微博,人們在其上瀏覽、發(fā)布、轉(zhuǎn)發(fā)和評論信息,而信息傳播主要依賴于用戶間社會性的交往與互動,在微博中這種社會關(guān)系是由用戶間的“關(guān)注—被關(guān)注”體現(xiàn)出來,它是現(xiàn)實世界中社會關(guān)系在社交網(wǎng)絡中的復制和重構(gòu)?;诖?,垃圾應該產(chǎn)生于內(nèi)容信息、用戶行為和社會關(guān)系3方面,故本文從這3個方面定義特征。

    選取特征的基本原則是:根據(jù)統(tǒng)計指標,挑揀區(qū)分度大的特征;使特征之間的相關(guān)性最??;保留中性特征。借鑒相關(guān)文獻中有代表性的特征,結(jié)合新浪微博的實際情況,經(jīng)過反復計算與分析,最終選取了17個特征,其統(tǒng)計指標如表1所示。

    4.1 社會特征

    關(guān)注數(shù)(F1)為相關(guān)微博關(guān)注其他微博總數(shù)。垃圾用戶的關(guān)注數(shù)遠遠高于正常用戶,且垃圾用戶的關(guān)注數(shù)的離散度較正常用戶的小,其原因很可能是正常用戶常會根據(jù)自己的興趣有選擇地關(guān)注其他用戶,而以獲得更多粉絲為目的垃圾用戶,必然會大量關(guān)注其他用戶,期待所關(guān)注用戶回粉。

    粉絲數(shù)(F2)為相關(guān)微博的粉絲總數(shù),表明垃圾用戶的粉絲數(shù)要明顯少于正常用戶,且它的粉絲數(shù)的離散度較正常用戶的小很多,很可能因為垃圾用戶沒有正常的社會關(guān)系,導致很少有人會關(guān)注它。

    互粉數(shù)(F3)為互為粉絲的數(shù)量,反映用戶的真實好友數(shù)量。正常用戶的互粉數(shù)遠多于垃圾用戶的,且它的離散度較垃圾用戶的小很多。很可能因為真實的社會關(guān)系會給正常用戶帶來許多互粉數(shù),而垃圾用戶即使主動關(guān)注了其他用戶,因其不在真實的社交關(guān)系中,故其他用戶回粉的概率很小。

    關(guān)注粉絲比(F4)為關(guān)注數(shù)與粉絲數(shù)的比值。正常用戶的關(guān)注數(shù)少、粉絲多,而垃圾用戶的恰與其相反,故二者的比值更大,有利于提升檢測效果。

    關(guān)注互粉比(F5)為關(guān)注數(shù)與互粉數(shù)的比值, 較F4更能放大正常用戶與垃圾用戶之間的差距,其原因可根據(jù)F1和F3的定義簡單推得。

    4.2 用戶行為特征

    用戶名復雜度(F6)為用戶名字的復雜度。部分垃圾用戶有著極其相似的命名特征,名字長度較長并且較復雜,定義如下(該特征和特征F15~F17均需先經(jīng)過分詞處理,采用了 NLPIR(natural language processing amp; information retrieval)中文分詞工具[39])。

    其中,n表示詞的數(shù)量,k表示數(shù)詞的個數(shù),lengthi表示第i個數(shù)詞的長度。正常用戶與垃圾用戶的名字復雜度的統(tǒng)計特征差距并不明顯,說明許多垃圾用戶常會起與正常用戶相近的名字,但該特征能夠較準確地檢測出少部分垃圾用戶。

    微博數(shù)(F7)為發(fā)布的微博總數(shù)。較正常用戶,內(nèi)容垃圾用戶通常會發(fā)布較多的博文,僵尸為了避免檢測也會發(fā)布適當數(shù)量的微博。

    月均微博(F8)為數(shù)據(jù)采集期間用戶每月所發(fā)的微博數(shù),可衡量用戶所發(fā)微博的活躍頻度。垃圾用戶的活躍度要高于正常用戶的,特別是內(nèi)容垃圾用戶最為活躍,而僵尸最不活躍。

    時間間隔(F9)為用戶最近一次發(fā)布微博距數(shù)據(jù)采集結(jié)束時刻的時間間隔(單位為天)。垃圾用戶的時間間隔均比較大,其原因是它會為某種利益目的進行短暫非法活動,當活動結(jié)束就不再發(fā)送博文,如有些廣告用戶可能賣完某一商品就停用。

    轉(zhuǎn)發(fā)比(F10)為轉(zhuǎn)發(fā)的微博與微博總數(shù)之比。較正常用戶,垃圾用戶常會轉(zhuǎn)發(fā)其他用戶的微博,以達到其擴散某些非法信息的目的。

    4.3 內(nèi)容特征

    URL鏈接比(F11)為含有URL的微博數(shù)量與微博總數(shù)之比。內(nèi)容垃圾用戶的 URL鏈接比最大且變異系數(shù)最小,其原因很可能是在微博中放置鏈接誘使用戶進入,從而達到某些惡意目的。

    微博評論比(F12)為收到的評論數(shù)與微博總數(shù)之比。正常用戶會與好友就所發(fā)微博進行交流,而垃圾用戶由于其微博的信息價值低且沒有真正的“好友”,故所發(fā)的微博一般不會有用戶去評論。

    原創(chuàng)微博評論比(F13)為收到的評論數(shù)與原創(chuàng)微博總數(shù)之比。較F12更具區(qū)別性。

    微博平均長度(F14)為博文的平均長度。從統(tǒng)計指標上看,正常用戶與垃圾用戶的差別不大,其原因可能是因內(nèi)容垃圾的平均長度較大造成的,但在特征選擇算法中該特征的排名相對靠前。

    表1 特征的統(tǒng)計指標

    因垃圾用戶發(fā)布的微博具有很強的相關(guān)性,故文本內(nèi)容相似性是非常重要的反垃圾檢測特征,本文采用基于詞語級別的博文之間的余弦相似度(F15)、模相似度(F16)和詞語共享率(F17)3個特征,分別來從不同的時間粒度來度量微博之間的相似性。其中,F(xiàn)15計算用戶在相鄰兩天所發(fā)微博的相似程度,F(xiàn)16計算用戶在一天內(nèi)所發(fā)微博的相似程度,而F17沒有強調(diào)時間上的相似度。

    5 特征選擇算法與分類器

    5.1 特征選擇算法

    特征選擇(feature selection)是指從原始特征集中選出與任務最相關(guān)的特征子集,使任務達到和特征選擇前近似甚至更好的效果。通過特征選擇,一些與任務無關(guān)和相互冗余的特征被刪除,無關(guān)和冗余特征不僅增加特征空間的維數(shù),降低學習的效率,而且還增加噪聲數(shù)據(jù)的可能,從而干擾學習算法的學習過程,并最終影響分類模型的構(gòu)造。

    特征選擇通常選擇與類別相關(guān)性強、且特征彼此間相關(guān)性弱的特征子集,由特征子集生成、子集評價、終止條件判斷和子集驗證4個步驟組成[40]。根據(jù)特征子集評價與分類學習算法的結(jié)合方式,特征選擇算法可主要分為Filter、Wrapper 2大類,前者使用獨立于學習算法的評估準則來濾去任務無關(guān)特征和冗余特征,后者使用后續(xù)的分類準確率作為評價函數(shù)??傮w來說,前者識別精度較低,但識別效率高;后者與其相反。

    本文選用的特征選擇算法如表2所示,F(xiàn)S1~FS5是有代表性的輸出特征權(quán)重的有監(jiān)督特征選擇算法,F(xiàn)S6是本文提出的綜合特征排名算法,F(xiàn)S7是以選擇最小特征組為輸出的有監(jiān)督特征選擇算法。

    FS1~FS5特征選擇算法,因其評價標準的專一性分別有其最佳適用范圍,由于事先并不能預知哪個算法適合本文所涉及的應用環(huán)境,為此本文提出了綜合特征排名算法FS6,基本思想是綜合考慮每個特征在不同的特征選擇算法中的貢獻,將在各個選擇算法結(jié)果中排名靠前的特征的權(quán)值加大,這樣既克服了每個利用了特征選擇算法因?qū)R恍远鴰淼娜秉c,又利用了其優(yōu)點,其計算過程如下。

    已知特征集F={F1,F2,…,FM},設第i個特征選擇算法的特征排名FRi=(Fi,1,Fi,2,…,Fi,M)(1≤i≤L,L為特征選擇算法數(shù)目),在L個特征選擇算法的結(jié)果排名中,將前k(1≤k≤M)名的所有特征組成特征集Topk={Fi,j|1≤i≤L,1≤j≤k}。算法如下。

    表2 特征選擇算法

    1)計算特征Fj在 Topk中的出現(xiàn)概率,公式為為特征 Fj在 Topk中出現(xiàn)次數(shù),sizeof(·)為Topk中特征數(shù)目。

    2)計算特征Fj在Topk(F)中的出現(xiàn)概率的平均值,計算公式為

    5.2 分類器

    基于機器學習的分類檢測是通過學習訓練出一個分類模型,其將數(shù)據(jù)集中的樣本映射到給定類別中的某一個類別。由于分類器對樣本數(shù)量的敏感度、特征之間相關(guān)度的敏感度等均不相同,故選擇不同的分類器得到的分類效果往往不同。本文使用了10個經(jīng)典的分類器(如表3所示),包括了相關(guān)文獻已驗證識別效果最好的分類器。

    6 實驗與評估

    6.1 數(shù)據(jù)標注

    基于對多次實驗結(jié)果的分析,共隨機抽取4 300個用戶,進行人工標注,正常用戶為3 710個(包括199個新浪微博身份實名認證的用戶),約占總數(shù)的86.3%,垃圾用戶為590個(約13.7%)。在垃圾用戶中,內(nèi)容垃圾為208個(約4.8%);僵尸垃圾為111個(約2.6%);封號垃圾為271個(約6.3%)。

    6.2 實驗設置

    為了得到可信的結(jié)果,實驗采用 10折交叉驗證方法[54]來驗證分類性能,將原來樣本隨機分成10等份互不相交的樣本子集,每等份樣本的類別比例近似等于總樣本的,其中用9份樣本子集作為訓練集建立分類檢測模型,而用剩下的1份樣本子集作為驗證集,然后交叉驗證重復 10次,使得每份樣本都被驗證一次。最終模型的預測分類性能評估指標就是這10次分類評估指標的平均值。

    表3 分類器

    6.3 特征選擇實驗

    設包含M個特征的集合為F,C為類別特征,數(shù)據(jù)集中正樣本(正常用戶)與負樣本(垃圾用戶)比例為δ,數(shù)據(jù)集記為Dδ(F,C)。

    實驗包括特征選擇、用戶分類檢測和實驗結(jié)果評估3部分。特征選擇是采用不同的特征選擇算法(FS)對數(shù)據(jù)集 Dδ(F,C)進行計算,按照特征對分類的貢獻計算出特征排名FR,或從M個特征中選出m(1≤m≤M)個最佳特征子集Fbest。

    分別將δ=1(共 1 184條)和δ=5.9(共 4 101條)樣本數(shù)據(jù)輸入不同的特征選擇算法中,分別得到每個樣本比例對應的特征選擇結(jié)果。其中,δ取不同的值是為了考察不平衡數(shù)據(jù)集對特征選擇結(jié)果的影響。

    表4分別給出了6個經(jīng)典特征選擇算法的不同結(jié)果,其中CFS方法計算出最小數(shù)目的特征子集(用來與第6.4.2節(jié)的實驗結(jié)果對比分析),而其他特征選擇算法均給出了特征排名。表5給出了綜合特征排名算法(CR)的結(jié)果。

    6.4 分類檢測實驗

    用戶分類檢測是將不同的分類器(Classifier)與不同的特征選擇算法(FS)進行組合lt;FS,Classifier>對用戶進行識別,也即將特征選擇的結(jié)果作為分類器的輸入,然后根據(jù)度量指標對分類結(jié)果進行評估分析,包括特征選擇算法對分類器的影響、特征數(shù)目對分類效果的影響、樣本數(shù)量對分類器的影響。

    6.4.1 特征選擇對分類器影響分析

    分別將δ=1和δ=5.9的6個不同特征選擇算法的結(jié)果與新浪微博中正常用戶與垃圾用戶真實比例δ=5.9的4 101條樣本數(shù)據(jù)輸入至10個經(jīng)典的分類器中,共計120組實驗,然后記錄每個實驗的6個分類結(jié)果評價指標。本節(jié)使用準確率(Acc)來衡量分類器對整個樣本的識別能力。由于不同分類檢測實驗結(jié)果的準確率之間的絕對差距不是很大,為了在圖上將其顯著區(qū)分開,引入了準確率之間的比率表示每組實驗中每個實驗結(jié)果的準確率與最小者的比值。

    圖1和圖2分別給出δ=1和δ=5.9的同一個特征選擇算法組合不同分類器的檢測結(jié)果的準確率,從圖中可知,無論是δ=1還是δ=5.9,就單個特征選擇算法而言,其與不同分類器組合后的分類效果之間存在一定差異,但差異非常微小,如前所述,為了使差異顯著,圖中縱軸采用了準確率之間的比率Ratio;就所有的特征選擇算法而言,分類器的性能較為穩(wěn)定,一些分類器無論與哪個特征選擇算法結(jié)合,其分類效果均表現(xiàn)出色。

    表4 特征選擇實驗結(jié)果

    表5 綜合特征算法實驗結(jié)果及特征在Topk中出現(xiàn)的平均概率

    圖1 特征選擇方法與分類器組合的檢測性能(δ=1)

    圖2 特征選擇方法與分類器組合的檢測性能(δ=5.9)

    此外,就所有的特征選擇算法而言,特征選擇算法對分類器的支持在很大程度上具有穩(wěn)定性。具體來說,任意給定一個特征選擇算法FSx和一個分類器Classifiery,其組合的分類結(jié)果準確率Acclt;FSx,Classifiery>在 Acclt;FSi,Classifiery>(i=1,…,6)中的排名與對于某一分類器 Classifierj(j=1,…,10且j≠y)Acclt;FSx,Classifierj>在 Acclt;FSi,Classifierj>(i=1,…,6)的排名基本一致。也即對于某個特征選擇算法,其與某個分類器組合的準確率在該分類器與所有特征選擇算法組合的準確率中的排名,大致可以代表該特征選擇算法與其他任一分類器組合在該分類器與所有特征選擇算法組合的準確率中的排名。直觀而言,在圖2中,ReliefF與每個分類器組合的分類結(jié)果的準確率排名均靠前。這一現(xiàn)象表明,新浪微博中反垃圾分類檢測效果在一定程度上依賴于特征組的選擇。

    在特征選擇實驗中δ=5.9,其實驗結(jié)果較δ=1有明顯差別,在δ=1中,同一個分類器與不同特征選擇算法組合的分類準確率較為接近,而在δ=5.9中,差距較為明顯,特別是與ReliefF特征選擇算法組合的分類器的分類效果更為突出,這表明在用戶比例接近真實的環(huán)境下新浪微博中特征選擇對分類器的影響較為明顯。此外,在δ=1中,分類效果整體上較好的排名前3位的特征選擇算法分別是IG、CR和SU,而在δ=5.9中,排名前 3位的特征選擇算法分別是ReliefF、CR和IG;無論δ=1還是δ=5.9,分類效果整體上較好的排名前2位的均是LR和LMT,排名第3位的分別為 ABM1(δ=1)和 BA(δ=5.9)。該現(xiàn)象說明在不同的用戶比例下特征的選擇對分類器的影響不完全相同,另外,本文提出的CR方法排名第2,雖不是最好的方法,但起到了均衡其他特征選擇方法的效果。

    總之,整體而言,對于新浪微博的垃圾用戶檢測,特征組的選擇較分類器的選擇更為重要,也即特征組的選取較分類器的改進更為重要。

    6.4.2 特征數(shù)目對分類效果影響分析

    探尋特征數(shù)目對分類效果的影響,是否存在最小特征數(shù)目。實驗針對δ=5.9,選取排名前3的特征選擇算法(分別為ReliefF、CR和IG)與排名前3的分類器(LR、LMT和BA)進行組合,從而得到特征重要性排名及數(shù)目與準確率指標之間的關(guān)系,如圖3所示,橫坐標為特征的數(shù)目且根據(jù)特征對分類結(jié)果的貢獻程度由大至小排列(在圖中,因在所有特征選擇方法中,第17個特征相同,為了降低計算量,該特征沒有參與分類計算),縱坐標為3個不同分類器與不同的特征選擇算法組合的準確率的平均值,及圖中l(wèi)t;ReliefF,.>表示 ReliefF特征選擇算法分別與分類器LR、LMT和BA組合的準確率的平均值。

    圖3 特征數(shù)目對準確率的影響(δ=5.9)

    如果忽略局部的波動,總體來說,準確率隨著特征數(shù)目的逐漸增加呈現(xiàn)拋物線形狀,隨著特征數(shù)目的增加準確率會逐漸升高,達到峰值(從圖3知特征數(shù)目為10個時準確率達到峰值),然后下降。該結(jié)果表明在分類檢測中僅有少數(shù)幾個關(guān)鍵特征是不夠的,只有特征數(shù)目達到一定的數(shù)量,準確率才能達到峰值;當然,過多的冗余特征又會導致準確率的降低。此外,值得一提的是,此處的最小特征數(shù)目10個與第6.3節(jié)采用CFS算法選出的最小特征數(shù)目5個(如表4所示)所示不盡一致,需進一步討論。

    6.4.3 最佳特征來源分布分析

    旨在分析最佳特征的來源分布。在6.4.2節(jié)實驗中,對于δ=5.9樣本,取排名第 1的特征選擇算法(ReliefF)中的最佳特征子集Fbest={F5,F1,F10,F4,F17,F14,F9,F11,F13,F3}。其中{F5,F1,F4,F3}屬于社會特征,{F10,F9}屬于用戶行為特征,{F17,F14,F11,F13}屬于內(nèi)容特征,也即最佳特征來源于內(nèi)容信息、用戶行為和社會關(guān)系 3個方面。這一結(jié)果表明需要從多側(cè)面生成特征,這將有助于提高識別準確率。

    6.4.4 樣本數(shù)量對分類效果影響分析

    旨在分析樣本數(shù)量對分類器性能的影響,掌握分類器性能收斂與樣本數(shù)量之間的關(guān)系,并探尋實驗中所需的最佳訓練樣本數(shù)量,進一步說明之前的實驗對樣本數(shù)量的假設是合理的。

    根據(jù) 6.4.2節(jié)實驗,從所有樣本集中隨機抽取不同數(shù)量的樣本,以200為步長使樣本數(shù)量從400逐漸增加到 4 000。將不同的樣本數(shù)目輸入至不同的分類器中,進行分類檢測實驗,觀察樣本數(shù)量與準確率之間的變化關(guān)系。圖4給出了10個分類檢測算法準確率的統(tǒng)計曲線,從圖中可以看出,雖然不同分類器的準確率各有差異,但是總體的趨勢都是特征數(shù)目在1 000到2 000之間時準確率的變化發(fā)生由快到慢的轉(zhuǎn)折。

    圖4 10個分類檢測算法的準確率

    由于圖中所有曲線的變化趨勢相似,因此計算每個樣本數(shù)目下 10個分類檢測算法準確率的平均值,如圖 5所示的 avgAcc曲線,其擬合結(jié)果為fitCurve曲線。對于擬合曲線,當樣本數(shù)目達到3 000以上時,只增大樣本數(shù)目已經(jīng)很難使分類器的準確率得到提高。這說明有關(guān)樣本數(shù)量假設合理可行。

    圖5 樣本數(shù)量對準確率的影響

    7 結(jié)束語

    本文旨在回答在微博反垃圾中優(yōu)先將研究重點投入到尋找分類特征還是改進分類方法。以新浪微博為例,實驗結(jié)果表明特征組的選擇較分類器的改進更為重要,需從內(nèi)容信息、用戶行為和社會關(guān)系多側(cè)面定義特征,且特征并非越多檢測效果越好。鑒于此,希望未來在特征的選取方面投入更多的工作,以便在反垃圾研究中有進一步的突破。盡管實驗是以新浪微博為例展開,但其結(jié)果同樣適用于騰訊微博、搜狐微博等微博的反垃圾。

    [1]Available online[EB/OL]. http://news.xinhuanet.com/2013-07/04/c_116410610.htm.

    [2]Available online[EB/OL]. http://it.people.com.cn/n/2015/0212/c1009-26552746.html.

    [3]SPIRIN N,HAN J W. Survey on web spam detection: principles and algorithms[J]. ACM SIGKDD Explorations Newsletter,2012,13(2):50-64.

    [4]MUKHERJEE A,LIU B,GLANCE N S. Spotting fake reviewer groups in consumer reviews[C]//The WWW. c2012: 191-200.

    [5]WANG T Y,WANG G,LI X. Characterizing and detecting malicious crowdsourcing[C]//The ACM SIGCOMM. c2013: 537-538.

    [6]WANG G,WILSON C,ZHAO X H. Serf and turf: crowdturfing for fun and profit[C]//The WWW. c2012: 679-688.

    [7]SRIDHARAN V,SHANKAR V,GUPTA M. Twitter games: how successful spammers pick targets[C]//The ACSAC. c2012: 389-398.

    [8]STRINGHINI G,KRUEGEL C,VIGNA G. Detecting spammers on social networks[C]//The ACSAC. c2010: 1-9.

    [9]IRANI D,WEBB S,PU C. Study of static classification of social spam profiles in MySpace[C]//The ICWSM. c2010: 82-89.

    [10]GAO H Y,HU J,WILSON C. Detecting and characterizing social spam campaigns[C]//The CCS. c2010: 681-683.

    [11]AGGARWAL A,ALMEIDA J M,KUMARAGURU P. Detection of spam tipping behaviour on foursquare[C]//The WWW. c2013:641-648.

    [12]GAO Q,ABEL F,HOUBEN G J. A comparative study of user’s microblogging behavior on Sina weibo and Twitter[C]//The 20th International Conference on User Modeling. c2012: 88-101.

    [13]YU L,ASUR S,HUBERMAN BA. What trends in Chinese social media[C]//SNA-KDD Workshop. c2011: 1-10.

    [14]YU LL,ASUR S,HUBERMAN B A. Artificial inflation: the real story of trends and trend-setters in Sina weibo[C]//The International Con-fernece on Social Computing. c2012: 514-519.

    [15]樊鵬翼,王暉,姜志宏,等. 微博網(wǎng)絡測量研究[J]. 計算機研究與發(fā)展,2012,49(4):691-699.FAN P Y,WANG H,JIANG Z H,et al. Measurement of microblogging network[J]. Journal of Computer Research Development,2012,49(4):691-699.

    [16]SHARMA P,BISWAS S. Identifying spam in Twitter trending topics.technical report[R]. USC(University of Southern California)Information Sciences Institute,2011.1-4.

    [17]BENEVENUTO F,MAGNO G,RODRIGUES T. Detecting spammers on Twitter[C]//The 7th Collaboration,Electronic messaging,Anti-Abuse and Spam Conference. c2010: 1-9.

    [18]HASTIE T,TIBSHIRANI R. DISCRIMINANT adaptive nearest neighbor classification[J]. IEEE Trans. on Pattern Analysis and Machine Intelligence. 1996,18(6):607-616.

    [19]FREUND Y,SCHAPIRE RE. A decision-theoretic generalization of on-line learning and an application to boosting[J]. Journal of Computer and System Sciences,1997,55(1):119-139.

    [20]ORR M J L. Regularization in the selection of radial basis function centres[J]. Neural Computation,1995,7(3):606-623.

    [21]HO T K. The random subspace method for constructing decision forests[J]. IEEE Trans. on Pattern Analysis and Machine Intelligence,1998,20(8):832-844.

    [22]MILLER Z,DICKINSON B,DEITRICK W,et al. Twitter spammer detection using data stream clustering[J]. Information Sciences,2014,260(1): 64-73.

    [23]SHOBEIR F,JAMES F,MADHUSHDANA S,et al. Collective spammer detection in evolving multi-relation social networks[C]//The KDD.c2015: 1769-1778.

    [24]WANG A H. Detecting spam bots in online social networking sites: a machine learning approach[C]//DBSec. c2010: 335-342.

    [25]LEE K,CAVERLEE J,WEBB S. Uncovering social spammers: social honeypots+machine learning[C]//The SIGIR. c2010: 435-442.

    [26]MARTINEZ R J,ARAUJO L. Detecting malicious tweets in trending topics using a statistical analysis of language[J]. Expert Systems with Applications,2013 40(8): 2992-3000.

    [27]ZHU Y,WANG X,ZHONG E H. Discovering spammers in social networks[C]//The AAAI. c2012: 1-7.

    [28]HU X,TANG J L,GAO HJ,et al. Social spammer detection with sentiment information[C]//The ICDM. c2014: 180-189.

    [29]TAN E,GUO L,CHEN S,et al. Unik: unsupervised social network spam detection[C]//The CIKM. c2013: 479-488.

    [30]ZHANG X,ZHU S,LIANG W. Detecting spam and promoting campaigns in the twitter social network[C]//The ICDM. c2012: 1194-1199.

    [31]SURENDRA S,AIXIN S. HSpam14: a collection of 14 million tweets for hashtag-oriented spam research[C]//The SIGIR. c2015: 9-13.

    [32]YANG C,HARKREADER R C,ZHANG J. Analyzing spammers'social networks for fun and profit: a case study of cyber criminal ecosystem on twitter[C]//The WWW. c2012: 71-80.

    [33]HU X,TANG J L,LIU H. Online social spammer detection[C]//The AAAI. c2014: 1-7.

    [34]HU X,TANG J L,ZHANG Y C,et al. Social spammer detection in microblogging[C]//The IJCAI. c2013: 177-188.

    [35]CASTILLO C,MENDOZA M,POBLETE B. Information credibility on twitter[C]//The WWW. c2011: 675-684.

    [36]RATKIEWICZ J,CONOVER M,MEISS M. Detecting and tracking political abuse in social media[C]//The ICWSM. c2011: 1-8.

    [37]丁兆云,周斌,賈焰,等. 微博中基于統(tǒng)計特征與雙向投票的垃圾用戶發(fā)現(xiàn)[J]. 計算機研究與發(fā)展,2013,50(11): 2336-2348.DING Z Y,ZHOU B,JIA Y,et al. Detecting spammers with a bidirectional vote algorithm based on statistical features in microblogs[J].Journal of Computer Research and Development,2013,50(11):2336-2348.

    [38]HU X,TANG J L,ZHANG Y C,LIU H. Leveraging knowledge across media for spammer detection in microblogging[C]//The ACM SIGIR. c2014: 547-556.

    [39]Available online[EB/OL]. http://ictclas.nlpir.org/.

    [40]DASH M,LIU H. Feature selection for classifications[J]. Intelligent Data Analysis,1997,16(21):131-156.

    [41]LIU H,SETIONO R. CHI2: feature selection and discretization of numeric attributes[C]//The ICTAI. c1995: 338-391.

    [42]NOWOZIN S. Improved information gain estimates for decision tree induction[C]//ICML. c2012: 1-8.

    [43]KONONENKO I. Estimating attributes: analysis and extensions of RELIEF[C]//The ECML-PKDD. c1994: 171-182.

    [44]GUYON I,WESTON J,BARNHILL SMD. Gene selection for cancer classification using support vector machines[J]. Machine Learning,2002,46(1-3):389-422.

    [45]STECK J B. Netpix: a method of feature selection leading to accurate sentiment-based classification models[D]. Central Connecticut State University,2005.

    [46]HALL M A. Correlation-based feature selection for discrete and numeric class machine learning[C]//The ICML. c2000: 359-366.

    [47]JOHN GH,EDU S,LANGLEY P. Estimating continuous distributions in Bayesian classifiers[C]//The UAI. c1995: 338-345.

    [48]KEERTHI S S,DUAN K,SHEVADE S K. A fast dual algorithm for kernel logistic regression[J]. Machine Learning,2005,61(1):151-165.

    [49]CORTES C,VAPNIK V N. Support-vector networks[J]. Machine Learning,1995,20(3):273-297.

    [50]ORR M J L. Regularization in the selection of radial basis function centres[J]. Neural Computation,1995,7(3):606-623.

    [51]BREIMAN L. Bagging predictors[J]. Machine Learning,1996,24(2):123-140.

    [52]QUINLAN J R. C4.5: programs for machine learning[M]. Morgan Kaufmann Publishers,San Mateo,California,1993.

    [53]LANDWEHR N,HALL M,FRANK E. Logistic model trees[J]. Machine Learning,2005,59(1):161-205.

    [54]KOHAVI R. A study of cross-validation and bootstrap for accuracy estimation and model selection[C]//The IJCAI. c1995: 1137-1143.

    Feature importance analysis for spammer detection in Sina Weibo

    ZHANG Yu-xiang1,2,3,SUN Yu1,YANG Jia-hai2,3,ZHOU Da-lei4,MENG Xiang-fei5,XIAO Chun-jing1

    (1.College of Computer Science,Civil Aviation University of China,Tianjin 300300,China;2.Institute for Network Sciences and Cyberspace,Tsinghua University,Beijing 100084,China;3.Tsinghua National Laboratory for Information Science and Technology (TNList),Beijing 100084,China;4.Institue of Network Technology,Beijing University of Posts and Telecommunications,Beijing 100876,China;5. State Key Laboratory of Virtual Reality Technology and Systems,Beihang University,Beijing 100876,China)

    Microblog has drawn attention of not only legitimate users but also spammers. The garbage information provided by spammers handicaps users’ experience significantly. In order to improve the detection accuracy of spammers,most existing studies on spam focus on generating more classification features or putting forward new classifiers. Which kind of issues would be put the high priority of an enormous amount of research effort into? Are extensive features or novel classifiers better for the detection accuracy of spammers? It is tried to address these questions through combining different feature selection methods with different classifiers on a real Sina Weibo dataset. Experimental results show that selected features are more important than novel classifiers for spammer detection. In addition,features should be derived from a wide range,such as text contents,user behaviors,and social relationship,and the dimension of features should not be too high. These results will be useful in finding the breakpoint of Microblog anti-spam works in the future.

    Sina Weibo,feature definition,feature selection,spammer detection

    s:The National Basic Research Program of China (973 Program)(No.2009CB320505),The National Key Technology Ramp;D Program of China(No.2008BAH37B05),The National Natural Science Foundation of China (No.61170211,No.U1533104,No.61301245),Ph.D. Programs Foundation of Ministry of Education of China (No.20110002110056)

    TP391

    A

    2015-11-23;

    2016-04-24

    國家重點基礎研究發(fā)展計劃(“973”計劃)基金資助項目(No.2009CB320505);國家科技支撐計劃基金資助項目(No.2008BAH37B05);國家自然科學基金資助項目(No.61170211,No.U1533104,No.61301245);教育部博士點基金資助項目(No.20110002110056)

    10.11959/j.issn.1000-436x.2016152

    張宇翔(1975-),男,山西五寨人,博士,中國民航大學副教授,主要研究方向為社會網(wǎng)絡分析、推薦技術(shù)。

    孫菀(1991-),女,山東煙臺人,中國民航大學碩士生,主要研究方向為社會網(wǎng)絡分析與推薦技術(shù)。

    楊家海(1966-),男,浙江云和人,清華大學教授、博士生導師,主要研究方向為計算機網(wǎng)絡管理與測量、云計算與大數(shù)據(jù)等。

    周達磊(1992-),男,江蘇連云港人,北京郵電大學碩士生,主要研究方向為網(wǎng)絡分析。

    孟祥飛(1993-),男,山西太原人,北京航空航天大學碩士生,主要研究方向為數(shù)據(jù)分析技術(shù)。

    肖春景(1978-),女,河北唐山人,中國民航大學講師,主要研究方向為數(shù)據(jù)挖掘與推薦系統(tǒng)。

    猜你喜歡
    分類特征用戶
    分類算一算
    如何表達“特征”
    不忠誠的四個特征
    當代陜西(2019年10期)2019-06-03 10:12:04
    分類討論求坐標
    數(shù)據(jù)分析中的分類討論
    教你一招:數(shù)的分類
    抓住特征巧觀察
    關(guān)注用戶
    商用汽車(2016年11期)2016-12-19 01:20:16
    關(guān)注用戶
    商用汽車(2016年6期)2016-06-29 09:18:54
    關(guān)注用戶
    商用汽車(2016年4期)2016-05-09 01:23:12
    亚洲精品日本国产第一区| 日韩成人av中文字幕在线观看| 久久久久网色| 最近中文字幕2019免费版| 免费观看在线日韩| 色尼玛亚洲综合影院| 一级毛片久久久久久久久女| 国产精品一区二区三区四区免费观看| 中文字幕免费在线视频6| 亚洲av电影在线观看一区二区三区 | 床上黄色一级片| 亚洲人成网站在线观看播放| 99热全是精品| 91精品伊人久久大香线蕉| 国产女主播在线喷水免费视频网站 | 国产成人午夜福利电影在线观看| 久久久精品欧美日韩精品| 免费看不卡的av| 色播亚洲综合网| 精品亚洲乱码少妇综合久久| 亚洲精品国产成人久久av| 欧美人与善性xxx| 春色校园在线视频观看| 99久久中文字幕三级久久日本| 特级一级黄色大片| 99久久中文字幕三级久久日本| 久久久久免费精品人妻一区二区| 亚洲av电影不卡..在线观看| 亚洲美女视频黄频| 天堂网av新在线| 国产三级在线视频| 精品久久久久久久久久久久久| 在线 av 中文字幕| 九色成人免费人妻av| 精品一区二区三区人妻视频| 欧美xxxx黑人xx丫x性爽| 寂寞人妻少妇视频99o| 亚洲va在线va天堂va国产| 国产一区二区三区av在线| 麻豆成人av视频| 久久久久网色| 又粗又硬又长又爽又黄的视频| 在线天堂最新版资源| 天堂av国产一区二区熟女人妻| 狠狠精品人妻久久久久久综合| 国产黄片视频在线免费观看| 日韩伦理黄色片| av专区在线播放| 午夜爱爱视频在线播放| 国产高清国产精品国产三级 | 亚洲在线自拍视频| 精品久久久精品久久久| 成年免费大片在线观看| 五月玫瑰六月丁香| 亚洲激情五月婷婷啪啪| 亚洲在久久综合| 久久久久网色| 久久精品人妻少妇| 亚洲国产成人一精品久久久| 嫩草影院入口| 国产av不卡久久| 天天躁夜夜躁狠狠久久av| 精品国产三级普通话版| 亚洲国产日韩欧美精品在线观看| 日韩一区二区三区影片| 久久久久久国产a免费观看| 久久这里只有精品中国| 中文天堂在线官网| 91精品一卡2卡3卡4卡| 欧美日韩国产mv在线观看视频 | 亚洲丝袜综合中文字幕| 人妻少妇偷人精品九色| 国产黄色小视频在线观看| 午夜福利网站1000一区二区三区| 日韩欧美一区视频在线观看 | 国产乱人视频| 成年av动漫网址| 国产黄片视频在线免费观看| 国产不卡一卡二| 国产精品1区2区在线观看.| av在线老鸭窝| 在线免费十八禁| 男女边吃奶边做爰视频| 国产又色又爽无遮挡免| 男插女下体视频免费在线播放| 网址你懂的国产日韩在线| 午夜激情欧美在线| 国产精品一及| 国产伦理片在线播放av一区| 亚洲国产精品成人久久小说| 亚州av有码| 黄片wwwwww| 女人久久www免费人成看片| 成人午夜精彩视频在线观看| 晚上一个人看的免费电影| 免费在线观看成人毛片| 色播亚洲综合网| 天堂√8在线中文| 久久久午夜欧美精品| 精品少妇黑人巨大在线播放| 午夜免费男女啪啪视频观看| 国产乱来视频区| 亚洲av.av天堂| .国产精品久久| 亚洲精品一二三| 老师上课跳d突然被开到最大视频| 视频中文字幕在线观看| av国产免费在线观看| 不卡视频在线观看欧美| 超碰97精品在线观看| 99久国产av精品国产电影| 成人午夜高清在线视频| 淫秽高清视频在线观看| 久久精品夜夜夜夜夜久久蜜豆| 欧美xxⅹ黑人| 久热久热在线精品观看| 一级毛片久久久久久久久女| 国产精品三级大全| 国产亚洲午夜精品一区二区久久 | 亚洲一级一片aⅴ在线观看| 人妻制服诱惑在线中文字幕| 国产成人精品一,二区| 久久久久久久久久久丰满| 午夜福利视频1000在线观看| 亚洲最大成人av| 又大又黄又爽视频免费| 赤兔流量卡办理| 日本一二三区视频观看| 热99在线观看视频| 天天躁夜夜躁狠狠久久av| 日韩,欧美,国产一区二区三区| 天堂网av新在线| 欧美xxxx性猛交bbbb| 男人和女人高潮做爰伦理| 久久久精品94久久精品| 汤姆久久久久久久影院中文字幕 | 亚洲av免费高清在线观看| 国产亚洲午夜精品一区二区久久 | videossex国产| 国产男人的电影天堂91| 亚洲精品日韩在线中文字幕| 国产毛片a区久久久久| 中文在线观看免费www的网站| 国产在视频线精品| 丰满乱子伦码专区| 少妇人妻一区二区三区视频| 国产成人精品福利久久| 黄色欧美视频在线观看| 久久午夜福利片| 舔av片在线| 性插视频无遮挡在线免费观看| 亚洲一区高清亚洲精品| 日韩三级伦理在线观看| 美女黄网站色视频| 亚洲av成人av| 综合色丁香网| 在现免费观看毛片| a级毛色黄片| 尤物成人国产欧美一区二区三区| 成年av动漫网址| 最近的中文字幕免费完整| 大片免费播放器 马上看| 夫妻午夜视频| 成人国产麻豆网| 国产 亚洲一区二区三区 | 黄色配什么色好看| 亚洲成色77777| 久久久久久久久久成人| 亚洲在久久综合| 高清视频免费观看一区二区 | 久久久久久国产a免费观看| 成人午夜高清在线视频| 亚洲人与动物交配视频| av在线老鸭窝| 国产午夜精品一二区理论片| 不卡视频在线观看欧美| 老司机影院毛片| 看免费成人av毛片| 欧美最新免费一区二区三区| av网站免费在线观看视频 | 狂野欧美激情性xxxx在线观看| 少妇裸体淫交视频免费看高清| 亚洲av一区综合| 国产精品一区二区三区四区久久| 亚洲欧美成人综合另类久久久| 精品久久久久久久久av| 观看美女的网站| 久久综合国产亚洲精品| 欧美激情在线99| 嫩草影院入口| 久久久久网色| 韩国av在线不卡| 国产精品蜜桃在线观看| 中文字幕人妻熟人妻熟丝袜美| 秋霞伦理黄片| 免费av观看视频| 免费大片黄手机在线观看| 国产女主播在线喷水免费视频网站 | 午夜免费观看性视频| 日韩成人伦理影院| 搞女人的毛片| 99久久九九国产精品国产免费| 精品国产一区二区三区久久久樱花 | 特大巨黑吊av在线直播| 亚洲av在线观看美女高潮| 一级爰片在线观看| 久久久久国产网址| 欧美高清性xxxxhd video| 三级毛片av免费| 欧美日韩亚洲高清精品| 中文字幕人妻熟人妻熟丝袜美| 熟妇人妻不卡中文字幕| 午夜精品国产一区二区电影 | 高清视频免费观看一区二区 | 国产精品人妻久久久影院| 十八禁国产超污无遮挡网站| 晚上一个人看的免费电影| 久久国内精品自在自线图片| 69av精品久久久久久| 搡老乐熟女国产| 久久久久久国产a免费观看| 听说在线观看完整版免费高清| 国产亚洲最大av| 九色成人免费人妻av| 精品久久国产蜜桃| 欧美性感艳星| 亚洲精品日本国产第一区| 午夜老司机福利剧场| 国产精品女同一区二区软件| 国产亚洲午夜精品一区二区久久 | 亚洲天堂国产精品一区在线| 看黄色毛片网站| 亚洲在线自拍视频| 久久精品国产亚洲av天美| 欧美成人午夜免费资源| 久久精品国产亚洲av涩爱| 伦理电影大哥的女人| www.av在线官网国产| 亚洲在线观看片| 国产成人a区在线观看| 亚洲人成网站高清观看| 日韩欧美国产在线观看| 欧美一区二区亚洲| 一区二区三区免费毛片| 国产成人aa在线观看| 99热这里只有精品一区| 老师上课跳d突然被开到最大视频| 高清毛片免费看| 国产在线男女| 欧美激情久久久久久爽电影| 免费无遮挡裸体视频| 在线观看av片永久免费下载| 国产av在哪里看| 亚洲欧美精品专区久久| ponron亚洲| av在线观看视频网站免费| 99久久精品热视频| 看十八女毛片水多多多| 天堂中文最新版在线下载 | 久久久久久久久久久免费av| 国产一级毛片七仙女欲春2| 三级男女做爰猛烈吃奶摸视频| 99久久九九国产精品国产免费| 成人高潮视频无遮挡免费网站| 久久久久久久亚洲中文字幕| 午夜激情欧美在线| 狂野欧美白嫩少妇大欣赏| 三级毛片av免费| 国产精品一二三区在线看| 欧美成人精品欧美一级黄| 日韩电影二区| 可以在线观看毛片的网站| av专区在线播放| 欧美人与善性xxx| 高清毛片免费看| 亚洲人成网站在线观看播放| 亚洲av中文字字幕乱码综合| 小蜜桃在线观看免费完整版高清| 久久久久久久久中文| av福利片在线观看| av天堂中文字幕网| 熟女电影av网| 午夜福利在线观看免费完整高清在| 最近中文字幕2019免费版| 亚洲真实伦在线观看| 亚洲成人中文字幕在线播放| 婷婷色综合大香蕉| 久久精品国产自在天天线| 少妇人妻一区二区三区视频| 国产黄频视频在线观看| 精品人妻视频免费看| 免费播放大片免费观看视频在线观看| 亚洲成人精品中文字幕电影| 国产黄色免费在线视频| 一级毛片 在线播放| 超碰av人人做人人爽久久| 国产综合精华液| 卡戴珊不雅视频在线播放| 日本av手机在线免费观看| 午夜精品在线福利| 成人二区视频| 欧美潮喷喷水| 插逼视频在线观看| 国产免费一级a男人的天堂| 美女主播在线视频| 97超视频在线观看视频| 亚洲最大成人av| 一区二区三区免费毛片| 久久久久九九精品影院| 亚洲精品456在线播放app| 欧美日韩亚洲高清精品| 亚洲国产精品国产精品| 精品一区二区三卡| 边亲边吃奶的免费视频| 99热网站在线观看| www.色视频.com| 91av网一区二区| 精品一区在线观看国产| 国产黄色小视频在线观看| 一级二级三级毛片免费看| 观看美女的网站| 国产综合精华液| 听说在线观看完整版免费高清| 午夜激情欧美在线| 国产大屁股一区二区在线视频| 成人午夜精彩视频在线观看| 夜夜看夜夜爽夜夜摸| 久久国产乱子免费精品| 久久久久久久久久黄片| 午夜激情久久久久久久| 一级毛片我不卡| 熟妇人妻不卡中文字幕| 亚洲丝袜综合中文字幕| 成人高潮视频无遮挡免费网站| 哪个播放器可以免费观看大片| 高清av免费在线| 久久韩国三级中文字幕| 欧美成人精品欧美一级黄| av国产免费在线观看| 26uuu在线亚洲综合色| 国产黄a三级三级三级人| 最后的刺客免费高清国语| 免费黄频网站在线观看国产| 18+在线观看网站| 精品少妇黑人巨大在线播放| 国产av码专区亚洲av| 中文字幕av成人在线电影| eeuss影院久久| 国产欧美另类精品又又久久亚洲欧美| 丰满少妇做爰视频| 国产视频内射| 久久精品国产鲁丝片午夜精品| 可以在线观看毛片的网站| 欧美最新免费一区二区三区| 亚洲精品日韩在线中文字幕| 日本午夜av视频| 精品久久久久久电影网| 听说在线观看完整版免费高清| 丝袜美腿在线中文| 久久久色成人| 女人被狂操c到高潮| 80岁老熟妇乱子伦牲交| 搞女人的毛片| 国产女主播在线喷水免费视频网站 | 国产精品一区二区在线观看99 | 国产午夜精品久久久久久一区二区三区| 日本午夜av视频| 日本av手机在线免费观看| 99热6这里只有精品| 免费黄色在线免费观看| 一级毛片aaaaaa免费看小| 亚洲在久久综合| 黄色配什么色好看| 亚洲色图av天堂| 91午夜精品亚洲一区二区三区| 777米奇影视久久| 成人特级av手机在线观看| 超碰av人人做人人爽久久| 亚洲精品456在线播放app| 国产色婷婷99| 日韩国内少妇激情av| 亚洲精品aⅴ在线观看| 青春草亚洲视频在线观看| 国产淫片久久久久久久久| 亚洲国产精品国产精品| 日韩成人伦理影院| 日日啪夜夜撸| 日韩av免费高清视频| 成人无遮挡网站| 99热这里只有是精品在线观看| 免费在线观看成人毛片| 天堂俺去俺来也www色官网 | 成人无遮挡网站| 嫩草影院精品99| 激情五月婷婷亚洲| 男插女下体视频免费在线播放| 午夜免费观看性视频| 身体一侧抽搐| 国产成人91sexporn| 最后的刺客免费高清国语| 国产成人aa在线观看| av黄色大香蕉| 国产伦一二天堂av在线观看| 精华霜和精华液先用哪个| 国国产精品蜜臀av免费| 男插女下体视频免费在线播放| 99热这里只有精品一区| 亚洲第一区二区三区不卡| 国产成人91sexporn| 天美传媒精品一区二区| 久久久久久久国产电影| 国产伦一二天堂av在线观看| 91午夜精品亚洲一区二区三区| 免费看a级黄色片| 欧美性感艳星| a级毛色黄片| 国产成人午夜福利电影在线观看| 欧美日韩精品成人综合77777| 搡老妇女老女人老熟妇| 国产黄色视频一区二区在线观看| 午夜激情福利司机影院| 欧美日本视频| 午夜福利高清视频| 美女黄网站色视频| 久久久久九九精品影院| 精品亚洲乱码少妇综合久久| 九九在线视频观看精品| 99久久精品热视频| 我的女老师完整版在线观看| 能在线免费看毛片的网站| 毛片女人毛片| 亚洲图色成人| 亚洲在线观看片| 亚洲欧美一区二区三区黑人 | 青青草视频在线视频观看| 深爱激情五月婷婷| 如何舔出高潮| 日韩成人伦理影院| 中文天堂在线官网| 中国国产av一级| 99久久精品国产国产毛片| 成年av动漫网址| 久久亚洲国产成人精品v| av免费观看日本| 亚洲av电影在线观看一区二区三区 | 久久久a久久爽久久v久久| 听说在线观看完整版免费高清| 综合色av麻豆| 国产精品嫩草影院av在线观看| 成人午夜精彩视频在线观看| 免费观看在线日韩| 草草在线视频免费看| 午夜福利视频1000在线观看| 亚洲精品乱码久久久v下载方式| 欧美日本视频| 精品国产露脸久久av麻豆 | 最新中文字幕久久久久| 国产一区二区亚洲精品在线观看| 日本一二三区视频观看| 欧美人与善性xxx| 五月伊人婷婷丁香| 卡戴珊不雅视频在线播放| 可以在线观看毛片的网站| 永久网站在线| 日韩三级伦理在线观看| 日韩欧美精品免费久久| 欧美高清性xxxxhd video| 国产视频内射| 国产精品久久久久久精品电影小说 | 三级国产精品欧美在线观看| av在线播放精品| 免费黄网站久久成人精品| 国产精品综合久久久久久久免费| 日韩 亚洲 欧美在线| 能在线免费观看的黄片| 亚洲精品中文字幕在线视频 | 天天一区二区日本电影三级| 日韩人妻高清精品专区| or卡值多少钱| 插阴视频在线观看视频| 日韩欧美国产在线观看| 国产一区二区三区av在线| 青青草视频在线视频观看| 51国产日韩欧美| 男女视频在线观看网站免费| 禁无遮挡网站| 日日摸夜夜添夜夜添av毛片| 精品久久久久久久久亚洲| 免费观看性生交大片5| 麻豆av噜噜一区二区三区| 亚洲色图av天堂| 亚洲欧美成人综合另类久久久| 国产av国产精品国产| 国产v大片淫在线免费观看| 三级国产精品欧美在线观看| 国产男人的电影天堂91| 最近2019中文字幕mv第一页| 免费少妇av软件| 91久久精品电影网| 夫妻午夜视频| 亚洲高清免费不卡视频| 最近最新中文字幕大全电影3| 身体一侧抽搐| 亚洲伊人久久精品综合| 午夜爱爱视频在线播放| 国产一区有黄有色的免费视频 | 国产淫语在线视频| 天堂中文最新版在线下载 | 伊人久久国产一区二区| 国产精品一区二区在线观看99 | 久久99蜜桃精品久久| 视频中文字幕在线观看| 一级爰片在线观看| 伦理电影大哥的女人| 久久这里只有精品中国| 国产精品女同一区二区软件| 2021少妇久久久久久久久久久| 日本一本二区三区精品| 亚洲成人精品中文字幕电影| 两个人视频免费观看高清| 国产乱人偷精品视频| 天天一区二区日本电影三级| 纵有疾风起免费观看全集完整版 | 免费少妇av软件| 日本-黄色视频高清免费观看| 午夜激情久久久久久久| 熟妇人妻不卡中文字幕| 成人毛片a级毛片在线播放| 啦啦啦中文免费视频观看日本| 天堂影院成人在线观看| a级一级毛片免费在线观看| 国产三级在线视频| 久久久久久久久大av| 国产 亚洲一区二区三区 | 26uuu在线亚洲综合色| 久热久热在线精品观看| 91aial.com中文字幕在线观看| 麻豆乱淫一区二区| 亚洲真实伦在线观看| 99热全是精品| 亚洲激情五月婷婷啪啪| 精品人妻熟女av久视频| 国产精品一区二区性色av| 免费观看性生交大片5| 高清视频免费观看一区二区 | 最近的中文字幕免费完整| 成人一区二区视频在线观看| 男女啪啪激烈高潮av片| 亚洲精品国产av成人精品| 99视频精品全部免费 在线| 亚洲婷婷狠狠爱综合网| 国产精品人妻久久久久久| 综合色av麻豆| 午夜免费男女啪啪视频观看| 色综合站精品国产| 成人亚洲精品av一区二区| 男人舔奶头视频| 好男人视频免费观看在线| 精品酒店卫生间| 日本爱情动作片www.在线观看| av在线亚洲专区| 国产精品国产三级国产av玫瑰| 国产精品一二三区在线看| 少妇熟女aⅴ在线视频| 日韩三级伦理在线观看| 亚洲av成人精品一区久久| 国产精品人妻久久久影院| 国产免费又黄又爽又色| 黑人高潮一二区| 午夜精品一区二区三区免费看| 国产一区二区三区av在线| 少妇人妻一区二区三区视频| 熟女人妻精品中文字幕| 精品熟女少妇av免费看| 亚洲综合精品二区| 最近中文字幕2019免费版| 视频中文字幕在线观看| 国产国拍精品亚洲av在线观看| 色综合站精品国产| 最后的刺客免费高清国语| 国产在线男女| 精品久久久久久久久av| 国产激情偷乱视频一区二区| 中文精品一卡2卡3卡4更新| 美女cb高潮喷水在线观看| 人妻制服诱惑在线中文字幕| 亚洲欧美日韩卡通动漫| 黄色配什么色好看| 视频中文字幕在线观看| 中文字幕久久专区| 久久久国产一区二区| 丝瓜视频免费看黄片| 精华霜和精华液先用哪个| 亚洲精品乱码久久久v下载方式| 26uuu在线亚洲综合色| 亚洲国产精品国产精品| 日本色播在线视频| 久久草成人影院| 国产 一区精品| 亚洲人成网站在线播| 色吧在线观看| 日韩电影二区| 日本猛色少妇xxxxx猛交久久| 国产色婷婷99| 日本猛色少妇xxxxx猛交久久| 在线播放无遮挡| 在线观看免费高清a一片| 国产熟女欧美一区二区| 亚洲人与动物交配视频| 国产一区二区三区av在线| 晚上一个人看的免费电影| 免费播放大片免费观看视频在线观看| 精品亚洲乱码少妇综合久久| 777米奇影视久久| 一级毛片aaaaaa免费看小|