• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于信任的托攻擊用戶檢測算法

      2020-11-12 11:10:40
      計算機應用與軟件 2020年11期
      關鍵詞:魯棒性信任算法

      張 鑫 黃 剛

      (南京郵電大學計算機學院 江蘇 南京 210000)

      0 引 言

      2018年,阿里巴巴的年營收是321.54億元人民幣,亞馬遜的年營收是177 866.0百萬美元,電子商務發(fā)展如此迅猛,協(xié)同過濾算法功不可沒。信息數(shù)量的爆炸式增長,使得用戶難以在海量的信息中,找到自己感興趣的商品。如何準確快速地定位用戶偏好的商品,從而對用戶進行推薦,成為推薦系統(tǒng)設計的首要目標。協(xié)同過濾算法[1-4]從相似的用戶和相似的項目角度出發(fā),分析項目之間和用戶之間的相似程度,找到用戶偏好的項目,可以在大數(shù)據(jù)的情境下,較為可靠地完成推薦任務。

      研究表明[5-7],數(shù)據(jù)稀疏性問題和托攻擊問題,對于推薦的準確度有較大的影響。為了緩解現(xiàn)實生活中用戶只評論少量的項目導致的數(shù)據(jù)稀疏性問題,研究證明[8-10],在推薦過程中,綜合考慮用戶添加的信任關系來改進用戶之間的相似度,往往可以獲得更好的推薦效果。

      基于信任的推薦算法,已經(jīng)有許多學者進行了研究,但是算法大多沒有考慮到托攻擊問題的影響。托攻擊問題指托攻擊用戶向推薦系統(tǒng)中注入虛假的評分信息,最終影響系統(tǒng)的推薦結果。如表1所示,托攻擊用戶X通過對項目1和項目2正常評分偽裝為正常用戶的鄰居用戶,對項目3實施托攻擊,使得項目3的評分上升。

      表1 托攻擊用戶對于項目進行惡意評分

      針對以上問題,本文提出一種信任網(wǎng)絡下的托攻擊用戶檢測算法TSAD,通過研究信任網(wǎng)絡下托攻擊的統(tǒng)計量特征檢測托攻擊用戶,提升系統(tǒng)的魯棒性。

      1 相關工作

      1.1 信 任

      1998年,Gambetta首次定義了信任[11],從社會學的角度出發(fā),敘述了信任的本質:如果我們信任某個人,就表明這個可信的人的行為有可能對我們有幫助,因此我們會考慮與其合作;相反地,如果我們不信任某個人,就表明這個人對我們沒有幫助甚至有害,因此我們不會考慮與其合作。信任包含以下性質:(1) 不對稱性,用戶A對于用戶B添加了信任關系,并不能說明用戶B也信任用戶A;(2) 傳遞性,如果用戶A對于用戶B添加了信任關系,用戶B又信任用戶C,可以得出用戶A在一定程度上信任用戶C;(3) 多樣性,根據(jù)信任的不同表現(xiàn)形式,可以分為直接信任、間接信任等;(4) 動態(tài)性,信任的程度會隨著時間等因素發(fā)生變化。

      針對以上性質,潘一騰等[12]提出了一種新的基于信任關系隱含相似度的度量方法,并與協(xié)同推薦算法相結合,提升了推薦質量;Wang[13]提出了一種基于改進D-S證據(jù)理論的多源屬性信任預測方法,通過七重交叉驗證方法驗證了屬性證據(jù)的充分性和信任預測結果,改善了推薦效果;Shabut等[14]提出了一種新的信任模型,該模型具有防御方案,利用聚類技術,動態(tài)地過濾不誠實的信任關系,增加了推薦的精度;林韶娟等[15]基于二值信任網(wǎng)絡,提出了GenTrust算法來預測新的信任關系,提升了原始信任網(wǎng)絡推薦的準確率。雖然上述算法都結合信任進行評分預測,但是都沒有考慮到托攻擊問題,導致系統(tǒng)的魯棒性較差。

      1.2 托攻擊

      協(xié)同過濾推薦系統(tǒng)中,系統(tǒng)根據(jù)每個用戶的鄰居的概貌信息為其生成推薦列表,因此惡意用戶可人為地向系統(tǒng)中注入大量虛假概貌,成為多個真實用戶的近鄰,進而達到影響推薦結果的目的,這種向推薦系統(tǒng)注入虛假概貌的行為即為托攻擊,2004年Lam等[16]首次正式提出了這個概念。托攻擊問題被提出之后,如何在推薦的過程中對于托攻擊進行檢測和抵御,成為了推薦領域中的又一重要課題。托攻擊方式主要分為兩種:提升攻擊項目排名的推攻擊;降低攻擊項目排名的核攻擊。圖1是托攻擊的一般結構[17]。

      圖1 托攻擊的一般結構

      圖1中,IS為選擇項目集合,IF為填充項目集合,it為攻擊項目集合。根據(jù)攻擊方式的不同,托攻擊又可以分為平均攻擊、隨機攻擊、混合攻擊等。由于本文實驗中采用的托攻擊方式為隨機攻擊,下面只對該方式進行介紹:選擇項目為空,評分為空,填充項目為隨機選擇,評分為該項目全局評分的臨近值,攻擊項目為要攻擊的目標,評分為最大值或者最小值。

      1.3 托攻擊用戶在信任網(wǎng)絡中的行為特征

      在含有用戶信任信息的推薦系統(tǒng)中,托攻擊方式有了以下行為特征[18-21]:

      1) 對稱性:托攻擊用戶為了使自身的評分有更高的可信性,往往會對其他托攻擊用戶添加信任關系。與正常的信任關系的非對稱性相比,其信任關系往往是雙向的,并且多個托攻擊用戶之間會形成區(qū)域性質的信任關系,如圖2所示。

      圖2 托攻擊用戶的對特征

      2) 偽裝性:托攻擊用戶為了隱藏自身的惡意評分,對正常用戶添加信任關系。另外,由于托攻擊用戶的評分對于正常用戶難以分辨,使得正常用戶也會對其信任,如圖3所示。

      圖3 托攻擊用戶的偽裝性

      3) 傳染性:多個托攻擊用戶對于同一個正常用戶添加信任,導致該正常用戶被檢測為托攻擊用戶。如果該正常用戶被多數(shù)正常用戶所信任,惡意的信任關系的添加會降低該用戶在信任網(wǎng)絡中的可信度,最終導致整體的評分失衡,如圖4所示。

      圖4 托攻擊用戶的傳染性

      2 統(tǒng)計量與TSAD算法描述

      根據(jù)1.3節(jié)中托攻擊用戶在信任網(wǎng)絡下的表現(xiàn)特征,與正常用戶的信任關系對比,提出以下統(tǒng)計量:信任集群等級TCL(Trust Cluster Level)、信任項目等級TPL(Trust Project Level)、信任相似度等級TSL(Trust Similarity Level)、全局一致度等級GCL(Global Consistency Level)。結合以上統(tǒng)計量計算,給出信任托攻擊檢測TSAD算法(Trust Shilling Attacks Detection)的相關描述。

      2.1 信任集群等級TCL

      該等級描述了信任網(wǎng)絡中的用戶彼此信任的“集群”程度。由于正常用戶A的信任關系呈現(xiàn)非對稱性,其信任的用戶往往不會有較大的交集。而托攻擊用戶的對稱性特征,導致彼此之間的信任關系形成一定的集群特征。對于該等級,定義如下:

      (1)

      式中:TA表示用戶A信任的用戶集合;TTA表示信任TA的用戶集合。對于托攻擊用戶的傳染性特征,式(1)一方面削減托攻擊用戶對于正常用戶添加信任的影響,另一方面正常用戶誤信任托攻擊用戶的影響也在公式中進行削減。以圖3為例,對于分子,托攻擊用戶X對正常用戶A信任時,托攻擊用戶X不會出現(xiàn)在用戶A信任的用戶集合中;對于分母,用戶A信任了托攻擊用戶X,但是由于托攻擊用戶X信任的托攻擊用戶集合Y,沒有被用戶A信任,不會參與計算。

      2.2 信任項目等級TPL

      為了欺騙正常用戶,托攻擊用戶會對填充項目進行評分,一方面成為正常用戶A的鄰居用戶,一方面對于目標項目進行最大最小值評分而改變評分預測。評分可以由托攻擊的隨機攻擊的特性得出。托攻擊用戶的評分物品數(shù)量幾乎相同且評分物品數(shù)目較多。而實際推薦情景中,正是由于用戶對于較少的物品評分,導致評分矩陣數(shù)據(jù)稀疏使得推薦不理想。利用托攻擊用戶的這一特征,定義TPL為:

      (2)

      式中:It表示用戶t評價的項目集合;IA表示用戶A評價的項目集合;NumberIA表示用戶A評價的項目集合的數(shù)目?,F(xiàn)實生活中,正常用戶A、B、C可能為同一個宿舍的同學,都只是評論了一個項目,并且其互相之間添加了信任關系。按照式(2)最終計算得到的三個正常用戶的TPL較高,該等級的設計目的應該是托用戶有較高的TPL??紤]到托用戶評分特點,改善式(2),定義式(3),作為TPL的判定。

      (3)

      式中:Numbermax為評分最多項目的用戶的評分項目總數(shù),實際上對NumberIA進行歸一化處理。對于正常用戶,由于其數(shù)據(jù)稀疏性,雖然評價了同一個商品,但是評論數(shù)量往往較少,通過調節(jié)參數(shù)φ和ω的大小,能夠適應不同信任情況的推薦情形,同時也降低正常用戶的TPL等級。

      2.3 信任相似度等級TSL

      托用戶攻擊方式,不論是托舉攻擊還是詆毀攻擊,對于填充項目都能取得項目的全局平均值,與正常用戶相比,尤其考慮正常用戶往往沒有過多的項目評分,所以兩者相似度不高。在信任網(wǎng)絡中,由于托攻擊用戶的相互信任行為和托攻擊的相似攻擊行為,導致其信任關系中的兩個用戶有很高的相似度。而不論正常用戶是否有信任關系,兩者的相似度都不會很高。利用托攻擊用戶的這個特征,定義TSL:

      (4)

      式中:simA,t為用戶A和用戶t的余弦相似度。

      2.4 全局一致度等級GCL

      部分托攻擊用戶不添加信任信息,對系統(tǒng)進行隨機攻擊,為了增加系統(tǒng)抵御該種托攻擊方式的魯棒性,提出全局一致度等級GCL,定義如下:

      (5)

      2.5 TSAD算法描述

      算法主要分為信任網(wǎng)絡中的托用戶判斷和未添加信任信息的托用戶判斷兩個部分。

      1) 信任網(wǎng)絡中的托用戶判斷。首先計算信任網(wǎng)絡的統(tǒng)計量TCL、TPL、TSL,將每個統(tǒng)計量大于各自閾值α、β、γ的用戶加入托攻擊用戶集合。在添加之后,在托攻擊用戶集合中的用戶,滿足以下條件:信任關系中有較大的“集群”,評論了較多的項目且信任關系的用戶共同評分的項目較多,信任關系中的用戶與自身有較高的相度??梢哉J為,此時集合中的用戶是添加了信任信息的托攻擊用戶。

      算法步驟如下:

      1. 將用戶分為托攻擊用戶集合attackUser和正常用戶集合normalUser,初始化為空。

      2. 在信任關系數(shù)據(jù)集中,計算每一個有信任關系用戶的TCL、TPL、TSL。

      3. 將TCL>α,TPL>β,TSL>γ的用戶添加到attackUser集合中。

      6. 算法結束,attackUser集合中的用戶為檢測出的托攻擊用戶。

      3 仿真實驗

      3.1 實驗數(shù)據(jù)集

      本次實驗的數(shù)據(jù)采用含有信任信息的Eponions數(shù)據(jù)集[22-23],數(shù)據(jù)集包含49 290位用戶,139 738個不同的項目,664 824條評分記錄和487 181條信任記錄。數(shù)據(jù)集包含兩個文件,用戶評分數(shù)據(jù)ratings_data.txt.bz2和用戶信任關系數(shù)據(jù)trust_data.txt.bz2。用戶評分數(shù)據(jù)格式:user_id item_id rating_value,例如:3 12 5。用戶信任關系數(shù)據(jù)格式:source_user_id target_user_id trust_statement_value,例如:22633 12220 1。

      3.2 實驗環(huán)境

      系統(tǒng):Ubuntu。軟件:Java,Spark,Hadoop。內存:16 GB。CPU:4核。編程語言:Scala,Java。

      3.3 評價標準

      托攻擊用戶檢測率:該項反映了不同攻擊程度下,算法對于托攻擊的檢測效果,衡量了系統(tǒng)的魯棒性。定義如下:

      (6)

      由于托攻擊的目的就是將項目的評分拉高或者降低,最終達到提高推薦或者減低推薦的目的。采用該標準來檢測對比的兩種算法與文本算法在受攻擊時的抵抗攻擊程度。該值越小,說明托攻擊未能對攻擊項目的評分加以影響,算法的魯棒性更好。定義如下:

      (7)

      3.4 實驗結果及分析

      本次實驗對比的對象是協(xié)同過濾算法和林韶娟等[15]提出的基于二值信任網(wǎng)絡的推薦算法。托攻擊方式選擇隨機攻擊的托舉攻擊,在信任信息數(shù)據(jù)集中,人為地增加托攻擊用戶的信任關系,其信任關系為雙向的,人數(shù)數(shù)量為50,編號范圍為50000-50050,并且對于正常用戶隨機的對編號50000-50050的托攻擊用戶添加信任關系。在用戶評分數(shù)據(jù)中,人為地增加托攻擊用戶,人數(shù)數(shù)量為50,編號范圍為50051-50100。采取隨機攻擊的方式,按照不同的填充大小和攻擊大小,增加托用戶的評分信息。

      對于原始數(shù)據(jù)集,采用協(xié)同過濾和基于信任的推薦算法,得到結果數(shù)據(jù);對于添加了托用戶攻擊的數(shù)據(jù)集,采用協(xié)同過濾和基于信任的推薦算法,得到結果數(shù)據(jù);使用TSAD算法進行托用戶檢測之后,對正常用戶集合采用協(xié)同過濾和基于二值信任網(wǎng)絡的推薦算法,得到結果數(shù)據(jù)。實驗結果如下:

      圖5為不同填充大小、不同攻擊大小下的托攻擊用戶檢測率。在填充大小和攻擊大小都為0.10%的情況下,由于托攻擊用戶的特征不夠明顯,此時一小部分正常用戶由于也具有較高的TCL、TPL、TSL,而被加入托用戶集合。而當填充大小和攻擊大小的數(shù)量上升到1.00%時,正常用戶已經(jīng)很難獲得較高的TCL、TPL、TSL,而不會被誤加入托攻擊用戶集合。

      圖5 不同填充大小、不同攻擊大小下的托攻擊用戶檢測率

      圖6為未使用TSAD算法的協(xié)同過濾算法的受攻擊項目的攻擊程度,填充項目在評分數(shù)大于3且評分為3的項目集合中選擇100個項目,攻擊大小分別為5、10、20??梢钥吹剑捎谔畛漤椖康脑u分與正常用戶的評分一致,使得托攻擊用戶與每一個用戶都擁有很高的相似度,在相似用戶中排名靠前。并且托攻擊用戶的平均評分接近正常評分,在預測評分公式中,對于攻擊項目得到更高的評分,算法對于托攻擊用戶抵御較差。

      圖6 未使用TSAD算法的協(xié)同過濾算法的受攻擊項目的攻擊程度

      圖7為基于二值信任網(wǎng)絡算法的受攻擊項目的攻擊程度,該算法在預測評分時采用了用戶之間的信任度,而信任度是根據(jù)信任用戶的個數(shù)計算的。為了方便比較,依然采用協(xié)同過濾算法時的填充大小和攻擊大小??梢钥吹?,雖然二值網(wǎng)絡算法使用信任值增強了推薦的精確性,但由于實驗數(shù)據(jù)集中,人為增加正常用戶對于托攻擊用戶的信任關系,導致托攻擊用戶在用戶預測評分計算時,信任值較高較大,使得最終的受攻擊項目預測評分依然有較大的偏差,無法較好地消除托攻擊用戶的影響。

      圖7 基于二值信任網(wǎng)絡算法的受攻擊項目的攻擊程度

      圖8為TSAD算法檢測之后的受攻擊項目的攻擊程度,由于填充大小較少,修正TPL計算中項目數(shù)量的權重,將φ增大,ω減小,使得托攻擊用戶即使擁有較少的總評分項目數(shù),依然會有較大的TPL,會被算法檢測為托攻擊用戶,加入到托攻擊用戶集合中。與之前的實驗結果對比,說明在推薦的過程中,對于托攻擊用戶進行檢測,TSAD算法能夠提升推薦系統(tǒng)的準確率,增強系統(tǒng)的魯棒性。

      圖8 TSAD算法檢測之后的受攻擊項目的攻擊程度

      4 結 語

      在包含信任信息的推薦情景下,為了增加系統(tǒng)的魯棒性,本文從抵御托攻擊的角度提出信任網(wǎng)絡下的托攻擊用戶檢測算法TSAD。通過分析信任網(wǎng)絡下托攻擊用戶的行為特征,提出信任網(wǎng)絡下的不同托攻擊檢測統(tǒng)計量,以檢測隱藏在正常用戶集合中的托攻擊用戶。經(jīng)過實驗的驗證,在使用本文的TSAD算法檢測過濾到托攻擊用戶之后,對于協(xié)同過濾等易受托攻擊的算法,均能較好地抵御托攻擊用戶的托舉攻擊或者詆毀攻擊。但是,由于托攻擊手段的復雜性,往往在實際的托攻擊情況中,多種攻擊方式混合使用。此情境下,本文提出的統(tǒng)計量可能不能準確檢測出托攻擊用戶,需要多種統(tǒng)計量來作為衡量維度或者綜合機器學習等知識去檢測。即便如此,TSAD算法也增加了信任網(wǎng)絡下推薦系統(tǒng)對于隨機攻擊托攻擊方式的魯棒性。面對更加復雜的托攻擊手段,希望本文能給其他學者解決問題提供一些思路。

      猜你喜歡
      魯棒性信任算法
      荒漠綠洲區(qū)潛在生態(tài)網(wǎng)絡增邊優(yōu)化魯棒性分析
      基于MapReduce的改進Eclat算法
      Travellng thg World Full—time for Rree
      基于確定性指標的弦支結構魯棒性評價
      中華建設(2019年7期)2019-08-27 00:50:18
      表示信任
      進位加法的兩種算法
      嚶嚶嚶,人與人的信任在哪里……
      桃之夭夭B(2017年2期)2017-02-24 17:32:43
      從生到死有多遠
      基于非支配解集的多模式裝備項目群調度魯棒性優(yōu)化
      一種改進的整周模糊度去相關算法
      永康市| 南陵县| 龙门县| 新野县| 平和县| 河北区| 郎溪县| 原平市| 平凉市| 郓城县| 定南县| 邓州市| 南安市| 阿坝县| 洪湖市| 德钦县| 高碑店市| 万宁市| 青神县| 桐梓县| 莱西市| 望江县| 恩施市| 文化| 那曲县| 米泉市| 咸阳市| 岑溪市| 板桥市| 荔浦县| 宜阳县| 额尔古纳市| 板桥市| 仙居县| 寻乌县| 福鼎市| 陇川县| 广饶县| 图们市| 沁源县| 南平市|