馬海燕 梁永全 紀淑娟 李 達
1(山東科技大學計算機科學與工程學院 山東青島 266590) 2(山東省智慧礦山信息技術(shù)重點實驗室(山東科技大學) 山東青島 266590)
隨著電子商務的快速發(fā)展,購物變得越來越方便,但信用缺失問題也越來越嚴重.雖然電子商務系統(tǒng)設(shè)置了信譽排名和推薦機制,為個體消費者在選擇誠信賣方方面提供輔助的決策支持.然而,一些賣方不斷采取欺騙、偽裝、漂白、共謀、歧視等策略構(gòu)造虛假評價操控信譽排名和推薦排名,進而誤導消費者[1-2].職業(yè)刷手已經(jīng)成為一個黑色產(chǎn)業(yè)[3].
為了解決這些問題,一些學者提出通過設(shè)計個人購物助理(agent)并基于個人購物經(jīng)驗和消費者之間的信任關(guān)系從其社交網(wǎng)絡中選擇一些可信評價者,然后基于這些可信評價者的評價計算賣方可信度[4-15].與現(xiàn)有基于信任和不信任信息的算法相同,本文認為電子商務環(huán)境中人與人之間的關(guān)系既有信任關(guān)系也有不信任關(guān)系.消費者不僅可以維護一個最信任的朋友(白名單)列表,還可以維護一個最不信任的評價者(黑名單)列表.例如yelp平臺就為每個消費者提供了白名單和黑名單2個列表功能.隨著買方購物經(jīng)驗的積累,其白名單與黑名單不斷地被更新和進化.此外,心理學的研究結(jié)果[16]還表明一個人對另一個人的信任程度取決于后者的可信性和不可信性2個方面.當被信者的可信性大于不可信性時,施信者認為被信者可信,否則認為不可信.基于以上2種觀點,本文提出了一種基于信任與不信任的虛假信譽防御策略(簡稱T&D).與已有基于信任信息的虛假信譽防御策略[4-6,9-13,17-18]不同,該策略同時考慮了用戶之間的信任關(guān)系和不信任關(guān)系,并用不信任關(guān)系凈化信任關(guān)系;與已有基于信任和不信任信息的策略[11,15,19]不同,該策略通過黑名單和白名單分別記錄每個消費者最信任和最不信任的評價者,同時考慮評價者的可信性和不可信性2個屬性,依據(jù)人類可信性感知增長較慢、不可信感知增長較快的特點設(shè)計了可信性和不可信性融合為信任值的融合算法.模擬實驗結(jié)果顯示:刷單比例比較小的時候,現(xiàn)有方法能有效地抵御各種攻擊;刷單比例非常大時,現(xiàn)有防御策略在抵御女巫攻擊和融合女巫的復合攻擊的穩(wěn)定性存在一定局限性,明顯不如本文所給防御策略.
以檢測和過濾為手段的信譽攻擊防御方法可以分為2類:基于個體消費者視角的信譽攻擊防御方法[4-6]和基于電子商務平臺視角的信譽攻擊防御方法[7].由于本文的方法屬于基于個體消費者視角的方法,因此,本節(jié)僅介紹一些基于個體消費者視角的虛假信譽攻擊檢測方法.
人們一致認為信任是指一個人相信他人的行為跟其預期的一樣[8].基于信任信息,人們設(shè)計了許多虛假信譽防御模型,例如BRS[9],iCLUB[10-11],TRAVOS[12],Referralchains[13,17],Personalized[6],MET[4], PEALGA[5],GTETM[18],這些模型大致可以分為過濾方法、折扣方法和進化方法3類.
過濾方法由Dellarocas[20]提出,其目的是通過聚類過濾模型[21]降低不公平的高分和正面歧視(positive discrimination)對信譽評價的影響.雖然該算法可以很好地過濾出不公平的高分,但是它不能處理用戶惡意給商品的低分.此外,聚類過程僅考慮了買方的打分值.基于J?sang等人[22]提出的beta信譽系統(tǒng)、Whitby等人[9]給出了一種重復過濾算法BRS,由于BRS算法是在“少數(shù)服從多數(shù)原則”的基礎(chǔ)上構(gòu)建的,因此BRS算法只有當大多數(shù)打分是公平的情況下才有效.Liu等人[10-11]提出了另一種聚類算法iCLUB,它根據(jù)買方與目擊者(誠實或者不誠實的評價者)之間的相似性把買方劃分為不同的社團(clubs).因此,當大多數(shù)目擊者是不誠實的(女巫(sybil)攻擊)時候,iCLUB算法的抵御能力會大大降低.
Yu等人[13,17]提出了一種折扣方法Referralchains,該方法應用加權(quán)多數(shù)技術(shù)實現(xiàn)了不同信任信念的聚合.然而,“初始信任值為1”這一設(shè)置使得漂白攻擊者可以通過不斷重新注冊賬號來漂白自己的低信譽歷史.Teacy等人[12]給出了一種融合信任與置信度的算法TRAVOS實現(xiàn)評價者評估.有些情況下(例如買方與評價者所評價賣方的交易經(jīng)驗很少)TRAVOS中的信任加權(quán)方法不能最大程度地懲罰不誠實評價者.此外,“評價者行為是一致的”這一假設(shè)使得TRAVOS算法容易遭受偽裝攻擊.與前面2種策略不同,Zhang等人[6]提出的折扣策略Personalized主要基于折扣的私有信任和公有信任評價買方的可信度和賣方的可信度.
2013年,Jiang等人[4]提出了一種進化折扣算法MET.應用該策略,每個買方首先獲得自己的社交網(wǎng)絡,然后基于該買方對社交網(wǎng)絡成員的信任值進化一個“可信評價者列表”.雖然文中實驗證明了該算法能很好地抵御各種攻擊,然而其在抵御包含女巫的各種攻擊時性能不是很理想.這是因為“可信評價者列表”中的成員不一定與每個賣方都有很多的交易經(jīng)驗,因此導致“利用進化得到的消費者可信評價者列表評估所有賣方的可信度”這一思想在賣方信譽評估時缺乏針對性.此外,該模型忽略了評價者打分的時效性,有可能“可信評價者列表”成員在很久之前曾經(jīng)與賣方交易過,考慮到賣方的誠信行為可能會變化,因此這些“可信評價者列表”所給評價的可信度下降,評價的參考價值也就會大大降低.針對該算法的局限性,Ji等人[5]提出了一種預進化“最優(yōu)可信評價者列表”的方法.該方法為每個買方設(shè)置一個可信朋友列表,基于該列表,為每個候選賣方預進化一個有針對性的“最優(yōu)可信評價者列表”并利用這些評價者對相應賣方的評價和這些評價者的可信度折扣計算每個賣方的可信度.當交易賣方選中之后,再根據(jù)交易賣方的預進化最優(yōu)可信評價者列表更新該買方的可信朋友列表.該算法能非常好地抵御包含女巫攻擊在內(nèi)的各種攻擊,算法穩(wěn)定性也較前面算法有很大提高.
社會心理學研究結(jié)果[14]表明現(xiàn)實生活中人對其他人的可信度評估往往來源于可信和不可信2個方面,且同時考慮可能會更準確.因此,一些研究者試圖把不信任因素融合到信任中[23-24]評估買/賣方的可信度.例如Liu等人[15]提出了一個反網(wǎng)絡垃圾的框架.他們認為每個頁面既有好的方面,也有壞的方面,因此給每個頁面賦予一個GoodRank值、一個BadRank值,分別表示頁面的可信度和不可信度(垃圾或者被垃圾頁面操控的程度).基于此,他們給出了由好/壞種子頁面?zhèn)鞑ood-Bad Rank值(GBR)的算法,在該算法中,一個頁面的GoodRank值被其BadRank值懲罰,BadRank值被GoodRank值弱化.GBR算法比其他經(jīng)典的反垃圾算法性能都要好.然而,GBR算法的性能對種子的依賴性非常強.當種子集合非常小(小于訓練集合)時,GBR算法的過濾準確性較差.人工地獲取大量的種子集合是非常耗時的,因此,很難平衡種子頁面大小和時間復雜性.
Liu等人[11]提出了一種基于社交網(wǎng)絡中信任與不信任信息的統(tǒng)一排序機制,該機制基于一個類似于PageRank的模型抵御女巫攻擊.它首先提出一個簡單有效的方法生成一些已經(jīng)融合了當前社會網(wǎng)絡中反女巫模式的女巫種子.然后,為了提升這些方法對目標攻擊的抵御能力,他們應用局部結(jié)構(gòu)相似性引入了一個基于相似度的圖修剪技術(shù).最后,基于一個PageRank算法變種給出了一個基于信任與不信任因素的排序機制,并計算社交網(wǎng)絡中結(jié)點的可信度.該方法在社交網(wǎng)絡中女巫檢測方面優(yōu)于其之前的算法;然而,在面臨其他攻擊時,抵御能力明顯不足.
為了提高推薦系統(tǒng)的性能,F(xiàn)ang等人[19]提出了一個基于信任與不信任信息的框架,它考慮了社會科學中的信任與不信任信息[24],如人際方面(基于用戶歷史打分建模的仁愛、能力、正直、預見性等屬性)和客觀方面(從信任網(wǎng)絡中社會聯(lián)系提取的度中心性)信息.在此框架的基礎(chǔ)上他們設(shè)計并訓練了2個邏輯回歸模型,用于預測用戶的信任和不信任值,并利用預測的不信任信息精煉信任信息.新生成的信任值被應用于基于信任的推薦算法中.實驗結(jié)果顯示該框架能有效提高現(xiàn)有基于信任的推薦算法性能.由于該模型考慮了太多因素,引入了大量冗余和噪聲信息,因此該框架在抵御女巫和漂白攻擊方面的性能不是很突出.
本文給出了一個含有白名單和黑名單機制的多agent電子商務平臺框架,如圖1所示.該框架包含3種agent,即買家agent、賣家agent和搜索agent.每一個買家agent維護一個白名單列表(存儲他最信任的評價者)、一個黑名單列表(存儲他最不信任的評價者)、一個歷史交易記錄列表(存儲與其有過交易的賣家集合,如圖1中左側(cè)矩形框中的內(nèi)容所示).在平臺中,當買家bi提交購買需求后,搜索agent選擇一些滿足買家購買需求的賣家以及這些賣家的評論者列表(圖1中右側(cè)矩形框中的內(nèi)容)一起反饋給買家bi.
Fig. 1 A framework for electronic commerce platform with whitelist and blacklist mechanism圖1 一種含有白名單和黑名單機制的電子商務平臺框架
面對搜索agent推薦的賣方,買方bi需要根據(jù)自己的經(jīng)驗和評論者提供的信息對每一個被推薦的賣方進行信譽評估,選擇信譽值最高的賣方進行交易.遺憾的是,有一些評論者是不誠實的,他們會提供一些虛假的評分、評論.因此,買方bi首先必須對每一個評論者的信譽進行評估.對于評論者A,如果bi與A有足夠多的共同交易經(jīng)驗,則bi根據(jù)自己的經(jīng)驗對A進行信譽評估;否則,bi需要求助于可以信任的買方(通過白名單、黑名單構(gòu)建社交網(wǎng)絡,利用社交網(wǎng)絡中信任和不信任的傳播,找到可以信任的買方集合)對A進行信譽評估.對每一個評論者的信譽進行評估后,買方bi針對每一個賣方選擇一個顧問團列表(根據(jù)信譽度由高到低對評論者排序,從中選擇若干個最可信的作為顧問),基于這些顧問的可信度以及這些顧問對賣方的評價可以計算賣方的信譽.買方bi與信譽度最高的賣方進行交易后,根據(jù)自己的交易體驗對該賣方進行打分.同時,買家bi也會根據(jù)此次交易經(jīng)驗更新自己的白名單和黑名單列表.表1列出了含黑白名單機制的電子商務平臺框架中用到的所有符號及它們所表示的含義.
為了界定本文研究范疇,綜合考慮模型框架以及B2B電子商務的特點,本文假設(shè)在具有白名單和黑名單機制的電子商務平臺中,采取各種防御策略的agent都遵循以下假設(shè):
假設(shè)1. 買方更傾向于相信那些與自己有過近似觀點的買方.經(jīng)驗不足的買方會向其他買方求助.買方更傾向于相信那些與自己評分相似度高的個體.
假設(shè)2. 評分的權(quán)重隨著時間的增加而減小,評分所給出的時間越近,越能反映信譽的真實性,對于賣方的信譽值計算也越有意義.
假設(shè)3. 買方之間沒有競爭關(guān)系,樂于分享自己的經(jīng)驗、白名單列表和黑名單列表.
假設(shè)4. 買方在選擇交易賣方時只考慮信譽的影響,不考慮價格、質(zhì)量、外觀等其他因素.
4) 交易完成后,買方bi根據(jù)交易體驗對交易賣方進行打分,更新自己的黑名單列表和白名單列表(詳見算法4).
下面詳細介紹以上各步驟的實現(xiàn)原理和細節(jié).
采用T&D策略的買方agent的信任網(wǎng)絡是在其社交網(wǎng)絡的基礎(chǔ)上構(gòu)建的,而其社交網(wǎng)絡是在其白名單和黑名單基礎(chǔ)上構(gòu)建的.由于“六度分割”理論宣稱“世界上的任意2個人都可以通過至多6個人聯(lián)系起來”,因此,本文限制社會網(wǎng)絡的距離最大長度為6.例1直觀地解釋了網(wǎng)絡的構(gòu)建過程.
例1. 假設(shè)存在一個包含{b1,b2,b3,b4,b5,b6,b7,b8,b9}九個agent的社交網(wǎng)絡,其中b1是誠實agent.如果b2,b3,b4存在于b1的白名單(信任列表)中,b5,b6存在于b2的白名單中,b7同時存在于b3的白名單和b6的黑名單(不信任列表)中,b8同時存在于b5的白名單和b6的黑名單中,b9同時存在于b7的白名單和b4的黑名單中.每個沒有說明的買方的黑名單和白名單都是空的.信任用實線表示,不信任用虛線表示,我們可以得到一個如圖2所示的社交網(wǎng)絡.
Fig. 2 An example of social network with trustdistrust relationships圖2 帶信任不信任關(guān)系的社交網(wǎng)絡實例
社會網(wǎng)絡中信任與不信任的傳播與人類“口碑”傳播原理相同[25].J?sang等人[26]認為“一旦一個agent收到了既有信任和不信任的沖突推薦信任,它需要采用一些方法來融合這些沖突的推薦”.基于這些社會科學研究結(jié)果和社交網(wǎng)絡信息[27],本文給出了2條規(guī)則,定義如何在沖突推薦信任中確定信任與不信任.
規(guī)則1.如果一個agent同時被相同層次的多個agent信任或者不信任(即同時屬于同一層次上多個agent的白名單和黑名單),則該agent的可信性不確定.
規(guī)則2.如果一個agent同時被處于不同層次的多個agent信任或者不信任(即同時屬于不同層次上多個agent的白名單和黑名單),則該agent的可信性由其上層agent對其信任與否決定.如果層次最小的上層agent信任它,則認為其可信;否則,認為是其不可信.
規(guī)則對應的實現(xiàn)算法如算法1所示,其時間復雜度為O(|depthLimit(|Qt|+|Qd|)|).運行算法1就可以得到如圖3所示的信任網(wǎng)絡.如果僅考慮社交網(wǎng)絡中的信任信息[4-5,13-14],則圖2中從b1出發(fā)的所有信任鏈中的結(jié)點b2,b3,b4,b5,b6,b7,b8,b9將全部被選入信任網(wǎng)絡中.因此,與已有信任網(wǎng)絡構(gòu)建方法[4-5,13,17]相比,算法1實質(zhì)是利用不信任信息進一步凈化了信任信息,即把那些不太可信的agent從信任網(wǎng)絡中剔除掉了.
Fig. 3 The trust network obtained from Fig.2圖3 從圖2得到的信任絡網(wǎng)
算法1. 網(wǎng)絡凈化算法.
輸入:買方集合B={bi|i=1,2,…,m}、買方bi的白名單和黑名單、3個助理空隊列Qt,Qd,Tbi、鏈長depthLimit;
① 將bi白名單中的agent加入Qt,黑名單中的agent加入Qd;
② while (Qt≠NULL且Depth do ③ for eachbkinQt ⑥ end if ⑦ end for ⑧ for eachbkinQd 定義1. 買方bi和買方bk的相似度. 1) 如果他們有過共同交易賣方,則相似度為 (1) 2) 如果他們沒有過共同交易賣方,則相似度為 (2) 定義2. 買方bi對買方bk的可信性和不可信性2個方面的更新值. (3) (4) 其中,Rbi,T(bk)∈[0,1]表示買方bi對買方bk可信性的評價,Rbi,D(bk)∈[0,1]表示買方bi對買方bk不可信性的評價;ω∈(0,1)用于控制信任值和不信任值是正增長、負增長還是不變;β1和β2用于控制信任值和不信任值增長的速度且0<β2<β1<1. 約束β2<β1旨在保障信任值的上升速度小于不信任值的上升速度,信任值的下降速度大于不信任值的下降速度.這一點符合Smith等人[28]關(guān)于“信任來源于被信任對象的可信性程度和不可信性程度,且人們對負面信息的關(guān)注度高于他們對正面信息的關(guān)注度”的研究結(jié)果. 為了更便于評估買方可信性,本文把二維的可信性和不可信性融合為一個綜合可信度(記做STDbi(bk)),其原理如圖4所示: Fig. 4 Construction principle of synthesized trustworthiness圖4 綜合信任度的構(gòu)建準則 定義3. 買方bi對買方bk的綜合信任度.可以通過融合bi感知的bk可信性和不可信性得到: (5) 其中,Rbi,T(bk)∈[0,1]表示買方bi感知的bk的可信性,Rbi,D(bk)∈[0,1]表示買方bi感知的bk的不可信性;θ1(0<θ1<1)和θ2(0<θ2<1)表示2個評估閾值且θ1>θ2. 算法2. 基于信任—不信任融合的最優(yōu)顧問列表生成算法. ③ if (bi和bk有共同交易) ④ 按式(1)計算bi和bk的相似度; ⑤ else ⑥ 按式(2)計算bi和bk的相似度; ⑦ 按式(3)(4)更新Rbi,T(bk),Rbi,D(bk); ⑧ end if ⑨ 按式(5)計算STRbi(bk); ⑩ end for 當買方bi面對系統(tǒng)推薦的多個賣方時,如果其他屬性(如價格、質(zhì)量等因素)相同,該買方將選擇信譽值最高的賣方進行交易.因此,買方bi必須具有準確評估賣方信譽值的能力. (6) (7) (8) (9) 其中: (10) (11) 算法3給出了賣方信譽值的計算方法,該算法的時間復雜度為O(Scandidate). 算法3. 賣方信譽計算算法. ④ else ⑥ end if ⑨ end for 為了驗證T&D策略的性能,本文實現(xiàn)了基于多agent的電子商務實驗平臺.基于該平臺,設(shè)計了一套實驗旨在檢驗算法的穩(wěn)定性,具體涉及2個方面:1)買方可信性和不可信性感知增長速度變化對各種攻擊抵御能力(健壯性)穩(wěn)定性的影響;2)不誠實買家比例變化對各種攻擊抵御能力(健壯性)穩(wěn)定性的影響. 算法4. 白名單、黑名單更新算法. 輸出:WLbi,BLbi. ② 選擇WLbi中選擇綜合值最小的買方bm; ③ if (STDbi(bk)>STDbi(bm)) ④ 將bm從WLbi中刪除,將bk加入WLbi; ⑤ end if ⑥ 選擇BLbi中綜合值最大的買方bm; ⑦ if (STDbi(bk) ⑧ 將bm從BLbi中刪除,將bk加入BLbi; ⑨ end if ⑩ end for 實驗中選擇了6種攻擊策略(一直攻擊(always unfair)、偽裝攻擊(camouflage)、女巫攻擊(sybil)、漂白攻擊(whitewashing)、女巫-偽裝聯(lián)合攻擊(sybil&camouflage)、女巫-漂白聯(lián)合攻擊(sybil& whitewashing))不斷地攻擊信譽系統(tǒng).為了驗證本文防御策略的性能,本文選擇了4種典型的防御策略(MET[4],PEALGA[5], GBR[15], Multi-faceted[19])與之比較.本文設(shè)計了天真策略(naive strategy)和上帝策略(oracle strategy)這2種防御策略作為比較基準,越接近上帝策略防御性能越好,越接近天真策略防御性能越差.此外,還設(shè)計了一個T&D_S策略算法.與T&D策略不同的是:在T&D_S策略中,所有的賣方都用一個顧問團列表進行評估.以上攻擊和防御策略的基本思想在表2中進行了簡要說明. 表3詳細說明了論文中多agent攻防模擬平臺中的參數(shù)設(shè)置,其中用不同比例10%~50%的不誠實買方模擬不同的市場配置.包含女巫攻擊的3種攻擊下,不誠實的比例則擴大為50%~90%. 表4詳細說明了本文策略涉及參數(shù)的實驗設(shè)置.θ1,θ2,ω這3個參數(shù)的設(shè)置根據(jù)常識獲得.實驗過程中,所有買方的初始值黑名單、白名單全部隨機生成,對其他買方的可信性和不可信性感知也是隨機生成[0,1]范圍內(nèi)的值. Table 2 The Attack and Defense Strategy Used in the Experiment表2 實驗中使用的攻擊與防御策略 Table 3 Parameter Settings in Reputation Attack and Defense Simulation Platform表3 信譽攻防模擬平臺中參數(shù)設(shè)置 Table 4 Parameter Settings in T&D Strategy表4 T&D策略中的參數(shù)設(shè)置 Continued (Table 4) 為了便于比較,本文仍然沿用算法MET[4]中定義的“健壯性”來評估每一個防御模型的性能.健壯性直觀地反映了防御算法的抗攻擊能力,下面給出了健壯性的定義. 定義7. 健壯性.是反映防御方法的抗攻擊能力的標準,其計算方法為 (12) 其中,Def表示使用的防御策略,Atk表示使用的攻擊策略,R(Def,Atk)表示在攻防轉(zhuǎn)化過程中得到的健壯性,Tran(sH)表示誠實壟斷賣方的交易量,Trans(sD)表示不誠實壟斷賣方的交易量,BH表示誠實買方的數(shù)量,Days表示總的交易天數(shù),Ratio表示壟斷賣方被選擇交易的概率. 本文考慮了模型參數(shù)、市場配置和不信任信息3個因素對穩(wěn)定性的影響.下面詳細介紹這3個方面對防御策略的穩(wěn)定性分析實驗結(jié)果. 4.3.1 模型參數(shù)對穩(wěn)定性的影響 本文對4.1節(jié)實驗設(shè)置中的所有組合(5種不誠實買方比例(35種β1,β2組合)進行了實驗.由于實驗結(jié)果過多,下面僅列出一些典型的市場配置(4個不誠實與36個誠實買方(不誠實比例10%),16個不誠實與24個誠實買方(不誠實比例40%),16個不誠實與24個誠實買方(不誠實比例60%),36個不誠實與4個誠實買方(不誠實比例90%))下各種β1,β2組合參數(shù)下的健壯性結(jié)果.前2種市場配置下的實驗結(jié)果如表5所示,后2種市場配置下的實驗結(jié)果如表6所示.這2個表中符號“±”之前的數(shù)字表示健壯性的均值,“±”之后的數(shù)字表示均方差,取值范圍為[0,1].均值越大、均方差越小,防御策略的健壯性越好. Table 5 The Comparison About Robust of Defending Strategies (Excluding Sybil Attacks)表5 各防御策略的健壯性比較(不含女巫攻擊) Continued (Table 5) 由4.1節(jié)可知采用Oracle策略的agent可以洞察系統(tǒng)中所有用戶的真實信譽,可以準確地區(qū)分誠實個體和不誠實個體.所以,如果其他防御策略的健壯性越接近Oracle策略的健壯性,則防御性能越好.由表5可知,在2種市場配置下:不誠實買方比例比較小的市場(4個不誠實買方與36個誠實買方,不誠實買方比例為10%)和不誠實買方比例比較大的市場(16個不誠實買方與24個誠實買方,不誠實買方比例為40%),各種防御策略基本上都具有比較好的防御效果.由于在以上2種市場配置中,誠實的買方的數(shù)量都占多數(shù),不誠實買方數(shù)量占少數(shù),所以誠實買方起主導作用,不誠實買方的影響力較小,進而所有的防御策略基本上都能較好地完成防御任務. 由表5可以看出: 1) T&D策略在應對不含Sybil的攻擊時,其防御能力幾乎不受β1,β2值變化影響,也不受不誠實評論者比例的影響(不誠實買方的比例為10%和40%時的健壯性幾乎相同(0.96左右)). 2) T&D_S策略(一個顧問列表的情況)在應對不含Sybil的攻擊時,其防御能力也不受β1,β2值和不誠實比例變化影響,且健壯性與TDFDS策略(多個顧問列表時)的相似(0.96左右). 3) PEALGA策略與本文提出的防御策略具有相似的健壯性(0.96左右)且都不隨不誠實比例增加而降低. 4) MET策略和GBR策略在不誠實比例小于50%時,非常擅長抵御不含Sybil的攻擊,其健壯性大約高出本文提出的策略和PEALGA策略2個百分點. 5) Multi-faced策略不擅長抵御Camouflage和Whitewashing攻擊,且對這2種攻擊的抵御能力受不誠實買方比例變化的影響非常大(健壯性從10%的0.93和0.91降到40%的0.80和0.67).很多情況下,Multi-faced策略的抵御能力甚至不如naive策略.例如當不誠實買方的比例為10%時,Multi-faced策略在Camouflage和Whitewashing這2種攻擊下的健壯性分別為0.93,0.91,比naive攻擊下的0.98,0.98都要小. 由表6可觀察到4種現(xiàn)象: 1) T&D策略.當不誠實買家比例為60%時,在包含Sybil的3種攻擊下得到的健壯性幾乎相同,且不隨β1,β2取值變化而變化.但是,當不誠實買家比例為90%時,在包含Sybil的3種攻擊下,健壯性會隨著β1,β2取值不同,出現(xiàn)較小波動(在±0.1之間),但無法確定最優(yōu)的β1,β2取值.相比之下,不誠實買家比例為90%時,在Sybil&Camouflage攻擊下得到的健壯性要比不誠實比例為60%時的健壯性小.不誠實買家比例非常大(90%不誠實)時,在包含Sybil的3種攻擊下,本文策略穩(wěn)定性受β1,β2值變化的影響較大.但不論β1,β2取多少值,本文策略的健壯性一直明顯優(yōu)于其他策略. Table 6 The Comparison About Robust of Defending Strategies (Including Sybil Attacks)表6 各防御策略的健壯性比較(含女巫攻擊) 2) T&D_S策略.與包含多個顧問團的防御策略相似,當不誠實買方比例為60%時,在包含Sybil的3種攻擊下得到的健壯性幾乎相同,且不隨β1,β2取值的變化而變化.當不誠實買方比例為90%時,在包含女巫的3種攻擊下的健壯性會隨著β1,β2取值不同,出現(xiàn)較小的波動(在±0.2之間),但也無法確定最優(yōu)的β1,β2取值使健壯性達到最大值.然而,當不誠實買方比例為60%時,只有一個顧問團的防御策略(T&D_S),在除Sybil&Camouflage攻擊之外的2種攻擊下得到的健壯性比擁有多個顧問團的防御策略的值要小.當不誠實買方比例提高到90%時,所有攻擊的抵御能力都明顯低于多個顧問團的情況.特別地,T&D_S策略完全無法抵御Sybil& Whitewashing攻擊(因為健壯性接近-1).當不誠實買方比例為90%時,T&D_S策略對Sybil& Camouflage攻擊的抵御能力比不誠實買方比例為60%時有較大幅度的下降(大約20%).T&D_S策略則完全不能抵御Whitewashing攻擊;當不誠實買方比例相對較低(60%)時,其穩(wěn)定性受β1,β2值的影響很小,且與其他策略的健壯性差異變小. 3) PEALGA策略.當不誠實買方比例為60%時,其抵御各種包含Sybil攻擊的能力與T&D策略相同.但是,當不誠實買方比例提高到90%時,PEALGA策略抵御Sybil&Whitewashing攻擊的能力略低于多個顧問團的策略.特別地,PEALGA策略抵御Sybil&Camouflage攻擊的能力大幅降低.這說明PEALGA策略抵御Sybil&Camouflage攻擊的能力會隨著不誠實的比例提高而大幅度降低.現(xiàn)實生活中的刷單就是利用大量的正常用戶(平時偽裝成正常用戶)短時間內(nèi)涌現(xiàn)式打高分提高自身信譽.對于這種現(xiàn)象,T&D策略仍然能很好地抵御,且不受參數(shù)β1,β2取值的影響. 4) MET,GBR,Multi-faced策略在不誠實買方比例為60%時的抵御能力弱于T&D策略.當不誠實買方比例上升為90%時,這種劣勢尤其明顯.前2種策略則完全無法抵御包含Sybil的各種攻擊.值得一提的是,Multi-faced策略在不誠實買方比例為60%時的抵御能力就比較低了(分別為0.89±0.09,0.68±0.14,0.54±0.21).隨著不誠實買方比例提高到90%,其抵御包含Sybil的各種攻擊時的能力下降速度遠遠低于MET和GBR策略. 由表5和表6的結(jié)果可得到3個結(jié)論: 1) T&D策略穩(wěn)定性好,健壯性受β1,β2取值的影響很小.但是抵御包含女巫的各種攻擊的能力隨著不誠實比例的增加而降低,對Sybil&Camouflage攻擊的抵御能力下降最快. 2) 多個顧問團的策略T&D策略相較一個顧問團策略T&D_S更穩(wěn)定,更擅長抵御包含女巫的攻擊,特別是Sybil&Camouflage攻擊;不誠實比例不是特別高時,一個顧問團的T&D_S策略還能較好地抵御各種包含女巫的攻擊,但是,當不誠實比例非常大時,其抵御能力大幅下降. 3) 不可信信息凈化可信信息的信任樹構(gòu)造比傳統(tǒng)的基于信任信息的深度、廣度優(yōu)先搜索信任樹的構(gòu)造方法更能排除大多數(shù)都是偽裝的造假買方攻擊,因此更適合于處理當前的電子商務現(xiàn)實中大多數(shù)刷單用戶都是偽裝的誠實用戶偶爾刷單的情況. 4.3.2 市場配置對健壯性的影響 由前面實驗結(jié)果分析可知,β1,β2值對本文T&D策略的健壯性和穩(wěn)定性的影響不大.因此,本節(jié)旨在分析任意給定β1,β2值(β1=0.4,β2=0.3)時,不同市場配置(不誠實買方比例)下,不同策略對各種攻擊的抵御能力(健壯性)變化趨勢.表7列出了不同市場配置下各策略抵御各種攻擊時得到的健壯性.表7中符號“±”與表5和6中的含義相同. 由表7可觀察到2個結(jié)果: 1) 不誠實買方比例小于50%的不含女巫的攻擊下,T&D,T&D_S,PEALGA,MET,GBR這5種防御策略的防御能力受買方比例增加影響不大.在不誠實買方比例為50%時,T&D_S策略抵御Whitewashing攻擊的健壯性為0.93±0.21,略低于其他比例下的健壯性(0.96);隨著不誠實買方比例不斷增加,MET策略抵御Always Unfair和Whitewashing這2種攻擊的能力也稍有降低,健壯性降到0.92±0.07和0.94±0.06.T&D,PEALGA,GBR這3種策略都非常穩(wěn)定.Multi-faced策略對Always Unfair的防御能力較強(健壯性稍有波動),但是對Camouflage和Whitewashing攻擊的抵御能力很差,加健壯性會隨著不誠實買方比例快速下降.在不誠實買方比例小于等于30%和40%時,Multi-faced策略抵御Whitewashing攻擊和Camouflage攻擊的健壯性還不如基準策略naive的健壯性高. 2) 不誠實買方比例大于50%的包含女巫攻擊下,T&D策略的穩(wěn)定性仍然很好,對Sybil,Sybil&Camouflage,Sybil& Whitewashing這3種攻擊的健壯性僅從50%的0.96左右降到0.91左右.PEALGA策略的穩(wěn)定性明顯弱于T&D策略,PEALGA策略對Sybil,Sybil&Camouflage,Sybil& Whitewashing這3種攻擊抵御的健壯性分別為0.86±0.37,0.38±0.54,0.89±0.33. 觀察表7的結(jié)果可得出2個結(jié)論: 1) 同時考慮信任與不信任信息,用不信任提純信任信息可以有效預防Sybil&Camouflage攻擊;為每個賣方定制一個專門的顧問團評估其信譽的最優(yōu)顧問團思想可以有效預防Sybil和Sybil& Whitewashing這2種攻擊. Table 7 The Robustness of Defending Strategies Under Different Market Configurations表7 不同市場配置下各策略抵御各種攻擊的健壯性 2) 與現(xiàn)有典型的防御策略和基準策略相比,T&D策略受參數(shù)值和不誠實買方比例的影響非常小,且總能獲得大于0.9的健壯性,是非常穩(wěn)定、非常健壯的防御策略. 本文中只用一個顧問團評估所有賣方的防御策略T&D_S,由于同時考慮了信任和不信任信息,對Sybil&Camouflage攻擊的防御能力較好.但是,由于只考慮了一個顧問團,其對Sybil和Sybil& White-washing這2種攻擊的防御能力明顯不如為每個賣方定制一個顧問團的T&D策略.MET,GBR,Multi-faced這3種防御策略對Sybil,Sybil&Camouflage,Sybil& Whitewashing這3種攻擊的抵御能力則隨著不誠實買方比例從50%增加到90%快速下降,甚至完全不能抵御這幾種攻擊(健壯性為負值). 4.3.3 不信任信息對穩(wěn)定性的影響 表7僅以健壯性為標準衡量了各種策略的穩(wěn)定性.非常明顯,本文策略優(yōu)于同時考慮信任與不信任信息的T&D_S,GBR,Multi-faced這3種策略.此外,本文策略也明顯優(yōu)于只考慮信任信息的MET策略.但是相對于僅考慮信任信息的PEALGA策略的優(yōu)越性和產(chǎn)生的原因不是特別明顯.這是因為健壯性屬于多天的累積交易差,它能夠反映誠實買方采用某種防御策略后正確選擇誠實賣方交易的程度.這種正確選擇是建立在準確預測賣方的信譽基礎(chǔ)上的.為了進一步說明本文防御策略相對于文獻[5]中的優(yōu)點,本文給出了這2種防御策略和基準策略在不誠實買方比例為90%時包含女巫的3種攻擊下對壟斷誠實賣方和壟斷不誠實賣方信譽的預測值(如圖5~7所示).由于本文假設(shè)賣方銷售的商品質(zhì)量是穩(wěn)定的,且誠實和不誠實壟斷賣方的真實信譽假設(shè)分別是1和0,所以,預測的誠實不誠實賣方信譽越接近10越準確.其他策略越接近Oracle策略,說明其預測的越準確.Naive策略可以看作預測的下界,越接近它的預測曲線,說明預測準確率越差. Fig. 5 The predicted reputation value of monopolistic sellers under the Sybil attack圖5 Sybil攻擊下各壟斷賣方的預測信譽值 Fig. 6 The predicted reputation value of monopolistic sellers under the Sybil&Camouflage attack圖6 Sybil&Camouflage攻擊下各壟斷賣方的預測信譽值 Fig. 7 The predicted reputation value of monopolistic sellers under the Sybil&Whitewashing attack圖7 Sybil&Whitewashing攻擊下各壟斷賣方的預測信譽值 由圖5可以看出在抵御Sybil攻擊時,本文策略T&D總能比PEALGA策略用更短地時間逼近Oracle策略,進化到真實信譽.前者大概用10 d或15 d(每天一次交易,即10~15次交易)就能學習到不誠實賣方和誠實賣方的真實信譽值.然而PEALGA策略則需要40 d.類似地,在圖6顯示的Sybil&Camouflage攻擊下,T&D策略在經(jīng)過短暫的波動后,用更短地時間逼近Oracle策略,且相對于PEALGA優(yōu)勢非常明顯.圖7中的曲線走勢與圖5中的曲線非常相似,Sybil&Whitewashing攻擊下T&D策略能比PEALGA策略用更短的時間逼近Oracle策略,進化到真實的信譽值.而PEALGA策略始終無法達到真實的信譽值.導致以上結(jié)果的原因是不信任關(guān)系凈化信任關(guān)系之后,最優(yōu)顧問團里的評價者的可信性更可靠,基于他們的意見做出的賣方信譽的預測準確率也更高. 本文針對普遍存在的虛假評分及用虛假評分操控信譽評價體系的問題,給出了一種面向個體消費者的賣方選擇策略T&D.該策略融合了社交網(wǎng)絡中的信任與不信任關(guān)系,以及用戶的可信性和不可信性2個方面,進化了用戶的白名單和黑名單.論文設(shè)計了大量的仿真實驗驗證論文策略的有效性和穩(wěn)定性. 第4節(jié)的實驗結(jié)果顯示:無論模型參數(shù)、市場配置怎么變化,融合了不信任信息的T&D防御策略總能保持最好的穩(wěn)定性,即T&D策略始終比其他防御策略具有更高的健壯性.此外,利用不信任關(guān)系凈化信任關(guān)系的信任樹構(gòu)造比傳統(tǒng)的基于信任關(guān)系的深度優(yōu)先和廣度優(yōu)先搜索的信任樹構(gòu)造方法更能準確識別大多數(shù)評價者都是偽裝的造假買方,因此更適合于處理當前的電子商務現(xiàn)實中大多數(shù)刷單用戶都是偽裝的誠實用戶偶爾刷單的情況. 本文中的防御策略設(shè)計初衷是針對用戶需求不經(jīng)常變化的B2B電子商務市場.在今后的工作中,我們將進一步驗證該策略對需求(購買商品種類)經(jīng)常變化的C2C市場的適用性.此外,本文的實驗采用的數(shù)據(jù)是模擬數(shù)據(jù),未來我們將采用真實數(shù)據(jù)來驗證本文方法的健壯性、準確性和穩(wěn)定性.3.2 最優(yōu)顧問團構(gòu)造算法
3.3 賣方信譽評估算法
3.4 買方白名單和黑名單的更新算法
4 實驗結(jié)果與分析
4.1 實驗設(shè)置
4.2 評估標準
4.3 實驗結(jié)果
5 結(jié) 論