沈宏偉,邵 堃,張陽洋,霍 星,劉宗田
1(合肥工業(yè)大學 計算機與信息學院,合肥 230009) 2(合肥工業(yè)大學 數學學院,合肥 230009) 3(上海大學 計算機工程與科學學院,上海 200072) 4(南瑞集團 國電南瑞科技股份有限公司,南京 211106)
信任關系是一種在人類社會中普遍存在的人際關系,這種關系表現在日常生活中的各個方面.隨著互聯網技術的發(fā)展及其應用的普及,日常生活中的交互活動逐漸向網絡生活中轉移,比如網購、微博、微信等.由于網絡環(huán)境具有動態(tài)性、匿名性、開放性的特點,日常生活中對信任的評估方法已經不能充分適應當前復雜的網絡環(huán)境.
因此,適用于網絡環(huán)境下的信任評估方法作為衡量網絡實體行為可靠性的有效方法,得到越來越多的學者們關注.Blaze[1]為解決internet上網絡服務的安全問題,首先提出了“信任管理”的概念.至今,信任管理總體上仍處于發(fā)展初期.但是,國內外學者對信任模型的研究一直不斷取得突出成果[2-8].學者們對信任模型的研究主要分為兩大類:一類是基于概率理論的信任模型[2-5];一類是基于模糊理論的信任模型[6-8].
信任是來源于信任主體所擁有的經驗,主體對客體某種特定行為的預期,會隨著客體的行為而發(fā)生變化.jsang[9]等人基于主觀邏輯信任,通過引入事實空間和觀念空間的概念來描述和度量信任關系.唐文[10]等人針對信任的模糊性提出了一種基于模糊邏輯的主觀信任計算方法.文獻[11]對開放式系統中的動態(tài)信任預測模型進一步優(yōu)化,提出了一種符合人類心理認知過程的信任預測模型,摒棄了已有的文獻中常用的確定權重來進行預測的主觀方法,同時提出了在直接信任不存在情況下解決信任計算的辦法.文獻[12]提出了一種正態(tài)分布下的動態(tài)推薦信任模型,通過計算間接信任影響因素,運用分級剪枝方法過濾推薦信息,計算得到后驗分布期望的貝葉斯估計.文獻[13]提出了一個基于服務Agent的可信性評估方法,從社交認知角度建立的服務Agent信任本體,提出一系列的信任推理的計算規(guī)則來支持信任值的計算.
在對以上研究成果的分析研究過程中發(fā)現,現有的信任研究都專注于對信任度值量化分析,忽略了信任度對決策的指導性作用,并且在計算信任度時,學者們普遍使用直接信任和間接信任忽略了信譽的重要作用.文獻[14]指出了直接信任、間接信任、信譽之間的相互作用關系,認為信譽和直接信任之間存在一定的修正關系,可以避免直接信任的誤導.如果當直接信任、間接信任以及信譽出現差異時,主體很難通過其中一種信任關系來對客體進行客觀行為進行決策.而且,信任關系是一種不確定關系,兼具主觀性和模糊性.因此,本文通過深入研究信任關系中直接信任、間接信任、信譽的聯系,將樸素貝葉斯算法和模糊理論相結合建立信任決策模型,能夠更加準確可靠的幫助主體進行信任決策.
定義1.直接信任度(Direct Trust,DT)是依據信任主體i根據與信任客體j的歷史交互經驗得到的信任客體的可信度.
直接信任來自信任的主客體之間頻繁的歷史交互,是信任主體對信任客體的主觀判斷,受到多個方面因素的影響,包括信任主體的心理因素,歷史交互數量及時間因素,交互的順利程度等,這些因素都會影響信任主客體之間的直接信任度.由于主體的心理和交互的順利程度無法進行獲取,因此本文借助歷史交互數量及時間因素來對直接信任建立數學模型,如公式(1)所示:
(1)
定義2.間接信任度(Indirect Trust,IDT)是信任主體(i)借助與信任客體(j)有過交互經驗的第三方推薦所獲得的信任度.若有第三方推薦者p向信任主體推薦信任客體,則推薦信任度可用公式(2)表示:
(2)
(3)
定義3.信譽(Reputation,RE),也稱聲譽是信任客體為獲得信任主體的認可,通過大量交互來獲得信任主體對其的客觀評判.信譽是全部信任主體對信任客體信任度的加權平均.因此,信譽可以表示為:
(4)
貝葉斯算法由英國數學家Thomas Bayes提出,并成為概率論的基礎理論,主要應用于決策理論、統計推斷、統計的估算等領域.樸素貝葉斯(Native Bayesian,NB)是貝葉斯的一種特例,是貝葉斯證據獨立的表達形象.樸素貝葉斯與一般貝葉斯的主要區(qū)別在于,樸素貝葉斯要求各個特征屬性(characteristic attribute,CA)相互獨立.滿足獨立條件的樸素貝葉斯分類算法比一般貝葉斯算法速度更快,更簡單,分類準確率更高.
樸素貝葉斯分類算法應用在本文信任模型需滿足兩個基本假設:
假設1.交互成功的事件要比交互失敗的事件平均具有更高的直接信任度、間接信任度以及信譽值.
假設2.直接信任、間接信任和信譽在交互結果給定的情況下是獨立的.
假設1,顯然很容易滿足.假設2,由于間接信任通過直接信任計算而來,兩者看似不獨立.但是兩者來自不同信任主體,間接信任計算所采用的是推薦者與信任客體之間的直接信任,此直接信任和信任主體與信任客體之間的直接信任是相互獨立的,所以假設2也可滿足.
直接信任,間接信任,信譽作為信任交互結果的三個特征屬性,而且很好的滿足了樸素貝葉斯的特征條件相互獨立的基本假設.建立樸素貝葉斯信任決策模型,首先需要對訓練樣本進行統計和計算,包括交互成功和失敗的樣本數目,以及交互結果所對應的三個特征屬性,直接信任,間接信任以及信譽的分布.
由于直接信任,間接信任和信譽的值所在區(qū)間是[0,1],不能夠體現出人對其評價的主觀模糊性.人在對事物進行評價的時候往往只是“好”、“壞”之分,而不是有一個精確的度量.但是,完全采用這種二值邏輯無法完全勝任這種模糊表達的能力,而且缺乏靈活性.據此對其做一個模糊劃分,如下頁表1所示.本文將屬性值劃分為5個區(qū)間:{ Lowest,Low,General,High,Highest }.這樣不僅符合模糊評價的質量要求,而且有一個中間等級符合自然語言描述.
依據表1中的劃分,直接信任DT={Lowest,Low,General,High,Highest},間接信任IDT={Lowest,Low,General,High,Highest},信譽RE={Lowest,Low,General,High,Highest}.
定義4.交互結果(Interaction Result,IAR),是信任主體與信任客體直接發(fā)生交互,對此次交互成功與失敗的評判,其中IAR={Success,Fail}.將交互結果分為成功和失敗兩大類,是本文模型進行決策的最終依據.
表1 屬性值模糊劃分
Table 1 Attribute values fuzzy divided
屬性值模糊劃分[0,0.2)Lowest[0.2?0.4)Low[0.5?0.6)General[0.6?0.8)High[0.8?1.0]Highest
通過以下式子計算各個類別下各個特征屬性的條件概率估計,即P(CA|IAR).首先將訓練樣本集根據交互結果IAR={Success,Fail}進行分類.然后根據直接信任度,間接信任度,信譽值的劃分進行統計,獲得在不同交互結果下的先驗條件概率分布.
具體步驟如下:
1)輸入訓練樣本數據;
2)計算樣本數據中,信任主客體的直接信任、間接信任、信譽;
3)根據計算結果對交互結果及其直接信任、間接信任、信譽所屬劃分進行計數;
4)重復1),2),3)步,直至訓練樣本數據處理完畢.
根據以上步驟操作可以獲得交互成功、交互失敗的交互數量,及各個交互所對應的直接信任、間接信任、信譽所屬劃分的數量.特征屬性統計數量如表2所示.
表2 交互結果及其特征屬性統計數量表
Table 2 Interaction result and characteristic attributes statistical table
交互結果(IAR)numIAR={Success},numIAR={Fail}直接信任(DT)numDT={Lowest},numDT={Low},numDT={General},numDT={High},numDT={Highest}間接信(IDT)numIDT={Lowest},numIDT={Low},numIDT={General},numIDT={High},numIDT={Highest}信譽(RE)numRE={Lowest},numRE={Low},numRE={General},numRE={High},numRE={Highest}
根據表2,可計算信任三維特征屬性的先驗條件概率:P(DT| Success),P(IDT| Success),P(RE| Success),P(DT| Fail),P(IDT| Fail),P(RE| Fail).
由于各個特征屬性相互獨立,則可根據貝葉斯定理得到公式(5):
(5)
由于P(CA)對于各個類別都是相同的,可看作常數.因此,分子主要觀察對象.由于各個特征屬性之間相互獨立,因此分子部分等價于聯合分布模型.則反復使用鏈式法則將其改寫為條件概率形式,如公式(6):
P(IAR|CA)
=P(IAR|DT,IDT,RE)
=P(IAR)P(DT,IDT,RE|IAR)
=P(IAR)P(DT|IAR)P(IDT,RE|IAR,DT)
=P(IAR)P(DT|IAR)P(IDT|IAR,DT)P(RE|IAR,DT,IDT)
=P(IAR)P(DT|IAR)P(IDT|IAR)P(RE|IAR)
(6)
由式(6)知,交互結果的后驗概率通過交互結果的先驗概率及信任特征屬性的先驗概率計算獲得.因此,獲取先驗概率是樸素貝葉斯信任決策模型的重點.通過對訓練樣本集的統計訓練,獲得各個特征屬性的先驗概率是進行判別計算的關鍵.在得到三維特征屬性的先驗概率之后,便可對未知交互結果的交互事件進行預測并提供相關的決策信息.對于已知直接信任DT,間接信任IDT,信譽RE的交互事件X,交互事件X的交互結果未知.則可通過比較P(CA|Success)P(Success)和P(CA|Fail)P(Fail)的值,預測此次交互X的交互結果.
實驗數據集來自EPINIONS dataset,本文選用EPINIONS dataset是由于此數據集在研究社會網絡信任關系領域被許多學者所采用.EPINIONS dataset中包含49290位用戶對139738個對象進行了評價,并且評價次數不低于1次,一共發(fā)表了664824次評論,一共擁有487181對相互信任的用戶.
首先對獲取的664824次評論進行統計,根據評論來將此次交互結果(IAR)分為成功(Success)和失敗(Fail)兩類.數據集中評論分為1-5,5個等級,實驗過程中規(guī)定1-3為較低的評價,即交互失敗,4-5為較高評價,即交互成功,見表3.
表3 交互結果統計
Table 3 Statistical interaction results
交互結果(IAR)成功(Success)失敗(Fail)統計數量495393169431
接下來對交互結果的三個屬性特征直接信任,間接信任,信譽進行統計,統計結果如下頁表4所示.
實驗過程中,直接信任度是信任主體對信任對象的直接評價,與直接信任所屬劃分相對應.親密度的計算是根據信任主體與推薦者所交互對象共同數量確定的.
建立樸素貝葉斯模型的關鍵在于計算每一個特征屬性的條件概率分布,借助條件概率分布實現各個特征屬性的融合.條件概率分布為樸素貝葉斯模型提供了不確定性計算所必需的先驗概率,進而可以求出交互結果的后驗概率.樸素貝葉斯模型各個特征屬性的條件概率估計如下頁表5-表7.
以上是對訓練樣本中交互結果及其特征屬性的統計,并計算各個特征屬性的條件概率估計.下面對1000組測試樣進行測試,已知直接信任DT,間接信任IDT,信譽RE的交互X={x1,x2,x3,…,x1000},交互X的交互結果已知,其中交互結果成功有628個,失敗372個.根據訓練樣本計算獲得的預測交互結果與已知交互結果進行比較獲得模型的準確度.
表4 交互結果特征統計表
Table 4 Statistical feature attribute of interaction results
LowestLowGeneralHighHighest成功Success直接信任(DT)175152468443897169731239566間接信任(IDT)456121216094137386340246信譽(RE)85386616823143702333149失敗Fail直接信任(DT)2615428698416323956033387間接信任(IDT)422615176466996879434536信譽(RE)422615465489417040930390
表5 直接信任條件概率估計
Table 5 Direct trust conditional probability
直接信任(DT)LowestLowGeneralHighHighest成 功SuccessP(Lowest|Success)P(Low|Success)P(General|Success)P(High|Success)P(Highest|Success)3.5356%4.9827%8.8610%34.2619%48.3588%失 敗FailP(Lowest|Fail)P(Low|Fail)P(General|Fail)P(High|Fail)P(Highest|Fail)15.4364%16.9380%24.5717%23.3488%19.7053%
表6 間接信任條件概率估計
Table 6 Indirect trust conditional probability
間接信任(IDT)LowestLowGeneralHighHighest成 功SuccessP(Lowest|Success)P(Low|Success)P(General|Success)P(High|Success)P(Highest|Success)0.0920%0.2447%3.2487%27.7327%68.6819%失 敗FailP(Lowest|Fail)P(Low|Fail)P(General|Fail)P(High|Fail)P(Highest|Fail)2.4942%8.9570%27.5623%40.6029%20.3836%
表7 信譽條件概率估計
Table 7 Reputation conditional probability
信譽(RE)LowestLowGeneralHighHighest成 功SuccessP(Lowest|Success)P(Low|Success)P(General|Success)P(High|Success)P(Highest|Success)0.1722%0.1748%3.3959%29.0077%67.2494%失 敗FailP(Lowest|Fail)P(Low|Fail)P(General|Fail)P(High|Fail)P(Highest|Fail)2.4942%9.1276%28.8856%41.5561%17.9365%
具體步驟如下:
1)根據公式(1)(2)(3)(4)(5),計算獲得直接信任,間接信任以及信譽的值.
2)利用表1,對直接信任度,間接信任度,信譽值進行劃分.
3)借助表5-表7,使用以下公式分別計算交互成功和交互失敗的后驗概率如公式(7)(8):
(7)
(8)
其中
evidence=P(Success)p(DT|Success)p(IDT|Success)p(RE|Success)+P(Fail)p(DT|Fail)p(IDT|Fail)p(RE|Fail)
(9)
evidence是用來控制交互成功和交互失敗的后驗概率之和為1.
4)比較交互成功的后驗概率和交互失敗的后驗概率獲得交互的預測結果,與已知結果進行比較,并記錄.
5)反復執(zhí)行1),2),3),4)步,直到全部測試樣本測試完畢.
表8 對比結果
Table 8 Comparison result
已知結果預測結果誤差成功628592?36失敗37240836
根據以上步驟對測試樣本進行測試,測試結果如表8、下頁表9所示.
表8中看出,測試樣本中,交互成功的數量為628,交互失敗的數量為372,使用模型進行預測的結果是交互結果成功的數量為592,交互失敗的數量為408.
表9 交互結果轉移表
Table 9 Interaction results transfer table
成功(已知)→失敗(預測)失敗(已知)→成功(預測)5519
根據表9可以看到,在測試樣本中原來有55個交互成功的樣本經過模型計算后預測結果是失敗,19個在測試樣本中交互結果是失敗的經過模型計算后預測結果是成功,即一共有74個樣本預測結果與已知結果不匹配.可粗略估計本模型的準確率在92.6%,這是一個可以讓人接受的準確率.
表10 惡意評論
Table 10 Malicious bad review %
間接信任LowestLowGeneralHighHighest成功后驗概率9.87187.499025.914966.964490.9089失敗后驗概率90.128292.501074.085133.03569.0911交互結果預測失敗失敗失敗成功成功
模型不僅具有較高的準確率,而且對惡意差評和過分好評也有著一定的抵御能力.惡意評論是指對交互對象給予過低的評價.而過分好評相反,指的是給予交互對象一個過高的評價,這直接影響到間接信任.以一次交互為例,直接信任和信譽均處于較高評分,即IDT、RE={High},交互成功和交互失敗的后驗概率如表10所示.
表11 過分好評
Table 11 Extremely high praise %
間接信任LowestLowGeneralHighHighest成功后驗概率0.21860.16200.69503.897916.6729失敗后驗概率99.781499.838099.305096.102183.3271交互結果預測失敗失敗失敗失敗失敗
由表10可以看出,在直接信任DT=High,信譽RE=High時,間接信任IDT={Lowest,Low,General}則預測交互結果為失敗;間接信任IDT={High,Highest}則預測交互結果為成功.即如果初始的間接信任為Highest時,惡意評論對其影響不是很大,需要惡意評論影響間接信任度致其低于0.6方可影響到對交互結果的判斷.假設所有推薦者與信任主體親密度相等,初始推薦者有20人,融合間接信任度為0.9={Highest},現有n個惡意差評者,其信任主體對其間接信任度為0.1,則需要n>12個惡意推薦者才能影響模型對交互結果的預測.同理可知,模型對過分好評也有一定的抵御作用.如表11所示,其中直接信任DT={Low},信譽RE={Lowest}.當直接信任與信譽比較低的時候,過分好評對其的影響微乎其微,并沒有影響到對決策結果的判斷.因此,本文模型對惡意推薦也有著一定的抵御作用.
信任模型的構建一直是信任研究領域的重點.本文利用樸素貝葉斯理論,用直接信任,間接信任,信譽作為三維特征屬性描述交互結果.其中也涉及到了直接信任,間接信任以及信譽的計算問題,借助模糊理論方法將三者根據值所屬范圍進行劃分,然后計算信任的三維特征屬性的先驗條件概率估計.根據先驗概率估計來計算交互結果的后驗概率估計,構建信任決策模型.該模型將根據交互情況計算交互的三維特征屬性,并結合三維屬性特征劃分和交互結果的后驗概率預測此次交互的結果,完成決策分析功能.本文模型不僅具有較高的準確度,而且對惡意評論和過分好評也有一定抵御作用.
[1] Blaze M,Feigenbaum J,Lacy J.Decentralized trust m anagement[C].IEEE Computer Society,1996:164-173.
[2] Abdul-Rahman A,Hailes S.A distributed trust model[C].The Workshop on New Security Paradigms,ACM,1998:48-60.
[3] Tan Zhen-hua,Wang Xing-wei,Cheng Wei,et al.A distributed trust model for peer-to-peer networks based on multi-dimension-history vector[J].Chinese Journal of Computers,2010,33(9):1725-1735.
[4] Angin P,Zhong Y,Lu Y,et al.A computational dynamic trust model for user authorization[J].IEEE Transactions on Dependable & Secure Computing,2015,12(1):1-15.
[5] Hoogendoorn M,Jaffry S W,Van Maanen P P,et al.Design and validation of a relative trust model[J].Knowledge-Based Systems,2014,57(to appear):81-94.
[6] Sentz K.Combination of evidence in dempster-shafer theory[D].Binghamton,NY:Systems Science and Industrial Engineering Department,Binghamton University,2002.
[7] Tajeddine A,Kayssi A,Chehab A,et al.Fuzzy reputation-based trust model[J].Applied Soft Computing,2011,11(1):345-355.
[8] Wang Ying,Wang Xin,Zuo Wan-li.Trust prediction modeling based on social theories[J].Journal of Software,2014,25(12):2893-2904.
[10] Tang Wen,Hu Jian-bin,Chen Zhong.Research on a fuzzy logic-based subjective trust management model[J].Journal of Computer Research and Development,2005,42(10):1654-1659.
[11] Li Xiao-yong,Gui Xiao-lin.Cognitive model of dynamic trust forecasting[J].Journal of Software,2010,21(1):163-176.
[12] Shao Kun,Luo Fei,Mei Xiao-xiong,et al.Normal distribution based dynamical recommendation trust model[J].Journal of Software,2012,23(12):3130-3148.
[13] Zhu Man-ling,Jin Zhi.Approach for evaluating the trust worthiness of service agent[J].Journal of Software,2011,22(11):2593-2609.
[14] Kiefhaber R,Jahr R,Msadek N,et al.Ranking of direct trust,confidence,and reputation in an abstract system with unreliable components[C].Ubiquitous Intelligence and Computing,2013 IEEE,International Conference on and,International Conference on Autonomic and Trusted Computing,IEEE,2013:388-395.
附中文參考文獻:
[3] 譚振華,王興偉,程 維,等.基于多維歷史向量的P2P分布式信任評價模型[J].計算機學報,2010,33(9):1725-1735.
[8] 王 英,王 鑫,左萬利.基于社會學理論的信任關系預測模型[J].軟件學報,2014,25(12):2893-2904.
[10] 唐 文,胡建斌,陳 鐘.基于模糊邏輯的主觀信任管理模型研究[J].計算機研究與發(fā)展,2005,42(10):1654-1659.
[11] 李小勇,桂小林.動態(tài)信任預測的認知模型[J].軟件學報,2010,21(1):163-176.
[12] 邵 堃,羅 飛,梅梟雄,等.一種正態(tài)分布下的動態(tài)推薦信任模型[J].軟件學報,2012,23(12):3130-3148.
[13] 朱曼玲,金 芝.一種服務Agent的可信性評估方法[J].軟件學報,2011,22(11):2593-2609.