張佳樂,張秀芳,張桂玲
(1.天津工業(yè)大學 計算機科學與軟件學院,天津 300387;2.廊坊師范學院 數信學院,河北 廊坊 065000)
基于模糊綜合策略的用戶行為評估方法
張佳樂1,張秀芳2,張桂玲1
(1.天津工業(yè)大學 計算機科學與軟件學院,天津 300387;2.廊坊師范學院 數信學院,河北 廊坊 065000)
對網絡用戶行為的可信性評估是當今可信網絡領域的研究熱點之一。針對傳統(tǒng)可信網絡用戶行為評估方法的主觀性、局限性和靜態(tài)性等問題,提出了一種基于模糊綜合策略(FCS)的可信評估方法,并結合可信網絡用戶行為度量機制設計了用戶行為評估模型。該評估模型使用模糊綜合評價的方法對用戶行為和特征屬性進行挖掘分析,以此為基礎構建了評價指標及綜合指標權重,并運用模糊算子對評估結果進行加權運算,從而準確地量化用戶行為評估結果。通過仿真實驗對四種用戶行為進行了基于FCS的可信判定,并與其他兩種用戶行為可信判定策略進行了對比分析。實驗結果與分析表明,所提出的方法能夠在復雜網絡環(huán)境中對用戶行為進行全面、準確和動態(tài)的量化評估,且評估結果更加切合實際。
可信網絡;用戶行為評估;模糊綜合策略;綜合指標權重;模糊算子
隨著網絡應用技術的持續(xù)發(fā)展和網絡用戶規(guī)模的不斷擴大,傳統(tǒng)的網絡應用模式已經不能滿足大規(guī)模網絡和用戶需求,分布式系統(tǒng)(如云計算、物聯(lián)網、網格計算、P2P、Ad hoc網絡和電子商務等)迅速成為網絡發(fā)展的主流,系統(tǒng)形態(tài)開始向開放的、公共可訪問的和動態(tài)協(xié)作的服務模式轉變。在這種開放的網絡環(huán)境下,用戶可以得到更多資源共享和交互協(xié)作的機會,其行為也日趨復雜,一些用戶行為會不同程度地危及網絡運行狀態(tài),甚至影響其他用戶的正常交互,比如用戶的非法訪問、濫用資源和惡意攻擊等行為會導致網絡擁塞、網絡負載、節(jié)點異常甚至網絡癱瘓。因此,為了確保網絡的安全運行,必須從用戶行為的可信性入手,對用戶行為的可信性進行全面、準確和動態(tài)的評估。用戶行為信任的研究不僅可以提高網絡的安全性,而且也可以提高網絡的整體性能[1]。
目前針對用戶行為可信問題的研究主要集中在量化評估方面,林闖、田立勤等[1-2]給出了可信網絡中用戶行為可信的概念,并提出了基于滑動窗口的用戶行為管理機制,為用戶行為可信評估奠定了理論基礎。文獻[3]提出了基于AHP層次分析的評估方法,利用AHP原理確定用戶行為證據指標和各指標權重,對用戶行為進行量化評估。但由于確定權重的AHP層次分析方法容易引入模糊性而造成權重失真[4],影響評估結果,因此有研究人員引入數據挖掘技術對用戶行為可信進行研究,通過數據挖掘算法,分析并發(fā)現用戶正常行為模式和異常狀態(tài)下的特征規(guī)劃,反映出用戶行為的可信性[5],但該種方法的運算復雜度較高,且實際操作十分困難。文獻[6]從網絡用戶的自有模糊性出發(fā),通過有序二元對比矩陣確定用戶行為證據的相對重要程度,結合證據權重得到用戶行為的可信隸屬度,進而對其進行可信劃分,但在對證據進行有序二元對比時,其相對重要程度是通過歷史經驗獲得,對評估結果有較大影響。為此,通過建立模糊矩陣、熵權法確定權重以及模糊算子量化評估結果等方式來解決專家意見和歷史經驗等對評估結果的影響。文獻[7-11]在云計算開放的運行環(huán)境下,運用AHP、FAHP、FANP及DSW等方法對用戶行為進行可信評估。
這些方法雖然都能量化地評估用戶行為,但仍然面臨著以下兩個問題:一方面,采用專家建議、歷史經驗或者評估準則等方法構建評價指標具有主觀性,從而影響評估的準確性;另一方面,網絡中的用戶行為經常處于變化之中,而評價指標和權重是單一靜態(tài)的,因此極易導致評估結果隨用戶行為的變化而失效等誤差。
針對上述問題,提出了一種基于模糊綜合策略(FCS)的網絡用戶行為可信評估方法。將模糊綜合評估方法應用在用戶行為及其特征屬性的挖掘分析上,構建了評價指標和綜合指標權重,并使用模糊算子對評估結果進行了加權運算,不僅能夠精確量化評估結果,而且能夠消除專家意見的主觀性對指標權重的影響。
1.1 用戶行為的模糊綜合評估方法
由于網絡用戶行為的復雜性和不確定性,其行為特征往往由多種指標因素決定,因此,單一評估方法不能全面分析用戶行為特征,模糊綜合評估是在考慮多種因素的影響下,運用模糊數學方法對事物或問題做出綜合評估的方法。用戶行為模糊綜合評估的主要思路是:首先將用戶行為看作由n個評價指標(行為特征屬性)組成的模糊集合X={x1,x2,…,xn},設定這些評價指標能選取的評估等級,組成具有m種評語的評價集Y={y1,y2,…,ym},通過模糊映射,將行為特征屬性集合映射到評價集上,得到n×m的模糊評價矩陣Rn×m,然后根據行為特征屬性在各個評價目標中的權重分配,求出模糊指標權重向量W={ω1,ω2,…,ωn},最后通過模糊算子對R和W進行模糊運算:E=R°W,得到模糊綜合評價的定量解。
為更好地描述用戶行為的模糊綜合評價策略,首先給出以下定義。
定義1(行為特征屬性):指用于描述網絡用戶行為的多種指標因素,可在用戶正常網絡交互中通過測量獲得。假設集合P={p1,p2,…,pn}為描述網絡用戶行為特征的n項指標,通過測量得到某時刻n項網絡用戶行為特征指標對應的測量值,分別為x1,x2,…,xn,則可用這n個測量值組成的模糊集合X={x1,x2,…,xn}來表示用戶行為特征屬性,也稱為用戶行為原始數據。
為了準確和全面地描述用戶行為特征屬性,采用用戶訪問日志挖掘技術來獲取網絡用戶的行為特征集X,詳細方法參考文獻[12],這里不再贅述。
定義2(熵和熵權法):熵的概念最早來自熱力學,用來度量分子運動的無規(guī)則性,即不確定性。熵在應用于復雜決策問題的過程評價時是一個很理想的尺度,它是確定多指標綜合評價問題中各指標權重的有效方法。在用戶行為模糊綜合評價過程中,用戶行為特征屬性及對應評價集組成n×m的模糊評價矩陣R=[rij]n×m,其中第i個指標的熵定義為:
相應地,第i個指標的熵權為:
定義4(模糊算子):在模糊綜合評價方法中,通常采用模糊合成算子來求解模糊綜合評價的定量解。常用的模糊合成算子類型有主因素突出型和加權平均型。其中,主因素突出型包括M(∧,∨)模型和M(·,∨)模型,這兩種模型主要應用于主指標因素在綜合評價中起主導作用的情況;加權平均型包括M(∧,⊕)模型和M(·,⊕)模型,這兩種模型在運算時兼顧了各因素的作用,適用于各指標因素均起作用的情況。采用M(·,⊕)模型來解決用戶行為評估問題中的模糊運算問題。
定義5(模糊評價值):經過模糊綜合評價得到的結果是一個模糊向量,所包含的信息比較豐富和雜亂,不便于比較和評估,因此可以用一些方法將其轉化為一個具體的點值,這個點值被稱為模糊評價值。常用方法有最大隸屬原則、加權平均原則和模糊向量單值化三種。為突出綜合指標權重在評估過程中的作用,采用加權平均原則來求得模糊評價值:
1.2 基于FCS的用戶行為評估模型
為了準確量化用戶行為可信評估結果,基于模糊綜合策略(FCS)的用戶行為評估方法首先需要采集用戶行為原始數據,通常包括Web日志采集和客戶端信息采集兩種方式,然后通過數據清理和數據標準化選擇用戶行為特征屬性所對應的評價集,建立模糊矩陣,繼而通過熵權法設置其綜合指標權重,最后利用模糊矩陣和指標權重計算模糊綜合評價值,對用戶行為數據進行量化評估,根據評估結果判定信任等級并通過網絡獲取相應的對象和操作。據此,提出了基于FCS的用戶行為評估模型,包括數據采集模塊、數據預處理模塊、綜合指標權重設置模塊和用戶行為評估模塊,如圖1所示。
圖1 基于FCS的用戶行為評估模型
(1)數據采集模塊:該模塊在用戶行為評估模型中負責采集用戶行為指標的原始數據,一般包括Web日志采集和客戶端信息采集兩種方式,常見的構建方式為分布式的第三方采集器,如NetFlow Monitor、Bandwidth Monitor等[13]。采集器獲取的用戶數據在模塊內部經過初步處理(如數據歸類、刪除無屬性信息、統(tǒng)計均值和比例值等)形成用戶行為指標評估的原始數據。
(2)數據預處理模塊:該模塊負責對數據采集模塊生成的原始數據進行處理,構建用戶行為評估原始數據集,并進行模糊映射,得到初始模糊矩陣,進一步進行標準化消除數據物理量綱對取值范圍的影響,最終生成模糊矩陣,具體處理方法詳見2.1節(jié)。
(3)綜合指標權重設置模塊:該模塊用于確定評價指標的權重向量,首先確定各評價指標相對于某一特定評價等級的熵值,然后根據熵權法的定義求得對應指標的熵權,進而得到各評價指標的綜合權向量。
(4)用戶行為評估模塊:該模塊根據評價指標和綜合權向量對用戶行為數據進行量化計算,通過模糊綜合評價方法確定用戶行為的評估定量解,即模糊評價值,進而對用戶行為進行可信評級。
從現如今的網絡體系結構上來看,基于FCS的用戶行為評估模型具有較強的可實現性。數據采集模塊可呈分布式結構部署在網絡的各個節(jié)點,能夠實時有效地獲取用戶行為和網絡狀態(tài)數據,數據預處理、綜合指標權重設置及用戶行為評估三個模塊均可部署在網絡的中心節(jié)點上進行集中式管理,進而對用戶行為進行全面、準確和動態(tài)的可信評估。
基于模糊綜合策略的用戶行為評估方法在過程上包括數據采集和預處理、確定綜合指標權重和用戶行為模糊綜合評價三個階段,首先采集用戶行為原始數據,通過數據清理和數據標準化確定評價集,并建立初始模糊矩陣,進而通過熵權法設置其綜合指標權重,最后利用模糊矩陣和指標權重計算模糊綜合評價值,對用戶行為數據進行量化評估,最終得到用戶的可信評級和服務等級。具體流程如圖2所示。
2.1 用戶行為數據采集和預處理
用戶行為特征和評價指標的選取依賴于用戶行為實際數據的挖掘和分析,數據的采集方法包括Web日志采集和客戶端信息采集兩種方式。為了評估的準確和全面,需要對采集到的用戶行為數據進行預處理。
圖2 基于FCS的用戶行為評估流程圖
初始模糊矩陣中的用戶行為數據由采樣得到的原始數據組成,其單位和量綱可能不一樣,為了避免取值范圍不同而引起的誤差,需要對其標準化。標準化的方法采用極差變換法:
(1)
其中,i=1,2,…,n;j=1,2,…,m。這樣就消除了量綱的影響且使得0≤rij≤1,進而得到模糊矩陣R=[rij]n×m。
2.2 熵權法確定綜合指標權重
(2)
相應地,第i個指標的熵權為:
(3)
2.3 用戶行為模糊綜合評估
根據用戶行為特征屬性和各指標評級構成的模糊矩陣與綜合權向量進行量化計算即可得到用戶行為模糊綜合評估的定量解。具體的量化計算公式為:
(4)
(k=1,2,…,n)
(5)
E=
(i=1,2,…,n)
(6)
最后將求得的模糊評估值按照可信級別映射表[14]進行可信評級,可信級別映射表如表1所示。
表1 可信級別映射表
當用戶行為屬于不可信和較不可信范圍內時,服務器會拒絕用戶交互請求,并將用戶剔除可信用戶列表;而當用戶行為可信級別在可信范圍內時,服務器會響應用戶的交互請求。從而對不同用戶行為進行正確的可信控制,提高網絡利用率并降低網絡可能遇到的風險。
3.1 數據源說明及環(huán)境設置
為了驗證所提出的用戶行為評估機制,采用OWLS-TC數據庫的數據資源,在CPU為Intel Core i7,主頻為2.5 GHz,內存為8 GB的PC機上對評估機制進行了Matlab編程仿真。根據信任關系,將實體間的信任分為四類:高度可信、一般可信、臨界可信和不可信。定義實體的可信評估值為E,各類實體的信任范圍表述如下:
0.8≤E≤1:表示“高度可信”,高度可信表明服務器可以根據實體的服務屬性值,一直提供真實可信服務,與服務器的交互成功率很高且交互速度很快。
0.6≤E<0.8:表示“一般可信”,一般可信實體和完全可信實體相比,服務器對其服務屬性值的認知程度不夠,導致與服務器的交互成功率和交互速度表現一般。高度可信和一般可信的實體,其可信評估值會隨交互次數的增加,一直呈現上升趨勢。
0.3≤E<0.6:表示“臨界可信”,臨界可信表明服務器提供的服務時好時壞,實體的服務屬性值不穩(wěn)定,因此,其可信評估值會隨交互次數的增加呈現波浪起伏的態(tài)勢。
0≤E<0.3:表示“不可信”,不可信表明服務器不能識別其服務屬性值,實體的可信評估值會隨交互次數的增加而迅速下降,直至被剔除用戶可信列表。
3.2 實驗結果分析
3.2.1 準確性分析
在用戶行為準確性分析實驗中,對四種不同信任級別的實體進行可信評估,實驗設定在相同的網絡環(huán)境和交互模式下,實體與服務提供者之間的交互次數為600,服務器提供的服務數目為200個,可信評估值初始化為0.5。理論上,四類用戶行為的可信評估值會隨著交互次數的增加而呈現出不同的變化趨勢。
圖3 可信評估值對比圖
如圖3所示,當交互次數為0時,四類實體用戶的可信評估初始化值為0.5,高度可信和一般可信實體由于一直提供真實可信的服務,因此其可信評估值隨交互次數的增加而不斷上升。其中,高度可信實體的可信評估值逐漸趨近于1,且在任意交互次數下,其可信評估值均大于一般可信實體的評估值。臨界可信實體由于提供的服務時好時壞,實體的服務屬性值不穩(wěn)定,因此,其可信評估值會隨交互次數的增加呈現波浪起伏的態(tài)勢。而不可信實體,由于一直提供不可信服務,其可信評估值隨交互次數迅速下降,直至為0,最終剔除用戶可信列表。
實驗結果驗證了基于FCS的用戶行為評估方法的準確性,與理論分析相吻合。
3.2.2 對比分析
為了充分說明評估方法的優(yōu)點,將基于FCS的用戶行為評估方法與傳統(tǒng)評估方法在準確性方面進行比較,所采用的對比評估方法為文獻[3]的基于AHP層次分析法和文獻[6]的基于模糊決策分析的用戶行為評估方法,選擇用戶交互成功率作為評價指標。實驗同樣采用以上四種不同信任級別的實體進行用戶行為評估,設定用戶實體節(jié)點數目為100個,其中高度可信用戶實體比例為0.3,一般可信用戶實體比例為0.4,臨界可信用戶實體比例為0.2,不可信用戶實體比例為0.1,用戶交互次數為200次,服務器提供的服務數目為200。
圖4 交互成功率對比圖
如圖4所示,隨著交互次數的增多,三種用戶行為評估方法的用戶交互成功率均呈現上升趨勢,但基于AHP的用戶行為評估方法在交互過程中的交互成功率會產生較大波動,主要原因是在用戶行為評價指標的獲取和評級過程中,專家意見和歷史經驗起關鍵作用,導致用戶行為指標權重具有主觀性,量化結果波動較為明顯;基于模糊決策分析的用戶行為評估方法在交互過程中的交互成功率較低,而且也有部分波動現象,主要原因在于這種方法的用戶行為可信隸屬度評級不夠準確,證據權重因素不全面,使得可信評估結果量化粒度粗,整體交互成功率偏低;而所采用的評估方法在交互過程中的交互成功率較AHP方法和基于模糊決策分析的交互成功率較高且較為穩(wěn)定,主要原因在于所采用的評估方法在用戶行為評估過程中,摒棄專家意見和歷史經驗對用戶行為指標權重的主導作用,采用熵權法來建立用戶行為評價指標及綜合指標權重,并運用模糊算子和加權平均原則對評估結果進行精確量化,評估結果合理準確,切合實際,相比于其他評估方法,在安全性和準確性方面都有所提高。
隨著網絡技術與應用的快速發(fā)展,終端用戶行為的復雜性和開放性使得網絡安全面臨嚴峻挑戰(zhàn),而對網絡終端用戶的可信性評估顯得尤為重要。結合模糊綜合評估理論提出了一種基于模糊綜合策略的網絡用戶行為可信評估方法,采用熵權法來構建用戶行為的綜合指標權重,并運用模糊算子和加權平均原則保證了評估結果的精確量化。實驗結果表明,該評估方法能夠在復雜網絡環(huán)境中對用戶行為進行全面、準確和動態(tài)的量化評估。結合可信網絡連接控制機制,將評估機制擴展到可信網絡中將是下一步工作方向。
[1] 林 闖,田立勤,王元卓.可信網絡中用戶行為可信的研究[J].計算機研究與發(fā)展,2008,45(12):2033-2043.
[2] 田立勤,林 闖.可信網絡中一種基于行為信任預測的博弈控制機制[J].計算機學報,2007,30(11):1930-1938.
[3] 冀鐵果,田立勤,胡志興,等.可信網絡中一種基于AHP的用戶行為評估方法[J].計算機工程與應用,2007,43(19):123-126.
[4] Xi Zhenyuan, Chen He, Wang Xiaozhong, et al. Evaluation model for computer network information security based on analytic hierarchy process[C]//Intelligent information technology application.[s.l.]:[s.n.],2009:186-189.
[5] 武小年,周勝源.數據挖掘在用戶行為可信研究中的應用[C]//第十一屆保密通信與信息安全現狀研討會論文集.廈門:出版地不詳,2009.
[6] 馬軍煜,趙知勁,葉學義.基于模糊決策分析的可信網絡用戶行為評估[J].計算機工程,2011,37(13):125-127.
[7] 呂艷霞,田立勤,孫珊珊.云計算環(huán)境下基于FANP的用戶行為的可信評估與控制分析[J].計算機科學,2013,40(1):132-135.
[8] Hosseini S B,Shojaee A,Agheli N.A new method for evaluating cloud computing user behavior trust[C]//Proceedings of the 7th information and knowledge technology.[s.l.]:[s.n.],2015:1-6.
[9] Tian Liqin,Lin Chuang,Ni Yang.Evaluation of user behavior trust in cloud computing[C]//Proceedings of the computer application and system modeling.Taiyuan,Shanxi:[s.n.],2010.
[10] Li Wen,Ping Lingdi,Lu Kuijun,et al.Trust model of users’ behavior in trustworthy internet[C]//Proceedings of the information engineering.Taiyuan,Shanxi:[s.n.],2009:403-406.
[11] Yang Xiaoqiong,Liu Lianzhong,Zou Rongbo.A statistical user behavior trust evaluation algorithm based on cloud model[C]//Proceedings of the 6th computer science and convergence information technology.Jeju,Seogwipo:[s.n.],2011:598-603.
[12] Shan Xiaohong,Sun Huamei,Ge Gaoxin.The research of web users’ behavior analysis based on Web Log Mining[C]//E-Business and E-Government (ICEE).Shanghai:[s.n.],2011:1-4.
[13] 陸 悠,羅軍舟,李 偉,等.面向網絡狀態(tài)的自適應用戶行為評估方法[J].通信學報,2013,34(7):71-80.
[14] 田 野,彭新光,李宏濱,等.網絡用戶行為可信性集值統(tǒng)計度量方法[J].小型微型計算機系統(tǒng),2013,34(10):2354-2357.
User Behavior Evaluation in Trusted Network Based on Fuzzy Comprehensive Strategy
ZHANG Jia-le1,ZHANG Xiu-fang2,ZHANG Gui-ling1
(1.School of Computer Science & Software Engineering,Tianjin Polytechnic University,Tianjin 300387,China;2.Institute of Mathematics & Information Science,Langfang Teachers University,Langfang 065000,China)
The credibility evaluation of network user behavior is one of the hot spots in the field of trusted network.Due to the problems of subjectivity,limitations and static for the traditional user behavior evaluation ways in trusted network,a new trust evaluation method based on Fuzzy Comprehensive Strategy (FCS) has been put forward,and the user behavior trust evaluation model has been designed by combining with the trusted network user behavior measurement mechanism.In the new trusted evaluation model,user behaviors and attributes have been mined and analyzed by using fuzzy comprehensive evaluation method.Thus the evaluation indexes and the index weights can be constructed.The accurate user behavior evaluation quantization results have been obtained by weighted computing with proposed fuzzy operators based on indexes and index weights above.Experimental simulation have evaluated the four kinds of user behaviors with FCS evaluation methods,and compared them with the other two kinds of trusted evaluation methods of user behavior.The experiments and analysis show that the proposed methods can evaluate the user’s behavior comprehensively,accurately and dynamically in complex network environments and the simulation results are more realistic.
trusted network;user behavior evaluation;fuzzy comprehensive strategy;comprehensive index weight;fuzzy operator
2016-06-21
2016-09-22 網絡出版時間:2017-03-13
天津市重點投資人才引進計劃基金項目(029416)
張佳樂(1994-),男,碩士研究生,研究方向為可信計算、網絡安全;張秀芳,博士,講師,研究方向為網絡安全;張桂玲,博士,教授,研究方向為可信計算、網絡安全、圖像處理。
http://kns.cnki.net/kcms/detail/61.1450.TP.20170313.1548.106.html
TP393
A
1673-629X(2017)05-0138-06
10.3969/j.issn.1673-629X.2017.05.029