摘要:跨系統(tǒng)協(xié)同過濾推薦算法與信息管理系統(tǒng)間存在緊密的關(guān)系。為了應(yīng)對(duì)不良商家利用托攻擊帶來的挑戰(zhàn),并提高推薦的準(zhǔn)確性,本文設(shè)計(jì)了一種跨系統(tǒng)協(xié)同過濾推薦算法,其結(jié)合安全多方計(jì)算理論與隨機(jī)擾亂技術(shù),可有效保證用戶隱私不泄露給協(xié)同系統(tǒng),并在此基礎(chǔ)上,可以精確地計(jì)算用戶間的相似度,降低預(yù)測(cè)誤差。通過試驗(yàn)驗(yàn)證,該算法能夠有效防止不良商家的托攻擊行為,并顯著提高推薦系統(tǒng)的準(zhǔn)確性。
關(guān)鍵詞:協(xié)同過濾算法;安全計(jì)算模型;隱私保護(hù)
中圖分類號(hào):TP309""""""""" 文獻(xiàn)標(biāo)志碼:A
隨著信息技術(shù)的發(fā)展和普及,信息管理系統(tǒng)在各個(gè)領(lǐng)域中得到廣泛應(yīng)用,信息管理系統(tǒng)中的隱私保護(hù)與信息安全成為了亟待解決的重要問題??缦到y(tǒng)協(xié)同過濾推薦算法是一種用于推薦系統(tǒng)的算法,通過整合多個(gè)獨(dú)立的推薦系統(tǒng),共同提供個(gè)性化的推薦結(jié)果。傳統(tǒng)的協(xié)同過濾算法主要利用單一系統(tǒng)內(nèi)的用戶-項(xiàng)目評(píng)分矩陣來進(jìn)行推薦操作,跨系統(tǒng)協(xié)同過濾推薦算法則擴(kuò)展了這個(gè)概念,將多個(gè)系統(tǒng)中的用戶和項(xiàng)目數(shù)據(jù)進(jìn)行聯(lián)合分析和推薦。信息管理系統(tǒng)提供數(shù)據(jù)源和數(shù)據(jù)共享機(jī)制,為跨系統(tǒng)協(xié)同過濾推薦算法提供支持和基礎(chǔ)。
1傳統(tǒng)的協(xié)同過濾算法的問題
傳統(tǒng)的協(xié)同過濾算法在實(shí)際應(yīng)用中存在以下問題。1)數(shù)據(jù)稀疏性:協(xié)同過濾算法利用用戶-項(xiàng)目評(píng)分矩陣來進(jìn)行推薦,但是大部分用戶只對(duì)少數(shù)項(xiàng)目進(jìn)行評(píng)分,這導(dǎo)致算法難以準(zhǔn)確地預(yù)測(cè)用戶對(duì)未評(píng)分項(xiàng)目的興趣。2)冷啟動(dòng)問題:當(dāng)新用戶加入系統(tǒng)或推出新項(xiàng)目時(shí),因?yàn)槿狈ψ銐虻脑u(píng)分?jǐn)?shù)據(jù)進(jìn)行準(zhǔn)確推薦,所以協(xié)同過濾算法無法準(zhǔn)確預(yù)測(cè)他們的興趣。3)算法偏好:傳統(tǒng)的協(xié)同過濾算法主要基于用戶間的相似度或項(xiàng)目間的相似度來進(jìn)行推薦。這種方法容易使推薦結(jié)果出現(xiàn)算法偏好,即推薦給用戶的項(xiàng)目往往與他們喜歡的項(xiàng)目相似,缺乏多樣性。4)靈活性差:傳統(tǒng)的協(xié)同過濾算法通常只考慮用戶-項(xiàng)目間的關(guān)系,忽略了其他因素的影響,例如時(shí)間、地點(diǎn)、社交關(guān)系等。這限制了算法在個(gè)性化推薦方面的靈活性和準(zhǔn)確性。5)數(shù)據(jù)隱私問題:協(xié)同過濾算法需要收集和分析用戶的個(gè)人數(shù)據(jù),涉及用戶隱私。如果不妥善保護(hù),就可能引發(fā)數(shù)據(jù)泄露和濫用的風(fēng)險(xiǎn)。
2跨系統(tǒng)的隱私保持協(xié)同過濾算法
2.1提出問題
跨系統(tǒng)協(xié)同過濾是指在不同系統(tǒng)間共享個(gè)性化推薦服務(wù),對(duì)系統(tǒng)間進(jìn)行協(xié)作。在這種情況下,不同系統(tǒng)可以通過共享用戶評(píng)分和模型來提高推薦的準(zhǔn)確性和個(gè)性化程度。假設(shè)存在n個(gè)系統(tǒng):S1,S2,…,Sn,則系統(tǒng)i的用戶評(píng)分矩陣如公式(1)所示。
(1)
式中:(Ri)n,n為系統(tǒng)i中的用戶對(duì)第n個(gè)項(xiàng)目的評(píng)分。
鎖定了目標(biāo)用戶后,利用協(xié)同過濾推薦技術(shù),使不同系統(tǒng)間能夠攜手合作。通過各個(gè)系統(tǒng)間的協(xié)作,結(jié)合各個(gè)系統(tǒng)中所有用戶的評(píng)分?jǐn)?shù)據(jù),預(yù)測(cè)用戶對(duì)某個(gè)特定項(xiàng)目的評(píng)分。
隨機(jī)擾亂技術(shù)是一種保護(hù)用戶隱私的方法,它通過對(duì)原始數(shù)據(jù)進(jìn)行隨機(jī)化噪聲處理,來保護(hù)用戶評(píng)分信息。在協(xié)同過濾推薦系統(tǒng)中,當(dāng)需要計(jì)算用戶相似度時(shí),可以使用隨機(jī)擾亂技術(shù)來保證評(píng)分信息不會(huì)泄露給其他協(xié)作系統(tǒng)。利用隨機(jī)擾亂技術(shù),當(dāng)跨系統(tǒng)推薦時(shí),協(xié)同過濾推薦系統(tǒng)能夠保障用戶隱私的安全。同時(shí),這種方法也可以降低數(shù)據(jù)共享帶來的用戶隱私泄露風(fēng)險(xiǎn),提高用戶對(duì)推薦系統(tǒng)的信任度。
設(shè)想有兩個(gè)均值均為0的向量,分別標(biāo)記為A=(a1,a2,…,an)和B=(b1,b2,…,bn)。通過對(duì)向量A和B應(yīng)用向量∈=(∈1,∈2,…,∈n)和向量δ=(δ1,δ2,…,δn)的隨機(jī)擾動(dòng),可以得到新的向量A'=A+∈,B'=B+δ。在這個(gè)過程中,向量∈和δ的隨機(jī)化數(shù)據(jù)是遵循高斯分布或均勻分布的,其數(shù)值為[-m,m]。根據(jù)這種形式,基于A'·B'可以有效地估算所需A·B的數(shù)值。如公式(2)所示。
(2)
因?yàn)橄蛄緼和δ均值均為0并且相互獨(dú)立,因此能夠得
出ai≈0。同理,能夠得出bi≈0以及由
此可以得出公式(3)。
在隨機(jī)擾亂處理前,標(biāo)準(zhǔn)化處理是一項(xiàng)重要的步驟,它有助于縮小推薦算法的誤差。通過運(yùn)用z-score標(biāo)準(zhǔn)化方法,可基于算術(shù)均值和標(biāo)準(zhǔn)差消除不同特征間量綱差異,完成原始數(shù)據(jù)轉(zhuǎn)化,從而提高算法的穩(wěn)定性和準(zhǔn)確性。其計(jì)算過程如公式(4)所示。
(4)
式中:Rui為用戶u對(duì)項(xiàng)目i的原始評(píng)分;Ru、σu、Iu分別為用戶u的評(píng)分均值、標(biāo)準(zhǔn)差以及項(xiàng)目集合。標(biāo)準(zhǔn)差的計(jì)算過程如公式(5)所示。
2/Iu(5)
當(dāng)采用隨機(jī)擾亂技術(shù)時(shí),需要注意的是擾亂過度可能會(huì)影響推薦算法的精確度。可以通過改進(jìn)相似度度量標(biāo)準(zhǔn)來提高推薦的準(zhǔn)確性。保護(hù)用戶隱私的同時(shí),也能提高推薦系統(tǒng)的準(zhǔn)確性和用戶滿意度。
2.2安全計(jì)算模型
本文提出了一種基于安全多方計(jì)算的理論模型,這為跨系統(tǒng)的協(xié)同過濾提供了安全保障。在該模型中,用多個(gè)公共的第三方來保障原始數(shù)據(jù)的安全傳遞,從而避免了數(shù)據(jù)泄露給中間節(jié)點(diǎn)的風(fēng)險(xiǎn)。通過使用輕量
級(jí)分組密碼系統(tǒng)LBlock和RSA加密算法,本文的安全計(jì)算模型能夠有效地保護(hù)數(shù)據(jù)的機(jī)密性和完整性。LBlock有高效的數(shù)據(jù)加密和解密功能,用RSA保護(hù)密鑰的安全性。這樣即使在跨系統(tǒng)協(xié)同過濾過程中有潛在的安全風(fēng)險(xiǎn)和攻擊威脅,也能夠保障數(shù)據(jù)的安全傳輸。同時(shí),引入混淆傳輸?shù)母拍?,防止第三方惡意串通。通過混淆傳輸,使第三方無法獲知真實(shí)的數(shù)據(jù)內(nèi)容,提高數(shù)據(jù)的安全性和隱私保護(hù)。安全計(jì)算模型如圖1所示。
該安全計(jì)算模型使用RSA密碼系統(tǒng)生成公鑰和私鑰,利用LBlock密碼系統(tǒng)生成密鑰,并通過加密和解密操作安全傳輸數(shù)據(jù)。同時(shí),使用茫然傳輸協(xié)議保護(hù)數(shù)據(jù)免受第三方的惡意串通。具體步驟如下[1]。所有系統(tǒng)都會(huì)創(chuàng)建一對(duì)RSA公鑰PK和私鑰SK。將公鑰分享給其他系統(tǒng),而將私鑰則安全地傳遞給n個(gè)第三方機(jī)構(gòu)。2)所有系統(tǒng)使用LBlock密碼系統(tǒng)生成n個(gè)獨(dú)立的密鑰Ki。3)各系統(tǒng)會(huì)使用之前分享的RSA公鑰對(duì)每個(gè)密鑰進(jìn)行加密,生成對(duì)應(yīng)的密文K'i。將這些密文傳送到LBlock密鑰庫(kù)中。4)第三方機(jī)構(gòu)i從密鑰庫(kù)中檢索到對(duì)應(yīng)的密文K'i后,利用先前接收的RSA私鑰進(jìn)行解密操作,進(jìn)而還原原始的密鑰Ki。5)當(dāng)需要發(fā)送數(shù)據(jù)時(shí),所有系統(tǒng)會(huì)使用與其對(duì)應(yīng)的密鑰Ki,通過LBlock算法對(duì)數(shù)據(jù)進(jìn)行加密,生成加密后的密文ci。6)基于茫然傳輸協(xié)議可將完成加密的密文ci安全無誤地輸送至中間節(jié)點(diǎn)。7)中間節(jié)點(diǎn)將在n個(gè)第三方機(jī)構(gòu)所提供的密文組中挑選一組數(shù)據(jù)ci,且以安全的方式將其轉(zhuǎn)交給目標(biāo)系統(tǒng)。8)目標(biāo)系統(tǒng)會(huì)使用與密文ci對(duì)應(yīng)的密鑰Ki,通過LBlock解密算法還原原始的數(shù)據(jù)mi。
通過這樣的流程,可以保障數(shù)據(jù)的傳輸和存儲(chǔ)過程都是安全的,同時(shí)保護(hù)了用戶的隱私,并提高了系統(tǒng)的整體安全性。
2.3模型優(yōu)化
2.4隱私保護(hù)推薦算法
可以將基于安全計(jì)算模型和隨機(jī)擾動(dòng)的跨系統(tǒng)協(xié)同過濾推薦算法描述為一種隱私保護(hù)的推薦算法。它通過安全計(jì)算模型和隨機(jī)擾動(dòng)技術(shù),保證用戶的個(gè)人信息在推薦過程中不會(huì)泄露。這種算法允許不同系統(tǒng)間進(jìn)行協(xié)同過濾推薦,無須共享用戶的真實(shí)數(shù)據(jù)。同時(shí),通過引入隨機(jī)擾動(dòng),推薦結(jié)果會(huì)有一定程度的變化,使攻擊者無法準(zhǔn)確了解用戶的真實(shí)偏好。保護(hù)用戶隱私的同時(shí),提供個(gè)性化且準(zhǔn)確的推薦結(jié)果。
以系統(tǒng)Alice和Bob為例,評(píng)分?jǐn)?shù)據(jù)會(huì)對(duì)其進(jìn)行z-score標(biāo)準(zhǔn)化處理,并得到數(shù)據(jù)rui。同時(shí)引入隨機(jī)噪聲進(jìn)行擾動(dòng)。這樣即使在協(xié)同過濾推薦系統(tǒng)中,存在潛在的安全風(fēng)險(xiǎn)和攻擊威脅,也能夠保護(hù)用戶的隱私和數(shù)據(jù)的安全性。同時(shí),由于評(píng)分?jǐn)?shù)據(jù)通常較小,因此加性加入噪聲的方法能夠有效地增強(qiáng)數(shù)據(jù)的隱私保護(hù)效果。為增強(qiáng)隱私保護(hù)效果,對(duì)處理后的數(shù)據(jù)rui添加隨機(jī)擾動(dòng)。具體做法:將rui加上一個(gè)隨機(jī)數(shù)γui,得到擾動(dòng)后的數(shù)據(jù)r'ui=rui+γui。這里的γui可以是服從高斯分布或均勻分布在一定范圍內(nèi)的隨機(jī)數(shù)。
通過這樣的處理,評(píng)分?jǐn)?shù)據(jù)標(biāo)準(zhǔn)化,在每個(gè)系統(tǒng)中添加隨機(jī)擾動(dòng),以保護(hù)用戶的隱私協(xié)同過濾推薦計(jì)算中,使用處理后的評(píng)分?jǐn)?shù)據(jù)r'ui來進(jìn)行相似度計(jì)算、預(yù)測(cè)等操作,從而生成最終的推薦結(jié)果。
根據(jù)輸入的描述,基于RSA密碼系統(tǒng)和LBlock密碼系統(tǒng)的跨系統(tǒng)協(xié)同過濾推薦算法的過程如下。1)Alice和Bob共同生成一對(duì)密鑰,包括公鑰PK和私鑰SK,將公鑰PK安全地發(fā)送給第三方。2)利用LBlock密碼系統(tǒng),Alice和Bob分別創(chuàng)建了n個(gè)密鑰,KAi和KBi,并在LBlock密鑰庫(kù)中存放這些密鑰加密后的密文。3)第三方機(jī)構(gòu)提取密鑰庫(kù)中完成加密的密鑰密文,通過私鑰SK對(duì)其逐一進(jìn)行解密操作,從而獲取KAi、KBi。第三方使用KAi對(duì)數(shù)據(jù)RA、rA進(jìn)行加密,生成R'A、r'A;同樣,使用KBi對(duì)數(shù)據(jù)RB、rB進(jìn)行加密,生成R'B、r'B。4)第三方將加密后的數(shù)據(jù)密文組(c1、c2、...、cn)傳輸至中間節(jié)點(diǎn)。中間節(jié)點(diǎn)在密文組中挑選對(duì)應(yīng)數(shù)據(jù)ci,同時(shí)向Alice、Bob分別傳輸R'A和r'A、R'B和r'B。5)Alice與Bob接收到密文后各自運(yùn)用相應(yīng)密鑰KAi、KBi進(jìn)行解密,從而分別獲取其原始數(shù)據(jù)RA、rA和RB、rB。6)Alice與Bob分別將其組合后的數(shù)據(jù)XA+RA與YB+RB發(fā)送給對(duì)方。7)Bob進(jìn)一步處理數(shù)據(jù),將X'YB+rB和|IB|發(fā)送給Alice。8)Alice利用接收到的數(shù)據(jù)計(jì)算差值X'YB+rB-Y'RA+rA,得到XA與YB的乘積。9)Alice基于XAYB和|IB|,通過相似度近似估計(jì)目標(biāo)-Bob用戶的相似度。10)Alice采用預(yù)測(cè)評(píng)分公式來計(jì)算特定項(xiàng)目的預(yù)測(cè)評(píng)分Pui。
通過以上步驟,基于RSA密碼系統(tǒng)和LBlock密碼系統(tǒng)的跨系統(tǒng)協(xié)同過濾推薦算法可對(duì)目標(biāo)用戶進(jìn)行個(gè)性化推薦。
3試驗(yàn)及分析
3.1安全性能試驗(yàn)
為了研究不同密鑰長(zhǎng)度對(duì)RSA算法執(zhí)行效率的影響,選擇512位、1024位和2048位3種長(zhǎng)度進(jìn)行測(cè)試,并詳細(xì)記錄了密鑰生成、加密及解密所需的時(shí)間。測(cè)試結(jié)果表明,隨著RSA密鑰長(zhǎng)度增加,生成密鑰所需的計(jì)算時(shí)間顯著增長(zhǎng),而加密與解密操作所需的計(jì)算時(shí)間雖然也有所增加,但增長(zhǎng)相對(duì)平緩。在RSA密鑰生成過程中,需要生成兩個(gè)大素?cái)?shù),并計(jì)算其乘積作為公鑰模數(shù)。隨著密鑰長(zhǎng)度增加,找到足夠大的素?cái)?shù)變得更加困難,因此密鑰生成時(shí)間呈指數(shù)級(jí)增長(zhǎng)。而在RSA加密和解密過程中,涉及對(duì)大數(shù)進(jìn)行模冪運(yùn)算。模冪運(yùn)算的時(shí)間復(fù)雜度為指數(shù)級(jí),由于使用了快速模冪算法等優(yōu)化技術(shù),因此加密和解密時(shí)間呈線性增長(zhǎng)趨勢(shì)。為保障RSA算法安全,應(yīng)選擇足夠大的素?cái)?shù)作為密鑰,這樣可以大大降低攻擊者通過公鑰推導(dǎo)出私鑰的可能性。
3.2相似性度量比較
為比較跨系統(tǒng)協(xié)同過濾和單系統(tǒng)協(xié)同過濾的精度,本文進(jìn)行對(duì)比試驗(yàn)。首先,為對(duì)比跨系統(tǒng)協(xié)作過濾與單系統(tǒng)協(xié)作過濾器的精度,本文進(jìn)行比較試驗(yàn)。從數(shù)量相對(duì)稀少的資料表隨機(jī)選擇一百個(gè)用戶打分向量作為系統(tǒng)A,從數(shù)量相對(duì)密集的資料表隨機(jī)選擇一百個(gè)用戶打分向量作為系統(tǒng)B。因?yàn)橛嘘P(guān)系統(tǒng)A的信息極其稀少,所以系統(tǒng)A給系統(tǒng)B發(fā)送協(xié)同運(yùn)算要求,接受到反饋后,兩系統(tǒng)按PPCFSCM方法進(jìn)行協(xié)同運(yùn)算。對(duì)系統(tǒng)A、系統(tǒng)B以及系統(tǒng)A和系統(tǒng)B間的跨系統(tǒng)協(xié)作算法進(jìn)行均方絕對(duì)誤差(MAE)比較試驗(yàn)。研究結(jié)果表明,隨著數(shù)據(jù)集的稀疏性增強(qiáng),協(xié)同過濾的推薦精度呈現(xiàn)下降趨勢(shì)。在跨系統(tǒng)協(xié)作計(jì)算中,數(shù)據(jù)經(jīng)過加密和茫然傳輸?shù)劝踩胧┍Wo(hù),第三方只能獲取加密后的數(shù)據(jù),無法獲知真實(shí)的數(shù)據(jù)內(nèi)容。因此,通過跨系統(tǒng)協(xié)作計(jì)算和基于安全計(jì)算模型的數(shù)據(jù)保護(hù)措施,可以在用戶數(shù)據(jù)稀疏的情況下提高協(xié)同過濾推薦算法的精度,保障用戶隱私的安全性。
4結(jié)語
本文對(duì)信息管理系統(tǒng)的隱私保護(hù)與信息安全問題進(jìn)行深入研究。通過運(yùn)用安全多方計(jì)算理論、輕量級(jí)分組密碼算法和RSA密碼系統(tǒng)等技術(shù),提出了安全計(jì)算模型,該安全計(jì)算模型和算法可保護(hù)用戶隱私,提高推薦算法的準(zhǔn)確性和安全性,為信息管理系統(tǒng)的隱私保護(hù)和信息安全問題提供了有效的解決方案。因此,信息管理系統(tǒng)的隱私保護(hù)與信息安全問題的研究具有重要意義。
參考文獻(xiàn)
[1]劉國(guó)麗,李昂,李艷萍,等. 跨系統(tǒng)協(xié)同過濾推薦算法的隱私保護(hù)技術(shù)研究[J]. 計(jì)算機(jī)應(yīng)用研究,2017,34(9):4.
[2]張明磊,韓明,王震洲. 基于安全多方計(jì)算的系統(tǒng)間隱私保持推薦算法[J]. 河北工業(yè)大學(xué)學(xué)報(bào),2012(4):5.