胡北辰
摘要:傳統(tǒng)的加密方法對(duì)用戶行為和約束條件的劃分結(jié)果不佳,導(dǎo)致加密后的信息存在局部可識(shí)別,因此提出基于密度峰值的網(wǎng)絡(luò)用戶信息聚類局部自適應(yīng)加密方法。該方法基于密度峰值重新聚類分析網(wǎng)絡(luò)用戶信息;利用混沌系統(tǒng)獲取網(wǎng)絡(luò)用戶不確定行為特征;通過多目標(biāo)追蹤不同數(shù)據(jù)優(yōu)先級(jí),實(shí)現(xiàn)對(duì)信息自適應(yīng)的精準(zhǔn)控制;根據(jù)約束條件和限制條件調(diào)整聚類局部信息,實(shí)現(xiàn)全方位的信息加密。根據(jù)實(shí)驗(yàn)測(cè)試結(jié)果可知:與傳統(tǒng)方法相比,所提出加密方法加密后的網(wǎng)絡(luò)用戶信息被完全覆蓋,可識(shí)別率為0。由此可見,該方法的加密效果更好。
關(guān)鍵詞:密度峰值;網(wǎng)絡(luò)用戶;信息聚類;局部自適應(yīng)加密
中圖分類號(hào):TP393文獻(xiàn)標(biāo)志碼:A
文章編號(hào):2095-5383(2020)04-0043-05
Research on Local Adaptive Encryption of Network
User Information Clustering based on Density Peaks
HUBeichen
(Department of Information and Intelligent Engineering,Anhui Electronic Information Vocational College, Bengbu 233000, China)
Abstract:The traditional encryption method has poor results in dividing user behaviors and constraints, which leads to local identifiability of the encrypted information. Therefore, a local adaptive encryption method based on density peaks for network user information clustering was proposed. This method re-clusteres and analyzes network user information based on density peaks, uses chaotic systems to obtain network user uncertain behavior characteristics, tracks multiple data priorities through multiple targets to achieve precise and adaptive control of information, adjusts and clusters the local information according to the constraints and restrictions to realize comprehensive information encryption. According to the experimental test results, compared with the traditional method, the network user information encrypted by the proposed encryption method is completely covered, and the recognition rate is 0. It can be seen that the encryption effect of this method is better.
Keywords:
peak density; network users; information clustering; local adaptive encryption
隨著技術(shù)水平的不斷提高,互聯(lián)網(wǎng)的發(fā)展越來越迅捷,越來越多的人們通過使用互聯(lián)網(wǎng)平臺(tái),實(shí)現(xiàn)日常生產(chǎn)生活需要。但互聯(lián)網(wǎng)的發(fā)展是一把雙刃劍,方便人們獲取生活工作所需信息的同時(shí),會(huì)使大量用戶信息在網(wǎng)絡(luò)中泄露,導(dǎo)致個(gè)人信用安全以及財(cái)產(chǎn)安全受到威脅,因此文獻(xiàn)[1]提出了一種網(wǎng)絡(luò)用戶信息加密方法,通過對(duì)信息特征聚類,實(shí)現(xiàn)用戶信息自適應(yīng)加密;文獻(xiàn)[2]提出,通過變換Fourier二維離散分?jǐn)?shù)階,實(shí)現(xiàn)對(duì)用戶信息的加密;文獻(xiàn)[3]則利用全同態(tài)加密的有限域FFT算法,實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)用戶信息的加密。但這些加密方法在對(duì)明文用戶信息進(jìn)行加密時(shí),由于獲取的聚類特征不明顯、約束條件目標(biāo)不明確,致使加密信息存在漏洞,出現(xiàn)沒有被亂碼覆蓋的可識(shí)別用戶信息,因此本文針對(duì)文獻(xiàn)所提出加密方法的共性特征,提出基于密度峰值的網(wǎng)絡(luò)用戶信息聚類局部自適應(yīng)加密方法,與傳統(tǒng)方法相比,用所提出加密方法加密后的網(wǎng)絡(luò)用戶信息被完全覆蓋,加密效果更好。
1 基于密度峰值的網(wǎng)絡(luò)用戶信息加密方法1.1 基于密度峰值聚類網(wǎng)絡(luò)用戶信息
設(shè)置網(wǎng)絡(luò)用戶信息存在s個(gè)鄰域,將基于密度峰值的計(jì)算范圍重新定義,從整個(gè)網(wǎng)絡(luò)用戶信息樣本集合,縮減到與s個(gè)鄰域相對(duì)應(yīng)的范圍,以此實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)用戶信息真實(shí)分布的聚類,該調(diào)整公式為:
ρi=∑j∈sexp-bijavgi(1)
其中:i為屬于鄰域s的范圍之內(nèi)的常數(shù); j為網(wǎng)絡(luò)用戶樣本常數(shù);ρi為重新定義的密度峰值;bij為樣本i與樣本j之間的歐氏距離;avgi為樣本i到s個(gè)鄰域的均值距離[4]。根據(jù)設(shè)定的密度峰值,通過重新設(shè)定交叉算子,實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)用戶信息的聚類,改進(jìn)后的交叉算子概率定義為:
Pρ=ehc-h′hmax-hc1+eat+Pρ1,h′≥hc11+hchmaxeat+Pρ1,h′ 集合式(1)的密度峰值得到上述方程組,其中:Pρ為密度峰值為ρ的交叉算子概率;hc為交叉值為c的當(dāng)代種群平均適應(yīng)度;h′為交叉?zhèn)€體中數(shù)值較大的適應(yīng)度;hmax為當(dāng)代種群適應(yīng)度的最大值;Pρ1為聚類算法收斂時(shí)的極限交叉概率,通常取值為0.01;a為迭代次數(shù);t為聚類算法中交叉算子種群的進(jìn)化代數(shù)。根據(jù)上述交叉算子,重新定義聚類算法[5]。由于需要加密的網(wǎng)絡(luò)用戶信息集合中,密度峰值點(diǎn)區(qū)分度不高且存在多密度峰值數(shù)據(jù),因此利用上式改進(jìn)交叉算子后的聚類算法,根據(jù)密度峰值計(jì)算所得結(jié)果,從網(wǎng)絡(luò)用戶信息集合中求得最優(yōu)簇中心,實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)用戶信息的聚類。根據(jù)式(1),已知i個(gè)數(shù)據(jù)樣本的密度峰值為ρi,計(jì)算可能為最優(yōu)簇的聚類中心,得到樣本特征分布示意圖[6],如圖1所示。 圖1中,面積較小的實(shí)心圓表示普通簇;面積較大的實(shí)心圓表示可能最優(yōu)簇。將可能最優(yōu)簇按照降序排列,根據(jù)排列結(jié)果設(shè)置序列圖,用n表示數(shù)據(jù)集合排序規(guī)模。找出排序后集合中,可能最優(yōu)簇的跳躍點(diǎn)對(duì)應(yīng)的樣本s′,選擇前mins′2,n個(gè)點(diǎn)作為可能聚類中心集合,該集合用B表示,擴(kuò)大聚類算法遺傳k值初始化時(shí),網(wǎng)絡(luò)用戶信息聚合中,聚類中心的選擇范圍,在根據(jù)式(2)實(shí)現(xiàn)聚類中心的自動(dòng)選取,從而基于密度峰值,實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)用戶信息的聚類。 1.2 混沌系統(tǒng)獲取網(wǎng)絡(luò)用戶不確定行為特征 根據(jù)得到的用戶信息聚類結(jié)果,利用混沌系統(tǒng)獲取其中網(wǎng)絡(luò)用戶的不確定行為特征,確保網(wǎng)絡(luò)用戶信息加密時(shí),可以實(shí)現(xiàn)對(duì)所有用戶行為的數(shù)據(jù)加密。將網(wǎng)絡(luò)用戶的不確定行為默認(rèn)為混沌現(xiàn)象,即存在1個(gè)封閉區(qū)間,當(dāng)該區(qū)間LU上的連續(xù)自映射函數(shù) fx滿足一定條件時(shí),可認(rèn)定函數(shù) fx存在混沌現(xiàn)象。其中:L為用戶行為類型封閉區(qū)間;U為所有行為集合; fx表示用戶行為預(yù)測(cè)函數(shù)。根據(jù)上述混沌數(shù)據(jù)設(shè)計(jì)1個(gè)混沌加密框架,如圖2所示[7]。 由圖2可知,通過混沌系統(tǒng)獲取用戶不確定行為特征,實(shí)現(xiàn)對(duì)用戶基本信息的加密。設(shè)置混沌序列中的用戶行為狀態(tài)變量分別為x、y、z和v,與之相對(duì)應(yīng)的加密控制參數(shù)設(shè)置為a、b、c、d,則混沌序列組合過程為: xi,xi+1,xi+2,…,xi+kA0,xi+k+1,xi+k+2,xi+2,…,xi+2k,A4…yi,yi+1,yi+2,…,yi+kA1,yi+k+1,yi+k+2,yi+2,…,yi+2k,A5…zi,zi+1,zi+2,…,zi+kA2,zi+k+1,zi+k+2,zi+2,…,zi+2k,A6…vi,vi+1,vi+2,…,vi+kA3,vi+k+1,vi+k+2,vi+2,…,vi+2k,A7…→ A={A0,A1,A2,…} (3) 其中:A表示混沌序列組合。根據(jù)該組合,重新設(shè)置混沌系統(tǒng)中,影響混沌特性的其余加密控制參數(shù)。當(dāng)混沌系統(tǒng)的初始條件為[0,0.01,0.01,0.01,0.01],則其余加密控制參數(shù)的變化取值如表1所示[8]。 當(dāng)混沌系統(tǒng)中某一參數(shù)變化時(shí),系統(tǒng)狀態(tài)變量x、v隨這些參數(shù)的變化而變化,其中參數(shù)f、g、h與x的演化規(guī)律一致;m、n與v的演化規(guī)律一致。綜合上述混沌變量和混沌參數(shù),得出網(wǎng)絡(luò)用戶不確定行為特征參考數(shù)據(jù): dx/dN=ay-hzdy/dN=bz-gx-dxydz/dN=cz-nv-fx-dxydv/dN=dz-mv(4) 其中:N為迭代次數(shù)。根據(jù)上述求得的各個(gè)狀態(tài)的相互關(guān)系值,得到網(wǎng)絡(luò)用戶不確定行為特征,為數(shù)據(jù)加密提供突發(fā)性行為的變換特征數(shù)量[9]。 1.3 不同優(yōu)先級(jí)的多目標(biāo)追蹤自適應(yīng)控制 根據(jù)不同用戶的不確定行為特征數(shù)量,設(shè)置目標(biāo)數(shù)據(jù)集合,并設(shè)置等級(jí)不同的目標(biāo)追蹤優(yōu)先級(jí),實(shí)現(xiàn)追蹤優(yōu)先目標(biāo)的自適應(yīng)控制,以便于在處理與分析網(wǎng)絡(luò)用戶信息的過程中,可以根據(jù)用戶不確定行為特征,自動(dòng)設(shè)置加密調(diào)整順序、調(diào)整參數(shù)、約束條件以及邊界條件,令調(diào)整后的數(shù)據(jù)信息與需要加密信息的分布特征、結(jié)構(gòu)特征相適應(yīng),以便于實(shí)現(xiàn)最優(yōu)加密[10],如圖3所示。 根據(jù)上述追蹤控制效果,對(duì)移動(dòng)節(jié)點(diǎn)檢測(cè)到的目標(biāo)進(jìn)行適配度評(píng)估。評(píng)估內(nèi)容包括:所需追蹤目標(biāo)的移動(dòng)節(jié)點(diǎn)最小數(shù)量nminp、最大數(shù)量nmaxp;追蹤臨近目標(biāo)的時(shí)間間隔tnp;正在追蹤目標(biāo)的移動(dòng)節(jié)點(diǎn)數(shù)量,以及目標(biāo)與移動(dòng)節(jié)點(diǎn)之間的距離[11]。根據(jù)上述5個(gè)評(píng)估內(nèi)容,定義移動(dòng)節(jié)點(diǎn)i對(duì)目標(biāo)p的自適應(yīng)度評(píng)估函數(shù): μi,p=tnpωtnp+ts+1-1ω×Υnipnmaxp,nminpnmaxp× Υ‖τp-τi‖εmax,εsεmax(5) 其中:μ為移動(dòng)節(jié)點(diǎn)i對(duì)目標(biāo)p的自適應(yīng)度評(píng)估結(jié)果;ω為系統(tǒng)控制參數(shù);ts為離散參數(shù)為s的時(shí)間控制量;Υ為勢(shì)函數(shù);nip為評(píng)估數(shù)據(jù)總數(shù)量;τp為目標(biāo)數(shù)據(jù)移動(dòng)控制參數(shù);τi為移動(dòng)節(jié)點(diǎn)控制參數(shù);εmax為范圍最大半徑;εs為離散參數(shù)為s的目標(biāo)節(jié)點(diǎn)移動(dòng)范圍[12]。根據(jù)上述評(píng)估結(jié)果,得出圖4中的自適應(yīng)曲線。 當(dāng)圖4中的追蹤目標(biāo)曲線與源網(wǎng)絡(luò)用戶基本信息曲線相重疊時(shí),說明對(duì)網(wǎng)絡(luò)用戶信息追蹤成功,自適應(yīng)控制結(jié)果可以實(shí)現(xiàn)對(duì)全部數(shù)據(jù)的加密。 1.4 自動(dòng)調(diào)整局部目標(biāo)實(shí)現(xiàn)網(wǎng)絡(luò)用戶信息加密 按照優(yōu)先級(jí)追蹤得到的用戶信息自適應(yīng)控制結(jié)果,自動(dòng)調(diào)整其中因?yàn)槌^規(guī)定限制條件,或者尚未滿足約束條件的待加密信息。設(shè)置不同的用戶信息類別為mi,其中i=1,2,…,n,表示一組用戶信息的存在n個(gè)不同類別的內(nèi)容,n為正整數(shù)[13]。根據(jù)聚類信息結(jié)果與自適應(yīng)評(píng)估結(jié)果,分析缺失的局部目標(biāo),與實(shí)際加密目標(biāo)之間的差異值: Fp,=1μT∑ni 其中:p為目標(biāo)函數(shù);為限制條件,F(xiàn)p,為差異值預(yù)測(cè)函數(shù);T為預(yù)測(cè)周期;n為預(yù)測(cè)限制條件的攔截次數(shù);i、 j分別表示缺失量和超出量;βi與βj表示補(bǔ)償與抑制參量[14]。根據(jù)上述公式,按照自適應(yīng)結(jié)果對(duì)網(wǎng)絡(luò)用戶信息進(jìn)行調(diào)整,此時(shí)的局部調(diào)整過程,如圖5所示。 圖5中為2組數(shù)據(jù)樣本,其中不同顏色的方塊表示不同的網(wǎng)絡(luò)用戶信息數(shù)據(jù)庫;圓形表示數(shù)據(jù)庫中同類型的信息值代表。按照上述不同用戶信息的基本類別進(jìn)行加密,確保全部顯性特征與局部隱性特征均可被識(shí)別,確保數(shù)據(jù)庫內(nèi),同種類型的用戶信息被密文完全覆蓋,降低加密后信息的可識(shí)別率,至此基于密度峰值的網(wǎng)絡(luò)用戶信息,聚類局部自適應(yīng)加密方法得以實(shí)現(xiàn)[15]。 2 實(shí)驗(yàn)測(cè)試 將所提出加密方法與文獻(xiàn)所提出的其中一種加密方法進(jìn)行對(duì)比,分析基于密度峰值的加密方法,優(yōu)越于文獻(xiàn)提出加密方法的關(guān)鍵點(diǎn),從而得出實(shí)驗(yàn)測(cè)試結(jié)論。 2.1 實(shí)驗(yàn)準(zhǔn)備階段 此次實(shí)驗(yàn)選用的系統(tǒng)硬件配置為CPU Intel(R) Core(TM)3 Duo T6500 3.5 GHz,內(nèi)存大小為8 GB;軟件配置為Windows 2019a操作系統(tǒng),瀏覽器版本為IE11.0,網(wǎng)絡(luò)配置為10MLAN。試運(yùn)行實(shí)驗(yàn)測(cè)試系統(tǒng),該系統(tǒng)在虛擬機(jī)上進(jìn)行。 啟動(dòng)實(shí)驗(yàn)測(cè)試系統(tǒng),并在虛擬機(jī)系統(tǒng)中啟動(dòng)Hadoop系統(tǒng),并查看該系統(tǒng)的啟動(dòng)狀態(tài)。Hadoop系統(tǒng)啟動(dòng)成功后打開Tomcat服務(wù)器、打開IE瀏覽器,在瀏覽器中輸入一個(gè)現(xiàn)階段,網(wǎng)絡(luò)用戶經(jīng)常訪問的 信息IP地址為:http//:localhost:9559/cpabeforHadoop,單擊搜索進(jìn)入測(cè)試系統(tǒng),如圖6所示。 設(shè)置用戶名和密碼,根據(jù)實(shí)驗(yàn)測(cè)試要求設(shè)置角色選項(xiàng),注冊(cè)網(wǎng)絡(luò)用戶。注冊(cè)若干個(gè)網(wǎng)絡(luò)用戶,利用這些用戶進(jìn)行網(wǎng)絡(luò)信息訪問、下載與信息填充,將該用戶作為實(shí)驗(yàn)測(cè)試對(duì)象,打開信息加密系統(tǒng),分別利用兩種方法對(duì)上述網(wǎng)絡(luò)用戶信息進(jìn)行加密,將加密后的網(wǎng)絡(luò)用戶信息上傳到測(cè)試系統(tǒng)中,測(cè)試系統(tǒng)對(duì)網(wǎng)絡(luò)用戶信息進(jìn)行詳情查詢,根據(jù)查詢結(jié)果,得出實(shí)驗(yàn)結(jié)論。 2.2 測(cè)試結(jié)果與分析 本次實(shí)驗(yàn)將所提出加密方法測(cè)試結(jié)果作為實(shí)驗(yàn)組,將文獻(xiàn)提出加密方法的測(cè)試結(jié)果作為對(duì)照組,圖7即為此次實(shí)驗(yàn)測(cè)試對(duì)比結(jié)果。 分析上述實(shí)驗(yàn)測(cè)試結(jié)果,可知所提出加密方法下,實(shí)驗(yàn)組對(duì)于網(wǎng)絡(luò)用戶的用戶名稱、賬號(hào)、身份證件信息、以及訪問IP地址等基本信息,完全覆蓋加密,沒有泄露任何網(wǎng)絡(luò)用戶信息的任一信息,用戶信息明文均被亂碼覆蓋,可識(shí)別率為0。而對(duì)照組文獻(xiàn)所提出的加密方法,在利用測(cè)試系統(tǒng)搜索網(wǎng)絡(luò)用戶基本信息時(shí),存在3組用戶11個(gè)信息泄露的情況,可識(shí)別率約為24.44%??梢娝岢黾用芊椒ㄔ谡{(diào)整密度峰值的基礎(chǔ)上,實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)用戶信息的全數(shù)據(jù)覆蓋。 3 結(jié)束語 此次提出的加密方法,針對(duì)原有幾類加密方法的共性矛盾,對(duì)明文覆蓋進(jìn)行全新的加密。該加密方法是根據(jù)密度峰值,重新對(duì)網(wǎng)絡(luò)用戶信息聚類結(jié)果進(jìn)行局部自適應(yīng)加密,保護(hù)網(wǎng)絡(luò)用戶的基本信息,控制網(wǎng)絡(luò)用戶使用安全,為國家的網(wǎng)絡(luò)環(huán)境凈化提供技術(shù)支持。但該加密過程十分復(fù)雜,對(duì)于混沌系統(tǒng)的基本特征說明不夠充分,在今后的加密研究中,可對(duì)于混沌系統(tǒng)的基本定義和使用特征加以說明。 參考文獻(xiàn): [1]肖漢雄,陳秀宏,田進(jìn).特征聚類自適應(yīng)變組稀疏自編碼網(wǎng)絡(luò)及圖像識(shí)別[J].計(jì)算機(jī)工程與科學(xué),2018,40(10):1858-1866. [2]謝國波,姜先值.二維離散分?jǐn)?shù)階Fourier變換的雙混沌圖像加密算法[J].計(jì)算機(jī)工程與應(yīng)用,2018,54(3):40-45. [3]施佺,韓賽飛,黃新明,等.面向全同態(tài)加密的有限域FFT算法FPGA設(shè)計(jì)[J].電子與信息學(xué)報(bào),2018,40(1):57-62. [4]周世波,徐維祥.密度峰值快速搜索與聚類算法及其在船舶位置數(shù)據(jù)分析中的應(yīng)用[J].儀器儀表學(xué)報(bào),2018,39(7):152-163. [5]杜洪波,白阿珍,朱立軍.基于改進(jìn)的密度峰值算法的K-means算法[J].統(tǒng)計(jì)與決策,2018,34(18):20-24. [6]唐偉強(qiáng),龍文堃,孫麗娟,等.基于聚類方法和神經(jīng)網(wǎng)絡(luò)的非線性系統(tǒng)多模型自適應(yīng)控制[J].系統(tǒng)工程與電子技術(shù),2019,41(9):2100-2106. [7]薛麗霞,孫偉,汪榮貴,等.基于密度峰值優(yōu)化的譜聚類算法[J].計(jì)算機(jī)應(yīng)用研究,2019,36(7):1948-1950,1983. [8]蘭慶慶,肖本賢.基于網(wǎng)格的密度峰值聚類算法的RFID定位[J].電子測(cè)量與儀器學(xué)報(bào),2018,32(10):73-78. [9]劉昊霖,池金龍,鄧清勇,等.基于自適應(yīng)局部搜索的進(jìn)化多目標(biāo)稀疏重構(gòu)方法[J].計(jì)算機(jī)研究與發(fā)展,2019,56(7):1420-1431. [10]黎海雪,林海濤,陳津.單幀圖像超分辨中的自適應(yīng)正則約束算法[J].計(jì)算機(jī)科學(xué),2019,46(S1):200-204. [11]殷亞琪,楊聯(lián)強(qiáng),王學(xué)軍.局部權(quán)重調(diào)節(jié)的自適應(yīng)懲罰樣條回歸模型[J].應(yīng)用數(shù)學(xué),2018,31(3):592-599. [12]江盟,蔡勇,張建生.一種三維點(diǎn)云自適應(yīng)隱式曲面重構(gòu)方法[J].電子技術(shù)應(yīng)用,2019,45(6):104-107,112. [13]羅文興,管毅.一種基于無線傳感網(wǎng)的加密算法的設(shè)計(jì)[J].科技通報(bào),2018,34(6):215-218. [14]曲延鵬,張坤,陳頌英.MRT-LBM三重網(wǎng)格局部加密算法研究[J].北京理工大學(xué)學(xué)報(bào),2018,38(5):441-448. [15]徐瀟,馬峻,趙飛樂,等.Arnold變換和混沌映射的計(jì)算全息多圖像同步加密[J].激光雜志,2018,39(6):57-60.