楊戰(zhàn)武,劉 鵬
(1.運城學(xué)院計算機科學(xué)與技術(shù)系,山西運城 044000;2.山西省運城市氣象局網(wǎng)絡(luò)信息中心,山西運城 044000)
物聯(lián)網(wǎng)作為一項正處于發(fā)展時期的新興網(wǎng)絡(luò)技術(shù),面臨著來自多方面的安全挑戰(zhàn)。當(dāng)前而言,國內(nèi)對于物聯(lián)網(wǎng)信息安全的認(rèn)識依然停留在初級探索階段,相關(guān)信息安全保障措施和技術(shù)存在諸多弊端,因而加強物聯(lián)網(wǎng)網(wǎng)絡(luò)和信息安全相關(guān)問題的研究已成為物聯(lián)網(wǎng)發(fā)展中亟待解決的重要問題。物聯(lián)網(wǎng)產(chǎn)業(yè)的持續(xù)健康發(fā)展,也迫切需要更加有效、可靠地安全屬性風(fēng)險評估[1-3]。
研究中首先用F(x)來表示物聯(lián)網(wǎng)中某一安全要素X的頻率分布函數(shù),在此基礎(chǔ)上結(jié)合X的實際頻率分布情況,就可自動生成一系列粒度大小不等的云Clouds疊加,可用 Ex1i、Ex2i以及 En1i、En2i來表示,也包括He1i,He2i。其中任何一個云均可看作是一個離散且定性的概念,可完成由連續(xù)數(shù)值區(qū)間至離散概念的有效轉(zhuǎn)換。此外,云變換還會通過數(shù)據(jù)概率分布的方法來構(gòu)造概念集。與此同時,在數(shù)據(jù)概率分布的局部極大值點就可看作是信息數(shù)據(jù)的匯聚中心,通常頻率高的數(shù)據(jù)值對定性概念所發(fā)揮的作用要高于頻率低的值。在上述理論指導(dǎo)下,文中研究采用基于峰值法的云變換方法。該種方法的基本思想是:將數(shù)據(jù)分布的局部峰值處作為數(shù)據(jù)的匯聚中心,并將其作為云模型的數(shù)學(xué)期望是有效的[4-5]。
概念劃分算法的步驟主要包括以下幾個內(nèi)容[6-7]:
輸入。用X來表示安全要素S對應(yīng)的全部屬性值;用ε來表示云變換允許的誤差閾值;用εx來表示梯形頂邊的最小長度可允許的誤差;用εy來表示峰值高度可達(dá)到的誤差閾值。
輸出。主要是指安全要素S的k個概念劃分包括其所對應(yīng)的相關(guān)數(shù)字特征情況。
算法。概念提取。
1.k=0;Clouds=[Φ];g'(x)=g(x);
2.while(max(g'(x))>ε)
3.Exk=Find_Ex(g'(x))
4.Ex1k=Search1(g'(x)'εx,εy);
5.Ex2k=Search2(g'(x)'εx,εy);
6.Ex1k=Search1(Ck,EX1K,ε);
7.En2k=Search_En(Ck),Ex2k,ε)
8.gk(x)=Ck*Cloud(Ex1k,En1k,Ex2k,En2k)
9.g'(x)=g'(x)-gk(x)
10.k=k+1;
11.end while
12.for j=0 to k-1 do
13.Clouds[j]=Calculate_He(gk)(x).g'(x),Clouds(Ex1k,En1k,Ex2k,En2k)),
14.end for
利用云變換得到的僅是相關(guān)的原子概念,因未能關(guān)注原子云模型間存在的相應(yīng)關(guān)系,由此也導(dǎo)致了兩個云之間易發(fā)生一些真空地帶,或模型間的距離過近,所以需要對原子概念采取概念提升,以便能獲得較粗粒度的概念,以避免所提取的定性概念無法可靠地對原始數(shù)據(jù)進(jìn)行準(zhǔn)確的描述。文中選擇距離最近的兩個正態(tài)云概念,然后將其合并成更高層次的正態(tài)云概念,最終達(dá)到概念個數(shù)能滿足指定個數(shù)的目的[8]。研究中為了產(chǎn)生不合理的合并,引入了距離閾值,從而生成了一種新定性概念提升算法,即MAQC算法,具體情況如下所示:
輸入。用CLOUDS來表示云變換生成的原子概念集合,利用σ來表示距離閾值。
輸出。用 CLOUDS來表示定性概念提升后的集合。
具體算法:
While(min(d(A,B))<σ)
C=Soft_Or(A,B);
CLOUDS=DELETE(A,B);
CLOUDS=ADD(C);
安全事件的獲取可為系統(tǒng)提供數(shù)據(jù)支撐,也是確保物聯(lián)網(wǎng)安全屬性概念提取的基本前提。為了對上述提取方法的有效性進(jìn)行驗證,本文進(jìn)行了相關(guān)實驗。實驗數(shù)據(jù)選擇DARPA的入侵檢測數(shù)據(jù)集來實施試驗網(wǎng)絡(luò)的訓(xùn)練,對于安全事件及日志信息的采集方面,綜合運用了多種方法,如文件方式、Syslog及SNMP Trap等。此外,還綜合應(yīng)用了系統(tǒng)運行日志及數(shù)據(jù)庫等,在Matlab程序設(shè)計實現(xiàn)方面則選擇了數(shù)據(jù)的概念劃分算法。在概念提取方面選擇了屬性CPU利用率作為案例,其中涵蓋了系統(tǒng)運行48過程中產(chǎn)生的2 880條數(shù)據(jù)[9-10]。
圖1為CPU利用率頻率分布情況,從圖中可看出,大多數(shù)時間系統(tǒng)的 CPU利用率相對較低,但當(dāng)CPU利用率達(dá)到60%以上時,隨著CPU利用率的逐漸升高,數(shù)據(jù)分布也表現(xiàn)出了越來越稀疏的狀態(tài),數(shù)據(jù)分布情況和系統(tǒng)實際運行情況之間保持一致。
圖1 CPU利用率頻率分布情況
借助EAQC算法對系統(tǒng)中CPU利用率情況采取概念提取的方式進(jìn)行評估,為盡可能簡化計算,研究中假定梯形云的左右半云熵及超熵相同,借助云變換算法所得到的對應(yīng)數(shù)字特征情況如表1所示。
表1 屬性概化云數(shù)字特征分析
根據(jù)MAQC算法,對上述9個不確定性概念實施了合并,假設(shè)σ=2.5,則再通過兩次合并后,就可獲得5個不確定性概念,而這幾個概念所對應(yīng)數(shù)字特征的具體情況如表2所示。
表2 粗粒度概化云數(shù)字特征情況
可以看出,在最終得到的5個定性概念能夠相對準(zhǔn)確地表現(xiàn)出CPU利用率的具體分布情況。同時,這些合并后的概念云中涵蓋了原子概念云的取值區(qū)間,即使在進(jìn)行概念提升后的云模型概念集合無法完全客觀表現(xiàn)出原始數(shù)據(jù)的具體分布情況,但這些合并后的云模型概念集合相對更符合人的思維,因此可被接受并加以有效應(yīng)用。其中屬性值借助逆向云發(fā)生器的作用,就能有效判斷其對概念的隸屬度,只需根據(jù)極大判別法便可得到屬性值所屬的概念,在此基礎(chǔ)上完成對物聯(lián)網(wǎng)安全要素數(shù)值型數(shù)據(jù)的有效軟化分。
對現(xiàn)有的概念劃分及提升方法進(jìn)行了的研究,考慮到梯形云對定性概念的表示實際上更具一般性和可利用性,故文中將梯形云引入到了物聯(lián)網(wǎng)安全屬性的概念劃分及概念提升中,利用云變換達(dá)到了數(shù)量型屬性概化的目的,并在此基礎(chǔ)上對概念合并方法做出了有效改進(jìn)。實驗結(jié)果表明,利用此種概念合并方法可客觀、準(zhǔn)確地反映出原子概念云的分布情況。
[1]賀延平.物聯(lián)網(wǎng)及其關(guān)鍵技術(shù)[J].電子科技,2011,14(8):131-134.
[2]黃孝彬,毛培霖,唐浩源,等.物聯(lián)網(wǎng)關(guān)鍵技術(shù)及其發(fā)展[J].電子科技,2011,37(12):129 -132.
[3]暴磊,張代遠(yuǎn),吳家寶.物聯(lián)網(wǎng)與隱私保護(hù)技術(shù)[J].電子科技,2010,16(7):110 -112.
[4]向宏,傅鸝,詹榜華.信息安全測評與風(fēng)險評估[M].北京:電子工業(yè)出版社,2009.
[5]曾慶凱,許峰,張有東.信息安全體系結(jié)構(gòu)[M].北京:電子工業(yè)出版社,2010.
[6]張守奇,仲紅.隱私保護(hù)的四方判定線段是否相交協(xié)議[J].計算機工程與設(shè)計,2009(24):5577 -5579.
[7]符祖峰,羅文俊,童玲.一個保護(hù)私有信息的線段與橢圓相交判定協(xié)議[J].計算機工程與應(yīng)用,2010,15(17):137-139.
[8]SANCHEZ L,UNIV D C S,GALACHE JA,et al.Smart santander:the meeting point between future internet research and experimentation and the smart cities[C].In Future Network & Mobile Summit(FutureNetw),2011:15-17.
[9]SHARMA P P,THAKSEN J.Network log clustering using k means algorithm[C].Proceedings of the Third International Conference on Trends in Information,Telecommunication and Computing,2013:115 -124.
[10]WANG Chengqun,CHEN Jiming,HU Chonghai,et al.Kernel matrix learning with a general regularized risk functional criterion[J].Journal of Systems Engineering and Electronics,2010,21(1):72-80.