王志剛,王辰陽(yáng),李恒武
(中國(guó)人民解放軍戰(zhàn)略支援部隊(duì)信息工程大學(xué),河南 鄭州 450001)
互聯(lián)網(wǎng)中數(shù)量眾多的多維異構(gòu)數(shù)據(jù)被匯集在一起,形成了全球規(guī)模的信息共享環(huán)境。為貼合用戶(hù)實(shí)際搜索需要,需要推送的數(shù)據(jù)呈現(xiàn)出多樣化的趨勢(shì)。在保障數(shù)據(jù)安全性的同時(shí),為用戶(hù)提供可靠的信息推送服務(wù),是目前通信領(lǐng)域研究的重要目標(biāo)。
針對(duì)信息推送相關(guān)問(wèn)題,周長(zhǎng)敏等以旅游信息為例,提出一種旅游信息適應(yīng)性自組織推送方法。通過(guò)求解目標(biāo)使用者及其他使用者間的相似度,探尋目標(biāo)使用者的最近鄰集合。采用模糊遺傳算法明確加權(quán)函數(shù),計(jì)算目標(biāo)使用者對(duì)某旅游項(xiàng)目興趣度預(yù)測(cè)值,把預(yù)測(cè)值最高的旅游項(xiàng)目推送給使用者。但該方法耗時(shí)較長(zhǎng),且數(shù)據(jù)推送存在偏差情況。張雪峰等構(gòu)建一種參與者勝任度和接受度的任務(wù)推送模型。在模型中提出識(shí)別潛在參與者的思路和過(guò)程,運(yùn)用啟發(fā)式相似度算法分析任務(wù)相似度,描述并量化參與者表現(xiàn)。確保參與者回復(fù)率,降低多次推送。但該方法推送應(yīng)用范圍存在一定局限性。
為進(jìn)一步完善數(shù)據(jù)推送性能,提出多維異構(gòu)網(wǎng)絡(luò)數(shù)據(jù)智能預(yù)加密云推送方法。通過(guò)分析多維異構(gòu)網(wǎng)絡(luò)數(shù)據(jù)特征,劃分同構(gòu)與異構(gòu)數(shù)據(jù)。并在確保推送數(shù)據(jù)隱私前提下,創(chuàng)建云推送平臺(tái),解決多維異構(gòu)網(wǎng)絡(luò)數(shù)據(jù)推送問(wèn)題,實(shí)時(shí)為用戶(hù)推送最新信息。
X
和給予的μ
值相減,就能明確該成分在方向內(nèi)的偏移值,將異構(gòu)數(shù)據(jù)的關(guān)鍵數(shù)據(jù)成分值X
引入矩陣S
,得到S
=[X
,X
,…,X
](1)
把矩陣S
與其轉(zhuǎn)置矩陣S
相乘,計(jì)算求解數(shù)值的均值大小。將均值記作數(shù)據(jù)的全局異構(gòu)水準(zhǔn),具體表示為(2)
式(1)中,μ
代表按照評(píng)估得到的權(quán)重值,N
是樣本總數(shù),因?yàn)?p>V是已知值,所以此數(shù)據(jù)樣本的異構(gòu)水準(zhǔn)可使用特征值V
進(jìn)行描述。若出現(xiàn)多維異構(gòu)數(shù)據(jù)需要推送,此時(shí)每個(gè)數(shù)據(jù)的主成分不能劃分成X
-X
,需要將X
轉(zhuǎn)變成X
,因此矩陣S
變化為(3)
(4)
在云數(shù)據(jù)中,即便擁有大量的多維異構(gòu)數(shù)據(jù),但還存在一定數(shù)量的同構(gòu)數(shù)據(jù)。在用戶(hù)需要推送內(nèi)容是同構(gòu)數(shù)據(jù)情況下,采用協(xié)方差矩陣根據(jù)其數(shù)據(jù)特征進(jìn)行矢量分解,分解同構(gòu)數(shù)據(jù)就可得到更加高效的推送模式,無(wú)需在每個(gè)點(diǎn)采取重復(fù)迭代,節(jié)約數(shù)據(jù)通信時(shí)間。
(5)
(6)
因此在每個(gè)云數(shù)據(jù)樣本足夠的狀態(tài)下,推算同構(gòu)數(shù)據(jù)的精確度較高。因?yàn)橥瑯?gòu)數(shù)據(jù)的自身屬性問(wèn)題,將此增量更新解析式記作
(7)
(8)
在以上計(jì)算過(guò)程中能夠得出,協(xié)方差矩陣具備一定對(duì)稱(chēng)性,在進(jìn)行云推送時(shí),同構(gòu)數(shù)據(jù)每次更新僅需要傳輸半個(gè)協(xié)方差矩陣即可,減少了數(shù)據(jù)傳輸數(shù)量。假如網(wǎng)絡(luò)系統(tǒng)個(gè)數(shù)是M
,參數(shù)數(shù)量是d
,同構(gòu)數(shù)據(jù)計(jì)算過(guò)程的時(shí)間復(fù)雜度是O
(M
,d
)=(M
-1)(d
(d
+1)/
lgd
)(9)
多維異構(gòu)數(shù)據(jù)是對(duì)同構(gòu)數(shù)據(jù)關(guān)鍵成分采取拓展的一種形式。為了便于數(shù)學(xué)運(yùn)算,加入置換矩陣P
,對(duì)云服務(wù)器內(nèi)得到的樣本實(shí)施置換映射,將計(jì)算結(jié)果表示成y
y
=(y
,y
)=P
X
(10)
式(10)目的是為了把目前樣本內(nèi)和同構(gòu)數(shù)據(jù)內(nèi)相等的部分集合在矢量前面,記作y
,把不同部分安放于矢量后面,記作y
。同理,將均值矩陣與協(xié)方差矩陣采取置換,計(jì)算結(jié)果依次為μ
=(μ
,μ
)=P
μ
(11)
(12)
μ
與置換矩陣均為上次計(jì)算得到的數(shù)值,σ
表示m
樣本內(nèi)已經(jīng)獲得的協(xié)方差矩陣,σ
表示和同構(gòu)數(shù)據(jù)內(nèi)不同因子的協(xié)方差矩陣,σ
表示兩者之間協(xié)方差組成的矩陣。上述解析式均滿(mǎn)足高維分布特性,因此云數(shù)據(jù)樣本能夠使用高維分布進(jìn)行推算,具體描述為
(13)
由此,將信息云更新后推送異構(gòu)數(shù)據(jù)的解析式定義為
(14)
因?yàn)樵诋悩?gòu)數(shù)據(jù)內(nèi),各種云數(shù)據(jù)的因子數(shù)量是互不相等的,所以需要探尋每個(gè)N
的具體數(shù)值。因?yàn)檗D(zhuǎn)置矩陣可以減少數(shù)據(jù)傳輸數(shù)量,繼而把傳輸復(fù)雜度記作O
(M
,d
)=(M
-1)(d
+2d
)(15)
通過(guò)上述過(guò)程,能夠完成迅速分離數(shù)據(jù)源內(nèi)的同構(gòu)數(shù)據(jù)和異構(gòu)數(shù)據(jù),為后續(xù)數(shù)據(jù)智能預(yù)加密效率與云推送方法的有效完成提供幫助。
預(yù)加密可以保護(hù)數(shù)據(jù)隱私,是提高云推送服務(wù)安全性能的一項(xiàng)關(guān)鍵措施,但數(shù)據(jù)加密后會(huì)損失多種特征,讓云服務(wù)器對(duì)密文的處理有相當(dāng)困難。由此,使用全同態(tài)加密算法完成加法同態(tài)與乘法同態(tài),讓云服務(wù)器不必接觸明文數(shù)據(jù)就可以便利地處理推送數(shù)據(jù)。
E
(m
⊕m
)=E
(m
)?E
(m
)(16)
同態(tài),就是一個(gè)加密方案E
符合式(16)的約束條件的計(jì)算過(guò)程。式(16)中,m
、m
表示明文消息,E
表示加密函數(shù),?是密文的某類(lèi)計(jì)算形式,⊕是對(duì)明文進(jìn)行計(jì)算的某種形式。在實(shí)施數(shù)據(jù)智能預(yù)加密時(shí),首先要使用全同態(tài)加密算法對(duì)明文進(jìn)行加密。然后把密文數(shù)據(jù)輸送至云端,在傳送數(shù)據(jù)處理請(qǐng)求時(shí),云端服務(wù)器不用對(duì)密文解密就能實(shí)現(xiàn)對(duì)應(yīng)操作。全同態(tài)加密流程共包含三個(gè)步驟:對(duì)明文數(shù)據(jù)采取二進(jìn)制分組,分組長(zhǎng)度按照安全請(qǐng)求進(jìn)行自定義操控;對(duì)各明文分塊進(jìn)行加密,獲得相對(duì)應(yīng)的密文分塊;把全部密文分塊融合為完整的密文數(shù)據(jù)C
。加密詳細(xì)過(guò)程為:挑選加密參變量P
、Q
、R
,P
為正奇數(shù),Q
為正整數(shù)。P
、Q
值在密鑰生成階段進(jìn)行確認(rèn),P
為加密密鑰,R
為加密過(guò)程中挑選的隨機(jī)數(shù)值;把消息M
分組成多個(gè)長(zhǎng)度是L
的消息分塊;分別讀取明文分塊內(nèi)的字符,同時(shí)將其變換成二進(jìn)制數(shù)字;采用加密算法對(duì)二進(jìn)制數(shù)字實(shí)施加密操作,具體如式(17)所示。并將多個(gè)密文分塊整合為完整的密文數(shù)據(jù)。
c
=m
+2R
+PQ
(17)
按照全同態(tài)加密算法性質(zhì),依次對(duì)此算法的加法同態(tài)與乘法同態(tài)性實(shí)行驗(yàn)證。如果有兩組明文m
、m
,加密之后的密文依次是c
、c
,繼而得到c
=m
+2R
+PQ
(18)
c
=m
+2R
+PQ
(19)
對(duì)密文c
、c
采取加法操作c
+c
=(m
+m
)+2(R
+R
)+P
(Q
+Q
)(20)
將 cmod
p
的值當(dāng)作噪聲,若噪聲m
+2R
<P/
2的情況下,得到(c
+c
)modp
=(m
+m
)+2(R
+R
)(21)
將(m
+m
)+2(R
+R
)進(jìn)行對(duì)2取模m
+m
=[(m
+m
)+2(R
+R
)]mod 2(22)
由式(22)中可知,本文算法符合加法同態(tài)性。同理,對(duì)密文c
、c
實(shí)施乘法操作c
×c
=m
m
+2(2R
R
+m
R
+m
R
)+P
[PQ
Q
+Q
(m
+2R
)+Q
(m
+2R
)](23)
因?yàn)?/p>
m
m
+2(2R
R
+m
R
+m
R
)<P
(24)
所以,對(duì)P
與2依次取模得到m
m
=[(c
×c
)modp
]mod 2(25)
至此可知,本文數(shù)據(jù)智能預(yù)加密算法符合乘法同態(tài)性,可以實(shí)現(xiàn)數(shù)據(jù)智能預(yù)加密。
在對(duì)數(shù)據(jù)智能預(yù)加密后,設(shè)計(jì)云推送平臺(tái)。云推送表示處于云計(jì)算大環(huán)境下,客戶(hù)端接收經(jīng)過(guò)服務(wù)端主動(dòng)輸送消息的技術(shù),讓用戶(hù)無(wú)需主動(dòng)檢查更新,為用戶(hù)提供更多的便利服務(wù)。與此同時(shí),云服務(wù)器端會(huì)使用云推送平臺(tái)把每個(gè)系統(tǒng)內(nèi)的多維異構(gòu)數(shù)據(jù)推送至用戶(hù)。本文云推送方法關(guān)鍵有如下幾個(gè)方面:
云數(shù)據(jù)層作為全局云推送平臺(tái)最重要的部分,云數(shù)據(jù)是通過(guò)每個(gè)系統(tǒng)內(nèi)的多維異構(gòu)數(shù)據(jù)組成的,全部數(shù)據(jù)都屬于云數(shù)據(jù)層,并讓云數(shù)據(jù)層更好地完成數(shù)據(jù)邏輯虛擬化目標(biāo);數(shù)據(jù)管理層為云推送平臺(tái)邏輯框架的中心,是實(shí)現(xiàn)云推送過(guò)程中數(shù)據(jù)和推送同步進(jìn)行的關(guān)鍵工作層;在應(yīng)用接口層中,用戶(hù)能夠利用訂閱不同的應(yīng)用板塊對(duì)應(yīng)用接口層進(jìn)行自動(dòng)配置,得到不同的數(shù)據(jù)儲(chǔ)存、訪(fǎng)問(wèn)的應(yīng)用服務(wù);訪(fǎng)問(wèn)層中,授權(quán)用戶(hù)能使用對(duì)應(yīng)接口完成系統(tǒng)數(shù)據(jù)訪(fǎng)問(wèn),并按照用戶(hù)訪(fǎng)問(wèn)權(quán)限不同,每種用戶(hù)訪(fǎng)問(wèn)的形式也各不相等;用戶(hù)層擔(dān)負(fù)對(duì)每個(gè)用戶(hù)的注冊(cè)信息進(jìn)行整合,并且也能管理各類(lèi)型的登錄終端,例如IOS
、PC
等。具體平臺(tái)架構(gòu)如圖1所示。圖1 云推送平臺(tái)架構(gòu)圖
若處在隨機(jī)時(shí)間單元T
中,單個(gè)用戶(hù)訂購(gòu)業(yè)務(wù)個(gè)數(shù)是α
(T
),那么n
個(gè)用戶(hù)的訂購(gòu)業(yè)務(wù)總數(shù)是n
α
(T
),已知α
(T
)滿(mǎn)足泊松分布,均值參數(shù)是λ
,把現(xiàn)階段用戶(hù)i
在信道內(nèi)存留的數(shù)據(jù)積壓描述成Q
(T
),信道狀態(tài)是r
(T
),那么用戶(hù)集群信道狀態(tài)集合是r
(T
)=(r
(T
),r
(T
),…,r
(T
))(26)
在得到信道狀態(tài)后,能夠準(zhǔn)確推算用戶(hù)的信道輸送速度u
(T
)。假如全部T
單元中用戶(hù)i
的傳輸時(shí)間間隔總數(shù)是w
(T
),得到用戶(hù)的全信道速度u
(T
)=w
(T
)μ
(T
)τ
(27)
所以,將信道內(nèi)單個(gè)用戶(hù)的服務(wù)速度集記作
u
(T
)=(u
(T
),u
(T
),…,u
(T
))(28)
總結(jié)上述步驟,獲得信道內(nèi)的動(dòng)態(tài)數(shù)據(jù)積壓總數(shù)是
Q
(T
+1)=max[Q
(T
)-u
(T
),0]+n
α
(T
)(29)
評(píng)估云推送平臺(tái)穩(wěn)定性條件為
(30)
如果T
時(shí)段中用戶(hù)信道數(shù)據(jù)傳輸功率是ρ
(T
),把用戶(hù)數(shù)據(jù)能耗與所有用戶(hù)的能耗總量分別描述為E
(T
)=ρ
(T
)w
(T
)τ
(31)
在式(31)前提下計(jì)算基于推送策略的李雅普諾夫函數(shù)公式
(32)
為了判斷單元時(shí)間中函數(shù)的詳細(xì)變化情況,本文創(chuàng)建一種新的函數(shù)表達(dá)式
Δ(T
)=E
{ln(L
(T
+1)-L
(T
))|Q
(T
)}(33)
式(33)的函數(shù)表達(dá)式關(guān)鍵對(duì)李雅普諾夫函數(shù)的優(yōu)化進(jìn)行對(duì)數(shù)計(jì)算,即為降低信道自身傳輸噪聲的干擾作用,減少噪聲敏銳性。關(guān)于時(shí)間單元T
,把李雅普諾夫函數(shù)的乘法函數(shù)記作VE
{E
(T
)|Q
(T
)}。在獲取最低能耗值狀況下,把現(xiàn)階段最優(yōu)業(yè)務(wù)個(gè)數(shù)描述成式(34)。
(34)
在確保數(shù)據(jù)安全同時(shí),有效解決多維異構(gòu)網(wǎng)絡(luò)數(shù)據(jù)跨平臺(tái)推送問(wèn)題,快捷高效地為用戶(hù)推送最新信息。
在本節(jié)中,展示了實(shí)驗(yàn)環(huán)境和性能指標(biāo),并對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行了主要分析。
此次仿真使用EXE文件修改器與OpenStack軟件模擬構(gòu)建私有推送平臺(tái)。設(shè)置該平臺(tái)5個(gè)物理節(jié)點(diǎn),并通過(guò)100Mbps局域網(wǎng)重新連接。實(shí)驗(yàn)數(shù)據(jù)來(lái)自明尼蘇達(dá)大學(xué)相關(guān)的研究小組公布的真實(shí)數(shù)據(jù)集MovieLens,每個(gè)物理節(jié)點(diǎn)均配備了Intel(R) Pentium(R) CPU G4400 @ 3.30GHz,8GB RAM,64位中文版操作系統(tǒng)。測(cè)試的客戶(hù)端型號(hào)為Xiaomi mix3,內(nèi)存6GB,曉龍845 CPU。仿真內(nèi),設(shè)定數(shù)據(jù)傳輸速分布是450kbit/s的負(fù)指數(shù)分布,最高傳輸速率是1100kbit。
為了驗(yàn)證所提方法可靠性,將通信率及推送留存率當(dāng)作云推送方法評(píng)估的三項(xiàng)指標(biāo),對(duì)所提方法與云計(jì)算環(huán)境下旅游信息適應(yīng)性自組織推送算法(文獻(xiàn)[4])、眾包模式下基于參與者勝任度和接受度的任務(wù)推送模型(文獻(xiàn)[5])方法進(jìn)行仿真對(duì)比。
通信率表示單位時(shí)間內(nèi),用戶(hù)和云推送的通信次數(shù),檢驗(yàn)用戶(hù)是否愿意采用該方法實(shí)施數(shù)據(jù)推送,同時(shí)檢測(cè)通信數(shù)量較多時(shí)能否發(fā)生不可估計(jì)的復(fù)雜問(wèn)題。通信率越低說(shuō)明數(shù)據(jù)云推送過(guò)程所花費(fèi)的通信量越少,推送效果越好。基于上述實(shí)驗(yàn)環(huán)境,計(jì)算三種方法的通信率,得到仿真結(jié)果如圖2所示。
圖2 通信率對(duì)比示意圖
從圖2中可知,兩種文獻(xiàn)推送方法下的通信率基本維持不變,這是因?yàn)樵谕扑腿蝿?wù)隊(duì)列消息過(guò)程中,會(huì)持續(xù)向服務(wù)器發(fā)送請(qǐng)求。而所提方法一直保持信息收集狀態(tài),伴隨系統(tǒng)運(yùn)行,任務(wù)量增加,通信率最低為1.55%。因?yàn)樗岱椒ɡ昧藚f(xié)方差矩陣根據(jù)數(shù)據(jù)特征,對(duì)數(shù)據(jù)源內(nèi)的同構(gòu)、異構(gòu)數(shù)據(jù)進(jìn)行了快速分類(lèi),使得后續(xù)推送穩(wěn)定性能較優(yōu),即任務(wù)數(shù)量越多,耗費(fèi)的通信量越低。
留存率表示固定時(shí)段中,用戶(hù)保存此推送消息的比率,可以體現(xiàn)推送方法對(duì)用戶(hù)的影響程度。實(shí)驗(yàn)以1~8周的信息留存時(shí)間作為實(shí)驗(yàn)周期,得出三種方法下的推送留存率如圖3所示。
圖3 推送留存率對(duì)比圖
圖3仿真結(jié)果表明,所提方法通過(guò)預(yù)加密方式維護(hù)了云推送服務(wù)安全,因此每個(gè)星期的留存率均高于文獻(xiàn)[4]、文獻(xiàn)[5]方法,8個(gè)星期后兩種文獻(xiàn)方法的留存率已經(jīng)低于32%,而所提方法的留存率高達(dá)58%,說(shuō)明所提出的推送方法較符合用戶(hù)實(shí)際需要,推送的消息更可靠,安全性較高。
針對(duì)多維異構(gòu)網(wǎng)絡(luò)數(shù)據(jù)推送效率不高等問(wèn)題,提出一種基于對(duì)數(shù)優(yōu)化的數(shù)據(jù)智能預(yù)加密云推送方法。運(yùn)用智能預(yù)加密手段實(shí)現(xiàn)多維異構(gòu)網(wǎng)絡(luò)的安全推送,仿真結(jié)果證明,該方法可以為用戶(hù)提供及時(shí)有效信息推送服務(wù)。但該方法能否符合全部用戶(hù)需求,還要進(jìn)行具體驗(yàn)證,云推送自身性能的提高與演化也是接下來(lái)研究的關(guān)鍵內(nèi)容。