張創(chuàng)基
摘 要:為了提高社交網(wǎng)絡(luò)用戶行為分析和情景模式預(yù)測(cè)能力,優(yōu)化社交網(wǎng)絡(luò)建設(shè),結(jié)合數(shù)據(jù)挖掘和行為分析方法進(jìn)行社交網(wǎng)絡(luò)的用戶特征分析和用戶情景模式的優(yōu)化挖掘,發(fā)現(xiàn)社交網(wǎng)絡(luò)用戶行為特征。提出一種基于模糊分區(qū)聚類的社交網(wǎng)絡(luò)用戶情景模式預(yù)測(cè)方法,構(gòu)建社交網(wǎng)絡(luò)用戶情景模式分布的關(guān)聯(lián)拓?fù)浣Y(jié)構(gòu)模型,采用Parallel Sets變?cè)S排序方法進(jìn)行社交網(wǎng)絡(luò)用戶情景模式存儲(chǔ)結(jié)構(gòu)分區(qū)調(diào)度,結(jié)合分段特征提取方法進(jìn)行社交網(wǎng)絡(luò)用戶情景模式的關(guān)聯(lián)數(shù)據(jù)挖掘,采用自適應(yīng)尋優(yōu)方法求取社交網(wǎng)絡(luò)用戶的情景模式的分布信息,利用模糊分區(qū)聚類方法發(fā)現(xiàn)用戶情景模式數(shù)據(jù)集中的隱含模式,根據(jù)數(shù)據(jù)模糊分區(qū)聚類和挖掘結(jié)果,實(shí)現(xiàn)社交網(wǎng)絡(luò)用戶情景模式的自適應(yīng)預(yù)測(cè)。仿真結(jié)果表明,采用該方法進(jìn)行社交網(wǎng)絡(luò)用戶情景模式預(yù)測(cè)的準(zhǔn)確性較高,提高了對(duì)社交網(wǎng)絡(luò)用戶情景模式特征配準(zhǔn)的精度,算法處理的實(shí)時(shí)性較好。
關(guān)鍵詞: 數(shù)據(jù)聚類;社交網(wǎng)絡(luò);用戶情景模式;特征提取
文章編號(hào): 2095-2163(2019)03-0176-04 中圖分類號(hào): TP393 文獻(xiàn)標(biāo)志碼: A
0 引 言
隨著Web2.0快速的發(fā)展,社交網(wǎng)絡(luò)得到快速發(fā)展,社交網(wǎng)絡(luò)逐漸變成人們情感交流、關(guān)系維護(hù)和信息溝通的主要平臺(tái)和方式。社交網(wǎng)絡(luò)為用戶建立在線社交關(guān)系,通過互動(dòng)交流實(shí)現(xiàn)對(duì)具有共同特征愛好的用戶聚類處理,在不同的情景模式下構(gòu)建社交網(wǎng)絡(luò)模塊,提高信息資源的自適應(yīng)分配和調(diào)度能力。在社交網(wǎng)絡(luò)平臺(tái)中,需要對(duì)用戶的情景模式進(jìn)行自動(dòng)預(yù)測(cè),結(jié)合大數(shù)據(jù)分析方法,進(jìn)行用戶的行為特征分析和用戶的關(guān)系分析,根據(jù)用戶的社交搜索和偏好,實(shí)現(xiàn)情景模式預(yù)測(cè)和調(diào)度,提高社交網(wǎng)絡(luò)的服務(wù)功能,結(jié)合數(shù)據(jù)挖掘和行為分析方法進(jìn)行社交網(wǎng)絡(luò)的用戶特征分析和情景模式預(yù)測(cè),發(fā)現(xiàn)社交網(wǎng)絡(luò)用戶的規(guī)律性[1]。研究社交網(wǎng)絡(luò)用戶情景模式預(yù)測(cè)方法在社交網(wǎng)絡(luò)的構(gòu)建和行為特征分析中具有重要意義。
當(dāng)前,常見的聚類方法有K-means算法、模糊C均值算法和層次分割聚類挖掘方法[2-3]。模糊C均值聚類方法在進(jìn)行社交網(wǎng)絡(luò)用戶情景模式數(shù)據(jù)挖掘的聚類處理中容易陷入局部最優(yōu)解,而層次分割聚類方法進(jìn)行大數(shù)據(jù)關(guān)聯(lián)挖掘受到分割閾值的影響[4],導(dǎo)致對(duì)初始的聚類中心具有較大的敏感性,針對(duì)上述問題,本文提出一種基于模糊分區(qū)聚類的社交網(wǎng)絡(luò)用戶情景模式預(yù)測(cè)方法,構(gòu)建社交網(wǎng)絡(luò)用戶情景模式分布的關(guān)聯(lián)拓?fù)浣Y(jié)構(gòu)模型,采用分段特征提取方法進(jìn)行社交網(wǎng)絡(luò)用戶情景模式的關(guān)聯(lián)特征提取,采用模糊C均值聚類方法進(jìn)行數(shù)據(jù)挖掘,實(shí)現(xiàn)社交網(wǎng)絡(luò)用戶情景模式預(yù)測(cè)。最后通過仿真實(shí)驗(yàn)進(jìn)行性能測(cè)試,展示本文方法在提高用戶情景模式預(yù)測(cè)準(zhǔn)確性方面的優(yōu)越性能。
1.1 社交網(wǎng)絡(luò)用戶情景模式拓?fù)浣Y(jié)構(gòu)模型
社交網(wǎng)絡(luò)信息資源傳輸系統(tǒng)設(shè)計(jì)中,用矩陣C表示社交網(wǎng)絡(luò)的用戶拓?fù)浣Y(jié)構(gòu),其中,C是N×N的二維矩陣。N為在網(wǎng)絡(luò)中的節(jié)點(diǎn)個(gè)數(shù)。對(duì)于用戶節(jié)點(diǎn)i,假設(shè)N1i為第一個(gè)相鄰節(jié)點(diǎn),得到社交網(wǎng)絡(luò)用戶情景模式分布的多元鄰節(jié)點(diǎn)為:
將數(shù)據(jù)用戶節(jié)點(diǎn)α(i, j)輸入數(shù)據(jù)到鏈路層中,得到關(guān)鍵路徑節(jié)點(diǎn)采集的社交網(wǎng)絡(luò)用戶情景模式時(shí)間序列為xn,期望響應(yīng)為dn,由此構(gòu)建社交網(wǎng)絡(luò)的用戶情景模式分布軌跡拓?fù)浣Y(jié)構(gòu)圖如圖1所示。
1.2 用戶情景模式跟蹤的特征提取
在構(gòu)建社交網(wǎng)絡(luò)用戶情景模式分布的關(guān)聯(lián)拓?fù)浣Y(jié)構(gòu)模型的基礎(chǔ)上,進(jìn)行用戶情景模式的特征提取,采用分段特征提取方法進(jìn)行社交網(wǎng)絡(luò)用戶情景模式的關(guān)聯(lián)特征提取[6],用戶情景模式傳輸樹中任意一個(gè)非根節(jié)點(diǎn)的情景模式社交網(wǎng)絡(luò)用戶情景模式預(yù)測(cè)的步進(jìn)值為:
社交網(wǎng)絡(luò)用戶情景模式預(yù)測(cè)的QoS控制加權(quán)自適應(yīng)學(xué)習(xí)系數(shù)表示為:
其中,CW0min為社交網(wǎng)絡(luò)用戶情景模式拓?fù)浣Y(jié)構(gòu)傳輸樹中最底層根節(jié)點(diǎn)的預(yù)測(cè)初始化值;而CWlimin為第li步的社交網(wǎng)絡(luò)用戶情景模式拓?fù)淇刂浦?,在情景模式預(yù)測(cè)過程中,每一步之間加權(quán)控制構(gòu)成是相同的,假設(shè)混合云環(huán)境下社交網(wǎng)絡(luò)用戶情景模式簇頭節(jié)點(diǎn)上的信息導(dǎo)碼表達(dá)為:
設(shè)U是一個(gè)用精確數(shù)值表示的定量論域,C是U上的定性概念,采用無向圖模型結(jié)構(gòu)表示原始感知的社交網(wǎng)絡(luò)用戶情景模式,對(duì)社交網(wǎng)絡(luò)用戶情景模式進(jìn)行自適應(yīng)調(diào)度中,融合模型由一個(gè)參數(shù)未知多重假設(shè)檢驗(yàn)問題構(gòu)成[7],采用Parallel Sets變?cè)S排序方法進(jìn)行社交網(wǎng)絡(luò)用戶情景模式存儲(chǔ)結(jié)構(gòu)分區(qū)調(diào)度,調(diào)度模型為:
其中,K表示加權(quán)調(diào)節(jié)系數(shù),根據(jù)社交網(wǎng)絡(luò)中用戶層和層之間的平均子節(jié)點(diǎn)數(shù)目,進(jìn)行特征提取和分布式的網(wǎng)絡(luò)組網(wǎng)設(shè)計(jì)[8],此時(shí)社交網(wǎng)絡(luò)用戶情景模式多源節(jié)點(diǎn)中形成新的映射,可得:
根據(jù)社交網(wǎng)絡(luò)用戶情景模式的分區(qū)信息熵的信息流特征,進(jìn)行特征分解,定義特征值的受限條件關(guān)聯(lián)規(guī)則挖掘量為:
其中,該過程的k階累積量ckx(τ1,τ2,…,τk-1),提取任務(wù)信息流的特征尺度,在社交網(wǎng)絡(luò)用戶情景模式分區(qū)自適應(yīng)調(diào)度的受限條件下,提取關(guān)聯(lián)規(guī)則特征量,為社交網(wǎng)絡(luò)的用戶情景模式跟蹤提供數(shù)據(jù)輸入基礎(chǔ)。
2 預(yù)測(cè)算法優(yōu)化
2.1 社交網(wǎng)絡(luò)用戶情景模式的關(guān)聯(lián)數(shù)據(jù)挖掘
在構(gòu)建社交網(wǎng)絡(luò)用戶情景模式分布的關(guān)聯(lián)拓?fù)浣Y(jié)構(gòu)模型和特征提取的基礎(chǔ)上,進(jìn)行用戶情景模式預(yù)測(cè)算法的改進(jìn)設(shè)計(jì),本文提出一種基于模糊分區(qū)聚類的社交網(wǎng)絡(luò)用戶情景模式預(yù)測(cè)方法,采用分段特征提取方法進(jìn)行社交網(wǎng)絡(luò)用戶情景模式的關(guān)聯(lián)數(shù)據(jù)挖掘,根據(jù)用戶情景模式特征取小取大后的比值描述社交網(wǎng)絡(luò)用戶情景模式的相似程度,得到社交網(wǎng)絡(luò)用戶情景模式的互信息特征的熵函數(shù)可以表示為:
采用自適應(yīng)尋優(yōu)對(duì)Hi(x)求取社交網(wǎng)絡(luò)用戶的情景模式的分布信息最大值max(Hi(x)),由此得到社交網(wǎng)絡(luò)用戶情景模式的熵融合特征提取最優(yōu)化的約束條件為:
2.2 模糊聚類及用戶情景模式預(yù)測(cè)實(shí)現(xiàn)
結(jié)合模糊分區(qū)聚類方法發(fā)現(xiàn)數(shù)據(jù)集中的隱含模式,得到用戶情景模式挖掘的異步遞進(jìn)加權(quán)系數(shù)為:
因此,得社交用戶情景模式預(yù)測(cè)的模糊分區(qū)聚類中心調(diào)整系數(shù)為:
綜上分析,利用模糊分區(qū)聚類方法發(fā)現(xiàn)用戶情景模式數(shù)據(jù)集中的隱含模式,根據(jù)數(shù)據(jù)模糊分區(qū)聚類和挖掘結(jié)果,實(shí)現(xiàn)社交網(wǎng)絡(luò)用戶情景模式的自適應(yīng)預(yù)測(cè)。
3 仿真實(shí)驗(yàn)與結(jié)果分析
為了測(cè)試本文方法在實(shí)現(xiàn)社交網(wǎng)絡(luò)用戶情景模式預(yù)測(cè)中的性能,進(jìn)行仿真實(shí)驗(yàn) 實(shí)驗(yàn)的軟件環(huán)境為Matlab 7,社交網(wǎng)絡(luò)的用戶節(jié)點(diǎn)數(shù)為100,分區(qū)的大小為1 000M, 用戶的分布層數(shù)為12,嵌入維數(shù)為3,關(guān)聯(lián)系數(shù)0.23,對(duì)用戶軌跡位置采樣的離散采樣率為fs=10*f0 Hz=10 KHz,訓(xùn)練樣本規(guī)模為12 000,根據(jù)上述仿真環(huán)境和參數(shù)設(shè)定,進(jìn)行社交網(wǎng)絡(luò)的用戶情景模式分布的關(guān)聯(lián)數(shù)據(jù)挖掘,得到挖掘結(jié)果如圖2所示。
根據(jù)圖2的數(shù)據(jù)挖掘結(jié)果進(jìn)行用戶情景模式預(yù)測(cè),得到預(yù)測(cè)輸出如圖3所示。
分析圖3得知,采用本文方法進(jìn)行社交網(wǎng)絡(luò)的用戶情景模式預(yù)測(cè)具有很好的抗干擾能力,特征聚類性較好。采用不同方法進(jìn)行預(yù)測(cè)精度對(duì)比,得到對(duì)比結(jié)果如圖4所示,分析圖4得知,采用本文方法進(jìn)行社交網(wǎng)絡(luò)的用戶情景模式預(yù)測(cè)的精度較高。
4 結(jié)束語
對(duì)用戶的情景模式進(jìn)行自動(dòng)預(yù)測(cè),結(jié)合大數(shù)據(jù)分析方法,進(jìn)行用戶的行為特征分析和用戶的關(guān)系分析,提高社交網(wǎng)絡(luò)的服務(wù)功能,本文提出一種基于模糊分區(qū)聚類的社交網(wǎng)絡(luò)用戶情景模式預(yù)測(cè)方法,構(gòu)建社交網(wǎng)絡(luò)用戶情景模式分布的關(guān)聯(lián)拓?fù)浣Y(jié)構(gòu)模型,采用分段特征提取方法進(jìn)行社交網(wǎng)絡(luò)用戶情景模式的關(guān)聯(lián)特征提取,采用Parallel Sets變?cè)S排序方法進(jìn)行社交網(wǎng)絡(luò)用戶情景模式存儲(chǔ)結(jié)構(gòu)分區(qū)調(diào)度,結(jié)合模糊分區(qū)聚類方法發(fā)現(xiàn)數(shù)據(jù)集中的隱含模式,采用模糊C均值聚類方法進(jìn)行數(shù)據(jù)挖掘,實(shí)現(xiàn)社交網(wǎng)絡(luò)用戶情景模式預(yù)測(cè)。研究得知,采用本文方法進(jìn)行社交網(wǎng)絡(luò)用戶情景模式預(yù)測(cè)的準(zhǔn)確性較高,數(shù)據(jù)挖掘精度較高,在社交網(wǎng)絡(luò)用戶情景模式挖掘和行為分析中具有很好的實(shí)踐價(jià)值。
參考文獻(xiàn)
[1]曹玖新,董丹,徐順,等. 一種基于k-核的社會(huì)網(wǎng)絡(luò)影響最大化算法[J]. 計(jì)算機(jī)學(xué)報(bào),2015,38(2):238-248.
[2]曹玖新, 陳高君, 吳江林, 等. 基于多維特征分析的社交網(wǎng)絡(luò)意見領(lǐng)袖挖掘[J]. 電子學(xué)報(bào), 2016, 44(4): 898-905.
[3]劉亞州, 王靜, 潘曉中, 等. 社交網(wǎng)絡(luò)中考慮節(jié)點(diǎn)度的演化博弈[J]. 計(jì)算機(jī)應(yīng)用, 2018, 38(4): 1029-1035.
[4]朱冠樺, 蔣國平, 夏玲玲. 社交網(wǎng)絡(luò)上從眾現(xiàn)象對(duì)謠言傳播影響的研究[J]. 計(jì)算機(jī)科學(xué), 2016, 43(2):135-139,143.
[5]張付志,劉賽,李忠華,等. 融合用戶評(píng)論和環(huán)境信息的協(xié)同過濾推薦算法[J]. 小型微型計(jì)算機(jī)系統(tǒng),2014, 35(2):228-232.
[6]郭磊,馬軍,陳竹敏,等. 一種結(jié)合推薦對(duì)象間關(guān)聯(lián)關(guān)系的社會(huì)化推薦算法[J]. 計(jì)算機(jī)學(xué)報(bào), 2014, 37(1):219-228.
[7]孟祥武,劉樹棟,張玉潔,等. 社會(huì)化推薦系統(tǒng)研究[J]. 軟件學(xué)報(bào), 2015,26(6):1356-1372.
[8]吳錚, 于洪濤, 劉樹新, 等.? 基于信息熵的跨社交網(wǎng)絡(luò)用戶身份識(shí)別方法[J]. 計(jì)算機(jī)應(yīng)用, 2017, 37(8): 2374-2380.