摘" 要: 現(xiàn)有的異質(zhì)網(wǎng)絡(luò)多尺度離群點(diǎn)挖掘算法忽略了數(shù)據(jù)點(diǎn)之間的順序關(guān)系,無(wú)法充分利用數(shù)據(jù)點(diǎn)在異質(zhì)網(wǎng)絡(luò)中的排列順序信息,從而導(dǎo)致聚類精度下降。對(duì)此,提出一種基于無(wú)監(jiān)督學(xué)習(xí)的異質(zhì)網(wǎng)絡(luò)多尺度離群點(diǎn)挖掘方法,對(duì)異質(zhì)網(wǎng)絡(luò)的多節(jié)點(diǎn)、多邊特點(diǎn)進(jìn)行分析。利用季節(jié)?趨勢(shì)時(shí)序分解法提取異質(zhì)網(wǎng)絡(luò)數(shù)據(jù)特征。根據(jù)數(shù)據(jù)特征,結(jié)合K?means聚類算法與排序算法,將數(shù)據(jù)點(diǎn)的排序信息添加至聚類過(guò)程中,以實(shí)現(xiàn)對(duì)異質(zhì)網(wǎng)絡(luò)數(shù)據(jù)離群點(diǎn)的挖掘。實(shí)驗(yàn)結(jié)果表明,利用該方法進(jìn)行網(wǎng)絡(luò)數(shù)據(jù)節(jié)點(diǎn)聚類的準(zhǔn)確率均能達(dá)到80%以上;并且實(shí)現(xiàn)了多尺度離群點(diǎn)挖掘后,能夠精準(zhǔn)地識(shí)別出離群點(diǎn),為后續(xù)的網(wǎng)絡(luò)通信維護(hù)提供了良好的保障。
關(guān)鍵詞: 異質(zhì)網(wǎng)絡(luò); 多尺度; 離群點(diǎn)挖掘; 無(wú)監(jiān)督學(xué)習(xí); K均值聚類; 網(wǎng)絡(luò)數(shù)據(jù); 離群因子
中圖分類號(hào): TN911?34; TP391" " " " " " " " " " 文獻(xiàn)標(biāo)識(shí)碼: A" " " " " " " " " " "文章編號(hào): 1004?373X(2024)12?0182?05
Research on heterogeneous networks multi?scale outlier mining based on
unsupervised learning
ZHU Hui1, ZHANG Liyun2
(1. Guilin University of Technology, Nanning 530001, China; 2. School of Information and Management, Guangxi Medical University, Nanning 530021, China)
Abstract: The existing multi?scale outlier mining algorithms for heterogeneous networks ignore the sequential relationship between data points and cannot fully utilize the information of the arrangement order of data points in heterogeneous networks, resulting in a decrease in clustering accuracy. Therefore, a heterogeneous networks multi?scale outlier mining method based on unsupervised learning is proposed, and the multinode and multilateral characteristics of heterogeneous networks are analyzed. The seasonal trend time series decomposition method is used to extract data features of heterogeneous networks. In combiantion with K?means clustering algorithm and sorting algorithm, the sorting information of data points is added to the clustering process to achieve outlier mining in heterogeneous network data according to data characteristics. The experimental results show that the accuracy of the proposed method for clustering network data nodes can reach over 80%. After achieving multi?scale outlier mining, it is possible to accurately identify outliers, providing a good guarantee for subsequent network communication maintenance.
Keywords: heterogeneous networks; multi scale; outlier mining; unsupervised learning; K?means clustering; network data; outlier factor
0" 引" 言
異質(zhì)網(wǎng)絡(luò)(Heterogeneous Network)是一種類型網(wǎng)絡(luò),其特點(diǎn)在于網(wǎng)絡(luò)中的節(jié)點(diǎn)和邊具有不同的類型或?qū)傩?,能夠描述更?fù)雜的現(xiàn)實(shí)世界系統(tǒng),其中不同類型的實(shí)體和關(guān)系可以相互關(guān)聯(lián)[1]。多尺度離群點(diǎn)挖掘在異質(zhì)網(wǎng)絡(luò)中具有重要的作用,可以用于異質(zhì)網(wǎng)絡(luò)中的異常行為、入侵檢測(cè),實(shí)現(xiàn)多尺度離群點(diǎn)挖掘,有助于對(duì)異質(zhì)網(wǎng)絡(luò)的維護(hù)[2]。因此,進(jìn)行多尺度離群點(diǎn)挖掘已經(jīng)成為異質(zhì)網(wǎng)絡(luò)領(lǐng)域的熱門研究。
劉琨等人通過(guò)IPv6遠(yuǎn)程監(jiān)控得到無(wú)狀態(tài)網(wǎng)絡(luò)數(shù)據(jù),對(duì)網(wǎng)絡(luò)數(shù)據(jù)的特征進(jìn)行提取,并通過(guò)傅里葉變換和K均值方法分別實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)數(shù)據(jù)的分類和聚類,采用卷積神經(jīng)網(wǎng)絡(luò)對(duì)網(wǎng)絡(luò)數(shù)據(jù)中的多尺度離群點(diǎn)進(jìn)行挖掘[3]。但是網(wǎng)絡(luò)數(shù)據(jù)往往具有復(fù)雜性和多樣性,僅僅依賴傅里葉變換來(lái)提取網(wǎng)絡(luò)數(shù)據(jù)的特征存在不夠全面的現(xiàn)象,進(jìn)而導(dǎo)致挖掘性能降低。郭一陽(yáng)等人通過(guò)多個(gè)隨機(jī)投影實(shí)現(xiàn)對(duì)異質(zhì)網(wǎng)絡(luò)數(shù)據(jù)的降維,采用多離群點(diǎn)檢測(cè)器來(lái)構(gòu)建異質(zhì)集成模型,通過(guò)異質(zhì)模型從降維的異質(zhì)網(wǎng)絡(luò)數(shù)據(jù)中挖掘多尺度離群點(diǎn)[4]。但該方法通過(guò)多個(gè)離群點(diǎn)檢測(cè)器構(gòu)建的異質(zhì)集成模型,增加了模型的復(fù)雜性和過(guò)擬合的風(fēng)險(xiǎn),離群點(diǎn)數(shù)據(jù)挖掘的精度較差??狄埖热艘罁?jù)不等長(zhǎng)序列計(jì)算數(shù)據(jù)的相似程度,并使用偏最小二乘法完成不確定數(shù)據(jù)集的特征提??;再基于譜聚類算法對(duì)數(shù)據(jù)特征進(jìn)行計(jì)算,獲取數(shù)據(jù)的離群指數(shù);最后通過(guò)離群指數(shù)完成對(duì)不確定數(shù)據(jù)集的離群點(diǎn)挖掘[5]。但是偏最小二乘法在提取特征時(shí),無(wú)法充分考慮到數(shù)據(jù)的不確定性和復(fù)雜性,導(dǎo)致聚類性能受到影響。王曉輝等人利用節(jié)點(diǎn)計(jì)算性能對(duì)高維數(shù)據(jù)進(jìn)行區(qū)域分割,使用核密度描述局部密度,通過(guò)高斯分布計(jì)算數(shù)據(jù)出現(xiàn)次數(shù),得到數(shù)據(jù)鄰域密度,據(jù)此計(jì)算各數(shù)據(jù)離群度來(lái)識(shí)別異構(gòu)數(shù)據(jù)中的局部離群點(diǎn)[6]。但是對(duì)于大規(guī)模高維數(shù)據(jù),該方法可能需要較高的計(jì)算復(fù)雜度和運(yùn)行時(shí)間,從而影響其在實(shí)際應(yīng)用中的性能。
對(duì)此,本文提出一種基于無(wú)監(jiān)督學(xué)習(xí)的異質(zhì)網(wǎng)絡(luò)多尺度離群點(diǎn)挖掘方法。
1" 異質(zhì)網(wǎng)絡(luò)多尺度離群點(diǎn)挖掘
1.1" 異質(zhì)網(wǎng)絡(luò)
異質(zhì)網(wǎng)絡(luò)是一種具有多節(jié)點(diǎn)、多邊類型的網(wǎng)絡(luò)[5],結(jié)構(gòu)如圖1所示。
如圖1所示,以作者?論文?期刊為例,作者發(fā)表論文,論文被期刊錄用。其中,作者為目標(biāo)節(jié)點(diǎn),論文、期刊為屬性節(jié)點(diǎn),三者為不同的節(jié)點(diǎn)類型。論文發(fā)表的過(guò)程及期刊錄用論文的過(guò)程為邊類型,即元路徑。
異質(zhì)網(wǎng)絡(luò)表示為:
[D=U,V] (1)
式中:[U]、[V]分別表示為含有多種類型的節(jié)點(diǎn)集合、邊集合。
在異質(zhì)網(wǎng)絡(luò)中,設(shè)節(jié)點(diǎn)類型映射函數(shù)和邊類型映射函數(shù)為[φ:U→α];[?:V→β]。其中,異質(zhì)網(wǎng)絡(luò)節(jié)點(diǎn)類型集合和邊類型集合表示為[α]、[β],且[α+βgt;2],[u∈U],[v∈V],則分別將每個(gè)節(jié)點(diǎn)屬于對(duì)應(yīng)的節(jié)點(diǎn)類型和每條邊屬于對(duì)應(yīng)的邊類型表示為:[φu∈α]、[?v∈β]。
在異質(zhì)網(wǎng)絡(luò)結(jié)構(gòu)中,元路徑表示為:[α1→β1α2→β2…→βn-1αn],邊類型表示為[β=β1·β2·…·βn-1],“[·]”表示連接兩者間的復(fù)合運(yùn)算,[n]為元路徑[c]長(zhǎng)度。
若原路徑與反路徑之間的關(guān)系為[c=c-1],則該結(jié)構(gòu)稱為對(duì)稱元路徑[6],若[?i=1,2,…,n],[αi=φui],[βi=?vi],路徑[c]經(jīng)過(guò)節(jié)點(diǎn)[u1,u2,…,un],表示元路徑[c]為節(jié)點(diǎn)和邊具體化的元路徑實(shí)例[7]。
1.2" 異質(zhì)網(wǎng)絡(luò)數(shù)據(jù)特征提取
首先,設(shè)獲取的異質(zhì)網(wǎng)絡(luò)數(shù)據(jù)序列為[Ta=t1,t2,…,tn],通過(guò)季節(jié)?趨勢(shì)時(shí)序分解法將獲得的異質(zhì)網(wǎng)絡(luò)數(shù)據(jù)序列分為3個(gè)分量,表示為:
[Ta=DQa+Sa+Ja] (2)
式中:[Sa]、[Qa]、[Ja]分別為隨機(jī)性因素、趨勢(shì)性因素、季節(jié)性因素。則異質(zhì)網(wǎng)絡(luò)數(shù)據(jù)的季節(jié)性、趨勢(shì)性指標(biāo)表示為:
[j=1-varSavarSa-varQa] (3)
[q=1-varSavarTa-varJa] (4)
式中[var·]表示方差。
然后,提取異質(zhì)網(wǎng)絡(luò)數(shù)據(jù)的自相似性特征,異質(zhì)網(wǎng)絡(luò)數(shù)據(jù)序列中的零均值表示為:
[T′a=Ta-jq?meanTa] (5)
將異質(zhì)網(wǎng)絡(luò)數(shù)據(jù)均值處理的結(jié)果表示為[T′a]。設(shè)異質(zhì)網(wǎng)絡(luò)數(shù)據(jù)序列累積均值結(jié)果為[Oa],第[b]元素序列為[ob],則[ob]表示為:
[ob=a=1bT′a] (6)
式中[ob∈R]。采用赫斯特指數(shù)來(lái)表示異質(zhì)網(wǎng)絡(luò)數(shù)據(jù)的自相似性特征,公式為:
[Rδ=obLε2ε] (7)
最后,分別將異質(zhì)網(wǎng)絡(luò)數(shù)據(jù)序列的標(biāo)準(zhǔn)差、赫斯特指數(shù)、異質(zhì)網(wǎng)絡(luò)數(shù)據(jù)序列長(zhǎng)度表示為[δ]、[ε]、[L]。在異質(zhì)網(wǎng)絡(luò)數(shù)據(jù)分析中,數(shù)據(jù)的自相似性意味著數(shù)據(jù)在不同時(shí)間尺度上具有相似的統(tǒng)計(jì)特性。采用Hurst指數(shù)來(lái)量化這種自相似性。異質(zhì)網(wǎng)絡(luò)數(shù)據(jù)自相似性[ε]表示為:
[ε=2log L·Rδ] (8)
若[ε=12],則時(shí)間序列值是隨機(jī)的;若[0lt;εlt;12],則記憶逐漸變?nèi)?,即均值逐漸回復(fù);若[12lt;εlt;1],則記憶逐漸增強(qiáng),即得到長(zhǎng)期的異質(zhì)網(wǎng)絡(luò)數(shù)據(jù)時(shí)間序列。
1.3" 基于Rank?K?means聚類的多尺度離群點(diǎn)挖掘
K?means聚類算法是一種無(wú)監(jiān)督學(xué)習(xí)算法,屬于迭代求解的聚類分析算法。結(jié)合K?means聚類算法和排序算法,將數(shù)據(jù)點(diǎn)的排序信息添加至聚類過(guò)程中,適用于處理具有順序關(guān)系的異質(zhì)網(wǎng)絡(luò)多尺度離群點(diǎn)數(shù)據(jù)挖掘[8]。
將1.2節(jié)提取到的異質(zhì)網(wǎng)絡(luò)數(shù)據(jù)特征按數(shù)值升序的順序進(jìn)行排序,得到的曲線結(jié)果呈上升趨勢(shì)。設(shè)在曲線上相鄰的兩個(gè)數(shù)據(jù)為[g]、[h],[g]、[h∈T],且二者的排名分?jǐn)?shù)為[zg≤zh]。通過(guò)二者之間的斜率[kg]表示二者之間的排名分?jǐn)?shù)差,若[kg≠kh],則數(shù)據(jù)[g]為曲線上的一個(gè)折點(diǎn)。將曲線上所有折點(diǎn)集合表示為[B=b0,b1,b2,…,bn,…,bm],其中,[0≤n≤m],[0≤m≤N-1],[?bn∈T]。通過(guò)排名K均值聚類方法將1.2節(jié)獲取的異質(zhì)網(wǎng)絡(luò)數(shù)據(jù)特征聚類為K個(gè)簇,具體過(guò)程如下。
1) 若[m≥K-1],將集合[B]中的斜率[kn]最大的[K-1]個(gè)對(duì)象[bn]折點(diǎn)作為分割點(diǎn),將曲線劃分為[K]個(gè)簇。
2) 若[0lt;mlt;K-1],將集合[B]中所有對(duì)象和集合[T-B]的[N-m]個(gè)對(duì)象中的斜率進(jìn)行從大到小排序,選取前[K-1-m]個(gè)對(duì)象作為分割點(diǎn),對(duì)曲線進(jìn)行劃分。
3) 若[m=0],則將曲線平均分割為[K]個(gè)簇。
通過(guò)上述過(guò)程將異質(zhì)網(wǎng)絡(luò)數(shù)據(jù)特征中目標(biāo)對(duì)象劃分為[K]個(gè)簇,排序后選擇最中心的對(duì)象作為聚類簇中心[χnn=1,2,…,K]。
通過(guò)余弦相似性對(duì)聚類后的目標(biāo)對(duì)象進(jìn)行調(diào)整,以異質(zhì)網(wǎng)絡(luò)數(shù)據(jù)特征中的屬性對(duì)象為目標(biāo)對(duì)象特征,特征值為屬性對(duì)象與目標(biāo)對(duì)象之間的連接權(quán)值[9]。設(shè)異質(zhì)網(wǎng)絡(luò)為[D=x?y,ω],其中將目標(biāo)對(duì)象和屬性對(duì)象表示為[x]、[y],任一目標(biāo)對(duì)象[x∈Ti],[1≤i≤K],聚類[Ti]中心對(duì)象表示為[χi],計(jì)算目標(biāo)對(duì)象與中心對(duì)象之間的余弦相似度,公式為:
[simχi,x=χi,xχix] (9)
計(jì)算異質(zhì)網(wǎng)絡(luò)數(shù)據(jù)特征中所有的聚類目標(biāo)對(duì)象與中心對(duì)象之間的余弦相似度。異質(zhì)網(wǎng)絡(luò)數(shù)據(jù)特征的屬性對(duì)象被用作特征,而特征值表示屬性對(duì)象與目標(biāo)對(duì)象之間的連接權(quán)值。進(jìn)一步對(duì)聚類對(duì)象進(jìn)行調(diào)整,設(shè)定閾值[μ1],若計(jì)算得到的余弦相似度[simχi,xlt;μ1],則將對(duì)應(yīng)的目標(biāo)對(duì)象移動(dòng)至與其余弦相似度最大的聚類中。通過(guò)對(duì)聚類結(jié)果進(jìn)行調(diào)整,過(guò)程中的聚類簇中心也實(shí)時(shí)更新,最終實(shí)現(xiàn)向量誤差平方和最小,即能夠獲得最佳聚類中心。向量誤差平方表示為:
[γ=i=1Kx∈Tisimχi,x2] (10)
異質(zhì)網(wǎng)絡(luò)[D=x?y,ω]中存在任意屬性對(duì)象[yj∈Y1≤jlt;n],與目標(biāo)對(duì)象[x∈Ti]相對(duì)應(yīng),通過(guò)向量表示為[yj=f1j,f2j,…,fnj]。為對(duì)異質(zhì)網(wǎng)絡(luò)數(shù)據(jù)特征目標(biāo)對(duì)象聚類中的屬性對(duì)象進(jìn)行分析,從而得到分布異常的屬性對(duì)象[10],則向量[yj]的計(jì)算過(guò)程為:
[yj=f1j,f2j,…,fnjfij=yji=1nfnj] (11)
對(duì)于進(jìn)行歸一化處理后的多尺度屬性對(duì)象[yj],其期望與方差計(jì)算公式如式下:
[yj=i=1nfijn] (12)
[κyj=i=1nfij-yj2] (13)
在異質(zhì)網(wǎng)絡(luò)中,離群因子表示每個(gè)網(wǎng)絡(luò)數(shù)據(jù)特征屬性對(duì)象與整體數(shù)據(jù)的偏離情況。離群因子的計(jì)算過(guò)程為:
[λyj=κyjj=1nκyj] (14)
向量方差較大的情況說(shuō)明屬性分布異常,故設(shè)置合適的閾值[μ2],通過(guò)將離群因子與設(shè)定的閾值進(jìn)行比較,若[λyjgt;μ2],則說(shuō)明該屬性為離群點(diǎn)。
將異質(zhì)網(wǎng)絡(luò)中提取的多尺度類型對(duì)象表示為矩陣形式,將異質(zhì)網(wǎng)絡(luò)數(shù)據(jù)特征所有目標(biāo)對(duì)象和屬性對(duì)象之間的連接權(quán)值作為矩陣的每一項(xiàng),以屬性對(duì)象為特征,通過(guò)排名K均值聚類方法進(jìn)行處理,計(jì)算所有屬性對(duì)象的離群因子。通過(guò)與設(shè)定的閾值進(jìn)行比較,實(shí)現(xiàn)多尺度離群點(diǎn)的挖掘。
2" 實(shí)驗(yàn)與分析
2.1" 實(shí)驗(yàn)環(huán)境
為驗(yàn)證本文方法實(shí)現(xiàn)的網(wǎng)絡(luò)數(shù)據(jù)中多尺度離群點(diǎn)挖掘的效果,選取某網(wǎng)絡(luò)覆蓋面積為57萬(wàn)m2的地區(qū),通過(guò)遠(yuǎn)程監(jiān)控對(duì)網(wǎng)絡(luò)通信狀態(tài)進(jìn)行監(jiān)控,監(jiān)控點(diǎn)位為476個(gè),通過(guò)本文方法實(shí)現(xiàn)網(wǎng)絡(luò)數(shù)據(jù)的獲取,從獲取的網(wǎng)絡(luò)數(shù)據(jù)中隨機(jī)抽取10%用于實(shí)驗(yàn)驗(yàn)證。通過(guò)對(duì)獲取的網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行監(jiān)控,能夠?qū)崿F(xiàn)網(wǎng)絡(luò)數(shù)據(jù)中多尺度離群點(diǎn)的挖掘。網(wǎng)絡(luò)數(shù)據(jù)系統(tǒng)監(jiān)控界面如圖2所示。
由圖2可知,網(wǎng)絡(luò)數(shù)據(jù)系統(tǒng)能夠?qū)崿F(xiàn)對(duì)網(wǎng)絡(luò)數(shù)據(jù)的管理。通過(guò)本文方法能夠?qū)W(wǎng)絡(luò)數(shù)據(jù)中的離群點(diǎn)進(jìn)行檢測(cè),在網(wǎng)絡(luò)數(shù)據(jù)系統(tǒng)中顯示出檢測(cè)時(shí)間、網(wǎng)絡(luò)數(shù)據(jù)狀態(tài)以及離群點(diǎn)個(gè)數(shù),相關(guān)人員能夠清晰地看出網(wǎng)絡(luò)通信的狀態(tài)和多尺度離群點(diǎn)挖掘,及時(shí)發(fā)現(xiàn)異常,進(jìn)行排查。驗(yàn)證了本文方法的有效性,為網(wǎng)絡(luò)數(shù)據(jù)領(lǐng)域提供了技術(shù)支持。
2.2" 實(shí)驗(yàn)指標(biāo)
為驗(yàn)證本文方法實(shí)現(xiàn)網(wǎng)絡(luò)數(shù)據(jù)節(jié)點(diǎn)聚類的有效性,對(duì)聚類的準(zhǔn)確率進(jìn)行測(cè)試,表達(dá)式為:
[A=TrTn×100%] (15)
式中:[Tr]表示正確分類的數(shù)據(jù)點(diǎn)數(shù);[Tn]表示總數(shù)據(jù)點(diǎn)數(shù)。
2.3" 實(shí)驗(yàn)結(jié)果
為了驗(yàn)證采用本文方法來(lái)實(shí)現(xiàn)網(wǎng)絡(luò)數(shù)據(jù)節(jié)點(diǎn)聚類的有效性,分別在不同聚類數(shù)量([σ])及不同網(wǎng)絡(luò)通信節(jié)點(diǎn)數(shù)據(jù)集([τ])情況下對(duì)聚類的準(zhǔn)確率進(jìn)行計(jì)算,結(jié)果如表1所示。
由表1可知,通過(guò)本文方法進(jìn)行網(wǎng)絡(luò)數(shù)據(jù)節(jié)點(diǎn)聚類的準(zhǔn)確率較高,均能達(dá)到80%以上。證明它是一種有效的無(wú)監(jiān)督學(xué)習(xí)方法。通過(guò)對(duì)不同聚類數(shù)量、不同網(wǎng)絡(luò)通信節(jié)點(diǎn)數(shù)據(jù)集進(jìn)行研究,可以發(fā)現(xiàn),當(dāng)聚類數(shù)量為25 000,網(wǎng)絡(luò)通信節(jié)點(diǎn)數(shù)據(jù)集為7時(shí),實(shí)現(xiàn)網(wǎng)絡(luò)數(shù)據(jù)節(jié)點(diǎn)聚類的準(zhǔn)確率高達(dá)99.34%。因此在本文研究過(guò)程中,將參數(shù)設(shè)置為如上情況,能夠提升網(wǎng)絡(luò)數(shù)據(jù)中多尺度離群點(diǎn)挖掘的準(zhǔn)確性。
為進(jìn)一步驗(yàn)證本文方法實(shí)現(xiàn)多尺度離群點(diǎn)挖掘的有效性,對(duì)比使用本文方法進(jìn)行多尺度離群點(diǎn)挖掘前后的網(wǎng)絡(luò)通信節(jié)點(diǎn)分布情況。多尺度離群點(diǎn)挖掘前后情況對(duì)比結(jié)果如圖3所示。
由圖3可知,通過(guò)本文方法實(shí)現(xiàn)網(wǎng)絡(luò)數(shù)據(jù)中多尺度離群點(diǎn)挖掘前后存在較大差異。對(duì)多尺度離群點(diǎn)挖掘前,網(wǎng)絡(luò)通信節(jié)點(diǎn)呈無(wú)規(guī)律形式分布,無(wú)顯著特點(diǎn),無(wú)法進(jìn)行離群點(diǎn)識(shí)別;通過(guò)本文方法實(shí)現(xiàn)的多尺度離群點(diǎn)挖掘后,網(wǎng)絡(luò)通信節(jié)點(diǎn)被劃分為不同的簇,能夠精準(zhǔn)地識(shí)別出離群點(diǎn),從而實(shí)現(xiàn)多尺度離群點(diǎn)挖掘。由此驗(yàn)證了,通過(guò)本文方法能夠有效地將網(wǎng)絡(luò)通信節(jié)點(diǎn)中的節(jié)點(diǎn)分為不同的簇,實(shí)現(xiàn)更精準(zhǔn)的多尺度離群點(diǎn)挖掘。
3" 結(jié)" 論
實(shí)現(xiàn)多尺度離群點(diǎn)挖掘在網(wǎng)絡(luò)通信領(lǐng)域具有重要意義。通過(guò)挖掘的離群點(diǎn),能夠確定網(wǎng)絡(luò)通信中的異常模式,及時(shí)發(fā)現(xiàn)問(wèn)題點(diǎn),從而確保網(wǎng)絡(luò)通信的安全性、可靠性。本文所提基于Rank?K?means聚類的無(wú)監(jiān)督學(xué)習(xí)方法,能夠?qū)崿F(xiàn)高效率、高精準(zhǔn)度的網(wǎng)絡(luò)通信多尺度離群點(diǎn)挖掘,為后續(xù)的網(wǎng)絡(luò)通信維護(hù)工作提供了依據(jù)。
注:本文通訊作者為張莉蕓。
參考文獻(xiàn)
[1] 康耀龍,馮麗露,張景安,等.基于譜聚類的高維類別屬性數(shù)據(jù)流離群點(diǎn)挖掘算法[J].吉林大學(xué)學(xué)報(bào)(工學(xué)版),2022,52(6):1422?1427.
[2] 程雅瓊.基于雙區(qū)塊鏈結(jié)構(gòu)的高維光譜離群數(shù)據(jù)挖掘[J].電腦知識(shí)與技術(shù),2022,18(15):17?18.
[3] 劉琨,張曉涵,曹汝坤,等.IPv6遠(yuǎn)程監(jiān)控網(wǎng)絡(luò)下無(wú)狀態(tài)通信數(shù)據(jù)的多尺度離群點(diǎn)挖掘算法[J].電信科學(xué),2023,39(8):118?126.
[4] 郭一陽(yáng),于炯,杜旭升,等.基于隨機(jī)投影與集成學(xué)習(xí)的離群點(diǎn)檢測(cè)算法[J].計(jì)算機(jī)應(yīng)用研究,2022,39(9):2608?2614.
[5] 康耀龍,馮麗露,張景安,等.基于譜聚類的不確定數(shù)據(jù)集中快速離群點(diǎn)挖掘算法[J].吉林大學(xué)學(xué)報(bào)(工學(xué)版),2023,53(4):1181?1186.
[6] 王曉輝,宋學(xué)坤,王曉川.基于鄰域密度的異構(gòu)數(shù)據(jù)局部離群點(diǎn)挖掘算法[J].計(jì)算機(jī)仿真,2021,38(7):281?285.
[7] 邴睿,袁冠,孟凡榮,等.多視圖對(duì)比增強(qiáng)的異質(zhì)圖結(jié)構(gòu)學(xué)習(xí)方法[J].軟件學(xué)報(bào),2023,34(10):4477?4500.
[8] 張亞玲,屈玲玉.應(yīng)用BWP指標(biāo)的差分隱私保護(hù)k?means算法[J].計(jì)算機(jī)工程與應(yīng)用,2022,58(10):108?115.
[9] 蔣斌,黃恩銘.基于分形理論的異質(zhì)網(wǎng)絡(luò)中局部離群點(diǎn)檢測(cè)[J].計(jì)算機(jī)仿真,2023,40(1):544?547.
[10] 劉貞國(guó),朱宇,劉連照,等.基于轉(zhuǎn)化策略的異質(zhì)超網(wǎng)絡(luò)表示學(xué)習(xí)[J].計(jì)算機(jī)應(yīng)用研究,2022,39(11):3333?3339.
[11] 熊回香,唐明月,葉佳鑫,等.融合加權(quán)異質(zhì)網(wǎng)絡(luò)與網(wǎng)絡(luò)表示學(xué)習(xí)的學(xué)術(shù)信息推薦研究[J].現(xiàn)代情報(bào),2023,43(5):23?34.
[12] 楊成波,周麗華,黃亞群,等.異質(zhì)網(wǎng)絡(luò)中基于關(guān)鍵詞屬性的Truss社區(qū)搜索[J].計(jì)算機(jī)應(yīng)用研究,2023,40(6):1708?1714.
[13] 李慧,劉莎,胡耀華,等.融合異質(zhì)網(wǎng)絡(luò)與表示學(xué)習(xí)的科研合作預(yù)測(cè)方法研究[J].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2023,7(9):78?88.