• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于網(wǎng)格耦合的數(shù)據(jù)流異常檢測(cè)*

    2020-03-04 08:13:28張東月周麗華丁海燕
    關(guān)鍵詞:檢測(cè)

    楊 杰,張東月,周麗華,黃 皓,丁海燕

    (云南大學(xué)信息學(xué)院,云南 昆明 650504)

    1 引言

    數(shù)據(jù)流是一種隨著時(shí)間增加而順序、快速、大量、連續(xù)到達(dá)的數(shù)據(jù)序列。近年來(lái),隨著計(jì)算機(jī)技術(shù)的發(fā)展,大量的數(shù)據(jù)流不斷產(chǎn)生,如網(wǎng)絡(luò)流量、金融數(shù)據(jù)、氣象數(shù)據(jù)等。數(shù)據(jù)流中存在一些對(duì)象與其他數(shù)據(jù)對(duì)象顯著不同,好像它們是由不同的機(jī)制產(chǎn)生的,這些對(duì)象被稱作異常[1]。對(duì)數(shù)據(jù)流中異常進(jìn)行檢測(cè)可以預(yù)測(cè)數(shù)據(jù)對(duì)象的行為和發(fā)展趨勢(shì),對(duì)于人們的工作、生活具有重要意義。數(shù)據(jù)流的異常檢測(cè)廣泛應(yīng)用于網(wǎng)絡(luò)入侵檢測(cè)、金融風(fēng)險(xiǎn)分析和異常天氣檢測(cè)等領(lǐng)域,已經(jīng)成為數(shù)據(jù)挖掘中的一個(gè)重要研究熱點(diǎn)[2 - 5]。然而,由于數(shù)據(jù)流具有連續(xù)、無(wú)限和時(shí)變等特點(diǎn),數(shù)據(jù)流的異常檢測(cè)仍面臨許多挑戰(zhàn),比如數(shù)據(jù)流不能以有限內(nèi)存進(jìn)行存儲(chǔ),流中的數(shù)據(jù)對(duì)象不能隨機(jī)訪問(wèn),數(shù)據(jù)對(duì)象對(duì)于決策的影響隨時(shí)間的流逝逐漸衰減,如何提高數(shù)據(jù)流異常檢測(cè)的精確度和效率等。

    針對(duì)數(shù)據(jù)流異常檢測(cè)存在的諸多挑戰(zhàn),許多數(shù)據(jù)流異常檢測(cè)算法被提出[4,6,7]。這些算法利用距離、密度或聚類等手段來(lái)區(qū)分正常數(shù)據(jù)和異常,雖然能夠較精確地檢測(cè)數(shù)據(jù)流中的異常,但是它們均以數(shù)據(jù)對(duì)象為處理單元,需要對(duì)數(shù)據(jù)流中每個(gè)數(shù)據(jù)應(yīng)用詳盡的策略進(jìn)行異常判斷,這大大降低了算法處理數(shù)據(jù)流的速度,影響了算法的效率。而為了快速處理數(shù)據(jù)流,Chen等人[8]將網(wǎng)格引入到了數(shù)據(jù)流聚類中,將不斷到達(dá)的數(shù)據(jù)流映射到一組支持快速查找的網(wǎng)格結(jié)構(gòu)中,以此匯總數(shù)據(jù)流并提取數(shù)據(jù)流的概要信息,然后以網(wǎng)格為單元進(jìn)行后續(xù)處理。與以數(shù)據(jù)對(duì)象為處理單元的算法相比,網(wǎng)格的應(yīng)用大大加快了數(shù)據(jù)流的處理速度,進(jìn)而提高了算法的效率。但是,Chen等人[8]在將數(shù)據(jù)對(duì)象映射到網(wǎng)格并增量更新網(wǎng)格時(shí),獨(dú)立處理每個(gè)網(wǎng)格,忽略了網(wǎng)格之間的相互影響,使得提取的數(shù)據(jù)流概要不夠精確,從而影響了算法的精確度。張東月等人[9]也采用了網(wǎng)格的方式進(jìn)行數(shù)據(jù)流的聚類,但是在將數(shù)據(jù)對(duì)象映射到網(wǎng)格后不是獨(dú)立處理網(wǎng)格,而是考慮了網(wǎng)格之間的相互影響(即網(wǎng)格耦合),該方法有效提高了聚類的精確度。

    受此啟發(fā),本文提出了一種基于網(wǎng)格耦合的數(shù)據(jù)流異常檢測(cè)算法GCStream-OD(Grid Coupling based data Stream Outlier Detection)。首先,基于網(wǎng)格內(nèi)的數(shù)據(jù)對(duì)象定義網(wǎng)格權(quán)重,并在數(shù)據(jù)映射到網(wǎng)格的過(guò)程中不再獨(dú)立處理網(wǎng)格,而是基于網(wǎng)格內(nèi)數(shù)據(jù)對(duì)象的分布狀態(tài)考慮網(wǎng)格之間權(quán)重的相互影響,即一個(gè)網(wǎng)格權(quán)重的變化會(huì)使相鄰網(wǎng)格的權(quán)重增加或減小。網(wǎng)格的耦合能更加準(zhǔn)確地捕捉數(shù)據(jù)之間的相關(guān)性,從而提高檢測(cè)精確度。其次,基于網(wǎng)格內(nèi)數(shù)據(jù)分布的密度和網(wǎng)格間的距離度量每個(gè)網(wǎng)格的異常程度,使得異常度量更為準(zhǔn)確。最后,在實(shí)時(shí)映射數(shù)據(jù)流更新網(wǎng)格的過(guò)程中,通過(guò)剪枝策略周期性地去除那些數(shù)據(jù)量較多、不可能為異常的網(wǎng)格,縮小了異常的查找范圍,從而提高算法的效率。

    本文的主要貢獻(xiàn)包括:

    (1)提出了一種基于網(wǎng)格耦合的數(shù)據(jù)流異常檢測(cè)算法GCStream-OD。該算法以網(wǎng)格為處理單元,以網(wǎng)格耦合的思想更新網(wǎng)格,并基于網(wǎng)格內(nèi)數(shù)據(jù)分布的密度和網(wǎng)格間的距離度量每個(gè)網(wǎng)格的異常程度。網(wǎng)格的耦合以及網(wǎng)格內(nèi)數(shù)據(jù)分布的密度和網(wǎng)格間距離的融合,更為精確地捕捉了數(shù)據(jù)之間的相關(guān)性,從而提高檢測(cè)精確度。

    (2)提出了一種剪枝策略。該策略在實(shí)時(shí)映射數(shù)據(jù)流更新網(wǎng)格的過(guò)程中,周期性地去除不可能成為異常網(wǎng)格的網(wǎng)格,從而縮小異常的查找范圍,提高算法效率。

    (3)在5個(gè)真實(shí)數(shù)據(jù)集上,分別對(duì)GCStream-OD算法的檢測(cè)質(zhì)量和效率進(jìn)行了實(shí)驗(yàn)驗(yàn)證。實(shí)驗(yàn)結(jié)果表明GCStream-OD算法具有較高的檢測(cè)質(zhì)量和效率。

    2 相關(guān)工作

    數(shù)據(jù)流異常檢測(cè)是檢驗(yàn)數(shù)據(jù)流中是否有不符合常理的數(shù)據(jù)對(duì)象的過(guò)程。這些異常如果不被檢測(cè)出來(lái),會(huì)對(duì)數(shù)據(jù)流的挖掘分析結(jié)果產(chǎn)生負(fù)面影響。近年來(lái),提出了一些針對(duì)數(shù)據(jù)流的異常檢測(cè)算法[10,11]。這些算法主要分為4類:基于距離的算法、基于密度的算法、基于統(tǒng)計(jì)的算法和基于聚類的算法。

    基于距離的異常檢測(cè)算法最早是由Knorr等人[12]提出的,其主要思想是計(jì)算數(shù)據(jù)對(duì)象之間的距離,然后以距離定義它們之間的鄰近度,而異常往往是那些遠(yuǎn)離大部分?jǐn)?shù)據(jù)的對(duì)象。基于密度的異常檢測(cè)算法是根據(jù)對(duì)象的密度定義異常,如果某些點(diǎn)周圍的數(shù)據(jù)點(diǎn)比較稀疏,則這些點(diǎn)會(huì)被算法視為異常進(jìn)而從數(shù)據(jù)流中過(guò)濾出來(lái)。最典型的算法為局部異常因子LOF(Local Outlier Factor)算法[13],它根據(jù)每個(gè)數(shù)據(jù)對(duì)象的k近鄰密度,為每個(gè)數(shù)據(jù)對(duì)象分配了1個(gè)表示異??赡苄源笮〉腖OF得分。iLOF算法[14]為L(zhǎng)OF算法的增量版本。MiLOF算法[15]是一種能夠在有限的內(nèi)存環(huán)境中完成數(shù)據(jù)流的異常檢測(cè)的基于密度的數(shù)據(jù)流異常檢測(cè)算法?;诮y(tǒng)計(jì)的異常檢測(cè)算法最早是由Barnett等人[16]和Hawkins[17]提出的。這類算法的主要思想是利用平均值、方差等對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì),進(jìn)而確定那些明顯不同于大部分?jǐn)?shù)據(jù)的對(duì)象?;诰垲惖漠惓z測(cè)對(duì)數(shù)據(jù)對(duì)象進(jìn)行聚類,以此來(lái)獲取不屬于簇的點(diǎn)或者一些明顯小于其它簇的數(shù)據(jù)集合。這種方法的主要過(guò)程是將數(shù)據(jù)聚集成簇,并判斷簇的大小,將小于閾值的簇視為異常。典型的算法有CORM(Cluster based OutlieR Miner)[6]、ROCK(RObust Clustering using linKs)[18]、CLARANS(Clustering Large Applications based on RANdomized Search)[19]等。CORM算法利用滑動(dòng)窗口將數(shù)據(jù)流分塊,對(duì)于第1個(gè)窗口中的數(shù)據(jù)流,該算法先使用K-means算法將其劃分為k個(gè)簇,只保留每個(gè)簇的中心。對(duì)于后續(xù)窗口中的數(shù)據(jù),首先根據(jù)數(shù)據(jù)對(duì)象到各個(gè)簇中心的距離進(jìn)行對(duì)象所屬簇的劃分,然后每個(gè)簇根據(jù)其分得的新數(shù)據(jù)更新簇中心。根據(jù)當(dāng)前窗口中的數(shù)據(jù)對(duì)象和更新后的簇中心距離得到候選異常數(shù)據(jù)。當(dāng)候選異常數(shù)據(jù)經(jīng)過(guò)L個(gè)窗口后仍為候選異常值時(shí),則將其聲明為異常。CORM并沒(méi)有使用網(wǎng)格或微簇匯總數(shù)據(jù)流,而是以數(shù)據(jù)流中的每個(gè)數(shù)據(jù)對(duì)象為處理單元,這會(huì)降低算法的效率,并占用較大的內(nèi)存。

    iForest(isolation Forest)算法[20]使用稱為隔離樹(shù)的二叉樹(shù)結(jié)構(gòu),它可以有效構(gòu)建并且隔離數(shù)據(jù)對(duì)象。異常更容易被分離到更靠近隔離樹(shù)的根部,而正常點(diǎn)更可能在隔離樹(shù)的更深層被隔離掉。與其他異常檢測(cè)算法通過(guò)距離、密度等量化指標(biāo)來(lái)刻畫樣本間的疏離程度不同,iForest算法純粹基于隔離概念檢測(cè)異常。該算法大致可以分為2個(gè)階段;第1個(gè)階段需要訓(xùn)練出多棵孤立樹(shù),組成孤立森林;第2階段將每個(gè)樣本點(diǎn)代入森林中的每棵孤立樹(shù),計(jì)算平均高度,然后再計(jì)算每個(gè)樣本點(diǎn)的異常值分?jǐn)?shù)。iForest算法是一種半監(jiān)督的算法,需要一定的訓(xùn)練數(shù)據(jù),這在一些應(yīng)用場(chǎng)景下是不適用的。

    3 基于網(wǎng)格耦合的異常檢測(cè)算法

    本節(jié)首先介紹網(wǎng)格耦合的思想及概念,然后給出基于網(wǎng)格耦合的異常檢測(cè)算法GCStream-OD。

    3.1 網(wǎng)格耦合

    輸入數(shù)據(jù)流中的每個(gè)數(shù)據(jù)對(duì)象x=(x1,x2,…,xd)都是d維空間中的一個(gè)點(diǎn),xi表示數(shù)據(jù)對(duì)象在空間的第i維上的取值。如果x1屬于s1的j1區(qū)間,x2屬于s2的j2區(qū)間,以此類推xd屬于sd的jd區(qū)間,則可以將數(shù)據(jù)對(duì)象x映射到空間S的網(wǎng)格g=(j1,j2,…,jd)中。映射到同一網(wǎng)格中的數(shù)據(jù)對(duì)象距離相近,因此可以對(duì)各個(gè)網(wǎng)格內(nèi)的數(shù)據(jù)進(jìn)行匯總,形成概要。后續(xù)的數(shù)據(jù)分析可以只針對(duì)概要進(jìn)行處理,從而降低存儲(chǔ)空間和計(jì)算成本。

    網(wǎng)格權(quán)重定義為網(wǎng)格內(nèi)各個(gè)數(shù)據(jù)對(duì)象的權(quán)重之和,數(shù)據(jù)的權(quán)重用于體現(xiàn)數(shù)據(jù)對(duì)象的“新鮮”程度。隨著時(shí)間的推移數(shù)據(jù)對(duì)象的“新鮮”程度越來(lái)越低,因此網(wǎng)格權(quán)重的大小是對(duì)網(wǎng)格內(nèi)數(shù)據(jù)對(duì)象的數(shù)目和“新鮮”程度的反映。數(shù)據(jù)對(duì)象權(quán)重和網(wǎng)格權(quán)重的定義分別如定義1和定義2所示。

    定義1(數(shù)據(jù)對(duì)象權(quán)重[9]) 如果數(shù)據(jù)對(duì)象x在tp時(shí)刻到達(dá),那么x在t時(shí)刻的權(quán)重W(x,t)的計(jì)算公式如式(1)所示:

    W(x,t)=λ-a(t-tp)

    (1)

    其中,λ-a(0<λ-a<1)為衰減因子。參數(shù)λ和a控制衰減因子的衰減速度,a的絕對(duì)值越大,衰減速度越快。

    定義2(網(wǎng)格權(quán)重[9]) 設(shè)E(g,t)表示到時(shí)刻t為止,映射到網(wǎng)格g中的數(shù)據(jù)對(duì)象集合,則網(wǎng)格g在時(shí)刻t的權(quán)重W(g,t)定義為網(wǎng)格g內(nèi)所有數(shù)據(jù)對(duì)象的權(quán)重之和。W(g,t)的計(jì)算如式(2)所示:

    (2)

    數(shù)據(jù)流中的數(shù)據(jù)對(duì)象順序到達(dá),因此各個(gè)網(wǎng)格映射的數(shù)據(jù)隨時(shí)間不斷變化,每個(gè)網(wǎng)格的概要需要隨時(shí)間不斷更新。網(wǎng)格耦合的思想是在更新網(wǎng)格的概要時(shí),根據(jù)網(wǎng)格中數(shù)據(jù)的分布狀態(tài)考慮網(wǎng)格之間的相互影響。網(wǎng)格之間的相互影響是由網(wǎng)格內(nèi)的數(shù)據(jù)分布來(lái)決定的。為了表示網(wǎng)格內(nèi)數(shù)據(jù)對(duì)象的分布狀態(tài),張東月等人[9]將網(wǎng)格內(nèi)帶權(quán)數(shù)據(jù)對(duì)象的中心定義為網(wǎng)格質(zhì)心,利用網(wǎng)格質(zhì)心的位置來(lái)表示網(wǎng)格內(nèi)的數(shù)據(jù)分布狀態(tài)。數(shù)據(jù)流的動(dòng)態(tài)性使得網(wǎng)格質(zhì)心是隨時(shí)間變化的。網(wǎng)格質(zhì)心的定義如定義3所示。

    定義3(網(wǎng)格質(zhì)心[9]) 網(wǎng)格g在t時(shí)刻的質(zhì)心C(g,t)定義為網(wǎng)格g內(nèi)帶權(quán)數(shù)據(jù)對(duì)象的加權(quán)平均[9]。根據(jù)式(3)進(jìn)行計(jì)算可以得到C(g,t):

    (3)

    網(wǎng)格之間的相互影響與網(wǎng)格的質(zhì)心距離有關(guān),網(wǎng)格質(zhì)心距離越近,網(wǎng)格之間的影響越大,反之越小。網(wǎng)格質(zhì)心之間的距離disC(gi,gj)使用質(zhì)心之間的歐氏距離進(jìn)行度量。設(shè)網(wǎng)格的影響區(qū)域閾值為Dislen,disC(gi,gj)≤Dislen表示網(wǎng)格gi對(duì)網(wǎng)格gj產(chǎn)生正影響,反之表示產(chǎn)生負(fù)影響。當(dāng)網(wǎng)格gi對(duì)網(wǎng)格gj產(chǎn)生正影響時(shí),網(wǎng)格gj的權(quán)重會(huì)隨著網(wǎng)格gi權(quán)重的增大而增大,當(dāng)產(chǎn)生負(fù)影響時(shí),網(wǎng)格gj的權(quán)重會(huì)隨著網(wǎng)格gi權(quán)重的增加而減小。設(shè)網(wǎng)格gi的權(quán)重增量為ΔW(gi),則對(duì)網(wǎng)格gj的權(quán)重影響按式(4)進(jìn)行更新。

    (4)

    其中,MaxCdis是相鄰網(wǎng)格質(zhì)心間的最大距離,MaxCdis可以按式(5)計(jì)算:

    (5)

    其中,len為網(wǎng)格邊長(zhǎng),Dim為數(shù)據(jù)維度。

    另外,為體現(xiàn)Dislen影響范圍內(nèi)網(wǎng)格之間的權(quán)重關(guān)系,引入了核心網(wǎng)格的概念。

    定義4(核心網(wǎng)格[9]) 設(shè)L(g,t)是網(wǎng)格g在Dislen影響范圍內(nèi)的網(wǎng)格集合,如果L(g,t)內(nèi)所有網(wǎng)格的權(quán)重之和大于閾值θ,即LW(g,t)=∑g′∈L(g,t)W(g′,t)>θ,則稱網(wǎng)格g為核心網(wǎng)格。所有核心網(wǎng)格的集合表示為L(zhǎng)D。

    3.2 GCStream-OD算法

    本節(jié)分別從相關(guān)定義、算法框架、剪枝策略以及算法描述4個(gè)方面對(duì)GCStream-OD算法進(jìn)行闡述。

    3.2.1 相關(guān)定義

    GCStream-OD算法在使用網(wǎng)格來(lái)檢測(cè)異常時(shí),從網(wǎng)格密度和網(wǎng)格距離2個(gè)因素進(jìn)行考慮。密度因素從網(wǎng)格的鄰居網(wǎng)格數(shù)目和網(wǎng)格本身密度2個(gè)方面度量網(wǎng)格是異常網(wǎng)格的可能性,如果1個(gè)網(wǎng)格周圍含有數(shù)據(jù)的鄰居網(wǎng)格數(shù)較少且本身密度較低,則該網(wǎng)格中的數(shù)據(jù)對(duì)象是異常的可能性較大。距離因素從網(wǎng)格與其它網(wǎng)格的距離方面度量網(wǎng)格是異常網(wǎng)格的可能性,如果1個(gè)網(wǎng)格距離其它大部分網(wǎng)格較遠(yuǎn),則該網(wǎng)格中的數(shù)據(jù)對(duì)象為異常的可能性較大。

    GCStream-OD算法為每個(gè)網(wǎng)格分配1個(gè)異常因子,每個(gè)異常因子由密度異常因子和距離異常因子2部分組成。異常因子的定義如定義5所示。

    定義5(網(wǎng)格異常因子(GOF)) 每個(gè)網(wǎng)格的異常因子的計(jì)算如式(6)所示:

    GOF(g)=denF(g)+disF(g)

    (6)

    其中,denF為密度異常因子,disF為距離異常因子。GOF值表示網(wǎng)格的異常程度,值越大表示其越可能為異常網(wǎng)格,值越小表示其越不可能為異常網(wǎng)格。

    密度異常因子denF的計(jì)算類似于LOF[13]的計(jì)算,因此需要定義網(wǎng)格的k距離、網(wǎng)格k距離鄰域、網(wǎng)格可達(dá)距離、網(wǎng)格局部可達(dá)密度等概念。

    定義6(網(wǎng)格的k距離) 對(duì)于網(wǎng)格gp,如果存在網(wǎng)格go滿足至少存在k個(gè)網(wǎng)格gq使得disC(gp,gq)≤disC(gp,go)和至多存在k-1個(gè)網(wǎng)格gq使得disC(gp,gq)

    k-distance(gp)用來(lái)度量網(wǎng)格gp局部區(qū)域的密度,其值越小,局部區(qū)域密度越大;其值越大,局部區(qū)域密度越小。

    定義7(網(wǎng)格的k距離鄰域) 與網(wǎng)格gp之間距離小于或等于k-distance(gp)的網(wǎng)格集合稱為gp的k距離鄰域,記為Nk(gp),如式(7)所示:

    Nk(gp)={go|disC(gp,go)≤k-distance(gp)}

    (7)

    定義8(網(wǎng)格可達(dá)距離) 網(wǎng)格gp和go之間的可達(dá)距離的定義如式(8)所示:

    reachdist(gp,go)=

    max(k-distance(go),disC(gp,go))

    (8)

    定義9(網(wǎng)格局部可達(dá)密度) 網(wǎng)格gp的局部可達(dá)密度為Nk(gp)中所有網(wǎng)格平均可達(dá)距離的倒數(shù),可以通過(guò)式(9)計(jì)算得到:

    (9)

    定義10(網(wǎng)格密度異常因子) 網(wǎng)格gp密度異常因子定義為其k距離鄰域Nk(gp)內(nèi)網(wǎng)格的局部可達(dá)密度與網(wǎng)格gp局部可達(dá)密度之比的平均數(shù),如式(10)所示:

    (10)

    其中,局部異常因子denF(gp)越大,表示網(wǎng)格gp為異常的可能性越大,反之成立。

    denF(gp)從密度的角度表征了網(wǎng)格gp為異常的程度。從距離角度表征1個(gè)網(wǎng)格異常的程度的距離異常因子disF由定義11給出。

    定義11(距離異常因子disF) 設(shè)gc是1個(gè)核心網(wǎng)格,L(gc,t)是與網(wǎng)格gc最近的低權(quán)重網(wǎng)格集合,gi∈L(gc,t),則網(wǎng)格gi的距離異常因子定義為gi與gc之間的距離與L(gc,t)內(nèi)的網(wǎng)格與gc之間的最大距離之比,通過(guò)式(11)計(jì)算得到:

    (11)

    其中,任意網(wǎng)格g的距離因子滿足0

    定義12(異常網(wǎng)格) 在當(dāng)前時(shí)刻t如果網(wǎng)格g的異常因子大于一定閾值εo,即GOF(g)>εo,則將網(wǎng)格g視為異常網(wǎng)格。異常網(wǎng)格中的數(shù)據(jù)對(duì)象即為異常。

    3.2.2 算法框架

    由于數(shù)據(jù)流具有快速、大量、連續(xù)到達(dá)的特性,為了更好地處理數(shù)據(jù)流,GCStream-OD算法采用在線/離線的框架。在線階段處理源源不斷到達(dá)的數(shù)據(jù),離線階段進(jìn)行離群點(diǎn)檢測(cè)。GCStream-OD算法流程圖如圖1所示。

    Figure 1 Flow chart of GCStream-OD algorithm圖1 GCStream-OD算法流程圖

    GCStream-OD算法分為在線階段和離線階段2個(gè)部分。在線階段的主要工作是將隨時(shí)間到達(dá)的數(shù)據(jù)流映射到網(wǎng)格中,然后根據(jù)網(wǎng)格耦合思想更新網(wǎng)格,最后周期性地檢測(cè)網(wǎng)格權(quán)重并保留低權(quán)重網(wǎng)格作為異常的候選集合。離線階段的主要工作是計(jì)算每個(gè)低權(quán)重網(wǎng)格的異常因子,并根據(jù)異常因子判斷網(wǎng)格是否為異常網(wǎng)格。具體操作將在后面2節(jié)進(jìn)行介紹。

    3.2.3 剪枝策略

    在上述框架中,周期性檢測(cè)過(guò)程中若簡(jiǎn)單地將除核心網(wǎng)格外的所有網(wǎng)格作為低權(quán)重網(wǎng)格存至lwGirdList,將會(huì)使離線階段需要大量的計(jì)算,影響算法效率。針對(duì)這一問(wèn)題,本文根據(jù)異常數(shù)據(jù)量較少、密度較低的特點(diǎn),提出了一種剪枝策略。剪枝策略的主要思想是在周期性檢測(cè)過(guò)程中判定低權(quán)重網(wǎng)格時(shí),根據(jù)網(wǎng)格權(quán)重的大小篩選網(wǎng)格,保留權(quán)重較小的網(wǎng)格,去除網(wǎng)格權(quán)重大的非核心網(wǎng)格,判定標(biāo)準(zhǔn)為將網(wǎng)格權(quán)重低于μθ的網(wǎng)格劃為低權(quán)重網(wǎng)格,其中θ為判斷核心網(wǎng)格時(shí)所取的閾值,μ∈(0,1)。一個(gè)網(wǎng)格如果權(quán)重較大,表示該網(wǎng)格內(nèi)數(shù)據(jù)對(duì)象數(shù)目多或權(quán)重高,則該網(wǎng)格內(nèi)的數(shù)據(jù)對(duì)象為異常的可能性小,其被剪枝后對(duì)算法的精確度基本沒(méi)有影響,但能很好地提升算法的效率。如圖2所示,在ta時(shí)刻數(shù)據(jù)流映射到網(wǎng)格1~12,網(wǎng)格3是核心網(wǎng)格,其余網(wǎng)格均是非核心網(wǎng)格。經(jīng)過(guò)剪枝之后,權(quán)重較大的網(wǎng)格1、2、4、5和6會(huì)被去除,而網(wǎng)格權(quán)重較小的網(wǎng)格7~12以及核心網(wǎng)格3會(huì)被保留。進(jìn)行異常檢測(cè)時(shí),只需對(duì)網(wǎng)格7~12進(jìn)行處理,減少了離線階段的計(jì)算量,極大地提高算法運(yùn)行效率。

    經(jīng)過(guò)剪枝之后,一些權(quán)重較低的網(wǎng)格,原本距離高權(quán)重網(wǎng)格較近不屬于異常,但這類網(wǎng)格由于高權(quán)重鄰居網(wǎng)格的剪枝使得周圍鄰居網(wǎng)格數(shù)驟減、密度降低,很容易被視為異常,進(jìn)而影響算法精確度。距離異常因子的引入可以避免這種問(wèn)題。比如,圖2b中網(wǎng)格7,圖中五角星表示每個(gè)網(wǎng)格的質(zhì)心位置。網(wǎng)格7周圍數(shù)據(jù)量較少,其密度比較低,但是網(wǎng)格7與網(wǎng)格3質(zhì)心距離較近,即denF(7)較大,disF(7)較小,所以網(wǎng)格7的異常因子不會(huì)太高。圖2b中只有網(wǎng)格12為異常。由于考慮了網(wǎng)格耦合,圖2b中只有網(wǎng)格12為異常,若不考慮網(wǎng)格耦合,網(wǎng)格8、9、10和11均為異常。因此,該剪枝策略適用于GCStream-OD算法。

    Figure 2 Data distribution within the grid up to time ta圖2 截止到ta時(shí)刻網(wǎng)格內(nèi)的數(shù)據(jù)分布

    3.2.4 算法描述

    GCStream-OD算法在線階段將到來(lái)的數(shù)據(jù)流映射到對(duì)應(yīng)網(wǎng)格并通過(guò)周期性檢測(cè)得到低權(quán)重網(wǎng)格,具體細(xì)節(jié)如算法1所示。算法1需要1個(gè)數(shù)據(jù)流和1個(gè)檢測(cè)周期tp作為輸入。算法1首先初始化網(wǎng)格列表為空和tc=0,之后開(kāi)始接收數(shù)據(jù)流中的數(shù)據(jù),直到數(shù)據(jù)流結(jié)束后停止算法執(zhí)行。每當(dāng)從數(shù)據(jù)流中獲得1個(gè)新數(shù)據(jù)對(duì)象x,先將對(duì)象x映射到對(duì)應(yīng)的網(wǎng)格gx。若網(wǎng)格gx不存在,則創(chuàng)建網(wǎng)格gx并將其插入到網(wǎng)格列表中,再將對(duì)象x映射在所屬的網(wǎng)格gx。之后根據(jù)網(wǎng)格耦合思想更新網(wǎng)格gx的屬性:(1)根據(jù)式(2)計(jì)算網(wǎng)格權(quán)重;(2)根據(jù)式(3)計(jì)算網(wǎng)格質(zhì)心;(3)根據(jù)式(4)更新gx周邊網(wǎng)格的權(quán)重。更新網(wǎng)格后可能造成核心網(wǎng)格的變更,因此需要更新核心網(wǎng)格。每當(dāng)處理完1個(gè)數(shù)據(jù)對(duì)象x后,tc加1,同時(shí)判斷1個(gè)周期是否結(jié)束,若結(jié)束,先更新核心網(wǎng)格,再將通過(guò)剪枝策略得到的低權(quán)重網(wǎng)格存至lwGirdList,之后觸發(fā)執(zhí)行離線階段。

    算法1GCStream-OD在線階段

    輸入:數(shù)據(jù)流,檢測(cè)周期tp。

    輸出:低權(quán)重網(wǎng)格列表lwGirdList。

    1.初始化網(wǎng)格列表,tc=0;

    2.while(數(shù)據(jù)流沒(méi)有結(jié)束)

    3. 從流中獲取數(shù)據(jù)對(duì)象x=(x1,x2,…,xd);

    4. 確定數(shù)據(jù)對(duì)象x所屬的網(wǎng)格gx;

    5. if(網(wǎng)格gx不存在于網(wǎng)格列表)

    6. 創(chuàng)建網(wǎng)格gx并將其插入到網(wǎng)格列表;

    7. end if

    8. 將數(shù)據(jù)對(duì)象x映射到網(wǎng)格gx;

    9. 更新網(wǎng)格gx;

    10.tc=tc+1;

    11. if (tcmodtp==0)

    12. 更新核心網(wǎng)格;

    13. 通過(guò)剪枝策略得到低權(quán)重網(wǎng)格并將其存至lwGirdList;

    14. end if

    15.end while

    GCStream-OD算法在離線階段為每個(gè)網(wǎng)格分配1個(gè)異常因子來(lái)定量度量網(wǎng)格的異常程度,具體細(xì)節(jié)如算法2所示。算法2需要低權(quán)重網(wǎng)格列表lwGirdList作為輸入,對(duì)于lwGirdList中的每一個(gè)網(wǎng)格g,先根據(jù)式(10)計(jì)算密度因子denF(g),再根據(jù)式(11)計(jì)算距離因子disF(g),之后根據(jù)式(6)計(jì)算低權(quán)重網(wǎng)格的異常因子GOF(g),最后比較異常因子與異常閾值εo,若GOF(g)>εo將網(wǎng)格g加入到異常網(wǎng)格列表,反之不做處理。異常網(wǎng)格列表中的網(wǎng)格所對(duì)應(yīng)的數(shù)據(jù)對(duì)象都是異常。

    算法2GCStream-OD離線階段

    輸入:lwGirdList。

    輸出:異常值檢測(cè)結(jié)果。

    1.for (lwGirdList中的所有網(wǎng)格g)

    2. 計(jì)算denF(g);

    3. 計(jì)算disF(g);

    4.GOF(g)=denF(g)+disF(g);

    5. ifGOF(g)>εo

    6. 將網(wǎng)格g加入到異常網(wǎng)格列表;

    7. end if

    8.end for

    假設(shè)當(dāng)前時(shí)刻tc進(jìn)行異常檢測(cè),此時(shí)低權(quán)重網(wǎng)格列表lwGirdList中的網(wǎng)格數(shù)據(jù)為N,核心網(wǎng)格集合LD的大小為Ncg。GCStream-OD算法首先計(jì)算密度因子,由于此步驟是將LOF算法擴(kuò)展到網(wǎng)格,所以該步驟的時(shí)間復(fù)雜度為O(N2)。然后計(jì)算距離因子,在此步驟中需要先計(jì)算低權(quán)重網(wǎng)格與核心網(wǎng)格的距離,時(shí)間復(fù)雜度為O(Ncg×N)。緊接著遍歷低權(quán)重網(wǎng)格列表lwGirdList,計(jì)算距離因子,時(shí)間復(fù)雜度為O(N)。綜上所述,GCStream-OD算法的時(shí)間復(fù)雜度為:O(N2+Ncg×N+N)。在GCStream-OD算法中處理單位為網(wǎng)格,因?yàn)榈蜋?quán)重網(wǎng)格數(shù)N和核心網(wǎng)格集合LD的大小Ncg都是非常小的,使得該算法具有較高的效率。GCStream-OD算法最糟糕的情況是為每個(gè)到達(dá)的數(shù)據(jù)創(chuàng)造1個(gè)網(wǎng)格,因此GCStream-OD算法的空間復(fù)雜度最高為O(n),其中n為到達(dá)數(shù)據(jù)的總數(shù)。

    4 實(shí)驗(yàn)評(píng)估

    本節(jié)包含GCStream-OD 算法的實(shí)驗(yàn)準(zhǔn)備、參數(shù)選擇以及實(shí)驗(yàn)結(jié)果3個(gè)部分。

    4.1 實(shí)驗(yàn)準(zhǔn)備

    數(shù)據(jù)集:實(shí)驗(yàn)使用了KDD CUP99[21]、CoverType[22]、Poker Hand[23]、data_http[20]、data_OD共5個(gè)數(shù)據(jù)集來(lái)測(cè)試GCStream-OD算法的檢測(cè)質(zhì)量和效率。KDD CUP99、CoverType、Poker Hand 數(shù)據(jù)集均來(lái)自UCI數(shù)據(jù)集。KDD CUP99是一種網(wǎng)絡(luò)入侵檢測(cè)數(shù)據(jù)集,由原始數(shù)據(jù)集抽樣10%形成,包含494 020個(gè)數(shù)據(jù)對(duì)象,每個(gè)數(shù)據(jù)對(duì)象有34種連續(xù)屬性。CoverType是一種森林植被數(shù)據(jù)集,包含581 012個(gè)數(shù)據(jù)對(duì)象,并且每個(gè)數(shù)據(jù)對(duì)象記錄1塊30*30平方英尺上的54個(gè)地理數(shù)據(jù)。Poker Hand共有1 000 000個(gè)數(shù)據(jù)對(duì)象,其中每個(gè)數(shù)據(jù)對(duì)象表示由5張從52張標(biāo)準(zhǔn)牌組中抽出的撲克牌組成的手牌記錄,每張卡片使用2種屬性(花色和大小)進(jìn)行描述,因此共10個(gè)預(yù)測(cè)屬性。data_http[20]數(shù)據(jù)集和data_OD數(shù)據(jù)集由原始KDD CUP99數(shù)據(jù)集中567 497個(gè)相同的數(shù)據(jù)對(duì)象保留不同的屬性組成,data_http數(shù)據(jù)集保留了duration、src_bytes和dst_bytes屬性,data_OD數(shù)據(jù)集保留了hot、srv_count和dst_host_count屬性。KDD CUP99、data_http、data_OD均由原始KDD CUP99數(shù)據(jù)集抽樣而成,KDD CUP99保留了34種屬性而data_http和 data_OD只保留了3種屬性。

    在測(cè)試過(guò)程中,本文以上述數(shù)據(jù)集中數(shù)據(jù)的輸入順序作為數(shù)據(jù)流的傳輸順序,將所有數(shù)據(jù)集轉(zhuǎn)為流。除此之外,本文將測(cè)試數(shù)據(jù)流中規(guī)模小于5%的簇視為噪聲,即當(dāng)一個(gè)簇規(guī)模小于數(shù)據(jù)集總數(shù)據(jù)量的5%時(shí)被視為噪聲。表1匯總了各個(gè)數(shù)據(jù)集的特征。

    Figure 3 Influence of different len values on F1 on different data sets of GCStream-OD algorithm圖3 GCStream-OD算法在不同數(shù)據(jù)集上不同len值對(duì)F1的影響

    表1 數(shù)據(jù)集特征匯總

    對(duì)比算法:使用CORM算法[6]和iForest算法[20]作為本文的對(duì)比算法。CORM算法將數(shù)據(jù)流異常檢測(cè)過(guò)程分為在線/離線2個(gè)階段,這與GCStream-OD算法的處理方式相同,具有可比性。iForest算法基于隔離概念檢測(cè)異常,而不采用任何距離、密度測(cè)量,是目前很好的數(shù)據(jù)流異常檢測(cè)算法。

    評(píng)價(jià)指標(biāo):使用精確度(Precision)、召回率(Recall)和F-Measure(F1)作為評(píng)價(jià)指標(biāo),各項(xiàng)指標(biāo)的定義分別如式(12)~式(14)所示:

    Precision=TP/(TP+FP)

    (12)

    Recall=TP/(TP+FN)

    (13)

    F1=Precision*Recall*2/(Precision+Recall)

    (14)

    為了便于統(tǒng)計(jì),將異常視為正的(Positive)數(shù)據(jù)對(duì)象,非異常視為負(fù)的(Negative)數(shù)據(jù)對(duì)象。因此,式(12)和式(13)中TP表示被識(shí)別為異常的異常數(shù)據(jù)的個(gè)數(shù),F(xiàn)N表示被識(shí)別為非異常的異常數(shù)據(jù)的個(gè)數(shù),F(xiàn)P表示被識(shí)別為異常的非異常數(shù)據(jù)的個(gè)數(shù)。F-Measure是Precision和Recall的加權(quán)調(diào)和平均。

    4.2 參數(shù)選擇

    為了保證算法結(jié)果更具可比性,在進(jìn)行對(duì)比實(shí)驗(yàn)之前,統(tǒng)一環(huán)境變量、調(diào)整算法參數(shù)是非常必要的。環(huán)境變量主要包括:數(shù)據(jù)流的速度、數(shù)據(jù)對(duì)象的衰減速度。本文默認(rèn)將數(shù)據(jù)流中數(shù)據(jù)對(duì)象的到達(dá)速率設(shè)為1 000 pt/ms,統(tǒng)一算法中數(shù)據(jù)對(duì)象的權(quán)重衰減函數(shù)f=λ-a=0.998,而對(duì)比算法的參數(shù)設(shè)置參考其原始論文。在GCStream-OD算法中對(duì)異常檢測(cè)結(jié)果有較大影響的參數(shù)主要有網(wǎng)格邊長(zhǎng)len、核心網(wǎng)格集合LD的大小Ncg、網(wǎng)格第k距離中的k值以及異常網(wǎng)格閾值εo。為了對(duì)這些參數(shù)進(jìn)行合理選擇,本文對(duì)其進(jìn)行了實(shí)驗(yàn)探索。

    4.2.1 網(wǎng)格邊長(zhǎng)len

    GCStream-OD算法中,若len太小,網(wǎng)格切分太小,將會(huì)花費(fèi)大量的時(shí)間在網(wǎng)格耦合的處理上,不能滿足實(shí)時(shí)性要求;若len過(guò)大,容易將異常和非異常劃分到同一網(wǎng)格中,對(duì)算法精確度會(huì)造成影響。對(duì)于不同數(shù)據(jù)集,數(shù)據(jù)的最大值與最小值的差值不同,需要對(duì)不同數(shù)據(jù)集選取不同的len。圖3展示了在不同數(shù)據(jù)集上,不同len值對(duì)算法F1指標(biāo)值的影響。從圖3中可以看出,GCStream-OD算法在數(shù)據(jù)集KDD CUP99上當(dāng)len取值為1 200時(shí)F1值最大,所以對(duì)于KDD CUP99數(shù)據(jù)集實(shí)驗(yàn)選取len=1000。同理可得,在CoverType數(shù)據(jù)集上選取len=1500,在data_OD數(shù)據(jù)集上選取len=7,在data_http數(shù)據(jù)集上選取len=2000,在Poker Hand數(shù)據(jù)集上選取len=6。

    Figure 4 Influence of different Ncg values on F1 on different data sets of GCStream-OD algorithm圖4 GCStream-OD算法在不同數(shù)據(jù)集上不同Ncg值對(duì)F1的影響

    Figure 5 Influence of different k values on F1 on different data sets of GCStream-OD algorithm圖5 GCStream-OD算法在不同數(shù)據(jù)集上不同k值對(duì)F1的影響

    4.2.2 核心網(wǎng)格集合大小

    核心網(wǎng)格集合由權(quán)重大于閾值的網(wǎng)格組成,并且核心網(wǎng)格集合的大小對(duì)GCStream-OD算法的結(jié)果有直接影響。本節(jié)以評(píng)估指標(biāo)F1的大小來(lái)探索參數(shù)Ncg的最佳取值,實(shí)驗(yàn)結(jié)果如圖4所示。在KDD CUP99數(shù)據(jù)集上,當(dāng)Ncg=7時(shí)取得最好的F1值。在CoverType數(shù)據(jù)集上,當(dāng)Ncg=4時(shí)取得最好的F1值。對(duì)于數(shù)據(jù)集data_OD,當(dāng)Ncg=1時(shí)取得最好的F1值。在data_http數(shù)據(jù)集上,當(dāng)Ncg=12時(shí)取得最好的F1值。在Poker Hand數(shù)據(jù)集上,當(dāng)Ncg=6時(shí)取得最好的F1值。綜上所述,在KDD CUP99、CoverType、data_OD、data_http和Poker Hand數(shù)據(jù)集上,Ncg的取值分別為7,4,1,12和6。

    4.2.3 網(wǎng)格第k距離中的k值

    網(wǎng)格第k距離用來(lái)度量網(wǎng)格局部區(qū)域的密度,k值越小,局部區(qū)域密度越大;反之,k值越大,局部區(qū)域密度越小。不同數(shù)據(jù)集的數(shù)據(jù)映射到網(wǎng)格后所得到的網(wǎng)格局部區(qū)域的密度值不同,因此對(duì)于不同的數(shù)據(jù)集需要找到其最佳的網(wǎng)格第k距離。本節(jié)將根據(jù)評(píng)估指標(biāo)F1的好壞來(lái)探索不同數(shù)據(jù)集的最佳k值,實(shí)驗(yàn)結(jié)果如圖5所示。在KDD CUP99數(shù)據(jù)集上,當(dāng)k=6時(shí)取得最好的F1值,因此在KDD CUP99數(shù)據(jù)集上設(shè)置k=6。在CoverType數(shù)據(jù)集上,當(dāng)k=5時(shí)取得最好的F1值,因此設(shè)置k=5。對(duì)于數(shù)據(jù)集data_OD,當(dāng)k=7時(shí)取得最好的F1值,因此設(shè)置k=7。在data_http數(shù)據(jù)集上,當(dāng)k=11時(shí)取得最好的F1值,因此設(shè)置k=11。在Poker Hand數(shù)據(jù)集上,當(dāng)k=5時(shí)取得最好的F1值,因此設(shè)置k=5。

    4.2.4 異常網(wǎng)格閾值εo

    異常網(wǎng)格閾值εo直接影響異常數(shù)據(jù)的檢測(cè)。當(dāng)εo取值過(guò)小時(shí),許多非異常數(shù)據(jù)對(duì)象會(huì)被劃分為異常數(shù)據(jù)對(duì)象,造成精確度過(guò)低;當(dāng)εo取值過(guò)大時(shí),許多異常數(shù)據(jù)對(duì)象會(huì)被劃分為非異常數(shù)據(jù)對(duì)象,造成召回率過(guò)低。對(duì)于不同數(shù)據(jù)集,異常網(wǎng)格閾值εo也不盡相同。通過(guò)評(píng)估指標(biāo)F1的大小,本節(jié)將對(duì)不同數(shù)據(jù)集最適合的εo值進(jìn)行探索,實(shí)驗(yàn)結(jié)果如圖6所示。在KDD CUP99數(shù)據(jù)集上,當(dāng)εo=3.5時(shí)F1值最高。在CoverType數(shù)據(jù)集上當(dāng)εo=2.4時(shí)F1值最高。對(duì)于data_OD數(shù)據(jù)集當(dāng)εo=2.4時(shí)F1值最高。在data_http數(shù)據(jù)集上,在εo=19時(shí)取得最好的F1值;在Poker Hand數(shù)據(jù)集上,在εo=1時(shí)F1值最高。綜上所述,在KDD CUP99、CoverType、data_OD、data_http和Poker Hand數(shù)據(jù)集上εo的取值分別為3.5,2.4,2,19和1。

    Figure 6 Influence of different εo values on F1 on different data sets of GCStream-OD algorithm圖6 GCStream-OD算法在不同數(shù)據(jù)集上不同εo值對(duì)F1的影響

    4.3 實(shí)驗(yàn)結(jié)果

    本節(jié)主要對(duì)GCStream-OD算法的檢測(cè)質(zhì)量以及效率進(jìn)行實(shí)驗(yàn)評(píng)估。

    4.3.1 算法檢測(cè)質(zhì)量

    圖7展示了GCStream-OD算法與CORM和iForest算法的實(shí)驗(yàn)結(jié)果對(duì)比情況。其中,GCStream-OD算法的F1值在CoverType、data_OD和Poker Hand數(shù)據(jù)集上均高于基準(zhǔn)算法。雖然iForest算法在KDD CUP99和data_http上獲得了更好的F1值,但GCStream-OD的F1值仍接近于iForest。

    Figure 7 Precision,recall and F1 comparison of different algorithms on different data sets圖7 各算法在不同數(shù)據(jù)集上的Precision、Recall和F1對(duì)比

    通過(guò)對(duì)實(shí)驗(yàn)結(jié)果的分析可知,在KDD CUP99數(shù)據(jù)集上,GCStream-OD算法略低于iForest算法的主要原因是部分真實(shí)異常在分布上與非異常數(shù)據(jù)接近,被劃分到非核心的高權(quán)重網(wǎng)格中;且數(shù)量較少,對(duì)網(wǎng)格權(quán)重影響小,使得所在網(wǎng)格被剪去而不能被檢測(cè)出來(lái),造成Recall值過(guò)低。在data_http數(shù)據(jù)集上本文算法的F1略低于iForest算法主要包含2個(gè)原因,第1個(gè)原因與KDD CUP99數(shù)據(jù)集相同;第2個(gè)原因是非異常數(shù)據(jù)被剪去,造成數(shù)據(jù)密度因子denF過(guò)高,而距離因子disF不能消除其影響,使得正常數(shù)據(jù)被劃為異常,導(dǎo)致Precision值變低。

    CORM算法與本文算法原理類似,首先對(duì)數(shù)據(jù)流進(jìn)行劃分,然后丟棄正常值區(qū)域,保留每個(gè)簇的中心和候選異常。但是,CORM算法忽略了數(shù)據(jù)對(duì)象之間的影響,而GCStream-OD算法采用網(wǎng)格耦合的方式,更多地考慮了數(shù)據(jù)對(duì)象之間的相互影響,因此GCStream-OD算法在整體性能上優(yōu)于CORM算法。

    4.3.2 算法效率

    實(shí)時(shí)檢測(cè)異常數(shù)據(jù)對(duì)于數(shù)據(jù)流異常檢測(cè)算法至關(guān)重要,所以本文對(duì)GCStream-OD算法、CORM算法以及iForest算法的效率進(jìn)行了對(duì)比。實(shí)驗(yàn)結(jié)果如圖8所示,時(shí)間單位為ms。從圖8可以看出,本文算法在各個(gè)數(shù)據(jù)集上的耗時(shí)均較少。這是因?yàn)楸疚囊跃W(wǎng)格匯總數(shù)據(jù)流并采用剪枝策略,最終僅對(duì)少量的低權(quán)重網(wǎng)格進(jìn)行處理,大大降低了算法需要處理的對(duì)象數(shù)目,提高了算法效率。

    Figure 8 Time efficiency comparison of different algorithms on different data sets圖8 各算法在不同數(shù)據(jù)集上的時(shí)間效率對(duì)比

    5 結(jié)束語(yǔ)

    本文針對(duì)現(xiàn)有數(shù)據(jù)流異常檢測(cè)算法大都以每個(gè)數(shù)據(jù)對(duì)象為處理單元,算法效率較低,而以網(wǎng)格結(jié)構(gòu)匯總并提取數(shù)據(jù)流摘要信息,能夠較快地處理數(shù)據(jù)流,但是假設(shè)網(wǎng)格之間彼此獨(dú)立,忽略數(shù)據(jù)之間的相關(guān)性的不足,提出了一種基于網(wǎng)格耦合的數(shù)據(jù)流異常檢測(cè)算法GCStream-OD。首先,通過(guò)網(wǎng)格耦合實(shí)現(xiàn)了對(duì)數(shù)據(jù)流更精確的匯總,同時(shí)配合剪枝策略提高處理效率;其次,本文根據(jù)異常周圍鄰居較少、密度較低并且距正常值較遠(yuǎn)的特點(diǎn)為每個(gè)網(wǎng)格分配異常因子度量其異常程度;最后,通過(guò)在真實(shí)數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),對(duì)比了本文算法與其他算法檢測(cè)質(zhì)量和效率等,實(shí)驗(yàn)結(jié)果表明,本文所提GCStream-OD算法具有較高的異常檢測(cè)質(zhì)量和效率。

    GCStream-OD算法以網(wǎng)格為處理單元,采用了網(wǎng)格耦合的思想來(lái)提升算法質(zhì)量,并通過(guò)實(shí)驗(yàn)證明網(wǎng)格耦合是有效的,但對(duì)于一些數(shù)據(jù)集(如Poker Hand)該算法取得的結(jié)果還不盡人意。為了提高GCStream-OD算法的泛化能力,設(shè)計(jì)更好的網(wǎng)格耦合方式和剪枝策略將是我們未來(lái)工作的研究重點(diǎn)。

    猜你喜歡
    檢測(cè)
    QC 檢測(cè)
    “不等式”檢測(cè)題
    “一元一次不等式”檢測(cè)題
    “一元一次不等式組”檢測(cè)題
    “幾何圖形”檢測(cè)題
    “角”檢測(cè)題
    “有理數(shù)的乘除法”檢測(cè)題
    “有理數(shù)”檢測(cè)題
    “角”檢測(cè)題
    “幾何圖形”檢測(cè)題
    日本在线视频免费播放| 一区二区三区激情视频| 校园春色视频在线观看| 啪啪无遮挡十八禁网站| netflix在线观看网站| 女警被强在线播放| 一二三四社区在线视频社区8| 黄色成人免费大全| 内地一区二区视频在线| 亚洲 国产 在线| 高潮久久久久久久久久久不卡| a在线观看视频网站| 国产男靠女视频免费网站| 免费av观看视频| 国产欧美日韩一区二区精品| 乱人视频在线观看| 日韩精品青青久久久久久| 国产成人a区在线观看| 亚洲成人久久爱视频| 亚洲av电影在线进入| 国产野战对白在线观看| 国产成+人综合+亚洲专区| 亚洲成av人片免费观看| 一区福利在线观看| 亚洲欧美日韩东京热| 欧美日韩亚洲国产一区二区在线观看| 亚洲专区国产一区二区| 国产伦精品一区二区三区四那| www国产在线视频色| 欧美成狂野欧美在线观看| 国产主播在线观看一区二区| 国产乱人视频| 国产探花极品一区二区| 人妻丰满熟妇av一区二区三区| 可以在线观看的亚洲视频| 亚洲av成人av| 少妇的逼水好多| 真人一进一出gif抽搐免费| 黄色视频,在线免费观看| 久久久久久九九精品二区国产| 国产在视频线在精品| 欧美黑人巨大hd| 日本精品一区二区三区蜜桃| 97人妻精品一区二区三区麻豆| 不卡一级毛片| 国产毛片a区久久久久| 成熟少妇高潮喷水视频| 热99re8久久精品国产| 欧美成人a在线观看| 久久这里只有精品中国| 悠悠久久av| www日本在线高清视频| 真实男女啪啪啪动态图| 蜜桃亚洲精品一区二区三区| 99在线视频只有这里精品首页| 一个人观看的视频www高清免费观看| 有码 亚洲区| 亚洲精品成人久久久久久| 精品不卡国产一区二区三区| 非洲黑人性xxxx精品又粗又长| 亚洲五月天丁香| 88av欧美| 伊人久久大香线蕉亚洲五| 在线观看免费视频日本深夜| 小蜜桃在线观看免费完整版高清| 中亚洲国语对白在线视频| 淫秽高清视频在线观看| 日韩欧美一区二区三区在线观看| 国产精品久久久久久亚洲av鲁大| 人人妻人人看人人澡| 黑人欧美特级aaaaaa片| 国产日本99.免费观看| 性色avwww在线观看| 中国美女看黄片| 啪啪无遮挡十八禁网站| 亚洲性夜色夜夜综合| 九色成人免费人妻av| 天堂动漫精品| 99久久精品热视频| 精品久久久久久,| 每晚都被弄得嗷嗷叫到高潮| 久久香蕉精品热| 99国产精品一区二区三区| 国内精品久久久久精免费| 亚洲av不卡在线观看| 麻豆国产av国片精品| 成年人黄色毛片网站| 免费看十八禁软件| 亚洲精华国产精华精| 精品久久久久久久末码| 69av精品久久久久久| 久久亚洲真实| 禁无遮挡网站| 桃色一区二区三区在线观看| 青草久久国产| 午夜老司机福利剧场| 久久久久九九精品影院| 精品欧美国产一区二区三| 午夜福利视频1000在线观看| 桃红色精品国产亚洲av| 亚洲国产色片| 99久久精品国产亚洲精品| 国产成人欧美在线观看| 欧美中文日本在线观看视频| 99热这里只有精品一区| 国产精品 欧美亚洲| 久久国产精品人妻蜜桃| 免费在线观看日本一区| a级一级毛片免费在线观看| 窝窝影院91人妻| 欧美高清成人免费视频www| 日日夜夜操网爽| 99热精品在线国产| av专区在线播放| 国产精品野战在线观看| 看片在线看免费视频| 免费看光身美女| 精品99又大又爽又粗少妇毛片 | 久久久久久九九精品二区国产| 波多野结衣高清无吗| 亚洲欧美日韩无卡精品| 婷婷六月久久综合丁香| 国产精品三级大全| 亚洲七黄色美女视频| 久久天躁狠狠躁夜夜2o2o| 精品欧美国产一区二区三| 午夜激情欧美在线| 免费在线观看亚洲国产| 色视频www国产| 成人亚洲精品av一区二区| 国产成人av激情在线播放| 丁香六月欧美| 午夜日韩欧美国产| 国产精品亚洲美女久久久| 伊人久久精品亚洲午夜| 国产精品国产高清国产av| 国语自产精品视频在线第100页| 熟女电影av网| 波野结衣二区三区在线 | 亚洲成人精品中文字幕电影| 免费看a级黄色片| 中文字幕人成人乱码亚洲影| 午夜福利欧美成人| 中文字幕人成人乱码亚洲影| 在线观看一区二区三区| 国产精品久久久久久精品电影| 国产高清视频在线观看网站| 色综合站精品国产| 俄罗斯特黄特色一大片| 亚洲精品久久国产高清桃花| 午夜免费激情av| av女优亚洲男人天堂| 国产美女午夜福利| av片东京热男人的天堂| 蜜桃久久精品国产亚洲av| 精品人妻一区二区三区麻豆 | 色精品久久人妻99蜜桃| 欧美日韩一级在线毛片| 久久久久久久亚洲中文字幕 | 婷婷丁香在线五月| 天堂影院成人在线观看| 精品一区二区三区av网在线观看| 看免费av毛片| netflix在线观看网站| 国产毛片a区久久久久| 不卡一级毛片| av天堂在线播放| 91麻豆精品激情在线观看国产| 久久久久久大精品| 久久久久久久精品吃奶| 禁无遮挡网站| 中文字幕精品亚洲无线码一区| 日本黄色片子视频| 国产高清videossex| 亚洲av中文字字幕乱码综合| 久久精品国产亚洲av涩爱 | 久久天躁狠狠躁夜夜2o2o| 黄片大片在线免费观看| 可以在线观看的亚洲视频| 欧美3d第一页| 久久久精品大字幕| 亚洲午夜理论影院| 日韩精品中文字幕看吧| 三级国产精品欧美在线观看| 久久久久亚洲av毛片大全| 热99在线观看视频| 国产亚洲欧美在线一区二区| 狠狠狠狠99中文字幕| 久久性视频一级片| 免费在线观看亚洲国产| 99久久成人亚洲精品观看| 国产 一区 欧美 日韩| 国产伦精品一区二区三区四那| 伊人久久精品亚洲午夜| 国产老妇女一区| 男人舔奶头视频| 久久中文看片网| 国产精品自产拍在线观看55亚洲| 欧美zozozo另类| 男插女下体视频免费在线播放| 精品一区二区三区视频在线 | 一进一出抽搐gif免费好疼| 男人舔奶头视频| 热99在线观看视频| 久久久国产精品麻豆| 在线观看午夜福利视频| 国产美女午夜福利| 日本三级黄在线观看| 日日夜夜操网爽| 一级黄色大片毛片| 最好的美女福利视频网| 十八禁网站免费在线| 日韩亚洲欧美综合| 亚洲第一电影网av| 欧美日本视频| 波野结衣二区三区在线 | 一a级毛片在线观看| 国产精品香港三级国产av潘金莲| 天堂动漫精品| 久久久精品欧美日韩精品| 十八禁人妻一区二区| 国产69精品久久久久777片| 级片在线观看| 亚洲一区二区三区不卡视频| 变态另类成人亚洲欧美熟女| 亚洲国产精品999在线| 亚洲精品美女久久久久99蜜臀| 女人十人毛片免费观看3o分钟| 中文字幕精品亚洲无线码一区| 国产单亲对白刺激| 国内精品久久久久精免费| 日本熟妇午夜| 欧美一区二区精品小视频在线| av欧美777| 国产一区二区三区在线臀色熟女| 十八禁人妻一区二区| 国产精品久久久久久久久免 | 亚洲精品影视一区二区三区av| 国产美女午夜福利| 在线播放国产精品三级| 欧美乱码精品一区二区三区| 国产老妇女一区| 欧美在线黄色| 麻豆国产97在线/欧美| 女人十人毛片免费观看3o分钟| 国产淫片久久久久久久久 | 嫩草影院精品99| 嫩草影院入口| 欧美成人免费av一区二区三区| 国产亚洲精品av在线| 成人特级黄色片久久久久久久| 亚洲国产精品sss在线观看| 亚洲国产欧洲综合997久久,| 色综合站精品国产| 美女cb高潮喷水在线观看| 夜夜夜夜夜久久久久| 欧美最黄视频在线播放免费| 国产精品99久久99久久久不卡| www日本黄色视频网| 午夜福利免费观看在线| 麻豆国产av国片精品| 亚洲av不卡在线观看| 无限看片的www在线观看| 亚洲av成人不卡在线观看播放网| 欧美黄色片欧美黄色片| 一边摸一边抽搐一进一小说| 亚洲avbb在线观看| 韩国av一区二区三区四区| 亚洲一区二区三区色噜噜| 国产精品久久久人人做人人爽| 日本免费a在线| 无人区码免费观看不卡| 高潮久久久久久久久久久不卡| 婷婷精品国产亚洲av| 日韩成人在线观看一区二区三区| 欧美一区二区国产精品久久精品| 久久天躁狠狠躁夜夜2o2o| 又爽又黄无遮挡网站| 免费av观看视频| 国产高清视频在线播放一区| 天堂动漫精品| 日本一二三区视频观看| 尤物成人国产欧美一区二区三区| 天天一区二区日本电影三级| 亚洲成人精品中文字幕电影| 久久精品综合一区二区三区| 美女cb高潮喷水在线观看| 久久久久精品国产欧美久久久| 91在线观看av| 午夜福利在线在线| 国产成人福利小说| tocl精华| 国产成人av激情在线播放| 夜夜看夜夜爽夜夜摸| 九九久久精品国产亚洲av麻豆| 69人妻影院| 国产69精品久久久久777片| 免费一级毛片在线播放高清视频| 老汉色∧v一级毛片| 国产精品,欧美在线| 嫁个100分男人电影在线观看| 99热这里只有精品一区| 757午夜福利合集在线观看| 亚洲成人精品中文字幕电影| 露出奶头的视频| 欧美成狂野欧美在线观看| 亚洲天堂国产精品一区在线| 网址你懂的国产日韩在线| 国产一区在线观看成人免费| 免费观看人在逋| 日本撒尿小便嘘嘘汇集6| 一级毛片高清免费大全| 久久久久久九九精品二区国产| 变态另类丝袜制服| 成人av在线播放网站| 人妻丰满熟妇av一区二区三区| 日本黄大片高清| 岛国视频午夜一区免费看| 亚洲最大成人手机在线| 日日摸夜夜添夜夜添小说| 午夜免费成人在线视频| 俄罗斯特黄特色一大片| 成年免费大片在线观看| 午夜日韩欧美国产| 免费看a级黄色片| 日韩欧美免费精品| 国产精品亚洲av一区麻豆| 日韩欧美在线乱码| 欧美+亚洲+日韩+国产| 国产亚洲欧美在线一区二区| 国产真实乱freesex| 夜夜躁狠狠躁天天躁| 99久久久亚洲精品蜜臀av| 亚洲熟妇熟女久久| 午夜精品在线福利| 国产av一区在线观看免费| 无限看片的www在线观看| 国产乱人视频| 成年女人永久免费观看视频| bbb黄色大片| 国产伦精品一区二区三区四那| 国产乱人视频| 精品久久久久久久毛片微露脸| 非洲黑人性xxxx精品又粗又长| 国产亚洲精品综合一区在线观看| 又粗又爽又猛毛片免费看| 精品久久久久久久毛片微露脸| 很黄的视频免费| 亚洲国产欧美网| 午夜福利18| av视频在线观看入口| 亚洲av不卡在线观看| 老熟妇乱子伦视频在线观看| 一a级毛片在线观看| 日韩av在线大香蕉| 久久伊人香网站| 欧美区成人在线视频| 国产欧美日韩精品亚洲av| 一进一出抽搐动态| 在线观看舔阴道视频| 丁香欧美五月| 成人无遮挡网站| 免费在线观看日本一区| 午夜福利高清视频| 成年女人永久免费观看视频| 女人被狂操c到高潮| 白带黄色成豆腐渣| 精品乱码久久久久久99久播| 午夜精品在线福利| 小蜜桃在线观看免费完整版高清| 免费看a级黄色片| 亚洲av第一区精品v没综合| 熟女少妇亚洲综合色aaa.| 网址你懂的国产日韩在线| 宅男免费午夜| 别揉我奶头~嗯~啊~动态视频| 波多野结衣巨乳人妻| 男女午夜视频在线观看| 69av精品久久久久久| 观看免费一级毛片| 人人妻,人人澡人人爽秒播| 偷拍熟女少妇极品色| 国产v大片淫在线免费观看| 在线观看免费视频日本深夜| 十八禁网站免费在线| 亚洲欧美激情综合另类| 99久久九九国产精品国产免费| 在线免费观看的www视频| 亚洲人成电影免费在线| 欧美日本视频| av欧美777| 久久午夜亚洲精品久久| 色综合婷婷激情| 亚洲精品成人久久久久久| 给我免费播放毛片高清在线观看| 日本一本二区三区精品| 人人妻人人澡欧美一区二区| 久久久久久久精品吃奶| 日本一本二区三区精品| 亚洲 国产 在线| 久久久久久久精品吃奶| av黄色大香蕉| 国产免费一级a男人的天堂| 国产精品爽爽va在线观看网站| 欧美一级毛片孕妇| 老汉色∧v一级毛片| 国产精品女同一区二区软件 | 国产真人三级小视频在线观看| 国模一区二区三区四区视频| 看片在线看免费视频| 国产一区在线观看成人免费| 俺也久久电影网| 成人精品一区二区免费| 亚洲成人中文字幕在线播放| 男插女下体视频免费在线播放| 亚洲午夜理论影院| 99久久精品热视频| 三级毛片av免费| 亚洲欧美日韩东京热| 深夜精品福利| av片东京热男人的天堂| 一个人看的www免费观看视频| 中文字幕人妻丝袜一区二区| e午夜精品久久久久久久| 欧美日韩精品网址| 欧美一区二区国产精品久久精品| 精品99又大又爽又粗少妇毛片 | 天堂av国产一区二区熟女人妻| 亚洲精品一卡2卡三卡4卡5卡| 黄片小视频在线播放| 1024手机看黄色片| 久久精品国产亚洲av涩爱 | 国产精品亚洲美女久久久| 九九久久精品国产亚洲av麻豆| 欧美日韩福利视频一区二区| 亚洲最大成人中文| www.999成人在线观看| 99久国产av精品| 欧美日韩黄片免| 俄罗斯特黄特色一大片| www.熟女人妻精品国产| 日本免费一区二区三区高清不卡| 69人妻影院| 99热精品在线国产| 国产精品香港三级国产av潘金莲| 99在线视频只有这里精品首页| 国产精品99久久久久久久久| 亚洲av免费在线观看| 亚洲精品456在线播放app | 久久午夜亚洲精品久久| 99国产精品一区二区三区| 国产一区二区激情短视频| 精品日产1卡2卡| 亚洲国产高清在线一区二区三| 噜噜噜噜噜久久久久久91| 国产精品 欧美亚洲| 日韩精品青青久久久久久| 欧美成人a在线观看| 99热精品在线国产| 搡女人真爽免费视频火全软件 | 波多野结衣巨乳人妻| 18禁黄网站禁片免费观看直播| x7x7x7水蜜桃| 欧美+亚洲+日韩+国产| 一进一出抽搐动态| 一区二区三区激情视频| 91在线精品国自产拍蜜月 | 少妇的逼好多水| 蜜桃久久精品国产亚洲av| 人人妻,人人澡人人爽秒播| 国产精华一区二区三区| 成人高潮视频无遮挡免费网站| 久久久久久久午夜电影| av黄色大香蕉| 一级a爱片免费观看的视频| 在线免费观看不下载黄p国产 | 午夜精品在线福利| 欧美激情久久久久久爽电影| 色综合站精品国产| 99热这里只有是精品50| 久久这里只有精品中国| 美女高潮的动态| 国产三级中文精品| 午夜福利在线观看吧| 757午夜福利合集在线观看| 成人特级av手机在线观看| av黄色大香蕉| 丁香欧美五月| 亚洲成a人片在线一区二区| 久久久久久人人人人人| 俺也久久电影网| 欧美最新免费一区二区三区 | 村上凉子中文字幕在线| 亚洲国产色片| 日本黄色视频三级网站网址| 久久亚洲真实| www日本在线高清视频| 俄罗斯特黄特色一大片| 国产伦精品一区二区三区四那| 波多野结衣高清作品| 老师上课跳d突然被开到最大视频 久久午夜综合久久蜜桃 | 啦啦啦观看免费观看视频高清| 国产精品一及| 国产成人啪精品午夜网站| 美女免费视频网站| 一级黄片播放器| 老熟妇仑乱视频hdxx| 嫁个100分男人电影在线观看| 亚洲av五月六月丁香网| 欧美日韩乱码在线| 久久久久久久久中文| 久久久久久国产a免费观看| 国产成人a区在线观看| 色综合亚洲欧美另类图片| 亚洲avbb在线观看| 日韩成人在线观看一区二区三区| 午夜激情福利司机影院| 亚洲一区二区三区色噜噜| 国产精品久久视频播放| 真人做人爱边吃奶动态| 在线免费观看的www视频| 精品久久久久久久久久久久久| 色噜噜av男人的天堂激情| 欧美3d第一页| 日韩精品青青久久久久久| 操出白浆在线播放| 1000部很黄的大片| 欧美乱妇无乱码| 又紧又爽又黄一区二区| 日日干狠狠操夜夜爽| 亚洲无线观看免费| 成人特级av手机在线观看| 免费观看精品视频网站| 亚洲av美国av| 日本一本二区三区精品| 国产精品久久久久久精品电影| svipshipincom国产片| 五月伊人婷婷丁香| 非洲黑人性xxxx精品又粗又长| 12—13女人毛片做爰片一| 男人和女人高潮做爰伦理| 国产午夜福利久久久久久| 国产精品嫩草影院av在线观看 | 五月玫瑰六月丁香| xxx96com| 国产精品一及| 天堂影院成人在线观看| 久久久成人免费电影| 欧美大码av| 午夜免费观看网址| 国产在视频线在精品| 九九久久精品国产亚洲av麻豆| 欧美中文综合在线视频| 男人舔女人下体高潮全视频| 91麻豆av在线| 欧美bdsm另类| 人妻久久中文字幕网| 亚洲成人中文字幕在线播放| 精品久久久久久成人av| 日韩欧美三级三区| 成人一区二区视频在线观看| 久久精品综合一区二区三区| 成人永久免费在线观看视频| 亚洲黑人精品在线| 国产亚洲精品久久久久久毛片| 久久久久九九精品影院| 在线a可以看的网站| 久久久久久久精品吃奶| 岛国在线观看网站| 欧美成人性av电影在线观看| 久久久久国产精品人妻aⅴ院| 两个人视频免费观看高清| 免费看光身美女| 18禁美女被吸乳视频| 国产伦在线观看视频一区| 99国产综合亚洲精品| 香蕉久久夜色| 亚洲七黄色美女视频| 少妇熟女aⅴ在线视频| 亚洲欧美一区二区三区黑人| 欧美绝顶高潮抽搐喷水| 精品免费久久久久久久清纯| 天天一区二区日本电影三级| 亚洲欧美一区二区三区黑人| 成人高潮视频无遮挡免费网站| 亚洲aⅴ乱码一区二区在线播放| 手机成人av网站| 欧美xxxx黑人xx丫x性爽| 亚洲中文字幕日韩| 国产亚洲精品久久久com| 国产一区二区三区视频了| 精品一区二区三区视频在线 | 日韩高清综合在线| 国产精品亚洲一级av第二区| 一本久久中文字幕| 不卡一级毛片| 在线观看免费午夜福利视频| 成人国产一区最新在线观看| aaaaa片日本免费| 少妇人妻一区二区三区视频| 亚洲av不卡在线观看| 最新中文字幕久久久久| 亚洲第一电影网av| 亚洲av免费在线观看| 国产欧美日韩精品一区二区| 90打野战视频偷拍视频| 国产免费男女视频| 亚洲五月天丁香| 动漫黄色视频在线观看| 成人av在线播放网站| 日韩欧美国产一区二区入口| av片东京热男人的天堂| 日韩欧美精品v在线| 亚洲人成网站在线播| 色综合亚洲欧美另类图片|