• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    一種融合α 度量的混合數(shù)據(jù)K-prototypes算法

    2023-07-11 10:14:12陳佳佳劉東海張曉琴
    統(tǒng)計(jì)與決策 2023年10期
    關(guān)鍵詞:度量聚類距離

    陳佳佳,張 旺,劉東海,張曉琴

    (山西財(cái)經(jīng)大學(xué) 統(tǒng)計(jì)學(xué)院,太原 030006)

    0 引言

    作為機(jī)器學(xué)習(xí)中的分支,聚類分析是用特定的方式選擇初始類中心并將所有樣本分到與其相似性最大的類中的過(guò)程。聚類分析技術(shù)有著廣闊的應(yīng)用范圍:電子技術(shù)、電力系統(tǒng)、農(nóng)業(yè)研究、文本識(shí)別、經(jīng)濟(jì)分析等領(lǐng)域。聚類分析主要分為以K-means算法為代表的劃分聚類、以CURE算法[1]為代表的層次化聚類、以DBSCAN算法[2]為代表的密度聚類、以STING 算法為代表的網(wǎng)格式聚類、以EM 算法為代表的模型聚類。

    在聚類算法的研究過(guò)程中,不同研究者給出了不同的算法。文獻(xiàn)[3]針對(duì)數(shù)值型數(shù)據(jù)提出了K-means算法,該算法計(jì)算量小、計(jì)算速度快、適用范圍比較廣泛。針對(duì)分類型數(shù)據(jù),文獻(xiàn)[4]通過(guò)對(duì)比樣本點(diǎn)與類中心的異同,提出了基于簡(jiǎn)單0-1 匹配計(jì)算距離的K-modes 算法。K-means、K-modes 算法簡(jiǎn)單高效,但是只能處理固定的一類數(shù)據(jù)。在此基礎(chǔ)上,文獻(xiàn)[5]將K-means算法與K-modes算法簡(jiǎn)單結(jié)合,分別對(duì)兩部分?jǐn)?shù)據(jù)計(jì)算距離后再賦予二者權(quán)重進(jìn)行調(diào)整,提出了針對(duì)混合型數(shù)據(jù)的K-prototypes算法(又稱為K-原型算法)。文獻(xiàn)[6]提出了K-centers算法,分類型數(shù)據(jù)類中心為頻率向量,數(shù)值型數(shù)據(jù)類中心仍為均值,某一個(gè)樣本的類中心即為兩個(gè)部分的結(jié)合,這對(duì)混合型數(shù)據(jù)聚類提供了新的思路。文獻(xiàn)[7]提出了適用于模糊場(chǎng)景中表示類別屬性的類中心。文獻(xiàn)[8]提出了一種改進(jìn)的K-prototypes 算法,將類中心表示為均值與頻率模糊類中心結(jié)合的形式。文獻(xiàn)[9]提出了一種由信息熵計(jì)算不同類型數(shù)據(jù)權(quán)重的K-prototypes 聚類算法,通過(guò)計(jì)算不同類別的類內(nèi)熵與類間熵得出每個(gè)屬性的權(quán)重。文獻(xiàn)[10,11]在文獻(xiàn)[9]的基礎(chǔ)上引入了權(quán)重屬性,重新定義類間熵等指標(biāo),進(jìn)行了一定的改良。文獻(xiàn)[12]提出了結(jié)合均值與分布式質(zhì)心表示的混合屬性簇中心,并提出了一種新的相異性度量。文獻(xiàn)[13]提出了基于密度優(yōu)化的K-prototypes 算法,該算法能自動(dòng)調(diào)整聚類個(gè)數(shù)與初始類中心,同時(shí)改進(jìn)了K-prototypes 算法的相異性度量。文獻(xiàn)[14]提出了一種指數(shù)形式的分類型數(shù)據(jù)相似性作為權(quán)重的計(jì)算方法,該權(quán)重計(jì)算方法會(huì)擴(kuò)大數(shù)據(jù)之間的差異性。文獻(xiàn)[15]提出針對(duì)最大相異性度量不唯一的特性改進(jìn)初始聚類中心選取方法。文獻(xiàn)[16]提出了自適應(yīng)函數(shù)將相異性度量轉(zhuǎn)化為相似性度量,選取多個(gè)初始中心,增加了聚類結(jié)果的魯棒性。

    K-prototypes 算法具有適用范圍廣、計(jì)算速度快等優(yōu)點(diǎn),但仍然存在一些缺陷:(1)之前的K-prototypes 算法對(duì)于分類型數(shù)據(jù)距離都是進(jìn)行0-1簡(jiǎn)單匹配計(jì)算,文獻(xiàn)[5,9]引入頻率向量表示分布質(zhì)心后使用的也是歐氏距離。這種做法忽略了分類型數(shù)據(jù)與數(shù)值型數(shù)據(jù)的差別,分類型數(shù)據(jù)是離散的,直接使用0-1 匹配會(huì)損失很多信息,頻率向量表示分類型數(shù)據(jù)定和為1,并不適合用歐式距離作為相異性度量。(2)針對(duì)分類型數(shù)據(jù)的權(quán)重,大多需要每次迭代計(jì)算一次,雖然提升了聚類精度但是計(jì)算量大大提升,無(wú)法處理大數(shù)據(jù)問(wèn)題?;谝陨峡紤],本文提出了一種α度量下的改進(jìn)K-prototypes 算法(α-metric K-prototypes Clustering Algorithm,以下簡(jiǎn)稱α-K-prototypes 算法)。α-K-prototypes算法將均值與頻率向量結(jié)合來(lái)表示混合數(shù)據(jù)的類中心,并提出一種新的相異性度量方法。經(jīng)實(shí)驗(yàn)驗(yàn)證,α-K-prototypes 算法提升了對(duì)分類型、混合型數(shù)據(jù)的聚類精度,使算法性能得到進(jìn)一步提升。

    1 相關(guān)知識(shí)

    1.1 K-prototypes算法

    定義1:樣本Xi到聚類中心Qz的距離為:

    算法1:K-prototypes算法

    K-prototypes 算法是基于定義2 中目標(biāo)函數(shù)準(zhǔn)則,將數(shù)據(jù)集X分為k個(gè)互不相交的類,其具體算法步驟如下:

    步驟1:按照特定的方式確定k個(gè)初始類中心。

    步驟2:計(jì)算某個(gè)數(shù)據(jù)與所有類中心的目標(biāo)函數(shù),將數(shù)據(jù)分到使得目標(biāo)函數(shù)最小的類中,直至所有數(shù)據(jù)都完成分配。

    步驟3:按照均值與最多次數(shù)屬性值結(jié)合的形式更新類中心。

    步驟4:若步驟2、步驟3 計(jì)算出的距離總和未發(fā)生變化或達(dá)到迭代次數(shù)上限,則停止循環(huán);否則重復(fù)進(jìn)行步驟2、步驟3。

    1.2 分類型數(shù)據(jù)的模糊類中心表示形式

    K-prototypes 算法僅使用簡(jiǎn)單0-1 匹配計(jì)算距離會(huì)丟失很多信息,為更全面地表達(dá)樣本信息,文獻(xiàn)[9]引入了一種模糊類中心表達(dá)形式。

    1.3 一種新的融合α 度量K-prototypes改進(jìn)算法

    定義4:稱滿足以下條件的空間為D維成分?jǐn)?shù)據(jù)空間:

    該空間中的元素即為成分?jǐn)?shù)據(jù)。

    定義5:對(duì)于成分?jǐn)?shù)據(jù)x=(x1,x2,…,xD),對(duì)稱對(duì)數(shù)比變換定義為:

    定義6:記x、y為SD中的任意兩個(gè)成分?jǐn)?shù)據(jù),其Aitchison距離表示為:

    由公式可以看出第j個(gè)分類型屬性模糊類中心集合為Dj維成分?jǐn)?shù)據(jù)空間,第i個(gè)樣本在這個(gè)屬性上的頻率向量與第z個(gè)類在這個(gè)屬性上的模糊類中心頻率向量均符合成分?jǐn)?shù)據(jù)的定義。所有的樣本第j個(gè)屬性的頻率向量組合成為一個(gè)Dj維的成分?jǐn)?shù)據(jù)空間。Aitchison 距離為成分?jǐn)?shù)據(jù)進(jìn)行對(duì)稱對(duì)數(shù)比變換后的歐氏距離,可以更好地體現(xiàn)定合限制下不同維度之間的差異。使用樣本頻率向量與類中心頻率向量的Aitchison 距離作為相異性度量比使用拓展歐氏距離更好。由于樣本頻率向量中含有零值,而Aitchison距離無(wú)法度量含有零值的成分?jǐn)?shù)據(jù),因此引入α度量。α度量[17]是由Tsagris 等針對(duì)成分?jǐn)?shù)據(jù)中不能處理含有零值數(shù)據(jù)的問(wèn)題在2011年提出的。

    定義7:設(shè)成分向量x=(x1,x2,…,xD),進(jìn)行變換得到:

    這種變換被稱為α-變換(α-transformation)。

    定義8:對(duì)于任意的x,y?SD,定義x、y之間的α度量(α-metric)[18]為:

    當(dāng)α→0 時(shí),α度量為Aitchison 距離。當(dāng)α=1 時(shí),α度量為維度D乘歐氏距離。

    針對(duì)之前算法存在的問(wèn)題,本文基于α度量,提出了一種更適合比較分類型數(shù)據(jù)差別的K-prototypes改進(jìn)算法(α-metric K-prototypes算法),見(jiàn)如下定義。

    定義9:定義對(duì)象Xi與類中心Qz的距離為:

    定義10:α-K-prototypes算法的目標(biāo)函數(shù)為:

    算法2:α-K-prototypes算法

    步驟1:從數(shù)據(jù)集X中隨機(jī)選取k個(gè)作為初始類中心。

    步驟2:使用α度量計(jì)算某個(gè)數(shù)據(jù)與所有類中心的目標(biāo)函數(shù),將數(shù)據(jù)分到使得目標(biāo)函數(shù)最小的類中,直至所有數(shù)據(jù)都完成分配。

    步驟3:按照模糊類中心表達(dá)形式更新類中心。

    步驟4:若步驟2、步驟3 計(jì)算出的距離總和未發(fā)生變化或達(dá)到迭代次數(shù)上限,則停止循環(huán);否則重復(fù)進(jìn)行步驟2、步驟3。

    算法2 中數(shù)據(jù)個(gè)數(shù)n、屬性個(gè)數(shù)m+p、類中心的個(gè)數(shù)k以及迭代次數(shù)t都會(huì)影響α-K-prototypes 算法的計(jì)算時(shí)間,最后得出α-K-prototypes 算法的時(shí)間復(fù)雜度為O(n(m+p)kt)。

    2 實(shí)驗(yàn)結(jié)果與分析

    2.1 權(quán)重調(diào)節(jié)系數(shù)

    在α-K-prototypes 算法中,α度量具有一定的特殊性,當(dāng)α→0 時(shí),α度量為Aitchison 距離;當(dāng)α=1 時(shí),α度量為歐氏距離乘以頻率向量的維度Dj。假設(shè)樣本模糊類中心頻率向量x1=(1,0),聚類中心的模糊類中心頻率向量q1=(0.5,0.5),當(dāng)α=1 時(shí),計(jì)算出的α度量為2;當(dāng)α=0.5時(shí),計(jì)算出的值為8;當(dāng)α=0.1時(shí),計(jì)算出的值為20000。α度量隨著α變小而逐漸增大,該數(shù)量級(jí)過(guò)大的主要原因是式中分母的α過(guò)小導(dǎo)致的。為了更好地在實(shí)際中應(yīng)用,對(duì)于式中的參數(shù)η,本文推薦使用η=λα2作為權(quán)重調(diào)整系數(shù)。在本文的系數(shù)確定中默認(rèn)分類型數(shù)據(jù)與數(shù)值型數(shù)據(jù)重要程度相等,所以λα2中取λ=1,即對(duì)象Xi與類中心Qz的距離為:

    為體現(xiàn)權(quán)重調(diào)整系數(shù)的提升效果,在本文的對(duì)比中選取α=0.0001,并對(duì)比該系數(shù)對(duì)聚類效果的提升。從UCI數(shù)據(jù)庫(kù)中選取12個(gè)混合型數(shù)據(jù)對(duì)比驗(yàn)證設(shè)置調(diào)整系數(shù)后的指標(biāo)差距。圖1中由上到下分別為聚類精度(CA)[5]、調(diào)整的蘭特指數(shù)(ARI)[19]、標(biāo)準(zhǔn)互信息(NMI)[20]指標(biāo)下各數(shù)據(jù)集設(shè)置調(diào)整系數(shù)與不設(shè)置調(diào)整系數(shù)時(shí)的對(duì)比,其中設(shè)置調(diào)整系數(shù)即η=α2,不設(shè)置調(diào)整系數(shù)即η=1。從圖1可以看出,設(shè)置調(diào)整系數(shù)后效果僅在German數(shù)據(jù)集中有提升,在其他數(shù)據(jù)集上為持平或輕微提升。由于設(shè)置調(diào)整系數(shù)在實(shí)際應(yīng)用中有可解釋性,所以本文使用λα2作為權(quán)重調(diào)節(jié)系數(shù)。

    圖1 調(diào)整系數(shù)對(duì)比

    2.2 數(shù)據(jù)集的選擇與評(píng)價(jià)標(biāo)準(zhǔn)

    為驗(yàn)證α-K-prototypes算法的有效性,將α-K-prototypes 算法與K-prototypes、K-centers、improved-K-prototypes算法進(jìn)行比較。從UCI數(shù)據(jù)庫(kù)中分別選取分類型和混合型數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)對(duì)比。評(píng)價(jià)指標(biāo)包含CA、NMI、ARI。在不同評(píng)價(jià)標(biāo)準(zhǔn)下,將α-K-prototypes 算法與K-prototypes、K-centers、improved-K-prototypes 算法進(jìn)行比較。K-prototypes[5]、K-centers[6]算法中的參數(shù)γ設(shè)置為γ=1.5與γ=0.5,improved-K-prototypes[8]算法中參數(shù)設(shè)置為λ=8。

    實(shí)驗(yàn)分析中選擇的數(shù)據(jù)集見(jiàn)表1,其中Agaricus、Hayes、Promoter、Tic-tac-toe 數(shù)據(jù)集均為分類型數(shù)據(jù)集,剩余3 個(gè)數(shù)據(jù)集Flag、German、Zoo均為混合型數(shù)據(jù)集。由于部分?jǐn)?shù)據(jù)集存在數(shù)據(jù)缺失情況,本文選擇直接刪除的方法。本文中涉及對(duì)比的部分均采用以相同初始點(diǎn)作為類中心進(jìn)行聚類重復(fù)運(yùn)行50次后計(jì)算得出的各評(píng)價(jià)指標(biāo)的平均值與方差進(jìn)行衡量。

    表1 數(shù)據(jù)集信息描述

    2.3 分類型數(shù)據(jù)聚類結(jié)果分析

    選取表1 中的Agaricus、Hayes、Promoter、Tic-tac-toe,對(duì)比4種算法聚類結(jié)果在各指標(biāo)上的差別,計(jì)算結(jié)果如表2至表4所示。

    表2 分類型數(shù)據(jù)CA指標(biāo)對(duì)比(均值±方差)

    表3 分類型數(shù)據(jù)ARI指標(biāo)對(duì)比(均值±方差)

    表4 分類型數(shù)據(jù)NMI指標(biāo)對(duì)比(均值±方差)

    由表2 至表4 可以看出,Agaricus、Promoter 兩個(gè)數(shù)據(jù)集在α=1時(shí)效果最好,Hayes、Tic-tac-toe數(shù)據(jù)集在α較小時(shí)效果較好。在CA 指標(biāo)與ARI 指標(biāo)下,Agaricus、Hayes、Promoter、Tic-tac-toe 這4 個(gè)數(shù)據(jù)集分別在α=1,α=0.2,α=1,α=0.05 時(shí)效果最好。在NMI 指標(biāo)下,Agaricus、Hayes、Promoter、Tic-tac-toe 這4 個(gè)數(shù)據(jù)集分別在α=1,α=0.0001,α=1,α=0.8 時(shí)效果最好。選取表2 至表4 中α-K-prototypes 算法計(jì)算得出的最高數(shù)值作為α-K-prototypes 算法的結(jié)果,下頁(yè)圖2 給出4 種算法在3 種指標(biāo)下的結(jié)果比較,從左到右依次為CA指標(biāo)條形圖、ARI指標(biāo)條形圖、NMI指標(biāo)條形圖。從圖2可以看出,α-K-prototypes算法在計(jì)算分類型數(shù)據(jù)時(shí)效果是優(yōu)于其他3種算法的。

    圖2 分類型數(shù)據(jù)集CA、ARI、NMI指標(biāo)對(duì)比

    2.4 混合型數(shù)據(jù)聚類結(jié)果分析

    選取表1 中的Flag、German、Zoo 這3 個(gè)混合型數(shù)據(jù)集,對(duì)比4 種算法聚類結(jié)果在各指標(biāo)上的差別,計(jì)算結(jié)果如下頁(yè)表5至表7所示。

    表5 混合型數(shù)據(jù)CA指標(biāo)對(duì)比(均值±方差)

    表6 混合型數(shù)據(jù)ARI指標(biāo)對(duì)比(均值±方差)

    表7 混合型數(shù)據(jù)NMI指標(biāo)對(duì)比(均值±方差)

    由表5 至表7 可以看出,F(xiàn)lag、German、Zoo 這3 個(gè)數(shù)據(jù)集在α較小時(shí)效果較好。在CA指標(biāo)與ARI指標(biāo)下,F(xiàn)lag、German、Zoo分別在α=0.2,α=0.0001,α=0.0001 時(shí)效果最好。在NMI 指標(biāo)下,F(xiàn)lag、German 兩個(gè)數(shù)據(jù)集分別在α=0.6,α=0.0001 時(shí)效果最好,Zoo 數(shù)據(jù)集在α=0.8 時(shí)略低于K-prototypes 算法。設(shè)定其中German、Zoo 兩個(gè)數(shù)據(jù)集的α-K-prototypes 算法α取值為0.0001。因?yàn)镕lag 數(shù)據(jù)集在α=1 時(shí)的各項(xiàng)指標(biāo)優(yōu)于在α=0.0001 時(shí)的各項(xiàng)指標(biāo),為方便對(duì)比,設(shè)定Flag數(shù)據(jù)集的α-K-prototypes算法α取值為1。

    圖3 給出了4 種算法在3 種指標(biāo)下的結(jié)果比較,從左到右依次為CA指標(biāo)條形圖、ARI指標(biāo)條形圖、NMI指標(biāo)條形圖。從圖3 可以看出,α-K-prototypes 算法在計(jì)算混合型數(shù)據(jù)時(shí)效果是優(yōu)于其他3種算法的。

    圖3 混合型數(shù)據(jù)集CA、ARI、NMI指標(biāo)對(duì)比

    2.5 顯著性檢驗(yàn)分析

    表8 為置信度為95%的Wilcoxon 秩和檢驗(yàn)結(jié)果。檢驗(yàn)結(jié)果為1 表示在95%的置信度下認(rèn)為不同算法的指標(biāo)均值不相等,說(shuō)明α-K-prototypes算法與其他算法在指定指標(biāo)下是有顯著差異的;檢驗(yàn)結(jié)果為0表示不同算法的指標(biāo)均值相等,認(rèn)為α-K-prototypes算法與其他算法在指定指標(biāo)下沒(méi)有顯著差異。由表8可以看出,在7個(gè)數(shù)據(jù)集上,α-K-prototypes算法與其他3種算法在CA、ARI、NMI指標(biāo)下均是有顯著差異的。

    表8 提出算法與其他算法Wilcoxon秩和檢驗(yàn)結(jié)果h(p)

    2.6 α 推薦準(zhǔn)則

    在實(shí)際計(jì)算中,由于聚類的個(gè)數(shù)與樣本的標(biāo)簽是未知的,所以并不能通過(guò)對(duì)比聚類精度等指標(biāo)調(diào)整α?,F(xiàn)給出一種較優(yōu)α推薦準(zhǔn)則。

    定義11:第j個(gè)分類型屬性信息熵[21]為:

    從UCI 數(shù)據(jù)庫(kù)中找出20 個(gè)數(shù)據(jù)集,其中包含11 個(gè)混合型數(shù)據(jù)集、9個(gè)分類型數(shù)據(jù)集。對(duì)于每個(gè)數(shù)據(jù)集,計(jì)算m個(gè)分類型屬性信息熵權(quán)重后,計(jì)算整體離散系數(shù),計(jì)算結(jié)果如表9所示。

    表9 數(shù)據(jù)集離散系數(shù)

    圖4 為部分?jǐn)?shù)據(jù)集各指標(biāo)計(jì)算結(jié)果隨α變化的趨勢(shì)圖。從圖4 可以看出Auto、Soybean、Tae 數(shù)據(jù)集當(dāng)α=1 時(shí)在3 種指標(biāo)下效果優(yōu)于α→0 的結(jié)果,而Chess、Hayes、Lense數(shù)據(jù)集當(dāng)α→0 時(shí)在3種指標(biāo)下效果優(yōu)于α=1的結(jié)果。又由表2 至表7 中的結(jié)果發(fā)現(xiàn),在實(shí)際應(yīng)用中α度量適用于α→0 或者α=1的情況,取其他值效果較好的情況較少,所以僅考慮α→0 以及α=1兩種情況。

    圖4 部分?jǐn)?shù)據(jù)集指標(biāo)隨α 變化的趨勢(shì)

    對(duì)比圖4 與表9,觀察數(shù)據(jù)集變化趨勢(shì)后發(fā)現(xiàn)α的取值與離散系數(shù)具有一定的關(guān)系,由此假設(shè)較優(yōu)α的計(jì)算準(zhǔn)則[22]為:

    表10、表11分別給出了Vs<0.1與Vs≥0.1的數(shù)據(jù)集在α=0.0001和α=1下3種指標(biāo)的結(jié)果。為了檢驗(yàn)較優(yōu)α計(jì)算準(zhǔn)則是否在統(tǒng)計(jì)學(xué)上顯著,本文使用Wilcoxon秩和檢驗(yàn)進(jìn)行顯著性檢驗(yàn)。為了驗(yàn)證Vs<0.1數(shù)據(jù)集α=0.0001的結(jié)果顯著優(yōu)于α=1 的結(jié)果,記為α=0.0001 時(shí)不同數(shù)據(jù)集的CA指標(biāo)均值,為α=1時(shí)不同數(shù)據(jù)集的CA指標(biāo)均值,其余指標(biāo)類似。對(duì)于Vs<0.1 的數(shù)據(jù)集,原假設(shè)為α=0.0001時(shí)計(jì)算出的評(píng)價(jià)指標(biāo)大于等于α=1時(shí)計(jì)算出的評(píng)價(jià)指標(biāo),備擇假設(shè)為α=0.0001時(shí)計(jì)算出的評(píng)價(jià)指標(biāo)小于α=1時(shí)計(jì)算出的評(píng)價(jià)指標(biāo),具體結(jié)果見(jiàn)表12。表12中給出了Vs<0.1的數(shù)據(jù)集每種指標(biāo)下的原假設(shè)和備擇假設(shè),以及每種檢驗(yàn)的P值,由于P值都大于0.05,因此不拒絕原假設(shè),即α=0.0001時(shí)計(jì)算出的評(píng)價(jià)指標(biāo)顯著優(yōu)于α=1時(shí)計(jì)算出的評(píng)價(jià)指標(biāo)。對(duì)于Vs≥0.1 的數(shù)據(jù)集,原假設(shè)為α=0.0001時(shí)計(jì)算出的評(píng)價(jià)指標(biāo)小于等于α=1時(shí)計(jì)算出的評(píng)價(jià)指標(biāo),備擇假設(shè)為α=0.0001時(shí)計(jì)算出的評(píng)價(jià)指標(biāo)大于α=1時(shí)計(jì)算出的評(píng)價(jià)指標(biāo),具體計(jì)算結(jié)果見(jiàn)表13。表13 中給出了Vs≥0.1的數(shù)據(jù)集每種指標(biāo)下的原假設(shè)和備擇假設(shè),以及每種檢驗(yàn)的P值,由于P值都大于0.05,因此不拒絕原假設(shè),即α=1時(shí)計(jì)算出的評(píng)價(jià)指標(biāo)顯著優(yōu)于α=0.0001時(shí)計(jì)算出的評(píng)價(jià)指標(biāo)。由此說(shuō)明較優(yōu)α計(jì)算準(zhǔn)則在統(tǒng)計(jì)學(xué)上是顯著的。

    表10 Vs<0.1的數(shù)據(jù)集在α-K-prototypes算法下的指標(biāo)

    表11 Vs ≥0.1的數(shù)據(jù)集在α-K-prototypes算法下的指標(biāo)

    表12 Vs<0.1時(shí)較優(yōu)α 計(jì)算準(zhǔn)則Wilcoxon秩和檢驗(yàn)結(jié)果

    表13 Vs ≥0.1時(shí)較優(yōu)α 計(jì)算準(zhǔn)則Wilcoxon秩和檢驗(yàn)結(jié)果

    由上述計(jì)算可以認(rèn)為,當(dāng)Vs≥0.1時(shí),數(shù)據(jù)集包含的數(shù)據(jù)量更多、各樣本間的差異更大,所以離散系數(shù)更大,此時(shí)使用歐氏距離計(jì)算,即α=1。當(dāng)Vs<0.1 時(shí),數(shù)據(jù)集包含的信息量較少、各樣本間的差異較小,所以離散系數(shù)較小,此時(shí)使用Aitchison距離會(huì)分辨出各樣本間的差異,以更好地區(qū)分應(yīng)該屬于不同類別的樣本,即α→0。

    3 結(jié)束語(yǔ)

    在大數(shù)據(jù)背景下,混合型數(shù)據(jù)越來(lái)越多。其中分類型數(shù)據(jù)部分的類中心表現(xiàn)形式符合成分?jǐn)?shù)據(jù)定義,所以本文提出一種融合α度量的K-prototypes算法。針對(duì)α度量在α較小的時(shí)候距離太大的問(wèn)題,加入λα2作為分類型數(shù)據(jù)的權(quán)重調(diào)整系數(shù),使得α度量在不影響聚類甚至提高聚類精度的前提下更具有解釋性。最后基于實(shí)際應(yīng)用,給出了較優(yōu)α計(jì)算準(zhǔn)則。α-K-prototypes 算法引入了成分?jǐn)?shù)據(jù)的分析方法度量分類型數(shù)據(jù)的相異性。在多個(gè)數(shù)據(jù)集上實(shí)驗(yàn)對(duì)比后,證明了α-K-prototypes算法在分類型數(shù)據(jù)和混合型數(shù)據(jù)中均有比較明顯的提升作用,且在統(tǒng)計(jì)意義上顯著區(qū)別于其他三種算法。

    猜你喜歡
    度量聚類距離
    有趣的度量
    模糊度量空間的強(qiáng)嵌入
    迷向表示分為6個(gè)不可約直和的旗流形上不變愛(ài)因斯坦度量
    算距離
    基于DBSACN聚類算法的XML文檔聚類
    每次失敗都會(huì)距離成功更近一步
    山東青年(2016年3期)2016-02-28 14:25:55
    地質(zhì)異常的奇異性度量與隱伏源致礦異常識(shí)別
    基于改進(jìn)的遺傳算法的模糊聚類算法
    愛(ài)的距離
    母子健康(2015年1期)2015-02-28 11:21:33
    一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
    男女边摸边吃奶| 老司机影院成人| 国产国语露脸激情在线看| 亚洲人成网站在线观看播放| 中文字幕精品免费在线观看视频| 99香蕉大伊视频| 考比视频在线观看| 咕卡用的链子| 国产极品天堂在线| 亚洲第一av免费看| 午夜91福利影院| 观看av在线不卡| 深夜精品福利| 国产精品熟女久久久久浪| 菩萨蛮人人尽说江南好唐韦庄| 中文字幕人妻丝袜一区二区 | 国产高清不卡午夜福利| 考比视频在线观看| 国产深夜福利视频在线观看| 日本猛色少妇xxxxx猛交久久| 国产免费福利视频在线观看| 91成人精品电影| av国产久精品久网站免费入址| 极品人妻少妇av视频| 国产一区二区激情短视频 | 亚洲精品,欧美精品| 国产不卡av网站在线观看| 九色亚洲精品在线播放| 国产男女内射视频| av有码第一页| 狠狠精品人妻久久久久久综合| 啦啦啦在线免费观看视频4| 哪个播放器可以免费观看大片| 亚洲第一青青草原| 最近的中文字幕免费完整| 自拍欧美九色日韩亚洲蝌蚪91| 精品国产一区二区三区久久久樱花| 午夜精品国产一区二区电影| 国产成人av激情在线播放| 国产黄色免费在线视频| 午夜福利一区二区在线看| av女优亚洲男人天堂| 日韩中文字幕视频在线看片| 欧美日本中文国产一区发布| 婷婷色av中文字幕| 天堂8中文在线网| 久久99精品国语久久久| 免费看不卡的av| 亚洲精品第二区| 精品午夜福利在线看| 午夜福利网站1000一区二区三区| 另类精品久久| 久久久久久久久免费视频了| 制服诱惑二区| 国产淫语在线视频| 久久久久久久精品精品| 波多野结衣一区麻豆| 美女大奶头黄色视频| 99re6热这里在线精品视频| 美女午夜性视频免费| 如何舔出高潮| 国产精品免费视频内射| 国产亚洲最大av| 色吧在线观看| 两性夫妻黄色片| 天堂中文最新版在线下载| 人妻 亚洲 视频| www.自偷自拍.com| 亚洲成人一二三区av| 少妇熟女欧美另类| 成人漫画全彩无遮挡| 高清av免费在线| 欧美人与性动交α欧美精品济南到 | www.av在线官网国产| 伊人久久大香线蕉亚洲五| 欧美成人午夜免费资源| 久久人人爽人人片av| av卡一久久| 丰满迷人的少妇在线观看| 亚洲av成人精品一二三区| 一级毛片黄色毛片免费观看视频| 在线观看免费视频网站a站| 国产精品免费视频内射| 9色porny在线观看| 最新中文字幕久久久久| 亚洲成人av在线免费| 99国产精品免费福利视频| 高清在线视频一区二区三区| 欧美日韩国产mv在线观看视频| 欧美日韩视频精品一区| 丝袜美腿诱惑在线| 久久亚洲国产成人精品v| 国产精品久久久久久久久免| 亚洲综合精品二区| 久久青草综合色| 精品一区二区免费观看| 免费大片黄手机在线观看| 蜜桃国产av成人99| 少妇猛男粗大的猛烈进出视频| 七月丁香在线播放| 大话2 男鬼变身卡| 久久久欧美国产精品| 国产成人aa在线观看| 制服人妻中文乱码| 人人妻人人澡人人看| 熟女电影av网| 99久久人妻综合| 国产精品熟女久久久久浪| 成人18禁高潮啪啪吃奶动态图| 麻豆av在线久日| 香蕉精品网在线| 在线观看三级黄色| 91国产中文字幕| 精品国产一区二区三区久久久樱花| 男女午夜视频在线观看| 人妻少妇偷人精品九色| 午夜免费鲁丝| 桃花免费在线播放| 亚洲av中文av极速乱| 美女高潮到喷水免费观看| 亚洲第一av免费看| 女人被躁到高潮嗷嗷叫费观| 久久国内精品自在自线图片| 国产人伦9x9x在线观看 | 欧美日韩视频高清一区二区三区二| 两性夫妻黄色片| 精品酒店卫生间| 日韩精品免费视频一区二区三区| 婷婷色av中文字幕| 欧美 亚洲 国产 日韩一| 丰满迷人的少妇在线观看| 午夜福利乱码中文字幕| 国产黄色视频一区二区在线观看| 午夜日韩欧美国产| 久久久国产一区二区| 国产熟女午夜一区二区三区| 日本-黄色视频高清免费观看| 1024香蕉在线观看| 精品亚洲成国产av| 青春草国产在线视频| 咕卡用的链子| 综合色丁香网| 日韩中文字幕视频在线看片| 亚洲精品久久久久久婷婷小说| 人妻一区二区av| videos熟女内射| 久久久久久免费高清国产稀缺| 亚洲欧美清纯卡通| 精品第一国产精品| 国产麻豆69| 天天躁夜夜躁狠狠久久av| 女人久久www免费人成看片| 亚洲精品久久成人aⅴ小说| 精品少妇一区二区三区视频日本电影 | 少妇人妻 视频| 美女大奶头黄色视频| 精品酒店卫生间| av视频免费观看在线观看| 久久精品国产亚洲av天美| 97精品久久久久久久久久精品| av卡一久久| 综合色丁香网| 伦理电影免费视频| 久久久久国产一级毛片高清牌| 搡女人真爽免费视频火全软件| 男女边摸边吃奶| 成人毛片a级毛片在线播放| 久久久精品免费免费高清| 黑人巨大精品欧美一区二区蜜桃| 久久久久久免费高清国产稀缺| 三级国产精品片| 日韩 亚洲 欧美在线| 啦啦啦视频在线资源免费观看| 免费久久久久久久精品成人欧美视频| 久久精品久久久久久噜噜老黄| 欧美精品一区二区大全| 老司机影院毛片| 午夜福利,免费看| 亚洲三级黄色毛片| 国产精品蜜桃在线观看| 建设人人有责人人尽责人人享有的| 午夜福利影视在线免费观看| 黑人猛操日本美女一级片| 99久久中文字幕三级久久日本| 国产精品偷伦视频观看了| 成年美女黄网站色视频大全免费| 久久av网站| 精品一区二区三卡| 久久久久久久国产电影| 美女国产高潮福利片在线看| videossex国产| 久久综合国产亚洲精品| 中文精品一卡2卡3卡4更新| 日日撸夜夜添| 日韩不卡一区二区三区视频在线| 电影成人av| 日韩一区二区视频免费看| 一级黄片播放器| 亚洲国产精品一区三区| 国产精品亚洲av一区麻豆 | 在线免费观看不下载黄p国产| 99久久精品国产国产毛片| 看免费av毛片| 国产精品三级大全| av片东京热男人的天堂| 18禁裸乳无遮挡动漫免费视频| 欧美精品一区二区免费开放| 男女免费视频国产| 女性生殖器流出的白浆| 99国产精品免费福利视频| 亚洲精华国产精华液的使用体验| 国产乱人偷精品视频| 国产精品久久久久久久久免| 国产精品国产三级国产专区5o| 亚洲国产精品成人久久小说| 人妻人人澡人人爽人人| 啦啦啦中文免费视频观看日本| 精品第一国产精品| 男女国产视频网站| 最新中文字幕久久久久| 如日韩欧美国产精品一区二区三区| 午夜福利网站1000一区二区三区| 熟女电影av网| 99国产精品免费福利视频| 国产毛片在线视频| 成人午夜精彩视频在线观看| 美女午夜性视频免费| 国产精品麻豆人妻色哟哟久久| 精品亚洲成国产av| tube8黄色片| av在线app专区| 丁香六月天网| 巨乳人妻的诱惑在线观看| 亚洲国产成人一精品久久久| 一区二区三区激情视频| 在线免费观看不下载黄p国产| 亚洲成人手机| 亚洲色图综合在线观看| 亚洲精品av麻豆狂野| 国精品久久久久久国模美| 日日摸夜夜添夜夜爱| 91精品国产国语对白视频| 午夜福利视频精品| 亚洲精品国产av成人精品| 亚洲国产欧美网| 欧美日韩精品网址| 久久久精品区二区三区| 欧美成人精品欧美一级黄| 国产在线一区二区三区精| 亚洲伊人色综图| 自线自在国产av| 日日啪夜夜爽| 老熟女久久久| 高清视频免费观看一区二区| 亚洲欧美精品自产自拍| 老司机影院毛片| 亚洲精品日韩在线中文字幕| 亚洲欧美成人综合另类久久久| xxx大片免费视频| 又粗又硬又长又爽又黄的视频| 免费不卡的大黄色大毛片视频在线观看| 极品人妻少妇av视频| 2022亚洲国产成人精品| 成人毛片a级毛片在线播放| av网站免费在线观看视频| 亚洲精品自拍成人| 制服丝袜香蕉在线| 国产成人精品无人区| 国产精品无大码| 91午夜精品亚洲一区二区三区| 亚洲国产精品一区二区三区在线| 亚洲av日韩在线播放| 精品酒店卫生间| 夫妻性生交免费视频一级片| 国产精品一区二区在线观看99| 色网站视频免费| 亚洲精品视频女| 欧美人与性动交α欧美精品济南到 | 大片电影免费在线观看免费| 日韩大片免费观看网站| 菩萨蛮人人尽说江南好唐韦庄| 99香蕉大伊视频| 国产欧美日韩综合在线一区二区| 亚洲天堂av无毛| 成人手机av| 亚洲色图 男人天堂 中文字幕| 成年美女黄网站色视频大全免费| 免费观看在线日韩| 日本-黄色视频高清免费观看| 满18在线观看网站| 男女下面插进去视频免费观看| av视频免费观看在线观看| 精品一品国产午夜福利视频| 一区二区日韩欧美中文字幕| 国产精品99久久99久久久不卡 | 国产精品一二三区在线看| 亚洲欧美一区二区三区国产| 丰满饥渴人妻一区二区三| 久久人人爽人人片av| 久热久热在线精品观看| 97在线人人人人妻| 亚洲欧美色中文字幕在线| 欧美av亚洲av综合av国产av | 日本午夜av视频| 亚洲欧美一区二区三区黑人 | 一区在线观看完整版| 中文字幕人妻熟女乱码| 亚洲国产av影院在线观看| 女人精品久久久久毛片| 免费av中文字幕在线| 人人妻人人添人人爽欧美一区卜| 免费观看性生交大片5| 日本欧美国产在线视频| 亚洲精品久久午夜乱码| 免费观看无遮挡的男女| 黄片播放在线免费| 丰满少妇做爰视频| 在现免费观看毛片| 久久人人爽人人片av| 韩国精品一区二区三区| 日韩一区二区视频免费看| 18禁国产床啪视频网站| 免费看不卡的av| 亚洲久久久国产精品| 精品酒店卫生间| 国产免费福利视频在线观看| 亚洲av中文av极速乱| 欧美日韩精品成人综合77777| 国产一区二区在线观看av| 国产成人精品婷婷| 欧美精品国产亚洲| 欧美国产精品一级二级三级| 青青草视频在线视频观看| 国产精品久久久久久av不卡| 天堂8中文在线网| 在线观看免费高清a一片| 老司机亚洲免费影院| 一本一本久久a久久精品综合妖精 国产伦在线观看视频一区 | 欧美激情极品国产一区二区三区| 免费高清在线观看视频在线观看| 久久久国产一区二区| 午夜91福利影院| 黑人巨大精品欧美一区二区蜜桃| 不卡视频在线观看欧美| 日本午夜av视频| 国产日韩一区二区三区精品不卡| 久久久久国产精品人妻一区二区| 久热这里只有精品99| 午夜福利网站1000一区二区三区| 高清av免费在线| 性色avwww在线观看| 黑人巨大精品欧美一区二区蜜桃| 国产在线视频一区二区| 国产精品无大码| 久久影院123| 99热全是精品| 赤兔流量卡办理| 老鸭窝网址在线观看| 高清av免费在线| 色婷婷久久久亚洲欧美| 少妇精品久久久久久久| 香蕉丝袜av| 日韩三级伦理在线观看| 午夜老司机福利剧场| 久久精品国产a三级三级三级| 1024香蕉在线观看| 男女边摸边吃奶| 亚洲内射少妇av| videossex国产| 精品亚洲乱码少妇综合久久| 国产成人精品福利久久| av福利片在线| 中文字幕av电影在线播放| 妹子高潮喷水视频| 18禁国产床啪视频网站| freevideosex欧美| 伦理电影免费视频| 亚洲精品第二区| 免费大片黄手机在线观看| 极品人妻少妇av视频| 日韩欧美精品免费久久| 女的被弄到高潮叫床怎么办| 国产一区二区三区综合在线观看| 久久99蜜桃精品久久| 久久人人爽av亚洲精品天堂| 国产乱来视频区| 日韩在线高清观看一区二区三区| 视频在线观看一区二区三区| 国产视频首页在线观看| 国产乱来视频区| 高清视频免费观看一区二区| 亚洲美女黄色视频免费看| 两个人看的免费小视频| 国产无遮挡羞羞视频在线观看| 伦精品一区二区三区| 亚洲天堂av无毛| 免费观看无遮挡的男女| 伊人久久大香线蕉亚洲五| 国产精品一区二区在线观看99| 精品一区二区三区四区五区乱码 | 男女边吃奶边做爰视频| 观看美女的网站| 性色av一级| www.av在线官网国产| av免费在线看不卡| 欧美国产精品va在线观看不卡| 青春草视频在线免费观看| 伊人亚洲综合成人网| 欧美日韩亚洲国产一区二区在线观看 | 日韩视频在线欧美| 永久免费av网站大全| 97在线视频观看| a级毛片黄视频| 亚洲精品一二三| 香蕉国产在线看| 久久国产亚洲av麻豆专区| av在线app专区| 纵有疾风起免费观看全集完整版| 男女高潮啪啪啪动态图| 热re99久久精品国产66热6| 波野结衣二区三区在线| 中文字幕色久视频| 国产精品99久久99久久久不卡 | 亚洲精品久久成人aⅴ小说| 两性夫妻黄色片| 高清欧美精品videossex| 久热这里只有精品99| 亚洲欧美精品自产自拍| 99久久中文字幕三级久久日本| 高清欧美精品videossex| 久久毛片免费看一区二区三区| 哪个播放器可以免费观看大片| av国产久精品久网站免费入址| 精品亚洲成国产av| 日本-黄色视频高清免费观看| 男女边吃奶边做爰视频| 久久久精品区二区三区| 亚洲中文av在线| 黄色怎么调成土黄色| 久久精品国产鲁丝片午夜精品| 免费观看av网站的网址| 男女高潮啪啪啪动态图| 久热久热在线精品观看| 老司机影院毛片| 亚洲精品国产一区二区精华液| 三级国产精品片| 国产免费现黄频在线看| 久久久久国产一级毛片高清牌| 妹子高潮喷水视频| 肉色欧美久久久久久久蜜桃| 国产亚洲欧美精品永久| 亚洲精品在线美女| 久久久久国产网址| 亚洲av福利一区| 老汉色∧v一级毛片| 成人亚洲欧美一区二区av| 大码成人一级视频| 亚洲综合色网址| 午夜老司机福利剧场| 国产av一区二区精品久久| 欧美人与性动交α欧美精品济南到 | 极品人妻少妇av视频| 国产精品久久久久久精品电影小说| a级片在线免费高清观看视频| 国产欧美日韩综合在线一区二区| 久久国内精品自在自线图片| 午夜免费男女啪啪视频观看| 免费在线观看黄色视频的| 免费日韩欧美在线观看| 久久av网站| 桃花免费在线播放| 一边摸一边做爽爽视频免费| 国产成人精品福利久久| 国产成人精品婷婷| 亚洲精品中文字幕在线视频| 在线天堂最新版资源| 男女国产视频网站| 久久人人97超碰香蕉20202| 老鸭窝网址在线观看| 丰满少妇做爰视频| 免费在线观看完整版高清| 一本色道久久久久久精品综合| 丝袜在线中文字幕| 天堂中文最新版在线下载| 啦啦啦中文免费视频观看日本| 日韩电影二区| 久久精品久久久久久噜噜老黄| 久久久久精品性色| 亚洲国产日韩一区二区| 久久久久视频综合| 日韩一区二区三区影片| 亚洲av电影在线进入| www.精华液| 国产欧美日韩一区二区三区在线| 永久免费av网站大全| 日日摸夜夜添夜夜爱| 欧美+日韩+精品| 黑人欧美特级aaaaaa片| 欧美变态另类bdsm刘玥| 熟女少妇亚洲综合色aaa.| 国产一级毛片在线| 午夜福利网站1000一区二区三区| 中文字幕av电影在线播放| 日韩在线高清观看一区二区三区| 国产精品人妻久久久影院| av在线app专区| 国产精品秋霞免费鲁丝片| 免费看av在线观看网站| 一级片免费观看大全| 午夜福利影视在线免费观看| 亚洲久久久国产精品| 熟女少妇亚洲综合色aaa.| 自线自在国产av| 日产精品乱码卡一卡2卡三| 又黄又粗又硬又大视频| 日本黄色日本黄色录像| 国产精品 欧美亚洲| 男女午夜视频在线观看| 国产精品无大码| a 毛片基地| 国产精品av久久久久免费| xxxhd国产人妻xxx| 赤兔流量卡办理| 久久久久视频综合| 自线自在国产av| 街头女战士在线观看网站| 男人爽女人下面视频在线观看| 久久精品人人爽人人爽视色| 男女国产视频网站| 亚洲欧美色中文字幕在线| 99热国产这里只有精品6| 婷婷色综合www| av视频免费观看在线观看| 中文字幕色久视频| 老熟女久久久| 99热国产这里只有精品6| 性色av一级| 免费高清在线观看视频在线观看| a 毛片基地| 国产福利在线免费观看视频| 日韩欧美精品免费久久| 女性生殖器流出的白浆| 人人妻人人添人人爽欧美一区卜| 成人午夜精彩视频在线观看| 久久久久视频综合| 极品少妇高潮喷水抽搐| 国产国语露脸激情在线看| 妹子高潮喷水视频| 亚洲av国产av综合av卡| 丝袜脚勾引网站| 久久精品国产亚洲av高清一级| 欧美日韩国产mv在线观看视频| 国产成人精品福利久久| 我的亚洲天堂| 免费在线观看完整版高清| 激情五月婷婷亚洲| 午夜免费观看性视频| 国产精品免费大片| 日韩电影二区| 色哟哟·www| 日韩精品免费视频一区二区三区| 成年女人毛片免费观看观看9 | 亚洲国产欧美网| 五月开心婷婷网| 中文字幕av电影在线播放| 亚洲男人天堂网一区| av天堂久久9| 天天躁夜夜躁狠狠躁躁| 1024视频免费在线观看| 国产精品99久久99久久久不卡 | 亚洲第一青青草原| 国产视频首页在线观看| 精品人妻在线不人妻| 国产成人精品婷婷| 国产又爽黄色视频| 99久久中文字幕三级久久日本| 国产爽快片一区二区三区| 婷婷色综合大香蕉| 久久人人爽人人片av| 亚洲人成电影观看| 下体分泌物呈黄色| 美女大奶头黄色视频| 美女国产高潮福利片在线看| 免费观看av网站的网址| 99久久精品国产国产毛片| 日本免费在线观看一区| 久久国内精品自在自线图片| 永久网站在线| 老司机亚洲免费影院| 精品福利永久在线观看| 国产精品免费视频内射| 午夜日本视频在线| 青春草国产在线视频| 亚洲精品,欧美精品| 青春草国产在线视频| 国产精品偷伦视频观看了| 国产亚洲一区二区精品| 久久99蜜桃精品久久| 亚洲精品中文字幕在线视频| 国产高清不卡午夜福利| 免费观看a级毛片全部| 久久久久久久精品精品| www日本在线高清视频| 欧美变态另类bdsm刘玥| 女人精品久久久久毛片| 另类精品久久| 欧美精品人与动牲交sv欧美| 日韩免费高清中文字幕av| 1024香蕉在线观看| 日本vs欧美在线观看视频| 国产亚洲一区二区精品| 亚洲精品日韩在线中文字幕| 女性被躁到高潮视频| 五月开心婷婷网| 久久久久久久久免费视频了|