• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    相似度計(jì)算及其在數(shù)據(jù)挖掘中的應(yīng)用

    2016-06-29 19:16:55李俊磊滕少華
    電腦知識(shí)與技術(shù) 2016年13期
    關(guān)鍵詞:數(shù)據(jù)類型數(shù)據(jù)挖掘對(duì)象

    李俊磊 滕少華

    摘要:相似度是描述兩個(gè)對(duì)象之間相似程度的一種度量,依據(jù)對(duì)象不同,相似度計(jì)算方法亦不同。相似度計(jì)算被廣泛應(yīng)用于數(shù)據(jù)挖掘算法中,它是對(duì)象分類的基礎(chǔ)。該文將數(shù)據(jù)對(duì)象劃分為數(shù)值型、非數(shù)值型和混合型三種,并根據(jù)數(shù)據(jù)對(duì)象的類型,探討了相應(yīng)的相似度計(jì)算方法,最后,通過(guò)實(shí)例描述了相似度計(jì)算在數(shù)據(jù)挖掘中的應(yīng)用。

    關(guān)鍵詞:對(duì)象;相似度計(jì)算;數(shù)據(jù)挖掘;數(shù)據(jù)類型

    中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)13-0014-04

    Abstract: The Similarity is a measure of similarity between two objects, according to different objects, similarity calculation method is also different. Similarity calculation is widely used in data classification, is the basis for object classification. In this paper, the data objects were divided into three kinds: numeric type, non-numeric type and mixed type. And the similarity calculation methods of different types are discussed. Finally, we illustrated the application of similarity in the data mining.

    Key words: object; similarity calculation; data mining; data type

    伴隨數(shù)據(jù)挖掘技術(shù)的應(yīng)用領(lǐng)域發(fā)展,對(duì)象之間的相似性計(jì)算已成為一個(gè)非常重要的研究課題。相似度度量是衡量對(duì)象間相互關(guān)系強(qiáng)弱、聯(lián)系緊密程度的重要手段。

    在數(shù)據(jù)挖掘的方法中,諸如數(shù)據(jù)分類和預(yù)測(cè)[1-2]、數(shù)據(jù)聚類[1-2]、關(guān)聯(lián)分析[1-2]、序列模式[1-2]、依賴關(guān)系與依賴模型[1-2]、異常檢測(cè)和趨勢(shì)分析[1-2]等都離不開(kāi)對(duì)象之間的相似度分析。尤其是在考察對(duì)象間同異度關(guān)系時(shí),相似度度量和計(jì)算方法將直接影響最終的數(shù)據(jù)挖掘結(jié)果,相似度計(jì)算又是衡量對(duì)象間差異的基礎(chǔ),在分類應(yīng)用中,相似度計(jì)算是分類的依據(jù)。因而,依據(jù)不同的實(shí)際應(yīng)用和數(shù)據(jù)對(duì)象,研究相似度計(jì)算方法,對(duì)數(shù)據(jù)分類有重要意義。

    首先描述了相似度概念,進(jìn)而將數(shù)據(jù)對(duì)象分為三種類型:數(shù)值型、非數(shù)值型和混合型,然后按不同數(shù)據(jù)對(duì)象分別給出了相應(yīng)的相似度計(jì)算公式,最后通過(guò)實(shí)例對(duì)相似度計(jì)算進(jìn)行了說(shuō)明。

    1 相似度概念

    在數(shù)據(jù)挖掘、模式識(shí)別和機(jī)器學(xué)習(xí)等計(jì)算機(jī)應(yīng)用領(lǐng)域中,兩個(gè)對(duì)象的相似度是描述這兩個(gè)對(duì)象之間相似程度的一種度量,兩者越相似,它們的相似度就越高,相似度是一個(gè)非負(fù)數(shù)值,其值介于0和1之間[2]。數(shù)據(jù)挖掘的很多算法都涉及計(jì)算對(duì)象間的相似度,相似度計(jì)算方法依賴于數(shù)據(jù)對(duì)象的類型,數(shù)據(jù)對(duì)象的類型不同其相似度計(jì)算方法不同。例如,數(shù)值型數(shù)據(jù)的相似度可用歐氏空間的距離來(lái)描述其鄰近程度;兩個(gè)標(biāo)稱型數(shù)據(jù)對(duì)象的相似度與用來(lái)計(jì)算相似度的屬性的值域有關(guān)。

    依據(jù)參與相似度計(jì)算的數(shù)據(jù)類型,本文將數(shù)據(jù)對(duì)象分為數(shù)值型、非數(shù)值型和混合型[1-2]三種。

    1.1 數(shù)值型

    數(shù)值型數(shù)據(jù)被用來(lái)描述連續(xù)型或定量型數(shù)據(jù),即兩個(gè)不同數(shù)值之間有無(wú)窮多個(gè)數(shù)值。使用實(shí)數(shù)或度量衡單位計(jì)量相似度值,如溫度、身高等。數(shù)值型量可分為區(qū)間標(biāo)度量和比例標(biāo)度量,其中區(qū)間標(biāo)度量是一個(gè)線性的標(biāo)度量,而比例標(biāo)度量一般是非線性的。

    1.2 非數(shù)值型

    其取值是定性的、而非定量的數(shù)據(jù)。如人的性別,成績(jī)優(yōu)良等級(jí)等。通常這類對(duì)象屬性的取值可通過(guò)有限個(gè)狀態(tài)(字母/序數(shù))來(lái)描述。非數(shù)值型數(shù)據(jù)又可分為標(biāo)稱型、二元和序數(shù)型數(shù)據(jù)等。標(biāo)稱型數(shù)據(jù)之間是無(wú)序的,序數(shù)型是有序的。

    1.3 混合型

    由數(shù)值型數(shù)據(jù)和非數(shù)值型數(shù)據(jù)混合組成。

    2 相似度計(jì)算

    2.1 數(shù)值型數(shù)據(jù)

    數(shù)值型數(shù)據(jù)可分為區(qū)間標(biāo)度型和比例數(shù)值型數(shù)據(jù)。

    2.1.1 區(qū)間標(biāo)度型數(shù)據(jù)

    區(qū)間標(biāo)度型:是一個(gè)粗略線性標(biāo)度的連續(xù)量,這種量的值是有序的,可以為正數(shù)、負(fù)數(shù)或0。典型的例子有重量、高度、大氣溫度等。具體計(jì)算時(shí),區(qū)間型數(shù)據(jù)的相似度通常轉(zhuǎn)換成相異度計(jì)算。常用的計(jì)算方法是先將這種量標(biāo)準(zhǔn)化,消除度量單位對(duì)分析結(jié)果的影響,然后,采用距離來(lái)計(jì)算對(duì)象間的相異度。距離是一個(gè)非負(fù)數(shù),距離的大小代表著2個(gè)對(duì)象之間的差異程度,距離越大,2個(gè)對(duì)象相異度就越大,距離越小,2個(gè)對(duì)象之間的相似度越高。這里給出常見(jiàn)的相異度計(jì)算方法[3]。

    設(shè) p=(p1, p2, …, pn)T, q=(q1, q2, …, qn)T 為N維空間中的兩個(gè)對(duì)象,pi是對(duì)象p對(duì)應(yīng)的第i個(gè)屬性所取的值,是對(duì)象P的所有屬性值的平均值。qi是對(duì)象q對(duì)應(yīng)的第i個(gè)屬性所取的值,是對(duì)象q的所有屬性值的平均值。

    曼哈頓、歐氏和閔可夫斯基距離等計(jì)算公式分別如下:

    1)曼哈頓距離

    曼哈頓距離又稱為城市街區(qū)距離,是使用在幾何度量空間的幾何學(xué)用語(yǔ),用以表明2個(gè)點(diǎn)在標(biāo)準(zhǔn)坐標(biāo)系上的絕對(duì)軸距總和[4],對(duì)n維空間的曼哈頓距離表示如下:

    2個(gè)n維向量p(p1, p2, …, pn)與q(q1, q2, …, qn)間的曼哈頓距離:

    2)歐氏距離

    歐式距離也稱為歐幾里得距離,是通常采用的距離,它是在n維空間中2個(gè)點(diǎn)之間的真實(shí)距離,用來(lái)表示各個(gè)數(shù)據(jù)對(duì)象之間的距離。歐式距離與對(duì)象的量綱有關(guān),從統(tǒng)計(jì)的角度看,使用歐氏距離要求各個(gè)坐標(biāo)對(duì)歐式距離的貢獻(xiàn)是同等的且變差大小也是相同的[5]。

    2個(gè)n維向量p(p1, p2, …, pn)與q(q1, q2, …, qn)間的歐氏距離:

    (2)

    3)切比雪夫距離

    切比雪夫距離是一種最大距離。在向量空間中,2個(gè)向量間的切比雪夫距離,就是將其沿著任意坐標(biāo)尺寸的最大值[6]。二維和n維空間的切比雪夫距離如下:

    2個(gè)n維向量空間向量p(p1, p2, …, pn)與q(q1, q2, …, qn)間的切比雪夫距離:

    4)閔可夫斯基距離

    閔科夫斯基距離是歐氏距離和曼哈頓距離的推廣[7],定義如下:

    當(dāng)x=1時(shí),為曼哈頓距離,當(dāng)x=2時(shí)為歐氏距離。

    5)馬氏距離

    馬氏距離 [3]是一種常用的距離度量方式,能夠充分考慮模式特征參數(shù)的大小以及特征間的相關(guān)性,在模式識(shí)別中其性能通常比歐式距離好。馬氏距離是歐式距離的改進(jìn),是歐式空間中非均勻分布的歸一化距離,它對(duì)于一切線性變換是不變的[8]。

    6)Canberra距離

    Canberra距離是一種相對(duì)馬氏距離,不受量綱的影響,同樣沒(méi)有考慮多重相關(guān)性,Canberra距離對(duì)微小變化很敏感[9]。

    7)相關(guān)系數(shù)

    相關(guān)系數(shù)是對(duì)向量做標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)化后的夾角余弦,表示兩個(gè)向量的線性相關(guān)程度[10]。當(dāng)兩個(gè)向量方向相近時(shí),夾角余弦值越大,反之越小。特別地,當(dāng)兩個(gè)向量平行時(shí),夾角余弦值為1,而正交時(shí)余弦值為0。

    2.1.2 比例型數(shù)據(jù)

    比例型數(shù)據(jù)一般是通過(guò)非線性尺度取得的測(cè)量值。計(jì)算這類對(duì)象的相似度有三種方法:轉(zhuǎn)換為區(qū)間標(biāo)度型數(shù)據(jù)、轉(zhuǎn)換為連續(xù)的序數(shù)數(shù)據(jù)、取對(duì)數(shù)。

    2.2 非數(shù)值型數(shù)據(jù)

    許多數(shù)據(jù)挖掘方法只能處理數(shù)值型數(shù)據(jù),因此需要將非數(shù)值型數(shù)據(jù)轉(zhuǎn)為數(shù)值型數(shù)據(jù)??山⒎菙?shù)值型量的不同狀態(tài)值或利用離散數(shù)據(jù)建立其與對(duì)象之間的對(duì)照表。非數(shù)值型數(shù)據(jù)又可細(xì)分為標(biāo)稱數(shù)據(jù)、二元數(shù)據(jù)和序數(shù)型數(shù)據(jù)等。

    2.2.1 標(biāo)稱數(shù)據(jù)

    標(biāo)稱數(shù)據(jù)又稱為類別數(shù)據(jù),標(biāo)稱型屬性的值可以是一些符號(hào)或事物的名稱。每個(gè)值代表某種類別、編碼或狀態(tài)等。標(biāo)稱型屬性的值之間沒(méi)有順序關(guān)系。例如:設(shè)hair_color(頭發(fā)顏色)是一個(gè)描述實(shí)體人的屬性。它取值可以為黑色、棕色、淡黃色、紅色、赤褐色、灰色和白色等。因此,hair_color是標(biāo)稱屬性。

    通常,可以用數(shù)字表示這些符號(hào)或名稱,例如對(duì)于hair_color,可以指定數(shù)字0表示黑色,1表示棕色,2表示淡黃色等。

    兩個(gè)標(biāo)稱型對(duì)象i和j之間的相異度可以用簡(jiǎn)單匹配方法來(lái)計(jì)算:

    其中p為對(duì)象的屬性的個(gè)數(shù),m為對(duì)象i和j取值相同的屬性個(gè)數(shù),我們可以通過(guò)賦權(quán)重來(lái)增加m的影響,或者賦給有較多狀態(tài)的變量匹配以更大的權(quán)重。

    對(duì)于標(biāo)稱數(shù)據(jù),歐氏距離等不能直接應(yīng)用于其數(shù)據(jù)的特點(diǎn),Ralambondramy提出了一種該類型轉(zhuǎn)換成二進(jìn)制屬性的方法,用0和1表示一個(gè)屬性是否存在,并把這些二進(jìn)制屬性當(dāng)做數(shù)值來(lái)處理[11]。

    通過(guò)這種方法也很容易描述分類屬性的海明距離公式:

    2.2.2 二元型數(shù)據(jù)

    二元數(shù)據(jù)是一種特殊的標(biāo)稱數(shù)據(jù),只有二個(gè)類別或狀態(tài)(0和1)構(gòu)成,0表示該屬性不出現(xiàn),1表示出現(xiàn)。

    設(shè)x = (x1, x2, …, xn), y = (y1, y2, …, yn) 為二元數(shù)據(jù),常用0-0、0-1、1-0、1-1匹配表示xi及yi相應(yīng)的取值。其中fij表示集合{(xk, yk)| xk = i且yk = j, k = 1, 2, …, n}的基數(shù),[12]。計(jì)算二元型數(shù)據(jù)相似度的方法比較多,由于篇幅原因,只列如下幾種:

    1.簡(jiǎn)單匹配系數(shù)(對(duì)象的變量是對(duì)稱時(shí))

    2.Jaccard系數(shù)

    (11)

    3.Rogers-Tanimoto

    4.Srensen

    2.3 序數(shù)型數(shù)據(jù)

    序數(shù)型屬性變量分為分類和連續(xù)兩種。分類序數(shù)屬性與標(biāo)稱屬性類似,不同的是,分類序數(shù)值表示不同的狀態(tài),將其狀態(tài)可按一定的次序排列。例如,職稱就是一個(gè)分類序數(shù),按照助教、講師、副教授、教授的順序排列的;人的年齡段可按兒童、少年、青年、中年、老年順序排列。一個(gè)連續(xù)序數(shù)型數(shù)據(jù)看上去就像一組未知范圍的連續(xù)數(shù)據(jù),值之間的相對(duì)順序是重要的,而其實(shí)際的大小則不重要。在計(jì)算對(duì)象的相異度時(shí),對(duì)序數(shù)型數(shù)據(jù)的處理方式與區(qū)間標(biāo)度數(shù)據(jù)非常類似。

    假設(shè)f是用于描述n個(gè)對(duì)象的一組序數(shù)型屬性之一,若序數(shù)屬性f有mf個(gè)狀態(tài),關(guān)于f的相異度計(jì)算包括如下步驟:

    1)屬性f有mf個(gè)有序狀態(tài),第i個(gè)對(duì)象的屬性f的取值為xf,將屬性值xf替換為相應(yīng)的等級(jí)rf,rf{1,2,3,....,mf}。

    2)將序數(shù)屬性等級(jí)做變換,映射到區(qū)間[0,1]上。

    3)利用數(shù)值屬性的任一種距離計(jì)算公式來(lái)計(jì)算相異性。

    2.4 字符串型數(shù)據(jù)

    海明距離是專門針對(duì)字符串?dāng)?shù)據(jù)而設(shè)計(jì),用來(lái)衡量?jī)蓚€(gè)字符串之間的相似度,其計(jì)算公式如下所示:

    其中,表示兩個(gè)字符串。而,,分別表示字符串中各個(gè)位置上的字符。count( )函數(shù)用于獲取兩個(gè)字符串中對(duì)應(yīng)字符值不同的個(gè)數(shù),海明距離是分析文本等字符型數(shù)據(jù)之間相似度的常用方法,在文本分類等領(lǐng)域得到了廣泛應(yīng)用。

    2.5 文檔向量型

    通常,文檔用向量表示,向量的每個(gè)屬性代表一個(gè)特定的詞(關(guān)鍵詞)或短語(yǔ)的頻度。每個(gè)文檔都被一個(gè)所謂的詞頻向量來(lái)表示。詞頻向量通常很長(zhǎng),并且稀疏。使用這種結(jié)構(gòu)的應(yīng)用包括信息檢索、文本文檔聚類、生物學(xué)分類和基因特征映射。對(duì)于這類稀疏的數(shù)值數(shù)據(jù),常采用余弦相似性來(lái)計(jì)算兩個(gè)文檔間的相似性。

    2.6 其他非數(shù)值型數(shù)據(jù)

    在實(shí)際的應(yīng)用中,對(duì)象的某些屬性數(shù)據(jù)值與我們研究的結(jié)果毫無(wú)關(guān)系,則可忽略,不需考慮在內(nèi)。

    3 混合型數(shù)據(jù)

    當(dāng)對(duì)象的屬性是由多種數(shù)據(jù)類型組成時(shí),此時(shí)對(duì)象之間的相異度計(jì)算變得比較復(fù)雜了,目前有四種方法來(lái)處理:按單個(gè)屬性獨(dú)立計(jì)算、按類型分組獨(dú)立計(jì)算、通過(guò)相異度矩陣計(jì)算、采用摘要信息方式計(jì)算等,由于篇幅有限,摘要信息方式計(jì)算在文中就不具體列舉了。

    3.1 按單個(gè)屬性計(jì)算

    將對(duì)象的每個(gè)屬性單獨(dú)進(jìn)行考慮,按照一般正規(guī)相似度的定義方式進(jìn)行計(jì)算,也就是先度量單個(gè)屬性之間的相似度,然后利用綜合函數(shù)得出整體相似性。但是一般在計(jì)算數(shù)據(jù)相似度時(shí)會(huì)歸約到同一形式上[12]。

    3.2 按類型分組計(jì)算

    將屬性按數(shù)據(jù)類型分組,將每種數(shù)據(jù)類型的屬性分成一組,利用相應(yīng)的相似度計(jì)算公式來(lái)計(jì)算不同類型屬性的相似度,之后利用綜合函數(shù)得到整體相似度,這種方法將同種類型的屬性看成整體進(jìn)行考慮。如果這些分析得到兼容結(jié)果,則這種方法可行,但在實(shí)際的數(shù)據(jù)應(yīng)用中,每種屬性類型分別分析得到兼容結(jié)果的可能性不大,所以這種方法的可行性不大。

    3.3 通過(guò)相異度矩陣計(jì)算

    將所有的數(shù)據(jù)一起處理,只進(jìn)行一次分析。將不同類型的數(shù)據(jù)組合在單個(gè)相異度矩陣中,所有有意義的數(shù)據(jù)轉(zhuǎn)換到共同的值域區(qū)間[0, l]上[13]。

    假設(shè)數(shù)據(jù)集中包含p個(gè)不同的類型的屬性,對(duì)象i和j之間的相異度定義為:

    其中,如果或缺失(即對(duì)象i或?qū)ο骿沒(méi)有屬性f的度量值),或者,且屬性f是不對(duì)稱的二元型數(shù)據(jù),則指示項(xiàng);否則,指示項(xiàng)。

    對(duì)象i和j之間相異度的計(jì)算方式與屬性f的具體數(shù)據(jù)類型有關(guān):

    如果f是二元型數(shù)據(jù)或標(biāo)稱型數(shù)據(jù):如果,則;否則。

    如果f是標(biāo)度型數(shù)據(jù):這里的取值是屬性的所有非空缺對(duì)象。

    如果是序數(shù)型或者比例標(biāo)度型數(shù)據(jù),計(jì)算排序位和,并將作為區(qū)間標(biāo)度型數(shù)據(jù)對(duì)待。

    4 相似度計(jì)算的應(yīng)用

    4.1應(yīng)用

    對(duì)象間的相似度計(jì)算在數(shù)據(jù)挖掘中涉及面很廣,如K最近鄰分類(KNN)、聚類和異常檢測(cè)等技術(shù)。

    K最近鄰(KNN)分類算法通過(guò)計(jì)算給定的檢驗(yàn)對(duì)象與訓(xùn)練對(duì)象之間的相似度,找出檢驗(yàn)對(duì)象的K個(gè)“最近鄰”[27]?!班徑浴庇孟嗨贫葋?lái)度量。因此,如何選擇相似度計(jì)算方法在KNN最鄰近算法中對(duì)分類效果有著直接影響。若對(duì)象的屬性是數(shù)值型數(shù)據(jù),則直接用對(duì)象間的距離來(lái)度量,對(duì)每個(gè)屬性的值進(jìn)行規(guī)范化,變換到[0,1]區(qū)間,防止較大初始域的屬性權(quán)重過(guò)大而影響結(jié)果。若屬性是標(biāo)稱型數(shù)據(jù),常比較對(duì)象x1和x2中對(duì)應(yīng)屬性的值,若兩者相同者取0,反之則取1。

    聚類,也稱作無(wú)監(jiān)督分類。聚類分析的目的是把數(shù)據(jù)對(duì)象劃分成多個(gè)組或簇(即不同的類),來(lái)發(fā)現(xiàn)隱藏的、潛在于數(shù)據(jù)中的有用信息。其目標(biāo)是使得同一簇內(nèi)的對(duì)象具有較高的相似性,而簇間的對(duì)象盡可能相異。眾多聚類算法都是建立在事先假定某種相似度度量方式基礎(chǔ)上,因此聚類算法的基本出發(fā)點(diǎn)都是根據(jù)對(duì)象間相似度將對(duì)象劃分為不同的簇。

    在實(shí)際的數(shù)據(jù)挖掘應(yīng)用中,如果涉及相似性度量,首先應(yīng)分析對(duì)象的數(shù)據(jù)類型是否是單一,是數(shù)值型的數(shù)據(jù)還是是非數(shù)值型的或者是混合型的數(shù)據(jù)類型。然后根據(jù)相應(yīng)類型的相似度的計(jì)算公式進(jìn)行處理。

    4.2 計(jì)算實(shí)例

    下面用KNN算法和k-summary算法應(yīng)用的兩個(gè)實(shí)例來(lái)介紹相似度的計(jì)算。

    實(shí)例1.數(shù)據(jù)集weather如下表所示,測(cè)試樣本X=(rain,hot,normal,weak,?), k取3,下面根據(jù)KNN最鄰近方法預(yù)測(cè)該樣本的類符號(hào)。

    由于outlook的值有三個(gè),屬于標(biāo)稱型數(shù)據(jù)類型,為了便于區(qū)別它們之間的差異性,在此將其值對(duì)應(yīng)轉(zhuǎn)化為序數(shù)型數(shù)據(jù)。sunny=1,overcast=2,rain=3;同理temperature的hot=1,mild=2,cool=3。

    首先計(jì)算樣本X到14個(gè)記錄的距離(取曼哈頓距離)分別為:

    Distance(X,p1)=3,Distance(X,p2)=3,Distance(X,p3)=2,Distance(X,p4)=1.5,Distance(X,p5)=1,Distance(X,p6)=2,Distance(X,p7)=2.5,Distance(X,p8)=2.5,Distance(X,p9)=2,Distance(X,p10)=0.5,Distance(X,p11)=2.5,Distance(X,p12)=3,Distance(X,p13)=0.5,Distance(X,p14)=2.5;

    根據(jù)KNN的概念可知,K=3,在這里取3個(gè)距離最小的值,分別為Distance(X,p10)=0.5,Distance(X,p13)=0.5,Distance(X,p5)=1。所以取離樣本X最近的3個(gè)近鄰為p5,p10,p13。而這3個(gè)最鄰近對(duì)應(yīng)的類標(biāo)號(hào)都為yes,因此樣本X的類標(biāo)號(hào)被預(yù)測(cè)為yes。

    5 結(jié)論

    論文對(duì)相似性的概念進(jìn)行了介紹,然后對(duì)數(shù)據(jù)類型進(jìn)行了分類,并對(duì)不同數(shù)據(jù)類型對(duì)象的相似度的衡量方式進(jìn)行了分析。不同的數(shù)據(jù)類型具有不同的相似性處理方式,相似性的計(jì)算方法有很多,有的適用于專門的領(lǐng)域,同時(shí)也有適用于特定類型數(shù)據(jù)的限制,選擇相似性的一個(gè)重要的因素就是屬性的類型。在進(jìn)行非數(shù)值型數(shù)據(jù)時(shí),有時(shí)會(huì)因?yàn)閷⑵浠癁闃?biāo)稱類型,但是這樣的轉(zhuǎn)換并不能很好地了解屬性間的差異性,而將其進(jìn)行序數(shù)化,再進(jìn)行相似度計(jì)算,更能體現(xiàn)數(shù)據(jù)之間的差異性。

    參考文獻(xiàn):

    [1] Jiawei Han, Micheline Kamber, Jian Pei.Data Mining Concepts and Technologyes[M].3rd ed.China Machine Press,2012.

    [2] 蔣盛益,李霞,鄭琪.數(shù)據(jù)挖掘原理與實(shí)踐[M].北京:電子工業(yè)出版社,2013.

    [3] 黃彧.相似度度量的研究及其在數(shù)據(jù)挖掘中的應(yīng)用[D].福州:福建師范大學(xué),2009.

    [4] Yano Y.Associative Memory with Fully Parallel Nearest-Manhattan-Distance Search for Low-Power Real-Time Single-Chip Applications[C]. Proc. Of IEEE ASP-DAC, 2004:543-544.

    [5] Hua-Kai Chiou, Gia-Shie Liu.Multiple Objective Compromise Optimization Method to Analyze the Strategies of Nanotechnology in Taiwan[C]. Symposia and Workshops on Ubiquitous, Autonomic and Trusted Computing,2009:172-177.

    [6] de Souza R M C R , de Carvalho F A T. Dynamic clustering of interval data based on adaptive Chebyshev distances[J]. Electronics Letters, 2004, 40(11).

    [7] Ryotaro Kamimura, Osamu Uchida. Greedy Network-Growing by Minkowski Distance Functions[C]. IEEE Transaction on Neural Networks, 2004:2837-2842.

    [8] Chunhua Shen, Junae Kim, Lei Wang. Scalable Large-Margin Mahalanobis Distance Metric Learning[J].IEEE Transactions on Neural Networks, 2010, 21( 9): 1524-1530.

    [9] Sheng-Yijiang.Efficient Classification Method for Large Dataset [C]. Proceeding of the Fifth International Conference on Machine Learning and Cybernetics, Dalian, 2006:13-16.

    [10] Xing E P, Ng A Y, Jordan M I,et al. Distance metric learning, with application to clustering with side-information[C]. proc Adv Neural Inf Process Sys., 2003:505-512.

    [11] 陳韡.基于劃分的混合屬性聚類算法研究[D].長(zhǎng)沙:湖南大學(xué),2010.

    [12] 鄧冠男.聚類分析中的相似度研究[J].東北電力大學(xué)學(xué)報(bào),2013,33(1/2):156-161.

    [13] 李桂林,陳曉云.關(guān)于聚類分析中相似度的討論[J].計(jì)算機(jī)工程與應(yīng)用,2004,40(31): 64-65.

    猜你喜歡
    數(shù)據(jù)類型數(shù)據(jù)挖掘對(duì)象
    神秘來(lái)電
    睿士(2023年2期)2023-03-02 02:01:09
    詳談Java中的基本數(shù)據(jù)類型與引用數(shù)據(jù)類型
    探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
    如何理解數(shù)據(jù)結(jié)構(gòu)中的抽象數(shù)據(jù)類型
    攻略對(duì)象的心思好難猜
    意林(2018年3期)2018-03-02 15:17:24
    基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
    電力與能源(2017年6期)2017-05-14 06:19:37
    基于熵的快速掃描法的FNEA初始對(duì)象的生成方法
    區(qū)間對(duì)象族的可鎮(zhèn)定性分析
    一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
    基于GPGPU的離散數(shù)據(jù)挖掘研究
    黄片无遮挡物在线观看| 久久精品久久精品一区二区三区| 狂野欧美激情性xxxx在线观看| 亚洲精品乱码久久久久久按摩| 看非洲黑人一级黄片| 18禁在线播放成人免费| 国产成人aa在线观看| 国产欧美日韩一区二区三区在线 | 国产视频内射| 精品亚洲成国产av| 免费av不卡在线播放| 街头女战士在线观看网站| 免费久久久久久久精品成人欧美视频 | 成年女人在线观看亚洲视频| 亚洲欧美精品自产自拍| 久久久久久伊人网av| 国产成人免费无遮挡视频| 久久精品国产亚洲网站| 日韩一区二区视频免费看| h日本视频在线播放| 欧美亚洲 丝袜 人妻 在线| 国产男女内射视频| 黄色视频在线播放观看不卡| 免费少妇av软件| 五月开心婷婷网| 欧美精品一区二区大全| 欧美另类一区| 一本一本综合久久| 成年女人在线观看亚洲视频| 国产黄色免费在线视频| 欧美国产精品一级二级三级 | 只有这里有精品99| 久久人人爽av亚洲精品天堂| 天堂俺去俺来也www色官网| 午夜av观看不卡| 国产一区二区在线观看av| 久久精品久久精品一区二区三区| 国产日韩欧美视频二区| 欧美高清成人免费视频www| 欧美精品人与动牲交sv欧美| 亚洲精品国产成人久久av| 亚洲精品国产av成人精品| 熟妇人妻不卡中文字幕| 国产白丝娇喘喷水9色精品| 日本av免费视频播放| 亚洲精品国产成人久久av| 亚洲欧美一区二区三区国产| 国产精品不卡视频一区二区| 久久人妻熟女aⅴ| 一区二区av电影网| 亚洲婷婷狠狠爱综合网| 高清在线视频一区二区三区| 久久人妻熟女aⅴ| 亚洲国产欧美在线一区| 欧美精品亚洲一区二区| 91精品一卡2卡3卡4卡| 美女大奶头黄色视频| 国产欧美另类精品又又久久亚洲欧美| 中文乱码字字幕精品一区二区三区| tube8黄色片| 九九在线视频观看精品| 七月丁香在线播放| 日本欧美国产在线视频| 99久久精品一区二区三区| 边亲边吃奶的免费视频| 亚洲国产精品一区三区| 极品教师在线视频| 欧美激情极品国产一区二区三区 | 九九在线视频观看精品| 国产成人精品婷婷| 亚洲欧美一区二区三区国产| 麻豆成人av视频| 中文欧美无线码| 9色porny在线观看| 夜夜骑夜夜射夜夜干| 高清欧美精品videossex| 久久人妻熟女aⅴ| 国产精品人妻久久久久久| 日韩电影二区| 中文资源天堂在线| tube8黄色片| 亚洲人成网站在线观看播放| a级一级毛片免费在线观看| 午夜影院在线不卡| 亚洲精品一区蜜桃| 日韩电影二区| av有码第一页| 日本黄大片高清| 91aial.com中文字幕在线观看| 日韩制服骚丝袜av| 日本wwww免费看| 男女啪啪激烈高潮av片| 欧美三级亚洲精品| 久久久国产精品麻豆| 欧美精品一区二区大全| 最黄视频免费看| 自拍欧美九色日韩亚洲蝌蚪91 | 丰满少妇做爰视频| 中文在线观看免费www的网站| 黑丝袜美女国产一区| 黄片无遮挡物在线观看| 亚洲色图综合在线观看| 十八禁高潮呻吟视频 | 婷婷色综合www| 亚洲av在线观看美女高潮| 亚洲成色77777| 久久久久久伊人网av| 国内精品宾馆在线| av视频免费观看在线观看| 欧美亚洲 丝袜 人妻 在线| 亚洲精品久久午夜乱码| 极品少妇高潮喷水抽搐| 一级毛片黄色毛片免费观看视频| 免费久久久久久久精品成人欧美视频 | 少妇被粗大的猛进出69影院 | 赤兔流量卡办理| 亚洲一区二区三区欧美精品| 久久ye,这里只有精品| 久久精品久久久久久久性| 亚洲在久久综合| 如日韩欧美国产精品一区二区三区 | 91成人精品电影| 日本av免费视频播放| 蜜臀久久99精品久久宅男| 永久免费av网站大全| 少妇人妻 视频| 国产高清国产精品国产三级| 毛片一级片免费看久久久久| 国产淫片久久久久久久久| 少妇熟女欧美另类| 伊人久久国产一区二区| 在线精品无人区一区二区三| 亚洲精品乱码久久久久久按摩| 精品一区二区免费观看| 观看美女的网站| 亚洲av免费高清在线观看| 高清毛片免费看| 国产成人一区二区在线| 女性生殖器流出的白浆| av播播在线观看一区| 久久久精品94久久精品| av不卡在线播放| 欧美3d第一页| 赤兔流量卡办理| 波野结衣二区三区在线| 人人妻人人添人人爽欧美一区卜| 男人和女人高潮做爰伦理| 建设人人有责人人尽责人人享有的| 色视频www国产| 国产美女午夜福利| 精品人妻一区二区三区麻豆| 国产欧美日韩精品一区二区| 看十八女毛片水多多多| 夜夜看夜夜爽夜夜摸| 日日啪夜夜撸| 爱豆传媒免费全集在线观看| 亚洲av中文av极速乱| 欧美xxⅹ黑人| 国产精品国产三级国产av玫瑰| 欧美国产精品一级二级三级 | 久久久欧美国产精品| av有码第一页| 午夜av观看不卡| 国产精品女同一区二区软件| 男人和女人高潮做爰伦理| 国产精品久久久久久久久免| 久久久久久久久久久丰满| 岛国毛片在线播放| 亚洲精品乱码久久久久久按摩| 亚洲内射少妇av| 一区二区三区免费毛片| 特大巨黑吊av在线直播| 亚洲欧美成人精品一区二区| 成人毛片60女人毛片免费| 亚洲精品国产成人久久av| 久久久久久久国产电影| 肉色欧美久久久久久久蜜桃| 成人特级av手机在线观看| 欧美成人精品欧美一级黄| 伦理电影大哥的女人| 亚洲怡红院男人天堂| 久久国内精品自在自线图片| 免费看光身美女| 亚洲伊人久久精品综合| 乱系列少妇在线播放| 久久久久国产网址| 国产精品免费大片| 国产无遮挡羞羞视频在线观看| 国产男女超爽视频在线观看| 欧美性感艳星| 中文字幕人妻熟人妻熟丝袜美| 国产女主播在线喷水免费视频网站| 中国国产av一级| 欧美 日韩 精品 国产| 日本免费在线观看一区| 免费观看性生交大片5| 久久久a久久爽久久v久久| 只有这里有精品99| 婷婷色综合www| 亚洲国产精品999| 亚洲伊人久久精品综合| 妹子高潮喷水视频| 制服丝袜香蕉在线| 王馨瑶露胸无遮挡在线观看| 人妻 亚洲 视频| 日产精品乱码卡一卡2卡三| 啦啦啦视频在线资源免费观看| 久久久久久久亚洲中文字幕| 国产一区二区在线观看日韩| 下体分泌物呈黄色| 免费av不卡在线播放| 亚洲欧洲精品一区二区精品久久久 | 美女xxoo啪啪120秒动态图| 国产91av在线免费观看| a级毛片在线看网站| 久久99热这里只频精品6学生| 老女人水多毛片| 岛国毛片在线播放| 全区人妻精品视频| 亚洲精品乱码久久久v下载方式| 美女中出高潮动态图| 三级国产精品欧美在线观看| 搡女人真爽免费视频火全软件| 国产亚洲91精品色在线| 久久午夜福利片| 欧美成人午夜免费资源| 在线天堂最新版资源| 国内揄拍国产精品人妻在线| 伦理电影免费视频| 国产乱来视频区| 在线播放无遮挡| 亚洲精品视频女| 日韩av不卡免费在线播放| 一区在线观看完整版| 午夜久久久在线观看| 嫩草影院新地址| 成年av动漫网址| 九草在线视频观看| 3wmmmm亚洲av在线观看| 成人漫画全彩无遮挡| 久久久久久久亚洲中文字幕| 亚洲国产av新网站| 青春草国产在线视频| 插逼视频在线观看| 久久99热这里只频精品6学生| 国产淫语在线视频| 亚洲av男天堂| 亚洲精品乱码久久久v下载方式| 日日啪夜夜撸| 国产精品99久久99久久久不卡 | 性高湖久久久久久久久免费观看| 午夜免费鲁丝| 日韩成人伦理影院| 一级片'在线观看视频| 久久久久久久国产电影| av播播在线观看一区| 99久国产av精品国产电影| h视频一区二区三区| 麻豆成人av视频| 啦啦啦啦在线视频资源| 精品亚洲成国产av| 欧美+日韩+精品| 看非洲黑人一级黄片| 18禁在线无遮挡免费观看视频| av在线app专区| 制服丝袜香蕉在线| 一级a做视频免费观看| 日韩 亚洲 欧美在线| 成年女人在线观看亚洲视频| 婷婷色麻豆天堂久久| 少妇裸体淫交视频免费看高清| 男人狂女人下面高潮的视频| 久久鲁丝午夜福利片| 少妇裸体淫交视频免费看高清| 春色校园在线视频观看| 久久影院123| 老司机影院成人| 在线观看一区二区三区激情| 国产精品久久久久久久电影| 午夜激情久久久久久久| 水蜜桃什么品种好| 黄色配什么色好看| 在线观看三级黄色| 国产精品一区www在线观看| 伊人久久精品亚洲午夜| 男人舔奶头视频| 国产成人精品婷婷| 国产淫片久久久久久久久| 少妇被粗大的猛进出69影院 | 久久人人爽av亚洲精品天堂| 亚洲精品一区蜜桃| 成年美女黄网站色视频大全免费 | 亚洲人成网站在线播| 日韩av在线免费看完整版不卡| 国产免费一区二区三区四区乱码| 国产成人精品福利久久| 国产精品女同一区二区软件| 国产精品人妻久久久久久| 国产精品人妻久久久影院| 免费黄网站久久成人精品| 久久99蜜桃精品久久| 五月天丁香电影| 黑丝袜美女国产一区| 91在线精品国自产拍蜜月| 日日摸夜夜添夜夜添av毛片| 精品一区在线观看国产| 久热这里只有精品99| 国产男人的电影天堂91| 97在线人人人人妻| 少妇人妻 视频| 韩国高清视频一区二区三区| 久久99蜜桃精品久久| 97精品久久久久久久久久精品| 最近中文字幕2019免费版| 天堂8中文在线网| 免费人成在线观看视频色| 女人精品久久久久毛片| 亚洲国产精品国产精品| 一区二区av电影网| 亚洲精品一区蜜桃| 七月丁香在线播放| av在线老鸭窝| 菩萨蛮人人尽说江南好唐韦庄| 国产亚洲一区二区精品| 伊人亚洲综合成人网| 丰满少妇做爰视频| 全区人妻精品视频| 精品卡一卡二卡四卡免费| 在线精品无人区一区二区三| 天堂8中文在线网| 一级毛片aaaaaa免费看小| 国产黄频视频在线观看| 日韩强制内射视频| 久久久久久久久久久丰满| 久久99一区二区三区| 久久青草综合色| 久久精品熟女亚洲av麻豆精品| 街头女战士在线观看网站| 国产精品嫩草影院av在线观看| 久久av网站| 精品久久久久久电影网| 亚洲欧美日韩另类电影网站| 精品国产一区二区三区久久久樱花| 99九九线精品视频在线观看视频| 精品亚洲成a人片在线观看| 日本-黄色视频高清免费观看| 亚洲综合色惰| 精品一区二区三区视频在线| 女人久久www免费人成看片| 欧美精品国产亚洲| 亚洲av综合色区一区| 国产男女超爽视频在线观看| 丰满乱子伦码专区| 精品亚洲成a人片在线观看| 久久99蜜桃精品久久| 久久午夜福利片| 80岁老熟妇乱子伦牲交| 少妇人妻 视频| 午夜激情福利司机影院| 国产av精品麻豆| 一级毛片久久久久久久久女| 久久精品国产a三级三级三级| 成人毛片60女人毛片免费| 男女边吃奶边做爰视频| 高清毛片免费看| 久久久午夜欧美精品| 国模一区二区三区四区视频| 久久亚洲国产成人精品v| 女人精品久久久久毛片| 国产一级毛片在线| 亚洲第一区二区三区不卡| 亚洲国产最新在线播放| 国产有黄有色有爽视频| 女性被躁到高潮视频| 国产精品久久久久久久电影| 日本欧美国产在线视频| 纵有疾风起免费观看全集完整版| 乱系列少妇在线播放| 交换朋友夫妻互换小说| 丝袜脚勾引网站| 成人毛片a级毛片在线播放| 国产免费一区二区三区四区乱码| 插逼视频在线观看| 国内精品宾馆在线| 日韩av不卡免费在线播放| 亚洲精品成人av观看孕妇| 这个男人来自地球电影免费观看 | 日本欧美视频一区| 亚洲伊人久久精品综合| 久热久热在线精品观看| 夫妻性生交免费视频一级片| 激情五月婷婷亚洲| 久久精品国产亚洲av天美| 夫妻性生交免费视频一级片| 亚洲av男天堂| 欧美丝袜亚洲另类| 中文字幕人妻丝袜制服| 亚洲av电影在线观看一区二区三区| 中文字幕免费在线视频6| 国产永久视频网站| 亚洲高清免费不卡视频| 午夜福利,免费看| 五月玫瑰六月丁香| 中文字幕免费在线视频6| 欧美bdsm另类| 老女人水多毛片| 啦啦啦在线观看免费高清www| h视频一区二区三区| 国国产精品蜜臀av免费| 欧美变态另类bdsm刘玥| 精品午夜福利在线看| 狠狠精品人妻久久久久久综合| 91久久精品国产一区二区成人| 女的被弄到高潮叫床怎么办| 国产探花极品一区二区| 亚洲自偷自拍三级| 欧美成人精品欧美一级黄| 伊人亚洲综合成人网| 插阴视频在线观看视频| 免费看光身美女| 狂野欧美激情性xxxx在线观看| 日本欧美视频一区| 亚洲欧美成人综合另类久久久| 王馨瑶露胸无遮挡在线观看| 久久久久精品性色| 久久久久久久久久成人| 亚洲精品国产色婷婷电影| av专区在线播放| 国产男人的电影天堂91| 国产一区有黄有色的免费视频| 国产午夜精品一二区理论片| 91aial.com中文字幕在线观看| 久久久久国产精品人妻一区二区| 高清午夜精品一区二区三区| 啦啦啦视频在线资源免费观看| 国产在线视频一区二区| 天美传媒精品一区二区| 久久这里有精品视频免费| 国产亚洲欧美精品永久| 少妇精品久久久久久久| 一区二区av电影网| 在线免费观看不下载黄p国产| 夫妻性生交免费视频一级片| 日本爱情动作片www.在线观看| 在线观看免费视频网站a站| 国产精品秋霞免费鲁丝片| 99热这里只有是精品在线观看| 日韩人妻高清精品专区| 人妻人人澡人人爽人人| 一级毛片aaaaaa免费看小| 欧美 亚洲 国产 日韩一| 国产成人精品久久久久久| 国产精品嫩草影院av在线观看| 久久人妻熟女aⅴ| 亚洲精品日本国产第一区| 免费观看av网站的网址| 亚洲精品日本国产第一区| 22中文网久久字幕| 久久精品久久久久久久性| 26uuu在线亚洲综合色| 久久久久久久久久久丰满| 一本色道久久久久久精品综合| 国产欧美日韩精品一区二区| 丰满乱子伦码专区| 九草在线视频观看| 2021少妇久久久久久久久久久| 日韩人妻高清精品专区| 国产精品伦人一区二区| 亚洲综合色惰| 国产爽快片一区二区三区| 街头女战士在线观看网站| 三级国产精品片| 欧美精品人与动牲交sv欧美| 日本欧美国产在线视频| 波野结衣二区三区在线| 99九九在线精品视频 | 高清欧美精品videossex| 亚洲精品自拍成人| 水蜜桃什么品种好| 91午夜精品亚洲一区二区三区| 日韩 亚洲 欧美在线| 欧美精品一区二区大全| 色婷婷久久久亚洲欧美| 全区人妻精品视频| 亚洲四区av| 国产女主播在线喷水免费视频网站| 国产亚洲一区二区精品| 女人精品久久久久毛片| 91精品一卡2卡3卡4卡| 国产av国产精品国产| 欧美激情极品国产一区二区三区 | 久久99热这里只频精品6学生| 欧美区成人在线视频| 久久久久国产精品人妻一区二区| 26uuu在线亚洲综合色| 精品久久久噜噜| 久久午夜综合久久蜜桃| 大陆偷拍与自拍| 乱系列少妇在线播放| 国产一区二区在线观看日韩| 欧美97在线视频| 天美传媒精品一区二区| 亚洲欧美精品自产自拍| 国产精品伦人一区二区| 精品午夜福利在线看| 伦精品一区二区三区| 亚洲综合精品二区| 久久99蜜桃精品久久| 国产日韩欧美亚洲二区| 国产亚洲91精品色在线| av视频免费观看在线观看| 少妇猛男粗大的猛烈进出视频| 永久免费av网站大全| 香蕉精品网在线| xxx大片免费视频| 久久毛片免费看一区二区三区| 青春草亚洲视频在线观看| 黑丝袜美女国产一区| 免费黄色在线免费观看| 亚洲欧洲国产日韩| 成人综合一区亚洲| 一区二区三区四区激情视频| 边亲边吃奶的免费视频| 韩国高清视频一区二区三区| 18禁裸乳无遮挡动漫免费视频| 91精品一卡2卡3卡4卡| 亚洲国产最新在线播放| 亚洲精品自拍成人| 新久久久久国产一级毛片| 久久午夜综合久久蜜桃| 高清午夜精品一区二区三区| 国产69精品久久久久777片| 久久久久久久久大av| 欧美老熟妇乱子伦牲交| 国产免费一区二区三区四区乱码| 婷婷色麻豆天堂久久| 极品少妇高潮喷水抽搐| 欧美性感艳星| 制服丝袜香蕉在线| 女的被弄到高潮叫床怎么办| 亚洲内射少妇av| 女性生殖器流出的白浆| 久久精品夜色国产| 亚洲av男天堂| 亚洲,欧美,日韩| 亚洲精品国产av成人精品| 久久99蜜桃精品久久| 久久久久久久亚洲中文字幕| 最近中文字幕高清免费大全6| 精品熟女少妇av免费看| 亚洲国产欧美日韩在线播放 | 日本黄色日本黄色录像| 国产免费一区二区三区四区乱码| 国产极品天堂在线| 新久久久久国产一级毛片| 美女xxoo啪啪120秒动态图| 欧美三级亚洲精品| 国产精品蜜桃在线观看| 97在线视频观看| 亚洲经典国产精华液单| 国产精品国产三级国产专区5o| 丰满人妻一区二区三区视频av| 亚洲久久久国产精品| av不卡在线播放| 精品久久久久久久久亚洲| 男人添女人高潮全过程视频| 久久韩国三级中文字幕| 久久免费观看电影| videos熟女内射| 少妇裸体淫交视频免费看高清| 久久99一区二区三区| 蜜桃久久精品国产亚洲av| 噜噜噜噜噜久久久久久91| 黑丝袜美女国产一区| 妹子高潮喷水视频| 精品久久久久久久久av| 五月开心婷婷网| 亚洲欧美清纯卡通| 男女啪啪激烈高潮av片| 免费看av在线观看网站| 最近中文字幕2019免费版| 亚洲av.av天堂| 自线自在国产av| 日本wwww免费看| 久久久a久久爽久久v久久| 国产男女内射视频| 中国美白少妇内射xxxbb| 日本爱情动作片www.在线观看| 99视频精品全部免费 在线| 色视频www国产| 一边亲一边摸免费视频| 久久久国产精品麻豆| 久久精品国产亚洲网站| 大码成人一级视频| 黄色配什么色好看| 秋霞在线观看毛片| 777米奇影视久久| 精品酒店卫生间| 久久精品夜色国产| 97超视频在线观看视频| 国产在线免费精品| 三级国产精品片| 国产亚洲欧美精品永久| 国产男女超爽视频在线观看| 国产精品久久久久久精品古装| 国产亚洲91精品色在线| av天堂中文字幕网| 国产一级毛片在线| 亚洲av福利一区| 国产又色又爽无遮挡免| 免费观看无遮挡的男女| 一个人免费看片子| 交换朋友夫妻互换小说| 久久精品国产亚洲网站| 五月伊人婷婷丁香|