• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    相似度計(jì)算及其在數(shù)據(jù)挖掘中的應(yīng)用

    2016-06-29 19:16:55李俊磊滕少華
    電腦知識(shí)與技術(shù) 2016年13期
    關(guān)鍵詞:數(shù)據(jù)類型數(shù)據(jù)挖掘對(duì)象

    李俊磊 滕少華

    摘要:相似度是描述兩個(gè)對(duì)象之間相似程度的一種度量,依據(jù)對(duì)象不同,相似度計(jì)算方法亦不同。相似度計(jì)算被廣泛應(yīng)用于數(shù)據(jù)挖掘算法中,它是對(duì)象分類的基礎(chǔ)。該文將數(shù)據(jù)對(duì)象劃分為數(shù)值型、非數(shù)值型和混合型三種,并根據(jù)數(shù)據(jù)對(duì)象的類型,探討了相應(yīng)的相似度計(jì)算方法,最后,通過(guò)實(shí)例描述了相似度計(jì)算在數(shù)據(jù)挖掘中的應(yīng)用。

    關(guān)鍵詞:對(duì)象;相似度計(jì)算;數(shù)據(jù)挖掘;數(shù)據(jù)類型

    中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)13-0014-04

    Abstract: The Similarity is a measure of similarity between two objects, according to different objects, similarity calculation method is also different. Similarity calculation is widely used in data classification, is the basis for object classification. In this paper, the data objects were divided into three kinds: numeric type, non-numeric type and mixed type. And the similarity calculation methods of different types are discussed. Finally, we illustrated the application of similarity in the data mining.

    Key words: object; similarity calculation; data mining; data type

    伴隨數(shù)據(jù)挖掘技術(shù)的應(yīng)用領(lǐng)域發(fā)展,對(duì)象之間的相似性計(jì)算已成為一個(gè)非常重要的研究課題。相似度度量是衡量對(duì)象間相互關(guān)系強(qiáng)弱、聯(lián)系緊密程度的重要手段。

    在數(shù)據(jù)挖掘的方法中,諸如數(shù)據(jù)分類和預(yù)測(cè)[1-2]、數(shù)據(jù)聚類[1-2]、關(guān)聯(lián)分析[1-2]、序列模式[1-2]、依賴關(guān)系與依賴模型[1-2]、異常檢測(cè)和趨勢(shì)分析[1-2]等都離不開(kāi)對(duì)象之間的相似度分析。尤其是在考察對(duì)象間同異度關(guān)系時(shí),相似度度量和計(jì)算方法將直接影響最終的數(shù)據(jù)挖掘結(jié)果,相似度計(jì)算又是衡量對(duì)象間差異的基礎(chǔ),在分類應(yīng)用中,相似度計(jì)算是分類的依據(jù)。因而,依據(jù)不同的實(shí)際應(yīng)用和數(shù)據(jù)對(duì)象,研究相似度計(jì)算方法,對(duì)數(shù)據(jù)分類有重要意義。

    首先描述了相似度概念,進(jìn)而將數(shù)據(jù)對(duì)象分為三種類型:數(shù)值型、非數(shù)值型和混合型,然后按不同數(shù)據(jù)對(duì)象分別給出了相應(yīng)的相似度計(jì)算公式,最后通過(guò)實(shí)例對(duì)相似度計(jì)算進(jìn)行了說(shuō)明。

    1 相似度概念

    在數(shù)據(jù)挖掘、模式識(shí)別和機(jī)器學(xué)習(xí)等計(jì)算機(jī)應(yīng)用領(lǐng)域中,兩個(gè)對(duì)象的相似度是描述這兩個(gè)對(duì)象之間相似程度的一種度量,兩者越相似,它們的相似度就越高,相似度是一個(gè)非負(fù)數(shù)值,其值介于0和1之間[2]。數(shù)據(jù)挖掘的很多算法都涉及計(jì)算對(duì)象間的相似度,相似度計(jì)算方法依賴于數(shù)據(jù)對(duì)象的類型,數(shù)據(jù)對(duì)象的類型不同其相似度計(jì)算方法不同。例如,數(shù)值型數(shù)據(jù)的相似度可用歐氏空間的距離來(lái)描述其鄰近程度;兩個(gè)標(biāo)稱型數(shù)據(jù)對(duì)象的相似度與用來(lái)計(jì)算相似度的屬性的值域有關(guān)。

    依據(jù)參與相似度計(jì)算的數(shù)據(jù)類型,本文將數(shù)據(jù)對(duì)象分為數(shù)值型、非數(shù)值型和混合型[1-2]三種。

    1.1 數(shù)值型

    數(shù)值型數(shù)據(jù)被用來(lái)描述連續(xù)型或定量型數(shù)據(jù),即兩個(gè)不同數(shù)值之間有無(wú)窮多個(gè)數(shù)值。使用實(shí)數(shù)或度量衡單位計(jì)量相似度值,如溫度、身高等。數(shù)值型量可分為區(qū)間標(biāo)度量和比例標(biāo)度量,其中區(qū)間標(biāo)度量是一個(gè)線性的標(biāo)度量,而比例標(biāo)度量一般是非線性的。

    1.2 非數(shù)值型

    其取值是定性的、而非定量的數(shù)據(jù)。如人的性別,成績(jī)優(yōu)良等級(jí)等。通常這類對(duì)象屬性的取值可通過(guò)有限個(gè)狀態(tài)(字母/序數(shù))來(lái)描述。非數(shù)值型數(shù)據(jù)又可分為標(biāo)稱型、二元和序數(shù)型數(shù)據(jù)等。標(biāo)稱型數(shù)據(jù)之間是無(wú)序的,序數(shù)型是有序的。

    1.3 混合型

    由數(shù)值型數(shù)據(jù)和非數(shù)值型數(shù)據(jù)混合組成。

    2 相似度計(jì)算

    2.1 數(shù)值型數(shù)據(jù)

    數(shù)值型數(shù)據(jù)可分為區(qū)間標(biāo)度型和比例數(shù)值型數(shù)據(jù)。

    2.1.1 區(qū)間標(biāo)度型數(shù)據(jù)

    區(qū)間標(biāo)度型:是一個(gè)粗略線性標(biāo)度的連續(xù)量,這種量的值是有序的,可以為正數(shù)、負(fù)數(shù)或0。典型的例子有重量、高度、大氣溫度等。具體計(jì)算時(shí),區(qū)間型數(shù)據(jù)的相似度通常轉(zhuǎn)換成相異度計(jì)算。常用的計(jì)算方法是先將這種量標(biāo)準(zhǔn)化,消除度量單位對(duì)分析結(jié)果的影響,然后,采用距離來(lái)計(jì)算對(duì)象間的相異度。距離是一個(gè)非負(fù)數(shù),距離的大小代表著2個(gè)對(duì)象之間的差異程度,距離越大,2個(gè)對(duì)象相異度就越大,距離越小,2個(gè)對(duì)象之間的相似度越高。這里給出常見(jiàn)的相異度計(jì)算方法[3]。

    設(shè) p=(p1, p2, …, pn)T, q=(q1, q2, …, qn)T 為N維空間中的兩個(gè)對(duì)象,pi是對(duì)象p對(duì)應(yīng)的第i個(gè)屬性所取的值,是對(duì)象P的所有屬性值的平均值。qi是對(duì)象q對(duì)應(yīng)的第i個(gè)屬性所取的值,是對(duì)象q的所有屬性值的平均值。

    曼哈頓、歐氏和閔可夫斯基距離等計(jì)算公式分別如下:

    1)曼哈頓距離

    曼哈頓距離又稱為城市街區(qū)距離,是使用在幾何度量空間的幾何學(xué)用語(yǔ),用以表明2個(gè)點(diǎn)在標(biāo)準(zhǔn)坐標(biāo)系上的絕對(duì)軸距總和[4],對(duì)n維空間的曼哈頓距離表示如下:

    2個(gè)n維向量p(p1, p2, …, pn)與q(q1, q2, …, qn)間的曼哈頓距離:

    2)歐氏距離

    歐式距離也稱為歐幾里得距離,是通常采用的距離,它是在n維空間中2個(gè)點(diǎn)之間的真實(shí)距離,用來(lái)表示各個(gè)數(shù)據(jù)對(duì)象之間的距離。歐式距離與對(duì)象的量綱有關(guān),從統(tǒng)計(jì)的角度看,使用歐氏距離要求各個(gè)坐標(biāo)對(duì)歐式距離的貢獻(xiàn)是同等的且變差大小也是相同的[5]。

    2個(gè)n維向量p(p1, p2, …, pn)與q(q1, q2, …, qn)間的歐氏距離:

    (2)

    3)切比雪夫距離

    切比雪夫距離是一種最大距離。在向量空間中,2個(gè)向量間的切比雪夫距離,就是將其沿著任意坐標(biāo)尺寸的最大值[6]。二維和n維空間的切比雪夫距離如下:

    2個(gè)n維向量空間向量p(p1, p2, …, pn)與q(q1, q2, …, qn)間的切比雪夫距離:

    4)閔可夫斯基距離

    閔科夫斯基距離是歐氏距離和曼哈頓距離的推廣[7],定義如下:

    當(dāng)x=1時(shí),為曼哈頓距離,當(dāng)x=2時(shí)為歐氏距離。

    5)馬氏距離

    馬氏距離 [3]是一種常用的距離度量方式,能夠充分考慮模式特征參數(shù)的大小以及特征間的相關(guān)性,在模式識(shí)別中其性能通常比歐式距離好。馬氏距離是歐式距離的改進(jìn),是歐式空間中非均勻分布的歸一化距離,它對(duì)于一切線性變換是不變的[8]。

    6)Canberra距離

    Canberra距離是一種相對(duì)馬氏距離,不受量綱的影響,同樣沒(méi)有考慮多重相關(guān)性,Canberra距離對(duì)微小變化很敏感[9]。

    7)相關(guān)系數(shù)

    相關(guān)系數(shù)是對(duì)向量做標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)化后的夾角余弦,表示兩個(gè)向量的線性相關(guān)程度[10]。當(dāng)兩個(gè)向量方向相近時(shí),夾角余弦值越大,反之越小。特別地,當(dāng)兩個(gè)向量平行時(shí),夾角余弦值為1,而正交時(shí)余弦值為0。

    2.1.2 比例型數(shù)據(jù)

    比例型數(shù)據(jù)一般是通過(guò)非線性尺度取得的測(cè)量值。計(jì)算這類對(duì)象的相似度有三種方法:轉(zhuǎn)換為區(qū)間標(biāo)度型數(shù)據(jù)、轉(zhuǎn)換為連續(xù)的序數(shù)數(shù)據(jù)、取對(duì)數(shù)。

    2.2 非數(shù)值型數(shù)據(jù)

    許多數(shù)據(jù)挖掘方法只能處理數(shù)值型數(shù)據(jù),因此需要將非數(shù)值型數(shù)據(jù)轉(zhuǎn)為數(shù)值型數(shù)據(jù)??山⒎菙?shù)值型量的不同狀態(tài)值或利用離散數(shù)據(jù)建立其與對(duì)象之間的對(duì)照表。非數(shù)值型數(shù)據(jù)又可細(xì)分為標(biāo)稱數(shù)據(jù)、二元數(shù)據(jù)和序數(shù)型數(shù)據(jù)等。

    2.2.1 標(biāo)稱數(shù)據(jù)

    標(biāo)稱數(shù)據(jù)又稱為類別數(shù)據(jù),標(biāo)稱型屬性的值可以是一些符號(hào)或事物的名稱。每個(gè)值代表某種類別、編碼或狀態(tài)等。標(biāo)稱型屬性的值之間沒(méi)有順序關(guān)系。例如:設(shè)hair_color(頭發(fā)顏色)是一個(gè)描述實(shí)體人的屬性。它取值可以為黑色、棕色、淡黃色、紅色、赤褐色、灰色和白色等。因此,hair_color是標(biāo)稱屬性。

    通常,可以用數(shù)字表示這些符號(hào)或名稱,例如對(duì)于hair_color,可以指定數(shù)字0表示黑色,1表示棕色,2表示淡黃色等。

    兩個(gè)標(biāo)稱型對(duì)象i和j之間的相異度可以用簡(jiǎn)單匹配方法來(lái)計(jì)算:

    其中p為對(duì)象的屬性的個(gè)數(shù),m為對(duì)象i和j取值相同的屬性個(gè)數(shù),我們可以通過(guò)賦權(quán)重來(lái)增加m的影響,或者賦給有較多狀態(tài)的變量匹配以更大的權(quán)重。

    對(duì)于標(biāo)稱數(shù)據(jù),歐氏距離等不能直接應(yīng)用于其數(shù)據(jù)的特點(diǎn),Ralambondramy提出了一種該類型轉(zhuǎn)換成二進(jìn)制屬性的方法,用0和1表示一個(gè)屬性是否存在,并把這些二進(jìn)制屬性當(dāng)做數(shù)值來(lái)處理[11]。

    通過(guò)這種方法也很容易描述分類屬性的海明距離公式:

    2.2.2 二元型數(shù)據(jù)

    二元數(shù)據(jù)是一種特殊的標(biāo)稱數(shù)據(jù),只有二個(gè)類別或狀態(tài)(0和1)構(gòu)成,0表示該屬性不出現(xiàn),1表示出現(xiàn)。

    設(shè)x = (x1, x2, …, xn), y = (y1, y2, …, yn) 為二元數(shù)據(jù),常用0-0、0-1、1-0、1-1匹配表示xi及yi相應(yīng)的取值。其中fij表示集合{(xk, yk)| xk = i且yk = j, k = 1, 2, …, n}的基數(shù),[12]。計(jì)算二元型數(shù)據(jù)相似度的方法比較多,由于篇幅原因,只列如下幾種:

    1.簡(jiǎn)單匹配系數(shù)(對(duì)象的變量是對(duì)稱時(shí))

    2.Jaccard系數(shù)

    (11)

    3.Rogers-Tanimoto

    4.Srensen

    2.3 序數(shù)型數(shù)據(jù)

    序數(shù)型屬性變量分為分類和連續(xù)兩種。分類序數(shù)屬性與標(biāo)稱屬性類似,不同的是,分類序數(shù)值表示不同的狀態(tài),將其狀態(tài)可按一定的次序排列。例如,職稱就是一個(gè)分類序數(shù),按照助教、講師、副教授、教授的順序排列的;人的年齡段可按兒童、少年、青年、中年、老年順序排列。一個(gè)連續(xù)序數(shù)型數(shù)據(jù)看上去就像一組未知范圍的連續(xù)數(shù)據(jù),值之間的相對(duì)順序是重要的,而其實(shí)際的大小則不重要。在計(jì)算對(duì)象的相異度時(shí),對(duì)序數(shù)型數(shù)據(jù)的處理方式與區(qū)間標(biāo)度數(shù)據(jù)非常類似。

    假設(shè)f是用于描述n個(gè)對(duì)象的一組序數(shù)型屬性之一,若序數(shù)屬性f有mf個(gè)狀態(tài),關(guān)于f的相異度計(jì)算包括如下步驟:

    1)屬性f有mf個(gè)有序狀態(tài),第i個(gè)對(duì)象的屬性f的取值為xf,將屬性值xf替換為相應(yīng)的等級(jí)rf,rf{1,2,3,....,mf}。

    2)將序數(shù)屬性等級(jí)做變換,映射到區(qū)間[0,1]上。

    3)利用數(shù)值屬性的任一種距離計(jì)算公式來(lái)計(jì)算相異性。

    2.4 字符串型數(shù)據(jù)

    海明距離是專門針對(duì)字符串?dāng)?shù)據(jù)而設(shè)計(jì),用來(lái)衡量?jī)蓚€(gè)字符串之間的相似度,其計(jì)算公式如下所示:

    其中,表示兩個(gè)字符串。而,,分別表示字符串中各個(gè)位置上的字符。count( )函數(shù)用于獲取兩個(gè)字符串中對(duì)應(yīng)字符值不同的個(gè)數(shù),海明距離是分析文本等字符型數(shù)據(jù)之間相似度的常用方法,在文本分類等領(lǐng)域得到了廣泛應(yīng)用。

    2.5 文檔向量型

    通常,文檔用向量表示,向量的每個(gè)屬性代表一個(gè)特定的詞(關(guān)鍵詞)或短語(yǔ)的頻度。每個(gè)文檔都被一個(gè)所謂的詞頻向量來(lái)表示。詞頻向量通常很長(zhǎng),并且稀疏。使用這種結(jié)構(gòu)的應(yīng)用包括信息檢索、文本文檔聚類、生物學(xué)分類和基因特征映射。對(duì)于這類稀疏的數(shù)值數(shù)據(jù),常采用余弦相似性來(lái)計(jì)算兩個(gè)文檔間的相似性。

    2.6 其他非數(shù)值型數(shù)據(jù)

    在實(shí)際的應(yīng)用中,對(duì)象的某些屬性數(shù)據(jù)值與我們研究的結(jié)果毫無(wú)關(guān)系,則可忽略,不需考慮在內(nèi)。

    3 混合型數(shù)據(jù)

    當(dāng)對(duì)象的屬性是由多種數(shù)據(jù)類型組成時(shí),此時(shí)對(duì)象之間的相異度計(jì)算變得比較復(fù)雜了,目前有四種方法來(lái)處理:按單個(gè)屬性獨(dú)立計(jì)算、按類型分組獨(dú)立計(jì)算、通過(guò)相異度矩陣計(jì)算、采用摘要信息方式計(jì)算等,由于篇幅有限,摘要信息方式計(jì)算在文中就不具體列舉了。

    3.1 按單個(gè)屬性計(jì)算

    將對(duì)象的每個(gè)屬性單獨(dú)進(jìn)行考慮,按照一般正規(guī)相似度的定義方式進(jìn)行計(jì)算,也就是先度量單個(gè)屬性之間的相似度,然后利用綜合函數(shù)得出整體相似性。但是一般在計(jì)算數(shù)據(jù)相似度時(shí)會(huì)歸約到同一形式上[12]。

    3.2 按類型分組計(jì)算

    將屬性按數(shù)據(jù)類型分組,將每種數(shù)據(jù)類型的屬性分成一組,利用相應(yīng)的相似度計(jì)算公式來(lái)計(jì)算不同類型屬性的相似度,之后利用綜合函數(shù)得到整體相似度,這種方法將同種類型的屬性看成整體進(jìn)行考慮。如果這些分析得到兼容結(jié)果,則這種方法可行,但在實(shí)際的數(shù)據(jù)應(yīng)用中,每種屬性類型分別分析得到兼容結(jié)果的可能性不大,所以這種方法的可行性不大。

    3.3 通過(guò)相異度矩陣計(jì)算

    將所有的數(shù)據(jù)一起處理,只進(jìn)行一次分析。將不同類型的數(shù)據(jù)組合在單個(gè)相異度矩陣中,所有有意義的數(shù)據(jù)轉(zhuǎn)換到共同的值域區(qū)間[0, l]上[13]。

    假設(shè)數(shù)據(jù)集中包含p個(gè)不同的類型的屬性,對(duì)象i和j之間的相異度定義為:

    其中,如果或缺失(即對(duì)象i或?qū)ο骿沒(méi)有屬性f的度量值),或者,且屬性f是不對(duì)稱的二元型數(shù)據(jù),則指示項(xiàng);否則,指示項(xiàng)。

    對(duì)象i和j之間相異度的計(jì)算方式與屬性f的具體數(shù)據(jù)類型有關(guān):

    如果f是二元型數(shù)據(jù)或標(biāo)稱型數(shù)據(jù):如果,則;否則。

    如果f是標(biāo)度型數(shù)據(jù):這里的取值是屬性的所有非空缺對(duì)象。

    如果是序數(shù)型或者比例標(biāo)度型數(shù)據(jù),計(jì)算排序位和,并將作為區(qū)間標(biāo)度型數(shù)據(jù)對(duì)待。

    4 相似度計(jì)算的應(yīng)用

    4.1應(yīng)用

    對(duì)象間的相似度計(jì)算在數(shù)據(jù)挖掘中涉及面很廣,如K最近鄰分類(KNN)、聚類和異常檢測(cè)等技術(shù)。

    K最近鄰(KNN)分類算法通過(guò)計(jì)算給定的檢驗(yàn)對(duì)象與訓(xùn)練對(duì)象之間的相似度,找出檢驗(yàn)對(duì)象的K個(gè)“最近鄰”[27]?!班徑浴庇孟嗨贫葋?lái)度量。因此,如何選擇相似度計(jì)算方法在KNN最鄰近算法中對(duì)分類效果有著直接影響。若對(duì)象的屬性是數(shù)值型數(shù)據(jù),則直接用對(duì)象間的距離來(lái)度量,對(duì)每個(gè)屬性的值進(jìn)行規(guī)范化,變換到[0,1]區(qū)間,防止較大初始域的屬性權(quán)重過(guò)大而影響結(jié)果。若屬性是標(biāo)稱型數(shù)據(jù),常比較對(duì)象x1和x2中對(duì)應(yīng)屬性的值,若兩者相同者取0,反之則取1。

    聚類,也稱作無(wú)監(jiān)督分類。聚類分析的目的是把數(shù)據(jù)對(duì)象劃分成多個(gè)組或簇(即不同的類),來(lái)發(fā)現(xiàn)隱藏的、潛在于數(shù)據(jù)中的有用信息。其目標(biāo)是使得同一簇內(nèi)的對(duì)象具有較高的相似性,而簇間的對(duì)象盡可能相異。眾多聚類算法都是建立在事先假定某種相似度度量方式基礎(chǔ)上,因此聚類算法的基本出發(fā)點(diǎn)都是根據(jù)對(duì)象間相似度將對(duì)象劃分為不同的簇。

    在實(shí)際的數(shù)據(jù)挖掘應(yīng)用中,如果涉及相似性度量,首先應(yīng)分析對(duì)象的數(shù)據(jù)類型是否是單一,是數(shù)值型的數(shù)據(jù)還是是非數(shù)值型的或者是混合型的數(shù)據(jù)類型。然后根據(jù)相應(yīng)類型的相似度的計(jì)算公式進(jìn)行處理。

    4.2 計(jì)算實(shí)例

    下面用KNN算法和k-summary算法應(yīng)用的兩個(gè)實(shí)例來(lái)介紹相似度的計(jì)算。

    實(shí)例1.數(shù)據(jù)集weather如下表所示,測(cè)試樣本X=(rain,hot,normal,weak,?), k取3,下面根據(jù)KNN最鄰近方法預(yù)測(cè)該樣本的類符號(hào)。

    由于outlook的值有三個(gè),屬于標(biāo)稱型數(shù)據(jù)類型,為了便于區(qū)別它們之間的差異性,在此將其值對(duì)應(yīng)轉(zhuǎn)化為序數(shù)型數(shù)據(jù)。sunny=1,overcast=2,rain=3;同理temperature的hot=1,mild=2,cool=3。

    首先計(jì)算樣本X到14個(gè)記錄的距離(取曼哈頓距離)分別為:

    Distance(X,p1)=3,Distance(X,p2)=3,Distance(X,p3)=2,Distance(X,p4)=1.5,Distance(X,p5)=1,Distance(X,p6)=2,Distance(X,p7)=2.5,Distance(X,p8)=2.5,Distance(X,p9)=2,Distance(X,p10)=0.5,Distance(X,p11)=2.5,Distance(X,p12)=3,Distance(X,p13)=0.5,Distance(X,p14)=2.5;

    根據(jù)KNN的概念可知,K=3,在這里取3個(gè)距離最小的值,分別為Distance(X,p10)=0.5,Distance(X,p13)=0.5,Distance(X,p5)=1。所以取離樣本X最近的3個(gè)近鄰為p5,p10,p13。而這3個(gè)最鄰近對(duì)應(yīng)的類標(biāo)號(hào)都為yes,因此樣本X的類標(biāo)號(hào)被預(yù)測(cè)為yes。

    5 結(jié)論

    論文對(duì)相似性的概念進(jìn)行了介紹,然后對(duì)數(shù)據(jù)類型進(jìn)行了分類,并對(duì)不同數(shù)據(jù)類型對(duì)象的相似度的衡量方式進(jìn)行了分析。不同的數(shù)據(jù)類型具有不同的相似性處理方式,相似性的計(jì)算方法有很多,有的適用于專門的領(lǐng)域,同時(shí)也有適用于特定類型數(shù)據(jù)的限制,選擇相似性的一個(gè)重要的因素就是屬性的類型。在進(jìn)行非數(shù)值型數(shù)據(jù)時(shí),有時(shí)會(huì)因?yàn)閷⑵浠癁闃?biāo)稱類型,但是這樣的轉(zhuǎn)換并不能很好地了解屬性間的差異性,而將其進(jìn)行序數(shù)化,再進(jìn)行相似度計(jì)算,更能體現(xiàn)數(shù)據(jù)之間的差異性。

    參考文獻(xiàn):

    [1] Jiawei Han, Micheline Kamber, Jian Pei.Data Mining Concepts and Technologyes[M].3rd ed.China Machine Press,2012.

    [2] 蔣盛益,李霞,鄭琪.數(shù)據(jù)挖掘原理與實(shí)踐[M].北京:電子工業(yè)出版社,2013.

    [3] 黃彧.相似度度量的研究及其在數(shù)據(jù)挖掘中的應(yīng)用[D].福州:福建師范大學(xué),2009.

    [4] Yano Y.Associative Memory with Fully Parallel Nearest-Manhattan-Distance Search for Low-Power Real-Time Single-Chip Applications[C]. Proc. Of IEEE ASP-DAC, 2004:543-544.

    [5] Hua-Kai Chiou, Gia-Shie Liu.Multiple Objective Compromise Optimization Method to Analyze the Strategies of Nanotechnology in Taiwan[C]. Symposia and Workshops on Ubiquitous, Autonomic and Trusted Computing,2009:172-177.

    [6] de Souza R M C R , de Carvalho F A T. Dynamic clustering of interval data based on adaptive Chebyshev distances[J]. Electronics Letters, 2004, 40(11).

    [7] Ryotaro Kamimura, Osamu Uchida. Greedy Network-Growing by Minkowski Distance Functions[C]. IEEE Transaction on Neural Networks, 2004:2837-2842.

    [8] Chunhua Shen, Junae Kim, Lei Wang. Scalable Large-Margin Mahalanobis Distance Metric Learning[J].IEEE Transactions on Neural Networks, 2010, 21( 9): 1524-1530.

    [9] Sheng-Yijiang.Efficient Classification Method for Large Dataset [C]. Proceeding of the Fifth International Conference on Machine Learning and Cybernetics, Dalian, 2006:13-16.

    [10] Xing E P, Ng A Y, Jordan M I,et al. Distance metric learning, with application to clustering with side-information[C]. proc Adv Neural Inf Process Sys., 2003:505-512.

    [11] 陳韡.基于劃分的混合屬性聚類算法研究[D].長(zhǎng)沙:湖南大學(xué),2010.

    [12] 鄧冠男.聚類分析中的相似度研究[J].東北電力大學(xué)學(xué)報(bào),2013,33(1/2):156-161.

    [13] 李桂林,陳曉云.關(guān)于聚類分析中相似度的討論[J].計(jì)算機(jī)工程與應(yīng)用,2004,40(31): 64-65.

    猜你喜歡
    數(shù)據(jù)類型數(shù)據(jù)挖掘對(duì)象
    神秘來(lái)電
    睿士(2023年2期)2023-03-02 02:01:09
    詳談Java中的基本數(shù)據(jù)類型與引用數(shù)據(jù)類型
    探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
    如何理解數(shù)據(jù)結(jié)構(gòu)中的抽象數(shù)據(jù)類型
    攻略對(duì)象的心思好難猜
    意林(2018年3期)2018-03-02 15:17:24
    基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
    電力與能源(2017年6期)2017-05-14 06:19:37
    基于熵的快速掃描法的FNEA初始對(duì)象的生成方法
    區(qū)間對(duì)象族的可鎮(zhèn)定性分析
    一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
    基于GPGPU的離散數(shù)據(jù)挖掘研究
    中亚洲国语对白在线视频| 午夜精品在线福利| АⅤ资源中文在线天堂| 波多野结衣高清无吗| 99国产精品99久久久久| 中文在线观看免费www的网站 | 免费看日本二区| 午夜免费激情av| 制服丝袜大香蕉在线| 亚洲成人国产一区在线观看| 国产一区二区三区视频了| 搞女人的毛片| 国产精品乱码一区二三区的特点| 可以在线观看毛片的网站| 九色国产91popny在线| 欧美日韩亚洲国产一区二区在线观看| 亚洲人成伊人成综合网2020| 久久九九热精品免费| 欧美日韩乱码在线| 90打野战视频偷拍视频| 久久这里只有精品中国| 亚洲美女黄片视频| 色哟哟哟哟哟哟| 日本黄色视频三级网站网址| 在线a可以看的网站| 欧美高清成人免费视频www| 免费观看精品视频网站| 欧美日韩亚洲国产一区二区在线观看| 很黄的视频免费| 1024手机看黄色片| 一进一出抽搐动态| 日本一区二区免费在线视频| 久久久国产成人免费| www.www免费av| 搡老妇女老女人老熟妇| 久久久久久大精品| 亚洲熟妇熟女久久| 99在线人妻在线中文字幕| 亚洲男人天堂网一区| 天堂√8在线中文| 男女床上黄色一级片免费看| 国产av一区二区精品久久| 日韩 欧美 亚洲 中文字幕| 国产精品久久久av美女十八| 亚洲片人在线观看| 两个人免费观看高清视频| 在线观看一区二区三区| 一级a爱片免费观看的视频| 少妇粗大呻吟视频| 欧美久久黑人一区二区| 色av中文字幕| 首页视频小说图片口味搜索| 成人三级做爰电影| 中文字幕最新亚洲高清| 中文字幕久久专区| 免费在线观看日本一区| 欧美一级a爱片免费观看看 | 一级a爱片免费观看的视频| 婷婷六月久久综合丁香| avwww免费| 一a级毛片在线观看| 男女下面进入的视频免费午夜| 午夜福利欧美成人| 1024香蕉在线观看| 视频区欧美日本亚洲| 欧美成人性av电影在线观看| 又大又爽又粗| 1024手机看黄色片| bbb黄色大片| 成年免费大片在线观看| 亚洲第一欧美日韩一区二区三区| 国产激情久久老熟女| 午夜久久久久精精品| 高清在线国产一区| 丰满人妻熟妇乱又伦精品不卡| 成人18禁高潮啪啪吃奶动态图| 亚洲国产精品久久男人天堂| 欧美另类亚洲清纯唯美| 国内久久婷婷六月综合欲色啪| 欧美另类亚洲清纯唯美| 亚洲avbb在线观看| 中文在线观看免费www的网站 | 巨乳人妻的诱惑在线观看| 草草在线视频免费看| 18禁国产床啪视频网站| 国产欧美日韩一区二区三| 成人三级黄色视频| 男男h啪啪无遮挡| 国产视频一区二区在线看| 亚洲一区二区三区不卡视频| 国产精品永久免费网站| 国产精品一区二区三区四区久久| 国产成人系列免费观看| 亚洲欧美日韩无卡精品| 99久久精品热视频| 亚洲精品美女久久av网站| 一夜夜www| 香蕉国产在线看| 桃色一区二区三区在线观看| 最新美女视频免费是黄的| 亚洲国产日韩欧美精品在线观看 | 色播亚洲综合网| 一级片免费观看大全| 在线观看日韩欧美| 桃色一区二区三区在线观看| 国产av一区在线观看免费| 日韩大尺度精品在线看网址| 无限看片的www在线观看| 成人特级黄色片久久久久久久| 午夜影院日韩av| 日本 av在线| 亚洲精品美女久久久久99蜜臀| 九九热线精品视视频播放| 成人午夜高清在线视频| 欧美色视频一区免费| 国产麻豆成人av免费视频| 亚洲精品国产一区二区精华液| 色综合婷婷激情| 久久精品91蜜桃| 18禁黄网站禁片免费观看直播| 欧美黄色片欧美黄色片| av在线天堂中文字幕| 午夜福利在线观看吧| 欧美日韩一级在线毛片| 国产成人欧美在线观看| 午夜成年电影在线免费观看| 国产探花在线观看一区二区| 欧美乱码精品一区二区三区| 亚洲精品一卡2卡三卡4卡5卡| 国产精品综合久久久久久久免费| 亚洲自拍偷在线| 亚洲精品色激情综合| 嫩草影院精品99| 一个人观看的视频www高清免费观看 | 中国美女看黄片| 午夜精品久久久久久毛片777| 最新在线观看一区二区三区| 国产久久久一区二区三区| 国产成人av激情在线播放| 韩国av一区二区三区四区| 午夜激情av网站| 国产高清视频在线播放一区| 97人妻精品一区二区三区麻豆| 国产精品久久久久久精品电影| 黄色视频不卡| 欧美黑人巨大hd| 可以在线观看毛片的网站| 亚洲一区中文字幕在线| 亚洲成人免费电影在线观看| 国产av在哪里看| 欧美黑人欧美精品刺激| 两个人视频免费观看高清| 99riav亚洲国产免费| 国产亚洲欧美98| 怎么达到女性高潮| 国产精品1区2区在线观看.| 亚洲av成人不卡在线观看播放网| 久久精品aⅴ一区二区三区四区| 岛国视频午夜一区免费看| 久久久精品欧美日韩精品| 制服诱惑二区| 久久精品国产99精品国产亚洲性色| 国产精品 欧美亚洲| 97超级碰碰碰精品色视频在线观看| 久久伊人香网站| 精品久久蜜臀av无| 成人一区二区视频在线观看| 一级黄色大片毛片| 此物有八面人人有两片| 丰满的人妻完整版| 淫秽高清视频在线观看| 99riav亚洲国产免费| 女人被狂操c到高潮| 国产成人精品久久二区二区免费| 精品国产亚洲在线| 18禁黄网站禁片免费观看直播| 国产精品爽爽va在线观看网站| 欧美成人一区二区免费高清观看 | 麻豆成人午夜福利视频| 校园春色视频在线观看| 在线国产一区二区在线| 国产午夜福利久久久久久| 亚洲片人在线观看| 我要搜黄色片| 99在线视频只有这里精品首页| 欧美中文综合在线视频| 中文字幕av在线有码专区| 精品国产亚洲在线| 亚洲电影在线观看av| av欧美777| 久久中文字幕一级| 国产av又大| 精品久久久久久久久久久久久| 国内精品一区二区在线观看| 欧美av亚洲av综合av国产av| 丝袜美腿诱惑在线| 亚洲成人久久爱视频| 亚洲在线自拍视频| 国语自产精品视频在线第100页| 男人舔奶头视频| 美女黄网站色视频| 成人午夜高清在线视频| 桃色一区二区三区在线观看| 免费一级毛片在线播放高清视频| 国产99白浆流出| 精品国产美女av久久久久小说| 大型av网站在线播放| 成年免费大片在线观看| 久久 成人 亚洲| 我的老师免费观看完整版| 他把我摸到了高潮在线观看| 免费搜索国产男女视频| 亚洲欧美激情综合另类| 窝窝影院91人妻| av福利片在线观看| 美女免费视频网站| 少妇裸体淫交视频免费看高清 | www国产在线视频色| 窝窝影院91人妻| 动漫黄色视频在线观看| 男人舔女人下体高潮全视频| 视频区欧美日本亚洲| 久久午夜亚洲精品久久| 最近最新中文字幕大全电影3| 天天一区二区日本电影三级| 久久久久亚洲av毛片大全| 国产高清视频在线观看网站| 日韩av在线大香蕉| 国产区一区二久久| 黄色毛片三级朝国网站| 国产一级毛片七仙女欲春2| 色综合亚洲欧美另类图片| cao死你这个sao货| 日韩有码中文字幕| 国内久久婷婷六月综合欲色啪| 在线观看舔阴道视频| 老司机靠b影院| 免费电影在线观看免费观看| 亚洲七黄色美女视频| 久久久国产成人精品二区| 久久久久免费精品人妻一区二区| 97碰自拍视频| 欧美一区二区国产精品久久精品 | 91老司机精品| 熟女电影av网| 午夜a级毛片| 老鸭窝网址在线观看| 亚洲国产中文字幕在线视频| 中文资源天堂在线| 精品电影一区二区在线| 亚洲18禁久久av| 俺也久久电影网| 制服人妻中文乱码| 国产精品一区二区三区四区免费观看 | 特级一级黄色大片| 男人舔女人的私密视频| 免费高清视频大片| 青草久久国产| 蜜桃久久精品国产亚洲av| 久久人妻福利社区极品人妻图片| 最近视频中文字幕2019在线8| a在线观看视频网站| 国内久久婷婷六月综合欲色啪| 变态另类成人亚洲欧美熟女| 在线视频色国产色| 丝袜美腿诱惑在线| 老司机午夜十八禁免费视频| 99久久99久久久精品蜜桃| 老熟妇仑乱视频hdxx| 亚洲成人国产一区在线观看| a级毛片在线看网站| 欧美日韩亚洲国产一区二区在线观看| 99久久99久久久精品蜜桃| 成人av一区二区三区在线看| 18禁国产床啪视频网站| 日韩大码丰满熟妇| 黄色丝袜av网址大全| 亚洲色图av天堂| 午夜影院日韩av| 亚洲欧美一区二区三区黑人| 久久久久国产一级毛片高清牌| 男男h啪啪无遮挡| 亚洲av成人不卡在线观看播放网| videosex国产| 欧美色欧美亚洲另类二区| 国产成人精品久久二区二区免费| 好男人电影高清在线观看| 国产黄a三级三级三级人| 日韩有码中文字幕| 久久久久久久久中文| ponron亚洲| 久久精品综合一区二区三区| 99在线视频只有这里精品首页| 国产在线精品亚洲第一网站| 一边摸一边做爽爽视频免费| 美女黄网站色视频| 99riav亚洲国产免费| 日本一本二区三区精品| 亚洲熟女毛片儿| 亚洲18禁久久av| 国产av又大| 在线国产一区二区在线| 好男人电影高清在线观看| 99国产综合亚洲精品| 夜夜夜夜夜久久久久| 国内精品一区二区在线观看| 久久婷婷人人爽人人干人人爱| 久久九九热精品免费| 国产aⅴ精品一区二区三区波| 日本熟妇午夜| av欧美777| 麻豆av在线久日| 窝窝影院91人妻| 午夜福利18| 国产高清有码在线观看视频 | netflix在线观看网站| 少妇人妻一区二区三区视频| 日韩av在线大香蕉| xxx96com| 日韩欧美 国产精品| or卡值多少钱| 老司机午夜福利在线观看视频| 亚洲色图av天堂| 国产黄a三级三级三级人| 热99re8久久精品国产| 99国产精品99久久久久| 亚洲真实伦在线观看| 99国产综合亚洲精品| 老司机午夜福利在线观看视频| 熟妇人妻久久中文字幕3abv| 草草在线视频免费看| 国产成人影院久久av| 亚洲av成人精品一区久久| 神马国产精品三级电影在线观看 | 91九色精品人成在线观看| 精华霜和精华液先用哪个| 在线观看午夜福利视频| 日日夜夜操网爽| 久久国产乱子伦精品免费另类| 欧美zozozo另类| 亚洲在线自拍视频| 国产三级中文精品| 日本免费a在线| 丰满人妻熟妇乱又伦精品不卡| 日韩中文字幕欧美一区二区| 久久精品综合一区二区三区| 性欧美人与动物交配| 国产黄片美女视频| 天堂动漫精品| 99久久国产精品久久久| 搞女人的毛片| 国产精品,欧美在线| 三级毛片av免费| 手机成人av网站| 老汉色av国产亚洲站长工具| 无人区码免费观看不卡| 熟妇人妻久久中文字幕3abv| 免费av毛片视频| 日本一区二区免费在线视频| 两性午夜刺激爽爽歪歪视频在线观看 | 亚洲av日韩精品久久久久久密| 91麻豆av在线| 亚洲成人免费电影在线观看| 黄色视频不卡| 欧美色欧美亚洲另类二区| 精品少妇一区二区三区视频日本电影| 国产精品九九99| 老司机福利观看| 国产99白浆流出| 亚洲九九香蕉| 欧美大码av| 午夜福利18| 亚洲五月婷婷丁香| 免费一级毛片在线播放高清视频| 欧美av亚洲av综合av国产av| 免费搜索国产男女视频| 免费观看精品视频网站| 人人妻人人澡欧美一区二区| av超薄肉色丝袜交足视频| 欧美最黄视频在线播放免费| av中文乱码字幕在线| 一级片免费观看大全| 中文在线观看免费www的网站 | 两性夫妻黄色片| 又黄又粗又硬又大视频| 黄色女人牲交| 无人区码免费观看不卡| 欧美性长视频在线观看| 在线免费观看的www视频| 桃色一区二区三区在线观看| 亚洲一区中文字幕在线| 中文字幕人妻丝袜一区二区| 免费在线观看成人毛片| 亚洲av五月六月丁香网| 免费av毛片视频| 99精品久久久久人妻精品| 久久久久国产精品人妻aⅴ院| av国产免费在线观看| 青草久久国产| 久久久久免费精品人妻一区二区| 亚洲精品久久成人aⅴ小说| 久久九九热精品免费| 好看av亚洲va欧美ⅴa在| 99热只有精品国产| 国产97色在线日韩免费| 在线观看www视频免费| 九九热线精品视视频播放| 久久伊人香网站| 亚洲全国av大片| 男女视频在线观看网站免费 | 五月伊人婷婷丁香| 久久午夜亚洲精品久久| 成人永久免费在线观看视频| 丰满的人妻完整版| 亚洲人成伊人成综合网2020| 国产精品亚洲一级av第二区| 亚洲av日韩精品久久久久久密| 蜜桃久久精品国产亚洲av| 国产精品综合久久久久久久免费| 一个人免费在线观看电影 | 50天的宝宝边吃奶边哭怎么回事| 亚洲真实伦在线观看| 中国美女看黄片| 亚洲中文日韩欧美视频| 久久天堂一区二区三区四区| 99热6这里只有精品| 精品不卡国产一区二区三区| 视频区欧美日本亚洲| 亚洲男人的天堂狠狠| 午夜视频精品福利| 日韩欧美免费精品| 看免费av毛片| 免费看a级黄色片| 99riav亚洲国产免费| 看免费av毛片| 亚洲全国av大片| 男女视频在线观看网站免费 | 欧美黄色片欧美黄色片| 中出人妻视频一区二区| 亚洲国产高清在线一区二区三| 亚洲九九香蕉| 最新美女视频免费是黄的| 国产野战对白在线观看| 亚洲精品久久国产高清桃花| 黄色毛片三级朝国网站| 五月伊人婷婷丁香| 在线观看免费午夜福利视频| 岛国在线观看网站| 深夜精品福利| 最新在线观看一区二区三区| 在线观看免费视频日本深夜| 淫秽高清视频在线观看| 国产久久久一区二区三区| 精品一区二区三区视频在线观看免费| 亚洲av电影在线进入| 亚洲avbb在线观看| 国产爱豆传媒在线观看 | 国产亚洲精品综合一区在线观看 | 日本 av在线| 宅男免费午夜| 制服诱惑二区| 亚洲午夜理论影院| 国产av一区二区精品久久| 99热6这里只有精品| 黄色成人免费大全| 制服丝袜大香蕉在线| 久久午夜综合久久蜜桃| 亚洲精品一区av在线观看| 在线观看免费日韩欧美大片| 国产亚洲精品av在线| 国产精品,欧美在线| e午夜精品久久久久久久| 又紧又爽又黄一区二区| 久久香蕉国产精品| www.熟女人妻精品国产| 男人舔奶头视频| 91国产中文字幕| 亚洲自偷自拍图片 自拍| 免费高清视频大片| 成人亚洲精品av一区二区| 两个人的视频大全免费| 亚洲精品中文字幕一二三四区| 国产av麻豆久久久久久久| 欧美午夜高清在线| 两人在一起打扑克的视频| 国产精品免费视频内射| 国产亚洲欧美在线一区二区| 国产成人av激情在线播放| 在线视频色国产色| 久久这里只有精品19| 国产午夜福利久久久久久| 最近最新中文字幕大全免费视频| 免费在线观看日本一区| 日本 av在线| 精品日产1卡2卡| 亚洲精品一区av在线观看| 99精品久久久久人妻精品| 变态另类成人亚洲欧美熟女| 午夜亚洲福利在线播放| 精品国内亚洲2022精品成人| 亚洲,欧美精品.| 亚洲男人的天堂狠狠| 午夜福利在线在线| 香蕉国产在线看| 又紧又爽又黄一区二区| 国产亚洲精品久久久久5区| 男女那种视频在线观看| 国产精品av视频在线免费观看| 国产区一区二久久| 日本免费一区二区三区高清不卡| 嫁个100分男人电影在线观看| 曰老女人黄片| 亚洲国产欧美人成| 最新美女视频免费是黄的| 巨乳人妻的诱惑在线观看| 亚洲成a人片在线一区二区| 日韩欧美 国产精品| 国产成人影院久久av| 一二三四在线观看免费中文在| 叶爱在线成人免费视频播放| 亚洲 欧美一区二区三区| 天堂动漫精品| 天堂影院成人在线观看| 国产一区在线观看成人免费| 国产日本99.免费观看| 精品电影一区二区在线| 禁无遮挡网站| 精品一区二区三区视频在线观看免费| 国产成人精品无人区| 久久久久免费精品人妻一区二区| 亚洲av日韩精品久久久久久密| 亚洲人成网站高清观看| 亚洲成人中文字幕在线播放| 国产激情久久老熟女| 在线a可以看的网站| 久久精品成人免费网站| 亚洲欧美精品综合一区二区三区| 国产精品久久久久久人妻精品电影| 一本综合久久免费| 日韩欧美免费精品| 一本综合久久免费| av在线天堂中文字幕| 精品久久久久久久人妻蜜臀av| 久久精品影院6| 国内精品久久久久精免费| 国产精品免费一区二区三区在线| 欧美成人免费av一区二区三区| 人人妻,人人澡人人爽秒播| 99在线视频只有这里精品首页| 又紧又爽又黄一区二区| 啪啪无遮挡十八禁网站| av福利片在线观看| 国模一区二区三区四区视频 | 香蕉久久夜色| av有码第一页| 一区二区三区国产精品乱码| 亚洲精品粉嫩美女一区| 亚洲欧美日韩高清在线视频| 亚洲成人国产一区在线观看| 国产成人啪精品午夜网站| 国产真人三级小视频在线观看| 蜜桃久久精品国产亚洲av| av国产免费在线观看| 18禁黄网站禁片午夜丰满| 激情在线观看视频在线高清| 亚洲激情在线av| 99久久无色码亚洲精品果冻| 国产久久久一区二区三区| 欧美精品亚洲一区二区| 国产精品久久久久久精品电影| 免费搜索国产男女视频| 色av中文字幕| 欧美性长视频在线观看| 日韩 欧美 亚洲 中文字幕| 久久久精品国产亚洲av高清涩受| 亚洲精品中文字幕在线视频| 禁无遮挡网站| 少妇粗大呻吟视频| 欧美日韩福利视频一区二区| 日本免费一区二区三区高清不卡| 操出白浆在线播放| 黄色 视频免费看| x7x7x7水蜜桃| 午夜影院日韩av| 老司机午夜福利在线观看视频| 国产免费av片在线观看野外av| 成人18禁高潮啪啪吃奶动态图| 亚洲av成人av| 波多野结衣巨乳人妻| or卡值多少钱| 成人高潮视频无遮挡免费网站| 亚洲黑人精品在线| 国产亚洲av高清不卡| 精品欧美国产一区二区三| 精品电影一区二区在线| 非洲黑人性xxxx精品又粗又长| 国产精品久久久av美女十八| √禁漫天堂资源中文www| 久久天堂一区二区三区四区| 亚洲av成人精品一区久久| 国产一区二区激情短视频| 亚洲国产欧美网| 舔av片在线| 国产伦在线观看视频一区| 一夜夜www| 日本成人三级电影网站| 国产欧美日韩一区二区精品| 又粗又爽又猛毛片免费看| 欧美3d第一页| 男人舔女人下体高潮全视频| 丰满人妻熟妇乱又伦精品不卡| 亚洲男人天堂网一区| 亚洲中文日韩欧美视频| 日本免费a在线| 国产精品一区二区精品视频观看|