• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于相關(guān)系數(shù)的決策樹優(yōu)化算法*

    2015-01-05 08:50:50董躍華
    關(guān)鍵詞:偏向信息熵決策樹

    董躍華,劉 力

    (江西理工大學(xué)信息工程學(xué)院,江西 贛州 341000)

    基于相關(guān)系數(shù)的決策樹優(yōu)化算法*

    董躍華,劉 力

    (江西理工大學(xué)信息工程學(xué)院,江西 贛州 341000)

    通過(guò)分析ID3算法的基本原理及其多值偏向問(wèn)題,提出了一種基于相關(guān)系數(shù)的決策樹優(yōu)化算法。首先通過(guò)引進(jìn)相關(guān)系數(shù)對(duì)ID3算法進(jìn)行改進(jìn),從而克服其多值偏向問(wèn)題,然后運(yùn)用數(shù)學(xué)中泰勒公式和麥克勞林公式的性質(zhì),對(duì)信息增益公式進(jìn)行近似簡(jiǎn)化。通過(guò)具體數(shù)據(jù)的實(shí)例驗(yàn)證,說(shuō)明優(yōu)化后的ID3算法能夠解決多值偏向問(wèn)題。標(biāo)準(zhǔn)數(shù)據(jù)集UCI上的實(shí)驗(yàn)結(jié)果表明,在構(gòu)建決策樹的過(guò)程中,既提高了平均分類準(zhǔn)確率,又降低了構(gòu)建決策樹的復(fù)雜度,從而還縮短了決策樹的生成時(shí)間,當(dāng)數(shù)據(jù)集中的樣本數(shù)較大時(shí),優(yōu)化后的ID3算法的效率得到了明顯的提高。

    ID3算法;相關(guān)系數(shù);決策樹;泰勒公式;信息增益

    1 引言

    數(shù)據(jù)挖掘是指從大量數(shù)據(jù)中挖掘知識(shí)的過(guò)程,是一種新的高級(jí)數(shù)據(jù)分析技術(shù)[1]。數(shù)據(jù)分類是數(shù)據(jù)挖掘中重要的研究方法之一[2],其中有決策樹分類器、貝葉斯分類器等基本技術(shù)。20世紀(jì)80年代初期,機(jī)器學(xué)習(xí)研究者Quinlan J R[3]提出了一種新的決策樹分類算法,即ID3算法。在各類決策樹算法中,ID3算法的影響力最大。

    然而ID3算法也存在一些缺陷[4]:(1)信息熵的計(jì)算方式易使ID3算法產(chǎn)生多值偏向問(wèn)題;(2)數(shù)據(jù)集樣本個(gè)數(shù)的增多使算法對(duì)應(yīng)計(jì)算量的增幅變大;(3)訓(xùn)練集的增減變化會(huì)影響算法對(duì)應(yīng)決策樹的生成。

    針對(duì)ID3算法的多值偏向問(wèn)題,自Quinlan J R提出C4.5算法[5]以來(lái),許多學(xué)者進(jìn)行相關(guān)改進(jìn)工作:文獻(xiàn)[6~9]將用戶興趣度參數(shù)引入信息熵公式,雖在一定程度上能解決多值偏向問(wèn)題,但該參數(shù)需要用戶具有豐富的先驗(yàn)知識(shí)和領(lǐng)域知識(shí)以及需要在進(jìn)行大量的實(shí)驗(yàn)后才能給出;文獻(xiàn)[10]通過(guò)引入單調(diào)遞減的修正函數(shù)對(duì)信息熵值進(jìn)行修正,以達(dá)到對(duì)ID3算法進(jìn)行改進(jìn)的目的,但修正函數(shù)是人為主觀選取的,因此在一定程度上會(huì)影響決策結(jié)果的正確性和客觀性;文獻(xiàn)[11]將概率統(tǒng)計(jì)中的相關(guān)系數(shù)概念引入決策樹中,將條件屬性和決策樹屬性之間的相關(guān)系數(shù)值作為選擇分裂屬性的標(biāo)準(zhǔn)。條件屬性和決策屬性之間的相關(guān)系數(shù)越大,表明該條件屬性和決策屬性之間的相關(guān)性程度越高、聯(lián)系越緊密,該條件屬性對(duì)分類的重要性越大[12],但因?yàn)槠涿撾x信息熵理論的計(jì)算方式,所以在分類準(zhǔn)確率上會(huì)低于ID3算法;文獻(xiàn)[13]在用戶興趣度參數(shù)的研究基礎(chǔ)上,使用灰色關(guān)聯(lián)度取代用戶興趣度,雖在一定程度上能克服多值偏向問(wèn)題,但若實(shí)際操作中出現(xiàn)灰度較低或?qū)傩匀≈祩€(gè)數(shù)較多等情況,則難以界定灰色關(guān)聯(lián)度的范圍。

    本文在文獻(xiàn)[10,11]的基礎(chǔ)上,結(jié)合修正函數(shù)的修正思想和相關(guān)系數(shù),提出了基于相關(guān)系數(shù)的決策樹優(yōu)化算法。區(qū)別于文獻(xiàn)[10]中對(duì)信息熵值的修正,本文通過(guò)引入相關(guān)系數(shù)對(duì)劃分子元組的期望信息量進(jìn)行修正,以完成對(duì)ID3算法的改進(jìn)。另外,通過(guò)利用泰勒公式和麥克勞林公式得到近似轉(zhuǎn)化公式,以完成對(duì)信息熵公式的近似簡(jiǎn)化,簡(jiǎn)化后的公式已完全消除了復(fù)雜的對(duì)數(shù)運(yùn)算,從而提高了信息熵公式的計(jì)算效率。實(shí)驗(yàn)結(jié)果表明,基于相關(guān)系數(shù)的決策樹優(yōu)化算法,既能夠克服多值偏向問(wèn)題,提高分類精度,又能降低決策樹的生成時(shí)間。

    2 理論基礎(chǔ)

    2.1 ID3算法[14]

    設(shè)訓(xùn)練集S有s個(gè)樣本,將訓(xùn)練集分成m個(gè)類,第i類的實(shí)例個(gè)數(shù)為si,ID3算法基于信息熵計(jì)算的計(jì)算公式定義為:

    (1)

    其中,pi是S中屬于第i類的概率,pi=si/s。

    若選擇屬性A劃分訓(xùn)練集S,設(shè)屬性A有屬性值{s1,s2,…,sk},則sj中屬于第i類的訓(xùn)練實(shí)例個(gè)數(shù)為sij,則有:

    (2)

    其中s1j+…+smj=sj。

    (3)

    其中,pij為sj中第i類樣本的概率,pij=sij/sj。

    從而得到劃分屬性A的信息增益為:

    Gain(A,S)=Info(S)-InfoA(S)

    (4)

    2.2 相關(guān)系數(shù)

    2.2.1 相關(guān)系數(shù)的定義[15]

    則隨機(jī)變量X與Y的相關(guān)系數(shù)ρxy定義為:

    (5)

    其中,D(X)和D(Y)分別為X和Y的方差。

    2.2.2 相關(guān)系數(shù)的含義[15]

    用X的線性函數(shù)a+bX來(lái)近似表示Y,以均方誤差e來(lái)衡量以a+bX近似表示Y的好壞程度。其中,

    2abE(X)-2aE(Y)

    (6)

    而e的值越小,則表示a+bX與Y的近似程度越大。因此,給a、b賦值,使e取最小值。令e分別求關(guān)于a、b的偏導(dǎo)數(shù),并使它們等于零,則有:

    解得:

    將a0、b0代入式(6)得:

    (7)

    2.3 ID3算法公式簡(jiǎn)化的理論基礎(chǔ)

    本文通過(guò)運(yùn)用泰勒公式和麥克勞林公式對(duì)信息熵計(jì)算公式進(jìn)行近似轉(zhuǎn)換,以達(dá)到簡(jiǎn)化ID3算法公式的目的。

    2.3.1 泰勒中值定理[16]

    如果函數(shù)f(x)在含有x0的某個(gè)開(kāi)區(qū)間(a,b)內(nèi)具有直到(n+1)階的導(dǎo)數(shù),則對(duì)于任意x∈(a,b),有:

    (8)

    其中ξ是x0與x之間的某個(gè)值。

    2.3.2 麥克勞林公式[16]

    (9)

    由此得到近似公式:

    (10)

    由此可得:

    (11)

    因此有:

    (12)

    當(dāng)x∈(0,1)時(shí),

    (13)

    3 基于相關(guān)系數(shù)的決策樹優(yōu)化算法

    3.1 ID3決策樹優(yōu)化算法的實(shí)現(xiàn)方案

    本文針對(duì)“多值偏向問(wèn)題”和“信息熵計(jì)算公式”兩個(gè)方面,分別對(duì)ID3算法進(jìn)行算法改進(jìn)和公式簡(jiǎn)化,提出了基于相關(guān)系數(shù)的決策樹優(yōu)化算法DTCC(Optimized algorithm of Decision Tree based on Correlation Coefficient),DTCC算法由ID3算法改進(jìn)和ID3算法公式簡(jiǎn)化兩部分組成。

    (1)ID3算法改進(jìn)。用戶興趣度之類的主觀參數(shù)主要取決于用戶的先驗(yàn)知識(shí)和相關(guān)領(lǐng)域知識(shí),決策結(jié)果更傾向于用戶的主觀思維。為避免此類主觀參數(shù)不具說(shuō)服力,本文引入概率統(tǒng)計(jì)中的相關(guān)系數(shù)對(duì)ID3算法進(jìn)行改進(jìn)。相關(guān)系數(shù)客觀反映條件屬性和決策屬性之間的相關(guān)程度,使分裂屬性的選擇不受屬性取值個(gè)數(shù)的影響,從而克服其多值偏向的缺陷,還因無(wú)較多主觀的參與或干擾從而避免了決策結(jié)果受用戶主觀思想的影響。

    (2)ID3算法公式簡(jiǎn)化。本文在泰勒公式和麥克勞林公式的基礎(chǔ)上得到近似轉(zhuǎn)換公式,通過(guò)利用近似轉(zhuǎn)換公式對(duì)信息熵公式進(jìn)行近似簡(jiǎn)化。簡(jiǎn)化后的公式以信息熵理論為基礎(chǔ),因而保留了較高的分類精度,又能消除信息熵公式中復(fù)雜的對(duì)數(shù)運(yùn)算,提高算法計(jì)算效率。

    3.2 ID3算法的改進(jìn)

    ID3算法對(duì)屬性進(jìn)行分類時(shí),通常以信息增益值作為屬性選擇度量,將具有最大增益值的屬性作為最優(yōu)分裂屬性。ID3算法造成多值偏向問(wèn)題的本質(zhì)是:信息熵的計(jì)算特點(diǎn)會(huì)使屬性的重要性程度與屬性的取值個(gè)數(shù)成正比,但通常取值個(gè)數(shù)較多的屬性不一定是最優(yōu)分裂屬性,最終可能會(huì)導(dǎo)致做出不適合實(shí)際情況的決策,為此本文引進(jìn)相關(guān)系數(shù)對(duì)ID3算法進(jìn)行改進(jìn)。

    3.2.1 屬性之間相關(guān)系數(shù)的引入

    假設(shè)訓(xùn)練集S由r個(gè)條件屬性和一個(gè)決策屬性Y構(gòu)成,將r個(gè)條件屬性字段看成隨機(jī)變量Xp(p=1,2,…,r),決策屬性看成隨機(jī)變量Y,則某個(gè)屬性的屬性值分布即為某個(gè)隨機(jī)變量的取值分布,令隨機(jī)變量Xp的取值為xq(q=1,2,…,k),則Xp取到各個(gè)值的概率P{Xp=xq}=pq(q=1,2,…,k)稱為隨機(jī)變量Xp的概率分布,此時(shí)可將訓(xùn)練集S轉(zhuǎn)變成若干個(gè)隨機(jī)變量的集合。

    借鑒定義1和定義2,將變量間的相關(guān)系數(shù)引進(jìn)到ID3算法中,使其成為重新定義條件屬性與決策屬性之間緊密相關(guān)程度的性能指標(biāo)。令k、m分別為隨機(jī)變量Xi與Y的取值個(gè)數(shù),則隨機(jī)變量Xp(i=1,2,…,r)與Y的協(xié)方差為:

    其中,pq t為(q=1,2,…,k;t=1,2,…,m)為Xp和Y的聯(lián)合概率分布。Xp和Y的聯(lián)合概率分布如表1所示。

    Table 1 Joint probability distribution of Xp and Y表1 (Xp,Y)的聯(lián)合概率分布

    重新定義隨機(jī)變量Xp與Y的相關(guān)系數(shù)為:

    (14)

    令:

    (15)

    從公式(15)中可看出0≤ωp≤1,而ωp成為了衡量條件屬性集Xp與決策屬性Y之間緊密相關(guān)程度的一種度量標(biāo)準(zhǔn)。

    當(dāng)ωp較大時(shí),說(shuō)明Xp與Y屬性之間聯(lián)系的緊密程度較高;當(dāng)ωp較小時(shí),說(shuō)明Xp、Y屬性之間聯(lián)系的緊密程度較低;當(dāng)ωp=1時(shí),稱Xp和Y屬性之間以概率1存在著緊密的聯(lián)系;當(dāng)ωp=0時(shí),稱Xp和Y屬性之間沒(méi)有聯(lián)系。

    3.2.2 引入相關(guān)系數(shù)對(duì)ID3算法進(jìn)行改進(jìn)

    相關(guān)系數(shù)對(duì)ID3算法公式(4)進(jìn)行改進(jìn)后,得到新的信息增益公式(16):

    (16)

    屬性相關(guān)系數(shù)客觀反映條件屬性和決策屬性之間聯(lián)系的緊密程度,且不受屬性取值個(gè)數(shù)的影響。

    3.2.3 ID3算法改進(jìn)后的多值偏向分析

    (1)ID3算法多值偏向分析。

    假設(shè)存在一個(gè)屬性值個(gè)數(shù)較多且重要性低的條件屬性B,則條件屬性B與決策屬性Y之間聯(lián)系的緊密程度必然低,其相關(guān)系數(shù)ωB較小;存在一個(gè)屬性值個(gè)數(shù)較少且重要性高的條件屬性A,則條件屬性A與決策屬性Y之間聯(lián)系的緊密程度必然高,其相關(guān)系數(shù)ωA較大。相對(duì)于決策屬性Y,條件屬性A的重要性高于條件屬性B,因此很顯然有:ωA>ωB。

    從文獻(xiàn)[10]中可知:由于信息熵的計(jì)算特點(diǎn),它會(huì)偏向于屬性取值個(gè)數(shù)多的屬性,文獻(xiàn)[17]也證明在該情況下的公式(17)恒成立。

    Gain(A,S)≤Gain(B,S)

    (17)

    由此可知公式(17)的恒成立是造成多向偏值問(wèn)題的本質(zhì),所以要解決多向偏值問(wèn)題只要避免公式(17)恒成立即可。

    (2)ID3算法改進(jìn)后的多值偏向分析。

    ID3算法被改進(jìn)后,比較信息增益Gain(A,S)′和信息增益Gain(B,S)′兩者之間的大小關(guān)系:

    若Gain(A,S)′≤Gain(B,S)′恒成立,說(shuō)明該算法有多值偏向問(wèn)題;若能避免其恒成立,則說(shuō)明該算法能克服多值偏向問(wèn)題。

    將公式(17)進(jìn)一步等價(jià)推導(dǎo)可得:

    Gain(A,S)≤Gain(B,S)?

    Info(S)-InfoA(S)≤Info(S)-InfoB(S)?

    InfoA(S)≥InfoB(S)

    (18)

    由公式(16)可得算法改進(jìn)后,屬性A和屬性B的子元組期望信息分別為:

    從公式(18)中可知:公式(17)恒成立等價(jià)于InfoA(S)≥InfoB(S)恒成立。但是,因?yàn)樵诟髯缘淖釉M期望信息中分別乘以1/ωA和1/ωB,且由ωA>ωB可得1/ωA<1/ωB,所以可避免公式(19)的恒成立。

    (19)

    由公式(19)進(jìn)一步可推導(dǎo)出如下等價(jià)關(guān)系:

    ?

    Gain(A,S)′≤Gain(B,S)′

    (20)

    從公式(20)中可知:能夠避免公式(19)的恒成立,即等價(jià)于避免Gain(A,S)′≤Gain(B,S)′的恒成立。能夠避免Gain(A,S)′≤Gain(B,S)′的恒成立,則表明多向偏值問(wèn)題已經(jīng)得到解決。

    因此,采用公式(16)作為新的屬性選擇標(biāo)準(zhǔn)作,能夠降低屬性取值個(gè)數(shù)較多且重要性低的屬性的重要程度,克服了ID3算法多值偏向的缺陷。

    3.3 ID3算法的公式簡(jiǎn)化

    將ID3算法的信息增益公式完全展開(kāi)后,變形為公式(21):

    (21)

    公式(21)中常數(shù)m為訓(xùn)練集類別數(shù),Info(S)為一個(gè)定值,因此公式(21)只保留后一項(xiàng)也不會(huì)影響最終比較結(jié)果,則取后一項(xiàng)可得公式(22):

    (22)

    從公式(22)中可看出:對(duì)數(shù)運(yùn)算是計(jì)算中主要的耗時(shí)部分,因而消去對(duì)數(shù)運(yùn)算能夠降低計(jì)算量并提高計(jì)算效率。

    sj中屬于第i類的訓(xùn)練實(shí)例個(gè)數(shù)為sij,pij是sj中屬于第i類的概率,pij=sij/sj,且s1j+…+smj=sj,因此公式(22)可進(jìn)行如下轉(zhuǎn)化:

    使用近似簡(jiǎn)化公式(13)可進(jìn)一步化簡(jiǎn)為:

    ln 2和樣本個(gè)數(shù)s均為常數(shù)項(xiàng),去掉后不影響結(jié)果的比較,將其去掉后進(jìn)一步簡(jiǎn)化得到公式(23):

    (23)

    從公式(23)中可看出:公式中已完全消除復(fù)雜的log對(duì)數(shù)運(yùn)算,只需對(duì)函數(shù)進(jìn)行有限次數(shù)的加、減、乘、除四種基本運(yùn)算即可,計(jì)算效率得到很大提高。

    3.4 DTCC算法的提出

    DTCC算法包括ID3算法改進(jìn)和ID3算法公式簡(jiǎn)化兩個(gè)部分的工作,將ID3算法改進(jìn)公式(16)和ID3算法簡(jiǎn)化公式(23)相結(jié)合得到DTCC算法公式(24):

    (24)

    DTCC算法采用公式(24)作為新的屬性選擇標(biāo)準(zhǔn)。DTCC算法既能克服多值偏向,又能簡(jiǎn)化ID3算法公式,降低計(jì)算量并提高計(jì)算效率。

    4 實(shí)驗(yàn)及結(jié)果分析

    4.1 實(shí)驗(yàn)說(shuō)明及評(píng)價(jià)標(biāo)準(zhǔn)

    本實(shí)驗(yàn)在標(biāo)準(zhǔn)數(shù)據(jù)集UCI上進(jìn)行,采用UCI提供的若干個(gè)標(biāo)準(zhǔn)數(shù)據(jù)集(如表2所示)進(jìn)行數(shù)據(jù)分析。數(shù)據(jù)集中2/3樣本作為訓(xùn)練集,1/3作為測(cè)試集。采用文獻(xiàn)[18]中的方法先對(duì)數(shù)據(jù)集中的連續(xù)性屬性進(jìn)行離散化操作。

    Table 2 Dataset表2 數(shù)據(jù)集

    采用商務(wù)購(gòu)車顧客數(shù)據(jù)庫(kù)(如表3所示)作為訓(xùn)練集D,對(duì)數(shù)據(jù)進(jìn)行選取、預(yù)處理和轉(zhuǎn)換操作后得到樣本集合,該集合包含四個(gè)條件屬性:喜歡的季節(jié)(含四個(gè)屬性值:春天、夏天、秋天、冬天)、是否商務(wù)人士(含兩個(gè)屬性值:是、否)、收入(含三個(gè)屬性值:高、中、低)、駕車水平(含兩個(gè)屬性值:良好、一般)。樣本集合根據(jù)類別屬性“是否買車”(含有兩個(gè)屬性值:買、不買)進(jìn)行劃分。

    Table 3 Dataset D of the customer database表3 顧客數(shù)據(jù)庫(kù)訓(xùn)練集D

    本實(shí)驗(yàn)采用WEKA平臺(tái),實(shí)驗(yàn)使用的計(jì)算機(jī)配置:CPU為酷睿i5 2300系列,主頻為2.8 GHz,內(nèi)存為4 GB,操作系統(tǒng)為Windows 7,仿真軟件為Matlab 2012。

    分類準(zhǔn)確率是分類問(wèn)題中常用的評(píng)價(jià)標(biāo)準(zhǔn),能體現(xiàn)出分類器對(duì)數(shù)據(jù)集的分類性能。分類準(zhǔn)確率指分類器中被正確分類的樣本個(gè)數(shù)在總的檢驗(yàn)集中所占的比例[19],將其定義為公式(25):

    (25)

    其中,s為總的樣本個(gè)數(shù),m為分類類別個(gè)數(shù),si為訓(xùn)練集中屬于第i類的實(shí)例個(gè)數(shù)。

    4.2 DTCC算法的實(shí)例驗(yàn)證與分析

    以訓(xùn)練集D為例,先計(jì)算出各個(gè)條件屬性與決策屬性的相關(guān)系數(shù),然后再根據(jù)公式(4)計(jì)算ID3算法信息增益,根據(jù)公式(24)計(jì)算DTCC算法的信息增益,根據(jù)公式(23)計(jì)算ID3算法公式簡(jiǎn)化后的信息增益,最后按照決策樹建樹規(guī)則,構(gòu)建各自的決策樹,分別如圖1~圖3所示。

    4.2.1 相關(guān)系數(shù)的計(jì)算

    (1)條件屬性“喜歡的季節(jié)”與決策屬性“是否買車”之間相關(guān)系數(shù)的計(jì)算。

    條件屬性“喜歡的季節(jié)”X1與決策屬性“是否買車”Y的聯(lián)合分布律如表4所示。

    Table 4 Joint probability distribution of X1and Y表4 X1與Y的聯(lián)合概率分布

    通過(guò)表4中數(shù)據(jù)計(jì)算可得:

    (2)條件屬性“是否商務(wù)人士”與決策屬性“是否買車”之間相關(guān)系數(shù)的計(jì)算。

    條件屬性“是否商務(wù)人士”X2與決策屬性“是否買車”Y的聯(lián)合分布律如表5所示。

    Table 5 Joint probability distribution of X2 and Y表5 X2與Y的聯(lián)合概率分布

    通過(guò)表5中數(shù)據(jù)計(jì)算可得:

    (3)條件屬性“收入”與決策屬性“是否買車”之間相關(guān)系數(shù)的計(jì)算。

    條件屬性“收入”X3與決策屬性“是否買車”Y的聯(lián)合分布律如表6所示。

    Table 6 Joint probability distribution of X3and Y表6 X3與Y的聯(lián)合概率分布

    通過(guò)表6中數(shù)據(jù)計(jì)算可得:

    (4)條件屬性“駕車水平”與決策屬性“是否買車”之間相關(guān)系數(shù)的計(jì)算。

    條件屬性“駕車水平”X4與決策屬性“是否買車”Y的聯(lián)合分布律如表7所示。

    Table 7 Joint probability distribution of X4and Y表7 X4與Y的聯(lián)合概率分布

    通過(guò)表7中數(shù)據(jù)計(jì)算可得:

    4.2.2 ID3算法及其對(duì)應(yīng)生成的決策樹

    首先計(jì)算屬性的期望需求:

    則相應(yīng)屬性的信息增益為:

    其次,由計(jì)算結(jié)果比較可知:

    因此,依照ID3算法分裂節(jié)點(diǎn)的原則將“喜歡的季節(jié)”屬性作為決策樹的根節(jié)點(diǎn),對(duì)樣本元組進(jìn)行分類。對(duì)分類后形成的子集,用遞歸的方法對(duì)其計(jì)算熵值并進(jìn)行分裂屬性的選擇,最終得到的決策樹如圖1所示。

    Figure 1 Decision tree produced by the ID3 algorithm

    4.2.3 DTCC算法及其對(duì)應(yīng)生成的決策樹

    DTCC算法公式為:

    表1中實(shí)例有兩個(gè)類,即m=2,則公式(20)可變形為:

    按照變形后的公式分別計(jì)算屬性的信息增益:

    Gain(X1=喜歡的季節(jié))′=

    Gain(X2=是否商務(wù)人士)′=

    Gain(X3=收入)′=

    Gain(X4=駕車水平)′=

    比較結(jié)果可知:

    因此,將“收入”作為DTCC算法生成的決策樹的根節(jié)點(diǎn),對(duì)樣本元組進(jìn)行分類。對(duì)分類后形成的子集,用遞歸的方法對(duì)其計(jì)算熵值并進(jìn)行分裂屬性的選擇,最終得到的DTCC算法生成的決策樹如圖2所示。

    Figure 2 Decision tree produced by the DTCC algorithm圖2 DTCC算法生成的決策樹

    4.2.4 只進(jìn)行簡(jiǎn)化操作后的ID3算法及其對(duì)應(yīng)生成的決策樹

    簡(jiǎn)化后的ID3算法公式為:

    表1中實(shí)例有兩個(gè)類,即m=2,則公式(19)可變形為:

    按照變形后的公式分別計(jì)算屬性的信息增益:

    Gain(喜歡的季節(jié))3=

    Gain(是否商務(wù)人士)3=

    Gain(收入)3=

    比較計(jì)算結(jié)果可知:

    按照ID3算法分裂節(jié)點(diǎn)的原則將“喜歡的季節(jié)”屬性作為決策樹的根節(jié)點(diǎn),對(duì)樣本元組進(jìn)行分類。對(duì)分類后形成的子集,用遞歸的方法對(duì)其計(jì)算熵值并進(jìn)行分裂屬性的選擇,最終得到的決策樹如圖3所示。

    Figure 3 Decision tree produced by the ID3 algorithm with its simplified formula

    4.2.5 DTCC算法的實(shí)例分析與總結(jié)

    通過(guò)將圖1~圖3進(jìn)行綜合對(duì)比發(fā)現(xiàn):

    (1)比較圖1和圖2。屬性“喜歡的季節(jié)”屬性值個(gè)數(shù)最多,多值偏向使其成為決策樹的根節(jié)點(diǎn)。“喜歡的季節(jié)”是一種主觀想法,不是購(gòu)車的決定性因素?,F(xiàn)實(shí)生活中,“收入”在一定程度上更能決定是否購(gòu)車。從圖2可看出,DTCC算法令“喜歡的季節(jié)”屬性離決策樹根節(jié)點(diǎn)的距離變遠(yuǎn),降低其重要性;令“收入”屬性作為決策樹根節(jié)點(diǎn),提高其重要性,符合實(shí)際情況,因此DTCC算法在一定程度上克服了多值偏向問(wèn)題。

    (2)比較圖1和圖3。從圖3中可看出,ID3算法公式簡(jiǎn)化后生成的決策樹與原ID3算法生成的決策樹完全一致。表明本文中對(duì)原ID3算法進(jìn)行近似轉(zhuǎn)化的簡(jiǎn)化公式精度較高,能夠與原ID3算法生成的決策樹基本保持一致。

    4.3 實(shí)驗(yàn)及分析

    (1)分類準(zhǔn)確率和葉子節(jié)點(diǎn)數(shù)的比較。

    在表2提供的數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)數(shù)據(jù)測(cè)試,每一個(gè)數(shù)據(jù)集上進(jìn)行10次實(shí)驗(yàn)。在分類準(zhǔn)確率的實(shí)驗(yàn)結(jié)果中,去掉最大數(shù)據(jù)和最小數(shù)據(jù),再求出平均分類準(zhǔn)確率作為最終實(shí)驗(yàn)數(shù)據(jù),可使實(shí)驗(yàn)結(jié)果具有普遍性。

    將每一個(gè)數(shù)據(jù)集分成10個(gè)數(shù)據(jù)組,每個(gè)數(shù)據(jù)組中分別用ID3算法、C4.5算法、文獻(xiàn)[10]算法、文獻(xiàn)[11]算法和DTCC算法構(gòu)建決策樹,每個(gè)數(shù)據(jù)組上均構(gòu)建10次。在葉子節(jié)點(diǎn)數(shù)的實(shí)驗(yàn)結(jié)果中,去掉最大數(shù)據(jù)和最小數(shù)據(jù),再求出平均葉子節(jié)點(diǎn)數(shù)作為該數(shù)據(jù)組的最終數(shù)據(jù)。每個(gè)數(shù)據(jù)集里以數(shù)據(jù)組為最小單位進(jìn)行類似操作,求出其平均葉子節(jié)點(diǎn)數(shù)作為該數(shù)據(jù)集的最終實(shí)驗(yàn)數(shù)據(jù)。實(shí)驗(yàn)結(jié)果如表8和表9所示。

    Table 8 The first part of the experimental results表8 實(shí)驗(yàn)結(jié)果1

    從表8和表9的實(shí)驗(yàn)結(jié)果中可看出:相比于ID3算法、文獻(xiàn)[10]算法、C4.5算法、文獻(xiàn)[11]算法,DTCC算法具有較高的分類準(zhǔn)確率和較少的平均葉子節(jié)點(diǎn)數(shù),并降低了構(gòu)建決策樹的復(fù)雜度。

    Table 9 The second part of the experimental results表9 實(shí)驗(yàn)結(jié)果2

    (2)決策樹生成時(shí)間的比較。

    采用實(shí)例表3中提供的訓(xùn)練集D,分別對(duì)ID3算法、文獻(xiàn)[10]算法、C4.5算法、文獻(xiàn)[11]算法和DTCC算法進(jìn)行10次計(jì)算時(shí)間的測(cè)試,在實(shí)驗(yàn)結(jié)果中去掉最大數(shù)據(jù)和最小數(shù)據(jù),再求出平均時(shí)間作為構(gòu)建決策樹所花費(fèi)的時(shí)間。實(shí)驗(yàn)結(jié)果如圖4所示。圖4中橫坐標(biāo)表示訓(xùn)練集樣本的取值個(gè)數(shù),縱坐標(biāo)表示構(gòu)建決策樹所花費(fèi)的時(shí)間。

    Figure 4 Time comparison of building the decision tree among the five kinds of algorithms

    從圖4中可看出:(1)樣本個(gè)數(shù)偏少時(shí),五種算法花費(fèi)時(shí)間相差不大。(2)從整體上看文獻(xiàn)[10]算法所花費(fèi)的時(shí)間與ID3算法的時(shí)間基本相同。(3)當(dāng)樣本個(gè)數(shù)相同時(shí),DTCC算法和文獻(xiàn)[11]算法構(gòu)建決策樹所花費(fèi)的時(shí)間較少。(4)當(dāng)樣本個(gè)數(shù)達(dá)到一定數(shù)量時(shí),DTCC算法所節(jié)省的時(shí)間隨著樣本個(gè)數(shù)的遞增而變多,這表明:在構(gòu)建大規(guī)模數(shù)據(jù)集的決策樹時(shí),使用DTCC算法能夠節(jié)約更多的時(shí)間。

    4.4 實(shí)驗(yàn)結(jié)論

    結(jié)合圖1~圖3可看出:(1)本文提出的DTCC算法能夠克服多值偏向問(wèn)題;(2)DTCC算法中對(duì)ID3算法公式簡(jiǎn)化的部分,并未降低原ID3算法公式的精度,DTCC算法生成的決策樹與原ID3算法生成的決策樹基本保持一致。

    結(jié)合表8、表9、圖4可看出:(1)文獻(xiàn)[10]算法和C4.5算法雖然分類精度較高,但決策樹建立時(shí)間較長(zhǎng)。(2)文獻(xiàn)[11]算法決策樹建立時(shí)間較短,但分類精度較低。(3)本文提出DTCC算法,繼承了以上各算法的長(zhǎng)處,實(shí)驗(yàn)結(jié)果分析表明:DTCC算法具有較高的分類精度;平均葉子節(jié)點(diǎn)數(shù)較少,使構(gòu)造的決策樹有較低的復(fù)雜性,因而使決策樹建立時(shí)間較少;此外還能克服ID3算法的多值偏向問(wèn)題。

    5 結(jié)束語(yǔ)

    本文通過(guò)引進(jìn)概率論中相關(guān)系數(shù)的概念,基于相關(guān)系數(shù)提出了一種新的決策樹優(yōu)化算法——DTCC算法,相關(guān)系數(shù)能夠客觀反映條件屬性和決策屬性之間聯(lián)系的緊密程度,既不受屬性取值個(gè)數(shù)的影響,且不需要用戶提供先驗(yàn)知識(shí)或領(lǐng)域知識(shí),又能避免因?yàn)橹饔^的人為因素所受到的干擾和影響。本文用相關(guān)系數(shù)代替依靠先驗(yàn)知識(shí)的用戶興趣度之類的權(quán)值參數(shù),以克服ID3算法的多值偏向問(wèn)題。再利用泰勒公式和麥克勞林展開(kāi)公式得到近似公式,以完成對(duì)信息增益公式的近似轉(zhuǎn)換,這樣既保證簡(jiǎn)化后的算法保留較高的精度,且以信息熵計(jì)算為基礎(chǔ),又能夠消除函數(shù)中復(fù)雜的對(duì)數(shù)運(yùn)算,提高算法執(zhí)行效率。

    實(shí)驗(yàn)結(jié)果分析表明,相比于原ID3算法以及ID3相關(guān)的改進(jìn)算法,DTCC算法具有更高的平均分類精確度,較低的決策樹構(gòu)建復(fù)雜度,更少的決策樹生成時(shí)間。當(dāng)數(shù)據(jù)集的樣本數(shù)偏大時(shí),DTCC算法的效率和性能能夠得到明顯的提高。

    [1] Ji Xi-yu,Han Qiu-ming,Li Wei,et al.Data mining technology application examples[M].Beijing:Mechanical Industry Press,2009.(in Chinese)

    [2] Chen An, Chen Ning, Zhou Long-xiang, et al.Data mining technologies and application[M].Beijing:Science Press,2006.(in Chinese)

    [3] Quinlan J R. Induction of decision trees[J]. Machine Learning,1986,1(1):81-106.

    [4] Wang Miao,Chai Rui-min.An improved decision tree classification attribute selection method[J] .Computer Engineering and Applications,2010,46(8):127-129.(in Chinese)

    [5] Li Xiao-wei,Chen Fu-cai, Li Shao-mei. Improved C4.5 decision tree algorithm based on classification rules[J]. Computer Engineering and Design,2013,34(12):4321-4325.(in Chinese)

    [6] Wang Yong-mei,Hu Xue-gang.Research of ID3 algorithm in decision tree[J]. Journal of Anhui University (Natural Science Edition),2011,35(3):71-75.(in Chinese)

    [7] Wang Yong-mei,Hu Xue-gang.Improved decision tree algorithm based on user-interest and MID3[J].Computer Engineering and Applications,2011,47(27):155-157.(in Chinese)

    [8] Liu Yu-xun,Xie Niu-niu. Improved ID3 algorithm[C]∥Proc of the 3rd IEEE International Conference on Computer Science and Information Technology (ICCSIT 2010),2010:465-468.

    [9] Qu Kai-she,Cheng Wen-li,Wang Jun-hong. Improved algorithm based on ID3[J].Computer Engineering and Applications,2003,39(25):104-107.(in Chinese)

    [10] Zhang Chun-li,Zhang Lei.A new ID3 algorithm based on revised information gain[J]. Computer Engineering & Science,2008,30(11):46-47.(in Chinese)

    [11] Zhao Xiang,Qi Yun-song,Liu Tong-ming.Application of covariace and correlativity coefficient to the designing of decision trees[J].Journal of East China Shipbuilding Institute (Natural Science Edition),2003,17(5):57-60.(in Chinese)

    [12] Zhang Ming-wei,Wang Bo,Zhang Bin,et al.Weighted naive Bayes classification algorithm based on correlation coefficients[J].Journal of Northeastern University(Natural Science),2008,29(7):952-955.(in Chinese)

    [13] Ye Ming-quan,Hu Xue-gang.One improve decision tree algorithm based on grey relation degree[J].Computer Engineering and Applications,2007,43(32):171-173.(in Chinese)

    [14] Huang Yu-da,Fan Tai-hua.ID3 algorithm for decision tree analysis and optimization[J]. Computer Engineering and Design,2012,33(8):3089-3093.(in Chinese)

    [15] Sheng Zhou,Xie Shi-qian,Pan Cheng-yi.probabitity theory and mathematical statistics[M]. Beijing:Higher Education Press,2008.(in Chinese)

    [16] Department of Mathematics’ Tongji University.Mathematics:Volume One[M]. Beijing:Higher Education Press,2007.(in Chinese)

    [17] Han Song-lai, Zhang Hui, Zhou Hua-ping. Decision tree classification algorithm based on correlate degree function[J].Computer Application,2005,25(11):2655-2657.(in Chinese)

    [18] Hu X,Cercone N.Data mining via generalization,discrimination and rough set feature selection[J].Knowledge and Information System:An International Journal,1999,1(1):21-27.

    [19] Huang Yu-da, Wang Yi-ran. Decision tree classification based on naive Bayesian and ID3 Algorithm[J]. Computer Engineering,2012,38(14):41-47.(in Chinese)

    附中文參考文獻(xiàn):

    [1] 紀(jì)希禹,韓秋明,李微,等. 數(shù)據(jù)挖掘技術(shù)應(yīng)用實(shí)例[M].北京:機(jī)械工業(yè)出版社,2009.

    [2] 陳安,陳寧,周龍?bào)J,等. 數(shù)據(jù)挖掘技術(shù)及應(yīng)用[M]. 北京:科學(xué)出版社,2006.

    [4] 王苗,柴瑞敏. 一種改進(jìn)的決策樹分類屬性選擇方法[J]. 計(jì)算機(jī)工程與應(yīng)用,2010,46(8):127-129.

    [5] 李孝偉,陳福才,李邵梅. 基于分類規(guī)則的 C4. 5 決策樹改進(jìn)算法[J]. 計(jì)算機(jī)工程與設(shè)計(jì),2013,34(12):4321-4325.

    [6] 王永梅,胡學(xué)鋼. 決策樹中ID3算法的研究[J]. 安徽大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,35(3):71-75.

    [7] 王永梅,胡學(xué)鋼. 基于用戶興趣度和 MID3 決策樹改進(jìn)方法[J].計(jì)算機(jī)工程與應(yīng)用,2011,47(27):155-157.

    [9] 曲開(kāi)社,成文麗,王俊紅.ID3 算法的一種改進(jìn)算法[J].計(jì)算機(jī)工程與應(yīng)用,2003,39(25):104-107.

    [10] 張春麗,張磊. 一種基于修正信息增益的ID3算法[J]. 計(jì)算機(jī)工程與科學(xué),2008,30(11):46-47.

    [11] 趙翔,祁云嵩,劉同明. 協(xié)方差及相關(guān)系數(shù)在決策樹構(gòu)造中的應(yīng)用[J]. 華東船舶工業(yè)學(xué)院學(xué)報(bào)(自然科學(xué)版),2003,17(5):57-60.

    [12] 張明衛(wèi),王波,張斌,等. 基于相關(guān)系數(shù)的加權(quán)樸素貝葉斯分類算法[J]. 東北大學(xué)學(xué)報(bào)(自然科學(xué)版),2008,29(7):952-955.

    [13] 葉明全,胡學(xué)鋼.一種基于灰色關(guān)聯(lián)度的決策樹改進(jìn)算法[J]. 計(jì)算機(jī)工程與應(yīng)用,2007,43(32):171-173.

    [14] 黃宇達(dá),范太華. 決策樹 ID3 算法的分析與優(yōu)化[J]. 計(jì)算機(jī)工程與設(shè)計(jì),2012,33(8):3089-3093.

    [15] 盛驟,謝式千,潘承毅. 概率論與數(shù)理統(tǒng)計(jì)[M].北京:高等教育出版社,2008.

    [16] 同濟(jì)大學(xué)數(shù)學(xué)系.高等數(shù)學(xué):上冊(cè)[M].北京:高等教育出版社,2007.

    [17] 韓松來(lái),張輝,周華平. 基于關(guān)聯(lián)度函數(shù)的決策樹分類算法[J]. 計(jì)算機(jī)應(yīng)用,2005,25(11):2655-2657.

    [19] 黃宇達(dá),王迤冉. 基于樸素貝葉斯與 ID3 算法的決策樹分類[J]. 計(jì)算機(jī)工程,2012,38(14):41-47.

    董躍華(1964-),女,河北樂(lè)亭人,副教授,研究方向?yàn)閿?shù)據(jù)挖掘、軟件工程和軟件測(cè)試。E-mail:4490367@qq.com

    DONG Yue-hua,born in 1964,associate professor,her research interests include data mining, software engineering, and software testing.

    劉力(1990-),男,湖北黃岡人,碩士生,研究方向?yàn)閿?shù)據(jù)挖掘。E-mail:931667596@qq.com

    LIU Li,born in 1990,MS candidate,his research interest includes data mining.

    An optimized algorithm of decision tree based on correlation coefficients

    DONG Yue-hua,LIU Li

    (School of Information Engineering,Jiangxi University of Science and Technology,Ganzhou 341000,China)

    Aiming at the problem of multi-value bias in ID3 algorithm, we propose an optimized algorithm of decision tree based on correlation coefficients. Firstly, the correlation coefficients between the attributes are introduced to improve the ID3 algorithm, and in turn the multi-value bias problem is overcome. Then the properties of Taylor formula and Maclaurin formula are adopted to simplify the information gain formula. The concrete data of examples prove that the optimized ID3 algorithm can overcome multi-value bias problem. Experiments on the standard UCI data sets show that the optimized algorithm of decision tree not only improves the accuracy of average classification, but also reduces the complexity in building decision trees and thus reduces the generation time of decision trees. Besides, the efficiency of the optimized ID3 algorithm increases significantly for large scale samples.

    ID3 algorithm;correlation coefficient;decision tree;Taylor formula;information gain

    1007-130X(2015)09-1783-11

    2014-08-25;

    2014-12-29

    TP301.6

    A

    10.3969/j.issn.1007-130X.2015.09.030

    通信地址:341000 江西省贛州市章貢區(qū)紅旗大道86號(hào)江西理工大學(xué)信息工程學(xué)院

    Address:School of Information Engineering,Jiangxi University of Science and Technology,86 Hongqi Avenue,Zhanggong District,Ganzhou 341000,Jiangxi,P.R.China

    猜你喜歡
    偏向信息熵決策樹
    基于信息熵可信度的測(cè)試點(diǎn)選擇方法研究
    8~12歲兒童抑郁與認(rèn)知重評(píng)的關(guān)系:悲傷面孔注意偏向的中介作用*
    “偏向”不是好導(dǎo)向
    一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹算法
    考核偏向:錯(cuò)把經(jīng)過(guò)當(dāng)結(jié)果
    決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
    電子制作(2018年16期)2018-09-26 03:27:06
    基于信息熵的實(shí)驗(yàn)教學(xué)量化研究
    一種基于信息熵的雷達(dá)動(dòng)態(tài)自適應(yīng)選擇跟蹤方法
    基于決策樹的出租車乘客出行目的識(shí)別
    基于信息熵的IITFN多屬性決策方法
    我的老师免费观看完整版| 久久影院123| 免费观看性生交大片5| 在现免费观看毛片| 晚上一个人看的免费电影| 97在线人人人人妻| 女人久久www免费人成看片| 亚洲精品视频女| 色吧在线观看| 午夜老司机福利剧场| 欧美极品一区二区三区四区| 国产成人一区二区在线| 亚洲欧美日韩无卡精品| 亚洲av电影在线观看一区二区三区| 下体分泌物呈黄色| 80岁老熟妇乱子伦牲交| 亚洲av日韩在线播放| 亚洲av男天堂| 性色avwww在线观看| 秋霞在线观看毛片| 亚洲人成网站在线观看播放| 男女边摸边吃奶| 少妇的逼好多水| 美女cb高潮喷水在线观看| 99久久人妻综合| 少妇高潮的动态图| 欧美bdsm另类| 王馨瑶露胸无遮挡在线观看| 丝袜喷水一区| 天堂中文最新版在线下载| 亚洲国产av新网站| 美女福利国产在线 | 亚洲人成网站在线观看播放| 久久久午夜欧美精品| 多毛熟女@视频| 日本欧美国产在线视频| 在线观看一区二区三区激情| 免费av不卡在线播放| 男女下面进入的视频免费午夜| 最近中文字幕高清免费大全6| 天堂俺去俺来也www色官网| 赤兔流量卡办理| 国产永久视频网站| 青春草亚洲视频在线观看| 日本与韩国留学比较| 精品久久久久久久久av| 51国产日韩欧美| 新久久久久国产一级毛片| 女性生殖器流出的白浆| 99久久中文字幕三级久久日本| 18禁在线无遮挡免费观看视频| 纯流量卡能插随身wifi吗| 高清在线视频一区二区三区| 美女国产视频在线观看| 边亲边吃奶的免费视频| 久久久午夜欧美精品| 亚洲精品日韩在线中文字幕| 亚洲av.av天堂| 国国产精品蜜臀av免费| 99久久精品国产国产毛片| 亚洲精品中文字幕在线视频 | 成人特级av手机在线观看| 久久韩国三级中文字幕| 欧美精品亚洲一区二区| 青春草国产在线视频| 亚洲欧美日韩另类电影网站 | 91aial.com中文字幕在线观看| 噜噜噜噜噜久久久久久91| 亚洲人与动物交配视频| 蜜桃在线观看..| 日产精品乱码卡一卡2卡三| 搡老乐熟女国产| 亚洲欧美日韩另类电影网站 | 日韩av免费高清视频| 麻豆成人午夜福利视频| 国产伦理片在线播放av一区| 日本与韩国留学比较| 天美传媒精品一区二区| 久久精品国产a三级三级三级| av天堂中文字幕网| av免费在线看不卡| 水蜜桃什么品种好| 亚洲性久久影院| 亚洲精品日韩av片在线观看| 一级毛片我不卡| av在线老鸭窝| 汤姆久久久久久久影院中文字幕| 久久精品久久精品一区二区三区| 老女人水多毛片| 欧美三级亚洲精品| 日韩强制内射视频| 精品99又大又爽又粗少妇毛片| 亚洲国产日韩一区二区| 亚洲av.av天堂| 日本欧美国产在线视频| 在线观看免费视频网站a站| 国产永久视频网站| 欧美zozozo另类| 亚洲图色成人| 日韩一本色道免费dvd| 91久久精品国产一区二区三区| 99热这里只有是精品在线观看| 国产伦在线观看视频一区| 五月伊人婷婷丁香| 99久久精品国产国产毛片| 免费人成在线观看视频色| 久久精品人妻少妇| 国产精品精品国产色婷婷| 一级av片app| 网址你懂的国产日韩在线| 日日撸夜夜添| 丝袜脚勾引网站| 欧美高清成人免费视频www| 街头女战士在线观看网站| 最近中文字幕高清免费大全6| 国产久久久一区二区三区| 欧美区成人在线视频| 国产一区亚洲一区在线观看| 国产成人aa在线观看| 91狼人影院| 精品国产乱码久久久久久小说| 国产免费一区二区三区四区乱码| 国产色婷婷99| 欧美日韩在线观看h| 午夜免费鲁丝| av在线app专区| 午夜福利在线观看免费完整高清在| 国产精品免费大片| 蜜桃久久精品国产亚洲av| 国产有黄有色有爽视频| 精品久久国产蜜桃| 久久久久久人妻| 午夜福利在线观看免费完整高清在| 欧美少妇被猛烈插入视频| 欧美3d第一页| 亚洲成色77777| 国产精品人妻久久久影院| 熟女人妻精品中文字幕| 久久鲁丝午夜福利片| 久久99热这里只有精品18| 一本一本综合久久| 国产毛片在线视频| 精品一区二区免费观看| 日韩 亚洲 欧美在线| 亚洲性久久影院| 搡女人真爽免费视频火全软件| 国产在视频线精品| 中文资源天堂在线| 成人国产麻豆网| 99久久精品国产国产毛片| 久久毛片免费看一区二区三区| 少妇人妻一区二区三区视频| 亚洲四区av| 另类亚洲欧美激情| 最新中文字幕久久久久| 亚洲人与动物交配视频| 亚洲国产日韩一区二区| 精品久久久久久久久av| 99久久人妻综合| 中文天堂在线官网| 91在线精品国自产拍蜜月| 乱码一卡2卡4卡精品| 交换朋友夫妻互换小说| 一级毛片久久久久久久久女| 少妇精品久久久久久久| 深夜a级毛片| 亚洲综合精品二区| 国产一区二区三区综合在线观看 | 国产成人午夜福利电影在线观看| 美女国产视频在线观看| 热re99久久精品国产66热6| 免费av不卡在线播放| 多毛熟女@视频| 亚洲av不卡在线观看| 欧美日韩一区二区视频在线观看视频在线| 少妇裸体淫交视频免费看高清| 精品亚洲乱码少妇综合久久| av在线观看视频网站免费| 日日摸夜夜添夜夜爱| 男女下面进入的视频免费午夜| av国产精品久久久久影院| 一个人免费看片子| 日本av免费视频播放| 免费观看无遮挡的男女| 成人午夜精彩视频在线观看| 搡女人真爽免费视频火全软件| 亚洲欧美中文字幕日韩二区| 少妇高潮的动态图| 大片电影免费在线观看免费| 欧美成人午夜免费资源| 免费高清在线观看视频在线观看| 国产精品熟女久久久久浪| 亚洲欧美成人精品一区二区| 色婷婷av一区二区三区视频| 国产精品一二三区在线看| 久久女婷五月综合色啪小说| 久久ye,这里只有精品| 国产久久久一区二区三区| 久久热精品热| 毛片女人毛片| 精品酒店卫生间| 欧美精品国产亚洲| 国产精品伦人一区二区| 我的老师免费观看完整版| 嫩草影院新地址| 亚洲av成人精品一区久久| 欧美精品一区二区免费开放| 水蜜桃什么品种好| 免费观看在线日韩| 青青草视频在线视频观看| 国产日韩欧美亚洲二区| 黄片无遮挡物在线观看| 亚洲国产精品成人久久小说| av天堂中文字幕网| 久久97久久精品| 黄色欧美视频在线观看| 99热国产这里只有精品6| 人妻少妇偷人精品九色| 熟女电影av网| 啦啦啦视频在线资源免费观看| 国产色婷婷99| 七月丁香在线播放| 中文字幕亚洲精品专区| 亚洲一区二区三区欧美精品| 久久国内精品自在自线图片| 人人妻人人爽人人添夜夜欢视频 | 成人漫画全彩无遮挡| 国产日韩欧美亚洲二区| 99热国产这里只有精品6| 成年人午夜在线观看视频| 国产av一区二区精品久久 | 亚洲欧美清纯卡通| 国产69精品久久久久777片| 99re6热这里在线精品视频| 3wmmmm亚洲av在线观看| 精品久久久精品久久久| 久久精品熟女亚洲av麻豆精品| 午夜福利网站1000一区二区三区| 麻豆国产97在线/欧美| 久久人人爽人人片av| 欧美+日韩+精品| 久久国产乱子免费精品| 色视频在线一区二区三区| 在线亚洲精品国产二区图片欧美 | 国产男人的电影天堂91| 国产亚洲精品久久久com| 免费少妇av软件| 免费高清在线观看视频在线观看| 亚洲aⅴ乱码一区二区在线播放| 妹子高潮喷水视频| 黄色日韩在线| 亚州av有码| 美女cb高潮喷水在线观看| 狠狠精品人妻久久久久久综合| 岛国毛片在线播放| 免费观看a级毛片全部| 亚洲精品国产色婷婷电影| 韩国高清视频一区二区三区| 寂寞人妻少妇视频99o| 亚洲色图综合在线观看| 欧美+日韩+精品| 免费久久久久久久精品成人欧美视频 | 内地一区二区视频在线| 国产 一区精品| 成年人午夜在线观看视频| 亚洲av二区三区四区| 欧美一区二区亚洲| 日韩在线高清观看一区二区三区| 精品久久国产蜜桃| 日韩电影二区| 18禁裸乳无遮挡动漫免费视频| 18禁动态无遮挡网站| 日韩av不卡免费在线播放| 欧美日韩国产mv在线观看视频 | 亚洲成人中文字幕在线播放| 久久亚洲国产成人精品v| 大陆偷拍与自拍| 色吧在线观看| 五月天丁香电影| 国产在线免费精品| 日本猛色少妇xxxxx猛交久久| 免费黄色在线免费观看| 黄色一级大片看看| 精品午夜福利在线看| 99热这里只有是精品在线观看| 国产黄片美女视频| 国国产精品蜜臀av免费| 熟妇人妻不卡中文字幕| 日韩av在线免费看完整版不卡| 2018国产大陆天天弄谢| 99热6这里只有精品| 黄色配什么色好看| 国产一区二区在线观看日韩| 午夜福利影视在线免费观看| 午夜视频国产福利| 久久精品国产自在天天线| 国产 精品1| 亚洲中文av在线| 夫妻午夜视频| 欧美成人午夜免费资源| 在线观看av片永久免费下载| 国产精品久久久久久av不卡| 日韩电影二区| 男女下面进入的视频免费午夜| 国产精品久久久久久精品电影小说 | 国产色爽女视频免费观看| 人体艺术视频欧美日本| 99久久中文字幕三级久久日本| 大片免费播放器 马上看| 国产 一区 欧美 日韩| 男女啪啪激烈高潮av片| 国产精品精品国产色婷婷| 国产欧美日韩一区二区三区在线 | 美女高潮的动态| 人人妻人人澡人人爽人人夜夜| 自拍欧美九色日韩亚洲蝌蚪91 | 欧美日韩亚洲高清精品| 全区人妻精品视频| 欧美精品国产亚洲| 三级国产精品片| 亚洲经典国产精华液单| 亚洲国产欧美人成| 女的被弄到高潮叫床怎么办| 欧美三级亚洲精品| 18禁在线播放成人免费| 久久久欧美国产精品| 777米奇影视久久| 日日啪夜夜爽| 国产精品av视频在线免费观看| 国产精品久久久久久精品古装| 亚洲av中文av极速乱| 男人爽女人下面视频在线观看| 在线天堂最新版资源| 精品久久久久久久末码| 精品国产一区二区三区久久久樱花 | 国产v大片淫在线免费观看| 久久久午夜欧美精品| 亚洲欧美一区二区三区国产| 亚洲精品自拍成人| 99热6这里只有精品| 日韩人妻高清精品专区| 国产黄色视频一区二区在线观看| 亚洲精品亚洲一区二区| 免费黄色在线免费观看| av在线观看视频网站免费| 亚洲欧美日韩另类电影网站 | 2021少妇久久久久久久久久久| 欧美区成人在线视频| 国产免费一区二区三区四区乱码| 99视频精品全部免费 在线| 精品久久久久久久末码| 国产av码专区亚洲av| 最后的刺客免费高清国语| av天堂中文字幕网| 日本一二三区视频观看| 日本-黄色视频高清免费观看| 国语对白做爰xxxⅹ性视频网站| 成人亚洲欧美一区二区av| 少妇猛男粗大的猛烈进出视频| 免费大片黄手机在线观看| 免费观看性生交大片5| 国产在线视频一区二区| 91精品国产国语对白视频| 日本黄色日本黄色录像| 毛片一级片免费看久久久久| 欧美区成人在线视频| 日韩欧美精品免费久久| 免费观看在线日韩| 国产精品久久久久久精品电影小说 | 在线观看免费高清a一片| 少妇高潮的动态图| 日韩欧美精品免费久久| 亚洲欧美精品自产自拍| av女优亚洲男人天堂| 中文天堂在线官网| 韩国av在线不卡| 国产极品天堂在线| 蜜桃亚洲精品一区二区三区| 少妇人妻 视频| 成年av动漫网址| 草草在线视频免费看| 内地一区二区视频在线| 中国三级夫妇交换| 精品视频人人做人人爽| 伦理电影免费视频| 99re6热这里在线精品视频| 久久久久久久精品精品| 亚洲经典国产精华液单| 我要看黄色一级片免费的| 国产免费福利视频在线观看| 日韩 亚洲 欧美在线| 亚洲精品亚洲一区二区| 一级av片app| 少妇被粗大猛烈的视频| 直男gayav资源| 色吧在线观看| av免费在线看不卡| 97在线人人人人妻| 欧美精品国产亚洲| 国产精品人妻久久久久久| 我要看日韩黄色一级片| 99re6热这里在线精品视频| 91在线精品国自产拍蜜月| 亚洲中文av在线| 国精品久久久久久国模美| 日韩欧美一区视频在线观看 | 又粗又硬又长又爽又黄的视频| 老熟女久久久| 亚洲美女视频黄频| 精品亚洲乱码少妇综合久久| 啦啦啦在线观看免费高清www| 美女中出高潮动态图| 97在线视频观看| 97超碰精品成人国产| 久久综合国产亚洲精品| 免费大片黄手机在线观看| av卡一久久| 性高湖久久久久久久久免费观看| 最近手机中文字幕大全| 纵有疾风起免费观看全集完整版| 国产视频内射| 美女主播在线视频| 亚洲精品一区蜜桃| 国产国拍精品亚洲av在线观看| 欧美变态另类bdsm刘玥| 久久久久久久精品精品| 黑丝袜美女国产一区| 最近手机中文字幕大全| 日韩人妻高清精品专区| 一级av片app| 亚洲av成人精品一二三区| 亚洲美女搞黄在线观看| 国产一区亚洲一区在线观看| 久久毛片免费看一区二区三区| 青青草视频在线视频观看| 欧美激情极品国产一区二区三区 | 中文天堂在线官网| 妹子高潮喷水视频| 久久久成人免费电影| 国产 一区 欧美 日韩| 一边亲一边摸免费视频| 国产伦在线观看视频一区| 一二三四中文在线观看免费高清| 免费观看av网站的网址| 狂野欧美激情性bbbbbb| 国产精品无大码| 丝瓜视频免费看黄片| 黑人高潮一二区| 久热这里只有精品99| 国产精品精品国产色婷婷| 欧美激情极品国产一区二区三区 | 亚洲精品视频女| 男人狂女人下面高潮的视频| 99热网站在线观看| a级一级毛片免费在线观看| 一级毛片久久久久久久久女| av福利片在线观看| 下体分泌物呈黄色| 日本色播在线视频| 国产日韩欧美亚洲二区| 久久久精品94久久精品| 看免费成人av毛片| 婷婷色综合www| 日韩av在线免费看完整版不卡| 免费观看的影片在线观看| .国产精品久久| 亚洲精品日本国产第一区| av在线观看视频网站免费| 在线亚洲精品国产二区图片欧美 | 视频区图区小说| 国产成人a区在线观看| 国产精品爽爽va在线观看网站| 久久这里有精品视频免费| 午夜激情久久久久久久| 人妻少妇偷人精品九色| 国产久久久一区二区三区| 这个男人来自地球电影免费观看 | av在线观看视频网站免费| 亚洲av免费高清在线观看| 最近中文字幕2019免费版| 亚洲成人手机| 伦理电影大哥的女人| 亚洲精品久久午夜乱码| 91狼人影院| 久久久久精品久久久久真实原创| 日本黄色片子视频| 亚洲精品久久久久久婷婷小说| 下体分泌物呈黄色| 边亲边吃奶的免费视频| 国产片特级美女逼逼视频| 日韩人妻高清精品专区| 欧美极品一区二区三区四区| 午夜激情久久久久久久| 国产在线视频一区二区| 热99国产精品久久久久久7| 欧美亚洲 丝袜 人妻 在线| 亚洲不卡免费看| 欧美精品国产亚洲| 十八禁网站网址无遮挡 | 99热这里只有是精品50| 深爱激情五月婷婷| 最近中文字幕2019免费版| 久久精品夜色国产| 草草在线视频免费看| 成年女人在线观看亚洲视频| 亚洲,一卡二卡三卡| 肉色欧美久久久久久久蜜桃| 色视频www国产| 久久99热这里只有精品18| 久久久精品免费免费高清| 日日摸夜夜添夜夜爱| av在线蜜桃| 啦啦啦啦在线视频资源| 亚洲av男天堂| 欧美高清成人免费视频www| 亚洲成人手机| 亚洲精品视频女| 国产久久久一区二区三区| 国产精品三级大全| 看十八女毛片水多多多| 人妻少妇偷人精品九色| 精品国产三级普通话版| h视频一区二区三区| 免费观看无遮挡的男女| 男的添女的下面高潮视频| 亚洲国产成人一精品久久久| 高清av免费在线| 十八禁网站网址无遮挡 | 精品视频人人做人人爽| 欧美zozozo另类| 亚洲精品aⅴ在线观看| 免费看日本二区| 亚洲av福利一区| 亚洲最大成人中文| 色婷婷久久久亚洲欧美| 美女主播在线视频| h视频一区二区三区| 国产成人免费无遮挡视频| 成人毛片a级毛片在线播放| 午夜精品国产一区二区电影| 夫妻午夜视频| 免费av不卡在线播放| 少妇人妻精品综合一区二区| 色婷婷av一区二区三区视频| 日日摸夜夜添夜夜添av毛片| 亚洲综合精品二区| 日本av免费视频播放| 欧美一级a爱片免费观看看| 综合色丁香网| 成人毛片60女人毛片免费| 极品教师在线视频| 欧美精品国产亚洲| 少妇高潮的动态图| 51国产日韩欧美| 少妇人妻久久综合中文| 国产伦理片在线播放av一区| 毛片女人毛片| 日韩中字成人| 在线观看免费视频网站a站| 国产精品久久久久久av不卡| 婷婷色麻豆天堂久久| 中文在线观看免费www的网站| 国产精品女同一区二区软件| 亚洲av日韩在线播放| 亚洲精品国产av蜜桃| 有码 亚洲区| 欧美最新免费一区二区三区| 天堂俺去俺来也www色官网| 亚洲自偷自拍三级| 欧美激情极品国产一区二区三区 | 看非洲黑人一级黄片| 99久久精品一区二区三区| 国产免费一区二区三区四区乱码| 在线观看免费日韩欧美大片 | 亚洲精品一区蜜桃| 偷拍熟女少妇极品色| 精品熟女少妇av免费看| 亚洲av不卡在线观看| 久久久精品94久久精品| 在线天堂最新版资源| 如何舔出高潮| 国产精品欧美亚洲77777| 人人妻人人澡人人爽人人夜夜| 国产乱来视频区| 亚洲精品乱久久久久久| 日韩,欧美,国产一区二区三区| 国产美女午夜福利| 国产精品一及| 伊人久久精品亚洲午夜| 国产精品一区www在线观看| 日本vs欧美在线观看视频 | 观看av在线不卡| 成人一区二区视频在线观看| av国产久精品久网站免费入址| 亚洲美女黄色视频免费看| 美女中出高潮动态图| videossex国产| 国产 一区精品| 国产伦精品一区二区三区四那| 最后的刺客免费高清国语| 免费观看a级毛片全部| 午夜视频国产福利| 夜夜骑夜夜射夜夜干| 日本午夜av视频| 人人妻人人看人人澡| 插阴视频在线观看视频| 91午夜精品亚洲一区二区三区| 蜜桃亚洲精品一区二区三区| 精品一区二区免费观看| 亚洲av成人精品一区久久| 免费久久久久久久精品成人欧美视频 | 亚洲精品国产av蜜桃| 国产男人的电影天堂91| 在线播放无遮挡| 91精品国产国语对白视频|