• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    一種增量發(fā)現(xiàn)條件函數(shù)依賴的算法*

    2013-09-05 06:35:54李丁月劉建勛翟海軍
    計算機工程與科學 2013年8期
    關(guān)鍵詞:元組原始數(shù)據(jù)集上

    李丁月,劉建勛,翟海軍

    (1.湘潭大學信息工程學院,湖南 湘潭411100;2.湖南科技大學知識處理與網(wǎng)絡(luò)化制造湖南省教育廳重點實驗室,湖南 湘潭411100)

    1 引言

    隨著信息技術(shù)的快速發(fā)展,人類社會累積的數(shù)據(jù)每年都在呈指數(shù)上漲,這些數(shù)據(jù)中存在大量錯誤、不一致以及冗余的數(shù)據(jù),即“臟數(shù)據(jù)”[1]?!芭K數(shù)據(jù)”從各個方面影響組織的運作、收入和效率。據(jù)估計,美國政府每年在改善數(shù)據(jù)質(zhì)量方面的花費達到了近600億美元[2]。數(shù)據(jù)清除的目的是解決“臟數(shù)據(jù)”問題,檢測和修改數(shù)據(jù)中的錯誤、不一致和重復(fù)數(shù)據(jù),從而提高數(shù)據(jù)質(zhì)量[3]。

    數(shù)據(jù)質(zhì)量的主要評價指標包括以下幾個方面:一致性(Consistency)、正確性(Correctness)、完整性(Completeness)和最小性(Minimality)[1]。其中,如何解決數(shù)據(jù)的不一致性問題是近年數(shù)據(jù)庫研究領(lǐng)域的一個熱門課題。早期,研究人員主要采用函數(shù)依賴FDs(Functional Dependencies)來檢測和修改不一致數(shù)據(jù)。其中,文獻[4~6]提出了一些自動從關(guān)系數(shù)據(jù)庫中發(fā)現(xiàn)函數(shù)依賴的方法。函數(shù)依賴可以有效地進行模式發(fā)現(xiàn),然而,其在抓取數(shù)據(jù)中的語義方面往往無能為力。表1描述的記錄出自1994年美國Adult Census數(shù)據(jù)庫,其中包括work class(WC)、education(ED)、marital status(MS)、occupation(OCC)、relationship(REL)、sex(SEX)、native-country(NC)七個屬性。表1中存在一些不一致數(shù)據(jù)。例如,在Tuple為t5的記錄中,REL屬性的取值是 Wife,SEX屬性的取值是Male。很明顯,這條記錄中存在不一致數(shù)據(jù),SEX屬性的正確取值應(yīng)是female。類似于表1中的這種數(shù)據(jù)不一致情形在現(xiàn)實數(shù)據(jù)中大量地存在,但是利用函數(shù)依賴無法有效檢測出這些不一致的數(shù)據(jù)。找到一種能夠自動檢測和修改不一致數(shù)據(jù)的方法成為急需解決的問題。

    文獻[7]在函數(shù)依賴的基礎(chǔ)上,提出了條件函數(shù)依賴 CFDs(Conditional Functional Dependencies)的概念,并將其應(yīng)用于檢測和修改不一致數(shù)據(jù)。條件函數(shù)依賴通過綁定關(guān)系中的屬性及其語義相關(guān)的數(shù)據(jù),來定義滿足約束的數(shù)據(jù)應(yīng)用模式,從而檢測不符合依賴形式的數(shù)據(jù)。因此,條件函數(shù)依賴比函數(shù)依賴的數(shù)據(jù)約束能力更強,能更有效地修復(fù)不一致數(shù)據(jù)。

    目前,國內(nèi)外學者對條件函數(shù)依賴開展了一系列的研究工作。其中,文獻[7~9]對條件函數(shù)依賴理論及其應(yīng)用做了相關(guān)介紹。文獻[10~13]提出了一些從數(shù)據(jù)集中發(fā)現(xiàn)條件函數(shù)依賴的方法。這些方法主要側(cè)重于提高條件函數(shù)依賴的精確度和減少執(zhí)行時間,其無法快速更新、維護和管理已挖掘出來的條件函數(shù)依賴。例如,當數(shù)據(jù)集上增加一個新數(shù)據(jù)時,已有的方法必須將新增數(shù)據(jù)集與原始數(shù)據(jù)集進行合并,再對合并后的整個數(shù)據(jù)集重新執(zhí)行發(fā)現(xiàn)過程,才能更新CFDs,但這將導(dǎo)致大部分時間都浪費在對已處理數(shù)據(jù)集的重復(fù)計算上。

    針對條件函數(shù)依賴的更新問題,本文借鑒增量更新思想提出一種增量更新條件函數(shù)依賴的方法,并在條件函數(shù)依賴的發(fā)現(xiàn)方法[11](簡稱CFINDER算法)的基礎(chǔ)上實現(xiàn)了條件函數(shù)依賴增量更新算法CFUP。當數(shù)據(jù)集上增加一批新的數(shù)據(jù)時,CFUP算法通過掃描新增數(shù)據(jù)集,來判定原數(shù)據(jù)集上的CFDs在更新后的數(shù)據(jù)集上是否有效,是否產(chǎn)生了新的CFDs,從而達到更新CFDs的目的。最后,通過實驗對CFUP算法和重新運行的CFINDER算法進行性能比較,實驗表明CFUP算法比重新運行CFINDER算法在時間上更有效。

    2 基本概念

    定義1 (條件函數(shù)依賴)[14]在關(guān)系模式R上成立的條件函數(shù)依賴φ表示為(R:X→Y,Tp),其中:

    (1)X、Y表示關(guān)系R上的屬性集合。

    (2)X→Y表示一個嵌入φ的函數(shù)依賴。

    (3)Tp是X∪Y 屬性集上的模式組(Pattern Tableau),由若干模式元組tp組成。tp定義了相關(guān)屬性在取值上的約束條件,可以是對應(yīng)屬性可取域中的某個常量,也可以是對應(yīng)屬性可取域中的任意值,用“_”表示任意值 。

    從以上定義可以看出,Tp通過綁定屬性及其取值,來指定嵌入式函數(shù)依賴成立的條件。表1中的條件函數(shù)依賴φ如下所示:

    Table 1 Records in the USA Adult database in 1994表1 1994年美國Adult數(shù)據(jù)庫的記錄

    其中,φ指一個人若是已婚的男性,則其家庭成分為丈夫。

    定義2(匹配)[14]對于屬性A的取值a和b,若:(1)a和b都是常量,且a=b;(2)a或b為“_”,則a匹配b,記作ab。

    匹配是對函數(shù)依賴中屬性取值相等的擴展,主要用于判斷實例與模式元組或者模式元組之間相同的屬性取值是否存在對應(yīng)關(guān)系。

    定義3(元組匹配)[14]對于一個元組t和模式組Tp中的一個模式元組tp,如果tp中的每一個屬性A,都有tp[A]=t[A],或者tp[A]=“_”,那么稱t匹配tp,記作ttp。

    定義4(條件函數(shù)依賴語義)[14]對于定義在R上的條件函數(shù)依賴φ=(R:X→Y,Tp),如果R上的實例I中的任意兩個元組t1、t2滿足如下關(guān)系:若t1[X]=t2[X]tp[X],則t1[Y]=t2[Y]tp[Y],那么稱I滿足φ,記作I╞φ。

    定義5(支持度)條件函數(shù)依賴φ=(R:X→Y,Tp)在R上的支持度定義為與φ相匹配的元組數(shù)目在R上所占的比例,其公式如下:

    其中,φ·count表示關(guān)系R中與φ相匹配的元組數(shù)目,|R|表示關(guān)系R上所包含的元組數(shù)。若元組t匹配φ中的模式組Tp中的任意模式元組tp,則稱元組t匹配φ。

    3 算法設(shè)計與分析

    3.1 CFINDER算法介紹

    CFINDER算法的核心思想是找到屬性集X、Y中滿足如下關(guān)系的屬性值x和y:在關(guān)系R的任意元組中,只要屬性X取值為x,則屬性Y的取值一定為y。CFINDER算法發(fā)現(xiàn)的條件函數(shù)依賴具有以下三個特點:(1)所發(fā)現(xiàn)的條件函數(shù)依賴的Y屬性是由一個單一屬性A構(gòu)成的,其模式組Tp是由單一的模式元組tp組成;(2)關(guān)系R上的實例I必定滿足所發(fā)現(xiàn)的條件函數(shù)依賴;(3)所發(fā)現(xiàn)的條件函數(shù)依賴是令人感興趣的,滿足最小評估閾值。根據(jù)條件函數(shù)依賴模式元組tp上的屬性取值的不同,可將條件函數(shù)依賴分為如下三類:

    (1)第一類條件函數(shù)依賴(CFD_1):模式元組tp上的所有屬性的取值都是常數(shù)的條件函數(shù)依賴。

    (2)第二類條件函數(shù)依賴(CFD_2):模式元組tp上的屬性的取值既存在常數(shù)又存在變量的條件函數(shù)依賴。

    (3)第三類條件函數(shù)依賴(CFD_3):模式元組tp上的所有屬性的取值都是變量的條件函數(shù)依賴,即傳統(tǒng)的函數(shù)依賴。

    CFINDER算法的優(yōu)點在于其有效地發(fā)現(xiàn)了條件函數(shù)依賴,同時結(jié)構(gòu)簡單,易于理解,沒有過多的復(fù)雜推導(dǎo)。但是,CFINDER算法無法對已挖掘出來的條件函數(shù)依賴進行快速的更新、維護和管理。數(shù)據(jù)集的更新可能導(dǎo)致原始數(shù)據(jù)集上的CFDs失效,或新的CFDs的產(chǎn)生。為獲得更新后的整個數(shù)據(jù)集中的條件函數(shù)依賴,最簡單的方法就是在更新后的數(shù)據(jù)集上重新執(zhí)行挖掘過程,但這樣將導(dǎo)致大量時間浪費在對已處理過的原始數(shù)據(jù)集的重復(fù)計算上。為更好地解決由數(shù)據(jù)集更新所引起的條件函數(shù)依賴改變的問題,本文應(yīng)用遞進處理思想,在CFINDER算法的基礎(chǔ)上提出并實現(xiàn)了一種增量式更新算法(簡稱CFUP)。

    3.2 CFUP算法設(shè)計

    CFUP算法是一個基于CFINDER算法的條件函數(shù)依賴增量式更新算法。增量式的發(fā)現(xiàn)條件函數(shù)依賴的主要思想是掃描新增數(shù)據(jù)集,充分利用前期挖掘過程中獲得的CFDs及其部分中間結(jié)果,去掉那些不滿足條件的舊的CFDs,發(fā)現(xiàn)滿足條件的新的CFDs,其目的是減少對原始數(shù)據(jù)集的掃描和處理,快速發(fā)現(xiàn)更新后整個數(shù)據(jù)集上的CFDs。

    為了找到那些令人感興趣的條件函數(shù)依賴,CFINDER算法采用了支持度、置信度等多種興趣測量方法來對條件函數(shù)依賴進行評估。CFUP算法選擇采用支持度來發(fā)現(xiàn)那些令人感興趣的條件函數(shù)依賴。

    CFUP算法的具體步驟如下:

    首先,掃描新增數(shù)據(jù)集,利用CFINDER算法發(fā)現(xiàn)其上的CFDs。

    其次,將新增數(shù)據(jù)集ΔD上的CFDs和原數(shù)據(jù)集D上的CFDs進行比較,選出ΔD上不重復(fù)的CFDs。

    最后,對新增數(shù)據(jù)集ΔD上的不重復(fù)的CFDs和原數(shù)據(jù)集D上的CFDs進行判定,看其在整個數(shù)據(jù)集上是否仍然是有效CFDs或是否產(chǎn)生了新的CFDs。

    其中,CFD判定步驟為:

    (1)對每一個CFDφ,計算其相對數(shù)據(jù)集中的實例I對φ的滿足情況。其中,原數(shù)據(jù)集上的CFDs的相對數(shù)據(jù)集D′是新增數(shù)據(jù)集ΔD,新增數(shù)據(jù)集上的CFDs的相對數(shù)據(jù)集D′是原數(shù)據(jù)集D。

    (2)如果相對數(shù)據(jù)集上的所有實例I都滿足φ,則計算φ在相對數(shù)據(jù)集D′上的支持度:

    如果Support(φ)≥minsupport,則α是整個數(shù)據(jù)集上滿足條件的CFD。

    (6)若φ為第三類條件函數(shù)依賴,則根據(jù)變量屬性的可取域,將φ轉(zhuǎn)換成多個第二類條件函數(shù)依賴α。計算α相對數(shù)據(jù)集上的滿足情況。

    (7)若相對數(shù)據(jù)集D′上的所有實例I都滿足α,則利用(5)中的支持度公式計算α在整個數(shù)據(jù)集上的支持度。如果Support(φ)≥minsupport,則α是整個數(shù)據(jù)集上滿足條件的CFD。

    (8)若相對數(shù)據(jù)集D′上的實例I不全滿足α,則重復(fù)步驟(5)。

    CFUP算法偽代碼如下:

    INPUT:Dis the original dataset;ΔDis the additional dataset;CLDis the set of CFDs in the original dataset;

    1:scanΔDand use CFINDER algorithm get CFDs in CL△D

    2:CLD∪△D=?

    3:for every CFDαin CLD

    4: Judge-CFD(ΔD,D∪△D,α,CLD∪△D)

    5:end for

    6:for every CFDαin CL△D-CLD

    7: Judge-CFD(D,D∪△D,CLD∪△D)

    8:end for

    OUTPUT:CLD∪△D

    圖7a分析結(jié)果顯示,異常地質(zhì)體中心埋深比較清楚,異常值中心埋深都在z0=20m,左側(cè)質(zhì)量小的球體異常值比較小,右側(cè)質(zhì)量比較大的球體異常值比較大,同時異常分布明顯。因此,對于中心埋深相同的情況下,質(zhì)量大的球體異常表現(xiàn)更加明顯,該成像方法適用淺層地質(zhì)體模型的大質(zhì)量異常礦體勘探。

    如果Support(φ)≥minsupport,則φ是整個數(shù)據(jù)集上滿足條件的CFD。

    (3)如果相對數(shù)據(jù)集上存在不滿足φ的實例,則根據(jù)CFD的所屬類別對CFD進行操作。

    (4)若φ為第一類條件函數(shù)依賴,則φ是整個數(shù)據(jù)集上滿足條件的CFD。

    (5)若φ為第二類條件函數(shù)依賴,則根據(jù)變量屬性的可取域,將φ轉(zhuǎn)換成多個第一類條件函數(shù)依賴α。計算一個α在相對數(shù)據(jù)集D′上的滿足情況。若相對數(shù)據(jù)集D′上所有實例I都滿足α,則計算α在整個數(shù)據(jù)集上的支持度:

    DEFINE Judge-CFD(D,D∪△D,α,CLD∪△D)

    1:scan Dand comput the satisfaction ofαon the in-stance I

    2:if(I╞α)then compute Support(α)in D

    3: if(Support(α)≥minsupport)then

    5: else CLD=CLD-α

    6: end if

    7:else

    8: if(α∈CFD_1)then CLD=CLD-α;

    9: else

    10: if(α∈CFD_2)then

    11: convertαtoφof CFD_1and Judge-CFD(D ∪ △D,D ∪ △D,φ,CLD∪△D)

    12: else

    13: if(α∈CFD_3)then

    14: convertαtoφof CFD_2and Judge-CFD(D ∪ △D,D ∪△D,φ,CLD∪△D)

    15: end if

    16: end if

    17: end if

    18:end if

    19:return(CLD∪△D)

    3.3 CFUP算法性能分析

    對于由數(shù)據(jù)庫更新而引起的條件函數(shù)依賴變更這個問題,一種簡單的方法是在當數(shù)據(jù)庫更新時,重新運行CFINDER算法?,F(xiàn)在我們將增量式更新算法CFUP與重新運行CFINDER算法進行性能比較。

    在增量發(fā)現(xiàn)CFDs的過程中,CFINDER算法需要存儲CFDs的可取域,而CFUP算法需要存儲CFDs的可取域和其對應(yīng)的匹配元組數(shù)。假設(shè)整個數(shù)據(jù)集上發(fā)現(xiàn)了N個CFDs,且每個CFDs的可取域的大小為ki,則CFINDER算法的空間復(fù)雜度CFUP 算 法 的 空 間 復(fù) 雜 度 為。相對于 CFINDER算法而言,CFUP算法增加了O(N)的存儲開銷。

    數(shù)據(jù)一致性維護是NP完全問題,CFINDER和CFUP算法都采用窮舉法來解決NP完全問題,所以其時間復(fù)雜度都較高。CFINDER算法在更新CFDs的過程中需要掃描整個數(shù)據(jù)集多次,掃描的次數(shù)由數(shù)據(jù)集中屬性的個數(shù)決定。而CFUP算法利用已有的挖掘結(jié)果以減少原數(shù)據(jù)集掃描的次數(shù),對原始數(shù)據(jù)集的掃描次數(shù)取決于新增數(shù)據(jù)集上與原有CFDs不同的CFDs個數(shù)L。假設(shè)數(shù)據(jù)集的屬性個數(shù)為M,原數(shù)據(jù)集記錄總數(shù)為N,新增數(shù)據(jù)記錄總數(shù)為ΔN,則在最壞的情況下,CFINDER算法需要掃描數(shù)據(jù)集2M次,其時間復(fù)雜度為O((N+ΔN)*2M)。CFUP算法需要掃描新增數(shù)據(jù)集2M次,原數(shù)據(jù)集L次。CFUP算法時間復(fù)雜度為O(N*L+ΔN *2M),其中,0≤L≤2M-L1,L1為原數(shù)據(jù)集中CFDs的個數(shù)。CFUP算法比CFINDER算法減少了O(N*(2M-L))的時間開銷。在N/ΔN較大、L和M 較小的情況下,不管新增數(shù)據(jù)如何變化,CFUP算法都在時間上明顯優(yōu)于CFINDER算法。CFUP算法的時間復(fù)雜度主要受屬性的個數(shù)和新增數(shù)據(jù)記錄數(shù)的影響,數(shù)據(jù)變化的快慢程度對其影響不大。所以,當數(shù)據(jù)變化十分迅速但每次增量微小時,CFUP算法仍然能夠有效地進行增量更新。

    總的來說,CFUP算法保存挖掘過程中的一些中間結(jié)果,用于后續(xù)的增量式發(fā)現(xiàn),從而造成了系統(tǒng)所需存儲空間的增大,但是其絕對增加量并不大。在不討論新增數(shù)據(jù)內(nèi)容變化迅速的情況下,只要新增數(shù)據(jù)集相對原數(shù)據(jù)集較小、數(shù)據(jù)集屬性個數(shù)較小,CFUP算法都能在時間上明顯優(yōu)于CFINDER算法。

    4 實驗及其分析

    為驗證CFUP算法的可行性和有效性,本文采用了三個真實數(shù)據(jù)集,并在運行Windows操作系統(tǒng)(處理器:Intel(R)Core(TM)i3CPU 3.20 GHz,內(nèi)存:2.00GB)的PC上進行了實驗。

    4.1 數(shù)據(jù)集

    本文選取了UCI標準數(shù)據(jù)集上的三個數(shù)據(jù)集進行實驗,分別是 Adult、Mushroom、Census-income(KDD)數(shù)據(jù)集。其中,Adult數(shù)據(jù)集是一個描述美國公民基本特性的數(shù)據(jù)集,其中包含32 561條記錄和14個屬性。Mushroom數(shù)據(jù)集是一個描述蘑菇基本特性的數(shù)據(jù)集,其中包含8 124條記錄和23個屬性。Census-income數(shù)據(jù)集是一個與A-dult數(shù)據(jù)集相似的大型數(shù)據(jù)集,其中包含299 285條記錄和40個屬性。

    4.2 實驗結(jié)果及分析

    為驗證當原始數(shù)據(jù)集的大小固定時,新增數(shù)據(jù)集的大小對CFUP算法和CFINDER算法的運行時間和準確率的影響,本文選取了Adult和Mushroom兩個較小的數(shù)據(jù)集進行實驗。其中,選取A-dult數(shù)據(jù)集中的15 000條數(shù)據(jù)作為原始數(shù)據(jù)集,新增數(shù)據(jù)的記錄總數(shù)從2 000到18 000條,其屬性數(shù)目n=10,最小支持度閾值s=0.6。Mushroom數(shù)據(jù)集中的4 000條記錄作為原始數(shù)據(jù)集,新增數(shù)據(jù)集中的記錄總數(shù)從500到4 000條,其中屬性數(shù)目n=15,最小支持度閾值s=0.6。

    圖1和圖2分別展示了CFUP算法和CFINDER算法在Adult數(shù)據(jù)集上增量式地發(fā)現(xiàn)CFDs時的運行時間和準確率。圖3和圖4分別展示了CFUP算法和CFINDER算法在Mushroom數(shù)據(jù)集上增量式地發(fā)現(xiàn)CFDs時的運行時間和準確率。

    從圖1~圖4可以看出,對于不同大小的新增數(shù)據(jù)集,CFUP算法和CFINDER算法的準確率沒有顯著差異。但是,CFUP算法耗費的時間明顯少于CFINDER算法,且CFUP算法和CFINDER算法消耗的時間差隨著新增數(shù)據(jù)集的增大而逐漸減少。這是由于CFUP算法主要是通過減少對原始數(shù)據(jù)集的掃描次數(shù)來達到減少運行時間的目的。新增數(shù)據(jù)集增大了,原始數(shù)據(jù)集的大小對算法運行時間的影響就越小。所以,在原始數(shù)據(jù)集大小固定的情況下,新增數(shù)據(jù)集越小,CFUP算法比CFINDER算法的時間優(yōu)勢就體現(xiàn)得越明顯。

    為進一步驗證當新增數(shù)據(jù)集的大小固定時,原始數(shù)據(jù)集的大小對CFINDER算法和CFUP算法的運行時間和準確率的影響,本文采用Census income數(shù)據(jù)集中的數(shù)據(jù)進行實驗,其中選取的新增數(shù)據(jù)集的大小為1k,原始數(shù)據(jù)集從20k到100k,屬性個數(shù)n=10,最小支持度閾值s=0.6。圖5和圖6分別顯示了CFUP算法和CFINDER算法在Census-income數(shù)據(jù)集上增量式地發(fā)現(xiàn)條件函數(shù)依賴的運行時間和準確率。從圖5可以看出,在新增數(shù)據(jù)集的大小固定的條件下,原數(shù)據(jù)集越大,CFUP算法運行時間與CFINDER算法的運行時間差越大,CFUP算法在時間上的優(yōu)勢越大。從圖6可以看出,Census-income數(shù)據(jù)集上CFUP算法和CFINDER算法的準確率沒有顯著差異。

    為驗證CFUP算法和CFINDER算法的存儲空間變化,本文選取了Mushroom數(shù)據(jù)集中的4 000條記錄作為原始數(shù)據(jù)集,新增數(shù)據(jù)集中的記錄總數(shù)從500到4 000條,其中屬性數(shù)目n=15,最小支持度閾值s=0.6。

    圖7展示了CFUP算法和CFINDER算法在Mushroom數(shù)據(jù)集上增量式地發(fā)現(xiàn)CFDs時的存儲空間的變化。從圖7可以看出,CFUP算法和CFINDER算法的存儲空間都隨著數(shù)據(jù)集的增大而增大。這是因為數(shù)據(jù)集的增大會導(dǎo)致CFDs的可取域變大,而CFDs的可取域是影響CFUP算法和CFINDER算法的存儲空間的重要因素。同時,CFUP算法的存儲空間的開銷比CFINDER算法微大,這是因為CFUP算法在實現(xiàn)的過程中保留了每個有效CFD的匹配元組數(shù)目。

    Figure 7 Space cost on the Mushroom dataset圖7 Mushroom數(shù)據(jù)集上存儲空間開銷

    總的來說,當新增數(shù)據(jù)集相對于原數(shù)據(jù)集較小的情況下,CFUP算法雖然比CFINDER算法增加了一點存儲開銷,但在時間上明顯優(yōu)于CFINDER算法。

    5 結(jié)束語

    目前,國內(nèi)外研究人員正在對條件函數(shù)依賴理論及其應(yīng)用展開深入研究。條件函數(shù)依賴將在檢測和修改數(shù)據(jù)庫的不一致性方面起到重要作用。本文在CFINDER算法的基礎(chǔ)上,提出了條件函數(shù)依賴增量式更新算法CFUP,其充分利用了之前得到的挖掘結(jié)果來對條件函數(shù)依賴進行增量式更新。該算法是針對當數(shù)據(jù)庫增加一批新數(shù)據(jù)時,對條件函數(shù)依賴進行快速、有效的更新。因此,下一步工作將針對數(shù)據(jù)庫數(shù)據(jù)內(nèi)容改變這種情況研究條件函數(shù)依賴的發(fā)現(xiàn)策略。

    [1] Aebi D,Perrochon L.Towards improving data quality[C]∥Proc of the International Conference on Information Systems and Management of Data,1993:273-281.

    [2] Eckerson W.Data auality and the bottom line[R].Technical Report,TDWI Report Series,2002.

    [3] Rahm E,Do H H.Data cleaning:Problems and current approaches[J].IEEE Data Engineering Bulletin,2000,23(4):3-13.

    [4] Huhtala Y,Kinen J,Porkka P,et al.Efficient discovery of functional and approximate dependencies using partitions[C]∥Proc of the 14th International Conference on Data Engineering,1998:392-401.

    [5] Lopes S,Petit J-M,Lakhal L.Efficient discovery of functional dependencies and armstrong relations[C]∥Proc of the 7th International Conference on Extending Database Technology:Advances in Database Technology,2000:350-364.

    [6] Wyss C,Giannella C,Robertson E L.FastFDs:A heuristicdriven,depth-first algorithm for mining functional dependencies from relations instances[C]∥Proc of the 3rd International Conference on Data Warehousing and Knowledge Discovery,2001:101-110.

    [7] Bohannon P,F(xiàn)an W,Geerts F,et al.Conditional functional dependencies for data cleaning[C]∥Proc of the 23rd International Conference on Database Engineering,2007:764-755.

    [8] Hu Y,Zhang W,Luo X,et al.Dependencies theory and its application for repairing inconsistent data[J].Computer Science,2009,36(10):11-15.(in Chinese)

    [9] Hu Y,Zhang W.Theory of conditional functional dependencies and its application for improving data quality[J].Computer Science,2009,36(12):115-118.(in Chinese)

    [10] Golab L,Korn F,Srivastava D,et al.On generating nearoptimal tableaux for conditional functional dependencies[C]∥Proc of the 34th International Conference on Very Large Data Bases,2008:376-390.

    [11] Chiang F,Miller R.Discovering data quality rules[C]∥Proc of the 34th International Conference on Very Large Data Bases,2008:1166-1177.

    [12] Yeh Z P.Discovering conditional functional dependencies to detect data inconsistencies[C]∥Proc of the 36th International Conference on Very Large Data Bases,2010:256-270.

    [13] Fan W,Geerts F,Lakshmanan L V S,et al.Discovering conditional functional dependencies [C]∥ Proc of 2009 IEEE International Conference on Data Engineering,2009:1231-1234.

    [14] Fan W,Jia X,Kementsietsidis A.Conditional functional dependencies for capturing data inconsistencies[J].ACM Transactions on Database Systems,2008,33(2):1-48.

    附中文參考文獻:

    [8] 胡艷麗,張維明,羅旭輝,等.基于數(shù)據(jù)依賴的數(shù)據(jù)修復(fù)研究進展 [J].計算機科學,2009,36(10):11-15.

    [9] 胡艷麗,張維明.條件依賴理論及其應(yīng)用展望 [J].計算機科學,2009,36(12):115-118.

    猜你喜歡
    元組原始數(shù)據(jù)集上
    GOLDEN OPPORTUNITY FOR CHINA-INDONESIA COOPERATION
    Python核心語法
    電腦報(2021年14期)2021-06-28 10:46:22
    受特定變化趨勢限制的傳感器數(shù)據(jù)處理方法研究
    Cookie-Cutter集上的Gibbs測度
    鏈完備偏序集上廣義向量均衡問題解映射的保序性
    海量數(shù)據(jù)上有效的top-kSkyline查詢算法*
    基于減少檢索的負表約束優(yōu)化算法
    復(fù)扇形指標集上的分布混沌
    全新Mentor DRS360 平臺借助集中式原始數(shù)據(jù)融合及直接實時傳感技術(shù)實現(xiàn)5 級自動駕駛
    汽車零部件(2017年4期)2017-07-12 17:05:53
    面向數(shù)據(jù)流處理的元組跟蹤方法
    電信科學(2013年10期)2013-08-10 03:41:54
    啦啦啦在线观看免费高清www| 亚洲情色 制服丝袜| 国产成人免费无遮挡视频| 久久鲁丝午夜福利片| 黄色怎么调成土黄色| 日韩在线高清观看一区二区三区| 中文字幕av电影在线播放| 人人妻人人看人人澡| 大片电影免费在线观看免费| 在线观看一区二区三区激情| 啦啦啦在线观看免费高清www| 老熟女久久久| 午夜激情久久久久久久| 午夜福利网站1000一区二区三区| 高清欧美精品videossex| 七月丁香在线播放| 中文欧美无线码| 久久99一区二区三区| 免费av不卡在线播放| 精品亚洲成国产av| 久久久a久久爽久久v久久| 精品久久久噜噜| 亚洲不卡免费看| 麻豆乱淫一区二区| 久久精品久久久久久久性| 国产男女内射视频| 99久久中文字幕三级久久日本| 亚洲美女黄色视频免费看| 成人毛片a级毛片在线播放| 午夜福利网站1000一区二区三区| 在线天堂最新版资源| 欧美激情国产日韩精品一区| 国产色爽女视频免费观看| 国产精品伦人一区二区| 日韩欧美精品免费久久| 久久99热这里只频精品6学生| 国产视频首页在线观看| 亚洲内射少妇av| 我要看日韩黄色一级片| 免费观看性生交大片5| 美女cb高潮喷水在线观看| av在线播放精品| 国产成人免费无遮挡视频| 最近手机中文字幕大全| 青青草视频在线视频观看| 国产精品国产三级国产av玫瑰| 中国三级夫妇交换| 国产成人91sexporn| 自拍偷自拍亚洲精品老妇| 日韩欧美 国产精品| 边亲边吃奶的免费视频| 大陆偷拍与自拍| 国产毛片在线视频| 成人美女网站在线观看视频| 久久久久久久国产电影| 国产无遮挡羞羞视频在线观看| 91精品国产国语对白视频| 日韩av免费高清视频| 爱豆传媒免费全集在线观看| 一区二区三区精品91| 国内少妇人妻偷人精品xxx网站| 两个人的视频大全免费| 欧美精品一区二区免费开放| 国产熟女午夜一区二区三区 | 香蕉精品网在线| 亚洲综合精品二区| 国产免费一区二区三区四区乱码| 日韩强制内射视频| 国产一区亚洲一区在线观看| 日韩中字成人| 久久99蜜桃精品久久| 亚洲第一区二区三区不卡| 国产在线男女| 99热这里只有精品一区| 成人二区视频| 下体分泌物呈黄色| 一区二区三区乱码不卡18| 在线观看国产h片| 国产精品三级大全| 国产 一区精品| 国产永久视频网站| 国产黄色免费在线视频| 国产有黄有色有爽视频| 秋霞伦理黄片| 久久久久久久国产电影| 亚洲欧美中文字幕日韩二区| 久久6这里有精品| 黑人高潮一二区| 国产永久视频网站| 欧美+日韩+精品| 久久精品熟女亚洲av麻豆精品| 中文字幕亚洲精品专区| 久久国内精品自在自线图片| 日韩av免费高清视频| a级毛片在线看网站| 伦理电影大哥的女人| 国产成人精品一,二区| 丝瓜视频免费看黄片| 久久国内精品自在自线图片| 男男h啪啪无遮挡| 99久久中文字幕三级久久日本| 天天操日日干夜夜撸| 日本黄色日本黄色录像| 精品人妻一区二区三区麻豆| 婷婷色综合www| 久久久久视频综合| 国产午夜精品久久久久久一区二区三区| 国产成人精品久久久久久| 亚洲在久久综合| av在线老鸭窝| 中文在线观看免费www的网站| 亚洲国产成人一精品久久久| 国产美女午夜福利| 国产成人a∨麻豆精品| 国产精品三级大全| 国产精品福利在线免费观看| 永久网站在线| 亚洲精品乱码久久久久久按摩| 精品国产露脸久久av麻豆| 国产又色又爽无遮挡免| 国产日韩欧美亚洲二区| 91精品国产九色| 久热久热在线精品观看| 一区二区三区乱码不卡18| 免费观看性生交大片5| 精品久久久久久久久av| 久久久久久久久大av| 午夜av观看不卡| 如日韩欧美国产精品一区二区三区 | 高清在线视频一区二区三区| 男人爽女人下面视频在线观看| 国产日韩一区二区三区精品不卡 | 国产日韩欧美在线精品| 亚洲综合精品二区| 美女内射精品一级片tv| 久久精品久久精品一区二区三区| 亚洲内射少妇av| 国产国拍精品亚洲av在线观看| 亚洲国产精品专区欧美| 99热国产这里只有精品6| 国产亚洲5aaaaa淫片| 国产在线免费精品| 久久精品熟女亚洲av麻豆精品| 精品亚洲乱码少妇综合久久| 成人二区视频| 男人狂女人下面高潮的视频| 国产精品国产三级国产专区5o| 麻豆成人午夜福利视频| 老司机影院成人| 女性被躁到高潮视频| 国语对白做爰xxxⅹ性视频网站| av天堂久久9| 久久影院123| 在线观看免费高清a一片| 美女福利国产在线| 18禁在线播放成人免费| 美女福利国产在线| 99热全是精品| 久久久久久久大尺度免费视频| 亚洲国产精品国产精品| 乱人伦中国视频| 国产成人精品一,二区| a级毛色黄片| 国产精品国产三级国产专区5o| 国产黄色视频一区二区在线观看| 成人无遮挡网站| 国精品久久久久久国模美| 91在线精品国自产拍蜜月| 亚洲情色 制服丝袜| 观看美女的网站| 亚洲欧美日韩卡通动漫| 99九九线精品视频在线观看视频| 大片电影免费在线观看免费| 中文精品一卡2卡3卡4更新| 久久久精品94久久精品| 九色成人免费人妻av| 日韩av免费高清视频| 亚洲精品乱久久久久久| 国产真实伦视频高清在线观看| 欧美日韩在线观看h| 男女免费视频国产| 精品少妇黑人巨大在线播放| 最近的中文字幕免费完整| 日日爽夜夜爽网站| 少妇人妻久久综合中文| 日日撸夜夜添| 黄片无遮挡物在线观看| 国产精品一区二区性色av| 色网站视频免费| 成人免费观看视频高清| 亚洲中文av在线| 人人妻人人爽人人添夜夜欢视频 | 80岁老熟妇乱子伦牲交| 午夜视频国产福利| 亚洲国产av新网站| av免费在线看不卡| 中国三级夫妇交换| 男女边吃奶边做爰视频| 丰满人妻一区二区三区视频av| 我的女老师完整版在线观看| 亚州av有码| 国产综合精华液| 啦啦啦视频在线资源免费观看| 少妇人妻精品综合一区二区| 晚上一个人看的免费电影| 国产午夜精品一二区理论片| 精品人妻熟女毛片av久久网站| 国产男女超爽视频在线观看| 欧美亚洲 丝袜 人妻 在线| 亚洲国产精品专区欧美| 国产高清有码在线观看视频| 97精品久久久久久久久久精品| 国产精品伦人一区二区| 伊人久久国产一区二区| 久久狼人影院| 成人亚洲欧美一区二区av| 国产免费福利视频在线观看| 黄片无遮挡物在线观看| 日韩制服骚丝袜av| 亚洲欧洲日产国产| 能在线免费看毛片的网站| 内地一区二区视频在线| a级一级毛片免费在线观看| 国产成人精品无人区| 国产成人91sexporn| 天堂8中文在线网| 久久久久国产精品人妻一区二区| av在线app专区| 免费av不卡在线播放| 黄片无遮挡物在线观看| 七月丁香在线播放| 好男人视频免费观看在线| 欧美 日韩 精品 国产| 18+在线观看网站| 天堂中文最新版在线下载| 欧美亚洲 丝袜 人妻 在线| 丰满乱子伦码专区| 在线 av 中文字幕| 久久精品国产a三级三级三级| 18+在线观看网站| 亚洲电影在线观看av| 一区二区三区精品91| 国产男人的电影天堂91| 久久精品久久精品一区二区三区| 日本欧美国产在线视频| 亚洲国产成人一精品久久久| av专区在线播放| 日韩熟女老妇一区二区性免费视频| 国产真实伦视频高清在线观看| 七月丁香在线播放| 成人18禁高潮啪啪吃奶动态图 | 在线看a的网站| 国产一区二区在线观看日韩| 久久久久人妻精品一区果冻| 下体分泌物呈黄色| 国产免费又黄又爽又色| 欧美最新免费一区二区三区| 91aial.com中文字幕在线观看| 亚洲精品国产成人久久av| 狂野欧美激情性bbbbbb| h视频一区二区三区| av天堂中文字幕网| av.在线天堂| 国产一区亚洲一区在线观看| 一级毛片久久久久久久久女| 乱系列少妇在线播放| 十八禁高潮呻吟视频 | 视频中文字幕在线观看| 麻豆成人午夜福利视频| videos熟女内射| 看十八女毛片水多多多| 欧美日韩在线观看h| 夫妻午夜视频| 黑人猛操日本美女一级片| 国国产精品蜜臀av免费| 久久久久久久精品精品| 国产精品嫩草影院av在线观看| 亚洲国产欧美日韩在线播放 | 亚洲精品,欧美精品| 亚洲精品乱久久久久久| 久久6这里有精品| 精品人妻熟女av久视频| 久久久久久久久久久丰满| 秋霞伦理黄片| 大香蕉久久网| 这个男人来自地球电影免费观看 | 一本一本综合久久| 亚洲精品456在线播放app| 久久久a久久爽久久v久久| 欧美激情国产日韩精品一区| 人体艺术视频欧美日本| 街头女战士在线观看网站| 七月丁香在线播放| 青青草视频在线视频观看| 一区二区三区乱码不卡18| 久久久久网色| 亚洲精品一区蜜桃| 国产成人午夜福利电影在线观看| 精品少妇黑人巨大在线播放| 国产黄色免费在线视频| 国产成人精品婷婷| 久久 成人 亚洲| 亚洲图色成人| 欧美日韩一区二区视频在线观看视频在线| 亚洲av成人精品一二三区| 黄色怎么调成土黄色| 91精品国产九色| 亚洲av二区三区四区| 97超视频在线观看视频| 国产精品熟女久久久久浪| 国产乱人偷精品视频| 日本黄色日本黄色录像| 国产午夜精品久久久久久一区二区三区| 国国产精品蜜臀av免费| 老司机亚洲免费影院| 97在线人人人人妻| 国产成人精品福利久久| 在线观看免费日韩欧美大片 | 人妻夜夜爽99麻豆av| 婷婷色综合大香蕉| 亚洲精品国产色婷婷电影| 国产亚洲精品久久久com| tube8黄色片| 黄色配什么色好看| 街头女战士在线观看网站| 十分钟在线观看高清视频www | 午夜精品国产一区二区电影| 国产成人精品久久久久久| www.色视频.com| 春色校园在线视频观看| 免费少妇av软件| 国产黄片美女视频| 26uuu在线亚洲综合色| 男女国产视频网站| 欧美3d第一页| 男女无遮挡免费网站观看| 在线看a的网站| av天堂久久9| 亚洲精品第二区| 久久这里有精品视频免费| 91久久精品电影网| 国产视频首页在线观看| 啦啦啦啦在线视频资源| 欧美+日韩+精品| 精华霜和精华液先用哪个| 99久国产av精品国产电影| 男女无遮挡免费网站观看| 亚洲精品视频女| 热re99久久国产66热| 丁香六月天网| 欧美老熟妇乱子伦牲交| 22中文网久久字幕| 激情五月婷婷亚洲| 香蕉精品网在线| 在线天堂最新版资源| 免费不卡的大黄色大毛片视频在线观看| 少妇猛男粗大的猛烈进出视频| 高清在线视频一区二区三区| av福利片在线观看| 成人国产麻豆网| 国产片特级美女逼逼视频| 80岁老熟妇乱子伦牲交| 亚洲美女黄色视频免费看| 夫妻午夜视频| 人妻系列 视频| 成人亚洲精品一区在线观看| 日韩中字成人| 日日摸夜夜添夜夜爱| 国产精品久久久久久久久免| 日本欧美视频一区| 欧美日韩综合久久久久久| 久久精品久久久久久噜噜老黄| 日韩免费高清中文字幕av| 大又大粗又爽又黄少妇毛片口| 日韩av不卡免费在线播放| 欧美国产精品一级二级三级 | 不卡视频在线观看欧美| 在线观看三级黄色| 青春草国产在线视频| 亚洲欧美精品自产自拍| 亚洲国产日韩一区二区| 亚洲国产av新网站| 99九九在线精品视频 | 日本vs欧美在线观看视频 | 在线观看人妻少妇| 亚洲性久久影院| 蜜桃在线观看..| 国产一区二区三区av在线| 亚洲国产最新在线播放| 男人添女人高潮全过程视频| 欧美亚洲 丝袜 人妻 在线| 国精品久久久久久国模美| 老熟女久久久| 男女免费视频国产| 久久国产亚洲av麻豆专区| 午夜视频国产福利| 国产成人精品婷婷| 一本大道久久a久久精品| 国产淫语在线视频| 精品国产乱码久久久久久小说| 国产精品嫩草影院av在线观看| 午夜福利,免费看| 亚洲精品色激情综合| 国产91av在线免费观看| 三级国产精品欧美在线观看| 少妇猛男粗大的猛烈进出视频| 国产伦精品一区二区三区四那| 七月丁香在线播放| 国产中年淑女户外野战色| 性高湖久久久久久久久免费观看| 免费av中文字幕在线| 自线自在国产av| 我的老师免费观看完整版| 亚洲国产精品一区三区| 如何舔出高潮| 免费av不卡在线播放| 欧美少妇被猛烈插入视频| 久久久久久人妻| 我的老师免费观看完整版| 日韩成人av中文字幕在线观看| 免费黄频网站在线观看国产| 日本-黄色视频高清免费观看| xxx大片免费视频| 国产精品一二三区在线看| 看十八女毛片水多多多| 搡老乐熟女国产| 91成人精品电影| 日日啪夜夜撸| 成人无遮挡网站| 国产午夜精品一二区理论片| 精品久久久久久电影网| av女优亚洲男人天堂| 国产成人一区二区在线| 99久久中文字幕三级久久日本| 婷婷色综合www| 久久久精品免费免费高清| 成人黄色视频免费在线看| 2021少妇久久久久久久久久久| 久久毛片免费看一区二区三区| 久久久久精品久久久久真实原创| 亚洲婷婷狠狠爱综合网| 中文字幕久久专区| 五月伊人婷婷丁香| 男人和女人高潮做爰伦理| 亚洲国产日韩一区二区| 在线观看三级黄色| 亚洲精品中文字幕在线视频 | 两个人的视频大全免费| 一级二级三级毛片免费看| 一级a做视频免费观看| 久久 成人 亚洲| 日韩精品免费视频一区二区三区 | 久久精品久久精品一区二区三区| 乱码一卡2卡4卡精品| 亚洲精品视频女| 精品卡一卡二卡四卡免费| 午夜免费男女啪啪视频观看| 亚洲伊人久久精品综合| 日韩 亚洲 欧美在线| 免费av不卡在线播放| 国产亚洲最大av| 高清毛片免费看| 伊人亚洲综合成人网| 啦啦啦视频在线资源免费观看| 国产成人精品一,二区| 亚洲精品视频女| 丰满少妇做爰视频| a级片在线免费高清观看视频| 国内揄拍国产精品人妻在线| 国内精品宾馆在线| 亚洲在久久综合| 久久人人爽人人爽人人片va| 18禁动态无遮挡网站| 纵有疾风起免费观看全集完整版| 午夜福利视频精品| 国产色婷婷99| 亚洲精品乱久久久久久| 久久精品国产亚洲av天美| 午夜av观看不卡| 亚洲欧美一区二区三区国产| 插逼视频在线观看| av在线播放精品| 中文资源天堂在线| 一级a做视频免费观看| 又黄又爽又刺激的免费视频.| 99热国产这里只有精品6| 免费在线观看成人毛片| 寂寞人妻少妇视频99o| 亚洲色图综合在线观看| 少妇的逼水好多| 国产男人的电影天堂91| 少妇精品久久久久久久| 一级毛片 在线播放| 国产在线一区二区三区精| 亚洲欧洲国产日韩| 91精品国产九色| 日日啪夜夜撸| 简卡轻食公司| 在线看a的网站| av女优亚洲男人天堂| 亚洲av日韩在线播放| 老司机影院成人| 大话2 男鬼变身卡| 男人爽女人下面视频在线观看| 大话2 男鬼变身卡| 亚洲欧美清纯卡通| 国产熟女欧美一区二区| 高清欧美精品videossex| 成年美女黄网站色视频大全免费 | 亚洲va在线va天堂va国产| 亚洲中文av在线| av国产久精品久网站免费入址| 99精国产麻豆久久婷婷| 人妻人人澡人人爽人人| 日韩熟女老妇一区二区性免费视频| 中国国产av一级| 亚洲人成网站在线观看播放| 精品久久国产蜜桃| 午夜视频国产福利| 一级毛片电影观看| kizo精华| 99九九线精品视频在线观看视频| kizo精华| 亚洲欧洲精品一区二区精品久久久 | 狠狠精品人妻久久久久久综合| 最新的欧美精品一区二区| 日韩亚洲欧美综合| 欧美日韩一区二区视频在线观看视频在线| 六月丁香七月| 美女xxoo啪啪120秒动态图| 男女无遮挡免费网站观看| √禁漫天堂资源中文www| 久久久欧美国产精品| 久久久久人妻精品一区果冻| 亚洲国产精品999| 国精品久久久久久国模美| 伦理电影大哥的女人| 免费观看无遮挡的男女| 亚洲经典国产精华液单| 亚洲婷婷狠狠爱综合网| 全区人妻精品视频| 日韩亚洲欧美综合| 国内少妇人妻偷人精品xxx网站| 97精品久久久久久久久久精品| 免费高清在线观看视频在线观看| 国产日韩欧美视频二区| 深夜a级毛片| 狠狠精品人妻久久久久久综合| 一区二区av电影网| 久久精品国产鲁丝片午夜精品| 亚洲欧美精品专区久久| 韩国av在线不卡| 久久久久久久久久久久大奶| 欧美 亚洲 国产 日韩一| 亚洲成人av在线免费| 一二三四中文在线观看免费高清| 黄色欧美视频在线观看| 七月丁香在线播放| 亚洲精品乱码久久久v下载方式| 少妇丰满av| 亚洲精品456在线播放app| 日本与韩国留学比较| 免费在线观看成人毛片| 欧美精品人与动牲交sv欧美| 亚洲精品国产av成人精品| 久久国产精品大桥未久av | 久久婷婷青草| 国产欧美另类精品又又久久亚洲欧美| 国产深夜福利视频在线观看| 欧美日韩精品成人综合77777| 国产无遮挡羞羞视频在线观看| 国产精品福利在线免费观看| 国产无遮挡羞羞视频在线观看| 亚洲美女黄色视频免费看| a级毛色黄片| 久久久午夜欧美精品| 一级黄片播放器| 一级,二级,三级黄色视频| a 毛片基地| 22中文网久久字幕| 国产成人aa在线观看| 国产免费一级a男人的天堂| 丰满少妇做爰视频| 国产av精品麻豆| 99久久综合免费| 岛国毛片在线播放| 亚洲,一卡二卡三卡| 欧美人与善性xxx| 久久人人爽av亚洲精品天堂| 午夜免费男女啪啪视频观看| 一边亲一边摸免费视频| 欧美一级a爱片免费观看看| 97超视频在线观看视频| 老女人水多毛片| 日日撸夜夜添| 中文字幕人妻熟人妻熟丝袜美| 女人精品久久久久毛片| 亚洲精品一区蜜桃| 色婷婷av一区二区三区视频| 熟妇人妻不卡中文字幕| 久久久久精品久久久久真实原创| 亚洲av不卡在线观看| 日韩中字成人| 国产爽快片一区二区三区| 亚洲国产精品专区欧美| 十八禁高潮呻吟视频 | 在线免费观看不下载黄p国产| 日韩av不卡免费在线播放| 国产精品99久久99久久久不卡 | 丝瓜视频免费看黄片| 一区在线观看完整版| 亚洲精品一区蜜桃| 啦啦啦在线观看免费高清www| 成人午夜精彩视频在线观看| 午夜免费鲁丝|