• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于字段過濾和伸縮窗口的SNM算法優(yōu)化*

    2022-04-21 04:43:16周世杰婁淵勝
    關(guān)鍵詞:排序實(shí)驗(yàn)檢測

    周世杰,婁淵勝

    (河海大學(xué)計(jì)算機(jī)與信息學(xué)院,江蘇 南京 211100)

    1 引言

    隨著社會(huì)工業(yè)化和信息化水平的不斷提高,存儲(chǔ)在數(shù)據(jù)倉庫中的數(shù)據(jù)迅速增加。通過數(shù)據(jù)挖掘可在這些海量的數(shù)據(jù)中找出蘊(yùn)含的重要信息,這些信息往往對(duì)信息決策支持系統(tǒng)有重要作用,但挖掘的前提是有高質(zhì)量的數(shù)據(jù)。高質(zhì)量的數(shù)據(jù)是充分發(fā)揮其蘊(yùn)含的效能的前提和基礎(chǔ),而低質(zhì)量的數(shù)據(jù)可能對(duì)決策產(chǎn)生不利的影響[1,2]。數(shù)據(jù)清洗可以對(duì)存儲(chǔ)在數(shù)據(jù)倉庫中的“問題”數(shù)據(jù)進(jìn)行剔除或改正[3],從而提高數(shù)據(jù)質(zhì)量,為決策分析提供數(shù)據(jù)支撐。數(shù)據(jù)清洗的主要清洗對(duì)象是不完整數(shù)據(jù)、沖突數(shù)據(jù)和重復(fù)數(shù)據(jù)[4],其中需要解決的主要問題是對(duì)相似重復(fù)數(shù)據(jù)的查找與去除。相似重復(fù)數(shù)據(jù)是指對(duì)于現(xiàn)實(shí)世界的同一或類似實(shí)體,由于在各數(shù)據(jù)源存儲(chǔ)時(shí)可能出現(xiàn)的格式或拼寫錯(cuò)誤、結(jié)構(gòu)或表述不同等問題,數(shù)據(jù)庫管理系統(tǒng)DBMS(Database Management System)不能準(zhǔn)確識(shí)別而存儲(chǔ)的多條不完全相同的記錄[5]。在信息管理系統(tǒng)中,重復(fù)數(shù)據(jù)的存在會(huì)影響存儲(chǔ)效率,造成數(shù)據(jù)冗余,識(shí)別和消除無用數(shù)據(jù)可以提高數(shù)據(jù)質(zhì)量,保證決策數(shù)據(jù)的可靠性。

    清除相似重復(fù)記錄常用“排序-合并”的方式,其思想是將待檢測的數(shù)據(jù)集按照某個(gè)或某些屬性排序,使得數(shù)據(jù)集中的相似重復(fù)記錄彼此靠近,然后通過比對(duì)鄰近位置的記錄判斷是否為相似重復(fù)記錄。常見的排序-合并算法包括鄰近排序算法SNM(Sorted-Neighborhood Method)[6]、多趟鄰近排序算法MPN (Multi-Pass Sorted Neighborhood)[7]和優(yōu)先隊(duì)列算法[8]等。其中,鄰近排序算法SNM是一種比較流行的排序-合并算法,因其思想簡單、效果明顯和易于實(shí)現(xiàn)的優(yōu)點(diǎn)而被人們廣泛使用。SNM算法在排序后的數(shù)據(jù)集上設(shè)置一個(gè)固定大小的窗口,每次只比對(duì)窗口內(nèi)的數(shù)據(jù),窗口內(nèi)的數(shù)據(jù)比對(duì)完畢后向下移動(dòng)窗口再次進(jìn)行比對(duì),這種方式極大地減少了比對(duì)次數(shù),從而加快了檢測的速度。

    雖然SNM算法加快了檢測的速度,但依然存在一些缺點(diǎn):(1)對(duì)排序關(guān)鍵字依賴程度大;(2)字段權(quán)重多為單一用戶或領(lǐng)域?qū)<以O(shè)定,主觀程度大;(3)窗口的大小難以確定;(4)記錄匹配過程采用笛卡爾乘積的方式,比對(duì)時(shí)間較長。許多研究人員針對(duì)上述缺點(diǎn)提出了一些改進(jìn)方案。文獻(xiàn)[7]采用的方式是多次獨(dú)立地執(zhí)行SNM算法,每次選用不同的關(guān)鍵字對(duì)數(shù)據(jù)集排序,然后在小窗口中進(jìn)行比對(duì),此方法可以減少關(guān)鍵字選取不當(dāng)所帶來的影響,但該方式需要頻繁計(jì)算傳遞閉包,降低了查準(zhǔn)率。文獻(xiàn)[9,10]使用的屬性確定方法結(jié)合了客觀數(shù)理統(tǒng)計(jì)方法和主觀經(jīng)驗(yàn),雖然可以較為客觀地確定屬性權(quán)值,但此方法需要多用戶的參與,在實(shí)際運(yùn)用中耗時(shí)過長且不易實(shí)現(xiàn)。文獻(xiàn)[11,12]依據(jù)窗口內(nèi)重復(fù)記錄的總數(shù)與窗口大小的比例動(dòng)態(tài)調(diào)整滑動(dòng)窗口的大小,但此種方式將SNM歸并過程的時(shí)間復(fù)雜度從O(WN)提高到O(N2)(N為數(shù)據(jù)集總記錄數(shù),W為窗口的大小),時(shí)間效率不高。文獻(xiàn)[13,14]提出了長度過濾算法,在識(shí)別重復(fù)記錄前根據(jù)字符串的長度比例去除不相似的數(shù)據(jù)集,減少記錄比較次數(shù),提高檢測效率,但如果屬性值采用簡寫的方式或?qū)傩允欠潜靥铐?xiàng),采用此方式可能會(huì)將重復(fù)記錄排除,致使算法精度降低。

    綜上,本文提出了一種SNM的改進(jìn)算法ISNM(Improved Sorted-Neighborhood Method)。該算法采用屬性區(qū)分法客觀地計(jì)算權(quán)值,提高了檢測精度;采用字段過濾算法計(jì)算記錄相似度,減少了比對(duì)次數(shù);采用可變窗口來防止漏配,減少了無用的記錄比對(duì)。實(shí)驗(yàn)結(jié)果表明,ISNM算法提高了檢測精度,加快了記錄比對(duì)速度。

    2 SNM算法介紹

    基本的SNM算法主要包括以下3步:

    (1) 選取排序關(guān)鍵字。抽取記錄的重要屬性作為記錄排序關(guān)鍵字。

    (2) 排序。根據(jù)(1)中選取的關(guān)鍵字排序數(shù)據(jù)集。排序后重復(fù)記錄會(huì)彼此靠近,從而將比對(duì)限定到一定范圍內(nèi)。

    (3) 相似重復(fù)記錄檢測。設(shè)置一個(gè)大小為W的窗口,在第(2)步的基礎(chǔ)上向下移動(dòng)窗口。窗口的末尾記錄與其余的W-1條記錄比對(duì),比對(duì)完成后將首條記錄移出,將第W+1條記錄移入,重復(fù)上述步驟直到所有記錄都完成比對(duì)。

    圖1為SNM算法滑動(dòng)窗口示意圖。

    Figure 1 Sliding window in SNM algorithm

    由上述描述可知,SNM算法將記錄的比對(duì)限定在大小為W的固定窗口中,總比對(duì)次數(shù)為N(W-1)次;而傳統(tǒng)的方法是將每一條記錄與剩余的N-1條記錄進(jìn)行比對(duì),總比對(duì)次數(shù)為N(N-1)/2。由此可見,SNM算法極大地減少了比對(duì)次數(shù),因此極大地加快了檢測速度,提高了運(yùn)行效率。但是,SNM算法也存在以下不足:

    (1) 對(duì)選取的排序關(guān)鍵字依賴性較大。選用不合適的關(guān)鍵字對(duì)數(shù)據(jù)集排序,會(huì)使相似重復(fù)記錄不能同時(shí)出現(xiàn)在同一個(gè)窗口中,因無法比對(duì)而造成漏配。例如表1的2條記錄,無論是按照Name屬性排序,還是按照Address屬性排序,或者2個(gè)屬性組合排序,都存在因它們存儲(chǔ)的位置不相鄰而產(chǎn)生漏配的可能。

    Table1 Example of similar duplicate records

    (2)難以確定滑動(dòng)窗口的大小W。如果W較大會(huì)增加無用的比對(duì),降低檢測效率;如果W較小又可能導(dǎo)致漏配,降低檢測精度。

    (3)確定屬性權(quán)值的主觀性大。屬性權(quán)值大多是采用單一用戶或者專家打分的方法來確定,因此主觀性大。

    (4)在重復(fù)相似度檢測過程中,相似記錄的判別基本上都是采用笛卡爾積的方式,采用該種方式會(huì)導(dǎo)致記錄的匹配時(shí)間較長,檢測效率不高。

    3 ISNM算法

    本文針對(duì)SNM算法的缺點(diǎn)提出了改進(jìn)的ISNM算法,其思想是:首先通過屬性區(qū)分法計(jì)算各屬性權(quán)值,并通過權(quán)值來確定排序關(guān)鍵字;其次采用字段過濾算法進(jìn)行判重,提高檢測效率;最后使用可變窗口進(jìn)行比對(duì)。ISNM算法流程圖如圖2所示。

    Figure 2 Flow of ISNM algorithm

    3.1 屬性區(qū)分法計(jì)算權(quán)值

    記錄的屬性體現(xiàn)了現(xiàn)實(shí)實(shí)體的某個(gè)特性,屬性的權(quán)值又代表了該特性對(duì)實(shí)體的重要性,屬性權(quán)值越大,則該屬性對(duì)其所表示的現(xiàn)實(shí)實(shí)體的重要程度就越大,因此權(quán)值的設(shè)定不應(yīng)該有較強(qiáng)的主觀性。本文提出使用“屬性區(qū)分度”來確定屬性權(quán)值,一方面避免了權(quán)值設(shè)定的主觀性,另一方面不需要多用戶參與,在實(shí)際應(yīng)用中容易實(shí)現(xiàn)。

    屬性區(qū)分度是指屬性區(qū)分?jǐn)?shù)據(jù)集中不同記錄的能力,某個(gè)屬性取值種類越多,則該屬性的屬性區(qū)分度就越大。屬性的區(qū)分度代表了該屬性記錄的差異性,因此屬性區(qū)分度越大,該屬性的權(quán)值就越大。將計(jì)算得到的屬性區(qū)分度值歸一化處理后得各屬性權(quán)值。

    為方便描述,假設(shè)待檢測的數(shù)據(jù)集D={D1,D2,…,DN},N為記錄總數(shù),每條記錄有p個(gè)屬性,即Di={Attr1,Attr2,…,Arrtp},則每個(gè)屬性的區(qū)分度計(jì)算公式為:

    (1)

    其中,YAttri表示屬性Attri的取值種類數(shù),也就是說如果按照屬性Attri的不同取值進(jìn)行聚類,會(huì)有YAttri個(gè)簇。將各個(gè)屬性的區(qū)分度值進(jìn)行歸一化處理后,得到屬性的權(quán)值向量W={W1,W2,…,Wp}。屬性區(qū)分算法如算法1所示。

    算法1屬性區(qū)分算法

    輸入:數(shù)據(jù)集D={D1,D2,…,DN}。

    輸出:字段權(quán)值(W1,W2,…,Wp)(p表示記錄的屬性個(gè)數(shù))。

    1.Fori=1 topDo

    2. 計(jì)算屬性i的取值種類數(shù)YAttri;

    3.Endfor

    4.Fori=1 topDo

    5. 根據(jù)式(1)計(jì)算屬性i的屬性區(qū)分度Attrdisi;

    6.Endfor

    7.對(duì)Attrdisi進(jìn)行歸一化處理;

    8.ReturnWi

    3.2 關(guān)鍵字的選取與預(yù)處理

    由3.1節(jié)可知,屬性的區(qū)分度代表了該屬性記錄的差異性,選擇區(qū)分度大的屬性對(duì)數(shù)據(jù)集進(jìn)行排序,可以最大程度保證相似重復(fù)記錄位置靠近,并將非相似重復(fù)記錄分隔開。對(duì)數(shù)據(jù)集中每條數(shù)據(jù)的各個(gè)屬性利用算法1計(jì)算其屬性權(quán)值,并按由大到小順序排序,根據(jù)實(shí)際情況選取排名靠前的屬性作為排序關(guān)鍵屬性,并從每個(gè)關(guān)鍵屬性中提取一部分組成排序關(guān)鍵字對(duì)數(shù)據(jù)集進(jìn)行排序。如針對(duì)滁河流域水文數(shù)據(jù)集,經(jīng)過上述方法處理后,最終選取“站點(diǎn)名稱”“地區(qū)”“獲取數(shù)據(jù)時(shí)間”和“傳感器編號(hào)”作為排序關(guān)鍵屬性,取每個(gè)關(guān)鍵屬性的前4個(gè)字符作為排序關(guān)鍵字對(duì)數(shù)據(jù)集進(jìn)行排序。

    對(duì)數(shù)據(jù)集進(jìn)行排序之前,首先把字段中標(biāo)點(diǎn)符號(hào)、不能辨別的或有標(biāo)示性含義的符號(hào)刪除,例如銀行系統(tǒng)的“¥”“$”等;其次將字段中的單詞按照字典序排列;最后再按照排序關(guān)鍵字對(duì)整個(gè)數(shù)據(jù)集進(jìn)行排序。假設(shè)選擇表1中Name和Address屬性的組合作為排序關(guān)鍵字,按照上述方法對(duì)記錄進(jìn)行排序后的結(jié)果如表2所示。由此可見,經(jīng)過預(yù)處理之后,可以使這2條記錄存儲(chǔ)位置相距較近,確保它們?cè)谕粋€(gè)窗口中。

    Table 2 Record sorting results table after preprocessing

    3.3 字段過濾算法

    SNM算法檢測相似重復(fù)記錄常用的方法是求出2條記錄各屬性值的相似度,并加權(quán)求和得到記錄相似度,然后將該值與相似度閾值對(duì)比來判定記錄是否相似重復(fù)。然而字段比對(duì)大多采用的是笛卡爾乘積的方式[15],采用這種方式的問題是記錄匹配時(shí)間過長,效率不高。本節(jié)針對(duì)該問題提出使用字段過濾算法來提高檢測效率。

    字段過濾算法的核心思想是:記錄的不同屬性值可以區(qū)分不同的記錄,且關(guān)鍵屬性的屬性值對(duì)記錄的區(qū)分度更高。若對(duì)關(guān)鍵屬性的相似度進(jìn)行加權(quán)求和后可以確定2條記錄為相似重復(fù)記錄,則無需計(jì)算剩余屬性的相似度;否則需要計(jì)算所有屬性的相似度,加權(quán)求和后判斷2條記錄是否為相似重復(fù)記錄。因此,在進(jìn)行相似度檢測時(shí),首先選擇關(guān)鍵屬性進(jìn)行比較,將關(guān)鍵屬性的相似度與權(quán)值相乘并求和得到記錄相似度,然后將其與相似度閾值相對(duì)比,若前者大于后者,則斷定這2條記錄相似重復(fù),同時(shí)完成屬性比對(duì),否則,繼續(xù)比對(duì)剩余屬性。

    (2)

    否則有:

    (3)

    字段過濾算法如算法2所示。

    算法2字段過濾算法

    輸入:待比較的記錄Di和Dj,相似度閾值U。

    輸出:SimR(Di,Dj)。

    1.Fort=1 tomDo

    2.SimR(Di,Dj)=SimA(Dit,Djt)Wt;

    3.Endfor

    4.If(SimR(Di,Dj)

    5.Fort=m+1 topDo

    6.SimR(Di,Dj)+=SimA(Dit,Djt)Wt;

    7.Endfor

    8.Endif

    字段過濾算法極大地減少了字段比對(duì)的次數(shù),從而加快了檢測速度。

    3.4 可伸縮滑動(dòng)窗口

    原SNM算法滑動(dòng)窗口的大小不易確定,窗口設(shè)置得太大會(huì)增加很多無用的記錄比對(duì),降低檢測效率;窗口設(shè)置得太小又可能導(dǎo)致重復(fù)記錄的漏配,降低檢測精度。使用可變窗口可以在檢測過程中動(dòng)態(tài)調(diào)整窗口的大小,從而減小固定窗口給檢測結(jié)果帶來的影響。本文根據(jù)相似重復(fù)記錄的位置動(dòng)態(tài)調(diào)整滑動(dòng)窗口的大小,其基本思想是:假設(shè)窗口C的開始大小為W,若新移入C的記錄Rw與即將移出C的記錄R1是相似重復(fù)記錄,則Rw+1與R1相似的概率較高,此時(shí)應(yīng)當(dāng)增大窗口的大小,避免相似重復(fù)記錄的漏配;若與Rw互為相似重復(fù)的記錄Ri(1≤i≤w)距離Rw較近,則應(yīng)該縮小窗口大小,減少無用的比對(duì)。設(shè)窗口C大小的最大最小值分別為Wmax和Wmin,窗口C大小的初始值Wn設(shè)定為Wmin。C中記錄的位置為[1,w],位置為1的記錄為C內(nèi)的首條記錄,位置為w的記錄為新移入C中的記錄,則動(dòng)態(tài)計(jì)算滑動(dòng)窗口大小的方法如式(4)所示:

    (4)

    其中,Bi表示第i條記錄是否與末尾記錄Rw互為相似重復(fù)記錄,若是,則Bi=1,否則,Bi=0。由式(4)不難看出,若C內(nèi)的所有記錄都相似重復(fù),則下一輪C的大小從Wn變成Wmax,若C內(nèi)的所有記錄都不相似重復(fù),則下一輪C的大小從Wn變成Wmin,距離末尾紀(jì)錄Rw越遠(yuǎn)的相似重復(fù)記錄對(duì)C的取值作用越大。

    3.5 相似重復(fù)記錄檢測改進(jìn)方法

    ISNM算法的基本流程是:使用屬性區(qū)分法計(jì)算各屬性權(quán)值,并在權(quán)值的基礎(chǔ)上選擇排序關(guān)鍵字,對(duì)字段預(yù)處理后,再按照排序關(guān)鍵字排列數(shù)據(jù)集中的記錄,在窗口內(nèi)對(duì)數(shù)據(jù)子集進(jìn)行判重,在判重的過程中使用字段過濾算法提高檢測效率,然后調(diào)整窗口大小并向下移動(dòng)窗口,重復(fù)進(jìn)行判重。ISNM算法流程如算法3所示。

    算法3ISNM算法

    輸入:數(shù)據(jù)記錄集D,相似度閾值U,窗口最大值Wmax與最小值Wmin。

    輸出:去重后的數(shù)據(jù)集。

    步驟1計(jì)算屬性權(quán)值。

    使用算法1計(jì)算記錄各屬性的權(quán)值Wi。

    步驟2關(guān)鍵字的選取與數(shù)據(jù)記錄預(yù)處理。

    根據(jù)3.2節(jié)描述的方法選取排序關(guān)鍵字

    Fori=1 toNDo/*N表示數(shù)據(jù)總量。去除字段中的無用符號(hào),并將字段中的單詞按照字典序排列*/

    Endfor

    步驟3按照排列關(guān)鍵字對(duì)數(shù)據(jù)集進(jìn)行排列。

    步驟4在滑動(dòng)窗口中使用字段過濾算法進(jìn)行重復(fù)記錄檢測,并動(dòng)態(tài)調(diào)整窗口的大小。

    While(滑動(dòng)窗口沒有滑到數(shù)據(jù)集的尾部)

    使用算法2計(jì)算相似度值;

    If(SimR(Di,Dj)≥U)

    D=D-Ri;∥Ri表示第i條記錄

    Endif

    根據(jù)式(4)計(jì)算下一個(gè)滑動(dòng)窗口大小;

    向下滑動(dòng)窗口;

    Endwhile

    4 實(shí)驗(yàn)與結(jié)果分析

    4.1 實(shí)驗(yàn)環(huán)境及數(shù)據(jù)

    本次實(shí)驗(yàn)數(shù)據(jù)來自滁河流域近3年各站點(diǎn)所觀測的水位記錄,記錄了站點(diǎn)名稱、數(shù)據(jù)獲取時(shí)間、地區(qū)、傳感器編號(hào)和水位等內(nèi)容。由于記錄過程中傳感器異常導(dǎo)致同一時(shí)間重復(fù)記錄水位信息,因此采集到的數(shù)據(jù)存在大量的重復(fù)數(shù)據(jù)。

    實(shí)驗(yàn)環(huán)境為Intel(R) Core(TM) i5-1035G1 CPU @ 2.2 GHz,16 GB內(nèi)存,Windows 10操作系統(tǒng)。數(shù)據(jù)存儲(chǔ)在MySQL 5.6中,采用IntelliJ IDEA編程工具和Java語言實(shí)現(xiàn)優(yōu)化算法,jdk版本為1.8。

    4.2 實(shí)驗(yàn)方案及評(píng)價(jià)指標(biāo)

    4.2.1 性能實(shí)驗(yàn)

    實(shí)驗(yàn)1為了更好地分析ISNM算法帶來的性能提升,本次實(shí)驗(yàn)把ISNM算法與傳統(tǒng)的SNM算法、文獻(xiàn)[14]的LF-SNM(SNM based on Length Filtering and Dynamic Fault-tolerance)算法、文獻(xiàn)[16]的SNM改進(jìn)方法(在本文中稱為chen-SNM算法)、MPN(Multi-Pass Sorted Neighborhood)算法進(jìn)行對(duì)比實(shí)驗(yàn)。實(shí)驗(yàn)每一次從數(shù)據(jù)集中隨機(jī)抽出10萬,20萬,30萬,40萬和50萬條記錄,分別用上述5種算法進(jìn)行檢測。為了便于統(tǒng)計(jì)實(shí)驗(yàn)結(jié)果,將上述各數(shù)據(jù)集處理成包含0.12萬,0.25萬,0.43萬,0.56萬和0.71萬條相似重復(fù)記錄的數(shù)據(jù)集,用人工統(tǒng)計(jì)的方式判斷實(shí)驗(yàn)得出的相似重復(fù)數(shù)據(jù)集是否正確。實(shí)驗(yàn)中設(shè)定相似度閾值為0.75,可變窗口的最小值為40,最大值為60,固定大小的窗口值為40。

    實(shí)驗(yàn)2為了檢驗(yàn)ISNM算法在相同數(shù)據(jù)規(guī)模、不同相似重復(fù)記錄條數(shù)下的有效性,設(shè)置如下實(shí)驗(yàn):從數(shù)據(jù)集中隨機(jī)抽取20萬條記錄,并將此數(shù)據(jù)集處理成包含0.09萬,0.12萬,0.18萬,0.25萬和0.31萬條相似重復(fù)記錄的數(shù)據(jù)集,仍采用人工統(tǒng)計(jì)的方式處理實(shí)驗(yàn)結(jié)果。此次實(shí)驗(yàn)設(shè)定相似度閾值為0.75,可變窗口的最小值為40,最大值為60。

    4.2.2 不同窗口大小對(duì)消除結(jié)果的影響

    實(shí)驗(yàn)3為了看出不同窗口對(duì)實(shí)驗(yàn)結(jié)果的影響,設(shè)置可變窗口的最小值為60,最大值為80,可變窗口與固定窗口的初始值為80,在與實(shí)驗(yàn)1同樣的實(shí)驗(yàn)環(huán)境中進(jìn)行實(shí)驗(yàn),并將實(shí)驗(yàn)結(jié)果與實(shí)驗(yàn)1的結(jié)果進(jìn)行比較分析。

    實(shí)驗(yàn)4為了檢驗(yàn)ISNM算法在相同數(shù)據(jù)規(guī)模和相似重復(fù)記錄條數(shù)下,不同窗口范圍對(duì)實(shí)驗(yàn)結(jié)果的影響,設(shè)置如下實(shí)驗(yàn):從數(shù)據(jù)集中隨機(jī)抽取20萬條記錄,并將此數(shù)據(jù)集處理成包含0.25萬條相似重復(fù)記錄的數(shù)據(jù)集,將可變窗口的最小最大值分別設(shè)置成[20,40],[40,60],[60,80],[80,100]和[100,120],設(shè)定窗口的初始值取窗口的最小值,相似度閾值為0.75。

    4.2.3 評(píng)價(jià)指標(biāo)

    實(shí)驗(yàn)性能評(píng)價(jià)指標(biāo)采用查準(zhǔn)率(precision) 、查全率(recall)[17]和運(yùn)行時(shí)間開銷。查全率和查準(zhǔn)率定義如式(5)和式(6)所示:

    (5)

    (6)

    其中,tp表示檢測出來的相似重復(fù)記錄是正確的數(shù)量,fp表示檢測出來的相似重復(fù)記錄是錯(cuò)誤的數(shù)量,fn表示沒有檢測出來的相似重復(fù)記錄的數(shù)量[17]。故tp+fp表示檢測出來的相似重復(fù)記錄的總量,tp+fn表示數(shù)據(jù)集中原本存在的重復(fù)記錄總量。

    4.3 實(shí)驗(yàn)結(jié)果分析

    4.3.1 性能實(shí)驗(yàn)

    基于上述實(shí)驗(yàn)方案,使用各算法在相同的實(shí)驗(yàn)環(huán)境下對(duì)待檢測的數(shù)據(jù)集進(jìn)行重復(fù)記錄檢測,實(shí)驗(yàn)結(jié)果如圖3~圖5所示。

    Figure 3 Comparison of precision of each algorithm

    由圖3可以看出,ISNM算法的查全率優(yōu)于其他各算法的。ISNM算法采用屬性區(qū)分法確定字段權(quán)值,解決了權(quán)值主觀性過強(qiáng)的問題,在排序之前對(duì)排序關(guān)鍵字進(jìn)行預(yù)處理,使相似重復(fù)記錄存儲(chǔ)在靠近的位置以避免漏配,并使用大小可變的窗口進(jìn)行檢測,避免了因窗口過小而引起的漏配,從而提高了查全率。MPN算法多次獨(dú)立地執(zhí)行SNM算法,每次選用不同的關(guān)鍵字對(duì)數(shù)據(jù)集進(jìn)行排序,故查全率較高,但MPN算法固定移動(dòng)窗口大小,窗口設(shè)置得太大或太小對(duì)查全率都有比較大的影響,因此MPN算法的查全率低于ISNM算法的。LF-SNM算法與chen-SNM算法采用的字段權(quán)值調(diào)整方法需先人為設(shè)定再進(jìn)行調(diào)整,仍具有一定的主觀性,故查全率較低。

    Figure 4 Comparison of recall of each algorithm

    由圖4可以看出,ISNM算法的查準(zhǔn)率要優(yōu)于其他算法的。ISNM采用了伸縮滑動(dòng)窗口的方式,當(dāng)窗口較大時(shí)可以動(dòng)態(tài)縮小窗口,避免了因不必要的記錄比對(duì)導(dǎo)致檢測出來的記錄是錯(cuò)誤的情況,并且使用字段過濾算法減少了比較次數(shù),而不使用傳遞閉包的方式,降低了誤識(shí)別率,故查準(zhǔn)率高。而chen-SNM算法、LF-SNM算法和MPN算法均采用傳遞閉包的方式整合重復(fù)記錄,會(huì)產(chǎn)生很多的誤識(shí)別,因此這3種算法的查全率不如ISNM算法的。

    Figure 5 Comparison of running time of each algorithm

    由圖5可以看出,在同樣的實(shí)驗(yàn)環(huán)境中ISNM算法的時(shí)間效率優(yōu)于其他算法的。ISNM算法使用了可變窗口的方式,避免了無用的記錄比對(duì),并同時(shí)使用字段過濾算法計(jì)算記錄的相似度,提高了記錄的比對(duì)效率,因此ISNM算法的時(shí)間開銷小。chen-SNM算法與LF-SNM算法分別采用了伸縮窗口和長度過濾的方式來提高效率,但這2個(gè)算法需要計(jì)算傳遞閉包,因此這2個(gè)算法的時(shí)間開銷與ISNM算法的相近但低于ISNM算法的。MPN算法需要多次獨(dú)立執(zhí)行SNM算法,每次選擇不同的關(guān)鍵字排列數(shù)據(jù)集,并且合并數(shù)據(jù)集合時(shí)需要計(jì)算傳遞閉包,因此時(shí)間開銷較大。

    4.2.1節(jié)中的實(shí)驗(yàn)2的實(shí)驗(yàn)結(jié)果如圖6所示。

    Figure 6 Comparison results under different similar repeat scales

    由圖6可以看出,ISNM算法在相同數(shù)據(jù)規(guī)模、不同相似重復(fù)記錄條數(shù)下,查全率與查準(zhǔn)率一直處于相對(duì)穩(wěn)定的狀態(tài),并同時(shí)保持了較高水準(zhǔn)。其次運(yùn)行時(shí)間隨著相似重復(fù)數(shù)的增加而逐漸增大,但是仍在可接受的范圍內(nèi),由此可進(jìn)一步證明本文所提算法的優(yōu)越性。

    4.3.2 不同窗口大小對(duì)消除結(jié)果的影響

    基于4.2.2節(jié)中的實(shí)驗(yàn)3的實(shí)驗(yàn)結(jié)果如圖7~圖9所示。

    Figure 7 Comparison of precision between ISNM algorithm and SNM algorithm

    Figure 8 Comparison of recall between ISNM algorithm and SNM algorithm

    Figure 9 Comparison of running time between ISNM algorithm and SNM algorithm

    由圖7和圖8可以看出,ISNM算法的查全率和查準(zhǔn)率明顯優(yōu)于SNM算法的。隨著窗口的增大,窗口內(nèi)覆蓋的重復(fù)記錄變多,避免了目標(biāo)記錄的漏配,故SNM算法的查全率會(huì)提高,但查準(zhǔn)率會(huì)下降,這是因?yàn)楣潭ù翱诓荒苷{(diào)節(jié)大小,增加了無用的記錄比對(duì)導(dǎo)致誤識(shí)別增多。初始值為80的窗口幾乎包括了所有目標(biāo)記錄,故ISNM算法的查全率變化不大,但查準(zhǔn)率會(huì)稍微下降,這也是由于窗口增大造成誤識(shí)別增多導(dǎo)致的,但可變窗口會(huì)及時(shí)縮小窗口大小來避免這種情況的發(fā)生。

    由圖9可以看出,ISNM算法的時(shí)間開銷要優(yōu)于SNM算法的。隨著窗口的增大,增加了窗口內(nèi)的記錄比對(duì)次數(shù),故ISNM算法與SNM算法的時(shí)間開銷都會(huì)變大,其中SNM算法的時(shí)間開銷變化較大,而ISNM算法由于采用了可變窗口,可以及時(shí)調(diào)整窗口的大小,所以時(shí)間開銷變化的幅度不大。

    基于4.2.2節(jié)中的實(shí)驗(yàn)4的實(shí)驗(yàn)結(jié)果如圖10所示。

    Figure 10 Comparison results of different window ranges

    由圖10可以看出,隨著窗口范圍的增大,查全率先增大,然后趨于平穩(wěn);而查準(zhǔn)率先增大,然后減小。在此使用查全率和查準(zhǔn)率的調(diào)和均值F值來反映ISNM算法的性能。從圖10中的折線可以看出,窗口大小在[60,80]和[80,100]時(shí)F值達(dá)到最大,再結(jié)合2個(gè)范圍的運(yùn)行時(shí)間可以得出,針對(duì)本文的實(shí)驗(yàn)數(shù)據(jù),最優(yōu)的窗口為[60,80]。

    5 結(jié)束語

    數(shù)據(jù)清洗可以有效地提高數(shù)據(jù)源的數(shù)據(jù)質(zhì)量,消除數(shù)據(jù)中的重復(fù)記錄是其中的一個(gè)熱門課題。本文分析了傳統(tǒng)SNM算法,并指出了傳統(tǒng)SNM算法的缺陷,針對(duì)原算法的缺陷提出了基于SNM的改進(jìn)算法——ISNM算法。主要提出了4點(diǎn)改進(jìn):(1)采用屬性區(qū)分法確定屬性權(quán)值,解決了單一用戶設(shè)定固定權(quán)值的不足,提高了算法檢測的精度;(2)根據(jù)權(quán)值選取排序關(guān)鍵字,避免了關(guān)鍵字選取不當(dāng)對(duì)SNM算法精度的影響,并對(duì)關(guān)鍵字進(jìn)行預(yù)處理,使得相似重復(fù)記錄位置彼此靠近以避免漏配;(3)使用字段過濾算法計(jì)算相似度,減少了窗口內(nèi)記錄屬性的比對(duì)次數(shù),加快了算法的檢測速度;(4)使用可變窗口的方式進(jìn)行檢測,既防止了記錄的漏配,也減少了無用的匹配。通過對(duì)實(shí)際系統(tǒng)中的數(shù)據(jù)進(jìn)行實(shí)驗(yàn),采用查全率、查準(zhǔn)率和運(yùn)行時(shí)間評(píng)價(jià)標(biāo)準(zhǔn)驗(yàn)證了ISNM算法的可行性與優(yōu)勢。然而改進(jìn)算法無法識(shí)別文字不同但語義相同的相似重復(fù)記錄,另外相似度閾值的取值范圍也是一個(gè)亟需解決的問題,過大或過小的閾值都會(huì)對(duì)查重精度產(chǎn)生影響,下一步將針對(duì)這些問題進(jìn)行研究。

    猜你喜歡
    排序實(shí)驗(yàn)檢測
    記一次有趣的實(shí)驗(yàn)
    排序不等式
    “不等式”檢測題
    “一元一次不等式”檢測題
    “一元一次不等式組”檢測題
    恐怖排序
    做個(gè)怪怪長實(shí)驗(yàn)
    節(jié)日排序
    刻舟求劍
    兒童繪本(2018年5期)2018-04-12 16:45:32
    NO與NO2相互轉(zhuǎn)化實(shí)驗(yàn)的改進(jìn)
    亚洲伊人色综图| 晚上一个人看的免费电影| 国产成人系列免费观看| 免费女性裸体啪啪无遮挡网站| 亚洲色图 男人天堂 中文字幕| 在线观看三级黄色| 色婷婷久久久亚洲欧美| 日本91视频免费播放| 在线精品无人区一区二区三| 波多野结衣一区麻豆| 亚洲欧洲精品一区二区精品久久久 | 国产精品秋霞免费鲁丝片| 国产高清国产精品国产三级| 97精品久久久久久久久久精品| 国产日韩欧美在线精品| 肉色欧美久久久久久久蜜桃| 亚洲av福利一区| 精品久久久精品久久久| tube8黄色片| 欧美最新免费一区二区三区| 99久久精品国产亚洲精品| 日日爽夜夜爽网站| 伊人久久大香线蕉亚洲五| 捣出白浆h1v1| 免费在线观看黄色视频的| 日韩成人av中文字幕在线观看| 麻豆精品久久久久久蜜桃| 久久毛片免费看一区二区三区| 永久免费av网站大全| 各种免费的搞黄视频| 日日爽夜夜爽网站| 国产野战对白在线观看| 黄频高清免费视频| 久久久国产一区二区| 日本欧美国产在线视频| 国产又爽黄色视频| 久久人妻熟女aⅴ| e午夜精品久久久久久久| 99久久综合免费| 999久久久国产精品视频| 十八禁网站网址无遮挡| 在线观看免费午夜福利视频| av卡一久久| 三上悠亚av全集在线观看| 国产探花极品一区二区| 久久久久精品久久久久真实原创| netflix在线观看网站| 亚洲图色成人| 国产男女超爽视频在线观看| 一本—道久久a久久精品蜜桃钙片| 丰满少妇做爰视频| 久久狼人影院| 男的添女的下面高潮视频| 高清av免费在线| www日本在线高清视频| 国产精品麻豆人妻色哟哟久久| 大陆偷拍与自拍| 国产精品秋霞免费鲁丝片| 精品卡一卡二卡四卡免费| 丝瓜视频免费看黄片| 亚洲av日韩精品久久久久久密 | 狂野欧美激情性xxxx| 一本大道久久a久久精品| 亚洲成人免费av在线播放| 天天添夜夜摸| xxx大片免费视频| 超碰成人久久| 久久婷婷青草| 亚洲一区二区三区欧美精品| 免费观看性生交大片5| 纯流量卡能插随身wifi吗| www.av在线官网国产| av福利片在线| 久久精品国产综合久久久| 人人妻,人人澡人人爽秒播 | 大香蕉久久成人网| 啦啦啦在线免费观看视频4| 女人被躁到高潮嗷嗷叫费观| 丝袜美腿诱惑在线| 亚洲精品国产一区二区精华液| 下体分泌物呈黄色| 高清视频免费观看一区二区| 亚洲美女视频黄频| 热99国产精品久久久久久7| 国产日韩欧美在线精品| 亚洲精品,欧美精品| 国产成人av激情在线播放| 999精品在线视频| 欧美激情极品国产一区二区三区| 18禁裸乳无遮挡动漫免费视频| 99久国产av精品国产电影| 国产xxxxx性猛交| 亚洲精品aⅴ在线观看| 欧美中文综合在线视频| 亚洲精品中文字幕在线视频| 99精国产麻豆久久婷婷| www.精华液| 麻豆乱淫一区二区| 精品少妇黑人巨大在线播放| 亚洲国产av影院在线观看| 亚洲国产最新在线播放| 成人午夜精彩视频在线观看| 观看av在线不卡| 91精品伊人久久大香线蕉| 99久久人妻综合| 香蕉丝袜av| 在线观看三级黄色| 在线免费观看不下载黄p国产| 80岁老熟妇乱子伦牲交| 在线观看免费午夜福利视频| 女性被躁到高潮视频| 亚洲精品久久成人aⅴ小说| 天天躁夜夜躁狠狠久久av| 制服人妻中文乱码| 免费黄网站久久成人精品| 国产av精品麻豆| av又黄又爽大尺度在线免费看| av女优亚洲男人天堂| av在线播放精品| 老熟女久久久| 51午夜福利影视在线观看| 一边亲一边摸免费视频| 黄网站色视频无遮挡免费观看| 精品人妻熟女毛片av久久网站| 国产欧美日韩综合在线一区二区| 国产片特级美女逼逼视频| 欧美变态另类bdsm刘玥| 日本av免费视频播放| 嫩草影院入口| av视频免费观看在线观看| 青草久久国产| 99久国产av精品国产电影| 午夜福利一区二区在线看| 欧美精品一区二区免费开放| 毛片一级片免费看久久久久| 国产淫语在线视频| av免费观看日本| 亚洲国产最新在线播放| 国产一卡二卡三卡精品 | 亚洲五月色婷婷综合| 男女床上黄色一级片免费看| 国产成人欧美在线观看 | 免费在线观看完整版高清| 国产熟女午夜一区二区三区| 在现免费观看毛片| 十八禁网站网址无遮挡| 久久久国产一区二区| 一区二区三区激情视频| 五月开心婷婷网| 18禁裸乳无遮挡动漫免费视频| 国产黄色视频一区二区在线观看| 久久久久久久久久久免费av| 亚洲精品国产一区二区精华液| 青春草国产在线视频| 伦理电影大哥的女人| 国产精品人妻久久久影院| 一级a爱视频在线免费观看| 一本一本久久a久久精品综合妖精| 少妇被粗大猛烈的视频| 热99国产精品久久久久久7| 18禁国产床啪视频网站| 精品久久久久久电影网| 国产精品嫩草影院av在线观看| 久久毛片免费看一区二区三区| 看非洲黑人一级黄片| 一本大道久久a久久精品| 免费看不卡的av| 日韩伦理黄色片| 超碰成人久久| 黄片小视频在线播放| 亚洲美女视频黄频| 国产精品久久久久久精品电影小说| 亚洲男人天堂网一区| 日本wwww免费看| 美国免费a级毛片| 午夜福利一区二区在线看| 别揉我奶头~嗯~啊~动态视频 | 丝袜美足系列| 日韩一区二区视频免费看| 黄片无遮挡物在线观看| 99九九在线精品视频| 一区二区日韩欧美中文字幕| 日本色播在线视频| 欧美人与性动交α欧美软件| 91精品三级在线观看| 国产成人免费观看mmmm| 蜜桃国产av成人99| 欧美激情高清一区二区三区 | 国产精品.久久久| 中文精品一卡2卡3卡4更新| 国产精品国产三级国产专区5o| 国产免费现黄频在线看| av天堂久久9| 久久人人97超碰香蕉20202| 高清黄色对白视频在线免费看| 国产精品一区二区在线不卡| 国产精品麻豆人妻色哟哟久久| 大香蕉久久成人网| 美女国产高潮福利片在线看| 国产精品一区二区在线观看99| 高清av免费在线| 女的被弄到高潮叫床怎么办| 色精品久久人妻99蜜桃| 日韩免费高清中文字幕av| 少妇被粗大的猛进出69影院| 午夜老司机福利片| av女优亚洲男人天堂| 国产欧美亚洲国产| av天堂久久9| 国产日韩欧美亚洲二区| 欧美日韩一级在线毛片| 在线免费观看不下载黄p国产| 久久女婷五月综合色啪小说| 欧美日韩视频高清一区二区三区二| 91成人精品电影| 91国产中文字幕| 日韩免费高清中文字幕av| 国产毛片在线视频| 多毛熟女@视频| 亚洲美女搞黄在线观看| 黄片无遮挡物在线观看| 国产黄色视频一区二区在线观看| 免费女性裸体啪啪无遮挡网站| 天堂8中文在线网| 少妇精品久久久久久久| 亚洲美女黄色视频免费看| av电影中文网址| 亚洲国产精品999| 成人国语在线视频| 久久久久久人妻| 亚洲精品视频女| 咕卡用的链子| 性高湖久久久久久久久免费观看| 国产精品女同一区二区软件| 少妇被粗大的猛进出69影院| 在线观看三级黄色| 久久久久久人妻| 这个男人来自地球电影免费观看 | 视频在线观看一区二区三区| 热99国产精品久久久久久7| 成年人免费黄色播放视频| 一级片'在线观看视频| 国产爽快片一区二区三区| 色精品久久人妻99蜜桃| 在线 av 中文字幕| 人体艺术视频欧美日本| 91精品国产国语对白视频| 欧美在线黄色| 精品福利永久在线观看| 一级毛片 在线播放| 午夜福利,免费看| 国产熟女午夜一区二区三区| 久久久精品94久久精品| 如何舔出高潮| 夫妻性生交免费视频一级片| 2018国产大陆天天弄谢| 亚洲精品第二区| 一本一本久久a久久精品综合妖精| 少妇人妻 视频| 国产片特级美女逼逼视频| 亚洲成av片中文字幕在线观看| 国产国语露脸激情在线看| 国产精品久久久久成人av| 少妇被粗大的猛进出69影院| 欧美人与性动交α欧美精品济南到| 99久久99久久久精品蜜桃| 国产精品香港三级国产av潘金莲 | 国产99久久九九免费精品| 成年av动漫网址| 亚洲人成77777在线视频| 国产精品人妻久久久影院| 一级黄片播放器| 亚洲国产日韩一区二区| e午夜精品久久久久久久| 下体分泌物呈黄色| 黄片小视频在线播放| 在线观看免费午夜福利视频| 午夜91福利影院| 欧美97在线视频| 国产极品天堂在线| 亚洲,一卡二卡三卡| 九九爱精品视频在线观看| 狠狠婷婷综合久久久久久88av| 国产男女内射视频| 久久久久久免费高清国产稀缺| 久久久久精品人妻al黑| 色婷婷av一区二区三区视频| 曰老女人黄片| 深夜精品福利| 免费不卡黄色视频| 黄色视频在线播放观看不卡| 欧美激情 高清一区二区三区| 日韩精品有码人妻一区| 毛片一级片免费看久久久久| 亚洲欧美色中文字幕在线| 叶爱在线成人免费视频播放| 熟女少妇亚洲综合色aaa.| 一区二区三区激情视频| 看十八女毛片水多多多| 18禁裸乳无遮挡动漫免费视频| 97人妻天天添夜夜摸| 亚洲精品美女久久久久99蜜臀 | 各种免费的搞黄视频| 九色亚洲精品在线播放| 人人妻人人爽人人添夜夜欢视频| 美女主播在线视频| 高清欧美精品videossex| 成年动漫av网址| 波多野结衣一区麻豆| 亚洲国产最新在线播放| 午夜免费观看性视频| 男人操女人黄网站| 美国免费a级毛片| 80岁老熟妇乱子伦牲交| 欧美日韩一级在线毛片| 亚洲精品国产av成人精品| 国产av一区二区精品久久| 欧美日韩一级在线毛片| 高清欧美精品videossex| 欧美老熟妇乱子伦牲交| 亚洲国产av新网站| 9热在线视频观看99| 91精品三级在线观看| 日日撸夜夜添| 最近的中文字幕免费完整| 国产在线免费精品| 中文字幕色久视频| 日韩 亚洲 欧美在线| 久久鲁丝午夜福利片| 七月丁香在线播放| 老司机影院成人| 人人妻人人爽人人添夜夜欢视频| bbb黄色大片| 五月天丁香电影| 十八禁网站网址无遮挡| 亚洲av男天堂| 激情视频va一区二区三区| 久久鲁丝午夜福利片| 国产精品偷伦视频观看了| 亚洲av电影在线观看一区二区三区| 久久久久精品性色| 蜜桃在线观看..| 亚洲一卡2卡3卡4卡5卡精品中文| 国产av国产精品国产| 老熟女久久久| 成人毛片60女人毛片免费| 国产精品一区二区在线不卡| 飞空精品影院首页| 黄色视频不卡| 亚洲美女视频黄频| www日本在线高清视频| 亚洲精品一二三| 一区在线观看完整版| 91精品伊人久久大香线蕉| 免费黄频网站在线观看国产| 亚洲欧美一区二区三区黑人| 各种免费的搞黄视频| 国产 精品1| 亚洲男人天堂网一区| 一区二区av电影网| 少妇 在线观看| 看免费成人av毛片| 国产熟女午夜一区二区三区| 一区二区三区乱码不卡18| 一级爰片在线观看| 国产 一区精品| 亚洲四区av| 精品人妻熟女毛片av久久网站| 国产精品人妻久久久影院| 国产无遮挡羞羞视频在线观看| 国产熟女欧美一区二区| 久久综合国产亚洲精品| 天天躁狠狠躁夜夜躁狠狠躁| 1024视频免费在线观看| 亚洲成人手机| 精品一品国产午夜福利视频| 日本午夜av视频| 在线 av 中文字幕| 岛国毛片在线播放| 一边亲一边摸免费视频| 自线自在国产av| 亚洲av国产av综合av卡| 亚洲国产最新在线播放| 尾随美女入室| e午夜精品久久久久久久| 亚洲欧美激情在线| 你懂的网址亚洲精品在线观看| 色视频在线一区二区三区| 午夜影院在线不卡| av福利片在线| 亚洲国产精品成人久久小说| 五月开心婷婷网| 夫妻午夜视频| av线在线观看网站| 国产精品国产三级专区第一集| 午夜福利影视在线免费观看| 亚洲欧美成人精品一区二区| 女人精品久久久久毛片| 建设人人有责人人尽责人人享有的| 欧美日韩综合久久久久久| 亚洲精品国产色婷婷电影| 午夜福利视频在线观看免费| 国产精品国产三级专区第一集| 夜夜骑夜夜射夜夜干| 捣出白浆h1v1| 亚洲国产中文字幕在线视频| 九九爱精品视频在线观看| 日韩大码丰满熟妇| 亚洲精品国产av成人精品| 亚洲精品美女久久久久99蜜臀 | 2018国产大陆天天弄谢| 成年av动漫网址| 最近最新中文字幕大全免费视频 | 欧美精品人与动牲交sv欧美| 99热国产这里只有精品6| 中文字幕精品免费在线观看视频| h视频一区二区三区| 国产精品秋霞免费鲁丝片| 亚洲精品成人av观看孕妇| 亚洲第一区二区三区不卡| 日本爱情动作片www.在线观看| 在线观看免费视频网站a站| 日韩精品有码人妻一区| 久久久久国产精品人妻一区二区| 国产精品.久久久| 中国国产av一级| 精品亚洲成a人片在线观看| 69精品国产乱码久久久| 久久久久国产精品人妻一区二区| 你懂的网址亚洲精品在线观看| 一区二区三区四区激情视频| avwww免费| 国产成人免费观看mmmm| 蜜桃国产av成人99| 交换朋友夫妻互换小说| 中文字幕高清在线视频| 80岁老熟妇乱子伦牲交| 日韩大片免费观看网站| 亚洲精品中文字幕在线视频| 国产女主播在线喷水免费视频网站| 午夜日韩欧美国产| 久久亚洲国产成人精品v| 亚洲精品乱久久久久久| 丝袜在线中文字幕| 亚洲精品久久久久久婷婷小说| 亚洲自偷自拍图片 自拍| kizo精华| 熟女少妇亚洲综合色aaa.| 女人高潮潮喷娇喘18禁视频| 日本色播在线视频| 亚洲欧美日韩另类电影网站| 狠狠婷婷综合久久久久久88av| 日日爽夜夜爽网站| 青春草国产在线视频| 国产精品久久久久久久久免| 欧美在线一区亚洲| 国产免费视频播放在线视频| 国产成人一区二区在线| 欧美日韩亚洲国产一区二区在线观看 | 黄片小视频在线播放| 中文精品一卡2卡3卡4更新| 中文字幕制服av| 免费人妻精品一区二区三区视频| 下体分泌物呈黄色| 精品免费久久久久久久清纯 | 汤姆久久久久久久影院中文字幕| 无限看片的www在线观看| 日本黄色日本黄色录像| 久久午夜综合久久蜜桃| 天天影视国产精品| 桃花免费在线播放| 精品国产超薄肉色丝袜足j| 日韩av在线免费看完整版不卡| 亚洲四区av| 精品国产一区二区三区久久久樱花| 精品一区在线观看国产| 亚洲国产看品久久| 国产成人91sexporn| 成年av动漫网址| 国产精品无大码| 亚洲欧美日韩另类电影网站| 国产女主播在线喷水免费视频网站| 午夜91福利影院| 色94色欧美一区二区| 日日爽夜夜爽网站| 日本黄色日本黄色录像| 人人妻人人添人人爽欧美一区卜| 1024香蕉在线观看| 欧美少妇被猛烈插入视频| 男人添女人高潮全过程视频| 桃花免费在线播放| 熟妇人妻不卡中文字幕| 一区在线观看完整版| 婷婷色av中文字幕| 久久99精品国语久久久| 一级黄片播放器| 视频在线观看一区二区三区| 亚洲自偷自拍图片 自拍| 欧美精品高潮呻吟av久久| bbb黄色大片| 18禁动态无遮挡网站| 十八禁人妻一区二区| 国产精品免费视频内射| 一级毛片黄色毛片免费观看视频| 毛片一级片免费看久久久久| 美女高潮到喷水免费观看| 欧美精品av麻豆av| tube8黄色片| 免费不卡黄色视频| 伊人久久国产一区二区| 国产一区二区在线观看av| 黑人巨大精品欧美一区二区蜜桃| 最黄视频免费看| 在线亚洲精品国产二区图片欧美| 国产熟女午夜一区二区三区| 久久久久久免费高清国产稀缺| 日韩av不卡免费在线播放| 97人妻天天添夜夜摸| 国产成人精品无人区| 国产老妇伦熟女老妇高清| 纵有疾风起免费观看全集完整版| 日韩免费高清中文字幕av| 香蕉丝袜av| 99久国产av精品国产电影| 国产免费福利视频在线观看| 2021少妇久久久久久久久久久| 成年美女黄网站色视频大全免费| 夜夜骑夜夜射夜夜干| 欧美日韩综合久久久久久| 午夜91福利影院| 女人久久www免费人成看片| 一二三四中文在线观看免费高清| 日韩熟女老妇一区二区性免费视频| 日日摸夜夜添夜夜爱| 黄色一级大片看看| 少妇猛男粗大的猛烈进出视频| 国产一区二区三区综合在线观看| 天美传媒精品一区二区| 啦啦啦 在线观看视频| av国产精品久久久久影院| 看免费成人av毛片| 日日爽夜夜爽网站| 成年人免费黄色播放视频| 国产免费视频播放在线视频| 久久女婷五月综合色啪小说| 丁香六月欧美| 亚洲精品美女久久久久99蜜臀 | 国产亚洲最大av| a级片在线免费高清观看视频| 精品第一国产精品| 亚洲视频免费观看视频| 久久久久人妻精品一区果冻| 国产伦理片在线播放av一区| 国产日韩一区二区三区精品不卡| 1024香蕉在线观看| 久久午夜综合久久蜜桃| 男女床上黄色一级片免费看| 一级毛片电影观看| 午夜福利乱码中文字幕| 国产亚洲最大av| 亚洲久久久国产精品| 日韩 亚洲 欧美在线| 欧美日韩一区二区视频在线观看视频在线| 又黄又粗又硬又大视频| 中文字幕人妻丝袜制服| 久久久久精品性色| 久久久亚洲精品成人影院| 99热全是精品| 制服诱惑二区| 婷婷成人精品国产| 欧美日韩福利视频一区二区| 亚洲国产精品国产精品| 狂野欧美激情性xxxx| 男人添女人高潮全过程视频| 欧美少妇被猛烈插入视频| 国产成人一区二区在线| 高清不卡的av网站| 欧美最新免费一区二区三区| 人妻人人澡人人爽人人| 国产成人精品久久二区二区91 | 国产av一区二区精品久久| 男女国产视频网站| 久久亚洲国产成人精品v| 啦啦啦在线免费观看视频4| 人妻一区二区av| 人人妻人人添人人爽欧美一区卜| 亚洲精品美女久久av网站| 好男人视频免费观看在线| 亚洲成人av在线免费| 亚洲一区中文字幕在线| 日韩人妻精品一区2区三区| 韩国高清视频一区二区三区| 婷婷色麻豆天堂久久| 麻豆精品久久久久久蜜桃| 欧美人与性动交α欧美精品济南到| 免费黄网站久久成人精品| 十分钟在线观看高清视频www| 日韩 欧美 亚洲 中文字幕| 搡老乐熟女国产| 国产在线免费精品| 国产精品久久久久成人av| 一级片免费观看大全| 啦啦啦啦在线视频资源| 哪个播放器可以免费观看大片| 久久久久久人妻| 中文字幕色久视频| 国产精品香港三级国产av潘金莲 | √禁漫天堂资源中文www| 人妻 亚洲 视频| xxxhd国产人妻xxx| 成人亚洲欧美一区二区av| av电影中文网址| 一级片免费观看大全| 久久精品久久久久久久性| 91aial.com中文字幕在线观看|