• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于特征選擇的局部敏感哈希位選擇算法

    2021-11-22 02:01:00周文樺劉華文李恩慧
    大數(shù)據(jù) 2021年6期

    周文樺,劉華文,李恩慧

    浙江師范大學(xué)數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,浙江 金華 321001

    1 引言

    隨著互聯(lián)網(wǎng)技術(shù)的高速發(fā)展,需要處理的數(shù)據(jù)的量爆炸式增長(zhǎng)。在海量數(shù)據(jù)中檢索出所需的數(shù)據(jù)變得越來(lái)越困難。最近鄰搜索(nearest neighbor search,NNS)[1]在海量數(shù)據(jù)中尋找與查詢數(shù)據(jù)最相似的近鄰數(shù)據(jù),在信息檢索、數(shù)據(jù)挖掘、機(jī)器視覺(jué)等領(lǐng)域起到了至關(guān)重要的作用。若數(shù)據(jù)集中含有N個(gè)數(shù)據(jù),則檢索準(zhǔn)確近鄰數(shù)據(jù)的時(shí)間復(fù)雜度為O(N)。當(dāng)數(shù)據(jù)庫(kù)規(guī)模非常龐大時(shí),計(jì)算成本迅速增加,因此通常使用近似最近鄰(approximate nearest neighbor search,ANN)搜索作為替代方案來(lái)解決最近鄰搜索問(wèn)題[2]。因?yàn)樵诤芏鄳?yīng)用領(lǐng)域中,無(wú)須找到最近鄰的數(shù)據(jù),只要找到相似的數(shù)據(jù)即可。在過(guò)去的研究中,基于樹(shù)結(jié)構(gòu)(如KD tree[3]、K-means tree[4])的算法在近鄰問(wèn)題上得到廣泛應(yīng)用。其主要思想是對(duì)數(shù)據(jù)空間進(jìn)行劃分,從而提高檢索速度。但基于樹(shù)結(jié)構(gòu)的算法僅適用于低維數(shù)據(jù),當(dāng)遇到高維數(shù)據(jù)時(shí),其性能快速下降?;诠5乃阉魉惴ㄔ跀?shù)據(jù)規(guī)模與數(shù)據(jù)維度很大時(shí)仍具有高效的檢索性能,且其時(shí)間、空間復(fù)雜度較低,因此該算法成為主流的檢索算法之一[5-6]。

    在基于哈希的檢索方法中,局部敏感哈希(locality-sensitive hashing,LSH)算法[6-8]是有代表性的算法之一。LSH會(huì)隨機(jī)生成一組哈希函數(shù),每一個(gè)哈希函數(shù)生成一個(gè)對(duì)應(yīng)二值哈希位,將由多個(gè)哈希位組成的編碼稱為哈希碼。LSH將原空間中的數(shù)據(jù)點(diǎn)映射成哈希碼,使得相似度越高的數(shù)據(jù)具有相同哈希碼的概率越高,而相似度越低的數(shù)據(jù)具有相同哈希碼的概率越低。LSH的缺點(diǎn)是只有哈希碼長(zhǎng)度較長(zhǎng)時(shí),才能夠達(dá)到理想的檢索效果。但當(dāng)哈希碼的長(zhǎng)度較長(zhǎng)(如1024位)時(shí),計(jì)算的時(shí)間復(fù)雜度和數(shù)據(jù)所需的存儲(chǔ)空間也隨之增加。因此如何生成簡(jiǎn)短、性能優(yōu)越的哈希碼成為哈希學(xué)習(xí)中的主要問(wèn)題[9]。

    為了生成緊湊且信息量豐富的哈希碼,近年來(lái)提出了各種類型的哈希算法,如無(wú)監(jiān)督哈希學(xué)習(xí)[5]、有監(jiān)督哈希學(xué)習(xí)[10-12]、半監(jiān)督哈希學(xué)習(xí)[13]、深度哈希學(xué)習(xí)[14-15]等。上述哈希算法通過(guò)優(yōu)化不同模型的目標(biāo)函數(shù)來(lái)生成相應(yīng)哈希碼,如最小化排序損失、量化誤差、重構(gòu)誤差等。但上述算法在處理不同的數(shù)據(jù)集和查詢數(shù)據(jù)時(shí),需要不斷地調(diào)整模型結(jié)構(gòu)和參數(shù)才能滿足檢索要求。

    為了避免頻繁地調(diào)整不同場(chǎng)景下的模型結(jié)構(gòu)和參數(shù),哈希位選擇算法被提出[16-18]。該算法直接從現(xiàn)有的哈希位池中選取信息量最大的哈希碼。在現(xiàn)有的研究工作中,很少有關(guān)于哈希位選擇的研究。參考文獻(xiàn)[17]將哈希位選擇問(wèn)題轉(zhuǎn)化為圖的二次規(guī)劃問(wèn)題,從而提取哈希碼。然而,該圖的二次規(guī)劃為NP困難問(wèn)題,只能得出其局部最優(yōu)解;而且其時(shí)間復(fù)雜度較高,至少為O(N2),并不適用于處理大規(guī)模數(shù)據(jù)。

    特征選擇[19-20]也被稱為特征子集選擇,主要思想是從現(xiàn)有的M個(gè)特征中選取N個(gè)特征使得算法最優(yōu)。特征選擇能夠有效減少數(shù)據(jù)的維度,降低存儲(chǔ)成本,同時(shí)能夠提高算法的效率?,F(xiàn)有的特征選擇算法主要分為3類:一是過(guò)濾法,根據(jù)特征的發(fā)散性或相關(guān)性對(duì)各個(gè)特征進(jìn)行評(píng)分,通過(guò)設(shè)定閾值或排序方式選取特征;二是包裹法,每次選擇若干特征并輸入設(shè)定的目標(biāo)函數(shù),選出目標(biāo)函數(shù)下的最優(yōu)特征子集;三是嵌入法,使用與機(jī)器學(xué)習(xí)相關(guān)的算法對(duì)模型進(jìn)行訓(xùn)練,得到各個(gè)特征的權(quán)值系數(shù),根據(jù)系數(shù)從大到小選擇特征。

    本文的目的并不在于設(shè)計(jì)一個(gè)新的哈希算法,而是基于特征選擇的思想,將每一個(gè)哈希位視為一個(gè)特征,從現(xiàn)有哈希算法生成的哈希位池中高效地提取出信息量最大的哈希位。本文使用了10種簡(jiǎn)單且高效的基于特征選擇的方法來(lái)進(jìn)行哈希位選擇。為了探索特征選擇算法在哈希位選擇上的作用,本文主要從以下兩個(gè)角度進(jìn)行探究:一是通過(guò)10種選擇算法去除20%的冗余哈希位,觀察精準(zhǔn)率和召回率等性能指標(biāo)的變化;二是在保持精準(zhǔn)率和召回率等性能指標(biāo)與原長(zhǎng)度哈希位基本一致的前提下,探究每種選擇算法能去除的最大冗余哈希位比率。

    2 相關(guān)工作

    2.1 局部敏感哈希

    局部敏感哈希由于其原理簡(jiǎn)單、計(jì)算成本低而被廣泛應(yīng)用于各個(gè)領(lǐng)域,如大規(guī)模數(shù)據(jù)檢索、異常檢測(cè)、近鄰問(wèn)題[5,7,21]等。

    局部敏感哈希將數(shù)據(jù)向量投影到隨機(jī)超平面上,再進(jìn)行二值化處理生成對(duì)應(yīng)的二值碼(哈希位),使數(shù)據(jù)在歐氏空間中的相似性在漢明空間中得以保存。設(shè)數(shù)據(jù)集,為L(zhǎng)SH中的函數(shù)族,F(xiàn)中的每一項(xiàng)為隨機(jī)生成。則數(shù)據(jù)的哈希位定義如下:

    數(shù)據(jù)點(diǎn)x與L個(gè)哈希函數(shù)f經(jīng)過(guò)式(1)投影后生成長(zhǎng)度為L(zhǎng)的二值向量。整個(gè)數(shù)據(jù)集表示為二進(jìn)制編碼B。

    其中,hi∈{0,1}n×1表示編碼B的第i列,即整個(gè)數(shù)據(jù)集第i個(gè)哈希位組成的二值向量。

    2.2 圖模型哈希位選擇

    在現(xiàn)有的文獻(xiàn)中,很少有關(guān)于哈希位選擇的工作。僅有的基于圖模型算法有參考文獻(xiàn)[16-17]。在參考文獻(xiàn)[17]中,圖中節(jié)點(diǎn)權(quán)重表示每個(gè)哈希位保留原數(shù)據(jù)相似性的能力,邊權(quán)重表示哈希位之間的獨(dú)立性。一個(gè)好的哈希碼能夠保留數(shù)據(jù)在原空間中的相似性,且哈希碼之間要互相獨(dú)立,這使得哈希碼包含的信息量最大。因此在進(jìn)行哈希位選擇時(shí),應(yīng)選取圖中節(jié)點(diǎn)權(quán)重大且節(jié)點(diǎn)與節(jié)點(diǎn)之間的邊權(quán)重也足夠大的節(jié)點(diǎn)集合。此時(shí),哈希位選擇問(wèn)題便轉(zhuǎn)化為圖的二次規(guī)劃問(wèn)題。然而該問(wèn)題為NP困難問(wèn)題。參考文獻(xiàn)[17]采用模仿者動(dòng)態(tài)理論求解,但是該解為局部最優(yōu)解,而且需要調(diào)整節(jié)點(diǎn)權(quán)重與邊權(quán)重之間的權(quán)值參數(shù)才能得到較優(yōu)的哈希碼。

    在參考文獻(xiàn)[18]中,使用馬爾可夫過(guò)程求解上述圖的二次規(guī)劃問(wèn)題。將節(jié)點(diǎn)權(quán)重(保留相似性的能力)轉(zhuǎn)化為自我轉(zhuǎn)移概率,將邊權(quán)重(獨(dú)立性)轉(zhuǎn)化為節(jié)點(diǎn)之間的狀態(tài)轉(zhuǎn)移概率。通過(guò)馬爾可夫過(guò)程,選取訪問(wèn)次數(shù)最多的節(jié)點(diǎn)來(lái)進(jìn)行哈希位選擇。然而使用馬爾可夫過(guò)程求解的訓(xùn)練代價(jià)大、復(fù)雜度高。

    3 哈希位選擇算法

    本節(jié)詳細(xì)介紹10種哈希位選擇算法,包括去除高相似性哈希位、低評(píng)分哈希位和隨機(jī)選擇3種類型。

    3.1 去除高相似性哈希位

    使用皮爾遜相關(guān)系數(shù)、余弦相似度、Jaccard相似度等來(lái)描述哈希位之間的相似性程度。哈希位的相似性程度越高,其某種特定距離越小,如歐氏距離、漢明距離等。

    設(shè)S∈RL×L表示L個(gè)哈希位之間的相似度矩陣,其中Sij= sim(hi,hj),sim(hi,hj)表示哈希位hi與hj之間的相似性大小。分別使用以下方式計(jì)算sim(hi,hj)。

    (1)皮爾遜相關(guān)系數(shù)(高相關(guān)濾波)[22]。皮爾遜相關(guān)系數(shù)描述了兩個(gè)向量之間變化趨勢(shì)的相似性程度。

    其中,cov(hi,hj)表示hi與hj之間的協(xié)方差,D(hi)表示hi的標(biāo)準(zhǔn)差。

    (2)余弦相似度[23]。特征之間的相似性用特征向量的夾角余弦來(lái)度量。

    (3)Jaccard相似度。Jaccard相似度通過(guò)兩個(gè)向量集合的交集與并集之比來(lái)刻畫向量之間的相似性。

    (4)基于歐氏距離的相似度。特征向量之間的歐氏距離是一種Ld范數(shù),當(dāng)d=2時(shí),使用歐氏距離描述特征向量之間的相似性。

    當(dāng)d=1時(shí),L1表示曼哈頓距離。由于哈希碼均為二值向量,哈希位之間的歐氏距離等于曼哈頓距離。

    (5)基于漢明距離的相似度。漢明距離描述了兩個(gè)集合之間的重合程度。重合程度越高,兩個(gè)特征向量越相似。其中,⊕表示異或運(yùn)算,若hik與hjk相同則結(jié)果為1,不同則為0。

    (6)基于互信息的相似度[24]。互信息描述了兩個(gè)變量之間包含的信息量大小。互信息越大,則兩個(gè)向量之間包含的信息越大,兩個(gè)向量越相似。

    其中,p(hi)表示hi的概率分布,p(hi,hj)表示hi、hj的聯(lián)合概率分布。

    上述6種方式刻畫了哈希位之間的相似性程度,通過(guò)去除高相似性哈希位選擇出獨(dú)立且信息量豐富的哈希位。具體算法RHSHB(remove high similarity hashing bit)如下。

    算法1RHSHB算法

    輸入:數(shù)據(jù)集X,哈希碼長(zhǎng)度L,選擇后的哈希碼長(zhǎng)度k。

    輸出:數(shù)據(jù)集哈希碼B′。

    ① 使用式(1)得到數(shù)據(jù)集X的哈希碼B。

    ② 分別使用式(3)~式(8)計(jì)算哈希位之間的相似度矩陣S。

    ③ 將S的上三角陣按從大到小排序,將前L-k個(gè)數(shù)值(具有高相似度)所在的列號(hào)作為需要去除的哈希位,記為集合D。

    ④ 去除哈希碼B中集合D記錄的哈希位,得到去除冗余哈希位后的哈希碼B′。

    3.2 去除低評(píng)分哈希位

    通過(guò)計(jì)算每個(gè)哈希位的方差、拉普拉斯分?jǐn)?shù)、信息熵等屬性來(lái)評(píng)定每個(gè)哈希位的好壞,每個(gè)哈希位給予相應(yīng)的評(píng)分score(hi),去除其中評(píng)分低的哈希位。score(hi)的計(jì)算方式如下。

    (1)低方差濾波。數(shù)據(jù)取值變化小的哈希位所包含的信息量越少,該哈希位的方差越低。將每個(gè)哈希位的方差作為評(píng)分。

    其中,var(hi)表示hi的方差。

    (2)拉普拉斯分?jǐn)?shù)[25]。拉普拉斯分?jǐn)?shù)描述了各個(gè)特征保留數(shù)據(jù)局部結(jié)構(gòu)的能力。對(duì)于原始空間中的兩個(gè)近鄰點(diǎn)Xi和Xj,一個(gè)好的特征能夠保持這種近鄰關(guān)系,這在拉普拉斯分?jǐn)?shù)上體現(xiàn)為數(shù)值變小。哈希位hr的拉普拉斯分?jǐn)?shù)定義為:

    其中,Tij表示樣本i與樣本j之間的權(quán)重,

    將每個(gè)哈希位視為一個(gè)特征,則哈希位rh的評(píng)分為:

    (3)信息熵[26]。哈希位的信息熵值越大,該哈希位的不確定性程度越高,包含的信息量越大。使用信息熵作為哈希位的評(píng)分:

    ④ 提取哈希碼B中集合D記錄的哈希位,得到去除冗余哈希位后的哈希碼B′。

    3.3 隨機(jī)選擇

    隨機(jī)選擇是一種直接的選擇方式,即不考慮哈希位的屬性或哈希位之間的關(guān)系,從現(xiàn)有的哈希位集合中隨機(jī)選取哈希位子集。隨機(jī)哈希位選擇的具體算法如下。

    算法3隨機(jī)選擇算法

    輸入:數(shù)據(jù)集X,哈希碼長(zhǎng)度L,選擇后的哈希碼長(zhǎng)度k。

    輸出:數(shù)據(jù)集哈希碼B′。

    ① 使用式(1)得到數(shù)據(jù)集X的哈希碼B。

    ② 從1至L中隨機(jī)均勻生成k個(gè)隨機(jī)數(shù),記為集合D。

    ③ 提取哈希碼B中集合D記錄的哈希位,得到去除冗余哈希位后的哈希碼B ′。

    4 實(shí)驗(yàn)與分析

    其中,p(hi)表示hi取值的概率分布,m表示hi取值的個(gè)數(shù)。在哈希位中,m=2,即hi中元素的取值只能為0或1。

    通過(guò)上述3種方式計(jì)算每個(gè)哈希位的評(píng)分,選擇評(píng)分高的哈希位。具體算法SHHBS(select high hashing bit score)如下。

    算法2SHHBS算法

    輸入:數(shù)據(jù)集X,哈希碼長(zhǎng)度L,選擇后的哈希碼長(zhǎng)度k。

    輸出:數(shù)據(jù)集哈希碼′B。

    ① 使用式(1)得到數(shù)據(jù)集X的哈希碼B。

    ② 分別使用式(9)~式(12)計(jì)算每個(gè)哈希位的分?jǐn)?shù),記為score∈RL。

    ③ 將score從大到小排序,將前k個(gè)數(shù)值所在的列號(hào)作為選取的哈希位,記為集合D。

    4.1 數(shù)據(jù)集與實(shí)驗(yàn)設(shè)置

    本文使用兩個(gè)有標(biāo)簽數(shù)據(jù)集和兩個(gè)無(wú)標(biāo)簽數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)驗(yàn)證。其中有標(biāo)簽數(shù)據(jù)集分別為CIFAR-10[27]和MNIST[28],將具有相同標(biāo)簽的數(shù)據(jù)作為真實(shí)近鄰點(diǎn);無(wú)標(biāo)簽數(shù)據(jù)集分別為L(zhǎng)abelMe[29]和Corel[30],將其歐氏空間下的近鄰點(diǎn)作為真實(shí)近鄰點(diǎn)。下面簡(jiǎn)要描述上述4個(gè)常用數(shù)據(jù)集。

    MNIST:MNIST數(shù)據(jù)集為整數(shù)0~9的手寫數(shù)字圖片,包含70000張28×28像素的灰度圖片。

    CIFAR-10:CIFAR-10包含60000張32×32像素的彩色圖片。所有圖片被分為10個(gè)種類,每類圖片中含有6000張圖片。

    LabelMe:LabelMe數(shù)據(jù)集包含22000張彩色圖片,圖片均為生活中的場(chǎng)景與實(shí)體。

    Corel:Corel數(shù)據(jù)集包含10000張192×128像素的彩色圖片。其中多為風(fēng)景類圖片,如日落、山脈等。

    對(duì)于MNIST和CIFAR-10兩個(gè)數(shù)據(jù)集,分別從每個(gè)類別中隨機(jī)抽取1000張圖片作為查詢集(共計(jì)10000張圖片),剩余的所有圖片作為數(shù)據(jù)庫(kù)。對(duì)于LabelMe和Corel數(shù)據(jù)集,分別從中隨機(jī)抽取3000張圖片作為查詢集,余下的所有圖片作為數(shù)據(jù)庫(kù)。MNIST數(shù)據(jù)集直接使用圖片的像素值作為特征向量(786=28×28),其他3個(gè)數(shù)據(jù)集則提取每張圖片512維的GIST特征作為特征向量。

    4.2 評(píng)價(jià)指標(biāo)

    本文采用文獻(xiàn)中廣泛使用的精準(zhǔn)度(precision)、召回率(recall)、平均精度均值(mean average precision,MAP)3個(gè)性能指標(biāo)來(lái)衡量實(shí)驗(yàn)結(jié)果。將測(cè)試數(shù)據(jù)的真實(shí)近鄰點(diǎn)集合定義為R,假設(shè)測(cè)試數(shù)據(jù)返回的數(shù)據(jù)集合為′R,則定義精準(zhǔn)度和召回率分別為:

    為了描述哈希位選擇前后性能的變化,取返回不同數(shù)據(jù)點(diǎn)個(gè)數(shù)下的平均精準(zhǔn)度(mean precision,MP)和平均召回率(mean recall,MR)進(jìn)行對(duì)比,定義MP與MR為:

    其中, =Q{10,50,100,200,400,600,800,1000} 表示返回?cái)?shù)據(jù)點(diǎn)的個(gè)數(shù)。

    根據(jù)平均精準(zhǔn)度可以得到廣泛使用的MAP:

    其中,M表示查詢數(shù)據(jù)集。

    4.3 實(shí)驗(yàn)結(jié)果

    為了清晰地展示圖片中的內(nèi)容,將第2.2節(jié)中基于圖模型的哈希位選擇和本文使用的10種哈希位選擇算法分別命名為:NDomSet(圖模型)、HCF(高相關(guān)濾波)、Cosine(余弦相似度)、Hamming(漢明距離)、Euc(歐氏距離)、MI(互信息)、Jaccard(Jaccard相似度)、LCV(低方差濾波)、LS(拉普拉斯分?jǐn)?shù))、IE(信息熵)、Random(隨機(jī))。

    在實(shí)驗(yàn)過(guò)程中,分別使用局部敏感哈希生成的128、256、512、1024位哈希池進(jìn)行哈希位選擇。每個(gè)哈希碼長(zhǎng)度均約簡(jiǎn)(即去除冗余哈希位)20%,則約簡(jiǎn)后的哈希碼長(zhǎng)度為102、205、410、819位。

    局部敏感哈希約簡(jiǎn)20%的哈希位后與原哈希碼在MP和MR上的對(duì)比分別如圖1、圖2所示。在LabelMe和Corel數(shù)據(jù)集上,當(dāng)原哈希碼為128、256位時(shí),約簡(jiǎn)后的哈希碼與原碼在平均精準(zhǔn)度和平均召回率上的誤差在1%~2%之間;當(dāng)原哈希碼為512、1024位時(shí),除了基于Cosine的選擇算法,大部分選擇算法誤差在0~1%之間。這一現(xiàn)象表明,原哈希碼越長(zhǎng),約簡(jiǎn)相同比例的哈希碼對(duì)其性能影響越小。

    圖1 數(shù)據(jù)集LabelMe上不同編碼長(zhǎng)度下的MP

    圖2 數(shù)據(jù)集Corel上不同編碼長(zhǎng)度下的MR

    表1給出了在有標(biāo)簽數(shù)據(jù)集CIFAR-10和MNIST上約簡(jiǎn)20%哈希位后,MAP的前后對(duì)比。在CIFAR-10數(shù)據(jù)集上,不同長(zhǎng)度的哈希碼約簡(jiǎn)后的MAP均與原碼的MAP保持一致(誤差小于2%);在MNIST數(shù)據(jù)集上,當(dāng)原哈希碼為128位時(shí),基于歐氏距離(Euc)、低方差濾波(LCV)、拉普拉斯分?jǐn)?shù)(LS)、信息熵(IE)的哈希位選擇算法與原哈希碼的性能誤差在2%~3%之間。其他長(zhǎng)度的哈希碼基本與原碼保持一致(誤差小于2%)。

    表1 MAP在CIFAR-10和MNIST數(shù)據(jù)集上不同編碼長(zhǎng)度下的MAP

    在MP、MR和MAP均與原哈希碼基本保持一致的前提下(誤差小于2%),探究128、256、512、1024位局部敏感哈希在11種哈希位選擇算法下能約簡(jiǎn)的最大比率。從圖3和圖4中可以發(fā)現(xiàn),隨著原哈希碼長(zhǎng)度的增加,使用不同哈希位選擇算法能約簡(jiǎn)的哈希位比率也在增加。該現(xiàn)象說(shuō)明雖然隨著哈希碼長(zhǎng)度的增加,原局部敏感哈希的檢索性能有所提升,但其中冗余的哈希位也相應(yīng)增多。

    在MNIST數(shù)據(jù)集上,基于歐氏距離、低方差濾波、拉普拉斯分?jǐn)?shù)、信息熵的哈希位選擇算法能約簡(jiǎn)的哈希位比率較少。而其他哈希位選擇算法均能約簡(jiǎn)20%以上。當(dāng)原哈希碼為1024位時(shí),使用基于圖模型、余弦相似度、高相關(guān)濾波等選擇算法的約簡(jiǎn)比率高達(dá)60%以上。在CIFAR-10數(shù)據(jù)集上,所有哈希位選擇算法均能約簡(jiǎn)20%以上的哈希碼,且哈希碼長(zhǎng)度較長(zhǎng)(如512、1024)時(shí),約簡(jiǎn)比率為30%~70%。

    表2給出了不同哈希碼長(zhǎng)度下,對(duì)于給定的查詢數(shù)據(jù),檢索3000個(gè)近鄰數(shù)據(jù)所需時(shí)間。從表2可以看出,檢索所需時(shí)間隨著哈希碼長(zhǎng)度的增加而增加。例如,哈希碼長(zhǎng)度從256位增加至512位時(shí),檢索時(shí)間增加近一倍。結(jié)合圖3與圖4可以看出,本文使用的哈希位選擇算法能夠?qū)⒃4a約簡(jiǎn)30%~70%,使用約簡(jiǎn)后的哈希碼進(jìn)行信息檢索,不僅能夠充分減少檢索所需時(shí)間,還可以降低數(shù)據(jù)(圖片、文本等)轉(zhuǎn)換后的哈希碼所需存儲(chǔ)空間。

    表2 不同哈希碼長(zhǎng)度下檢索3000個(gè)近鄰數(shù)據(jù)所需時(shí)間

    圖3 數(shù)據(jù)集MNIST上11種算法的約簡(jiǎn)比率對(duì)比

    圖4 數(shù)據(jù)集CIFAR-10上11種算法約簡(jiǎn)的比率對(duì)比

    表3給出了11種哈希位選擇算法的時(shí)間復(fù)雜度和將512位哈希碼約簡(jiǎn)20%后的MAP和實(shí)際運(yùn)行時(shí)間。其中,n表示數(shù)據(jù)個(gè)數(shù),d表示數(shù)據(jù)維度,k表示哈希碼長(zhǎng)度(k?n)。從表3可以看出,雖然基于NDomSet的哈希位選擇算法的MAP最高,但是其時(shí)間復(fù)雜度也最大?;贜DomSet的哈希位選擇算法的MAP高于基于Cosine、HCF、Jaccard、Hamming、LCV、IE、Random的哈希位選擇算法0~0.002,然而其運(yùn)行時(shí)間為這幾種算法的20~100倍(除了基于IE的哈希位選擇算法)。因此,在處理小規(guī)模數(shù)據(jù)集和追求高精度的場(chǎng)景下可以使用基于NDomSet的哈希位選擇算法,但當(dāng)處理大規(guī)模數(shù)據(jù)時(shí),基于特征選擇的哈希位選擇算法更加高效,同時(shí)不會(huì)嚴(yán)重?fù)p失哈希碼的精度。

    表3 數(shù)據(jù)集CIFAR-10上11種算法的時(shí)間復(fù)雜度、MAP與運(yùn)行時(shí)間

    5 結(jié)束語(yǔ)

    本文首次將特征工程中的10種降維算法應(yīng)用于哈希位選擇中。在保證約簡(jiǎn)后的哈希碼與原碼性能基本一致的前提下,盡可能約簡(jiǎn)較多的哈希碼,使得約簡(jiǎn)后的哈希碼更加緊湊、高效,包含的冗余信息更少。約簡(jiǎn)后的哈希碼不僅提高了檢索效率,且減少了基于哈希碼表示的數(shù)據(jù)集所需的存儲(chǔ)空間。

    日韩av在线免费看完整版不卡| 在线观看国产h片| 欧美日韩视频高清一区二区三区二| 国产成人免费无遮挡视频| 女人爽到高潮嗷嗷叫在线视频| 国产精品久久久久成人av| 亚洲专区国产一区二区| 亚洲精品国产区一区二| 精品人妻1区二区| 亚洲第一av免费看| 91麻豆精品激情在线观看国产 | 18禁观看日本| 国产高清视频在线播放一区 | av在线app专区| 国产真人三级小视频在线观看| 久热这里只有精品99| 欧美黄色片欧美黄色片| 国产三级黄色录像| 免费观看av网站的网址| 久久久久久久久久久久大奶| 嫁个100分男人电影在线观看 | 久久久久久久大尺度免费视频| www.自偷自拍.com| 欧美在线黄色| 高清视频免费观看一区二区| 美女高潮到喷水免费观看| 国产精品av久久久久免费| 永久免费av网站大全| 国产色视频综合| 18禁黄网站禁片午夜丰满| 可以免费在线观看a视频的电影网站| 一边亲一边摸免费视频| 精品第一国产精品| 国产99久久九九免费精品| 9191精品国产免费久久| www日本在线高清视频| 久久国产精品影院| 亚洲精品国产av蜜桃| 日本91视频免费播放| 久久亚洲精品不卡| 久久精品国产亚洲av涩爱| 国产成人精品在线电影| 国产成人精品久久二区二区91| 中文欧美无线码| 精品国产乱码久久久久久小说| 日韩大片免费观看网站| 国产男女内射视频| 国产成人av激情在线播放| 99久久综合免费| 国产精品一区二区精品视频观看| 国产无遮挡羞羞视频在线观看| 亚洲伊人色综图| 日韩精品免费视频一区二区三区| 国产精品九九99| videosex国产| 久久人妻熟女aⅴ| 欧美亚洲 丝袜 人妻 在线| bbb黄色大片| 国产精品免费大片| 欧美日韩视频高清一区二区三区二| 亚洲国产最新在线播放| 97人妻天天添夜夜摸| 国产欧美日韩一区二区三区在线| 午夜福利视频在线观看免费| 国产又色又爽无遮挡免| 国产一区二区三区综合在线观看| 国产精品av久久久久免费| 丝袜人妻中文字幕| 免费不卡黄色视频| 成人影院久久| 王馨瑶露胸无遮挡在线观看| a级毛片黄视频| 久久久精品区二区三区| 97在线人人人人妻| 久久精品熟女亚洲av麻豆精品| 午夜福利,免费看| 欧美日韩亚洲综合一区二区三区_| 中国美女看黄片| 女警被强在线播放| 男女边吃奶边做爰视频| 精品高清国产在线一区| 国产亚洲av高清不卡| 亚洲专区中文字幕在线| 久久久精品免费免费高清| 19禁男女啪啪无遮挡网站| 99国产精品一区二区蜜桃av | 免费av中文字幕在线| 国产免费视频播放在线视频| 一级a爱视频在线免费观看| 18禁观看日本| 欧美变态另类bdsm刘玥| 亚洲成色77777| 亚洲激情五月婷婷啪啪| 国产一区二区在线观看av| 搡老乐熟女国产| 一区二区三区乱码不卡18| 黄网站色视频无遮挡免费观看| 91成人精品电影| 国产伦理片在线播放av一区| 叶爱在线成人免费视频播放| 超色免费av| 爱豆传媒免费全集在线观看| 看免费av毛片| av不卡在线播放| 啦啦啦啦在线视频资源| 国产日韩欧美在线精品| 国产一区二区三区综合在线观看| 国产女主播在线喷水免费视频网站| 99香蕉大伊视频| 亚洲精品国产一区二区精华液| 亚洲中文日韩欧美视频| 一级黄色大片毛片| 精品人妻1区二区| 精品少妇黑人巨大在线播放| 亚洲七黄色美女视频| 亚洲美女黄色视频免费看| 久久久久国产一级毛片高清牌| 丁香六月欧美| 建设人人有责人人尽责人人享有的| 精品亚洲成a人片在线观看| 亚洲国产精品999| 人成视频在线观看免费观看| 精品国产一区二区久久| 黄色a级毛片大全视频| 九色亚洲精品在线播放| 精品人妻1区二区| 国产欧美日韩精品亚洲av| 欧美在线一区亚洲| 日本wwww免费看| 青春草亚洲视频在线观看| 中文字幕精品免费在线观看视频| 婷婷成人精品国产| 精品人妻在线不人妻| 天天添夜夜摸| 别揉我奶头~嗯~啊~动态视频 | 中文字幕最新亚洲高清| 无限看片的www在线观看| 久久久久久久国产电影| 赤兔流量卡办理| 国产伦人伦偷精品视频| 最黄视频免费看| www.熟女人妻精品国产| 热re99久久国产66热| 久久久久国产精品人妻一区二区| 国产日韩欧美亚洲二区| 岛国毛片在线播放| 又大又爽又粗| 久久久久视频综合| 少妇猛男粗大的猛烈进出视频| 精品少妇一区二区三区视频日本电影| 十八禁高潮呻吟视频| 男人添女人高潮全过程视频| 久久人妻熟女aⅴ| 男女高潮啪啪啪动态图| 美女视频免费永久观看网站| 国产免费福利视频在线观看| 色视频在线一区二区三区| www.自偷自拍.com| 免费看十八禁软件| 国产成人精品久久二区二区免费| 热99久久久久精品小说推荐| 七月丁香在线播放| 亚洲av综合色区一区| 免费高清在线观看日韩| √禁漫天堂资源中文www| 丝袜在线中文字幕| 永久免费av网站大全| 久久久久久久久免费视频了| 2021少妇久久久久久久久久久| 99re6热这里在线精品视频| 大型av网站在线播放| 精品久久久久久电影网| 久久久久久久精品精品| 欧美在线黄色| 国产成人一区二区三区免费视频网站 | 高潮久久久久久久久久久不卡| 韩国精品一区二区三区| 国产黄色免费在线视频| 欧美日韩国产mv在线观看视频| 国产真人三级小视频在线观看| 欧美亚洲 丝袜 人妻 在线| 黄色毛片三级朝国网站| 久久精品熟女亚洲av麻豆精品| 青草久久国产| 国产成人a∨麻豆精品| 精品人妻1区二区| 国产福利在线免费观看视频| 高清不卡的av网站| 精品国产一区二区三区四区第35| 免费人妻精品一区二区三区视频| 国产精品熟女久久久久浪| 午夜福利,免费看| 七月丁香在线播放| 国产无遮挡羞羞视频在线观看| 久久人妻福利社区极品人妻图片 | 19禁男女啪啪无遮挡网站| 可以免费在线观看a视频的电影网站| 99久久99久久久精品蜜桃| 欧美97在线视频| 91国产中文字幕| 国产成人精品久久二区二区免费| 午夜福利一区二区在线看| 欧美精品一区二区大全| 女人爽到高潮嗷嗷叫在线视频| 18禁国产床啪视频网站| 在线观看免费午夜福利视频| 99九九在线精品视频| 伊人久久大香线蕉亚洲五| 天天添夜夜摸| 久久热在线av| 男女无遮挡免费网站观看| 婷婷色综合大香蕉| 日韩 亚洲 欧美在线| 性高湖久久久久久久久免费观看| 中文字幕最新亚洲高清| 少妇精品久久久久久久| 欧美成狂野欧美在线观看| av在线播放精品| 亚洲欧美色中文字幕在线| 后天国语完整版免费观看| 欧美性长视频在线观看| 国产精品九九99| 国产亚洲欧美精品永久| 午夜免费成人在线视频| 成年人黄色毛片网站| 日韩免费高清中文字幕av| 18禁国产床啪视频网站| 又粗又硬又长又爽又黄的视频| 热re99久久精品国产66热6| 中文字幕人妻丝袜制服| 91精品伊人久久大香线蕉| 考比视频在线观看| 欧美日韩一级在线毛片| 亚洲欧美中文字幕日韩二区| 日韩,欧美,国产一区二区三区| xxx大片免费视频| 国产精品久久久久久精品古装| 99国产综合亚洲精品| 国产高清国产精品国产三级| 免费少妇av软件| 观看av在线不卡| 午夜激情av网站| 夫妻性生交免费视频一级片| 国精品久久久久久国模美| 80岁老熟妇乱子伦牲交| 国产成人一区二区三区免费视频网站 | 国产欧美日韩一区二区三区在线| 色精品久久人妻99蜜桃| 超碰成人久久| 精品国产一区二区三区久久久樱花| 制服人妻中文乱码| 亚洲精品国产av蜜桃| 成人免费观看视频高清| 亚洲色图 男人天堂 中文字幕| 国产日韩一区二区三区精品不卡| 亚洲欧美一区二区三区国产| 欧美黑人精品巨大| 男的添女的下面高潮视频| 国产精品免费大片| 手机成人av网站| 男女无遮挡免费网站观看| 纵有疾风起免费观看全集完整版| 精品久久蜜臀av无| 91精品伊人久久大香线蕉| 777久久人妻少妇嫩草av网站| 精品亚洲成国产av| 国产精品国产av在线观看| 精品福利永久在线观看| 日本猛色少妇xxxxx猛交久久| 欧美精品啪啪一区二区三区 | 亚洲欧美激情在线| 99国产精品免费福利视频| 麻豆国产av国片精品| 久久国产亚洲av麻豆专区| 国产深夜福利视频在线观看| 免费观看人在逋| 中文字幕色久视频| 精品国产国语对白av| 新久久久久国产一级毛片| 国产成人精品久久久久久| 国产成人啪精品午夜网站| 一级黄片播放器| 亚洲成人国产一区在线观看 | 另类精品久久| www.av在线官网国产| 99热网站在线观看| 黄片播放在线免费| 亚洲国产精品成人久久小说| 人妻 亚洲 视频| 久久精品亚洲av国产电影网| 国产99久久九九免费精品| 精品亚洲乱码少妇综合久久| 免费女性裸体啪啪无遮挡网站| 可以免费在线观看a视频的电影网站| 下体分泌物呈黄色| 宅男免费午夜| 69精品国产乱码久久久| 91九色精品人成在线观看| 日韩精品免费视频一区二区三区| 免费人妻精品一区二区三区视频| 一区二区三区四区激情视频| 极品少妇高潮喷水抽搐| 国产精品久久久久久人妻精品电影 | 黄色 视频免费看| 99精国产麻豆久久婷婷| √禁漫天堂资源中文www| 啦啦啦啦在线视频资源| 亚洲av综合色区一区| 啦啦啦 在线观看视频| 少妇人妻久久综合中文| 欧美精品啪啪一区二区三区 | 人人妻,人人澡人人爽秒播 | 久久久精品94久久精品| 欧美日韩黄片免| 老司机影院毛片| 熟女少妇亚洲综合色aaa.| 丰满饥渴人妻一区二区三| 亚洲av美国av| 黄色片一级片一级黄色片| 夜夜骑夜夜射夜夜干| 丝袜美腿诱惑在线| 18禁裸乳无遮挡动漫免费视频| 久热爱精品视频在线9| 在线精品无人区一区二区三| 色婷婷av一区二区三区视频| 国产老妇伦熟女老妇高清| 午夜福利,免费看| 亚洲国产av影院在线观看| 美女国产高潮福利片在线看| 深夜精品福利| 久久久久久亚洲精品国产蜜桃av| 精品福利观看| 国产三级黄色录像| 成人三级做爰电影| 蜜桃国产av成人99| 国产熟女欧美一区二区| 国产激情久久老熟女| 飞空精品影院首页| 黄频高清免费视频| 亚洲国产中文字幕在线视频| 国产成人欧美| 国产男女超爽视频在线观看| 欧美另类一区| 国产深夜福利视频在线观看| 伊人亚洲综合成人网| 亚洲,一卡二卡三卡| 午夜福利视频在线观看免费| 18在线观看网站| 国产成人精品久久二区二区免费| h视频一区二区三区| 美女主播在线视频| 国产片特级美女逼逼视频| 中文字幕人妻丝袜一区二区| 在线av久久热| 啦啦啦啦在线视频资源| 香蕉丝袜av| 人人澡人人妻人| 天天躁狠狠躁夜夜躁狠狠躁| 成人手机av| 好男人视频免费观看在线| 一区二区日韩欧美中文字幕| 久久精品久久久久久噜噜老黄| 老司机影院成人| 一二三四社区在线视频社区8| 国产一区亚洲一区在线观看| 啦啦啦啦在线视频资源| 美女脱内裤让男人舔精品视频| 亚洲欧洲精品一区二区精品久久久| 好男人电影高清在线观看| 欧美精品一区二区大全| 在线观看免费高清a一片| 日韩欧美一区视频在线观看| 99香蕉大伊视频| 97人妻天天添夜夜摸| 女性生殖器流出的白浆| 国产精品 欧美亚洲| 中文字幕亚洲精品专区| 天天操日日干夜夜撸| 黄色毛片三级朝国网站| 两个人免费观看高清视频| 国产精品秋霞免费鲁丝片| 男人爽女人下面视频在线观看| 亚洲精品美女久久av网站| 日韩中文字幕视频在线看片| 亚洲国产欧美日韩在线播放| 大型av网站在线播放| 啦啦啦中文免费视频观看日本| 亚洲欧美色中文字幕在线| 香蕉国产在线看| 亚洲精品日本国产第一区| 黄色一级大片看看| 免费av中文字幕在线| 女人高潮潮喷娇喘18禁视频| 成年人黄色毛片网站| 无限看片的www在线观看| 国产午夜精品一二区理论片| 国产国语露脸激情在线看| 国产精品久久久久久精品电影小说| 啦啦啦 在线观看视频| 国产精品 欧美亚洲| 女人高潮潮喷娇喘18禁视频| 午夜av观看不卡| 久久国产精品影院| 一级毛片黄色毛片免费观看视频| 色视频在线一区二区三区| 一区福利在线观看| 国产成人免费观看mmmm| 下体分泌物呈黄色| 黑丝袜美女国产一区| 看免费av毛片| 男女无遮挡免费网站观看| 在线观看免费午夜福利视频| 九色亚洲精品在线播放| 成人免费观看视频高清| 免费av中文字幕在线| 极品少妇高潮喷水抽搐| 亚洲美女黄色视频免费看| 男人爽女人下面视频在线观看| 久久精品人人爽人人爽视色| 久久热在线av| 免费少妇av软件| 色婷婷av一区二区三区视频| 每晚都被弄得嗷嗷叫到高潮| 纵有疾风起免费观看全集完整版| 中文字幕av电影在线播放| 国产又色又爽无遮挡免| 国产一区亚洲一区在线观看| 中文字幕亚洲精品专区| 嫁个100分男人电影在线观看 | 久久人妻福利社区极品人妻图片 | 久久99精品国语久久久| 女人被躁到高潮嗷嗷叫费观| 桃花免费在线播放| 亚洲精品久久成人aⅴ小说| 大香蕉久久成人网| 欧美日韩亚洲高清精品| 精品久久久久久电影网| 日韩 欧美 亚洲 中文字幕| 激情五月婷婷亚洲| 日本黄色日本黄色录像| 国产在视频线精品| 麻豆av在线久日| 免费看av在线观看网站| 一区二区av电影网| 国产野战对白在线观看| 一本色道久久久久久精品综合| 国产精品国产三级国产专区5o| 人成视频在线观看免费观看| 女人爽到高潮嗷嗷叫在线视频| www.av在线官网国产| 久久国产精品人妻蜜桃| 国产淫语在线视频| 国产成人欧美在线观看 | 少妇猛男粗大的猛烈进出视频| 人妻一区二区av| 中国国产av一级| 亚洲视频免费观看视频| svipshipincom国产片| 欧美97在线视频| 国产男人的电影天堂91| 亚洲欧美色中文字幕在线| 菩萨蛮人人尽说江南好唐韦庄| 自线自在国产av| 精品熟女少妇八av免费久了| 精品国产超薄肉色丝袜足j| 成年美女黄网站色视频大全免费| 午夜日韩欧美国产| 在线精品无人区一区二区三| 国产高清国产精品国产三级| h视频一区二区三区| 色综合欧美亚洲国产小说| 少妇精品久久久久久久| 免费不卡黄色视频| 99久久人妻综合| 欧美日韩一级在线毛片| 国产高清视频在线播放一区 | 成年人黄色毛片网站| 一级黄片播放器| a级毛片在线看网站| 一边摸一边抽搐一进一出视频| 少妇裸体淫交视频免费看高清 | 黄色 视频免费看| 一区二区三区精品91| 麻豆乱淫一区二区| 亚洲欧洲国产日韩| 日韩 欧美 亚洲 中文字幕| 精品第一国产精品| 精品久久久久久久毛片微露脸 | 韩国高清视频一区二区三区| 性少妇av在线| 少妇被粗大的猛进出69影院| 免费一级毛片在线播放高清视频 | 高清视频免费观看一区二区| 一区二区三区乱码不卡18| 交换朋友夫妻互换小说| 少妇粗大呻吟视频| 色综合欧美亚洲国产小说| 久久av网站| 午夜日韩欧美国产| 日韩一本色道免费dvd| 久久久久久人人人人人| 中文精品一卡2卡3卡4更新| 高清视频免费观看一区二区| 亚洲欧美一区二区三区久久| 视频在线观看一区二区三区| 亚洲图色成人| 黑人猛操日本美女一级片| www.av在线官网国产| 国产精品熟女久久久久浪| 国产色视频综合| 国产日韩欧美亚洲二区| 在线观看国产h片| 老司机影院毛片| 亚洲欧美精品综合一区二区三区| 99精品久久久久人妻精品| 搡老岳熟女国产| 久久国产精品人妻蜜桃| 叶爱在线成人免费视频播放| 日韩中文字幕欧美一区二区 | 成人午夜精彩视频在线观看| 亚洲色图综合在线观看| 亚洲国产精品一区二区三区在线| 妹子高潮喷水视频| 亚洲精品乱久久久久久| www.999成人在线观看| 亚洲欧美清纯卡通| 汤姆久久久久久久影院中文字幕| 亚洲少妇的诱惑av| 在线观看国产h片| 精品国产一区二区三区久久久樱花| 狂野欧美激情性bbbbbb| 国产麻豆69| 热99久久久久精品小说推荐| 国产免费一区二区三区四区乱码| 婷婷色麻豆天堂久久| 精品亚洲乱码少妇综合久久| www.熟女人妻精品国产| 大陆偷拍与自拍| 一边摸一边做爽爽视频免费| 亚洲av男天堂| 国产伦理片在线播放av一区| 亚洲精品国产av成人精品| 久久天躁狠狠躁夜夜2o2o | 国产精品一国产av| 999久久久国产精品视频| 极品人妻少妇av视频| 极品少妇高潮喷水抽搐| 狂野欧美激情性xxxx| 一区福利在线观看| 亚洲精品国产色婷婷电影| a级片在线免费高清观看视频| 黄片播放在线免费| 国产欧美亚洲国产| 久久国产亚洲av麻豆专区| 肉色欧美久久久久久久蜜桃| 婷婷成人精品国产| 久久久国产一区二区| 日韩,欧美,国产一区二区三区| 美女国产高潮福利片在线看| 亚洲欧美成人综合另类久久久| 人妻 亚洲 视频| av国产久精品久网站免费入址| 超色免费av| 欧美av亚洲av综合av国产av| 免费在线观看日本一区| 人成视频在线观看免费观看| 日韩制服丝袜自拍偷拍| 国产精品 欧美亚洲| 天天添夜夜摸| 热99国产精品久久久久久7| 日本a在线网址| 欧美日韩精品网址| 免费人妻精品一区二区三区视频| 美女视频免费永久观看网站| 在线观看免费午夜福利视频| 老熟女久久久| 国产一区亚洲一区在线观看| 久久久精品免费免费高清| 国产精品一区二区在线不卡| 亚洲成av片中文字幕在线观看| 日日爽夜夜爽网站| 美女脱内裤让男人舔精品视频| 在线 av 中文字幕| 视频在线观看一区二区三区| 国产在线一区二区三区精| 久久午夜综合久久蜜桃| 久久人妻熟女aⅴ| 久久久久久久国产电影| 精品一区在线观看国产| 精品国产一区二区三区久久久樱花| 啦啦啦啦在线视频资源| 久久久国产一区二区| 波野结衣二区三区在线| 精品国产超薄肉色丝袜足j| 欧美日韩亚洲国产一区二区在线观看 | 亚洲av日韩精品久久久久久密 | 天堂中文最新版在线下载| 午夜视频精品福利| av一本久久久久| 老司机影院毛片| 欧美亚洲日本最大视频资源| 欧美日韩亚洲国产一区二区在线观看 | a级毛片在线看网站| 丁香六月天网| 亚洲精品av麻豆狂野| 婷婷色麻豆天堂久久| 国产一区有黄有色的免费视频| 国产成人免费无遮挡视频| 丝袜人妻中文字幕| 国产xxxxx性猛交| 王馨瑶露胸无遮挡在线观看| 国产黄频视频在线观看| 一区福利在线观看| 一级毛片我不卡| 中文字幕人妻熟女乱码|