• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于birch聚類的可更新機器學(xué)習(xí)索引模型

    2023-12-04 11:13:22曹衛(wèi)東
    計算機工程與設(shè)計 2023年11期
    關(guān)鍵詞:模型

    曹衛(wèi)東,金 超

    (中國民航大學(xué) 計算機科學(xué)與技術(shù)學(xué)院,天津 300300)

    0 引 言

    索引作為如今數(shù)據(jù)庫系統(tǒng)中用于數(shù)據(jù)存儲的重要技術(shù)之一,直接影響到了數(shù)據(jù)庫系統(tǒng)的存取性能。幾十年來,研究人員致力于研究出輕量、高效的索引結(jié)構(gòu):部分學(xué)者通過優(yōu)化B樹索引結(jié)構(gòu)和嘗試索引壓縮算法[1]來更好地發(fā)揮包括CPU緩存等在內(nèi)的硬件優(yōu)勢,例如A-樹[2]在葉子節(jié)點中使用了線性模型。

    傳統(tǒng)數(shù)據(jù)庫索引為了追求泛用性,通常只通過數(shù)據(jù)結(jié)構(gòu)進行優(yōu)化,欠缺對數(shù)據(jù)集模式和分布規(guī)律的考慮[3]。Google團隊Kraska等[4]將機器學(xué)習(xí)引入索引結(jié)構(gòu)設(shè)計,并提出了learned index。這種索引結(jié)構(gòu)可以學(xué)習(xí)數(shù)據(jù)集分布情況,生成適配度較高的專用索引結(jié)構(gòu),顯著提升大數(shù)據(jù)檢索效率[5]。

    Michael Mitzenmacher將神經(jīng)網(wǎng)絡(luò)運用在數(shù)據(jù)庫索引布隆過濾器上[6],Harrie Oosterhuis等研究了機器學(xué)習(xí)索引在索引壓縮上的潛力[7],HaiXin Wang等嘗試用機器學(xué)習(xí)化的索引結(jié)構(gòu)檢索高維數(shù)據(jù)[8],混合專家網(wǎng)絡(luò)[9]等技術(shù)也被引入相關(guān)研究。但是索引更新的問題沒有得到解決,針對這一缺陷,JiaLin Ding等[10]提出了ALEX,對葉節(jié)點進行了重新設(shè)計,使用就地插入策略解決了之前l(fā)earned index只能在只讀場景下進行的問題。并發(fā)數(shù)據(jù)結(jié)構(gòu)XIndex索引[11]采取的解決方案是設(shè)置緩沖區(qū)進行插入。FITling-tree[12]為每個段內(nèi)部預(yù)留緩沖區(qū)實現(xiàn)更新。PGM-index[13]從索引壓縮等多個方面優(yōu)化了FITing-Tree。但是大多數(shù)相關(guān)研究選擇采用learned index提出的遞歸模型Recursive Model Indexes(RMI)結(jié)構(gòu)框架或類似RMI結(jié)構(gòu)框架,并沒有解決RMI中數(shù)據(jù)固定劃分導(dǎo)致擬合效果不佳和訓(xùn)練時間長的問題。

    本文面向海量數(shù)據(jù)高檢索需求,提出了ULIB (upda-table learning index structure based on birch clustering)。該模型采用了類樹的結(jié)構(gòu)設(shè)計,首先對數(shù)據(jù)集使用birch聚類算法來實現(xiàn)數(shù)據(jù)的初步劃分,引入Calinski-Harabasz(CH)函數(shù)作為評價指標判斷聚類有效性;然后在訓(xùn)練階段,采用前饋神經(jīng)網(wǎng)絡(luò)進行分段學(xué)習(xí),同時將數(shù)據(jù)訪問模式引入損失函數(shù)設(shè)計提高預(yù)測精度。最后,在數(shù)據(jù)更新過程中使用基于日志結(jié)構(gòu)合并(log-structured merge,LSM)樹的異地插入策略解決更新問題。

    1 機器學(xué)習(xí)索引

    1.1 機器學(xué)習(xí)索引模型及相關(guān)問題

    機器學(xué)習(xí)索引模型使用索引列的所有鍵值作為訓(xùn)練集進行訓(xùn)練,待檢索數(shù)據(jù)鍵作為輸入,鍵值所在的位置作為輸出。訓(xùn)練結(jié)束得到的模型會生成真實值的偏移量,并存儲整個數(shù)據(jù)集中最大的向下和向上偏移量(稱作誤差范圍)。如圖1所示,B樹等同于機器學(xué)習(xí),同樣可以看成一個根據(jù)鍵值預(yù)測數(shù)據(jù)所在位置的模型。

    圖1 B樹與機器學(xué)習(xí)索引結(jié)構(gòu)

    當機器學(xué)習(xí)索引模型中一個檢索請求生成后,模型根據(jù)輸入的鍵值輸出這個鍵對應(yīng)數(shù)據(jù)項的預(yù)測位置,類似B樹中的頁面設(shè)置,數(shù)據(jù)檢索保證了在預(yù)測位置最大的上下誤差范圍內(nèi)一定能搜索到待檢索的數(shù)據(jù)項。雖然在索引設(shè)計方案中使用一個全連接神經(jīng)網(wǎng)絡(luò)就可以擬合數(shù)據(jù)的整體分布,但是由于索引對于預(yù)測精度的要求較高,訓(xùn)練階段需要大量的時間和空間去降低極小的誤差,即在單個數(shù)據(jù)實例級別上進行精確定位十分困難[14],這個問題被稱作是“最后一公里”問題。

    可以說,機器學(xué)習(xí)索引設(shè)計的關(guān)鍵就是如何解決初始數(shù)據(jù)劃分問題、數(shù)據(jù)劃分后的“最后一公里”問題和索引更新問題。

    1.2 learned index的解決方案

    learned index提供的解決方案是RMI,其結(jié)構(gòu)如圖2所示。

    圖2 RMI模型結(jié)構(gòu)

    其中,RMI頂層使用神經(jīng)網(wǎng)絡(luò)來實現(xiàn)數(shù)據(jù)分發(fā),在第二層使用線性回歸算法來實現(xiàn)各數(shù)據(jù)段的擬合,除第一層外,每一層分布情況由上一層模型的輸出決定,遞歸執(zhí)行直至最后一層,在誤差區(qū)間使用二分查找來找到待檢索鍵的最終位置。

    learned index相比較B樹,在查詢時間復(fù)雜度方面,可以由B樹的O(logN)降低至O(1),同時也可以顯著減少空間占用,空間復(fù)雜度從B樹O(N)降低至O(1)。

    learned index存在的問題為:使用復(fù)雜的遞歸層次結(jié)構(gòu)帶來的模型訓(xùn)練時間長的問題;采取均等劃分策略進行數(shù)據(jù)劃分,葉子節(jié)點使用線性回歸模型進行擬合解決“最后一公里”問題,擬合效果很大程度上由數(shù)據(jù)劃分階段所劃分出的各個數(shù)據(jù)區(qū)域自身分布決定,性能存在優(yōu)化空間;每次數(shù)據(jù)更新后需要完整重新訓(xùn)練數(shù)據(jù)集,即沒有解決索引更新的問題。

    2 可更新機器學(xué)習(xí)索引模型ULIB

    針對大數(shù)據(jù)時代海量數(shù)據(jù)高檢索需求,提出基于birch聚類的高效可更新機器學(xué)習(xí)索引模型ULIB。

    2.1 ULIB模型結(jié)構(gòu)

    ULIB模型結(jié)構(gòu)如圖3所示,模型一共分為4個階段:

    圖3 ULIB模型結(jié)構(gòu)

    (1)數(shù)據(jù)劃分,利用birch算法將數(shù)據(jù)集劃分為D1到Dk,由于在神經(jīng)網(wǎng)絡(luò)中訓(xùn)練時間并不隨數(shù)據(jù)集規(guī)模增長而線性增加,而是更高程度增長,所以劃分數(shù)據(jù)集的操作可以獲得更短的訓(xùn)練時間;

    (2)基于神經(jīng)網(wǎng)絡(luò)的葉子結(jié)點訓(xùn)練,針對數(shù)據(jù)劃分后的k個數(shù)據(jù)區(qū)域,分別構(gòu)建同樣數(shù)量的神經(jīng)網(wǎng)絡(luò)模型進行訓(xùn)練,以解決“最后一公里”問題。

    (3)數(shù)據(jù)檢索,當查詢數(shù)據(jù)時,模型選擇器首先檢查待查詢鍵是否存在于緩存中,若不在則確定出待查詢鍵所對應(yīng)的模型和鍵所在位置的預(yù)測y,最后自預(yù)測位置y按照最大最小誤差利用二分查找展開搜索,直至找到最終的數(shù)據(jù)精確位置。

    (4)數(shù)據(jù)更新,當數(shù)據(jù)插入時,模型會在內(nèi)存中開辟一個緩存區(qū)域存儲待插入數(shù)據(jù),當緩存溢出時,將緩存中所有數(shù)據(jù)插入到對應(yīng)學(xué)習(xí)模型中,并重新訓(xùn)練對應(yīng)模型。

    2.2 基于birch聚類的數(shù)據(jù)劃分

    2.2.1 birch聚類及有效性判定

    birch算法是一種自底向上的層次聚類算法,核心為聚類特征CF和聚類特征樹CFtree。

    相比較k-means,birch聚類無需定義聚類特征數(shù)k,且能以很高的效率更新[15]。CFtree包含3個關(guān)鍵閾值數(shù),每個內(nèi)部節(jié)點的最大CF閾值數(shù)B、葉節(jié)點最大CF閾值數(shù)L和子簇最大半徑閾值T,這3個數(shù)值直接決定了CFtree的最終形態(tài)和聚類類別數(shù)。

    一般來說,在沒有數(shù)據(jù)集類別的先驗知識時,需要確定出合適的B、L和T來使聚類效果盡可能好。研究者提出了“最優(yōu)聚類質(zhì)量判定原則”,即通過組內(nèi)元素之間距離和組件元素距離兩個方面來判定聚類效果優(yōu)劣。并依據(jù)此原則提出了多個判別函數(shù):DB函數(shù)、DI函數(shù)和CH函數(shù),本文選取公認判定效果最佳的CH函數(shù)

    (1)

    如式(1),k代表聚類類別數(shù),n代表數(shù)據(jù)集元素個數(shù)

    (2)

    如式(2),traceB等于組和組之間離差矩陣的跡,nj等于第j個組中存在的元素的數(shù)目,u為數(shù)據(jù)集所有元素的均值,uj是第j個組中所有元素的均值

    (3)

    如式(3),traceW表示組內(nèi)元素之間的離差矩陣的跡,xi代表第i個組內(nèi)元素。一般來說,聚類效果優(yōu)秀代表的是組與組之間的距離大,而組內(nèi)的元素距離小。也就是說,聚類質(zhì)量越好,CH值越大。

    2.2.2 數(shù)據(jù)劃分流程

    在機器學(xué)習(xí)索引模型中使用birch聚類算法進行數(shù)據(jù)劃分可以根據(jù)數(shù)據(jù)集分布情況生成內(nèi)部分布更加統(tǒng)一的不同數(shù)據(jù)區(qū)域,進而提升模型預(yù)測精度。

    ULIB數(shù)據(jù)劃分流程如圖4所示,選擇數(shù)據(jù)開始訓(xùn)練過程后,讀入數(shù)據(jù)樣本,使用默認B、L值進行birch聚類,進行閾值判定后更新CFtree,之后依次輸入不同的B、L值組合,CFtree在不斷地迭代中進行更新,直至算法收斂結(jié)束聚類并記錄對應(yīng)CH值用于后續(xù)對比。

    圖4 基于birch的數(shù)據(jù)劃分流程

    2.3 葉子節(jié)點訓(xùn)練

    2.3.1 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

    ULIB設(shè)計的子模型神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖5所示。

    圖5 神經(jīng)網(wǎng)絡(luò)設(shè)置

    具體訓(xùn)練流程為:

    每個模型接收數(shù)據(jù)對應(yīng)類別列向量輸入X=[x1,x2,…,xd]T通過式(4)產(chǎn)生凈輸出a[1],其中b為偏置,行向量W[1]為權(quán)重向量

    a[1]=W[1]X+b

    (4)

    凈輸入a[1]通過Relu激活函數(shù)做實現(xiàn)非線性變換,如式(5)。得到輸入為X時該神經(jīng)元的活性值a[2]

    a[2]=ρ(a[1])=max(a[1],0)

    (5)

    如式(6)所示,輸出預(yù)測值y

    y=ρ(W[2]a[2]+b2)

    (6)

    2.3.2 子模型設(shè)置及損失函數(shù)優(yōu)化

    ULIB其中一個子模型k訓(xùn)練過程如圖6所示,在訓(xùn)練階段,ULIB會根據(jù)birch聚類階段產(chǎn)生的k個數(shù)據(jù)區(qū)域分別構(gòu)造k個模型,其中各個模型為兩層神經(jīng)網(wǎng)絡(luò),輸入為待檢索數(shù)據(jù)的鍵,輸出為預(yù)測的位置,使用神經(jīng)網(wǎng)絡(luò)進行葉子節(jié)點訓(xùn)練可以適應(yīng)各種場景下的非線性擬合需求,提升預(yù)測精度。

    圖6 子模型結(jié)構(gòu)

    為了實現(xiàn)進一步提升模型性能,將數(shù)據(jù)訪問熱度融入到損失函數(shù)構(gòu)造中,即針對熱點訪問的數(shù)據(jù),模型訓(xùn)練過程中會增加其權(quán)重,宏觀上彌補了緩沖區(qū)帶來的性能損耗。

    更新?lián)p失函數(shù)如式(7),其中,x為輸入數(shù)據(jù)的主鍵,y為輸入數(shù)據(jù)項對應(yīng)的位置,f1(x)到fk(x)代表第1個到第k個訓(xùn)練模型,λx代表數(shù)據(jù)項x的訪問熱度信息,這個值由實際生活中對于x的訪問次數(shù)決定,針對不同的數(shù)據(jù)項i會有不同的λx值。優(yōu)化目標是最小化損失函數(shù)

    (7)

    2.4 基于LSM的索引更新

    模型訓(xùn)練得出的數(shù)據(jù)區(qū)域設(shè)為D1到Dk,訓(xùn)練模型fi(x)對應(yīng)的數(shù)據(jù)區(qū)域是Di。當一個待檢索數(shù)據(jù)x輸入后,輸出的y就是模型計算出的x對應(yīng)的數(shù)據(jù)區(qū)域Di中的預(yù)測的位置。計算x對應(yīng)的存儲真實位置是D1到Di-1的所有數(shù)據(jù)區(qū)域的數(shù)據(jù)量的累計值加上預(yù)測位置y,也就是說,只需要記錄下各個數(shù)據(jù)區(qū)域的數(shù)據(jù)量,即可通過計算確定x對應(yīng)的訓(xùn)練模型,而且插入操作完成后,只對x對應(yīng)的數(shù)據(jù)區(qū)域Di中的數(shù)據(jù)量和數(shù)據(jù)分布產(chǎn)生影響,訓(xùn)練時也只需要重新訓(xùn)練Di,其它數(shù)據(jù)區(qū)域不需要進行重訓(xùn)練,依舊可以通過對應(yīng)的f(x)計算出待檢索鍵的相對位置y,之后累加位于這個數(shù)據(jù)區(qū)域之前的所有數(shù)據(jù)區(qū)域數(shù)據(jù)累計量的大小得到待檢索鍵的真正的位置,模型間實現(xiàn)了互不干擾。

    但是當插入條目較多時,每次插入都要對對應(yīng)數(shù)據(jù)區(qū)域進行重訓(xùn)練依然會給模型帶來不小的開銷,進而影響模型性能?;谌罩窘Y(jié)構(gòu)的LSM樹,是一種寫優(yōu)化的數(shù)據(jù)組織方式,其核心思想包括延遲更新,核心為延遲批處理索引變更請求,采用類似歸并排序的方式串聯(lián)所有的變更信息,最后統(tǒng)一將變更遷移至磁盤[16]。

    為此,如圖7所示,模型借鑒了LSM樹的延遲更新思路。在插入過程開始后,首先在內(nèi)存中劃分一塊新的緩存,并將其分為k個緩存塊,分別對應(yīng)k個數(shù)據(jù)區(qū)域。當一條待插入數(shù)據(jù)請求生成后,模型首先根據(jù)待插入數(shù)據(jù)的輸入值x計算確定其對應(yīng)存儲數(shù)據(jù)區(qū)域Di,然后將這條數(shù)據(jù)存儲到被劃分號的第i個緩存塊中以B樹形式存儲,只有當這個緩存塊達到閾值溢出以后,才將其中的數(shù)據(jù)歸并到實際的數(shù)據(jù)區(qū)域,并重新訓(xùn)練。至此完成一次插入操作。使用這樣的異地插入不僅能夠分攤數(shù)據(jù)移位代價,還能分攤模型重訓(xùn)練代價。

    圖7 索引更新

    2.5 數(shù)據(jù)檢索過程

    當各個神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練完成以后,都會相應(yīng)生成一個適配各個模型的最大檢索誤差值。而且每一個模型對應(yīng)的數(shù)據(jù)區(qū)域都存在一個存儲范圍,這個范圍決定了檢索時待檢索鍵對應(yīng)哪個模型。

    在檢索階段,模型首先根據(jù)輸入的待檢索鍵x的大小來確定其范圍,進而根據(jù)范圍確定x對應(yīng)的索引模型fi(x),首先在fi(x)對應(yīng)的劃分緩沖區(qū)中第i個緩存塊中進行查找,檢查x是否作為臨時數(shù)據(jù)存放在內(nèi)存中,若不在,則根據(jù)fi(x)計算出x在這個模型中存儲的預(yù)測位置y,并根據(jù)生成的error序列找到對應(yīng)的最大誤差,最后通過二分查找算法在預(yù)測位置y的最大誤差區(qū)間內(nèi)查找精確位置,完成檢索操作。

    3 實驗結(jié)果與分析

    3.1 實驗數(shù)據(jù)及設(shè)置

    實驗使用數(shù)據(jù)集為亞馬遜書籍排名數(shù)據(jù)集和Weblogs數(shù)據(jù)集,以連續(xù)取樣的方式各采樣了約300萬條不重復(fù)的數(shù)據(jù)。其中:書籍排名數(shù)據(jù)集是來自亞馬遜發(fā)布的書籍各個時間段銷售排名情況;weblog數(shù)據(jù)集采集了服務(wù)器端訪問日志記錄。兩個數(shù)據(jù)集都選擇時間戳作為訓(xùn)練用主鍵。

    本文的實驗硬件環(huán)境為:CPU為2.7 GHz的6核,內(nèi)存為60 G;硬盤容量為1 TB。訓(xùn)練使用的為一塊8 G GTX 1080 GPU。軟件環(huán)境:使用操作系統(tǒng)為 Windows10 x64;Python版本為Python 3.6;基于版本號為1.13.2的 TensorFlow實現(xiàn)機器學(xué)習(xí)部分。

    實驗對比模型設(shè)置:

    ULIB:設(shè)置為兩層架構(gòu),模型輸入為待檢索數(shù)據(jù)的鍵,輸出為鍵所預(yù)測的位置,隱藏層神經(jīng)元設(shè)置為32個,激活函數(shù)為Relu;

    learned index:設(shè)置為兩層的遞歸回歸模型RMI,第一層使用神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),隱藏層設(shè)置為16*16個神經(jīng)元,激活函數(shù)為ReLu。輸出層設(shè)置為100個線性回歸模型;

    B+樹:設(shè)置頁面大小為256,緩存為64 K;

    ALEX:使用自適應(yīng)RMI模型,并在各個葉子節(jié)點加入空隙數(shù)組,大小為4倍鍵值數(shù)目。

    3.2 聚類有效性評估指標

    本文使用了CH函數(shù)量化指標來確定分支因子B和最大樣本半徑閾值T,為此,實驗設(shè)計了不同分支因子B和不同最大樣本半徑閾值T來進行組合實驗,實驗結(jié)果見表1、表2。

    表1 不同T、B對應(yīng)CH指數(shù)(amon)

    表2 不同T、B對應(yīng)CH指數(shù)(weblogs)

    從結(jié)果可以看出,關(guān)鍵參數(shù)T/B分別為0.5/100和2/25時,CH函數(shù)值取最大,即此時聚類效果最好,后續(xù)實驗均采用對應(yīng)參數(shù)。也就是說,針對不同的數(shù)據(jù)集,存在不同的最優(yōu)關(guān)鍵參數(shù)對來使模型分類效果獲得最優(yōu)。

    3.3 模型性能對比分析

    3.3.1 檢索性能對比

    為了驗證模型檢索性能優(yōu)勢,實驗對比了ULIB、lear-ned index、B+樹和ALEX的檢索性能,如圖8、圖9所示。

    圖8 檢索性能對比(amon)

    其中橫軸代表生成的檢索負載,縱軸代表所需要的時間,其值越小,代表模型檢索吞吐量越大,即檢索性能越好。

    結(jié)果表明,隨著檢索負載提高,檢索時間會正比增加,原因在于,神經(jīng)網(wǎng)絡(luò)中的矩陣運算決定了檢索所需要的時間,而該過程與檢索負載成正比關(guān)系。

    且ULIB在兩個數(shù)據(jù)集上檢索性能相比較B+樹、lear-ned index和ALEX也具有一定優(yōu)勢。原因在于ULIB模型在數(shù)據(jù)劃分階段使用birch聚類算法進行劃分,各個數(shù)據(jù)區(qū)域內(nèi)分布更加趨于一致,從而使神經(jīng)網(wǎng)絡(luò)訓(xùn)練擬合度更高。另外,learned index使用的是多層遞歸RMI,而ULIB使用了兩層的非RMI設(shè)計,并且只在第二層輸出層使用神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練預(yù)測,因此在各個階段體現(xiàn)得更加輕量有效。

    3.3.2 訓(xùn)練時間對比

    為了測試ULIB訓(xùn)練時間,即模型建立所需時間,實驗比較了ALEX、learned index和ULIB在相同數(shù)據(jù)集下模型建立完成所用時間,在兩個數(shù)據(jù)集上進行實驗,結(jié)果如圖10所示。

    圖10 訓(xùn)練時間對比

    結(jié)果表明,經(jīng)過birch聚類后的ULIB模型相比較learned index在兩個數(shù)據(jù)集的訓(xùn)練時間上存在明顯優(yōu)勢,主要原因是:在經(jīng)過聚類將數(shù)據(jù)集分類k類后,訓(xùn)練數(shù)據(jù)集變成了k個規(guī)模更小的數(shù)據(jù)區(qū)域,而機器學(xué)習(xí)訓(xùn)練時間隨數(shù)據(jù)規(guī)模增長可能是指數(shù)級增長的,所以相比較learned index直接訓(xùn)練所有數(shù)據(jù)而言,ULIB模型訓(xùn)練上會存在優(yōu)勢。

    3.3.3 插入性能對比

    為了驗證ULIB在插入性能上的優(yōu)勢,實驗比較了ULIB、B+樹和ALEX的插入性能對比。

    實驗結(jié)果如圖11、圖12所示,圖示分別代表在亞馬遜數(shù)據(jù)排名數(shù)據(jù)集和weblogs上實驗結(jié)果,橫軸是待插入數(shù)據(jù)的數(shù)目,縱軸為完成插入操作所使用的時間。實驗分別測試了2萬~10萬條插入請求時結(jié)果。

    圖11 插入性能對比(amon)

    圖12 插入性能對比(weblogs)

    結(jié)果表明,ULIB在數(shù)據(jù)插入性能上,保持了對B+樹和ALEX的優(yōu)勢。原因在于,ULIB借鑒LSM樹中延遲更新思路在內(nèi)存中設(shè)置了緩存區(qū),當插入請求生成后,模型先將其插入至緩存塊中,只有內(nèi)存的緩存區(qū)占用達到閾值并溢出后,才轉(zhuǎn)移至對應(yīng)的數(shù)據(jù)區(qū)域,此時才對相對應(yīng)的數(shù)據(jù)區(qū)域進行重訓(xùn)練,也正是因為這種機制,不會每次插入數(shù)據(jù)都需要對神經(jīng)網(wǎng)絡(luò)模型進行重訓(xùn)練,實現(xiàn)了插入性能的優(yōu)化。

    3.3.4 內(nèi)存占用對比

    本節(jié)對比了3個模型在亞馬遜數(shù)據(jù)排名數(shù)據(jù)集上的內(nèi)存占用,結(jié)果見表3,其中15.7 M、213 M代表learned index和B+樹存儲實驗數(shù)據(jù)所占用的空間,而60 K、180 K和890 K代表了各個機器學(xué)習(xí)索引中所設(shè)置的神經(jīng)網(wǎng)絡(luò)占用的空間。

    表3 3種模型內(nèi)存占用對比

    結(jié)果表明,B+樹在相同數(shù)據(jù)集下內(nèi)存占用最多。原因是B+樹中消耗了大量空間來存儲數(shù)據(jù)鍵和指針信息等額外數(shù)據(jù),所以說,存儲的數(shù)據(jù)集越大,B+樹所需要的內(nèi)存就越大。而機器學(xué)習(xí)索引結(jié)構(gòu)只需要存儲神經(jīng)網(wǎng)絡(luò)模型參數(shù)和數(shù)據(jù)鍵,并不需要其它額外的空間,因此內(nèi)存占用情況相比較B+樹具有明顯優(yōu)勢。

    另外,ULIB模型相比較而言更為輕量簡單,因此比learned index在內(nèi)存占用方面更具有優(yōu)勢。不過在參數(shù)B和T減小時,聚類類別數(shù)增加,神經(jīng)網(wǎng)絡(luò)內(nèi)存占用也會增加。

    4 結(jié)束語

    本文確立了學(xué)習(xí)化索引結(jié)構(gòu)實現(xiàn)的關(guān)鍵要素,提出可更新機器學(xué)習(xí)索引檢索模型ULIB,最后在亞馬遜書籍排名和weblogs數(shù)據(jù)集上分別進行測試實驗。經(jīng)實驗驗證,結(jié)論如下:①采用birch聚類進行數(shù)據(jù)劃分時,CH函數(shù)作為參考依據(jù)來可以找到關(guān)鍵參數(shù)B和T的局部最優(yōu)解;②相比較learned index、ALEX和B+樹索引結(jié)構(gòu),ULIB在相同數(shù)量級上檢索性能、訓(xùn)練時間、插入性能和內(nèi)存占用均有更好的表現(xiàn)。

    下一步研究工作在于,目前B和T的取值是通過在實驗中進行調(diào)整,從而實現(xiàn)局部最優(yōu),可以嘗試從數(shù)學(xué)角度計算推導(dǎo)全局最優(yōu)解。

    猜你喜歡
    模型
    一半模型
    一種去中心化的域名服務(wù)本地化模型
    適用于BDS-3 PPP的隨機模型
    提煉模型 突破難點
    函數(shù)模型及應(yīng)用
    p150Glued在帕金森病模型中的表達及分布
    函數(shù)模型及應(yīng)用
    重要模型『一線三等角』
    重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
    3D打印中的模型分割與打包
    久久久久久久国产电影| 午夜激情久久久久久久| 国产一区二区在线观看日韩| 久久热精品热| 麻豆成人av视频| 99国产精品免费福利视频| 欧美激情 高清一区二区三区| 一个人看视频在线观看www免费| 日日摸夜夜添夜夜添av毛片| 久久久欧美国产精品| 中国美白少妇内射xxxbb| 日韩,欧美,国产一区二区三区| 免费看光身美女| 国产男女超爽视频在线观看| 久久久久久久久久久免费av| 国产在线免费精品| www.av在线官网国产| 女性生殖器流出的白浆| 国产av码专区亚洲av| 在线看a的网站| 国产免费一级a男人的天堂| 精品人妻偷拍中文字幕| 亚洲精品视频女| 亚洲av国产av综合av卡| 欧美精品一区二区免费开放| 国产国语露脸激情在线看| 搡女人真爽免费视频火全软件| 极品人妻少妇av视频| 99热网站在线观看| av又黄又爽大尺度在线免费看| 精品久久国产蜜桃| 久久久久人妻精品一区果冻| 91在线精品国自产拍蜜月| 欧美 亚洲 国产 日韩一| 国产日韩欧美视频二区| 丝瓜视频免费看黄片| 国产色婷婷99| 在线精品无人区一区二区三| 国产精品.久久久| 免费观看av网站的网址| 欧美精品人与动牲交sv欧美| 国产午夜精品久久久久久一区二区三区| 国产极品粉嫩免费观看在线 | 精品久久久久久电影网| 夫妻午夜视频| 卡戴珊不雅视频在线播放| 色婷婷久久久亚洲欧美| 久久精品国产亚洲网站| 亚洲av综合色区一区| 内地一区二区视频在线| tube8黄色片| 久久这里有精品视频免费| 久久久精品免费免费高清| 久久精品国产亚洲av涩爱| 99精国产麻豆久久婷婷| 天天躁夜夜躁狠狠久久av| 亚洲色图 男人天堂 中文字幕 | 免费高清在线观看视频在线观看| 久久精品久久久久久噜噜老黄| 亚洲一级一片aⅴ在线观看| 男女国产视频网站| 亚洲精品av麻豆狂野| 中文乱码字字幕精品一区二区三区| 午夜激情av网站| 在线免费观看不下载黄p国产| 超碰97精品在线观看| 黑人巨大精品欧美一区二区蜜桃 | 18+在线观看网站| 亚洲av二区三区四区| 交换朋友夫妻互换小说| 亚洲熟女精品中文字幕| 国产欧美另类精品又又久久亚洲欧美| 国产视频首页在线观看| 大片免费播放器 马上看| 狂野欧美激情性bbbbbb| 黑人巨大精品欧美一区二区蜜桃 | 伊人久久精品亚洲午夜| 久久人妻熟女aⅴ| av播播在线观看一区| 最近最新中文字幕免费大全7| 青春草亚洲视频在线观看| 国产成人a∨麻豆精品| 99久久精品国产国产毛片| 丝袜脚勾引网站| 亚洲精品456在线播放app| 极品少妇高潮喷水抽搐| 欧美一级a爱片免费观看看| 欧美变态另类bdsm刘玥| 国产精品99久久久久久久久| 久久女婷五月综合色啪小说| 有码 亚洲区| 欧美另类一区| 一级毛片电影观看| 日本爱情动作片www.在线观看| 99九九在线精品视频| 熟女人妻精品中文字幕| 国产精品久久久久久精品古装| 欧美亚洲日本最大视频资源| 乱人伦中国视频| 欧美97在线视频| 日日摸夜夜添夜夜添av毛片| 99精国产麻豆久久婷婷| 亚洲激情五月婷婷啪啪| 国产欧美日韩综合在线一区二区| 日韩三级伦理在线观看| 亚洲国产精品一区三区| 久久 成人 亚洲| 成人无遮挡网站| 下体分泌物呈黄色| 久久久久久人妻| 日本欧美视频一区| 18+在线观看网站| 日韩熟女老妇一区二区性免费视频| 在线看a的网站| 免费观看a级毛片全部| 色婷婷av一区二区三区视频| 久久久国产一区二区| 久久精品久久精品一区二区三区| 嫩草影院入口| 亚洲欧美中文字幕日韩二区| 中文字幕制服av| 成年女人在线观看亚洲视频| 91精品三级在线观看| 黑丝袜美女国产一区| 国产永久视频网站| 又大又黄又爽视频免费| 多毛熟女@视频| av卡一久久| 欧美精品亚洲一区二区| 国产精品久久久久久久久免| 日本91视频免费播放| 少妇的逼水好多| 五月开心婷婷网| 午夜日本视频在线| 久久精品久久久久久噜噜老黄| 色哟哟·www| 黄色毛片三级朝国网站| 国产亚洲精品久久久com| 国产欧美日韩一区二区三区在线 | 亚洲国产av影院在线观看| 一级二级三级毛片免费看| 亚洲国产最新在线播放| 最近的中文字幕免费完整| 极品少妇高潮喷水抽搐| 国产又色又爽无遮挡免| 国产探花极品一区二区| 日本免费在线观看一区| 亚洲一区二区三区欧美精品| 最近最新中文字幕免费大全7| 搡老乐熟女国产| 日韩成人av中文字幕在线观看| 亚洲成人手机| 国产成人aa在线观看| 老熟女久久久| 久久毛片免费看一区二区三区| 色94色欧美一区二区| 午夜日本视频在线| 日日撸夜夜添| 国产高清国产精品国产三级| 午夜福利影视在线免费观看| a级毛色黄片| 国产亚洲av片在线观看秒播厂| 麻豆成人av视频| 永久免费av网站大全| 少妇人妻 视频| 男女边吃奶边做爰视频| 亚洲综合精品二区| 中文字幕亚洲精品专区| 另类亚洲欧美激情| 日本免费在线观看一区| 欧美bdsm另类| 综合色丁香网| 色婷婷久久久亚洲欧美| 欧美 日韩 精品 国产| 在线观看一区二区三区激情| 伊人久久精品亚洲午夜| 国产黄色免费在线视频| 最近最新中文字幕免费大全7| xxxhd国产人妻xxx| 亚洲欧美日韩另类电影网站| 亚洲少妇的诱惑av| 久久鲁丝午夜福利片| 亚洲精品视频女| 在线观看三级黄色| 精品少妇内射三级| 成人二区视频| 赤兔流量卡办理| 欧美日韩综合久久久久久| 欧美精品一区二区免费开放| 高清av免费在线| 久久午夜福利片| 亚洲av综合色区一区| 国产午夜精品一二区理论片| 人体艺术视频欧美日本| 精品国产一区二区久久| 精品一区在线观看国产| 在现免费观看毛片| 亚洲美女搞黄在线观看| 久久久久久久久久成人| 91午夜精品亚洲一区二区三区| 七月丁香在线播放| 午夜福利视频精品| 嘟嘟电影网在线观看| 国产成人午夜福利电影在线观看| 夫妻午夜视频| av电影中文网址| 亚洲精品乱码久久久v下载方式| 欧美日本中文国产一区发布| 欧美日韩在线观看h| 日韩av免费高清视频| 亚洲精品日本国产第一区| 久久久久久久久久久丰满| 精品少妇黑人巨大在线播放| 寂寞人妻少妇视频99o| 国产成人免费观看mmmm| 校园人妻丝袜中文字幕| 国产日韩欧美视频二区| 国产色婷婷99| 亚洲第一区二区三区不卡| 五月伊人婷婷丁香| 国产黄片视频在线免费观看| 国产无遮挡羞羞视频在线观看| 热99久久久久精品小说推荐| 久久久亚洲精品成人影院| 国产男女内射视频| 免费日韩欧美在线观看| 久久久a久久爽久久v久久| 99国产综合亚洲精品| 少妇人妻 视频| 一区二区三区免费毛片| 18禁动态无遮挡网站| 亚洲久久久国产精品| 美女主播在线视频| 国产综合精华液| 超碰97精品在线观看| 国产精品99久久久久久久久| 大香蕉久久成人网| 国产精品一区二区在线不卡| 国产乱来视频区| 国产精品不卡视频一区二区| a级毛片在线看网站| 有码 亚洲区| 国产精品一区www在线观看| 亚洲三级黄色毛片| 边亲边吃奶的免费视频| 精品午夜福利在线看| 激情五月婷婷亚洲| 在线观看美女被高潮喷水网站| 热99国产精品久久久久久7| 欧美亚洲日本最大视频资源| 国产精品国产av在线观看| 99国产综合亚洲精品| 69精品国产乱码久久久| 男女国产视频网站| 免费观看的影片在线观看| 欧美xxxx性猛交bbbb| 99久久人妻综合| 国产又色又爽无遮挡免| 在线天堂最新版资源| 午夜av观看不卡| 激情五月婷婷亚洲| 国产精品熟女久久久久浪| av在线app专区| 国产在线视频一区二区| 亚洲美女视频黄频| 免费观看无遮挡的男女| 欧美日韩亚洲高清精品| 精品酒店卫生间| www.色视频.com| 一本大道久久a久久精品| 亚洲国产毛片av蜜桃av| 我的老师免费观看完整版| 伦理电影免费视频| 久久99热6这里只有精品| 精品人妻在线不人妻| freevideosex欧美| 在线观看美女被高潮喷水网站| 建设人人有责人人尽责人人享有的| 国产探花极品一区二区| 国产国语露脸激情在线看| 国语对白做爰xxxⅹ性视频网站| av在线老鸭窝| 精品熟女少妇av免费看| 午夜激情久久久久久久| 51国产日韩欧美| 久热这里只有精品99| 亚洲美女黄色视频免费看| 啦啦啦视频在线资源免费观看| 国产深夜福利视频在线观看| 国产av码专区亚洲av| 一级片'在线观看视频| 九色亚洲精品在线播放| 熟女av电影| 久久精品久久久久久噜噜老黄| 久久韩国三级中文字幕| 亚洲美女搞黄在线观看| 一级毛片黄色毛片免费观看视频| 爱豆传媒免费全集在线观看| a级毛片黄视频| 97超碰精品成人国产| 日本色播在线视频| 天美传媒精品一区二区| 国产精品久久久久久久久免| 久久女婷五月综合色啪小说| 大码成人一级视频| 51国产日韩欧美| 99re6热这里在线精品视频| 精品国产乱码久久久久久小说| 美女内射精品一级片tv| 新久久久久国产一级毛片| 永久网站在线| 精品久久国产蜜桃| 妹子高潮喷水视频| 成人亚洲精品一区在线观看| 爱豆传媒免费全集在线观看| 久久久久精品性色| 蜜桃在线观看..| 一区在线观看完整版| 插阴视频在线观看视频| 成人综合一区亚洲| 中文欧美无线码| 成人无遮挡网站| 两个人免费观看高清视频| 日产精品乱码卡一卡2卡三| 91在线精品国自产拍蜜月| 乱码一卡2卡4卡精品| 伊人亚洲综合成人网| 午夜免费鲁丝| 自线自在国产av| 久久免费观看电影| av国产精品久久久久影院| 极品少妇高潮喷水抽搐| 边亲边吃奶的免费视频| 18禁在线播放成人免费| 老熟女久久久| 久久久久久久久久久久大奶| 狂野欧美激情性xxxx在线观看| 免费看av在线观看网站| 日韩熟女老妇一区二区性免费视频| 日韩在线高清观看一区二区三区| 欧美精品人与动牲交sv欧美| 成人漫画全彩无遮挡| 久久久久久人妻| 男女免费视频国产| 久久午夜综合久久蜜桃| 中文字幕免费在线视频6| 久久国产精品大桥未久av| 少妇的逼好多水| 欧美亚洲日本最大视频资源| 99视频精品全部免费 在线| 精品一区在线观看国产| 国产精品蜜桃在线观看| 色94色欧美一区二区| 免费久久久久久久精品成人欧美视频 | 成人午夜精彩视频在线观看| 国产精品一国产av| 成人无遮挡网站| 考比视频在线观看| 国产熟女午夜一区二区三区 | 人妻制服诱惑在线中文字幕| 亚洲av.av天堂| 一级黄片播放器| 女性生殖器流出的白浆| 国产国拍精品亚洲av在线观看| 三级国产精品片| 色网站视频免费| 免费av中文字幕在线| 国产精品久久久久久久久免| 免费高清在线观看日韩| 夫妻午夜视频| 高清毛片免费看| 纵有疾风起免费观看全集完整版| 综合色丁香网| 国产高清三级在线| 91国产中文字幕| 99久久精品国产国产毛片| 一区二区日韩欧美中文字幕 | 精品久久久噜噜| av播播在线观看一区| 青春草亚洲视频在线观看| 久久久久国产精品人妻一区二区| 国产伦理片在线播放av一区| 国产精品 国内视频| 欧美日韩视频高清一区二区三区二| av在线app专区| 亚洲精品日韩在线中文字幕| 嫩草影院入口| 午夜免费观看性视频| 精品国产乱码久久久久久小说| 亚洲国产色片| 五月开心婷婷网| av一本久久久久| av黄色大香蕉| 亚洲精品视频女| 卡戴珊不雅视频在线播放| 成年女人在线观看亚洲视频| av免费观看日本| av不卡在线播放| 日韩成人伦理影院| 黑人高潮一二区| 另类精品久久| 免费观看av网站的网址| 99九九线精品视频在线观看视频| 涩涩av久久男人的天堂| 汤姆久久久久久久影院中文字幕| 18禁在线无遮挡免费观看视频| 人妻 亚洲 视频| 极品人妻少妇av视频| 日韩一区二区三区影片| 精品酒店卫生间| 色哟哟·www| 伊人久久国产一区二区| 汤姆久久久久久久影院中文字幕| 午夜老司机福利剧场| 少妇的逼水好多| 18禁裸乳无遮挡动漫免费视频| 性色av一级| 久久99一区二区三区| 亚洲国产精品一区三区| 日本91视频免费播放| 亚洲色图 男人天堂 中文字幕 | 国产亚洲午夜精品一区二区久久| 中文字幕免费在线视频6| a级毛片在线看网站| 插阴视频在线观看视频| 99国产精品免费福利视频| 国产成人精品婷婷| 成年av动漫网址| 蜜臀久久99精品久久宅男| 欧美 亚洲 国产 日韩一| 免费大片黄手机在线观看| 国国产精品蜜臀av免费| 国产日韩欧美亚洲二区| 成人黄色视频免费在线看| 国产 精品1| 国产av码专区亚洲av| 久久青草综合色| 人妻 亚洲 视频| 国产精品人妻久久久影院| 中文字幕制服av| 久久久午夜欧美精品| 能在线免费看毛片的网站| 高清视频免费观看一区二区| 国产亚洲欧美精品永久| 久久久久久久久久久丰满| 如日韩欧美国产精品一区二区三区 | 久久人人爽人人爽人人片va| 中文字幕亚洲精品专区| 日韩一本色道免费dvd| 色婷婷久久久亚洲欧美| 人人妻人人澡人人爽人人夜夜| 成人漫画全彩无遮挡| 亚洲丝袜综合中文字幕| 免费不卡的大黄色大毛片视频在线观看| 精品99又大又爽又粗少妇毛片| av在线观看视频网站免费| 国产精品99久久99久久久不卡 | 亚洲熟女精品中文字幕| a 毛片基地| 日本-黄色视频高清免费观看| 亚洲高清免费不卡视频| 久久久久久久久久成人| 自拍欧美九色日韩亚洲蝌蚪91| 九九爱精品视频在线观看| 蜜臀久久99精品久久宅男| 我要看黄色一级片免费的| 国产在视频线精品| 亚洲丝袜综合中文字幕| 国产成人免费观看mmmm| 老女人水多毛片| 亚洲美女视频黄频| 亚洲av不卡在线观看| 男女边摸边吃奶| av女优亚洲男人天堂| 欧美日韩综合久久久久久| 天美传媒精品一区二区| 欧美变态另类bdsm刘玥| 五月玫瑰六月丁香| 99久久人妻综合| 亚洲美女黄色视频免费看| 国产 精品1| 国产高清不卡午夜福利| 丰满迷人的少妇在线观看| 午夜免费观看性视频| 午夜激情久久久久久久| 久久久国产欧美日韩av| 色婷婷av一区二区三区视频| 三上悠亚av全集在线观看| 国产 一区精品| 在线观看www视频免费| 国产黄色免费在线视频| 人妻少妇偷人精品九色| 亚洲欧美精品自产自拍| 最后的刺客免费高清国语| 成人免费观看视频高清| 天堂8中文在线网| 国产毛片在线视频| 免费av中文字幕在线| 天天影视国产精品| 国产 一区精品| 中文字幕精品免费在线观看视频 | 大陆偷拍与自拍| 黄色毛片三级朝国网站| 亚洲久久久国产精品| 国产精品女同一区二区软件| 日日摸夜夜添夜夜添av毛片| 搡老乐熟女国产| 蜜桃在线观看..| 欧美另类一区| 80岁老熟妇乱子伦牲交| 国产精品三级大全| h视频一区二区三区| 777米奇影视久久| 欧美精品高潮呻吟av久久| 桃花免费在线播放| 国产精品久久久久久久久免| 欧美日韩在线观看h| 免费黄色在线免费观看| 国产精品 国内视频| 下体分泌物呈黄色| 天天操日日干夜夜撸| 美女国产高潮福利片在线看| 国产成人精品久久久久久| 国产在视频线精品| 精品国产露脸久久av麻豆| 一区二区三区乱码不卡18| 女性生殖器流出的白浆| 国精品久久久久久国模美| 久久精品国产亚洲av涩爱| 观看美女的网站| 亚洲,欧美,日韩| 人人妻人人添人人爽欧美一区卜| 亚洲,欧美,日韩| 久久午夜综合久久蜜桃| 久久精品国产亚洲av涩爱| 91精品国产国语对白视频| 国产成人精品在线电影| 精品卡一卡二卡四卡免费| 欧美日韩综合久久久久久| 一本久久精品| 高清午夜精品一区二区三区| 春色校园在线视频观看| 插逼视频在线观看| 国语对白做爰xxxⅹ性视频网站| 精品国产一区二区三区久久久樱花| 一级毛片我不卡| 欧美xxⅹ黑人| 免费日韩欧美在线观看| 两个人的视频大全免费| 黄色视频在线播放观看不卡| 22中文网久久字幕| 九色亚洲精品在线播放| 亚洲一区二区三区欧美精品| 日韩一区二区三区影片| 亚洲精品,欧美精品| 亚洲av综合色区一区| 婷婷色综合大香蕉| 九九爱精品视频在线观看| 日本vs欧美在线观看视频| 国产色爽女视频免费观看| 亚洲精品色激情综合| 青春草视频在线免费观看| 国产精品三级大全| 国产av一区二区精品久久| 中国国产av一级| 欧美激情 高清一区二区三区| 人人澡人人妻人| 欧美日本中文国产一区发布| 国产精品久久久久久av不卡| 人人妻人人澡人人爽人人夜夜| 一级毛片我不卡| 日本-黄色视频高清免费观看| av不卡在线播放| 天天操日日干夜夜撸| 久久人人爽人人片av| 免费观看a级毛片全部| 久久精品国产鲁丝片午夜精品| 久久久久视频综合| 男人添女人高潮全过程视频| 多毛熟女@视频| 亚洲综合精品二区| 久久久久网色| 伊人亚洲综合成人网| 少妇人妻精品综合一区二区| 黄片无遮挡物在线观看| 午夜精品国产一区二区电影| 亚洲伊人久久精品综合| 国产色婷婷99| 丰满迷人的少妇在线观看| 99re6热这里在线精品视频| 一二三四中文在线观看免费高清| 亚洲人成77777在线视频| 高清欧美精品videossex| 日本黄大片高清| 熟女人妻精品中文字幕| 黄片无遮挡物在线观看| 99久久人妻综合| 又粗又硬又长又爽又黄的视频| 秋霞伦理黄片| 天美传媒精品一区二区| 亚洲人成77777在线视频| 女性被躁到高潮视频| 日韩av不卡免费在线播放| 婷婷色av中文字幕| 99热网站在线观看| 亚洲丝袜综合中文字幕| 天堂8中文在线网| 色94色欧美一区二区| 日韩亚洲欧美综合| 国产极品天堂在线| 狠狠精品人妻久久久久久综合| 免费不卡的大黄色大毛片视频在线观看| 久久这里有精品视频免费| 视频中文字幕在线观看| 成人亚洲欧美一区二区av|