劉亞男
(安徽工商職業(yè)學(xué)院,安徽 合肥 231131)
增量式學(xué)習(xí)算法是一種數(shù)據(jù)庫(kù)處理技術(shù),在動(dòng)態(tài)變化處理過(guò)程中,不斷增加待處理的數(shù)據(jù)量,增強(qiáng)分析結(jié)果的準(zhǔn)確性。流處理是一種重要的大數(shù)據(jù)處理手段,通過(guò)實(shí)時(shí)分布處理動(dòng)態(tài)數(shù)據(jù),能夠增加數(shù)據(jù)處理的效率。雙鏈區(qū)塊鏈?zhǔn)且环N單鏈結(jié)構(gòu)的衍生,由于單鏈結(jié)構(gòu)不能有效實(shí)現(xiàn)對(duì)數(shù)據(jù)實(shí)體的應(yīng)用[1],在管理上存在一定的滯后,故將原有的區(qū)塊鏈衍生出雙鏈結(jié)構(gòu),增強(qiáng)區(qū)塊鏈的管理效率。多目標(biāo)優(yōu)化方法的原理是使用一項(xiàng)系數(shù)將多個(gè)目標(biāo)函數(shù)整合為一項(xiàng)單目標(biāo)函數(shù)的過(guò)程,在實(shí)際處理過(guò)程中,選定不同數(shù)值的決策系數(shù)[2],自適應(yīng)調(diào)整單向目標(biāo)函數(shù),實(shí)現(xiàn)對(duì)多目標(biāo)處理過(guò)程的優(yōu)化。在多項(xiàng)智能算法的支持下,設(shè)計(jì)得到多種目標(biāo)優(yōu)化方法。
本文提出基于增量式流處理的雙鏈區(qū)塊鏈多目標(biāo)優(yōu)化方法,為實(shí)際雙鏈區(qū)塊鏈多目標(biāo)優(yōu)化提供參考。
雙鏈區(qū)塊鏈有著特殊的結(jié)構(gòu)組成,增量聚合處理時(shí),能夠減少雙鏈結(jié)構(gòu)產(chǎn)生的冗余計(jì)算量[3],優(yōu)化屬性函數(shù)后,采用自底向上的算法處理屬性函數(shù)中的隸屬概率[4],并將該概率作為雙鏈區(qū)塊鏈的增量參數(shù),隸屬概率可計(jì)算得到:
(1)
式中,M表示一次向上處理時(shí)所需隸屬參數(shù),xt表示區(qū)塊鏈的數(shù)值概率密度。在合并處理兩區(qū)塊鏈的數(shù)據(jù)結(jié)構(gòu)時(shí)[5],不同數(shù)據(jù)簇會(huì)產(chǎn)生隸屬度漂移,重復(fù)增量聚合區(qū)塊鏈的數(shù)值概率密度,使用概率密度數(shù)值,構(gòu)建一個(gè)流處理數(shù)學(xué)模型。
使用上述得到的概率密度數(shù)值,隨機(jī)選定一項(xiàng)概率數(shù)值,變換處理為一個(gè)概率分量,殘余概率數(shù)據(jù)在不同時(shí)間周期控制下,形成多個(gè)單調(diào)分量[6],利用mean shift算法估算區(qū)塊鏈中產(chǎn)生的分布密度。在構(gòu)建流處理數(shù)學(xué)模型時(shí),將相鄰數(shù)值節(jié)點(diǎn)調(diào)整為一個(gè)微型簇結(jié)構(gòu)[7],整合簇結(jié)構(gòu)的節(jié)點(diǎn),構(gòu)建得到如下所示的數(shù)學(xué)模型,數(shù)值關(guān)系可表示為:
(2)
式中,F(xiàn)表示微型簇調(diào)整參數(shù),Q表示相鄰節(jié)點(diǎn)數(shù)值集合,γ表示節(jié)點(diǎn)凝聚參數(shù)。為了增強(qiáng)數(shù)學(xué)模型的精度,將調(diào)整參數(shù)處理為信息熵[8],在不斷變換基準(zhǔn)聚類參數(shù)后,將雙鏈區(qū)塊鏈的數(shù)據(jù)處理為一個(gè)并行模式,可表示為:
(3)
式中,Mi表示聚類階段處理產(chǎn)生的時(shí)間開銷,其余參數(shù)含義不變。使用并行參數(shù)作為多目標(biāo)的劃分參數(shù)[9],針對(duì)劃分得到的多目標(biāo),構(gòu)建目標(biāo)優(yōu)化算法。
使用上述劃分得到的多目標(biāo)參數(shù),在構(gòu)建優(yōu)化算法時(shí),設(shè)定目標(biāo)參數(shù)的約束條件,多個(gè)并行參數(shù)對(duì)應(yīng)處理為多個(gè)約束條件后,構(gòu)建成一個(gè)支配空間[10],將支配空間內(nèi)的并行參數(shù)作為優(yōu)化節(jié)點(diǎn),計(jì)算優(yōu)化節(jié)點(diǎn)間的歐式距離,計(jì)算公式可表示為:
(4)
式中,D1、D2分別表示節(jié)點(diǎn)聚類參數(shù),li表示節(jié)點(diǎn)并行參數(shù)聚類函數(shù),D表示節(jié)點(diǎn)數(shù)據(jù)集。以最大數(shù)值對(duì)應(yīng)的點(diǎn)做維護(hù)優(yōu)化目標(biāo)[11],重復(fù)支配各項(xiàng)符合條件的節(jié)點(diǎn),為了平衡區(qū)塊鏈數(shù)據(jù)點(diǎn)中的擁擠程度,重復(fù)稀疏化處理優(yōu)化節(jié)點(diǎn)后,確定一個(gè)最優(yōu)解,以該最優(yōu)解對(duì)應(yīng)的處理過(guò)程作為優(yōu)化過(guò)程[12],最終完成對(duì)雙鏈區(qū)塊鏈多目標(biāo)優(yōu)化方法的設(shè)計(jì)。
準(zhǔn)備六臺(tái)服務(wù)器搭建區(qū)塊鏈網(wǎng)絡(luò)作為實(shí)驗(yàn)環(huán)境,使用該六臺(tái)服務(wù)器共同維護(hù)區(qū)塊鏈的正常運(yùn)作,在每個(gè)服務(wù)器上認(rèn)證一個(gè)節(jié)點(diǎn),搭建如圖1所示的雙鏈區(qū)塊鏈支持結(jié)構(gòu)。
圖1 搭建的區(qū)塊鏈支持結(jié)構(gòu)
基于上述實(shí)驗(yàn)準(zhǔn)備,控制區(qū)塊鏈內(nèi)的目標(biāo)數(shù)據(jù)流內(nèi)置1500組數(shù)據(jù),控制三種多目標(biāo)優(yōu)化方法同時(shí)處理對(duì)應(yīng)的數(shù)據(jù)流,以100組數(shù)據(jù)作為一個(gè)時(shí)間開銷統(tǒng)計(jì)時(shí)間點(diǎn),最終三種多目標(biāo)優(yōu)化方法時(shí)間開銷結(jié)果見表1。
由表1所示的時(shí)間開銷結(jié)果可知,控制三種多目標(biāo)優(yōu)化方法處理相同屬性及相同數(shù)量的數(shù)據(jù),根據(jù)表中的實(shí)驗(yàn)結(jié)果,傳統(tǒng)多目標(biāo)優(yōu)化方法1所需的時(shí)間開銷在60ms左右,優(yōu)化方法所需的時(shí)間較長(zhǎng),傳統(tǒng)多目標(biāo)優(yōu)化方法2所需的平均時(shí)間開銷在34.2ms左右,優(yōu)化過(guò)程所需的時(shí)間較長(zhǎng),設(shè)計(jì)的優(yōu)化方法優(yōu)化所需的平均時(shí)間開銷在15s左右,與兩種傳統(tǒng)多目標(biāo)優(yōu)化方法相比,設(shè)計(jì)的優(yōu)化方法實(shí)際所需的時(shí)間開銷最小,具有較強(qiáng)的時(shí)效性。
在上述實(shí)驗(yàn)環(huán)境下,受到區(qū)塊鏈結(jié)構(gòu)的影響,在實(shí)際進(jìn)行多目標(biāo)優(yōu)化時(shí),存在多個(gè)處理模塊,對(duì)應(yīng)上述實(shí)驗(yàn)準(zhǔn)備的數(shù)據(jù)組,以多目標(biāo)數(shù)據(jù)發(fā)出到區(qū)塊鏈支持結(jié)構(gòu)過(guò)程作為實(shí)驗(yàn)對(duì)比,定義三種優(yōu)化方法的吞吐量,計(jì)算公式可表示為:
(5)
式中,Sumdt表示數(shù)據(jù)發(fā)出時(shí)間周期內(nèi)包含的目標(biāo)數(shù)據(jù)數(shù)量,Δt表示數(shù)據(jù)發(fā)出到區(qū)塊鏈結(jié)構(gòu)過(guò)程中的時(shí)間間隔,吞吐量越大,表明處理數(shù)據(jù)目標(biāo)效果更好。在上述吞吐量數(shù)值關(guān)系的控制下,對(duì)應(yīng)設(shè)定10s~100s之間時(shí)間周期參數(shù),計(jì)算并對(duì)比三種多目標(biāo)優(yōu)化方法可處理的目標(biāo)數(shù)據(jù)量,結(jié)果見表2。
表2 三種多目標(biāo)優(yōu)化方法吞吐量結(jié)果
在固定時(shí)間周期參數(shù)下,控制三種優(yōu)化方法處理目標(biāo)數(shù)據(jù),對(duì)應(yīng)上述計(jì)算公式的結(jié)果,傳統(tǒng)優(yōu)化方法1的吞吐量數(shù)值在100組/秒~200組/秒之間,對(duì)應(yīng)優(yōu)化方法在固定的時(shí)間周期內(nèi)處理的數(shù)據(jù)量最少,傳統(tǒng)優(yōu)化方法2吞吐量數(shù)值在300組/秒~400組/秒之間,在相同的時(shí)間周期內(nèi)可處理的數(shù)據(jù)量數(shù)值較少。而設(shè)計(jì)得到的優(yōu)化方法吞吐量結(jié)果在600組/秒~700組/秒之間,與兩種傳統(tǒng)優(yōu)化方法相比,設(shè)計(jì)得到的優(yōu)化方法可處理的目標(biāo)數(shù)據(jù)量最多。
保持上述實(shí)驗(yàn)環(huán)境不變,選定區(qū)塊鏈結(jié)構(gòu)中十個(gè)處理節(jié)點(diǎn),設(shè)定節(jié)點(diǎn)的迭代次數(shù)為100次,設(shè)定區(qū)塊鏈不同的尺度參數(shù),定義多目標(biāo)優(yōu)化方法的收斂性,收斂性參數(shù)的數(shù)值關(guān)系可表示為:
(6)
式中,f表示收斂性參數(shù),p表示尺度參數(shù),xi表示區(qū)塊鏈節(jié)點(diǎn)函數(shù),N表示實(shí)際迭代次數(shù)。在上述計(jì)算公式控制下,最終三種多目標(biāo)優(yōu)化方法在不同尺度參數(shù)控制下的收斂性結(jié)果如圖2所示。
圖2 三種多目標(biāo)優(yōu)化方法收斂性結(jié)果
在相同大小的尺度參數(shù)控制下,控制三種多目標(biāo)優(yōu)化方法處理相同結(jié)構(gòu)的區(qū)塊鏈結(jié)構(gòu),根據(jù)收斂性結(jié)果可知,傳統(tǒng)多目標(biāo)優(yōu)化方法1和多目標(biāo)優(yōu)化方法2的收斂率較低,收斂性效果較差,而設(shè)計(jì)的多目標(biāo)方法的收斂率與兩種設(shè)計(jì)的多目標(biāo)優(yōu)化方法相比,設(shè)計(jì)的多目標(biāo)優(yōu)化方法收斂性最強(qiáng)。在相同尺度數(shù)值的控制下,多目標(biāo)優(yōu)化方法能夠控制優(yōu)化方法在區(qū)塊鏈中產(chǎn)生的數(shù)據(jù)變異,保證目標(biāo)優(yōu)化的多樣性。
雙鏈區(qū)塊鏈?zhǔn)菃捂渽^(qū)塊鏈結(jié)構(gòu)的派生,由于單鏈結(jié)構(gòu)不能有效地實(shí)現(xiàn)對(duì)數(shù)據(jù)實(shí)體的應(yīng)用,在管理上存在一定的滯后,所以將原來(lái)的區(qū)塊鏈派生為雙鏈區(qū)塊鏈結(jié)構(gòu),以提高區(qū)塊鏈的管理效率,同時(shí)結(jié)合增量式流處理。該技術(shù)是一項(xiàng)綜合處理技術(shù),在雙鏈區(qū)塊鏈的發(fā)展下,運(yùn)用該項(xiàng)綜合處理技術(shù),設(shè)計(jì)一種多目標(biāo)優(yōu)化方法,能夠改善傳統(tǒng)多目標(biāo)優(yōu)化方法的不足,為今后研究?jī)?yōu)化方法提供理論支持。