賀敬偉,戚林成,杜元翰,張世杰,劉繼東
(1.江蘇電力信息技術(shù)有限公司,江蘇 南京 210000;2.國(guó)網(wǎng)江蘇省電力有限公司信息通信分公司,江蘇南京 210000)
混合模型是集中不同應(yīng)用模型的組合體表現(xiàn)形式,其允許所研究項(xiàng)目向著最有效的路徑發(fā)展。除隨機(jī)誤差條件外,也可定義為固定效應(yīng)、隨機(jī)效應(yīng)兩類基本的統(tǒng)計(jì)分析原則。在統(tǒng)計(jì)學(xué)范疇中,混合模型代表了原始大群體中存在子群體的數(shù)學(xué)概率,一般來(lái)說(shuō),與混合模型匹配的數(shù)據(jù)集合空間越大,子群體被應(yīng)用主機(jī)直接采納的可能性也就越大[1-2]。若將統(tǒng)計(jì)推斷條件考慮在內(nèi),則可認(rèn)為隨著子群體數(shù)量值水平的增大,混合模型的原始包含空間也會(huì)不斷擴(kuò)大,但由于隨機(jī)誤差量的存在,子空間對(duì)于原始空間的數(shù)值影響條件也會(huì)隨之不斷改變。
在云平臺(tái)環(huán)境中,為了從根本上保障云服務(wù)的質(zhì)量水平,應(yīng)對(duì)資源數(shù)據(jù)存儲(chǔ)條件進(jìn)行及時(shí)適量的匹配。傳統(tǒng)高斯負(fù)載型數(shù)據(jù)伸縮方法通過(guò)計(jì)算正向超量時(shí)延系數(shù)的方式,確定云平臺(tái)資源數(shù)據(jù)的實(shí)時(shí)存儲(chǔ)條件,再根據(jù)既定的殘差值分析標(biāo)準(zhǔn),實(shí)現(xiàn)對(duì)數(shù)據(jù)信息的拉伸與收縮處理。然而此方法的最小壓縮與最大拉伸能力有限,并不能實(shí)現(xiàn)對(duì)云資源數(shù)據(jù)傳輸體積的及時(shí)調(diào)整。
為解決此問(wèn)題,提出基于混合模型的云平臺(tái)資源彈性伸縮方法,根據(jù)資源數(shù)據(jù)的初始定位條件,確定云平臺(tái)主機(jī)需求的實(shí)際變化趨勢(shì),再通過(guò)資源數(shù)據(jù)采集與融合的處理方式,完善已定義的彈性擴(kuò)容與伸縮擴(kuò)容條件。
基于混合模型的云數(shù)據(jù)定位由聚類混合系數(shù)計(jì)算、初始定位條件確定、云數(shù)據(jù)優(yōu)選殘差加權(quán)量分析三個(gè)處理環(huán)節(jié)共同組成,具體研究方法如下。
聚類是將已知云數(shù)據(jù)特征矢量全部劃分至不同模型類別中,再將所得模型集合體按照一定標(biāo)準(zhǔn)混合,以便于后續(xù)協(xié)方差計(jì)算。協(xié)方差指標(biāo)能夠約束云平臺(tái)資源在單位時(shí)間內(nèi)的傳輸能力,一般情況下,混合模型的初始數(shù)值空間越大,已存儲(chǔ)資源信息之間的協(xié)方差指標(biāo)數(shù)值水平越高[3-4]。
設(shè)i0代表最小的云數(shù)據(jù)存儲(chǔ)系數(shù),in代表最大的云數(shù)據(jù)存儲(chǔ)系數(shù)。其中,n表示聚類處理的實(shí)際執(zhí)行次數(shù)。在由i0、in決定的云數(shù)據(jù)存儲(chǔ)空間中,混合模型所涉及的云數(shù)據(jù)信息總量值越大,最終計(jì)算所得的聚類混合系數(shù)值也就越精準(zhǔn)。聯(lián)立上述物理量,可將聚類混合系數(shù)表達(dá)式定義為:
其中,w1代表第一個(gè)應(yīng)用模型聚類條件,wn代表第n個(gè)應(yīng)用模型聚類條件,代表待存儲(chǔ)云平臺(tái)資源數(shù)據(jù)特征值,代表聚類模型的混合特征均值。
初始定位條件是混合模型建立的關(guān)鍵,可在已知聚類混合系數(shù)結(jié)果基礎(chǔ)上,限定云平臺(tái)資源數(shù)據(jù)所能達(dá)到的傳輸與存儲(chǔ)位置[5]。由于混合模型存在相對(duì)復(fù)雜的數(shù)據(jù)信息存儲(chǔ)限定條件,在考慮聚類作用的情況下,隨著云平臺(tái)資源數(shù)據(jù)傳輸速率的加快,相關(guān)信息參量的存儲(chǔ)位置也會(huì)逐漸發(fā)生改變。為更好適應(yīng)上述資源信息變化情況,應(yīng)選取多個(gè)不同云平臺(tái)數(shù)據(jù)作為聚類參考條件。一方面,借助混合模型對(duì)相關(guān)信息參量進(jìn)行整合,另一方面也可較好控制模型主體在單位時(shí)間內(nèi)的具體變化情況[6-7]。設(shè)m1、m2、…、mn分別代表n個(gè)不同云平臺(tái)資源數(shù)據(jù)信息,λ表示混合模型的單位聚類條件,聯(lián)立式(1),可將混合模型的初始定位條件表示為:
其中,u0代表最小的資源數(shù)據(jù)傳輸速率值,un代表最大的資源數(shù)據(jù)傳輸速率值,R代表標(biāo)準(zhǔn)的平臺(tái)資源數(shù)據(jù)聚類系數(shù)項(xiàng)。
云數(shù)據(jù)的優(yōu)選殘差加權(quán)量從隨機(jī)解角度出發(fā),通過(guò)尋優(yōu)迭代處理的方式,確定混合模型的最優(yōu)解數(shù)值,再借助適應(yīng)度函數(shù),評(píng)價(jià)云平臺(tái)資源的存儲(chǔ)與應(yīng)用價(jià)值,從而實(shí)現(xiàn)對(duì)混合模型執(zhí)行環(huán)境的有效完善。在已知初始定位條件的前提下,通過(guò)聚類處理等方式所獲得的優(yōu)選殘差加權(quán)量計(jì)算結(jié)果,能夠從強(qiáng)弱度、分離度等多個(gè)角度分析云平臺(tái)存儲(chǔ)環(huán)境的穩(wěn)定性水平[8-9]。云數(shù)據(jù)優(yōu)選殘差加權(quán)量作為一種正值誤差特征量,在參量選取與計(jì)算過(guò)程中,只能將其視為一種估算值應(yīng)用結(jié)果。
設(shè)表示云平臺(tái)環(huán)境中資源數(shù)據(jù)信息的殘差優(yōu)選系數(shù),代表與混合模型匹配的強(qiáng)弱度參量值,β代表與混合模型匹配的分離度參量值,聯(lián)立式(2),可將云數(shù)據(jù)的優(yōu)選殘差加權(quán)量計(jì)算結(jié)果表示為:
其中,An代表云數(shù)據(jù)信息的殘差量最大值,Aˉ代表云數(shù)據(jù)信息的殘差量均值,ΔY代表單位時(shí)間內(nèi)的云平臺(tái)資源數(shù)據(jù)傳輸變化量。
在混合模型支持下,按照平臺(tái)主機(jī)需求變化趨勢(shì)分析、資源數(shù)據(jù)采集與融合、彈性擴(kuò)容與伸縮擴(kuò)容條件計(jì)算的處理流程,完成云平臺(tái)資源彈性伸縮方法的設(shè)計(jì)與應(yīng)用。
針對(duì)云平臺(tái)所有特定資源數(shù)據(jù)的彈性伸縮變化策略,需要根據(jù)平臺(tái)主機(jī)的需求制定條件,且由于混合模型的存在,數(shù)據(jù)信息參量在實(shí)際存儲(chǔ)過(guò)程中,始終保持較強(qiáng)的感應(yīng)性傳輸能力[10-11]。不同存儲(chǔ)時(shí)刻,云平臺(tái)資源數(shù)據(jù)具備的彈性伸縮適應(yīng)能力也有所不同,在已知優(yōu)選殘差加權(quán)量計(jì)算結(jié)果的情況下,待存儲(chǔ)的資源數(shù)據(jù)量越大,云平臺(tái)主機(jī)所具備的信息傳輸能力也就越強(qiáng)。在單位傳輸時(shí)間內(nèi),云平臺(tái)資源數(shù)據(jù)始終保持連續(xù)轉(zhuǎn)存的物理變化形式,即隨著平臺(tái)運(yùn)行時(shí)間的延長(zhǎng),資源數(shù)據(jù)的轉(zhuǎn)存量水平也會(huì)不斷增大,反之則不斷減小[12]。
設(shè)θ1、θ2分別代表兩個(gè)不同的云平臺(tái)感應(yīng)需求條件,在資源數(shù)據(jù)查找量等于β的情況下,聯(lián)立式(3),可將云平臺(tái)主機(jī)的需求變化趨勢(shì)定義為:
其中,f代表云平臺(tái)環(huán)境中的資源數(shù)據(jù)轉(zhuǎn)存系數(shù),代表單位時(shí)間內(nèi)的云平臺(tái)資源查找均值量,η代表資源數(shù)據(jù)的傳輸效率,k0代表數(shù)據(jù)信息的初始存儲(chǔ)量數(shù)值。
云平臺(tái)資源數(shù)據(jù)采集與融合是信息參量處理的關(guān)鍵環(huán)節(jié),其可在已知混合模型的基礎(chǔ)上,安排彈性伸縮控制指令的執(zhí)行強(qiáng)度,實(shí)現(xiàn)對(duì)彈性擴(kuò)容與伸縮擴(kuò)容條件的準(zhǔn)確計(jì)算。從宏觀角度來(lái)看,資源數(shù)據(jù)采集與資源數(shù)據(jù)融合是兩個(gè)相互獨(dú)立的執(zhí)行流程,前者負(fù)責(zé)在云平臺(tái)環(huán)境中分析資源數(shù)據(jù)所處的實(shí)時(shí)位置,并結(jié)合混合模型對(duì)主機(jī)中暫存的信息參量進(jìn)行按需提?。缓笳邉t主要負(fù)責(zé)將散亂分布的資源數(shù)據(jù)整合成包狀傳輸形式,從而實(shí)現(xiàn)對(duì)彈性收縮控制指令的有效分配與調(diào)節(jié)[13-14]。采集與融合流程如圖1所示。
圖1 云平臺(tái)資源數(shù)據(jù)的采集與融合流程
彈性擴(kuò)容條件決定了云平臺(tái)資源數(shù)據(jù)的最大存儲(chǔ)能力,一般來(lái)說(shuō),資源數(shù)據(jù)的采集與融合情況越完整,彈性擴(kuò)容條件的計(jì)算結(jié)果也就越精確[15]。設(shè)ξ表示既定的云平臺(tái)資源數(shù)據(jù)采集系數(shù),j表示單位時(shí)間內(nèi)的資源數(shù)據(jù)融合處理系數(shù),聯(lián)立式(4),可將彈性擴(kuò)容條件表示為:
其中,h代表單位時(shí)間內(nèi)云平臺(tái)資源數(shù)據(jù)的最大采集量。
伸縮擴(kuò)容條件決定云平臺(tái)資源數(shù)據(jù)的最小存儲(chǔ)能力,該項(xiàng)物理?xiàng)l件與彈性擴(kuò)容條件之間的差值水平越大,云平臺(tái)空間的實(shí)際穩(wěn)定性能力也就越強(qiáng)[16]。設(shè)d代表云平臺(tái)資源數(shù)據(jù)的實(shí)時(shí)容量系數(shù)值,μ代表數(shù)據(jù)信息的彈性伸縮目標(biāo)向量,聯(lián)合上述所有已知條件,可將伸縮擴(kuò)容條件表示為:
至此,完成各項(xiàng)物理系數(shù)值的計(jì)算與處理,實(shí)現(xiàn)云平臺(tái)資源彈性伸縮方法的研究。
在云平臺(tái)環(huán)境中,最大拉伸值、最小壓縮值都能反映主機(jī)設(shè)備所具備的資源數(shù)據(jù)處理能力。理想情況下,云平臺(tái)資源最大拉伸值的理想變化區(qū)間為5~13 bit(如圖2 所示),且數(shù)值結(jié)果越大,達(dá)標(biāo)拉伸處理行為越明顯,其理想情況如圖2 所示。
圖2 最大拉伸值的理想變化情況
將與理想拉伸值結(jié)果對(duì)應(yīng)的時(shí)間節(jié)點(diǎn)作為時(shí)間取樣點(diǎn),繪制實(shí)驗(yàn)組、對(duì)照組最大拉伸數(shù)值的實(shí)際變化曲線。其中,實(shí)驗(yàn)組采用基于混合模型的云平臺(tái)資源彈性伸縮方法,對(duì)照組采用高斯負(fù)載型數(shù)據(jù)伸縮方法[17-19]。
對(duì)比圖2、圖3 可知,實(shí)驗(yàn)組、對(duì)照組的最大拉伸值曲線始終與理想曲線保持相同的變化趨勢(shì),但實(shí)驗(yàn)組均值水平明顯更高,變化區(qū)間范圍由5~13 bit 擴(kuò)大為8~16 bit;對(duì)照組均值水平則顯著降低,變化區(qū)間范圍由5~13 bit縮小至3.5~11.5 bit。
圖3 最大拉伸值的實(shí)驗(yàn)記錄結(jié)果
綜上可知,在混合模型作用下,云平臺(tái)資源的最大拉伸數(shù)值會(huì)明顯增大,對(duì)于擴(kuò)大云主機(jī)的數(shù)據(jù)信息存儲(chǔ)能力具有較強(qiáng)促進(jìn)作用。
表1 記錄了實(shí)驗(yàn)組、對(duì)照組云平臺(tái)資源最小壓縮值及理想數(shù)值的實(shí)際變化情況。
分析表1 可知,實(shí)驗(yàn)組最小壓縮值、對(duì)照組最小壓縮值、理想數(shù)值均保持相同的物理變化趨勢(shì)。從平均量角度來(lái)看,實(shí)驗(yàn)組的變化區(qū)間為[0.200 bit,0.317 bit],對(duì)照組的變化區(qū)間為[0.5 bit,0.8 bit],理想數(shù)值的變化區(qū)間為[0.31 bit,0.45 bit],其變化區(qū)間大小順序?yàn)閷?shí)驗(yàn)組<理想組<對(duì)照組。
表1 最小壓縮值的實(shí)驗(yàn)記錄結(jié)果
綜上可知,在混合模型作用下,云平臺(tái)資源的最小壓縮值會(huì)出現(xiàn)持續(xù)縮小的變化形式,這在一定程度上,可實(shí)現(xiàn)對(duì)云主機(jī)數(shù)據(jù)信息下限存儲(chǔ)能力的有效促進(jìn)。
與高斯負(fù)載型數(shù)據(jù)伸縮方法相比,新型彈性伸縮方法可在混合模型的作用下,通過(guò)定義初始定位條件,計(jì)算得到云數(shù)據(jù)優(yōu)選殘差加權(quán)量,且由于平臺(tái)主機(jī)始終處于相對(duì)變化的發(fā)展趨勢(shì),資源數(shù)據(jù)的采集與融合結(jié)果可對(duì)彈性擴(kuò)容與伸縮擴(kuò)容條件提供有效的保障。從實(shí)用性角度來(lái)看,混合模型支持下,云平臺(tái)主機(jī)的最大拉伸值結(jié)果更大,最小壓縮值結(jié)果更小,可在實(shí)現(xiàn)云資源數(shù)據(jù)與平臺(tái)主機(jī)存儲(chǔ)條件最大化匹配的同時(shí),確保云服務(wù)質(zhì)量水平的可行性,具備較強(qiáng)的實(shí)際應(yīng)用價(jià)值。