摘 要: 網(wǎng)絡(luò)資源調(diào)度過(guò)程中存在多處理機(jī)同時(shí)發(fā)生故障的情況,傳統(tǒng)方法在處理多處理機(jī)發(fā)生故障時(shí),主要分析執(zhí)行時(shí)間和通信時(shí)間,未對(duì)資源調(diào)度的穩(wěn)定性進(jìn)行考慮,資源調(diào)度存在較高的誤差。為了有效解決資源調(diào)度過(guò)程中存在的故障問(wèn)題,設(shè)計(jì)了基于自適應(yīng)容錯(cuò)機(jī)制的網(wǎng)絡(luò)資源調(diào)度平臺(tái)。該平臺(tái)具有網(wǎng)絡(luò)資源發(fā)現(xiàn)、網(wǎng)絡(luò)網(wǎng)絡(luò)資源預(yù)約、網(wǎng)絡(luò)資源動(dòng)態(tài)信息查詢以及資源調(diào)度運(yùn)行時(shí)監(jiān)控等功能。網(wǎng)絡(luò)資源調(diào)度模塊的錯(cuò)誤檢測(cè)服務(wù)包括進(jìn)程監(jiān)控模塊、匯總模塊、錯(cuò)誤評(píng)估模塊以及報(bào)警模塊。通過(guò)自適應(yīng)錯(cuò)誤檢測(cè)算法,對(duì)網(wǎng)絡(luò)資源調(diào)度進(jìn)程中的錯(cuò)誤進(jìn)行檢測(cè),并采取對(duì)應(yīng)的解決措施,確保資源調(diào)度的順利運(yùn)行。實(shí)驗(yàn)結(jié)果說(shuō)明,所設(shè)計(jì)調(diào)度平臺(tái)在進(jìn)行資源調(diào)度過(guò)程中,網(wǎng)絡(luò)利用率、調(diào)度性能以及可靠性都較優(yōu)。
關(guān)鍵詞: 容錯(cuò)機(jī)制; 網(wǎng)絡(luò)資源; 資源調(diào)度; 錯(cuò)誤檢測(cè)服務(wù)
中圖分類號(hào): TN915?34; TP393 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2016)10?0061?04
Design of network resource scheduling platform based on adaptive
fault?tolerant mechanism
HAN Min, QIAO Lu
(Department of Information Engineering, Henan PolyTechnic, Zhengzhou 450046, China)
Abstract: In order to effectively solve the fault problems existing in the process of resource scheduling, a network resource scheduling platform based on adaptive fault?tolerant mechanism was designed. The platform has the functions of network resource discovery, network resource appointment, network resources dynamic information query, resource scheduling run?time monitoring, etc. The error detection service of the network resource scheduling includes process monitoring module, summary module, error evaluation module and alarm module. The error in the process of the network resource scheduling is detected with the adaptive error detection algorithm, and the corresponding measures are taken to ensure the smooth operation of the resource scheduling. The experiment result shows that the platform has high network utilization, perfect scheduling performance and better reliability in the process of resource scheduling,.
Keywords: fault?tolerance mechanism; network resource; resource scheduling; error detection service
0 引 言
隨著科學(xué)技術(shù)和通信技術(shù)的高速發(fā)展,網(wǎng)絡(luò)已經(jīng)成為人們生產(chǎn)和生活必不可少的一部分,網(wǎng)絡(luò)資源的高效調(diào)度對(duì)于提高生產(chǎn)和生活質(zhì)量具有重要作用。而網(wǎng)絡(luò)資源調(diào)度過(guò)程中存在多處理機(jī)同時(shí)發(fā)生故障的情況,傳統(tǒng)方法處理多處理機(jī)發(fā)生故障,主要分析執(zhí)行時(shí)間和通信時(shí)間,未對(duì)資源調(diào)度的穩(wěn)定性進(jìn)行考慮,資源調(diào)度存在較高的誤差[1?3]。網(wǎng)絡(luò)資源調(diào)度的高可靠性是系統(tǒng)內(nèi)在要求的關(guān)鍵,容錯(cuò)調(diào)度是調(diào)度系統(tǒng)實(shí)現(xiàn)容錯(cuò)的有效方法。因此,考慮容錯(cuò)機(jī)制,設(shè)計(jì)出高質(zhì)量的網(wǎng)絡(luò)資源調(diào)度平臺(tái),具有重要應(yīng)用意義[4?5]。
文獻(xiàn)[6]分析了依據(jù)可靠性驅(qū)動(dòng)的動(dòng)態(tài)網(wǎng)絡(luò)資源調(diào)度方法,該方法在大量資源失敗條件下,基于資源調(diào)度可靠性代價(jià)為目標(biāo),實(shí)現(xiàn)非周期的的動(dòng)態(tài)資源實(shí)時(shí)調(diào)度,但是該方法的調(diào)度效率較低。文獻(xiàn)[7]提出了基于主動(dòng)復(fù)制策略的List啟發(fā)式調(diào)度算法,其可將一個(gè)資源的N+l個(gè)副本調(diào)度到不同處理機(jī),但是在劃分資源的大規(guī)模副本時(shí),產(chǎn)生了較高的通信消耗和時(shí)間復(fù)雜度。文獻(xiàn)[8]在啟發(fā)式調(diào)度算法基礎(chǔ)上,采用新的數(shù)據(jù)結(jié)構(gòu)處理網(wǎng)絡(luò)資源映射到的處理機(jī)間的通信關(guān)系,降低大量冗余通信,但是存在調(diào)度誤差高的缺陷。文獻(xiàn)[9]中的CAFT資源調(diào)度方法,其重復(fù)考慮資源調(diào)度的時(shí)間復(fù)雜度,將資源多個(gè)副本映射到不同的處理機(jī)上,但是該方法在調(diào)度資源過(guò)程中的穩(wěn)定性較差。
本文設(shè)計(jì)了基于自適應(yīng)容錯(cuò)機(jī)制的網(wǎng)絡(luò)資源調(diào)度平臺(tái),該平臺(tái)具有網(wǎng)絡(luò)資源發(fā)現(xiàn)、網(wǎng)絡(luò)網(wǎng)絡(luò)資源預(yù)約、網(wǎng)絡(luò)資源動(dòng)態(tài)信息查詢以及資源調(diào)度運(yùn)行時(shí)監(jiān)控等功能。
1 網(wǎng)絡(luò)資源調(diào)度平臺(tái)的邏輯設(shè)計(jì)
1.1 網(wǎng)絡(luò)資源高度平臺(tái)的總體結(jié)構(gòu)
網(wǎng)絡(luò)資源調(diào)度平臺(tái)的總體結(jié)構(gòu)如圖1所示。
在圖1所示的網(wǎng)絡(luò)資源調(diào)度結(jié)構(gòu)中,網(wǎng)絡(luò)資源提交者將資源提交給資源調(diào)度程序,資源調(diào)度程序從其中的等待調(diào)度資源序列中采集有關(guān)待調(diào)度網(wǎng)絡(luò)資源的反映信息以及資源申請(qǐng)信息,在資源提供者中搜索相關(guān)的網(wǎng)絡(luò)需求。網(wǎng)絡(luò)資源調(diào)度模塊中的資源匹配子模塊能夠?qū)Y源進(jìn)行匹配分析。資源管理模塊將現(xiàn)場(chǎng)網(wǎng)絡(luò)資源調(diào)度模塊中采集到的網(wǎng)絡(luò)現(xiàn)場(chǎng)資源,傳輸給資源提交模塊,實(shí)現(xiàn)網(wǎng)絡(luò)資源的有效調(diào)度,并將調(diào)度結(jié)果存儲(chǔ)在數(shù)據(jù)庫(kù)中,同時(shí)通過(guò)調(diào)度結(jié)果顯示模塊向用戶提供網(wǎng)絡(luò)資源調(diào)度結(jié)果。
1.2 基于自適應(yīng)容錯(cuò)機(jī)制的網(wǎng)絡(luò)資源調(diào)度模型設(shè)計(jì)
隨著網(wǎng)絡(luò)規(guī)模的不斷擴(kuò)大,網(wǎng)絡(luò)資源調(diào)度故障發(fā)生率逐漸增加,引入自適應(yīng)容錯(cuò)機(jī)制實(shí)時(shí)檢測(cè)故障,有效處理故障形成的不利干擾,確保網(wǎng)絡(luò)資源調(diào)度的順利進(jìn)行。
1.2.1 錯(cuò)誤檢測(cè)服務(wù)的設(shè)計(jì)
錯(cuò)誤檢測(cè)服務(wù)是自適應(yīng)容錯(cuò)機(jī)制的關(guān)鍵部分,其可實(shí)時(shí)采集網(wǎng)絡(luò)故障資源節(jié)點(diǎn),同時(shí)將錯(cuò)誤信息傳遞到錯(cuò)誤調(diào)控服務(wù),通過(guò)錯(cuò)誤控制服務(wù)制定解決方案,完成錯(cuò)誤的恢復(fù),最終實(shí)現(xiàn)網(wǎng)絡(luò)資源調(diào)度容錯(cuò)性能。錯(cuò)誤檢測(cè)服務(wù)包括進(jìn)程監(jiān)控模塊、匯總模塊、錯(cuò)誤評(píng)估模塊和報(bào)警模塊,其結(jié)構(gòu)圖如圖2所示。圖2所示的基于自適應(yīng)容錯(cuò)機(jī)制的網(wǎng)絡(luò)資源調(diào)度模塊的容錯(cuò)檢測(cè)服務(wù)過(guò)程為:
(1) 進(jìn)程監(jiān)測(cè)模塊可檢測(cè)到網(wǎng)絡(luò)中運(yùn)行的進(jìn)程以及對(duì)應(yīng)的資源,采用故障機(jī)制檢測(cè)網(wǎng)絡(luò)資源調(diào)度進(jìn)程的情況,通過(guò)將故障信息傳遞給匯總模塊。
(2) 匯總模塊用于采集進(jìn)程監(jiān)測(cè)模塊傳遞的故障信息,采用合理的方案評(píng)估故障信息達(dá)到世界的歷史信息,分析后續(xù)故障信息到達(dá)的時(shí)間。
(3) 錯(cuò)誤評(píng)估模塊對(duì)網(wǎng)絡(luò)資源調(diào)度平臺(tái)是否存在錯(cuò)誤進(jìn)行評(píng)估,該模塊對(duì)服務(wù)器預(yù)測(cè)的下次故障信息以及故障信息實(shí)際到達(dá)的實(shí)際進(jìn)行匹配,基于該匹配結(jié)果評(píng)估是否存在資源調(diào)度錯(cuò)誤。
(4) 通信模塊在存在網(wǎng)絡(luò)資源調(diào)度錯(cuò)誤情況下,將錯(cuò)誤信息傳輸?shù)皆?jì)算目錄模塊以及錯(cuò)誤控制模塊。通信模塊能夠在網(wǎng)絡(luò)資源調(diào)度過(guò)程中對(duì)錯(cuò)誤資源進(jìn)行標(biāo)識(shí),并通過(guò)錯(cuò)誤控制模塊針對(duì)發(fā)生的錯(cuò)誤進(jìn)行合理的處理,確保網(wǎng)絡(luò)資源調(diào)度的順利運(yùn)行。
1.2.2 錯(cuò)誤檢測(cè)服務(wù)的實(shí)現(xiàn)
基于自適應(yīng)容錯(cuò)機(jī)制的網(wǎng)絡(luò)資源調(diào)度模塊,通過(guò)自適應(yīng)錯(cuò)誤檢測(cè)算法,檢測(cè)網(wǎng)絡(luò)資源調(diào)度進(jìn)程中存在的錯(cuò)誤。自適應(yīng)錯(cuò)誤檢測(cè)算法的思路為:檢測(cè)進(jìn)程P塑造一個(gè)滑動(dòng)窗口其范圍是N,其用作描述近來(lái)N次故障消息的傳達(dá),所花費(fèi)的時(shí)間,用t1,t2,…,tn來(lái)描述,在任意一個(gè)新增故障消息抵達(dá)的過(guò)程中,會(huì)更換掉最初記載的那個(gè)時(shí)間,通過(guò)以上時(shí)間的記載,則可獲取臨近兩次故障消息抵達(dá)的時(shí)間間隙Δt,如果故障消息抵達(dá)的時(shí)間間隙服從正態(tài)分布,則可預(yù)測(cè)出后續(xù)故障消息到達(dá)的時(shí)間概率,獲取待檢測(cè)進(jìn)程超出時(shí)間t的命中率,自適應(yīng)錯(cuò)誤檢測(cè)算法中的猜測(cè)程度函數(shù)Φ的分析過(guò)程如下:
(1) 檢測(cè)網(wǎng)絡(luò)資源調(diào)度過(guò)程p中存儲(chǔ)待檢測(cè)過(guò)程q近期的N次傳遞的故障消息抵達(dá)時(shí)間為t1,t2,…,tn;
式中:[Φ(Tnow)]為若網(wǎng)絡(luò)資源調(diào)度平臺(tái)在時(shí)刻[Tnow],檢測(cè)網(wǎng)絡(luò)資源調(diào)度進(jìn)程p未獲取到待檢測(cè)進(jìn)程q反饋的故障消息,則進(jìn)程p確定進(jìn)程q存在故障的概率是[Φ(Tnow)]。檢測(cè)網(wǎng)絡(luò)資源調(diào)度平臺(tái)是否存在錯(cuò)誤前,網(wǎng)絡(luò)資源調(diào)度進(jìn)程會(huì)基于資源調(diào)度平臺(tái)對(duì)錯(cuò)誤檢測(cè)服務(wù)的要求,設(shè)置合理的閾值[α],因此,在檢測(cè)錯(cuò)誤時(shí),實(shí)時(shí)對(duì)比[Φ(Tnow)]值與[α]值,若[Φ(Tnow)]>[α],則說(shuō)明被檢測(cè)的網(wǎng)絡(luò)資源調(diào)度進(jìn)程存在錯(cuò)誤。
1.2.3 引入自適應(yīng)容錯(cuò)機(jī)制的網(wǎng)絡(luò)資源調(diào)度算法
通過(guò)1.2.2節(jié)的計(jì)算結(jié)果,將錯(cuò)誤檢測(cè)容錯(cuò)機(jī)制引入網(wǎng)絡(luò)資源調(diào)度中,具體運(yùn)行過(guò)程為:
(1) 用戶和網(wǎng)絡(luò)使用者將資源傳送至調(diào)度平臺(tái),并放置在網(wǎng)絡(luò)待調(diào)度的列表中;
(2) 網(wǎng)絡(luò)信息服務(wù)依據(jù)容錯(cuò)機(jī)制完成資源的檢測(cè),得到有價(jià)值的資源列表;
(3) 網(wǎng)絡(luò)資源調(diào)試模塊依據(jù)有價(jià)值的資源列表完成資源調(diào)度;
(4) 開(kāi)始調(diào)度網(wǎng)絡(luò)資源時(shí),根據(jù)固定的時(shí)間段塑造檢驗(yàn)點(diǎn)并恢復(fù)原始數(shù)據(jù)錯(cuò)誤等級(jí)是1;
(5) 錯(cuò)誤檢測(cè)模塊根據(jù)自適應(yīng)容錯(cuò)機(jī)制檢測(cè)處理單元的錯(cuò)誤,同時(shí)將檢查的信息反饋到錯(cuò)誤決策模塊;
(6) 在故障消息超出設(shè)定時(shí)間后,錯(cuò)誤決策模塊分析出存在錯(cuò)誤,則執(zhí)行過(guò)程(7),否則說(shuō)明不存在錯(cuò)誤,執(zhí)行過(guò)程(8);
(7) 錯(cuò)誤控制模塊基于NakedJoystick提取對(duì)應(yīng)的容錯(cuò)方案:
① NakedJoystick=1時(shí),利用檢測(cè)點(diǎn)與發(fā)生錯(cuò)誤重試的容錯(cuò)方案,同時(shí)設(shè)置NakedJoystick++;
② NakedJoystick=2時(shí),利用檢測(cè)點(diǎn)與資源替換的容錯(cuò)方案,同時(shí)設(shè)置NakedJoystick++;
③ NakedJoystick=3時(shí)代表出現(xiàn)了重大錯(cuò)誤,這時(shí)要利用檢測(cè)點(diǎn)與資源復(fù)制的容錯(cuò)方案;
④ 若無(wú)綜上情況發(fā)生就代表容錯(cuò)機(jī)制運(yùn)行失敗,資源實(shí)施也以失敗告終,執(zhí)行過(guò)程(9)。
(8) 分析是否完成網(wǎng)絡(luò)資源調(diào)度,若完成則執(zhí)行過(guò)程(9),否則執(zhí)行過(guò)程(6);
(9) 完成網(wǎng)絡(luò)資源調(diào)度,說(shuō)明基于自適應(yīng)容錯(cuò)機(jī)制的網(wǎng)絡(luò)資源調(diào)度過(guò)程結(jié)束。
1.2.4 代碼的設(shè)計(jì)與實(shí)現(xiàn)
基于自適應(yīng)容錯(cuò)機(jī)制的網(wǎng)絡(luò)資源調(diào)度算法執(zhí)行過(guò)程代碼如下:
Begin
(1) 網(wǎng)絡(luò)信息服務(wù)依據(jù)資源描述信息獲取有價(jià)值的資源列表;
(2) 對(duì)GA_TS網(wǎng)絡(luò)資源進(jìn)行調(diào)度;
MistakeJoystick=2
while(網(wǎng)絡(luò)資源未實(shí)施結(jié)束)
if([t等待>Δt1])
在網(wǎng)絡(luò)信息服務(wù)里記錄發(fā)生錯(cuò)誤的資源,同時(shí)從可用資源列表中清除;
if(MistakeJoystick==2)
JowlScore_Wound;
NakedJoystick++;
else
if(MistakeJoystick==2)
JowlScore_Substitute_Financial;
NakedJoystick++;
Clse
if(nakedJoystick==4)
JowlScore??HrUtilization:
else
容錯(cuò)機(jī)制失效,網(wǎng)絡(luò)資源調(diào)度失?。?/p>
endif
endif
endif
endwhile
end
2 實(shí)驗(yàn)分析
通過(guò)實(shí)驗(yàn)驗(yàn)證本文提出的基于自適應(yīng)容錯(cuò)機(jī)制的網(wǎng)絡(luò)資源調(diào)度平臺(tái)設(shè)計(jì)方法的性能。實(shí)驗(yàn)采用的對(duì)比方法為神經(jīng)網(wǎng)絡(luò)方法。實(shí)驗(yàn)從網(wǎng)絡(luò)利用率、調(diào)度性和可靠性三方面評(píng)估本文方法和神經(jīng)網(wǎng)絡(luò)方法的優(yōu)劣。兩種方法的網(wǎng)絡(luò)利用率的實(shí)驗(yàn)結(jié)果如圖3所示。
圖3 兩種方法的網(wǎng)絡(luò)利用率對(duì)比
從圖3中可看出,網(wǎng)絡(luò)利用率在開(kāi)始階段,兩種調(diào)度方法的網(wǎng)絡(luò)利用率都相對(duì)較高,但是隨著調(diào)度時(shí)間的逐漸增加,兩種方法的網(wǎng)絡(luò)利用率都不斷降低,并且本文方法的網(wǎng)絡(luò)利用率始終高于神經(jīng)網(wǎng)絡(luò)方法,本文方法能夠充分利用網(wǎng)絡(luò)資源完成網(wǎng)絡(luò)資源的調(diào)度。并且本文方法的變化趨于平穩(wěn),說(shuō)明本文方法能夠很好地完成網(wǎng)絡(luò)資源的調(diào)度,具有較高的調(diào)度均衡性。
如圖4所示為兩種方法的調(diào)度性表現(xiàn),分析圖4可以看出,隨著資源數(shù)的增加,本文方法和神經(jīng)網(wǎng)絡(luò)方法的調(diào)度性逐漸降低,并且神經(jīng)網(wǎng)絡(luò)方法的調(diào)度性能出現(xiàn)顯著的波動(dòng),但本文方法的調(diào)度性高于神經(jīng)網(wǎng)絡(luò)方法,表明在多資源調(diào)度環(huán)境下本文方法具有較強(qiáng)的健壯性。
如圖5所示為不同網(wǎng)絡(luò)資源調(diào)度失敗比率條件下,兩種調(diào)度方法的可靠性。從圖5中能夠分析出:隨著資源調(diào)度失敗比率的不斷增加,兩種方法的可靠性都有所下降,但是本文方法的可靠性遠(yuǎn)遠(yuǎn)優(yōu)于神經(jīng)網(wǎng)絡(luò)方法,特別當(dāng)通信延遲較高時(shí),說(shuō)明本文方法具有較高的可靠性。
3 結(jié) 論
為了有效解決資源調(diào)度過(guò)程中存在的故障問(wèn)題,本文設(shè)計(jì)了基于自適應(yīng)容錯(cuò)機(jī)制的網(wǎng)絡(luò)資源調(diào)度平臺(tái)。該平臺(tái)具有網(wǎng)絡(luò)資源發(fā)現(xiàn)、網(wǎng)絡(luò)資源預(yù)約、網(wǎng)絡(luò)資源動(dòng)態(tài)信息查詢和資源調(diào)度運(yùn)行時(shí)監(jiān)控等功能。網(wǎng)絡(luò)資源調(diào)度模塊的錯(cuò)誤檢測(cè)服務(wù)包括進(jìn)程監(jiān)控模塊、匯總模塊、錯(cuò)誤評(píng)估模塊以及報(bào)警模塊。通過(guò)自適應(yīng)錯(cuò)誤檢測(cè)算法,對(duì)網(wǎng)絡(luò)資源調(diào)度進(jìn)程中的錯(cuò)誤進(jìn)行檢測(cè),并采取對(duì)應(yīng)的解決措施,確保資源調(diào)度的順利運(yùn)行。實(shí)驗(yàn)結(jié)果表明,所設(shè)計(jì)調(diào)度平臺(tái)在進(jìn)行資源調(diào)度過(guò)程中,網(wǎng)絡(luò)利用率、調(diào)度性能以及可靠性都較優(yōu)。
參考文獻(xiàn)
[1] 華楠,鄭小平.智能光網(wǎng)絡(luò)發(fā)展歷程的回顧和展望:從ASON到PCE,再到SDON[J].電信科學(xué),2014,30(2):88?98.
[2] 彭彬,于浩,蘇韻掣,等.基于物聯(lián)網(wǎng)的智能廠站位置服務(wù)系統(tǒng)[J].電力系統(tǒng)自動(dòng)化,2013,37(16):114?118.
[3] 魯睿,鄭小平,華楠.多域異構(gòu)光網(wǎng)絡(luò)互連互通管控機(jī)制[J].清華大學(xué)學(xué)報(bào)(自然科學(xué)版),2013(7):982?990.
[4] WEI Yongjian, GUO Junhu, LI Hui, et al. Experimental demonstration of centralized control mechanism over all?optical network based on OpenFlow protocol [C]// 2014 Optical Fiber Communications Conference and Exhibition. San Francisco, CA: OFC, 2014: 1?9.
[5] 真才基.TD?LTE網(wǎng)絡(luò)規(guī)劃原理與應(yīng)用[M].北京:人民郵電出版社,2013:57?59.
[6] 孫維成.云資源調(diào)度技術(shù)在區(qū)域醫(yī)療衛(wèi)生信息平臺(tái)中的應(yīng)用研究[D].青島:中國(guó)海洋大學(xué),2013:19?21.
[7] 汪楠.基于OpenStack云平臺(tái)的計(jì)算資源動(dòng)態(tài)調(diào)度及管理[D].大連:大連理工大學(xué),2013:45?50.
[8] 敖文鳳.云計(jì)算中基于Hungarian算法的資源獲取研究[D].成都:電子科技大學(xué),2013:21?24.
[9] 石華.異構(gòu)無(wú)線網(wǎng)絡(luò)中頻譜資源動(dòng)態(tài)分配[D].西安:西安電子科大學(xué),2014.