摘 要: 云計(jì)算大規(guī)模服務(wù)器涉及的資源非常豐富,數(shù)據(jù)量巨大,對(duì)其中的故障進(jìn)行診斷需要大量的科學(xué)計(jì)算,當(dāng)前的故障診斷平臺(tái)通過(guò)對(duì)故障信息特征的提取實(shí)現(xiàn)對(duì)服務(wù)器故障的診斷,效率極低。因此,設(shè)計(jì)一種新的云計(jì)算大規(guī)模服務(wù)器故障診斷平臺(tái),給出平臺(tái)的總體結(jié)構(gòu),詳細(xì)分析了主控芯片、電源電路、復(fù)位電路、無(wú)線通信模塊和故障診斷模塊,共同實(shí)現(xiàn)云計(jì)算大規(guī)模服務(wù)器的故障診斷。軟件設(shè)計(jì)中,介紹了故障診斷平臺(tái)的診斷流程,給出了詳細(xì)實(shí)現(xiàn)過(guò)程的代碼。用戶通過(guò)系統(tǒng)的身份驗(yàn)證后,通過(guò)平臺(tái)對(duì)服務(wù)器進(jìn)行故障診斷,直至故障排除為止。實(shí)驗(yàn)結(jié)果表明,采用所設(shè)計(jì)平臺(tái)對(duì)云計(jì)算大規(guī)模服務(wù)器故障進(jìn)行診斷,不僅診斷成功率高,而且所需時(shí)間較短。
關(guān)鍵詞: 云計(jì)算; 大規(guī)模服務(wù)器; 故障診斷; 軟件設(shè)計(jì)
中圖分類(lèi)號(hào): TN911?34; TP302.8 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2016)18?0052?05
Abstract: The current fault diagnosis platform has low efficiency, because its diagnosis for server failure is realized by means of the extraction of fault information characteristics. Therefore, a new fault diagnosis platform for cloud computing large?scale servers was designed. In this paper, the general structure of the platform is described, the main control chip, power supply circuit, reset circuit, wireless communication module and fault diagnosis module are analyzed in detail, the diagnosis process of the fault diagnosis platform is introduced, and the code of the implementation process is given. The users can make the fault diagnosis of their servers by means of the platform after passing through the authentication of the system. The experimental results show that the platform has high success rate and needs shorter time for fault diagnosis of cloud computing large?scale server.
Keywords: cloud computing; large?scale server; fault diagnosis; software design
隨著計(jì)算機(jī)和互聯(lián)網(wǎng)的逐漸發(fā)展,云計(jì)算大規(guī)模服務(wù)器作為處理大數(shù)據(jù)的有效平臺(tái),被廣泛地應(yīng)用于各個(gè)領(lǐng)域[1?2]。服務(wù)器所處理的業(yè)務(wù)均較為關(guān)鍵,出現(xiàn)數(shù)據(jù)丟失或異常停機(jī)均將造成嚴(yán)重后果,人們對(duì)服務(wù)器的安全性和可靠性提出了很高的要求[3?4]。而這些安全性要求必須通過(guò)設(shè)計(jì)故障診斷平臺(tái)實(shí)現(xiàn),因此,設(shè)計(jì)一個(gè)合理的云計(jì)算大規(guī)模服務(wù)器故障診斷平臺(tái)勢(shì)在必行,已經(jīng)受到專(zhuān)家學(xué)者的廣泛關(guān)注,并取得了一定的進(jìn)展 [5?6]。
1 云計(jì)算大規(guī)模服務(wù)器故障診斷平臺(tái)的設(shè)計(jì)
1.1 故障診斷平臺(tái)總體設(shè)計(jì)
云計(jì)算大規(guī)模服務(wù)器故障診斷平臺(tái)將嵌入式處理器看作是主控單元,協(xié)同電源電路、復(fù)位電路、無(wú)線通信模塊和故障診斷模塊實(shí)現(xiàn)服務(wù)器的故障診斷,詳細(xì)結(jié)構(gòu)如圖1所示。
1.2 主控芯片設(shè)計(jì)
綜合分析整個(gè)云計(jì)算大規(guī)模服務(wù)器故障診斷平臺(tái)的設(shè)計(jì)要求和成本等因素,將意法半導(dǎo)體集團(tuán)生產(chǎn)的ARM Cortex?M3內(nèi)核微處理器STM32F103VCT6作為主控芯片。STM32F103VCT6芯片為32位嵌入式微處理器,計(jì)算性能高、計(jì)算速度快,并且外設(shè)配置豐富,能實(shí)現(xiàn)良好的通信與控制功能,其詳細(xì)結(jié)構(gòu)如圖2所示。
STM32F103VCT6芯片存在一顆運(yùn)算性能高的核心,能夠提供高達(dá)64 KB的大容量SRAM 。STM32F103VCT6芯片的串行通信接口很豐富,采用130個(gè)I/O端口實(shí)現(xiàn)CPU與外部設(shè)備、存儲(chǔ)器的連接和數(shù)據(jù)交換,將得到的外部設(shè)備信息通過(guò)2個(gè)集成電路總線發(fā)送至處理中心,利用控制器局部網(wǎng)絡(luò)總線傳輸至控制器中進(jìn)行處理,器件間的信息交換主要通過(guò)4個(gè)通用同步/異步串行接收/發(fā)送器實(shí)現(xiàn)。通過(guò)上述豐富的接口設(shè)計(jì)不僅能夠有效地實(shí)現(xiàn)故障診斷模塊信息通信的要求,還可依據(jù)實(shí)際情況與平臺(tái)中的其他模塊聯(lián)合使用,使服務(wù)性能更加優(yōu)越。
1.3 電源電路設(shè)計(jì)
針對(duì)診斷平臺(tái)的蓄電池有很多規(guī)格,本文采用最適用于故障診斷平臺(tái)的8 V蓄電池。STM32F103主控芯片的運(yùn)行電壓在2.3~3.5 V范圍內(nèi),無(wú)線通信芯片的運(yùn)行電壓在3.4~4.5 V范圍內(nèi),因此需將蓄電池的8 V電壓轉(zhuǎn)化成主控芯片和無(wú)線通信芯片的運(yùn)行電壓。本節(jié)電源電路的設(shè)計(jì)方案是將8 V電壓分別轉(zhuǎn)換成滿足主控芯片正常運(yùn)行的3 V電壓和滿足無(wú)線通信芯片正常運(yùn)行的4 V電壓。首先采用LM2596電壓轉(zhuǎn)化芯片將8 V電壓轉(zhuǎn)換成4 V電壓,電路圖如圖3所示。
圖3中,B340是肖特基整流二極管,其功能是對(duì)電路進(jìn)行整流,利用旁路電容和去耦電容運(yùn)行的基本原理,對(duì)云計(jì)算大規(guī)模服務(wù)器輸入信號(hào)與輸出信號(hào)中的高頻噪聲產(chǎn)生的干擾進(jìn)行過(guò)濾。在此基礎(chǔ)上通過(guò)穩(wěn)壓三極管進(jìn)行降壓,并利用B340進(jìn)行整流后,在VCC端輸出所需求的4 V電壓。然后采用AMS1117_3.3電壓轉(zhuǎn)化芯片將8 V電壓轉(zhuǎn)換成3 V電壓,為主控芯片提供工作電壓。AMS1117_3.3電壓轉(zhuǎn)化芯片為高效線性穩(wěn)壓器,能夠穩(wěn)定輸出3 V電壓。8 V電壓轉(zhuǎn)換成3 V電壓的電路圖如圖4所示。
1.4 復(fù)位電路設(shè)計(jì)
為了保證云計(jì)算大規(guī)模服務(wù)器故障診斷平臺(tái)電路的穩(wěn)定可靠,需設(shè)計(jì)一種復(fù)位電路進(jìn)行上電復(fù)位。只有在VCC端輸出在正常范圍內(nèi)的情況下,復(fù)位信號(hào)才會(huì)撤除,平臺(tái)開(kāi)始正常工作。本節(jié)采用STM32F103VCT6芯片作為復(fù)位芯片,該芯片是低電平復(fù)位,復(fù)位電路和主控芯片NRST硬件相連,復(fù)位電路圖如圖5所示。
如圖5所示,當(dāng)復(fù)位電路斷開(kāi),NRST引腳和3.3 V工作電壓相連,這時(shí)處于髙電平狀態(tài),按下復(fù)位鍵,將復(fù)位電路接通,NRST引腳將和地線連接在一起,轉(zhuǎn)換成低電平,STM32F103VCT6芯片復(fù)位。
1.5 無(wú)線通信模塊電路設(shè)計(jì)
所設(shè)計(jì)診斷平臺(tái)的通信芯片選用SIMCom公司生產(chǎn)的SIM900芯片,實(shí)現(xiàn)和主控芯片之間的通信,電路設(shè)計(jì)如圖6所示。
圖6中,SIM900芯片通過(guò)TXD,RXD引腳實(shí)現(xiàn)和STM32F103VCT6芯片之間的信息交換,引腳連接形式為主控芯片的 TXD 引腳連接 SIM900 芯片的RXD引腳,主控芯片的RXD引腳和通信芯片的TXD引腳相連,主控芯片和通信芯片之間共地,通過(guò)上述連接即可實(shí)現(xiàn)SIM900芯片與主控芯片之間的通信。
1.6 故障診斷芯片
平臺(tái)選用ELM327芯片作為云計(jì)算大規(guī)模服務(wù)器故障診斷芯片,其設(shè)計(jì)電路如圖7所示。圖7中,依據(jù)各種故障診斷通信協(xié)議的物理層需求,在ELM327芯片外圍設(shè)置通信接口電路,從而符合故障診斷通信協(xié)議。通過(guò)CAN控制器把故障診斷信息按照協(xié)議要求,轉(zhuǎn)換成CAN協(xié)議標(biāo)準(zhǔn)數(shù)據(jù)幀格式完成傳輸,故障診斷信息是通過(guò)芯片中的軟件程序獲取的,詳細(xì)情況將在第2節(jié)進(jìn)行分析。而傳輸過(guò)程是通過(guò)CAN收發(fā)器實(shí)現(xiàn)的。
2 故障診斷平臺(tái)軟件設(shè)計(jì)
2.1 故障診斷主流程設(shè)計(jì)
云計(jì)算大規(guī)模服務(wù)器故障診斷平臺(tái)的診斷流程如圖8所示。
3 實(shí)驗(yàn)結(jié)果分析
為了驗(yàn)證本文設(shè)計(jì)平臺(tái)的有效性,需要進(jìn)行相關(guān)的實(shí)驗(yàn)分析。實(shí)驗(yàn)將ANN平臺(tái)作為對(duì)比,在Matlab 7.0環(huán)境下進(jìn)行。主要針對(duì)服務(wù)器中服務(wù)停止、服務(wù)暫停和進(jìn)程異常三種故障進(jìn)行診斷,三種故障類(lèi)型的注入次數(shù)和注入成功數(shù)量如表1所示。
分別采用本文平臺(tái)和ANN平臺(tái)對(duì)上述三種云計(jì)算大規(guī)模服務(wù)器故障進(jìn)行診斷,得到的診斷準(zhǔn)確率比較結(jié)果如表2所示。
分析表2可以看出,采用本文平臺(tái)對(duì)云計(jì)算大規(guī)模服務(wù)器的三種故障進(jìn)行診斷,不管是針對(duì)服務(wù)停止,服務(wù)暫停還是針對(duì)進(jìn)程異常的故障,得到結(jié)果的診斷準(zhǔn)確率一直高于ANN平臺(tái),說(shuō)明本文平臺(tái)具有很高的診斷精度。在上述實(shí)驗(yàn)的基礎(chǔ)上,對(duì)本文平臺(tái)和ANN平臺(tái)進(jìn)行一次故障診斷所需的時(shí)間進(jìn)行比較,得到的結(jié)果如圖9所示。
從圖9可以看出,采用本文平臺(tái)進(jìn)行故障診斷,所需的時(shí)間明顯低于ANN平臺(tái),同時(shí)本文平臺(tái)的運(yùn)行時(shí)間曲線更加平穩(wěn),說(shuō)明本文平臺(tái)不僅效率高,而且穩(wěn)定性較強(qiáng)。
4 結(jié) 論
本文設(shè)計(jì)了一種新的云計(jì)算大規(guī)模服務(wù)器故障診斷平臺(tái),給出了平臺(tái)的總體結(jié)構(gòu),詳細(xì)分析了主控芯片、電源電路、復(fù)位電路、無(wú)線通信模塊和故障診斷模塊,共同實(shí)現(xiàn)云計(jì)算大規(guī)模服務(wù)器的故障診斷。軟件設(shè)計(jì)中,介紹了故障診斷平臺(tái)的診斷流程,用戶通過(guò)系統(tǒng)的身份驗(yàn)證后,通過(guò)平臺(tái)對(duì)服務(wù)器進(jìn)行故障診斷,直至故障排除為止,給出了詳細(xì)實(shí)現(xiàn)過(guò)程的代碼。實(shí)驗(yàn)結(jié)果表明,采用所設(shè)計(jì)平臺(tái)對(duì)云計(jì)算大規(guī)模服務(wù)器故障進(jìn)行診斷,不僅診斷成功率高,而且所需時(shí)間較短。
參考文獻(xiàn)
[1] 趙雪琴,付媛媛.云計(jì)算環(huán)境下大規(guī)模Web服務(wù)故障診斷技術(shù)研究[J].計(jì)算機(jī)測(cè)量與控制,2014,22(9):2760?2762.
[2] 李金徽.云計(jì)算對(duì)于電力電氣設(shè)備故障診斷和檢修的作用[J].電子技術(shù)與軟件工程,2015(4):189.
[3] 邱昕,甘超,江雄心,等.基于云計(jì)算環(huán)境下Apriori算法的設(shè)備故障診斷技術(shù)研究[J].組合機(jī)床與自動(dòng)化加工技術(shù),2014(4):45?48.
[4] 安海濤.多媒體云計(jì)算下的大規(guī)模數(shù)據(jù)流調(diào)度方法研究[J].現(xiàn)代電子技術(shù),2015,38(20):154?157.
[5] 張亞中,余正紅.基于Windows Azure云計(jì)算的輿情監(jiān)控系統(tǒng)服務(wù)器模塊設(shè)計(jì)與實(shí)現(xiàn)[J].軟件導(dǎo)刊,2014(7):69?71.
[6] 李貴兵,金煒東,蔣鵬,等.面向大規(guī)模監(jiān)測(cè)數(shù)據(jù)的高鐵故障診斷技術(shù)研究[J].系統(tǒng)仿真學(xué)報(bào),2014,26(10):2458?2464.
[7] 楊艷燕.云計(jì)算中基于相似性圖的故障自動(dòng)診斷方法[J].計(jì)算機(jī)測(cè)量與控制,2014,22(12):3877?3880.
[8] 傅仁軒,石安委.物聯(lián)網(wǎng)遠(yuǎn)程監(jiān)控故障診斷系統(tǒng)的設(shè)計(jì)與應(yīng)用[J].移動(dòng)通信,2014(2):80?84.
[9] 張自賓,孔凡勝,王竹林.模擬電路故障診斷方法設(shè)計(jì)及虛擬維修過(guò)程[J].電子設(shè)計(jì)工程,2015(1):30?32.
[10] 張黎黎.基于云計(jì)算的高??蒲袡n案管理模式探析[J].物聯(lián)網(wǎng)技術(shù),2015,5(12):75?77.