■ 河北 溫帥
編者按:筆者在工作中發(fā)現(xiàn)一款監(jiān)測(cè)溫度的軟件,利用該軟件,可以實(shí)現(xiàn)機(jī)房溫度監(jiān)測(cè)報(bào)警機(jī)制。
筆者單位機(jī)房的普通格力120空調(diào)出現(xiàn)兩次故障,一次出現(xiàn)報(bào)錯(cuò),一次直接關(guān)機(jī),兩次故障導(dǎo)致的原因都是外機(jī)溫度過高。
第一次發(fā)現(xiàn)是在例行檢查時(shí),機(jī)房溫度已經(jīng)超過了45度,兩臺(tái)服務(wù)器(加配外置風(fēng)扇)的溫度已經(jīng)超過了50度,網(wǎng)絡(luò)設(shè)備溫度未報(bào)警,風(fēng)扇正常運(yùn)轉(zhuǎn)。
圖1 Core Temp軟件
發(fā)現(xiàn)后馬上開啟備用空調(diào),清理空調(diào)外機(jī),外機(jī)進(jìn)風(fēng)口已經(jīng)完全被糊住了,導(dǎo)致進(jìn)風(fēng)困難,持續(xù)運(yùn)轉(zhuǎn)溫度升高,經(jīng)過清理恢復(fù)運(yùn)行。
第二次還是在例行檢查時(shí)發(fā)現(xiàn)空調(diào)關(guān)閉,沒有報(bào)錯(cuò),機(jī)房溫度超過44度,服務(wù)器溫度超過50度。
兩次故障幸虧是在例行檢查的時(shí)候發(fā)現(xiàn),如果有其他工作耽誤了例行檢查,很有可能造成溫度更高,甚至服務(wù)器損壞。
圖3 監(jiān)測(cè)界面
于是研究如何檢測(cè)機(jī)房溫度,以便在不穩(wěn)定的空調(diào)宕機(jī)時(shí)能及時(shí)收到消息。
第一想法是使用服務(wù)器的溫度傳感器監(jiān)測(cè)溫度,并經(jīng)過一定的觸發(fā)報(bào)警,通知到管理人員。
經(jīng)過從網(wǎng)上搜索,找到一款Core Temp軟件(如圖1所示),可以持續(xù)監(jiān)測(cè)服務(wù)器各個(gè)核心的溫度,并觸發(fā)過熱保護(hù),通過聲音報(bào)警或觸發(fā)程序報(bào)警,并自動(dòng)向郵箱發(fā)送郵件。
以前的腳本發(fā)現(xiàn)是vbs的,而該軟件需要bat或者exe格式的文件,于是筆者從網(wǎng)上搜了一下,找到一個(gè)腳本,這個(gè)腳本的特點(diǎn)是,擴(kuò)展名為vbs或者bat,兩種腳本都可以用,其中的語(yǔ)句在vbs和bat中具有不同的意義,或者被忽略,但都能實(shí)現(xiàn)發(fā)郵件的效果。
具體腳本如圖2所示。
軟件安裝到了一臺(tái)物理服務(wù)器上后,還需要對(duì)溫度持續(xù)監(jiān)測(cè),了解到正常溫度的最大值是多少,才能設(shè)定報(bào)警值。
經(jīng)過1周的監(jiān)測(cè),發(fā)現(xiàn)在空調(diào)設(shè)置24度恒溫的情況下,4個(gè)CPU核心最高溫度為45,我手動(dòng)同時(shí)運(yùn)行多個(gè)大型程序,也不會(huì)超過這個(gè)溫度,于是將過熱保護(hù)值設(shè)定為46度,觸發(fā)過熱保護(hù)后,運(yùn)行sendmail.bat腳本,發(fā)送郵件,如圖3所示。
該報(bào)警方式實(shí)現(xiàn)服務(wù)器溫度傳感器同時(shí)應(yīng)用于服務(wù)器溫度檢測(cè)和機(jī)房溫度檢測(cè),實(shí)現(xiàn)硬件的復(fù)用,節(jié)省費(fèi)用,也實(shí)現(xiàn)了高溫報(bào)警,運(yùn)行效果良好。
圖2 具體腳本內(nèi)容