柳林溪
(貴州電網(wǎng)有限責(zé)任公司計(jì)量中心, 貴州,貴陽 550000)
隨著信息化技術(shù)的發(fā)展,物聯(lián)網(wǎng)技術(shù)日益受到重視,諸多專家學(xué)者在監(jiān)測與預(yù)警方面進(jìn)行了研究,主要包括社會風(fēng)險的監(jiān)測預(yù)警、燃?xì)夤艿赖谋O(jiān)測預(yù)警以及不同行業(yè)風(fēng)險的監(jiān)測預(yù)警。大多數(shù)的風(fēng)險監(jiān)測預(yù)警都是采用簡單的閾值預(yù)警方式,難以在早起階段快速做出反應(yīng)。部分專家[1-3]利用STM32采集監(jiān)測數(shù)據(jù),實(shí)現(xiàn)簡單的數(shù)據(jù)存儲異常報警功能。還有部分專家[4-6]提出在監(jiān)測的過程中建立監(jiān)測點(diǎn),通過對多個監(jiān)測點(diǎn)的實(shí)時數(shù)據(jù)的監(jiān)測,實(shí)現(xiàn)關(guān)鍵情況的判斷,建立監(jiān)測點(diǎn)監(jiān)測預(yù)警模型。也有部分專家學(xué)者[7-9]考慮了監(jiān)測對象的狀態(tài),認(rèn)為不同的監(jiān)測對象應(yīng)考慮的情況是不同的,所以提出了實(shí)時動態(tài)監(jiān)測模型,但是對于動態(tài)的監(jiān)測更多的是停留在理論層面上。由此可知,目前在風(fēng)險的動態(tài)監(jiān)測預(yù)警方面普遍結(jié)合物聯(lián)網(wǎng)技術(shù),但是動態(tài)監(jiān)測更多的是從理論層面上驗(yàn)證可行性,實(shí)際應(yīng)用性仍需要摸索。因此,本研究在物聯(lián)網(wǎng)監(jiān)測數(shù)據(jù)的基礎(chǔ)上,利用模糊控制算法優(yōu)化隨機(jī)森林方法,建立模糊隨機(jī)森林模型,實(shí)現(xiàn)風(fēng)險的動態(tài)監(jiān)測預(yù)警。
數(shù)據(jù)的動態(tài)監(jiān)測預(yù)警結(jié)果主要是由采集終端、邊緣計(jì)算和云平臺組成。其中,采集終端主要是由傳感器感知數(shù)據(jù),邊緣計(jì)算是由智能網(wǎng)關(guān)對感知的數(shù)據(jù)進(jìn)行處理,最后通過云平臺,利用模糊隨機(jī)森林算法建立監(jiān)測預(yù)警模型,實(shí)現(xiàn)信息的可視化。整體架構(gòu)如圖1所示。
圖1 整體架構(gòu)
隨機(jī)森林算法是一種集成學(xué)習(xí)的方法。隨機(jī)森林是由多顆CART樹組成的強(qiáng)學(xué)習(xí)器,通過統(tǒng)計(jì)所有弱學(xué)習(xí)器的輸出,得到預(yù)測結(jié)果,對缺失特征不敏感,與其他機(jī)器學(xué)習(xí)算法相比,隨機(jī)森林算法泛化能力更強(qiáng),準(zhǔn)確率更高[10-12]。模糊控制算法基于模糊數(shù)學(xué),以模糊集合理論、模糊語言和模糊邏輯為基礎(chǔ),通過語言變量和模糊條件語句等方法,將自然語言轉(zhuǎn)換成對應(yīng)規(guī)則,基于這些規(guī)則對系統(tǒng)進(jìn)行控制[13-15]。
本研究將模糊控制算法和隨機(jī)森林算法結(jié)合,設(shè)計(jì)一種動態(tài)監(jiān)測預(yù)警方法。該方法將隨機(jī)森林模型中特征重要度較高的數(shù)據(jù)作為模糊控制算法的輸入,通過模糊控制算法獲得基于專家經(jīng)驗(yàn)的風(fēng)險斷結(jié)果,然后將獲得的結(jié)果替代隨機(jī)森林模型中特征重要度較低的數(shù)據(jù),從而減少輸入數(shù)據(jù)中的干擾信息,提高輸入數(shù)據(jù)與風(fēng)險等級的相關(guān)性。以優(yōu)化后的數(shù)據(jù)作為隨機(jī)森林模型的輸入進(jìn)行訓(xùn)練,獲得模糊-隨機(jī)森林模型,進(jìn)而得到風(fēng)險預(yù)警等級。模糊-隨機(jī)森林算法的結(jié)構(gòu)如圖2所示。
圖2 算法結(jié)構(gòu)
算法整體執(zhí)行的步驟如下。
Step 1 將無線傳感器采集到的數(shù)據(jù)進(jìn)行預(yù)處理,實(shí)現(xiàn)數(shù)據(jù)格式轉(zhuǎn)換、去除冗余數(shù)據(jù)。
Step 2 實(shí)現(xiàn)數(shù)據(jù)的歸一化處理,設(shè)定xo為歸一化結(jié)果,xk為當(dāng)前數(shù)據(jù),xmin為樣本數(shù)據(jù)的最小值,xmax為樣本數(shù)據(jù)的最大值,公式如下:
(1)
Step 3 將數(shù)據(jù)分為訓(xùn)練集和測試集兩部分,對模型進(jìn)行訓(xùn)練,得到隨機(jī)森林模型的屬性重要度和預(yù)測數(shù)值。
Step 4 根據(jù)屬性重要度實(shí)現(xiàn)數(shù)據(jù)的模糊化處理。
Step 5 將處理后的數(shù)據(jù)進(jìn)行模型的輸入,得到最終的模型預(yù)測效率和數(shù)據(jù)特征重要度。
將數(shù)據(jù)集以7∶3的比例劃分為訓(xùn)練集和測試集,數(shù)據(jù)集共計(jì)400條。將數(shù)據(jù)集放入模型進(jìn)行大范圍的訓(xùn)練,利用訓(xùn)練后的模型實(shí)現(xiàn)風(fēng)險的預(yù)測,并確定數(shù)據(jù)對隨機(jī)森林模型預(yù)測結(jié)果的重要度特征。將本研究提出的模糊-隨機(jī)森林模型和傳統(tǒng)的隨機(jī)森林模型進(jìn)行比對,驗(yàn)證不同模型預(yù)測的準(zhǔn)確率,模型對比效果如圖3所示。
圖3 模型的對比效果
同時,比較了模糊-隨機(jī)森林模型、MLP神經(jīng)網(wǎng)絡(luò)模型和SVM模型在測試集中的效果,將數(shù)據(jù)分為10組,如表1和圖4所示。通過比較可知,模糊-隨機(jī)森林模型相較其他模型的預(yù)測準(zhǔn)確率情況。
表1 模型準(zhǔn)確率對比數(shù)據(jù)表
圖4 比較分析
通過比較分析可知,模糊-隨機(jī)森林的準(zhǔn)確率平均為82.7%,MLP神經(jīng)網(wǎng)絡(luò)模型的準(zhǔn)確率為78.3%,SVM模型的準(zhǔn)確率為76%。由此可知,模糊-隨機(jī)森林模型的準(zhǔn)確率相對較高。
本研究利用物聯(lián)網(wǎng)技術(shù),將無線傳感器和邊緣計(jì)算、云平臺充分結(jié)合,通過智能化的手段和方法實(shí)現(xiàn)風(fēng)險的監(jiān)測預(yù)警,并在風(fēng)險分析的過程中建立模糊-隨機(jī)森林模型,實(shí)現(xiàn)風(fēng)險的有效識別。通過實(shí)驗(yàn)對比可知,模糊-隨機(jī)森林模型與傳統(tǒng)的隨機(jī)森林模型相比,算法的準(zhǔn)確率得到了提升,具有一定的實(shí)際應(yīng)用性。