摘? 要:文章研究利用改進(jìn)的機(jī)器學(xué)習(xí)理論與算法,建立針對森林火險(xiǎn)因子大數(shù)據(jù)的深度約簡機(jī)制,旨在對現(xiàn)有森林火險(xiǎn)預(yù)警模型中重要的火險(xiǎn)因子進(jìn)行過濾和修正,以更為充分地剔除規(guī)模較大的火險(xiǎn)因子大數(shù)據(jù)中冗余的、無效的數(shù)據(jù),并且利用改進(jìn)的人工魚群算法對過濾約簡得到的關(guān)鍵火險(xiǎn)因子進(jìn)行補(bǔ)償修正。為基于大數(shù)據(jù)的、有效的森林火險(xiǎn)預(yù)測預(yù)防方法及對策奠定重要基礎(chǔ)。
關(guān)鍵詞:森林火險(xiǎn)因子;機(jī)器學(xué)習(xí);大數(shù)據(jù)
中圖分類號:TP181? ? ? ?文獻(xiàn)標(biāo)識碼:A 文章編號:2096-4706(2020)01-0086-02
Abstract:A deep reduction mechanism for forest fire risk factor big data is established to filter and correct the important fire risk factors in the existing forest fire risk warning model using the improved machine learning theory and algorithm in this paper,which is aimed at eliminating the redundant and invalid data with large scale in the fire risk factor big data more fully. Meanwhile,a modified artificial fish swarm algorithm is used to compensate and correct the key fire risk factors obtained by the filter reduction. It lays an important foundation for effective forest fire risk prediction prevention methods and countermeasures based on big data.
Keywords:forest fire risk factor;machine learning;big data
1? 研究背景
隨著大數(shù)據(jù)時(shí)代的來臨,森林火險(xiǎn)預(yù)警系統(tǒng)需要分析的森林火險(xiǎn)因子數(shù)據(jù)逐漸增多。如何聚類這些火險(xiǎn)因子并分析其對于森林火險(xiǎn)的影響程度,對森林火險(xiǎn)的預(yù)測準(zhǔn)確度以及火勢發(fā)展趨勢等都尤為關(guān)鍵。由于數(shù)據(jù)龐大、干擾數(shù)據(jù)眾多,在建立森林火災(zāi)預(yù)警模型之前,對各類火險(xiǎn)因子的數(shù)據(jù)分析與處理就顯得尤為關(guān)鍵。本文采用灰色關(guān)聯(lián)分析與模糊集理論,研究利用改進(jìn)算法的神經(jīng)網(wǎng)絡(luò)建立針對森林火險(xiǎn)因子大數(shù)據(jù)的深度約簡機(jī)制,旨在從橫向和縱向?qū)痣U(xiǎn)因子進(jìn)行過濾和修正,利用多種機(jī)器學(xué)習(xí)算法建立深度約簡機(jī)制。人工神經(jīng)網(wǎng)絡(luò)具有自組織、自學(xué)習(xí)和泛化能力,無需考慮數(shù)學(xué)模型的內(nèi)部結(jié)構(gòu)、不需假設(shè)前提條件和人為地確定因子權(quán)重就可對林火等非線性現(xiàn)象的任意非線性函數(shù)進(jìn)行逼近和模擬。但是處理大數(shù)據(jù)時(shí),神經(jīng)網(wǎng)絡(luò)自身易陷于最小化和收斂速度慢的情境。因此,新時(shí)期應(yīng)在前人研究的基礎(chǔ)上,結(jié)合當(dāng)今的計(jì)算機(jī)科學(xué)技術(shù)和各種類型的大數(shù)據(jù),為森林火險(xiǎn)的預(yù)警建立動(dòng)態(tài)改良的機(jī)制,提高森林火災(zāi)預(yù)測的準(zhǔn)確率,為開展生態(tài)安全防護(hù)工作提供更加豐富的對策支撐,使因森林火災(zāi)造成的損失最小化。
在大數(shù)據(jù)時(shí)代,各行各業(yè)為了適應(yīng)新的需要,都已經(jīng)在建立專業(yè)的大數(shù)據(jù)的對策方面開展相關(guān)工作。林業(yè)相關(guān)部門也已經(jīng)提出建立建成森林、濕地、荒漠等林業(yè)資源大數(shù)據(jù)采集、分析、預(yù)測和應(yīng)用的一體化林業(yè)智慧決策機(jī)制。充分發(fā)揮大數(shù)據(jù)的作用,深化林業(yè)智慧決策機(jī)制的建立意義,實(shí)現(xiàn)森林、濕地、荒漠等林業(yè)資源大數(shù)據(jù)的預(yù)測和分析應(yīng)用是未來的研究重點(diǎn),也是森林防火研究的實(shí)際應(yīng)用價(jià)值所在。
2? 研究現(xiàn)狀
森林火險(xiǎn)預(yù)警是一個(gè)集不同影響因素于一體的復(fù)雜機(jī)制,森林火險(xiǎn)因子大數(shù)據(jù)為其主要研究對象。目前對森林火險(xiǎn)預(yù)警模型研究主要也集中在森林火險(xiǎn)因子大數(shù)據(jù)分析技術(shù)的開發(fā)與研究上。我國在森林火險(xiǎn)預(yù)警方面的研究起步較晚,但發(fā)展迅速。隨著科技的進(jìn)步與發(fā)展,我國的森林火災(zāi)預(yù)警的研究仍然在不斷開拓與完善。尤其在基于森林火險(xiǎn)因子大數(shù)據(jù)分析的預(yù)警機(jī)制研究上已經(jīng)取得了一定的成果。
國內(nèi)對森林火險(xiǎn)因子大數(shù)據(jù)技術(shù)的分析研究中,大部分學(xué)者都認(rèn)為濕度、溫度和風(fēng)速是影響林火發(fā)生的三個(gè)主要的火險(xiǎn)氣象因子,并對相關(guān)的氣象因子在林火預(yù)測中的權(quán)重進(jìn)行分析[1];還有一些學(xué)者以森林植被類型和林地面積資料等相關(guān)因子為基礎(chǔ),進(jìn)行各區(qū)域的森林火險(xiǎn)劃分;還有運(yùn)用衛(wèi)星遙感獲取到的火點(diǎn)位置信息與氣象數(shù)據(jù)來推演火災(zāi)的動(dòng)態(tài)變化(蔓延方向、火燒面積及強(qiáng)度)的研究[2];此外,一些先進(jìn)國家已經(jīng)形成的成熟技術(shù),比如加拿大森林火險(xiǎn)氣候指數(shù)(Fire Weather Index,F(xiàn)WI),也被用來研究我國森林火災(zāi)的等級劃分,已經(jīng)得到了較好的研究成果[3]。除了這些可檢測到的森林綠度和氣象因子,還有因吸煙、祭祀等野外用火以及農(nóng)耕、生產(chǎn)用火等人為影響的火險(xiǎn)因子的相關(guān)研究也有報(bào)道[4]。事實(shí)上,我國對于森林火災(zāi)預(yù)警模型的指標(biāo)體系還沒有完全形成,本文也希望建立一種改進(jìn)的神經(jīng)網(wǎng)絡(luò)模型,并對各類火險(xiǎn)因子進(jìn)行聚類與篩選,以提高預(yù)警模型的預(yù)測精度。
在處理規(guī)模較大的數(shù)據(jù)時(shí),粗糙集理論能夠識別和抽取出其中隱含的、潛在的、有意義、有價(jià)值的數(shù)據(jù),去掉冗余的、無效的數(shù)據(jù)?;诖耍S多學(xué)者利用粗糙集理論對預(yù)處理神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)進(jìn)行簡化,以提高神經(jīng)網(wǎng)絡(luò)算法的預(yù)測率。但是這些研究只考慮到了縱向維度的約簡,即各類指標(biāo)對預(yù)測結(jié)果的影響,而忽略了橫向維度的數(shù)據(jù)。對輸入數(shù)據(jù)的約簡并不徹底,仍然會出現(xiàn)部分無關(guān)的、冗余的數(shù)據(jù),這樣可能會造成人工神經(jīng)網(wǎng)絡(luò)出現(xiàn)過度學(xué)習(xí)等情況,從而影響模型的預(yù)測精度。
由此可見,雖然許多專家與學(xué)者運(yùn)用各種數(shù)據(jù)挖掘方法對森林火險(xiǎn)因子大數(shù)據(jù)分析各個(gè)方面進(jìn)行研究,但是對于各種類的火險(xiǎn)因子的收集以及篩選的研究略顯不足。而且大多選用人工智能對森林火險(xiǎn)進(jìn)行預(yù)警的研究,都沒有進(jìn)行模型參數(shù)的選擇分析與優(yōu)化。因此,本文對森林火險(xiǎn)因子大數(shù)據(jù)深度約簡機(jī)制的探討具有很強(qiáng)的理論與現(xiàn)實(shí)意義。
3? 研究機(jī)制
3.1? 重要的火險(xiǎn)因子的過濾機(jī)制
在森林火險(xiǎn)預(yù)警系統(tǒng)中,影響森林火險(xiǎn)的因子眾多。如果將這些火險(xiǎn)因子全部導(dǎo)入預(yù)測模型中,會造成模型的冗余、運(yùn)行速度變慢以及預(yù)測精度下降等問題。所以模型進(jìn)行預(yù)測之前,大數(shù)據(jù)的預(yù)處理與因子篩選是一項(xiàng)重要的工作。在可燃物因子、氣象因子、火源以及火災(zāi)歷史數(shù)據(jù)等火險(xiǎn)因子中,有不少火險(xiǎn)因子在預(yù)測劃分森林火險(xiǎn)等級時(shí)具有相關(guān)性。本文可以通過灰色相關(guān)分析與模糊集理論篩選出在特定區(qū)域或環(huán)境下具有代表性的火險(xiǎn)因子。這樣通過小部分的參數(shù)就可以對森林火險(xiǎn)進(jìn)行有效預(yù)警,以提高模型的準(zhǔn)確度。在保持信息的決策能力不變的前提下,可以剔除輸入大數(shù)據(jù)中不必要的一些數(shù)據(jù)來建立動(dòng)態(tài)有效的森林火險(xiǎn)因子體系。
3.2? 關(guān)鍵火險(xiǎn)因子的補(bǔ)償修正機(jī)制
在特定區(qū)域或環(huán)境下具有代表性的火險(xiǎn)因子通常具有不同程度的相關(guān)性。通過將人工魚群算法中魚群初始化方式、視野和步長以及擁擠度因子的適用于過濾得到的火險(xiǎn)因子的研究,可以得到改進(jìn)的人工魚群算法。采用改進(jìn)的人工魚群算法對反向傳播神經(jīng)網(wǎng)絡(luò)的初始權(quán)值閾值進(jìn)行全局尋優(yōu),再用尋優(yōu)后的權(quán)值閾值建立反向神經(jīng)網(wǎng)絡(luò),對篩選過濾得到火險(xiǎn)因子進(jìn)行相關(guān)性補(bǔ)償修正。修正后的火險(xiǎn)因子輸入系統(tǒng)后可以有效降低恒定的預(yù)警誤差。
3.3? 預(yù)警模型參數(shù)選擇的分析優(yōu)化機(jī)制
通過對BP(Back Propagation,反向傳播)神經(jīng)網(wǎng)絡(luò)模型的參數(shù)選擇進(jìn)行分析,得出最合適的參數(shù)組合進(jìn)神經(jīng)網(wǎng)絡(luò)的模型訓(xùn)練。針對神經(jīng)網(wǎng)絡(luò)在面對大數(shù)據(jù)量,特別是高維輸入矢量時(shí)收斂速度較慢并且容易陷入局部極值的缺陷,采用遺傳算法、模擬退火算法等進(jìn)行全局搜索,找出基于本項(xiàng)目數(shù)據(jù)的優(yōu)化初始權(quán)值與閾值,并建立優(yōu)化的人工神經(jīng)網(wǎng)絡(luò)模型,對森林火險(xiǎn)進(jìn)行預(yù)警并進(jìn)行危險(xiǎn)等級的劃分。由此,我們得到基于深度約簡后的森林火險(xiǎn)預(yù)警模型火險(xiǎn)因子體系,建立基于優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)的森林火險(xiǎn)預(yù)警機(jī)制。
4? 結(jié)? 論
在大數(shù)據(jù)時(shí)代,林業(yè)相關(guān)部門已經(jīng)提出建立建成森林、濕地、荒漠等林業(yè)資源大數(shù)據(jù)采集、分析、預(yù)測和應(yīng)用的一體化林業(yè)智慧決策平臺。本文利用機(jī)器學(xué)習(xí)算法從多個(gè)維度深度剔除了冗余的森林火險(xiǎn)因子,并建立了深度約簡機(jī)制。不同于現(xiàn)有利用粗糙集理論對預(yù)處理神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)進(jìn)行獨(dú)立簡化的方法,本文考慮了輸入火險(xiǎn)因子數(shù)據(jù)之間的相關(guān)性,采用灰色關(guān)聯(lián)分析、模糊集理論以及人工魚群算法對各火險(xiǎn)因子大數(shù)據(jù)進(jìn)行更為徹底的剔除,同時(shí)利用遺傳算法,改良處理大數(shù)據(jù)時(shí)神經(jīng)網(wǎng)絡(luò)自身易陷于最小化和收斂速度慢的缺點(diǎn),對模型的參數(shù)選擇進(jìn)行分析優(yōu)化。過濾和修正后的數(shù)據(jù)輸入經(jīng)過優(yōu)化后的神經(jīng)網(wǎng)絡(luò),可以更加動(dòng)態(tài)有效地預(yù)測森林火險(xiǎn)。
參考文獻(xiàn):
[1] 梁慧玲,林玉蕊,楊光,等.基于氣象因子的隨機(jī)森林算法在塔河地區(qū)林火預(yù)測中的應(yīng)用 [J].林業(yè)科學(xué),2016,52(1):89-98.
[2] 李曉戀.基于MODIS數(shù)據(jù)的多因子協(xié)同作用下森林火災(zāi)預(yù)測監(jiān)測研究 [D].合肥:中國科學(xué)技術(shù)大學(xué),2016.
[3] 高德民,林海峰,劉云飛,等.基于無線傳感網(wǎng)的森林火災(zāi)FWI系統(tǒng)分析 [J].林業(yè)科技開發(fā),2015,29(1):105-109.
[4] 徐虹,程晉昕,余凌翔.基于GIS的云南省森林火險(xiǎn)區(qū)劃研究 [J].中國林業(yè)產(chǎn)業(yè),2016(10):199-202.
作者簡介:陳俊雹(1990.02-),男,漢族,江蘇南京人,就職于信息技術(shù)學(xué)院,講師,博士,主要研究方向:機(jī)器學(xué)習(xí)、信息安全和激光感知技術(shù)。