馮 嶺,宋 文 輝,陳 繼 坤
(華北水利水電大學 信息工程學院,河南 鄭州 450046)
干旱是降水或河川徑流異常引起的水分短缺現(xiàn)象[1],而旱災是世界上危害最廣泛、最嚴重的自然災害之一[2]。中國地處典型季風氣候區(qū),旱災的影響尤為突出[3]。據(jù)《中國水旱災害公報》統(tǒng)計,中國農(nóng)作物平均年成災面積近年來呈現(xiàn)出逐年增長的態(tài)勢,從20世紀50年代的531.7萬hm2,迅速增長至 90 年代的1 384.2萬hm2。每年因旱災損失糧食基本維持在300多億kg,造成的工農(nóng)業(yè)直接經(jīng)濟損失近千億元[4]。因此,如何在旱災發(fā)生前進行災情風險評估,準確預測災情的發(fā)生,保障糧食安全,是干旱相關工作者需迫切展開的工作。
傳統(tǒng)的旱災風險等級評估方法大多是通過定義各種指標對旱災的風險等級進行評價。在指標方面,張偉杰等[5]基于標準化降水指數(shù)SPI,分別以月尺度、季節(jié)尺度、半年尺度、年尺度對內(nèi)蒙古達茂草原近56 a間的干旱演變與趨勢特征進行分析;聶明秋等[6]采用非參數(shù)法以渭河流域為研究對象,構(gòu)建了綜合干旱指數(shù),分析了渭河流域綜合干旱的演變規(guī)律,結(jié)合干旱風險因子探究風險的動態(tài)演變特征;任怡等[7]利用水資源供求指數(shù)、綜合干旱指數(shù)對陜西省干旱時空分布進行了分析。
以上基于指標的方法通常只能對已發(fā)生干旱的強度進行分析,而無法對未來旱災發(fā)生的可能性和風險等級進行預測。隨著機器學習方法的發(fā)展,將多源數(shù)據(jù)與機器學習算法相結(jié)合已經(jīng)成為當前旱災風險等級評估的一個重要趨勢,多元線性回歸[8]、遺傳算法[9]、人工神經(jīng)網(wǎng)絡[10]等機器學習模型和算法被用于對旱災的風險等級進行評估。在這方面,F(xiàn)ung等[11]基于改進的支持向量回歸模型,對馬來西亞蘭加特河流域下游的農(nóng)業(yè)干旱進行預測;Djerbouai等[12]使用小波神經(jīng)網(wǎng)絡和隨機模型,對北阿爾及利亞地區(qū)進行了干旱預測預報;Seibert等[13]通過比較3種不同的統(tǒng)計方法,即多元線性回歸模型、人工神經(jīng)網(wǎng)絡模型、隨機森林回歸樹模型,對水文干旱進行季節(jié)性預報;Khan等[14]利用支持向量機(Support Vector Machine,SVM)、人工神經(jīng)網(wǎng)絡和K近鄰算法對巴基斯坦進行了干旱建模分析。盡管上述方法可以在一定程度上對未來發(fā)生的干旱風險進行預測和評估,但在這些方法中考慮的影響旱災風險的因素較為單一,并沒有將干旱影響因素與實際旱災風險關聯(lián)起來。
針對已有旱災風險等級評估方法的不足,本研究旨在基于歷史旱情文本數(shù)據(jù)和氣象數(shù)據(jù),建立一種數(shù)據(jù)驅(qū)動的短期旱災風險等級評估方法。首先,對旱情文本進行預處理,提取干旱等級標簽;其次,選取多個影響干旱的氣象因素,通過深度學習算法來挖掘氣象數(shù)據(jù)與歷史災情之間的關系;最后,建立基于數(shù)據(jù)驅(qū)動的多源多模態(tài)旱災風險等級評估模型,以對未來發(fā)生旱災的風險等級進行評估。以此可在旱災發(fā)生前對旱災進行預警,降低旱災造成的負面影響,減少國家的經(jīng)濟損失。
河南省是中國的糧食與農(nóng)業(yè)大省,而旱災對河南省的影響尤為強烈。鄭州市位于河南省中部偏北,地處南北氣候過渡帶,常年平均降水量為628 mm,降水量的年際變化大,年內(nèi)分布不均勻。地形和氣候的2個過渡帶決定了鄭州市旱澇災害會頻繁發(fā)生[15],故選擇河南省境內(nèi)的鄭州市作為實例來研究旱災風險。
研究區(qū)的氣象數(shù)據(jù)來源于中國氣象資料共享服務網(wǎng)(http:/cdc.cma.gov.cn/)河南省縣級以上區(qū)域18個氣象站1951~2020年的逐月氣象資料。
研究區(qū)文本數(shù)據(jù)來源于《中國氣象災害大典(河南卷)》干旱災害篇章中的災情記錄文本。該文本中,記錄了河南省地區(qū)從公元前1804年到公元2000年的歷史旱災。2000年以后的標簽以河南省水利廳、農(nóng)業(yè)廳發(fā)布的新聞報道為主,輔以網(wǎng)絡報道期刊數(shù)據(jù)等。
基于上述2個數(shù)據(jù)集,以鄭州市為例,根據(jù)1951~2017年的氣象數(shù)據(jù)和災情記錄文本數(shù)據(jù),對2018~2020年的旱災風險等級進行了預測評估,最后對2021年旱災情況進行了預測。
旱災風險評估主要是實現(xiàn)對未來可能發(fā)生旱災的風險等級進行評估。在該方法中,綜合考慮到了多種風險因素,比如:降水量、氣溫、平均相對濕度以及平均水汽壓等,融合了氣象監(jiān)測數(shù)據(jù)和旱情歷史文本數(shù)據(jù);并基于機器學習和深度學習算法,構(gòu)建了旱災風險等級評估模型,以對未來一段時間內(nèi)發(fā)生旱災的可能性和嚴重程度進行評估。該模型的主要實現(xiàn)流程如圖1所示。
旱災風險等級評估的主要流程包括以下4個部分:① 旱災風險等級評估模型訓練集的構(gòu)建;② 基于支持向量機的旱災風險等級評估模型的訓練;③ 基于長短期記憶神經(jīng)網(wǎng)絡(Long Short Term Memory Networks,LSTM)的未來氣象特征值預測;④ 基于支持向量機的未來旱災風險等級的評估。
(1) 基于氣象監(jiān)測數(shù)據(jù)和旱情歷史文本數(shù)據(jù),篩選可能對旱災發(fā)生具有影響的氣象特征,并抽取歷史旱災的風險等級標簽,構(gòu)建用于進行旱災風險評估模型的訓練數(shù)據(jù)集。
(2) 基于旱災訓練數(shù)據(jù)集,采用SVM分類算法,對旱災風險等級評估模型進行訓練。
(3) 對于已有的氣象特征數(shù)據(jù),采用LSTM預測其未來一段時間的特征值。
圖1 旱災風險等級評估技術路線示意Fig.1 Technical roadmap for drought risk assessment
(4) 將LSTM得到的一系列未來特征值,加載到訓練好的旱災風險等級評估模型,從而對未來可能發(fā)生的旱災風險等級進行評估。
1.3.1構(gòu)建旱災訓練數(shù)據(jù)集
為了獲得有效的旱災風險等級評估模型,首先需要構(gòu)建旱災風險等級評估的訓練數(shù)據(jù)集。數(shù)據(jù)集包括標簽集和特征集2個部分。對于標簽集,基于歷史災情記錄、國家或地區(qū)的干旱災害統(tǒng)計報告等文本數(shù)據(jù),采用文本抽取方法從中來抽取相應的旱災等級標簽。對于特征集,基于氣象監(jiān)測數(shù)據(jù)中的相關指標,從中篩選出用于旱災風險等級評估的主要特征。
(1) 標簽抽取。對于標簽集,基于歷史災情記錄、國家或地區(qū)的干旱災害統(tǒng)計報告等文本數(shù)據(jù),通過文本抽取和統(tǒng)計分析的方法,抽取各個城市歷年發(fā)生的旱情信息,以用于構(gòu)建特征集對應的旱災風險等級標簽。標簽抽取的流程如圖2所示。
圖2 標簽抽取流程Fig.2 Label extraction process
根據(jù)歷史災情文本,應首先構(gòu)建地名詞典以及干旱詞典;然后,采用正則表達式以及模板匹配法對干旱災情文本中的時間、地點以及干旱等級進行識別和抽取,以形成結(jié)構(gòu)化的旱災風險等級標簽;最后,對抽取的標簽進行人工校驗,以保證所抽取標簽的準確性。標簽抽取的流程共包含以下3個步驟。
步驟1:構(gòu)建地名詞典和旱災風險等級詞典。在歷史災情文本中,通常采用“省、市、縣”3個不同大小的粒度來表述旱災發(fā)生的范圍。對此,將城市作為研究粒度,即將“縣”轉(zhuǎn)換為對應的“市”。為了獲得“省”“縣”與“市”之間的關系,定義了地名詞典。此外,根據(jù)歷史災情文本中對災情的相關描述,從描述的嚴重程度以及當年的旱情實際情況,將旱災風險劃分為5個等級:正常、輕旱、中旱、重旱、特旱,并構(gòu)建干旱等級詞典,以用于旱災風險等級標簽的抽取。
步驟2:基于地名詞典和旱災風險等級詞典,采用正則表達式和模式匹配法,從歷史災情文本中抽取旱災發(fā)生的時間、城市以及旱災的風險等級。在經(jīng)過程序自動抽取后,為了保證所抽取標簽信息的質(zhì)量,對抽取的標簽進行人工校驗。
步驟3:將抽取的結(jié)構(gòu)化標簽保存為csv文件,以方便計算機讀取。圖3給出了標簽抽取結(jié)果的示例圖,由圖3可以看出,每一條標簽記錄的格式為〈時間,城市,月份,旱災風險等級〉。例如,〈1949,商丘,3,2〉表示1949年3月商丘發(fā)生了中度干旱。
圖3 標簽抽取結(jié)果示例Fig.3 Sample image of label extraction results
(2) 特征集構(gòu)建。通過對歷史災情文本的抽取,得到用于構(gòu)建旱災風險等級評估模型的標簽集合。但為了構(gòu)建完整的旱災風險等級評估模型,還需要獲得與旱災風險等級標簽有關聯(lián)的特征。將氣象指標作為候選特征集,然后基于隨機森林算法對各個指標的重要性進行計算,并將重要度較高的前k個指標用于構(gòu)建旱災風險等級評估模型,所采用的候選氣象指標如表1所列。
表1 旱災風險等級評估候選特征集Tab.1 Candidate feature set for drought risk assessment
表1中的指標的具體含義及其與旱災的關系描述如下。
降水是影響干旱的重要因素,常見的干旱預報系統(tǒng)大多是依據(jù)降水量來對未來的干旱進行預測。例如,春播期降水量偏少,極易造成春旱。除此之外,在現(xiàn)有的干旱指標中,如標準化降水指數(shù)(SPI)、帕爾默干旱指數(shù)(PDSI)、地表水供給指數(shù)(SWSI)等都將降水量作為衡量干旱的主要因素;高溫少雨會直接導致干旱的發(fā)生,尤其是夏季持續(xù)的高溫天氣會造成土壤水分大量蒸發(fā)、土壤墑情變差,導致十分嚴重的干旱。因此,可以考慮把氣溫作為評估旱災風險等級的特征之一;氣壓跟天氣有密切的關系,一般來說,地面上高氣壓的地區(qū)往往是晴天,地面上低氣壓的地區(qū)往往是陰雨天。氣壓通過影響天氣,從而影響干旱。
風速與水分蒸發(fā)有著密切的關系,風可將蒸發(fā)物表面飽和度較高的空氣吹走。因此,風速越大,水分蒸發(fā)越快,造成土壤失墑,導致干旱的發(fā)生;濕度越大,空氣中含有的水汽越接近于飽和水汽壓,也越容易形成凝結(jié),從而形成降水影響干旱;日照與干旱有著一定關系。氣候干旱的地區(qū),常年是晴朗天氣,日照時數(shù)就多。熱帶雨林氣候區(qū)常年陰雨天氣,日照時數(shù)就少。因此,日照時長與干旱存在一定的關聯(lián);水汽壓與降水量之間存在線性關系,與蒸發(fā)快慢也有著密切的關系。白天溫度高,蒸發(fā)快,進入大氣的水汽多,水汽壓就大;夜間情況相反。因此,水汽壓也是影響干旱的一個重要因素。
對于以上候選特征,采用隨機森林算法[16],基于袋外誤差(OOB)理論來判斷每個特征在隨機森林中的每棵樹上的貢獻度,從而計算各個特征的重要度,并將排名前k個特征作為用于構(gòu)建旱災風險等級評估模型的特征。對于任意特征x的特征重要度Ix的計算公式如下:
(1)
式中:N代表訓練樣本的個數(shù),ROOB1表示決策樹對袋外數(shù)據(jù)進行分類,統(tǒng)計的正確分類的個數(shù);ROOB2為決策樹對擾動后的袋外數(shù)據(jù)進行分類,統(tǒng)計的正確分類個數(shù)[17]。如果加入擾動后,袋外數(shù)據(jù)準確率大幅度下降,說明這個特征對于樣本的預測結(jié)果有很大影響,進而說明重要程度比較高。
(3) 標簽與特征的融合。 基于篩選出的用于構(gòu)建旱災風險等級評估模型的特征以及從歷史災情記錄文本中抽取的標簽,將表示同一城市同一時間的特征和標簽進行融合,從而構(gòu)成完整的旱災訓練數(shù)據(jù)集,所構(gòu)建的旱災訓練集的示例如表2所列。
表2 訓練數(shù)據(jù)集示例Tab.2 Example of training data set
1.3.2基于SVM的旱災風險等級評估模型
根據(jù)前文中得到的訓練數(shù)據(jù)集,采用分類算法來構(gòu)建旱災風險等級評估模型,并對模型中的未知參數(shù)進行訓練。常見的分類算法包括K近鄰[18]、決策樹[19]、樸素貝葉斯[20]、支持向量機[21]等。其中,基于支持向量機的分類算法具有較好的學習泛化能力,可以解決非線性、高維數(shù)、局部極小點等分類中存在的問題。因此,本研究采用支持向量機分類器對旱災預測模型進行訓練,其訓練過程如圖4所示。
圖4 基于SVM的旱災風險等級評估模型Fig.4 Drought risk assessment model based on SVM
支持向量機算法的基本思想是在特征空間上找到最佳的分離超平面,使得訓練集上正、負樣本的間隔最大。假設訓練數(shù)據(jù)集中的訓練樣本為(x1,y1),(x2,y2),……,(xi,yi),xi為用于進行旱災風險等級評估的特征向量,yi為旱災風險等級標簽。對于線性可分的情況,支持向量機分類算法需要找到一個超平面,使2個異類支持向量到超平面的距離之和最大。
然而,由于訓練樣本往往不是線性可分的,因此,通常需要將樣本從原始空間映射到一個更高維的特征空間中,使得樣本在這個特征空間內(nèi)線性可分,從而找到一個合適的劃分超平面。樣本數(shù)據(jù)經(jīng)過高位映射后的超平面可以表示為
f(x)=wTφ(xi)+b
(2)
式中:w為加權(quán)向量,φ(xi)為映射函數(shù),b為偏差。尋找超平面的過程即求優(yōu)化問題的最優(yōu)解過程,所得到的最優(yōu)化問題是:
(3)
通過拉格朗日乘子法將原問題轉(zhuǎn)化為對偶問題求解,即可得到用于旱災風險等級評估的SVM分類器。
1.3.3基于LSTM的未來特征值預測
基于支持向量機分類算法得到旱災風險等級評估模型后,當給定一組與旱災相關的特征時,可基于這組特征對當前的旱災風險等級進行評估。但為了對未來可能存在的旱災風險進行預測,需要對未來的特征值即未來m個時刻的降水量、氣溫、水汽壓等進行預測。鑒于在旱災風險等級評估模型中采用的特征都為時序型特征,因此,可以采用時間序列模型對未來時刻的特征值進行預測。
長短期記憶神經(jīng)網(wǎng)絡[22]是一種常見的時間序列預測模型,它可以學習長期依賴信息,是當下比較流行的循環(huán)神經(jīng)網(wǎng)絡。近年來,隨著深度學習的不斷發(fā)展,LSTM已經(jīng)在語音識別、機器翻譯、負荷預測、交通流量預測等眾多不同領域成功應用。由于該模型具有良好的時序預測能力,因此,可采用LSTM對旱災相關特征未來m個時刻的特征值進行預測。LSTM單元結(jié)構(gòu)如圖5所示。
圖5 LSTM單元結(jié)構(gòu)示意Fig.5 LSTM unit structure diagram
LSTM 3個重要的門中,遺忘門ft決定了上一時刻的單元狀態(tài)有多少保留到當前時刻;輸入門it決定了當前時刻網(wǎng)絡的輸入有多少保存到單元狀態(tài);輸出門ot決定了控制單元狀態(tài)有多少輸出到 LSTM 的當前輸出值,gt代表輸入單元?!伴T”以及輸入單元的計算公式如下。
遺忘門:
ft=σ(Wfx·xt+Wfh·ht-1+bf)
(4)
輸入門:
it=σ(Wixxt+Wihht-1+bi)
(5)
輸入單元:
gt=φ(Wgxxt+Wghht-1+bg)
(6)
輸出門:
ot=σ(Wox·xt+Woh·ht-1+bo)
(7)
輸出:
ht=φ(gt?it+ct-1?ft)?ot
(8)
式中:Wgx,Wgh等是權(quán)重矩陣,b是偏置項,σ表示sigmod激活函數(shù),φ表示tanh激活函數(shù)?!伴T”實際上就是一層全連接層,它的輸入是一個向量,輸出是一個0~1的實數(shù)向量,通過“門”來決定保留哪些信息。
由LSTM的原理可知,對于時序型數(shù)據(jù),LSTM可通過“門”來記憶有用的信息,對數(shù)據(jù)未來值進行預測。旱災風險評估研究中用于構(gòu)建模型的氣象數(shù)據(jù)均為時序數(shù)據(jù)。因此,對于選取的每個特征可采用LSTM來預測其未來一段時間的特征值。本文基于LSTM建立了適用于氣象特征預測的深度學習預測模型,得到每個特征未來一段時間的特征值后,將預測的特征值輸入到之前完成訓練的旱災風險等級評估模型中,即可對未來可能發(fā)生的旱災風險等級進行評估。為了驗證本研究中旱災風險等級評估模型的有效性,將通過算例對所提出的方法進行分析驗證。
旱災訓練集的構(gòu)建包括標簽集構(gòu)建和特征集構(gòu)建2個部分。
(1) 標簽構(gòu)建。為準確提取河南省歷史干旱情況,基于《中國氣象災害大典(河南卷)》干旱災害篇史料記載,根據(jù)上文標簽抽取方法,將災情劃分特大干旱、嚴重干旱、中度干旱、輕度干旱和正常5個等級,分別用數(shù)字4,3,2,1,0來表示(若對應城市當年未記錄發(fā)生旱災,則標記為正常)。抽取的旱災風險等級標簽以月為粒度,當旱災災情記錄文本中以季節(jié)來表述旱情情況時,將季節(jié)轉(zhuǎn)換為對應的月。以鄭州市為例,將1951~2011年的鄭州歷史旱災發(fā)生情況以月為單位進行標簽抽取,從而得到732條標簽數(shù)據(jù)。本研究在抽取過程中所用到的地名詞典以及干旱等級詞典分別如表3和表4所列。
表3 地名詞典Tab.3 Gazetteer
表4 干旱等級詞典Tab.4 Dictionary of drought levels
(2) 特征篩選。對于表1中所列的候選特征集,采用隨機森林算法計算各個特征的重要性,并按照重要度從大到小進行排序,得到了重要度最高的前6個特征,如表5所列。
表5 重要度最高的前6個特征Tab.5 The top 6 most important features
將這6個特征作為構(gòu)建旱災風險等級評估模型的特征?;诤Y選出的構(gòu)建旱災風險等級評估模型的特征,以及從歷史災情記錄文本中抽取的標簽,將表示同一城市同一時間的特征和標簽進行融合,從而構(gòu)成完整的旱災訓練數(shù)據(jù)集。
基于得到的旱災訓練數(shù)據(jù)集,采用支持向量機分類算法構(gòu)建旱災風險等級評估模型,并對模型中的未知參數(shù)進行訓練。在該算例中,分別選擇線性核、多項式核、高斯核作為SVM分類器的核函數(shù),采用10折交叉驗證法對旱災風險等級評估模型進行訓練,在訓練過程中對SVM分類器的參數(shù)C和gamma進行調(diào)參優(yōu)化。其中,C是懲罰系數(shù),即對誤差的寬容度,C越高,對誤差要求越嚴格,容易出現(xiàn)過擬合;C越小,越容易出現(xiàn)欠擬合。gamma決定了數(shù)據(jù)映射到新的特征空間后的分布,gamma越大,則用于分類的支持向量越少;gamma值越小,則用于分類的支持向量越多。在訓練過程中,不斷地對參數(shù)C和gamma進行調(diào)參優(yōu)化,最終得出核函數(shù)選取線性核且C=0.9時,SVM分類器在訓練數(shù)據(jù)集上的效果最好,即可得到所需的旱災風險等級評估模型。
為了對未來的旱災風險等級進行預測,對于每一個用于構(gòu)建旱災風險等級評估模型的特征,如降水量、氣溫、水汽壓等。首先,采用LSTM來預測該特征在未來m個時刻的特征值。在該算例中,基于LSTM模型,用前11個月的特征值來預測第12個月的特征值。例如,根據(jù)鄭州市前11個月的氣溫,預測第12個月的氣溫,并在下一步將得到的第12個月的特征值加載訓練好的旱災風險等級評估模型中,從而對未來1個月的旱災風險等級進行評估。
為了驗證LSTM在未來特征值預測上的效果,選用1951~2000年共50 a鄭州市的各個特征值的逐月數(shù)據(jù),來構(gòu)建LSTM模型,并對2001~2013年的每個月的特征值進行預測,預測曲線如圖6所示。
圖6 6種特征預測曲線Fig.6 Six characteristic prediction curves
為了判斷預測結(jié)果優(yōu)劣,選取平均絕對誤差(MAE)和決定系數(shù)(R2)作為評價指標。表6是對特征預測的評價,其中,平均絕對誤差表示預測誤差,數(shù)值越小表示預測精度越高;決定系數(shù)表示擬合優(yōu)度,數(shù)值在0~1區(qū)間,數(shù)值越接近于1表示擬合越好。
(9)
(10)
通過圖6的特征預測曲線以及表6中列出的特征預測指標評價結(jié)果可以看出:對于選取的構(gòu)建旱災風險評估模型的6個特征,基于LSTM的特征值預測結(jié)果與真實值較為接近。在誤差方面,平均絕對誤差數(shù)值相對較?。辉跀M合優(yōu)度方面,預測特征中有一半特征決定系數(shù)在0.90以上。因此,采用LSTM網(wǎng)絡模型對各個特征的未來值進行預測是可行的。
表6 特征預測指標評估Tab.6 Evaluation of feature prediction indicators
通過LSTM預測得到了每個月的特征值,再將其加載到旱災風險等級評估模型中,即可對每個月的旱災風險等級進行評估。對于旱災研究,在災情記錄文本中多以季節(jié)為單位來記錄旱災的發(fā)生情況。因此,將以月為單位記錄的旱災風險等級合并為以季節(jié)為單位的旱災風險等級,并以當季最高的旱災風險等級作為本季的旱災風險等級。表7給出了對2018年冬到2020年秋的旱災風險等級評估結(jié)果。
表7 旱災風險等級評估結(jié)果Tab.7 Forecast results of drought risk levels
通過表7可以得出:在評估2 a的情況下,預測準確率為75%,證明本研究對于旱災風險等級評估具有一定效果。另外,若將預測結(jié)果分為兩類(正常與干旱)時,準確率會進一步提升到87.5%。結(jié)果顯示:鄭州市在2019年和2020年春季干旱較為嚴重,將預測的結(jié)果與歷史資料中記載的真實結(jié)果進行比較,發(fā)現(xiàn)旱災風險等級預測結(jié)果基本符合歷史實際情況。另外,對2020年夏季預測結(jié)果進行誤差分析,推測可能由于降水量預測小于實際值,且日照時長大于實際值導致最終誤差。
本文基于歷史旱情文本數(shù)據(jù)和氣象數(shù)據(jù),提出了一種新的旱災評估思路,建立了數(shù)據(jù)驅(qū)動的多源多模態(tài)旱災風險等級評估模型。通過對未來一段時間內(nèi)可能發(fā)生的旱災風險等級進行評估,可以得到如下結(jié)論。
(1) 氣象數(shù)據(jù)可與文本災情數(shù)據(jù)相結(jié)合,用于旱災風險等級評估;
(2) 結(jié)合多種機器學習算法的優(yōu)勢,構(gòu)建了旱災風險等級評估模型,證明了大數(shù)據(jù)分析方法可用于研究旱災問題;
(3) 算例評估結(jié)果顯示,研究區(qū)春季干旱較為嚴重,基本符合實際情況。
此外,在初始選取評估特征時,考慮了氣象、水文、墑情等多方面因素。但由于數(shù)據(jù)較難獲取,僅基于氣象特征來構(gòu)建模型,可能由于風險因素不夠全面,影響評估結(jié)果的準確性。隨著旱災風險因素的相關數(shù)據(jù)獲取難度降低,采用此方法將得到更為準確的評估結(jié)果。