摘要:本研究旨在通過Beta-SARMA時間序列模型捕捉安徽省降水模式,為農(nóng)業(yè)產(chǎn)出、灌溉需求和農(nóng)民福祉提供可靠數(shù)據(jù)支持。該模型在傳統(tǒng)SARIMA模型的基礎上,結(jié)合廣義線性回歸,并將殘差設定為Beta分布。研究發(fā)現(xiàn),皖中和皖南地區(qū)的降水數(shù)據(jù)殘差符合高斯分布,而皖北地區(qū)則表現(xiàn)出不同的分布模式。Beta-SARMA模型在預測性能上普遍優(yōu)于傳統(tǒng)SARIMA模型,顯示出更高的準確性和可靠性。
關鍵詞:降水量預測;廣義線性回歸;Beta-SARMA模型;R語言
降水預測在全球范圍內(nèi)被視為一個至關重要的研究領域,其對農(nóng)業(yè)、水資源管理以及整個社會經(jīng)濟活動產(chǎn)生著深遠的影響。隨著氣候變化的加劇和極端天氣事件的頻繁發(fā)生,準確的降水預測變得越來越重要,以便各國政府和相關機構(gòu)能夠及時采取適當?shù)膽獙Υ胧?。近年來,科學家們已經(jīng)采用了多種創(chuàng)新方法來提高降水預測的準確性。例如,王永濤等人開發(fā)的中長期降水預測模型就是一次重要嘗試。該模型利用小波分解技術結(jié)合預測重建過程,有效提取了降水數(shù)據(jù)中的關鍵特征,從而改善了預測的準確度[1]。另一方面,郭楠和王兆才采用了結(jié)合了麻雀搜索優(yōu)化算法的BP神經(jīng)網(wǎng)絡和馬爾可夫鏈,這種組合模型能夠更好地處理降水的非線性變化[2]。此類發(fā)現(xiàn)不僅在理論上有重要意義,也為實際的水資源管理和應急響應提供了實用的指導。
安徽省在地理上屬于華東地區(qū),處于暖溫帶過渡地區(qū),以淮河為分界線,北部屬暖溫帶半濕潤季風氣候,南部屬亞熱帶濕潤季風氣候。安徽省南北兩部的代表性城市的歷年降水量數(shù)據(jù)對研究安徽省降雨變化特征對農(nóng)作物產(chǎn)量預報及因地制宜指導農(nóng)業(yè)生產(chǎn)有著重要的意義[3-5]。
1 材料與方法
1.1 數(shù)據(jù)資料
選用的降雨量數(shù)據(jù)來源于歷年安徽省統(tǒng)計年鑒,收集了2000—2021年共計22年的安徽省16市(巢湖市不做分析)逐月降雨量資料,2000—2020年為訓練數(shù)據(jù)集,2021年為驗證集。
1.2 研究方法Beta-SARMA模型
時間序列分析廣泛應用在按時間順序收集的數(shù)據(jù)上,ARIMA模型是一個著名的時間序列分析模型,在降雨預測中起十分重要的作用[6],ARIMA模型由自回歸(AR)部分、積分(I)部分和移動平均(MA)三部分組成。然而,需要注意的是,ARIMA模型基于對數(shù)據(jù)的高斯(正態(tài))分布假設。這意味著它們假定數(shù)據(jù)遵循一個鐘形曲線,而這不一定適用于所有類型的數(shù)據(jù)。特別是對于那些季節(jié)性是由隨機過程引起的數(shù)據(jù)集,ARIMA模型可能不太適用。在這種情況下,廣義線性回歸給出了另一種使用非高斯模型的辦法,這種模型可以有效處理數(shù)據(jù)中的隨機機制驅(qū)動的季節(jié)性,并更好地捕捉數(shù)據(jù)背后的機制[7]。Beta-SARMA模型[8]是一個動態(tài)類的時間序列模型衍生自貝塔回歸模型。Beta-SARMA[9]模型集成了隨機季節(jié)、自回歸和移動平均動力學三個組成部分。假設是n個隨機變量的向量,對于每一個服從一個β分布,模型的表達式為:
這里的,是模型的自回歸和移動平均的系數(shù),而和是季節(jié)性自回歸和移動平均的系數(shù)。P和q分別是模型的自回歸部分和移動平均部分的階數(shù),P和Q分別是描述季節(jié)自回歸部分和季節(jié)移動平均部分的階數(shù),S表示季節(jié)性頻率。
1.3 均方根誤差(RMSE)
在進行時間序列分析和預測時,評估模型的預測準確性是至關重要的。為此,研究者經(jīng)常使用各種誤差指標來量化模型的預測能力。其中,均方根誤差[10](RMSE)是最常用的評價指標之一,因為它綜合考慮了所有預測誤差,并提供了一個易于解釋的單一值。均方根誤差(RMSE)計算公式為:
2 結(jié)果與分析
考慮到安徽省的地理和氣候特征[11],本研究將全省的16個城市依據(jù)地理位置劃分為三個主要區(qū)域:淮河以北(包括宿州、淮北、蚌埠、阜陽、亳州五市)、江淮之間(合肥、淮南、安慶、六安、滁州五市)以及長江以南(黃山、蕪湖、馬鞍山、銅陵、宣城、池州六市)。選擇了三個具有代表性的城市—安慶、亳州、黃山進行深入展示與分析。
2.1 模型建立及檢驗
Beta-SARMA模型的構(gòu)建基于對殘差行為采用Beta分布,這要求將原始降雨量數(shù)據(jù)轉(zhuǎn)換至(0,1)的范圍內(nèi)。圖1清晰展示了安慶、亳州和黃山三市在2000—2020年,經(jīng)過此轉(zhuǎn)換處理的降雨量數(shù)據(jù)時間序列。在時間序列分析中,若序列的均值與方差隨時間保持恒定,則稱該序列為平穩(wěn)的。使用ADF檢驗來測試三個城市的降雨量數(shù)據(jù)是否平穩(wěn),檢驗結(jié)果為所有城市的P值均低于0.05的臨界值,這表明安慶、亳州和黃山的降雨數(shù)據(jù)滿足平穩(wěn)性需求。
圖2展示了安慶、亳州和黃山三市降雨量的自相關系數(shù)圖(ACF)和偏自相關系數(shù)圖(PACF)。安慶市的ACF圖在初期顯示顯著的非季節(jié)性峰值,而季節(jié)性成分在滯后12處表現(xiàn)突出。亳州市的ACF和PACF圖則顯示明顯的季節(jié)性和非季節(jié)性成分。黃山市的數(shù)據(jù)呈現(xiàn)初期的非季節(jié)性顯著峰值及季節(jié)性成分的周期性特征,表明三市降雨量時間序列中存在非季節(jié)性和季節(jié)性波動。
在確定了所有可能的非季節(jié)性自回歸(p)和移動平均(q)成分,以及季節(jié)性自回歸(P)和移動平均(Q)成分的組合后,使用R軟件并通過AIC準則選擇了每個城市的最佳Beta-SARMA模型。表1列出了三市最佳Beta-SARMA模型及其參數(shù)估計值。表1中的Ljung-Box[12]檢驗結(jié)果表明,Beta-SARMA模型成功擬合了安慶市和黃山市的降雨量數(shù)據(jù),而亳州市的Ljung-Box檢驗P值顯著小于0.05,表明該模型未能有效捕捉亳州市的降雨模式。
2.2 模型預測
表2詳細展示了2021年三個城市的實際降水量與Beta-SARMA模型預測值之間的對比。
從表2可以看出,得出Beta-SARMA模型在這三個城市的均方根誤差(RMSE)分別為0.07276、0.14838和0.11514。與之形成對比的是,采用傳統(tǒng)SARIMA模型在同一時間段內(nèi)的預測結(jié)果,其均方根誤差分別為0.07758、0.12996和0.11514。特別值得注意的是,在安慶市和黃山市,Beta-SARMA模型展現(xiàn)出的預測精度明顯優(yōu)于傳統(tǒng)SARIMA模型,這一發(fā)現(xiàn)凸顯了在特定氣候和地理條件下,Beta-SARMA模型的高效性和適應性。
深入分析三市原始降水數(shù)據(jù)揭示了一些關鍵的地理和氣候特征。亳州市的月均降水量較低,其數(shù)據(jù)分布頻繁出現(xiàn)低于下四分位數(shù)的情況。這可能是由于亳州市地處淮河以北的平原區(qū)域,該地區(qū)降水量普遍偏低,導致數(shù)據(jù)呈現(xiàn)出顯著的偏態(tài)分布。此類偏態(tài)分布的數(shù)據(jù)對于線性模型的預測挑戰(zhàn)較大,不適合簡單的線性擬合。相比之下,安慶市和黃山市月均降水量均超過100 mm,降水量較為豐富。在這兩個城市中,Beta-SARMA模型通過將降雨量數(shù)據(jù)有效地轉(zhuǎn)換至(0,1)[13]區(qū)間,顯著提高了預測的準確性,從而在預測性能上超越了傳統(tǒng)SARIMA模型。
此外,對安徽省其余13個市近20年的月降水量數(shù)據(jù)進行深入分析,采用R語言挑選出適合各個城市的最佳Beta-SARMA模型,并利用auto.arima函數(shù)自動選擇最合適的SARIMA模型。這些模型的12期預測結(jié)果與實際降水量數(shù)據(jù)對比后得出的均方根誤差(RMSE)如表3所示。結(jié)果顯示,Beta-SARMA模型在合肥、安慶、六安等11個城市的預測中表現(xiàn)優(yōu)異,其中10個城市位于皖中和皖南地區(qū)。
3 結(jié)論
采用Beta-SARMA時間序列模型對安徽省十六個市的降水進行預測,主要發(fā)現(xiàn):通過自相關系數(shù)圖(ACF)、偏自相關系數(shù)圖(PACF)和Ljung-Box檢驗分析Beta-SARMA模型的殘差,皖中和皖南地區(qū)的降水數(shù)據(jù)殘差似乎符合高斯分布,而皖北地區(qū)則不然。這可能與皖北為暖溫帶半濕潤大陸性氣候,年降水量較少且集中在夏季有關;而皖南為亞熱帶濕潤氣候,年降水量豐富,特別是夏季降水充沛,表明Beta-SARMA模型更適用于降水量較大的區(qū)域。與SARIMA模型的RMSE誤差估計對比,Beta-SARMA模型在多數(shù)情境下顯示出明顯更高的預測精度,驗證了其優(yōu)越性能。
參考文獻
[1] WANG Y,Liu J,LI R,et al.Medium and long-term precipitation prediction using wavelet
decomposition-prediction-reconstruction model[J].
Water Resources Management,2022,36(3):971-987.
[2] GUON,WANG Z.A combined model based on sparrow
search optimized BP neural network and Markov chain
for precipitation prediction in Zhengzhou City,China[J].
AQUA-Water Infrastructure,Ecosystems and Society,2022,71(6):782-800.
[3] 朱國良,嚴韜,秦糧朋等.安徽省旱澇受災時空特征及與降水關系研究[J].安徽農(nóng)業(yè)大學學報,2020,47(6):971-978.
[4] 張夢瑤,鄭謙.長三角城市群農(nóng)業(yè)信息化發(fā)展水平測度[J].安徽科技學院學報,2022,36(3):97-102.
[5] 魏新彥,劉穎,張俊飚.氣候智慧型農(nóng)業(yè)項目能否抑制農(nóng)業(yè)碳排放——來自安徽氣候智慧型主要糧食作物生產(chǎn)項目的經(jīng)驗證據(jù)[J].浙江農(nóng)業(yè)學報,2023,35(3):676-687.
[6] 咬登魁,段功豪.基于季節(jié)性SARIMA模型的武漢市長序列降雨量趨勢分析與預測[J].地下水,2022,44(2):166-168.
[7] 李莎,林暉.結(jié)合MLR和ARIMA模型的時空建模及預測[J].計算機工程與應用,2021,57(13):276-282.
[8] SHAD M,SHARMA Y D,NARULA P.Forecasting
Southwest Indian Monsoon Rainfall Using the Beta Seasonal
Autoregressive Moving Average(β SARMA)Model[J].Pure and Applied Geophysics,2023,180(1):405-419.
[9] BAYER FM,CINTRA RJ,CRIBARI-NETOF.Beta
seasonal autoregressive moving average models[J].Journal
of Statistical Computation and Simulation,2018,88(15):2961-2981.
[10] 吳雪梅,劉志強,張?zhí)忑?,?雙模型結(jié)合進一步降低預測均方根誤差和均方根相對誤差的方法[J].分析化學,2015,43(5):754-758.
[11] 鄭基超;倪澤強.安徽融入長三角研究——基于生態(tài)環(huán)境和基礎設施建設視角[J].時代金融,2019(23):45-47.
[12] 聶巧平,孫淇銘.時間序列模型的Ljung-Box檢驗的發(fā)展與應用綜述[J].統(tǒng)計與管理,2022,37(4):101-107.
[13] 張春華;高鐵梅;陳飛.經(jīng)濟時間序列頻率轉(zhuǎn)換方法的研究與應用[J].統(tǒng)計研究,2017,34(2):92-100.