熊紅偉,鄭進
(1.中冶智誠(武漢)工程技術有限公司,湖北 武漢 430080; 2.湖北省國土測繪院,湖北 武漢 430010)
水汽是地球大氣中的重要組成部分,GPS測站天頂方向上大氣中水汽全部凝結(jié)成水降落所產(chǎn)生的降雨量又被稱為可降水量(PWV)。地基GPS遙感大氣可降水量,有著探測精度高、全天候和高時空分辨率,能夠有效地彌補常規(guī)氣象探測水汽的不足。在獲取GPS可降水量的基礎上對不同氣候和不同地區(qū)的數(shù)據(jù)進行分析,可以作為氣象預報的有力補充。因此可降水量的短期預測,對天氣預報有著重要的意義。
天氣系統(tǒng)是一個隨時間和空間劇烈變化的非線性系統(tǒng),數(shù)學和物理方法難以描述,要準確地預測GPS可降水量有一定的難度。由于神經(jīng)網(wǎng)絡對非線性函數(shù)有著很好的逼近能力,自Robret利用人工神經(jīng)網(wǎng)絡預測降雨量以來[1],國內(nèi)外研究主要集中在預測的模型[2~12]和GPS數(shù)據(jù)處理的精度[13~15]。由于大氣可降水量受到時空環(huán)境影響以及現(xiàn)有預測模型自身的局限性,無法高精度實時地對其進行預測。本文正是針對可降水量的這一特點以及現(xiàn)有模型的局限性,利用小波神經(jīng)網(wǎng)絡對非線性函數(shù)超強的逼近能力和遺傳算法較強的全局搜索能力,建立遺傳小波神經(jīng)網(wǎng)絡預測GPS可降水量。
預測就是利用數(shù)學理論和方法,通過歷史數(shù)據(jù)建立數(shù)學模型,利用近期數(shù)據(jù)作為測試數(shù)據(jù)并推理驗證,用于解決未來趨勢問題。假定未來的觀測值和過去的觀測值之間存在一定的函數(shù)關系[6],即
x(t)=f(x(t-1),x(t-2),…,x(t-n))
(1)
通過構(gòu)造這一函數(shù),來預測后續(xù)的觀測值,可見預測問題可以轉(zhuǎn)換成函數(shù)逼近問題。如果一個函數(shù)的自變量的個數(shù)為n,問題進一步可轉(zhuǎn)化為在n+1維空間構(gòu)造一個超曲面函數(shù)。通過對歷史的觀測數(shù)據(jù)反復擬合,構(gòu)造一個函數(shù)f使得觀測值與期望值之間按照一定的準則達到最優(yōu),進而求解f的參數(shù)。
BP神經(jīng)網(wǎng)絡由于其強大的自學習能力以及不需知道輸入與輸出之間的具體關系,就可以以較高的精度逼近非線性函數(shù),所以在時間序列的應用上十分廣泛。但是,BP神經(jīng)網(wǎng)絡的激勵函數(shù)并不正交,神經(jīng)網(wǎng)絡在進行學習時收斂的速度相當慢,同時BP神經(jīng)網(wǎng)絡在部分參數(shù)的選取上沒有理論的指導,在局部極值的地方將導致迭代不收斂和過擬合?;谝陨先秉c,相關學者在神經(jīng)網(wǎng)絡算法的基礎上,為了對其改進,將小波分析的時頻局部化和多尺度分析能力引進到神經(jīng)網(wǎng)絡算法中,即將小波分析與神經(jīng)網(wǎng)絡進行結(jié)合,得到的小波神經(jīng)網(wǎng)絡具備了小波分析的時頻局域化特點和人工神經(jīng)網(wǎng)絡的自學習能力,有效地改善了傳統(tǒng)的BP神經(jīng)網(wǎng)絡算法的局限性。目前使用最為廣泛的小波神經(jīng)網(wǎng)絡算法是緊致型的小波神經(jīng)網(wǎng)絡算法,將小波函數(shù)代替人工神經(jīng)網(wǎng)絡的隱含層函數(shù),同時用小波基函數(shù)的尺度參數(shù)與平移參數(shù),將神經(jīng)網(wǎng)絡輸入層到隱含層的權值及閾值進行替換。該算法在參數(shù)和激勵函數(shù)的選取上更具備理論的指導意義,以更快的收斂速度和逼近能力進行高精度的預測。
圖1 小波神經(jīng)網(wǎng)絡模型
雖然小波神經(jīng)網(wǎng)絡(WNN)相比較于BP神經(jīng)網(wǎng)絡在參數(shù)的選取上有很大的改善,但是在網(wǎng)絡的初始權值參數(shù)選取方面,多數(shù)基于經(jīng)驗模型沒有理論指導;在學習算法上,WNN是直接根據(jù)誤差能量函數(shù)采用梯度下降算法來調(diào)整網(wǎng)絡連接權值和伸縮平移尺度,所以在迭代過程中受局部極值的影響導致訓練結(jié)束后預測的結(jié)果出現(xiàn)不同程度的差異[7]。如果直接使用該算法預測GPS可降水量,得到的結(jié)果在實際GPS可降水量預測中的應用往往不理想。
遺傳算法是一種模擬遺傳機制和生物進化理論的并行隨機搜索最優(yōu)方法,按照選擇的適應度函數(shù)并通過遺傳中的選擇、交叉和變異對個體進行篩選,使得適應度好的個體被保留,在多點隨機并行的搜索下尋找適合群體的最優(yōu)解,以此來抵抗震蕩效應和參數(shù)收斂到局部最優(yōu)解上。
神經(jīng)網(wǎng)絡的學習算法可以表示為,在一個樣本集S=(xi,yi),i=1,2,…P,其中P為樣本數(shù),從中尋找一個參數(shù)集,使得能量函數(shù)E最小
(2)
最陡梯度下降算法調(diào)整權值參數(shù)公式為:
(3)
(4)
(5)
(6)
其中η和α分別為學習速率與動量因子。
顧及遺傳算法的全局搜索能力,利用該能力來確定伸縮和平移尺度參數(shù)以及權值和閾值。訓練過程分為初次訓練和二次訓練。
初次訓練為:
(1)對初始種群進行編碼,主要包括wij,wlj,aj,bj參數(shù)進行編碼,編碼的方法采用實數(shù)編碼,使得每一個個體均為一個實數(shù)串;并在此過程中初始化進化的次數(shù)、種群規(guī)模、交叉概率Pc和變異概率Pm等參數(shù);
(2)適應度函數(shù),根據(jù)個體得到WNN的初始權值和閾值,由訓練后得到的預測輸出yl和期望輸出dl之間的誤差絕對值和計算誤差函數(shù)E:
(7)
(3)遺傳操作,選擇若干適應度最大的個體直接繼承給下一代,采用“輪盤賭”選擇方法進行種群的選擇操作,每個個體的選擇概率pi為
(8)
其中N為種群個體數(shù)目。同時以概率Pc和Pm完成交叉和變異操作,最后產(chǎn)生新的下一代個體。
(4)將新的個體插入到種群P中得到新種群,并計算新個體的適應度值,如果達到了指定的條件,則結(jié)束,否則轉(zhuǎn)到操作(3)。
(5)反復迭代到滿足收斂條件以后,將最終種群里面的最優(yōu)個體解碼作為網(wǎng)絡連接權、伸縮和平移參數(shù)。
二次訓練為:在初次訓練得到參數(shù)的基礎之上使用WNN的最陡梯度下降算法進行二次優(yōu)化訓練,將兩次訓練得到參數(shù)作為遺傳小波神經(jīng)網(wǎng)絡模型的最終參數(shù)對GPS可降水量進行預測。
為了驗證GWNN預測GPS可降水量的能力,利用高精度GPS解算軟件GAMIT,對香港地區(qū)的衛(wèi)星定位參考網(wǎng)站(SatRef)2017年第157天的觀測數(shù)據(jù)進行解算,通過在解算時引入WUHN、BJFS、URUM、三個長于 500 km的站點獲得絕對的天頂對流層延遲量。另外為了保證獲得的GPS可降水量值與實時的溫度、氣壓和濕度等大氣參數(shù)保持一致,在解算GPS可降水量時引入各自站點的氣象數(shù)據(jù)文件(met)。選用最終星歷,采用松弛解(RELAX)模式,衛(wèi)星截止高度角為10°,降低由于外部參數(shù)和衛(wèi)星軌道誤差的選取對GPS可降水量解算結(jié)果造成的影響,另外在數(shù)據(jù)處理過程中還對天線相位中心偏差、海潮負荷改正、大氣潮和非潮汐的大氣負荷改正。
每分鐘提取一個GPS可降水量值可以更加精細地反映GPS反演可降水量的細節(jié)信息。得到的結(jié)果發(fā)現(xiàn),在0:00~10:00由于大氣參數(shù)因素的影響,GPS可降水量值變化相當劇烈,最大時相鄰兩個歷元的差值有 12.64 mm,平均偏差為 4.26 mm;10:00以后抖動量相對平緩,最大時相鄰兩個歷元的差值為 1.92 mm,平均偏差為 0.52 mm。針對GPS可降水量的這一特點,實現(xiàn)天氣變化短期的預報,對不同時間段的GPS可降水量分別進行預測,選取以下兩種不同的方案進行試驗:
方案一:選取該天11:00~14:00每分鐘的GPS可降水量值共240個,選用前 180 min的數(shù)據(jù)為建模數(shù)據(jù),預測后續(xù) 60 min的GPS可降水量值。
方案二:選取該天凌晨4:00~8:00每分鐘的GPS可降水量值共240個,選用前 180 min的數(shù)據(jù)為建模數(shù)據(jù),預測后續(xù) 60 min的GPS可降水量值。
為了對建立的GWNN模型進行對比分析,分別選用WNN和BP神經(jīng)網(wǎng)絡模型同時進行預測。選用均方根誤差(RMS)、殘差的最大值和最小值等指標進行外符合精度的評定,RMS計算公式為
(9)
(10)
考慮文章篇幅,現(xiàn)選取HKON站點的數(shù)據(jù),使用BP神經(jīng)網(wǎng)絡和WNN模型預測的數(shù)據(jù)與本文提出的GWNN模型預測的數(shù)據(jù)進行比較。
由表1,就BP神經(jīng)網(wǎng)絡與WNN模型比較可知,WNN在RMS上有 0.27 mm的改善,平均誤差降低了 0.30 mm,可見在預測的精度和擬合程度上WNN要優(yōu)于BP神經(jīng)網(wǎng)絡;但是這種優(yōu)勢并不明顯,WNN最大絕對誤差為 1.89 mm,最大相對誤差為3.96%,均高于BP神經(jīng)網(wǎng)絡,因此WNN雖然在模型的整體精度上有一定的提高,但是預測的穩(wěn)定性卻不如BP神經(jīng)網(wǎng)絡。理論上,訓練好的WNN可預測復雜的時間序列問題,但是WNN模型是結(jié)合了小波分析通過調(diào)節(jié)尺度參數(shù)放大局部信號,如果在參數(shù)的選擇上不夠合理,訓練好的WNN仍然不能很好地對非線性系統(tǒng)的GPS可降水量進行預報。而本文提出的GWNN模型在GPS可降水量預測的精度與穩(wěn)定性均優(yōu)于其他兩種模型,最大絕對誤差為 0.82 mm,RMS為 0.29 mm。
方案一殘差結(jié)果統(tǒng)計表 表1
圖2給出了三種模型預測結(jié)果的殘差情況,圖2(a)在總體上呈現(xiàn)一定的偏離,說明了BP神經(jīng)網(wǎng)絡對實時GPS可降水量的預測并不敏感,該模型不能很好地擬合水汽的短時期變化。從圖2(a)和圖2(b)可知,WNN殘差基本上以零為中心跳動,說明了WNN能夠在一定程度上擬合GPS可降水量;且前兩種模型在前 20 min預測的效果好。從圖2整體上來看,GWNN模型在前 20 min預測的效果與另外兩種模型預測的效果相當,在后續(xù)的 40 min預測上雖然殘差逐漸變大,但是仍能與原始GPS可降水量序列很好地保持一致。
圖2 方案一預測結(jié)果殘差圖
方案一對GPS可降水量變化程度不明顯的時刻進行了預測,得出GWNN相對于WNN在預測精度、穩(wěn)定性以及預測的時長都有很大的提高,但是該預測仍然停留在GPS可降水量較為穩(wěn)定的情況,不能代表短時期強對流天氣帶來GPS可降水量劇烈的變化,然而GPS可降水量劇烈的變化對于短時數(shù)值預測又是非常重要的,因此方案二在方案一的基礎上,就GWNN預測PWV在氣壓、溫度和濕度等大氣參數(shù)造成的GPS可降水量抖動明顯的情況繼續(xù)進行分析。
由表2可知,對GPS可降水量抖動明顯的情況下進行預測,WNN模型相對于BP神經(jīng)網(wǎng)絡模型在預測的精度上有一定的改進,但是在 60 min的預測上RMS仍然為 3.11 mm;無法很好地滿足實時的水汽預測要求,且在預測的穩(wěn)定性方面依然無法得到很好的改善,WNN模型預測的最大絕對誤差為 7.85 mm,最大相對誤差為15.92%,均高于BP神經(jīng)網(wǎng)絡模型??梢娪捎赪NN模型自身的小波分析功能的影響,使得這一特點在GPS可降水量變化劇烈的情況下表現(xiàn)得更為明顯。而本文建立的GWNN模型,網(wǎng)絡參數(shù)預測得到的RMS為 2.19 mm,在WNN模型的基礎上有 0.92 mm提高。在預測的穩(wěn)定性上,相比較于另外兩種模型也均有不同程度的改善。
方案二殘差結(jié)果統(tǒng)計表 表2
圖3 方案二預測結(jié)果殘差圖
圖3給出了在方案二下,3種模型預測結(jié)果的殘差圖。從圖3可以看出GWNN模型預測的效果明顯得優(yōu)于其他兩種方法。圖中存在部分由3種方法預測結(jié)果的殘差都偏大的點,這一方面與氣壓、溫度和濕度等大氣參數(shù)有關,若以理論推導 2.5 HPa的氣壓變化能導致實時解算GPS可降水量值有 1 mm的變化,因此外部參數(shù)的變化是影響預測精度的一個重要誤差源;另一方面是由于3種模型均是基于神經(jīng)網(wǎng)絡的模型進行預測,因此在趨勢上保持著一致性。同時圖3(a)、圖3(b)中前 30 min部分的效果均要優(yōu)于后半部分,可見隨著預測步長的增加模型預測的誤差逐漸增大。而圖3(c)中雖然在后半部分的預測上有一定的偏大,但是總體上仍然優(yōu)于前面兩種模型,可以保持良好的穩(wěn)定性。說明了GWNN模型可以在一定時間內(nèi)抵抗由于隨著預測步長增加而帶來預測偏差。
本文針對水汽變化劇烈這一特點以及BP神經(jīng)網(wǎng)絡和小波神經(jīng)網(wǎng)絡對GPS可降水量預測的局限性,采用遺傳算法優(yōu)化小波神經(jīng)網(wǎng)絡預測GPS可降水量。分別從預測的精度、穩(wěn)定性以及預測的步長等方面對三種模型進行比較,對得到的結(jié)果進行了合理的評價。通過實驗發(fā)現(xiàn),建立的GWNN模型在現(xiàn)有模型的基礎上有很大的改進,能適用于PWV變化劇烈的情況。同時本文對三種不同的模型在GPS可降水量預測的結(jié)果上亦進行了分析,發(fā)現(xiàn)采用GWNN模型預測GPS可降水量的一些特點,這些結(jié)論對今后的短時天氣預測將有著一定的指導作用,而提出的GWNN模型也是一種數(shù)值天氣預報新方法。在后續(xù)的研究中將對該模型在暴雨、臺風等短時期的強對流天氣情況下進行分析。