杜言霞,林輝陽,汪月霞,溫繼昌
摘 要:暴雨是世界上最主要的災(zāi)害之一,每年都會給國民經(jīng)濟和人民的生命財產(chǎn)造成巨大的損失。但是,暴雨預(yù)報是非常困難的,造成這種情況的根本原因是對大氣環(huán)流短時間的突變和強對流天氣系統(tǒng)發(fā)生、發(fā)展的機理了解得非常少。這其中包括對大氣內(nèi)部的動力機制及其與外部環(huán)流之間相互作用的物理過程和熱帶、中緯度的各種天氣系統(tǒng)異常變化的機理,特別是對多尺度相互作用的研究還非常淺顯。假如忽略一些隨機因素的影響,大氣系統(tǒng)可以被認為是一個確定性的非線性系統(tǒng)。符號動力學(xué)是非線性科學(xué)的一個分支,有著深厚的理論基礎(chǔ),它已慢慢成為實際工作中所要掌握的工具之一。信息熵是信息論中最重要的物理量之一,它把非線性科學(xué)與統(tǒng)計學(xué)結(jié)合起來,已經(jīng)成為了一種分析非線性問題的重要工具。利用符號動力學(xué)和信息熵對暴雨過程進行研究具有一定的探索意義,通過分析大量暴雨過程的熵曲線,發(fā)現(xiàn)大部分暴雨過程在發(fā)生前10 d內(nèi),其熵值達到了極小值。這一征兆的發(fā)現(xiàn)表明,該方法在對暴雨事件進行監(jiān)測和預(yù)報方面具有一定的研究價值。
關(guān)鍵詞:符號動力學(xué);信息熵;暴雨;小波去噪
中圖分類號:P446 文獻標(biāo)識碼:A 文章編號:2095-6835(2014)21-0148-03
1 暴雨研究
暴雨預(yù)報是世界難題之一,根據(jù)《科學(xué)時報》登載,美國暴雨預(yù)報的準(zhǔn)確率是22%,中國僅為19%,暴雨研究引起了世界各地氣象科學(xué)家的重視,并且他們對此進行了大量的研究。目前,科學(xué)家的研究主要集中在監(jiān)測手段的事實分析、數(shù)值模擬和動力及熱力診斷等方面。隨著自動氣象站、風(fēng)廓線儀、雷達、衛(wèi)星等氣象監(jiān)測手段的不斷完善和氣象學(xué)理論的發(fā)展,暴雨中尺度系統(tǒng)發(fā)生和發(fā)展機理的研究也在日趨深入。暴雨研究概括起來主要集中在以下三個方面。
1.1 觀測研究和建立概念模型
從氣象科學(xué)的理論出發(fā),認為暴雨、洪澇、強風(fēng)暴、雷暴和龍卷風(fēng)等天氣現(xiàn)象經(jīng)常是中尺度對流系統(tǒng)(MCSs)造成的,弄清楚了MCSs的結(jié)構(gòu)和發(fā)生、發(fā)展機制,就能夠?qū)@些天氣現(xiàn)象做出合理的解釋和預(yù)測。中尺度對流系統(tǒng)的分析主要是利用衛(wèi)星云圖進行的,包括分析颮鋒云型、雷暴低層外流邊界、弧狀云線的形成、雷暴中高壓、云團的形成及其相互作用等。
1.2 數(shù)值模擬和分析診斷
這是目前氣象學(xué)的研究熱點,隨著研究的不斷深入,其理論也在不斷充實。簡要的講,數(shù)值模擬和分析診斷就是從目前的大氣狀態(tài)來看,通過求解支配大氣狀態(tài)演變的動力和熱力方程組,推導(dǎo)未來的大氣狀態(tài)。
1.3 動力分析和理論研究
從動力學(xué)的理論出發(fā),反演出具體天氣現(xiàn)象與物理參數(shù)的關(guān)系,或者總結(jié)出物理量隨天氣變化的規(guī)律。比如氣壓、浮力、潛熱釋放、能量變化等隨天氣的變化。
如果忽略一些隨機因素的影響,大氣系統(tǒng)可以被認為是一個確定性的非線性系統(tǒng),而非線性時間序列分析也成為了從觀測資料中探索復(fù)雜系統(tǒng)現(xiàn)象和揭示其物理本質(zhì)的強有力的工具。符號動力學(xué)是非線性科學(xué)的一個分支,在利用非線性時間序列揭示復(fù)雜系統(tǒng)物理本質(zhì)方面非常有效。信息熵是信息論中最重要的物理量之一,在非線性科學(xué)、統(tǒng)計力學(xué)和最優(yōu)信息處理等學(xué)科領(lǐng)域中被廣泛應(yīng)用。本文利用符號動力學(xué)對非線性時間序列進行分析,先對大氣可降水量原始數(shù)據(jù)的非線性時間序列進行預(yù)處理,包括插值和去噪;再利用符號動力學(xué)和信息熵分析暴雨過程。
2 時間序列的插值
常用的插值方法有最近鄰點插值、線性插值、立方插值和三次樣條插值。為了比較這幾種插值方法對大氣數(shù)據(jù)的插值效果,本文以成都地區(qū)2007-03-01—2010-03-31的可降水量時間序列為測試序列進行研究。該時間序列共4 508個數(shù)據(jù)點,其隔點采樣為2 254點,分別采用最近鄰點插值、線性插值、立方插值和三次樣條插值。為了直觀地比較插值結(jié)果,選100點作圖,插值時間序列與原始時間序列的比較如圖1所示,4種插值方法的絕對誤差比較如圖2所示。為了定量衡量插值效果,分別計算插值時間序列與原始時間序列的絕對誤差的均方根、平均值、方差和插值時間序列與原始時間序列的相關(guān)系數(shù),結(jié)果如表1所示,從圖1、圖2和表1中可知,三次樣條插值的精度最高。因此,在本文研究中,將選擇三次樣條插值方法對大氣時間序列進行插值。
圖1 4種插值法與原始時間序列的比較
圖2 4種插值方法產(chǎn)生的絕對誤差
表1 差值結(jié)果的統(tǒng)計比較
插值方法 均方根 平均值 方差 相關(guān)系數(shù)
最近鄰點插值 1.944 1.079 3 2.615 8 0.990 7
線性插值 1.311 0.735 3 1.180 8 0.996 0
立方插值 1.307 0.731 3 1.174 6 0.996 0
三次樣條插值 1.296 0.726 9 1.152 6 0.996 1
3 時間序列的去噪
在小波域閾值濾波去噪中,閾值函數(shù)的選取是關(guān)鍵,軟閾值函數(shù)和硬閾值函數(shù)是兩種經(jīng)典的閾值函數(shù)。雖然這兩種閾值函數(shù)都被廣泛應(yīng)用,但是,它們都有自身固有的缺點。
在經(jīng)典軟閾值函數(shù)、硬閾值函數(shù)的基礎(chǔ)上,提出了新閾值函數(shù),將其定義如下:
.(1)
式(1)中:M——任意正常數(shù),一般為正整數(shù),本文取M=5.
當(dāng)M趨于無窮時,新閾值函數(shù)逼近于硬閾值函數(shù)。從定義中可以看出,新域值函數(shù)克服了硬閾值函數(shù)不連續(xù)性的缺點和軟閾值函數(shù)對大于閾值的小波系數(shù)進行收縮而產(chǎn)生較大偏差的缺點。
下面對軟閾值函數(shù)、硬閾值函數(shù)和新閾值函數(shù)進行對比、研究,并運用信噪比(SNR)和最小均方誤差(MMSE)衡量這幾種閾值函數(shù)的去噪效果。
為了比較各種閾值函數(shù)的去噪效果,選用MATLAB中wnoise函數(shù)產(chǎn)生的含噪信號bumps進行測試。運用信噪比(SNR)和最小均方誤差(MMSE)檢驗去噪效果。將信噪比和最小均方誤差定義為:
. (2)
. (3)
式(2)(3)中:px——原始信號的能量;
——噪聲的能量;
N——原始信號的長度。
信噪比越高,說明信號中的噪聲越?。蛔钚【秸`差越小,說明去噪后信號與原始純凈信號越接近,去噪效果越好。
3.1 確定最優(yōu)分解層數(shù)
為了確定將原始信號分解為多少層時去噪效果最好,選用db4小波對bumps信號進行分解,并用新閾值函數(shù)處理小波系數(shù),表2列出了不同分解層數(shù)的去噪結(jié)果。
表2 不同分解層數(shù)新域值函數(shù)的去噪效果
層數(shù)N 1 2 3 4 5
SNR 71.142 75.625 77.313 77.723 77.959
MMSE 0.444 4 0.283 9 0.239 8 0.230 2 0.224 8
層數(shù)N 6 7 8 9 10
SNR 77.951 77.803 77.793 77.793 77.793
MMSE 0.225 0 0.228 3 0.228 5 0.228 5 0.228 5
從表2中可以看出,當(dāng)分解層數(shù)N為5時,信噪比最大,最小均方誤差最小,這時的去噪效果最好,因此,本文選用的分解層數(shù)為5.
3.2 各種閾值函數(shù)的去噪效果比較
為了比較上述3種閾值函數(shù)的去噪效果,本文用db4小波對bumps信號進行5層分解,并分別用上述3種閾值函數(shù)進行處理,重構(gòu)獲得的去噪信號。3種閾值函數(shù)的去噪效果如表3所示。從表3中可以看出,軟閾值函數(shù)去噪的信噪比最小,最小均方誤差最大,去噪效果最差;新域值函數(shù)去噪的信噪比最大,最小均方誤差最小,去噪效果最好。
表3 硬閾值函數(shù)、軟閾值函數(shù)和新域值函數(shù)的去噪效果
閾值函數(shù) 原始信號 硬閾值函數(shù) 軟閾值函數(shù) 新閾值函數(shù)
SNR 63.769 0 76.012 2 64.651 1 77.959 0
MMSE 0.929 1 0.273 1 0.850 6 0.224 8
4 時間序列的符號化
時間序列符號化就是將原始時間序列轉(zhuǎn)化為符號序列的形式。將觀測數(shù)據(jù)分割成一系列離散的數(shù)字,常用的分割方法有兩種,即分割區(qū)間法和差值法。本文采用的方法是分割區(qū)間法,首先選擇一條合適的分割線,如果原始數(shù)據(jù)在分割線上,則記為1,否則記為0. 這樣原始時間序列就轉(zhuǎn)化為了由0和1組成的離散符號序列。
關(guān)于分割線的選擇有多種不同的方法。好的分割線應(yīng)該使符號軌道唯一地對應(yīng)在一個連續(xù)的空間軌道上,這樣符號動力學(xué)特性就完全等價于連續(xù)空間中的動力特性,這樣的分割被稱為生成分割。
生成分割應(yīng)該保留原始系統(tǒng)的信息,最優(yōu)分割是生成分割的最好逼近,它是使分割得到的符號序列熵最大的分割。為了獲得最優(yōu)分割,設(shè)定初始分割值為時間序列的平均值,并計算獲得的符號時間序列的熵,然后在平均值周圍微調(diào)分割值,并計算相應(yīng)的熵值,選取熵值最大的符號序列對應(yīng)的分割值作為最優(yōu)分割值,此符號序列為最優(yōu)符號序列。
5 符號序列的統(tǒng)計分析
在對符號序列統(tǒng)計、分析之前,需要將符號序列編碼。先從符號序列中提取出長度為n的字(圖3中n=3),然后將每個字作為1個二進制數(shù),并將其轉(zhuǎn)化為十進制數(shù)。這樣,不同的字可以用1個唯一的十進制數(shù)表示,符號序列就轉(zhuǎn)化為了代碼序列。在編碼后,就可以很容易地知道每個字出現(xiàn)的概率,可以用柱狀圖表示,如圖3所示。
圖3 符號序列的編碼圖和序列的柱狀圖
在實際研究中,必須選擇合適的n值,如果選取的n太小,那么,計算得到的熵值不能反映系統(tǒng)信息量的大小;但是,如果n值選得太大時,計算熵值需要的數(shù)據(jù)量會很大,會大大增加計算的復(fù)雜度。
按照上述方法獲得每個字出現(xiàn)的概率后,就可以很方便地根據(jù)信息熵公式計算熵值。信息熵計算公式為:
. (4)
式(4)中,pi——第i種代碼出現(xiàn)的概率;
H——該代碼序列的熵值。
計算獲得每一段的熵值后,可以得到1個由熵值組成的時間序列,觀察在暴雨前該熵值序列的變化情況,進而得出一些有意義的結(jié)論。
6 暴雨事件實例分析
2013-07-09,成都地區(qū)遭遇強降雨襲擊,利用符號動力學(xué)方法分析此次暴雨事件。使用的大氣可降水量時間序列來源于每日4次的分辨率為1°×1°的NCEP再分析格點資料。
6.1 可降水時間序列的插值
本文將采用三次樣條插值法對大氣可降水量時間序列進行10倍插值,圖4是成都市2011-06-10—2011-07-09的大氣可降水量數(shù)據(jù),對其進行10倍插值后如圖5所示。
圖4 可降水時間序列的分段示意圖
圖5 插值前后的時間序列
6.2 可降水時間序列的去噪
采用新閾值函數(shù)對插值后的可降水量時間序列進行去噪,先采用db4小波對可降水量時間序列進行小波分解,分解層數(shù)為5,然后用新閾值函數(shù)處理小波系數(shù),最后再用小波逆變換重構(gòu)處理后的小波系數(shù),進而獲得去噪后的大氣可降水量時間序列。
6.3 可降水時間序列的分段
對去噪后的可降水量時間序列按照每三天數(shù)據(jù)分為一段,即插值后每段數(shù)據(jù)長度為120,然后測試每段數(shù)據(jù)的平穩(wěn)性。此次所用的數(shù)據(jù)第一次分段后的每段數(shù)據(jù)都是平穩(wěn)的,因此不再重新分段。分段后的數(shù)據(jù)仍用圖4提供的數(shù)據(jù),分段后原始時間序列被分為{t1,t2,…,t14}共14個小段,由于最后一段不夠120個數(shù)據(jù),因此丟棄。
6.4 可降水時間序列的符號化
以分段后的第一段t1為例介紹時間序列的符號化,其他小段符號化的方法相同。計算t1段的平均值m,并將其作為閾值,然后將大于m的置為1,其他的置為0,可用公式表示:
. (5)
式(5)中:Si——第i個元素符號化后的符號;
xi——原始時間序列中的第i個元素。
計算所獲得的符號序列的熵值(熵值的計算方法將在后文介紹),然后在平均值周圍微調(diào)閾值,并計算相應(yīng)符號序列的熵值,最后將熵值最大的符號序列作為最優(yōu)符號序列。
6.5 符號序列的編碼和統(tǒng)計分析
為了便于統(tǒng)計分析符號序列,需要對符號序列進行編碼。將符號序列分為長度為n(n取值為3)的子序列,這里稱其為字,然后將每個字當(dāng)作1個二進制碼,將其轉(zhuǎn)化為十進制數(shù),這樣,每個不同的字對應(yīng)1個不同的十進制數(shù),即可以用1個十進制數(shù)表示1個字,便于后面統(tǒng)計每個字出現(xiàn)的概率。
圖6 成都市2013-06-10—2013-08-09的熵曲線圖
符號時間序列分析的重點在于分析每一個字的相對頻率,通過分析出現(xiàn)的字,達到揭示系統(tǒng)動力學(xué)特性的目的。一般來說,表征系統(tǒng)主要特性的字出現(xiàn)的頻率往往較高,而那些出現(xiàn)頻率很低的字不能反映系統(tǒng)的動力學(xué)特性。對符號序列進行編碼后,就可以很方便地計算出每種字出現(xiàn)的概率及其信息熵。
在計算每個子序列的熵值后,就得到了1個由熵值組成的序列,熵值代表其對應(yīng)時間序列信息量的多少,這樣就可以得到隨著時間的推移系統(tǒng)信息量的變化。如果在暴雨來臨之前出現(xiàn)了很小的熵值,則認為在暴雨前出現(xiàn)了征兆。根據(jù)此征兆可以對暴雨做出預(yù)測。
圖6為成都市2011-06-01—2011-07-09的熵曲線圖,先將可降水量時間序列進行10倍插值和去噪,然后將時間序列分為10段,分別計算每段時間序列的熵值,這樣便獲得了由熵值組成的時間序列,每個熵值對應(yīng)3 d時間。從圖6中可以看出,在暴雨發(fā)生前6 d出現(xiàn)了明顯的熵最小值,此即為暴雨出現(xiàn)的征兆(或稱預(yù)報因子)。
7 大量暴雨實例的研究結(jié)果
本文分析了全球68個暴雨過程,選取每個暴雨時間暴雨前30 d的可降水量時間序列,然后采用三次樣條插值方法進行10倍插值,再用新閾值函數(shù)去噪,最后將去噪后的可降水量時間序列采用符號動力學(xué)的方法統(tǒng)計、分析,做出熵值曲線。結(jié)果表明,其中有44個暴雨過程在暴雨發(fā)生前的10 d內(nèi),其熵的極小值都達到了0.5以下,所占比例為64.7%. 在目前暴雨預(yù)報準(zhǔn)確率仍非常低的情況下,從熵值變化這一征兆出現(xiàn)的比例來講,用符號動力學(xué)的方法分析暴雨過程能夠得到較為理想的結(jié)果。為了進一步說明該方法的適用性,以暴雨發(fā)生前10 d熵值極小值是否達到0.5以下作為判據(jù),又驗證了53個暴雨事件,發(fā)現(xiàn)其中34個暴雨過程在暴雨發(fā)生前10 d熵值極小值達到了0.5以下,所占比例約為64.2%. 這一結(jié)果表明,應(yīng)用符號動力學(xué)的方法監(jiān)測和預(yù)報暴雨具有一定的研究價值,并且從非線性角度提供了一個新的研究思路。
8 結(jié)束語
本文將符號動力學(xué)與信息熵理論相結(jié)合,分析了大量暴雨事件發(fā)生前一段時間內(nèi)大氣可降水量的熵值變化,這是從非線性角度對暴雨過程研究進行的一次全新嘗試,旨在為暴雨監(jiān)測預(yù)報的研究提供一個新思路。結(jié)果表明,該方法在對暴雨事件的監(jiān)測方面具有一定的研究價值,然而,由于該方法應(yīng)用于暴雨過程的研究是一種全新的嘗試,所以,有些問題還需要進行更深入的研究和完善。
參考文獻
[1]Orlanski L A.A rational subdivision of scales for atmospheric processes[J].Bull Amer Meteor Soc,1975(56).
[2]馮伍虎,程麟生.“98.7”特大暴雨中尺度系統(tǒng)發(fā)展的熱量和水汽收支診斷應(yīng)用[J].氣象學(xué)報, 2001,12(4).
[3]Hane C E,Jorgensen D P.Dynamic aspects of distinctly three-dimensional mesoscale convective systems[J]. Mon Wea Rev,1995(123).
[4]林振山.非線性科學(xué)及其在地學(xué)中的應(yīng)用[M].北京:氣象出版社,2003.
[5]許小勇,陳竹.基于模擬退火算法的最短三次樣條插值[J].航空計算技術(shù),2007,37(6).
[6]汪同慶,郭子義,劉家兵,等.一種基于改進閾值函數(shù)的小波域超聲信號去噪方法[J].無損檢測,2007,29(11).
[7]張雨,胡蔦慶.基于符號樹信息熵的機械振動瞬態(tài)信號特征提取[J].國防科技大學(xué)學(xué)報,2003,25(4):79-81.
〔編輯:白潔〕
Study on Symbolic Dynamics and Information Entropy and Its Applications in the Monitoring of Rainstorms
Du Yanxia, Lin Huiyang, Wang Yuexia, Wen Jichang
Abstract:Rainstorms is the main disaster in the world and lead huge losses of national economy and peoples life and property every year, but the prediction of rainstorms is very difficult. The basic reason is that we are unclear to the sudden change of atmospheric circulation and the occurrence and development mechanism of severe convective weather; include the inner dynamic mechanism and the physical interaction process of it with the external atmospheric circulation and the abnormal change mechanism of various weather system in tropical and middle latitude zone. Especially, the research on multi-scale interaction is lack. Atmospheric system is a deterministic nonlinear system if a few random factors are ignored. Symbolic dynamic which have gradually become a tool of practitioners is a branch of nonlinear science and has a strong theoretical foundation. Entropy is a basic physical quantity and it is apply widely in nonlinear science, statistical mechanics, and optimum signal processing, and so on. Using symbolic dynamics to explore storm event has some certain significance, the entropy curves of a large number of heavy rain are analyzed and the entropy has reached its minimum ten days before most of the heavy rainfall in the storm. So it is valuable in monitoring and forecasting heavy rain events.
Key words: symbolic dynamics; information entropy; rainstorms; wavelet de-noising
. (5)
式(5)中:Si——第i個元素符號化后的符號;
xi——原始時間序列中的第i個元素。
計算所獲得的符號序列的熵值(熵值的計算方法將在后文介紹),然后在平均值周圍微調(diào)閾值,并計算相應(yīng)符號序列的熵值,最后將熵值最大的符號序列作為最優(yōu)符號序列。
6.5 符號序列的編碼和統(tǒng)計分析
為了便于統(tǒng)計分析符號序列,需要對符號序列進行編碼。將符號序列分為長度為n(n取值為3)的子序列,這里稱其為字,然后將每個字當(dāng)作1個二進制碼,將其轉(zhuǎn)化為十進制數(shù),這樣,每個不同的字對應(yīng)1個不同的十進制數(shù),即可以用1個十進制數(shù)表示1個字,便于后面統(tǒng)計每個字出現(xiàn)的概率。
圖6 成都市2013-06-10—2013-08-09的熵曲線圖
符號時間序列分析的重點在于分析每一個字的相對頻率,通過分析出現(xiàn)的字,達到揭示系統(tǒng)動力學(xué)特性的目的。一般來說,表征系統(tǒng)主要特性的字出現(xiàn)的頻率往往較高,而那些出現(xiàn)頻率很低的字不能反映系統(tǒng)的動力學(xué)特性。對符號序列進行編碼后,就可以很方便地計算出每種字出現(xiàn)的概率及其信息熵。
在計算每個子序列的熵值后,就得到了1個由熵值組成的序列,熵值代表其對應(yīng)時間序列信息量的多少,這樣就可以得到隨著時間的推移系統(tǒng)信息量的變化。如果在暴雨來臨之前出現(xiàn)了很小的熵值,則認為在暴雨前出現(xiàn)了征兆。根據(jù)此征兆可以對暴雨做出預(yù)測。
圖6為成都市2011-06-01—2011-07-09的熵曲線圖,先將可降水量時間序列進行10倍插值和去噪,然后將時間序列分為10段,分別計算每段時間序列的熵值,這樣便獲得了由熵值組成的時間序列,每個熵值對應(yīng)3 d時間。從圖6中可以看出,在暴雨發(fā)生前6 d出現(xiàn)了明顯的熵最小值,此即為暴雨出現(xiàn)的征兆(或稱預(yù)報因子)。
7 大量暴雨實例的研究結(jié)果
本文分析了全球68個暴雨過程,選取每個暴雨時間暴雨前30 d的可降水量時間序列,然后采用三次樣條插值方法進行10倍插值,再用新閾值函數(shù)去噪,最后將去噪后的可降水量時間序列采用符號動力學(xué)的方法統(tǒng)計、分析,做出熵值曲線。結(jié)果表明,其中有44個暴雨過程在暴雨發(fā)生前的10 d內(nèi),其熵的極小值都達到了0.5以下,所占比例為64.7%. 在目前暴雨預(yù)報準(zhǔn)確率仍非常低的情況下,從熵值變化這一征兆出現(xiàn)的比例來講,用符號動力學(xué)的方法分析暴雨過程能夠得到較為理想的結(jié)果。為了進一步說明該方法的適用性,以暴雨發(fā)生前10 d熵值極小值是否達到0.5以下作為判據(jù),又驗證了53個暴雨事件,發(fā)現(xiàn)其中34個暴雨過程在暴雨發(fā)生前10 d熵值極小值達到了0.5以下,所占比例約為64.2%. 這一結(jié)果表明,應(yīng)用符號動力學(xué)的方法監(jiān)測和預(yù)報暴雨具有一定的研究價值,并且從非線性角度提供了一個新的研究思路。
8 結(jié)束語
本文將符號動力學(xué)與信息熵理論相結(jié)合,分析了大量暴雨事件發(fā)生前一段時間內(nèi)大氣可降水量的熵值變化,這是從非線性角度對暴雨過程研究進行的一次全新嘗試,旨在為暴雨監(jiān)測預(yù)報的研究提供一個新思路。結(jié)果表明,該方法在對暴雨事件的監(jiān)測方面具有一定的研究價值,然而,由于該方法應(yīng)用于暴雨過程的研究是一種全新的嘗試,所以,有些問題還需要進行更深入的研究和完善。
參考文獻
[1]Orlanski L A.A rational subdivision of scales for atmospheric processes[J].Bull Amer Meteor Soc,1975(56).
[2]馮伍虎,程麟生.“98.7”特大暴雨中尺度系統(tǒng)發(fā)展的熱量和水汽收支診斷應(yīng)用[J].氣象學(xué)報, 2001,12(4).
[3]Hane C E,Jorgensen D P.Dynamic aspects of distinctly three-dimensional mesoscale convective systems[J]. Mon Wea Rev,1995(123).
[4]林振山.非線性科學(xué)及其在地學(xué)中的應(yīng)用[M].北京:氣象出版社,2003.
[5]許小勇,陳竹.基于模擬退火算法的最短三次樣條插值[J].航空計算技術(shù),2007,37(6).
[6]汪同慶,郭子義,劉家兵,等.一種基于改進閾值函數(shù)的小波域超聲信號去噪方法[J].無損檢測,2007,29(11).
[7]張雨,胡蔦慶.基于符號樹信息熵的機械振動瞬態(tài)信號特征提取[J].國防科技大學(xué)學(xué)報,2003,25(4):79-81.
〔編輯:白潔〕
Study on Symbolic Dynamics and Information Entropy and Its Applications in the Monitoring of Rainstorms
Du Yanxia, Lin Huiyang, Wang Yuexia, Wen Jichang
Abstract:Rainstorms is the main disaster in the world and lead huge losses of national economy and peoples life and property every year, but the prediction of rainstorms is very difficult. The basic reason is that we are unclear to the sudden change of atmospheric circulation and the occurrence and development mechanism of severe convective weather; include the inner dynamic mechanism and the physical interaction process of it with the external atmospheric circulation and the abnormal change mechanism of various weather system in tropical and middle latitude zone. Especially, the research on multi-scale interaction is lack. Atmospheric system is a deterministic nonlinear system if a few random factors are ignored. Symbolic dynamic which have gradually become a tool of practitioners is a branch of nonlinear science and has a strong theoretical foundation. Entropy is a basic physical quantity and it is apply widely in nonlinear science, statistical mechanics, and optimum signal processing, and so on. Using symbolic dynamics to explore storm event has some certain significance, the entropy curves of a large number of heavy rain are analyzed and the entropy has reached its minimum ten days before most of the heavy rainfall in the storm. So it is valuable in monitoring and forecasting heavy rain events.
Key words: symbolic dynamics; information entropy; rainstorms; wavelet de-noising
. (5)
式(5)中:Si——第i個元素符號化后的符號;
xi——原始時間序列中的第i個元素。
計算所獲得的符號序列的熵值(熵值的計算方法將在后文介紹),然后在平均值周圍微調(diào)閾值,并計算相應(yīng)符號序列的熵值,最后將熵值最大的符號序列作為最優(yōu)符號序列。
6.5 符號序列的編碼和統(tǒng)計分析
為了便于統(tǒng)計分析符號序列,需要對符號序列進行編碼。將符號序列分為長度為n(n取值為3)的子序列,這里稱其為字,然后將每個字當(dāng)作1個二進制碼,將其轉(zhuǎn)化為十進制數(shù),這樣,每個不同的字對應(yīng)1個不同的十進制數(shù),即可以用1個十進制數(shù)表示1個字,便于后面統(tǒng)計每個字出現(xiàn)的概率。
圖6 成都市2013-06-10—2013-08-09的熵曲線圖
符號時間序列分析的重點在于分析每一個字的相對頻率,通過分析出現(xiàn)的字,達到揭示系統(tǒng)動力學(xué)特性的目的。一般來說,表征系統(tǒng)主要特性的字出現(xiàn)的頻率往往較高,而那些出現(xiàn)頻率很低的字不能反映系統(tǒng)的動力學(xué)特性。對符號序列進行編碼后,就可以很方便地計算出每種字出現(xiàn)的概率及其信息熵。
在計算每個子序列的熵值后,就得到了1個由熵值組成的序列,熵值代表其對應(yīng)時間序列信息量的多少,這樣就可以得到隨著時間的推移系統(tǒng)信息量的變化。如果在暴雨來臨之前出現(xiàn)了很小的熵值,則認為在暴雨前出現(xiàn)了征兆。根據(jù)此征兆可以對暴雨做出預(yù)測。
圖6為成都市2011-06-01—2011-07-09的熵曲線圖,先將可降水量時間序列進行10倍插值和去噪,然后將時間序列分為10段,分別計算每段時間序列的熵值,這樣便獲得了由熵值組成的時間序列,每個熵值對應(yīng)3 d時間。從圖6中可以看出,在暴雨發(fā)生前6 d出現(xiàn)了明顯的熵最小值,此即為暴雨出現(xiàn)的征兆(或稱預(yù)報因子)。
7 大量暴雨實例的研究結(jié)果
本文分析了全球68個暴雨過程,選取每個暴雨時間暴雨前30 d的可降水量時間序列,然后采用三次樣條插值方法進行10倍插值,再用新閾值函數(shù)去噪,最后將去噪后的可降水量時間序列采用符號動力學(xué)的方法統(tǒng)計、分析,做出熵值曲線。結(jié)果表明,其中有44個暴雨過程在暴雨發(fā)生前的10 d內(nèi),其熵的極小值都達到了0.5以下,所占比例為64.7%. 在目前暴雨預(yù)報準(zhǔn)確率仍非常低的情況下,從熵值變化這一征兆出現(xiàn)的比例來講,用符號動力學(xué)的方法分析暴雨過程能夠得到較為理想的結(jié)果。為了進一步說明該方法的適用性,以暴雨發(fā)生前10 d熵值極小值是否達到0.5以下作為判據(jù),又驗證了53個暴雨事件,發(fā)現(xiàn)其中34個暴雨過程在暴雨發(fā)生前10 d熵值極小值達到了0.5以下,所占比例約為64.2%. 這一結(jié)果表明,應(yīng)用符號動力學(xué)的方法監(jiān)測和預(yù)報暴雨具有一定的研究價值,并且從非線性角度提供了一個新的研究思路。
8 結(jié)束語
本文將符號動力學(xué)與信息熵理論相結(jié)合,分析了大量暴雨事件發(fā)生前一段時間內(nèi)大氣可降水量的熵值變化,這是從非線性角度對暴雨過程研究進行的一次全新嘗試,旨在為暴雨監(jiān)測預(yù)報的研究提供一個新思路。結(jié)果表明,該方法在對暴雨事件的監(jiān)測方面具有一定的研究價值,然而,由于該方法應(yīng)用于暴雨過程的研究是一種全新的嘗試,所以,有些問題還需要進行更深入的研究和完善。
參考文獻
[1]Orlanski L A.A rational subdivision of scales for atmospheric processes[J].Bull Amer Meteor Soc,1975(56).
[2]馮伍虎,程麟生.“98.7”特大暴雨中尺度系統(tǒng)發(fā)展的熱量和水汽收支診斷應(yīng)用[J].氣象學(xué)報, 2001,12(4).
[3]Hane C E,Jorgensen D P.Dynamic aspects of distinctly three-dimensional mesoscale convective systems[J]. Mon Wea Rev,1995(123).
[4]林振山.非線性科學(xué)及其在地學(xué)中的應(yīng)用[M].北京:氣象出版社,2003.
[5]許小勇,陳竹.基于模擬退火算法的最短三次樣條插值[J].航空計算技術(shù),2007,37(6).
[6]汪同慶,郭子義,劉家兵,等.一種基于改進閾值函數(shù)的小波域超聲信號去噪方法[J].無損檢測,2007,29(11).
[7]張雨,胡蔦慶.基于符號樹信息熵的機械振動瞬態(tài)信號特征提取[J].國防科技大學(xué)學(xué)報,2003,25(4):79-81.
〔編輯:白潔〕
Study on Symbolic Dynamics and Information Entropy and Its Applications in the Monitoring of Rainstorms
Du Yanxia, Lin Huiyang, Wang Yuexia, Wen Jichang
Abstract:Rainstorms is the main disaster in the world and lead huge losses of national economy and peoples life and property every year, but the prediction of rainstorms is very difficult. The basic reason is that we are unclear to the sudden change of atmospheric circulation and the occurrence and development mechanism of severe convective weather; include the inner dynamic mechanism and the physical interaction process of it with the external atmospheric circulation and the abnormal change mechanism of various weather system in tropical and middle latitude zone. Especially, the research on multi-scale interaction is lack. Atmospheric system is a deterministic nonlinear system if a few random factors are ignored. Symbolic dynamic which have gradually become a tool of practitioners is a branch of nonlinear science and has a strong theoretical foundation. Entropy is a basic physical quantity and it is apply widely in nonlinear science, statistical mechanics, and optimum signal processing, and so on. Using symbolic dynamics to explore storm event has some certain significance, the entropy curves of a large number of heavy rain are analyzed and the entropy has reached its minimum ten days before most of the heavy rainfall in the storm. So it is valuable in monitoring and forecasting heavy rain events.
Key words: symbolic dynamics; information entropy; rainstorms; wavelet de-noising