魏小亭 李國東,2 李碩 徐文霞 王雪
(1.新疆財(cái)經(jīng)大學(xué)應(yīng)用數(shù)學(xué)學(xué)院,烏魯木齊 830012;2.新疆財(cái)經(jīng)大學(xué)新疆社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)研究中心,烏魯木齊 830012;3.新疆維吾爾自治區(qū)氣象局人工影響天氣辦公室,烏魯木齊 830002)
?
基于最大概率判別法的雹云識(shí)別模型的設(shè)計(jì)研究
魏小亭1李國東1,2李碩1徐文霞3王雪1
(1.新疆財(cái)經(jīng)大學(xué)應(yīng)用數(shù)學(xué)學(xué)院,烏魯木齊830012;2.新疆財(cái)經(jīng)大學(xué)新疆社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)研究中心,烏魯木齊830012;3.新疆維吾爾自治區(qū)氣象局人工影響天氣辦公室,烏魯木齊830002)
冰雹是一種嚴(yán)重災(zāi)害性天氣,具有突發(fā)性、移動(dòng)迅速、生命史短等特點(diǎn),使人工預(yù)報(bào)冰雹非常困難,因此對(duì)冰雹的研究是當(dāng)下的一個(gè)熱點(diǎn)問題。設(shè)計(jì)了雹云識(shí)別模型,通過最大概率判別的方法,根據(jù)測(cè)度分析,提取雹云和非雹云圖像的特征數(shù)據(jù),分析雹云圖像和非雹云圖像特征數(shù)據(jù)的差異性。利用測(cè)度分析提取的相關(guān)統(tǒng)計(jì)量作為最大概率判別法的變量數(shù)據(jù),構(gòu)造判別函數(shù),并利用此模型對(duì)已有的新疆阿克蘇地區(qū)的樣本進(jìn)行檢測(cè),可知此判別法對(duì)于識(shí)別雹云非雹云圖像具有較高的分辨率,且判別有較低的誤差率。實(shí)驗(yàn)結(jié)果顯示,通過氣象雷達(dá)反射率圖像的回波強(qiáng)度的測(cè)度分析與最大概率判別法相結(jié)合構(gòu)造的雹云判別模型,具有較好的效果。
冰雹;測(cè)度分析;特征提??;最大概率判別法
冰雹是阿克蘇地區(qū)春夏季最常見的一種災(zāi)害性天氣,嚴(yán)重的影響了農(nóng)業(yè)的發(fā)展,給農(nóng)民帶來了巨大的經(jīng)濟(jì)損失,但因其時(shí)空尺度小、突發(fā)性強(qiáng)的特點(diǎn),冰雹天氣的預(yù)報(bào)和預(yù)警也是短時(shí)臨近預(yù)報(bào)的難點(diǎn)。 近幾年,隨著全國新一代天氣雷達(dá)網(wǎng)的建設(shè), 國內(nèi)在利用新一代天氣雷達(dá)產(chǎn)品對(duì)冰雹等強(qiáng)對(duì)流天氣監(jiān)測(cè)和分析方面的研究已有了不少成果[1]。Rinehart[2]應(yīng)用模式識(shí)別中相關(guān)分析的方法對(duì)整幅回波圖像做處理,并介紹了使用單一常規(guī)氣象雷達(dá)的反射率因子數(shù)據(jù)獲取風(fēng)暴的三維運(yùn)動(dòng)信息。路志英[3]等提出了一種基于雷達(dá)反射率圖像特征的自動(dòng)識(shí)別方法。對(duì)雷達(dá)回波反射率圖像中冰雹回波區(qū)域和暴雨回波區(qū)域的圖像特征進(jìn)行提取,通過分析冰雹暴雨間單一特征的差異性和不同特征之間的分類互補(bǔ)性,確定了識(shí)別冰雹暴雨的有效圖像特征。楊玉峰[4]等從冰雹云的統(tǒng)計(jì)特征即基本反射率因子、形態(tài)特征兩個(gè)方面進(jìn)行冰雹的識(shí)別。胡文東[5]等利用寧夏中北部51個(gè)強(qiáng)對(duì)流降水過程反射率圖像資料,分析了不同地區(qū)強(qiáng)降水過程在反射率圖像上所表現(xiàn)出的基本紋理特征差異。
以雷達(dá)反射率所成圖像,并以圖像中反射率的強(qiáng)度概率為基礎(chǔ),根據(jù)對(duì)圖像的測(cè)度分析,通過最大概率判別法構(gòu)建雹云判別模型。最后利用該模型對(duì)阿克蘇地區(qū)的云層圖像進(jìn)行檢驗(yàn),為尋求有效識(shí)別雹云圖像方法,并為冰雹預(yù)報(bào)提供參考。
統(tǒng)計(jì)調(diào)查取得的數(shù)據(jù),經(jīng)過排序和分組整理后,數(shù)據(jù)的類型和分布特點(diǎn)得到初步的反映。為了進(jìn)一步掌握數(shù)據(jù)分布特征的變化規(guī)律,有必要對(duì)其進(jìn)一步的討論及研究。
集中趨勢(shì)測(cè)度是指一組數(shù)據(jù)(或總體各單位標(biāo)志值)向某一中心值靠攏的傾向,測(cè)度集中趨勢(shì)也就是尋找資料一般水平代表值或中心值,即平均指標(biāo)。描述數(shù)據(jù)集中趨勢(shì)測(cè)度值主要有算數(shù)平均數(shù)、調(diào)和平均數(shù)、幾何平均數(shù)、位置平均數(shù);其中位置平均數(shù)又包含眾數(shù)、中位數(shù)、分位數(shù)。離散程度測(cè)度是指各個(gè)變量值遠(yuǎn)離其中心值的程度,又稱離中趨勢(shì),描述數(shù)據(jù)離散程度的測(cè)度值主要有極差、平均差、方差和標(biāo)準(zhǔn)差、離散系數(shù)等。數(shù)據(jù)的分布特征除了用集中趨勢(shì)和離散程度來描述外,許多場(chǎng)合還需要了解數(shù)據(jù)分布的偏斜程度及扁平程度。偏態(tài)與峰態(tài)是進(jìn)一步描述分布情況的兩種統(tǒng)計(jì)測(cè)度,偏態(tài)是指對(duì)分布偏斜方向及程度的測(cè)度。峰態(tài)是指數(shù)據(jù)分布的尖峭狀況和程度。
運(yùn)用概率統(tǒng)計(jì)中的分布列,選取集中趨勢(shì)中的算數(shù)平均數(shù)、離散趨勢(shì)中的方差以及分布形狀的偏態(tài)和峰態(tài),四個(gè)指標(biāo)作為判斷雹云非雹云的統(tǒng)計(jì)測(cè)度。
均值:為回波強(qiáng)度量級(jí)的均值,表示回波反射率的強(qiáng)度大小。
(1)
方差:反應(yīng)各個(gè)強(qiáng)度與均值的偏離程度。
(2)
偏度:用于度量分布偏斜方向和程度的測(cè)度,是次數(shù)分配的非對(duì)稱程度。
(3)
峰度:又稱為峰態(tài)系數(shù),反映隨機(jī)變量的分布形狀的量。
(4)
雹云識(shí)別模型流程圖1所示。
圖1 雹云識(shí)別模型流程圖
2.1最大概率判別法[7]
最大概率判別是根據(jù)線性函數(shù)的函數(shù)值進(jìn)行判別,使待判樣本屬于判別函數(shù)大的類。
若各總體服從正態(tài)分布N(μi,∑i),X是來自第i個(gè)總體,則其概率密度函數(shù)
(5)
(6)
(7)
代替Si。其中n=n1+…+nk。為了簡化,可以略去共同的(X)′S-1(X),乘以-0.5,于是判別函數(shù)化為線性函數(shù)
(8)
則待判樣本屬于判別函數(shù)大的類。
2.2模型構(gòu)建
氣象雷達(dá)反射率圖像來源于基本產(chǎn)品中的反射率因子,圖像上每一個(gè)像素點(diǎn)的顏色與反射強(qiáng)度相對(duì)應(yīng),即不同的顏色反應(yīng)不同的反射強(qiáng)度。具體對(duì)應(yīng)范圍為圖2所示。反射因子的大小是氣象目標(biāo)內(nèi)部降水粒子的尺度和密度的分布情況,表示的是氣象目標(biāo)的強(qiáng)度,數(shù)據(jù)的單位為“dBZ”[8-9]。目前認(rèn)為,反射率強(qiáng)度越大,出現(xiàn)極端天氣的可能性越大[10]。所用氣象圖像由新疆自治區(qū)氣象局提供。
圖2 雷達(dá)反射率圖像及基本反射率
雷達(dá)反射率圖像是基于 RGB 彩色空間,以基本反射率因子圖的圖例為基礎(chǔ),利用RGB彩色空間的成色原理,讀取回波反射圖[4],即將反射率為-35~94 dBZ,分為17種相應(yīng)的量級(jí)。其中不同量級(jí)所對(duì)應(yīng)的RGB值如圖所示,由 RGB 與灰度值的換算關(guān)系式(1),可知對(duì)應(yīng)的灰度值。由氣象學(xué)理論可知,強(qiáng)對(duì)流的極端天氣,只可能出現(xiàn)在反射強(qiáng)度大于45 dBZ的區(qū)域。選取量級(jí)為11~15的,如表1所示。
Gray=R×0.299+G×0.587+B×0.114.
(9)
表1 反射率與RGB 值、灰度值對(duì)應(yīng)關(guān)系
雷達(dá)回波反射率圖像上的不同顏色代表的是不同的反射強(qiáng)度,即可以通過統(tǒng)計(jì)不同顏色在圖像中所占的面積的比例,體現(xiàn)圖像中回波強(qiáng)度的特征。假設(shè)一幅規(guī)格為M×N的圖像,含有M×N個(gè)像素,反射率強(qiáng)度分為17個(gè)量級(jí),這不同量級(jí)在圖像中所占的面積的比重為:
(10)
其中,ni為第i個(gè)量級(jí)的顏色在圖像上的像素個(gè)數(shù)。
利用2009~2011年間,新疆維吾爾自治區(qū)的阿克蘇地區(qū)的降雹與無雹反射率圖像各30副作為訓(xùn)練樣本。提取降雹圖像和無雹圖像中反射率數(shù)據(jù),依據(jù)公式(10)計(jì)算出其概率pi,再依據(jù)公式(1)~(4)分別計(jì)算出均值、方差、偏度、峰度(如表2、表3所示)。
表2 阿克蘇地區(qū)降雹反射率圖像強(qiáng)度的測(cè)度指標(biāo)-訓(xùn)練樣本
注:1表示降雹,i=1,…,30。
表3 阿克蘇地區(qū)無雹反射率圖像強(qiáng)度的測(cè)度指標(biāo)-訓(xùn)練樣本
注:2表示無雹,j=1,…,30。
主要是利用是利用SAS中的CLASS GROUP函數(shù)代碼,對(duì)訓(xùn)練樣本集的判別分析。處理結(jié)果如下。
表4 處理結(jié)果表
以上是線性判別函數(shù)表,線性判別函數(shù)為
由上表4可見判為第一類(y=1)的線性判別函數(shù):
L1(X)=299.141 61x1+29.875 91x2-14 763x3+371.382 92x4,
(11)
由上表4可見判為第一類(y=2)的線性判別函數(shù)
L2(X)=304.769 29x1+29.740 71x2-15 310x3+378.847 94x4,
(12)
L1(X)表示降雹的線性判別函數(shù);L2(X)表示無雹的線性判別函數(shù)。
2.3模型檢驗(yàn)
利用已知的分組數(shù)據(jù)對(duì)上述的判別函數(shù)(11)、(12)式,進(jìn)行檢驗(yàn)。數(shù)據(jù)選取2010年阿克蘇地區(qū)的不同于訓(xùn)練樣本的數(shù)據(jù),作為待測(cè)樣本表5和表6。由于待測(cè)樣本的分類已知,則利用此判別函數(shù)進(jìn)行判別,并將判別結(jié)果與真實(shí)結(jié)果進(jìn)行比較,即可知道判別函數(shù)對(duì)于反射率圖像判別的準(zhǔn)確率。結(jié)果如表7所示。
表5 阿克蘇地區(qū)降雹反射率圖像強(qiáng)度的測(cè)度指標(biāo)-待測(cè)樣本
表6 阿克蘇地區(qū)無雹反射率圖像強(qiáng)度的測(cè)度指標(biāo)-待測(cè)樣本
表7 檢驗(yàn)結(jié)果
注:1表示降雹,2表示無雹。
2.4實(shí)驗(yàn)結(jié)果分析
檢驗(yàn)結(jié)果中p1和p2的值是由降雹類和無雹類的后驗(yàn)概率
后驗(yàn)概率最大就等價(jià)于線性判別函數(shù)最大。根據(jù)判別函數(shù)(11)、(12)式,將20幅降雹圖像與20幅無雹圖像代入判別函數(shù)中進(jìn)行檢驗(yàn),得到表7數(shù)據(jù),由表7概率可知,在20幅降雹圖像中,18幅都是p1>p2,根據(jù)最大概率判別模型,將待測(cè)樣本判為概率最大的一類,因此將它們判為降雹圖像。第10幅圖像和第20幅圖像原本是降雹圖像,但現(xiàn)在判別為無雹圖像,因此后面加“*”,表示與原來類別不同。對(duì)于20幅無雹圖像的檢驗(yàn),與降雹圖像一樣。
2.5誤差分析
表8 誤差表
由表8可知,該判別模型的判別準(zhǔn)確率為90 %,準(zhǔn)確率較高,說明最大概率判別模型具有一定的判別效果。由于判別樣本的容量小,對(duì)判別函數(shù)造成一定程度的局限性,所以模型判定的準(zhǔn)確性尚提高的可能性。
通過新疆自治區(qū)氣象局提供的2009~2011年阿克蘇地區(qū)的歷史資料中,選取降雹和無雹過程的共100個(gè)樣本的雷達(dá)數(shù)據(jù)進(jìn)行處理和分析。首先,由氣象雷達(dá)反射率圖像的回波強(qiáng)度的測(cè)度分析得到反射率數(shù)據(jù),根據(jù)反射率數(shù)據(jù)計(jì)算得到概率;其次,根據(jù)概率計(jì)算得到相關(guān)統(tǒng)計(jì)量作為變量數(shù)據(jù),建立最大概率判別法模型,得到判別函數(shù);最后,檢驗(yàn)結(jié)果顯示,判別函數(shù)的準(zhǔn)確率為90 %,能夠較好的區(qū)分降雹和無雹過程。
[1]趙俊榮,郭金強(qiáng),楊景輝,等.一次致災(zāi)冰雹的超級(jí)單體風(fēng)暴雷達(dá)回波特征分析[J].高原氣象,2011(06):1681-1689.
[2]Rinehart R E. The storm cell identification and tracking algorithm: an enhanced WSR-88D Algoithm[J]. Wea Forecasting, 1998,13:263-276.
[3]路志英,劉海,賈惠珍,等.基于雷達(dá)反射率圖像特征的冰雹暴雨識(shí)別[J].物理學(xué)報(bào), 2014, 631(8):189-201.
[4]楊玉峰.基于雷達(dá)回波反射率圖的冰雹識(shí)別系統(tǒng)的研究[D].天津:天津大學(xué),2005.
[5]胡文東,李艷春,鄭廣芬,等.寧夏干旱區(qū)強(qiáng)對(duì)流降水過程雷達(dá)圖像紋理特征分析[J].中國沙漠, 2007,27(2): 331-336.
[6]艾軍.新編統(tǒng)計(jì)學(xué)原理 [M] .北京:機(jī)械工業(yè)出版社.
[7]陳平等.應(yīng)用數(shù)理統(tǒng)計(jì) [M] .北京:機(jī)械工業(yè)出版社,2008: 251-255.
[8]廖玉芳,潘志祥,郭慶.單多普勒天氣雷達(dá)產(chǎn)品的強(qiáng)對(duì)流天氣預(yù)報(bào)預(yù)警方法[J].氣象科學(xué),2006,26(11): 564-570.
[9]陳秋萍, 陳齊川,劉錦良,等. 應(yīng)用衛(wèi)星,雷達(dá)資料的強(qiáng)對(duì)流天氣預(yù)警系統(tǒng)[J].氣象科技,2011,39(5): 545-551.
[10]Xie X N, Liu X D. Spectral dispersion of cloud dropsize distributions and radar threshold reflectivity for drizzle[J].Chese Physics B, 2010(10): 663-666.Research on Hail Cloud Recognition Model Based on Maximum Probability Discriminance
WEI Xiaoting1LI Guodong1,2LI Shuo1XU Wenxia3WANG Xue1
(1. School of Applied Mathematics, Xinjiang University of Finance and Economics, Urumqi 830012, China;2. Research Center of Xinjiang Social and Economic Statistics, Xinjiang University of Finance and Economics, Urumqi 830012, China;3. Weather Modification Office, Weather Bureau of Xinjiang, Urumqi 830002, China)
Since hail is a severe weather and hail cloud has the characteristics of sudden, quick and short movement, artificial hail forecasting is very difficult and the research on hailstone is currently popular. This paper narrates the design of hail cloud identification model through the maximum probability discriminance, extracting hail cloud and non-hail cloud image feature data according to the analysis of measure, analyzing the difference of the image feature data between hail cloud and non-hail cloud image with Akesu Region of Xinjiang as a sample. Experimental results show that the model of hail discriminance has a good effect by combining the measured analysis for echo intensity of weather radar reflectivity image with the maximum probability discriminance.
hail; measured analysis; feature extraction; maximum probability discriminance
2016-03-16
國家教育部人文社會(huì)科學(xué)基金(13YJAZH040);國家社科基金(14BTJ021);國家自然科學(xué)基金(11461063);氣象局人影辦青年基金(RY1403);新疆自治區(qū)氣象局吐哈空中水資源項(xiàng)目(TUHA201514)。
魏小亭(1993—),女,安徽阜陽人,碩士生,主要從事數(shù)據(jù)分析與圖像處理研究。
O183.1;TN957.53
A
1009-0312(2016)05-0008-06