林潤生,黃明明
(北京市氣象信息中心,北京 100089)
局部均值偽最近鄰算法在降水預報中的應用
林潤生,黃明明*
(北京市氣象信息中心,北京 100089)
分析北京地區(qū)日降雨量資料發(fā)現(xiàn),相較于其他降雨事件,大雨或暴雨事件發(fā)生的次數(shù)較少,因此該地區(qū)的降水量預報屬于樣本不均衡問題.在樣本不均衡的情況下,K最近鄰算法的分類誤差率將會大大提高,這也就使傳統(tǒng)的基于K最近鄰算法的降水量預報方法的應用受到了限制.針對北京地區(qū)降水量預報這一樣本不均衡問題,應用局部均值偽最近鄰算法構建了北京市的降水量預報模型.該方法利用北京地區(qū)日降雨量資料和美國國家環(huán)境預報中心全球格點資料,將降雨量作為類,將美國國家環(huán)境預報中心全球格點資料的各種因子場作為天氣樣本特征,計算得到不同天氣樣本在所有類中的局部均值偽最近鄰,通過決策規(guī)則實現(xiàn)最優(yōu)分類.利用提出的降水預報模型對北京市2010年6-8月進行了24 h降水預報,實驗結果表明,提出的預報方法對于降水等級預報的預報準確率以及晴雨預報的TS評分、正樣本概括率、空報率和漏報率均優(yōu)于傳統(tǒng)的K最近鄰預報方法,該方法具有較好的預報效果.
局部均值偽最近鄰算法;K最近鄰算法;降水量
降水是影響氣候的主要因素之一,它對農業(yè)、能源產業(yè)以及社會和經濟的發(fā)展具有至關重要的作用,并且也為各物種提供了一個穩(wěn)定的棲息地[1-5].然而,短期強降水通常會導致洪水、山體滑坡和城市洪澇等嚴重災害,給人們的經濟和生命財產安全造成巨大損失[6].因此,精確的短期降水預報對于防災減災,保護人民群眾的生命財產安全和維護社會穩(wěn)定具有重要作用.但是天氣形勢復雜多變,特別是降水天氣的產生極為復雜,降水被認為是天氣預報中最重要也是難度最大的一項[7].因此,如何提高降水預報的準確度也是研究者們一直關注的熱點問題.
劉還珠等[8]應用MOS(Model Output Statistics)數(shù)值預報產品釋用方法建立方程,制作了溫度、風、降水、云量、相對濕度和能見度等氣象要素預報,但預報檢驗結果顯示降水預報尚未達到可用程度,需加以改進.邵明軒[9]利用KNN算法從歷史樣本集中搜索出近鄰子集,并根據(jù)近鄰子集做出未來天氣預報.翟宇梅[10]提出了一種制作概率天氣預報的K近鄰非參數(shù)估計仿真模型(簡稱KNN-M),利用該模型進行了云量和降水的概率預報試驗.閔晶晶等[11]在傳統(tǒng)BP算法的基礎上,提出一種改進的BP算法進行降水預報.該方法在網(wǎng)絡訓練過程中自動確定最優(yōu)的學習訓練和網(wǎng)絡結構參數(shù),并利用這一方法建立江淮流域68個站24 h降水3個等級的預報.范嚴等[12]為提高降水預報的準確率,提出模糊聚類算法來構建降水預報模型.該方法根據(jù)空氣的流動特性,采用模糊聚類算法分析預報因子的內部特性來表述預報因子間的聯(lián)系,構建初始預報模型,并根據(jù)最小二乘回歸方法訓練得到降水預報模型.鄧小花等[13]應用支持向量機(SVM)方法分別建立海水浴場不同預報時效內的氣溫、降水和能見度預報模型,使預報準確率得到提高.
綜上易見,K最近鄰(K-Nearest Neighbor,KNN)算法[14]被廣泛應用于天氣預報中.事實上,KNN算法過程簡單、有效而且易于理解,屬于一種非常簡單有效的分類方法[15].此外,基于KNN算法的天氣預報方法即K近鄰預報方法不需要建立預報方程,可避免建立預報方程時所需作的種種假設以及假設和實際不一致時產生的誤差,是一種穩(wěn)定的預報方法[16].然而,研究表明[17-18],在不平衡樣本以及樣本集受到離群點的影響時,KNN算法的分類誤差率較高.此外,KNN算法對于近鄰點個數(shù)也就是K值大小的選擇較為敏感.目前在氣象領域中,在處理不平衡氣象數(shù)據(jù)集的天氣預報問題上,應用KNN算法進行降水預報的研究較為少見.陳凱等提出了基于加權的KNN算法,采用權值的方法來改進在不平衡數(shù)據(jù)集中的預報性能.曾曉青[16]考慮了小概率事件的天氣如強降水與無降水事件的樣本數(shù)不均衡的情況,在選擇K近鄰域時,分別考慮兩類不同天氣的樣本,通過交叉檢驗方法,分別獲取有天氣事件的正樣本值和無天氣事件的負樣本值,從而有效的確定了K值的最優(yōu)組合.并利用這一方法制作了不同站點的晴雨預報和不小于10 mm的降水預報,使得降水預報評分得到提高.然而,該方法僅對降水樣本類別數(shù)是兩類的情況適用,不是普遍適用的,不適用于本文的降水量預報,具有一定的局限性.因此,對于降水量樣本集不均衡的問題,選取合適的機器學習算法來進行降水量的分類,制作降水量預報,是本文的研究重點.
局部均值偽最近鄰(Local Mean-based Pseudo Nearest Neighbor,LMPNN)算法[19]是在KNN算法基礎上提出的一種新的機器學習算法.研究表明[19],與KNN算法相比,在不平衡樣本以及樣本集受到離群點的影響時LMPNN算法具有較低的分類誤差率,分類性能較好.此外,LMPNN算法對于K值的選擇魯棒性更強.因此,本文應用局部均值偽最近鄰算法構建北京市降水量預報模型,并利用該模型制作了北京地區(qū)的降水量預報試驗.實驗結果表明,應用局部均值偽最近鄰算法的降水量預報方法的預報效果比傳統(tǒng)的K最近鄰算法有明顯的提高,該方法具有較好的降水量預報能力和預報準確率.
通常情況下,給定一組輸入和輸出數(shù)據(jù)(X,Y),參數(shù)估計方法通過擬合尋找函數(shù)的具體關系式:
其中α是模型參數(shù),擬合的過程就是在全部訓練數(shù)據(jù)集對(xi,yi)樣本上最小化準則函數(shù)J(α).模型建立后,可以利用這個模型計算新的輸入數(shù)據(jù)x~的輸出估計值y~.與參數(shù)模型相比,KNN算法屬于非參數(shù)估計技術,基于KNN算法的降水量預報模型不關心公式(1)中函數(shù)g的具體形式,而是在全部訓練數(shù)據(jù)對樣本集也就是歷史降水樣本數(shù)據(jù)集(xi,ci)(ci是降水樣本xi的所屬類別)上尋找關于待預報樣本x~的k近鄰子集待預報降水樣本被分類為k近鄰子集T中出現(xiàn)最多的那個類別,如公式(2)所示.
若
則x∈ct.
研究表明[20-21],基于KNN的分類算法都是以訓練樣本集合中類分布基本平衡為假設前提的,在不均衡數(shù)據(jù)集上的分類效果傾向于多數(shù)類.曾曉青在文獻[16]中也指出,對于有無降水來說,有無中雨或有無大雨等類型的天氣樣本數(shù)是不均衡的,特別是在北方地區(qū).因此,對于北京市降水量預報這一降水量樣本不均衡的問題,基于KNN算法的降水量預報方法將導致待預報日的降水量類別預報(分類)錯誤.如圖1所示,以歷史降水樣本集合中包含無雨和暴雨兩個降水量類別為例.顯然,相較于無雨類別,暴雨類中包含的樣本數(shù)量較少,即降水量樣本集的分布是不均衡的.由圖1可見,根據(jù)基于KNN算法的降水量預報模型即公式(2)計算可得,待預報降水樣本屬于降水樣本較多的無雨類.然而,該預報樣本事實上應該屬于暴雨類.因此,樣本數(shù)量的嚴重不均衡導致了KNN分類器判別錯誤.
圖1 不均衡數(shù)據(jù)集上的基于KNN算法降水量分類
針對降水量預報中歷史降水樣本集不均衡問題,本文將局部均值偽最近鄰算法用于構建降水量預報模型.局部均值偽最近鄰算法首先在歷史降水樣本集的每一類別中尋找待預報降水樣本的k個近鄰樣本,然后計算這k個近鄰樣本的局部均值向量,并分別賦予這k個局部均值向量不同的權重,最后根據(jù)待預報降水樣本的k局部均值向量得到該待預報降水樣本的偽近鄰來進行分類.下面首先介紹基于LMPNN算法降水量預報模型所用到的資料,然后給出LMPNN算法,最后應用LMPNN算法構建北京市降水量預報模型.
基于LMPNN算法的降水量預報模型的歷史降水樣本集采用的降水實況數(shù)據(jù)集和因子場資料如下所示.
(1)本文采用的降水實況數(shù)據(jù)集來源于北京市氣象信息中心提供的20個國家站2006-2010年6-8月北京市逐日20:00到次日20:00的24 h降水量實況.將實況集中的樣本按照降水量進行分類,分別把無雨、小雨、中雨、大雨、暴雨五類標記為{0,1,2,3,4}.由于氣象部門的降水量分類類別太多,且不同降水量類別有重疊現(xiàn)象,本文采用了防汛部門的24 h降水量劃分法來對降水量進行劃分,具體劃分標準見表1.
表1 降水量等級劃分
(2)因子場資料選取的是2.5°X2.5°的美國國家環(huán)境預報中心(National Centers for Environmental Prediction,NCEP)全球格點資料,利用NCL軟件讀取地面和高空1000~50 hPa資料,范圍為107.5°~125°E,30°~47.5°N,包括溫度場、位勢高度場、徑向風速場、濕度場、地面可降水量場.
預報因子場范圍和預報因子的好壞直接影響預報效果,參考文獻,本文最優(yōu)預報因子場范圍和因子的選擇如下:
考慮到預報地北京市的地理位置(東經116.3°,北緯39.9°),選取以北京為中心,范圍為12.5~12.5經緯度(即112.5°~120°E,35°~42.5°N,總共4X4個格點)作為最優(yōu)因子場的范圍.
選取的預報因子如表2所示.為了避免各項預報因子量級的差異,對預報因子進行歸一化處理,從而達到消除不同單位和量綱影響的目的[22-23],歸一化公式如下所示.
表2 降水預報選取的預報因子
(1)計算測試樣本x與類ωi,i=1,2,……M的類子集Tωi中各樣本的歐式距離,即d根據(jù)該距離獲得測試樣本在Tωi中距離最近的k個訓練樣本,并將這k個訓練樣本按照其與測試樣本x的距離由小到大的順序排列,記為
(4)設測試樣本x在類ωi,i=1,2,…,M中的局部均值偽近鄰(Pseudo Nearest Neighbor,PNN)是滿足如下約束函數(shù)
(5)定義ωi,i=1,2,…,M類的判別函數(shù)是f(ix)=d,決策規(guī)則為:若
則決策x∈ωi.
顯然,由LMPNN算法的步驟(1)可知,不同于傳統(tǒng)KNN算法在整個訓練樣本集即歷史降水樣本數(shù)據(jù)集里搜索k近鄰,LMPNN算法在每類訓練樣本集合里搜索k近鄰,考慮了未分類樣本在每類訓練樣本里的最近鄰信息,這也就采用了分而治之的思想來降低訓練樣本集上樣本分布不均衡對正確分類造成的影響.由LMPNN算法的步驟(2)、步驟(3)和步驟(4)可知,該算法在每類訓練樣本集合里搜索得到k近鄰后,計算這k個近鄰樣本的局部均值向量,這也就充分利用了每類訓練樣本集的整體均值信息.特別是根據(jù)待預報降水樣本與這k個局部均值向量距離的遠近來添加不同權值,這又進一步采用權值的方法來改進在不平衡數(shù)據(jù)集中的預報性能.因此,應用該局部均值偽近鄰算法構建北京市降水量預報模型將會提高該地區(qū)降水量預報的預報效果.
應用LMPNN算法構建的北京市降水量預報模型可表述如下:
用xi,i=1,2,…,n表示第i個歷史降水樣本,采用上文3.1節(jié)選取的預報因子作為該樣本的特征,即xi=(xi1,xi2,…,xim)其中xij表示第i個樣本的j個氣象因子,xij是利用公式(3)進行歸一化處理后的因子值.此外,yi,i=1,2,…,n表示樣本日第二天的降水量類別yi∈{0,1,2,3,4}.因此,基于LMPNN算法的降水量預報模型的歷史降水樣本集如式(8)所示,該樣本集包括M=5類.
另外,給出待預報樣本如公式(9)所示,
基于LMPNN算法的降水量預報模型可表述為:
若
則預報結果是x∈c.
本文提出的基于局部均值偽最近鄰算法的降水量預報模型中需要確定的參數(shù)是k,也就是待預報樣本搜索得到的近鄰樣本的個數(shù).在k值的選擇中,采用交叉驗證的方法獲取最優(yōu)k值.首先確定某一k值,本文從k=1開始.把訓練樣本平均分成10份,取訓練樣本中一部分(占訓練樣本的29%)作為試預報樣本集即測試樣本集,剩余部分作為訓練樣本集(占訓練樣本的71%),通過不斷地交叉更換預報樣本,直到遍歷整個樣本集為止.然后再改變k值,重復上述過程,直到k值實驗完畢.事實上,由2.1節(jié)所述的LMPNN算法易知,k值應小于等于所有訓練樣本類中含最少樣本類中的樣本數(shù)目值即k≤min{Ny}i=1,2,…,M.
對于上述預測結果采用2種評分標準,分別是準確率和TS評分:
TS(Threat Score)評分是目前國內外降水評估最常用的一個評判工具[24].為了取得較好的預報效果,既考慮總體樣本的準確率,又要考慮TS評分.本文提出如下k值選擇公式:
經過交叉驗證,選出準確率和TS評分都達到最優(yōu)的k值也就是說使得公式(13)中(1-準確率)與(1-TS)的和取最小值時對應的k值作為最優(yōu)k值.
本文以北京地區(qū)6、7、8月的降水量為研究對象,以2006-2009年6-8月的數(shù)據(jù)作為訓練樣本,以2010年6、7、8月的24 h降水量為測試樣本.根據(jù)2.3節(jié)所述的應用局部均值偽最近鄰算法構建的降水量預報模型,制作2010年6、7、8月的逐日24 h降水量預報實驗.本實驗在Eclipce3.7.2下采用Java語言編程實現(xiàn),硬件環(huán)境為Inter Core i7-6700 CPU 3.40GHz.
首先由2.3節(jié)所述的k值選擇方法,通過交叉驗證方法,交叉變換訓練樣本中的測試樣本集,選出準確率和TS評分都達到相對最優(yōu)的k值即k=5.然后根據(jù)選取的最優(yōu)k值,制作2010年6、7、8月的逐日24 h降水量預報.為了直觀反映本文應用LMPNN算法構建的降水量預報模型的預報效果,并與傳統(tǒng)的基于KNN算法的降水量預報模型進行比較,制作2010年6-8月的實際觀測和預報降雨量的降水量預報效果圖,如圖2、圖3和圖4所示.為了公平起見,基于傳統(tǒng)KNN算法的降水量預報方法的因子場采用與本文提出的降水量預報方法相同的因子場如本文2.1節(jié)所述.
圖2 2010年6月兩種預報方法的預報效果及觀測降水量
圖3 2010年7月兩種預報方法的預報效果及觀測降水量
圖4 2010年8月兩種預報方法的預報效果及觀測降水量
由圖2~4分析得到2010年6-8月北京地區(qū)兩種降水量預報方法的預報準確率如表3所示.由表3可見,相比傳統(tǒng)的基于KNN算法的降水量預報方法的準確率,基于LMPNN算法的降水量預報方法的準確率分別高出3.34%,12.91%,12.91%.由分析結果可以看出,本文提出的基于LMPNN算法的降水量預報方法具有較好的預報效果.此外,對2010年6-8月北京地區(qū)的降水樣本進行了統(tǒng)計,統(tǒng)計結果顯示,2010年6-8月并無暴雨樣本,因此本文對降水樣本中無雨、小雨、中雨、大雨這4個等級進行了預報,如表4所示.由表4可見,基于LMPNN算法的降水量預報方法的等級預報準確率和晴雨預報的TS評分略高于傳統(tǒng)的基于KNN算法的降水量預報方法.由晴雨預報的TS評分公式(12)可知,對于無雨這一降水量級,該等級中的樣本均是負樣本即無雨的情況而沒有正樣本,因此,對無雨這一等級進行晴雨預報時TS評分應均為0%,如表4所示.
表3 2010年6-8月兩種降水量預報方法的預報準確率對比
表4 2010年6-8月兩種降水量預報方法的分級預報準確率和TS評分對比
為了進一步驗證本文提出的降水量預報方法的性能,對2010年6-8月逐日20:00-20:00 24 h降水量進行大于或等于0 mm的晴雨預報.晴雨預報采用國內外公認的降水量預報評價標準TS評分、正樣本概括率、漏報率和空報率來評估本文所提出的降水量預報方法的晴雨預報效果.TS評分公式如2.3節(jié)公式(12),空報率和漏報率計算公式如式(14)、(15)和(16).
2010年6-8月總共92 d的逐日24 h晴雨預報效果如圖5、圖6所示.圖5、圖6是上述兩種方法晴雨預報的TS評分、正樣本概括率、空報率和漏報率.根據(jù)圖5的TS評分和正樣本概括率結果可知,傳統(tǒng)的基于KNN算法的降水量預報方法的2010年6-8月晴雨預報的TS評分和正樣本概括率分別是67.14%、79.66%,而本文提出的基于LMPNN算法的預報方法分別為78.57%、93.22%,分別比基于KNN算法的降水量預報方法的評分高11.43%、13.56%.由圖6易見,傳統(tǒng)的基于KNN算法的降水量預報方法的晴雨預報的空報率和漏報率分別是18.97%、20.34%,而LMPNN方法僅為16.67%、6.78%,分別比傳統(tǒng)方法降低了2.3%和13.56%.這也就表明,本文提出的基于LMPNN算法的降水量預報方法在做晴雨預報時,更多地減少了漏報,對空報情況也有所改進.因此,由以上分析結果可以看出,本文提出的應用LMPNN算法構建的北京市降水量預報模型的定量降水預報能力及預報可信度均得到很大提高.
圖5 2010年6-8月兩種預報方法的TS評分和正樣本概括率對比
圖6 2010年6-8月兩種預報方法的空報率和漏報率對比
以北京市降水量為研究對象,針對降水預報中降水樣本數(shù)不均衡的問題,應用局部均值偽最近鄰算法構建降水量預報模型,制作了北京地區(qū)降水量預報.本文所提出的降水量預報方法對于降水等級預報的預報準確率以及對于晴雨預報的TS評分、正樣本概括率、空報率和漏報率明顯優(yōu)于傳統(tǒng)的基于KNN算法的預報方法,具有較好的預報效果.此外,本文提出方法的空報率和漏報率均較小,使得預報的可信度得到很大提高.然而,基于LMPNN算法的降水量預報方法選取了與已有參考文獻中相似的預報因子場,顯然不十分合理,具有很大的局限性.事實上,因子場的好壞直接影響預報效果,有效的預報因子場選擇方法有助于提高預報水平.因此,合理的最優(yōu)預報因子場選擇方法是下一步工作中需要改進的地方.
[1] Jermey P M,Renshaw R J.Precipitation representation over a two-year period in regional reanalysis[J].Q J R Meteorol Soc,2016,142(696):1300-1310.
[2] Huang Y J,Cui X P,Li X F.A three-dimensional WRF-based precipitation equation and its application in the analysis of roles of surface evaporation in a torrential rainfall event[J].Atmospheric Research,2016,169(123):54-64.
[3] Balana B B,Vinten A,Slee B.A review on costeffectiveness analysis of agri-environmental measures related to the EU WFD:Key issues,methods,and applications[J].Ecological Economics,2011,70(6):1021-1031.
[4] Ross I,Misson L,Rambal S,et al.How do more extreme rainfall regimes affect ecosystem fluxes in seasonally water-limited Northern Hemisphere temperate shrublands and forests?[J].Biogeosciences Discussions,2011,8:9813-9845.
[5] Dubus L.Monthly and seasonal forecasts in the French powersector [C].In ECMWF SeminarProceedings:Seasonal Predictions,ECMWF:Reading,UK,2012:131-142.
[6] Qiu X X,Zhang F Q.Prediction and predictability of a catastrophic local extreme precipitation event through cloud-resolving ensemble analysis and forecasting with Doppler radar observations [J].Science China Earth Sciences,2016,59(3):518-532.
[7]陳凱,王立松.一種新的加權最近鄰算法的降水預報試驗[J].計算機仿真,2014,31(6):325-328.
[8] 劉還珠,趙聲榮,陸志善,等.國家氣象中心氣象要素的客觀預報-MOS系統(tǒng)[J].應用氣象學報,2004,15(2):181-191.
[9] 邵明軒,劉還珠,竇以文.用非參數(shù)估計技術預報風的研究[J].應用氣象學報,2006,17:125-128.
[10] 翟宇梅,趙瑞星.概率天氣預報的K近鄰非參數(shù)估計仿真模型[J].系統(tǒng)仿真學報,2005,17(4):786-788.
[11] 閔晶晶,孫景榮,劉還珠,等.一種改進的BP算法及在降水預報中的應用[J].應用氣象學報,2010,21(1):55-62.
[12] 范嚴,程琳.實現(xiàn)準確預報的降水預報模型構建方法研究[J].計算機仿真,2013,30(2):351-363.
[13] 鄧小花,魏立新,黃煥卿,等.運用支持向量機方法對數(shù)值模擬結果的初步釋用[J].海洋預報,2015,32(2):14-23.
[14] CoverT M,HartP E.Nearestneighborpattern classification[J].IEEE Trans Inform Theory,1967,13:21-27.
[15] Song Y,Huang J,Zha H,et al.IKNN:Informative KNearest Neighbor Pattern Classification[C].Knowledge Discovery in Databases:PKDD,2007:248--264.
[16] 曾曉青,邵明軒,王式功,等.基于交叉驗證技術的KNN方法在降水預報中的試驗 [J].應用氣象學報,2008,19(4):471-478.
[17] Mitani Y,Hamamoto Y.A local mean-based nonparametric classifier[J].Pattern Recognition Letters,2006,27(10):1151-1159.
[18] Zeng Y,Yang Y,Zhao L.Pseudo Nearest Neighbor Rule forPattern Classification [J].ExpertSystems with Applications,2009,36(2):3587-3595.
[19] Gou J,Zhan Y,Rao Y,et al.Improved pseudo nearest neighbor classification[J].Knowledge-Based Systems,2014,70(C):361-375.
[20] 吳洪興,彭宇,彭喜元.適用于不平衡樣本數(shù)據(jù)處理的支持向量機方法[J].電子學報,2006,34(12A):2395-2398.
[21] 杜娟,劉志剛,衣治安.一種適用于不均衡數(shù)據(jù)集分類的KNN算法 [J].科學技術與工程,2011,11(12):2680-2685.
[22] 劉賽艷,黃強,王義民,等.基于統(tǒng)計降尺度和CMIP5模式的涇河流域氣候要素模擬與預估[J].農業(yè)工程學報,2015,31(23):138-144.
[23] 韓越.基于TOPMODEL模型的涇河流域水資源演變規(guī)律研究[D].西安:西安理工大學,2014.
[24] MCLOYMC.Severe storm forecast results from the PROFS 1983 forecast experiment[J].Bull Amer Mteoro Soc,1986,63:155-164.
Application of Local Mean-based Pseudo Nearest Neighbor Algorithm in Precipitation Forecast
LIN Runsheng,HUANG Mingming*
(Beijing Meteorological Information Center,Beijing 100089,China)
After analyzing daily precipitation data in Beijing city,the number of heavy rainfall events or torrential rainfall events,as compared to the number of other events such as no rain events,light rain events and moderate rain events,is significantly few.Therefore,the precipitation data of precipitation forecast in Beijing city is imbalance.In the case of the precipitation data with an uneven distribution,the forecast performance of the traditional k-nearest neighbor algorithm based precipitation forecast method will degrade dramatically due to the classification error rate of the k-nearest neighbor algorithm rising greatly.To overcome the problem which is the sample size of the precipitation forecast in Beijing city is not balanced,the precipitation forecast model is established using Local Mean-based Pseudo Nearest Neighbor(LMPNN)algorithm.Using the observed precipitation data in Beijing as the class and factors of the National Centers for Environmental Prediction-National Center for Atmospheric Research reanalysis dataset as the feature of the sample,we firstly calculated the local mean-based pseudo nearest neighbor of the sample in each class and then obtained the class label of the sample by the LMPNN rule.The extensive experiments of 24 hour precipitation forecast of Beijing city from June 1st to August 31st in 2010 were conducted.The proposed approach could get more accuracy,threat score,summary alarm rate,false alarm rate and missing alarm rate than that of the precipitation forecast method based on k-nearest neighbor algorithm.The comprehensively experimental results suggest that the proposed approach is effective.
local mean-based pseudo nearest neighbor algorithm;k-nearest neighbor algorithm;precipitation
P456.1
A
1002-0799(2017)05-0001-08
林潤生,黃明明.局部均值偽最近鄰算法在降水預報中的應用[J].沙漠與綠洲氣象,2017,11(5):1-8.
10.12057/j.issn.1002-0799.2017.05.001
2017-02-23;
2017-03-09
預報預測核心業(yè)務發(fā)展專項quot;基于云計算環(huán)境的氣象數(shù)據(jù)環(huán)境應用試驗quot;(CMAHX20160701)資助.
林潤生(1962-),男,高級工程師,主要研究方向為氣象信息技術研究和開發(fā).
黃明明(1986-),女,博士,主要研究方向為機器學習、模式識別.E-mail:mmhuang1205@163.com