• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    2010年云南復(fù)雜山地年降水量精細(xì)化分布研究

    2021-11-20 10:55:48楊鵬武王學(xué)鋒范立張楊曉鵬
    關(guān)鍵詞:插值法格點(diǎn)氣象站

    楊鵬武 王學(xué)鋒 范立張 楊曉鵬

    (云南省氣候中心,昆明 650034)

    0 引言

    精細(xì)化降水量信息對(duì)于區(qū)域水資源管理、旱澇災(zāi)害預(yù)防、環(huán)境治理等方面均具有重要意義,隨著大氣數(shù)值模式的不斷發(fā)展,氣象要素模擬方面取得了長(zhǎng)足的進(jìn)展,但由于降水產(chǎn)生的內(nèi)部機(jī)理尚不完全明確,準(zhǔn)確模擬區(qū)域降水較為困難,對(duì)于復(fù)雜下墊面更難以實(shí)現(xiàn)。近年來(lái),氣象部門加大了區(qū)域氣象站的建設(shè),已具備一定規(guī)模,通過一些技術(shù)處理,可以獲得較高精度的區(qū)域雨量分布。降水隨時(shí)空而變化,主要依賴于大氣、地理、地形等多種因素,而僅考慮地理地形影響下的降水,反映的是降水量分布的一種準(zhǔn)常態(tài),對(duì)分析月、年、年際等較長(zhǎng)時(shí)間尺度的降水量分布比較適合。不少學(xué)者建立降水與地理地形因子間的關(guān)系,推算降水量的空間分布及變化,如Ollinger等建立了北美地區(qū)降水等氣象要素與地理位置、地形高程等的回歸模型;黃煒等建立了年、季降水量和地理、地形因子(包括緯度、經(jīng)度、地形高程、坡度、坡向和遮蔽度)的關(guān)系模型。

    通常估算降水量空間分布的方法有3種:整體法、空間局部插值法和混合法。整體法是用數(shù)學(xué)表達(dá)式來(lái)描述降水量與影響因子之間關(guān)系的一種估算方法,包括趨勢(shì)面法、多元回歸法等,如Cross等運(yùn)用多元回歸法建立了菲律賓氣溫和降水回歸模型,提高了血吸蟲病發(fā)生氣象條件的預(yù)測(cè)精度;空間局部插值法是僅僅用臨近點(diǎn)的降水?dāng)?shù)據(jù)來(lái)估計(jì)未知點(diǎn)的降水值,包括泰森多邊形法、反距離權(quán)重法(IDW)、克里金法(Kriging)等,莊立偉等比較了東北日降水的空間插值方法,認(rèn)為IDW方法優(yōu)于克里金法;混合法是在整體法估算空間降水的基礎(chǔ)上,用空間局部插值法對(duì)殘差值進(jìn)行局部插值,該方法可以有效提高估算度。Vicente-Serrano等用多種插值方法對(duì)西班牙埃布羅河谷地的降水進(jìn)行估算,經(jīng)過對(duì)比,發(fā)現(xiàn)用多元回歸法結(jié)合克里金插值的混合法估算的區(qū)域降水效果最理想。

    雖然以上3種方法在估算降水量空間分布方面得到了廣泛的應(yīng)用,但各有不足,其中,整體法雖然考慮了降水的影響因子,但由于將整個(gè)分析區(qū)域考慮為一個(gè)單一類型,在研究范圍較小時(shí)效果較好,但對(duì)較大范圍的降水空間分布卻難以給出準(zhǔn)確的估算;局部插值方法是僅通過鄰近測(cè)點(diǎn)降水信息、空間相關(guān)等來(lái)估計(jì)待插點(diǎn)的降水量,由于較少考慮降水影響因子,插值效果往往不理想;混合法雖然是整體插值法與局部插值法的結(jié)合,但是仍然以整體插值法為基礎(chǔ),并沒有解決將所有站點(diǎn)僅劃為一個(gè)單一降水類型的局限。

    通過分析以上3種插值方法的不足,并針對(duì)云南山高谷深、降水差異大的特點(diǎn),本文提出一套以氣象站數(shù)據(jù)為基礎(chǔ),結(jié)合格點(diǎn)地形數(shù)據(jù),應(yīng)用主成分分析、聚類分析、判別分析及混合插值法(多元線性擬合結(jié)合空間局部插值法)來(lái)推算云南年降水量精細(xì)化(1 km×1 km格點(diǎn))空間分布的方法。

    1 資料及方法

    1.1 資料選取

    1)站點(diǎn)資料:為了檢驗(yàn)上述方法的適應(yīng)性,本文選取云南一個(gè)典型干旱年份2010年進(jìn)行分析,并通過分析結(jié)果了解當(dāng)年降水的空間分布,資料為經(jīng)過質(zhì)控的125個(gè)國(guó)家氣象站及1055個(gè)區(qū)域氣象站逐時(shí)降水資料及各站點(diǎn)的經(jīng)度、緯度、海拔高度資料。

    2)數(shù)字高程資料(DEM):為了獲取云南各氣象站的坡度、坡向數(shù)據(jù)及全省1 km×1 km格點(diǎn)地理、地形數(shù)據(jù)(經(jīng)度、緯度、海拔、坡度、坡向),本研究使用了由美德聯(lián)合研制的約90 m分辨率SRTM V4.1 DEM數(shù)據(jù),其中氣象站的坡度、坡向直接由90 m分辨率DEM計(jì)算得出,1 km×1 km格點(diǎn)地理、地形數(shù)據(jù)是通過對(duì)90 m分辨率DEM重新采樣后計(jì)算獲得,圖1為基于DEM的云南地形圖。

    圖1 云南地形圖Fig.1 Yunnan topographic map

    1.2 技術(shù)方法

    采用主成分分析(PCA)、K-means聚類分析、多元線性擬合、樸素貝葉斯分類、Kriging插值、IDW插值等方法對(duì)2010年云南年降水量空間精細(xì)化(1 km×1 km格點(diǎn))分布進(jìn)行研究,并通過K-fold交叉驗(yàn)證法、相關(guān)系數(shù)(

    r

    )、平均相對(duì)誤差(MRE)等方法進(jìn)行結(jié)果驗(yàn)證。其中K-means聚類法的關(guān)鍵是確定聚類數(shù),通常根據(jù)聚類有效性指標(biāo)來(lái)判斷不同聚類數(shù)的聚類效果,常用的聚類有效性的評(píng)價(jià)指標(biāo)有: Calinski-Harabasz(CH)指標(biāo)、Davies-Bouldin(DB)指標(biāo)、Silhouette(S)指標(biāo)[23-24]。

    2 氣象站年降水量分析

    2.1 多重相關(guān)性分析

    本文研究的是年降水量的空間分布,由于時(shí)間尺度較大(準(zhǔn)常態(tài)),如前言所述,僅考慮地理、地形因子便可以較好地反映年降水量分布特征,本文選取的地理、地形因子(以下簡(jiǎn)稱因子)分別為經(jīng)度(

    λ

    )、緯度(

    φ

    )、高程(

    h

    )、坡度(

    α

    )和坡向(

    β

    ),由于原始因子之間往往存在較強(qiáng)的相關(guān)性,所代表的信息相互重疊,直接應(yīng)用常常會(huì)增大模型誤差、破壞模型穩(wěn)定性。因此,在應(yīng)用之前需要對(duì)因子進(jìn)行多重相關(guān)性分析。表1 給出了因子之間及與2010年降水量的相關(guān)系數(shù)(

    r

    ),從表中可以看出:

    r

    (

    φ

    ,

    h

    )接近0.5,說明云南氣象站的緯度和海拔具有較高的線性關(guān)系,這主要因?yàn)樵颇系匦纬蕱|南低、西北高分布,與緯度的南北分布比較相近所致。為了消除因子之間的高線性,簡(jiǎn)單的處理就是刪除那個(gè)與年降水量相關(guān)性不顯著的因子,但從

    r

    (

    φ

    ,

    p

    )=-0.30、

    r

    (

    h

    ,

    p

    )= -0.23(均通過了0.01的顯著性檢驗(yàn))可以看出,無(wú)論緯度、還是海拔都與年降水有比較密切的關(guān)系,剔除哪個(gè)都是不合適的。

    表1 自變量相關(guān)性分析Table 1 Correlation analysis of independent variable

    2.2 消除因子間高相關(guān)性

    PCA是目前消除因子間高相關(guān)性效果較好的方法,PCA是從原始因子中選取一個(gè)特征子集,該子集在消除相關(guān)及冗余特征的同時(shí),具有更好的分離度。為了便于后面分析的一致性,本文將氣象站因子和1 km×1 km格點(diǎn)因子一起進(jìn)行PCA分析,將得到的特征值按從大到小排列,并計(jì)算各主成分的累積方差貢獻(xiàn)率(圖2),可以看出,第一主成分的方差貢獻(xiàn)率已經(jīng)接近50%,而前3個(gè)主成分的累積方差貢獻(xiàn)率超過90%,說明前3個(gè)主成分已經(jīng)能夠較好地反映原因子的主要特征,因此,選取前3個(gè)特征值對(duì)應(yīng)的特征向量生成因子主成分。通過PCA變換消除了因子之間的高相關(guān)性,然后用因子主成分直接對(duì)全省氣象站年降水量進(jìn)行擬合,發(fā)現(xiàn)擬合結(jié)果并不理想,主要原因是因?yàn)樵颇系乩砜缍容^大,局部地形復(fù)雜,所有氣象站僅用一個(gè)擬合方程,必然存在較大的誤差,為了減少誤差,對(duì)氣象站點(diǎn)進(jìn)行分類擬合是必要的。

    圖2 主成分特征值及累計(jì)比率Fig.2 Principal component characteristic value andcumulative ratio

    2.3 降水分類

    聚類分析是當(dāng)前研究數(shù)據(jù)分類的熱門方法,而K-means是一種典型的基于歐式距離的聚類算法,該算法認(rèn)為兩個(gè)對(duì)象的距離越小,相似度越大;距離越大,相似度就越小。應(yīng)用K-means對(duì)氣象站年降水進(jìn)行分類,選擇的聚類因子為:氣象站年降水量及PCA生成的因子主成分。K-means的難點(diǎn)是確定最佳聚類數(shù),目前通常的做法是先確定聚類數(shù)

    k

    的測(cè)試范圍[

    k

    ,

    k

    ],然后進(jìn)行逐個(gè)測(cè)試,從中選取最佳聚類數(shù)。其中,下限

    k

    一般從2開始,但考慮到云南省較大的地理跨度及復(fù)雜的下墊面分布,較少的分類無(wú)法反應(yīng)年降水量的真實(shí)特征,因此本文將下限

    k

    設(shè)定為4。上限

    k

    通過經(jīng)驗(yàn)公式

    k

    ≤來(lái)確定,其中

    n

    為氣象站數(shù)。通過計(jì)算,本研究的聚類數(shù)測(cè)試范圍為,對(duì)測(cè)試范圍的不同聚類數(shù)進(jìn)行K-means分析,然后通過

    DB

    S

    CH

    這3個(gè)指標(biāo)檢驗(yàn)聚類效果,結(jié)果發(fā)現(xiàn),

    S

    、

    CH

    指標(biāo)均在聚類數(shù)為5時(shí),達(dá)到了最優(yōu)值,而

    DB

    指標(biāo)在聚類數(shù)為4時(shí)聚類效果最佳,為5時(shí)次之。

    繪制聚類數(shù)為5時(shí)的2010年氣象站年降水分類圖(圖3),圖中1~5類不僅體現(xiàn)了各氣象站局部地理、地形差異,更主要體現(xiàn)了降水量從少到多的分布,圖中可以看出,既可以明顯區(qū)分哀牢山以東、以西兩側(cè)作為西南暖濕氣流迎風(fēng)坡和背風(fēng)坡的降水類型差異,也可以識(shí)別出西部、南部邊緣地帶的多雨形態(tài),同時(shí),各個(gè)類型的樣本數(shù)比較均勻(最多、最少類型占?xì)庀笳颈壤謩e為:25.5%、15.3%),可以有效避免多項(xiàng)式擬合時(shí)出現(xiàn)過擬合或者欠擬合現(xiàn)象。因此,將云南省2010年降水分為5類是比較合理的。

    圖3 聚類數(shù)為5時(shí)的2010年氣象站降水分類圖Fig.3 Clustering map of weather stations in 2010 whenthe clustering number is 5

    2.4 回歸方程擬合

    聚類完成后,便可以針對(duì)每種降水類型擬合多元線性回歸方程。方法是:每種類型都隨機(jī)選取80%的站點(diǎn)作為建模數(shù)據(jù),其余20%數(shù)據(jù)用作效果檢驗(yàn)。所有擬合方程均通過了0.01的顯著性

    F

    檢驗(yàn),說明方程的擬合是有效的,同時(shí),檢驗(yàn)數(shù)據(jù)的實(shí)測(cè)值與擬合值的

    r

    值均在0.44以上,且MRE值均小于0.30,說明方程的泛化能力比較令人滿意。

    3 格點(diǎn)年降水量分析

    3.1 格點(diǎn)歸類

    為了計(jì)算云南格點(diǎn)年降水量分布,首先需要將全省所有格點(diǎn)歸類到2.3節(jié)生成的不同降水類型中,然后通過各類型的回歸方程計(jì)算格點(diǎn)年降水量。樸素貝葉斯法(BC)是大數(shù)據(jù)分析中較為常用的歸類方法,該方法邏輯簡(jiǎn)單、易于實(shí)現(xiàn)。應(yīng)用BC歸類,首先需要建立BC模型,即在訓(xùn)練集合上得到建模各要素的先檢概率,本文建模要素為氣象站的因子主成分及所屬類別(用1~5表示)。為了構(gòu)建最合適的模型,本文采用K-fold交叉驗(yàn)證法(記為K-CV)進(jìn)行模型構(gòu)建,該方法將全省氣象站點(diǎn)隨機(jī)均分成K組,將每組的數(shù)據(jù)分別充當(dāng)一次驗(yàn)證數(shù)據(jù)集,其余的K-1組的數(shù)據(jù)集作為訓(xùn)練數(shù)據(jù)集,K-CV可以有效地避免過學(xué)習(xí)、欠學(xué)習(xí)的狀態(tài)發(fā)生。本文取

    K

    =10,通過K-CV法訓(xùn)練BC模型,

    結(jié)果表明平均判錯(cuò)站數(shù)為5,占檢驗(yàn)站點(diǎn)比率為0.42%,最差組的判錯(cuò)站數(shù)為8,占檢驗(yàn)站點(diǎn)比率為0.68%,最好組的判錯(cuò)站數(shù)為1,占檢驗(yàn)站點(diǎn)比率僅為0.08%。從分析可以得到,無(wú)論哪個(gè)分組都有很好的判別能力,本文選擇出錯(cuò)率最小的第2組進(jìn)行建模,然后對(duì)各格點(diǎn)進(jìn)行歸類。

    3.2 格點(diǎn)年降水量推算

    對(duì)歸類的各格點(diǎn)分別應(yīng)用第2.4節(jié)生成的擬合方程進(jìn)行格點(diǎn)年降水量擬合,生成全省2010年格點(diǎn)降水量分布圖(圖4),從圖中可以清晰地分辨出哀牢山以西的多雨區(qū)和以東的少雨區(qū),但是由于擬合值趨于平滑(主要集中在600~1200 mm),對(duì)局地降水特點(diǎn)表現(xiàn)不足,同時(shí)不同降水量級(jí)的區(qū)域比較規(guī)則,與實(shí)際有一定差別,因此需要進(jìn)一步訂正。

    圖4 云南2010年降水量擬合圖(單位:mm)Fig.4 Fitting diagram of precipitation in Yunnan in 2010(unit: mm)

    3.3 格點(diǎn)年降水量訂正

    用觀測(cè)值減去擬合值即為殘差(

    ε

    ),年降水量殘差可以看作是局地的氣候效應(yīng)。為了提高格點(diǎn)年降水量的估算精度,本文嘗試對(duì)站點(diǎn)年降水量

    ε

    進(jìn)行空間插值,獲得全省各格點(diǎn)處的

    ε

    值,然后把

    ε

    值與第3.2節(jié)生成的格點(diǎn)擬合值相加,生成格點(diǎn)年降水量訂正值。目前,克里金插值法(Griging) 和IDW法是常見的兩種空間插值方法,為了檢驗(yàn)兩種插值方法對(duì)云南年降水量的訂正效果,本文隨機(jī)選取80%的氣象站進(jìn)行全省年降水量

    ε

    空間插值,然后將插值結(jié)果與所有氣象站年降水量擬合值相加,生成氣象站年降水量訂正值,再用另外20%的氣象站對(duì)訂正值進(jìn)行檢驗(yàn)。檢驗(yàn)站點(diǎn)年降水量觀測(cè)值振幅較大,而擬合值比較平緩,與觀測(cè)值有一定的差別(MRE為0.25),通過IDW和Griging訂正后的年降水量振幅明顯增大,與觀測(cè)值比較貼合(MRE值分別0.17、0.19),說明訂正方法有效。由于IDW方法得到的MRE更小,因此,本文選擇IDW作為年降水量

    ε

    的插值方法。訂正后的云南省2010年1 km×1 km格點(diǎn)降水量分布圖(圖5),不僅克服了擬合圖中不同降水量級(jí)的區(qū)域比較規(guī)則的問題,而且格點(diǎn)極值與站點(diǎn)實(shí)測(cè)極值也比較接近(格點(diǎn)年降水量最大值、最小值分別為:3037,153 mm;氣象站分別為:2933,185 mm),同時(shí)也可以看出,2010年云南年降水分布非常不均,滇中及以南以西、滇西北北部的大部分區(qū)域降水量明顯較少,多不足800 mm,而滇西、滇南的邊緣區(qū)域降水量比較豐沛,多超過1200 mm,其他區(qū)域降水多處于800~1200 mm。

    圖5 云南2010年降水量訂正圖(單位:mm)Fig.5 Revised precipitation figure of Yunnan in 2010 (unit: mm)

    4 結(jié)論與討論

    本文通過以上的分析及驗(yàn)證,可以獲得以下結(jié)論。

    1)氣象模型所用的原始因子間往往存在多重相關(guān)性,會(huì)導(dǎo)致模型不穩(wěn)定、泛化能力差。PCA方法不僅可以降維去噪,生成的新因子互不相關(guān),同時(shí)還盡可能地保持了原有因子的信息,是消除因子間多重相關(guān)性的一種較好方法。

    2)利用K-means方法對(duì)站點(diǎn)年降水類型進(jìn)行聚類分析,不僅區(qū)分出哀牢山東、西兩側(cè)作為西南暖濕氣流迎風(fēng)坡和背風(fēng)坡的降水類型差異,也識(shí)別出西部、南部邊緣地帶的多雨形態(tài),得到了比較理想的分類結(jié)果,說明K-means方法在復(fù)雜山地降水分類方面具有較好的適應(yīng)性。

    3)在站點(diǎn)降水類型聚類的基礎(chǔ)上,利用樸素貝葉斯分類法對(duì)格點(diǎn)降水類型進(jìn)行歸類,樸素貝葉斯分類法雖然算法簡(jiǎn)單,但是如果所選因子與降水量的關(guān)系比較強(qiáng),同時(shí)因子之間獨(dú)立性較強(qiáng),分類效果會(huì)非常理想,因此樸素貝葉斯分類法是處理氣象信息分類的一個(gè)簡(jiǎn)潔而又準(zhǔn)確的分析方法。

    4)基于聚類之上的混合插值法,是對(duì)傳統(tǒng)混合法插值的發(fā)展,即結(jié)合了傳統(tǒng)混合插值法對(duì)局部地形影響地勾畫,又很好地與聚類方法相結(jié)合,對(duì)研究復(fù)雜地形下氣象因子精細(xì)化分布具有很好的應(yīng)用前景。

    5) 分析中還存在一些問題,即陡峭地形下的實(shí)測(cè)降水值與擬合值仍存在較大的差異,主要原因是復(fù)雜地形觀測(cè)站點(diǎn)仍然較少,無(wú)法更精細(xì)地刻畫地形對(duì)降水的影響所致,相信隨著今后氣象站點(diǎn)的不斷加密,會(huì)有所改進(jìn)。

    猜你喜歡
    插值法格點(diǎn)氣象站
    帶有超二次位勢(shì)無(wú)限格點(diǎn)上的基態(tài)行波解
    珠峰上架起世界最高氣象站
    一種電離層TEC格點(diǎn)預(yù)測(cè)模型
    《計(jì)算方法》關(guān)于插值法的教學(xué)方法研討
    心靈氣象站
    帶可加噪聲的非自治隨機(jī)Boussinesq格點(diǎn)方程的隨機(jī)吸引子
    格點(diǎn)和面積
    自動(dòng)氣象站應(yīng)該注意的一些防雷問題
    基于二次插值法的布谷鳥搜索算法研究
    Newton插值法在光伏發(fā)電最大功率跟蹤中的應(yīng)用
    沙湾县| 嵊州市| 黑河市| 章丘市| 彭泽县| 临夏市| 衡水市| 安义县| 大兴区| 明水县| 凤山市| 丰县| 利津县| 砚山县| 水城县| 徐汇区| 封丘县| 枣强县| 肥乡县| 临城县| 当雄县| 清河县| 保靖县| 宝兴县| 佛冈县| 石棉县| 阿克苏市| 肇源县| 肇州县| 锦屏县| 全椒县| 金华市| 化隆| 静安区| 通道| 那坡县| 乐平市| 申扎县| 兴安县| 七台河市| 茶陵县|