李巖松徐枝芳范廣洲李 平李澤椿
1)(成都信息工程學(xué)院高原大氣與環(huán)境四川省重點實驗室,成都610225)
2)(國家氣象中心,北京100081)
船舶海平面氣壓觀測資料質(zhì)量控制
李巖松1)2)徐枝芳2)*范廣洲1)李 平1)2)李澤椿2)
1)(成都信息工程學(xué)院高原大氣與環(huán)境四川省重點實驗室,成都610225)
2)(國家氣象中心,北京100081)
隨著數(shù)值預(yù)報模式不斷發(fā)展,各類觀測資料在數(shù)值模式中發(fā)揮著越來越重要的作用,船舶觀測資料是海上3類觀測系統(tǒng)(衛(wèi)星、飛機(jī)、船舶)資料之一。為了保障船舶觀測資料質(zhì)量并有效地應(yīng)用于數(shù)值模式,該文依據(jù)船舶觀測資料的時空分布特征,以及2011年1月和7月T639分析場與觀測資料對比分析結(jié)果,建立了一套船舶海平面氣壓資料質(zhì)量控制方案,包括要素極值范圍檢查、缺測和冗余資料剔除、背景場一致性檢查、測站黑名單建立等,并將該方案應(yīng)用于2011年2月、6月、8月的觀測資料。結(jié)果表明:船舶觀測資料在時間上不連續(xù)且空間分布不均勻,會影響時間一致性檢查和空間一致性檢查質(zhì)量控制效果;船舶海平面氣壓觀測資料在所有觀測要素中資料量最大,但其缺測和冗余資料量約占50%;黑名單資料的質(zhì)量控制方案能夠有效識別和剔除黑名單資料,且有利于對各測站的檢查與維修工作;由于五大湖和大奴湖地區(qū)地形高度的影響,在背景場一致性檢查過程中需對這些區(qū)域的背景場資料進(jìn)行訂正。
船舶觀測資料;質(zhì)量控制;黑名單;一致性檢驗
人們很早就通過各種海洋要素資料研究海洋,隨著科學(xué)技術(shù)的不斷發(fā)展和觀測手段的日益更新,海洋衛(wèi)星、氣象衛(wèi)星和飛機(jī)報已經(jīng)能夠提供大量長時間序列的觀測資料。衛(wèi)星是自上而下的觀測,易受云層和降水等因素的影響,繼而影響到洋面觀測資料的質(zhì)量,而飛機(jī)受航線的限制,對海面狀況的反映也不夠全面。船舶是對衛(wèi)星和飛機(jī)資料的重要補(bǔ)充,能夠幫助人們更加全面和客觀地認(rèn)識海洋環(huán)境。因此,不斷加深對船舶觀測資料的研究很有必要,而如何進(jìn)一步對船舶觀測資料進(jìn)行處理分析,最大限度發(fā)揮其使用價值,也一直是海洋研究工作的重要任務(wù)。
資料同化是提高數(shù)值模式預(yù)報能力的有效方法之一,而同化系統(tǒng)分析對資料中的錯誤和離群資料非常敏感。所謂錯誤資料,即沒有任何天氣學(xué)意義的資料,產(chǎn)生錯誤的原因可能是觀測失誤、觀測儀器故障、不正確的編碼、抄錄和資料傳輸錯誤等,附著在浮標(biāo)站的海洋生物也會對浮標(biāo)站的觀測和數(shù)據(jù)資料的傳輸造成影響,這些因素都會導(dǎo)致錯誤資料的出現(xiàn)。雖然錯誤資料在資料總數(shù)中只占有很小的比例,但錯誤資料不會因為計算分析而自動消失,它們會嚴(yán)重影響模式模擬效果,進(jìn)而產(chǎn)生不合理現(xiàn)象,甚至導(dǎo)致整個模擬結(jié)果失敗,造成很大浪費。離群資料就是與周圍觀測相差過大,或與資料同化的背景場差異過大,而造成模式初值不協(xié)調(diào)等問題的可疑資料。因此,在進(jìn)行資料同化分析之前,對原始觀測資料進(jìn)行質(zhì)量控制,正確識別錯誤和離群資料極其重要。隨著數(shù)值預(yù)報受到越來越多的關(guān)注與重視,以及對氣象觀測資料質(zhì)量要求的不斷提升,多種針對氣象資料的質(zhì)量控制技術(shù)也應(yīng)運(yùn)而生。為了充分發(fā)揮船舶資料的作用并保證資料的正確性,世界各國氣象科學(xué)研究者針對該資料及其質(zhì)量控制方法進(jìn)行了大量研究工作,郭豐義等[1]根據(jù)中美技術(shù)合作協(xié)議,對140萬站次的船舶海面觀測資料進(jìn)行了標(biāo)準(zhǔn)化處理,總結(jié)了一些行之有效的質(zhì)量控制方法,包括各環(huán)境要素資料屬性與變化范圍檢查、相關(guān)性檢驗和統(tǒng)計模型檢驗方法,并介紹了人工審查與計算機(jī)相結(jié)合如何處理可疑資料。王伯民等[2]就提高船舶觀測資料質(zhì)量的可能性,對資料的整理和統(tǒng)計方法進(jìn)行討論,詳細(xì)闡述了船舶觀測資料的特點,同時提出了海區(qū)的劃分方式以及各要素的統(tǒng)計方法,為船舶觀測資料的整理和統(tǒng)計提供了可用素材。潘錦嫦[3]探討了如何利用過往指定海區(qū)船只不定期、不連續(xù)的波浪與風(fēng)的船舶報觀測記錄,并在滿足統(tǒng)計學(xué)對采樣資料要有代表性與連續(xù)性要求的條件下分析了海區(qū)波況與風(fēng)況的研究方法,同時還以海南省南部海域的資料為例給出分析結(jié)果,表明該方法行之有效。王可光等[4]提出了一種與西北太平洋的常規(guī)海表溫度船舶報資料相適應(yīng)的客觀分析方法,并對1999年2月中旬和8月中旬的資料進(jìn)行了詳細(xì)分析,給出了在此基礎(chǔ)上的資料質(zhì)量控制方案——觀測矩平判別法和逐步訂正法;陳上及等[5]對海洋資料進(jìn)行了全面分析,不但對資料特性進(jìn)行了詳細(xì)描述,同時也總結(jié)了多種常用的質(zhì)量控制方法。朱江等[6]將最優(yōu)插值法應(yīng)用到對船舶報海表溫度資料的質(zhì)量控制方案中,簡單而又充分地利用了得到的資料信息。Richard[7]在利用調(diào)查船、浮標(biāo)和衛(wèi)星資料對1985年1月—1986年12月全球海表溫度的分析中,描述了調(diào)查船和浮標(biāo)資料的全球分布特征,并提出針對該資料的分析思路,包括如何處理出現(xiàn)漂移情況的浮標(biāo)資料,同時指出在分析資料的過程中最為關(guān)鍵的一步是對一種基于中位數(shù)的非線性過濾方法的使用。Seaman[8]介紹了近些年來澳大利亞氣象局在對海平面氣壓資料的質(zhì)量控制中所開發(fā)和使用的方法,從對資料系統(tǒng)性偏差的研究、間歇性錯誤資料的識別等方面分析了質(zhì)量控制的現(xiàn)狀、前景以及可能會遇到的問題。此外,飛機(jī)報、地面天氣報、高空資料和衛(wèi)星遙感產(chǎn)品等其他氣象資料的質(zhì)量控制方法[9-16]以及基本氣象資料質(zhì)量控制綜合辨別法[17]和綜合一致性質(zhì)量控制方法[18]的應(yīng)用在對船舶資料的質(zhì)量控制技術(shù)研究中也有一定的參考價值。
近年來,氣象觀測手段的不斷提升及數(shù)值預(yù)報的不斷發(fā)展,為研究提供了更加多樣化的船舶觀測資料,同時也為資料的質(zhì)量控制帶來了新的問題和挑戰(zhàn)。本文依據(jù)船舶觀測資料的時空分布特征以及與T639分析場的對比分析結(jié)果,結(jié)合國內(nèi)外先進(jìn)技術(shù)和經(jīng)驗,建立了一套適用的船舶海平面氣壓資料質(zhì)量控制方案,以確保資料的可用性。
本文使用的全球范圍船舶觀測資料來自國家氣象信息中心接收的全球通信系統(tǒng)(GTS)資料,資料時間為2011年1月、2月、6月、7月、8月;背景場資料為全球中期數(shù)值模式T639分析場海平面氣壓格點(水平分辨率為0.28125°×0.28125°)資料,資料時間與GTS觀測資料時間一致。
船舶觀測資料是對海洋進(jìn)行觀測調(diào)查的最初資料,直接反映了海洋中各要素的時空分布狀況,是進(jìn)行海洋科學(xué)研究和海洋資源開發(fā)利用等的重要依據(jù)。目前,船舶觀測資料主要以調(diào)查船(海洋天氣船、科學(xué)考察船、商船等)和無人自動浮標(biāo)站為觀測來源,調(diào)查船和無人自動浮標(biāo)站大部分為四定時(00:00,06:00,12:00,18:00,世界時,下同)天氣觀測報告,少數(shù)無人自動浮標(biāo)站有八定時(00:00,03:00,06:00,09:00,12:00,15:00,18:00,21:00)的天氣觀測報告。本文所使用的船舶觀測資料均為四定時。
通過對2011年1月和7月原始船舶觀測報告數(shù)及各要素報告數(shù)(圖略)的研究發(fā)現(xiàn),這兩個月觀測報告數(shù)隨時間變化普遍存在小幅波動,即不同時刻的觀測量并不同,偶爾存在大幅波動。由于政治、經(jīng)濟(jì)和天氣條件(如臺風(fēng)等)等因素的影響使得船舶不能全天候出海進(jìn)行觀測,且測站儀器故障得不到及時維修的情況時有發(fā)生,這些都造成了船舶觀測資料在時間上的不連續(xù)和不均勻。此外,各觀測要素中海平面氣壓要素資料最多,因此海平面氣壓資料更為重要,故在本文中以海平面氣壓要素為研究對象。
同時,對2011年1月船舶海平面氣壓資料的全球范圍分布情況(圖略)分析發(fā)現(xiàn):船舶海平面氣壓資料主要集中在中、低緯度洋面,且北半球資料數(shù)量明顯多于南半球。其中,大量的調(diào)查船是在航行中進(jìn)行氣象觀測,因而船舶海平面氣壓資料具有觀測站點不固定的特點。由于洋面廣闊且船舶常取固定航線航行,故資料多集中在航線附近,而位于近海的觀測站在數(shù)量上也超過在洋面上的觀測站,這使得船舶海平面氣壓資料的空間分布極不均勻。
雖然無人自動浮標(biāo)站可長期穩(wěn)定于固定的位置進(jìn)行連續(xù)的天氣觀測,但是分析發(fā)現(xiàn),浮標(biāo)站在長期觀測過程中會發(fā)生位置漂移,且在全球各海域皆有發(fā)生。
由以上分析可知,船舶海平面氣壓資料在時間上易存在不連續(xù)、且空間分布不均勻等特點,這會影響時間一致性和空間一致性檢查質(zhì)量控制效果,而通過背景場一致性檢查則能有效克服上述缺點。
本文選取2011年1月、2月、6月、7月、8月的船舶海平面氣壓資料進(jìn)行質(zhì)量控制,對資料分析時發(fā)現(xiàn)資料存在缺測和冗余情況,因此在對資料進(jìn)行質(zhì)量控制之前,需要對這類資料進(jìn)行一定的預(yù)處理:①剔除缺測值。極端惡劣天氣(如臺風(fēng)等)的影響,海洋生物和海水的侵蝕易導(dǎo)致觀測儀器和資料傳輸裝置故障,這些因素都會造成船舶觀測資料中出現(xiàn)要素缺測的情況。經(jīng)統(tǒng)計,資料數(shù)量相對較多的海平面氣壓要素缺測值占到了近11.5%,因此資料預(yù)處理首先就是剔除缺測值。②剔除冗余值。由于目前資料收集的時間窗為6 h,因此在同一同化時間窗中,相同測站在相同的地理位置可能出現(xiàn)多次觀測。本文將在同一同化時間窗中測站號和測站經(jīng)緯度完全相同的資料視為冗余資料。冗余資料是多余資料,必須給予剔除。對冗余資料進(jìn)行處理時,保留最靠近同化時間的觀測資料。該方法僅適用于數(shù)值預(yù)報的資料同化處理過程。
圖1給出了對2011年1月和7月的船舶海平面氣壓資料預(yù)處理前后資料數(shù)量的變化。由圖1可知,資料經(jīng)處理后資料剔除量非常大,約達(dá)50%,說明船舶資料缺測和冗余情況較常見。
圖1 2011年1月(a)和7月(b)船舶海平面氣壓資料預(yù)處理后資料數(shù)量變化情況Fig.1 The number of shipborne sea level pressure data after the data pre-processing in January(a)and July(b)of 2011
4.1 船舶海平面氣壓資料與背景場對比
在設(shè)計船舶海平面氣壓資料的質(zhì)量控制方案之前,先對資料特點進(jìn)行分析。圖2是2011年1月全球范圍內(nèi)船舶海平面氣壓資料與背景場對應(yīng)的散點分布圖,背景場是采用雙線性插值方法將T639分析場插到觀測站點。由圖2可見,部分資料觀測值非常小,不具有觀測意義,因此對觀測資料進(jìn)行極值檢查必不可少。圖2中除了隨機(jī)分布的離群資料外,還有部分分布情況較特殊的資料(如圖2中框內(nèi)所示的兩部分觀測資料)。
圖2中Ⅰ框范圍內(nèi)資料呈現(xiàn)一條豎直直線分布特征,這表明觀測值在某一固定值不隨時間變化。分析發(fā)現(xiàn),這部分觀測資料是由不同測站資料組成,圖3分別列舉了2011年1月測站21915和測站41972的觀測情況。由圖3可見,兩個測站的觀測記錄在一段時間內(nèi)均固定不變,使用這種資料易造成負(fù)面影響。對2011年1月和7月的觀測資料分析發(fā)現(xiàn),這樣的情況不但常見,而且每個月的情況不同。對觀測值落在豎直線上的其他資料隨機(jī)抽樣統(tǒng)計發(fā)現(xiàn),2011年1月測站W(wǎng)XN31海平面氣壓為1000.00 hPa的觀測記錄占總觀測記錄的86.21%,測站21542海平面氣壓為1023.90 hPa的觀測記錄占總觀測記錄的100.00%;2011年7月測站VDFP海平面氣壓為1000.00 hPa的觀測記錄占總觀測記錄的100.00%,測站W(wǎng)ZP81海平面氣壓為1000.00 hPa的觀測記錄占總觀測記錄的83.33%等等,雖然海平面氣壓的變化幅度較小,但出現(xiàn)觀測值長期不變的情況則不正常。調(diào)查船通過安裝在船上的儀器對海洋狀況進(jìn)行觀測記錄,而船舶可能會經(jīng)過數(shù)天的航行才能到達(dá)目的地,如果儀器在船舶航行期間發(fā)生故障(觀測儀器、資料傳送裝置故障等)而沒有得到及時維修,就會出現(xiàn)觀測錯誤的情況。無人自動浮標(biāo)站長期漂浮在洋面上進(jìn)行觀測,隨著觀測時間延長,浮標(biāo)上附著的海洋生物等會對觀測和資料傳送裝置造成一定影響,從而影響觀測的準(zhǔn)確性和觀測資料的傳輸,而時常出現(xiàn)的風(fēng)暴等極端天氣也可能對浮標(biāo)站造成損壞,上述情況都可能造成儀器故障:在一段時間內(nèi)出現(xiàn)固定不變的要素觀測值。在本文中將這類觀測資料的站點資料稱為黑名單資料,在質(zhì)量控制方案設(shè)計中,需要對這部分資料進(jìn)行特殊處理。
圖2 2011年1月全球范圍船舶海平面氣壓資料預(yù)處理后觀測值與背景場散點分布Fig.2 The scatterplot for the shipborne sea level pressure data after pre-processing and background field in January 2011
圖3 2011年1月測站21915(a)和測站41972(b)觀測氣壓Fig.3 Pressure observations in January 2011 of Station 21915(a)and Station 41972(b)
圖2中Ⅱ框范圍內(nèi)所示資料與背景場之差保持在相對穩(wěn)定的范圍內(nèi),表明觀測和背景場存在一定的系統(tǒng)性偏差,該情況也有出現(xiàn)在7月。分析發(fā)現(xiàn),雖然不同月份存在系統(tǒng)性偏差觀測資料的測站分布情況有差異,但分布在五大湖地區(qū)和大奴湖地區(qū)的資料均占較大比例。通過對所有船舶海平面氣壓資料的分析可知,2011年1月位于五大湖的資料占圖2Ⅱ范圍內(nèi)中資料總量的69.98%,而在2011年2月、6月、7月、8月,位于五大湖和大奴湖的資料(2月大奴湖地區(qū)無觀測資料)分別占相應(yīng)月份中分布類似于圖2中Ⅱ框范圍所示資料的資料總量的66.49%,38.24%,28.08%和8.86%,不同月份資料所占比例波動較大的原因是各月份中內(nèi)陸湖上資料數(shù)量差異較大。五大湖和大奴湖屬于內(nèi)陸湖,地形高度相對較高,如五大湖海拔約140 m。由于海上船舶所測得的本站氣壓與海平面氣壓誤差非常?。?9],基本不需要訂正直接作為海平面氣壓發(fā)報,因此五大湖等內(nèi)陸湖區(qū)出現(xiàn)觀測與背景場的系統(tǒng)偏差原因極可能是測站仍沿用海上船舶的發(fā)報方式,將觀測到的本站氣壓作為海平面氣壓。由于船舶資料并不發(fā)送其測站高度,所以需要將背景場訂正到測站高度氣壓場。因此,在背景場一致性檢查中需要對五大湖和大奴湖地區(qū)的背景場進(jìn)行訂正。
4.2 質(zhì)量控制方案設(shè)計
依據(jù)前文分析,本文設(shè)計的船舶海平面氣壓資料質(zhì)量控制方案包括資料預(yù)處理(缺測值剔除、冗余值剔除)、極值檢查、黑名單資料查找、背景場一致性檢查(包括對五大湖等區(qū)域背景場的訂正)。
4.2.1 要素極值檢查
要素極值檢查是指氣象要素值允許出現(xiàn)有明確規(guī)定的范圍[20],在要素允許值范圍檢查中,對需要進(jìn)行質(zhì)量控制的要素值設(shè)定明確的變化范圍,超出變化范圍的要素值被視為錯誤資料。
郭豐義等[1]曾將船舶海平面氣壓資料的變化范圍設(shè)定為[940 hPa,1050 hPa],本文參考國家氣象中心業(yè)務(wù)系統(tǒng)規(guī)定將海平面氣壓要素允許值范圍定為[850 hPa,1080 hPa],即將海平面氣壓值大于1080 h Pa或者小于850 h Pa的資料作為錯誤資料剔除。在對2011年1月、2月、6月、7月和8月進(jìn)行要素極值檢查后,分別識別并剔除了48,27,104,82和140個資料。
4.2.2 黑名單資料查找
若測站出現(xiàn)某一固定觀測值的數(shù)量占該測站當(dāng)月總觀測報告數(shù)的50%以上(含50%),則將該測站列入黑名單,并將黑名單中測站得到的觀測報告全部剔除。由于每個月船舶海平面氣壓資料的觀測報告量和參與觀測的站點不同,因此必須按月份制作測站黑名單。圖4給出了2011年1月和7月船舶海平面氣壓資料剔除黑名單測站的觀測報告后的情況,效果顯著。
圖4 船舶海平面氣壓資料剔除黑名單測站的觀測報告后觀測值與背景場散點分布(灰點為被剔除資料)(a)2011年1月,(b)2011年7月Fig.4 The scatterplot for the shipborne sea level pressure data after eliminating observation reports of blacklist stations and backgound field(grey dots represent the eliminated data)(a)January 2011,(b)July 2011
質(zhì)量控制不僅要將觀測誤差過大的資料去掉,而且還要將觀測算子不能較好模擬資料或模式分辨率還不能分辨的小尺度變化資料去除[21]。在質(zhì)量控制中,離群資料本身會對序列平均值和標(biāo)準(zhǔn)差產(chǎn)生很大影響,進(jìn)而影響到對離群資料的識別,而雙權(quán)重方法在統(tǒng)計序列平均值和標(biāo)準(zhǔn)差的過程中對奇異值具有抵抗性,不易受離群資料影響。在呈豎直直線分布特征的資料中,有部分黑名單資料的數(shù)量并未占到對應(yīng)測站觀測報告總量的50%,因此將采用雙權(quán)重平均值和雙權(quán)重標(biāo)準(zhǔn)偏差質(zhì)量控制方法對其進(jìn)一步識別。鄒曉蕾等[21-22]曾利用觀測資料的雙權(quán)重平均值和雙權(quán)重標(biāo)準(zhǔn)偏差B對2004年3月的CHAMP(Challenging Hinisatellite Payload)掩星觀測資料進(jìn)行質(zhì)量控制,得到比較理想的結(jié)果。為了提高對可疑資料的敏感度,本文利用觀測資料與背景場之差(即觀測余差,觀測場與背景場之差用Xiobs-Xib表示)的雙權(quán)重平均值與雙權(quán)重標(biāo)準(zhǔn)偏差來識別離群資料,方法如下:
式(1)中,Zi為各資料的標(biāo)準(zhǔn)化變量Zscore值(對觀測資料的偏差進(jìn)行歸一化計算得到),通過Zscore值即可確定離群資料。其中,和B(X)分別為雙權(quán)重平均值和雙權(quán)重標(biāo)準(zhǔn)偏差:
其中,M是中位數(shù),wi是權(quán)重函數(shù),定義權(quán)重函數(shù)為
式(4)中,A為絕對偏差中位數(shù),也就是|(Xiobs-Xib)-M|的中位數(shù)。若wi>1,則取wi=1。
根據(jù)船舶海平面氣壓資料自身特點,本文采用上述質(zhì)量控制方法對剔除黑名單測站的觀測報告后仍殘留在豎直直線上的觀測資料進(jìn)行一致性檢驗,進(jìn)一步識別可疑資料。采用雙權(quán)重平均和雙權(quán)重標(biāo)準(zhǔn)偏差方法對資料進(jìn)行質(zhì)量控制時,|Zscore|值越小,觀測資料與背景場之差(即觀測余差Xiobs-Xib)的允許值范圍就越小,對資料的質(zhì)量要求越高。由于豎直直線上的殘余資料中大部分為黑名單資料,這類資料在同化中使用會對同化分析效果產(chǎn)生負(fù)面影響,對待這樣的資料需要更加謹(jǐn)慎,因此將標(biāo)準(zhǔn)化變量|Zscore|>3的資料視為可疑資料。圖5給出了對豎直直線上的殘余資料進(jìn)行一致性檢驗之后,2011年1月和7月全球范圍內(nèi)船舶海平面氣壓資料和背景場對應(yīng)的散點分布。由圖5可知,明顯將直線上的資料有效剔除。
4.2.3 背景場一致性檢查
4.2.3.1 五大湖等區(qū)域背景場訂正
本文采用雙權(quán)重平均訂正法,即依據(jù)觀測余差Xiobs-Xib的雙權(quán)重平均分別對五大湖等區(qū)域每個測站的背景場進(jìn)行訂正:
圖5 對殘余資料進(jìn)行質(zhì)量控制后的觀測氣壓與背景場氣壓散點分布(灰色點為可疑值)(a)2011年1月,(b)2011年7月Fig.5 The scatterplot for shipborne sea level pressure data after the quality control of residual data and background field(grey dots represent the questionable data)(a)January 2011,(b)July 2011
利用上述雙權(quán)重平均法分別對2011年1月和7月五大湖等區(qū)域背景場進(jìn)行了訂正,得到訂正場。1月五大湖區(qū)域的訂正值為-22.26 hPa,而大奴湖區(qū)在1月沒有觀測記錄,故背景場不需進(jìn)行訂正;7月五大湖區(qū)域的訂正值為-20.92 hPa,大奴湖區(qū)域的訂正值為-18.17 hPa。圖6反映了單個測站背景場、訂正場與觀測場的差異。由圖6可知,該方案能夠有效消除背景場與觀測之間的系統(tǒng)性偏差。圖7是2011年1月和7月訂正場與船舶海平面氣壓資料散點分布。對比圖5和圖7可知,針對背景場的雙權(quán)重平均訂正方法能夠有效消除系統(tǒng)性偏差,避免了在質(zhì)量控制中對資料的誤剔,從而達(dá)到資料的有效利用。
4.2.3.2 資料一致性檢驗
對于完成上面質(zhì)量控制之后得到的所有測站資料,再次采用雙權(quán)重平均和雙權(quán)重標(biāo)準(zhǔn)偏差法對其進(jìn)行背景場一致性檢查,識別模式不能分辨的資料。為了更多地保留正確觀測資料,因而對質(zhì)量控制的參數(shù)適當(dāng)放寬,選擇以資料標(biāo)準(zhǔn)化變量|Zscore|大于4,5,6來確定可疑資料。表1給出了對2011年1月和7月的資料進(jìn)行一致性檢驗后確定的可疑資料量,|Zscore|=4時資料剔除量過多,而取5則相對較好。結(jié)合實際應(yīng)用效果可知,通過此方法可疑資料能夠被準(zhǔn)確地識別(圖略)。
圖6 2011年7月測站W(wǎng)UW21觀測氣壓與背景場訂正前后序列Fig.6 The observation and the background pressure before and after correction for Station WUW21 in July 2011
圖7 船舶海平面氣壓與訂正場氣壓散點分布(a)2011年1月,(b)2011年7月Fig.7 The scatterplot for shipborne sea level pressure and the corrected background field(a)January 2011,(b)July 2011
表1 2011年1月和7月可疑資料量Table 1 The questionable data in January and July of 2011
5.1 質(zhì)量控制方法在其他月份中的應(yīng)用
為了證明本文中質(zhì)量控制方案的普遍適用性,圖8給出了對經(jīng)過極值檢查后的2011年2月、6月、8月全球范圍船舶海平面氣壓資料進(jìn)行質(zhì)量控制后的效果,圖8中少量可疑資料(灰點)和背景場比較一致,這可能是黑名單資料在豎直直線以外的部分正確資料,當(dāng)動態(tài)調(diào)整統(tǒng)計時間段進(jìn)行黑名單查找時,這些資料就有可能被保留下來。由圖8可知,質(zhì)量控制方法不僅能夠識別錯誤資料和與背景場有差異的離群資料,也能識別并剔除黑名單資料,同時保留與背景場存在系統(tǒng)性偏差的資料(如五大湖等區(qū)域資料),這表明本文所使用的質(zhì)量控制方法對各個月份船舶海平面氣壓資料均適用,且可得到比較理想的結(jié)果。
圖8 船舶海平面氣壓資料質(zhì)量控制效果(灰色點為可疑資料)(a)2011年2月,(b)2011年6月,(c)2011年8月Fig.8 The scatterplot for shipborne sea level pressure data after quality control and background field(grey dots represent the questionable data)(a)February 2011,(b)June 2011,(c)August 2011
5.2 不同質(zhì)量控制方法資料剔除率
對2011年不同月份的船舶海平面氣壓資料進(jìn)行質(zhì)量控制時,資料預(yù)處理部分的資料剔除量以及其余質(zhì)量控制步驟確定的可疑資料量如表2所示。由表2可見,資料預(yù)處理部分資料剔除量最大,均超過50%,而黑名單資料查找部分剔除的可疑資料量超過極值檢查剔除資料量,需要重點關(guān)注。
表2 資料預(yù)處理資料剔除量以及其余質(zhì)量控制步驟確定的可疑資料量(單位:%)Table 2 The elimination rate of data pre-processing and other quality control schemes(unit:%)
本文通過對船舶海平面氣壓資料的深入研究,根據(jù)其資料特性建立了一套適用于數(shù)值模式的質(zhì)量控制方案,主要結(jié)論如下:
1)船舶觀測資料的時間、空間分布極不均勻,一部分質(zhì)量控制方法(如時間一致性檢查等)對船舶觀測資料不適用。在質(zhì)量控制前,須對原始資料進(jìn)行預(yù)處理。
2)對黑名單資料的質(zhì)量控制,能夠有效識別與背景場差異較小的可疑資料,同時也有利于對出現(xiàn)故障測站的檢查和維護(hù)工作。
3)在質(zhì)量控制中必須考慮內(nèi)陸湖的地形高度,本文采用雙權(quán)重平均法分別對五大湖、大奴湖地區(qū)的背景場資料進(jìn)行訂正,有效消除了觀測資料與模式分析場之間系統(tǒng)性偏差,避免了資料的錯誤剔除。
將本文質(zhì)量控制方案應(yīng)用于實際的觀測資料并經(jīng)過分析比較后,其結(jié)果能夠達(dá)到預(yù)期效果,且具備普遍適用性,能夠為同化工作提供質(zhì)量可靠的資料。
[1] 郭豐義,張冬生.船舶海面觀測資料的質(zhì)量控制方法研究.海洋通報,1998,17(4):1-5.
[2] 王伯民,謝清華.船舶地面氣象資料的整理和統(tǒng)計.海洋通報,1980,1:1-16.
[3] 潘錦嫦.利用船舶報的資料分析海區(qū)波(風(fēng))次的方法討論.中國海洋平臺,1996,11(4):160-164.
[4] 王可光,張建華,王彩欣.西北太平洋常規(guī)SST資料的客觀分析方法研究(I.旬的平均船舶報資料分析).海洋預(yù)報,2000,17(4):52-59.
[5] 陳上及,馬繼瑞.海洋數(shù)據(jù)處理分析方法及應(yīng)用.北京:海洋出版社,1991:1-62.
[6] 朱江,徐啟春,王賜震,等.海溫數(shù)值預(yù)報資料同化實驗I.客觀分析的最優(yōu)插值法試驗.海洋學(xué)報,1995,17(6):9-19.
[7] Richard W R.A real-time global sea surface temperature analysis.J Climate,1988,1:75-86.
[8] Seaman R S.Quality control of Australian sea-level pressure observations.Australian Meteorological Magazine,1999,48(2):123-131.
[9] 陶士偉,郝民,趙琳娜.AMDAR觀測資料分析及質(zhì)量控制.氣象,2009,35(12):65-73.
[10] Dean V,Mahrt L.Quality control and flux sampling problems for tower and aircraft data.J Atmosp Ocean Technol,1997,14:512-526.
[11] Lorenc A.Analysis methods for numerical weather prediction.QJ R Metorol Soc,1986,112L:1177-1194.
[12] 張強(qiáng),郭發(fā)輝,許松.全球地面天氣報資料質(zhì)量控制和數(shù)據(jù)集特征分析.應(yīng)用氣象學(xué)報,2004,15(增刊):121-127.
[13] 周尚河.全國高空資料質(zhì)量控制和建庫方法的研究.應(yīng)用氣象學(xué)報,2000,11(3):364-370.
[14] 師春香,劉玉潔.國外部分衛(wèi)星產(chǎn)品質(zhì)量評價和質(zhì)量控制方法.應(yīng)用氣象學(xué)報,2004,15(增刊):142-151.
[15] 封秀燕,何志軍,王荷平,等.自動氣象站實時資料質(zhì)量控制開放式平臺設(shè)計.應(yīng)用氣象學(xué)報,2010,21(4):506-512.
[16] 李鐵,鄒立堯,國世友.東北地區(qū)低溫氣象資料數(shù)據(jù)集及其質(zhì)量控制.應(yīng)用氣象學(xué)報,2004,15(增刊):164-167.
[17] 王伯民.基本氣象資料質(zhì)量控制綜合判別法的研究.應(yīng)用氣象學(xué)報,2004,15(增刊):50-59.
[18] 王海軍,劉瑩.綜合一致性質(zhì)量控制方法及其在氣溫中的應(yīng)用.應(yīng)用氣象學(xué)報,2012,23(1):69-76.
[19] Ingleby N B.Assimilation of station level pressure and errors in station height.Wea Forecasting,1995,10:172-182.
[20] 王新華,羅四維,劉小寧,等.國家級地面自動站A文件質(zhì)量控制方法及軟件開發(fā).氣象,2006,32(3):107-112.
[21] 鄒曉蕾.資料同化理論和應(yīng)用(上).北京:氣象出版社,2009:53-59.
[22] Zou X,Zeng Zhen.A quality control procedure for GPS radio occultation data.J Geophys Res,2006,111,D02112,doi:10.1029/2005JD005846.
Quality Control for Shipborne Observations of Sea Level Pressure
Li Yansong1)2)Xu Zhifang2)Fan Guangzhou1)Li Ping1)2)Li Zechun2)
1)(Center for Plateau Atmospheric and Environmental Research,Chengdu University of Information Technology,Chengdu 610225)
2)(National Meteorological Center,Beijing 100081)
With the rapid development of numerical prediction model,kinds of observations play an important role,among which the shipborne observations show great importance.In order to ensure the quality of shipborne observations and its positive contribution in numerical model,according to the temporal and spatial distribution characteristics of shipborne observations,a quality control scheme for sea level pressure data is set up consisting of element extreme range checking,eliminating the missing and redundant data,background field consistency checking,deciding the blacklist of observation stations,quality control method for blacklist data and so on.The scheme is developed based on the contrast analysis results between the observations and the T639 analysis field(0.28125°×0.28125°)in January and July of 2011,and it’s also applied to the data of February and June of 2011.
Shipborne observations consist of the data from oceanographic research vessel and unmanned automatic buoy station,the highest density of data is found at mid-and low-latitude ocean of the Northern Hemisphere,and the number of observation reports are fluctuating with time unsteadily.Missing observations and data redundancy are common cases,which affect the effectiveness of some quality control methods such as time consistency check and space consistency check,but the background field consistency check could avoid these disadvantages.The amount of sea level pressure data is the largest among all observed elements,but the missing data ratio and redundant data ratio both reach up to 50%and needs pre-processing.Blacklist data quality control scheme include the data elimination of blacklist station and quality control of residual blacklist data.The scheme can identify and eliminate the blacklist data accurately,as well as establish the blacklist of observation stations,which is beneficial to the lookup and maintenance work.Due to the altitude difference between the observation terrain and the model terrain in the Five Lakes and Great Slave Lake areas,background field data must be corrected through background consistency checking,and the double weighted average correction method can effectively eliminate the systemic deviation between observations and model outputs,thereby avoiding the errors in data quality control.Quality control results are proved to be correct and reasonable by the verification of case analysis and data rejection percentage of every quality control steps,and the quality control scheme also has a favorable application foreground in providing reliable initial field for data assimilation work.
shipborne observations;quality control;blacklist;consistency check
李巖松,徐枝芳,范廣洲,等.船舶海平面氣壓觀測資料質(zhì)量控制.應(yīng)用氣象學(xué)報,2014,25(2):222-231.
2013-02-04收到,2014-01-08收到再改稿。
公益性行業(yè)(氣象)科研專項(GYHY201106008),國家自然科學(xué)基金項目(41275105)
*email:zhifang@cma.gov.cn