王山海,馬鑫鑫,劉 謙
(河南省人工影響天氣中心,河南 鄭州 450000)
云計算(cloud computing)是分布式計算、并行計算和網(wǎng)格計算的發(fā)展,是一種新型的計算模式。目前云計算技術(shù)得到了迅猛的發(fā)展,在商業(yè)界也到了廣泛的應(yīng)用。亞馬遜、微軟、Google、阿里、華為等各大公司都提出了各自云計劃,準備在這一新興的領(lǐng)域占領(lǐng)制高點,打造新的盈利模式。另外學(xué)術(shù)界對該研究也從來沒有停止過,各種新理論新方法層出不窮。云計算的普及勢必將為各行各業(yè)帶來重大變革,氣象行業(yè)同樣將受到重大而深遠的影響[1]。云計算最大的特點是分布式(distributed)和虛擬化(virtualization),它可以將分布的數(shù)據(jù)以及分散的計算資源集中起來,允許用戶按需申請服務(wù)[2]。與物理設(shè)備相比,云計算模式既可以滿足計算需求,也能大大降低成本。
人工影響天氣(簡稱“人影”),指在適當(dāng)條件下,人們通過科技手段對局部大氣的過程進行影響,使某些局地天氣朝著有利于人類的方向轉(zhuǎn)化,從而避免或者減輕氣象災(zāi)害,合理利用氣候資源,實現(xiàn)增雨(雪)、防雹、消雨等目的[3]。目前實施人影作業(yè)主要有地面高炮(火箭架)和飛機兩種方式。地面作業(yè)通常利用高炮或者火箭架向目標云發(fā)射炮彈、火箭彈,將催化劑播撒在云中,從而影響云微物理過程。飛機人工影響天氣作業(yè)則是在空中飛行,將催化劑直接播撒,影響云物理過程。
在進行人影作業(yè)時,對作業(yè)潛力區(qū)的分析是必不可少的步驟。只有將催化劑播撒到潛力區(qū)內(nèi),才能取得良好的作業(yè)效果,實現(xiàn)人影作業(yè)目的。目前對作業(yè)潛力區(qū)的分析主要是使用PC機,對大量的數(shù)據(jù)進行研究,得出合理的結(jié)果。隨著對人影作業(yè)科學(xué)性、時效性要求的提高,傳統(tǒng)PC機的計算瓶頸逐漸顯現(xiàn),它無法滿足科學(xué)作業(yè),發(fā)展智慧人影的需求。基于這種現(xiàn)狀,如果能將云計算模式引入到人影領(lǐng)域,必將充分發(fā)揮云計算作用,大大促進人影作業(yè)效果的提升。
近年來,隨著數(shù)據(jù)的爆炸式增長,快速處理海量的大數(shù)據(jù)成為必然,這對計算能力的需求提出新的挑戰(zhàn)??陀^上要求一種不同于傳統(tǒng)方式的計算框架。在這種情況下,“云計算”的概念被提了出來。云計算綜合了分布式計算、并行處理和網(wǎng)格計算,能夠向各種應(yīng)用提供基于硬件、基礎(chǔ)架構(gòu)、平臺、軟件以及存儲服務(wù)[4]。云計算的核心目的是實現(xiàn)對計算資源、網(wǎng)絡(luò)資源、存儲資源的管理。
云計算目前已經(jīng)在學(xué)術(shù)界和產(chǎn)業(yè)界受到了廣泛的關(guān)注和應(yīng)用,但還沒有關(guān)于云計算的統(tǒng)一定義。關(guān)于云計算的定義主要有如下幾種。
(1)云計算是一種能夠以靈活的方式提供計算資源的服務(wù),滿足用戶按需所求,避免資源浪費[5]。
(2)云計算是一種并行的、分布式系統(tǒng),可以按照約定的服務(wù)等級提供服務(wù)[6]。
(3)云計算屬于一種虛擬化的計算資源,調(diào)用者使用時按需付費[7]。
從上述定義中可以發(fā)現(xiàn),幾種定義都將云計算看作服務(wù)。但是,這些定義都不完善。通過上述分析可以看出云計算架構(gòu)具有較好的性能。它將資本投入變成可變投入,減少了投資構(gòu)建數(shù)據(jù)中心和服務(wù)器的盲目性,按需付費,降低了成本。還可以從大型規(guī)模經(jīng)濟中獲益,使用云計算,遠比自己投資硬件性價比高。同時無需考慮所需硬件設(shè)備容量,避免過高的資源配置造成浪費,也避免了過低的資源配置無法滿足應(yīng)用需求。在云計算環(huán)境中,網(wǎng)絡(luò)配置靈活性大大增加,IT資源配置快速。
根據(jù)云計算架構(gòu)及服務(wù)目的,主要可以分為以下幾類:
(1)SaaS(軟件即服務(wù),software as a service)。
這種類型的云計算模式在互聯(lián)網(wǎng)上一般通過瀏覽器對應(yīng)用程序進行交付。通常,SaaS應(yīng)用可提供廣泛的配置選項和開發(fā)環(huán)境,客戶能夠方便地對自己的代碼進行修改和添加。
(2)IaaS(基礎(chǔ)設(shè)施即服務(wù),infrastructure as a service)。
IaaS公有云供應(yīng)商主要提供計算和存儲服務(wù)。這種服務(wù)具有高可伸縮數(shù)據(jù)庫、虛擬專用網(wǎng)絡(luò)、大數(shù)據(jù)分析、機器學(xué)習(xí)等等。
(3)PaaS(平臺即服務(wù),platform as a service)。
PaaS所提供的服務(wù)和工作流主要專門針對開發(fā)人員,這種服務(wù)可以方便開發(fā)人員快速開發(fā)、測試、部署應(yīng)用程序。
云計算是一種新型的計算架構(gòu),它以數(shù)據(jù)為中心,在數(shù)據(jù)存儲、數(shù)據(jù)計算、云通信等多方面具有自身獨特的技術(shù)[8]。
(1)為保證可用性、可靠性以及經(jīng)濟性,云計算存儲采用分布式存儲的方式。同時,云計算需要提供并行服務(wù),從而保證大量用戶的并發(fā)訪問服務(wù)。需要具有高吞吐率和高傳輸率的特點。云計算常用的存儲技術(shù)主要有谷歌的GFS(Google file system)和Hadoop開發(fā)的GFS的開源實現(xiàn)HDFS(Hadoop distributed file system)。大多公司應(yīng)用的都是HDFS的數(shù)據(jù)存儲技術(shù)。
(2)云計算系統(tǒng)對大數(shù)據(jù)集進行處理分析后向用戶提供高效的服務(wù)。因此,數(shù)據(jù)管理技術(shù)必須滿足能夠高效地管理大數(shù)據(jù)集的要求。其次,如何在規(guī)模巨大的數(shù)據(jù)中找到特定的數(shù)據(jù),也是云計算數(shù)據(jù)管理技術(shù)所必須解決的問題。云計算的特點是對海量的數(shù)據(jù)存儲、讀取后進行大量的分析,數(shù)據(jù)的讀操作頻率遠大于數(shù)據(jù)的更新頻率,云中的數(shù)據(jù)管理是一種讀優(yōu)化的數(shù)據(jù)管理。因此,云系統(tǒng)的數(shù)據(jù)管理往往采用數(shù)據(jù)庫領(lǐng)域中列存儲的數(shù)據(jù)管理模式。將表按列劃分后存儲。云計算的數(shù)據(jù)管理技術(shù)中最著名的是谷歌提出的BigTable數(shù)據(jù)管理技術(shù)[9]。
(3)為了使用戶能便利地享受云計算帶來的服務(wù),讓用戶能利用該編程模型編寫簡單的程序來實現(xiàn)特定的目的,云計算上的編程模型必須十分簡單,必須保證后臺復(fù)雜的并行執(zhí)行和任務(wù)調(diào)度向用戶透明。云計算大部分采用Map-Reduce的編程模式。目前主流IT廠商提出的“云”計劃中采用的編程模型,都是基于Map-Reduce的思想開發(fā)的編程工具。Map-Reduce不僅僅是一種編程模型,同時還是一種高效的任務(wù)調(diào)度模型。Map-Reduce這種編程模型并不僅僅適用于云計算,在多核和多處理器、Cpu processor以及異構(gòu)機群上同樣有良好的性能[10]。
云計算層次關(guān)系如圖1所示。
圖1 云計算層次關(guān)系
由大氣中的水汽凝結(jié)(凝華)形成水滴、冰雪晶或它們的混合物組成的可見懸浮體形成云霧[11],構(gòu)成降水的必要條件。云粒子在空中繼續(xù)吸附水汽,體積與重量逐漸增長,獲得較大的下落速度,并且在下落過程中沒有被蒸發(fā)掉,才能形成降水(見圖2)。
圖2 云霧降水微物理機制
自然界中的云具有不同的外形和空間尺度,可以存在于不同的高度,其組成也有固態(tài)或液態(tài)之分。通過分析云的分布情況和演變過程,可以研究當(dāng)時的天氣形勢和水汽狀況,還可以預(yù)測未來天氣的變化。人工影響天氣作業(yè)的開展,正是基于對云進行充分的宏、微觀研究,掌握云霧降水機制,開發(fā)空中水資源,增加降水。但長期以來,由于云霧、降水和可降水量有很大的不確定性,尤其是對云的了解還很不透徹,人工影響天氣作業(yè)中存有很大的盲目性[12]。這樣導(dǎo)致了作業(yè)資源浪費,貽誤作業(yè)時機,不能充分發(fā)揮人影作業(yè)效益。
中國的人工影響天氣始于20世紀50年代,通過50多年的發(fā)展,目前人工影響天氣無論從作業(yè)規(guī)模還是作業(yè)經(jīng)費投入都處于世界前列。同時,國家大力支持建設(shè)東北、西北、中部區(qū)域人工影響工程。21世紀初,出于抗旱防災(zāi)、減災(zāi)和改善生態(tài)環(huán)境的需要,中國人工影響天氣呈現(xiàn)快速發(fā)展勢頭,國家也增大了對人工影響天氣研究的支持力度,同時學(xué)術(shù)界對人工影響天氣的理論和探測研究也得到了快速發(fā)展。為了更好地開展人工影響天氣業(yè)務(wù),切實提高人影作業(yè)效益,全國氣象部門以及相關(guān)高校科研院所對人影業(yè)務(wù)的關(guān)鍵技術(shù)的研究不斷深入和加強。
針對每一次天氣過程,為了實現(xiàn)不同的需求,取得作業(yè)實效,應(yīng)當(dāng)在適當(dāng)?shù)臅r機,對適當(dāng)?shù)脑企w,播撒適當(dāng)劑量的催化劑,即做到三適當(dāng)[13]。而對作業(yè)潛力區(qū)的準確分析是做到三適當(dāng)?shù)那疤?。對人影作業(yè)潛力區(qū)的研究主要從天氣形勢、高空探測、數(shù)值模式等云降水微觀特征方面展開,選取適宜人工增雨作業(yè)的云系。目前已有大量的科技文獻從播云溫度窗、過冷水含量與冰晶濃度、云的宏觀特征以及多普勒雷達等方面論述了作業(yè)潛力區(qū)的選取。
無論采用哪種關(guān)鍵技術(shù),原始觀測資料是必不可少的內(nèi)容。結(jié)合河南人影中心的實際業(yè)務(wù),常用的觀測資料包含以下內(nèi)容,如表1所示。從表中可以看出,人影特種觀測資料數(shù)據(jù)量較大,種類較多,如果使用傳統(tǒng)的PC機或者服務(wù)器來進行數(shù)據(jù)處理,將無法滿足人影業(yè)務(wù)的需求。因此,在人影領(lǐng)域引入云計算模式是一個不錯的選擇。
衛(wèi)星云圖是通過氣象衛(wèi)星觀測到的地球上的云層覆蓋地表特征的圖像。目前接收的云圖主要有紅外云圖、可見光云圖及水汽圖等。在天氣分析中可以利用衛(wèi)星云圖識別天氣系統(tǒng),估計其強度和發(fā)展趨勢,為研究天氣提供依據(jù)。目前在學(xué)術(shù)界已有大量基于衛(wèi)星云圖應(yīng)用展開的研究。文獻[14]以FY2號氣象衛(wèi)星云圖為研究對象,利用圖像分割技術(shù),去掉非臺風(fēng)云系,定位臺風(fēng)中心;文獻[15]選取了1995-1998年的冰雹衛(wèi)星云圖,分析了產(chǎn)生冰雹衛(wèi)星云圖的特征,為冰雹預(yù)報提供了技術(shù)方法;文獻[16]針對中尺度強對流云團的衛(wèi)星云圖識別,設(shè)計了短時臨近預(yù)報系統(tǒng);文獻[17]利用衛(wèi)星云圖及其他資料分析了2002年7月17日在華北地區(qū)上空出現(xiàn)的中尺度渦旋成因,對于提升對流性天氣預(yù)報質(zhì)量有很好的幫助作用。這些文獻的研究內(nèi)容都是基于衛(wèi)星云圖展開的,雖然衛(wèi)星云圖在人影研究中具有重要作用,但是衛(wèi)星云圖數(shù)據(jù)量較大,特別是衛(wèi)星反演數(shù)據(jù)的獲得,對計算機硬件要求較高。
表1 人影特種觀測資料
雷達在人工影響天氣領(lǐng)域的應(yīng)用也已開展了大量的試驗研究工作。青海省氣象局、中國科學(xué)院大氣物理研究所利用711雷達回波、地面和高空加密觀測等資料在黃河上游的瑪曲地區(qū)開展人工增雨試驗,研究表明天氣雷達在這一工作中發(fā)揮了重要作用[18]。2002秋季和2003年春季,分別在青海省、河南省開展的云和降水的雷達觀測,為人工影響天氣研究工作提供了參考數(shù)據(jù)[19]。文獻[20]研究表明,多普勒天氣雷達風(fēng)場資料可為天氣系統(tǒng)的中尺度結(jié)構(gòu)分析和人影作業(yè)潛力區(qū)的劃定提供更多判定依據(jù),它在開展人影作業(yè)指揮、作業(yè)效果評估、云和降水動力機制研究等領(lǐng)域具有較大的應(yīng)用潛力。
云降水?dāng)?shù)值模式是人工影響天氣研究中的一個關(guān)鍵組成部分。云降水模式是將云的三維動力學(xué)方程和云微物理方程聯(lián)立,結(jié)合觀測和實驗結(jié)果求解。通過方程的求解,可以模擬云降水的發(fā)展演變過程。數(shù)值模式的作用體現(xiàn)在它能夠在相同的云況下比較人影作業(yè)前后云的異同,從而可以明確人影作業(yè)的效果。同時,它也可用這些過程來重建過去的試驗條件,計算其應(yīng)有的播云效果。這些程序也可用來模擬播云物質(zhì)的擴散效果,提供外場試驗和作業(yè)所需的實時預(yù)報,在作業(yè)區(qū)外檢驗播云后的潛在效應(yīng),從而有助于人影試驗的統(tǒng)計分析。隨著云降水微物理過程認識的不斷深入以及計算能力的提高,可以降低人工影響天氣工作的很多不確定性,提升業(yè)務(wù)能力和科技水平[21-22]。目前河南省人影中心使用的模式是GRAPES-CAMS模式和WRF模式,由于模式運算對計算機性能要求較高,地方人影機構(gòu)無法滿足硬件要求,因此這兩種模式都是國家局人影中心計算出來后面向全國下發(fā)。如果能夠使用云計算方式,結(jié)合河南本地特征元素,在河南本地進行模式優(yōu)化計算,對指導(dǎo)開展人影業(yè)務(wù)將會有更強的針對性。
利用上文提到的衛(wèi)星、雷達、模式等資料和數(shù)據(jù)對2004-2013年10年間中部區(qū)域春、秋季降水過程進行統(tǒng)計分析,歸納出典型降水類型的天氣系統(tǒng)和降水特點,總結(jié)出人影增雨潛力區(qū)相關(guān)指標,如表2所示。如果云系滿足這些指標,則認為具備增雨潛力,可以進行人工增雨作業(yè)[23]。
河南省氣象局信息中心為了給各業(yè)務(wù)單位提供高效的計算、存儲、通信服務(wù),減輕各業(yè)務(wù)單位的運維壓力和投資成本,利用氣象局內(nèi)網(wǎng),統(tǒng)一部署了云計算平臺。省人影中心根據(jù)日常業(yè)務(wù)需要,向信息中心申請了云存儲服務(wù),將傳統(tǒng)的海量觀測資料統(tǒng)一上云。
在人影日常工作中,為了做好人影業(yè)務(wù)分析工作,提高人影作業(yè)的準確性和針對性,所用到的氣象數(shù)據(jù)成倍增長,每天的自動站、雷達、雨量、衛(wèi)星等數(shù)據(jù)高達17 G左右,需不斷投資購買昂貴的硬件設(shè)備,維護成本也居高不下。而云計算存儲可以將數(shù)據(jù)儲存在云端,集中維護,通過網(wǎng)絡(luò)方便地為用戶提供實用的存儲服務(wù)。云存儲對用戶端的設(shè)備要求較低。具體到氣象行業(yè),科研人員只要用終端設(shè)備連接到云,就可以下載到需要的數(shù)據(jù)。
表2 中部人影增雨潛力區(qū)指標
目前河南省人影中心針對云計算這種先進的IT架構(gòu),僅僅利用了云存儲模式。基于云計算平臺,利用Hadoop工具,充分發(fā)揮云計算性能,將其應(yīng)用到人影業(yè)務(wù)中,具有更大價值。人影業(yè)務(wù)每天使用的天氣預(yù)報產(chǎn)品以及各種觀測數(shù)據(jù),需要大量的科學(xué)計算才能給出,特別是對于模式數(shù)據(jù),需要小型機來處理,這對于一般的省級和地市級人影部門是不現(xiàn)實的。而云計算能夠給人影工作帶來性能強大、配置靈活和成本低廉的協(xié)作與創(chuàng)新平臺,提高效率。
另外,氣象是一個數(shù)據(jù)資源豐富的行業(yè),國家對氣象部門建設(shè)的投入力度不斷加大。雖然各單位都積累了大量的信息資源,但存在信息孤島的現(xiàn)象,缺乏一個行業(yè)、部門之間的氣象信息共享平臺,無法充分發(fā)揮信息資源的作用。同時,重復(fù)建設(shè)問題也十分突出,造成資源浪費?;谠朴嬎愕哪J綄⒑芎玫亟鉀Q這個問題。對于人影行業(yè)和航空、農(nóng)業(yè)、林業(yè)、水利部門之間可以創(chuàng)建部門云,各部門把資料放在同一云中,資料共享,共同合作,協(xié)同工作,各取所需。對于不同級別的省市縣人影部門同樣可以在一個云中共享資料和數(shù)據(jù),降低建設(shè)成本。
云計算作為一種新型的計算模式,具有計算性能強大、部署快速簡單、投資成本低廉的優(yōu)勢,在學(xué)術(shù)界和產(chǎn)業(yè)界得到了快速的推廣和發(fā)展。人工影響天氣業(yè)務(wù)在防災(zāi)減災(zāi)、改善生態(tài)環(huán)境中發(fā)揮著越來越重要的作用,在實施人工影響天氣作業(yè)過程中,首先需要對大量的雷達、衛(wèi)星等觀測數(shù)據(jù)進行詳細的分析與復(fù)雜的模式計算,才能得到精確的分析結(jié)果。而傳統(tǒng)的計算方式都是采用PC機、服務(wù)器模式,隨著對人影作業(yè)時效性和準確性要求的提高,需要分析的觀測數(shù)據(jù)量越來越大,模式計算復(fù)雜程度越來越高,傳統(tǒng)的計算方法已經(jīng)無法滿足計算需求。如果能將高效先進的云計算模式引入到人影業(yè)務(wù)中,將大大提高計算的時效性和準確性,對作業(yè)潛力區(qū)的分析更加精準,從而使得人影作業(yè)更加有效,可以提高人影作業(yè)效益,使人影業(yè)務(wù)發(fā)揮更大的作用。