董雪
(邢臺現(xiàn)代職業(yè)學(xué)校,河北 邢臺 054000)
對于目前如此嚴(yán)峻的氣象條件,有什么方法可以預(yù)測到像霧霾這樣的重污染天氣嗎?
通過查閱大量的網(wǎng)絡(luò)資料,我們發(fā)現(xiàn)現(xiàn)在很多研究員,諸如微軟亞洲研究院主管研究員鄭宇【麻省理工科技評論TR35(35名在科技創(chuàng)新領(lǐng)域具有杰出成就的35歲以下頂級青年創(chuàng)新者)2013年的獲獎?wù)摺恳恢睆氖麓髷?shù)據(jù)挖掘和算法研究,希望用大數(shù)據(jù)解決現(xiàn)代城市所面臨的天氣問題。如果大數(shù)據(jù)可以帶給人們對于天氣問題的預(yù)測,那么何嘗不是一件好事。
那么大數(shù)據(jù)能不能成功預(yù)測霧霾?答案是肯定的。Urban Air正是由微軟亞洲研究院開發(fā),用大數(shù)據(jù)預(yù)測城市空氣質(zhì)量的項(xiàng)目。目前,Urban Air已經(jīng)實(shí)現(xiàn)全國70多個城市空氣質(zhì)量預(yù)測,可以對京津冀、長三角、珠三角、成渝城市群未來48小時的空氣質(zhì)量進(jìn)行預(yù)測。
大數(shù)據(jù)不僅能預(yù)測霧霾,還可以精細(xì)化預(yù)測。除了在預(yù)測精度上有優(yōu)勢外,大數(shù)據(jù)精細(xì)化預(yù)測還體現(xiàn)在地域范圍上。目前,傳統(tǒng)模擬方法預(yù)測霧霾只能精細(xì)到區(qū)的范圍,比如可以預(yù)測到邢臺市橋東區(qū)、橋西區(qū)的空氣質(zhì)量,而大數(shù)據(jù)可以精細(xì)化到每個空氣質(zhì)量站點(diǎn),比如可以預(yù)測橋西區(qū)達(dá)活泉站點(diǎn)未來48小時的空氣質(zhì)量狀況。大數(shù)據(jù)不僅能預(yù)測霧霾,還可以快速預(yù)測。傳統(tǒng)的重污染天氣預(yù)測工作需要6小時左右的模擬運(yùn)算時間,無法快速實(shí)時發(fā)布,而大數(shù)據(jù)可以在幾秒鐘之內(nèi)快速算出重污染空氣質(zhì)量數(shù)據(jù)。未來,霧霾的運(yùn)行軌跡也將有望實(shí)現(xiàn),霧霾從哪來,到哪去都將不是難題。
預(yù)測霧霾的大數(shù)據(jù)主要包括當(dāng)前空氣質(zhì)量數(shù)據(jù)、氣象條件、未來天氣預(yù)報(bào)三類數(shù)據(jù)??諝赓|(zhì)量數(shù)據(jù)并不是指單純的空氣質(zhì)量站點(diǎn)數(shù)據(jù),而是以某空氣質(zhì)量站點(diǎn)為圓心,囊括了方圓300公里范圍內(nèi)所有的與空氣質(zhì)量相關(guān)的數(shù)據(jù),比如空氣質(zhì)量站點(diǎn)數(shù)據(jù)、交通流數(shù)據(jù)、氣象數(shù)據(jù)、廠礦數(shù)據(jù)、人口流動數(shù)據(jù)、路網(wǎng)結(jié)構(gòu)等。與傳統(tǒng)模擬空氣質(zhì)量不同,大數(shù)據(jù)預(yù)測霧霾依靠的是多元融合方法,也就是說,空氣質(zhì)量的預(yù)測不僅僅看空氣質(zhì)量數(shù)據(jù),還要看與之相關(guān)的氣象數(shù)據(jù)、交通流量數(shù)據(jù)、廠礦數(shù)據(jù)、城市路網(wǎng)結(jié)構(gòu)等不同領(lǐng)域的數(shù)據(jù),不同領(lǐng)域的互相疊加,相互補(bǔ)強(qiáng),從而預(yù)測空氣質(zhì)量狀況。大數(shù)據(jù)應(yīng)用于預(yù)測霧霾,首先,由于每個站點(diǎn)、每個時段空氣質(zhì)量的影響因素都不盡相同,所以針對每個空氣質(zhì)量站點(diǎn),我們都會為這個站點(diǎn)每個時段單獨(dú)建一個空氣質(zhì)量模型,之后再將三者數(shù)據(jù)疊加,最后將數(shù)據(jù)進(jìn)行融合,制作出空氣質(zhì)量預(yù)測模型。
此外,大數(shù)據(jù)預(yù)測與傳統(tǒng)模擬方法有一定的相似性,都是通過數(shù)據(jù)來擬合模型,只不過是數(shù)據(jù)量大小不同。以往由于獲知的數(shù)據(jù)有限,傳統(tǒng)模擬方法只能基于有限的樣本數(shù)據(jù),由科研人員通過經(jīng)驗(yàn)、假設(shè)找出這些數(shù)據(jù)間的規(guī)律,模擬出簡單的模型,預(yù)測空氣質(zhì)量。而隨著數(shù)據(jù)增多,單單依靠人工已經(jīng)無法從海量繁雜的數(shù)據(jù)中找出規(guī)律,所以需要借助機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘等工具來發(fā)現(xiàn)多源數(shù)據(jù)中隱含的規(guī)律。如今影響空氣質(zhì)量的因素越來越多,傳統(tǒng)模擬空氣質(zhì)量預(yù)測首先需要搜集完整的污染源數(shù)據(jù),比如企業(yè)的排污數(shù)據(jù)和汽車尾氣排放等,而這些數(shù)據(jù)無法全部獲知;其次模型太理想化,污染物在空氣中傳播和變化的實(shí)際情況也要復(fù)雜很多,因此,傳統(tǒng)模擬的方法顯得“力不從心”。在這樣的因素下,大數(shù)據(jù)在空氣質(zhì)量預(yù)測上就顯得頗有優(yōu)勢。比如傳統(tǒng)方法要拿到精確的地面污染源數(shù)據(jù)才能預(yù)測,而大數(shù)據(jù)則可以解決數(shù)據(jù)缺失的問題。比如對于交通尾氣數(shù)據(jù)難獲取的情況,大數(shù)據(jù)運(yùn)算可以采用與交通尾氣相關(guān)的交通流量、排量等相關(guān)數(shù)據(jù),間接地分析其與空氣質(zhì)量的關(guān)系。大數(shù)據(jù)的精髓就是A領(lǐng)域的問題可以借助B領(lǐng)域、C領(lǐng)域、D領(lǐng)域的數(shù)據(jù)來一起解決,通過多元數(shù)據(jù)融合的方法來解決數(shù)據(jù)缺失和不精準(zhǔn)的問題。
雖然大數(shù)據(jù)對霧霾的預(yù)測已經(jīng)成功實(shí)踐,但還有存在很多困難。數(shù)據(jù)量少是大數(shù)據(jù)發(fā)展的掣肘,我國數(shù)據(jù)開放進(jìn)程比較晚,并且很多污染源數(shù)據(jù)都還不完善。數(shù)據(jù)量大小直接影響大數(shù)據(jù)預(yù)測的精準(zhǔn)度。比如數(shù)據(jù)樣本量不夠,會導(dǎo)致霧霾的拐點(diǎn)很難預(yù)測,目前傳統(tǒng)經(jīng)典模型和大數(shù)據(jù)模型都很難說清楚霧霾何時會消散。
“很多人認(rèn)為大風(fēng)來了,霧霾一定會散去”,而真實(shí)情況并非如此。霧霾消散與大風(fēng)的強(qiáng)度、持續(xù)時間、風(fēng)向來源地都有非常大的關(guān)系。比如,如果風(fēng)向的來源地本身是污染源,那么霧霾不但不會散去,反而會加重等情況。針對大數(shù)據(jù)在環(huán)保領(lǐng)域未來的發(fā)展,不僅僅是懂大數(shù)據(jù)的算法,還要懂一定的行業(yè)知識,這樣才能把大數(shù)據(jù)轉(zhuǎn)化為生產(chǎn)力。其次,大數(shù)據(jù)時代要求政府及相關(guān)部門的配合,對數(shù)據(jù)進(jìn)行開放。只要數(shù)據(jù)足夠,整個城市設(shè)計(jì)與空氣質(zhì)量的變化情況,完全可以依靠大數(shù)據(jù)實(shí)現(xiàn)。
總之,伴隨著網(wǎng)絡(luò)的普及以及大數(shù)據(jù)的應(yīng)用,我們對于霧霾預(yù)測和氣象條件的分析都可以運(yùn)用數(shù)據(jù)網(wǎng)絡(luò),利用先進(jìn)的大數(shù)據(jù)技術(shù)來實(shí)現(xiàn)。以往人們都是以每天的天氣預(yù)報(bào)來獲取天氣情況但不是實(shí)時情況,而大數(shù)據(jù)可以做到實(shí)時數(shù)據(jù)的發(fā)布。利用大數(shù)據(jù)技術(shù)對霧霾進(jìn)行監(jiān)測和預(yù)測是氣象天氣預(yù)測的必然,改變大家固化的思維模式,將大數(shù)據(jù)能量轉(zhuǎn)化為真正的生產(chǎn)力,為人們服務(wù),讓大家對惡劣天氣有效預(yù)防和治理。