我們的城市變得越來(lái)越繁華,問(wèn)題也越來(lái)越多,如交通擁堵、污染等。隨著傳感器技術(shù)的發(fā)展和大規(guī)模的計(jì)算環(huán)境的成熟,我們有了很多大數(shù)據(jù),如果使用得當(dāng)?shù)脑?huà)我們可以利用大數(shù)據(jù)解決大城市的問(wèn)題。
城市里面有哪些大數(shù)據(jù)?有了高速公路與房子連續(xù)多年的數(shù)據(jù)累計(jì),我們就會(huì)知道這個(gè)城市是朝哪個(gè)方向發(fā)展;有了北京市酒吧和電影院的數(shù)據(jù)(興趣點(diǎn)數(shù)據(jù)),我們就能知道城市里有哪些商業(yè)在衰亡,有哪些商業(yè)在發(fā)展,有哪些商業(yè)模式在變化;有了氣溫、氣壓、濕度,這些氣象數(shù)據(jù),我們就能知道空氣質(zhì)量的變化;有了出租車(chē)GPS的熱度數(shù)據(jù),我們就可以分析城市里人是怎樣移動(dòng)的。
我們做了一個(gè)城市計(jì)算框架,它包括四個(gè)環(huán)節(jié),第一,城市感知;二,城市管理;三,城市數(shù)據(jù)的分析和挖掘;四,服務(wù)提供。這是一個(gè)多數(shù)據(jù)分析框架,它的數(shù)據(jù)種類(lèi)非常多,任務(wù)也很多,可以是改進(jìn)城市規(guī)劃,也可以緩解交通擁堵,在一個(gè)任務(wù)中我們要同時(shí)用到多個(gè)數(shù)據(jù),對(duì)數(shù)據(jù)要進(jìn)行整合分析。
以空氣質(zhì)量分析為例?,F(xiàn)在很多城市都建了空氣質(zhì)量監(jiān)測(cè)站,每個(gè)小時(shí)發(fā)布一些數(shù)據(jù),告訴大家這個(gè)地方空氣質(zhì)量是多少。我們國(guó)家的站點(diǎn)數(shù)目有限,北京六環(huán)以?xún)?nèi)22個(gè)站點(diǎn)已經(jīng)是全國(guó)最多了。一方面,站點(diǎn)成本昂貴。另一方面,城市里的空氣質(zhì)量是不均勻的,每個(gè)地方變化也是不一樣的。我們不能用一個(gè)平均讀數(shù)來(lái)代表整體,也不能通過(guò)簡(jiǎn)單的差值來(lái)算出空氣質(zhì)量。
我們利用兩方面的大數(shù)據(jù)來(lái)解決這個(gè)問(wèn)題。第一,歷史和實(shí)時(shí)的空氣質(zhì)量數(shù)據(jù),包括天氣、濕度、氣壓、氣溫等等。第二,交通流量數(shù)據(jù)。這里有多少公園,密度是多少,有多少紅綠燈,多少高速公路。結(jié)合這些數(shù)據(jù),我們就可以算出整個(gè)城市里面每個(gè)角落的空氣質(zhì)量。我們可以知道,什么時(shí)候該關(guān)開(kāi)窗,什么時(shí)候該關(guān)窗,去哪里跑步,線(xiàn)路是什么樣的。也許有人會(huì)問(wèn)這個(gè)準(zhǔn)不準(zhǔn)?我們?cè)?個(gè)城市用我們的方法來(lái)預(yù)測(cè)該城市的空氣質(zhì)量,該城市的預(yù)測(cè)精確度提升了20%,環(huán)保部門(mén)對(duì)這個(gè)工作非常重視。
再來(lái)看另外一個(gè)例子。利用人們的興趣點(diǎn)數(shù)據(jù)來(lái)分析這個(gè)城市里面不同功能區(qū)域的分布和它的核心區(qū)域所在。開(kāi)一個(gè)超市,我們要知道居民住宅區(qū)的居民,開(kāi)電影院要知道周邊的分布。單單用一種數(shù)據(jù)是不能完全反應(yīng)地貌的。如兩個(gè)餐館在數(shù)據(jù)庫(kù)里都是表示是中餐館,但反應(yīng)的地域地貌是完全不一樣的。一個(gè)是住宅區(qū),一個(gè)是商業(yè)區(qū),它代表的意義是完全不同的。另外,人的移動(dòng)性也反應(yīng)了區(qū)域的功能。利用興趣點(diǎn)數(shù)據(jù)我們能發(fā)現(xiàn)城市里的功能區(qū)在不斷的變化。
我們認(rèn)為利用大數(shù)據(jù)進(jìn)行城市計(jì)算前景廣闊,我們的目的是達(dá)到城市、人和環(huán)境三盈的局面。