中國(guó)科學(xué)院軟件研究所,北京 100190
衛(wèi)星影像大數(shù)據(jù)情報(bào)分析與應(yīng)用
張金芳,胡曉惠,張慧,王瑞,李海昌
中國(guó)科學(xué)院軟件研究所,北京 100190
衛(wèi)星遙感技術(shù)的發(fā)展使得影像獲取能力大大提高,深度學(xué)習(xí)方法使信息的自動(dòng)提取上了一個(gè)新的臺(tái)階,而云計(jì)算為衛(wèi)星影像的大數(shù)據(jù)處理提供了強(qiáng)大的計(jì)算能力支持。這3項(xiàng)技術(shù)激活了科研領(lǐng)域?qū)πl(wèi)星影像潛在商業(yè)價(jià)值、軍事價(jià)值的預(yù)期,很多科研機(jī)構(gòu)加入這個(gè)實(shí)力競(jìng)爭(zhēng)中,也吸納了大量的風(fēng)險(xiǎn)投資??偨Y(jié)了基于衛(wèi)星影像大數(shù)據(jù)的潛在價(jià)值分析與應(yīng)用,并提出了下一步可能的技術(shù)突破途徑和未來(lái)的發(fā)展方向。
衛(wèi)星影像;大數(shù)據(jù);情報(bào)分析
衛(wèi)星影像的處理與應(yīng)用正經(jīng)歷一場(chǎng)從單幅衛(wèi)星影像到全球、全時(shí)、全波段處理方式的轉(zhuǎn)變,即對(duì)盡可能地能夠收集到的遙感數(shù)據(jù)進(jìn)行系統(tǒng)的、綜合的處理,以期發(fā)現(xiàn)潛在的價(jià)值,并與其他來(lái)源的數(shù)據(jù)進(jìn)行相互驗(yàn)證,實(shí)現(xiàn)數(shù)據(jù)的增值。
衛(wèi)星影像的應(yīng)用與其觀測(cè)精度、時(shí)空尺度密切關(guān)聯(lián)。一方面,隨著衛(wèi)星技術(shù)的發(fā)展,影像獲取成本持續(xù)下降,影像的時(shí)間分辨率、空間分辨率、頻段分辨率越來(lái)越高;另一方面,能夠處理的問(wèn)題也從局部目標(biāo)識(shí)別、土地利用分類擴(kuò)充到精細(xì)目標(biāo)識(shí)別、狀態(tài)判斷、關(guān)聯(lián)分析、全球趨勢(shì)分析等應(yīng)用領(lǐng)域,其背后的價(jià)值也得到了充分的挖掘。
大數(shù)據(jù)的生產(chǎn)期盼大的處理能力,傳統(tǒng)的處理方式已極不適應(yīng)。Orbital Insight的創(chuàng)立者 James Crawford研究了現(xiàn)存和新興的衛(wèi)星公司創(chuàng)辦計(jì)劃,從而得出結(jié)論:要想細(xì)查這些公司在未來(lái)5年時(shí)間里提供的圖像,需要800萬(wàn)人不吃不喝,一直盯著衛(wèi)星圖像觀察。
從影像處理方法上看,深度學(xué)習(xí)的應(yīng)用使得識(shí)別圖像中的對(duì)象、特征與模式變得越來(lái)越強(qiáng)大,能夠透析影像背后的深層次情報(bào)、揭示潛在的信息,甚至發(fā)現(xiàn)影像中存在的人眼所不能發(fā)現(xiàn)的新模式。云計(jì)算技術(shù)使得海量圖像大數(shù)據(jù)計(jì)算成為可行,一方面使得大計(jì)算量的算法訓(xùn)練成為可能,另一方面使得巨大的影像數(shù)據(jù)的實(shí)時(shí)處理成為可能,極大地提高了影像數(shù)據(jù)的潛在價(jià)值與應(yīng)用時(shí)效性。
從大數(shù)據(jù)的應(yīng)用角度看,數(shù)據(jù)的處理模式也需要進(jìn)行適應(yīng)性改造。當(dāng)前的數(shù)據(jù)處理與應(yīng)用模式還是單向的,即從數(shù)據(jù)獲取、數(shù)據(jù)處理到數(shù)據(jù)應(yīng)用。實(shí)際上人對(duì)事物的觀察是一個(gè)迭代的過(guò)程,越不確定的事物,迭代次數(shù)越多。計(jì)算機(jī)在訓(xùn)練階段一定程度上模擬了人的迭代觀察,而在具體判斷時(shí)大多數(shù)還是一次性的判斷。深度學(xué)習(xí)將經(jīng)驗(yàn)固化到網(wǎng)絡(luò)中,但因?yàn)槠漭斎脒€只是影像本身,因而沒(méi)能就觀察的上下文語(yǔ)境信息考慮進(jìn)去,這是由原來(lái)的長(zhǎng)周期處理方式?jīng)Q定的。當(dāng)觀察、學(xué)習(xí)與判斷由同一過(guò)程完成時(shí),語(yǔ)境將成為一個(gè)重要因素,在語(yǔ)境中才能判斷信息的價(jià)值,并能指導(dǎo)觀察到更多的有價(jià)值信息。
另一方面,影像處理的重點(diǎn)也將不同,傳統(tǒng)數(shù)據(jù)少的時(shí)候,從一幅圖像理解其中的各個(gè)單元、目標(biāo)的信息是重點(diǎn);在大量數(shù)據(jù)連續(xù)涌入時(shí),發(fā)現(xiàn)對(duì)象變化的信息、全局統(tǒng)計(jì)信息成為重點(diǎn)。
通過(guò)影像情報(bào)要素的提取、處理、分類,并分析所有類型的地理空間數(shù)據(jù),從而生成全球趨勢(shì)性的認(rèn)知,可以回答許多領(lǐng)域的問(wèn)題,比如考古[1]、莊稼收成與預(yù)測(cè)[2,3]、糧食安全[4]、人類健康[5,6]、土地開發(fā)與利用[7]、城市規(guī)劃[8-11]、森林監(jiān)控[12]、戰(zhàn)爭(zhēng)與沖突研究[13]。具體地,諸如本季度將有多少種商品投入市場(chǎng);保險(xiǎn)公司如何評(píng)估房屋與確定正確的政策;在高峰期間,城市的哪些路口是最繁忙的;全球可用的原油是多少;中國(guó)的經(jīng)濟(jì)狀況如何;中國(guó)的房地產(chǎn)發(fā)展趨勢(shì);全球糧食狀況預(yù)測(cè)等。
以上問(wèn)題是各國(guó)經(jīng)濟(jì)及其各個(gè)經(jīng)濟(jì)實(shí)體單元共同關(guān)注的問(wèn)題,因?yàn)槭澜缫呀?jīng)是一個(gè)緊密聯(lián)系的實(shí)體。網(wǎng)絡(luò)信息的發(fā)展將地球的每個(gè)角落聯(lián)系在一起,然而網(wǎng)上的信息多是經(jīng)過(guò)人參與其中并解釋后的信息,帶有強(qiáng)烈的人文特征。而遙感手段能夠從全球視角獲得真實(shí)客觀的地面信息,是全球信息來(lái)源的重要途徑。
衛(wèi)星影像大數(shù)據(jù)應(yīng)用提升了傳統(tǒng)的衛(wèi)星影像應(yīng)用模式,在信息提取基礎(chǔ)之上向數(shù)據(jù)挖掘方向發(fā)展。衛(wèi)星影像時(shí)空大數(shù)據(jù)分析,一方面各種技術(shù)還處于研究與攻關(guān)階段,另一方面各個(gè)創(chuàng)新組織已經(jīng)投入巨大的人力、財(cái)力向信息服務(wù)方向商業(yè)化,成為一個(gè)新的研究熱點(diǎn)和垂直市場(chǎng)增長(zhǎng)點(diǎn)。目前,盡管遙感衛(wèi)星影像的商用市場(chǎng)仍處于起步階段,但相關(guān)的產(chǎn)業(yè)領(lǐng)域出現(xiàn)了相應(yīng)的專業(yè)數(shù)據(jù)分析服務(wù),這些公司也同時(shí)是該行業(yè)的研發(fā)主力。
(1)RSMetrics
RSMetrics(remote sensing metrics)專注于衛(wèi)星情報(bào)分析,擁有超過(guò)5年的存儲(chǔ)衛(wèi)星圖像庫(kù),通過(guò)對(duì)高分辨率遙感衛(wèi)星影像、人口數(shù)據(jù)等進(jìn)行量化分析,向企業(yè)提供商業(yè)智能服務(wù),為投資者提供公司基本面研究,重點(diǎn)針對(duì)經(jīng)濟(jì)、社會(huì)及文化領(lǐng)域的研究。用衛(wèi)星追蹤像星巴克、沃爾瑪?shù)冗B鎖零售商的人流數(shù)據(jù)和停車場(chǎng)車輛變化,從而推測(cè)出一些核心經(jīng)營(yíng)數(shù)據(jù)。這種方法是當(dāng)前華爾街對(duì)沖基金公司了解公司基本面、期內(nèi)趨勢(shì),預(yù)測(cè)同店交易和銷量等領(lǐng)先指標(biāo)的重要方式之一??梢蕴峁┝闶奂肮I(yè)指數(shù),這一指標(biāo)與第三方指標(biāo)及政府報(bào)告數(shù)據(jù)高度相關(guān)。
(2)Genscape
Genscape面向全球商品和能源市場(chǎng)的實(shí)時(shí)數(shù)據(jù)和情報(bào)收集,在全球部署或利用直升飛機(jī)、熱感攝像機(jī)、傳感器收集大量一手?jǐn)?shù)據(jù),同時(shí)也充分利用遙感渠道的影像數(shù)據(jù),這些多源信息渠道和綜合處理能力使其具有了市場(chǎng)基本行情實(shí)時(shí)或近實(shí)時(shí)采集與報(bào)告的能力,其監(jiān)控業(yè)務(wù)主要覆蓋兩大地域,分別是北美和歐洲,行業(yè)則包括:石油、電力、天然氣和液化天然氣、農(nóng)業(yè)、石化和天然氣液、海事及可再生能源。
(3)Orbital Insight
Orbital Insight①https:// orbitalinsight.com/, 2016以挖掘全球范圍主題信息為己任,重點(diǎn)在軟件方面。通過(guò)對(duì)全球道路、飛機(jī)、云、煙霧、土地、建筑物和油罐進(jìn)行計(jì)算和測(cè)量,從而更具體地了解整個(gè)世界。
目前的大部分水源模型都是基于過(guò)去50年的數(shù)據(jù)建立起來(lái)的模型,不能精確概括當(dāng)下的水體狀況,也不能很好地做出預(yù)測(cè)。針對(duì)這種水模型的需要,該公司使用Landsat 7、Landsat 8陸地衛(wèi)星免費(fèi)影像開發(fā)了一款工具(Tinder)來(lái)近實(shí)時(shí)獲取全球陸地表面的水位狀況,可以不斷收集水位信息,建立更準(zhǔn)確的水循環(huán)模型,進(jìn)而提出宏觀預(yù)測(cè)。比如,干旱可能導(dǎo)致農(nóng)作物歉收,甚至因?yàn)樗Y源缺乏而導(dǎo)致政治動(dòng)蕩等。
Orbital Insight根據(jù)建筑物高度及屋頂使用材料來(lái)判斷居民的財(cái)富狀況,并與世界銀行達(dá)成了合作,用于提升世界銀行數(shù)據(jù)庫(kù)中相關(guān)貧困數(shù)據(jù)的精確性;通過(guò)衛(wèi)星影像觀察杭州地區(qū)建筑的房頂面積變化,可以分析出杭州建筑行業(yè)是在繁榮上升還是在蕭條下降,如圖1所示,如此亦可分析一個(gè)地區(qū)乃至一個(gè)國(guó)家的經(jīng)濟(jì)狀態(tài)。分析停車場(chǎng)的數(shù)據(jù)來(lái)初步預(yù)測(cè)沃爾瑪?shù)攘闶凵痰募径蠕N售情況;還可以從油罐儲(chǔ)油體積分析出全球原油儲(chǔ)量[23],如圖2所示。
圖1 杭州房頂面積趨勢(shì)
(4)PlanetiQ
PlanetiQ是一家基于衛(wèi)星的氣象數(shù)據(jù)服務(wù)公司,這家公司研發(fā)出了 Pyxis 傳感器,安裝在衛(wèi)星上,可以追蹤穿過(guò)地球大氣層的 GPS 信號(hào),對(duì)全球范圍內(nèi)的氣溫、氣壓和濕度進(jìn)行測(cè)量。
(5)Spire
Spire是致力于部署一個(gè)氣象衛(wèi)星網(wǎng)絡(luò),為政府和商業(yè)客戶采集氣象數(shù)據(jù)。Spire 計(jì)劃向太空發(fā)射衛(wèi)星來(lái)獲得大氣溫度、壓強(qiáng)和濕度曲線之類的氣象數(shù)據(jù)。前期主要銷售數(shù)據(jù),后期將有可能提供基于氣象數(shù)據(jù)的增值服務(wù)。
(6)Windward
Windward是一家海上數(shù)據(jù)及分析服務(wù)提供商,通過(guò)商用衛(wèi)星追蹤船舶交通狀況,不僅為金融及交易市場(chǎng)提供分析,還為海上走私或非法捕撈等提供起訴依據(jù)。Windward 旗下不同的產(chǎn)品面向不同的客戶,有政府、海軍以及情報(bào)機(jī)構(gòu),也面向商品交易商、對(duì)沖基金投資者及分析師。
另外,IHS和Airbus Defence and Space聯(lián)合進(jìn)行影像大數(shù)據(jù)情報(bào)發(fā)現(xiàn)的研發(fā)。
除以上提到的衛(wèi)星影像分析服務(wù)商外,還有專業(yè)的大數(shù)據(jù)分析公司,例如Ayasdi、Quid等,從不同的側(cè)面為影像大數(shù)據(jù)潛在價(jià)值挖掘服務(wù)。其中Quid致力于為客戶打造“沉浸式的數(shù)據(jù)體驗(yàn)”,讓企業(yè)能在可視化數(shù)據(jù)中快速掌握自己需要的關(guān)鍵信息,并用這些信息反向指導(dǎo)自己的公司業(yè)務(wù)。Quid創(chuàng)建了一個(gè)智能平臺(tái),該平臺(tái)把智能搜索、優(yōu)質(zhì)數(shù)據(jù)和高性能算法結(jié)合在一起,用來(lái)輸出例如市場(chǎng)趨勢(shì)分析結(jié)果等客戶需求的可視化內(nèi)容。除此之外,這個(gè)平臺(tái)還允許用戶以數(shù)百萬(wàn)計(jì)索引文件的量級(jí)搜索并處理數(shù)據(jù),為那些原本可能需要數(shù)周或數(shù)月才能解決的問(wèn)題快速給出可視化的答案。這種可視化結(jié)果以類似邏輯地圖的形式呈現(xiàn),幫助用戶更好地理解數(shù)據(jù)、獲取信息。
值得一提的是,DigitalGlobe作為影像提供商,也著手建立了面向衛(wèi)星影像大數(shù)據(jù)的深度挖掘平臺(tái),并開放給用戶。其理念是,利用大規(guī)模機(jī)器學(xué)習(xí)算法與人工參與相結(jié)合的途徑實(shí)現(xiàn)影像價(jià)值的提升。其開發(fā)的平臺(tái)是GBDX (geospatial big data platform),采用深度學(xué)習(xí)算法提取影像信息,并通過(guò)Tomnod眾包平臺(tái)來(lái)提供驗(yàn)證、訓(xùn)練樣本。
影像增值服務(wù)市場(chǎng)的成熟將形成新的垂直市場(chǎng),這個(gè)市場(chǎng)可能會(huì)包括金融服務(wù)和非政府機(jī)構(gòu),還有保險(xiǎn)和能源行業(yè)(分別評(píng)估水災(zāi)、火災(zāi)風(fēng)險(xiǎn),水力壓裂和鉆井率)。而且隨著技術(shù)的成熟,增值服務(wù)還將可以分析無(wú)人機(jī)圖像、汽車傳感器和物聯(lián)網(wǎng)的地理空間數(shù)據(jù)。
圖2 油罐儲(chǔ)油體積分析
衛(wèi)星影像信息提取從基于像素的方法、基于像元的方法到基于深度網(wǎng)絡(luò)的方法,效果提升是明顯的。當(dāng)前深度網(wǎng)絡(luò)方法成為共同關(guān)注的基礎(chǔ)性方法,本領(lǐng)域的專家針對(duì)遙感影像的特點(diǎn),對(duì)深度網(wǎng)絡(luò)進(jìn)行了多種改造嘗試,取得了較好的效果。
3.1 圖像處理經(jīng)驗(yàn)特征的引入
Basu S[14]采用DeepSat框架,如圖3所示,針對(duì)衛(wèi)星影像的高階流形維度的特點(diǎn)提出將被行業(yè)認(rèn)可的人工圖像特征作為深度學(xué)習(xí)的起點(diǎn),取得了11%的效果提升。
DeepSat框架分兩個(gè)步驟:圖像特征選取和深度網(wǎng)絡(luò)訓(xùn)練。從遙感與圖像處理領(lǐng)域整理的150個(gè)人工圖像特征,這些特征在以前的研究中[15-18]被證明是有效的描述子。通過(guò)特征分級(jí)選出22個(gè)特征,見表1。
圖3 DeepSat框架
表1 篩選的22個(gè)人工影像特征
SaikatBasu認(rèn)為衛(wèi)星影像具有比較大的類內(nèi)和類間變化,而且同整個(gè)數(shù)據(jù)集相比,標(biāo)準(zhǔn)樣本也非常小。高階紋理特征是一個(gè)重要的土地利用類型區(qū)分的參數(shù),這就是人工特征預(yù)篩選的意義。另一方面,各種深度學(xué)習(xí)首先學(xué)到的線性特征對(duì)于衛(wèi)星圖像分類并沒(méi)有實(shí)質(zhì)的意義,這可能解釋了傳統(tǒng)深度學(xué)習(xí)很難做到全局最優(yōu)的原因??臻g上下文是衛(wèi)星影像的一個(gè)重要建模參數(shù),卻在傳統(tǒng)深度學(xué)習(xí)中的處理中丟失掉了,而在人工篩選特征中得到保留。
另一方面,衛(wèi)星影像數(shù)據(jù)集同MNIST和CIFAR-10等數(shù)據(jù)集相比,其流形維數(shù)高得多,見表2。通過(guò)intrinsicDimension進(jìn)行度量[19],可以看到使用DANCo方法計(jì)算的衛(wèi)星影像的內(nèi)在維數(shù)達(dá)到115維。從衛(wèi)星影像的成像過(guò)程來(lái)研究,衛(wèi)星影像成像的所有影響因素都是圖像流形的一部分,其中重要的有:太陽(yáng)高度角、成像平臺(tái)、成像內(nèi)參數(shù)、大氣狀態(tài)、地形與結(jié)構(gòu)特征、地面狀況等。
表2 不同訓(xùn)練數(shù)據(jù)集的流形維度
3.2 視覺認(rèn)知模式的引入
深度學(xué)習(xí)是在淺層神經(jīng)網(wǎng)絡(luò)上發(fā)展起來(lái)的,使用的層數(shù)越來(lái)越多,最近出現(xiàn)了1000層的深度網(wǎng)絡(luò)。然而隨著網(wǎng)絡(luò)層數(shù)的增多,一方面訓(xùn)練時(shí)間將越來(lái)越多,另一方面效果提升越來(lái)越弱。深度學(xué)習(xí)的特征決定人很難讀懂學(xué)習(xí)到的模型,因而除了提升層數(shù)、微調(diào)整結(jié)構(gòu)外尚沒(méi)有突破性的方法。本文將針對(duì)衛(wèi)星影像的大流形維度的特點(diǎn),以窄化感知理論為指導(dǎo),對(duì)識(shí)別過(guò)程進(jìn)行解構(gòu),即將識(shí)別過(guò)程分解為一個(gè)個(gè)主題的學(xué)習(xí),然后再基于學(xué)習(xí)到的主題數(shù)據(jù)作為深度學(xué)習(xí)的輸入進(jìn)行二次深度學(xué)習(xí),以期將人的視覺經(jīng)驗(yàn)集成到深度學(xué)習(xí)中,提高訓(xùn)練效果。
人眼在長(zhǎng)期的自然演化與訓(xùn)練后,形成了比較成熟的視覺信息處理流程與模式,在錯(cuò)覺和異?,F(xiàn)象中往往能夠發(fā)現(xiàn)。
● 人眼對(duì)深度信息的發(fā)現(xiàn)具有方向性,即衛(wèi)星影像選裝180°后,人眼獲得的深度信息往往正好相反(正向是山脊的位置,旋轉(zhuǎn)180°后會(huì)視為山谷)。
● 結(jié)構(gòu)信息不正確會(huì)造成識(shí)別困難,在地面深度信息識(shí)別錯(cuò)誤的條件下,對(duì)密集高層建筑物的識(shí)認(rèn)會(huì)非常難。
● 為了得到最佳的識(shí)認(rèn)方向,往往首先識(shí)別出太陽(yáng)的方位。
● 大氣狀態(tài)、季節(jié)等要素,也是在識(shí)認(rèn)過(guò)程中逐漸清晰的,并作為先驗(yàn)信息指導(dǎo)后續(xù)的信息辨認(rèn)。
從這些現(xiàn)象可以看出,人眼經(jīng)過(guò)了多個(gè)流形維度的預(yù)先識(shí)別。據(jù)此觀察,可以首先單獨(dú)學(xué)習(xí)出某個(gè)流形維度的特征,然后再將這些特征融入目標(biāo)識(shí)別、圖像分類的深度網(wǎng)絡(luò)中,這樣就將衛(wèi)星成像過(guò)程的先驗(yàn)信息納入了深度學(xué)習(xí)中。
窄化,就是人們對(duì)事物的軀體感覺、認(rèn)知、情感或思維意識(shí)向某一方面或某一方向高度集中,使其所涉及的范圍越來(lái)越狹窄、越來(lái)越收縮、越來(lái)越局限的過(guò)程,窄化過(guò)程同時(shí)表現(xiàn)為對(duì)窄化對(duì)象的感受性增加、敏感程度增強(qiáng)。對(duì)象的程度屬性包括長(zhǎng)度、寬度、廣度、深度、濃度、密度、幅度、溫度、濕度、硬度等多個(gè)維度,窄化就是有針對(duì)性地選擇或忽略事物的維度的過(guò)程。由窄化感知理論可知,單獨(dú)訓(xùn)練一個(gè)流形特征要容易得多。這是筆者提出的預(yù)先學(xué)習(xí)流形特征的出發(fā)點(diǎn)?;诹餍翁卣鲗W(xué)習(xí)的深度學(xué)習(xí)框架如圖4所示。
圖4 基于窄化理論的完整圖像理解框架
具體如下:
● 通過(guò)多個(gè)單主題深度學(xué)習(xí)得到專題層;
● 每個(gè)專題學(xué)習(xí)都面向多尺度特征的深度學(xué)習(xí);
● 圖像分析中需要一個(gè)已經(jīng)存在的可能的分析結(jié)果(初始隨機(jī)結(jié)果或置為未知),完整的圖像理解是一個(gè)遞進(jìn)反復(fù)過(guò)程。
3.3 尺度特征的擴(kuò)充
衛(wèi)星影像的一個(gè)重要特征是其多尺度共存的特征,這是由成像分辨率和研究范圍決定的。圖像的大多數(shù)特征都是某個(gè)尺度下的特征,從理論上只有分形特征才具備尺度不變性。
存在兩種尺度的理解,分別為觀察分辨率和觀察范圍。在CNN深度網(wǎng)絡(luò)中,通過(guò)卷積的步長(zhǎng)來(lái)實(shí)現(xiàn)觀察分辨率的逐級(jí)粗化,而其觀察范圍基本沒(méi)有改變。改變觀察尺度,看到的是對(duì)象的內(nèi)部結(jié)構(gòu),例如,對(duì)于熱帶雨林地區(qū),精細(xì)分辨率下看到的是一個(gè)個(gè)斑塊代表的樹冠,在粗分辨率下看到的是灰綠一片。內(nèi)部結(jié)構(gòu)特征往往是一個(gè)“求同”(identification)的過(guò)程。尺度顯化特征影像與原始影像的對(duì)比如圖5、圖6所示。
圖5 尺度顯化特征影像與原始影像色調(diào)一致
圖6 尺度顯化特征影像與原始影像直方圖對(duì)比
當(dāng)鎖定影像上的一點(diǎn),考察其在不同范圍內(nèi)的表現(xiàn)時(shí),得到了該像素的外部結(jié)構(gòu)特征。外部結(jié)構(gòu)是一個(gè)“求異”(differentiation)的過(guò)程。
識(shí)別是求同與求異的統(tǒng)一,因而兩個(gè)過(guò)程不可偏廢。需要在傳統(tǒng)的多分辨率處理的基礎(chǔ)上增加多觀察范圍尺度來(lái)提升目標(biāo)與信息提取的效果。多觀察范圍尺度特征研究方面,鮮有成果提出,在前期的工作中提出的尺度顯化特征影像是這方面的一個(gè)填補(bǔ)空白的技術(shù)。該技術(shù)可以用在對(duì)原始影像的預(yù)處理上,處理結(jié)果為一幅新的具有范圍尺度特征的影像。其實(shí)現(xiàn)是通過(guò)考察某個(gè)像素在其不同尺度鄰域內(nèi)的對(duì)比特征確定其在該尺度下的顯著性,并將各個(gè)尺度的顯著性特征進(jìn)行加權(quán)組合,生成一個(gè)新的特征值作為該像素的像素值。該尺度特征影像具有如下性質(zhì):
● 基于亮暗的尺度特征影像基本保持原始色調(diào),從而保持了影像的總體外觀不變;
● 尺度顯化特征影像的直方圖上呈現(xiàn)離散多峰的特點(diǎn),具有分類的特征;
● 像素值本身含有尺度語(yǔ)義,且每個(gè)二進(jìn)制位代表不同的尺度特征(高位具有較大的尺度),為了突出特定尺度的地物對(duì)象可以通過(guò)位操作來(lái)實(shí)現(xiàn);
● 尺度顯化特征影像是在原始分辨率下的不同范圍觀察時(shí)的特征的概括,與傳統(tǒng)的金字塔或高斯多尺度空間圖像(以降低分辨率獲取的概括能力)相比,在保持概括性的同時(shí),不會(huì)將邊界也模糊掉,尤其是細(xì)窄地物(比如道路)。
衛(wèi)星影像本身是大數(shù)據(jù),當(dāng)從全球角度考慮時(shí),從中提取的目標(biāo)信息、分類信息等依然構(gòu)成大數(shù)據(jù),且與相應(yīng)區(qū)域的國(guó)家政策、經(jīng)濟(jì)建設(shè)、人文環(huán)境等密切相關(guān)。在該數(shù)據(jù)集上出現(xiàn)了一些新的研究方法和趨勢(shì)。
4.1 基于衛(wèi)星影像序列建模的信息挖掘方法
研究模式上,一種是首先進(jìn)行目標(biāo)與信息提取,然后通過(guò)數(shù)據(jù)挖掘?qū)ふ冶澈蟮臐撛诼?lián)系,這是傳統(tǒng)的方法。最近又出現(xiàn)了基于衛(wèi)星影像序列建模的信息挖掘方法。這種方法的前提是衛(wèi)星影像獲取能力提高到足夠高,以至于可以建立起衛(wèi)星影像時(shí)間序列(SITS),時(shí)間特征便成為一個(gè)重要的信息要素。基于SITS可以進(jìn)行區(qū)域變化建模,并基于該模型進(jìn)行變化預(yù)測(cè),更具有決策輔助的意義[20]。
基于SITS的研究是衛(wèi)星影像窄化分析中另一種窄化方式,即區(qū)域受限。這種區(qū)域窄化模式將提高目標(biāo)狀態(tài)變化的敏感性。這是面向目標(biāo)識(shí)別很難做到的,因?yàn)槟繕?biāo)識(shí)別過(guò)程中,為了提高識(shí)別的泛化能力,天然地有一種忽略目標(biāo)狀態(tài)的傾向。
4.2 多源數(shù)據(jù)集成研究
衛(wèi)星影像本身是一個(gè)多平臺(tái)、多波段和多成像方式的數(shù)據(jù)收集途徑,最近幾年無(wú)人機(jī)的興起為遙感對(duì)地觀察增添了新的信息獲取渠道,無(wú)人機(jī)的最大特點(diǎn)是靈活、即時(shí)、分辨率高、兼有視頻與圖像。將長(zhǎng)期的衛(wèi)星影像分析結(jié)果與即時(shí)的無(wú)人機(jī)驗(yàn)證結(jié)合將成為一種新的應(yīng)用模式,也出現(xiàn)了將遙感信息與網(wǎng)絡(luò)輿情、商業(yè)統(tǒng)計(jì)等信息相結(jié)合的研究。
4.3 數(shù)據(jù)獲取方式的革新
能否獲取衛(wèi)星影像數(shù)據(jù)成為應(yīng)用能否成功的關(guān)鍵。傳統(tǒng)上那種昂貴的衛(wèi)星數(shù)據(jù)售賣方式將嚴(yán)重阻礙大數(shù)據(jù)應(yīng)用的發(fā)展,因?yàn)楹茈y有一個(gè)應(yīng)用客戶能購(gòu)買得起這么大的數(shù)據(jù)。不過(guò)隨著大數(shù)據(jù)價(jià)值的發(fā)掘,衛(wèi)星影像數(shù)據(jù)的商業(yè)價(jià)值將更多地體現(xiàn)在增值服務(wù)上,即由數(shù)據(jù)服務(wù)向信息、情報(bào)服務(wù)過(guò)渡,這方面DigitalGlobe已經(jīng)走到了前頭,通過(guò)提供的GBDX②https:// developer.digitalglobe.com/ gbdx/來(lái)使用其數(shù)據(jù)。
4.4 面向應(yīng)用的數(shù)據(jù)評(píng)價(jià)
當(dāng)數(shù)據(jù)獲取不是問(wèn)題的時(shí)候,數(shù)據(jù)的質(zhì)量評(píng)價(jià)、有用性評(píng)價(jià)、適用性評(píng)價(jià)將成為面向應(yīng)用數(shù)據(jù)準(zhǔn)備的最重要一環(huán)。根據(jù)應(yīng)用的目的篩選合適的影像類型、成像時(shí)間、成像季節(jié)、成像角度等,并初步判斷圖像內(nèi)容的合用性,比如云量的多少、圖像的完整性等。
對(duì)于選取的數(shù)據(jù)也不一定全部使用,因?yàn)槔锩娲嬖谥罅康娜哂嘈畔?,這需要建立圖像內(nèi)容與應(yīng)用目標(biāo)之間的模型,尋找最佳的數(shù)據(jù)組合,在數(shù)據(jù)缺失的時(shí)候?qū)で笞罴训奶娲鷶?shù)據(jù)。
4.5 實(shí)時(shí)處理將成為可能
對(duì)于生物體來(lái)說(shuō),信息的獲取與處理是同時(shí)的。而遙感的應(yīng)用因?yàn)榧夹g(shù)的原因,從獲取到應(yīng)用,中間需要經(jīng)過(guò)多個(gè)時(shí)間分裂的環(huán)節(jié),因而遙感應(yīng)用的周期都比較長(zhǎng),對(duì)于國(guó)家級(jí)的事務(wù)也需要一兩天的反應(yīng)期,且獲取的數(shù)據(jù)也不一定適用。
當(dāng)信息處理的速度跟得上影像獲取的速度的時(shí)候,影像的獲取模式也將隨之改變,例如,當(dāng)能夠?qū)崟r(shí)監(jiān)測(cè)云量和位置時(shí),便能通過(guò)改變成像的視角來(lái)躲開云區(qū)或在云覆蓋區(qū)通過(guò)不同的角度成像來(lái)消除云的干擾。這樣就從單純的獲取數(shù)據(jù)過(guò)渡到了獲取信息的目標(biāo)。
參考文獻(xiàn):
[1] SEVER T L, IRWIN D E.Landscape archaeology: remote-sensing investigation of the ancient maya in the peten rainforest of northern guatemala[J].Ancient Mesoamerica, 2003, 14(1): 113-122.
[2] STEVEN M D, CLARK J A.Applications of remote sensing in agriculture[J].1990, 13(1989): 69-75.
[3] LIAGHAT S, BALASUNDRAM S.A review: the role of remote sensing in precision agriculture[J].American Journal of Agricultural and Biological Sciences, 2010, 5(1): 553-564.
[4] BECKERRESHEF I, JUSTICE C, DOORN B, et al.NASA contribution to the group on earth observation (GEO) global agricultural monitoring system of systems[J].The Earth Obs, 2009(21): 24-29.
[5] COUNCIL N R.Contributions of land remote sensing for decisions about food security and human health: workshop report[R].2007.
[6] BROWN M E, GRACE K, SHIVELY G, et al.Using satellite remote sensing and household survey data to assess human health and nutrition response to environmental change[J].Population and Environment, 2014, 36(1): 48-72.
[7] M A RTI NUZZ I A S,G OULDA W A, GONZALEZA O M R.Land development, land use, and urban sprawl in Puerto Rico integrating remote sensing and population census data[J].Landscape and Urban Planning, 2007, 79(3): 288-297.
[8] NETZBAND M,STEFANOV W,REDMAN C.Applied remote sensing for urban planning, governance and sustainability[M].Berlin Heidelberg: Springer-Verlag, 2007.
[9] DENG X, HUANG J, ROZELLE S, et al.Growth, population and industrialization, and urban land expansion of china[J].Journal of Urban Economics, 2008, 63(1): 96-115.
[10] GAMBA P, HEROLD M.Global mapping of human settlement: experiences, datasets, and prospects[M].Florida: CRC Press, 2009.
[11] BHATTA B.Analysis of urban growth and sprawl from remote sensing data[M].Berlin Heidelberg: Springer-Verlag, 2010.[12] CROWTHER T W, GLICK H B, COVEY K R.Mapping tree density at a global scale[J].Nature, 2015, 525(7568): 201-205.
[13] HALL O.Remote sensing in social science research[J].The Open Remote Sensing Journal, 2010, 3(1): 1-16.
[14] BASU S.Deepsat-a learning framework for satellite imagery[J].Computer Science, 2015.
[15] HARALICK R M,SHANMUGAM K, DINSTEIN I.Textural features for image classification[J].IEEE Transactions on Systems, Man and Cybernetics, 1973, SMC-3(6): 610-621.
[16] SOH L K, TSATSOULIS C.Texture analysis of sar sea ice imagery using gray level co-occurrence matrices[J].IEEE Transactions on Geoscience and Remote Sensing, 1999, 37(2): 780-795.
[17] CLAUSI D A.An analysis of co-occurrence texture statistics as a function of grey level quantization[J].Canadian Journal of Remote Sensing, 2002, 28(1): 45-62.
[18] BOUREAU Y L, PONCE J, LECUN Y.A theoretical analysis of feature pooling in visual recognition[C]//International Conference on Machine Learning, July 11-14, 2010, Qingdao, China.[S.l.:s.n.], 2010: 459-459.
[19] CERUTI C, BASSIS S, ROZZA A, et al.Danco: an intrinsic dimensionality estimator exploiting angle and norm concentration[J].Pattern Recognition,2014, 47(8): 2569-2581.
[20] ZHU Z, WOODCOCK C E.Continuous change detection and classification of land cover using all available landsat data[J].Remote Sensing of Environment, 2013, 144(1): 152-171.
Intelligence analysis and application for satellite imagery of big data
ZHANG Jinfang, HU Xiaohui, ZHANG Hui, WANG Rui, LI Haichang
Institute of Software, Chinese Academy of Sciences, Beijing 100080, China
Imaging capability has been greatly improved along with the development of remote sensing technology, the image information extraction based on deep learning raises to a new level, and cloud computing makes it possible of processing satellite imagery of big data.These three technologies activated the research on the expected potential commercial and military value, many research institutions joined the strength competition, and attracted a large number of venture capital.The potential value analysis and application based on satellite imagery of big data were summarized, and the next possible technological breakthroughs and the future direction of development were presented.
satellite imagery, big data, intelligence analysis
TP75
A
10.11959/j.issn.2096-0271.2016053
張金芳(1970-),男,中國(guó)科學(xué)院軟件研究所副研究員,主要研究方向?yàn)椤?S”技術(shù)與應(yīng)用,主要研究方向?yàn)樾l(wèi)星影像處理、大數(shù)據(jù)挖掘。
胡曉惠(1960-),男,中國(guó)科學(xué)院軟件研究所研究員,天基綜合信息技術(shù)實(shí)驗(yàn)室常務(wù)副主任,主要研究方向?yàn)樾畔⑾到y(tǒng)集成與仿真技術(shù)。其中,系統(tǒng)仿真技術(shù)包括分布式仿真技術(shù)、模型重組技術(shù)和想定處理技術(shù)等,應(yīng)用目標(biāo)是分析體系結(jié)構(gòu)、進(jìn)行方案設(shè)計(jì)以及對(duì)總體技術(shù)和指標(biāo)等進(jìn)行研究;綜合信息系統(tǒng)與集成技術(shù),主要包括綜合信息系統(tǒng)的體系結(jié)構(gòu)研究以及信息集成、系統(tǒng)集成和應(yīng)用集成等研究?jī)?nèi)容。
張慧(1984-),女,中國(guó)科學(xué)院軟件研究所助理研究員,主要研究方向?yàn)槟J阶R(shí)別與遙感圖像處理。
王瑞(1987-),女,中國(guó)科學(xué)院軟件研究所工程師,主要研究方向?yàn)榇髷?shù)據(jù)、云計(jì)算、服務(wù)計(jì)算。
李海昌(1984-),男,中國(guó)科學(xué)院軟件研究所助理研究員,主要研究方向?yàn)槟J阶R(shí)別與圖像分析。
2016-08-10
國(guó)家自然科學(xué)基金資助項(xiàng)目(No.U1435220)
Foundation Item: The National Natural Science Foundation of China (No.U1435220)