馬劍林, 鄭宇恒, 李雙琴, 孫 嘯, 張 濤, 沈 忱, 鄒 妍
(中國石油天然氣股份有限公司西南管道分公司, 成都 610037)
近年來,隨著經(jīng)濟的發(fā)展,油氣管道外界環(huán)境越來越復雜,由于外界環(huán)境變化引起的油氣管道泄漏事故頻發(fā)。油氣管道在儲運過程中,沿線地物環(huán)境變化,如房屋的建設、溝壑的挖掘、滑坡等易造成管道的外漏、擠壓等事故,因此對油氣管道沿線地物變化情況進行及時、準確地監(jiān)測十分重要[1]。傳統(tǒng)的油氣管道安全巡檢通常采用人工巡檢的方式,但是隨著中國油氣管道分布范圍越來越廣,沿線區(qū)域地物越來越復雜,傳統(tǒng)的人工巡檢方式不能有效識別油氣管道沿線地物變化情況;而衛(wèi)星遙感具有大范圍、長時間和周期性監(jiān)測的能力[2],因此利用衛(wèi)星遙感影像對油氣管道沿線地物變化情況進行檢測具有可行性[3]。
變化檢測是指通過對覆蓋同一地區(qū)不同時相遙感影像的研究,定量分析和確定地表覆蓋變化的特征與過程[4]。按照算法的自動化程度,變化檢測可分為非監(jiān)督和監(jiān)督變化檢測算法。
非監(jiān)督變化檢測算法一般是根據(jù)閾值分割直接將兩時相影像生成的差值影像分為變化和非變化類別[5-6]。主要包括有影像差值法、變化向量分析法(change vector analysis, CVA)法[7]、馬爾科夫隨機場(Markov random filed, MRF)[8]等,非監(jiān)督變化檢測算法可以確定地物是否發(fā)生變化,但是無法判斷變化類型,并且該類型變化檢測技術的精度可能會受到不同時相影像的光照變化、大氣條件和傳感器校準差等外部因素的影響,一般檢測精度相對較低[9]。
監(jiān)督變化檢測算法是在有先驗知識的前提下,通過機器學習挖掘并提取遙感影像的變化信息,可以有效減少不同時相影像間的大氣、光照條件等對檢測結果的影響,一般檢測精度較高[10]。但是在監(jiān)督變化檢測中,通常需要通過目視解譯手動選擇有標簽的訓練樣本,可能會導致所選類別不全,并且費時費力,特別是針對數(shù)據(jù)量較大并且結構較為復雜的高分辨率遙感影像來說訓練樣本標記成本增加。半監(jiān)督方法能夠在少量標記樣本的情況下利用一定的策略增選一些未標記的樣本用于分類器的訓練,在一定程度上減少了獲取訓練樣本的代價并且解決了訓練樣本不足的現(xiàn)象。因此大量學者研究了半監(jiān)督變化檢測算法。趙敏[11]提出了基于支持向量機(support vector machine, SVM)的半監(jiān)督變化檢測算法并應用于礦區(qū)監(jiān)測,與傳統(tǒng)的變化檢測算法相比,精度得到較大提高。但是該算法只是利用單一的分類器,并且在樣本增選過程中未考慮噪聲對訓練樣本的影響以及冗余信息。多分類器集成結構可以綜合利用多個分類器的優(yōu)勢互補性能,主動學習可以通過一定的算法選擇置信度高的未標記樣本作為訓練模型的增選樣本來提高模型的精確度[12]。在分析了機器學習和半監(jiān)督變化檢測以及主動學習的基礎上,構建了基于主動學習的半監(jiān)督變化檢測算法。
針對高分辨率遙感影像地物結構信息豐富等特點,當前研究熱點主要圍繞面向?qū)ο笞兓瘷z測[13]和多特征空間融合[14]兩個方面。如何有效挖掘并利用豐富的紋理特征、形態(tài)特征等空間信息來彌補光譜信息的不足,對于高分辨率遙感影像變化檢測精度的提高具有重要的作用[15]。Peng等[16]以對象為分類基元,利用證據(jù)理論融合算法對多特征融合影像進行變化檢測,與像素級變化檢測結果相比,精度得到有效提高。由于不同地物具有不同的尺度特征,面向?qū)ο笞兓瘷z測算法以影像對象為基元進行檢測,因此可能會忽略尺度較小的地物變化。Tan等[17]通過提取紋理、Gabor濾波、形態(tài)特征與光譜特征一起構建多源特征進行變化檢測,取得了較好的變化檢測結果。
雖然已經(jīng)有大量學者和專家針對高分辨率遙感影像變化檢測做了改進,但是現(xiàn)存的方法中仍舊存在以下難點:受“同物異譜”和“同譜異物”影響,傳統(tǒng)的基于光譜特征的面向像元的變化檢測結果中存在偽變化以及“椒鹽噪聲”現(xiàn)象;遙感影像不同地物具有多尺度特征,單純的面向?qū)ο蟮淖兓瘷z測算法存在“分割失真”現(xiàn)象以及“均值問題”;基于機器學習的監(jiān)督變化檢測算法雖然有效提高了變化檢測的精度,但是單分類器挖掘能力有限,并且訓練樣本獲取困難。
針對以上高分辨率遙感影像的特點以及難點,在前人研究的基礎上提出了基于多源特征融合和主動學習的遙感影像變化檢測算法對油氣管道沿線地物變化情況進行檢測。首先通過特征提取構建最優(yōu)多源特征矢量,然后利用自適應閾值算法選擇初始訓練樣本,最后利用梯度提升樹[18]、k近鄰[19]和極限隨機樹[17]構成的集成結構在分割對象的基礎上進行未標記樣本的類別判定以及變化檢測結果的提取,在利用多分類器集成進行未標記樣本類別判定過程中,采用邊緣采樣的主動學習算法進行未標注樣本增選。在樣本增選過程中通過兩方面對增選樣本進行優(yōu)化,首先通過分割對象約束分類器集成變化檢測結果,減少“椒鹽噪聲”的影響,提高增選樣本的準確性,然后利用邊緣采樣方法選擇信息量較大的未標記樣本進行標注。
1.1.1 多源特征提取
隨著高分辨率遙感影像空間分辨率的提高,光譜波段信息隨之減少,為了充分挖掘并利用高分辨率遙感影像豐富的空間信息,以提高變化檢測的精度,提取了紋理和形態(tài)特征與光譜特征組合構建變化檢測的輸入數(shù)據(jù)。
1.1.2 變化矢量特征的構建
根據(jù)紋理特征和形態(tài)特征構建的各個像元(i,j)的多源特征向量X(i,j)計算公式為
X(i,j)=[Xs(i,j),Xt(i,j),Xm(i,j)] (1)
式(1)中:Xs(i,j)表示像元的光譜特征;Xt(i,j)表示紋理特征;Xm(i,j)表示形態(tài)特征。則差值影像表示為
D(i,j)=X1(i,j)-X2(i,j) (2)
(1)利用構建的多源特征數(shù)據(jù)根據(jù)CVA法獲取變化強度矢量圖,其中變化強度矢量計算公式為
(2)計算變化強度矢量的均值M、并參考文獻[20]求取變化最優(yōu)閾值。
(3)根據(jù)M設定初始閾值T0,T0=M,并利用T0將變化強度矢量圖分為兩類:
(4)求取兩部分的均值Mu和Mc并計算新的閾值T,T=|(Mu+Mc)/2|。并根據(jù)終止條件e比較兩閾值的絕對差,如果滿足收斂條件,即|T-T0| (5)當e較小,但實際收斂結果e1較大時,即當e1>e時不同的初始閾值T0會產(chǎn)生兩個初始閾值Tlast1和Tlast2,即閾值所在的一個范圍{Tlast1,Tlast2}。 (6)根據(jù)Tlast1和Tlast2將位于初始閾值范圍外的影像分為兩部分: (7)求取兩部分的標準差S1和S2,并計算最終閾值T。 (8)根據(jù)閾值T將變化矢量圖CD歸為變化和非變化像元兩部分: 式(7)中,CD(i,j)和f(i,j)分別表示像元(i,j)的變化檢測結果和變化矢量。 (9)通過分割對象約束對初始變化檢測結果進行不確定性分析。 磨河水庫屬小型水庫,由于工程自身規(guī)模較小,所以投入的資金和人員受相關水利部門管理限制。建設資金少、使用是否合理,人員匱乏、專業(yè)素質(zhì)如何,這些因素都是嚴重影響磨河水庫工程建設的重要因素。 式(8)中,n_c和n_uc分別表示任一對象Ri中變化和非變化像元數(shù)量;Ni表示對象Ri中像元總個數(shù);e1i+e2i=1。 (10)分別將所有的e1i和e2i從大到小進行排序,數(shù)值越大,確定性越大,并從最確定區(qū)域隨機選擇準確率較高的正負訓練樣本作為初始訓練樣本。 影像分割是指利用遙感影像的光譜、紋理、形狀以及空間上下文特征,將圖像劃分為若干個具有特征一致性且互不重疊的連通區(qū)域的過程。 分形網(wǎng)絡演化方法(fractal net evolution approach, FNEA)是一種有效的多尺度分割算法,該算法以種子點為起始點,根據(jù)像元對象異質(zhì)性最小的原則,在保證類間平均異質(zhì)性最小、類內(nèi)同質(zhì)性最大的前提下,基于合并相鄰像素或小分割對象來實現(xiàn)影像的分割,是一種自上而下的分割算法。對象異質(zhì)性度量和尺度閾值選擇是決定對象合并與終止的條件。其中異質(zhì)性度量公式為 f=wcolorhcolor+wshapehshape(9) 式(9)中:hcolor表示相鄰對象的光譜異質(zhì)度;hshape表示相鄰對象的形狀異質(zhì)度;wcolor和wshape分別表示相鄰對象的光譜和形狀異質(zhì)度權重,wshape+wcolor=1。 實驗中利用的是易康自帶的FNEA算法對兩時相疊加后影像進行分割,通過設置分割尺度(scale),緊致度(compactness)和形狀(shape)參數(shù)對影像進行分割,并且利用空間信息和位置信息提取具有不同標簽值(Label)對象的索引來對柵格數(shù)據(jù)進行處理,對每個對象Ri,利用式(8)對初始變化檢測結果進行約束,計算該分割對象屬于非變化對象和變化對象的概率,并從最確定變化和非變化區(qū)域分別提取正負訓練樣本作為初始訓練樣本候選集,利用1.2節(jié)方法進行初始訓練樣本的提取。 1.4.1 增選樣本候選集的構建 增選樣本候選集的構建可以有效解決半監(jiān)督變化檢測訓練學習過程中的樣本標注問題。傳統(tǒng)的多分類器集成半監(jiān)督變化檢測算法中,通常選擇兩個分類器變化檢測結果一致的樣本作為增選樣本候選集,但是由于高分辨率遙感影像變化檢測中噪聲可能會被誤檢為偽變化像元,影響增選樣本的準確度,因此首先利用多尺度分割對分類器集成變化檢測結果進行約束,然后利用已經(jīng)標注樣本的八鄰域信息與多分類器變化檢測結果進行融合進行增選樣本候選集的構建,這樣既利用了光譜信息,也有效利用了空間信息,使增選樣本結果更加可靠。 1.4.2 邊緣采樣的主動學習算法 在樣本增選過程中,如果選擇光譜特征相似的未標記樣本進行標注不僅不能提高變化檢測的精度,還會增加樣本的冗余性進而降低變化檢測的效率。因此利用主動學習算法進行增選樣本選擇的優(yōu)化十分重要。邊緣采樣是樣本不確定性分析的標準之一,該方法是根據(jù)樣本的最大后驗概率和次大后驗概率的差值來描述不確定性,差值越小,不確定性越大,說明該樣本的信息量越大,可分性越小,添加到訓練模型中越有意義。在變化檢測中只有變化和非變化兩類,因此選擇屬于變化和非變化類別概率結果差值的絕對值最小的樣本x′i進行標注,即 x′i=argmin|p(yi=c|xi)-p(yi=uc|xi)| (10) 式(10)中:c代表變化類別的標簽;uc代表非變化類別的標簽;p(yi=c|xi)和p(yi=uc|xi)分別表示像元xi屬于變化和非變化類型的概率。 影像大小分別為700×700個像元,空間分辨率為2.1 m圖2 兩時相遙感影像和參考變化圖Fig.2 Two-temporal images and reference map 為了提高變化檢測算法的自動化程度,并且有效利用高分辨率遙感影像豐富的空間信息,構建了基于多源特征融合和主動學習的變化檢測算法,并且為了充分利用機器學習的挖掘能力,將目前應用廣泛的梯度提升樹(gradient boosting decision tree, GBDT)、k近鄰(knear neighbor, KNN)和極限隨機樹(extremely randomized trees, ET)作為基分類器構成集成結構。 其中實驗主要分為兩部分,如圖1所示,首先利用1.1節(jié)所述的多源特征提取方法構建多源特征和差值影像。由于在實際應用中,初始訓練樣本獲取較為困難,因此利用自適應閾值法和不確定性分析自動選擇準確度較高的初始訓練樣本,并通過半監(jiān)督變化檢測算法獲取變化檢測結果,在半監(jiān)督變化檢測過程中,為了提高未標記樣本的準確率并且減少增選樣本的冗余性,通過對象約束和主動學習增選準確且信息量較大的未標記樣本進行標注。 圖1 算法流程Fig.1 Algorithm flowchart 利用2013年11月和2014年10月的兩時相影像資源3(ZY-3)號影像進行實驗有效評估算法的有效性,影像覆蓋范圍是江蘇省部分區(qū)域,如圖2(a)、圖2(b)所示,參考變化圖如圖2(c)所示。 2.2.1 模型建立 為了有效驗證本文構建的用于油氣管道沿線地物變化檢測算法的可行性,選擇基于EM的CVA、基于ET和GBDT的同質(zhì)分類器集成變化檢測算法,以及基于主動學習的支持向量機(semi-SVM)半監(jiān)督變化檢測算法作對比,實驗過程中ET和GBDT算法都是利用自適應閾值法自動選擇訓練樣本。為減少訓練樣本的偶然性對變化檢測結果的影響,每次實驗進行5次,取平均值作為最終精度,所有實驗都以整幅影像像元作為測試像元。其中在基于SVM和多分類器的半監(jiān)督變化檢測過程中,兩種方法初始訓練樣本都設置為100個,迭代過程中每次增選50個,共迭代11次,都利用邊緣采樣的主動學習策略進行樣本增選,兩種方法的變化檢測精度曲線如圖3所示,圖中Semi-SVM表示基于半監(jiān)督SVM的變化檢測算法,Semi-ensemble表示本文提出的基于多分類器集成和主動學習的半監(jiān)督變化檢測算法。 圖3 半監(jiān)督變化檢測算法精度變化曲線Fig.3 Precision trend of semi-supervised methods 通過圖3可以看出,半監(jiān)督SVM變化檢測算法在迭代到第8次時精度趨于平穩(wěn)狀態(tài),總體精度低于本文所提的變化檢測算法,因此也說明了多分類器集成結構相對于單分類器來說挖掘能力更強。 2.2.2 精度評定 圖4所示為不同變化檢測算法和參考變化圖。通過圖4(a)可以看出,基于CVA的非監(jiān)督變化檢測算法中存在較多噪聲影響產(chǎn)生的虛檢像元,如綠色框區(qū)域。通過圖4(b)~圖4(e)檢測結果中可以看出,在紅色框區(qū)域所示的裸土變?yōu)榈缆凡糠?基于ET[圖4(b)]和GBDT算法[圖4(c)]漏檢了大量像元,基于SVM半監(jiān)督變化檢測算法[圖4(d)]稍微得到改善,漏檢像元數(shù)量有所減少,而本文構建的基于主動學習的多分類器集成結構[圖4(e)]對于這些區(qū)域的檢測效果得到了明顯提升,并且虛檢現(xiàn)象也得到較大改進,因此可以有效應用于油氣管道沿線地物變化情況研究。 為了定量地評估不同算法的有效性,利用總體精度、Kappa系數(shù)、虛檢率、漏檢率和誤檢像元數(shù)量5種評價指標來進行精度評定。表1列出了不同變化檢測算法的檢測精度,通過實驗結果可以看出本文構建的變化檢測算法總體精度為0.947 7,Kappa系數(shù)為0.703 6,具有比其他算法更高的變化檢測精度,更低的虛檢率和漏檢率。相比其他變化檢測算法總體精度分別提高了2%~4%,Kappa系數(shù)提高了約0.23,并且,通過誤檢像元數(shù)量可以看出,相對于對比實驗來說,本文提出的方法誤檢像元數(shù)量減少很多,因此說明了該方法的可行性和有效性。 針對油氣管道外界環(huán)境越來越復雜、外界環(huán)境變化引起的油氣管道泄漏事故頻發(fā)等現(xiàn)象,研究了基于衛(wèi)星遙感的油氣管道沿線地物變化檢測算法。為綜合利用非監(jiān)督變化檢測和監(jiān)督變化檢測各自的優(yōu)點,在提高變化檢測的自動化程度減少訓練樣本標注成本的同時,提高變化檢測的精度。構建了基于主動學習的半監(jiān)督變化檢測算法,在該算法結構中,為了充分利用分類器挖掘信息的能力,利用GBDT、kNN和ET構建了分類器集成結構,并且利用邊緣采樣的主動學習方法進行訓練樣本的增選。通過實驗結果可知,該變化檢測框架在減少訓練樣本標注的同時,提高了變化檢測的精度,可以有效檢測油氣管道沿線地物變化情況。為了驗證算法的有效性,利用兩景基于ZY-3影像的融合后高分辨率遙感影像進行實驗,通過對比實驗結果可知本文構建的變化檢測算法不僅減少了訓練樣本標注成本,而且精度優(yōu)于其他方法。1.3 多尺度分割
1.4 訓練樣本增選策略
1.5 算法流程
2 實驗結果與分析
2.1 實驗數(shù)據(jù)
2.2 實驗過程
3 結論