覃偉榮,勞燕玲
(北部灣大學(xué)資源與環(huán)境學(xué)院,廣西 欽州 535011)
隨著遙感衛(wèi)星技術(shù)的不斷發(fā)展,一方面增加了遙感衛(wèi)星傳感器以及遙感數(shù)據(jù)類型,另一方面導(dǎo)致數(shù)據(jù)量急劇增加,對遙感數(shù)據(jù)的管理以及存儲等帶來了巨大的挑戰(zhàn)[1,2]。同時,由于遙感數(shù)據(jù)自身具有時空等多維度特征,越來越多的遙感應(yīng)用開始關(guān)注遙感數(shù)據(jù)集的時間分析和管理,在現(xiàn)有微型數(shù)據(jù)中心環(huán)境下,數(shù)據(jù)的獲取以及分析存在效率低下等問題,所以對異構(gòu)遙感數(shù)據(jù)有效檢測成為當(dāng)前研究的關(guān)鍵問題。
相關(guān)專家對此進(jìn)行了大量研究,并給出了一些較好的研究成果,李新鵬等人[3]通過歷史數(shù)據(jù)組建多個子森林異常檢測器,同時組建森林異常檢測器,將數(shù)據(jù)輸入到檢測器中完成數(shù)據(jù)異常檢測。胡姣姣等人[4]通過抽樣法對不平衡時間數(shù)據(jù)實施預(yù)處理,將經(jīng)過處理后的時間序列數(shù)據(jù)轉(zhuǎn)換為尺度和時間一致的片段,同時將數(shù)據(jù)輸入到卷積神經(jīng)網(wǎng)絡(luò)模型中完成異常檢測。閆媞錦等人[5]通過含有可訓(xùn)練遲滯項的門控循環(huán)單元對缺失和非規(guī)則采樣的時序數(shù)據(jù)實施建模,采用極值論中的自適應(yīng)閾值確定合適閾值,最終達(dá)到異常檢測的目的。在以上幾種方法的基礎(chǔ)上,提出一種基于3D關(guān)聯(lián)規(guī)則深度學(xué)習(xí)的異構(gòu)遙感數(shù)據(jù)檢測方法。經(jīng)實驗測試結(jié)果證明,所提方法可以有效提升檢測結(jié)果,降低檢測時間。
小波變換可以將遙感數(shù)據(jù)分解為低頻和高頻信息,為了更好地保護(hù)遙感數(shù)據(jù)的細(xì)節(jié)特征,提出一種基于雙樹復(fù)小波的四階偏微分方程數(shù)據(jù)去噪模型[6,7],模型中兩個關(guān)鍵的去噪部分為:
1)對于含有噪聲的原始遙感數(shù)據(jù),需要實施二維雙樹復(fù)小波分解,分解出包含大量噪聲的高低頻子帶,經(jīng)過去噪處理的高低頻子帶采用雙樹復(fù)小波重構(gòu),最終得到去噪后的遙感數(shù)據(jù)。
2)對復(fù)高頻子帶的實部和虛部分別使用四階偏微分模型完成去噪。
在去噪模型中,通過Q-Shift濾波組對含有噪聲的遙感數(shù)據(jù)實施一維雙樹復(fù)小波多尺度分解,分解后灰度梯度比較低的信息即為背景信息,而分解后含有大量噪聲的高頻子帶則為噪聲或者邊緣信息。
雙樹復(fù)小波分解的詳細(xì)操作步驟如圖1所示。
圖1 雙樹復(fù)小波分解流程圖
偏微方程的求解思路主要采用有限差分法完成數(shù)值計算,有限差分法的基本操作思路為:
通過一定的步長根據(jù)時間和空間完成格網(wǎng)劃分,同時將連續(xù)的偏微分方程采用差分近似代替導(dǎo)數(shù)的方式劃分為多個代數(shù)方程,同時求解代數(shù)方程組,獲取各個網(wǎng)格節(jié)點的取值。
有限差分法的詳細(xì)操作步驟如下所示:
1)將時間和空間區(qū)域離散化處理;
2)將各個網(wǎng)格上的導(dǎo)數(shù)通過像素灰度值計算,將計算得到的差分作為近似替換;
3)根據(jù)推導(dǎo)出的迭代公式,設(shè)定最佳迭代次數(shù),同時采用梯度下降法求解[8,9],其中梯度下降流可以表示為式(1)的形式
(1)
式中,p(x,y,z)代表歐拉方程;q代表時間變量;h代表最佳迭代次數(shù)。
為了對方程離散化處理,主要借助有限差分法實現(xiàn)。在遙感數(shù)據(jù)中心點,可以獲取對應(yīng)的二階差分?h(i,j),具體的計算式為
?h(i,j)=(vxx)i,j+(vyy)i,j
(2)
其中
(3)
式中,(vxx)i,j和(vyy)i,j代表二階差分因子。
將雙樹復(fù)小波分解和四分偏微分方程兩者相結(jié)合完成遙感數(shù)據(jù)去噪,詳細(xì)的操作流程如圖2所示。
圖2 遙感數(shù)據(jù)去噪流程圖
1)初始化遙感數(shù)據(jù),確定迭代離散化時間和空間步長,設(shè)定迭代次數(shù)。
2)對含有噪聲的遙感數(shù)據(jù)實施分解。
3)保留小波系數(shù)的低頻部分,獲取二階差分。
4)通過遙感數(shù)據(jù)的實際情況和噪聲水平選取合適的梯度閾值。
5)計算擴(kuò)散函數(shù)的二階差分。
6)獲取去噪后的高頻小波系數(shù)。
7)重構(gòu)去噪后的高低頻分量,獲取去噪后的遙感數(shù)據(jù)。
在遙感數(shù)據(jù)去噪的基礎(chǔ)上,挖掘其屬性特征。選取遙感數(shù)據(jù)中的多個屬性特征,主要包含波段、紋理以及形狀等條件屬性特征。以下分別對基元特征參數(shù)展開詳細(xì)描述:
1)相似度:
主要用來衡量灰度共生矩陣元素在行或者列方向的相似矩陣,可以有效反映局部灰度值的相關(guān)性。相似度Cor的具體計算式如下所示
(4)
式中,q(i,j)代表矩陣元素值;uxuy代表局部灰度相關(guān)性;β1和β2代表度量矩陣的取值。
2)矩形度:
矩形度Compact主要用來描述目標(biāo)圖像面積和包圍該圖像的最小矩形面積之比,詳細(xì)的計算式如下
(5)
式中,Mmerge代表對象的像元數(shù)量;nmerge和hmerge代表不同類型的對象像元。
另外,在計算的過程中,還需要使用最小外接矩形(MER),詳細(xì)的計算步驟為:
1)追蹤不同基元的四鄰域輪廓,獲取封閉區(qū)域;同時計算各個外接矩形面積,存儲各個存儲的長寬以及面積等信息。
2)重復(fù)步驟1),同時實施多次旋轉(zhuǎn)。
3)當(dāng)完成旋轉(zhuǎn)之后,計算封閉區(qū)域的矩形面積,得到封閉區(qū)域的最小外接矩形,同時獲取對應(yīng)的頂點坐標(biāo)。
4)根據(jù)步驟3)獲取MER的頂點坐標(biāo),同時得到矩形的相關(guān)形狀特征。
形狀指數(shù)主要用來描述對象邊的平滑度ShapeIndex,如式(6)所示
(6)
通過3D關(guān)聯(lián)規(guī)則深度學(xué)習(xí)主要包含兩個方面的內(nèi)容,尋找全部的頻繁項集以及通過頻繁項集獲取強(qiáng)關(guān)聯(lián)規(guī)則。其中,強(qiáng)關(guān)聯(lián)規(guī)則需要滿足最小支持度和最小置信度規(guī)則。
基于3D關(guān)聯(lián)規(guī)則深度學(xué)習(xí)的操作步驟如下所示:
1)預(yù)處理和挖掘任務(wù)存在關(guān)聯(lián)的遙感數(shù)據(jù),對問題具體分析并實施相應(yīng)操作,構(gòu)建結(jié)構(gòu)化的數(shù)
2)對于數(shù)據(jù)庫,需要求解全部滿足最小支持度的項目集,即頻繁項目集。
3)形成滿足最小置信度的關(guān)聯(lián)規(guī)則,進(jìn)而構(gòu)建規(guī)則集。
4)分析并解釋典型的關(guān)聯(lián)規(guī)則。
由于遙感數(shù)據(jù)量比較大且屬性維數(shù)比較多,選擇合適的3D關(guān)聯(lián)規(guī)則深度學(xué)習(xí)算法是十分重要的。
通過3D關(guān)聯(lián)規(guī)則深度學(xué)習(xí)算法分別統(tǒng)計式(4)-式(6)所描述的每個屬性特征的期望信息和熵,進(jìn)而獲取異構(gòu)遙感數(shù)據(jù)屬性特征,如式(7)所示
(7)
式中,H(i,j)代表經(jīng)過挖掘獲取的異構(gòu)遙感數(shù)據(jù)屬性特征;Ent(H1)和Ent(H2)代表特征挖掘效率。
以通過3D關(guān)聯(lián)規(guī)則深度學(xué)習(xí)得到的異構(gòu)遙感數(shù)據(jù)屬性特征挖掘結(jié)果為基礎(chǔ),采用計算機(jī)視覺常用的詞包模型進(jìn)一步實施異構(gòu)遙感數(shù)據(jù)檢測。過程如下所示:
1)將最優(yōu)尺度作為判定依據(jù),分割遙感數(shù)據(jù),最終獲取對應(yīng)的數(shù)據(jù)對象;
2)獲取每一個分割對象的低層特征[10],得到研究對象的底層特征描述符;
3)分別對分割對象的特征描述子進(jìn)行編碼量化[11]和聚類操作,將處理結(jié)果匯聚成特征字典;
4)通過判定依據(jù),獲取與研究對象距離較近的單個異構(gòu)遙感數(shù)據(jù),分別統(tǒng)計每個異構(gòu)遙感數(shù)據(jù)出現(xiàn)的次數(shù),進(jìn)而得到各個研究對象對應(yīng)的異構(gòu)遙感數(shù)據(jù),統(tǒng)一用詞包表述。
設(shè)定遙感數(shù)據(jù)集可以分割為L個數(shù)據(jù)集lm,采用聚類獲取r個聚類中心,獲取字典B,將不同的B作為視覺單詞,則有
B={b1,b2,…,bn}
(8)
計算全部異構(gòu)遙感數(shù)據(jù)屬性特征和視覺單詞之間的歐式距離,同時將全部距離排序,選取距離最近的單詞,將歐式距離表示為of,則對應(yīng)的權(quán)重計算式為
(9)
式中,?i,j代表權(quán)重值。
由于詞包模型忽略了遙感數(shù)據(jù)之間的空間關(guān)系,因此,還需要引入空間關(guān)系,對詞包模型進(jìn)行改進(jìn)。在原始坐標(biāo)信息內(nèi)加入擴(kuò)展特征,同時組建特征和空間位置共同影響的概率語義模型。為此,提出一種基于金字塔的多尺度詞包模型,借助加權(quán)連接方法級聯(lián)處理不同尺度下的單詞,詳細(xì)的操作步驟為:
1)分割原始遙感數(shù)據(jù),獲取多個分割數(shù)據(jù)集,構(gòu)建標(biāo)記矩陣遙感數(shù)據(jù)集合[12]。分別對原始遙感數(shù)據(jù)和標(biāo)記矩陣遙感數(shù)據(jù)集合展開上下采樣處理,以此為依據(jù)組建尺度金字塔。
2)組建視覺詞匯字段,同時計算對應(yīng)尺度下的異構(gòu)遙感直方圖。
3)將全部異構(gòu)遙感直方圖連接,構(gòu)建聯(lián)合直方圖,最終得到對應(yīng)的權(quán)重值。
以下采用基于多尺度詞包模型檢測異構(gòu)遙感數(shù)據(jù),詳細(xì)的操作步驟為:
1)通過幾何校正和輻射校正處理遙感數(shù)據(jù)[13]。
2)采用改進(jìn)后的詞包模型確定遙感數(shù)據(jù)的最優(yōu)分割尺度,同時分割處理遙感數(shù)據(jù),獲取分割對象。
3)組建尺度金字塔影像,設(shè)定分割對象數(shù)量和金字塔層數(shù)[14,15],采用鄰域窗口提取分割對象全部像素點的低層次特征,同時設(shè)定視覺單詞數(shù)量,構(gòu)建視覺詞典。
4)根據(jù)視覺詞典,分別對不同對象展開投影映射,形成視覺直方圖,同時將其加權(quán)連接,獲取多尺度直方圖。
5)將全部特征映射到高維單詞空間,最終實現(xiàn)異構(gòu)遙感數(shù)據(jù)檢測。
為了驗證所提基于3D關(guān)聯(lián)規(guī)則深度學(xué)習(xí)的異構(gòu)遙感數(shù)據(jù)檢測方法的有效性,進(jìn)行實驗驗證。
實驗主要選取精確率Precinion、召回率TPR、誤報率FPR以及漏報率MAR作為測試指標(biāo),詳細(xì)的計算式如下
(10)
(11)
(12)
(13)
式中,TP代表檢測異常且實際異常的樣本數(shù)量;TN代表檢測正常且實際正常的樣本數(shù)量;FP代表檢測異常且實際正常的樣本數(shù)量;FN代表檢測正常且實際異常的樣本數(shù)量。
各個方法的檢測性能表示為圖3的形式。
圖3 不同方法的檢測性能測試結(jié)果對比分析
分析圖3中的實驗數(shù)據(jù)可知,由于所提方法對遙感數(shù)據(jù)實施了濾波處理,將數(shù)據(jù)中的噪聲濾除,可以有效提升檢測結(jié)果的準(zhǔn)確性。
以下實驗還進(jìn)一步分析了各個方法在不同抽樣次數(shù)下的異構(gòu)遙感數(shù)據(jù)檢測時間變化情況,實驗結(jié)果如表1所示。
表1 不同抽樣次數(shù)下各個方法的異構(gòu)遙感數(shù)據(jù)檢測時間結(jié)果對比
分析表1中的實驗數(shù)據(jù)可知,所提方法可以以更快的速度完成異構(gòu)遙感數(shù)據(jù)檢測,其檢測時間最低值與最高值分別為0.52s和1.24s,說明其具有較高的檢測效率。
針對傳統(tǒng)方法存在的一些問題,設(shè)計并提出一種基于3D關(guān)聯(lián)規(guī)則深度學(xué)習(xí)的異構(gòu)遙感數(shù)據(jù)檢測方法。經(jīng)實驗測試證明,所提方法可以有效提升檢測結(jié)果的準(zhǔn)確性,同時還可以有效降低異構(gòu)遙感數(shù)據(jù)檢測時間,獲取更加滿意的檢測結(jié)果。由于時間等多方面因素的限制,所提方法仍然需要展開更深層次的研究,確保其各項性能均得到有效提升,例如檢測費用等。