畢 奇,童 心,張濟(jì)勇,許 凱, 張 涵, 秦 昆
1.武漢大學(xué)遙感信息工程學(xué)院,武漢430079
2.北京洛斯達(dá)數(shù)字遙感技術(shù)有限公司中南分公司,武漢430070
3.國(guó)網(wǎng)經(jīng)濟(jì)技術(shù)研究院有限公司,北京102209
4.中國(guó)地質(zhì)大學(xué)(武漢)信息工程學(xué)院,武漢430070
遙感技術(shù)在環(huán)境監(jiān)測(cè)、應(yīng)急響應(yīng)和重要場(chǎng)所監(jiān)管等諸多領(lǐng)域應(yīng)用廣泛.其中,對(duì)港口等主要運(yùn)輸場(chǎng)所的監(jiān)管關(guān)系到港口利用、經(jīng)濟(jì)發(fā)展和國(guó)家安全[1-3].相比于大型港口,對(duì)漫長(zhǎng)水岸線上分布的眾多小型港口的管理往往受到人力限制,很難實(shí)現(xiàn)有效監(jiān)管.另外,港口環(huán)境復(fù)雜、港口特征難以描述,港口目標(biāo)的自動(dòng)檢測(cè)至今仍是難點(diǎn)[4].
常見(jiàn)的大中型港口檢測(cè)方法包括形態(tài)學(xué)[5]、基于邊緣線特征[6]和基于紋理特征等方法[7].數(shù)據(jù)日益豐富的高分辨率遙感影像為小型港口監(jiān)測(cè)提供了有效的數(shù)據(jù)源.目前利用高分影像進(jìn)行港口檢測(cè)的方法主要包括視覺(jué)注意機(jī)制、概率潛在語(yǔ)義分析模型(probabilistic latent semantic analysis,PLSA)和詞袋模型(bag of words,BoW).其中,視覺(jué)注意機(jī)制可將底層特征抽象為高級(jí)知識(shí),提高港口的檢測(cè)精度,但對(duì)特征的隱含信息挖掘不夠充分,模型適應(yīng)性不足[8-9];PLSA 和BoW 模型則可充分挖掘隱含信息,橫跨語(yǔ)義鴻溝.針對(duì)PLSA 對(duì)視覺(jué)單詞的空間分布考慮不足這一問(wèn)題,文獻(xiàn)[10]使用不變量特征描述目標(biāo),利用PLSA 模型提取隱含語(yǔ)義信息作為特征輸入,使用SVM 分類器獲取分類模型,從而提高了港口檢測(cè)的精度.文獻(xiàn)[11]構(gòu)建了一種基于多尺度不變特征的BoW 模型用于遙感影像港口分類,但港口識(shí)別中的視覺(jué)詞匯多義性問(wèn)題仍未得到有效解決.
本文研究了一種基于PLSA 和BoW 的高分遙感影像小型港口檢測(cè)方法.首先提取歸一化差分水體指數(shù)(normalized differential water index,NDWI)和分形維數(shù)特征,基于GrabCut分割方法得到水岸線,縮小搜索范圍;然后將灰度直方圖統(tǒng)計(jì)、NDWI、分形維數(shù)紋理特征引入PLSA 模型生成特征描述集,同時(shí)將加速魯棒特征(speeded up robust features,SURF)引入BoW 模型生成視覺(jué)詞典;進(jìn)而根據(jù)以上特征描述集,基于小型港口樣本庫(kù)訓(xùn)練SVM分類器;最后在待檢測(cè)影像上實(shí)現(xiàn)高分影像小型港口的高精度檢測(cè).
小型港口常沿江沿湖分布,相比于大中型港口,面積小、幾何形狀不規(guī)則,常缺少防波堤和倉(cāng)庫(kù)等設(shè)施.文獻(xiàn)[12]指出,小型港口所具有的穩(wěn)定特征是其輪廓特征點(diǎn)比非港口區(qū)域密集.因此高分遙感影像上小型港口的主要特征包括:1)位于水陸交界處,水岸線是其存在的前提.受水岸本身和港口建筑物、船舶等影響,水岸線一帶往往形狀不規(guī)則且紋理信息豐富.2)包括水體和陸地背景.影像中往往水域灰度較低、陸地灰度較高.3)由船舶、建筑物等目標(biāo)組成,目標(biāo)間的空間信息豐富.4)少見(jiàn)防波堤等大型港口設(shè)施.
針對(duì)這些特點(diǎn),本文選用分形維數(shù)、歸一化差分水體指數(shù)NDWI、灰度直方圖和SURF點(diǎn)特征來(lái)描述小型港口.
1)分形維數(shù)
該特征旨在定量描述不規(guī)則集合目標(biāo)的形狀復(fù)雜度.考慮到港口幾何形態(tài)復(fù)雜,水岸線和陸地部分紋理信息豐富,水域部分紋理信息匱乏,該特征可有效描述港口紋理信息復(fù)雜的水岸線.本文選用圖像處理領(lǐng)域常用的盒子維數(shù)計(jì)算方法[13].
2)NDWI
NDWI 是描述水體最常見(jiàn)方法[14],定義為
式中,pGreen和pNIR分別為綠光波段和近紅外波段的光譜反射率.
由于陸地區(qū)域(包括房屋群和植被群等)NDWI 值較低,因此NDWI 在描述港口水體部分的同時(shí),可有效突出港口區(qū)域的光譜特征.
3)灰度直方圖
影像灰度直方圖描述像素灰度值在各灰度級(jí)的分布,一般將影像灰度級(jí)由小到大展開(kāi),并依次統(tǒng)計(jì)像素灰度在各個(gè)灰度級(jí)上出現(xiàn)的頻率,其計(jì)算公式為
式中,rk表示灰度值為k的所有像素,N為像素總數(shù),nk是灰度值為k的像素?cái)?shù).
港口位于水陸交界處,影像具有水域灰度較低、陸地灰度較高的特點(diǎn).灰度直方圖可有效描述港口區(qū)域的光譜特征.
4)SURF 點(diǎn)特征
SURF 算子是對(duì)SIFT 算子的改進(jìn)[15],增強(qiáng)了對(duì)光照變化以及噪聲干擾的魯棒性.該算子生成步驟主要包括:
步驟1利用Hessian 構(gòu)造影像金字塔;
步驟2非極值點(diǎn)抑制初步確定特征點(diǎn);
步驟3極值點(diǎn)精確定位;
步驟4興趣點(diǎn)主方向確定;
步驟5SURF 特征描述.
使用SURF 特征點(diǎn)加上簡(jiǎn)單的聚類操作,很容易在BoW 模型下描述港口中船舶、建筑物等目標(biāo),估計(jì)港口中豐富的上下文信息.
1.2.1 PLSA 原理
PLSA 的核心思想是對(duì)目標(biāo)描述特征出現(xiàn)次數(shù)進(jìn)行統(tǒng)計(jì),降低描述向量維數(shù),提取隱含主題信息.其理論基礎(chǔ)牢固,魯棒性較強(qiáng),應(yīng)用廣泛.
假定得到一組特征集F={f1,f2,··· ,fM},描述的目標(biāo)O={o1,o2,··· ,oN},并由此組成N ×M的特征頻率矩陣N=(n(oi,fj))ij,n(oi,fj)表示特征fj在目標(biāo)oi中出現(xiàn)的頻率.每一對(duì)(oi,fj)與一組潛在成分主題Z={z1,z2,··· ,zK}相對(duì)應(yīng),K為任意給定的常數(shù).PLSA 的本質(zhì)就是描述目標(biāo)與隱含信息之間的聯(lián)合概率函數(shù)P(oi,fj,zk).文獻(xiàn)[16]給出了相應(yīng)的理論與推導(dǎo).
1.2.2 BoW 原理
BoW 最早應(yīng)用于文本分類,其基本思想是通過(guò)統(tǒng)計(jì)文本中關(guān)鍵詞w1,w2,··· ,wn的頻率直方圖來(lái)構(gòu)建文本描述集D.具體原理和公式推導(dǎo)見(jiàn)文獻(xiàn)[10].
由于原理簡(jiǎn)單且處理效率高,BoW 模型得到廣泛應(yīng)用.圖像關(guān)鍵詞提取與文本關(guān)鍵詞的一個(gè)主要差異是其通常在提取點(diǎn)特征后聚類生成圖像詞匯.其中聚類方法尤以K 均值聚類算法使用廣泛,具體步驟如下:
習(xí)近平總書(shū)記指出:“青年興則國(guó)家興,青年強(qiáng)則國(guó)家強(qiáng)。青年一代有理想、有本領(lǐng)、有擔(dān)當(dāng),國(guó)家就有前途,民族就有希望?!?/p>
步驟1隨機(jī)選取k個(gè)初始中心;
步驟2確定每個(gè)特征點(diǎn)與聚類中心的距離,并將該特征點(diǎn)歸并于與其距離最近的聚類中心;
步驟3對(duì)完成聚類操作的數(shù)據(jù)重新生成聚類中心;
步驟4重復(fù)步驟2 和3,直到結(jié)果收斂為止.
該算法可有效將高相似度的詞匯降維,構(gòu)建較完善的視覺(jué)詞典.統(tǒng)計(jì)出各個(gè)單詞在詞典中出現(xiàn)的頻率并構(gòu)建統(tǒng)計(jì)直方圖向量后,使用合適的分類器即可識(shí)別.
本文將PLSA 和BoW 模型相結(jié)合對(duì)小型港口目標(biāo)進(jìn)行檢測(cè),流程如圖1所示,包括預(yù)處理、特征提取、生成PLSA 和BoW 模型、訓(xùn)練分類器等步驟.
將水岸線提取作為預(yù)處理環(huán)節(jié),能有效縮小港口檢測(cè)范圍,提高檢測(cè)效率.本文水岸線提取基于分形維數(shù)特征和NDWI,包括超像素分割、統(tǒng)計(jì)超像素特征、設(shè)置水域模板、GrabCut分割方法提取水域范圍和形態(tài)學(xué)后處理共5 個(gè)步驟.圖2給出了一個(gè)水岸線提取的實(shí)例.
2.1.1 超像素分割
SLIC 超像素分割算法由Achanta 等提出[17].該算法首先將RGB 顏色模型的影像轉(zhuǎn)換到CIELAB 空間,然后利用迭代聚類獲取分割后的圖像集合.該算法處理速度快,對(duì)目標(biāo)的邊界保持效果較好,能生成特征相似、大小近似均勻的超像素集合,且使用時(shí)只需設(shè)置超像素大小即可.經(jīng)預(yù)實(shí)驗(yàn),超像素大小取30 時(shí)可得最佳分割結(jié)果,圖2(a)子圖即為一組實(shí)例.
2.1.2 統(tǒng)計(jì)超像素特征
將超像素作為影像的最小基元,計(jì)算其分形維數(shù)紋理特征和NDWI特征.在橫坐標(biāo)為NDWI值、縱坐標(biāo)為分形維數(shù)特征值的特征空間中,水域特征往往集中在右下角;非水域特征則較分散,僅有少量與水域相重合.圖2(b)是一個(gè)示例.其中紅色五角星表示屬于水域的超像素,綠色五角星表示非水域超像素.
2.1.3 設(shè)置水域模板
統(tǒng)計(jì)超像素的分形維數(shù)紋理(fractal dimension texture,FDT)特征和NDWI 特征后,根據(jù)統(tǒng)計(jì)結(jié)果并按照如下規(guī)則集將影像中超像素劃分為4 種可能的區(qū)域類型.
圖1 基于PLSA 和BoW 的港口檢測(cè)流程圖Figure1 Flowchart of harbor detection based on PLSA and BoW
1)若NDWI 特征值小于0.4 或FDT 特征值大于3.5,則可能為陸地;
2)若NDWI 特征值小于0.3 或FDT 特征值大于4.4,則一定為陸地;
3)若NDWI 特征值大于0.42 且小于0.58 或FDT 特征值大于1.6 且小于2.6,則為水域;
4)其他情況均可能為水域。
根據(jù)上述特征值的4 種可能性,基于NDWI 和分形維數(shù)特征可確定對(duì)應(yīng)區(qū)域.圖2(c)是該示例區(qū)域的水域模板圖.
2.1.4 圖像分割
GrabCut 方法能夠通過(guò)較少交互甚至零交互,將前景目標(biāo)從復(fù)雜的背景層中提取出來(lái).該方法分割效果理想,被廣泛使用[18].圖2(d)是基于以上特征使用GrabCut 圖像分割算法提取的水域結(jié)果示例,白色區(qū)域檢測(cè)為水域.
2.1.5 形態(tài)學(xué)后處理
對(duì)上一步的水域檢測(cè)結(jié)果進(jìn)行數(shù)學(xué)形態(tài)學(xué)膨脹操作,然后使用canny 算子提取邊緣,得到港口檢測(cè)候選區(qū).圖2(e)的示例中結(jié)構(gòu)元素大小為300×300,邊緣由紅線標(biāo)出.
圖2 水岸線提取示例Figure2 Example of coastline extraction
相比于建筑物、植被、水體等常見(jiàn)地物,港口位于水陸交界處,包含船舶建筑物等目標(biāo),紋理信息豐富.選擇合適的特征對(duì)港口識(shí)別精度至關(guān)重要.
選取灰度統(tǒng)計(jì)直方圖、分形維數(shù)、NDWI 3 種特征的統(tǒng)計(jì)直方圖描述樣本.為方便特征直方圖統(tǒng)計(jì)并使得灰度特征、紋理特征的變化趨勢(shì)保持一致,將分形維數(shù)特征線性拉伸至0~255,將NDWI 線性拉伸至0~255 并取反.由此得到的正樣本的特征直方圖具有明顯的雙波峰特征.由于特征維數(shù)高,可使用PLSA對(duì)特征直方圖有效降維,挖掘隱含信息.
為描述港口豐富的上下文信息,選用基于SURF 描述子的BoW 模型.相比于常用的SIFT 描述子,該算子采用卷積方式提取特征,不需要構(gòu)建DOG 尺度空間.在保持SIFT 算子縮放和旋轉(zhuǎn)不變等優(yōu)勢(shì)的同時(shí),SURF 算子具有仿射不變和運(yùn)算性能高等優(yōu)點(diǎn),可有效保證港口目標(biāo)特征的可區(qū)分性,抵抗光照和傳感器視角等多種外界因素干擾.
2.3.1 PLSA 模型生成
將遙感影像的灰度直方圖、分形維數(shù)和NDWI 特征作為特征集F={f1,f2,··· ,fM};影像數(shù)量相當(dāng)于描述的目標(biāo)集O={o1,o2,··· ,oN},其中N為影像數(shù).每一對(duì)可視數(shù)據(jù)(oi,fj)與一組潛在成分主題Z={z1,z2,··· ,zK}相關(guān),本文設(shè)定常數(shù)K=20,即以上高維特征通過(guò)PLSA 模型降維變?yōu)?0 個(gè)主題.
采用隨機(jī)法對(duì)P(fj|zk)和P(zk|oi)進(jìn)行初始化.隨后使用EM 算法至迭代收斂,此時(shí)所提取的目標(biāo)參數(shù)即為所需的隱含信息主題.由此得到的特征向量可作為SVM 分類器的特征輸入值.
2.3.2 BoW 模型生成
關(guān)鍵點(diǎn)提取是一種有效的影像特征提取方法.本文選擇SURF 特征向量來(lái)描述港口目標(biāo).引入BoW 模型后,影像相當(dāng)于BoW 模型中的“文本”,SURF 特征向量相當(dāng)于“單詞”.利用K均值進(jìn)行單詞聚類,并構(gòu)建視覺(jué)詞典.
對(duì)于待處理的影像,同樣進(jìn)行SURF 特征提取,并將其與視覺(jué)詞典進(jìn)行特征匹配,從視覺(jué)詞典中判別出與該特征最相似的單詞并統(tǒng)計(jì)其出現(xiàn)的頻率,用該頻率統(tǒng)計(jì)直方圖作為描述子.
將以上兩種模型的特征描述集一起作為輸入,訓(xùn)練SVM 分類器.
為訓(xùn)練分類器,首先需要建立小型港口樣本庫(kù).正樣本即小型港口目標(biāo),負(fù)樣本包括水體、建筑物、道路等常見(jiàn)的非港口目標(biāo).樣本質(zhì)量的好壞直接影響模型的泛化能力.一般來(lái)說(shuō),用于訓(xùn)練的正負(fù)樣本比例應(yīng)在1:2 至1:3 之間.
使用SVM 分類器旨在將目標(biāo)與背景進(jìn)行分離,其中核函數(shù)的選擇至關(guān)重要.核函數(shù)將低維空間中線性不可分的問(wèn)題轉(zhuǎn)化到線性可分的高維空間中,通過(guò)更復(fù)雜的分類模型將目標(biāo)從背景中提取出來(lái).常見(jiàn)的核函數(shù)包括線性核函數(shù)、多項(xiàng)式核函數(shù)、徑向基函數(shù)等.本文選擇徑向基函數(shù)作為核函數(shù).
分類器的使用分為訓(xùn)練過(guò)程和測(cè)試過(guò)程.使用經(jīng)過(guò)PLSA 和BoW 生成的特征描述集對(duì)所有訓(xùn)練樣本進(jìn)行訓(xùn)練;使用同樣的描述集對(duì)測(cè)試樣本進(jìn)行測(cè)試.通過(guò)交叉驗(yàn)證獲取分類模型的最優(yōu)參數(shù).最后將待檢測(cè)影像以同樣方式進(jìn)行描述集提取,基于分類模型可以得到港口檢測(cè)結(jié)果.
本文基于融合后的快鳥(niǎo)影像沿長(zhǎng)江分布的小型港口構(gòu)建樣本庫(kù).該樣本庫(kù)包括500 個(gè)正樣本(圖3)和1 000 個(gè)負(fù)樣本(圖4).正樣本為小型港口目標(biāo),負(fù)樣本包括建筑物、植被、道路、裸地等.
根據(jù)訓(xùn)練的SVM 分類器,重點(diǎn)對(duì)湖北境內(nèi)的長(zhǎng)江沿線港口開(kāi)展檢測(cè)實(shí)驗(yàn).另收集22 幅空間分辨率為0.6 m、大小為2 000×2 000 像素的快鳥(niǎo)遙感影像并開(kāi)展實(shí)驗(yàn)分析,以驗(yàn)證本文方法的有效性.以上影像不與樣本庫(kù)中任何樣本所在位置重復(fù).選用查準(zhǔn)率、查全率、錯(cuò)誤率和耗時(shí)4 個(gè)評(píng)價(jià)指標(biāo)考察識(shí)別精度和算法效率.其中,查準(zhǔn)率(precision rate,PR)、查全率(recall rate,RR)和錯(cuò)誤率(error rate,ER)計(jì)算公式分別為
式中,TC為正確識(shí)別的港口數(shù),F(xiàn)A為識(shí)別為港口的總數(shù).TA為真港口影像數(shù).TF為港口誤判定為非港口的數(shù)目,F(xiàn)T為非港口誤判定為港口的數(shù)目,NA為總港口數(shù).
圖3 港口識(shí)別正樣本(500 個(gè))Figure3 Positive samples for harbor detection (500)
圖4 港口識(shí)別負(fù)樣本(1 000 個(gè))Figure4 Negative samples for harbor detection (1 000)
本文利用構(gòu)建的樣本庫(kù)進(jìn)行SVM 分類器的訓(xùn)練和測(cè)試,采用交叉驗(yàn)證的方式得到最優(yōu)參數(shù),即懲罰系數(shù)c取80,核函數(shù)中γ值取4.4.基于以上分類器參數(shù),對(duì)這22 幅影像進(jìn)行港口檢測(cè)實(shí)驗(yàn).所有實(shí)驗(yàn)均先進(jìn)行水岸線提取,縮小檢測(cè)范圍提高檢測(cè)效率.本文以紅色矩形框的形式標(biāo)出港口目標(biāo),若出現(xiàn)相鄰邊界,則對(duì)矩形框進(jìn)行合并處理.
為驗(yàn)證本文所選特征(SURF+BoW+gray+texture+NDWI+PLSA)的有效性,在使用PLSA 前提下,設(shè)置灰度直方圖(gray+PLSA)、分形維數(shù)(texture+PLSA)、歸一化差分水體指數(shù)(NDWI+PLSA)和三者結(jié)合(gray+texture+ NDWI+PLSA)這4 組特征描述對(duì)比實(shí)驗(yàn);為說(shuō)明PLSA 模型在港口目標(biāo)識(shí)別中的作用,開(kāi)展對(duì)以上3 種特征直接輸入SVM 訓(xùn)練(gray+texture+NDWI)和使用PLSA 降維后再輸入SVM 訓(xùn)練(gray+texture+NDWI+PLSA)的對(duì)比實(shí)驗(yàn);為證明BoW 和PLSA 模型結(jié)合進(jìn)行港口目標(biāo)檢測(cè)的優(yōu)勢(shì),開(kāi)展基于SURF 特征的BoW 模型(SURF+BoW)、基于以上3 種特征的PLSA 模型(gray+texture+NDWI+PLSA)和對(duì)以上兩種特征描述集進(jìn)行合并處理(gray+texture+NDWI+PLSA+SURF+BoW)的對(duì)比實(shí)驗(yàn).
表1為其中3 幅實(shí)驗(yàn)結(jié)果.影像黑色區(qū)域?yàn)樗毒€提取算法判定的非檢測(cè)區(qū)域.
由以上結(jié)果可知:
1)本文研究的PLSA 與BoW 相結(jié)合的方法識(shí)別準(zhǔn)確率較高,效果顯著.
2)本文水岸線提取這一預(yù)處理環(huán)節(jié)在保證小型港口目標(biāo)不被誤剔除的前提下,縮小了檢測(cè)范圍,可有效提高檢測(cè)效率和檢測(cè)精度.
3)常見(jiàn)的單一特征難以對(duì)小型港口進(jìn)行全面準(zhǔn)確的描述,錯(cuò)檢、漏檢現(xiàn)象明顯.例如,SURF+BoW 算法易將船只以及水岸線周圍的非港口區(qū)域誤判為港口(表1第4 行).
4)相比于單特征,多特征與PLSA 結(jié)合進(jìn)行檢測(cè)時(shí)準(zhǔn)確率提高顯著(表1第9 行).PLSA模型可在挖掘隱含的主題信息且正樣本不全面的情況下,仍然能夠達(dá)到較好的港口目標(biāo)識(shí)別效果.
22 幅影像的平均精度評(píng)價(jià)結(jié)果如表2所示.分析可知:
1)本文方法查準(zhǔn)率達(dá)82%,錯(cuò)誤率僅為8.6%,為以上方法中最佳;查全率為91.1%,與最佳查全率相當(dāng).該方法通過(guò)結(jié)合灰度直方圖、分形維數(shù)和NDWI 特征,并使用PLSA 模型挖掘的上述特征的隱含主題信息,避免了樣本不足導(dǎo)致的查全率偏低等問(wèn)題;同時(shí)通過(guò)結(jié)合SURF+BoW 算法考慮了目標(biāo)的SURF 點(diǎn)特征信息,有效提高了檢測(cè)精度,且耗時(shí)較少.
2)在單特征方面,所有方法查準(zhǔn)率均低于60%,查全率最高僅達(dá)81%.此外,單獨(dú)使用分形維數(shù)特征的方法耗時(shí)最長(zhǎng),因?yàn)閱为?dú)使用紋理特征結(jié)合PLSA模型進(jìn)行迭代優(yōu)化時(shí),容易出現(xiàn)難以收斂的情況.
3)在多特征方面,將光譜、灰度和紋理特征直接輸入分類器的方法查準(zhǔn)率較高,但查全率低.在此基礎(chǔ)上結(jié)合PLSA 模型,可將查全率和查準(zhǔn)率提高至80%.
小型港口檢測(cè)目前研究較少,但具有重要的研究意義.本文研究了一種基于PLSA 和BoW 的高分辨率遙感影像小型港口檢測(cè)方法,其特征描述集可有效描述小型港口.此外,預(yù)先進(jìn)行的水岸線提取可有效縮小檢測(cè)范圍,提高檢測(cè)精度.相比于常見(jiàn)的單一特征和只使用PLSA 或BoW 生成特征描述集,本文方法可在耗時(shí)較少的前提下,大幅提高小型港口的檢測(cè)精度,具有較好的應(yīng)用前景.
表1 不同分類模型的港口檢測(cè)對(duì)比實(shí)驗(yàn)結(jié)果Table1 Comparison experiment results of harbor detection under different classification models
表2 精度評(píng)定Table2 Accuracy evaluation
結(jié)合有關(guān)實(shí)驗(yàn)和討論,未來(lái)的研究可從以下3 方面開(kāi)展:
1)使用PLSA 和BoW 模型需人工設(shè)置的參數(shù)較多,可研究一種自適應(yīng)參數(shù)取值方法,以增強(qiáng)本文方法的通用性.
2)分形維數(shù)等特征復(fù)雜度高,利用PLSA 模型進(jìn)行隱含主題信息提取時(shí)計(jì)算量大,耗時(shí)長(zhǎng).后期可研究復(fù)雜度較小的隱含主題信息提取算法.
3)使用SURF 算子容易導(dǎo)致建筑物與港口混淆,可研究更佳的描述子來(lái)生成BoW 模型.