蔡興泉,柳靜華,2(.北方工業(yè)大學(xué)計(jì)算機(jī)學(xué)院,北京 0044;2.興唐通信科技有限公司,北京 009)
建筑物圖像識別系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
蔡興泉1,柳靜華1,2
(1.北方工業(yè)大學(xué)計(jì)算機(jī)學(xué)院,北京100144;2.興唐通信科技有限公司,北京100191)
隨著信息技術(shù)的發(fā)展,用戶對信息獲取的方式已經(jīng)不僅僅局限于文字,人們更希望能夠直接從圖像中獲取其信息,圖像識別技術(shù)已經(jīng)成為圖像處理領(lǐng)域新的研究熱點(diǎn)。建筑物圖像識別屬于其中一個熱門研究方向。有多種技術(shù)可以實(shí)現(xiàn)建筑物識別定位,比較常見的一種方法是利用全球衛(wèi)星定位系統(tǒng)(GPS)進(jìn)行定位。在視野良好的環(huán)境中,GPS可以對建筑物實(shí)現(xiàn)準(zhǔn)確定位;但是在人口稠密區(qū),GPS定位只能達(dá)到300米,無法滿足需求。此時僅僅依靠GPS準(zhǔn)確識別周邊建筑物是非常困難的。本文主要研究并設(shè)計(jì)出一款建筑物圖像識別系統(tǒng),首先利用SIFT算法提取待識別圖像特征信息,并創(chuàng)建圖像特征數(shù)據(jù)庫;然后利用圖像GPS匹配及圖像特征匹配算法識別建筑物。
近年來,我國眾多學(xué)者對建筑物圖像識別技術(shù)有很多研究,但是很少有專門的系統(tǒng)設(shè)計(jì)實(shí)現(xiàn),在系統(tǒng)設(shè)計(jì)方面,卻難以在系統(tǒng)的準(zhǔn)確率和效率之間找到平衡點(diǎn)。
2012年,李松霖[1]提出了一種基于特征線匹配的城市建筑物識別系統(tǒng),該系統(tǒng)可以很好地適應(yīng)移動條件下的建筑物快速識別需求,但是其準(zhǔn)確率不高。2012年,董肖[2]提出了一種快速穩(wěn)健的建筑物圖像識別系統(tǒng),該系統(tǒng)在建筑物識別上具有很高的準(zhǔn)確性,但是沒有兼顧到圖像識別的速度。2013年,齊沁芳[3]提出了一種應(yīng)用與增強(qiáng)現(xiàn)實(shí)系統(tǒng)的建筑物識別算法,該算法可以通過手持設(shè)備實(shí)時獲得建筑物的相關(guān)信息,因?yàn)槭腔谝苿討?yīng)用,系統(tǒng)重點(diǎn)放在加快圖像識別速度上,準(zhǔn)確率不高。
在系統(tǒng)設(shè)計(jì)時,為了兼顧系統(tǒng)的響應(yīng)速度與識別效率,本文在進(jìn)行大量研究的基礎(chǔ)上,發(fā)現(xiàn)SIFT圖像識別算法,無論在時間復(fù)雜度,還是在空間復(fù)雜度方面都具有很大的優(yōu)勢[4-5],因此本文采用該算法設(shè)計(jì)建筑物圖像識別系統(tǒng)。
為了提高建筑物圖像識別系統(tǒng)對建筑物識別的準(zhǔn)確率和效率,本文設(shè)計(jì)的基于移動設(shè)備的建筑物圖像識別系統(tǒng)主要分為四個重要模塊,即圖像特征提取模塊、圖像數(shù)據(jù)庫創(chuàng)建模塊、圖像特征匹配模塊和圖像數(shù)據(jù)傳輸模塊。圖像特征提取模塊包括圖像預(yù)處理、圖像GPS提取和圖像特征提取三部分,主要用來縮短系統(tǒng)響應(yīng)時間,為后期圖像匹配做準(zhǔn)備;圖像特征提取是指采用SIFT算法提取圖像特征,并保存成XML文件。圖像數(shù)據(jù)庫創(chuàng)建模塊包括GPS基本信息存庫和特征文件信息存庫兩部分。圖像特征匹配模塊包括GPS匹配和特征匹配兩部分,兩種匹配方式相結(jié)合識別出建筑物。
(1)圖像特征提取
首先采用雙線性插值方式縮小待識別圖像尺寸,減少圖像的響應(yīng)時間;然后提取待識別GPS信息,用戶圖像匹配時縮小數(shù)據(jù)庫查找范圍;最后利用SIFT算法提取圖像的特征描述算子,客戶端將提取到的特征描述算子存儲為XML特征文件,供下一階段圖像特征匹配使用。
(2)圖像數(shù)據(jù)庫創(chuàng)建
利用計(jì)算機(jī)進(jìn)行建筑物識別首先需要建立建筑物圖像特征數(shù)據(jù)庫。建立圖像特征數(shù)據(jù)庫需要搜集帶有GPS信息的建筑物圖像,筆者把北方工業(yè)大學(xué)等建筑物分別拍攝了不同視角、不同角度、不同鏡頭以及不同光照等條件下的帶有GPS數(shù)據(jù)的照片;然后對圖像中的GPS基本信息存庫;最后對圖像進(jìn)行預(yù)處理及特征提取,將提取出來的特征信息放到XML特征文件中,并對特征文件、GPS數(shù)據(jù)、景點(diǎn)信息存庫。
(3)圖像特征匹配
圖像特征匹配包括GPS匹配和特征匹配兩個方面。GPS匹配首先提取待匹配圖像的GPS數(shù)據(jù),然后與圖像數(shù)據(jù)庫中的所有圖像GPS計(jì)算距離D,若D<300,那么將圖像作為候選圖像,否則舍棄該圖像。特征匹配是指利用將待匹配圖像與GPS匹配得到的候選圖像集進(jìn)行特征匹配,并將該結(jié)果返回給客戶端。
(4)圖像數(shù)據(jù)傳輸
圖像數(shù)據(jù)傳輸是指客戶端與服務(wù)器之間的通信??蛻舳双@取待識別圖像后,預(yù)處理后進(jìn)行特征提取,提取后的XML特征文件通過Socket數(shù)據(jù)傳輸方式傳送到服務(wù)器端;服務(wù)器端將圖像識別結(jié)果返回給客戶端。
為了驗(yàn)證本文設(shè)計(jì)的建筑物圖像識別系統(tǒng)的可行性和有效性,以北方工業(yè)大學(xué)建筑物為例,實(shí)現(xiàn)了該系統(tǒng)。系統(tǒng)的硬件設(shè)備為Lenovo臺式機(jī):Intel Core i5 3.2GHz的CPU、4.00GB內(nèi)存、NVIDIA GeForce 315顯卡;系統(tǒng)軟件環(huán)境為Windows 7、VS 2010等。
圖1 系統(tǒng)初始界面
用戶登錄系統(tǒng)后可以看到系統(tǒng)的初始界面如圖1所示。用戶可以通過該界面選擇進(jìn)行圖像特征存庫操作或者直接進(jìn)行圖像識別,系統(tǒng)包含客戶端與服務(wù)器兩部分,客戶端主要用來識別建筑物,服務(wù)器主要用來向數(shù)據(jù)庫添加模型圖像。
圖2 客戶端特征提取結(jié)果界面
圖2展示的是客戶端對圖像進(jìn)行特征提取的結(jié)果界面,主要包含兩部分:圖像特征提取的結(jié)果圖像;圖像特征提取的XML特征文件打開路徑及鏈接。
圖3 服務(wù)器端特征匹配結(jié)果界面
圖3展示的是服務(wù)器端對建筑物圖像識別的結(jié)果界面,主要包含三部分:客戶端傳輸?shù)膱D像特征與數(shù)據(jù)庫圖像特征GPS匹配結(jié)果、最終的特征匹配結(jié)果、匹配成功的圖像特征文件打開路徑及鏈接。
為了提高建筑物圖像識別系統(tǒng)對建筑物識別的準(zhǔn)確率和效率,本文設(shè)計(jì)的建筑物圖像識別系統(tǒng)主要分為四個重要模塊,即圖像特征提取模塊、圖像數(shù)據(jù)庫創(chuàng)建模塊、圖像特征匹配模塊和圖像數(shù)據(jù)傳輸模塊。并且給出了系統(tǒng)模塊的實(shí)現(xiàn)及系統(tǒng)運(yùn)行效果,系統(tǒng)運(yùn)行效果表明,本文設(shè)計(jì)的基于移動設(shè)備的建筑物圖像識別系統(tǒng)運(yùn)行效果良好。
進(jìn)一步研究包括對圖像特征提取算法進(jìn)行改進(jìn),提高系統(tǒng)的響應(yīng)時間。
[1]李松霖,范海生,陳秀萬.基于特征匹配的城市建筑物識別方法研究[J].遙感技術(shù)與應(yīng)用,2012,27(2):190-196.
[2]董肖.快速穩(wěn)健的建筑物識別算法與系統(tǒng)[D].華南理工大學(xué),2012.
[3]齊沁芳.應(yīng)用于增強(qiáng)現(xiàn)實(shí)系統(tǒng)的建筑物識別算法的研究與實(shí)現(xiàn)[D].北京郵電大學(xué),2013.
[4]Lowe D.G.Object recognition from local scale-invariant features[A].Proceedings of the Seventh IEEE International Conference on Computer Vision[C],1999:1150-1157.
[5]Mikolajczyk K.,Schmid C.A performance evaluation of local descriptors[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2005,27(10):1615-1630.
Feature Extracting;GPS Matching;Feature Database;Feature Matching
Design and Implementation of Building Image Recognition System
CAI Xing-quan1,LIU Jing-hua1,2
(1.School of Computer Science,North China University of Technology,Beijing 100144;
2.Xingtang Communications Technology Co.,Ltd.,Beijing 100191)
1007-1423(2015)21-0018-03
10.3969/j.issn.1007-1423.2015.21.005
蔡興泉(1980-),男,山東萊蕪人,副教授,博士,研究方向?yàn)樘摂M現(xiàn)實(shí)、數(shù)字娛樂等
2015-05-19
2015-07-14
為了更好地提高建筑物圖像識別系統(tǒng)的準(zhǔn)確性和效率,采用SIFT算法研究并實(shí)現(xiàn)建筑物圖像識別系統(tǒng)。利用SIFT算法提取建筑物圖像特征,并保存XML特征文件;然后創(chuàng)建圖像特征數(shù)據(jù)庫,保存特征文件信息及圖像的基本信息;最后利用GPS匹配與SIFT特征匹配相結(jié)合的方式識別建筑物圖像。實(shí)驗(yàn)驗(yàn)證表明,該方法是可行有效的。該方法已經(jīng)應(yīng)用于實(shí)際的項(xiàng)目中。
特征提??;GPS匹配;特征數(shù)據(jù)庫;特征匹配
北京市人才強(qiáng)校行動計(jì)劃項(xiàng)目(No.2015NCUT008)、北京市教委教學(xué)專項(xiàng)(No.15010)
In order to better improve the accuracy and efficiency of the building image recognition system,focuses on researching and completing the building image recognition system with SIFT.Extracts the features of images with SIFT algorithm,and saves the features into XML file.Creates the image feature database which saves the base information and feature information of image.Uses GPS matching method and feature matching method to complete the image recognition.Provides the experiments results.The experiment results prove that the method is feasible and valid,and it has been used in the practical application.