湯慧 唐朝暉 彭鐵光
1.中南大學(xué)信息科學(xué)與工程學(xué)院,長沙 410083
2.湖南司法警官職業(yè)學(xué)院管理系,長沙 410131
3.湖南外貿(mào)職業(yè)學(xué)院教務(wù)處,長沙 413400
基于HSV空間顏色特征的圖像內(nèi)容檢索及應(yīng)用
湯慧1,2唐朝暉1彭鐵光3
1.中南大學(xué)信息科學(xué)與工程學(xué)院,長沙 410083
2.湖南司法警官職業(yè)學(xué)院管理系,長沙 410131
3.湖南外貿(mào)職業(yè)學(xué)院教務(wù)處,長沙 413400
監(jiān)獄信息安全是數(shù)字化監(jiān)獄的基本要求,隨著電子監(jiān)獄資料庫中多元資料的日益增多,自動識別出數(shù)字監(jiān)獄庫中圖像資料的內(nèi)容是否涉密成為司法信息安全防范研究的焦點。顏色特征是圖像資料的最基本的視覺特征之一,在圖像內(nèi)容檢索上具有舉足輕重的地位。為了實現(xiàn)監(jiān)獄圖像資料的自動檢索與內(nèi)容感知,本文提出基于HSV空間的22色非均勻顏色特征的圖像內(nèi)容檢索方法。實驗結(jié)果表明,該方法與基于RGB顏色空間的顏色特征檢索算法相比,有效降低了時間和空間復(fù)雜度,圖像查全率、查準(zhǔn)率高,實際應(yīng)用效果明顯。
圖像內(nèi)容檢索;顏色量化;監(jiān)獄
監(jiān)獄本身是一個涉密場所,在信息安全防范上不但要保證網(wǎng)絡(luò)運行安全,還要確保涉密信息在產(chǎn)生、存儲、傳遞和處理過程中的保密、完整、可用和抗抵賴。特別是對記載國家秘密信息的文字、圖像、數(shù)據(jù)等電子載體進(jìn)行嚴(yán)格管理防泄密。數(shù)字監(jiān)獄資料庫中內(nèi)容的日益增多、類型的多元化,自動識別出圖像內(nèi)容是否涉密成為司法信息安全防范研究的焦點。
圖像來源于數(shù)碼相機記錄相關(guān)文件、會議、活動等拍攝動態(tài)視頻或靜態(tài)圖像或監(jiān)獄內(nèi)安防設(shè)備抓拍到的圖像。圖像保存為BMP格式(24位)色彩、圖像分辨率600 dpi以上;尺寸不大于10寸。
圖像內(nèi)容的檢索可從顏色特征入手。顏色特征是圖像中最基本的視覺特征,對圖像的平移、尺度、旋轉(zhuǎn)等變化不敏感,具有很強的穩(wěn)定性,且計算簡單。圖像檢索含顏色直方圖[1]、顏色矩[2]、顏色集[3]、顏色分布特征[4]、中心矩法等多種表征方法。
2.1 CBIR技術(shù)
對圖像內(nèi)容語義進(jìn)行分析和檢索,包括圖像本身客觀屬性,如顏色、紋理、形狀等。檢索技術(shù)的應(yīng)用方向多為收集圖像后進(jìn)行合理加工(對比度、高度等),提取顏色特征的方法。根據(jù)顏色量化,結(jié)合相似度算法,提取基于HSV空間查準(zhǔn)率、查全率具體的值。
2.2 顏色空間選取
RGB顏色空間有不均勻和不直觀的缺點,選擇HSV空間合適的原因,一是其三分量相對獨立,易通過設(shè)定不同權(quán)值將其轉(zhuǎn)換成一維進(jìn)行測量,計算量??;二是色調(diào)分量對彩色的描述與人類視覺接近,容易區(qū)分。
2.3 HSV空間顏色量化
將三分量進(jìn)行非等間隔的量化工作。理論上當(dāng)V<0.152,顏色接近黑色,可忽略H的影響。當(dāng)S<0.1時,顏色接近灰色圖,可忽略H的影響。即把分量H、S、V各分成9份、2份和1份,并根據(jù)色彩的不同范圍進(jìn)行量化,合成為一維特征矢量公式l=HQsQv+SQv+V。其中:Qs和Qv分別是分量S、V的量化級數(shù),當(dāng)取Qs=2,Qv=1時進(jìn)行細(xì)化。l取值范圍為[0,21],獲得22柄的一維直方圖。
監(jiān)獄信息圖像與其他圖像在內(nèi)容有明顯的行業(yè)特征,本文更多的是關(guān)心圖像中的目標(biāo)的顏色特征,如監(jiān)舍、勞動改造區(qū)、獄警辦公區(qū)等。如圖1中C類執(zhí)勤服圖像的顏色特征集中體現(xiàn)在衣服和軟肩章,這些重點目標(biāo)區(qū)域所特有顏色。建立基于圖像內(nèi)容檢索的模型分:圖像預(yù)處理、顏色特征的提取、建數(shù)據(jù)庫與搜索引擎、人機交互界面四大部分。
3.1 監(jiān)獄圖像預(yù)處理
在進(jìn)行圖像分析處理前,需對圖像進(jìn)行灰度化、圖像增強和降低并減少圖像的噪聲等預(yù)處理,突出有用的信息,為后續(xù)顏色特征的圖像內(nèi)容檢索工作做準(zhǔn)備。
3.2 顏色特征的提取
完成任務(wù)區(qū)域或涉密區(qū)域的選取后,保存為二級圖像,并與原始圖像建立關(guān)聯(lián)。根據(jù)上述顏色量化公式、提取算法對區(qū)域圖像進(jìn)行顏色、紋理等特征提取,組建特征庫。
3.3 建庫與搜索引擎
監(jiān)獄圖像數(shù)據(jù)庫由特征庫、圖像庫、實驗子庫組成。按照圖像顏色相似的原則,即圖像顏色數(shù)量相當(dāng),顏色相近;對應(yīng)主要顏色面積相當(dāng);圖像內(nèi)主要顏色的相似性,本文采用實驗子庫中五類主題。包括:
A類含9張監(jiān)獄物理防逃鋼網(wǎng)墻,明顯特色特征是鋼絲呈現(xiàn)銀灰色;
B類含8張監(jiān)舍圖,明顯特色特征是粉紅色被子,床單上有XX監(jiān)獄的黑色字樣;
C類含10張執(zhí)勤服圖,明顯特色特征是衣服顏色偏紫或者偏藍(lán);軟肩章用反光線織成,在陽光下發(fā)黃;
D類含6張囚服圖,明顯特色特征是灰藍(lán)為主,上衣的前胸和后背上有白灰相間的條紋,囚褲兩側(cè)縫有藍(lán)白條;
E類含10張警車圖,明顯特色特征是整車藏藍(lán)色和白色為基本色調(diào),輔以黃色。
算法采用衡量搜索引擎的性能的查全率(recall)和查準(zhǔn)率(precision)作為評價標(biāo)準(zhǔn)。根據(jù)各種特征自動提取出的重點目標(biāo)區(qū)域的特征數(shù)據(jù),并建立多維索引結(jié)構(gòu)。
另外,人機交互界面為操作人員提供圖像基于內(nèi)容檢索的接口、參數(shù)。
驗證實驗環(huán)境是VC++6.0,用實驗子庫為操作對象。先人工篩選出43張圖像與樣圖顏色相類似的圖像,按22柄的HSV顏色直方圖圖像顏色相似進(jìn)行實驗,可得A類到E類在RGB空間等間隔的查全率、查準(zhǔn)率分別是0.778、0.75、0.7、1.0、0.9;在HSV空間非等間隔的查全率、查準(zhǔn)率分別是0.889、0.875、0.9、1.0、1.0,不難看出新算法均高于原算法,檢索效果明顯增強。
為了實現(xiàn)監(jiān)獄敏感圖像資料的自動檢索與內(nèi)容感知,本文提出了一種新的基于HSV空間的22色非均勻顏色特征的圖像內(nèi)容檢索方法。后續(xù)工作是構(gòu)建圖像安全管理單元,全程實現(xiàn)涉密圖像的可控、在控和可審計的安全防護(hù)工作,即涉密計算機上禁止打印/屏幕拷貝圖像;禁止涉密圖像通過可編程的對象連接與嵌入接口等途徑對權(quán)限、屬性的修改;并當(dāng)U盤等外設(shè)插入時自動報警,有望從信息安全防范的角度有效解決泄密問題。
[1] Swain M J, Ballard D H.Color indexing[J].International Journal of Computer Vision,1991.7 (1):11-32
[2] Pass G, Zabih R.Histogram refinement for content-based image retrieval[A].IEEE Workshop on Applications of Computer Vision[C].1996,96-102
[3] Mlsna P A, Rodriguez JJ.Efficient indexing of multi-color sets for content-based image retrieval[A].4th IEEE Southwest Symposium,2000.116-120
[4] Heckbert P.Color image quantization for frame buffer display[J].Comput Graphics,1982, 16:297-307
TP391.41
10.3969/j.issn.1001-8972.2011.12.054