李冰+毛布+許然
摘 要: 當(dāng)前設(shè)計(jì)的圖像數(shù)據(jù)檢測(cè)系統(tǒng)大都依據(jù)特定關(guān)鍵詞完成數(shù)據(jù)檢測(cè),對(duì)海量弱關(guān)聯(lián)圖像數(shù)據(jù)的檢測(cè)效率和精度較低。為了解決這些問(wèn)題,設(shè)計(jì)基于PMML規(guī)范的海量弱關(guān)聯(lián)圖像數(shù)據(jù)檢測(cè)系統(tǒng),其將數(shù)據(jù)檢測(cè)算法同PMML標(biāo)準(zhǔn)融合,由表示層、應(yīng)用服務(wù)層和數(shù)據(jù)資源層構(gòu)成。其中應(yīng)用服務(wù)層中的數(shù)據(jù)檢測(cè)模塊將形成的檢測(cè)模型通過(guò)PMML文檔輸出,模型應(yīng)用模塊通過(guò)PMML模型采用自定義的數(shù)據(jù)檢測(cè)查詢語(yǔ)言CMQL完成語(yǔ)言檢索,實(shí)現(xiàn)海量弱關(guān)聯(lián)圖像數(shù)據(jù)的有效檢測(cè)。系統(tǒng)實(shí)現(xiàn)部分給出了PMML模型的創(chuàng)建和應(yīng)用過(guò)程。實(shí)驗(yàn)結(jié)果表明,所設(shè)計(jì)檢測(cè)系統(tǒng)具有較高的檢測(cè)性能和較低的虛警率。
關(guān)鍵詞: 海量弱關(guān)聯(lián)圖像數(shù)據(jù); PMML; CMQL; 數(shù)據(jù)檢測(cè)系統(tǒng)
中圖分類(lèi)號(hào): TN911.73?34; TN453 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2017)08?0114?03
Design and implementation of massive weak?correlation image data detection system
LI Bing1, MAO Bu2, XU Ran3
(1. Department of Information Technology, Sichuan Business Vocational College, Chengdu 610091, China;
2. Zigong Radio & TV University, Zigong 643000, China; 3. Zhejiang Sci?Tech University, Hangzhou 310018, China)
Abstract: The currently?designed image data detection systems detect the data mostly according to the specific keywords, and have low detection efficiency and precision for the massive weak?correlation image data. In order to solve these problems, a massive weak?correlation image data detection system based on PMML standard was designed, which fused the data detection algorithm with the PMML standard. The system is composed of the presentation layer, application service layer and data resource layer. The data detection module of the application service layer outputs the formed detection model through the PMML document. The model application module uses the self?defined data to detect the query language CMQL through PMML model for language retrieval, so as to detect the massive weak?correlation image data effectively. The creation and application process of the PMML model is given in the fourth part of this paper. The experimental results indicate that the detection system has high detection performance and low false alarm rate.
Keywords: massive weak?correlation image data; PMML; CMQL; data detection system
隨著現(xiàn)代制造工業(yè)的高速發(fā)展,圖像檢測(cè)技術(shù)也快速發(fā)展。圖像檢測(cè)技術(shù)在醫(yī)療、軍事、農(nóng)業(yè)等領(lǐng)域具有廣泛的應(yīng)用價(jià)值。但是傳統(tǒng)圖像數(shù)據(jù)檢測(cè)方法在較多領(lǐng)域已無(wú)法滿足現(xiàn)代制造業(yè)的需求[1?3]。并且以往的圖像數(shù)據(jù)檢測(cè)系統(tǒng)大都依據(jù)特定關(guān)鍵詞完成數(shù)據(jù)檢測(cè),對(duì)海量弱關(guān)聯(lián)圖像數(shù)據(jù)的檢測(cè)效率和精度較低。因此,尋求有效的海量弱關(guān)聯(lián)圖像數(shù)據(jù)檢測(cè)方法,具有重要應(yīng)用意義。
1 海量弱關(guān)聯(lián)圖像數(shù)據(jù)檢測(cè)系統(tǒng)
1.1 系統(tǒng)總體結(jié)構(gòu)設(shè)計(jì)
本文設(shè)計(jì)的基于PMML規(guī)范的海量弱關(guān)聯(lián)圖像數(shù)據(jù)檢測(cè)系統(tǒng)[4?6],其將數(shù)據(jù)檢測(cè)算法同PMML標(biāo)準(zhǔn)融合,通過(guò)組件技術(shù),增強(qiáng)系統(tǒng)的擴(kuò)展性。該系統(tǒng)使用PMML語(yǔ)言規(guī)范,PMML模型是系統(tǒng)中各模塊間和系統(tǒng)同其他檢測(cè)系統(tǒng)間溝通的紐帶。數(shù)據(jù)檢測(cè)模塊將形成的檢測(cè)模型通過(guò)PMML文檔輸出,模型應(yīng)用模塊通過(guò)PMML模型完成語(yǔ)言檢索。系統(tǒng)采用三層架構(gòu),如圖1所示。
1.2 系統(tǒng)基本模塊設(shè)計(jì)
(1) 預(yù)處理模塊獲取DICOM文件信息以及圖像特征,同時(shí)形成數(shù)據(jù)表信息,并對(duì)圖像數(shù)據(jù)進(jìn)行離散化處理。
(2) CTM文件轉(zhuǎn)換部件進(jìn)行數(shù)據(jù)檢測(cè)的數(shù)據(jù)源格式具有多樣化特征,該部件解決了不同數(shù)源格式的差異性,確保為數(shù)據(jù)檢測(cè)算法提供統(tǒng)一的數(shù)據(jù)格式。CTM文件轉(zhuǎn)換部件將用戶庫(kù)中有價(jià)值的數(shù)據(jù)表變換成檢測(cè)系統(tǒng)可分析的CTM格式。
(3) CMQL語(yǔ)法解析部件用于對(duì)數(shù)據(jù)檢測(cè)任務(wù)進(jìn)行設(shè)置。系統(tǒng)中的用戶采用圖形用戶界面GUI表明待檢測(cè)的對(duì)象,系統(tǒng)則可自主將檢測(cè)任務(wù)變換成CMQL語(yǔ)句,同時(shí)傳遞給CMQL語(yǔ)法解釋部件。該部件對(duì)檢測(cè)任務(wù)中的待檢測(cè)對(duì)象也就是CTM文件或圖像數(shù)據(jù)表是否存在、檢測(cè)算法是否存在和待檢測(cè)對(duì)象是否滿足檢測(cè)算法的需求等進(jìn)行檢測(cè)。如果發(fā)現(xiàn)異常,則將錯(cuò)誤信息傳輸給用戶。如果檢測(cè)對(duì)象滿足檢測(cè)需求,則將該語(yǔ)句解析成數(shù)據(jù)檢測(cè)模塊可分析的參數(shù),并且將參數(shù)反饋給數(shù)據(jù)檢測(cè)模塊。
(4) 數(shù)據(jù)檢測(cè)模塊是系統(tǒng)的關(guān)鍵模塊,可運(yùn)行相應(yīng)的圖像數(shù)據(jù)檢測(cè)任務(wù)。該模塊采集CMQL語(yǔ)法解析部件反饋的不同檢測(cè)參數(shù),再按照檢測(cè)參數(shù)選擇合理的檢測(cè)算法。也就是檢測(cè)算法模塊檢索用戶選擇的檢測(cè)算法對(duì)應(yīng)的aass文件或JAR包。如果檢索成功,則將檢索參數(shù)反饋給檢測(cè)算法模塊中相關(guān)的類(lèi)文件。
(5) 數(shù)據(jù)檢測(cè)算法模塊,通過(guò)哈希映射對(duì)圖像數(shù)據(jù)檢測(cè)算法進(jìn)行控制。
2 PMML模型應(yīng)用框架設(shè)計(jì)
2.1 PMML模型的塑造
PMML模型的塑造流程如圖2所示,詳細(xì)過(guò)程為:
(l) 用戶采用客戶端程序獲取塑造PMML模型需要的數(shù)據(jù)表,采用CTM變換其將數(shù)據(jù)表轉(zhuǎn)換成.cttn文件。
(2) 采集有價(jià)值的數(shù)據(jù)集,同時(shí)對(duì)其進(jìn)行預(yù)操作。
(3) 選擇合理的圖像數(shù)據(jù)檢測(cè)算法并設(shè)置其中的參數(shù),并自主產(chǎn)生對(duì)應(yīng)的CMQL語(yǔ)句。
(4) 分析CMQL語(yǔ)句,對(duì)弱關(guān)聯(lián)圖像數(shù)據(jù)檢測(cè)任務(wù)進(jìn)行分析,同時(shí)將檢測(cè)任務(wù)以及對(duì)應(yīng)的參數(shù)反饋給數(shù)據(jù)檢測(cè)模塊。
(5) 完成海量弱關(guān)聯(lián)圖像數(shù)據(jù)的檢測(cè)后,將檢測(cè)結(jié)果反饋給用戶,同時(shí)將系統(tǒng)檢測(cè)模型反饋給PMML模塊。
(6) PMML模塊進(jìn)行模型變換,將檢測(cè)模型變換成PMML模型并輸出。
2.2 PMML模型的應(yīng)用
PMML模型的應(yīng)用流程如圖3所示,其具體描述如下:
(1) 用戶在客戶端應(yīng)用程序設(shè)置塑造PMML模型需要的數(shù)據(jù)表,采用CTM變換部件將數(shù)據(jù)表變換成.Ctln文件。
(2) 選擇需要進(jìn)行預(yù)測(cè)的數(shù)據(jù)集,同時(shí)對(duì)數(shù)據(jù)集進(jìn)行預(yù)操作。
(3) 選擇進(jìn)行海量弱關(guān)聯(lián)圖像數(shù)據(jù)檢測(cè)需要的PMML模型。
(4) 系統(tǒng)自主產(chǎn)生相關(guān)的CMQL語(yǔ)句。
(5) 分析CMQL語(yǔ)句,檢測(cè)對(duì)應(yīng)的PMML模型能否生成海量弱關(guān)聯(lián)圖像數(shù)據(jù)的檢測(cè)任務(wù)。
(6) 數(shù)據(jù)檢測(cè)模塊將PMML模型作用在用戶選取的數(shù)據(jù)集,同時(shí)將弱關(guān)聯(lián)圖像數(shù)據(jù)反饋給用戶,而將模型的應(yīng)用結(jié)果反饋給數(shù)據(jù)源。
3 實(shí)驗(yàn)分析
為了驗(yàn)證本文設(shè)計(jì)的海量弱關(guān)聯(lián)圖像數(shù)據(jù)檢測(cè)系統(tǒng)的有效性,采用實(shí)際的AVIRIS高光譜數(shù)據(jù)源進(jìn)行實(shí)驗(yàn)分析。AVIRIS是通過(guò)推掃成像方式的成像光譜儀,在0.3~2.23腳的波長(zhǎng)區(qū)間采集224個(gè)波長(zhǎng)處的空間圖像信息,波長(zhǎng)的間隔是8 nm。實(shí)驗(yàn)采用的圖像是某地區(qū)機(jī)場(chǎng)的局部區(qū)域,使用的實(shí)驗(yàn)圖像大小是100×100,其中含有30個(gè)需要檢測(cè)的圖像數(shù)據(jù)。實(shí)驗(yàn)采用的目標(biāo)圖像如圖4所示。
實(shí)驗(yàn)分別采用本文方法和基于正交子空間的圖像數(shù)據(jù)檢測(cè)方法對(duì)實(shí)驗(yàn)圖像進(jìn)行檢測(cè),檢測(cè)結(jié)果分別如圖5和圖6所示。
對(duì)比分析圖5和圖6的檢測(cè)結(jié)果可得,本文方法的檢測(cè)性能優(yōu)于基于正交子空間的圖像數(shù)據(jù)檢測(cè)方法。因?yàn)榛谡蛔涌臻g的圖像數(shù)據(jù)檢測(cè)方法未考慮不同圖像數(shù)據(jù)間的關(guān)聯(lián)性,形成較多的虛警。而本文方法的檢測(cè)結(jié)果較為清晰、準(zhǔn)確。為了進(jìn)一步驗(yàn)證本文方法的優(yōu)越性,將圖像數(shù)據(jù)檢測(cè)方法檢測(cè)到的目標(biāo)數(shù)量、目標(biāo)占據(jù)的像素?cái)?shù)、虛警占據(jù)的像素?cái)?shù)和運(yùn)算時(shí)間四個(gè)指標(biāo),當(dāng)成評(píng)估本文方法和基于正交子空間的圖像數(shù)據(jù)檢測(cè)方法性能的指標(biāo)。具體的結(jié)果如表1所示。從表1可以看出,本文方法具有較高的目標(biāo)檢測(cè)率和較低的虛警率,比基于正交子空間的圖像數(shù)據(jù)檢測(cè)方法的優(yōu)越性好。
系統(tǒng)的圖像數(shù)據(jù)接收特性可以反映不同環(huán)境下的檢測(cè)概率和虛警概率間的波動(dòng)關(guān)系,可對(duì)檢測(cè)系統(tǒng)進(jìn)行定量分析。檢測(cè)概率為檢測(cè)到的實(shí)際目標(biāo)圖像數(shù)據(jù)數(shù)量同地面實(shí)際目標(biāo)圖像數(shù)據(jù)量的比值;虛警概率為檢測(cè)到的虛警圖像數(shù)據(jù)量同總體圖像數(shù)據(jù)量的比值。分析檢測(cè)到的圖像數(shù)據(jù)是否落入實(shí)際目標(biāo)排列區(qū)域能夠判斷到檢測(cè)到的是實(shí)際目標(biāo)還是虛警。本文方法和基于正交子空間的圖像數(shù)據(jù)檢測(cè)方法的接收特性曲線如圖7所示。從圖7中能夠看出本文方法的檢測(cè)性能和虛警率都優(yōu)于基于正交子空間的圖像數(shù)據(jù)檢測(cè)方法,較好地約束了混合圖像像素中背景數(shù)據(jù)對(duì)圖像數(shù)據(jù)檢測(cè)的干擾。
4 結(jié) 論
為了解決以往的圖像數(shù)據(jù)檢測(cè)系統(tǒng)對(duì)海量弱關(guān)聯(lián)圖像數(shù)據(jù)存在的檢測(cè)效率和精度較低問(wèn)題。本文設(shè)計(jì)基于PMML規(guī)范的海量弱關(guān)聯(lián)圖像數(shù)據(jù)檢測(cè)系統(tǒng),其將數(shù)據(jù)檢測(cè)算法同PMML標(biāo)準(zhǔn)融合,由表示層、應(yīng)用服務(wù)層和數(shù)據(jù)資源層構(gòu)成。其中應(yīng)用服務(wù)層中的數(shù)據(jù)檢測(cè)模塊將形成的檢測(cè)模型通過(guò)PMML文檔輸出,模型應(yīng)用模塊通過(guò)PMML模型采用自定義的數(shù)據(jù)檢測(cè)查詢語(yǔ)言CMQL完成語(yǔ)言檢索,實(shí)現(xiàn)海量弱關(guān)聯(lián)圖像數(shù)據(jù)的有效檢測(cè)。
參考文獻(xiàn)
[1] 馬亞楠,黃敏,李艷華,等.基于能量信息的毛豆豆莢螟高光譜圖像檢測(cè)[J].食品工業(yè)科技,2014,35(14):59?63.
[2] 陳健沛,朱煒湛,蔡志崗.紅外監(jiān)控圖像紅眼檢測(cè)與消除[J].現(xiàn)代電子技術(shù),2015,38(17):65?67.
[3] 韓先平.光電經(jīng)緯儀圖像數(shù)據(jù)內(nèi)同步動(dòng)態(tài)檢測(cè)方法[J].自動(dòng)化技術(shù)與應(yīng)用,2016,35(2):96?99.
[4] 劉綏美,李鵬飛,張蕾,等.基于稀疏編碼字典學(xué)習(xí)的疵點(diǎn)檢測(cè)[J].西安工程大學(xué)學(xué)報(bào),2015,29(5):594?599.
[5] 唐天翼,朱長(zhǎng)仁,趙和鵬.基于色彩空間變換與異常檢測(cè)的多光譜艦船感興趣區(qū)域檢測(cè)[J].現(xiàn)代電子技術(shù),2015,38(21):28?31.
[6] 張軍,王勇,郝萬(wàn)兵.面部彩色圖像特征檢測(cè)方法研究[J].軟件導(dǎo)刊,2015,14(9):166?168.