楊光熙
摘要:在油田安防工作中,視頻監(jiān)控是一個(gè)重要環(huán)節(jié),近年來(lái)無(wú)人機(jī)技術(shù)的發(fā)展,不僅減少人工巡檢的工作量,更提高對(duì)異常情況進(jìn)行響應(yīng)的及時(shí)性。由于無(wú)人機(jī)行進(jìn)過(guò)程中,針對(duì)同一物體獲取到的圖像以及視頻資料可能來(lái)自不同角度,導(dǎo)致無(wú)人機(jī)自動(dòng)識(shí)別目標(biāo)的難度增加,無(wú)法達(dá)到自動(dòng)導(dǎo)航的效果。針對(duì)這一問(wèn)題提出可行性改進(jìn)方案,將SIFT圖像配準(zhǔn)算法應(yīng)用到實(shí)際設(shè)備中,提取圖像特征點(diǎn),并計(jì)算每個(gè)特征點(diǎn)的描述符,提高特征點(diǎn)匹配的準(zhǔn)確性。
關(guān)鍵詞:油田安防;配準(zhǔn);特征點(diǎn);特征描述符
一、前言
視頻監(jiān)控是油田生產(chǎn)中的重要技術(shù)手段,油田安防系統(tǒng)中,工作人員可以通過(guò)攝像頭對(duì)現(xiàn)場(chǎng)進(jìn)行監(jiān)控。當(dāng)現(xiàn)場(chǎng)出現(xiàn)設(shè)備故障等意外時(shí),視頻數(shù)據(jù)將作為后續(xù)處理故障以及追責(zé)的重要依據(jù)。大慶油田幅員遼闊,因此對(duì)于施工作業(yè)現(xiàn)場(chǎng)的影像資料通過(guò)人工獲取的成本較大,此外,對(duì)于異常情況的響應(yīng)速度也較慢,無(wú)法在第一時(shí)間獲取現(xiàn)場(chǎng)的影像資料。在這些困難存在的情況下,無(wú)人機(jī)技術(shù)的應(yīng)用成為必然的趨勢(shì)。無(wú)人機(jī)能夠快速到達(dá)現(xiàn)場(chǎng),節(jié)約人力成本,提高異常情況的響應(yīng)速度。但是目前的無(wú)人機(jī)仍需要操作員進(jìn)行遠(yuǎn)程控制,無(wú)法做到自動(dòng)識(shí)別并鎖定目標(biāo)。究其原因,是由于無(wú)人機(jī)攝像頭對(duì)于目標(biāo)的識(shí)別準(zhǔn)確性不高,針對(duì)同一物體,從不同角度進(jìn)行拍攝,無(wú)法從獲取到的圖像中識(shí)別出同一目標(biāo),從而進(jìn)行圖像的匹配。SIFT(尺度不變特征變換)[1]算法是David G.Lowe教授于1999年提出的匹配算法,它的基本原理基于不變量描述符的匹配。經(jīng)典SIFT算法對(duì)圖像配準(zhǔn)[2]技術(shù)具有重大意義,它有如下的兩個(gè)主要特點(diǎn):①算法針對(duì)圖像局部特征進(jìn)行提取,因此對(duì)于圖像場(chǎng)景中的仿射變換、明暗轉(zhuǎn)換等因素的影響下,可以具備良好穩(wěn)定性;②在一些圖像中,我們直接通過(guò)肉眼并不能在影響因素存在的條件下輕易識(shí)別出物品,但在提取特征點(diǎn)時(shí),該算法可以識(shí)別到圖像中極其細(xì)微的特征,并為大量特征點(diǎn)建立特征描述符。本文中提出采用SIFT算法對(duì)油田監(jiān)控圖像進(jìn)行配準(zhǔn)的設(shè)想。
二、SIFT算法原理概述
計(jì)算機(jī)視覺(jué)的一項(xiàng)重要功能就是,通過(guò)攝像機(jī)拍攝的圖像,經(jīng)過(guò)特殊算法,獲取到圖像場(chǎng)景中的幾何關(guān)系,并能夠識(shí)別物體??臻g物體表面的三維空間位置與圖像中相應(yīng)物體的三維空間關(guān)系是可以通過(guò)一定的轉(zhuǎn)換關(guān)系進(jìn)行關(guān)聯(lián)的[3]。而這種現(xiàn)實(shí)中物體的三維幾何特征到圖像中相應(yīng)物體的特征,二者之間的轉(zhuǎn)換關(guān)系就是攝像機(jī)的參數(shù),在攝像測(cè)量的過(guò)程中,也涉及需要這種攝像機(jī)參數(shù)的情況,因此,如何獲取準(zhǔn)確的攝像機(jī)參數(shù)也成為多年以來(lái)的熱門(mén)研究課題,這種計(jì)算攝像機(jī)參數(shù)的過(guò)程就被稱(chēng)為攝像機(jī)標(biāo)定。而通過(guò)攝像機(jī)參數(shù)來(lái)對(duì)圖像進(jìn)行處理,將兩幅圖像進(jìn)行匹配的過(guò)程被稱(chēng)為圖像配準(zhǔn)。
圖像配準(zhǔn)的最基本工作就是找到圖片中最有代表性的亮點(diǎn)或暗點(diǎn),也就是特征點(diǎn)[4]。由上述可知,特征點(diǎn)的一大特點(diǎn)就是,必須能夠在盡可能多的干擾情況下依然突出,保證其特別性,才能作為描述圖像中物體特性輪廓的點(diǎn)。SIFT算法在分析了多種影響因素的情況下,引入了通過(guò)尺度空間來(lái)鎖定圖像特征點(diǎn)的方法。即認(rèn)為,能夠在不同尺度下依然能夠保持突出的點(diǎn),就是圖像的特征點(diǎn)。SIFT算法的步驟大致分為:①對(duì)圖像進(jìn)行不同尺度的模糊,建立高斯金字塔。②對(duì)高斯金字塔進(jìn)行進(jìn)一步處理,相鄰圖像做差,建立DoG金字塔[5]。③獲取每一張圖的局部極值點(diǎn),即最能克服尺度變化依舊保持特殊的點(diǎn)。④極值點(diǎn)篩選,留下特征足夠明顯的極值點(diǎn),作為特征點(diǎn)。⑤對(duì)每一個(gè)特征點(diǎn)建立描述符,描述特征點(diǎn),以便后面進(jìn)行匹配。⑥將兩幅圖中特征描述符最接近的點(diǎn)進(jìn)行匹配,獲得最終匹配結(jié)果。算法具體過(guò)程解釋如下。
(一)建立高斯金字塔
構(gòu)建尺度空間的過(guò)程可以理解為在不同程度上對(duì)圖像進(jìn)行模糊,以便從中提取能夠保持穩(wěn)定特性不受尺度影像的特征。在提取時(shí),需要建立包含各種不同尺度圖像的空間模型。我們稱(chēng)這個(gè)構(gòu)建出的模型為金字塔,它的作用是在各種尺度上對(duì)目標(biāo)圖像提取出穩(wěn)定的特征點(diǎn)。Koenderink等教授經(jīng)過(guò)試驗(yàn)證實(shí),在尺度空間引入高斯函數(shù)的方法是最適合對(duì)圖像進(jìn)行處理的。
當(dāng)比例因子連續(xù)增加時(shí),可以獲得一系列模糊程度逐漸增加的圖像。隨著每個(gè)級(jí)別圖像的比例逐層增加,其模糊程度也逐漸增加,最終結(jié)果是,當(dāng)前圖像的尺寸以及所占內(nèi)存都是上一級(jí)別圖像的一半。此處建造的高斯金字塔有o個(gè)級(jí)別,每個(gè)級(jí)別都有s個(gè)級(jí)別。在同一級(jí)別中,兩個(gè)相鄰級(jí)別之間的比例為k。
(二)建立DoG金字塔
Lowe教授在論文中指出,對(duì)特征點(diǎn)進(jìn)行檢測(cè)的過(guò)程要在尺度不變的條件下才有意義。因此,怎樣在圖像中提取出克服尺度變化的特征,是非常重要的問(wèn)題。林德伯格指出,歸一化的LOG算子具有良好的尺度不變性。
在計(jì)算方面,DoG算子只需要利用尺度相鄰的上下層圖像進(jìn)行相減,這個(gè)過(guò)程獲取到目標(biāo)的輪廓特征。利用高斯差分算法,可以得到目標(biāo)圖像上每一個(gè)像素值的變化趨勢(shì)以及變化值,從而有效提取目標(biāo)圖像所有像素中變化最大的點(diǎn)。在使用高斯差分算子對(duì)圖像進(jìn)行處理的基礎(chǔ)上,進(jìn)一步建立高斯金字塔(DoG金字塔)。
(三)局部極值點(diǎn)的檢測(cè)
提取關(guān)鍵點(diǎn)的過(guò)程是在DoG金字塔中的圖像上進(jìn)行的,為了尋找DoG函數(shù)的極值點(diǎn),目標(biāo)圖像的每一個(gè)像素都要和它周?chē)?個(gè)相鄰像素進(jìn)行灰度值比較,看該像素是否為鄰域內(nèi)的極值點(diǎn)。
對(duì)每一個(gè)檢測(cè)點(diǎn)來(lái)說(shuō),它不僅要和同一尺度的8個(gè)相鄰點(diǎn)進(jìn)行比較,還需要與它上下相鄰尺度圖像中的9×2個(gè)點(diǎn)進(jìn)行比較,即比較范圍為三維空間中的26個(gè)相鄰點(diǎn),確保在縱向上的尺度空間和橫向上的圖像空間都進(jìn)行極值點(diǎn)檢測(cè),類(lèi)似于魔方中心塊與周?chē)噜徯K進(jìn)行比較。
由上述原理敘述可知,在尺度空間提取極值的過(guò)程中,每一組圖像的最上和最下兩層是無(wú)法進(jìn)行極值比較的。為了解決這個(gè)問(wèn)題,使尺度連續(xù)變化,在每組圖像的頂部通過(guò)高斯模糊的方式生成三幅圖像,這樣就保證了原來(lái)的最上層圖像也有與之進(jìn)行鄰域比較的參考。
(四)特征點(diǎn)的精確定位和進(jìn)一步過(guò)濾
在上述過(guò)程之后,可以初始提取圖像中的關(guān)鍵點(diǎn)。然而,由于DoG對(duì)噪聲和邊緣敏感,在尺度空間中檢測(cè)到的局部極值點(diǎn)需要進(jìn)一步篩選,過(guò)程如下:
(1)刪除對(duì)比度低的點(diǎn)
為提高特征點(diǎn)的穩(wěn)定性和準(zhǔn)確性,需要在尺度空間模型中執(zhí)行DoG函數(shù)的曲線擬合,進(jìn)而去除對(duì)比度比較低的點(diǎn)。
(2)刪除邊緣點(diǎn)
為了保證特征點(diǎn)的穩(wěn)定性,僅去除具有低對(duì)比度的點(diǎn)是不夠的。由于DoG函數(shù)在圖像邊緣具有很強(qiáng)的邊緣響應(yīng),因此我們需要對(duì)圖像中的邊緣點(diǎn)進(jìn)行進(jìn)一步篩選。
通過(guò)上述兩個(gè)過(guò)程(1)和(2),將篩選過(guò)濾掉大量特征點(diǎn),留下更穩(wěn)定和更準(zhǔn)確的像素坐標(biāo)。這個(gè)過(guò)程對(duì)于建立特征描述符的工作至關(guān)重要。
(五)建立特征描述符
1.特征點(diǎn)的方向關(guān)聯(lián)。圖像配準(zhǔn)算法中的最大問(wèn)題是,如何解決圖像內(nèi)場(chǎng)景旋轉(zhuǎn)帶來(lái)的影響。通過(guò)前幾步所提取關(guān)鍵點(diǎn)的鄰域像素的梯度特性,為每個(gè)關(guān)鍵點(diǎn)設(shè)置一個(gè)主方向,從而特征描述符增加了一項(xiàng)方向信息,在特征描述符的匹配過(guò)程中可以考慮方向因素,達(dá)到使描述符旋轉(zhuǎn)不變的目的。
在上述步驟之后,已經(jīng)檢測(cè)到圖像的關(guān)鍵點(diǎn),并且獲得的每個(gè)關(guān)鍵點(diǎn)包含三個(gè)重要信息:特征點(diǎn)的位置坐標(biāo)、特征點(diǎn)的比例和特征點(diǎn)的主要方向。這樣保證了提取出的關(guān)鍵點(diǎn)具有旋轉(zhuǎn)以及縮放保持不變的特性。
2.創(chuàng)建功能描述符。建立描述關(guān)鍵點(diǎn)本身以及關(guān)鍵點(diǎn)周?chē)袼靥卣鞯拿枋龇麃?lái)對(duì)關(guān)鍵點(diǎn)進(jìn)行唯一性身份賦予,描述符能夠包含足夠的特殊性信息。通過(guò)調(diào)節(jié)描述符向量參數(shù)信息,獲取效果最好的向量維度,既保證了篩選出足夠數(shù)量和質(zhì)量的特征點(diǎn),又保證了算法的運(yùn)行效率。通過(guò)大量實(shí)驗(yàn)結(jié)果表明,該描述符采用4×4×8=128維向量,具有最佳的抗噪聲能力和匹配魯棒性,同時(shí)保證了描述符計(jì)算過(guò)程的速度。
3.特征描述符的匹配。選擇一幅參考圖像,以及一幅目標(biāo)圖像,通過(guò)之前的幾個(gè)步驟分別計(jì)算兩張圖像的特征點(diǎn),并計(jì)算每個(gè)特征點(diǎn)的描述符。將兩張圖像所有的特征點(diǎn)的特性描述符進(jìn)行對(duì)比,并為目標(biāo)圖像中的每個(gè)特征點(diǎn)找到與之最為匹配的參考圖像中的特征點(diǎn),即找到兩幅圖中特征描述符最為接近的點(diǎn)對(duì)。
兩張圖的匹配可以用窮舉法耗時(shí)太長(zhǎng),因此使用建立kd樹(shù)的方法來(lái)實(shí)現(xiàn)特征描述符的匹配。對(duì)比參考圖像的關(guān)鍵點(diǎn),在目標(biāo)圖像中查找最接近參考圖像關(guān)鍵點(diǎn)的特征點(diǎn)。如果兩個(gè)匹配點(diǎn)之間的距離除以固定最近距離的商值小于預(yù)設(shè)閾值,則將接受這對(duì)匹配點(diǎn),而預(yù)設(shè)的閾值可以通過(guò)實(shí)際圖像的復(fù)雜程度進(jìn)行調(diào)整,以便找到最佳閾值。整個(gè)算法過(guò)程的流程圖如圖1所示。
三、SIFT算法的實(shí)際效果展示
(一)SIFT算法的實(shí)際圖像效果示例圖展示
上文中講述了SIFT算法的原理,本節(jié)中參考Lowe教授的文章,將SIFT算法進(jìn)行實(shí)現(xiàn)。通過(guò)在不同尺度中檢測(cè)圖像像素的極值點(diǎn)、篩選最具唯一性身份信息的特征點(diǎn)、為每個(gè)特征點(diǎn)分配方向以及灰度信息、建立特征描述符的基本過(guò)程,即完成了算法,可以得到目標(biāo)圖像與參考圖像中相應(yīng)的特征點(diǎn)匹配。
為了能夠驗(yàn)證算法的準(zhǔn)確性,檢查圖像特征點(diǎn)的匹配效率,需要利用真實(shí)場(chǎng)景圖像進(jìn)行實(shí)際的配準(zhǔn)操作。對(duì)同一物體進(jìn)行不同方式的拍攝,比如不同角度或者不同明暗,獲取同一物體的不同圖像。對(duì)采集到的圖像進(jìn)行算法處理,獲取圖像對(duì)的特征點(diǎn),并進(jìn)行匹配,通過(guò)連線將兩幅圖中的特征點(diǎn)進(jìn)行連接,一目了然地檢查特征點(diǎn)的匹配準(zhǔn)確度。
SIFT算法匹配效果的示例圖如圖2所示(所用的圖像由數(shù)據(jù)集中隨機(jī)選取而來(lái))。
(二)SIFT算法在圖像庫(kù)中的匹配效果統(tǒng)計(jì)
為了檢測(cè)上述SIFT算法對(duì)多模圖像的特征點(diǎn)匹配準(zhǔn)確率,需要用大量的圖像進(jìn)行實(shí)驗(yàn),并對(duì)效果進(jìn)行統(tǒng)計(jì)。本人在瑞士洛桑聯(lián)邦理工學(xué)院的官方網(wǎng)站上獲取包含大量實(shí)驗(yàn)圖像對(duì)的數(shù)據(jù)包,其中的圖像均來(lái)自大量實(shí)際景物拍攝,即包含村莊田地等自然景物,又包含建筑街道等城市中的場(chǎng)景。用這些包含不同事物的圖像來(lái)進(jìn)行配準(zhǔn)實(shí)驗(yàn),并將配準(zhǔn)誤差做統(tǒng)計(jì),以表格的形式保存。
分別計(jì)算每個(gè)圖像庫(kù)中多模圖像對(duì)的特征點(diǎn)配準(zhǔn)誤差,以誤差的像素?cái)?shù)目作為匹配效果的參考標(biāo)準(zhǔn)。分別將誤差像素?cái)?shù)目分布在0~2,2~5,5~10,10~20,20~50,50~100以及大于100共七個(gè)范圍內(nèi)的點(diǎn)對(duì)數(shù)目進(jìn)行統(tǒng)計(jì),并將不同誤差范圍內(nèi)點(diǎn)對(duì)數(shù)所占的百分比進(jìn)行計(jì)算。統(tǒng)計(jì)結(jié)果如表1所示。
四、算法效果總結(jié)以及在油田中的應(yīng)用前景分析
(一)算法效果總結(jié)
前章詳細(xì)敘述圖像匹配經(jīng)典算法SIFT的原理,分步說(shuō)明該算法提取特征點(diǎn)、建立特征描述符以及匹配特征描述符的基本過(guò)程,利用實(shí)景圖像進(jìn)行特征點(diǎn)匹配實(shí)驗(yàn)。經(jīng)過(guò)大量圖像進(jìn)行特征描述符的計(jì)算以及匹配,獲取每對(duì)特征點(diǎn)匹配的誤差,將誤差分布進(jìn)行統(tǒng)計(jì)。實(shí)驗(yàn)可以得出結(jié)論,上述圖像匹配經(jīng)典算法效果良好,對(duì)于內(nèi)容復(fù)雜的場(chǎng)景圖片,可以進(jìn)行特征點(diǎn)匹配。
(二)SIFT圖像配準(zhǔn)算法在油田中的應(yīng)用
大慶油田產(chǎn)量高,區(qū)域廣,安防工作是十分關(guān)鍵的內(nèi)容,施工作業(yè)現(xiàn)場(chǎng)以及設(shè)備故障現(xiàn)場(chǎng)視頻資料的獲取有著重要意義。隨著計(jì)算機(jī)視覺(jué)技術(shù)的發(fā)展,如何利用計(jì)算機(jī)程序來(lái)完成人工的工作,是提高監(jiān)控效率的重要研究方向。
無(wú)人機(jī)的特點(diǎn)是監(jiān)控范圍廣,大大減少人工巡檢的工作量,節(jié)約人力成本,同時(shí)有效提高故障的響應(yīng)效率,盡快到達(dá)現(xiàn)場(chǎng),有利于統(tǒng)一管理。傳統(tǒng)方式對(duì)于操作員的依賴(lài)性較大,若能使無(wú)人機(jī)自動(dòng)獲取并鎖定目標(biāo),則可完全脫離人工,自動(dòng)到達(dá)現(xiàn)場(chǎng),進(jìn)一步減少人工成本,且提高故障響應(yīng)效率。本文介紹的算法可以應(yīng)用于油田場(chǎng)景圖像的匹配,對(duì)于目標(biāo)的識(shí)別以及鎖定得到較好的效果。
五、結(jié)語(yǔ)
SIFT圖像配準(zhǔn)算法可以通過(guò)檢測(cè)不同尺度空間中的圖像的極值點(diǎn)、對(duì)初步檢測(cè)到的特征點(diǎn)進(jìn)行過(guò)濾、為每個(gè)過(guò)濾后的特征點(diǎn)分配方向、建立特征描述符、對(duì)特征點(diǎn)進(jìn)行分類(lèi)、對(duì)目標(biāo)圖像和參考圖像之間的對(duì)應(yīng)特征點(diǎn)進(jìn)行匹配,以及匹配兩個(gè)圖像中所有特征點(diǎn)的特征描述符。目的是識(shí)別和匹配兩張圖片中的相同目標(biāo)。作為計(jì)算機(jī)視覺(jué)的一個(gè)重要研究方向,SIFT圖像配準(zhǔn)算法的相關(guān)研究工作已受到國(guó)內(nèi)外眾多高校和企業(yè)的關(guān)注。
實(shí)驗(yàn)表明,該算法穩(wěn)定高效,能夠在短時(shí)間內(nèi)處理大量圖像,能夠滿足實(shí)際工程的實(shí)時(shí)性要求。使用該算法對(duì)大量圖像進(jìn)行匹配,取得了良好的效果。在后續(xù)的研究中,該算法將應(yīng)用于油田場(chǎng)景圖像進(jìn)行實(shí)驗(yàn),并進(jìn)一步研究和改進(jìn)其在油田視頻監(jiān)控中的效果。
參考文獻(xiàn)
[1]David G.Lowe.Distinctive Image Features from Scale-Invariant Keypoints.[J].International Journal of Computer Vision,2004,60(2):91-110.
[2]洪貝,孫繼銀.圖像配準(zhǔn)技術(shù)研究[D].西安:第二炮兵工程學(xué)院,2006.
[3]何文峰,查紅彬.基于平面特征的深度圖像配準(zhǔn)[D].北京:北京大學(xué),2006.
[4]章毓晉.圖像理解與計(jì)算機(jī)視覺(jué)[D].北京:清華大學(xué)出版社,2000.
[5]Baba C.Vemuri et al.An efficient motion estimator with application to medical image registration[J].Medical Image Analysis,1998,2(1):79-98.