摘 要:雙目立體視覺(jué)是在對(duì)人類視覺(jué)系統(tǒng)研究的基礎(chǔ)上,通過(guò)雙目圖像的處理來(lái)獲取物體三維幾何信息,其結(jié)果表現(xiàn)為深度圖,再經(jīng)過(guò)進(jìn)一步處理得到三維空間中的物體信息的方法。雙目立體視覺(jué)的研究具有重要的應(yīng)用價(jià)值,包括機(jī)器人的自主導(dǎo)航、工業(yè)檢測(cè)、視覺(jué)監(jiān)控以及車輛輔助駕駛系統(tǒng)等。隨著計(jì)算機(jī)硬件的高速發(fā)展,基于雙目立體視覺(jué)的應(yīng)用越來(lái)越多地呈現(xiàn)在人們面前。
關(guān)鍵詞:雙目立體視覺(jué),立體匹配,相機(jī)標(biāo)定
中圖分類號(hào):N04;O43;TP3 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1673-8578(2014)S1-0070-03
The Concept and Analysis of Binocular Stereo Vision
WANG Qingwei
Abstract:Binocular stereo vision is one method which can obtain the 3D information by processing two images from the cameras. The 3D information is presented by depth image. The stereo vision system can be used in auto navigation, industrial detection, visual surveillance, and drive assistance system. With the rapid evolution of hardware, binocular vision based application will become more and more popular.
Keywords: binocular stereo vision, stereo matching, camera calibration
收稿日期:2014-06-28
作者簡(jiǎn)介:王青偉(1977—),女,遼寧本溪人,博士,實(shí)審審查員,從事自動(dòng)控制領(lǐng)域的專利審查。通信方式:wangqingwei@sipo.gov.cn。
一 雙目立體視覺(jué)的概念
計(jì)算機(jī)視覺(jué)中的一個(gè)重要的問(wèn)題是計(jì)算攝像機(jī)到物體之間的距離,實(shí)現(xiàn)方法之一是模仿生物的眼睛,即雙目立體視覺(jué)。雙目立體視覺(jué)是指雙眼互相重疊下而產(chǎn)生視覺(jué)[1]。研究人員付出了很多努力來(lái)研究我們的視覺(jué)系統(tǒng),希望能夠有一天創(chuàng)造一個(gè)人工視覺(jué)系統(tǒng)。人的視覺(jué)系統(tǒng)具有巨大的動(dòng)態(tài)感光范圍,能夠自適應(yīng)地發(fā)現(xiàn)場(chǎng)景里的細(xì)節(jié)。雙目視覺(jué)在視覺(jué)系統(tǒng)下是一系列復(fù)雜的生理及視覺(jué)心理過(guò)程,這種機(jī)制一直在下意識(shí)地發(fā)生作用。當(dāng)人們?cè)噲D觀察面前的物體時(shí),看到的是平面、圖畫(huà)或者照片,但是視覺(jué)感知機(jī)制卻會(huì)自動(dòng)獲得三維信息。這種機(jī)制能夠幫助我們理解世界并完成生活中的各種任務(wù)。
由于人的雙眼之間有瞳距,當(dāng)用眼睛觀察世界時(shí),會(huì)在左右眼的視網(wǎng)膜上生成有一定差別又基本相似的圖像[2]。同一個(gè)物體在左右眼所成圖像上坐標(biāo)位置的差別稱之為視差。根據(jù)視差的不同,大腦會(huì)將左右眼得到的兩幅圖像的差異進(jìn)行整合,從而能得到人眼到物體的精準(zhǔn)距離。人的雙眼的瞳距在60毫米到70毫米左右,能夠?qū)?00米內(nèi)的場(chǎng)景進(jìn)行很好的三維重建。
雙目立體視覺(jué)測(cè)量時(shí)基于三角法原理來(lái)獲取三維信息,一般用兩個(gè)攝像機(jī)來(lái)組成雙目立體視覺(jué)測(cè)量系統(tǒng),用視差理論來(lái)實(shí)現(xiàn)三維測(cè)量[3]。如圖1所示為雙目立體成像原理。
圖1 雙目立體成像原理
兩攝像機(jī)的投影中心連線的距離,即兩個(gè)相機(jī)的基線距離為b,三維空間中一個(gè)點(diǎn)A(X,Y,Z)在左右相機(jī)的成像面上的圖像坐標(biāo)分別為al(ul,vl)和ar(ur, vr),兩個(gè)成像點(diǎn)的X坐標(biāo)差即為視差,由此可計(jì)算出點(diǎn)A在攝像機(jī)坐標(biāo)系下的三維坐標(biāo)。
二 雙目立體視覺(jué)的系統(tǒng)及特點(diǎn)
完整的立體視覺(jué)系統(tǒng)由多個(gè)模塊組成,通常包含圖像采集模塊、攝像機(jī)標(biāo)定模塊、立體匹配模塊和三維重建模塊。
圖像采集模塊的主要目的是獲取數(shù)字圖像,雙目立體視覺(jué)系統(tǒng)采集雙目圖像,還有其他多目系統(tǒng)會(huì)采集多目圖像。圖像獲取的方式有很多種,主要由具體的應(yīng)用場(chǎng)景決定。在采集圖像時(shí)還要考慮光照、場(chǎng)景特點(diǎn)及采集設(shè)備的性能。
攝像機(jī)標(biāo)定模塊主要目的是對(duì)系統(tǒng)中的兩個(gè)相機(jī)進(jìn)行標(biāo)定,建立相機(jī)成像的幾何模型,從而確定真實(shí)空間中物體上的某點(diǎn)的幾何位置和圖像中對(duì)應(yīng)點(diǎn)之間的關(guān)系。相機(jī)標(biāo)定結(jié)果的精度和算法的穩(wěn)定性會(huì)對(duì)相機(jī)結(jié)果的準(zhǔn)確性產(chǎn)生直接的影響。標(biāo)定模塊包括單個(gè)相機(jī)的標(biāo)定和雙目相機(jī)的標(biāo)定。單個(gè)相機(jī)的標(biāo)定主要是獲取相機(jī)的畸變和內(nèi)參參數(shù)。得到單個(gè)相機(jī)的參數(shù)后,接下來(lái)就是對(duì)雙目相機(jī)進(jìn)行標(biāo)定,計(jì)算出兩個(gè)相機(jī)在當(dāng)前位置下的相互參數(shù)。標(biāo)定完成后就可以去觀測(cè)世界。
立體匹配模塊主要目的是將三維空間中的一點(diǎn)在左右相機(jī)的對(duì)應(yīng)點(diǎn)找出來(lái),從而達(dá)到計(jì)算視差而獲取三維世界的距離。圖像匹配是雙目立體視覺(jué)中最重要也是最難的一個(gè)問(wèn)題,也一直是研究的焦點(diǎn)。同一物體在兩個(gè)相機(jī)成像面上的成像會(huì)有不同程度的變形,而且成像還會(huì)受到場(chǎng)景光照、攝像機(jī)系統(tǒng)的噪聲和其特性、目標(biāo)對(duì)象的表面特性等因素的影響,要想獲得精確的匹配十分不易。匹配方法有區(qū)域匹配、特征匹配和全局匹配。
在完成上述雙目相機(jī)的標(biāo)定和圖像匹配后就可以對(duì)被測(cè)量物體進(jìn)行三維信息恢復(fù)。通過(guò)空間中一點(diǎn)和兩個(gè)圖像中的對(duì)應(yīng)坐標(biāo)及相機(jī)參數(shù)矩陣,可以求解出該點(diǎn)的世界坐標(biāo),來(lái)達(dá)到三維重建的目的。
雙目立體視覺(jué)系統(tǒng)具有系統(tǒng)結(jié)構(gòu)簡(jiǎn)單、成本低、精度適中、高效等特點(diǎn),而且具有很強(qiáng)的擴(kuò)展能力,可以較容易地?cái)U(kuò)展到多個(gè)相機(jī)。雙目立體相機(jī)還由于其體積不大,方便于在各種場(chǎng)合布置,還具有不易損壞,連續(xù)工作時(shí)間長(zhǎng)等特點(diǎn)。
三 雙目立體視覺(jué)的應(yīng)用現(xiàn)狀
雙目立體視覺(jué)的主要功能是獲取目標(biāo)物體的三維信息以及準(zhǔn)確的距離信息?;诖斯δ?,雙目立體相機(jī)在導(dǎo)航、視覺(jué)監(jiān)控、工業(yè)檢測(cè)、虛擬現(xiàn)實(shí)、汽車輔助駕駛系統(tǒng)等方面有廣闊的應(yīng)用前景。
雙目視覺(jué)導(dǎo)航系統(tǒng)當(dāng)前主要應(yīng)用在機(jī)器人系統(tǒng)中,在機(jī)器人上安裝雙目攝像頭,獲取機(jī)器人前面障礙物的位置,得出該障礙物的三維坐標(biāo)值,并把該三維坐標(biāo)輸入到機(jī)器人控制系統(tǒng),機(jī)器人就可以實(shí)現(xiàn)智能地避障了。
雙目立體視覺(jué)在視覺(jué)監(jiān)控方面也獲得了越來(lái)越廣泛的應(yīng)用。由于雙目立體視覺(jué)可以獲得物體的三維幾何信息,因此可以有效避免光線、陰影等干擾因素,提高智能監(jiān)控的準(zhǔn)確度?;诹Ⅲw視覺(jué)技術(shù)的監(jiān)控,因?yàn)榭梢垣@得監(jiān)控目標(biāo)的三維信息、姿態(tài)及目標(biāo)周圍空間的距離信息,因此可以適應(yīng)復(fù)雜的監(jiān)控環(huán)境。
四 結(jié) 語(yǔ)
雙目立體視覺(jué)是計(jì)算機(jī)視覺(jué)領(lǐng)域一個(gè)重要的課題,經(jīng)過(guò)幾十年的研究,取得了顯著的成果,技術(shù)也越來(lái)越成熟。隨著硬件處理能力的增強(qiáng),立體視覺(jué)的應(yīng)用會(huì)越來(lái)越廣泛地出現(xiàn)在人們?nèi)粘I钪小?/p>
參考文獻(xiàn)
[1] 艾海舟.關(guān)于雙目立體視覺(jué)的研究[D]. 北京:清華大學(xué)計(jì)算機(jī)系,1988:121.
[2] 張廣軍.機(jī)器視覺(jué)[M].北京:科學(xué)出版社有限責(zé)任公司,2005:273.
[3] 徐敏,周中偉.一種雙目立體視覺(jué)運(yùn)動(dòng)目標(biāo)跟蹤定位方法[J].制造業(yè)自動(dòng)化,2013,35(9):69—72.