劉嬋楨
(重慶理工大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院,重慶 400050)
足球機(jī)器人系統(tǒng)是一個(gè)涉及計(jì)算機(jī)視覺(jué)、人工智能、無(wú)線通信和自動(dòng)控制等多種領(lǐng)域的典型的智能機(jī)器人系統(tǒng)。其中視覺(jué)系統(tǒng)是機(jī)器人足球的最前端系統(tǒng),負(fù)責(zé)原始的球場(chǎng)信息的采集工作,相當(dāng)于足球機(jī)器人的眼睛,因此,“眼睛”的誤差將直接影響整個(gè)系統(tǒng)精確和穩(wěn)定,而攝像機(jī)的標(biāo)定是視覺(jué)系統(tǒng)處理的第一步,是整個(gè)視覺(jué)系統(tǒng)的基礎(chǔ)。攝像機(jī)標(biāo)定是指建立攝像機(jī)圖像像素位置與場(chǎng)景點(diǎn)位置之間的關(guān)系,其途徑是根據(jù)攝像機(jī)模型,由已知標(biāo)定點(diǎn)的圖像坐標(biāo)和世界坐標(biāo)求解攝像機(jī)的模參數(shù)[1]。攝像機(jī)透視模型分為線性模型與非線性模型。因此標(biāo)定方法分為線性的與非線性的。國(guó)內(nèi)外在機(jī)器人足球視覺(jué)標(biāo)定方面做了大量的研究,并提出一些可行的方法。對(duì)攝像機(jī)成像的幾何模型和光學(xué)畸變進(jìn)行了詳細(xì)的分析,并分別闡述了相關(guān)的研究思路和方法,為機(jī)器人足球視覺(jué)系統(tǒng)的研究提供了參考。
線性攝像機(jī)的建模涉及到3個(gè)坐標(biāo)系:圖像坐標(biāo)系、攝像機(jī)坐標(biāo)系和空間坐標(biāo)系。
理想的透鏡成像是針孔模型,如圖1所示。
其中,Oc-XcYcZc為攝像機(jī)坐標(biāo)系,其原點(diǎn)Oc即為攝像機(jī)的光心,Zc軸與光軸重合。Ow-XwYwZw為世界坐標(biāo)系,O-xy為圖像物理坐標(biāo)系,坐標(biāo)原點(diǎn)在光軸與圖像平面的交點(diǎn)為O,其x,y軸分別平行于攝像機(jī)坐標(biāo)系的Xc,Yc軸。O-uv為圖像像素坐標(biāo)系,(Xw,Yw,Zw)是三維世界坐標(biāo)系中物體點(diǎn)P的三維坐標(biāo),(u,v)是計(jì)算機(jī)圖像坐標(biāo)系中空間任意一點(diǎn)P點(diǎn)的成像點(diǎn)p的實(shí)際圖像坐標(biāo),單位是像素?cái)?shù)(pixe1)。焦距f為圖像平面到光學(xué)中心的距離。
采用線性模型[2],對(duì)于選定的n個(gè)特征點(diǎn),有2n個(gè)關(guān)于計(jì)算參數(shù)矩陣M元素的方程,用矩陣形式表示為:
圖1 理想的攝像機(jī)模型
方法是一種基于標(biāo)志點(diǎn)將場(chǎng)地分區(qū)的線性標(biāo)定算法。具體的算法如下:通過(guò)拖動(dòng)鼠標(biāo)在圖像上確定一個(gè)矩形,4 個(gè)頂點(diǎn)分別為A、B、C和D,其分別對(duì)應(yīng)的世界坐標(biāo)為A(0,0),B(0,180),C(220,180),D(220,0);A,B兩點(diǎn)之間屏幕坐標(biāo)Y之間的差值與A,B兩點(diǎn)之間世界坐標(biāo)Y之間的對(duì)應(yīng)關(guān)系為;A,D兩點(diǎn)之間的屏幕坐標(biāo)X之間的差值與A,D兩點(diǎn)之間的世界坐標(biāo)X之間對(duì)應(yīng)關(guān)系為。
線性標(biāo)定方法,只需求解線性方程,簡(jiǎn)單快速,原理簡(jiǎn)單,實(shí)現(xiàn)容易。改進(jìn)的線性標(biāo)定方法一般根據(jù)經(jīng)驗(yàn)對(duì)場(chǎng)地分區(qū),在每個(gè)分區(qū)中,分塊對(duì)場(chǎng)地進(jìn)行標(biāo)定,同時(shí)對(duì)邊界進(jìn)行處理。改進(jìn)的標(biāo)定方法相對(duì)于前一種線性標(biāo)定方法,在一定范圍內(nèi)縮小誤差。但線性模型不考慮鏡頭畸變,準(zhǔn)確性欠佳,精度不高。
引入非線性畸變的數(shù)學(xué)模型主要有以下幾種:
(1)僅考慮鏡頭的徑向畸變時(shí),可得到鏡頭幾何畸變修正的數(shù)學(xué)模型為[3]:
其中θ為畸變前后的坐標(biāo)系偏轉(zhuǎn)角。
(2)對(duì)足球機(jī)器人視覺(jué)系統(tǒng)中采用的短焦廣角鏡頭可建立只考慮徑向誤差的數(shù)學(xué)模型,在實(shí)際應(yīng)用中,為了減少運(yùn)算量,在不影響畸變校正效果的前提下,忽視其徑向誤差中的高次項(xiàng),鏡頭誤差表達(dá)式可以簡(jiǎn)化為[4]:
其中ρ2=(x-x0)(y-y0),k1為徑向畸變系數(shù),(x0,y0)是成像面中心點(diǎn)的坐標(biāo)。
(3)圖像的非線性幾何畸變可用坐標(biāo)間的多項(xiàng)式來(lái)表示。令(x,y)為無(wú)畸變圖像上任一點(diǎn)的坐標(biāo),(xd,yd)為畸變圖像上與(x,y)相對(duì)應(yīng)的點(diǎn)坐標(biāo)。則有關(guān)系式[5]:
式中:aij,bij為多項(xiàng)式的系數(shù);n為多項(xiàng)式的次數(shù)。按最小二乘法,通過(guò)求解使得擬合誤差平方和最小時(shí)的aij,bij,即可求出校正前后坐標(biāo)點(diǎn)之間的變換關(guān)系。
(1)BP網(wǎng)絡(luò)。用于攝像機(jī)標(biāo)定的BP網(wǎng)絡(luò)的結(jié)構(gòu)如圖2所示[7]。根據(jù)攝像機(jī)標(biāo)定的特點(diǎn),網(wǎng)絡(luò)輸入為標(biāo)定樣本點(diǎn)的圖像像素坐標(biāo)(u,v),輸出為其對(duì)應(yīng)的世界坐標(biāo)(X,Y),即BP網(wǎng)絡(luò)為2-n-2結(jié)構(gòu)。n為網(wǎng)絡(luò)的隱層節(jié)點(diǎn)數(shù)。
圖2 單目標(biāo)定的BP網(wǎng)絡(luò)結(jié)構(gòu)
(2)RBF網(wǎng)絡(luò)。從理論上講,RBF網(wǎng)絡(luò)和BP網(wǎng)絡(luò)一樣可近似任何的連續(xù)非線形函數(shù),兩者的主要差別在于各使用不同的作用函數(shù),BP網(wǎng)絡(luò)中的隱層節(jié)點(diǎn)使用的是Sigmoid函數(shù),其函數(shù)值在輸入空間中無(wú)限大的范圍內(nèi)為非零值,而RBF網(wǎng)絡(luò)的作用函數(shù)則是局部的。
BP網(wǎng)絡(luò)和RBF網(wǎng)絡(luò)是兩種應(yīng)用頗為廣泛的神經(jīng)網(wǎng)絡(luò)模型。在解決具有相同精度要求的問(wèn)題時(shí),BP網(wǎng)絡(luò)的結(jié)構(gòu)要比RBF網(wǎng)絡(luò)簡(jiǎn)單,但在逼近能力,收斂速度以及搜索的遍歷性等方面RBF網(wǎng)絡(luò)都優(yōu)于BP網(wǎng)絡(luò)[6]。在機(jī)器人足球視覺(jué)系統(tǒng)場(chǎng)地標(biāo)定中,BP網(wǎng)絡(luò)實(shí)現(xiàn)起來(lái)比RBF網(wǎng)絡(luò)簡(jiǎn)單,但RBF網(wǎng)絡(luò)能夠?qū)崟r(shí)及準(zhǔn)確地得到更精確的機(jī)器人位置。
用線性模型進(jìn)行場(chǎng)地標(biāo)定的方法簡(jiǎn)單快速,可靠性高;但方法假定圖像上的直線經(jīng)過(guò)透視投影仍然為直線,未考慮攝像機(jī)光學(xué)系統(tǒng)中存在的加工誤差和裝配誤差,實(shí)際上引入了誤差,經(jīng)實(shí)驗(yàn),在邊界畸變較大的情況下,校正的效果較差。對(duì)場(chǎng)地分區(qū)或引入畸變參數(shù)可以提高場(chǎng)地標(biāo)定精度。引入畸變參數(shù)時(shí),從不同的模型出發(fā)可得到不同的方法,神經(jīng)網(wǎng)絡(luò)模型因?yàn)槠淇梢员平我夥蔷€性函數(shù)的特點(diǎn),因而作為一種新的模型應(yīng)用在視覺(jué)系統(tǒng)的場(chǎng)地標(biāo)定中。數(shù)學(xué)模型的建立提高場(chǎng)地標(biāo)定的精度,但計(jì)算量大,比較繁瑣;而神經(jīng)網(wǎng)絡(luò)這種新型模型在保證精度的前提下擺脫了繁瑣,但實(shí)時(shí)性有待進(jìn)一步提高。
隨著廣角鏡頭的廣泛使用以及各種技術(shù)不斷地發(fā)展和成熟,視覺(jué)系統(tǒng)中的場(chǎng)地標(biāo)定精度有待進(jìn)一步提高,且具有很大的發(fā)展?jié)摿?。建立合理可靠的模型是提高?chǎng)地標(biāo)定精度的重要途徑。
[1]張廣軍.機(jī)器視覺(jué)[M].北京:科學(xué)出版社,2005
[2]馬頌德,張正友.計(jì)算機(jī)視覺(jué)—計(jì)算理論與算法基礎(chǔ)[M].北京:科學(xué)出版社,2003
[3]王婷婷,王朝輝.機(jī)器人足球視覺(jué)系統(tǒng)圖像畸變的幾何校正[J].貴州工業(yè)大學(xué)學(xué)報(bào),2007,36(1):56-59
[4]鄧梅生.光學(xué)理論與實(shí)踐[M].武漢:武漢大學(xué)出版社,2004
[5]吳佩杰,張奇志.MiroSot機(jī)器人足球視覺(jué)系統(tǒng)圖象畸變的幾何校正[J].北京機(jī)械工業(yè)學(xué)院學(xué)報(bào),2008,24:49-52
[6]MUSAVI M T.On the training of the radial basis function classifiers[J].Neural Networks.1992(5):595-603
[7]宗曉萍,石圣羽,田華.基于BP神經(jīng)網(wǎng)絡(luò)的足球機(jī)器人攝像機(jī)標(biāo)定[J].計(jì)算機(jī)工程與應(yīng)用,2007,44(8):204-206
[8]袁野,田中旭,歐宗瑛.應(yīng)用徑向基函數(shù)網(wǎng)絡(luò)進(jìn)行足球機(jī)器人視覺(jué)系統(tǒng)的標(biāo)定[J].計(jì)算機(jī)工程與應(yīng)用,2003,65:89-91