張 劍 宋婉娟
(1.武漢體育學(xué)院體育工程與信息技術(shù)學(xué)院,湖北 武漢430079;2.湖北第二師范學(xué)院計(jì)算機(jī)學(xué)院,湖北 武漢430079)
隨著計(jì)算機(jī)處理能力的提高和傳感器技術(shù)的發(fā)展,近年來基于視頻圖像處理的計(jì)算機(jī)視覺技術(shù)已成為圖像處理領(lǐng)域的研究熱點(diǎn),該技術(shù)在眾多的領(lǐng)域中都有十分廣泛的應(yīng)用[1]。
視覺是人類認(rèn)識(shí)世界、觀察世界的重要手段。人類從外界獲取的信息量約有75%來自視覺系統(tǒng),這表明視覺信息量十分巨大以及人類對(duì)視覺信息有較高的利用率。人類利用視覺的過程可看作是一個(gè)從感覺到知覺的復(fù)雜過程,即從感受到的對(duì)三維世界的投影圖像到依據(jù)投影圖像去認(rèn)知三維世界的內(nèi)容和含義[2]。
計(jì)算機(jī)視覺技術(shù)是指利用計(jì)算機(jī)實(shí)現(xiàn)人的視覺功能,既對(duì)客觀世界的三維場景的識(shí)別、感知和理解。該技術(shù)包括是仿生學(xué)方法及工程方法,仿生學(xué)方法是模仿人類視覺功能的結(jié)構(gòu)及原理,建立相應(yīng)的處理系統(tǒng),完成類似的工作和功能;工程方法是從分析人類視覺系統(tǒng)著手,并采用任何現(xiàn)有的可行手段實(shí)現(xiàn)人類視覺系統(tǒng)的功能[3],該方法的特點(diǎn)是只關(guān)心系統(tǒng)的輸入和輸出。計(jì)算機(jī)視覺的主要研究目標(biāo)是建成計(jì)算機(jī)視覺系統(tǒng),完成各種視覺功能。也就是說,即要能借助各種視覺傳感器(如CMOS攝像器件、CCD等)獲取現(xiàn)實(shí)世界的圖像,而感知和恢復(fù)3D環(huán)境中物體的幾何性質(zhì)、運(yùn)動(dòng)情況、姿態(tài)結(jié)構(gòu)、相互位置等,并且要對(duì)客觀場景進(jìn)行識(shí)別、解釋、描述、進(jìn)而做出決斷。目前,計(jì)算機(jī)視覺技術(shù)在體育運(yùn)動(dòng)中也得到了廣泛的應(yīng)用,利用該技術(shù)不僅可以從不同的視角觀察運(yùn)動(dòng)員的動(dòng)作,而且能將運(yùn)動(dòng)員速度、加速度、所在位置等數(shù)據(jù)進(jìn)行量化處理,使體育訓(xùn)練及比賽擺脫依靠傳統(tǒng)經(jīng)驗(yàn)分析及判別的狀態(tài),從而進(jìn)入科學(xué)化、數(shù)字化的狀態(tài),而且還可以完成競技體育項(xiàng)目的成績測試[4-5]。
在測試項(xiàng)目中鉛球成績的測量仍采用皮尺丈量法。這種方法存在著三個(gè)方面的缺陷,一是皮尺本身具有彈性以及易折疊特性,二是受場地的凹凸不平,三是人為因素影響較大。由于這三方面的作用,故在鉛球成績的測量精確度受到極大的限制。針對(duì)這一問題本課題提出了一種基于同視場(鉛球場地)測量地平面坐標(biāo)的單攝像機(jī)模型[6-7]。該模型利用透視投影幾何關(guān)系,對(duì)攝像機(jī)內(nèi)部參數(shù)進(jìn)行標(biāo)定,然后,建立相應(yīng)的網(wǎng)格匹配數(shù)學(xué)模型,通過單目CCD攝像機(jī)像面坐標(biāo),測量鉛球落點(diǎn)的地平面坐標(biāo)[8]。成功的解決了鉛球著點(diǎn)測量在雙目視覺交匯組合測量存在的死角影響系統(tǒng)的測量范圍的問題,另外,單目視覺測量系統(tǒng)也避免了雙目視覺系統(tǒng)存在對(duì)應(yīng)特征點(diǎn)匹配問題。
圖1 鉛球的2D場景坐標(biāo)系
鉛球場地是一個(gè)扇形區(qū)域(如圖1)。假設(shè)建立一個(gè)如圖1的2D場景坐標(biāo)系,首先要做的事是要確定場地上指定點(diǎn)的真實(shí)坐標(biāo)與采集到的圖片的指定點(diǎn)象素坐標(biāo)之間的對(duì)應(yīng)關(guān)系,即要找到這兩種坐標(biāo)系之間的轉(zhuǎn)換關(guān)系。而這種轉(zhuǎn)換關(guān)系可以用平面測量的相關(guān)技術(shù)獲得。在計(jì)算機(jī)視覺中,所謂的平面測量,就是從圖像中獲得2D場景信息。在實(shí)際的測量中,我們可以通過在圖像上標(biāo)定一定數(shù)量的坐標(biāo)點(diǎn)來確定圖像中場地指定點(diǎn)的象素坐標(biāo)和真實(shí)世界中的指定點(diǎn)的現(xiàn)實(shí)坐標(biāo)之間的單應(yīng)矩陣。
我們獲取一幅2D場景S的圖像I,通過S與I之間的N(N>=4)對(duì)對(duì)應(yīng)點(diǎn),就可以確定它們之間的單應(yīng)矩陣H。
令:
在H的九個(gè)元素中,有八個(gè)獨(dú)立比率,即一個(gè)單應(yīng)有八個(gè)自由度變量,一個(gè)常數(shù)1。因此,在H中,往往設(shè)置h33=1。
其中,h是矩陣H的向量形式,
于是我們可以得到2N個(gè)方程,寫成矩陣形式為:
其中
因此,要求得8個(gè)參數(shù)的單應(yīng)矩陣,至少需要4個(gè)對(duì)應(yīng)點(diǎn)。在實(shí)際的測量中,為了提高精度,每個(gè)模板平面上提供的對(duì)應(yīng)點(diǎn)數(shù)目都會(huì)超過4個(gè)。
當(dāng)N>4時(shí),我們可以用奇異值分解法(SVD)[14]求最小二乘解h。求得單應(yīng)矩陣后,利用公式(2),就可以計(jì)算出圖像上指定點(diǎn)對(duì)應(yīng)的真實(shí)坐標(biāo)值,從而計(jì)算出鉛球投擲的距離。
表1
經(jīng)實(shí)際測量的6個(gè)標(biāo)定點(diǎn)(如圖1)的坐標(biāo)分別為A(700,0)、B(900,0)、C(1100,0)、D(570,407)、E(733,523)、F(895,639)。為了測試本文提出的測量模型,在反復(fù)測量鉛球投擲實(shí)驗(yàn)中選取了典型的10個(gè)測試樣本,其中鉛球落點(diǎn)10個(gè)。
從表1中我們可以看到人工測量值和系統(tǒng)測量值有一定的誤差,分析誤差產(chǎn)生的原因有如下幾種:
1)數(shù)字CCD鏡頭的光學(xué)性能引起的誤差,如焦距、畸變和光學(xué)中心誤差等通過攝像機(jī)內(nèi)部參數(shù)校正來解決。
2)攝像機(jī)的支架及底座一定要有足夠的穩(wěn)定性和剛度,在視頻圖像獲取過程中應(yīng)保證攝像機(jī)的相對(duì)位置穩(wěn)定不動(dòng),由意外情況所造成的誤差在計(jì)算中應(yīng)予以剔除。
3)環(huán)境的變化將對(duì)測量結(jié)果產(chǎn)生影響,因此測量中要及時(shí)修正背景圖像。
4)人工測量本身就會(huì)與真實(shí)值產(chǎn)生一定的誤差。
本論文首先介紹了課題背景,對(duì)單目視覺測量的研究現(xiàn)狀和測量建模在國內(nèi)外的研究現(xiàn)狀進(jìn)行了分析和歸納,同時(shí)分析了視頻圖像處理技術(shù)在體育項(xiàng)目應(yīng)用現(xiàn)狀,將基于單目視頻圖像處理技術(shù)的鉛球成績測量作為切入點(diǎn),對(duì)數(shù)字圖像處理技術(shù)在田徑運(yùn)動(dòng)中應(yīng)用的關(guān)鍵技術(shù)進(jìn)行了研究。結(jié)合鉛球場地的特點(diǎn),提出一種基于視頻圖像的鉛球測量方法,并通過實(shí)際應(yīng)用證明了該方法的可行性。
[1]Criminisi A,Reid I,Zisserman A.A plane measuring device[J].Image and VisionComputing,1999,17(8),625-634.
[2]Lorenzo Bruzzone,Diego Fernàndez Prieto.Automatic Analysis of the Difference Image for Unsupervised Change Detection[J].IEEE Transactions on Geoscience and Remote Sensing,2000,5,38(3).
[3]L Sajó,Z Ruttkay,A Fazekas.Turk-2,a multi-modal chess player[J].International Journal of Human-Computer Studies,2011,7,69(7-8):483-495.
[4]Lichtenberg,D.B.,Wills,J.G.,Maximizing the range of the shot-put[J].American Journal of Physics,1978,46:546-549.
[5]Maheras,A.V..The relationship between the angle of release and the velocity of release in the shot-put,and the application of a theoretical model to estimate the optimum angle of release(throwing)[D].University of Kansas.,1995.
[6]Antonio Plaza,Jon Atli Benediktsson,Joseph W.Boardman.Recent advances in techniques for hyperspectral image processing[J].Remote Sensing of Environment,2009,9,113(1):S110-S112.
[7]Cynthia Matuszek,Brian Mayton,Roberto Aimi.Gambit:An Autonomous Chess-Playing Robotic System[C]//International Conference on Robotics and Automation(ICRA).2011.
[8]Liu J.,Tong X.,Li W.,Wang T.,Zhang Y.,Wang H.,Yang B.,Sun L.,Yang S..Automatic player detection,labeling and tracking in broadcast soccer video[J].Pattern Recognition Letters,2009,30(2):103-113.