陳仁愛,凌 強,徐 駿,李 峰
(中國科學技術(shù)大學 信息科學技術(shù)學院,安徽 合肥 230026)
?
基于DSP的實時圓檢測算法的設(shè)計實現(xiàn)與優(yōu)化
陳仁愛,凌強,徐駿,李峰
(中國科學技術(shù)大學 信息科學技術(shù)學院,安徽 合肥 230026)
霍夫圓變換是圖像處理中人眼檢測的一種常見方法,但是其處理的數(shù)據(jù)量多,處理速度慢,在移植到DSP上后難以滿足實時性要求。對此,提出了一種將兩階段霍夫圓變換算法應(yīng)用到 TMS320C6000系列 DSP上的實現(xiàn)與優(yōu)化方法。首先,在算法上對霍夫圓變換使用Marr-Hildreth算子增強等方法進行改進以保證檢測的準確率;之后根據(jù) DSP的特點,利用C代碼優(yōu)化、浮點定點轉(zhuǎn)換和軟件流水等技術(shù)對算法進行深度優(yōu)化。實驗結(jié)果表明,程序的運行時間明顯縮短,為視線檢測的實時性實現(xiàn)創(chuàng)造了良好的條件。
C6000 DSP;霍夫變換;程序優(yōu)化
引用格式:陳仁愛,凌強,徐駿,等. 基于DSP的實時圓檢測算法的設(shè)計實現(xiàn)與優(yōu)化[J].微型機與應(yīng)用,2016,35(11):93-96,100.
在視頻圖像中快速地檢測出圓形是目標跟蹤、目標分類和行為理解等更高層次視頻圖像分析的重要基礎(chǔ),比如人眼檢測、視線跟蹤和交通視頻分析等。霍夫圓變換是圖像處理中識別和定位圓形的常用方法,其準確率高且與圖中形狀的方向無關(guān)[1-2],被廣泛用于運動目標軌跡的檢測與識別。在視線檢測領(lǐng)域,也有眾多關(guān)于它的研究。MATHEWS R 提出了一種利用霍夫圓變換來設(shè)計鼠標的方法[3],ZIA M A等人嘗試利用眼球追蹤來為殘疾人設(shè)計輪椅[4]。
標準霍夫變換雖然具有顯著的優(yōu)勢,但其不足也不容忽視[5-6]。它需消耗大量的時空資源,對于在嵌入式平臺上進行視線檢測這樣的應(yīng)用背景無法做到實時控制。目前有很多研究都僅針對算法上的改進,而沒有結(jié)合具體的實現(xiàn)平臺的特點來進行優(yōu)化,不能充分利用硬件的性能優(yōu)勢。本文擬在德州儀器的TMS320C6000系列DSP上使用兩階段霍夫變換算法來實現(xiàn)圓形檢測,并開展基于DSP平臺的程序優(yōu)化研究。
[2]提出將霍夫變換一般化的方法,對于任何曲線,只要給出了它的函數(shù)方程,就可以利用霍夫變換的方法,將圖像空間變換到霍夫參數(shù)空間,利用投票的方法求得曲線參數(shù)。對于檢測圓的情形,由于圓的方程有3個未知量,變換到霍夫空間中需要一個三維的累加器,對于高清圖片來說將耗費大量的內(nèi)存,而且搜索極值時時間代價很大。這二者對于DSP平臺都是致命的,故在移植到DSP時本文采用了兩階段霍夫圓變換算法,并對其進行性能上的改進。本節(jié)闡述了基于兩階段霍夫圓變換算法的圓檢測方案設(shè)計。
1.1兩階段霍夫圓變換算法
兩階段霍夫圓變換是一種針對標準霍夫圓變換的參數(shù)空間分解的方法,主要目的是為了減少原算法的空間復(fù)雜度,其輸入是邊緣圖像[5]。
考慮如下圓的參數(shù)方程:
(1)
其中(x0,y0,r)是一組圓心和坐標參數(shù)。兩階段霍夫圓變換的第一步是對圓心參數(shù)空間累加。根據(jù)圓的一階導數(shù)和二階導數(shù)的特性,過圓周上任意一點的圓切線的垂線經(jīng)過圓心,如圖1所示。對已知邊緣上的任意點做垂線,這些垂線將會在(a, b)空間匯集,形成一個熱點,在(a, b)空間搜索極值即得圓心坐標。給定r的范圍,在邊緣點上做垂線段,得(a, b)空間。即:
(2)
A(i±a,j±b)←A(i±a,j±b)+E(i,j)
(3)
圖1 圓的方向?qū)?shù)示意
其中,(minr,maxr)是給定的半徑的范圍,也是做出的垂線段的長度,A是(a,b)空間的累加器,E(i,j)是待檢測圖像的邊緣圖。在(a,b)空間搜索極值即得圓心坐標。
求得圓心坐標之后,在此基礎(chǔ)上可以進行半徑參數(shù)空間的累加。對每一個檢測的圓,R空間累加方式為:
(4)
其中,E是邊緣圖,r是給定的半徑范圍。在R空間搜索極值即可求得半徑。
圖2 圓檢測整體流程設(shè)計
1.2圓形檢測整體方案設(shè)計
1.1節(jié)描述了一種節(jié)省空間開銷的霍夫變換方法,基于此,本節(jié)設(shè)計了一套圓檢測方案,增加了預(yù)處理和利用Marr-Hildreth算子進行圖像增強等步驟,具體如圖2所示。
由于形狀只與灰度值有關(guān),故首先獲取灰度圖。之后,對于含噪聲的圖像,對其進行平滑處理,減少邊緣檢測的工作量和出錯率。平滑操作使用高斯平均算子,模板大小為5,方差為1,實現(xiàn)時采用空域卷積的方式。為了保存更多的邊緣信息,本文使用一階及二階邊緣檢測的方式來求取邊緣圖而不是直接對灰度圖進行二值化。一階邊緣提取使用Sobel算子,包括水平Sobel算子和垂直Sobel算子,最后取二者的幾何平均作為最終的Sobel圖像。在使用圓的方向?qū)?shù)縮減參數(shù)空間時需要使用邊緣圖像的方向信息,本文使用Sobel處理后的圖像來直接求得。
對于每個被檢測到的邊緣點(i,j),計算其方向角度θ(i,j):
(5)
對于邊緣更復(fù)雜的圖像,當一階邊緣檢測過粗或者錯誤時,使用二階邊緣檢測能獲得更好的檢測效果。Marr-Hildreth算子是利用高斯濾波的一種二階濾波方式,它先對圖像進行高斯平滑,之后應(yīng)用拉普拉斯運算,即:
(6)
其中P是待處理的圖像,g(x,y)是高斯平滑濾波器。此外,Marr-Hildreth算子還被用于圖像增強。
在獲得邊緣圖像和邊緣方向信息之后使用1.1節(jié)中的方法就能求得圓心和半徑。
1.3圓形檢測中的實現(xiàn)細節(jié)
由于邊緣檢測的不精確性和待檢測圓的不確定性,兩階段霍夫圓變換方法在實現(xiàn)的過程中存在一些問題,本節(jié)將討論這些問題的解決方式。
(7)
實驗中發(fā)現(xiàn)大的圓由于邊緣方向估計誤差更大,在圓心區(qū)域的偏差會更大,這會使它的聚集程度下降,從而與由半徑大帶來的優(yōu)勢相抵消,此時k可設(shè)為1。
對于同心圓,在R空間累加后選擇合適的閾值以保留多個峰值,能獲得不同的半徑值。
圖3是一組檢測結(jié)果示意圖。其中圖(c) 是將θ映射到(0,255) 得來。在采取合適的參數(shù)后能獲得較好的檢測結(jié)果。
圖3 檢測結(jié)果圖示
2.1移植到DSP
本文使用的硬件平臺是TI的TMS320C64x+TM定點型DSP核,使用的開發(fā)環(huán)境為CCSv4。使用C64x+ simulator進行軟件仿真,通過CCS的時鐘工具測得試運行時鐘周期,通過profile工具分析工程耗時分布[7]。
2.2具體的優(yōu)化步驟
本文的優(yōu)化基于所用DSP的結(jié)構(gòu)特性,盡量充分利用DSP的計算資源來縮短檢測時間[8-9]。本節(jié)將介紹本文使用的優(yōu)化方法。
2.2.1基于編譯器的優(yōu)化方法
CCS的編譯器中設(shè)置了眾多參數(shù),選擇合適的參數(shù)能減少檢測耗時。
選擇優(yōu)化級別。由于本文不考慮代碼體積,故使用-o3文件級優(yōu)化。
使用-mt。假設(shè)不存在多個指針對同一個內(nèi)存(塊)進行讀寫操作。
使用 -mh
不使用 -g、-ss等參數(shù)。這些參數(shù)對調(diào)試很有效,但是會造成性能下降,在最終發(fā)布產(chǎn)品時不應(yīng)使用。
CCS編譯器選項中有部分能減少手工整定時間但是對代碼性能沒有影響的參數(shù),使用這些參數(shù)有助于程序優(yōu)化。使用-s[-k|-al]-o[2|3]能生成優(yōu)化后的類似于C的代碼,且優(yōu)化器描述被嵌套在匯編代碼中,使用-mw或者-mw-al輸出額外的關(guān)于軟件流水的信息,包括單次循環(huán)的調(diào)度方式;使用-on2-o3生成*.nfo文件,以給出高級別的優(yōu)化總結(jié)和可用的優(yōu)化建議。
2.2.2手工整定方法
僅使用基于編譯器的優(yōu)化所減少的程序耗時是有限的,本文對算法的實時性要求較高,需要在2.2.1節(jié)的基礎(chǔ)上進行手工整定。手工整定的方式很多,本文使用的幾種方法有基于編譯器和優(yōu)化器描述、浮點定點轉(zhuǎn)換、不用除法等。
根據(jù)優(yōu)化器描述給所有安全的指針添加restrict關(guān)鍵字,消除循環(huán)間的依賴,使生成的匯編文件中循環(huán)依賴項值為零;根據(jù)匯編嵌入信息添加pragma 指令MUST_ITERATE和UNROLL,告訴編譯器循環(huán)的最大值、最小值、公約數(shù)和展開次數(shù),并根據(jù)軟件流水信息中各資源的使用情況在循環(huán)前使用 _nassert() 告訴編譯器數(shù)據(jù)是64位對齊的,一次讀取多個對齊數(shù)據(jù)以減少D單元和T通道的使用數(shù),以能較好地平衡資源。這些措施極大地提高了軟件流水的效率。
由于算法涉及眾多的浮點運算,在定點型甚至浮點型DSP中效率都很低,故在精度允許的情況下,使用定點運算代替浮點型運算。浮點轉(zhuǎn)換為定點除了手動使用Qn定標外,對于C64x+ DSP還可以使用TI的C64x+ IQmath庫。IQmath集合了很多高精度且高度優(yōu)化的數(shù)學函數(shù),適合于將浮點的算法轉(zhuǎn)換成定點[10]。除了提供_iq數(shù)據(jù)類型及各類型互相轉(zhuǎn)換之外,IQmath還提供了各種高度優(yōu)化的數(shù)學函數(shù)比如_IQcos(余弦函數(shù)),并且支持可調(diào)節(jié)精度,在不同地方可以選擇不同的定標Q值,即GLOBAL_Q可以在需要的地方指定0~31中的任意值。比如融合兩個Sobel算子時求兩個數(shù)的幾何平均:
(*imageTot)[i][j]= pow( (*imageH)[i][j]*(*imageH)[i][j] +(*imageV)[i][j]*(*imageV)[i][j], 0.5f);
可以修改為:
tmp=_IQpow(*imageH[i][j],2) +_IQpow(*imageV[i][j],2);
//sqrt(H^2+V^2)
*imageTot[i][j] = _IQsqrt(tmp);
//pow(tmp,0.5f)
先將數(shù)據(jù)轉(zhuǎn)換成_iq類型,然后使用IQmath中的_IQpow和_IQsqrt來求冪和根號,之后再轉(zhuǎn)換回需要的float型。
對于除法運算,DSP是利用函數(shù)調(diào)用來完成,耗費的時鐘周期比乘法高出2個數(shù)量級以上。為了消除除法,可以使用移位或者查找表(look-up table)來代替。比如:
(int)(_abs(im[i][j] + shift) /maxval*255);
其中maxval值在0~255之間,可以提前將255/maxval計算出來,計算時查表代替;或者使用?8替代*255。另外,使用 _IQdiv( _iq A, _iq B) 函數(shù)可完成_iq類型的除法。
對于DSP的優(yōu)化方法還有很多,如使用內(nèi)聯(lián)函數(shù)和線性匯編等,在進一步優(yōu)化過程中可使用。
2.3優(yōu)化結(jié)果與分析
在綜合了各種優(yōu)化方式之后,重新使用profile測試各部分的時鐘周期,保持其他條件不變。程序優(yōu)化前后所用的時間見表1??梢娊?jīng)過優(yōu)化,耗時明顯減少。
表1 優(yōu)化前后部分函數(shù)耗時對比(時鐘周期數(shù))
本文先在PC上實現(xiàn)了基于霍夫變換的圓形檢測算法,然后將它移植到了DSP上并進行了基于時間的優(yōu)化分析,使得實時性有很大的提高。
若要將此算法應(yīng)用到人眼檢測,可以在前述的基礎(chǔ)上繼續(xù)改進,比如縮減霍夫變換中r的范圍,在R空間尋找峰值時指定目標是2個等。本文所完成的只是視線跟蹤中人眼檢測的一部分,離實際應(yīng)用還很遠。本文設(shè)計還有很多不足,希望在未來的工作中繼續(xù)改進。
參考文獻
[1] BALLARD D H. Generalizing the Hough transform to detect arbitraryshapes[J]. Pattern Recognition, 1981, 13(2): 111-122.
[2] YUEN H K, PRINCEN J, ILLINGWORTH J. Comparative study of Hough transform methods for circle finding[J]. Image and Vision Computing, 1990, 8(1): 71-77.
[3] MATHEWS R, CHANDRA N. Computer mouse using eyetracking system based on houghman circle detection algorithm with grid analysis[J]. International Journal of Computer Applications, 2012, 40(13): 12-16.
[4] ZIA M A, ANSARI U, JAMIL M, et al.Face and eye detection in images using skin color segmentation and circular Hough transform[C].Robotics and Emerging Allied Technologies in Engineering (iCREATE), 2014 International Conference on. IEEE, 2014: 211-213.
[5] NIXON M S,AGUADO A S. 特征提取與圖像處理 (第二版)[M].李實英,楊高波,譯.北京:電子工業(yè)出版社, 2010.
[6] ILLINGWORTH J, KITTLER J. A survey of the Hough transform[J]. Graphical Models Graphical Models and Image Processing Computer Vision, Graphics, and Image Processing, 1988, 44(1): 87-116.
[7] 美國德州儀器公司. TMS320C6000系列DSP編程工具與指南[M].田黎育、何佩琨, 朱夢宇,譯. 北京:清華大學出版社, 2006.
[8] TEXAS INSTRUMENTS. Introduction to TMS320C6000 DSP Optimization[EB/OL]. (2011-11-xx)[2016-01-10].http://www.ti.com/lit/an/sprabf2/sprabf2.pdf.
[9] GRANSTON E. Hand-tuning loops and control code on the TMS320C6000[EB/OL]. (2006-08-xx)[2016-01-10].http://www.ti.com/lit/an/spra666/spra666.pdf.
[10] Texas Instruments. TMS320C64x+ IQmath library user’s guide[EB/OL]. (2008-12-xx)[2016-01-10].http://www.ti.com.cn/cn/lit/ug/sprugg9/sprugg9.pdf.
Implementation and optimization of DSPs based real-time circle detection
Chen Renai,Ling Qiang,Xu Jun,Li Feng
(School of Information Science and Technology, University of Science and Technology of China, Hefei 230026, China)
Circular Hough transform is a common method for eye detection in image processing. However, it requires large amount of data processing, leading a long processing period, so that it cannot satisfy the real-time requirements when transplanted to DSPs. In this regard, this paper puts forward a method for circle detection using two-stage circular Hough transform which can be applied to TMS320C6000 DSPs as well as some optimization approaches. Firstly, it uses Marr-Hildreth operator to improve circular detection algorithm to ensure accuracy. Then C code optimization, floating-point to fixed-point conversion and software pipeline technology are utilized to optimize the algorithm in depth according to the characteristics of DSPs. Experimental results show that the execution time of the program is significantly reduced, which creates a good condition for the realization of real-time eye sight detection.
C6000 DSP; Hough transform; code optimization
TP368
A
10.19358/j.issn.1674- 7720.2016.11.028
2016-01-14)
陳仁愛(1992-),男,碩士研究生,主要研究方向:嵌入式系統(tǒng)、圖像處理。
凌強(1975-),通信作者,男,博士,副教授,博士生導師,主要研究方向:網(wǎng)絡(luò)化控制、嵌入式系統(tǒng)。E-mail:qling@ustc.edu.cn。
徐駿(1977-),男,講師,主要研究方向:嵌入式系統(tǒng)。