文/趙興濤 杜治國 洪衛(wèi)軍
隨著我國經濟的高速發(fā)展,社會治安形勢發(fā)生了巨大變化,為了維護社會穩(wěn)定,保障人民安居樂業(yè),公安機關建設了大量的城市監(jiān)控報警聯網系統(tǒng)。這在一定程度上化解了社會治安面臨的嚴峻挑戰(zhàn),有力的彌補了警力資源的不足。據統(tǒng)計,2010年上海市安防監(jiān)控攝像機安裝數量約為20多萬臺。從2001年至2010年,北京市公共場所安裝的攝像機數量超過40萬臺,基本覆蓋了全市重點公共場所、主要交通道路、重點要害單位。截止2011年底,廣東省安裝的視頻監(jiān)控攝像機數量已經突破了110萬臺,其中與公安機關聯網的將近11萬臺。然而,在系統(tǒng)的建設和使用過程中也出現了很多新問題[1-4]。例如,很多視頻監(jiān)控系統(tǒng)的設計目的不明確;系統(tǒng)建設缺乏規(guī)劃,整體布局存在不少問題;各種設備不能達到很好的配合,多數設備(如:前端攝像機、控制云臺)都未達到最優(yōu)配置;安裝位置欠妥、拍攝角度狹小、受到障礙物阻擋;成像不夠清晰、分辨率不足等。這些都嚴重影響到視頻監(jiān)控系統(tǒng)在案件偵查中的有效應用。
隨著視頻圖像信息整合與共享工作的進一步開展,針對系統(tǒng)的效能進行研究也變得日益迫切,如系統(tǒng)的建設能否滿足用戶的業(yè)務需求?能否充分發(fā)揮系統(tǒng)的技術優(yōu)勢?本文從影響攝像機監(jiān)控效能的關鍵指標入手,研究攝像機在理想條件下的成像模型,并借助OpenGL開發(fā)工具,設計、實現了監(jiān)控攝像機三維仿真效能評估平臺。該平臺能夠真實的仿真攝像機的監(jiān)視場景和成像效果,直觀、形象的展現攝像機的防控區(qū)域,為視頻監(jiān)控系統(tǒng)的設計、優(yōu)化、檢驗和評估提供輔助解決工具。
攝像機仿真模型解決的是監(jiān)控場景中攝像機的視域能否恰到好處的覆蓋監(jiān)控區(qū)域(參見圖 1)。也就是說,監(jiān)控攝像機能否首先保證監(jiān)控區(qū)域(如出入口、圍墻、金庫等)位于視野范圍之內,其次能否保證識別出監(jiān)控區(qū)域內的主要對象(如犯罪嫌疑人、可疑車輛、可疑物體等),最后能否保證標識出主要對象的突出特征(如犯罪嫌疑人的身體特征、行為動作特點、穿著打扮、攜帶物品等)。為實這一目標,首先必須理解攝像機的成像過程。其次,還要能真實的模擬這一過程。
圖1:監(jiān)控攝像機的視域及其成像(來源于CCTVCAD)
攝像機的成像受到諸多因素的影響,如三維物體的空間位置、攝像機焦距、鏡頭的厚度和成像靶面尺寸等,其成像模型的復雜程度也各不相同。為了簡化問題的復雜程度,本文以理想情況下的針孔攝像機透視變換模型作為研究的基礎,忽略了透鏡的畸變與厚度。物理上相當于薄透鏡,這種模型可以滿足我們對成像精度的要求。
圖2:攝像機成像幾何關系
圖2揭示了攝像機成像過程中世界坐標系、攝像機坐標系和成像坐標系之間的關系。由于攝像機可安裝在環(huán)境中的任何位置,所以攝像機的中心和主軸等事先都是未知的,攝像機坐標系不能給出空間點的具體坐標值,因而需要一個參考坐標系來描述空間物體和攝像機的位置。這個參考坐標系通常稱為世界坐標系。攝像機坐標系和世界坐標系之間的關系可用旋轉矩陣R和平移向量T來描述。令空間點P在世界坐標系中的齊次坐標為(Xw,Yw,Zw,1)T,在攝像機坐標系中的齊次坐標是(Xc,Yc,Zc,1)T,則存在如下關系:
其中R是3x3正交單位矩陣,T是3維平移向量,0=(0,0,0)T。
攝像機光軸與成像平面的交點稱為圖像主點Oi,由點Oi與x、y軸組成的直角坐標系稱為成像平面坐標系。將攝像機的光心定義為原點Oc,Xc軸和Yc軸分別與成像平面坐標系的x軸和y軸平行,Zc軸為攝像機的光軸,和成像平面垂直。由點Oc與Xc、Yc、Zc軸組成的直角坐標系稱為攝像機坐標系。空間點P(Xc,Yc,Zc,1)T在成像平面上的投影是直線OcP與成像平面的交點p(x,y,1)T。根據三角形相似原理,可推知空間點P與它的像點p滿足下述關系:
在公式 (2)、(3)中,f是攝像機的焦距,表示光心到成像平面的距離。采用齊次坐標表示方法,公式 (2)、(3)可表示為:
但由于攝像機制作的原因,主點Oi一般會偏離圖像的中心。并且在實際應用中,計算機以像素為單位處理數字圖像。因而可定義圖像坐標系u-v,將原點定義為圖像中心或者圖像的左上角。由于圖像坐標系是以像素為單位表示的,而成像平面坐標系是以物理尺度(如厘米)為單位的,因而需要建立圖像坐標系與成像平面坐標系的對應關系。在圖像坐標系下,若主點的坐標為Oi(x0,y0,1)T,并且每個像素在x軸和y軸方向上的物理尺寸為dx,dy,則兩個坐標系的關系為:
結合公式(4)、(5),可得:
綜合公式(1)、(6),可得:
通常稱f/dx,f/dy稱為攝像機在u軸和v軸方向上的尺度因子。矩陣M1只與攝像機內部參數有關,故稱為攝像機內參數矩陣。M2由攝像機相對于世界坐標系的方位決定,稱為攝像機的外參數矩陣。
為了將三維場景生成二維計算機屏幕圖像,OpenGL主要對三維場景進行視點變換、投影變換和仿射變換,變換過程如圖3所示。
圖3:OpenGL成像過程
視點變換的目的是設置攝像機的位置和方向,即將世界坐標系轉換為觀察者坐標系。另外,也可以不改變攝像機的參數,而采用模型變換來實現,即改變三維場景中物體的位置和方向。實際上,OpenGL聯合使用視點變換和模型變換,即通過模型視點矩陣(M)生成觀察者坐標。例如,空間某點在世界坐標系中的坐標為Qw(X,Y,Z,W)T,通過矩陣的平移glTranslate*()、旋轉glRotate*()變換,得到該點在攝像機坐標系中的坐標Qc(Xc,Yc,Zc,Wc)T。此外,也可以通過OpenGL中的gluLookAt()例程設置攝像機的位置和方向。
投影變換相當于選定攝像機的鏡頭,即指定了視椎體(視域)的形狀和方向(參見圖4)。投影變換決定裁減掉場景中的哪些物體或部位。另外,投影變換也決定了如何將物體投影到屏幕上,這里主要采用OpenGL提供的透視投影glFrustum()。再經過投影矩陣P(參見公式(8))的透視投影變換執(zhí)行裁剪操作,得到像平面上的二維投影點坐標Qp(Xp,Yp,Wp)T,之后經過透視投影除法生成歸一化的設備坐標Qd(Xd,Yd,1)T。
圖4:OpenGL中定義的視錐體
仿射變換是將投影變換之后的二維圖像顯示到屏幕上的指定矩形區(qū)域。相當于對最終的照片進行平移、放大或縮小。OpenGL采用glViewport()得到該點在屏幕上的對應像素坐標Qi(x,y)T。
文獻編程設定攝像機的內外參數,并采用OpenGL渲染成不同位置的Checker Board圖像。之后,利用第三方標定程序包對渲染后的圖像進行標定。該研究結果表明,標定值與預先設定的攝像機參數一致,證明了通過設定OpenGL參數可使渲染圖像與真實攝像機拍攝結果一致。文獻提出了利用OpenGL平臺生成空間目標圖像的方法與流程,并論證了通過合理設置OpenGL的有關參數,能夠仿真出成像系統(tǒng)所觀察到的待測目標圖像。這些研究證明了,通過合理設置OpenGL的參數,可以真實模擬攝像機的成像空間和成像畫面,能夠滿足效能評估的要求。
監(jiān)控攝像機效能仿真平臺的開發(fā)框架采用Multi-Gen Paradigm公司的Creator、Vega Prime和開放圖形庫OpenGL。環(huán)境仿真采用Creator建模。攝像機仿真模型采用OpenGL的透視投影模型。透視投影是最常用的一種投影類型,使用這種投影,會使近處的對象看起來比遠處的大一些。
衡量攝像機性能的指標很多,如清晰度、最低照度、信噪比和白平衡等。但是用戶真正關心的是攝像機的成像質量,實際上就是攝像機的視域和分辨率。
視域或者視角(Field of View,FOV)是指攝像機固定位置時可以成像的區(qū)域。視域由鏡頭的焦距和其圖像傳感器的靶面尺寸決定。焦距是指鏡頭中心,或是一個復雜的鏡頭組件中特定的點,到光聚集焦點(通常是攝像機的圖像傳感器)間的距離。焦距遠小于圖像傳感器的靶面直徑,則視角大;反之,視角小。攝像機的視角定義為2,,其中d是圖像傳感器的直徑,f是鏡頭的焦距。
分辨率指的是當攝像機攝取等間隔排列的黑白相間條紋時,在監(jiān)視器(應比攝像機的分辨率高)上能夠看到的最多線數。當超過這一線數時,屏幕上就只能看到灰蒙蒙的一片而不能再辨出黑白相間的線條。工業(yè)監(jiān)視用攝像機的分辨率通常在380~460線之間,廣播級攝像機的分辨率則可達到700線左右。分辨率是由攝像器件像素多少決定的,即水平像素數×垂直像素數。如:VGA:640×480;SVGA:800×600;XGA:1024×768。
在三維空間中,攝像機的視場區(qū)域是場景中的一個三維椎體。其頂點為攝像機鏡頭,頂點到錐體底面兩條水平邊和兩條垂直邊所稱的視角分別為垂直視場角和水平視場角,椎體底面邊的尺寸是攝像機圖像傳感器尺寸的等比放大,比例為視場底面與攝像機鏡頭的距離與攝像機鏡頭焦距之比;該椎體再經過前、后兩個剪切面的分割,位于這兩個面之間的部分就是視錐。
首先,根據視頻監(jiān)控系統(tǒng)場景圖建立視景仿真環(huán)境,實現不同角度、不同方式、不同速度的漫游,觀察防區(qū)及周邊環(huán)境。其次,按照視頻監(jiān)控系統(tǒng)攝像機點位圖,設計人員從視頻監(jiān)控系統(tǒng)設備數據庫中選擇符合要求的攝像機及鏡頭,在防區(qū)的三維環(huán)境中實時交互地部署攝像機。設計人員可合理地調整攝像機的安裝角度,對準目標或要觀察的區(qū)域,將安裝位置和角度等數據記錄到攝像機安裝數據庫中。攝像機的視場區(qū)域仿真如圖5所示。系統(tǒng)能根據攝像機的像素比,對三維環(huán)境中部署的攝像機所觀察的場景成像進行仿真,如圖6所示。用戶通過觀察每個虛擬攝像機防控的區(qū)域及其采集的圖像,判斷是否滿足監(jiān)控目標要求。用戶可反復配置不同的攝像機和鏡頭,調整安裝位置和方向,直到得到清晰的目標圖像為止。
圖5:監(jiān)控攝像機視域仿真
圖 6:監(jiān)控攝像機成像仿真
隨著城市監(jiān)控報警聯網系統(tǒng)建設的深入開展,視頻監(jiān)控系統(tǒng)在公安偵查工作中所起的作用越來越重要。但是,由于視頻監(jiān)控系統(tǒng)在設計、安裝和使用過程中存在的問題,導致最終的視頻影像不清晰,難以達到偵查辦案的要求。本文首先分析探討了攝像機仿真成像模型,包括針孔攝像機的成像原理和方法,以及OpenGL的成像模型,并論證了OpenGL模型與針孔成像模型的一致性;其次分析研究了影響攝像機成像質量的關鍵指標:視域和分辨率;最后利用視景仿真平臺Vega Prime和開放圖形庫OpenGL,設計實現了一套完整的攝像機效能三維仿真系統(tǒng)。該系統(tǒng)可以根據視頻監(jiān)控系統(tǒng)的設計圖紙,利用Creator建立三維仿真場景,并可根據監(jiān)控點位需求在仿真場景中添加攝像機,根據設計要求或者實際參數配置調整攝像機模型,建立各個攝像機模型的視場區(qū)域和虛擬成像。通過對攝像機效能進行仿真評估,可以發(fā)現視頻監(jiān)控系統(tǒng)是否存在盲區(qū),成像質量是否達到設計要求,提前發(fā)現系統(tǒng)漏洞,為偵查辦案奠定基礎。當然,本文采用了針孔攝像機模型對視頻監(jiān)控系統(tǒng)進行效能仿真研究,沒有考慮攝像機鏡頭的實際物理特性,在未來的研究中將進一步加強。