宋建中
(中國(guó)科學(xué)院長(zhǎng)春光學(xué)精密機(jī)械與物理研究所,吉林長(zhǎng)春130033)
圖像處理已經(jīng)成為一門引人注目,前景廣闊的新型學(xué)科,并正在向更高、更深層次發(fā)展。國(guó)內(nèi)外大量文獻(xiàn)報(bào)道證明了人們已經(jīng)開(kāi)始研究如何用計(jì)算機(jī)解釋圖像,實(shí)現(xiàn)用計(jì)算機(jī)視覺(jué)系統(tǒng)理解外部世界。許多國(guó)家都正在大力探索和研究圖像理解和機(jī)器視覺(jué),并取得了不少重要成果。
本文參考了國(guó)內(nèi)外報(bào)道的技術(shù)文獻(xiàn)和作者長(zhǎng)期從事圖像處理研究的經(jīng)驗(yàn)與體會(huì),對(duì)圖像處理的發(fā)展趨勢(shì)進(jìn)行了分析,認(rèn)為智能化是其發(fā)展的必然趨勢(shì);并以目標(biāo)自動(dòng)捕獲為例,具體分析了圖像處理智能化研究應(yīng)該包括的理論、算法和硬件系統(tǒng)。
隨著高技術(shù)武器系統(tǒng)的發(fā)展,自動(dòng)目標(biāo)捕獲技術(shù)的需求日益迫切,尤其是光學(xué)成像儀器、機(jī)器人視覺(jué)、多媒體視頻檢索等項(xiàng)技術(shù)的發(fā)展使圖像處理智能化已經(jīng)成為諸多領(lǐng)域的關(guān)鍵技術(shù)。與此同時(shí),計(jì)算機(jī)科學(xué)和電子技術(shù)的飛速發(fā)展,也從硬件和軟件上為圖像處理的智能化奠定了堅(jiān)實(shí)的基礎(chǔ)。所以,智能化已成為圖像處理的發(fā)展趨勢(shì)。
上個(gè)世紀(jì)60年代末期,為了實(shí)現(xiàn)靶場(chǎng)電影經(jīng)緯儀的自動(dòng)跟蹤,中科院長(zhǎng)春光機(jī)所開(kāi)始了電視跟蹤技術(shù)的研究,用電視攝像機(jī)攝取遠(yuǎn)距離的目標(biāo),對(duì)攝取的視頻圖像進(jìn)行實(shí)時(shí)測(cè)量,并將測(cè)量結(jié)果反饋給伺服系統(tǒng),使經(jīng)緯儀實(shí)現(xiàn)自動(dòng)跟蹤目標(biāo)。幾十年過(guò)去了,科學(xué)技術(shù)和市場(chǎng)需求都發(fā)生了突飛猛進(jìn)的變化。電視跟蹤技術(shù)已經(jīng)普及,圖像處理技術(shù)也有了很大進(jìn)步。但是,迄今為止,自動(dòng)目標(biāo)捕獲問(wèn)題仍然沒(méi)有得到很好的解決,在目標(biāo)的捕獲階段,識(shí)別和瞄準(zhǔn)目標(biāo)還是依賴人的參與。不斷出現(xiàn)的圖像制導(dǎo)武器系統(tǒng)的打擊速度和精度一再提高,用戶迫切要求對(duì)小、暗、多、快目標(biāo)實(shí)現(xiàn)自動(dòng)捕獲并對(duì)復(fù)雜背景下的目標(biāo)實(shí)現(xiàn)平穩(wěn)跟蹤。近10年來(lái),面對(duì)現(xiàn)代戰(zhàn)爭(zhēng),美國(guó)空軍也遇到了許多棘手的問(wèn)題,如對(duì)城市、平民區(qū)空中打擊時(shí),如何進(jìn)行空-地目標(biāo)精確打擊;遠(yuǎn)程末制導(dǎo)和光電對(duì)抗武器系統(tǒng)如何能及早發(fā)現(xiàn)小目標(biāo)、偽裝和隱蔽目標(biāo)等。因此,作為核心技術(shù)之一的圖像處理技術(shù),亟待增強(qiáng)自動(dòng)識(shí)別那些對(duì)比度很低的目標(biāo)、假目標(biāo)或民用目標(biāo)的能力,從而提高自動(dòng)捕獲和對(duì)復(fù)雜背景下的目標(biāo)平穩(wěn)跟蹤的能力,以滿足目前圖像制導(dǎo)武器系統(tǒng)的快速響應(yīng)和精確打擊的要求。
在實(shí)際應(yīng)用中,自動(dòng)識(shí)別目標(biāo)是個(gè)極其困難的問(wèn)題,這是因?yàn)樵诂F(xiàn)有技術(shù)條件下,很難在不同時(shí)間,不同觀察角度,不同距離,對(duì)同一個(gè)目標(biāo)獲得相同的圖像。目前所采用的圖像處理系統(tǒng)和處理方法遠(yuǎn)遠(yuǎn)不能適應(yīng)這些條件變化,而且敵方對(duì)目標(biāo)的偽裝和探測(cè)系統(tǒng)的干擾,又使自動(dòng)識(shí)別目標(biāo)問(wèn)題變得更加困難。到目前為止,自動(dòng)目標(biāo)識(shí)別只能通過(guò)人們的觀察來(lái)完成。為了訓(xùn)練操作手識(shí)別一種未知的目標(biāo),需要對(duì)其進(jìn)行大量的訓(xùn)練。即使如此,操作人員的判斷也避免不了人為的誤差,甚至?xí)驗(yàn)樗卟蛔愣绊懪袛嗟木?。另外,他們還必須定期重復(fù)訓(xùn)練,否則技能會(huì)很快變差。因此,給圖像處理系統(tǒng)加上人工智能,讓計(jì)算機(jī)系統(tǒng)代替人,自動(dòng)實(shí)現(xiàn)快速、準(zhǔn)確地識(shí)別目標(biāo),即實(shí)現(xiàn)圖像處理的智能化是當(dāng)前亟須解決的問(wèn)題。
光學(xué)成像儀器的發(fā)展也非常需要智能圖像處理技術(shù)的支撐。目前,國(guó)內(nèi)外各種光學(xué)成像儀器不斷推陳出新。伴隨著大、中、小型光學(xué)儀器的發(fā)展,越來(lái)越多地采用帶有某些人工智能的圖像處理技術(shù)。例如:具有圖像增強(qiáng)功能的紅外攝像機(jī)、具有圖像壓縮和視頻自動(dòng)調(diào)焦功能的數(shù)碼相機(jī)、具有失真校正功能的大視場(chǎng)攝像機(jī)、針對(duì)人造目標(biāo)識(shí)別的偏振攝像機(jī)、采用結(jié)構(gòu)光照明的雙目(單目)立體攝像機(jī)、采用圖像拼接技術(shù)實(shí)現(xiàn)的大視場(chǎng)高分辨率的成像系統(tǒng)、采用現(xiàn)場(chǎng)標(biāo)定內(nèi)外參數(shù)的虛擬現(xiàn)實(shí)成像系統(tǒng)、采用波前檢測(cè)技術(shù)的自適應(yīng)光學(xué)系統(tǒng),以及計(jì)算成像系統(tǒng)、量子成像等新的光學(xué)成像系統(tǒng)。具有各種智能的圖像處理系統(tǒng)將其視頻信息(目標(biāo)的亮度、位置、姿態(tài)等)反饋給光學(xué)儀器的控制系統(tǒng)或顯示系統(tǒng),使光學(xué)儀器實(shí)現(xiàn)自適應(yīng)智能控制,從而提高儀器成像質(zhì)量使其具有學(xué)習(xí)和自適應(yīng)能力。圖像處理智能化為提高產(chǎn)品的附加值、擴(kuò)大市場(chǎng)份額起到了相當(dāng)大的推動(dòng)作用。
目前,國(guó)內(nèi)也在不斷出現(xiàn)智能圖像處理的相關(guān)研究報(bào)道,但成果寥寥無(wú)幾。由此說(shuō)明,人們已經(jīng)認(rèn)識(shí)到圖像處理智能化在國(guó)民經(jīng)濟(jì)和軍事各領(lǐng)域的重要性,但圖像處理智能化的發(fā)展還需要艱苦的努力。
隨著計(jì)算速度、內(nèi)存容量、傳輸帶寬的提高和成本的降低,以及高新技術(shù)產(chǎn)業(yè)的發(fā)展和人民生活水平的提高,機(jī)器人視覺(jué)技術(shù)在國(guó)內(nèi)有了很大的發(fā)展,從傳統(tǒng)的遙感、機(jī)器人視覺(jué)導(dǎo)航,已經(jīng)發(fā)展到醫(yī)學(xué)圖像的處理和理解、視頻監(jiān)測(cè)、虛擬現(xiàn)實(shí)等許多領(lǐng)域,應(yīng)用對(duì)象從航天、軍工領(lǐng)域進(jìn)入了日常生活和娛樂(lè),甚至將走進(jìn)普通家庭。
智能圖像處理的一個(gè)主要內(nèi)容是用計(jì)算機(jī)來(lái)模仿和執(zhí)行人腦的某些智力功能,實(shí)現(xiàn)具有人工智能的圖像處理系統(tǒng)。機(jī)器人視覺(jué)也可以叫做計(jì)算機(jī)視覺(jué),它是用各種成像系統(tǒng)代替人的視覺(jué)器官作為視覺(jué)輸入的敏感“器官”,由計(jì)算機(jī)來(lái)代替大腦完成視覺(jué)信息處理和解釋,使計(jì)算機(jī)能像人那樣觀察和理解世界,從而具有自主適應(yīng)環(huán)境的能力,能夠協(xié)助以至代替人的工作。機(jī)器人視覺(jué)技術(shù)側(cè)重于研究以應(yīng)用為背景的專用視覺(jué)系統(tǒng),所以,圖像理解是研究機(jī)器視覺(jué)的重要基礎(chǔ)理論之一。圖像理解需要復(fù)雜的圖像處理做基礎(chǔ),還需要了解關(guān)于景物成像的物理規(guī)律以及與景物內(nèi)容有關(guān)的知識(shí)。所以,機(jī)器人視覺(jué)系統(tǒng)本身就是一個(gè)典型的智能圖像處理系統(tǒng)。
基于內(nèi)容的視頻和圖像信息檢索是從大量的靜止或活動(dòng)視頻圖像庫(kù)中檢索包含目標(biāo)物體的圖像(或視頻片段)。海量視頻圖像數(shù)據(jù)的自動(dòng)檢索需要具有圖像理解功能的圖像專家系統(tǒng)或圖像信息(知識(shí))處理系統(tǒng),在高度信息化的今天,這已成為圖像庫(kù)中圖像信息組織和管理不可缺少的技術(shù)?;趦?nèi)容的視頻和圖像信息檢索需要對(duì)視頻和圖像信息進(jìn)行處理和分析,通過(guò)圖像知識(shí)的描述,圖像知識(shí)獲取,用語(yǔ)義網(wǎng)絡(luò)表示,圖像知識(shí)庫(kù)建立,圖像數(shù)據(jù)庫(kù)管理,從而實(shí)現(xiàn)按圖像內(nèi)容從圖像知識(shí)庫(kù)中檢索圖像文件。其中底層視覺(jué)特征和高層語(yǔ)義特征的提取與表達(dá)方法是基于內(nèi)容的圖像檢索技術(shù)在發(fā)展中遇到的難題。解決基于內(nèi)容的視頻和圖像信息檢索問(wèn)題的關(guān)鍵也是圖像處理的智能化。
總之,無(wú)論是從軍事戰(zhàn)略對(duì)自動(dòng)目標(biāo)識(shí)別的需求,還是從光學(xué)成像儀器、網(wǎng)絡(luò)視頻通信,以及各種高技術(shù)的發(fā)展來(lái)看,圖像處理的智能化都具有極其重要的意義,是今后圖像處理領(lǐng)域的發(fā)展趨勢(shì)。
智能圖像處理的理論大體上可以分為以下3個(gè)方面:可靠解決問(wèn)題的方法論、相關(guān)交叉學(xué)科的理論和新的成像理論。
3.1.1 解決圖像處理智能化問(wèn)題的方法論
研究解決圖像處理智能化問(wèn)題的方法論用于研究用什么樣的方式、方法解決圖像處理智能化問(wèn)題更切實(shí)可行。
以解決“復(fù)雜環(huán)境中物體的識(shí)別”問(wèn)題為例,目前采用什么理論來(lái)指導(dǎo)研究最可行在國(guó)際學(xué)術(shù)界還有爭(zhēng)論。它關(guān)系到研究圖像識(shí)別技術(shù)的起點(diǎn)、發(fā)展方向及理論高度。
有一種理論是將“復(fù)雜環(huán)境中物體的識(shí)別”問(wèn)題納入人工智能圖像理解(Image Understanding)的范躊[1],它包括:圖像知識(shí)描述、知識(shí)語(yǔ)言、圖像知識(shí)獲取、圖像知識(shí)庫(kù)建立和問(wèn)題求解。該理論采用概率或模糊處理的方法并用邏輯語(yǔ)言描述圖像,試圖把定性的、不精確的問(wèn)題在工程上獲得確定解。目前在實(shí)際應(yīng)用中解決該問(wèn)題困難很大。
清華大學(xué)章毓晉教授在《圖像工程》一書(shū)中[2]將圖像處理分為“圖像處理”、“圖像分析”、“圖像理解”3個(gè)等級(jí)。對(duì)“復(fù)雜環(huán)境中物體的識(shí)別”這個(gè)問(wèn)題的處理方法與上述觀點(diǎn)相似。
美國(guó)麻省理工學(xué)院研究人員將“復(fù)雜環(huán)境中物體的識(shí)別”問(wèn)題分成4個(gè)階段。第1階段:低級(jí)處理(邊緣提取、3-D處理、運(yùn)動(dòng)分析)、圖像描述(符號(hào)方法)、特征分類;第2階段:標(biāo)號(hào);第3階段:匹配、識(shí)別,選擇;第4階段:硬件實(shí)現(xiàn)。在這4個(gè)階段中,第1階段的工作是其它工作的基礎(chǔ),也是最難的。例如,導(dǎo)引頭經(jīng)常會(huì)給出質(zhì)量很差的圖像(對(duì)比度低、噪聲大)。為了處理這類圖像,就需要研究圖像增強(qiáng)、邊緣提取、運(yùn)動(dòng)分析、三維處理、物體的形狀和特征的描述,然后用于圖像分割、分類、識(shí)別以及確定物體在空間的運(yùn)動(dòng)和姿態(tài)。
利用3-D數(shù)據(jù)來(lái)識(shí)別和確定物體位置,是利用圖像顏色、紋理等特征將圖像中特定的物體選擇出來(lái),不僅要研究提取底層特征的具體實(shí)現(xiàn)方法,還要研究如何利用這些特征使選擇的目標(biāo)是唯一的。
國(guó)外在這方面的做法為我們提供了借鑒。美軍正在研究用一個(gè)低成本的傳感網(wǎng)絡(luò)、新型光電和紅外技術(shù)以及先進(jìn)的操作概念來(lái)解決傳統(tǒng)的圖像處理所遇到的困難。在非常復(fù)雜的環(huán)境里,如森林和城郊地區(qū),中高空飛機(jī)上的單獨(dú)傳感器往往不能對(duì)視角連續(xù)變化的目標(biāo)進(jìn)行正確的探測(cè)、跟蹤和識(shí)別。針對(duì)這種情況,他們采用如圖1所示的分層傳感系統(tǒng),即在中高空平臺(tái)上用高光譜傳感器提供能夠覆蓋大面積和可見(jiàn)近紅外(VNIR)、短波紅外(SWIR)、長(zhǎng)波紅外(LWIR)光譜區(qū)圖像,用小型無(wú)人機(jī)上的逼近傳感器提供高分辨力的圖像,采用歸一化的景物特征和子空間匹配濾波等方法,大幅度提高對(duì)困難目標(biāo)的探測(cè)和判別能力。
研究用什么樣的方式、方法更實(shí)際可行,比抓住一種算法進(jìn)行計(jì)算機(jī)編程更重要。針對(duì)多目標(biāo)跟蹤與識(shí)別的問(wèn)題,美國(guó)空軍研究實(shí)驗(yàn)室提出一種用多分辨率傳感器,解決同時(shí)跟蹤和識(shí)別的問(wèn)題[8]。不同于傳統(tǒng)的僅靠目標(biāo)位置信息來(lái)跟蹤一群目標(biāo),這種方法是通過(guò)不同分辨率的多傳感器的數(shù)據(jù)融合來(lái)識(shí)別目標(biāo),減輕干擾并提高跟蹤的穩(wěn)定性。
圖1 分層傳感系統(tǒng)概念框圖Fig.1 Block diagram of a sensed system with separated layers
3.1.2 研究相關(guān)交叉學(xué)科的理論
圖像處理相關(guān)的交叉學(xué)科與解決的物理問(wèn)題有關(guān)。仍以解決“復(fù)雜環(huán)境中物體的識(shí)別”問(wèn)題為例,現(xiàn)在國(guó)內(nèi)外提出了許多方法,下面是美國(guó)空軍實(shí)驗(yàn)室的一份研究報(bào)告中提到的為解決目標(biāo)識(shí)別而計(jì)劃的幾個(gè)研究方向,它們涉及到光學(xué)、數(shù)學(xué)、物理等領(lǐng)域的理論。
(1)高光譜目標(biāo)探測(cè)
用成像光譜儀可在很寬的光譜區(qū)域收集每個(gè)像元位置的精細(xì)光譜。利用高光譜成像進(jìn)行大范圍的目標(biāo)探測(cè),利用目標(biāo)的VNIR反射光譜作為識(shí)別它們的基本特征。實(shí)驗(yàn)表明:整流罩經(jīng)過(guò)偽裝,其VNIR區(qū)的反射光譜與自然植被的反射光譜很像。但是在SWIR區(qū)或夜間在LWIR區(qū),經(jīng)過(guò)偽裝的整流罩的反射光譜與自然植被的反射光譜還是有差別的如圖2所示。
圖2 利用高光譜成像進(jìn)行大范圍的目標(biāo)探測(cè)Fig.2 Target detection in large area by using a hyperspectral imager
美軍正在研究高光譜傳感器向短波紅外和長(zhǎng)波紅外延伸的能力。最近完成的光譜儀使用了長(zhǎng)波紅外HgCdTe焦平面陣列,自身輻射最小,并且制冷靈活。目標(biāo)探測(cè)是基于大氣層歸一化的景物反射特性數(shù)據(jù)庫(kù)和光譜濾波器,或是基于協(xié)方差歸一化的景物特征。目前正在考慮用更完美的子空間匹配濾波方法進(jìn)一步提高目標(biāo)探測(cè)性能。
(2)偏振光譜目標(biāo)識(shí)別
采用多光譜或偏振光譜傳感器可以改進(jìn)視覺(jué)上難以判斷的偽裝和隱蔽目標(biāo)的識(shí)別能力。偏振技術(shù)在可見(jiàn)和紅外光譜區(qū)增強(qiáng)人造目標(biāo)的對(duì)比度已經(jīng)表現(xiàn)出很好的應(yīng)用前景。
在高分辨率光學(xué)系統(tǒng)中加入微極化濾波器是一種有效的偏振成像系統(tǒng),它除了增強(qiáng)人造目標(biāo)的對(duì)比度,還可以通過(guò)形狀抽取來(lái)支持目標(biāo)識(shí)別。因?yàn)?,?duì)一個(gè)有點(diǎn)模糊的目標(biāo),其線性偏振的程度取決于光源—目標(biāo)—傳感器的幾何關(guān)系。在偏振圖像中的形狀信息可以用數(shù)字圖像處理方法提取出來(lái)。
圖3 典型軍用涂料的長(zhǎng)波紅外偏振光譜測(cè)量結(jié)果Fig.3 Typical polarized spectra of measuring a military coating material
光譜偏振成像技術(shù)對(duì)減少高光譜目標(biāo)探測(cè)系統(tǒng)的虛警率是一種很有潛力的方法。圖3是典型軍用涂料的長(zhǎng)波紅外偏振光譜測(cè)量結(jié)果。S0和S1分別是典型軍用涂料的非偏振光譜和偏振光譜,S2為另一種物質(zhì)的偏振光譜。顯然,在8~13 μmS2與S1的差別更大。也就是說(shuō),偏振的高光譜目標(biāo)探測(cè)系統(tǒng)的虛警率比非偏振的要低。
(3)多光譜目標(biāo)捕獲
在前面提到的分層傳感系統(tǒng)中,情報(bào)監(jiān)視偵察(ISR)傳感器把目標(biāo)的類型和位置傳送給打擊平臺(tái)的火控系統(tǒng)后,火控系統(tǒng)首先要重新捕獲指定的目標(biāo)。目標(biāo)的重新捕獲要采用寬帶熱成像系統(tǒng),但對(duì)偽裝和隱蔽目標(biāo)的識(shí)別是采用光譜分析法。
美國(guó)空軍實(shí)驗(yàn)室正在探索用多光譜成像系統(tǒng)來(lái)實(shí)現(xiàn)對(duì)偽裝和隱蔽目標(biāo)的捕獲。光譜傳感器不僅提供目標(biāo)的類型和位置,還提供目標(biāo)的光譜信息(均值向量)和局部背景統(tǒng)計(jì)(均值向量和協(xié)方差矩陣)。然后用修正的Fisher判決函數(shù)產(chǎn)生一個(gè)子空間的投影,最大化分離目標(biāo)和背景。通過(guò)最大化類間矩陣和最小化類內(nèi)矩陣求解本征值問(wèn)題,得到圖4所示的類別可分離性曲線。然后用簡(jiǎn)單的閾值切割來(lái)得到最大分類可能性的波段。
圖4 SWIR光譜區(qū)判別能力曲線Fig.4 Curve of discriminating power in SWIR spectrum
美國(guó)空軍實(shí)驗(yàn)室的研究表明,選擇最佳波段不僅依賴目標(biāo)和局部背景的特性,而且依賴環(huán)境參數(shù),如照明、溫度和大氣路徑。因此,對(duì)于一個(gè)有效的多光譜目標(biāo)捕獲系統(tǒng),它的光譜波段控制單元在考慮不同情況下的環(huán)境參數(shù)后,能自適應(yīng)地選擇最大分類可能性的波段。
實(shí)現(xiàn)光譜自適應(yīng)性的方法是將用微機(jī)電系統(tǒng)(MEMS)可調(diào)Fabry-Perot標(biāo)準(zhǔn)具(相當(dāng)于可變?yōu)V光片)放在常規(guī)凝視紅外攝像機(jī)的焦平面陣列的前面,當(dāng)攝像機(jī)穩(wěn)定在指定目標(biāo)區(qū)域的上空時(shí),系統(tǒng)快速掃描,通過(guò)最佳的多光譜波段。
(4)激光雷達(dá)目標(biāo)識(shí)別
在有些情況下,由于被動(dòng)傳感器受其能力所限,即使采用頻域和偏振成像的方法也難以識(shí)別某些目標(biāo)景區(qū),這時(shí),采用激光雷達(dá)可以很好地完成任務(wù)。因?yàn)楣ぷ鞑ㄩL(zhǎng)越短,空間分辨能力越高,并且通過(guò)振動(dòng)傳感、距離門2-D和3-D成像可以獲得增強(qiáng)的信息。
美國(guó)空軍實(shí)驗(yàn)室最近已經(jīng)開(kāi)發(fā)出激光脈沖3-D成像的焦平面陣列傳感器。這些被稱為快閃3-D激光雷達(dá)專門用于自動(dòng)識(shí)別室外偽裝和遮擋的目標(biāo)。由于受到激光功率的限制,還需要一個(gè)標(biāo)記目標(biāo)位置的被動(dòng)系統(tǒng)來(lái)協(xié)助。
綜上所述,圖像處理涉及的技術(shù)有:光譜偏振成像、多光譜目標(biāo)捕獲和激光脈沖3-D成像;利用目標(biāo)的類型、位置、光譜信息、局部背景統(tǒng)計(jì),分離目標(biāo)與背景;在偏振圖像中提取目標(biāo)的形狀信息;利用激光脈沖3-D成像技術(shù)識(shí)別偽裝和被遮擋目標(biāo);利用大氣層歸一化的景物反射特性,識(shí)別地面目標(biāo);子空間匹配濾等等。以上技術(shù)涉及到物理光學(xué)、大氣光學(xué)、統(tǒng)計(jì)物理等學(xué)科,如果不研究這些學(xué)科的理論,僅憑電子學(xué)或計(jì)算機(jī)科學(xué)的知識(shí)是不夠的。
3.1.3 新的成像理論
圖像處理的智能化與圖像傳感器有著密切的關(guān)系。因?yàn)閳D像傳感器是視頻圖像信息的源,就像人的眼睛一樣,大腦再發(fā)達(dá),眼睛失明,也談不上視覺(jué)。客觀世界千差萬(wàn)別,圖像處理面對(duì)的問(wèn)題多種多樣,比如目標(biāo)識(shí)別需要3-D的信息,需要從噪聲中識(shí)別目標(biāo),甚至需要傳統(tǒng)的成像系統(tǒng)不能提供的信息?,F(xiàn)在和將來(lái)所遇到的挑戰(zhàn),必然會(huì)使現(xiàn)有的各種成像系統(tǒng)都不能完全滿足要求,所以需要研究新的成像理論和成像系統(tǒng)。實(shí)際上,現(xiàn)在已經(jīng)出現(xiàn)了一些新的成像理論需要關(guān)注和進(jìn)一步研究,量子成像就是其中之一。
量子力學(xué)認(rèn)為:“微觀客體的關(guān)聯(lián)具有非局域性,它可以延伸到很遠(yuǎn)的距離”。這就是著名的量子糾纏現(xiàn)象。量子成像技術(shù)就是利用量子糾纏現(xiàn)象發(fā)展起來(lái)的一種新的成像技術(shù)。
量子成像的光源是兩束量子糾纏的激光束,用其中一束激光照射目標(biāo),并攝取目標(biāo)圖像;同時(shí)用高分辨率的圖像傳感器接收另一束光,然后用計(jì)算機(jī)比較從物體和光源得到的不同圖像數(shù)據(jù),進(jìn)而合成被照目標(biāo)的高分辨率圖像。
有資料報(bào)道:“量子成像技術(shù)在紅外波段獲得高分辨率圖像效果很好”,將在航空遙感、軍事偵察、遠(yuǎn)紅外成像等領(lǐng)域發(fā)揮重要作用[9]。
量子成像是弱光測(cè)量領(lǐng)域的一個(gè)新興研究課題。不同于經(jīng)典成像,量子成像是利用光場(chǎng)的量子力學(xué)性質(zhì)和其內(nèi)在的并行特點(diǎn),在量子水平上發(fā)展起來(lái)的新的光學(xué)成像和量子信息并行處理技術(shù),它將為生命科學(xué)等眾多領(lǐng)域的研究帶來(lái)曙光。相對(duì)于傳統(tǒng)光學(xué)成像技術(shù)中通過(guò)記錄輻射場(chǎng)的光強(qiáng)分布從而獲取目標(biāo)圖像信息的方法,量子成像是通過(guò)利用和控制(或模擬)輻射場(chǎng)的量子漲落來(lái)得到物體的圖像。
目前,國(guó)內(nèi)已經(jīng)有人開(kāi)始研究量子成像的理論和技術(shù)。量子成像和經(jīng)典成像的主要區(qū)別見(jiàn)表1。
表1 量子成像和經(jīng)典成像的區(qū)別Tab.1 Key distinction between quantum imaging and classical imaging
“鬼成像”技術(shù)是量子成像技術(shù)的一個(gè)分支,是光電子與物理電子學(xué)學(xué)科近年來(lái)的一個(gè)研究熱點(diǎn)[10,11]。“鬼成像”技術(shù)作為一門新型技術(shù),有著傳統(tǒng)成像不可取代的優(yōu)勢(shì),它可讓信息(圖像)高度自由化。傳統(tǒng)光學(xué)成像必須經(jīng)過(guò)光學(xué)元件的反射、折射,或微光放大,成像在光線(或其反向延長(zhǎng)線)到達(dá)的光路上,而“鬼成像”則擺脫了這些束縛,使信息傳遞渠道更加豐富,也會(huì)使信息的保密性得到進(jìn)一步提高。
美國(guó)陸軍研究實(shí)驗(yàn)所的量子實(shí)驗(yàn)室已經(jīng)得到了較為逼真的“鬼像”。他們認(rèn)為:“若干年后,會(huì)出現(xiàn)這樣的情景:一名軍人使用一臺(tái)量子鬼像成像機(jī),透過(guò)戰(zhàn)場(chǎng)上的硝煙辨清敵友。”量子鬼像成像技術(shù)幾乎可以使用任何光源—熒光燈泡、激光甚至太陽(yáng),能避免云、霧和煙等使常規(guī)成像技術(shù)無(wú)能為力的氣象條件的干擾,從而獲得更為清晰的圖像。
“鬼成像”技術(shù)在軍事領(lǐng)域還有其他應(yīng)用?!肮沓上瘛眰鞲衅骰蛟S可以使直升機(jī)或無(wú)人機(jī)獲得能評(píng)估投下的炸彈所造成的破壞程度的圖像。在醫(yī)學(xué)領(lǐng)域和搜救行動(dòng)中,也能利用這種成像技術(shù)。即可以采用非相干X射線源來(lái)實(shí)現(xiàn)以往只能利用相干X射線才能完成的、具有納米分辨率的衍射成像。
中國(guó)科學(xué)院上海光機(jī)所對(duì)基于統(tǒng)計(jì)光學(xué)的無(wú)透鏡“鬼成像”做了數(shù)值模擬與實(shí)驗(yàn)驗(yàn)證。從經(jīng)典統(tǒng)計(jì)光學(xué)入手,建立了熱光場(chǎng)的數(shù)值模型,模擬符合熱光特性的光場(chǎng)變化、光場(chǎng)傳播、以及物體透射函數(shù)對(duì)熱光場(chǎng)的調(diào)制,進(jìn)而從光強(qiáng)度起伏的關(guān)聯(lián)函數(shù)中,分別重現(xiàn)振幅型物體和純相位型物體的傅里葉變換圖像。與真實(shí)實(shí)驗(yàn)結(jié)果的對(duì)比表明,基于統(tǒng)計(jì)光學(xué)原理的該數(shù)值模型所預(yù)測(cè)的實(shí)驗(yàn)結(jié)果與真實(shí)的實(shí)驗(yàn)結(jié)果完全一致,因此,基于統(tǒng)計(jì)光學(xué)的無(wú)透鏡“鬼成像”亦可以實(shí)現(xiàn)。
算法是軟件設(shè)計(jì)的靈魂,它代表著用系統(tǒng)的方法描述解決問(wèn)題的策略機(jī)制。算法結(jié)合特定的數(shù)據(jù)結(jié)構(gòu),經(jīng)過(guò)某種語(yǔ)言編程后,成為按照一定的運(yùn)算順序所構(gòu)成的完整的解題步驟。不同的算法完成同樣的任務(wù),可能花費(fèi)不同的時(shí)間和空間。從事計(jì)算機(jī)科學(xué)的研究人員已經(jīng)創(chuàng)造了許多經(jīng)典的算法,如遞歸算法、窮舉搜索算法、貪婪算法等。
智能算法也被稱為仿生算法。它是受自然界規(guī)律的啟發(fā),根據(jù)其原理來(lái)模仿求解問(wèn)題的算法。如人工神經(jīng)網(wǎng)絡(luò)算法、遺傳算法、模擬退火算法、蟻群算法、免疫算法,粒子群算法等。它們的共同特點(diǎn)是模擬了某些自然過(guò)程,模擬了某種人類的智力過(guò)程,神經(jīng)網(wǎng)絡(luò)更是直接模擬了人腦。它們都不同程度地具有自動(dòng)學(xué)習(xí)、自適應(yīng)調(diào)整,自動(dòng)優(yōu)化,給出最優(yōu)結(jié)果的功能。
這些算法有機(jī)結(jié)合在一起,取長(zhǎng)補(bǔ)短,性能將更加優(yōu)良。如模擬退火算法和遺傳算法的結(jié)合可以有效地克服傳統(tǒng)遺傳算法的早熟現(xiàn)象,同時(shí)根據(jù)聚類問(wèn)題的具體情況設(shè)計(jì)遺傳編碼方式、適應(yīng)度函數(shù),可使該算法更有效、更快速地收斂到全局最優(yōu)解。模擬退火和遺傳算法為神經(jīng)網(wǎng)絡(luò)提供了更優(yōu)良的學(xué)習(xí)算法;反之,將有監(jiān)督學(xué)習(xí)的BP算法與遺傳算法相結(jié)合可以達(dá)到優(yōu)勢(shì)互補(bǔ)、提高算法穩(wěn)定性和全局搜索能力的目的。另外,采用遺傳算法改進(jìn)粒子群算法可以增強(qiáng)全局的搜索能力。
智能算法還包括自適應(yīng)濾波器、合成匹配濾波器的設(shè)計(jì)。在解決自動(dòng)目標(biāo)識(shí)別問(wèn)題中,自適應(yīng)濾波器可以根據(jù)圖像的特征自動(dòng)調(diào)整濾波器的參數(shù)。比如近幾年提出的基于偏微分方程理論進(jìn)行圖像去噪和增強(qiáng)的方法就是利用圖像的微小局部特征信息來(lái)構(gòu)造自適應(yīng)數(shù)值保真項(xiàng),將其引入到非線性擴(kuò)散模型中,即可在有效地去除噪聲的同時(shí)很好地保持目標(biāo)尖角、邊緣等重要的幾何結(jié)構(gòu)。合成匹配濾波器是在目標(biāo)的形狀、姿態(tài)發(fā)生變化時(shí),有效識(shí)別目標(biāo)的一種方法,過(guò)去由于它的計(jì)算量太大,實(shí)用性受到限制,但隨著信息技術(shù)的發(fā)展,合成匹配濾波器的瓶頸問(wèn)題一定會(huì)得到解決。
智能算法有別于常見(jiàn)的精確計(jì)算程序,它更強(qiáng)調(diào)學(xué)習(xí)、記憶和聯(lián)想的功能。熟練的掌握幾種智能算法,能夠很方便地解決在圖像處理中遇到的實(shí)際問(wèn)題。
算法研究還要包括算法評(píng)估的工作。首先要設(shè)計(jì)一個(gè)可對(duì)各種實(shí)際情況建立先驗(yàn)?zāi)P偷姆抡鏈y(cè)試系統(tǒng),該系統(tǒng)應(yīng)包括3個(gè)相對(duì)獨(dú)立又密切聯(lián)系的功能模塊,分別負(fù)責(zé)模擬環(huán)境和目標(biāo)、裝載算法、以及實(shí)時(shí)統(tǒng)計(jì)和事后評(píng)估。
研究復(fù)雜背景下的目標(biāo)探測(cè)(解決瞬態(tài)捕獲、定位)、目標(biāo)識(shí)別(考慮偽裝和隱藏)應(yīng)以沙盤構(gòu)成的仿真場(chǎng)景和真實(shí)圖像傳感器來(lái)模擬環(huán)境和進(jìn)行目標(biāo)仿真實(shí)驗(yàn),因?yàn)椴捎闷聊煌队昂屯ㄓ脠D像傳感器的辦法丟失太多的有用信息,同時(shí)引入許多虛假信息。
評(píng)估一個(gè)算法,要考慮以下4個(gè)方面:算法對(duì)各種有刁難性的輸入數(shù)據(jù)應(yīng)能得出符合要求的結(jié)果,表明算法的正確性;算法要易于閱讀、調(diào)試和修改,滿足算法的可讀性要求;當(dāng)數(shù)據(jù)輸入非法時(shí),算法能作出反映,滿足算法的可靠性要求;評(píng)估算法的效率及對(duì)存儲(chǔ)空間的需求。
研究智能圖像處理自然要研究圖像傳感器的智能化,包括自動(dòng)調(diào)光、自動(dòng)調(diào)焦、光譜自適應(yīng)調(diào)整、接口自適應(yīng)、圖像的預(yù)處理功能等。但是更關(guān)鍵的是具有并行處理能力的硬件系統(tǒng)。現(xiàn)在許多智能算法并不實(shí)用,就是因?yàn)樵谀壳暗挠?jì)算機(jī)硬件系統(tǒng)上運(yùn)行時(shí)間太長(zhǎng)。
智能圖像處理系統(tǒng)是要模擬人的大腦,實(shí)現(xiàn)高速信息處理。根據(jù)目前生物醫(yī)學(xué)的研究成果,人的大腦由大量的神經(jīng)元廣泛互連而成,每個(gè)神經(jīng)元大約有103~104個(gè)樹(shù)突及相應(yīng)的突觸,一個(gè)人的大腦總計(jì)約形成1014~1015個(gè)突觸。用神經(jīng)網(wǎng)絡(luò)的術(shù)語(yǔ)來(lái)說(shuō),人腦具有1014~1015個(gè)互相連接的存儲(chǔ)潛力。雖然每個(gè)神經(jīng)元的運(yùn)算功能十分簡(jiǎn)單,且信號(hào)傳輸速率也較低(大約100次/s),但由于各神經(jīng)元之間的并行互連功能,最終使得一個(gè)普通人的大腦在約1 s內(nèi)就能完成現(xiàn)行計(jì)算機(jī)至少需要數(shù)10億次處理步驟才能完成的任務(wù)。
最新消息報(bào)道:英國(guó)曼徹斯特大學(xué)科學(xué)家將ARM芯片聯(lián)結(jié)起來(lái),作為巨型電腦的系統(tǒng)架構(gòu),取名“SpiNNaker”。該報(bào)道說(shuō)“項(xiàng)目以芯片制作為中心,花了5年時(shí)間。隨著項(xiàng)目規(guī)模的擴(kuò)大,它會(huì)在未來(lái)18個(gè)月成型,屆時(shí)會(huì)用到100萬(wàn)顆處理器?,F(xiàn)在系統(tǒng)已經(jīng)小規(guī)模運(yùn)行,可以模擬60萬(wàn)個(gè)神經(jīng)元工作”。芯片由曼徹斯特設(shè)計(jì),在中國(guó)臺(tái)灣生產(chǎn),每一個(gè)芯片包括18個(gè)ARM處理器。
根據(jù)國(guó)內(nèi)外對(duì)人工智能研究的共識(shí),智能圖像處理的硬件系統(tǒng)應(yīng)為專門研發(fā)的多處理器并行處理系統(tǒng)。所以,研究具有高速并行處理能力的硬件系統(tǒng)是必要的。目前國(guó)內(nèi)絕大多數(shù)嵌入式圖像處理硬件系統(tǒng)的構(gòu)成方案是基于TMs320系列的高速信號(hào)處理器,而根據(jù)國(guó)外資料的介紹,TMs320系列并不適合并行處理,它適于用來(lái)加快運(yùn)算速度,面向并行處理的微處理器Transputer更適合構(gòu)成并行處理系統(tǒng)。
Transputer采用了精簡(jiǎn)指令技術(shù),它通過(guò)4對(duì)可雙向通訊的串行通訊Link鏈來(lái)實(shí)現(xiàn)高速通訊,高效地進(jìn)行處理器之間的互聯(lián),組成多機(jī)系統(tǒng)。它拋棄了共享存儲(chǔ)器和公用總線方式,因而脫離了多處理器的總線結(jié)構(gòu),解決了總線瓶頸問(wèn)題。多個(gè)處理器由Link鏈點(diǎn)對(duì)點(diǎn)相連,可構(gòu)成任意規(guī)模的拓?fù)渚W(wǎng)絡(luò)。網(wǎng)絡(luò)類似于積木塊結(jié)構(gòu),硬件的擴(kuò)展和改動(dòng)非常靈活。在Transputer推出的同時(shí),INMOS公司還開(kāi)發(fā)出了OCCAM語(yǔ)言用以支持用Transputer構(gòu)成的并行多機(jī)系統(tǒng)。Transputer現(xiàn)已大量應(yīng)用于各種實(shí)時(shí)處理系統(tǒng),例如Microway公司的IMS 110和Intel 960片子用作并行處理就很好,價(jià)格也很便宜。
本文綜述了圖像處理智能化的理論研究、智能高效算法和并行處理的硬件系統(tǒng),可以看出無(wú)論從軍事需求,還是從光學(xué)成像儀器、網(wǎng)絡(luò)視頻通信,以及各種高技術(shù)的發(fā)展來(lái)看,智能化都是圖像處理的必然發(fā)展趨勢(shì)。參考國(guó)外的行情,從理論、算法和硬件3個(gè)方面開(kāi)展研究,會(huì)把圖像處理的智能化推上一個(gè)新高度。
實(shí)現(xiàn)圖像處理的智能化是一個(gè)奮斗目標(biāo),近期的研究應(yīng)圍繞復(fù)雜背景下的自動(dòng)目標(biāo)捕獲來(lái)進(jìn)行,這主要包括:
(1)智能傳感器,特別是利用AI技術(shù)簡(jiǎn)化了的各種攝像設(shè)備。
(2)圖像處理的智能算法研究:人工神經(jīng)網(wǎng)絡(luò)、遺傳計(jì)算、免疫算法、以及其它自適應(yīng)算法,通過(guò)與常規(guī)信息處理方法相結(jié)合,實(shí)現(xiàn)自動(dòng)目標(biāo)捕獲。
(3)用Transputer構(gòu)成的并行多機(jī)系統(tǒng)。
(4)以目標(biāo)識(shí)別作為切入點(diǎn),建立一個(gè)先進(jìn)的仿真試驗(yàn)室。以沙盤構(gòu)成的仿真場(chǎng)景和真實(shí)圖像傳感器進(jìn)行仿真實(shí)驗(yàn),研究復(fù)雜背景下的目標(biāo)探測(cè)(解決瞬態(tài)捕獲、定位)、目標(biāo)識(shí)別(考慮偽裝和隱藏)方法,進(jìn)行目標(biāo)捕獲、識(shí)別與跟蹤算法的性能評(píng)估。
[1]SONKA M,HLAVAC V,BOYLE R.Image Processing,Analysis,and Machine Vision[M].2nd ed.London:Thomson Learning,2002.
[2]章毓晉.圖像工程(上、中、下)[M].2版.北京:清華大學(xué)出版社,2008.ZHANG Y J.Image Engineering(Ⅰ,Ⅱ,Ⅲ)[M].2nd ed.Beijing:Tsinghua University Press,2008.(in Chinese)
[3]馬頌德,張正友.計(jì)算機(jī)視覺(jué)—計(jì)算理論與算法基礎(chǔ)[M].北京:科學(xué)出版社,2003.MA S D,ZHANG ZH Y.Computer Vision-Theory of Computation and Basis of Computer Algorithm[M].Beijing:Science Press,2003.(in Chinese)
[4]胡守仁.神經(jīng)網(wǎng)絡(luò)導(dǎo)論[M].長(zhǎng)沙:國(guó)防科技大學(xué)出版社,1993:113-117.HU SH R.Neuronic Network Introduction[M].Changsha:National University of Defence Technology Press,1993:113-117.(in Chinese)
[5]楊宜禾,周維真.成像跟蹤技術(shù)導(dǎo)論[M].西安:西安電子科技大學(xué)出版社,1992.YANG Y H,ZHOU W ZH.Imaging Tracking Technique Introduction[M].Xi'an:Xidian University Press,1992.(in Chinese)
[6]CYNTHIA L C,JEFFRE J C.Intelligent targeting for a remotely operated,rapid aiming weapon platform,PB SAND2002-3733[R].NM(US):Sandia National Laboratories,2003.
[7]HERMAN J L.Target Identification Algorithm for the AN/AAS-44V Forward Looking Infrared[M].Washington:Storming Meclia,2000.
[8]BLASCH E,KAHLER B.Multiresolution EO/IR target tarcking and identification[C].Information Fusion,2005 8th International Conference on,25-28 July.
[9]張加源,金偉其.極弱光成像—量子成像技術(shù)[J].激光與紅外,2007,37(6):503-505.ZHANG J Y,JIN W Q.Extremely low light imaging-quantum imaging technology[J].Laser&Infrared,2007,37(6):503-505.(in Chinese)
[10]BAI Y F,HAN SH SH.Ghost imaging with thermal light by third-order correlation[J].Phys.Rev,A,2007,76:043828.
[11]LIU H L,CHENG J,HAN SH SH.Ghost imaging in Fourier space[J].J.Appl.Phys.,2007,102(10):102-103-4.
[12]CHEN H H.Stereo matching using dynamic programming based on occlusion detection[C]//Proceedings of the 2007 IEEE International Conference on Mechatronics and Automation,Harbin,China.2007:2445-2449.
[13]姚新,陳國(guó)良,徐惠敏,等.進(jìn)化算法研究進(jìn)展[J].計(jì)算機(jī)學(xué)報(bào),1995,18(9):694-706.YAO X,CHEN G L,XU H M.The progress of evolution algorithms[J].Chinese J,Computer,1995,18(9):694-706.(in Chinese)
[14]張曉繢,戴冠中,徐乃平.一種新的優(yōu)化搜索算法—遺傳算法[J].控制理論與應(yīng)用,1995,12(3):265-273.ZHANG X H,DAI G ZH,XU N P.Genetic algorithms-a new optimization and search algorithms[J].Control Theory&Appl.,1995,12(3):265-273.(in Chinese)
[15]HONG L,WAN Y F,JAIN A.Fingerprint image enhancement:algorithm and performance evaluation[J].IEEE T.Pattern Anal.,1998,20(8):777-789.
[16]JOAQUIM S,XAVIER A,JOAN B.A comparative review of camera calibrating methods with accuracy evaluation[J].Pattern Recognition,2002,35(7):1617-1635.
[17]FAUGERAS O D,LUONG Q T,MAYBANK S J.Camera self-calibration:theory and experiments[J].Lecture Notes in Computer Science,1992,588(1):321-334.
[18]胡玉鎖,陳宗海.一種新的基于線性EIV模型的魯棒估計(jì)算法[J].計(jì)算機(jī)研究與發(fā)展,2006,43(3):483-488.HU Y S,CHEN ZH H.A novel robust estimation algorithm based on linear EIV model[J].J.Computer Res.and Devel-
opment,2006,43(3):483-488.(in Chinese)
[19]云慶夏.進(jìn)化算法[M].北京:冶金工業(yè)出版社,2000.
YUN Q X.Genetic Algorithms[M].Beijing:Metallurgical Industry Press,2000.