韓曉娟
晉中職業(yè)技術(shù)學院,山西 晉中 030600
隨著我國技術(shù)水平不斷提高,數(shù)字媒體技術(shù)逐漸進入人們的視野,其主要使用信息技術(shù)以及通信技術(shù),全面處理圖像、文字等信息,最終將信息轉(zhuǎn)化成數(shù)據(jù)。圖像融合主要是把具有不同成像理念設(shè)備所收集的圖像進行相互融合,以下是圖像融合算法的具體分析。
圖像融合最早出現(xiàn)在20世紀,其是一種不同傳感設(shè)備可視信息部分的融合,通過將不同設(shè)備收集到的圖像經(jīng)過統(tǒng)一的圖像處理,提取所需要的數(shù)據(jù)信息,最后將其形成統(tǒng)一的圖像,以此為后續(xù)工作提供較大的便利。圖像融合綜合了較多的技術(shù)形式,例如:圖像處理、信息處理、數(shù)據(jù)顯示以及人工智能等。由于圖像融合技術(shù)具有一定的數(shù)據(jù)探測性,因此,在世界上技術(shù)發(fā)展較快的國家逐漸受到較高程度的重視,并產(chǎn)生了較為良好的成績。圖像融合形式一般可以分為以下幾種:不同傳感器在不同時間收集到的圖像進行融合;不同傳感器在相同時間收集到的圖像進行融合;單一傳感器在不同時間,或是不同地點下收集到的圖像進行融合。圖像融合可以高效地利用上述場景或時間收集圖像信息,結(jié)合精準的融合算法形成所需要的圖像,以此對其進行后續(xù)檢測、分析和跟蹤。將兩個傳感設(shè)備看作A和B,形成信息構(gòu)成圖(圖1)。
圖1 多源圖像的信息構(gòu)成
通過圖像融合技術(shù)可以使圖像中相關(guān)信息更加明顯,并逐漸提高圖像的精準性,從而使圖像中目標更加清晰,由此看來,這種計算方式可以獲得更加可靠的數(shù)據(jù)結(jié)果,進一步使該系統(tǒng)具有較強的實用性。與此同時,數(shù)據(jù)融合可以最大限度地提高圖像的分辨率,避免出現(xiàn)圖像模糊不清的情況,并的改善圖像分類性。在此基礎(chǔ)上,圖像融合在層次上有明顯的分類,主要可以劃分為:像素級、特征級以及決策級。
現(xiàn)如今,通過運用圖像融合技術(shù)對圖像進行處理,具有以下關(guān)鍵目的。①獲取圖像中更多的信息,提高圖像的分辨率,避免出現(xiàn)傳感設(shè)備收集到的圖像模糊不清的問題。②合理改善圖像空間分辨率,使圖像中光譜信息逐漸加強,從而為后續(xù)圖像識別工作提供便利。③將不同圖像根據(jù)場景變化情況進行合理分類。④可以將不同圖像進行融合,使其形成立體感較強的三維圖像,上述這種方式主要應(yīng)用在立體投影、數(shù)據(jù)測量等工作領(lǐng)域中。⑤根據(jù)其他傳感設(shè)備圖像,收集所丟失的圖像信息。根據(jù)以上目的來看,圖像融合技術(shù)與其他圖像技術(shù)不同,其具有更強的創(chuàng)新性以及準確性,從而在短時間內(nèi)成為圖像處理領(lǐng)域中全新的技術(shù)形式[1]。
在不同融合應(yīng)用過程中,由于應(yīng)用方式、所運用的數(shù)據(jù)信息,以及融合處理工作前對數(shù)據(jù)處理程度不同,使融合系統(tǒng)要在不同層次上,對數(shù)據(jù)信息進行針對性處理,每個層次都有相對應(yīng)的數(shù)據(jù)級別。結(jié)合數(shù)據(jù)形式來看,可以將圖像融合系統(tǒng)分為三個部分:像素級、特征級以及決策級。融合層次在一定程度上直接影響著算法形式、適用范圍。圖2是在圖像處理工作過程中,圖像融合所代表的層次信息。
圖2 不同層次的多源圖像融合示意圖
圖像融合在一定程度上主要是指將使用方式不同的傳感設(shè)備收集到的場景圖像,通過圖像融合算法計算得出精準性較高的新圖像,圖像融合過程大多包含以下幾個方面。
圖像預(yù)處理主要是將兩張或兩張以上的圖像進行事先處理,所處理的圖像一般來自不同使用方式的傳感設(shè)備,圖像預(yù)處理過程主要包括圖像去噪聲、圖像增強以及圖像配準等流程,上述過程的關(guān)鍵就是全方位提高所有圖像的對比度以及識別度[2]。
(1)圖像校正。圖像校正主要可以劃分成幾何校正、灰度校正。結(jié)合幾何校正來看,其主要理念就是通過已經(jīng)獲取的數(shù)據(jù),也就是根據(jù)坐標之間的數(shù)據(jù)關(guān)系以及相關(guān)系數(shù),使其作為其他象限的基礎(chǔ)。幾何校正的方式一般是先建立針對性的數(shù)學模型,再根據(jù)相關(guān)圖像信息明確模型中的參數(shù)數(shù)據(jù),最后結(jié)合圖像進行幾何對比。實際流程可以劃分為兩步。第一,變換圖像對應(yīng)的坐標,建立適當?shù)淖鴺梭w系以及坐標點,使二者形成映射,從而解決上述關(guān)系中的參數(shù)數(shù)據(jù),最后結(jié)合映射對坐標進行調(diào)整。第二,明確掌握不同像素之間的灰度值。與此同時,結(jié)合灰度校正來看,根據(jù)圖像自身的不同情況以及需要的不同特點選擇相對應(yīng)的修正方式。
下列是使用較多的三種方式。第一,灰度級別校正。由于圖像之間存在曝光不清楚的問題,這種現(xiàn)象會使圖像變得忽明忽暗,為了解決上述問題,可以對于圖像進行適當?shù)幕叶燃墑e校正,從而保證圖像在灰度上均勻分布。第二,灰度變換。由于部分圖像存在曝光不均勻的問題,因此可以運用灰度變換的方式,其能夠最大限度提高圖像之間的對比度。第三,直方圖修正。這種方式能夠為圖像有均勻灰度提供關(guān)鍵保障,進而有針對性選擇需要的部分圖像,以此滿足不同需要。
(2)圖像濾波技術(shù)。在圖像收集過程中,由于圖像會受到周圍地理位置、環(huán)境、使用設(shè)備以及電壓等不同因素的影響,圖像收集工作極容易受到信號的干擾,上述信號就是生活中的噪聲,會或多或少對圖像造成干擾。其中,最相似的干擾特點就是導(dǎo)致圖像分辨率降低,使圖像變得更加模糊,甚至出現(xiàn)圖像目標無法呈現(xiàn)的問題,從而對后續(xù)圖像分析、處理工作造成較大影響。上述噪聲具有較多的種類,分類標準也各有不同。例如,根據(jù)噪聲產(chǎn)生情況,可以劃分為外部噪聲以及內(nèi)部噪聲;根據(jù)噪聲分布情況來看,可以分成隨機噪聲以及校驗噪聲;根據(jù)噪聲與信號之間的相互影響,可以劃分成加性噪聲以及乘性噪聲等。針對上述不同種類的噪聲,去除噪聲的方式可以劃分成以下兩種。
①空域濾波去噪。這種方式主要是調(diào)整圖像中的灰度值,進而進行圖像運算。生活中最常見的空域濾波去噪方式主要有均值濾波、中值濾波以及空間域低通濾波法。根據(jù)上述方式來看,維納濾波是適應(yīng)性較強的去噪方式,其在運用過程中選擇性較高,因此,可以對圖像進行高質(zhì)量的保護,特別是對白噪聲有較好的控制效果。
②變換域去噪。這種方式主要是在圖像的某一部分內(nèi),對圖像經(jīng)過相關(guān)變換后產(chǎn)生的系數(shù)進行處理,進而再進行反變換,從而真正實現(xiàn)去除噪聲的要求。生活中經(jīng)常使用的方法主要有:頻率域低通濾波法、小波變換法等?,F(xiàn)如今,小波變換法仍然處于摸索階段,整體來看,其具有較好的去噪效果,但計算方式較為繁瑣。由此看來,不同的計算方式會對圖像產(chǎn)生不同的影響[3]。
圖像融合主要過程就是清晰掌握圖像融合的級別,例如圖像的像素級別、決策級別、特征級別、圖像融合算法以及相關(guān)融合處理過程等,上述過程是圖像融合工作的重中之重。
融合效果評價是對融合算法的運算方式進行合理檢測以及評價,通過融合效果評價,可以促進后續(xù)生產(chǎn)有效改進并高質(zhì)量完善,進而對后續(xù)工作提供關(guān)鍵的依據(jù)。對于融合圖像的后續(xù)處理工作來說,要對處理完畢的融合圖像進行后續(xù)檢測、信息識別、數(shù)據(jù)跟蹤以及最終決策等,上述流程會包括不同工作范圍的相關(guān)應(yīng)用。
①通過將紅外熱圖像進行事先處理,根據(jù)分段的方式進行變化,從而逐步增加紅外熱圖像的分辨率以及對比度,這種方式可以更加清晰地區(qū)分紅外熱圖像。②通過將事先處理完畢的紅外熱圖像以及可見光圖像進行方向、尺度上的變化,由此可以得到更加精準的圖像數(shù)據(jù)信息以及高頻子帶系數(shù)。③根據(jù)融合圖像的相關(guān)算法規(guī)則來看,要對圖像數(shù)據(jù)信息、高頻子帶系數(shù)進行不同的數(shù)據(jù)融合,從而得出與其對應(yīng)的子帶系數(shù)。④通過對上述系數(shù)進行變化,最后能夠得到所需要的融合圖像。
紅外圖像自身在抗噪聲方面功能性較差,并且對比性與邊緣處理情況都有處理上的問題。為了進一步實現(xiàn)圖像融合的要求,必須要運用分段性的方式對紅外圖像進行相關(guān)處理,通過合理提高圖像數(shù)據(jù)對比度,增強圖像中目標的識別系數(shù)。這種運算方式相對簡單,不需要較長的運算時間,因此對后續(xù)工作不會產(chǎn)生較大的影響。
分段性變換計算方式的公式如下:
上述公式中I(x,y)代表紅外圖像在(x,y)中像素變化情況,g(x,y)代表經(jīng)過變換后的像素變化情況。
(1)將事先處理完畢的可見光圖像與紅外圖像進行方向、尺度上的變化,以此得到不同圖像在頻率變化中的子帶系數(shù)。
(2)通過全方位分析不同子帶系數(shù)的相關(guān)特點,獲取不同的數(shù)據(jù)信息,進而結(jié)合圖像場景中的融合處理要求,選擇最適宜的融合方式,從而進行融合處理,最終得到不同圖像的子帶數(shù)據(jù)信息。
(3)通過上述流程能夠得到不同方向、尺度的融合系數(shù),在對融合系數(shù)進行相關(guān)變換后,最終獲得融合圖像。
融合規(guī)則主要運用區(qū)域性的計算方式,這種方式與窗口方式在運用過程中具有較大的相似性,具體不同主要體現(xiàn)在其沒有限制性的方形小窗,融合形狀可以選擇不同形式的形狀。這主要由于紅外圖像中所有目標在形狀都各有不同,運用上述規(guī)則形式可以適應(yīng)融合區(qū)域特點。
平均梯度指標主要是指圖像的清晰情況,其是衡量圖像清晰度的關(guān)鍵方式之一,具體代表圖像在垂直以及水平不同方向上的區(qū)別。平均梯度指標在實際應(yīng)用中能夠反映出圖像中紋理情況的變化程度,并且其對像素灰度有較大的敏感性。以下是平均梯度的相關(guān)公式:
信息熵主要是指圖像中價值水平較高的數(shù)據(jù)信息間的含量,也代表著圖像中像素灰度自身的頻率特點以及次數(shù)情況,因此能夠代表像素灰度情況的概率信息。信息熵的情況能夠直接預(yù)測著融合圖像自身的數(shù)據(jù)價值情況,這側(cè)面證明著融合效果的質(zhì)量情況[4]。以下是信息熵的相關(guān)公式:
E=-∑Pi×log2pi
互信息主要是用在觀察不同圖像間的相似情況,是圖像融合質(zhì)量的關(guān)鍵檢測方式之一?;バ畔?shù)據(jù)越大,就代表融合圖像中信息數(shù)據(jù)量越豐富,因此,其自身就具有較強的融合性。若融合圖像中A、B通過融合的方式生成了圖像F,則以下就是互信息的計算方式:
圖像中空間頻率主要是指圖像在不同方向中的相差數(shù)據(jù)值與垂直方向的相差數(shù)值之和,也可以理解為,其代表圖像自身的活躍情況。以下是空間頻率的相關(guān)公式:
SF=√(RF)2+(CF)2
標準差主要是指圖像在像素灰度與數(shù)據(jù)水平中的實際差異,在計算過程中代表著像素的類別,數(shù)據(jù)值越大就表明像素之間具有較大的差異,層次性就更顯著。以下是標準差的相關(guān)公式:
SD(F)=√1/M X N∑(F(i,j))-F)2
根據(jù)上述計算方式進行針對性的仿真實驗,主要是將可見光圖像與紅外線圖像進行對比;將變化算法與NSCT算法進行對比;將PCNN算法與其他算法進行對比。結(jié)合最終對比情況來看,運用變換算法的圖像在目標部分更加顯著,但融合圖像后沒有良好地保存相關(guān)數(shù)據(jù)信息,因此,運用上述計算方式的融合圖像質(zhì)量較差。運用NSCT算法的圖像在目標場景方面有較好的保留性,圖像顯示更加清晰,但在對比度方面仍有缺陷[5]。PCNN算法在場景融合過程中有高質(zhì)量的信息保存性,但在邊緣區(qū)域較為模糊,對比性較差。表1是上述方式的具體指標對比。
表1 圖像融合算法評價指標對比表
結(jié)合表1可以看出其他算法的融合圖像在平均梯度、信息熵、互信息、空間頻率以及標準差方面都有明顯的提高[6]。
綜上所述,圖像融合技術(shù)是數(shù)字媒體技術(shù)中較為關(guān)鍵的技術(shù)之一,其可以把不同設(shè)備收集到的圖像運用數(shù)字媒體技術(shù)進行相互融合,從而使圖像中的物體逐漸顯現(xiàn)。圖像融合技術(shù)可以儲存更多關(guān)鍵的場景,具有較高的準確性,為后續(xù)相關(guān)工作順利進行奠定堅實的基礎(chǔ)。