摘要:當(dāng)圖像對(duì)比度低或者光照條件復(fù)雜時(shí),圖像目標(biāo)形狀、顏色等特征都具有很高的變異性,難以準(zhǔn)確地識(shí)別目標(biāo)邊界,導(dǎo)致圖像分割結(jié)果中目標(biāo)區(qū)域與真實(shí)標(biāo)注的重合程度較低。為此,文章研究基于生成對(duì)抗網(wǎng)絡(luò)的小波域自適應(yīng)圖像分割技術(shù)。該技術(shù)利用小波域分析基函數(shù),將圖像從空間域轉(zhuǎn)換為模糊集域;考慮圖像對(duì)比度,計(jì)算圖像變換的擴(kuò)散強(qiáng)度與各向同性擴(kuò)散系數(shù);采用反模糊變換函數(shù)恢復(fù)圖像中存在的模糊效應(yīng),獲取目標(biāo)邊緣增強(qiáng)的圖像,計(jì)算圖像像素之間的相似度;通過(guò)引入距離信息,計(jì)算分割圖像的相對(duì)熵和權(quán)值,對(duì)生成對(duì)抗網(wǎng)絡(luò)進(jìn)行優(yōu)化處理,實(shí)現(xiàn)圖像的自適應(yīng)分割。實(shí)驗(yàn)結(jié)果表明,所提技術(shù)可以對(duì)圖像進(jìn)行精準(zhǔn)分割,并保留豐富的細(xì)節(jié)信息,平均重疊率達(dá)到了96.3%,分割準(zhǔn)確性較高,這表明該技術(shù)在圖像分割任務(wù)中具有較高的可靠性,為后續(xù)的圖像處理任務(wù)提供高質(zhì)量的輸入數(shù)據(jù)。
關(guān)鍵詞:生成對(duì)抗網(wǎng)絡(luò);小波域分析;圖像分割;邊緣增強(qiáng)
中圖分類(lèi)號(hào):TP391文獻(xiàn)標(biāo)志碼:A
0引言
在低對(duì)比度或復(fù)雜的光照條件下,圖像目標(biāo)的邊界通常會(huì)變得模糊不清。由于目標(biāo)邊界模糊或特征變異性,分割算法容易出現(xiàn)誤判或誤分的情況,即將背景中的雜亂部分誤認(rèn)為是目標(biāo),或?qū)⒛繕?biāo)的一部分誤認(rèn)為背景,使分割結(jié)果中目標(biāo)區(qū)域與真實(shí)標(biāo)注的重合程度較低。為了提高圖像分割的準(zhǔn)確性,在以上背景下,張榮國(guó)等[1]利用流形學(xué)習(xí)非線(xiàn)性降維方法獲取每個(gè)視圖的譜嵌入矩陣,將不同視圖的信息進(jìn)行融合,通過(guò)對(duì)一致性圖矩陣展開(kāi)非負(fù)正交矩陣分解,保留圖像的非負(fù)性質(zhì),得到圖像分割結(jié)果。流形學(xué)習(xí)方法對(duì)異常圖像特征比較敏感,當(dāng)圖像中存在噪聲或異常點(diǎn)時(shí),會(huì)影響流形學(xué)習(xí)的降維效果和分割結(jié)果;張軍等[2]利用混沌映射來(lái)優(yōu)化改進(jìn)鬣狗算法,提升種群的豐富性,結(jié)合非線(xiàn)性收斂因子調(diào)節(jié)機(jī)制,獲取圖像分割最優(yōu)閾值。引入混沌映射和非線(xiàn)性收斂因子調(diào)節(jié)機(jī)制會(huì)導(dǎo)致算法在訓(xùn)練集上過(guò)度擬合,導(dǎo)致圖像分割的準(zhǔn)確性明顯降低。為此,本文研究基于生成對(duì)抗網(wǎng)絡(luò)的小波域自適應(yīng)圖像分割技術(shù)?;谏蓪?duì)抗網(wǎng)絡(luò),該技術(shù)實(shí)現(xiàn)了對(duì)圖像的自適應(yīng)分割,提高了分割算法的準(zhǔn)確性和魯棒性。
1基于小波域分析的圖像目標(biāo)邊緣增強(qiáng)
基于小波域分析的圖像目標(biāo)邊緣增強(qiáng)方法通過(guò)突出目標(biāo)邊界的特征,使其更加清晰和明顯,從而有助于分割算法準(zhǔn)確地識(shí)別目標(biāo)邊界。小波變換可以將圖像分解成不同尺度下的頻率成分,從而能更好地捕捉圖像的局部特征,包括邊緣信息[3]。因此,所構(gòu)建的小波域分析基函數(shù)如下:
φ=cos2ω2f(|mo|2)(1)
其中,ω表示圖像分解頻率,f(·)表示時(shí)域函數(shù),mo表示小波域變換控制系數(shù),o表示圖像頻率因子。本文利用各向同性擴(kuò)散系數(shù)來(lái)計(jì)算像素點(diǎn)的灰度,可以解決圖像分割中的模糊細(xì)節(jié)問(wèn)題;通過(guò)調(diào)整擴(kuò)散系數(shù),可以改變像素點(diǎn)之間的灰度流動(dòng)速度,從而增強(qiáng)圖像中的細(xì)節(jié)。圖像灰度表達(dá)式如下:
qm=φ×Y(2)
其中,Y表示擴(kuò)散系數(shù)調(diào)整因子。本文通過(guò)反模糊變換,恢復(fù)圖像中存在的模糊效應(yīng),并且可以使得目標(biāo)的邊緣更加清晰。引入反模糊變換函數(shù),獲取目標(biāo)邊緣增強(qiáng)的圖像為:
Am=arcsinqm2(3)
本文利用小波域方法對(duì)圖像增強(qiáng)處理,以提高在低光照和復(fù)雜光照條件下的分割準(zhǔn)確性;通過(guò)突出目標(biāo)邊緣特征和灰度對(duì)比調(diào)整等步驟,有效增強(qiáng)了圖像邊緣,提高了分割算法的準(zhǔn)確性和可靠性。
2基于生成對(duì)抗網(wǎng)絡(luò)的圖像自適應(yīng)分割
利用生成對(duì)抗網(wǎng)絡(luò)對(duì)目標(biāo)邊緣增強(qiáng)后的圖像自適應(yīng)分割過(guò)程如下。
(1)對(duì)目標(biāo)邊緣增強(qiáng)后的圖像尺度歸一化處理。
(2)計(jì)算圖像像素之間的相似度γ,其表達(dá)式如下:
γ=(ri-rj)2+(gi-gj)2+(bi-bj)2(4)
其中,ri、rj、gi、gj、bi和bj分別表示2個(gè)相鄰像素點(diǎn)對(duì)應(yīng)的紅、綠、藍(lán)3種顏色的強(qiáng)度值。
(3)通過(guò)小波域分析技術(shù)獲取圖像的邊緣增強(qiáng)信息,將反模糊變換函數(shù)處理得到的邊緣增強(qiáng)圖像輸入生成對(duì)抗網(wǎng)絡(luò),判別網(wǎng)絡(luò)會(huì)區(qū)分生成的結(jié)果和真實(shí)圖像。
(4)將輸入的目標(biāo)邊緣增強(qiáng)圖像與對(duì)應(yīng)的期望輸出(真實(shí)的分割結(jié)果)展開(kāi)重復(fù)訓(xùn)練,使得生成網(wǎng)絡(luò)能夠輸出清晰的分割結(jié)果[4]。根據(jù)以上對(duì)生成對(duì)抗網(wǎng)絡(luò)的優(yōu)化,構(gòu)建圖像自適應(yīng)分割表達(dá)式如下:
ψ(x,y)=γAm(5)
本文采用生成對(duì)抗網(wǎng)絡(luò)分割圖像,在生成對(duì)抗網(wǎng)絡(luò)的訓(xùn)練過(guò)程中,引入像素相似度計(jì)算以及距離和相對(duì)熵的優(yōu)化,有助于提升了網(wǎng)絡(luò)對(duì)圖像分割任務(wù)的特征表示能力,使分割結(jié)果更加平滑、連貫,減少過(guò)度分割的情況。
3實(shí)驗(yàn)分析
本文實(shí)驗(yàn)選取一個(gè)廣泛使用且具有代表性的ADE20K圖像數(shù)據(jù)集,以城市道路、建筑俯瞰圖為對(duì)象,從中選擇500個(gè)圖像組成訓(xùn)練集來(lái)進(jìn)行訓(xùn)練和驗(yàn)證。為了確保所選數(shù)據(jù)具有代表性,能夠反映整個(gè)數(shù)據(jù)集的多樣性,本文展開(kāi)如下實(shí)驗(yàn)。本文選取張榮國(guó)等[1]的基于流形學(xué)習(xí)分割方法、張軍等[2]的基于改進(jìn)鬣狗分割方法作為本文生成對(duì)抗網(wǎng)絡(luò)分割技術(shù)的對(duì)比方法。為了清晰化展示實(shí)驗(yàn)結(jié)果的可對(duì)比性,從500個(gè)訓(xùn)練集圖像中選取一個(gè)具代表性的圖像樣本,不同方法下圖像的分割實(shí)驗(yàn)結(jié)果如圖1所示。
在圖1所示的分割結(jié)果中,張榮國(guó)等[1]的方法在圖像分割中表現(xiàn)出一定的效果,能夠較為準(zhǔn)確地識(shí)別出城市道路和建筑的基本輪廓。然而,該方法在處理復(fù)雜場(chǎng)景和細(xì)節(jié)部分時(shí),分割效果相對(duì)較弱,容易出現(xiàn)誤分割和邊緣模糊的情況。張軍等[2]的方法在分割精度上有所提升,特別是在處理邊緣細(xì)節(jié)方面表現(xiàn)出更好的性能。然而,該方法在應(yīng)對(duì)圖像中的噪聲和紋理變化時(shí),仍存在一定的局限性,導(dǎo)致分割結(jié)果不夠平滑和連貫。而本文所提分割技術(shù)展現(xiàn)出了顯著的優(yōu)勢(shì)。該方法利用生成對(duì)抗網(wǎng)絡(luò)的強(qiáng)大學(xué)習(xí)能力,通過(guò)自適應(yīng)調(diào)整小波域特征,實(shí)現(xiàn)了對(duì)圖像中城市道路和建筑的精準(zhǔn)分割。在實(shí)驗(yàn)中,該技術(shù)準(zhǔn)確地識(shí)別了圖像中的主要物體,保留了豐富的細(xì)節(jié)信息,具有較強(qiáng)的魯棒性,能夠有效應(yīng)對(duì)圖像中的紋理變化。
平均重疊率不僅關(guān)注整體分割區(qū)域的準(zhǔn)確性,還重視物體邊界的分割效果。在圖像分割任務(wù)中,邊界信息的準(zhǔn)確性對(duì)于整體分割結(jié)果至關(guān)重要。平均重疊率能夠充分考慮這一點(diǎn),從而更全面地評(píng)價(jià)分割技術(shù)的性能。平均重疊率越高,意味著分割結(jié)果與真實(shí)標(biāo)注之間的吻合度高,即分割性能良好。平均重疊率結(jié)果如表1所示。
根據(jù)表1中實(shí)驗(yàn)結(jié)果,在500個(gè)圖像樣本的測(cè)試中,所提技術(shù)的平均重疊率達(dá)到了96.3%,而張榮國(guó)等[1]和張軍等[2]的方法分別只有87.9%和83.6%。這充分說(shuō)明所提技術(shù)在處理城市道路和建筑俯瞰圖的圖像分割任務(wù)時(shí),具有更高的分割準(zhǔn)確性。這是因?yàn)樗峒夹g(shù)采用了反模糊變換函數(shù)來(lái)恢復(fù)圖像中的模糊效應(yīng),使得分割后的圖像邊緣得以增強(qiáng),有利于減少邊緣模糊的影響,從而提高了分割的精準(zhǔn)度。通過(guò)生成對(duì)抗網(wǎng)絡(luò)的損失函數(shù)實(shí)現(xiàn)對(duì)圖像的自適應(yīng)分割,可以根據(jù)不同圖像的特點(diǎn)和內(nèi)容進(jìn)行靈活調(diào)整,提高了重疊率。所提技術(shù)在圖像分割任務(wù)中表現(xiàn)出了顯著的優(yōu)勢(shì)。該技術(shù)不僅具有更高的分割準(zhǔn)確性,還能夠在不同場(chǎng)景下保持穩(wěn)定且可靠的性能。
4結(jié)語(yǔ)
本文研究了一種基于生成對(duì)抗網(wǎng)絡(luò)的小波域自適應(yīng)圖像分割技術(shù)。該技術(shù)將圖像從空間域轉(zhuǎn)換為模糊集域時(shí),利用小波域分析基函數(shù)進(jìn)行轉(zhuǎn)換,這有助于更好地理解圖像特征在頻率和空間上的分布規(guī)律,提高了圖像處理的效率和準(zhǔn)確性。該技術(shù)采用反模糊變換函數(shù)來(lái)恢復(fù)圖像中存在的模糊效應(yīng),實(shí)現(xiàn)了對(duì)目標(biāo)邊緣的增強(qiáng),可以更清晰地展現(xiàn)圖像中的邊緣信息,提高了圖像的視覺(jué)效果和識(shí)別能力。通過(guò)計(jì)算圖像像素之間的相似度、引入距離信息,本文計(jì)算了分割圖像的相對(duì)熵和權(quán)值,優(yōu)化了生成對(duì)抗網(wǎng)絡(luò)的分割性能,使得分割結(jié)果更加準(zhǔn)確和合理。通過(guò)實(shí)驗(yàn)結(jié)果,該技術(shù)的平均重疊率和分割準(zhǔn)確性較高,同時(shí)兼顧了細(xì)節(jié)信息的保留和自適應(yīng)分割特性,在圖像分割領(lǐng)域具有明顯優(yōu)勢(shì),能夠?yàn)閳D像分割任務(wù)帶來(lái)更加可靠和有效的解決方案。
參考文獻(xiàn)
[1]張榮國(guó),曹俊輝,胡靜,等.基于非負(fù)正交矩陣分解的多視圖聚類(lèi)圖像分割算法[J].模式識(shí)別與人工智能,2023(6):556-571.
[2]張軍,溫秀平,陳巍.融合改進(jìn)鬣狗優(yōu)化和Tsallis熵的圖像分割[J].計(jì)算機(jī)工程與設(shè)計(jì),2022(12):3493-3502.
[3]劉家齊.基于小波域的數(shù)字化媒體圖像自適應(yīng)模糊去重算法[J].吉林大學(xué)學(xué)報(bào)(信息科學(xué)版),2023(4):701-708.
[4]卿粼波,吳夢(mèng)凡,劉剛,等.基于小波域ADMM深度網(wǎng)絡(luò)的圖像復(fù)原算法[J].工程科學(xué)與技術(shù),2022(5):257-267.
(編輯沈強(qiáng)編輯)
Adaptive image segmentation technology of wavelet domain based on generative adversarial networks
LIANG" Lixiang, LI" Huaiying, HE" Chengyi
(Kaili university, Kaili 556011, China)
Abstract: When the image contrast is low or the lighting conditions are complex, the image target shape, color and other characteristics have high variability, and it is difficult to accurately identify the target boundary, resulting in a low degree of overlap between the target area and the real annotation in the image segmentation results. To this end, the wavelet domain adaptive image segmentation technology based on generative adversarial networks is studied. Using the wavelet domain analysis basis function, the image is converted from the spatial domain to the fuzzy set domain. Considering the image contrast, the diffusion intensity of the image transformation is calculated. By using anti blur transformation function to restore the blurring effect in the image, the image with enhanced target edges is obtained, and the similarity between image pixels is calculated. The relative entropy and weight of the segmented image are calculated by introducing the distance information, furthermore to optimize the processing tasks of the generative adversarial network and realize the adaptive segmentation of the image. The experimental results show that the proposed technology can accurately segment the image and retain the rich detailed information. The average overlap rate reaches 96.3%, and the segmentation accuracy is high, indicating that the technology has high reliability in the image segmentation task and provides high quality input datas for the subsequent image processing tasks.
Key words: generative adversarial network; wavelet domain analysis; image segmentation; edge enhancement
無(wú)線(xiàn)互聯(lián)科技2024年14期