陳柯鑫, 范麗亞
(聊城大學數(shù)學科學學院, 山東聊城 252059)
隨著現(xiàn)代網(wǎng)絡(luò)的不斷普及和通信技術(shù)的高速發(fā)展,數(shù)字技術(shù)已廣泛應用于眾多領(lǐng)域,但是所需數(shù)字信息在收集或傳輸過程中通常會受到噪聲等因素的影響。例如,在錄制視頻時,周圍難免會有無關(guān)聲源及無關(guān)事物的發(fā)生,導致所錄視頻是多個聲源與圖像的疊加。除此之外,在視頻的傳輸過程中,電磁信號等噪聲同樣不可避免,因此如何從混合信息中快速、高效地分離所需信息成為亟待解決的問題。針對混合信號的分離,Jutten等[1]提出了盲源分離(blind source separation,BSS)法,該方法在未知混合方式的前提下直接從多個觀測到的混合信號中解析出原始信號。當信源具有統(tǒng)計獨立性并且瞬時混合時,BSS可以通過獨立成分分析(independent component analysis,ICA)實現(xiàn),該方法稱為BSS-ICA[2],是一種基于非高斯的通用轉(zhuǎn)換方法,常用于音頻處理[3-4]、生物醫(yī)學數(shù)據(jù)處理[5]、物理學[6-7]等領(lǐng)域。FastICA[5,8]是一種快速不動點ICA算法, 將神經(jīng)網(wǎng)絡(luò)的學習規(guī)則、梯度下降法轉(zhuǎn)化為不動點迭代,不需要自定義參數(shù),能快速找到非高斯獨立分量。ICA假設(shè)觀測值是獨立源的線性混合,所有階數(shù)的相互統(tǒng)計量都為0,該假設(shè)過于嚴格,導致在ICA過程中丟失一些重疊的共激活模式。Friman等[9]提出一種基于典型相關(guān)分析(CCA)的BSS法(BSS-CCA),該方法將各組分按相關(guān)性度量排序, 不需要對所有組分進行人工檢測, 并且對數(shù)據(jù)的高噪聲不敏感。 Liu等[10]提出了基于廣義正則CCA的BSS法, 并證實了廣義正則CCA可以成功地恢復原信號。 Karhunen等[11]提出了基于廣義CCA的BSS法,驗證了廣義CCA對合成數(shù)據(jù)集的分離具有良好的性能。Yu等[12]提出了基于多集CCA的BSS法,并應用于核磁共振數(shù)據(jù)分析[13-14]。上述各方法僅考慮了混合信號的分離。
與上述研究相比,關(guān)于混合圖像的BSS研究相對較少。Nuzillard等[15]將BSS應用于多光譜天文圖像,結(jié)果表明BSS可以用于提取一些特征。Lin等[16]對盲信號分離在圖像加密方面的應用進行了研究,將v(v∈+)個灰色源圖像與一個噪聲圖像混合加密,然后利用BSS進行分離。Jadhav等[17]利用BSS-ICA從水印圖像中檢測所有者的簽名,并證明了BSS-ICA方法有魯棒性。Hattay等[18]提出了一種基于BSS法的數(shù)字全息圖像重建和雙像去除的魯棒自聚焦方法,可以有效地去除同軸粒子數(shù)字全息圖中多余的雙像。以上方法僅研究了圖像的分離方法。
目前,信號與圖像(尤其是彩圖)共同混合分離的研究較少?;诖?,本文中研究信號與彩圖的混合分離,提出一種基于CCA的信號與彩圖混合分離方法(簡稱本文方法)。將m(m∈+)個長度為n(時間節(jié)點個數(shù),本文中隨機取n=120)的信號與m張彩圖混合,構(gòu)成n張混合彩圖,在此基礎(chǔ)上添加高斯白噪聲(以方差為0.01的噪聲為例),用以增加信息的模糊性。分離過程在一切信息均未知的情況下進行,僅利用CCA作為信號與彩圖分離工具。最后在McMaster數(shù)據(jù)集上,將本文方法與目前最常用的ICA法進行對比實驗。
給定2個隨機向量x∈p和y∈q(p,q∈+),它們的取值分別為p和q。CCA的基本思想是尋找典型方向wx∈p和wy∈q,使得投影后的隨機變量與之間具有極大相關(guān)性,即滿足準則
(1)
令
X=(x1,x2,…,xm)∈p×m,
Y=(y1,y2, …,ym)∈q×m,
em=(1,1,…,1)T∈m,
由于Cxx、Cyy為對稱非負定陣,并且
因此式(1)轉(zhuǎn)化為
(2)
(3)
(4)
式中λ(λ≠0)為拉格朗日算子。為了避免矩陣Cxx和Cyy的奇異性,將Cxx和Cyy正則化,即用Cxx+tIp×p替代Cxx,用Cyy+tIq×q替代Cyy,其中t>0為正則化參數(shù),I為單位矩陣。基于此,式(4)可轉(zhuǎn)化為廣義特征方程,即
Cxy(Cyy+tIq×q)-1Cyxwx=λ2(Cxx+tIp×p)wx。
(5)
為了求解方程(5),對矩陣Cxx+tIp×p進行特征值分解(eigen value decomposition, EVD),即Cxx+tIp×p=UΣxUT,其中U∈p×p為正交陣,Σx=diag(σ1,σ2, …,σp),σ1≥σ2≥…≥σp>0為Cxx+tIp×p的全部非零特征值,并記
可得
(6)
設(shè)rank(B)=r≤min{p,q},并對B進行奇異值分解(singular value decomposition, SVD),
(P1ΣB,0)QT,
式中:P=(P1,P2)∈p×p、Q∈q×q為正交陣;ΣB=diag(ζ1,ζ2,…,ζr),ζ1≥ζ2≥…≥ζr>0為B的所有非零奇異值,r∈+;P1=(p1,p2,…,pr)∈p×r。 可得
(7)
(8)
根據(jù)式(8),隨機向量x∈p(y∈q)的d個典型投影方向wx1,wx2,…,wxd(wy1,wy2,…,wyd)彼此正交,因此也相互獨立。
對于連續(xù)時間信號,卷積是一種特殊的積分運算。2個連續(xù)時間信號f1(η)和f2(η)的卷積運算為
式中:η為連續(xù)時間信號的時間點;τ∈。
如果把連續(xù)時間信號離散化,則卷積運算的定義可轉(zhuǎn)化為
式中:γ∈;x(η)、h(η)為參與運算的離散時間信號。
針對圖像的卷積運算是通過卷積核完成的,是圖像數(shù)字矩陣與卷積核加權(quán)的滑動求和過程。卷積核是卷積運算的核心,卷積核通常為3×3型或5×5型矩陣,矩陣各元素稱為卷積核的權(quán)重,和為1。卷積運算在滑動過程中權(quán)重不變,步幅依據(jù)任務(wù)而定,一般設(shè)為1。卷積運算的結(jié)果有2種:1)得到更小尺寸的圖像特征矩陣;2)通過對圖像矩陣上下左右填充0元素,得到相同尺寸的圖像特征矩陣。針對圖像的卷積運算常用于圖像特征提取、圖像濾波(平滑化)、基于梯度運算的邊緣提取等。
信號與彩圖的混合方法要求信號與信號、彩圖與彩圖、信號與彩圖之間相互獨立。首先,對彩圖Scaitu,l∈p×q×3(l=1,2,…,m)按RGB(紅、綠、藍三原色)3個通道進行分解,得到3張灰度圖像(簡稱灰圖)Rl∈p×q,Gl∈p×q,Bl∈p×q,l=1,2,…,m;其次,將各通道上的所有灰圖(每個通道有m個)與m個相同長度的信號按時間節(jié)點(節(jié)點個數(shù)n>>m)進行混合后添加高斯白噪聲;最后,將3個通道上的混合加噪后的灰圖按時間節(jié)點合成n個偽彩圖,并作為混合后的內(nèi)容,具體過程如圖1所示。
Rl、 Gl、 Bl—彩圖l(l=1,2,…,m)按RGB(紅、綠、藍三原色)3個通道進行分解得到3張灰度圖像(簡稱灰圖); R(k)、 G(k)、 B(k)—Rl、 Gl、 Bl按時間節(jié)點與m個信號混合后得到的灰圖, k=1,2,…,n; R′(k)、 G′(k)、 B′(k)—R(k)、 G(k)、 B(k)加噪后的圖像。圖1 信號與彩圖的混合過程
R(k)=R1V1(k)+R2V2(k)+…+RmVm(k)=
G(k)=G1V1(k)+G2V2(k)+…+GmVm(k)=
B(k)=B1V1(k)+B2V2(k)+…+BmVm(k)=
則各通道上的n個混合灰圖分別簡記為
基于CCA的信號與彩圖分離方法具體步驟如下。
R′(k)、 G′(k)、 B′(k)—R(k)、 G(k)、 B(k)加噪后的圖像,個傳輸彩圖分別在RGB (紅、綠、藍三原色)3個通道上分解得到的3組灰圖;對進行同尺寸的卷積運 算得到的3組特征矩陣;的向量化; 的向量化;經(jīng) 過CCA運算得到的3組典型投影方向;恢復的信號。圖2 利用典型相關(guān)分析(CCA)進行信號與彩圖分離的過程
vec(G1)V1(k)+vec(G2)V2(k)+…+vec(Gm)Vm(k)≈
k=1,2,…,n。
Vl(k),l=1,2,…,m,k=1,2,…,n。
進而有
同理可得
記
則分離的m個(離散)盲源信號為
為了驗證本文方法的有效性,利用McMaster數(shù)據(jù)集[19],與目前最常用的ICA法進行比較實驗。McMaster數(shù)據(jù)集包含18張格式為.tif的彩色圖片,每張圖片尺寸為500像素×500像素。本文中選用的卷積核為
隨機產(chǎn)生2個信號作為原始信號,如圖3所示,時間節(jié)點個數(shù)n=120。從McMaster數(shù)據(jù)集中隨機選取5組彩圖作為原始彩圖,如圖4所示。
(a)信號1
(b)信號2圖3 隨機產(chǎn)生的2個時間節(jié)點個數(shù)均為120的信號
實驗中圖4(a1)、 (b1)、 (c1)、 (d1)、 (e1)標記為每組的第1張彩圖,圖4(a2)、 (b2)、 (c2)、 (d2)、 (e2)標記為每組的第2張彩圖。為了直觀對比ICA法和本文方法的分離效果,以圖4(a1)、 (a2)為例,分離信號與彩圖的對比如圖5、 6所示。雙信號雙彩圖實驗中原始灰圖與分離灰圖及原始信號與分離信號的相似度對比如表1所示。從表中可以看出,不論是原始彩圖還是信號的分離,本文方法均遠優(yōu)于ICA法,尤其是對彩圖的恢復,相似度普遍提高30%左右,但是本文方法所消耗的時間較長。
圖7所示隨機產(chǎn)生的3個時間節(jié)點個數(shù)均為120的信號,圖8所示為從McMaster數(shù)據(jù)集中隨機選取的4組彩圖。以圖7中產(chǎn)生的信號與圖8中選取彩圖為例進行三信號三彩圖實驗。
圖8(a1)、 (b1)、 (c1)、 (d1)標記為每組的第1張彩圖,圖8(a2)、 (b2)、 (c2)、 (d2)標記為每組的第2張彩圖,圖8(a3)、 (b3)、 (c3)、 (d3)標記為每組的第3張彩圖,原始灰圖與分離灰圖或原始信號與分離信號間的相似度對比如表2所示。從表中可以看出,不論是原始彩圖的分離,還是信號的分離,利用CCA進行分離的方法均優(yōu)于ICA法,不僅恢復的相似度高且效果相對穩(wěn)定,但是利用CCA進行分離的方法在時間方面不占優(yōu)勢,消耗時間較長。為了直觀對比ICA法和本文方法的分離效果,以圖8(c1)、 (c2)、 (c3)為例,分離信號與彩圖的對比如圖9、 10所示。
(a1)第1組圖1(a2)第1組圖2(b1)第2組圖1(b2)第2組圖2(c1)第3組圖1(c2)第3組圖2(d1)第4組圖1(d2)第4組圖2(e1)第5組圖1(e2)第5組圖2圖4 從McMaster數(shù)據(jù)集中隨機選取的5組彩圖
(a)信號1
(b)信號2
(c)本文方法提取信號1(相似度為0.998 1)
(d)本文方法提取信號2(相似度為1.000 0)
(e)ICA法提取信號1(相似度為0.880 8)
(f)ICA法提取信號1(相似度為0.736 5) 本文方法—基于典型相關(guān)分析的信號與彩圖 混合分離方法;ICA法—獨立成分分析法。圖5 雙信號雙彩圖中分離信號的對比
表1 雙信號雙彩圖實驗中原始灰圖與分離灰圖及原始信號與分離信號的相似度對比
(a)信號1
(b)信號2
(c)信號3圖7 隨機產(chǎn)生的3個時間節(jié)點個數(shù)均為120的信號
(a1)第1組圖1(a2)第1組圖2(a3)第1組圖3(b1)第2組圖1(b2)第2組圖2(b3)第2組圖3(c1)第3組圖1(c2)第3組圖2(c3)第3組圖3(d1)第4組圖1(d2)第4組圖2(d3)第4組圖3圖8 從McMaster數(shù)據(jù)集中隨機選取的4組彩圖
表2 三信號三彩圖實驗中原始灰圖與分離灰圖及原始信號與分離信號的相似度對比
(a)信號1(b)信號2(c)信號3(d)本文方法提取信號1(相似度為0.965 2)(e)本文方法提取信號2(相似度為0.979 9)(f)本文方法提取信號3(相似度為0.889 6)(g)ICA法提取信號1(相似度為0.804 4)(h)ICA法提取信號2(相似度為0.754 6)(i)ICA法提取信號3(相似度為0.579 3)本文方法—基于典型相關(guān)分析的信號與彩圖混合分離方法; ICA法—獨立成分分析法。圖9 三信號三彩圖中分離信號的對比
本文中研究了信號與彩圖混合分離方法,并在分離過程中利用CCA作為信號與彩圖混合分離的工具,得到以下主要結(jié)論。
1)在McMaster數(shù)據(jù)集中,雙信號雙彩圖和多信號多彩圖的實驗證明了本文方法可以同時高質(zhì)量分離信號與彩圖。
2)在一切條件未知的情況下,McMaster數(shù)據(jù)集中與利用ICA法作為分離工具的對比實驗證明,本文方法的分離效果明顯優(yōu)于ICA法的分離效果。
本文方法在時間方面不占優(yōu)勢, 并且沒有考慮本文方法對其他信號與彩圖混合方法數(shù)據(jù)的分離效果; 此外, 本文中也沒有考慮卷積核的選擇對分離效果的影響, 在后續(xù)的工作中還將進一步研究。
(a)圖8(c1)(b)本文方法分離圖8(c1)(相似度為0.795 2)(c)ICA法分離圖8(c1)(相似度為0.606 2)(d)圖8(c2)(e)本文方法分離圖8(c2)(相似度為0.858 9)(f)ICA法分離圖8(c2)(相似度為0.437 7)(g)圖8(c3)(h)本文方法分離圖8(c3)(相似度為0.883 9)(i)ICA法分離圖8(c3)(相似度為0.274 5)本文方法—基于典型相關(guān)分析的信號與彩圖混合分離方法; ICA法—獨立成分分析法。圖10 三信號三彩圖中分離彩圖的對比