張 成,張莉茹,朱進兵,江勁波,韋 穗
(1.安徽大學 計算智能與信號處理教育部重點實驗室,安徽 合肥 230039;2.國防科技大學 先進激光技術安徽省實驗室,安徽 合肥 230037)
眾所周知,描述光波場特性的主要物理量有振幅、波長和相位,研究表明大部分的信息被編碼在相位中。由于可見光的振蕩頻率約為10Hz,現(xiàn)有的光學測量設備通常依賴于將光子轉換成電子(電流),無法直接記錄光場的相位信息,只能記錄其振幅或強度信息。因此需要通過測量振幅或強度來恢復丟失的光場相位信息,即相位恢復(phase retrieval,PR)。相位恢復問題在過去的幾十年中得到了大量的研究,廣泛應用于天文、光學和X射線等成像領域。
相位恢復是從復光場的傅里葉變換的振幅中恢復原復光場。相位恢復研究內容主要分為成像系統(tǒng)設計與相位恢復算法的設計。相位恢復算法主要可分為3大類:經(jīng)典Gerchberg-Saxton-Fienup(GSF)類算法、以PhaseLift為代表的凸優(yōu)化方法、以Wirtinger flow(WF)算法為代表的新一代非凸優(yōu)化方法。Candès等在2015年提出了一個基于WF的非凸優(yōu)化算法,先通過譜初始化獲得初始估計,再通過梯度更新下降來迭代細化初始估計,并能以很高的概率確保收斂到全局的最優(yōu)解。該算法不僅解決了傳統(tǒng)GSF等類算法收斂速度慢、容易進入“停滯”狀態(tài)的問題,也很輕松地克服了收斂到局部極小解的問題,同時,解決了PhaseLift等凸優(yōu)化算法的計算復雜度過高,難以進行尺度較大的2維信號重建的問題。
本文主要研究的是成像系統(tǒng)的設計。根據(jù)相位恢復算法需要的強度圖像數(shù)目的不同,可以分為:單強度相位恢復(single-intensity phase retrieval,SIPR)、雙強度相位恢復(double-intensity phase retrieval,DIPR)和多強度相位恢復(multiple-intensity phase retrieval,MIPR)。SIPR方法(包括GSF算法)僅需要單幅強度圖像(例如,頻域測量),但通常需要引入額外的先驗信息(prior knowledge)進行相位恢復,例如,非負性(nonnegativity)、支撐(support)約束、稀疏先驗(sparsity)等。SIPR和DIPR屬于迭代相位恢復(iterative phase retrieval, IPR)方法,雖然在一定程度上可以恢復相位,但是,面臨收斂速度較慢、易陷入“停滯”狀態(tài)及無法保證唯一性 (non-uniqueness)等缺點。為了改進上述的不足,MIPR方法進行多幅強度圖像的測量,因此通過使用不同的光學系統(tǒng)參數(shù)獲取多幅強度圖像以完成相位恢復。MIPR方法包括PhaseLift算法、WF算法、TWF(truncated Wirtinger flow)、TAF(truncated amplitude flow)算法等,主要通過改變光學成像系統(tǒng)中的物理參數(shù)獲得不同多樣性的測量值,例如,多距離、多掩膜、多旋轉角度、多方向、多平移、多頻率等等。但是,上述方法在獲取不同測量值的過程中往往需要不斷改變成像系統(tǒng)的物理結構,如調制成像平面的位置、旋轉透鏡角度等,從而導致成像結構較為復雜,需要精確移動或調整部分光學元件的空間位置,反復地對齊與校準,增加了相應的工作量。
在相位恢復問題中,最常見的傅里葉測量對應的是遠場(farfield,F(xiàn)F)測量或者在一個理想透鏡的焦平面上獲取測量值,菲涅耳場測量(Fresnel field,F(xiàn)rF)相比于遠場測量,可以通過不同的策略獲得更多的信息,例如,在不同傳播距離獲取多幅強度圖案,從而降低過采樣條件和(或)減少圖像平面上的支撐集上的大量先驗知識。
相位恢復的空間分辨率受到兩個因素的限制:傳播算子的低通濾波和傳感器像素的大小。對于傳播算子的低通濾波,在強度觀測中丟失了高頻空間信息,可以將其視為下采樣的真實目標,超分辨率成像允許補償這種次抽樣效應。而克服像素大小限制的一種直接方法是使用一系列橫向移位的全息圖或散斑模式的亞像素掃描。然而,運用傳統(tǒng)的光學成像系統(tǒng)來解決空間分辨率低下依然是一個巨大的挑戰(zhàn)。
基于傳統(tǒng)相位恢復受空間分辨率和圖像先驗知識的雙重限制,本文提出基于高速相位調制的菲涅耳場編碼衍射圖案實時獲取成像方法,采用純相位型硅基液晶(phase-only liquid crystal on silicon,PLCoS)或電可調透鏡(electronically tunable lens, ETL)兩種純相位型空間調制器實現(xiàn)光場相位信息的高速動態(tài)調制,包括ETL的可變距離的快速聚焦或PLCoS透鏡的靈活動態(tài)相位調制兩種成像系統(tǒng)。初始目標經(jīng)過ETL或PLCoS調制,調制后的光波通過自由空間傳播到記錄的平面,被CCD相機實時獲取多幅編碼衍射圖案(coded diffraction patterns, CDPs);將記錄的CDPs利用WF算法重建光場的復振幅。本文提出的ETL成像系統(tǒng)可以有效地避免離散空間光調制器(spatial light modulator,SLM)柵格化結構、難以對準及調制速度慢等劣勢。數(shù)值實驗驗證了本文方法的有效性和魯棒性,可用于高分辨率場景的高速記錄,具有較大的應用潛力。
b
中 恢復相位x
,在數(shù)學上可表述為求解如下非線性方程:A
為 系統(tǒng)的正向算子,m
為測量次數(shù),n
為信號長度,|·|算子表示取模運算。式(1)的振幅約束可以轉換為求解式(2)的二次約束:
y
為測量的強度值;a
為調制函數(shù)向量,與成像系統(tǒng)物理參數(shù)相關;上標 H為共軛轉置。采用最小二乘準則,將式(2)的問題轉化為基于強度的經(jīng)驗損失函數(shù)優(yōu)化問題,數(shù)學表達式如下:
z
相當于式(2)中的x
。WF算法是使用迭代優(yōu)化的方式求解式(3)的最小化問題,該方法主要由兩個部分組成:首先,通過譜方法來獲取較為精確的初始化估計值;然后,用一種類似于梯度下降算法的更新規(guī)則來迭代估計值。WF算法的流程如下。
1)WF算法的輸入:觀測值y
=(y
,y
,···,y
),觀測向量a
∈C,步長為 μ,迭代次數(shù)設置為T
。初始化常數(shù) λ,其公式為:n
為信號長度。2)通過求解矩陣Y
的最大特征值對應的特征向量x
?,使得x
?滿足‖x
?‖=λ,所得到的x
?為估計初始值。其中,矩陣Y
的表達式如下:m
為測量次數(shù)。3)最后從譜初估計的初始值x
?出發(fā),通過梯度更新的方法獲得確切的解x
?,迭代次數(shù)t
=1,2,···,T
,迭代更新如式(6)所示:對式(6)進行不斷迭代得到最終的重建結果。
與SIPR和DIPR方法相比,MIPR方法通過改變光學成像系統(tǒng)中的物理結構獲得不同的編碼衍射圖案(CDPs),無需先驗約束,通過利用不同的掃描策略(例如,重疊照明、多波長掃描、多角度照明、針孔掃描和多距離測量等方法),獲得最佳收斂和高精度重建。
但是,上述方法在獲取不同CDPs的過程中需要不斷改變成像系統(tǒng)的物理結構,不僅缺乏應用靈活性,而且增加了相應的工作量。因此,本文提出基于高速相位調制的菲涅耳場編碼衍射圖案實時獲取方法,其中的成像系統(tǒng)在獲取多幅強度測量圖案時,采用純相位空間調制和相位的動態(tài)調制,使得成像結構簡單且記錄過程簡便,大大減輕相應工作量。
相位恢復的成像系統(tǒng)如圖1所示。
圖1 遠場和菲涅耳場相位恢復的成像系統(tǒng)Fig. 1 Imaging system for farfield and Fresnel field phase retrieval
圖1(a)為傅里葉成像系統(tǒng)(等價于遠場FF成像系統(tǒng)),其中,ETL/PLCoS、CCD分別放置在透鏡L0的前焦面和后焦面,焦距為f
。菲涅耳場相位恢復記錄強度的成像光學系統(tǒng)設置如圖1(b)所示,物光場經(jīng)過ETL或PLCoS隨機調制,再通過自由空間傳播到Z
處的記錄平面(其中Z
為傳播距離),最終由光電探測器CCD記錄CDPs。傅里葉成像系統(tǒng)中,相位恢復的目的是從CCD上記錄的噪聲干擾測量的無相位非線性測量信號Y
中重建2維復光場X
,具體表示為:e
為成像系統(tǒng)的隨機噪聲;F
(·):C→C為線性算符,在傅里葉光學成像系統(tǒng)中線性算符F
(·)為經(jīng)過L
個掩膜調制的編碼衍射圖案成像模型,可表示為:X
為物體的復光場;M
為第l
個調制掩模,l
=1,2,···,L
; ⊙表示Hadamard積;FT
表示2維傅里葉變換。線性算符的伴隨算符(adjoint operator)為:
在菲涅耳場成像系統(tǒng)中,物光場經(jīng)過ETL/PLCoS隨機調制,再通過自由空間傳播到記錄平面,其編碼衍射圖案成像模型為:
為實現(xiàn)高精度相位恢復,需要構造具有高匹配度的線性算符及其伴隨算符,對于式(8)~(11)而言,要求:
D
為全1矩陣,即矩陣所有元素為1。為保證滿足式(12),最常見的選擇是設計隨機相位掩膜調制。因此,本文提出采用純相位型空間光調制器實現(xiàn)相位的動態(tài)調制,例如,純相位型硅基液晶(PLCoS)、電可調透鏡(ETL)等光學元件動態(tài)調制,獲取多幅不同的編碼衍射圖案用于相位恢復。PLCoS的調制函數(shù)表示為:
p
(x
,y
)為相位函數(shù),其值為[0,1]之間的均勻分布。ETL的調制函數(shù)可表示為:
k
=2π/λ。本文提出基于高速相位調制的菲涅耳場編碼衍射圖案實時獲取方法,運用WF算法在PLCoS/ETL純相位型空間光調制器獲取的菲涅爾場多幅編碼衍射圖案下重建復光場。其菲涅耳場相位恢復原理如圖2所示。
圖2 菲涅耳場相位恢復原理圖Fig. 2 Schematic diagram of Fresnel field phase retrieval
由圖2可知本文提出的方法包括4個主要模塊:1)初始化模塊,初始化位于物平面的復振幅,其由原始振幅和原始相位組成。2)調制函數(shù)生成模塊。純相位型空間光調制器的調制函數(shù)由振幅和相位兩部分組成,由于是純相位調制,振幅為單位振幅,而相位分布有兩種:一種是ETL產生的透鏡相位分布(ETL),另一種是PLCoS對應的是隨機相位調制(random phase modulation,RPM)的分布。3)記錄CDPs模塊。經(jīng)過ETL和PLCoS的隨機相位調制,沿著光軸傳播方向Z
處的探測平面記錄多幅編碼衍射圖案(CDPs)。4)重建模塊。利用WF算法從多幅編碼衍射圖案中分別恢復的復光場。為了驗證本文提出的基于高速相位調制的菲涅耳場編碼衍射圖案實時獲取方法的有效性和魯棒性,設計遠場(FF)和菲涅耳場(FrF)成像系統(tǒng)對比,實現(xiàn)5組仿真對比實驗。
驗證在菲涅耳場(FrF)與遠場(FF)成像條件下對比使用ETL和PLCoS隨機相位調制獲取不同CDPs重建復光場的可行性。選取尺寸為128×128像素的標準peppers和baboon圖像分別作為復光場的振幅和相位,其中,peppers圖像灰度值歸一化到[0,1]區(qū)間作為原始振幅,baboon圖像灰度值歸一化到(-π,π)作為原始相位分布,如圖3所示。
圖3 原始對象的振幅和相位Fig. 3 Amplitude and phase of the original object
用于生成CDPs的ETL/RPM的掩膜數(shù)量L
為15。菲涅耳場成像系統(tǒng)的傳播距離Z
是10 mm,波長為0.532 μm,原始測試對象的像素大小為5 μm×5 μm,ETL的可調焦距范圍是0.1~14.5 mm,其中步長為0.6 mm。實驗是在無噪聲條件下分別通過遠場和菲涅耳場成像系統(tǒng)生成不同的CDPs,并利用WF算法進行重建,設置WF算法的梯度下降的迭代次數(shù)為900。實驗使用了2種不同的純相位型空間調制器(ETL/PLCoS),對應2種不同的相位調制方式(ETL/RPM),分別在遠場(FF)和菲涅耳場(FrF)下共4種不同成像系統(tǒng)進行單次重建實驗,重建效果圖如圖4所示。圖4中,4列分別對應FF_ETL(遠場+ETL)、FF_RPM(遠場+ RPM),以及本文提出的FrF_ETL(菲涅耳場+ETL)和FrF_RPM(菲涅耳場+RPM)4種不同系統(tǒng)單次重建實驗結果,實驗得到的快速隨機調制的振幅、相位和強度測量都各有15個結果,僅各給出其中1個結果作為實例。當重建復振幅的信噪比(signal-to-noise ratio,SNR)約為40 dB,可以認為重建成功,4個不同成像系統(tǒng)的重建復振幅的SNR分別為357.27、292.90、315.22和280.02 dB。從圖4可以看出,無論是菲涅耳場(FrF)成像還是遠場(FF)成像,采用PLCoS/ETL隨機調制記錄的多幅編碼衍射圖案可以實現(xiàn)光場復振幅的有效重建,說明在菲涅耳場條件下采用PLCoS/ETL同樣可以實現(xiàn)菲涅耳場相位信息的有效獲取。
圖4 單次重建實驗對比Fig. 4 Comparison of single reconstruction experiments
本實驗采取不同掩膜數(shù)量,分別在FF_ETL、FF_RPM, FrF_ETL和FrF_RPM 4種不同成像系統(tǒng)下測試相位恢復性能與WF算法的梯度下降迭代次數(shù)之間的關系。測試對象是由標準Lena和baboon圖像分別作為振幅圖像和相位圖像合成的,歸一化方式與第3.1節(jié)相同,其像素大小與第3.1節(jié)保持一致。分別在遠場和菲涅耳場中通過ETL和RPM隨機相位調制生成多幅編碼衍射圖案,其中,不同成像系統(tǒng)對應不同的相位掩膜生成方式,均在不同數(shù)量掩膜下進行單次重建實驗,將梯度下降的迭代次數(shù)分別設置為150、300、450、600、750、900、1 000,利用SNR評估重建復振幅的質量,判斷成功重建的標準是在無噪聲下重建復振幅的SNR約為40 dB。重建復振幅的SNR隨著迭代次數(shù)的變化曲線如圖5所示。從圖5中可以看出,總體而言,隨著迭代次數(shù)的增加,從4種成像系統(tǒng)記錄的CDPs中重建復振幅的SNR也逐漸增加。
由圖5還可知:當WF算法梯度下降的迭代次數(shù)達到900次時,4種成像系統(tǒng)在不同掩膜數(shù)量下的重建性能基本保持穩(wěn)定,所以本文后續(xù)實驗都選取迭代次數(shù)為900。對于不同的成像系統(tǒng),成功重建所需的最少掩膜數(shù)量不同。在遠場成像條件下,采用ETL(即FF_ETL)相位掩膜調制需要的最少編碼衍射圖案數(shù)目(即掩膜數(shù)量)L
=7(
L
≤6時重建失?。?,而RPM(即FF_RPM)需要的最少掩膜數(shù)量L
=8(
L
≤7時重建失?。?。在菲涅耳場成像條件下,采用ETL(即FrF_ETL)相位掩膜調制需要的最少掩膜數(shù)量L
=11,此時重建復振幅的SNR約為40 dB,可以認為重建成功,而RPM(即FrF_RPM)需要的最少掩膜數(shù)量L
=7(L
≤6時重建失?。嶒灲Y果表明,在遠場成像和菲涅耳場成像條件下使用ETL或RPM隨機調制可以實現(xiàn)復光場的有效調制與高質量重建。圖5 SNR隨著迭代次數(shù)變化的曲線Fig. 5 Curves of SNR with iteration times
L
=14時,這4種成像系統(tǒng)的性能基本趨于一致。在L
=7時:FF_ETL的ASNR數(shù)值較高,結合圖6(b)可知此時其重建成功率接近60%;而此時FF_RPM的ASNR數(shù)值較低,結合圖6(b)可知,此時其重建成功率接近20%,在L
=8時,其重建成功率提升到接近80%。在L
=7時,F(xiàn)rF_RPM的ASNR數(shù)值較高,結合圖6(b)可知,此時其重建成功率接近40%,而在L
=8時其重建成功率提升到接近90%。在L
= 6~11時,F(xiàn)rF_ETL的ASNR數(shù)值增長較緩慢,其性能最差??偟膩碚f,圖6(b)的重建成功率曲線與圖6(a)曲線的走勢規(guī)律基本一致。圖6 ASNR和重建成功率隨著腌膜數(shù)量變化的曲線Fig. 6 Curves of ASNR and the success rates of reconstruction with the change of the number of salted films
Y
加入不同SNR的噪聲,噪聲的加入通過MATLAB軟件自帶的awgn函數(shù)來實現(xiàn);調整加性高斯白噪聲方差使得測量值的輸入信噪比(input signal-to-noise ratio,ISNR)在10~50 dB之間,步長為5 dB,其中,ISNR=SNR(|F
(X
),Y
|),ISNR值反映成像系統(tǒng)中的測量噪聲水平;由于隨機噪聲的不確定性,不同噪聲水平實驗在相同參數(shù)下獨立運行50次,并計算重建復振幅的ASNR;在不同的成像系統(tǒng)和不同數(shù)量的掩膜下得到ASNR隨著ISNR(噪聲水平)變化的曲線如圖7所示。圖7 ASNR隨著噪聲水平變化的曲線Fig. 7 Curves of ASNR changing with different noise levels
從圖7中可以看出:總體而言,隨著測量值Y
的ISNR值增大,即測量噪聲方差減小,ASNR逐漸增加。隨掩膜數(shù)量的增加,不同成像系統(tǒng)的ASNR的差異較大,這反映了不同成像系統(tǒng)的抗噪聲性能的差異。對于遠場系統(tǒng),無論是ETL還是RPM隨機調制,通過WF算法都可以實現(xiàn)復光場的精確重建,當掩膜數(shù)量L
≥8時,F(xiàn)F_ETL和FF_RPM的ASNR近似與ISNR(噪聲水平)呈線性增長。掩膜數(shù)量的增加對重建ASNR有一定的提高,但提高不明顯。相比遠場系統(tǒng),菲涅耳場成像系統(tǒng)中無論是ETL還是RPM隨機調制,其復光場的重建ASNR值要略差,也就是說菲涅耳場系統(tǒng)的抗噪性較差。在菲涅耳場的兩種相位調制方式中,對于FrF_ETL,只有當掩膜數(shù)目L
≥12時ASNR與ISNR(噪聲水平)呈現(xiàn)出與遠場成像類似的線性關系;對于FrF_RPM,當L
≥9時ASNR與ISNR(噪聲水平)呈現(xiàn)出與遠場成像類似的線性關系;因此FrF_ETL抗噪聲性能最差。其背后深層原因是菲涅耳場系統(tǒng)中ETL的可調控自由度要遠遠小于利用PLCoS調制的RPM的可調控自由度。ETL只有1個自由度,即可變焦距f
,通過改變焦距,來改變ETL的相位分布;而PLCoS的自由度為M
×N
×L
。但是,隨著掩膜數(shù)量L
的增加,ETL透鏡測量的多樣性也可以達到PLCoS相位調制類似的效果。需要強調的是,電可調透鏡ETL利用其高速變焦距功能,可用于高速獲取多次曝光的編碼衍射圖案,則適用于快速和大尺度場景的相位恢復,并且具有快速、高分辨率、大景深(depth-of-field,DOF)、高靈敏度和低成本成像等優(yōu)點。此外,PLCoS是離散柵格結構,其調制速度遠遠低于ETL。測試在FF_ETL和FF_RPM成像系統(tǒng)下使用WF、TWF、TAF不同算法的重建質量與掩膜數(shù)量之間的關系。測試對象以及其生成方式、隨機相位調制方式及像素大小與第3.2節(jié)保持一致,WF算法梯度下降的迭代次數(shù)為900。針對不同算法和不同數(shù)量的掩膜進行單次重建實驗,利用SNR評估重建復振幅的質量,不同算法隨著掩膜數(shù)量變化如圖8所示。
圖8 不同算法隨著掩膜數(shù)量變化的曲線Fig. 8 Curves of changes of different algorithms with the number of masks
從圖8可以看出,隨著掩膜數(shù)量的增加,3種算法從遠場成像系統(tǒng)記錄的CDPs中重建復振幅的SNR也逐漸增加。當掩膜數(shù)量為大致為7時,3種算法的重建性能基本保持穩(wěn)定,所以,WF、TWF、TAF這3種算法在FF_ETL和FF_RPM成像系統(tǒng)下即使掩膜數(shù)量發(fā)生變化,也能夠較好地重建振幅和相位。
本文提出一種基于高速相位調制的菲涅耳場編碼衍射圖案實時獲取方法,將多幅編碼衍射圖案運用WF算法可實現(xiàn)相位的最佳收斂和高精度重建,無需額外的先驗知識。其基本思想是采用純相位型空間調制器進行相位的動態(tài)調制,其中,包括ETL的可變距離的快速聚焦或純相位PLCoS透鏡的靈活動態(tài)相位調制,ETL成像系統(tǒng)可以有效地避免離散空間光調制器(spatial light modulator,SLM)柵格化結構、難以對準和調制速度慢等劣勢;并且不需要透鏡等裝置,可以直接傳播到記錄平面;在采集階段,使用一系列橫向移位的全息圖克服像素大小的限制,能夠得到多幅不一樣的編碼衍射圖案;在復振幅重建階段,無需額外的先驗知識,使用WF算法能夠較好地重建振幅和相位信息。對本文方法進行單次重建實驗,由實驗結果可以看出,菲涅耳場成像采用PLCoS或ETL隨機調制記錄多幅編碼衍射圖案,可以實現(xiàn)光場復振幅的有效重建。本文通過對遠場(FF)和菲涅耳場(FrF)在不同迭代次數(shù)、不同掩膜數(shù)量、不同噪聲水平及不同算法下分別進行對比實驗,一系列的測試結果表明本文方法的有效性和魯棒性。相比于傳統(tǒng)獲取多強度的成像系統(tǒng),本文所提出的成像系統(tǒng)更為緊湊和簡單,避免了反復對齊與校準的工作量,具有重要的應用潛力。本文方法可用于實時采集多幅編碼衍射圖樣,適用于快速和大規(guī)模相位恢復場景,并且具有高分辨率和可擴展性等優(yōu)勢?;诂F(xiàn)有的工作,所提成像系統(tǒng)中PLCoS與CCD之間的距離等參數(shù)會直接影響著測試系統(tǒng)的性能,下一步研究中要對實驗參數(shù)進行更加精確的測量,以保證獲得更準確的結果。