馬 媛, 李日浩, 張偉峰
華南農(nóng)業(yè)大學(xué)數(shù)學(xué)與信息學(xué)院, 廣東 廣州 510642
顏色是人們觀察和理解事物的重要信息, 但它并非是固定不變的, 而是人眼對(duì)特定環(huán)境下光刺激的視覺(jué)感受。 物體的真實(shí)顏色是由其表面的光譜反射率決定[1], 即對(duì)照射在它上面的不同波長(zhǎng)的可見(jiàn)光反射的光通量與入射的光通量之比。 獲取光譜反射率的專(zhuān)用儀器價(jià)格昂貴、 步驟繁雜緩慢、 空間分辨率低, 使得其無(wú)法滿足廣泛的應(yīng)用需求。 因此利用民用設(shè)備如相機(jī)、 掃描儀等進(jìn)行光譜反射率重建的問(wèn)題得到了廣泛的關(guān)注與研究, 如壁畫(huà)藝術(shù)品的顏色復(fù)原[2]等。
光譜反射率重建可以看作是利用訓(xùn)練樣本找到相機(jī)的RGB三維響應(yīng)值向量與對(duì)應(yīng)的高維光譜反射率向量間的映射關(guān)系, 這是一個(gè)病態(tài)的反問(wèn)題。 重建算法中訓(xùn)練樣本的選擇至關(guān)重要, 從樣本的使用角度可以分為全局學(xué)習(xí)方法[3-7]和局部學(xué)習(xí)方法[8-9], 前者利用所有訓(xùn)練樣本構(gòu)建適用于所有待測(cè)樣本的單一映射模型, 其存在的問(wèn)題是嚴(yán)重依賴(lài)于大量分布較好的訓(xùn)練樣本, 而在實(shí)際情況中較難滿足。 有學(xué)者研究從全部訓(xùn)練樣本中選擇最有代表性的樣本來(lái)克服樣本分布偏差問(wèn)題, 如Hardeberg等[5]提出了比較所選訓(xùn)練樣本的光譜反射率矩陣的最大最小奇異值之比的最小條件數(shù)法; Mohammadi等[6]提出了基于光譜空間距離進(jìn)行聚類(lèi)的方法; Shen等[7]提出了特征向量和虛擬成像結(jié)合的方法, 通過(guò)最小化總反射率均方根誤差來(lái)選擇樣本。 局部學(xué)習(xí)方法根據(jù)每個(gè)待測(cè)樣本挑選一組局部訓(xùn)練樣本構(gòu)建獨(dú)立的映射模型, 這種方法模型簡(jiǎn)單且自適應(yīng)能力強(qiáng), 具有良好的泛化能力, 適用性更廣。 局部學(xué)習(xí)方法中的局部樣本選擇方法是一個(gè)重要的研究問(wèn)題, 最常見(jiàn)的局部樣本選擇方法是基于向量夾角距離, 曾茜等[8]提出了將向量夾角大小作為待測(cè)樣本與訓(xùn)練樣本的相似度度量, 其出發(fā)點(diǎn)是考慮光譜向量的形態(tài)信息; 任澳等[9]提出了基于加權(quán)歐氏距離來(lái)選取訓(xùn)練樣本, 目的是克服歐氏距離不同維度度量的影響。 上述局部樣本選擇方法都為了達(dá)到少而精的效果, 挑選出具有典型代表性的樣本, 但都沒(méi)有同時(shí)考慮光譜反射率向量空間與色彩空間的信息, 僅考慮了單一的一種空間, 并不是最優(yōu)的樣本選擇方法。 光譜反射率向量是一條光滑的曲線[10], 訓(xùn)練樣本的選擇應(yīng)該既要考慮光譜反射率空間距離相近, 也要考慮光譜反射率向量形狀相似, 針對(duì)曾茜等提出的向量夾角距離忽略了光譜反射率向量空間距離的相近和任澳等提出的加權(quán)歐氏距離忽略了光譜反射率中形狀的相似性, 本文提出一種改進(jìn)加權(quán)歐氏距離, 該距離可以同時(shí)滿足以上兩個(gè)光譜特性來(lái)進(jìn)行光譜反射率重建, 同時(shí)兼顧歐氏空間與色度空間的精度, 實(shí)驗(yàn)結(jié)果表明本文方法能更有效且全面地利用信息, 提高重建精度。
相機(jī)成像的數(shù)學(xué)模型可以表示為
(1)
式(1)中:i為相機(jī)成像的第i個(gè)通道,i=1, 2, 3分別表示相機(jī)成像的RGB三個(gè)通道;Pi為相機(jī)成像的第i個(gè)通道的輸出值;R(λ)為物體表面在波長(zhǎng)為λ下的光譜反射率;E(λ)為光照條件在波長(zhǎng)為λ下的光譜能量;Qi(λ)為相機(jī)第i個(gè)通道在波長(zhǎng)為λ下的光譜感應(yīng)值;δi為第i個(gè)通道的系統(tǒng)噪聲。 通常, 在可見(jiàn)光波長(zhǎng)范圍400~700 nm按10 nm等間距采樣得到一個(gè)列向量為31×1的光譜反射率y。 因此式(1)可以用離散形式表示為
x=My+δ
(2)
式(2)中:x為相機(jī)生成的3×1 RGB響應(yīng)值向量;M為3×31的光譜響應(yīng)矩陣, 該矩陣包含了成像環(huán)境的先驗(yàn)信息, 即傳感器的光譜感應(yīng)度信息和光照的光譜能量信息;y為31×1的光譜反射率向量;δ為3×1的系統(tǒng)噪聲向量。
(3)
(4)
曾茜等[8]提出了利用待測(cè)樣本與訓(xùn)練樣本之間的向量夾角距離大小判斷兩者間的相似度, 進(jìn)而篩選出更有效的樣本重建光譜反射率, 如式(5)所示
(5)
式(5)中:a為待測(cè)樣本向量;bi為第i個(gè)訓(xùn)練樣本向量;l為訓(xùn)練樣本集的數(shù)量;ei為待測(cè)樣本與第i個(gè)訓(xùn)練樣本的相似度。 將向量夾角大小作為相似度, 選取前p個(gè)構(gòu)成矩陣形式的色差值權(quán)重e[8], 見(jiàn)式(6)
(6)
(7)
式(7)中:Ystrain為前p個(gè)與測(cè)試樣本相似度較高的訓(xùn)練樣本子集的光譜反射率向量,Xstrain為對(duì)應(yīng)的RGB響應(yīng)值向量。 該訓(xùn)練樣本選擇方法僅考慮了光譜反射率向量中曲線形態(tài)的信息, 卻忽略了光譜反射率向量空間距離的相近信息。
最經(jīng)典的基于歐氏距離的訓(xùn)練樣本選擇方法只考慮了直線距離的接近, 沒(méi)有考慮每個(gè)維度上樣本分散程度的影響, 為了改善這一問(wèn)題, 任澳等[9]提出了加權(quán)歐氏距離來(lái)選取訓(xùn)練樣本, 如式(8)所示
(8)
式(8)中:d1為三維待測(cè)樣本RGB向量u(u1,u2,u3)與訓(xùn)練樣本RGB向量v(v1,v2,v3)的加權(quán)歐氏距離;sk為第k維的標(biāo)準(zhǔn)差。 該方法避免了數(shù)據(jù)各維度之間尺度不一致問(wèn)題, 首先, 將各維度標(biāo)準(zhǔn)化使其滿足標(biāo)準(zhǔn)正態(tài)分布, 其次, 將加權(quán)歐氏距離作為相似度并進(jìn)行排序, 最后, 選取前p個(gè)相似性較高的訓(xùn)練樣本子集并對(duì)訓(xùn)練樣本給予不同大小的權(quán)重, 縮小歐氏距離較遠(yuǎn)的樣本在重建時(shí)的影響, 該方法可以提高光譜重建的效果, 但是卻忽慮了光譜反射率向量曲線形態(tài)上的接近。
針對(duì)以上兩種方法均單一地考慮光譜反射率空間距離的相近或光譜反射率曲線形狀的接近, 于是提出了一種基于改進(jìn)加權(quán)歐氏距離的光譜重建訓(xùn)練樣本選擇方法, 其原理是既考慮光譜反射率空間距離的接近, 又考慮曲線形狀上的接近。
首先, 式(9)是計(jì)算待測(cè)樣本向量a=(z1,z2,z3)與所有訓(xùn)練樣本向量bi=(xi1,xi2,xi3)之間的夾角余弦
(9)
然后, 考慮到光譜反射率向量可以看成31維向量, 其實(shí)質(zhì)是一條光滑的曲線, 為了篩選出與待測(cè)樣本曲線形狀更相似的訓(xùn)練樣本, 于是, 將該夾角余弦轉(zhuǎn)換為具有幾何距離意義的距離d2, 目的是為了讓其與加權(quán)歐氏距離在同一個(gè)量綱下進(jìn)行結(jié)合, 見(jiàn)式(10)
(10)
為了選擇與待測(cè)樣本相似度更高的訓(xùn)練樣本, 本文結(jié)合加權(quán)歐氏距離d1, 提出改進(jìn)加權(quán)歐氏距離d, 見(jiàn)式(11)
d=gd1+hd2
(11)
式(11)中:g,h的值是由經(jīng)驗(yàn)給定, 以均方根誤差最小為目的進(jìn)行調(diào)參, 經(jīng)過(guò)多次實(shí)驗(yàn)分析, 發(fā)現(xiàn)當(dāng)g=5,h=2時(shí)重構(gòu)誤差最小, 在之后實(shí)驗(yàn)中, 均使用此參數(shù)。 本文權(quán)值函數(shù)e依照相似度d考慮到距離越近賦予的權(quán)重越大, 見(jiàn)式(12)
(12)
從圖1(a-c)可以直觀地看出在RGB空間中曾茜方法的向量夾角距離僅單一地考慮了光譜反射率向量形狀的相似, 任澳方法的加權(quán)歐氏距離僅單一地考慮了光譜反射率向量空間中距離的相近, 而本文提出的改進(jìn)加權(quán)歐氏距離, 該距離既考慮了光譜反射率曲線空間距離的接近, 又考慮光譜反射率曲線形狀上的接近, 以這種改進(jìn)的距離選擇出最優(yōu)的訓(xùn)練樣本, 可以在保證光譜均方根誤差最小的條件下, 顯著降低色度誤差, 提高光譜重建精度。
圖1 在RGB中不同樣本選擇方法的圖示比較(a): 曾茜方法; (b): 任澳方法; (c): 文中方法Fig.1 Graphical comparison of different sample selection methods in RGB(a): Zeng Qian’s method; (b): Ren Ao’s method; (c): The proposed method
選用孟賽爾半光澤數(shù)據(jù)集(Munsell Matte), 該數(shù)據(jù)集來(lái)源于芬蘭約恩蘇大學(xué)[12], 其中包含了1269塊在可見(jiàn)光波長(zhǎng)范圍內(nèi)等距采樣獲得的31維光譜反射率樣本向量。 光譜反射率對(duì)應(yīng)的RGB響應(yīng)值為模擬Sony DXC-930 3CCD相機(jī)的光譜敏感曲線[13], 使用CIE D65標(biāo)準(zhǔn)光照, 進(jìn)行數(shù)值模擬并經(jīng)標(biāo)準(zhǔn)化變換到區(qū)間[0, 1]上。 為了確保實(shí)驗(yàn)的客觀性與真實(shí)性, 文中對(duì)數(shù)據(jù)集進(jìn)行了隨機(jī)采樣的兩組實(shí)驗(yàn), 如圖2所示, 實(shí)驗(yàn)一為首先隨機(jī)選出1 100個(gè)樣本, 再?gòu)闹须S機(jī)抽取200個(gè)作為測(cè)試樣本, 剩余的900個(gè)作為訓(xùn)練樣本, 通過(guò)使測(cè)試樣本均方誤差最小來(lái)選擇模型最優(yōu)參數(shù), 并將數(shù)據(jù)集剩余的169個(gè)作為驗(yàn)證樣本來(lái)檢驗(yàn)光譜重建的效果; 實(shí)驗(yàn)二為考慮噪聲影響的情況, 給RGB響應(yīng)值分別添加標(biāo)準(zhǔn)差為0.01與0.001的高斯隨機(jī)噪聲, 模擬出有噪聲數(shù)據(jù), 隨機(jī)選出800個(gè)樣本, 將其分為600個(gè)訓(xùn)練樣本和200個(gè)測(cè)試樣本, 剩余的369個(gè)作為驗(yàn)證樣本進(jìn)行光譜重建效果的比較。
圖2 數(shù)據(jù)集分配Fig.2 Data set allocation
實(shí)驗(yàn)結(jié)果的對(duì)比使用均方根誤差RMSE和色度誤差ΔEab, 見(jiàn)式(13)和式(14)。
(13)
(14)
為了更加直觀地驗(yàn)證文中方法樣本選擇的效果, 隨機(jī)挑選4個(gè)驗(yàn)證樣本進(jìn)行重構(gòu), 得到光譜反射率曲線以及誤差曲線, 圖3(a-d)中可以看出, 文中方法重建的光譜反射率與實(shí)際的基本吻合, 其中樣本8#、 41#、 113#, 曲線十分接近, 效果較好, 除了樣本130#曲線尾部重建效果稍微遜色一點(diǎn)。 圖3(e-h)直觀地展示了文中方法重建的光譜反射率誤差與理想誤差基本接近, 除了樣本130#曲線只有尾部誤差波動(dòng)幅度稍大, 其他波段幾乎重合。 由此說(shuō)明文中的方法重建的樣本與實(shí)際測(cè)量數(shù)據(jù)更接近, 重建效果更佳。
圖3 重構(gòu)光譜反射率曲線及誤差波動(dòng)曲線的比較(a): 樣本8#; (b): 樣本41#; (c): 樣本113#; (d): 樣本130#; (e): 8#樣本反射率誤差; (f): 41#樣本反射率誤差; (g): 113#樣本反射率誤差; (h) 130#樣本反射率誤差Fig.3 Comparison of reconstructed spectral reflectance curve and error fluctuation curve(a): Sample 8#; (b): Sample 41#; (c): Sample 113#; (d): Sample 130#; (e): 8# sample reflectance error; (f): 41# sample reflectance error; (g): 113# sample reflectance error; (h) 130# sample reflectance error
從表1可以看出, 在兩種實(shí)驗(yàn)條件下, 文中方法的光譜平均均方根誤差和平均色差均是最小的, 從實(shí)驗(yàn)一的平均色差降低到0.587 9, 最大色差為4.511 6, 色差的標(biāo)準(zhǔn)差為0.584 9, 平均均方根誤差降低到0.009 8, 最大均方根誤差為0.048 8, 均方根誤差的標(biāo)準(zhǔn)差為0.009 3, 本文的方法在保證均方根誤差最小的條件下, 重建后的色度誤差有明顯地降低; 實(shí)驗(yàn)二的平均色差降低到0.689 2, 最大色差為16.378 5, 平均均方根誤差降低到0.011 3, 最大均方根誤差為0.109 1。 從實(shí)驗(yàn)一與實(shí)驗(yàn)二的結(jié)果可以看出來(lái)訓(xùn)練樣本集最大誤差會(huì)相對(duì)小一點(diǎn), 這是因?yàn)橛?xùn)練樣本與測(cè)試樣本可以篩選出更接近的樣本。 相比任澳方法, 該方法在保證均方根誤差最小的條件下, 能夠顯著地降低色度誤差, 光譜反射率的重建精度有了大幅度地提升。 為了考慮采集顏色數(shù)據(jù)中的噪聲, 本文給RGB數(shù)據(jù)在三個(gè)通道添加噪聲分別為均值為0, 標(biāo)準(zhǔn)差為0.01和0.001的高斯噪聲, 從表2中可以看出, 添加噪聲后, 文中方法的光譜平均均方根誤差和平均色差依舊保持最小, 說(shuō)明該方法能夠更好的利用局部樣本的信息, 而且具有較好的抗干擾能力, 根據(jù)改進(jìn)距離的大小從而施加不同的權(quán)重, 對(duì)模型進(jìn)行修正, 因此, 基于改進(jìn)加權(quán)歐氏距離選擇樣本的重建光譜精度明顯提高。
表1 2種局部樣本選擇方法的重建精度比較Table 1 Comparison of reconstruction accuracy of two local sample selection methods
表2 不同噪聲對(duì)2種局部樣本選擇方法的重建精度比較Table 2 Comparison of reconstruction accuracy of two local sample selection methods with different noises
針對(duì)光譜反射率重建中如何選擇更有效的訓(xùn)練樣本問(wèn)題, 基于向量夾角距離僅考慮光譜反射率向量形狀的相似, 與加權(quán)歐氏距離僅考慮光譜反射率向量空間距離的相近, 本文提出了改進(jìn)加權(quán)歐氏距離, 該距離同時(shí)考慮了光譜反射率向量形狀的相似與空間距離的相近, 與待測(cè)樣本越相似的訓(xùn)練樣本施加較大的權(quán)重, 在光譜重構(gòu)精度與樣本選擇的效果兩方面進(jìn)行對(duì)比分析。 實(shí)驗(yàn)結(jié)果表明本文的方法重建光譜反射率的平均色差與平均光譜均方根誤差均最小, 尤其在保證均方根誤差最小的條件下, 顯著地降低了色度誤差, 不僅能夠充分利用樣本信息, 而且在添加噪聲后依舊保持最小均方根誤差與色度誤差, 具有較好的抗干擾能力, 較顯著地提高了色度精度與光譜精度, 能夠更好地滿足顏色的真實(shí)再現(xiàn)。