徐 聰,全恩懋,梁華剛
(1.重慶郵電大學(xué),重慶 400065;2.長安大學(xué),西安 710064)
為確保道路信息的有效傳達,人們針對交通標(biāo)識的視認(rèn)性問題展開了研究[1-5]。影響交通標(biāo)識辨別的因素眾多[6-7],主要分為標(biāo)識與背景自身因素[8-10]、標(biāo)識與背景的對比因素[11]。標(biāo)識與背景的自身因素方面,文獻[12]證明了背景的復(fù)雜度對視認(rèn)性有很大的影響,對此提出了基于背景復(fù)雜度對比的紅綠燈的視認(rèn)性的評測方法;Siegmann等[13]利用標(biāo)志牌的亮度特征提出視認(rèn)性的評測方法,提出利用顏色直方圖來表示標(biāo)識牌;Maerz等[14]通過分析不同標(biāo)識牌對應(yīng)的標(biāo)志領(lǐng)域的亮度值,基于RGB各成分來推斷視認(rèn)性的方法。標(biāo)識與背景的對比方面,K Doman等[15]提出了通過累積標(biāo)志一系列瞬時視認(rèn)性,估計其累積視認(rèn)性,使在動態(tài)場景下,背景環(huán)境隨時間變化也能夠準(zhǔn)確估計標(biāo)志牌視認(rèn)性。
雖然學(xué)者們對視認(rèn)性評測方法進行了研究,但方法仍存在不足。目前方法多出于通過單個特征對視認(rèn)性進行推斷,缺乏對更多影響因素的考慮。若考慮復(fù)合因素對視認(rèn)性推斷的影響,需考慮分析特征的選取和其結(jié)果對視認(rèn)性精度的影響。
本文提出多特征融合的交通標(biāo)識的視認(rèn)性的評測方法。在靜態(tài)實驗的基礎(chǔ)上,選取將6種圖像特征對視認(rèn)性進行評測,特征包括:標(biāo)志牌的表面亮度特征、顏色特征以及標(biāo)志牌復(fù)雜度特征、標(biāo)志牌與背景的亮度對比特征、顏色對比特征、復(fù)雜度對比特征進行融合,提出多特征融合的視認(rèn)性評測模型。
在認(rèn)知神經(jīng)科學(xué)領(lǐng)域,選擇性注意是人類感知系統(tǒng)從外部環(huán)境獲取信息的重要生理機制。人眼在視覺圖像辨認(rèn)的過程中,通過視覺刺激進行一系列快速的眼球跳動來改變注意點位置,視覺刺激不僅來自于對象本身,還受觀察者大腦的影響[16]。在視覺注意機制中,這兩類因素分別稱為自頂向下(top-down)和自底向上(bottom-up)信息處理模型[17]。其中自頂向下模型的視覺注意點的定位和轉(zhuǎn)移取決于先驗知識即任務(wù)目標(biāo),而自底向上模型視覺注意點的定位和轉(zhuǎn)移純粹取決于視覺刺激本身,且兩者存在相互作用[18],即若模型引入適當(dāng)?shù)南闰炛R和充分利用圖像信息的話,能夠更好地促進計算機視覺的探索。
以交通標(biāo)識為對象,利用自頂向下處理模型以交通標(biāo)識為任務(wù)目標(biāo),自底向上處理模型充分利用標(biāo)識對象和背景的對比特征,進行視認(rèn)性評測。將視認(rèn)性評測值V與交通標(biāo)識表面特證a、標(biāo)志與背景的對比特征b公式化,表示為
V=Fa(a)+Fb(b)+Fa×b(a,b)
(1)
(1)式中,等號右邊3項分別表示對視認(rèn)性值V的影響,第1項是標(biāo)志與背景的對比特征;第2項是標(biāo)志表面特征;第3項是兩者的相互作用(交差項)。
求解以a1,a2,a3,b1,b2,b3等為變量組成的P維多項式(P≥2)以獲取視認(rèn)性值。當(dāng)P=2時,可表示為
(2)
(3)
(3)式即為求取視認(rèn)性評測值V的多特征融合模型,Wa,Wb,Wa×b是各項的系數(shù)行列式。為求得系數(shù)矩陣W,本文通過學(xué)習(xí)數(shù)據(jù),利用線性回歸[19]和最小二乘法對W矩陣進行求取。
(4)
由于RGB(red, green, blue)和CIELab之間沒有直接的轉(zhuǎn)換公式,則必須利用通道XYZ顏色空間作為中間層[20]。XYZ空間到CIELab之間的轉(zhuǎn)換為
L*=116f(Y/Yn),
a*=500[f(X/Xn)-Y/Yn],
b*=100[f(Y/Yn)-f(Z/Zn)]
(5)
(6)
交通標(biāo)識的表面特征是影響視認(rèn)性評測的重要組成因素,特別是標(biāo)志牌的亮度、顏色和復(fù)雜度(信息量)特征。作為先驗知識,駕駛員在駕駛資格證考試中必須先對已有的常見的交通標(biāo)示牌進行學(xué)習(xí)記憶,在后續(xù)的駕駛中,每當(dāng)遇見標(biāo)志牌時就會在大腦中進行匹配來識別內(nèi)容。與印象中的標(biāo)志牌越相似,則視認(rèn)性越高?;谏鲜龇治?,以標(biāo)準(zhǔn)交通標(biāo)識作為模版進行分析。
選取k種交通標(biāo)識,設(shè)相對應(yīng)的模版標(biāo)志為Sk,測試圖像中的標(biāo)志牌亮度特征、顏色特征、圖案復(fù)雜度特征與模版標(biāo)志牌S-Sk間的相似程度,并分別表示為a1,a2,a3,如(7)—(9)式。
(7)
(8)
(9)
常見的對比特征的計算是將目標(biāo)外的領(lǐng)域全部當(dāng)作背景來進行處理的,與背景對比的亮度對比特征X1、顏色對比特征X2、復(fù)雜度對比特征X3特征如(10)—(12)式。
X1=|Ys-Yb|
(10)
(11)
X3=|Es-Eb|
(12)
(10)—(12)式中:Ys,Yb分別為標(biāo)志和背景區(qū)域的平均灰度亮度值;Rs,Gs,Bs為標(biāo)志區(qū)域的平均RGB值,Rb,Gb,Bb為背景區(qū)域的平均RGB值;Es,Eb分別為標(biāo)志和背景區(qū)域的平均邊緣強度,標(biāo)志牌邊緣強度同背景邊緣強度差異性越大,標(biāo)志牌越容易辨別。標(biāo)志牌邊緣強度同背景邊緣強度差異性越小,標(biāo)志牌越難以辨別,甚至被認(rèn)為是背景的一部分。文獻[21]在車載相機的實驗中證明了背景復(fù)雜度對比特征的有效性。
但在實際情況下,道路標(biāo)志的周圍存在具有不同圖像特征的區(qū)域,可以認(rèn)為離標(biāo)志越近且領(lǐng)域越大,對標(biāo)志的影響也越大。為提高視認(rèn)性評測值的準(zhǔn)確率,采用基于CIELAB彩色空間的K-means聚類圖像分割方法分割背景。
K-means算法的基本思想:以空間中k個點為中心進行聚類,對最靠近他們的對象歸類。通過迭代的方法,逐次更新各聚類中心的值,直至得到最好的聚類結(jié)果[22]。
假設(shè)把樣本集分為n個類別,令標(biāo)志區(qū)域為s,僅對背景區(qū)域做下列操作,算法描述如下。
1)適當(dāng)選擇k個對象作為n個類的初始聚類中心;
2)對于剩下的對象根據(jù)聚類中心的相似度,求其到n個中心的距離,將其分類給與其最相似的聚類;
3)更新該類的中心值;
4)重復(fù)2),3)步驟直到標(biāo)準(zhǔn)測度函數(shù)收斂。
對包含標(biāo)志圖的圖像背景區(qū)域進行K-means劃分,將背景區(qū)域聚類成3類,聚類初始中心點在標(biāo)志區(qū)域外隨機選取,除標(biāo)志區(qū)域,其他區(qū)域均為聚類對象。通過以上步驟,得到如圖1b所示圖像,其中,背景部分包含多個不同區(qū)域。
(13)
(14)
(15)
圖1 K-means聚類分割結(jié)果圖Fig.1 K-means clustering segmentation result graph
問卷調(diào)查常被用于測量調(diào)查者的態(tài)度、認(rèn)知等潛在特征[22-23],為了證明上述交通標(biāo)識視認(rèn)性評價模型的有效性,通過建立視認(rèn)性的標(biāo)準(zhǔn)值來進行對比分析。本文采用靜態(tài)實驗方法,不考慮行車狀態(tài)對視認(rèn)性的影響,視認(rèn)性的標(biāo)準(zhǔn)值通過問卷調(diào)查法求取。本文采用文獻[24]中一種模糊形式李克特矢量表。將模糊語言變量設(shè)定為總和為100%的百分比形式的條件選項,被測試者可針對設(shè)置的每個模糊語言變量選擇切實心理狀態(tài)所占的百分比數(shù)。
(16)
選取5名測試者對某個標(biāo)識牌圖像進行識別,語義選項設(shè)定為5個區(qū)間,分別為無法分辨、不清楚、稍微清楚、清晰、非常清晰。統(tǒng)計測試者的心理狀態(tài),統(tǒng)計比例結(jié)果如表1所示。
表1 5位測試人員對應(yīng)于各選項的隸屬度選擇
將視認(rèn)性程度在[0,1]上等分為5份,且令Mj為區(qū)分度區(qū)間的中點值{0.073,0.292,0.511,0.730,0.949},對100張交通標(biāo)識的視認(rèn)性值進行統(tǒng)計。
視認(rèn)性測評實驗中,利用Matlab對視認(rèn)性評測模型進行推斷。選取500幅白天不同光照條件下550×550的標(biāo)志周邊圖像,其中圓形標(biāo)志牌占120×120個像素點。將標(biāo)志周邊圖像均分為50組。將圖像數(shù)據(jù)分為用來訓(xùn)練學(xué)習(xí)和進行測試的2組,選用其中9組圖像進行線性回歸求取式未知系數(shù),10組作為測試組,40組數(shù)據(jù)反復(fù)操作。最后,利用視認(rèn)性標(biāo)準(zhǔn)評價值求取各個方法視認(rèn)性評測值的絕對誤差(mean absolute error, MAE)和標(biāo)準(zhǔn)偏差(standard deviation,SD),判斷各方法的視認(rèn)性評測精度。
為降低實驗偶然性,對實驗進行100次,每次均隨機抽取訓(xùn)練數(shù)據(jù)和驗證數(shù)據(jù),統(tǒng)計最后的實驗結(jié)果如圖2所示。圖2中,橫坐標(biāo)為實驗統(tǒng)計次數(shù),圖2a,圖2b,圖2c,圖2d分別為亮度特征和對比度特征、顏色特征和對比度特征、復(fù)雜度特征和復(fù)雜對比度特征以及本文方法的視認(rèn)性標(biāo)準(zhǔn)值與標(biāo)準(zhǔn)值的比較圖。采用不同的方法對100幅圖像進行視認(rèn)性評測,在不同的評測誤差范圍下對滿足該誤差標(biāo)準(zhǔn)的圖像數(shù)目進行統(tǒng)計,結(jié)果如表2所示。
圖2 推斷值和標(biāo)準(zhǔn)值對比Fig.2 Comparison of the inferred value and the standard value
絕對誤差MAE本文方法/幅亮度特征/幅亮度對比特征/幅顏色特征/幅顏色對比特征/幅復(fù)雜度特征/幅復(fù)雜度對比/幅[0,-0.03)31171414107[0.03,0.06)36111913617[0.06,0.09)12121604612[0.09,0.12)8141114813[0.12,0.15)25141181017[0.15,0.18)2889439[0.18,0.21)2154756106[0.21,0.24)41376854[0.24,0.27)1502755[0.27,0.3)10341557[0.3,1]104027323
由圖2可以看出,本文方法相比亮度特征、亮度對比特征、顏色特征、顏色對比特征、信息復(fù)雜度特征和信息復(fù)雜度對比特征擬合程度更高。視認(rèn)性標(biāo)準(zhǔn)值在0.3~0.5時本文方法偶然出現(xiàn)較大誤差,均在標(biāo)準(zhǔn)值以上, 顯然與圖2c中信息復(fù)雜度特征相似,說明在此范圍內(nèi)信息復(fù)雜度特征作用較大。標(biāo)準(zhǔn)值在0.4~0.6時本文方法得到的視認(rèn)性值比標(biāo)準(zhǔn)值低,且變化較為平緩,同圖2b中顏色對比特征相似。而當(dāng)視認(rèn)性值在0.7~0.85時視認(rèn)性值比標(biāo)準(zhǔn)值高,圖2a中亮度特征占據(jù)主導(dǎo)地位。
由表2可以看出,本文方法與視認(rèn)性標(biāo)準(zhǔn)值誤差在0.06以下占據(jù)較大,為67%??梢?,87%的數(shù)據(jù)誤差均在0.12以下,誤差在0.27以上較少,結(jié)合圖2d知誤差較大的部分視認(rèn)性標(biāo)準(zhǔn)值在0.3~0.5。單獨特征中,顏色對比特征和復(fù)雜度對比特征表現(xiàn)最差,較大部分的誤差在0.3以上。顯然誤差較大時,標(biāo)志牌的視認(rèn)性低,很難做出準(zhǔn)確結(jié)果。亮度特征的所有誤差均在0.27以內(nèi),表現(xiàn)較好。亮度對比特征誤差分布也較為均勻,誤差在0.15以下的達到74%。顏色特征較為特殊,由顏色特征得到的視認(rèn)性值大多數(shù)誤差分布在0.18~0.21,達到75%。以0.15的誤差為標(biāo)準(zhǔn),本文方法89%的樣本均達到要求,而其他方法中表現(xiàn)最好的顏色特征也僅達到74%。
上述試驗驗證了本文提出的視認(rèn)性模型的有效性,為了進一步驗證多特征融合視認(rèn)性評測模型的準(zhǔn)確性,將模型公式(3)分為3部分進行驗證。分別利用標(biāo)志牌表面特征(方法1)、標(biāo)志與背景的對比特征(方法2)、不含交叉項的特征共同作用(方法3)以及含標(biāo)志牌表面特征和標(biāo)志與背景的對比特征的交叉項(本文方法)方法進行實驗。通過計算得到4種模型,對視認(rèn)性標(biāo)準(zhǔn)值求取平均絕對誤差和標(biāo)準(zhǔn)偏差進行比較,結(jié)果如表3所示。
由表3可知,對于方法1—方法3中3種成分獲取的視認(rèn)性值無論在絕對誤差還是在標(biāo)準(zhǔn)偏差上均比本文方法差,且4種模型誤差關(guān)系為方法1>方法2>方法3>方法4,顯然本文方法綜合了其他方法的優(yōu)點,比其他方法能更精確地推斷視認(rèn)性值。
為增加本文實驗的說服性,同文獻[13,21,25-26]的標(biāo)志牌視認(rèn)性評價方式進行了對比,實驗結(jié)果如表4所示。
表3 視認(rèn)性評測精度比較
表4 對比實驗
由表4可以明顯看出,本文方法的MAE和SD均為最小值,且融合了主要影響視認(rèn)性的圖像特征的本文方法明顯優(yōu)于其余的對比方法。實驗證明了多特征融合的視認(rèn)性評測模型的有效性,并且模型具有精度高的特點。同表3進行對比,可以看出本文將特征進行融合的方式極大提高了視認(rèn)性值的精度,表4中將亮度特征、顏色特征和復(fù)雜度特征3種特征進行融合的結(jié)果也優(yōu)于文獻中的方法,說明了特征融合方式的有效性。
本文綜合考慮交通標(biāo)識與背景的亮度特征、亮度對比特征、顏色特征、顏色對比特征、復(fù)雜度特征和復(fù)雜度對比特征共6種特征,及特征相互之間的影響,建立特征融合的交通標(biāo)識視認(rèn)性評測模型,并利用最小二乘法求取模型參數(shù),優(yōu)化了視認(rèn)性模型,實驗驗證部分證明了本文方法的有效性,該方法可以對標(biāo)志牌視認(rèn)性值進行高精度推斷。
在實驗中發(fā)現(xiàn),本文方法對視認(rèn)性值在0.3~0.5時仍有部分樣本的推斷視認(rèn)性值存在較大誤差,且有部分樣本的誤差在0.3以上,對此部分的優(yōu)化是本文方法下一步研究的重點。