秦曉倩 劉大琨
1(淮陰師范學(xué)院城市與環(huán)境學(xué)院 江蘇 淮安 223300) 2(鹽城工學(xué)院機(jī)械工程學(xué)院 江蘇 鹽城 224051)
親屬關(guān)系驗(yàn)證的目標(biāo)是通過學(xué)習(xí)得到一個分類模型,以判斷給定的人臉圖像是否具有父子(FS)、父女(FD)、母子(MS)和母女(MD)等直接血親關(guān)系。分類模型所獲知的對象間的關(guān)系信息可被應(yīng)用于人臉識別、社會媒體分析、人臉標(biāo)注和圖像追蹤等[1]。已有的親屬關(guān)系驗(yàn)證方法可大致分為基于特征的和基于相似性學(xué)習(xí)的。Fang等[2]率先提出利用一些包括器官顏色、人臉的結(jié)構(gòu)和紋理信息等特征來刻畫親屬關(guān)系人臉圖像。此后,研究者提出了其他多種不同的特征[3-7]以及屬性[8]。還有一些工作提出融合多種特征[9-12]來刻畫親屬關(guān)系人臉圖像?;谙嗨菩詫W(xué)習(xí)的方法學(xué)習(xí)一個特征轉(zhuǎn)換空間,以達(dá)到更好地刻畫親屬關(guān)系樣本間相似性的目的。其中,文獻(xiàn)[13-16]使用遷移學(xué)習(xí)來減少年老父母與子女間的臉部外觀差異。度量學(xué)習(xí)方法是該類別中另一有效的驗(yàn)證方法,其主要目標(biāo)是學(xué)習(xí)某個相似性度量,以使得親屬關(guān)系樣本間相似性大于非親屬關(guān)系樣本。已有的度量學(xué)習(xí)方法又可以進(jìn)一步根據(jù)所要學(xué)習(xí)的特征轉(zhuǎn)換矩陣的個數(shù),繼續(xù)劃分為僅學(xué)習(xí)一個轉(zhuǎn)換矩陣的單度量學(xué)習(xí)[9,17]和學(xué)習(xí)多個轉(zhuǎn)換矩陣的多度量學(xué)習(xí)[10-11,18-23]兩種類型。Zhao等[24]和Liang等[25]則結(jié)合了度量學(xué)習(xí)與核方法,學(xué)習(xí)一個非線性的特征轉(zhuǎn)換矩陣。近期,深度學(xué)習(xí)亦被引入到親屬關(guān)系驗(yàn)證任務(wù)中[18,26],但卻無法避免親屬關(guān)系人臉圖像的數(shù)據(jù)量較少這一問題。Yan等[27]則使用基于人臉圖像的親屬關(guān)系驗(yàn)證工作中主流的幾種度量學(xué)習(xí)方法來對視頻中的親屬關(guān)系進(jìn)行判斷,但仍只是簡單地將視頻中所有幀的均值作為某主體對象的最終的特征表示,從本質(zhì)上來看,仍然是基于圖像的。
盡管已經(jīng)有許多用于親屬關(guān)系驗(yàn)證的度量學(xué)習(xí)方法,但已有方法中的大多數(shù)都是直接在每種親屬關(guān)系訓(xùn)練樣本上統(tǒng)一學(xué)習(xí),而鮮有討論年齡跨度對學(xué)習(xí)模型的影響。但是,隨著人的年齡增長,人臉外觀會在形狀和紋理上發(fā)生顯著變化,這都將增加親屬關(guān)系驗(yàn)證的難度。另外,Xia等[13]的實(shí)驗(yàn)結(jié)果也表明,主體對象的年齡跨度越大,外觀相似性越低,如圖1所示,圖1(a)是孩子和其父/母在年輕時的人臉圖像對,圖1(b)是該孩子和其父/母在年老時的人臉圖像對,觀察發(fā)現(xiàn),圖1(a)中對象間的相似程度更高。對分類模型來講,這些具有不同相似程度的樣本對模型的影響程度截然不同。
圖1 不同年齡跨度的親屬關(guān)系圖像對
本文提出一種年齡跨度感知的多任務(wù)學(xué)習(xí)方法,通過在具有不同年齡跨度的親屬關(guān)系樣本間共享判別信息的方法,達(dá)到利用更多判別信息的目的。所提出的方法在學(xué)習(xí)時區(qū)別對待由年齡跨度不同所引起的在相似程度上存在差異的樣本對,而不是簡單地統(tǒng)一學(xué)習(xí),解決了年齡跨度對親屬關(guān)系驗(yàn)證的影響問題。
本文的主要工作如下:
(1) 在多任務(wù)學(xué)習(xí)框架下,將具有不同年齡跨度的親屬關(guān)系驗(yàn)證問題分別看作一個學(xué)習(xí)任務(wù),聯(lián)合學(xué)習(xí)兩類特征轉(zhuǎn)換矩陣,其中一類由所有學(xué)習(xí)任務(wù)共享,另一類則由每個學(xué)習(xí)任務(wù)獨(dú)享,以利用具有不同相似程度的樣本所蘊(yùn)含的判別信息。
(2) 為了充分利用父母-孩子對象在不同人臉局部區(qū)域中所表現(xiàn)的遺傳相似性,借助金字塔多層結(jié)構(gòu)進(jìn)行親屬關(guān)系人臉圖像特征的表示學(xué)習(xí)。
(3) 在親屬關(guān)系人臉數(shù)據(jù)庫KinFaceW和UBKinFace上與現(xiàn)有的度量學(xué)習(xí)方法進(jìn)行對比實(shí)驗(yàn),驗(yàn)證了本文方法的有效性,并獲得了較高的驗(yàn)證性能。
本文提出的年齡跨度感知的多任務(wù)親屬關(guān)系驗(yàn)證方法整體框架如圖2所示,首先將訓(xùn)練樣本劃分為具有不同年齡跨度的樣本簇,再借助金字塔多層(Pyramid Multi-Level, PML)結(jié)構(gòu)進(jìn)行人臉圖像特征的表示學(xué)習(xí),然后在多任務(wù)學(xué)習(xí)框架下學(xué)習(xí)特征轉(zhuǎn)換矩陣,最后使用SVM進(jìn)行親屬關(guān)系人臉圖像的驗(yàn)證。
圖2 年齡跨度感知的多任務(wù)學(xué)習(xí) 親屬關(guān)系驗(yàn)證算法框架
在日常生活中,我們經(jīng)常會聽到類似“小明的鼻子那兒和他媽媽真像”這樣的語句,因此,我們猜想,親屬關(guān)系對象間的遺傳相似性往往隱藏在臉部局部區(qū)域?;诖耍覀兘柚鹱炙鄬咏Y(jié)構(gòu),將父母-孩子人臉圖像分別劃分為不同尺度的多個局部塊,如圖3所示,我們在L=4個尺度上分別對人臉圖像進(jìn)行劃分,其中,在第l個尺度上,人臉被劃分為l2個局部人臉塊,從每個局部塊上,抽取維度為m的特征向量,再將所有特征向量按序置于二維矩陣的列上,最終,得到兩個大小為m×B的矩陣Xp和Xc,其中B為所有尺度上的全部局部塊的個數(shù),即B=L(L+1)(2L+1)/6。
圖3 基于金字塔多層結(jié)構(gòu)的人臉劃分(Xpc)
(1)
(2)
(3)
式中:轉(zhuǎn)換矩陣W0用于刻畫具有某種親屬關(guān)系樣本所共享的遺傳特性;Wt則被每個任務(wù)獨(dú)享,用于刻畫具有某種年齡跨度的親屬關(guān)系樣本的遺傳特性。
為了學(xué)習(xí)這兩種轉(zhuǎn)換矩陣,我們構(gòu)建下面的優(yōu)化問題:
(4)
目標(biāo)函數(shù)G(W0,Wt,λ,η)關(guān)于W0和{Wt}是凸的,為了獲得W0和{Wt},使用隨機(jī)梯度下降法求解式(4)。具體地,W0和{Wt}的梯度使用式(5)計(jì)算:
W0=W0L(·,·)+ηW0
Wt=WtL(·,·)+λWt
(5)
(6)
式中:μ是一個范圍在0到1之間的參數(shù)。
我們采取交替迭代優(yōu)化的策略進(jìn)行學(xué)習(xí)。具體地,首先固定W0,優(yōu)化{Wt},再固定{Wt},優(yōu)化W0。該過程一直重復(fù)直至到達(dá)預(yù)設(shè)的某種收斂條件,如迭代次數(shù)或相鄰兩輪經(jīng)驗(yàn)損失函數(shù)的差值變化小于某誤差等。
算法的具體過程整理如下:
算法1年齡跨度感知的多任務(wù)學(xué)習(xí)方法(AS-MTL)
參數(shù):λ,η,迭代次數(shù)Nu,誤差τ。
輸出: 轉(zhuǎn)換矩陣W0和{Wt}。
Step1 初始化
1 隨機(jī)T+1個d×d的矩陣作為W0和{Wt}的初始值;
2 計(jì)算損失函數(shù)的值L0(·,·);
Step2 優(yōu)化
Forr=1,2,…,Nu
固定W0,使用式(5)-式(6)更新{Wt};
固定{Wt},使用式(5)-式(6)更新W0;
計(jì)算Lr(·,·);
若r>2且Lr-Lr-1∨τ,轉(zhuǎn)到Step3;
Step3 輸出
輸出轉(zhuǎn)換矩陣W0和{Wt}
當(dāng)從訓(xùn)練樣本中學(xué)習(xí)獲得轉(zhuǎn)換矩陣W0和{Wt}后,意味著已經(jīng)探尋到了所有親屬關(guān)系樣本所共有的投影轉(zhuǎn)換判別空間,以及具有不同年齡跨度的樣本簇各自獨(dú)享的判別空間。接下來,借助SVM訓(xùn)練一個分類器做最后的決策。
具體做法如下:
首先,對每個訓(xùn)練樣本簇中的每對訓(xùn)練樣本圖像數(shù)據(jù),根據(jù)其所對應(yīng)的學(xué)習(xí)任務(wù)t,借助雙線性函數(shù)計(jì)算每幅圖像對主體間的相似度,即:
SW0,Wt(xp,xc)=(xp)T(W0+Wt)xc
(7)
接著,基于所有圖像對的相似度及其標(biāo)號,訓(xùn)練一個線性SVM分類器。
當(dāng)有待驗(yàn)證圖像對出現(xiàn)時,首先將待驗(yàn)證圖像對劃分到某個對應(yīng)的樣本簇t,再根據(jù)該樣本簇對應(yīng)的轉(zhuǎn)換矩陣Wt和共有轉(zhuǎn)換矩陣W0,借助式(7)計(jì)算該圖像對的相似度,最后使用訓(xùn)練好的SVM分類器進(jìn)行預(yù)測。
2.1.1數(shù)據(jù)庫和實(shí)驗(yàn)設(shè)置
KinFaceW-I[9]和KinFaceW-II[9]是目前流行的親屬關(guān)系人臉圖像數(shù)據(jù)庫。這兩個數(shù)據(jù)庫最大的不同是前者中的每對人臉圖像來自于不同照片,而后者中的每對人臉則來自同一幅照片??紤]到我們的目標(biāo),即討論年齡跨度差異在親屬關(guān)系驗(yàn)證問題中的影響,而KinFaceW-II中的父母—孩子年齡跨度情況較為單一,因此,我們在KinFaceW-I上驗(yàn)證本文算法的性能。圖4展示了KinFaceW-I數(shù)據(jù)庫中的四對圖像,其中每列的兩幅人臉圖像依次具有父子、父女、母子和母女關(guān)系。
圖4 KinFaceW-I數(shù)據(jù)庫圖像對樣本
KinFaceW-I[9]共包含156對父子、134對父女、116對母子和127對母女關(guān)系人臉圖像。但KinFaceW-I并未給出每幅人臉圖像上的主體對象的年齡信息,導(dǎo)致我們無法直接在其上驗(yàn)證本文算法。為此,我們采取人工標(biāo)注的方法,將該數(shù)據(jù)庫中的所有人臉對按照年齡跨度小于20歲和大于20歲這兩種情形進(jìn)行歸類處理,這直接使得式(4)中的參數(shù)T=2。當(dāng)然,也可以使用年齡分類器對人臉圖像進(jìn)行自動年齡標(biāo)注,但這里為了使得圖像樣本對的年齡跨度更為精準(zhǔn),使用了人工標(biāo)注的方法。實(shí)驗(yàn)遵循文獻(xiàn)[9]中的評估協(xié)議。
對本文方法中的參數(shù),即λ、η、Nu和τ,使用4折交叉驗(yàn)證方法設(shè)置它們的值,具體地,對λ,其候選值的值域?yàn)閧0.001,0.01},對η,則根據(jù)λ的值確定其值的變化范圍,分別是{1×10-4:10:1×103}或{1×10-3:10:1×104}。分別設(shè)置Nu=200,τ=0.1。
2.1.2結(jié)果和分析
1) 基準(zhǔn)實(shí)驗(yàn)。首先,我們設(shè)計(jì)了基準(zhǔn)方法Base_1以討論在學(xué)習(xí)過程中考慮年齡跨度影響的有效性。具體地,將式(4)中的T設(shè)置為1。其次,為了討論特征選擇方法的有效性,我們執(zhí)行了本文方法的無特征選擇版本Base_2。
對這兩組基準(zhǔn)實(shí)驗(yàn),我們?yōu)槊糠四槇D像抽取和數(shù)據(jù)庫發(fā)布者[9]所使用的相同的兩種特征:(1) SIFT:從相互之間有8個像素重疊的大小為16×16的塊中抽取SIFT特征。接著,將這些特征拼接為一個維度為6 272的特征向量。(2) LBP:將圖像分為4×4個相互之間無重疊像素的塊,每個塊的大小為16×16。接著,從每個塊中抽取256維的LBP特征,并拼接為4 096維特征向量。使用PCA將提取的兩種特征向量分別降到100維以去除噪聲。
表1是實(shí)驗(yàn)結(jié)果。通過觀察,得到以下結(jié)論:
表1 基準(zhǔn)方法和本文方法在KinFaceW-I
(1) 由于考慮了年齡跨度的影響,Base_2在所有親屬關(guān)系上可以獲得比Base_1更高的性能,且平均來看,兩種特征可分別獲得12.0百分點(diǎn)和12.5百分點(diǎn)的提高,說明在學(xué)習(xí)時考慮不同年齡跨度的影響是十分有效的。
(2) 所提的AS-MTL可以在Base_2的基礎(chǔ)上進(jìn)一步提升性能,說明特征選擇的有效性。實(shí)驗(yàn)中每種親屬關(guān)系上選擇出的人臉區(qū)域如圖5所示,其中被黑色塊覆蓋的部分是未被選擇的局部區(qū)域。觀察發(fā)現(xiàn),所選的人臉塊大多位于人臉上的關(guān)鍵器官區(qū)域,這與我們?nèi)粘I钪械慕?jīng)驗(yàn)相一致。另外,我們也發(fā)現(xiàn),在不同種類的親屬關(guān)系人臉圖像數(shù)據(jù)上選出的局部區(qū)域有所不同,這也暗示了性別對親屬關(guān)系驗(yàn)證的影響。
圖5 KinFaceW-I數(shù)據(jù)庫親屬關(guān)系圖像選出的人臉區(qū)域
(3) SIFT特征在所使用的兩種特征中可以獲得更好的性能,在后面,我們將使用該特征與其他算法進(jìn)行比較。
為了進(jìn)一步展示本文方法的有效性,我們將KinFaceW-I數(shù)據(jù)庫中500對隨機(jī)的親屬關(guān)系對和非親屬關(guān)系對在Base_1和Base_2方法下的相似度分布進(jìn)行了可視化處理,結(jié)果如圖6所示,其中:圖6(a)是Base_1方法所獲得的相似度分布;圖6(b)是Base_2方法的相似度分布。通過觀察可以發(fā)現(xiàn),親屬關(guān)系對和非親屬關(guān)系對的相似度分布在Base_1方法所獲轉(zhuǎn)換空間中存在較為嚴(yán)重的重疊現(xiàn)象,而它們在Base_2方法所獲得的轉(zhuǎn)換空間中則變得更可分,再一次說明本文方法的有效性。
圖6 KinFaceW-I數(shù)據(jù)庫中500對親屬關(guān)系對和 500對非親屬關(guān)系對的相似度分布
2) 與其他度量學(xué)習(xí)方法的對比。由于本文方法需要學(xué)習(xí)特征轉(zhuǎn)換矩陣,這與已有的度量學(xué)習(xí)方法NRML[9]和NRCML[17]的學(xué)習(xí)目標(biāo)一致,為此,我們還將本文方法與這兩個度量學(xué)習(xí)方法進(jìn)行了比較。其中,NRML方法在學(xué)習(xí)時利用不同非親屬關(guān)系樣本對度量學(xué)習(xí)的不同影響,提出尋求一個特征轉(zhuǎn)換矩陣,以使得所有親屬關(guān)系樣本對的距離盡可能小而所有非親屬關(guān)系樣本對之間的距離盡可能大。而NRCML則在NRML的基礎(chǔ)上引入了相關(guān)性度量。
由于兩個對比方法僅在前述人臉特征上進(jìn)行了特征轉(zhuǎn)換矩陣的學(xué)習(xí),而沒有進(jìn)行特征學(xué)習(xí),因此,我們還將本文方法的無特征選擇版本Base_2與對比方法進(jìn)行了比較。除此之外,我們還將本文方法與兩個多視圖度量學(xué)習(xí)方法S3L[22]和MHDL3-V[19]進(jìn)行了比較。這兩種方法旨在利用多種特征相互間能提供互補(bǔ)性判別信息的能力來學(xué)習(xí)多個特征轉(zhuǎn)換矩陣。其中:S3L[22]使用了SIFT、HOG和LBP特征;而MHDL3-V[19]則使用了FV、Color和LPQ三種特征。所有對比方法的性能均來自對應(yīng)文獻(xiàn)。表2比較了Base_2、AS-MTL和四個對比度量學(xué)習(xí)方法在KinFaceW-I上的結(jié)果。我們有以下幾點(diǎn)觀察:(1) 與單度量學(xué)習(xí)方法NRML[9]和NRCML[17]相比,由于NRCML[17]方法是NRML[9]方法的改進(jìn),因此可以獲得較高的平均性能。相較于NRCML[17]方法,Base_2在KinFaceW-I上平均獲得9.3百分點(diǎn)的提高,再一次說明在學(xué)習(xí)時考慮年齡跨度影響的有效性,而所提AS-MTL則可進(jìn)一步平均獲得4.0百分點(diǎn)的提高,說明本文方法的有效性。(2) 與多度量學(xué)習(xí)方法S3L[22]和MHDL3-V[19]相比,由于S3L[22]和MHDL3-V[19]使用了多種特征,因此可以獲得比僅使用一個特征的NRML[9]和NRCML[17]方法更高的性能。而MHDL3-V[19]方法除了利用多種特征的互補(bǔ)性外,還學(xué)習(xí)了對稱和非對稱的多種度量,因此可以獲得最高的驗(yàn)證性能。所提的AS-MTL方法也僅使用了一種特征,但在經(jīng)過特征選擇后可以獲得與MHDL3-V[19]方法相當(dāng)?shù)钠骄?yàn)證性能,說明本文方法的有效性。
3)與其他多任務(wù)學(xué)習(xí)方法的對比。由于本文方法構(gòu)建在多任務(wù)學(xué)習(xí)框架下,因此,我們還將本文方法與No-group MTL[28]和GO-MTL[29]這兩個子空間正則化多任務(wù)學(xué)習(xí)方法進(jìn)行了比較。其中:No-group MTL方法假設(shè)所有的學(xué)習(xí)任務(wù)是相關(guān)的,并通過對學(xué)習(xí)參數(shù)施加Lq,1正則化范數(shù)的方法來約束學(xué)習(xí)任務(wù)處于某個低維子空間;而GO-MTL方法則假設(shè)每個學(xué)習(xí)任務(wù)的參數(shù)向量是一些潛在的基任務(wù)的線性組合。
圖7比較了Base_1、Base_2、AS-MTL和兩個對比多任務(wù)學(xué)習(xí)方法在KinFaceW-I上的平均驗(yàn)證精度。觀察發(fā)現(xiàn),所有多任務(wù)學(xué)習(xí)方法都可以獲得比Base_1方法更高的性能,說明在進(jìn)行親屬關(guān)系驗(yàn)證時,考慮年齡跨度影響,并同時學(xué)習(xí)具有不同年齡跨度的樣本間的參數(shù),可以有效提高泛化性能。
圖7 不同方法在KinFaceW-I庫上的平均驗(yàn)證精度比較
其中,GO-MTL通過引入重疊組結(jié)構(gòu),在No-group MTL的基礎(chǔ)上獲得了3.1百分點(diǎn)的提高,說明具有不同年齡跨度的樣本簇相互間具有一定的結(jié)構(gòu)。而Base_2方法則可在其基礎(chǔ)上進(jìn)一步提高2.7百分點(diǎn)。原因是,相較于GO-MTL方法所假設(shè)的學(xué)習(xí)任務(wù)間存在的重疊組結(jié)構(gòu),Base_2方法僅通過在任務(wù)間共享一個共有轉(zhuǎn)換矩陣的形式在學(xué)習(xí)任務(wù)間共享判別信息,是一種相對松弛的學(xué)習(xí)方法,因此有機(jī)會獲得更高的驗(yàn)證性能。
4) 參數(shù)的影響。我們還討論了參數(shù)u=λ/η的大小對算法性能的影響,具體地,通過固定參數(shù)λ的值,變化參數(shù)η大小的方式進(jìn)行查看。另外需要說明的是,為了更純粹地討論年齡跨度對驗(yàn)證結(jié)果的影響,需要將特征選擇過程剝離,因此,我們在本文方法的無特征選擇版本Base_2上進(jìn)行具體的分析。圖8展示了在u取不同值時,Base_2方法的平均驗(yàn)證性能。觀察發(fā)現(xiàn),當(dāng)u較大時,算法性能相對較低,表明具有不同年齡跨度的親屬關(guān)系樣本不能被無差別地統(tǒng)一處理。
圖8 參數(shù)u=λ/η對驗(yàn)證性能的影響
2.2.1數(shù)據(jù)庫和實(shí)驗(yàn)設(shè)置
UBKinFace數(shù)據(jù)庫[13]包含200組親屬關(guān)系人臉圖像,每組人臉圖像由年老父母圖像、年輕父母圖像和孩子圖像組成,圖9展示了數(shù)據(jù)庫中的四組人臉圖像,其中每列的三幅人臉圖像依次是年老父母、年輕父母和孩子的圖像。
圖9 UBKinFace數(shù)據(jù)庫圖像組樣本
已有的親屬關(guān)系驗(yàn)證算法都遵循文獻(xiàn)[13]中的協(xié)議,即構(gòu)建兩個子集:“孩子—年輕父母”和“孩子—年老父母”,并分別在這兩個子集上驗(yàn)證算法的性能。而我們的目標(biāo),是要討論年齡跨度差異在親屬關(guān)系驗(yàn)證問題中的影響,因此,我們在遵循文獻(xiàn)[13]中的5折交叉驗(yàn)證協(xié)議的基礎(chǔ)上,采取將這兩個子集合并且按照兩種不同年齡跨度情形進(jìn)行歸類處理的策略來驗(yàn)證本文算法的性能。
對本文方法中的參數(shù),即λ、η、Nu和τ,采用與前述KinFaceW親屬關(guān)系人臉數(shù)據(jù)庫上相同的策略來設(shè)置它們的值。
2.2.2結(jié)果和分析
1) 基準(zhǔn)實(shí)驗(yàn)。我們執(zhí)行了本文方法AS-MTL及其無特征選擇版本Base_2,在實(shí)驗(yàn)中,我們?yōu)槊糠四槇D像抽取與KinFaceW數(shù)據(jù)庫所使用的相同的SIFT特征,表3是實(shí)驗(yàn)結(jié)果。通過觀察,可以發(fā)現(xiàn),所提的AS-MTL可以在Base_2的基礎(chǔ)上提升2.5百分點(diǎn)的驗(yàn)證性能,說明方法的有效性。
表3 基準(zhǔn)方法和本文方法在UBKinFace
2) 與其他最好學(xué)習(xí)方法的對比。我們將本文方法和包括基于遷移學(xué)習(xí)的文獻(xiàn)[13]的方法、基于單度量學(xué)習(xí)的NRML[9]、非線性多度量學(xué)習(xí)的NMML[21]和基于深度神經(jīng)網(wǎng)絡(luò)的KML[26]等在內(nèi)的四個方法在UBKinFace數(shù)據(jù)庫上進(jìn)行了比較。但由于已有的方法都是分別在子集1“孩子—年輕父母”和子集2“孩子—年老父母”上驗(yàn)證算法的性能,因此我們?nèi)∵@些對比算法在兩個子集上的驗(yàn)證精度的均值作對比。
表4是實(shí)驗(yàn)結(jié)果,其中所有對比算法的最后一列的精度值是其在兩個子集上精度的均值。我們有以下幾點(diǎn)觀察:(1) 與單度量學(xué)習(xí)方法NRML[9]和多度量學(xué)習(xí)方法NMML[21]相比,本文方法的無特征選擇版本Base_2可以獲得與NMML[21]相當(dāng)?shù)尿?yàn)證精度,說明在進(jìn)行親屬關(guān)系驗(yàn)證時考慮年齡跨度影響是十分有效的,而AS-MTL可以獲得比其高2.7百分點(diǎn)的平均驗(yàn)證精度,說明所提特征選擇策略的有效性。(2) 與基于深度神經(jīng)網(wǎng)絡(luò)的KML[26]相比,所提AS-MTL可以獲得0.9百分點(diǎn)的平均驗(yàn)證精度的提高,再次說明本文方法的有效性。同時也說明,在樣本數(shù)量較少的親屬關(guān)系數(shù)據(jù)上直接使用深度學(xué)習(xí)未必是最好的選擇。
表4 不同方法在UBKinFace庫上的驗(yàn)證精度比較(%)
為了討論親屬關(guān)系驗(yàn)證問題中具有不同年齡跨度的樣本對相似性學(xué)習(xí)具有不同影響的問題,提出一種年齡跨度感知的多任務(wù)學(xué)習(xí)方法。實(shí)驗(yàn)表明,由于在多任務(wù)學(xué)習(xí)框架下同時學(xué)習(xí)具有不同年齡跨度的親屬關(guān)系樣本所蘊(yùn)含的共有的、獨(dú)有的空間結(jié)構(gòu)信息,因此,可以利用更多的判別信息,進(jìn)而獲得較高的驗(yàn)證性能。探討年齡跨度對親屬關(guān)系驗(yàn)證的影響是利用人臉圖像進(jìn)行親屬關(guān)系驗(yàn)證的第一次嘗試,在今后的工作中,我們將考慮用自動化的方式獲取年齡跨度,再在此基礎(chǔ)上,構(gòu)建一個年齡分類和親屬關(guān)系驗(yàn)證的統(tǒng)一學(xué)習(xí)模型。