歐嘯天,胡偉
(北京化工大學(xué)信息科學(xué)與技術(shù)學(xué)院,北京100029)
Logo標(biāo)識(shí)是代表某種特定含義的圖案,例如商業(yè)品牌商標(biāo),交通標(biāo)識(shí)等。Logo在日常生活中廣泛的使用,對(duì)Logo的檢測(cè)在商品檢測(cè)、自動(dòng)駕駛、自動(dòng)化倉(cāng)庫(kù)等方面都有重要作用。檢測(cè)自然拍攝圖像中的商業(yè)品牌Logo的位置和類別,一直是圖像內(nèi)容檢測(cè)研究中的熱點(diǎn)問(wèn)題。
Logo檢測(cè)[1]作為圖像內(nèi)容檢測(cè)的一個(gè)分支,與普通圖像物體檢測(cè)的方法基本相同。傳統(tǒng)方法提取圖像特征,如尺度不變特征變換(SIFT)[2],方向梯度直方圖(HOG)[3]特征,并使用這些特征訓(xùn)練一個(gè)N分類器;而檢測(cè)時(shí)則使用滑動(dòng)窗口或其他區(qū)域提取方法生成候選區(qū)域,對(duì)候選區(qū)域分類。可形變部件模型(DPM)[4]是傳統(tǒng)物體檢測(cè)方法的高峰。而從2012年開(kāi)始,隨著AlexNet[5]在ImageNet[6]圖像分類比賽上的突破,基于深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)[7]的方法成為了檢 測(cè) 問(wèn) 題 的 主 流 方 法 ,如 R-CNN[8]、Fast-RCNN[9]、YOLO[10]等檢測(cè)框架不斷出現(xiàn)。文獻(xiàn)[11]指出深度學(xué)習(xí)的效果依賴大量輸入數(shù)據(jù),而如何獲得高質(zhì)量的訓(xùn)練數(shù)據(jù)在很多時(shí)候成為了應(yīng)用深度學(xué)習(xí)的瓶頸。
獲取自然場(chǎng)景中特定Logo檢測(cè)所需訓(xùn)練數(shù)據(jù)最直接的途徑是利用搜索引擎在因特網(wǎng)上搜索該Logo,并獲取包含該Logo圖片然后進(jìn)行人工標(biāo)注。但在實(shí)際操作中,搜索引擎搜出的圖片幾乎都是Logo的設(shè)計(jì)圖,這些圖片以整個(gè)Logo圖案為主體,并使用標(biāo)準(zhǔn)外觀。但是,自然拍攝圖像中的Logo往往是處于復(fù)雜的背景中,并且含有光照、噪聲等影響。因此通過(guò)搜索引擎獲取的Logo圖片并不適合作為訓(xùn)練數(shù)據(jù)集。
針對(duì)深度學(xué)習(xí)的數(shù)據(jù)獲取困難的問(wèn)題,有一些研究工作從合成數(shù)據(jù)[12-14]的方向進(jìn)行探索,同樣針對(duì)訓(xùn)練數(shù)據(jù)難以真實(shí)獲取的問(wèn)題?;贚ogo檢測(cè)的特點(diǎn)(Logo圖案基本都分布在平面上且畫面內(nèi)容穩(wěn)定;真實(shí)訓(xùn)練數(shù)據(jù)獲取和標(biāo)注工作量大),文中提出了一個(gè)合成Logo標(biāo)識(shí)數(shù)據(jù)集的完整框架,利用計(jì)算機(jī)自動(dòng)生成Logo檢測(cè)所需要的訓(xùn)練圖片集以及對(duì)應(yīng)的標(biāo)注數(shù)據(jù)。
文中方法生成訓(xùn)練樣本的基本思路是:將原始輸入的標(biāo)準(zhǔn)Logo模版圖案進(jìn)行各種幾何和紋理變換,然后合成到背景圖像上。方法的具體計(jì)算過(guò)程分3步:
1)Logo模版處理。對(duì)Logo模版進(jìn)行各種幾何和光照的處理;
2)背景圖像處理。在背景圖像上選擇合適的區(qū)域并進(jìn)行其他操作;
3)整體合成。將處理后的Logo模版和背景圖像進(jìn)行合成。
圖1使用3個(gè)示例表現(xiàn)本文方法的完整處理流程。以左圖為例,首先對(duì)輸入的ESSO標(biāo)準(zhǔn)Logo模版進(jìn)行透視變換、擾動(dòng)等處理;同時(shí)在背景圖像集合中隨機(jī)選擇一張圖像作為當(dāng)前背景圖像,進(jìn)行區(qū)域選擇和添加色塊等操作;最后將兩者進(jìn)行融合,并添加一些光照處理以形成最終的合成圖像。下面本文將詳細(xì)介紹這3個(gè)處理過(guò)程。
圖1 Logo樣本的生成流程示例
待檢測(cè)Logo均需要標(biāo)準(zhǔn)的圖案輸入系統(tǒng)。有些Logo只需形狀信息(如Adidas,其內(nèi)部可填充各種顏色和紋理),那么就僅需表示Logo區(qū)域信息蒙版位圖;有些Logo圖案本身紋理信息非常重要(如星巴克),除了蒙版位圖外還需要一個(gè)圖案位圖,這個(gè)位圖和蒙版尺寸相同,形狀匹配(此時(shí)蒙版實(shí)際上是對(duì)圖案的Logo部分作摳圖的結(jié)果)。
為模擬真實(shí)圖像中的效果,本文對(duì)模版進(jìn)行各種幾何和色彩處理,具體方法包括;
1)透視變換。自然場(chǎng)景中因?yàn)橐暯亲儞Q,Logo圖案會(huì)有相應(yīng)的透視效果。本文方法即提供隨機(jī)產(chǎn)生視點(diǎn)和視線方向,計(jì)算平面Logo圖案對(duì)應(yīng)的透視變換效果,以模擬真實(shí)場(chǎng)景中的透視效果。
2)擾動(dòng)。本文方法可以對(duì)Logo圖像的每個(gè)像素點(diǎn),取其鄰域內(nèi)的隨機(jī)一點(diǎn)顏色值作為該點(diǎn)的新顏色值,以使Logo的紋理產(chǎn)生小幅變化形成擾動(dòng),模擬真實(shí)場(chǎng)景中l(wèi)ogo的輕微、不規(guī)則的形變,避免模型對(duì)Logo的細(xì)節(jié)特征過(guò)擬合。
3)紋理疊加。部分只關(guān)注輪廓的Logo圖案在真實(shí)場(chǎng)景中會(huì)填充不同的紋理內(nèi)容,為模擬該效果,本文方法使用紋理集合中預(yù)先準(zhǔn)備好的紋理圖像,與Logo圖像做線性融合,為生成的Logo樣本增加更豐富的紋理效果。
4)色彩調(diào)整。自然場(chǎng)景中Logo在不同顏色的環(huán)境光照射下色彩會(huì)發(fā)生變化。為了模擬該效果,本文方法可以隨機(jī)選取顏色,與Logo進(jìn)行融合。此外,在現(xiàn)實(shí)場(chǎng)景中,Logo與背景會(huì)有一定對(duì)比度,為了在合成圖像中體現(xiàn)這種對(duì)比度,我們使用下述方法對(duì)Logo的亮度進(jìn)行調(diào)整:
1)計(jì)算Logo的平均亮度Ll和所在背景區(qū)域(該區(qū)域在背景圖像處理中計(jì)算)的平均亮度Lb(使用Lab色彩空間,亮度范圍為[0,100])。本文方法主要調(diào)整Logo的亮度以保證Logo與背景的區(qū)分度。
2)計(jì)算Lc作為L(zhǎng)ogo亮度的參考值是一個(gè)隨機(jī)偏移量
然后調(diào)整Logo圖像上的每一點(diǎn)的亮度值Lp使得Logo的平均亮度與背景有足夠反差。
5)噪聲。真實(shí)場(chǎng)景中Logo表面會(huì)有污痕,同時(shí)照片成像時(shí)也可能產(chǎn)生噪點(diǎn)。本文方法通過(guò)對(duì)Logo圖像逐像素添加高斯噪聲以模擬此類效果。在實(shí)驗(yàn)中我們發(fā)現(xiàn)噪點(diǎn)過(guò)多會(huì)降低Logo檢測(cè)模型的準(zhǔn)確率,因此對(duì)尺寸較小的Logo,所添加的噪點(diǎn)強(qiáng)度也會(huì)相應(yīng)減小。同時(shí),我們會(huì)對(duì)圖像添加一些模糊處理以更好地模擬污痕效果。
為更好模擬真實(shí)場(chǎng)景,我們從MIT Places數(shù)據(jù)集[15]中選擇了一些常見(jiàn)的室內(nèi)和室外場(chǎng)景圖片用作背景圖像數(shù)據(jù)集。對(duì)背景圖像的處理則包含以下內(nèi)容:
1)區(qū)域選擇。實(shí)際場(chǎng)景中的Logo圖案可能分布在背景圖像的不同位置,其尺寸也會(huì)發(fā)生變化。為模擬該效果,我們需要對(duì)Logo在背景圖像中的位置和尺寸進(jìn)行設(shè)定。但簡(jiǎn)單的使用隨機(jī)分布會(huì)有一個(gè)問(wèn)題:大多數(shù)Logo在自然場(chǎng)景中處于平緩(低頻)區(qū)域,而隨機(jī)選取位置很容易把Logo繪制到復(fù)雜紋理(高頻)區(qū)域。如果生成的Logo分布在高頻區(qū)域,Logo圖案本身的特征反而會(huì)被背景干擾,難以學(xué)習(xí),影響最終模型的檢測(cè)效果。
為了選取盡可能合適的區(qū)域和尺寸,避免Logo落入復(fù)雜背景區(qū)域,我們只使用雜亂程度較低的區(qū)域。具體而言,算法從圖像中隨機(jī)選取若干候選區(qū)域,計(jì)算每個(gè)區(qū)域的三階導(dǎo)數(shù),用該區(qū)域的平均三階導(dǎo)數(shù)表示其雜亂程度,然后在平均三階導(dǎo)數(shù)最小的區(qū)域填入Logo圖像。具體計(jì)算方法如下:
假設(shè)圖像為I,?是圖像卷積運(yùn)算,x、y分別表示水平和垂直兩個(gè)方向,則圖像在x和y方向上的導(dǎo)數(shù)為:
則圖像的一階導(dǎo)數(shù)為:
將M1作為I輸入進(jìn)行求導(dǎo)運(yùn)算得到M2,并再次運(yùn)算得到圖像I的三階導(dǎo)數(shù)M3。那么對(duì)于隨機(jī)選擇的第i個(gè)區(qū)域Ω,其紋理復(fù)雜度為Pi為
選擇雜亂程度較小的區(qū)域作為L(zhǎng)ogo的輸出位置,可以使得Logo的位置和尺寸分布得到控制,減少了Logo被復(fù)雜背景干擾的概率。
2)添加色塊。很多時(shí)候自然場(chǎng)景中的Logo不僅處在平坦區(qū)域,而且Logo所在背景與周圍有明顯的分界,例如交通標(biāo)識(shí)通常在路牌上、酒標(biāo)通常在酒瓶上。這些背景區(qū)域的輪廓可能會(huì)影響模型對(duì)Logo的定位。我們使用隨機(jī)繪制多邊形或橢圓形色塊的方法模擬此類效果,提高Logo檢測(cè)的準(zhǔn)確率。
在處理完Logo標(biāo)準(zhǔn)模版圖像,并選好背景圖像和融合區(qū)域后,我們需要將兩者進(jìn)行融合處理:根據(jù)Logo圖像和選取的背景圖像和區(qū)域,利用Logo的Mask進(jìn)行線性融合。為了更加近似真實(shí)場(chǎng)景,該過(guò)程中本文方法還將進(jìn)行如下處理:
1)模擬光照??呻S機(jī)為生成的Logo增加高光、陰影等效果。因?yàn)樽匀粓?chǎng)景中的光照會(huì)影響到Logo和附近區(qū)域,所以該處理過(guò)程需要在Logo繪制到背景之后進(jìn)行。我們通過(guò)增加圖像像素點(diǎn)的亮度模擬光照,支持兩種形狀的高光效果:點(diǎn)狀高光和帶狀高光。
2)JPEG壓縮。真實(shí)場(chǎng)景的圖像在采集和儲(chǔ)存時(shí)經(jīng)常會(huì)被壓縮,導(dǎo)致圖像質(zhì)量下降。我們?cè)谏捎?xùn)練圖片時(shí)加入了JPEG壓縮的效果,并可根據(jù)參數(shù)隨機(jī)調(diào)整輸出壓縮后的圖像。
總之,通過(guò)標(biāo)準(zhǔn)Logo模版處理、背景圖像處理和融合處理,利用隨機(jī)性產(chǎn)生每個(gè)處理過(guò)程中的各個(gè)參數(shù),就能夠由計(jì)算機(jī)合成大量模擬的Logo圖像,并且得到相應(yīng)的檢測(cè)標(biāo)注數(shù)據(jù)。圖2給出了由我們方法生成的部分Logo檢測(cè)訓(xùn)練樣本圖像。
為了驗(yàn)證合成Logo檢測(cè)訓(xùn)練數(shù)據(jù)集的實(shí)際應(yīng)用效果,我們?cè)贔lickrLogos-32[16]數(shù)據(jù)集上進(jìn)行測(cè)試實(shí)驗(yàn)。該數(shù)據(jù)集收集了包含32類Logo圖案,共2 240張真實(shí)拍攝的圖片。該數(shù)據(jù)集每類Logo對(duì)應(yīng)70張圖片,每張圖片中含有至少一個(gè)Logo位置,且每張圖片只包含該類Logo。在原始數(shù)據(jù)集中,每類70張圖像包含10張訓(xùn)練樣本,30驗(yàn)證樣本和30測(cè)試樣本,在實(shí)驗(yàn)中我們使用測(cè)試集進(jìn)行測(cè)試。
圖2 更多合成訓(xùn)練樣本的例子
我們使用本文提出方法生成每類400張圖像,以及FlickrLogos本身的訓(xùn)練驗(yàn)證數(shù)據(jù),共組合提供6組訓(xùn)練樣本:1)使用FlickrLogos訓(xùn)練集(每類10張)作為訓(xùn)練數(shù)據(jù);2)從FlickrLogos訓(xùn)練和驗(yàn)證集中隨機(jī)選20張作為訓(xùn)練數(shù)據(jù);3)從FlickrLogos訓(xùn)練驗(yàn)證集中隨機(jī)選30張作為訓(xùn)練數(shù)據(jù);4)使用FlickrLogos完整的訓(xùn)練驗(yàn)證集(每類40張)作為訓(xùn)練數(shù)據(jù);5)使用本文方法生成的每類400張圖像作為訓(xùn)練數(shù)據(jù);(6)使用包含本文方法生成數(shù)據(jù)和FlickrLogos訓(xùn)練驗(yàn)證集,每類總共100張作為訓(xùn)練數(shù)據(jù)。
我們使用了Faster RCNN[17]分別訓(xùn)練上述6組訓(xùn)練數(shù)據(jù),并在FlickrLogos測(cè)試集上檢驗(yàn)訓(xùn)練效果,實(shí)驗(yàn)結(jié)果如表1所示。
表1 使用不同訓(xùn)練集得到的模型檢測(cè)結(jié)果對(duì)比
表2 幾種典型logo分析
從表1的結(jié)果可以發(fā)現(xiàn)使用人工標(biāo)注的真實(shí)圖片效果較好,但使用自動(dòng)生成的訓(xùn)練數(shù)據(jù)依然取得了接近的準(zhǔn)確率。雖然自動(dòng)生成數(shù)據(jù)樣本本身與自然圖像有一定差距,但由于可以產(chǎn)生更大的數(shù)據(jù)量,保證了訓(xùn)練樣本的多樣性,彌補(bǔ)了數(shù)據(jù)質(zhì)量上的不足。而且將真實(shí)數(shù)據(jù)與生成數(shù)據(jù)混合,則準(zhǔn)確率進(jìn)一步提升至71%,也說(shuō)明了機(jī)器生成訓(xùn)練數(shù)據(jù)確實(shí)有增加樣本多樣性的優(yōu)勢(shì)。
實(shí)驗(yàn)中我們發(fā)現(xiàn)對(duì)于有些類別,使用自動(dòng)生成的數(shù)據(jù)訓(xùn)練效果較好,而對(duì)于另一些類別,效果則較差。我們分析了4個(gè)典型類別的準(zhǔn)確率(表2)和相應(yīng)Logo的真實(shí)圖片(圖3、圖4),發(fā)現(xiàn)Apple和Shell這些效果較好的Logo圖案相對(duì)比較簡(jiǎn)單,變化不復(fù)雜。在這種情況下,使用機(jī)器生成訓(xùn)練樣本保持了比較好的樣本豐富性。而對(duì)于類似NVIDIA這種Logo(見(jiàn)圖4)本身就存在多種復(fù)雜變化(顏色組合有黑+綠、白+綠、純綠等多種);另一方面,真實(shí)場(chǎng)景中,NVIDIA的Logo下方往往有“NVIDIA”文字,雖然這個(gè)文字本身不在Logo的標(biāo)注中,但作為一個(gè)特征,我們生成的樣本中缺少這種情況。而從圖5中可見(jiàn),類似CHIMAY這樣的Logo常常有曲面的變形,而我們的樣本生成程序缺少這種效果。
圖3 Apple和Shell的真實(shí)圖片
圖4 NVIDIA(a)和CHIMAY(b)的真實(shí)圖片
圖5 背景區(qū)塊對(duì)logo檢測(cè)時(shí)定位的影響
表3 不同繪制效果對(duì)準(zhǔn)確率的影響
綜上所述,我們的Logo檢測(cè)方法保證了樣本本身的豐富和多樣性,非常適合部分Logo的檢測(cè)訓(xùn)練。但是對(duì)于一些存在更復(fù)雜的變化(曲面、柔性變形等)的Logo,鑒于本文方法模擬的效果有限,實(shí)際檢測(cè)效果還有待提高。
本文方法利用計(jì)算機(jī)生成與真實(shí)自然圖像相似的合成圖像。自然圖像中Logo的變化是非常復(fù)雜的,模擬的近似程度很大程度會(huì)影響實(shí)際效果。表3展示了添加處理方法對(duì)準(zhǔn)確率的影響(注意表中由上到下是增量式的,即高序號(hào)的組包含了低序號(hào)組的變換特性;基準(zhǔn)只包含透視變換和紋理色彩調(diào)整)。很顯然,樣本生成器加入的模擬效果越多,訓(xùn)練樣本越豐富,得到的模型準(zhǔn)確率就越高。
從表中可知候選區(qū)域篩選對(duì)準(zhǔn)確率影響顯著,原因在于其避免了生成的logo被復(fù)雜的環(huán)境干擾,影響網(wǎng)絡(luò)學(xué)習(xí)到正確的特征。光照的裁剪對(duì)結(jié)果影響也比較大,應(yīng)該是局部遮擋提升了網(wǎng)絡(luò)的健壯性。背景區(qū)塊對(duì)準(zhǔn)確率的影響雖然不大,但實(shí)際應(yīng)用中顯示其提升了logo的準(zhǔn)確定位能力,加入背景區(qū)塊后,logo與背景反差更大,學(xué)習(xí)坐標(biāo)回歸更容易。圖5以ESSO為例,上圖是未使用背景區(qū)塊的檢測(cè)效果,下圖是使用了背景區(qū)塊后的檢測(cè)效果;深色是標(biāo)注框,淺色表示正確檢測(cè)??梢园l(fā)現(xiàn),雖然2張圖中的都檢測(cè)到了目標(biāo)logo,但下方的檢測(cè)框要更準(zhǔn)確。
針對(duì)自然場(chǎng)景圖像中的Logo檢測(cè),本文提出了一種用于深度學(xué)習(xí)網(wǎng)絡(luò)模型訓(xùn)練的樣本生成方法,能夠?qū)崿F(xiàn)快速靈活地生成大量訓(xùn)練樣本。實(shí)驗(yàn)證明基于本方法生成的訓(xùn)練數(shù)據(jù),檢測(cè)準(zhǔn)確率基本達(dá)到了使用人工標(biāo)注訓(xùn)練數(shù)據(jù)的效果??紤]到實(shí)際中Logo的種類遠(yuǎn)遠(yuǎn)超過(guò)32個(gè)類別,而獲得高質(zhì)量的真實(shí)場(chǎng)景中的Logo圖像以及標(biāo)注數(shù)據(jù)非常困難,依賴人工收集數(shù)據(jù)并標(biāo)注的成本非常高昂,本文方法具有較高的實(shí)用價(jià)值。
本文的方法依然存在不足之處,主要在于尚不能模擬很多真實(shí)場(chǎng)景中Logo復(fù)雜的變換效果,例如曲面變形、柔性變形、圖案本身變體多、背景與Logo的關(guān)聯(lián)度等。為解決這些問(wèn)題,未來(lái)可以通過(guò)增加模擬效果的種類(曲面變形等),以及可考慮使用對(duì)抗生成網(wǎng)絡(luò)(GAN)[18-20]提高生成樣本的效果。
此外,對(duì)類似的圖像內(nèi)容檢測(cè)也可以使用合成訓(xùn)練樣本的思路。例如漢字就有與Logo相似的特點(diǎn),其形狀比較固定,而且漢字?jǐn)?shù)目較多,常用漢字有超過(guò)2 000個(gè),加上常見(jiàn)字體有幾十種,顯然從真實(shí)場(chǎng)景中收集到漢字的標(biāo)注數(shù)據(jù)代價(jià)非常高,而合成訓(xùn)練樣本則相對(duì)容易很多。我們嘗試使用本文方法生成了常用500個(gè)漢字的訓(xùn)練數(shù)據(jù)并進(jìn)行訓(xùn)練,達(dá)到了可用的水平。由此可見(jiàn)本文的方法具有一定通用性,在其他檢測(cè)領(lǐng)域也有潛在的應(yīng)用價(jià)值。
參考文獻(xiàn):
[1]張瑞.基于卷積神經(jīng)網(wǎng)絡(luò)的Logo檢測(cè)與識(shí)別研究[D].杭州:浙江大學(xué),2015.
[2]Lowe D G.Object recognition from local scaleinvariant features[C]//international conference on computer vision,1999:1150-1157.
[3]Dalal N,Triggs B.Histograms of oriented gradients for human detection[C]//computer vision and pattern recognition,2005:886-893.
[4]Felzenszwalb P,Mcallester D,Ramanan D.A discriminatively trained,multiscale,deformable part model[C]//IEEE Computer Society Conference on Computer Vision and Pattern Recognition.DBLP,2008:1-8.
[5]Krizhevsky A,Sutskever I,Hinton G E.ImageNet classification with deep convolutional neural networks[J]. Advances in neural information processing systems,2012,25(2):1097-1105.
[6]Russakovsky O,Deng J,Su H,et al.ImageNet large scale visual recognition challenge[J].International Journal of Computer Vision,2015,115(3):211-252.
[7]Lecun Y,Bottou L,Bengio Y,et al.Gradientbased learning applied to document recognition[J].Proceedings of the IEEE,1998,86(11):2278-2324.
[8]Girshick R,Donahue J,Darrell T,et al.Rich feature hierarchies for accurate object detection and semantic segmentation[C].computer vision and pattern recognition,2014:580-587.
[9]Girshick R.Fast R-CNN[C].international conference on computer vision,2015:1440-1448.
[10]Redmon J,Divvala S K,Girshick R,et al.You Only Look Once:Unified,real-time object detection[C]//computer vision and pattern recognition,2015:779-788.
[11]LeCun Y,Bengio Y,Hinton G E.Deep learning[J].Nature 521.7553(2015):436-444.
[12]Gupta A,Vedaldi A,Zisserman A,et al.Synthetic data for text localisation in natural images[C]//computer vision and pattern recognition,2016:2315-2324.
[13]Gaidon A,Wang Q,Cabon Y,et al.Virtual worlds as proxy for multi-object tracking analysis[C]//computer vision and pattern recognition,2016:4340-4349.
[14]Richter S R,Vineet V,Roth S,et al.Playing for data:ground truth from computer games[C]//europeanconferenceoncomputervision,2016:102-118.
[15]Zhou B,Garcia A L,Xiao J,et al.Learning Deep features for scene recognition using places database[J].Advances in Neural Information Processing Systems,2014,1:487-495.
[16]Romberg S,Pueyo L G,Lienhart R,et al.Scalable logo recognition in real-world images[C]//International Conference on Multimedia Retrieval,ICMR 2011,Trento,Italy,April.DBLP,2011:25.
[17]Ren S,He K,Girshick R,et al.Faster R-CNN:towards real-time object detection with region proposal networks[C]//neural information processing systems,2015:91-99.
[18]Goodfellow I J,Pougetabadie J,Mirza M,et al.Generative Adversarial Networks[J].Advances in Neural Information Processing Systems,2014,3:2672-2680.
[19]嚴(yán)明,李剛,楊少華,等.基于CMOS圖像傳感器的高實(shí)時(shí)遠(yuǎn)程圖像采集系統(tǒng)設(shè)計(jì)[J].現(xiàn)代應(yīng)用物理,2016(4):61-66.
[20]李雪,朱欣娟.二維人臉表情仿真技術(shù)研究[J].紡織高?;A(chǔ)科學(xué)學(xué)報(bào),2014(3):385-391.