楊華
(陜西工業(yè)職業(yè)技術(shù)學(xué)院 化工與紡織服裝學(xué)院, 咸陽 712000)
隨著智能手機(jī)和購物Android應(yīng)用程序的出現(xiàn),網(wǎng)上購物已經(jīng)有了很大的發(fā)展。當(dāng)前利用互聯(lián)網(wǎng)購物可以讓人們可以享受一個(gè)舒適的購物感覺,避免了路上、停車、實(shí)體店選取物品所造成的時(shí)間浪費(fèi),因此互聯(lián)網(wǎng)徹底改變了購物行為,網(wǎng)上購物已經(jīng)變成了當(dāng)前主流的購物模式。然而在實(shí)際購物過程中的一個(gè)主要問題就是目標(biāo)產(chǎn)品的選取,這就存在大量產(chǎn)品的選取過程。尤其在購買女士服裝時(shí)問題會(huì)變得更為明顯,如購買連衣裙有多種顏色、圖案以及不同的長(zhǎng)度,這使得個(gè)人主觀匹配和最終決定購買成為一項(xiàng)具有挑戰(zhàn)性的任務(wù)[1];面對(duì)該類問題本文提出了一種方法,即用戶將圖像作為查詢而不是一組描述著裝的關(guān)鍵詞,然后通過識(shí)別衣服的長(zhǎng)度和袖子的類型來確定衣服的樣式——無袖、半袖或全袖,并且將顏色和紋理作為其它選取條件。
根據(jù)對(duì)購物引導(dǎo)的需求,按照多特征設(shè)計(jì)的要求需設(shè)計(jì)智能購物系統(tǒng)總體框架,用戶可以使用該框架生成感興趣的服裝圖像,在該框架的幫助下,用戶根據(jù)自己的特征在數(shù)據(jù)庫中找到相似的服裝,系統(tǒng)所提出的框架,如圖1所示。
圖1 服裝檢索系統(tǒng)框架
包含預(yù)處理、特征提取和分類三個(gè)階段。在本節(jié)中,將詳細(xì)描述框架中的各個(gè)階段,為尋找匹配的服裝提供了一個(gè)自操作過程,并在女裝數(shù)據(jù)集上給出了很好的檢索和識(shí)別結(jié)果。
下面對(duì)各階段進(jìn)行詳細(xì)介紹:
(1) 預(yù)處理階段
在這一步中,首先通過使用Viola Jones算法刪除頭部部分來計(jì)算感興趣的區(qū)域,每個(gè)識(shí)別出的人臉的比例和相對(duì)位置被用來預(yù)測(cè)臉周圍的包圍盒。
(2) 特征分類階段
在提出的方法中,根據(jù)衣服的長(zhǎng)度和袖子對(duì)其進(jìn)行分類。使用水平投影直方圖[2]來找出裙子的長(zhǎng)度,這里的用法是找到衣服的頂部和底部。在圖像二值化之后,得到了服裝的上下界。上界和下界之間的空隙被稱為上半身連衣裙的長(zhǎng)度,下身衣服的長(zhǎng)度可以計(jì)算為從下界到圖像末端的長(zhǎng)度,為了將裙子的長(zhǎng)度歸為長(zhǎng)、短、中,通過設(shè)置對(duì)裙子進(jìn)行分類的閾值來計(jì)算上半身和下半身的比例。
和衣服長(zhǎng)度一樣,袖子也分為3種類型——無袖、整袖和半袖。初步的手工標(biāo)注是用來了解衣服的袖子。為了自動(dòng)計(jì)算套筒長(zhǎng)度,本文引入了一種算法,探討了在皮膚顏色像素的幫助下,袖長(zhǎng)可以發(fā)現(xiàn)的想法,即可以通過膚色和服裝顏色的比例很容易地找出袖子的長(zhǎng)度,如圖2所示。
圖2 袖子分類示意圖
(3) 特征提取階段
對(duì)于匹配服裝的檢測(cè),與顏色和圖案設(shè)計(jì)相關(guān)的信息是非常重要的。因此,得到這兩個(gè)屬性,然后使用相似度測(cè)量技術(shù)來檢索匹配的服裝,正如CIELAB[3]所引導(dǎo)的那樣,CIELAB在定義圖像中的顏色信息方面具有精妙的能力,因此有利于評(píng)估不同圖像之間的區(qū)別。為了更好地匹配,本文將圖像的中心部分作為感興趣的區(qū)域。
模式:使用Gabor filter[4]提取模式的特征,Gabor濾波器通常是高斯函數(shù)乘以余弦函數(shù)發(fā)現(xiàn)在一定頻率和角度下的邊,為了提高效率,首先計(jì)算和存儲(chǔ)過濾器系列,表示如式(1)。
(1)
其中,x′和y′分別表示如下:
x′=xcosθ+ysinθ
y′=ycosθ+ysinθ
提取模式特征的特征向量的算法如下所示。為了比較圖像,選取兩個(gè)描述符向量的差值,并提供了一個(gè)距離值,數(shù)據(jù)庫圖像和目標(biāo)圖像之間的相似度取決于距離,如果距離大,相似度就小,如果距離小,相似度就大。
特征組合:一件有特定設(shè)計(jì)/圖案的衣服可以有不同的顏色,這就是為什么在女性服飾搭配中圖案起著至關(guān)重要的作用。所以本文給圖案特征更多的權(quán)重而不是顏色,采用如下權(quán)重實(shí)現(xiàn)特征提取[5-6]。
Wg=1.7
Wc=1
(2)
(1)數(shù)據(jù)集
為了評(píng)估使用顯示社會(huì)中服裝圖像數(shù)據(jù)的1 000種方法的成功性,從各種在線購物網(wǎng)站——flipkart、jabong、snapdeal、voonik、shopper stop、myntra——準(zhǔn)備了一組XX服飾的圖片。從集合中隨機(jī)選擇10%的圖像作為查詢,其余的圖像將在以后任意檢索。因?yàn)樗械姆b圖片都有清晰的背景,所以不需要圖像處理技術(shù)來提煉圖像,每個(gè)圖片的中心部分,也就是我們感興趣的區(qū)域(ROI),在去掉頭部和手的部分后會(huì)被裁剪出來,從而構(gòu)建特征數(shù)據(jù)集合。
(2) 性能評(píng)價(jià)
通過系統(tǒng)的精確性和可回憶性有助于找出潛在的檢索,Recall計(jì)算系統(tǒng)的性能以檢索所有相關(guān)的模型,同時(shí)precision計(jì)算系統(tǒng)的性能以僅檢索相關(guān)的模型,他們的定義分別如式(3)
(3)
其中A表示檢索到的相關(guān)圖像的數(shù)量,B表示檢索到的不相關(guān)圖像的數(shù)量,C表示未檢索到的相關(guān)圖像的數(shù)量。
使用最佳F-score標(biāo)準(zhǔn)確定選取的準(zhǔn)確性:
在衣服的選取過程中,P和R是像素相對(duì)于手工分割的地面真相的精度和召回率。通過式(3)可獲取F值為0.879,這在我們的F-score方法中顯示出了合理的準(zhǔn)確性,它在1處達(dá)到了最佳值,在0點(diǎn)處最差。此外,通過對(duì)圖3的可視化檢查,可以肯定檢索結(jié)果是定性的。我們可以觀察到,該系統(tǒng)對(duì)相似顏色、圖案、服裝長(zhǎng)度和袖子長(zhǎng)度的相關(guān)服裝結(jié)果是可靠的,為采用特征匹配對(duì)三款不同風(fēng)格的衣服樣本進(jìn)行檢索,正確的和錯(cuò)誤的獲取的衣服屬性分別用藍(lán)色的星星和紅色的星星來標(biāo)記,如圖3所示。
利用Matlab 13a實(shí)現(xiàn)了該方法。每個(gè)查詢從數(shù)據(jù)庫中返回前10個(gè)圖像,然后使用式(1)計(jì)算精度值,使用式(3)計(jì)算平均精度。這一工作結(jié)果的平均精度為83%,這是指比其他方法更好的檢索結(jié)果。
用該方法求出的服裝長(zhǎng)度和袖子長(zhǎng)度,其性能與實(shí)際相符。服裝長(zhǎng)度的平均精度為93%,說明該方法對(duì)服裝長(zhǎng)度進(jìn)行了分類,得到了最新的技術(shù)成果,本文所提出的袖子長(zhǎng)度分類平均精度為89%。商業(yè)服裝圖像數(shù)據(jù)集的實(shí)證結(jié)果表明,與其他最先進(jìn)的檢索方法相比,所提出的框架獲得了滿意的檢索結(jié)果,結(jié)果如圖4所示。
圖3 分類結(jié)果圖
圖4 檢測(cè)結(jié)果圖
對(duì)RGB、CIELAB和HSV顏色空間模型的結(jié)果進(jìn)行了比較。結(jié)果表明,CIELAB顏色模型優(yōu)于HSV和RGB顏色模型。
本文提出了一種非常新穎的方法來檢索和識(shí)別服飾,本文在對(duì)服裝形象的四個(gè)主要屬性進(jìn)行提取和比較的基礎(chǔ)上進(jìn)行了研究。這些特性包括顏色、圖案、服裝長(zhǎng)度和袖子長(zhǎng)度。根據(jù)目標(biāo)圖像和數(shù)據(jù)庫圖像之間的相似性,對(duì)每個(gè)屬性進(jìn)行評(píng)分。結(jié)果表明,基于本研究的系統(tǒng)在大多數(shù)情況下均運(yùn)轉(zhuǎn)良好。