范海紅
(浙江郵電職業(yè)技術學院 管理信息學院,浙江 紹興 312000)
近幾年,隨著電子商務迅速發(fā)展,相應的物流產(chǎn)業(yè)也快速發(fā)展,包裹數(shù)量遠超歐美國家的總和。但在物流技術比如包裹圖像識別等方面為我國還相對落后。目前,計算機圖像識別等已經(jīng)在人臉識別、醫(yī)學圖像中廣泛應用,如何將圖像識別技術運用到物流運輸?shù)刃袠I(yè)中成為比較熱門的話題。物流運輸中,包裹圖像的檢測非常重要,可以快速有效地確定包裹的數(shù)量,分配資源,同時也能避免卡塞、掉落等異?,F(xiàn)象。但在運送過程中包裹很容易產(chǎn)生遮擋現(xiàn)象,從而導致包裹檢測困難的增加,因此必須使用分類器來識別包裹特征。所以本研究通過引入卷積神經(jīng)網(wǎng)絡獲得特征,從而完成包裹圖像識別等的檢測任務。
卷積神經(jīng)網(wǎng)絡系統(tǒng)是一個涉及卷積處理計算的深層次的前饋神經(jīng)網(wǎng)絡,網(wǎng)絡結(jié)構(gòu)一般涵蓋了數(shù)據(jù)輸入層、卷積計算層、池化層、連通處理層以及全連接層。卷積層可以提取大量數(shù)據(jù)的基本特征信息,通過卷積核的卷積運算得到輸入圖像的深層特征信息。池化層對卷積層的計算結(jié)果進行優(yōu)化降維,降低圖像的分辨率,減少參數(shù)量,同時獲得圖像平移和形變的魯棒性。交替組合使用卷積優(yōu)化層和圖像池化層,完成圖像特征信息的提取,同時降低圖像的分辨率,完成數(shù)據(jù)降維效果。
目前,最常見的卷積神經(jīng)網(wǎng)絡有很多,比如AlexNet、VGG、ResNet等。而VGG網(wǎng)絡系統(tǒng)在圖像數(shù)據(jù)獲取方面也相當優(yōu)秀,而且泛化能力強大,使用范圍廣闊。目前,VGG-16網(wǎng)絡系統(tǒng)主要分為十三個卷積層和三處全連通層,卷積核為3×3,步長為1,該網(wǎng)絡可以減少參數(shù)優(yōu)化計算。為降低包裹檢驗的時間消耗和內(nèi)存耗費,本文采用了VGG-16網(wǎng)絡技術來獲取特征信息,并將ImageNet數(shù)據(jù)集上VGG-16權重值作為本文提取網(wǎng)絡特征的起始權重,輸出的特征信息用作包裹檢測依據(jù)。
區(qū)域生成網(wǎng)絡RPN 通過CNN 提取到特征信息,獲取候選框。而網(wǎng)絡訓練過程中,每個像素點都會產(chǎn)生9個錨節(jié)點,在分類層中,利用激活函數(shù)softmax對每一個錨節(jié)點進行判斷,區(qū)分為前景圖像還是背景圖像,在回歸層中,通過調(diào)整錨節(jié)點的參數(shù),擬合得到候選框位置,綜合前景圖像和候選框位置生成候選區(qū)域,RPN網(wǎng)絡結(jié)構(gòu)圖如圖1所示。
圖1 RPN網(wǎng)絡結(jié)構(gòu)圖
Faster R-CNN 算法是基于卷積神經(jīng)網(wǎng)絡的Fast R-CNN 算法和RPN 網(wǎng)絡結(jié)構(gòu)結(jié)合實現(xiàn)的算法。與經(jīng)典的檢測框生成方法不同,F(xiàn)aster R-CNN直接采用RPN網(wǎng)絡結(jié)構(gòu)獲取檢測框,提升生成速度。首先,通過RPN網(wǎng)絡搜索出粗略范圍,識別出保護壓板所在區(qū)域,然后用投入狀態(tài)和退出狀態(tài)的壓板圖片對Faster R-CNN進行訓練,從而提高算法對壓板投退特征的識別能力,最后采用已訓練完成的Faster R-CNN算法對RPN算法劃定的搜索范圍進行特征檢索,識別搜索框中壓板的投退狀態(tài)。Faster R-CNN算法的原理圖如圖2所示。
圖2 Faster R-CNN算法設計原理演示圖
當對一個包裹目標進行定位分類時,常常需要用一個定位分類器對不同包裹類型進行計算。目前,我們使用的主要包裹檢測方法是SVM分類器,在結(jié)合卷積神經(jīng)網(wǎng)絡的包裹追蹤檢測算法中,使用Softmax 分類函數(shù)計算包裹目標追蹤概率,并以此方式判斷包裹類別和完成包裹目標的定位。目標定位時,先開始得到一個候選框,接著再開始使用全連接層和Softmax函數(shù)對每個包裹進行定位劃分。由于部分候選框并沒有很精確地選中目標物,所以就必須對每個候選框都作出細微的調(diào)節(jié),這個方法就叫做邊界框調(diào)整回歸。如圖3所示,最原始的目標候選框為一個虛線框P,而回歸目標框為點線框G,回歸目的為利用大數(shù)據(jù)訓練得到與目標候選框P和回歸目標框G更接近的回歸框(實線框S)。當P和G之間的距離較近時,回歸法對確定目標的位置更精確有效。
圖3 邊界框回歸示意圖
邊界框回歸過程中,主要利用回歸算法完成對檢測框位置的調(diào)整,包括大小和長度比的調(diào)整。具體坐標參數(shù)化設定:
其中,水平方向的中心為,垂直方向中心為,和表示寬和高,而表示真實的目標框G的數(shù)據(jù),表示初始候選框P 的數(shù)據(jù),從而目標框數(shù)據(jù)可以用(t,t,t,t)表示。
為了完成目標劃分和定位功能,在卷積層中使用的卷積核都必須進行訓練,并且還必須把分類損失函數(shù)L與定位損失函數(shù)L結(jié)合,融合到同一個損失函數(shù)里。采用基于Softmax的損失函數(shù)作為分類損失函數(shù),而Faster R-CNN的損失函數(shù)主要定義如下:
由于快遞中轉(zhuǎn)中心產(chǎn)生了大量包裹,從而形成聚集現(xiàn)象,容易導致包裹識別錯誤。本文通過使用RepGT損失函數(shù)調(diào)節(jié)包裹檢測計算中的回歸項,以選取更合理的候選框,從而減小預測框與目標框之間的間距,并增加與其周圍非相應目標框的間距。因而可以設計的損失函數(shù)如下:
是(0,1)區(qū)間上連續(xù)可微的函數(shù),∈[01)是異常值的敏感參數(shù)??梢园l(fā)現(xiàn),如果同時存在多個候選框都與目標框重合,則RepGT損失函數(shù)就會通過增大懲罰損失使得整體的損失值不斷增大,這樣就能獲得對該目標框最合適的候選框。
本文將以改進前后的Faster R-CNN兩個檢測算法作為對照實驗,在Faster R-CNN的損失函數(shù)上再添加損失函數(shù) 。全部實驗都在同樣的實驗條件下完成,并且設置相同的計算參數(shù),其中正則化系數(shù)為10,動量系數(shù)為0.9,通過隨機梯度下降算法完成優(yōu)化。初始學習效率為0.001,在20 000 次迭代后進行0.1倍的衰減,共計迭代60 000次。
為檢驗Faster R-CNN算法的有效性,選擇了物流企業(yè)某時刻下的包裹數(shù)據(jù)圖片,利用改進后的Faster R-CNN網(wǎng)絡,對包裹目標信息進行了檢驗。具體的訓練方法是,在同樣的實驗數(shù)據(jù)和同樣的參數(shù)訓練網(wǎng)絡下,先得到訓練模型,并在測試集中進行測試,然后對測試結(jié)果進行統(tǒng)計分析。
圖4的數(shù)據(jù)分析結(jié)果可得,通過增加RepGT損失函數(shù)得到的改進后的算法可以更高效、更準確地分離目標框,相比傳統(tǒng)的Faster R-CNN,檢測效率更佳。從表1中可發(fā)現(xiàn),對于平均準確精度AP值,傳統(tǒng)Faster R-CNN 的檢測準確度為56.60,而改進后的算法檢測準確度達到了58.98,比傳統(tǒng)的Faster R-CNN算法增加了2.38AP,在精度方面有了顯著的提高。
圖4 算法實驗結(jié)果對比圖
表1 包裹檢測數(shù)據(jù)集的測試結(jié)果
表2結(jié)果表明隨著參數(shù)的變化,模型性能也跟著變化,對算法的檢測精度也有一定的影響。表中結(jié)果表明當參數(shù)1 時,包裹檢測數(shù)據(jù)集中檢測精確度最佳。
表2 不同參數(shù)的測試結(jié)果
針對密集包裹檢查問題,建立了由損失函數(shù)改進的Faster R-CNN 的檢查計算。使用了傳統(tǒng)的Faster R-CNN的包裹檢查流程,包含了特征提取、區(qū)域形成、目標定位和分析,并結(jié)合RepGT損失函數(shù)對密集堆積包裹和遮擋現(xiàn)象中的問題進行了計算修正,并通過數(shù)據(jù)實驗得到結(jié)果,顯示改進后的檢測精度從56.60提升到58.98。同時對損失函數(shù)中參數(shù)做了調(diào)試分析,得出在參數(shù)1 時算法性能良好,有待今后研究借鑒。但針對現(xiàn)代物流中的包裝檢驗問題,目前還是存在著類似于小目標包裝檢驗、人工標注等方面的不足,仍有待今后進一步研究。