陳晉音,王 楨,鄭海斌
(浙江工業(yè)大學(xué) 信息工程學(xué)院,杭州 310000)
非法流動(dòng)攤販,是指沒(méi)有合法的經(jīng)營(yíng)許可證、沒(méi)有固定的經(jīng)營(yíng)場(chǎng)所,在人流密集的公共場(chǎng)所擺攤設(shè)點(diǎn),擅自進(jìn)行貨物交易行為的人員[1].流動(dòng)攤販的存在,有一定的積極作用,但也存在極大的弊端.其好處在于,滿足了城市居民的日常需求,為居民生活提供了便利;另一方面,居民對(duì)流動(dòng)攤販的需求,為外來(lái)務(wù)工人員以及失業(yè)人員提供了一定的就業(yè)機(jī)會(huì).而其弊端在于,流動(dòng)攤販往往聚集在城市中人流量較大的路段,嚴(yán)重影響了交通秩序和市容市貌;其次,流通攤販?zhǔn)圪u的食物、商品基本是未通過(guò)衛(wèi)生與質(zhì)量監(jiān)督部門的檢查,存在著極大的安全隱患問(wèn)題;此外,流動(dòng)攤販的經(jīng)營(yíng)活動(dòng)產(chǎn)生的噪音、垃圾污染會(huì)直接影響周邊的環(huán)境與居民日常生活,擾亂了社會(huì)秩序[2].因此,城市管理部門需要對(duì)流動(dòng)攤販進(jìn)行監(jiān)控、管理.
非法流動(dòng)攤販管理的難點(diǎn),在于其流動(dòng)性.城市管理部門執(zhí)法人員無(wú)法確定流動(dòng)攤販經(jīng)營(yíng)的時(shí)間、地點(diǎn),需要不斷的進(jìn)行人工巡視,因此存在監(jiān)管難度大、監(jiān)管盲區(qū)多、管理成本高等問(wèn)題.
本文結(jié)合注意力機(jī)制提出了一種基于深度學(xué)習(xí)模型的非法流動(dòng)攤販檢測(cè)方法.該方法首先對(duì)視頻圖像數(shù)據(jù)進(jìn)行人工標(biāo)注建立訓(xùn)練數(shù)據(jù)集,然后訓(xùn)練并使用改進(jìn)的Faster R-CNN Inception Resnet-v2 attention目標(biāo)檢測(cè)模型(FRIRAM),對(duì)非法流動(dòng)攤位與行人進(jìn)行檢測(cè),從監(jiān)控圖像中獲得攤位與行人的位置信息.最后,基于圖像處理技術(shù)通過(guò)幀間攤販對(duì)比對(duì)得到的目標(biāo)位置信息進(jìn)行處理,確定非法流動(dòng)攤販,并使用適當(dāng)數(shù)據(jù)處理方式進(jìn)行取證,進(jìn)一步通知管理人員進(jìn)行定點(diǎn)監(jiān)控、管理.
在我國(guó),目前的城市非法流動(dòng)攤販管理工作中,以人工形式的城管人員現(xiàn)場(chǎng)巡視管理為主導(dǎo)的管理制度的弊端在于[3]:非法流動(dòng)攤販的反復(fù)性強(qiáng),治理與管理效率低,“城管進(jìn),攤販逃;城管撤,攤販進(jìn)”;同時(shí),如今社會(huì)輿論[4]往往偏向于流動(dòng)攤販經(jīng)營(yíng)者,攤販與城管若發(fā)生矛盾沖突,網(wǎng)友總是強(qiáng)調(diào)攤販的弱勢(shì)群體身份,一味指責(zé)城管部門的粗暴執(zhí)法行為,使工作人員的執(zhí)法處于被動(dòng)與孤立的地位.造成這一治理困境的主要原因在于,無(wú)法及時(shí)有效的對(duì)流動(dòng)攤販們的非法經(jīng)營(yíng)行為進(jìn)行取證與預(yù)警.
作為計(jì)算機(jī)視覺(jué)領(lǐng)域的一個(gè)主要的研究方向,圖像目標(biāo)檢測(cè)成為數(shù)字取證的一種關(guān)鍵技術(shù).經(jīng)典的目標(biāo)檢測(cè)方法,指未使用神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)方法.此類方法種類較多,如背景差分法[5],混合高斯模型法[6].Shao等人[7]提出了一種基于視頻序列的跟蹤檢測(cè)方法用于識(shí)別監(jiān)控中的車輛.He等人[8]提出了一種結(jié)合運(yùn)動(dòng)邊界和稀疏光流的運(yùn)動(dòng)目標(biāo)檢測(cè)方法,可以精確地檢測(cè)出完整的運(yùn)動(dòng)目標(biāo).
深度學(xué)習(xí)作為新興的機(jī)器學(xué)習(xí)研究領(lǐng)域,最早由多倫多大學(xué)的G.E.Hinton等人[9]提出.其特點(diǎn)在于,免去了傳統(tǒng)機(jī)器學(xué)習(xí)中的特征工程步驟,可以自主地從原始數(shù)據(jù)中獲取有用的特征信息.深度學(xué)習(xí)在計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別、自然語(yǔ)言處理等領(lǐng)域均有廣泛的應(yīng)用前景.
隨著深度學(xué)習(xí)的進(jìn)一步研究,出現(xiàn)了使用深度學(xué)習(xí)進(jìn)行目標(biāo)檢測(cè)的技術(shù).R-CNN[10]方法將卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)方法引入目標(biāo)檢測(cè)領(lǐng)域,大大提升了目標(biāo)檢測(cè)的效果.Girshick等人[11]針對(duì)R-CNN方法中存在的空間、時(shí)間冗余問(wèn)題進(jìn)行改進(jìn),提出了Fast R-CNN方法,實(shí)現(xiàn)了大部分端到端的訓(xùn)練,加快了目標(biāo)檢測(cè)的運(yùn)行速度.Faster R-CNN[12]使用區(qū)域生成網(wǎng)絡(luò)(Region Proposal Network,PRN),相比于Fast R-CNN,擁有更快的速度.YOLO(You Only Look Once)目標(biāo)檢測(cè)模型[13]是一種端到端的神經(jīng)網(wǎng)絡(luò)模型,借鑒了GoogleNet[14]的分類網(wǎng)絡(luò)結(jié)構(gòu).SSD(Single Shot MultiBox Detector)方法[15]與YOLO方法類似,它借鑒了VGG16分類網(wǎng)絡(luò)并使用了非模塊化的端到端模型結(jié)構(gòu),能夠?qū)崿F(xiàn)統(tǒng)一訓(xùn)練,SSD模型能夠?qū)崿F(xiàn)比YOLO更快的處理速度.盡管深度模型具有非常好的目標(biāo)檢測(cè)效果,但是需要有盡可能豐富的訓(xùn)練數(shù)據(jù)集.
最近,注意力機(jī)制在深度學(xué)習(xí)中表現(xiàn)出先進(jìn)性能,能夠捕獲全局依賴性,尤其是處理順序決策任務(wù),例如,具有長(zhǎng)短期記憶的時(shí)空注意力模型被用于人類行為識(shí)別.Xu等人[16]設(shè)計(jì)了處理視頻字幕的視覺(jué)注意力模型,可以密切關(guān)注對(duì)象的關(guān)鍵信息.Yang等人[17]提出了堆疊空間注意力模型,進(jìn)行文本生成和輿情預(yù)測(cè).Bowman等人[18]提出自我關(guān)注的生成對(duì)抗性網(wǎng)絡(luò)進(jìn)行精細(xì)圖像的生成,其中利用注意力機(jī)制遍歷特征圖,專注于空間關(guān)鍵信息.
現(xiàn)有的基于視頻監(jiān)控的非法流動(dòng)攤販檢測(cè)和識(shí)別方法中,人工檢測(cè)方法的人工成本較高且監(jiān)控人員容易疲勞使得檢測(cè)效果較差.傳統(tǒng)的目標(biāo)識(shí)別方法,針對(duì)固定的攤位與物體特征進(jìn)行檢測(cè),檢測(cè)準(zhǔn)確率低且誤檢率高,并需要人工對(duì)誤檢的數(shù)據(jù)進(jìn)行篩選.本文針對(duì)這一技術(shù)現(xiàn)狀提出了基于深度學(xué)習(xí)模型的非法流動(dòng)攤販檢測(cè)方法,該方法結(jié)合注意力機(jī)制和Inception Resnet-v2模型改進(jìn)Faster R-CNN,得到FRIRAM,對(duì)非法流動(dòng)攤位與行人進(jìn)行檢測(cè).為了使模型具有識(shí)別能力,需要從網(wǎng)絡(luò)、監(jiān)控視頻中獲取大量的圖像數(shù)據(jù),并進(jìn)行人工標(biāo)注,構(gòu)成訓(xùn)練數(shù)據(jù)集,以對(duì)模型進(jìn)行訓(xùn)練.使用訓(xùn)練好的目標(biāo)檢測(cè)模型,可以從監(jiān)控圖像中獲得攤位與行人的位置信息.通過(guò)幀間攤販對(duì)比對(duì)得到的位置信息進(jìn)行處理,可以確定非法流動(dòng)攤販,并使用適當(dāng)?shù)臄?shù)據(jù)處理方式進(jìn)行取證、后臺(tái)預(yù)警.其具體的檢測(cè)流程如圖1所示.
圖1 非法流動(dòng)攤販檢測(cè)流程圖Fig.1 Flow chart of illegal floating vendor detection
本文基于深度學(xué)習(xí)算法提出了改進(jìn)的目標(biāo)檢測(cè)模型FRIRAM,基于Faster R-CNN目標(biāo)檢測(cè)網(wǎng)絡(luò)加入Attention注意力機(jī)制并采用Inception Resnet-v2網(wǎng)絡(luò)作為特征提取網(wǎng)絡(luò),有效提高了模型的精度與計(jì)算速度.
本文所設(shè)計(jì)的目標(biāo)檢測(cè)模型進(jìn)行目標(biāo)檢測(cè)的主要步驟是:通過(guò)Inception Resnet-v2模型提取圖像特征,基于特征圖進(jìn)行候選區(qū)域的選擇與映射,加入注意力機(jī)制進(jìn)行各候選區(qū)域參數(shù)的計(jì)算與優(yōu)化,并得到各候選區(qū)域的特征向量,基于特征向量加入注意力機(jī)制計(jì)算相關(guān)系數(shù)進(jìn)行特征向量的篩選與剔除,最后基于得到的特征向量進(jìn)行目標(biāo)分類與邊界回歸以實(shí)現(xiàn)對(duì)目標(biāo)物體的檢測(cè).具體檢測(cè)流程如圖2所示.
圖2 目標(biāo)檢測(cè)流程圖Fig.2 Flow chart of target detection
本文使用Inception Resnet-v2網(wǎng)絡(luò)作為特征提取器,網(wǎng)絡(luò)以inception 模塊為主體,其中的殘差連接可以動(dòng)態(tài)調(diào)整模型的復(fù)雜度,并在一定程度上解決了訓(xùn)練過(guò)程中的梯度爆炸與過(guò)擬合問(wèn)題,增加網(wǎng)絡(luò)架構(gòu)的精確度.本文將原始圖像輸入Inception Resnet-v2網(wǎng)絡(luò),經(jīng)過(guò)一系列卷積、池化與殘差連接等操作后得到特征圖.
候選區(qū)域的選擇指從原始圖像中預(yù)先找出可能存在目標(biāo)的位置,也稱為感興趣區(qū)域(Region of Interest,RoI).本文使用區(qū)域生成網(wǎng)絡(luò)(Region Proposal Network,RPN),通過(guò)滑動(dòng)窗口的方式在特征圖上提取候選區(qū)域.
本文基于各候選區(qū)域增加注意力機(jī)制以對(duì)每個(gè)候選區(qū)域在同一特征圖下的不同深度通道進(jìn)行強(qiáng)化,其過(guò)程如圖3所示.對(duì)于通道深度l為的特征圖,對(duì)每一個(gè)候選區(qū)域進(jìn)行上采樣或下采樣操作以得到尺寸為64×64×l的統(tǒng)一候選區(qū)域.隨后引入尺寸為64×64×1的卷積核,以步長(zhǎng)為1對(duì)各候選區(qū)域進(jìn)行卷積計(jì)算,得到尺寸為64×64×1的區(qū)域特征圖.將區(qū)域特征圖與候選區(qū)域每一層的對(duì)應(yīng)位置相乘求和并取均值以得到每一層的注意力權(quán)重,尺寸為1×l.最后將原始候選區(qū)域的每一層與對(duì)應(yīng)的注意力權(quán)重相乘實(shí)現(xiàn)候選區(qū)域不同通道深度的參數(shù)更新與強(qiáng)化.
圖3 候選區(qū)域注意力機(jī)制示意圖Fig.3 Flow chart of attention mechanism in region of interest
隨后通過(guò)在RPN網(wǎng)絡(luò)后增加RoI池化層將每個(gè)候選區(qū)域映射為單個(gè)固定尺度的特征向量.
本文基于得到的尺度固定的特征向量增加注意力機(jī)制以實(shí)現(xiàn)對(duì)特征向量的篩選與剔除,降低算法復(fù)雜度,其過(guò)程如圖4所示.以1條特征向量為例,對(duì)于各固定尺寸為1×N的特征向量,引入尺寸為1×1的卷積核,以步長(zhǎng)為1對(duì)各特征向量進(jìn)行卷積計(jì)算,得到尺寸為1×N的目標(biāo)向量.隨后對(duì)目標(biāo)向量進(jìn)行轉(zhuǎn)置操作并與特征向量相乘,計(jì)算得到尺寸為1×1的注意力權(quán)重.對(duì)各注意力權(quán)重使用歸一化指數(shù)函數(shù)(softmax)計(jì)算得到相對(duì)應(yīng)的注意力值{βi′,i∈[1,n]}.將各特征向量對(duì)應(yīng)的注意力值進(jìn)行降序排序得到{βi,i∈[1,n]},選取前k個(gè){βi}值對(duì)應(yīng)的特征向量進(jìn)行后續(xù)計(jì)算與操作.k值的選取由原始圖像尺寸,特征向量維度等因素決定.
圖4 特征向量注意力機(jī)制示意圖Fig.4 Flow chart of attention mechanism in feature vector
最后,采用奇異值分解(SVD)將上一步選取得到的特征向量經(jīng)過(guò)各自的全連接層計(jì)算分別得到兩個(gè)輸出向量用于分類與回歸操作.其中,目標(biāo)分類以輸出向量作為輸入,使用支持向量機(jī)(SVM)對(duì)目標(biāo)進(jìn)行分類,實(shí)現(xiàn)目標(biāo)識(shí)別.邊界回歸通過(guò)輸出向量對(duì)候選區(qū)域邊框進(jìn)行回歸、修正,以獲取與目標(biāo)圖像位置最為吻合的邊框,實(shí)現(xiàn)目標(biāo)物體的位置信息提取.
根據(jù)對(duì)實(shí)際監(jiān)控視頻的觀察,流動(dòng)攤販按圖像特征來(lái)區(qū)分,大致可以分為三種:地?cái)倲偽?、固定攤位與車載攤位.地?cái)倲偽?,指直接將貨物擺放在地面上,或在地面上墊布、墊紙后再擺放貨物的攤位,常見(jiàn)的地?cái)倲偽挥惺卟藬?、水果攤等;固定攤位,指帶有桌子、架子或頂棚的攤位,常常帶有較大的招牌、海報(bào),常見(jiàn)的固定攤位有燒烤攤、小吃攤等;車載攤位,指利用機(jī)動(dòng)車、電動(dòng)三輪車運(yùn)載貨物,并直接在街頭販賣的攤位,常見(jiàn)的有車載水果攤、車載小吃攤等.在實(shí)際場(chǎng)景中,流動(dòng)攤位具有種類多樣、特征復(fù)雜、易產(chǎn)生變化等特點(diǎn),對(duì)其進(jìn)行檢測(cè)較為困難.本文將流動(dòng)攤位大體上分為三類,實(shí)際上這三類攤位之間存在一定的共性,比如一個(gè)帶招牌的三輪車車載水果攤位,既可能被識(shí)別為固定攤位、也可能被識(shí)別成車載攤位.對(duì)此,本方法在數(shù)據(jù)處理時(shí),將不區(qū)分三類攤位,均將其看成同一類攤位來(lái)處理,如圖5所示.
圖5 常見(jiàn)的幾類流動(dòng)攤位Fig.5 Common types of floating vendor
在實(shí)際處理過(guò)程中,發(fā)現(xiàn)易混淆的物體有4種,分別為三輪車、垃圾桶、電瓶車、自行車.其中,垃圾桶容易被識(shí)別為固定攤位,三輪車、電瓶車、自行車容易被識(shí)別為車載攤位.為了提高模型的辨識(shí)能力,降低誤判率,本文在數(shù)據(jù)集的構(gòu)建過(guò)程中,為這幾類容易產(chǎn)生誤判的目標(biāo)進(jìn)行標(biāo)記.
由自制數(shù)據(jù)集進(jìn)行訓(xùn)練的基于FRIRAM的目標(biāo)檢測(cè)模型可檢測(cè)出監(jiān)控圖像中的流動(dòng)攤販與行人并確定其位置信息.基于幀間攤販對(duì)比與圖像處理技術(shù)確定非法流動(dòng)攤販并進(jìn)行取證報(bào)警.
3.3.1 幀間攤位對(duì)比
通過(guò)使用改進(jìn)的FRIRAM模型,可以從單幀圖像中獲取到所有流動(dòng)攤販與行人的信息,但是無(wú)法獲取到前后幀之間攤販的關(guān)聯(lián)信息,需要使用幀間攤位對(duì)比的方法,對(duì)具體的流動(dòng)攤販進(jìn)行識(shí)別.幀間攤位對(duì)比可以有兩種方法:攤位特征比對(duì)和攤位位置比對(duì).
攤位特征比對(duì),指使用一定的特征提取網(wǎng)絡(luò),提取每個(gè)攤位的特征信息.這里的特征提取網(wǎng)絡(luò)可以直接使用Faster R-CNN網(wǎng)絡(luò)結(jié)構(gòu)中已訓(xùn)練好的特征提取部分.將提取到的特征圖轉(zhuǎn)化為一維向量,作為攤位特征信息.對(duì)每一幀中檢測(cè)出的所有攤位,進(jìn)行特征提取,將第n+1幀的所有攤位,與第n幀所有攤位進(jìn)行特征比對(duì),使用歐氏距離度量攤位特征的相似性.歐氏距離計(jì)算定義為公式(1):
(1)
其中,F(xiàn)(n,i,x)指第n幀圖像中,第i個(gè)攤位的第x個(gè)特征的值.人為給定距離閾值TL,若L≤TL,則認(rèn)為兩攤位是同一攤位;若L>TL,則認(rèn)為是不同的兩攤位.該方法使用了攤位圖像的信息特征,來(lái)判斷前后幀中出現(xiàn)的兩攤位是否是同一攤位,其優(yōu)點(diǎn)在于:1)適用范圍廣泛,在前后幀攤位位置發(fā)生變化的情況下,也能進(jìn)行正確判斷;2)對(duì)于外觀不同的攤位,識(shí)別準(zhǔn)確率高.但是在實(shí)際應(yīng)用中,我們發(fā)現(xiàn)其缺陷在于:1)運(yùn)算速度慢,需要使用額外的深度神經(jīng)網(wǎng)絡(luò)對(duì)每一攤位進(jìn)行特征提取,需要耗費(fèi)大量的時(shí)間;2)對(duì)于外觀相似的攤位容易發(fā)生誤判.
攤位位置比對(duì),指使用攤位的位置信息,通過(guò)前后幀攤位位置坐標(biāo)、覆蓋情況,來(lái)判斷是不是同一輛車.該方法參考了RPN網(wǎng)絡(luò)訓(xùn)練過(guò)程中使用的GTB(ground true box)方法.首先判斷前后兩幀中,是否存在位置重疊的攤位.假設(shè)A、B兩攤位存在重疊,兩攤位所在矩形區(qū)域面積分別為SA、SB,其重疊面積SC=SA∩SB.對(duì)于存在位置重疊情況的攤位,計(jì)算兩攤位矩形區(qū)域的交集面積,即重疊面積SC,然后計(jì)算兩矩形區(qū)域的并集面積SD=SA∪SB=SA+SB-SC.相似度定義為公式(2):
(2)
IOU的取值在0到1之間,數(shù)值越高,代表兩攤位的重合度越高.給定閾值TIOU,若IOU≥TIOU,則認(rèn)為是同一攤位;若IOU 綜合考慮實(shí)際的非法流動(dòng)攤販檢測(cè)應(yīng)用場(chǎng)景,當(dāng)流動(dòng)攤販存在經(jīng)營(yíng)行為時(shí),攤位往往是靜止不動(dòng)的,此時(shí)需要城市管理部門進(jìn)行相應(yīng)的處理;而當(dāng)流動(dòng)攤位在道路中運(yùn)動(dòng)時(shí),并沒(méi)有進(jìn)行經(jīng)營(yíng)行為,此時(shí)城市管理部門并不需要對(duì)其進(jìn)行處理.因此,流動(dòng)攤販檢測(cè)只需檢測(cè)靜止的攤位,本文使用攤位位置比對(duì)方法即可得到較好的檢測(cè)效果. 3.3.2 流動(dòng)攤販處理及報(bào)警取證 流動(dòng)攤販處理方式由不同的報(bào)警取證方法而定,報(bào)警取證可以有三種方法:流動(dòng)攤位預(yù)警、流動(dòng)攤位取證記錄、流動(dòng)攤販取證記錄. 第一種,流動(dòng)攤位預(yù)警,指僅使用流動(dòng)攤位的信息,對(duì)其進(jìn)行過(guò)濾,篩除可能存在的誤判情況,保留可能正在經(jīng)營(yíng)的非法流動(dòng)攤販信息,給出一個(gè)流動(dòng)攤位預(yù)警值.若該流動(dòng)攤位預(yù)警值超過(guò)一定閾值,則記錄存在流動(dòng)攤位、攤販的監(jiān)控場(chǎng)景圖像,并提醒城市管理部門對(duì)其相關(guān)處理.該方法較為簡(jiǎn)單,僅進(jìn)行場(chǎng)景照片取證與實(shí)時(shí)報(bào)警,具體的攤位、攤販記錄,對(duì)流動(dòng)攤販的處罰、管理,需要城市管理部門進(jìn)行相應(yīng)操作. 第二種,流動(dòng)攤位取證記錄,類似于幀間攤位對(duì)比中的攤位特征對(duì)比方法,指使用一定的深度學(xué)習(xí)特征提取網(wǎng)絡(luò),提取流動(dòng)攤位的特征,并使用攤位特征進(jìn)行取證的方法.該方法使用流動(dòng)攤位的圖像特征信息作為取證的對(duì)象,將攤位信息存儲(chǔ)到數(shù)據(jù)庫(kù)中,同時(shí)提醒城市管理部門進(jìn)行相關(guān)處理.并且每當(dāng)檢測(cè)到一個(gè)新的攤位時(shí),將其特征與數(shù)據(jù)庫(kù)中的攤位信息進(jìn)行比對(duì),可以判斷該流動(dòng)位是否已多次進(jìn)行非法經(jīng)營(yíng)行為.該方法可以實(shí)時(shí)檢測(cè)城市道路中流動(dòng)攤販的情況,同時(shí)可以記錄一定的流動(dòng)攤位信息,為城市管理部門的取證、管理提供了方便.當(dāng)然,該方法也有一些比較明顯的局限性:首先,流動(dòng)攤位目標(biāo)較為復(fù)雜多變,比如攤販僅僅改變其銷售商品的種類,或者改變招牌,就能在一定程度上改變其流動(dòng)攤位特征,因此攤位的特征并不是固定的,對(duì)攤位進(jìn)行取證不一定會(huì)有較好的效果;其次,對(duì)流動(dòng)攤位、攤販的處理,最終應(yīng)以人為目標(biāo),而不應(yīng)以攤位為目標(biāo);最后,由于該方法引入了額外的深度神經(jīng)網(wǎng)絡(luò),不可避免地會(huì)增加計(jì)算的時(shí)間開(kāi)銷.綜上所述,流動(dòng)攤位取證記錄方法,不是一個(gè)較好的數(shù)據(jù)處理以及報(bào)警取證方法. 流動(dòng)攤販取證記錄,與流動(dòng)攤位取證記錄類似,而不同之處在于,該方法以流動(dòng)攤販的人物圖像特征信息作為取證的對(duì)象,而不是攤位的圖像特征.要獲取攤販的人物圖像特征信息,首先要將攤販與普通的行人區(qū)分出來(lái),其次是使用一定的特征提取方法,比如人臉識(shí)別、行人重識(shí)別方法,提取流動(dòng)攤販的圖像特征信息,并將該特征信息保存到數(shù)據(jù)庫(kù)中,同時(shí)提醒城市管理部門進(jìn)行相關(guān)處理.每當(dāng)檢測(cè)到一個(gè)新的攤販時(shí),將其特征與數(shù)據(jù)庫(kù)中的攤販信息進(jìn)行對(duì)比,可以判斷該流動(dòng)攤販?zhǔn)欠褚讯啻芜M(jìn)行非法經(jīng)營(yíng)行為.該方法在對(duì)城市管理部門發(fā)出實(shí)時(shí)提醒的同時(shí),能夠?qū)`法攤販的個(gè)人信息進(jìn)行記錄取證,大大地方便了城市管理部門的工作.該方法的優(yōu)點(diǎn)在于:第一,以個(gè)人信息為對(duì)象進(jìn)行存儲(chǔ)取證,方便城市管理部門進(jìn)行監(jiān)管;其次,行人、人臉信息的區(qū)分度較高,特征比對(duì)的準(zhǔn)確率高.而該方法也有一定的局限性,具體表現(xiàn)為:第一,該方法引入了額外的深度神經(jīng)網(wǎng)絡(luò),不可避免地會(huì)增加計(jì)算的時(shí)間開(kāi)銷;其次,行人、人臉信息的特征信息提取,對(duì)圖像的要求較高,僅適用于監(jiān)控探頭像素較高,或者具備縮放功能的條件下.綜上所述,該方法適用于處理設(shè)備、監(jiān)控探頭等硬件條件較好的情況下,并且能夠獲得較好的效果. 本文使用了德清縣城市道路監(jiān)控視頻數(shù)據(jù),從其中選取部分作為測(cè)試數(shù)據(jù),對(duì)本文的非法流動(dòng)攤販檢測(cè)方法進(jìn)行測(cè)試.具體測(cè)試分為兩部分,第一部分對(duì)改進(jìn)的FRIRAM檢測(cè)模型的檢測(cè)效果進(jìn)行測(cè)試,第二部分對(duì)流動(dòng)攤販取證預(yù)警效果進(jìn)行測(cè)試.本文方法實(shí)際上是對(duì)視頻中的每一幀進(jìn)行單獨(dú)處理的,因此在輸入時(shí),要將視頻拆成單幀圖像來(lái)處理.目標(biāo)檢測(cè)模型每運(yùn)行一次,在不同的物理設(shè)備上所需的時(shí)間是不同的.因此,給定可變參數(shù)N,每N秒從視頻中提取一幀圖像進(jìn)行處理,N的取值需要根據(jù)具體物理設(shè)備而定.本文使用了Nvidia Titan X的GPU對(duì)該模型進(jìn)行實(shí)驗(yàn),每處理一幀大約需要4秒,因此給定N值為5.檢測(cè)的對(duì)象為流動(dòng)攤位與攤販,雖然攤位具有流動(dòng)性,但是正在經(jīng)營(yíng)的攤位往往是固定不動(dòng)的,因此不考慮運(yùn)動(dòng)的攤位,只考慮正在經(jīng)營(yíng)的固定攤位,5秒/次的處理速度完全能夠滿足應(yīng)用需求. 本文使用的流動(dòng)攤販識(shí)別數(shù)據(jù)集,包含8種類標(biāo).其中3種流動(dòng)攤位類標(biāo),1種行人類標(biāo),另4種類標(biāo)為易混淆的物體. 表1為流動(dòng)攤販數(shù)據(jù)集.流動(dòng)攤販對(duì)象較為特殊,網(wǎng)絡(luò)中常見(jiàn)的公共數(shù)據(jù)集中都不包含此類標(biāo)注,因此需要自行構(gòu)建數(shù)據(jù)集,才能使目標(biāo)檢測(cè)模型具備同時(shí)檢測(cè)流動(dòng)攤位與行人的能力. 表1 流動(dòng)攤販識(shí)別訓(xùn)練數(shù)據(jù)集中包含的類標(biāo)及其對(duì)應(yīng)對(duì)象Table 1 Objects and labels in the training dataset 本文選取了幾個(gè)流動(dòng)攤位較多的場(chǎng)景,測(cè)試了流動(dòng)攤位檢測(cè)模型的檢測(cè)效果,結(jié)果如表2所示.由于視頻中不存在預(yù)先的標(biāo)注,本文采用人工辨別的方式進(jìn)行數(shù)據(jù)統(tǒng)計(jì). 表2 流動(dòng)攤位檢測(cè)模型的識(shí)別效果統(tǒng)計(jì)Table 2 Statistical result of floating vendor detection model in test videos 從測(cè)試后數(shù)據(jù)表3來(lái)看,整體上的準(zhǔn)確率達(dá)到了87.99%,召回率達(dá)到了79.95%,可以看出該模型的誤判數(shù)量較低,漏判數(shù)量較高.該模型已經(jīng)具有了一定的流動(dòng)攤位識(shí)別能力,但是識(shí)別準(zhǔn)確率還有待提高. 表3 流動(dòng)攤位檢測(cè)模型總體檢測(cè)效果Table 3 Result of floating vendor detection model 此外,本文使用COCO數(shù)據(jù)集[19]與測(cè)試視頻對(duì)各類目標(biāo)檢測(cè)模型以及本文提出的FRIRAM檢測(cè)模型進(jìn)行檢測(cè)效果的對(duì)比測(cè)試與模型的預(yù)訓(xùn)練,具體實(shí)驗(yàn)結(jié)果記錄如表4所示.從COCO數(shù)據(jù)集的預(yù)訓(xùn)練結(jié)果中可以看出,總體上SSD模型擁有較高的運(yùn)行速度,視頻處理的實(shí)時(shí)性較強(qiáng),而Faster R-CNN模型具有較高的目標(biāo)識(shí)別準(zhǔn)確率,識(shí)別精度較好,而本文提出的FRIRAM目標(biāo)檢測(cè)模型實(shí)現(xiàn)了最高的mAP準(zhǔn)確率,但運(yùn)行耗時(shí)相對(duì)較長(zhǎng).在監(jiān)控視頻數(shù)據(jù)集的目標(biāo)檢測(cè)效果對(duì)比中,F(xiàn)RIRAM目標(biāo)檢測(cè)模型相較于對(duì)比算法模型實(shí)現(xiàn)了最高的流動(dòng)攤販識(shí)別準(zhǔn)確率,體現(xiàn)了本文提出方法的可行性與優(yōu)勢(shì). 非法流動(dòng)攤販檢測(cè)的測(cè)試視頻中,出現(xiàn)流動(dòng)攤販的數(shù)量較少.因此,本節(jié)選取具有代表性的測(cè)試效果進(jìn)行分析.測(cè)試視頻選取了視頻3,在該測(cè)試視頻中,僅存在一個(gè)流動(dòng)攤販.視頻一開(kāi)始該攤販就已處于違法設(shè)攤狀態(tài),過(guò)一段時(shí)間后該攤販離開(kāi).該測(cè)試視頻記錄了從“存在攤販”到“不存在攤販”的狀態(tài)變化,能清楚地展示算法效果. 表4 各類目標(biāo)檢測(cè)模型在COCO數(shù)據(jù)集與測(cè)試視頻上的檢測(cè)效果平均值Table 4 Statistical result of different detection models in CoCo and test videos 圖6為測(cè)試視頻初始幀的圖像.此時(shí)已有流動(dòng)攤販處于擺攤的狀態(tài),并且目標(biāo)檢測(cè)模型已經(jīng)將其檢測(cè)了出來(lái).左上角顯示的是預(yù)警值,其大小與攤位的數(shù)量以及每個(gè)攤位的計(jì)數(shù)值有關(guān),當(dāng)該值超過(guò)100%時(shí),則進(jìn)行預(yù)警.由于該幀是初始幀,計(jì)數(shù)值較低,因此預(yù)警值也較低,攤位均使用虛線框標(biāo)注,而非實(shí)線框.隨著時(shí)間累積,攤位的計(jì)數(shù)值將增大,預(yù)警值也將隨之增大,預(yù)警值較高的攤位將使用實(shí)線框標(biāo)注出來(lái). 圖6 測(cè)試視頻10:41:47Fig.6 Test video 10:41:47 圖7為初始幀之后1分04秒的圖像,此時(shí)攤位的累計(jì)值已較高,攤位使用實(shí)線框標(biāo)注出來(lái),并且左上角的預(yù)警值超過(guò)了100%,此時(shí)應(yīng)向城市管理部門發(fā)出報(bào)警,并進(jìn)行一定的截圖、錄像取證. 圖7 測(cè)試視頻10:42:51Fig.7 Test video 10:42:51 圖8為初始幀之后9分56秒的圖像.在初始幀之后1分鐘到9分鐘的時(shí)間內(nèi),場(chǎng)景中的攤位均能夠被識(shí)別出來(lái),并且發(fā)出預(yù)警.圖8中的車輛將部分?jǐn)偽徽趽?,以至于目?biāo)檢測(cè)模型無(wú)法正確地檢測(cè)出流動(dòng)攤位的位置,沒(méi)有框定區(qū)域,此時(shí)無(wú)法正確識(shí)別. 圖8 測(cè)試視頻10:51:43Fig.8 Test video 10:51:43 圖9為初始幀之后12分08秒的圖像.此時(shí)圖6中的車輛駛離,本文方法再次正確地識(shí)別出流動(dòng)攤位,并進(jìn)行重新框定,但是車輛駛離時(shí)間較短,流動(dòng)攤位的累計(jì)值較低,此時(shí)的預(yù)警值也較低,框定為虛線,還未報(bào)警.由于此時(shí)攤販正在收拾攤位,準(zhǔn)備離開(kāi),部分商品轉(zhuǎn)移到了攤販的三輪車上,目標(biāo)檢測(cè)模型將三輪車檢測(cè)為車載攤位. 圖9 測(cè)試視頻10:53:55Fig.9 Test video 10:53:55 圖10為初始幀之后13分20秒的圖像.此時(shí)流動(dòng)攤販正在離開(kāi),原本攤販販賣的物品已轉(zhuǎn)移到三輪車上.從圖中可以看出,原擺攤的位置不再檢測(cè)出攤位,而將攤販的三輪車檢測(cè)為車載攤位. 圖10 測(cè)試視頻10:55:07Fig.10 Test video 10:55:07 綜合之上的測(cè)試數(shù)據(jù)可以看出,本文提出的非法流動(dòng)攤販檢測(cè)方法,具有一定的檢測(cè)效果,但其存在一定的誤判、漏判現(xiàn)象,在目標(biāo)被遮擋的情況下,識(shí)別率有所下降. 隨著城鎮(zhèn)化的快速發(fā)展,城區(qū)流動(dòng)攤販正成為考量城市政府統(tǒng)籌“繁榮與市容、發(fā)展與穩(wěn)定、民生與秩序”宏觀決策能力和城市治理能力的晴雨表,社會(huì)和媒體對(duì)此也高度關(guān)注.流動(dòng)攤販作為市場(chǎng)經(jīng)濟(jì)發(fā)展階段的產(chǎn)物,雖然一定程度上迎合人們的消費(fèi)心理,卻給城市交通與環(huán)境帶來(lái)了負(fù)面影響并存在較大的食品安全衛(wèi)生隱患以及商品質(zhì)量問(wèn)題. 本文使用改進(jìn)的FRIRAM目標(biāo)檢測(cè)模型,對(duì)街道及制定路段上的非法流動(dòng)攤位與行人進(jìn)行檢測(cè).為了使模型具有識(shí)別能力,本文從網(wǎng)絡(luò)、監(jiān)控視頻中獲取了大量的圖像數(shù)據(jù),并進(jìn)行人工標(biāo)注,構(gòu)成訓(xùn)練數(shù)據(jù)集,以對(duì)模型進(jìn)行訓(xùn)練.使用訓(xùn)練好的目標(biāo)檢測(cè)模型,從監(jiān)控圖像中獲得攤位與行人的位置信息.通過(guò)幀間攤位對(duì)比對(duì)得到的位置信息進(jìn)行處理確定非法流動(dòng)攤販,并使用適當(dāng)?shù)臄?shù)據(jù)處理方式進(jìn)行報(bào)警、取證.由實(shí)驗(yàn)結(jié)果可見(jiàn),本文提出的基于深度學(xué)習(xí)模型的非法流動(dòng)攤販檢測(cè)方法在實(shí)際視頻數(shù)據(jù)上取得了較好的效果,能夠?yàn)榱鲃?dòng)擺攤現(xiàn)象的管理與整治提供技術(shù)幫助與支持.在本文方法的研究過(guò)程中也發(fā)現(xiàn)了不足之處,該方法識(shí)別效果下降的原因,在于自制數(shù)據(jù)集中的數(shù)據(jù)較少.COCO數(shù)據(jù)集中,車輛類的標(biāo)注數(shù)據(jù)有將近10萬(wàn)條,訓(xùn)練出的目標(biāo)檢測(cè)模型能夠達(dá)到超過(guò)90%的識(shí)別準(zhǔn)確率.而本文使用的自制訓(xùn)練集中,僅包含約4000張圖片,可能由于標(biāo)注數(shù)量較少,訓(xùn)練后無(wú)法達(dá)到較高的準(zhǔn)確率.因此,在未來(lái)的研究中將進(jìn)行進(jìn)一步的改進(jìn). 同時(shí),基于本文方法的應(yīng)用效果,對(duì)于未來(lái)的研究方向,將深度學(xué)習(xí)模型與圖像檢測(cè)模型應(yīng)用于其他城市管理領(lǐng)域如違停車輛的檢測(cè)、店外擺攤的檢測(cè)等,都是具有極大理論與實(shí)踐意義的.4 實(shí)驗(yàn)結(jié)果與分析
4.1 數(shù)據(jù)集介紹
4.2 流動(dòng)攤位檢測(cè)與算法對(duì)比
4.3 流動(dòng)攤販取證預(yù)警
5 總 結(jié)