• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于多尺度目標檢測的人群計數(shù)深度方法與系統(tǒng)設計

    2021-09-11 09:01:28賈奇麟段其微
    科學技術創(chuàng)新 2021年25期
    關鍵詞:檢測器人臉特征提取

    賈奇麟 段其微 徐 源

    (南京郵電大學,江蘇 南京 210023)

    1 概述

    人臉檢測是自動人臉識別系統(tǒng)中的一個關鍵環(huán)節(jié)。今天,人臉檢測的應用背景已經遠遠超出了人臉識別系統(tǒng)的范疇,在基于內容的檢索、數(shù)字視頻處理、視頻檢測等方面有著重要的應用價值。本文提出一種基于深度學習目標檢測的人群計數(shù)方法,使用YOLO 目標檢測框架并針對人臉檢測做出改進,改進后的框架能夠較好地檢測大視域下的人臉。在實際應用中,能夠在員工考勤簽到、智慧超市、機場實名認證、走失人員檢測等場景中得以利用。

    2 目標檢測算法論述

    近年來,目標檢測因其廣泛的應用和近年來的技術突破而受到越來越多的關注。這項任務在學術界和現(xiàn)實世界的應用中都得到了廣泛的研究,如監(jiān)控安全、自動駕駛、交通監(jiān)控、無人機場景分析和機器人視覺等[1]。目前,深度學習模型已廣泛應用于計算機視覺的整個領域,包括通用目標檢測和特定領域目標檢測。目標檢測是一種與計算機視覺和圖像處理相關的計算機技術,用于檢測數(shù)字圖像和視頻中某一類語義對象(如人、建筑物或汽車)的實例。

    現(xiàn)有的圖像目標檢測其通??梢员环譃閮深悾阂活愂莟wo-stage 檢測器,最具代表性的是Faster R-CNN[2]。另一類是one-stage 檢 測 器,如YOLO[3]、SSD[4]。two-stage 檢測器具有較高的定位和目標識別精度,而one-stage 檢測器具有較高的推理速度。two-stage 檢測器可以按照ROI 池化層來劃分為two-stage。此外,one-stage 檢測器直接從輸入圖像中提出預測框,不需要區(qū)域建議步長,因此具有時間效率,可用于實時設備。

    FasterRCNN 網絡的主要結構由四個部分組成:(1)CNN(卷積神經網絡):特征提取層,通過特征提取層提取特征向量,(可以使用VGG16,Resnet101 等網絡結構),生成固定大小的特征圖。(2)RPN(區(qū)域建議網絡):使用小的卷積神經網絡(如3x3 小卷積核),在特征圖上進行滑動,在每個滑動位置上,將會接兩個FC 層(也可以使用全卷積網絡),一個用于分類(分析是分類物體的概率和不是物體的概率),一個用于回歸物體位置的坐標。(3)建議區(qū)域在feature map 上的映射:除了每個維度上特征圖的個數(shù),還需要計算每一層的感受野大小,因此我們需要了解每一層的額外信息,包括當前感受野的尺寸,相鄰特征之間的距離,起始特征的中心坐標,其中特征的中心坐標定義為其感受野的中心坐標。(4)ROI pooling 層:就是單層的SPP-Net,負責將不定大小的向量處理為固定大小的向量。

    SSD(Single Shot MultiBox Detection)是單階段多類別目標檢測算法網絡,具有不錯的檢測精度與速度,但小目標檢測效果中并不很理想。SSD 網絡結構主要分為兩部分,一部分是VGGNet16 特征提取網絡,提取圖片目標的特征信息得到特征圖(feature map),另一部分是分類回歸層,對每個候選框進行分類與回歸,識別檢測出圖像目標。

    3 一種多尺度人臉檢測方法

    本文提出了一種基于YOLOv4 結構的人臉檢測算法,首先清洗人臉數(shù)據(jù)集,然后將Widerface 數(shù)據(jù)集輸入至網絡進行訓練,得到該數(shù)據(jù)集對應的PTH 文件,然后對置信度等參數(shù)作適當?shù)男薷模詈筝斎胍粡埲碌膱D片進行驗證。

    YOLOv4 網絡的結構如圖1 所示。其主要由主干特征提取網絡CSPDarknet53、特征金字塔SPP[5]、路徑聚合網絡PANet 等構成。

    圖1 YOLOv4 的結構

    主干特征提取網絡CSPDarknet53:設計出CSPDarknet53 的目的是最大化梯度聯(lián)合的差異。其使用梯度流截斷的手段避免不同的層學習到重復的梯度信息。得出的結論是,如果能夠有效的減少重復的梯度學習,那么網絡的學習能力能夠大大提升。Darknet53 由一系列殘差網絡結構構成。在Darknet53 中,其存在resblock_body 模塊,其由一次下采樣和多次殘差結構的堆疊構成,Darknet53 便是由resblock_body 模塊組合而成。而在YOLOV4 中,其對該部分進行了一定的修改。

    其一是將DarknetConv2D 的激活函數(shù)由LeakyReLU 修改成了 Mish, 卷 積 塊 由 DarknetConv2D_BN_Leaky 變 成 了DarknetConv2D_BN_Mish。Mish 函數(shù)的公式如下:

    其二是將resblock_body 的結構進行修改,使用了CSPNet結 構。 此 時 YOLOV4 當 中 的 Darknet53 被 修 改 成 了CSPDarknet53。

    特征金字塔SPP:在SPP 之前,所有神經網絡都是要輸入固定尺寸的圖片,比如經常遇到的224×224,圖片輸入網絡前都要調整到224×224,導致圖片變形,其中的信息也變形了,從而限制了識別精度。而SPP 就是為了解決這個問題,它可以讓網絡輸入原圖而不必調整,有利于多尺度目標的檢測和識別。

    PANet:其優(yōu)點主要有三個方面。第一,從底到上的路徑增強。當圖像經過神經網絡的各個層時,特征的復雜度增加,同時圖像的空間分辨率降低。因此,像素級mask 無法通過高層次的特征準確的識別。第二,自適應特征池化。以前使用的技術,如Mask-RCNN 使用單一階段的特征來做mask 預測。如果感興趣區(qū)域較大,則使用ROI Align Pooling 從較高層次提取特征。雖然相當準確,但這仍然可能導致不希望的結果,因為有時兩個proposals 只有10 像素的差異,但是分配到了兩個不同的層,而實際上它們是非常相似的proposals。為了避免這種情況,PANet使用來自所有層的特征,并讓網絡決定哪些是有用的。對每個特征圖進行ROI 對齊操作,提取目標的特征。接下來是元素級的最大融合操作,以使網絡適配新的特征。第三,全連接融合。在Mask-RCNN 中,使用FCN 來代替全連接層,因為它保留了空間信息,減少了網絡中的參數(shù)數(shù)量。然而,由于所有空間位置的參數(shù)都是共享的,模型實際上并沒有學會如何使用像素位置來進行預測,默認情況下,它會在圖像的頂部顯示天空,在底部顯示道路。另一方面,全連接層是位置敏感的,可以適應不同的空間位置。PANet 使用來自這兩層的信息來提供更準確的mask 預測。

    對于widerface 數(shù)據(jù)集作適于多尺度的清洗,由于部分過小的人臉分辨率較低,訓練效果較差,因此盡可能地保留了較為清晰的人臉圖片作為訓練數(shù)據(jù)集。

    由于YOLOv4 網絡的默認識別類型有很多,并且不包括人臉,因此本項目做了人臉方面的改進。首先,在類別文件中增加“Face”類別,刪除其他類別;然后用清洗好的人臉數(shù)據(jù)集進行訓練。

    4 實驗結果分析

    項目開發(fā)環(huán)境為VSCode 鏈接Anaconda 平臺,采用Python語言配合Pytorch 庫編寫代碼。將清洗好的數(shù)據(jù)集輸入至該網絡,經過若干次迭代訓練后,Logs 目錄下會生成一個PTH 文件,其中存儲了相關權重參數(shù)。隨后,使用該權重進行預測,預測結果如圖2 所示。

    圖2 預測結果示例

    5 結論與展望

    本文詳細介紹了一種多尺度人臉識別的算法并進行了實驗驗證,證明了該算法的魯棒性以及高效性。該方法可應用于人工智能系統(tǒng)、車輛輔助駕駛系統(tǒng)、智能機器人、智能視頻監(jiān)控、人臉表情分析、智能交通等領域,解決實際問題。

    本算法的關鍵技術改進點:

    (1)使用Mish 激活函數(shù)代替LeakyReLU。(2)采用了特征金字塔SPP 結構。(3)對于多尺度的人臉能夠自適應地進行訓練和檢測。

    通過以上改進,提高了算法的執(zhí)行效率,同時提高了對于多尺度人臉檢測的精度,能適用于多種復雜的場景,保證人臉檢測的正確性。

    針對本文的研究內容,由于時間及能力的局限性,還需要以下的完善:(1)由于訓練用的數(shù)據(jù)集中去除了部分分辨率較低的人臉,因此對于模糊人臉的檢測還需深入研究。(2)本論文僅實現(xiàn)了相關的算法,并針對人臉進行的初步的優(yōu)化,對于檢測精度及速度仍需深入的優(yōu)化和改進。

    猜你喜歡
    檢測器人臉特征提取
    有特點的人臉
    基于Daubechies(dbN)的飛行器音頻特征提取
    電子制作(2018年19期)2018-11-14 02:37:08
    三國漫——人臉解鎖
    動漫星空(2018年9期)2018-10-26 01:17:14
    車道微波車輛檢測器的應用
    Bagging RCSP腦電特征提取算法
    一種霧霾檢測器的研究與設計
    馬面部與人臉相似度驚人
    基于MED和循環(huán)域解調的多故障特征提取
    長得象人臉的十種動物
    奇聞怪事(2014年5期)2014-05-13 21:43:01
    一體化火焰檢測器常見故障分析
    河南科技(2014年22期)2014-02-27 14:18:12
    南召县| 祁门县| 静海县| 多伦县| 祥云县| 南乐县| 根河市| 大连市| 修水县| 安乡县| 牡丹江市| 武冈市| 高清| 屯门区| 永德县| 吉木乃县| 台南市| 邹城市| 华宁县| 洛扎县| 锦州市| 明星| 达拉特旗| 彝良县| 平塘县| 叙永县| 四会市| 东兰县| 龙南县| 建瓯市| 澎湖县| 独山县| 吉木乃县| 讷河市| 定南县| 高要市| 上饶县| 扶绥县| 山丹县| 花莲市| 内丘县|