• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于ShuffleNet的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)搜索

      2020-07-06 03:39:35胡金水劉辰宇吳航
      中國(guó)新通信 2020年3期
      關(guān)鍵詞:網(wǎng)絡(luò)結(jié)構(gòu)神經(jīng)網(wǎng)絡(luò)深度

      胡金水 劉辰宇 吳航

      摘要:神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計(jì)在深度學(xué)習(xí)任務(wù)中至關(guān)重要,自動(dòng)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)算法的思想是在特定實(shí)際任務(wù)下,減少人工參與,直接搜索出最優(yōu)模型結(jié)構(gòu)。本文提出一個(gè)基于ShuffleNet的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)搜索算法,該算法將計(jì)算量限制嵌入進(jìn)演化搜索過(guò)程,自適應(yīng)地調(diào)整網(wǎng)絡(luò)結(jié)構(gòu)中的通道劃分比例和通道混淆策略。在實(shí)際任務(wù)應(yīng)用所需的計(jì)算量限制下,可搜索出最優(yōu)模型結(jié)構(gòu),并具備高效前向推理效率。

      關(guān)鍵詞:前向推理;結(jié)構(gòu)搜索

      引言

      深度學(xué)習(xí)近年成為人了智能領(lǐng)域廣泛研究的一個(gè)熱門(mén)技術(shù)。深度學(xué)習(xí)可以理解成一個(gè)數(shù)據(jù)驅(qū)動(dòng)的端到端的特征表示學(xué)習(xí)框架,這個(gè)框架中重要的構(gòu)成是神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。目前研究者提出了殘差網(wǎng)絡(luò)等一系列重要的網(wǎng)絡(luò)結(jié)構(gòu),提高了圖像識(shí)別、自然語(yǔ)言處理領(lǐng)域等眾多任務(wù)的效果,但是面向移動(dòng)端的實(shí)際應(yīng)用,在保證識(shí)別率下降可控的前提下,如何提升神經(jīng)網(wǎng)絡(luò)的前向推理效率仍然是不可回避的難題。最近一些前向推理輕量級(jí)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)相繼提出,一定程度上緩解了推理效率低的問(wèn)題。通過(guò)端到端的方式來(lái)可以進(jìn)行特征表示學(xué)習(xí),是否可以設(shè)計(jì)一個(gè)算法,針對(duì)特定任務(wù),通過(guò)端到端的方式直接給出模型的結(jié)構(gòu)呢?

      本文先簡(jiǎn)單介紹神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)搜索的最新進(jìn)展,接著提出一個(gè)輕量級(jí)的自動(dòng)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)算法,能根據(jù)實(shí)際任務(wù)的硬件算力,自適應(yīng)地調(diào)整網(wǎng)絡(luò)結(jié)構(gòu)中通道劃分比例和通道混淆策略。

      一、神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)搜索概述

      神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)搜索通過(guò)構(gòu)建一個(gè)RNN作為神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)采桿器,利用強(qiáng)化學(xué)習(xí)算法將采桿所得的神經(jīng)網(wǎng)絡(luò)的性能表現(xiàn)作為反饋去優(yōu)化該采桿器,使采樣器采桿所得的網(wǎng)絡(luò)性能達(dá)到最優(yōu)。但由于搜索空間龐大,每次采桿的子網(wǎng)絡(luò)都需要從頭進(jìn)行訓(xùn)練,需用450塊GPU訓(xùn)練長(zhǎng)達(dá)數(shù)月,難以實(shí)用。為減少搜索耗時(shí),有論文中改為搜索子結(jié)構(gòu),而完整網(wǎng)絡(luò)結(jié)構(gòu)則由這兩種網(wǎng)絡(luò)子結(jié)構(gòu)雄疊而成。由于這種模塊結(jié)構(gòu)搜索空間相對(duì)較小,搜索耗時(shí)降低了7倍。更有研究組通過(guò)構(gòu)建超網(wǎng)絡(luò)并引入權(quán)車共享的思想,在搜索效果略有下降的情況下僅用單塊GPU在一天內(nèi)即可實(shí)現(xiàn)。

      此后,出于效率和資源消耗的考慮,基超網(wǎng)絡(luò)的搜索方案逐漸成為主流。由于強(qiáng)化學(xué)習(xí)算法搜索過(guò)程收斂較慢,性能不穩(wěn)定,業(yè)界又提出了One-shot NAS算法和DARTS算法。One-shot NAS算法將訓(xùn)練與搜索分開(kāi)進(jìn)行,通過(guò)在超網(wǎng)絡(luò)里隨機(jī)采桿子網(wǎng)絡(luò)進(jìn)行超網(wǎng)絡(luò)訓(xùn)練,并對(duì)訓(xùn)好的超網(wǎng)絡(luò)通過(guò)EA算法進(jìn)行子網(wǎng)絡(luò)搜索,從而獲得最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)。而DARTS方案最早由CMU團(tuán)隊(duì)提出,通過(guò)松弛超網(wǎng)絡(luò)的所有子網(wǎng)絡(luò),利用超參進(jìn)行加權(quán)組合,通過(guò)梯度下降算法對(duì)該超參進(jìn)行優(yōu)化。最后,根據(jù)優(yōu)化結(jié)果即可獲得最優(yōu)子網(wǎng)絡(luò)。相比于另兩種方案,這種基于梯度優(yōu)化的方案效率極高,極大地減小了搜索耗時(shí)。

      另一方面,采用網(wǎng)絡(luò)模塊結(jié)構(gòu)搜索空間,這桿搜索出來(lái)的網(wǎng)絡(luò)結(jié)構(gòu)效果較好,但由于網(wǎng)絡(luò)模塊內(nèi)部較為碎片化,難以實(shí)現(xiàn)并行計(jì)算,實(shí)際部署難度大,效率低。如果采用的是全局結(jié)構(gòu)搜索空間,搜索網(wǎng)絡(luò)空間包含深度寬度等模型結(jié)構(gòu)的大部分超參,這樣保證了獲得的網(wǎng)絡(luò)模塊結(jié)構(gòu)相對(duì)規(guī)整,使得網(wǎng)絡(luò)結(jié)構(gòu)部署相對(duì)簡(jiǎn)單。

      二、基于ShuffleNet的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)搜索

      (一)ShumeNet簡(jiǎn)介

      與殘差網(wǎng)絡(luò)等不同,ShuffleNet系列的模型通過(guò)引入有規(guī)則的通道打亂來(lái)增強(qiáng)輕量級(jí)Depthwise(DW)卷積后特征通道上的信息混疊,同時(shí)ShuKleNetV2又額外通過(guò)通道均分和拼接的操作移除了網(wǎng)絡(luò)中的碎片元組操作,使模型的效率和效果得到了進(jìn)一步提升。一個(gè)基本的ShuKleNetV2塊結(jié)構(gòu)如下圖1(a)所示。

      通過(guò)分析,我們發(fā)現(xiàn)ShuKleNetV2的通道切分與拼接實(shí)際上是在不斷地進(jìn)行特征的整合與復(fù)用,且隨著通道上的不斷拆分與組合,通道上特征的實(shí)際深度是現(xiàn)出一種固定分布的特性。進(jìn)一步,當(dāng)我們不是考慮通道均分,而是考慮通用性更強(qiáng)的比例切分時(shí),特征通道的實(shí)際深度仍然具有固定分布的特性。

      考慮每次切分出比例為p的通道數(shù),當(dāng)圖1(a)中的ConvOP為DW卷積時(shí),網(wǎng)絡(luò)第K層實(shí)際深度為j的通道數(shù)目占比為:

      實(shí)際深度為i的通道數(shù)目占比為:

      (二)搜索算法描述

      根據(jù)式(3-1)、式(3-2)可知,在每層網(wǎng)絡(luò)切分比例固定的時(shí)候,最終特征的復(fù)用和組合是滿是與通道切分比例相關(guān)的固定分布的。如果我們對(duì)每層通道切分的比例進(jìn)行針對(duì)性建模優(yōu)化,就可以對(duì)不同任務(wù)、不同數(shù)據(jù)、不同計(jì)算量需求去靈活自動(dòng)搜索出該場(chǎng)景可用的最優(yōu)模型,同時(shí)滿是所得模型的高效推理特性。

      本文使用遺傳算法對(duì)自動(dòng)通道切分結(jié)構(gòu)進(jìn)行了演化搜索,且將計(jì)算量限制嵌入進(jìn)演化過(guò)程,保證了計(jì)算資源限制下的最優(yōu)搜索。一個(gè)搜索空間和搜索結(jié)果的例子如圖1(b)、圖2所示,紅色代表著當(dāng)前層所使用的通道,藍(lán)色代表復(fù)用的通道,通過(guò)特征的不斷組合,算法可搜索㈩最優(yōu)模型結(jié)構(gòu),同時(shí)具備高效前向推理效率。

      三、結(jié)論

      本文提出了一個(gè)基于輕量級(jí)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)搜索算法。該算法基于遺傳算法對(duì)通道劃分比例和通道混淆策略進(jìn)行了演化搜索,將計(jì)算量限制嵌入進(jìn)演化過(guò)程,解決了受限計(jì)算資源下的神經(jīng)網(wǎng)絡(luò)大規(guī)模靈活應(yīng)用問(wèn)題。

      猜你喜歡
      網(wǎng)絡(luò)結(jié)構(gòu)神經(jīng)網(wǎng)絡(luò)深度
      深度理解一元一次方程
      神經(jīng)網(wǎng)絡(luò)抑制無(wú)線通信干擾探究
      電子制作(2019年19期)2019-11-23 08:42:00
      深度觀察
      深度觀察
      深度觀察
      基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
      基于互信息的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)
      知識(shí)網(wǎng)絡(luò)結(jié)構(gòu)維對(duì)于創(chuàng)新績(jī)效的作用機(jī)制——遠(yuǎn)程創(chuàng)新搜尋的中介作用
      滬港通下A+ H股票網(wǎng)絡(luò)結(jié)構(gòu)演化的實(shí)證分析
      復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)比對(duì)算法研究進(jìn)展
      万年县| 工布江达县| 灵宝市| 盐源县| 犍为县| 秦安县| 名山县| 平潭县| 南木林县| 阳西县| 漳州市| 浦东新区| 修武县| 馆陶县| 舒兰市| 饶平县| 铁岭市| 兴业县| 周口市| 阿拉尔市| 九台市| 修水县| 大宁县| 桂东县| 柳江县| 瑞金市| 宝山区| 芦山县| 宁乡县| 沙雅县| 扶余县| 庐江县| 团风县| 滦平县| 兴和县| 张北县| 即墨市| 古蔺县| 丹凤县| 潮安县| 都昌县|