• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    面向在軌高效實(shí)時(shí)圖像處理的二值權(quán)重沙漏網(wǎng)絡(luò)加速器設(shè)計(jì)

    2021-09-11 01:38:34程利甫徐煒莉趙啟義段欣欣蔣仁興
    上海航天 2021年4期
    關(guān)鍵詞:二值沙漏加速器

    程利甫,徐煒莉,趙啟義,段欣欣,蔣仁興

    (1.清華大學(xué) 集成電路學(xué)院,北京 100047;2.上海航天電子技術(shù)研究所,上海 201109;3.上海市宇航學(xué)會(huì),上海 200235)

    0 引言

    以卷積神經(jīng)網(wǎng)絡(luò)為代表的深度學(xué)習(xí)方法,已經(jīng)在很多圖像處理領(lǐng)域取得了超越人類的性能而獲得廣泛的應(yīng)用,并隨著航空航天領(lǐng)域圖像傳感技術(shù)的演進(jìn)逐步滲透到該領(lǐng)域內(nèi),如在軌圖像處理[1-3]、遙感目標(biāo)識(shí)別[4-7]等。沙漏網(wǎng)絡(luò)(Hourglass Network,HN)作為一種經(jīng)典的網(wǎng)絡(luò)架構(gòu)被廣泛應(yīng)用于特征點(diǎn)檢測等領(lǐng)域,但較高的計(jì)算復(fù)雜度和存儲(chǔ)需求限制了其在設(shè)備端的應(yīng)用。作為有效降低計(jì)算復(fù)雜度的一種方法,二值權(quán)重處理通過將權(quán)重值轉(zhuǎn)換為+1 或-1,使得原來的乘法操作變?yōu)榧臃ú僮鳌?/p>

    本文對(duì)沙漏網(wǎng)絡(luò)的權(quán)重進(jìn)行二值化處理得到二值權(quán)重沙漏網(wǎng)絡(luò)(Binary-weight Hourglass Network,B-HN)。雖然可以將沙漏網(wǎng)絡(luò)的權(quán)重存儲(chǔ)需求降低到1/32,并且將計(jì)算量降低了近1/2,但是,推理過程中的算術(shù)操作數(shù)量仍然很高,需要對(duì)B-HN 算法進(jìn)行進(jìn)一步優(yōu)化。因此,本文的主要設(shè)計(jì)目標(biāo)是在不影響識(shí)別精度的前提下,通過算法-硬件協(xié)同設(shè)計(jì)實(shí)現(xiàn)高能效的高速圖像處理。為了避免造成比較大的精度損失,B-HN 網(wǎng)絡(luò)中第一層以及最后一層權(quán)重需要保持為多比特位寬(硬件實(shí)現(xiàn)時(shí)量化為8 bit)。

    針對(duì)在計(jì)算和存儲(chǔ)兩方面潛在的瓶頸問題,采用多級(jí)預(yù)測校準(zhǔn)機(jī)制及查找表(Look-Up Table,LUT)方法設(shè)計(jì)實(shí)現(xiàn)B-HN 加速器來滿足高效實(shí)時(shí)處理需求。

    首先,采用LUT 的查表方式來代替大量重復(fù)的加法操作。在UNPU[8]中,LUT 被設(shè)置為兩種模式:單比特模式和多比特模式來實(shí)現(xiàn)不同的計(jì)算效率。為了進(jìn)一步提升硬件效率,本文將多比特權(quán)重進(jìn)行離線編碼,轉(zhuǎn)換成可復(fù)用單比特權(quán)重的形式,從而用一種統(tǒng)一模式實(shí)現(xiàn)對(duì)不同位寬權(quán)重計(jì)算的支持,可以進(jìn)一步降低硬件實(shí)現(xiàn)開銷并且獲得更高的能量效率。其次,作為B-HN 中廣泛采用的基本結(jié)構(gòu)——“卷積-歸一化-ReLU”,在經(jīng)過激活后的激活值稀疏度會(huì)達(dá)到30%~90%。

    卷積后為負(fù)值的結(jié)果在經(jīng)過激活后會(huì)被直接置零。因此,針對(duì)這些結(jié)果為負(fù)值的卷積,如果能夠提前判斷其為負(fù)的話,則沒必要執(zhí)行全部完整精確的計(jì)算過程。同樣,對(duì)于最大值池化而言,只需要在熱點(diǎn)圖中定位可能為最大值的點(diǎn)的位置即可。卷積過程中的部分計(jì)算結(jié)果就可以用來提前中止最終為負(fù)值的計(jì)算或提前濾掉非極大值的點(diǎn)。

    基于這些發(fā)現(xiàn),提出了多級(jí)預(yù)測校準(zhǔn)機(jī)制來實(shí)現(xiàn)對(duì)計(jì)算精度的自動(dòng)調(diào)整。與基于內(nèi)核方法[9-10]相比,該方法在AlexNet 和VGG-16 網(wǎng)絡(luò)上可以降低77.4%~82.8%的計(jì)算量,并分別取得2.3~3.4 倍推理速度提升。

    由于殘差網(wǎng)絡(luò)模塊中存在大量的模塊內(nèi)及模塊間的跳轉(zhuǎn)連接,如果采用傳統(tǒng)的逐層計(jì)算模式會(huì)造成大量的存儲(chǔ)訪問操作。而頻繁的片外數(shù)據(jù)訪問會(huì)造成巨大的功耗開銷。為了解決這一問題,提出了基于模塊計(jì)算的流水架構(gòu)(Block Computing Based Pipeline,BCP)來提高片上數(shù)據(jù)重用。與傳統(tǒng)的逐層計(jì)算模式[11]相比可以降低66.2%的片外數(shù)據(jù)訪問。與相似的合并層方法[12]相比,分別降低了60%的片上存儲(chǔ)需求和31%的數(shù)據(jù)訪問。

    在以上優(yōu)化方法的基礎(chǔ)上,在TSMC 28 nm CMOS 工藝下對(duì)B-HN 加速器實(shí)現(xiàn)了后端設(shè)計(jì)和性能分析。該加速器在500 MHz 工作頻率下的功耗為117 mW,功耗效率達(dá)到10.15 TOPS/W。

    1 二值權(quán)重沙漏網(wǎng)絡(luò)模型優(yōu)化

    1.1 沙漏網(wǎng)絡(luò)模型簡述

    基于沙漏模型的算法在特征點(diǎn)檢測的靈活性及精度方面具有明顯的優(yōu)勢(shì)。如圖1 所示,沙漏網(wǎng)絡(luò)在自底向上以及自上向下處理過程中呈現(xiàn)對(duì)稱分布的特點(diǎn),因此,可以獲取圖像在各個(gè)尺度的關(guān)鍵信息。

    圖1 通用的沙漏網(wǎng)絡(luò)模型架構(gòu)及殘差模塊Fig.1 Common hourglass network model and residual block

    除此之外,還可以通過不斷重復(fù)疊加沙漏模塊來提高精度。本文針對(duì)沙漏網(wǎng)絡(luò)進(jìn)行二值權(quán)重優(yōu)化,在通過B-HN 的歸一化圖像處理后會(huì)產(chǎn)生一組熱點(diǎn)圖。每個(gè)熱點(diǎn)反映了該像素作為特征點(diǎn)的概率大小。殘差模塊作為沙漏網(wǎng)絡(luò)中的基礎(chǔ)模塊是本文的主要優(yōu)化對(duì)象,其中,C 代表連接,“+”代表逐個(gè)元素的求和。本文提出的層次化并行模塊(P-Residual Block,PRB)增加了跳轉(zhuǎn)連接,提高了網(wǎng)絡(luò)中的梯度流。同時(shí)該模塊中并不存在1×1 卷積,因?yàn)樵诙稻W(wǎng)絡(luò)中這種卷積核會(huì)造成比較嚴(yán)重的性能下降。

    在PRB 模塊中,存在很多模塊間與模塊內(nèi)的跳轉(zhuǎn)連接。由于模塊中每一層的激活值不能全部存在片上,從而造成大量的片外存儲(chǔ)訪問操作,并進(jìn)一步限制網(wǎng)絡(luò)推理速度并造成比較高的能耗開銷。因此,PRB 模塊是限制整個(gè)B-HN 網(wǎng)絡(luò)性能的一個(gè)主要瓶頸。

    此外,批量歸一化_線性修正單元(Batch Normalization Rectified Linear Unit,BN_ReLU)被重新調(diào)整到卷積層之后,跳轉(zhuǎn)連接之前來進(jìn)行存儲(chǔ)訪問。為了進(jìn)一步利用ReLU 函數(shù)之后造成的稀疏性,采用多級(jí)預(yù)測校準(zhǔn)(Multi-level Prediction-Correction,MPC)模型來降低大量零值激活值與非最大值之間的冗余操作。

    B-HN 的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)是對(duì)稱的,任務(wù)精度與速度可以通過調(diào)整堆疊的沙漏模塊數(shù)量來實(shí)現(xiàn)靈活調(diào)整。同時(shí),通過調(diào)整B-HN 的權(quán)重和最后一層的輸出通道數(shù)來實(shí)現(xiàn)不同的檢測功能。因此,本文提出的方案可以根據(jù)不同的任務(wù)需求(處理速度、功耗、識(shí)別精度等)對(duì)網(wǎng)絡(luò)架構(gòu)和參數(shù)進(jìn)行靈活配置。

    1.2 基于LUT 方法的計(jì)算優(yōu)化

    考慮有限的二值權(quán)重可能會(huì)造成的大量重復(fù)的加法操作,本文提出了基于輸入特征圖重用的LUT 方法來替換這些重復(fù)的操作。在B-HN 網(wǎng)絡(luò)中,需要強(qiáng)調(diào)的是第一層和最后一層的權(quán)重是多比特位寬。在B-HN 網(wǎng)絡(luò)的所有計(jì)算當(dāng)中,多比特位寬權(quán)重卷積操作大概占比達(dá)到43%。因此,針對(duì)多比特位寬權(quán)重卷積操作進(jìn)行優(yōu)化將同樣重要。

    在文獻(xiàn)[13]中,LUT 可以被配置成2 種模式:二值權(quán)重模式和多比特權(quán)重模式。一個(gè)深度為4 的LUT 可以執(zhí)行針對(duì)多比特權(quán)重卷積的兩路位串行加法操作和二值權(quán)重卷積的三路位串行加法操作。為了同時(shí)支持這2 種模式,本文提出了一種統(tǒng)一模式的LUT 方法。

    1.2.1 二值權(quán)重卷積優(yōu)化

    對(duì)于二值權(quán)重,每個(gè)權(quán)重參數(shù)的值或者為-1或者為+1。如果將幾個(gè)二值權(quán)重劃分為一組,則這些權(quán)重的組合也是有限的。如圖2 所示,以M個(gè)輸入特征圖、N個(gè)輸出特征圖,以及濾波器尺寸為3×3 為例,則一共需要N×M個(gè)3×3 的濾波器核。如果每3 個(gè)權(quán)重劃分為一組,對(duì)于相應(yīng)的3 個(gè)輸入激活值a、b、c而言,一共有8 種輸出組合。在通常情況下,卷積神經(jīng)網(wǎng)絡(luò)中輸出通道的數(shù)量要比這些組合的數(shù)量大很多,可以通過LUT 的方法來避免重復(fù)操作。同時(shí)可以發(fā)現(xiàn),LUT 中出現(xiàn)的8 種組合的值是對(duì)稱的,即前4 種組合可以通過相應(yīng)的后4 位組合直接取反得到。因此,只需要對(duì)4 種組合進(jìn)行編碼即可以覆蓋所有可能出現(xiàn)的組合,最后2 bit 用來對(duì)相應(yīng)的LUT 值進(jìn)行選擇,第一比特則用來決定符號(hào)。

    圖2 基于LUT 的二值權(quán)重卷積計(jì)算優(yōu)化Fig.2 LUT-based binary weight convolution optimization

    1.2.2 多比特卷積轉(zhuǎn)換方法

    考慮到二值權(quán)重計(jì)算的高效性,多比特權(quán)重也被轉(zhuǎn)換成二值權(quán)重的形式,從而使得其乘法卷積轉(zhuǎn)換成二值權(quán)重的計(jì)算方式。首先,B-HN 中第一層和最后一層的權(quán)重首先被量化到8 bit。8 bit 權(quán)重值又被進(jìn)一步拆分成8 bit 的基值和8 bit 的校準(zhǔn)值。所有卷積核中基值的每個(gè)bit 都是-1,而校準(zhǔn)值的每一位則可能是+1,也可能是-1。在對(duì)應(yīng)同樣輸出位置的不同通道間計(jì)算時(shí),基于基值的卷積計(jì)算結(jié)果都是一樣的,因此,僅需要計(jì)算一次。然后通過校準(zhǔn)值的計(jì)算來復(fù)用二值計(jì)算模式得到最終的計(jì)算結(jié)果。

    同樣以M個(gè)輸入特征圖、N個(gè)輸出特征圖、卷積核尺寸k×k的Ibit 權(quán)重為例,為了計(jì)算同一位置所有輸出通道的值,需要考慮3 個(gè)方面的開銷:所有權(quán)重基礎(chǔ)組合的卷積計(jì)算、部分和的加法以及LUT值的選擇。假設(shè)每s個(gè)權(quán)重為一組,并通過P1、P2和P3來表示上述3 方面的功耗開銷。我們的目標(biāo)是使得總的功耗開銷最小化。需要強(qiáng)調(diào)的是,s是正整數(shù)。通過解這個(gè)優(yōu)化問題,可以得到最小開銷下的s值。s主要與輸出通道數(shù)有關(guān),基于s的加法操作降低比例見表1,降低比率隨著輸出通道數(shù)的增加而快速增加。

    表1 不同輸出通道數(shù)量下的計(jì)算優(yōu)化對(duì)比Tab.1 Computation optimization for different numbers of output channels

    另一個(gè)需要解決的問題是如何對(duì)權(quán)重進(jìn)行分組。通過實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過ReLU 函數(shù)處理后,統(tǒng)一通道的輸出特征圖中存在著大量連續(xù)分布的零值。這就意味著可以通過時(shí)鐘門控來實(shí)現(xiàn)大量零值計(jì)算的跳轉(zhuǎn),因此相同通道內(nèi)的權(quán)重被選擇作為一組。與相關(guān)CNN 加速器的LUT 方法對(duì)比,本文提出的LUT 計(jì)算方法可以實(shí)現(xiàn)對(duì)多種位寬權(quán)重的卷積實(shí)現(xiàn)統(tǒng)一支持,同時(shí)降低硬件的實(shí)現(xiàn)開銷,針對(duì)多比特權(quán)重卷積實(shí)現(xiàn)1.33~1.50 倍的卷積速度提升。

    1.3 多級(jí)預(yù)測校準(zhǔn)模型

    在主流CNN 模型中,通用的基礎(chǔ)網(wǎng)絡(luò)架構(gòu)為“卷積-歸一化-ReLU 激活-池化”等。其中,作為應(yīng)用最廣泛的激活函數(shù),ReLU 會(huì)造成很高的激活值稀疏度。同時(shí)經(jīng)過最大值池化層后,僅需要決定池化結(jié)果的相對(duì)尺寸,這也就意味著最終結(jié)果為負(fù)值或非最大值的全精度卷積計(jì)算是完全沒有必要的。與當(dāng)前提出的基于零值的操作消除方法[13-14]相比,本文提出了一種更加高效的多級(jí)預(yù)測較準(zhǔn)方法。

    為了便于硬件實(shí)現(xiàn),計(jì)算過程中的所有權(quán)重及中間結(jié)果均需要進(jìn)行定點(diǎn)化。本文提出的多級(jí)預(yù)測校準(zhǔn)主要針對(duì)兩種計(jì)算模式:1)激活層。預(yù)測階段主要對(duì)最終激活值的符號(hào)進(jìn)行判斷,后面對(duì)結(jié)果進(jìn)行校準(zhǔn)。2)最大值池化層。前面的計(jì)算判定激活值的相對(duì)尺寸,后面的計(jì)算完成更大值的更新。而在本文的B-HN 網(wǎng)絡(luò)中主要包括二值權(quán)重和多位寬權(quán)重兩種網(wǎng)絡(luò)類型。

    在二值權(quán)重網(wǎng)絡(luò)層,由于權(quán)重是1 bit 數(shù)據(jù),卷積操作被轉(zhuǎn)換為加法操作。針對(duì)輸入的8 bit 數(shù)據(jù),將其劃分為高4 bit 和低4 bit 兩個(gè)部分。對(duì)于激活層而言,在預(yù)測階段,將高4 bit 參與到計(jì)算過程并判斷ReLU 最終結(jié)果的符號(hào),如果可以判定結(jié)果為負(fù)值,則將輸出結(jié)果直接設(shè)置為0,后續(xù)結(jié)果無需繼續(xù)執(zhí)行;否則,需要執(zhí)行低4 bit 計(jì)算來對(duì)輸出結(jié)果進(jìn)行校準(zhǔn)。在B-HN 網(wǎng)絡(luò)中,經(jīng)過ReLU 處理后的稀疏度在30%到90%之間,因此,采用本方法大概可以節(jié)省15%~45%的操作。對(duì)于最大值池化層,在預(yù)測階段,首先計(jì)算高4 bit 的結(jié)果來判斷最大池化輸出的相對(duì)尺寸。需要采用一個(gè)閾值Tm來對(duì)相對(duì)尺寸進(jìn)行評(píng)估。如果最大值與其他非極大值的距離大于閾值,則后續(xù)非計(jì)算值的計(jì)算不需要繼續(xù)執(zhí)行。否則,需要執(zhí)行后續(xù)計(jì)算過程。在校準(zhǔn)階段,低4 bit 的計(jì)算結(jié)果將用來繼續(xù)執(zhí)行比較,本方法可以降低大約37.5%的計(jì)算處理。

    在多比特權(quán)重網(wǎng)絡(luò)中,輸入特征值和權(quán)重均被量化為8 bit。對(duì)于輸入而言,同樣被分為高4 bit 和低4 bit 兩部分,而權(quán)重則按每2 bit 分組,從高位到低位劃分為4 部分。在此劃分模式下,每次輸入與權(quán)重的乘法操作轉(zhuǎn)換為8 級(jí)從高位到低位的計(jì)算過程,具體的計(jì)算及校準(zhǔn)過程與二值權(quán)重計(jì)算過程相同。

    2 硬件架構(gòu)設(shè)計(jì)

    如圖3 所示,B-HN 加速器的硬件架構(gòu)中主要包括3 個(gè)模塊:1)預(yù)處理模塊;2)多級(jí)計(jì)算控制模塊;3)存儲(chǔ)系統(tǒng)。

    圖3 B-HN 加速器的系統(tǒng)架構(gòu)Fig.3 System architecture of B-HN accelerator

    2.1 預(yù)處理模塊

    在B-HN 加速器的處理過程中,輸入的激活值及首末層權(quán)重的位寬均為8 bit,其他層的權(quán)重為1 bit。處理單元(Processing Element,PE)主要由查找表和加法器樹組成。每個(gè)PE 包括9 個(gè)查找表和1 個(gè)由9 個(gè)加法器組成的加法器樹,其中,每個(gè)LUT中包括4 個(gè)7 bit 的實(shí)體。在該架構(gòu)中,總共包括176 個(gè)PE。

    加法器在配置下首先被配置來計(jì)算LUT 中的4 個(gè)基礎(chǔ)值,編碼后權(quán)重用來決定Psum 的值。每組權(quán)重包括3 bit,由后2 個(gè)bit 來選擇LUT 中的值,第一個(gè)bit 來確定符號(hào)。隨后Psum 值在加法器樹中進(jìn)行累加。最終,通過權(quán)重轉(zhuǎn)換得到的校準(zhǔn)值與Psum相加得到最后的結(jié)果。在整個(gè)處理過程中,二值權(quán)重卷積操作可以在一個(gè)周期內(nèi)完成,而多比特權(quán)重操作則需要多個(gè)周期穿行計(jì)算完成。

    為了優(yōu)化片上數(shù)據(jù)存儲(chǔ)及訪問,采用了同時(shí)復(fù)用輸入和權(quán)重的計(jì)算模式。對(duì)于多比特位寬層,輸入尺寸為256×256×3(位寬為8 bit),在重用輸入與權(quán)重的基礎(chǔ)上利用所有的PE 來并行計(jì)算3×256×3 大小的模塊,可以在每8 個(gè)周期內(nèi)完成64 個(gè)點(diǎn)的計(jì)算。

    而對(duì)于其他層而言,PE 用來并行的執(zhí)行2×16×144 大小的模塊,每16 個(gè)周期產(chǎn)生32 個(gè)點(diǎn)。對(duì)于殘差模塊,分別采用128、32 和16 個(gè)PE 來完成殘差模塊中3 層的計(jì)算,每6 個(gè)時(shí)鐘周期產(chǎn)生4 個(gè)點(diǎn)。在整個(gè)計(jì)算過程中,所有的輸入會(huì)一致被重用直到相對(duì)應(yīng)通道的計(jì)算全部完成。

    2.2 多級(jí)計(jì)算控制

    該模塊的主要功能是完成所有的參數(shù)配置和模塊工作調(diào)度,包括閾值設(shè)定、多級(jí)計(jì)算預(yù)測、Psum累加、多比特權(quán)重卷積的分解與組合。該模塊主要包括4 個(gè)部分:歸一化模塊、ReLU 模塊、最大池化模塊和確認(rèn)模塊。歸一化模塊包括一個(gè)乘法器和加法器。

    ReLU 模塊則采用符號(hào)位來作為選擇信號(hào)來判定選擇原輸出值或者是0。ReLU 之后結(jié)果的符號(hào)位則寫進(jìn)標(biāo)志位表來標(biāo)識(shí)是否需要執(zhí)行下一級(jí)計(jì)算以及控制PE 陣列的數(shù)據(jù)更新,最大池化模塊則由一個(gè)閾值比較邏輯和選擇最大值的多選器組成。

    2.3 存儲(chǔ)系統(tǒng)

    采用獨(dú)立的輸入緩存和權(quán)重緩存來為PE 陣列提供數(shù)據(jù)。由于有限的數(shù)據(jù)帶寬及計(jì)算資源,無法將卷積操作完全并行展開執(zhí)行。因此,多級(jí)計(jì)算需要串行執(zhí)行并且在片上實(shí)現(xiàn)每級(jí)計(jì)算的中間結(jié)果存儲(chǔ),采用Psum 緩存來存儲(chǔ)這些數(shù)據(jù)。對(duì)于殘差模塊中的跳轉(zhuǎn)連接而言,部分?jǐn)?shù)據(jù)需要存在很長時(shí)間才會(huì)被用于計(jì)算,因此,需要一個(gè)臨時(shí)數(shù)據(jù)緩存來存儲(chǔ)這些數(shù)據(jù)。由于本文提出的BCP方法,使得這些數(shù)據(jù)不需要存到片外,而僅需要存3 行特征圖數(shù)據(jù)。因此對(duì)于片外存儲(chǔ)的帶寬和訪問極大降低。

    2.4 基于模塊計(jì)算的流水架構(gòu)

    作為B-HG 網(wǎng)絡(luò)中的瓶頸模塊,PRB 模塊主要由內(nèi)部及外部跳轉(zhuǎn)連接的3 層卷積層組成。考慮到每個(gè)中間層的輸出結(jié)果均非常多,如果采用傳統(tǒng)逐層處理方式的話,會(huì)造成與片外存儲(chǔ)之間的大量數(shù)據(jù)交互。因此,提出面向PRB 模塊的三級(jí)流水計(jì)算架構(gòu)。在這種架構(gòu)下,僅僅需要在片上存儲(chǔ)3.5 行特征圖數(shù)據(jù),而且中間結(jié)果不需要寫回到片外存儲(chǔ),同時(shí)跳轉(zhuǎn)連接也不需要從片外存儲(chǔ)多次讀取數(shù)據(jù)。PRB 模塊中3 層網(wǎng)絡(luò)的計(jì)算時(shí)間比為8∶2∶1,根據(jù)這個(gè)比例來對(duì)每一層分配相應(yīng)的計(jì)算資源,來保證流水處理的負(fù)載均衡性。

    假設(shè)M個(gè)W×H大小的輸入特征圖,N個(gè)輸出特征圖,卷積核尺寸為k×k,將計(jì)算模塊的尺寸設(shè)置為w×h,輸入、權(quán)重及中間結(jié)果的位寬分別為Ba、Bw和Bp。每次數(shù)據(jù)讀取和寫入的功耗分別為Pr和Pw,則由輸入、位寬及中間結(jié)果數(shù)據(jù)訪問造成的開銷C1、C2和C3分別為

    本文的設(shè)計(jì)目標(biāo)則是實(shí)現(xiàn)三者之和的最小化,在給定的硬件資源約束下對(duì)這一優(yōu)化問題進(jìn)行求解,得到對(duì)于PRB 模塊每一層最優(yōu)的計(jì)算模塊尺寸為6×4×48、4×4×24 和4×4×12。

    對(duì)于非PRB 的網(wǎng)絡(luò)層而言,采用逐層處理的方式。為了保證最小的存儲(chǔ)開銷,對(duì)于每一層選取最優(yōu)的模塊尺寸。對(duì)于B-HN 網(wǎng)絡(luò)的第一層,其卷積核尺寸為3×3,步長為2,輸出通道數(shù)為144,每次讀取5 行圖像數(shù)據(jù),計(jì)算模塊被配置成3×128×3。對(duì)于B-HN 網(wǎng)絡(luò)中的其他網(wǎng)絡(luò)層,卷積核尺寸為1×1,步長為1,計(jì)算模塊尺寸則被配置成2×16×144。

    3 性能評(píng)估與硬件實(shí)現(xiàn)

    3.1 性能評(píng)估

    為了進(jìn)一步衡量本文提出方法的通用性,以AlexNet[15]作為測試基準(zhǔn)來對(duì)本文提出的方法效果進(jìn)行測試,網(wǎng)絡(luò)的權(quán)重根據(jù)本文方法確定為每4 bit為一組。二值權(quán)重AlexNet 網(wǎng)絡(luò)中5 層卷積層的性能統(tǒng)計(jì)數(shù)據(jù)見表2。表中可見,二值權(quán)重AlexNet 的計(jì)算量可以降低82.75%。

    表2 AlexNet 網(wǎng)絡(luò)的性能優(yōu)化分析Tab.2 Performance optimization analysis for AlexNet

    3.2 硬件實(shí)現(xiàn)

    在TSMC 28 nm 的CMOS 工藝下對(duì)提出的BHN 加速器進(jìn)行了后端實(shí)現(xiàn)和性能仿真,具體的芯片版圖及性能指標(biāo)如圖4 和表3 所示。

    圖4 B-HN 加速器后端版圖Fig.4 Post-layout of the B-HN accelerator

    表3 B-HN 加速器后端仿真性能數(shù)據(jù)Tab.3 Performance data of simulation for the B-HN accelerator post-layout

    B-HN 加速器與相關(guān)二值權(quán)重硬件加速器的性能對(duì)比情況見表4。表中可見,B-HN 加速器在計(jì)算延遲及功耗效率方面較相關(guān)工作取得了比較明顯的提升。

    表4 與相關(guān)工作性能對(duì)比Tab.4 Performance comparison with related works

    4 結(jié)束語

    本文首先采用二值化權(quán)重方法對(duì)當(dāng)前通用的沙漏卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行處理,并在進(jìn)一步分析其計(jì)算、存儲(chǔ)瓶頸的基礎(chǔ)上提出了基于多級(jí)預(yù)測校準(zhǔn)模型及LUT 方法的高效卷積計(jì)算、針對(duì)殘差模塊的基于模塊計(jì)算的流水架構(gòu),最終在28 nm 工藝條件下對(duì)提出的B-HN 模型高效硬件設(shè)計(jì)及性能評(píng)估。后續(xù)工作將重點(diǎn)基于航天應(yīng)用中的專用數(shù)據(jù)集本文架構(gòu)進(jìn)行進(jìn)一步優(yōu)化。

    猜你喜歡
    二值沙漏加速器
    輪滑加速器
    化學(xué)工業(yè)的“加速器”
    混沌偽隨機(jī)二值序列的性能分析方法研究綜述
    全民小康路上的“加速器”
    支持CNN與LSTM的二值權(quán)重神經(jīng)網(wǎng)絡(luò)芯片
    基于二值形態(tài)學(xué)算子的軌道圖像分割新算法
    有趣的沙漏
    視頻圖像文字的二值化
    DIY裝飾沙漏
    DIY裝飾沙漏
    日韩精品有码人妻一区| 久久精品国产a三级三级三级| 久久ye,这里只有精品| 少妇人妻 视频| 两个人的视频大全免费| 国产成人freesex在线| 国产在线一区二区三区精| 女性被躁到高潮视频| 日韩三级伦理在线观看| 免费观看av网站的网址| 在线观看一区二区三区激情| 51国产日韩欧美| 高清不卡的av网站| 国产精品精品国产色婷婷| 亚洲欧美成人综合另类久久久| 最近中文字幕2019免费版| 国产精品人妻久久久久久| 国产91av在线免费观看| 在线 av 中文字幕| 超碰av人人做人人爽久久| 99热网站在线观看| 在线观看av片永久免费下载| 欧美激情极品国产一区二区三区 | 美女xxoo啪啪120秒动态图| 最新中文字幕久久久久| 中文字幕av成人在线电影| 九九在线视频观看精品| 日韩成人伦理影院| 99久久人妻综合| 在线免费观看不下载黄p国产| 免费大片18禁| 美女国产视频在线观看| 2022亚洲国产成人精品| 国产黄片美女视频| 午夜视频国产福利| 亚洲美女搞黄在线观看| 日韩 亚洲 欧美在线| 欧美zozozo另类| 视频区图区小说| 亚洲国产欧美在线一区| 免费观看的影片在线观看| 99久久人妻综合| 亚洲精品乱久久久久久| 人妻制服诱惑在线中文字幕| 人人妻人人看人人澡| 观看免费一级毛片| 狠狠精品人妻久久久久久综合| 麻豆精品久久久久久蜜桃| 亚洲国产色片| 国产精品久久久久成人av| 国精品久久久久久国模美| 伦理电影免费视频| 国产成人91sexporn| 国产精品无大码| 欧美精品一区二区大全| 日日撸夜夜添| 天堂中文最新版在线下载| 亚洲经典国产精华液单| 午夜免费男女啪啪视频观看| 精品久久久噜噜| 亚洲精品国产av蜜桃| 韩国av在线不卡| 日韩免费高清中文字幕av| 免费观看无遮挡的男女| 日韩强制内射视频| 啦啦啦在线观看免费高清www| 2018国产大陆天天弄谢| 亚洲欧美精品专区久久| 国产免费一级a男人的天堂| 国产白丝娇喘喷水9色精品| 精品一品国产午夜福利视频| 成年av动漫网址| 日韩一区二区三区影片| 亚洲欧美清纯卡通| 久久99热这里只频精品6学生| 欧美少妇被猛烈插入视频| 成人国产av品久久久| 91精品伊人久久大香线蕉| 日韩大片免费观看网站| 黄片无遮挡物在线观看| 日韩欧美 国产精品| 国产熟女欧美一区二区| 国产在线视频一区二区| 美女中出高潮动态图| 97在线人人人人妻| 婷婷色av中文字幕| 麻豆成人午夜福利视频| 国产成人免费无遮挡视频| 91久久精品国产一区二区三区| 成人特级av手机在线观看| 国产亚洲欧美精品永久| 国内揄拍国产精品人妻在线| 五月伊人婷婷丁香| 欧美亚洲 丝袜 人妻 在线| 亚洲国产高清在线一区二区三| 久久鲁丝午夜福利片| 国产成人一区二区在线| 联通29元200g的流量卡| 老女人水多毛片| 纯流量卡能插随身wifi吗| 熟女人妻精品中文字幕| 99久久精品国产国产毛片| 日韩欧美精品免费久久| 久久韩国三级中文字幕| av在线播放精品| 狂野欧美激情性xxxx在线观看| 一级片'在线观看视频| 丰满人妻一区二区三区视频av| 国产 一区精品| 国产精品无大码| 一区二区三区精品91| 国产爱豆传媒在线观看| 欧美三级亚洲精品| 黄色日韩在线| 国产欧美亚洲国产| 在线精品无人区一区二区三 | 99热网站在线观看| www.色视频.com| 日本vs欧美在线观看视频 | 美女主播在线视频| 少妇被粗大猛烈的视频| 3wmmmm亚洲av在线观看| 五月伊人婷婷丁香| 看非洲黑人一级黄片| 国产真实伦视频高清在线观看| 亚洲在久久综合| 国产精品不卡视频一区二区| 人人妻人人看人人澡| 热re99久久精品国产66热6| 亚洲国产色片| 欧美国产精品一级二级三级 | 亚洲一区二区三区欧美精品| 纵有疾风起免费观看全集完整版| 午夜福利在线观看免费完整高清在| 日本免费在线观看一区| 高清午夜精品一区二区三区| 日本免费在线观看一区| 亚洲欧美一区二区三区黑人 | 最近中文字幕高清免费大全6| 日本av手机在线免费观看| 欧美一区二区亚洲| 国内精品宾馆在线| 亚洲高清免费不卡视频| 美女福利国产在线 | 久久午夜福利片| 视频中文字幕在线观看| 超碰av人人做人人爽久久| 免费大片18禁| 国产黄片视频在线免费观看| 多毛熟女@视频| 一级片'在线观看视频| 国产成人免费观看mmmm| 亚洲国产av新网站| 国产精品偷伦视频观看了| 汤姆久久久久久久影院中文字幕| 国产乱人视频| 天天躁夜夜躁狠狠久久av| 中文字幕av成人在线电影| 1000部很黄的大片| 肉色欧美久久久久久久蜜桃| 精品熟女少妇av免费看| 在线看a的网站| 欧美精品人与动牲交sv欧美| 久久久午夜欧美精品| 自拍偷自拍亚洲精品老妇| 欧美亚洲 丝袜 人妻 在线| 麻豆国产97在线/欧美| www.色视频.com| 日韩av免费高清视频| 国产亚洲欧美精品永久| 国产亚洲午夜精品一区二区久久| 一级毛片 在线播放| 亚洲av.av天堂| 亚洲精品,欧美精品| 国产女主播在线喷水免费视频网站| av福利片在线观看| 熟女电影av网| 日本免费在线观看一区| 国产成人精品久久久久久| 中文天堂在线官网| 性高湖久久久久久久久免费观看| 国产精品一区二区三区四区免费观看| 少妇高潮的动态图| 国产精品99久久久久久久久| 久久毛片免费看一区二区三区| 赤兔流量卡办理| 国产伦在线观看视频一区| 亚洲国产精品999| 欧美人与善性xxx| 99国产精品免费福利视频| 伊人久久精品亚洲午夜| 五月开心婷婷网| av福利片在线观看| 精品国产露脸久久av麻豆| 91久久精品电影网| 26uuu在线亚洲综合色| 亚洲一级一片aⅴ在线观看| 黑人高潮一二区| 精品久久久久久久久av| 美女xxoo啪啪120秒动态图| 国精品久久久久久国模美| 最后的刺客免费高清国语| a 毛片基地| 三级国产精品片| videos熟女内射| 国产精品国产av在线观看| 免费大片黄手机在线观看| 国产精品久久久久久久电影| 久久久亚洲精品成人影院| 哪个播放器可以免费观看大片| 亚洲av.av天堂| 国国产精品蜜臀av免费| 欧美日韩视频高清一区二区三区二| 久久午夜福利片| 水蜜桃什么品种好| 欧美丝袜亚洲另类| 99热这里只有精品一区| 亚洲国产毛片av蜜桃av| 91精品一卡2卡3卡4卡| 波野结衣二区三区在线| 国产精品一区二区性色av| av播播在线观看一区| 成人国产麻豆网| 爱豆传媒免费全集在线观看| 我要看日韩黄色一级片| 免费观看无遮挡的男女| 国产成人aa在线观看| 女的被弄到高潮叫床怎么办| 中文字幕久久专区| 高清视频免费观看一区二区| 波野结衣二区三区在线| 男人舔奶头视频| 国产精品av视频在线免费观看| 大码成人一级视频| 久久久久久久精品精品| 亚洲欧美清纯卡通| 韩国高清视频一区二区三区| 免费黄频网站在线观看国产| 91精品一卡2卡3卡4卡| 夫妻性生交免费视频一级片| 亚洲激情五月婷婷啪啪| 九九久久精品国产亚洲av麻豆| 久久ye,这里只有精品| 久久午夜福利片| 欧美亚洲 丝袜 人妻 在线| 国产精品av视频在线免费观看| 高清av免费在线| 国产免费视频播放在线视频| 丝袜脚勾引网站| 国产乱人偷精品视频| 精品一品国产午夜福利视频| 免费大片黄手机在线观看| 亚洲av欧美aⅴ国产| 草草在线视频免费看| 国产精品.久久久| 亚洲精品aⅴ在线观看| 成人黄色视频免费在线看| av又黄又爽大尺度在线免费看| 天美传媒精品一区二区| 亚洲精品国产av成人精品| 18禁在线播放成人免费| 国产伦精品一区二区三区四那| 少妇人妻一区二区三区视频| 国产亚洲91精品色在线| 国产精品久久久久久精品古装| 美女高潮的动态| 国产欧美日韩精品一区二区| 三级经典国产精品| 久久精品人妻少妇| 久久久久人妻精品一区果冻| 亚洲av免费高清在线观看| 国产视频内射| av在线老鸭窝| 国产av精品麻豆| 黄片wwwwww| 午夜免费鲁丝| 亚洲欧美日韩另类电影网站 | 国产高清三级在线| 国产精品一区二区在线观看99| 日本色播在线视频| 麻豆国产97在线/欧美| 大香蕉97超碰在线| 蜜桃亚洲精品一区二区三区| 蜜桃在线观看..| 91午夜精品亚洲一区二区三区| 日韩大片免费观看网站| 国产成人a∨麻豆精品| 美女视频免费永久观看网站| 亚洲人成网站在线观看播放| 国产爱豆传媒在线观看| 一级片'在线观看视频| 日本一二三区视频观看| 国产久久久一区二区三区| 国产伦在线观看视频一区| 亚洲精品亚洲一区二区| 亚洲av福利一区| 18禁裸乳无遮挡免费网站照片| 国产91av在线免费观看| 亚洲在久久综合| 国产精品国产三级专区第一集| 国产男女内射视频| 一本一本综合久久| 国产中年淑女户外野战色| 欧美一级a爱片免费观看看| 性高湖久久久久久久久免费观看| av在线观看视频网站免费| 国产男人的电影天堂91| 国产高清有码在线观看视频| 精品人妻熟女av久视频| 一个人免费看片子| 大陆偷拍与自拍| 国产伦精品一区二区三区视频9| 激情 狠狠 欧美| 人妻少妇偷人精品九色| 亚洲国产毛片av蜜桃av| av福利片在线观看| 免费观看a级毛片全部| 久久影院123| 久久久久国产精品人妻一区二区| 精品久久久噜噜| 国产有黄有色有爽视频| 日本wwww免费看| 国产高清有码在线观看视频| 午夜激情福利司机影院| 一级爰片在线观看| 亚洲av二区三区四区| 精品人妻视频免费看| 成人特级av手机在线观看| 久久国内精品自在自线图片| 97在线人人人人妻| 看十八女毛片水多多多| 五月伊人婷婷丁香| 青春草亚洲视频在线观看| 丝袜脚勾引网站| 美女中出高潮动态图| 国产永久视频网站| 亚洲精品乱久久久久久| 久久97久久精品| 天堂俺去俺来也www色官网| 日韩一区二区视频免费看| 制服丝袜香蕉在线| 一本—道久久a久久精品蜜桃钙片| 男男h啪啪无遮挡| 国产精品伦人一区二区| 麻豆成人av视频| 纵有疾风起免费观看全集完整版| 国产精品人妻久久久影院| 插阴视频在线观看视频| 91精品国产九色| 精品一品国产午夜福利视频| 亚洲精品aⅴ在线观看| 在线观看三级黄色| 国模一区二区三区四区视频| 99久久人妻综合| 少妇高潮的动态图| 免费人妻精品一区二区三区视频| 狂野欧美激情性xxxx在线观看| 国产精品国产三级国产专区5o| 午夜免费男女啪啪视频观看| 中文字幕av成人在线电影| 黄色怎么调成土黄色| 日韩 亚洲 欧美在线| 成人午夜精彩视频在线观看| 亚洲精品aⅴ在线观看| 国产国拍精品亚洲av在线观看| 高清欧美精品videossex| 极品少妇高潮喷水抽搐| 大陆偷拍与自拍| 国产一区亚洲一区在线观看| 国产成人aa在线观看| 国产成人午夜福利电影在线观看| av在线观看视频网站免费| 人人妻人人添人人爽欧美一区卜 | 人妻一区二区av| 中文欧美无线码| 啦啦啦中文免费视频观看日本| 免费黄网站久久成人精品| 国产精品一区二区三区四区免费观看| 日韩制服骚丝袜av| 亚洲欧美清纯卡通| 日韩电影二区| 亚洲精品乱码久久久久久按摩| 男女国产视频网站| 国产69精品久久久久777片| 久久久久国产网址| 99久久精品热视频| 18禁在线无遮挡免费观看视频| 欧美成人午夜免费资源| 免费av不卡在线播放| 亚洲精品色激情综合| 丝袜脚勾引网站| 亚洲欧美日韩东京热| 少妇人妻久久综合中文| 99久国产av精品国产电影| 亚洲av中文字字幕乱码综合| 久久国产乱子免费精品| 黄色视频在线播放观看不卡| 国产精品一区二区三区四区免费观看| 成人国产麻豆网| 国产亚洲精品久久久com| 午夜视频国产福利| 哪个播放器可以免费观看大片| 亚洲婷婷狠狠爱综合网| 国产成人a区在线观看| 午夜日本视频在线| 久久97久久精品| 国产高清三级在线| 亚洲av中文av极速乱| 啦啦啦中文免费视频观看日本| 精品亚洲成国产av| 男女边摸边吃奶| 久久久久久久精品精品| 亚洲国产毛片av蜜桃av| 纵有疾风起免费观看全集完整版| av一本久久久久| 成人二区视频| 久久女婷五月综合色啪小说| 五月玫瑰六月丁香| 亚洲精品成人av观看孕妇| 日本黄色日本黄色录像| 国产精品av视频在线免费观看| 国产亚洲精品久久久com| kizo精华| 3wmmmm亚洲av在线观看| 国产在视频线精品| 久久久精品免费免费高清| 国产午夜精品久久久久久一区二区三区| 国国产精品蜜臀av免费| 欧美丝袜亚洲另类| 三级经典国产精品| 国产欧美另类精品又又久久亚洲欧美| 国产精品久久久久久精品电影小说 | 91精品国产国语对白视频| 成人美女网站在线观看视频| 这个男人来自地球电影免费观看 | 18禁在线播放成人免费| 99久久人妻综合| 我的老师免费观看完整版| 国产精品精品国产色婷婷| 久久久久久久国产电影| 欧美xxⅹ黑人| 深爱激情五月婷婷| 精品人妻一区二区三区麻豆| 国产乱人视频| 91在线精品国自产拍蜜月| 少妇精品久久久久久久| 欧美日韩视频精品一区| 亚洲四区av| 国产探花极品一区二区| 亚州av有码| 国产精品伦人一区二区| 亚洲av日韩在线播放| 日本av手机在线免费观看| 久久久久久久亚洲中文字幕| 国产午夜精品久久久久久一区二区三区| 丰满少妇做爰视频| 国产精品不卡视频一区二区| 99热网站在线观看| 色视频www国产| 插逼视频在线观看| 欧美一区二区亚洲| av专区在线播放| 国产免费福利视频在线观看| 欧美另类一区| 在线亚洲精品国产二区图片欧美 | 人妻少妇偷人精品九色| 国产精品一区二区三区四区免费观看| 色哟哟·www| av在线app专区| av播播在线观看一区| 日韩免费高清中文字幕av| av视频免费观看在线观看| 久久久久久久久大av| 亚洲精品成人av观看孕妇| 国产有黄有色有爽视频| 国产综合精华液| 大又大粗又爽又黄少妇毛片口| 精华霜和精华液先用哪个| 丝袜脚勾引网站| av天堂中文字幕网| 一级毛片久久久久久久久女| 日本欧美国产在线视频| 99国产精品免费福利视频| 国产亚洲欧美精品永久| 纯流量卡能插随身wifi吗| 日韩av在线免费看完整版不卡| 六月丁香七月| 国产成人午夜福利电影在线观看| 我的女老师完整版在线观看| 国产视频内射| 两个人的视频大全免费| 一区二区三区免费毛片| 亚洲性久久影院| 国产国拍精品亚洲av在线观看| 亚洲人成网站在线播| 午夜福利在线在线| 免费观看的影片在线观看| 成人高潮视频无遮挡免费网站| 亚洲精品国产成人久久av| 国产亚洲av片在线观看秒播厂| 国产一区二区三区av在线| 简卡轻食公司| 老司机影院毛片| 国产高清有码在线观看视频| 午夜免费观看性视频| 亚洲av男天堂| 亚洲精品456在线播放app| 国产乱人视频| 最近手机中文字幕大全| 九草在线视频观看| 久久久精品94久久精品| 精品亚洲成a人片在线观看 | 最近2019中文字幕mv第一页| 全区人妻精品视频| 久久国产亚洲av麻豆专区| 国产午夜精品一二区理论片| 国产精品免费大片| videos熟女内射| 精华霜和精华液先用哪个| 国产精品99久久99久久久不卡 | 黄色日韩在线| 美女内射精品一级片tv| 国产成人午夜福利电影在线观看| 大片电影免费在线观看免费| 亚洲精品乱码久久久v下载方式| 男人舔奶头视频| av不卡在线播放| 国产欧美亚洲国产| 精品一区在线观看国产| 久久精品国产a三级三级三级| 国产精品福利在线免费观看| 久久久色成人| 亚洲色图av天堂| 舔av片在线| 成人综合一区亚洲| av免费在线看不卡| 女的被弄到高潮叫床怎么办| 欧美精品人与动牲交sv欧美| 高清欧美精品videossex| 精品少妇黑人巨大在线播放| 国产精品三级大全| 尤物成人国产欧美一区二区三区| 欧美日韩视频精品一区| 最近2019中文字幕mv第一页| 制服丝袜香蕉在线| 18禁裸乳无遮挡免费网站照片| 一个人看视频在线观看www免费| 精品久久久久久久久av| av在线老鸭窝| 亚洲国产av新网站| 成年av动漫网址| 精华霜和精华液先用哪个| 韩国av在线不卡| 亚洲精品乱码久久久久久按摩| 国内精品宾馆在线| 色网站视频免费| 天天躁日日操中文字幕| www.av在线官网国产| 青春草亚洲视频在线观看| av专区在线播放| 久久久久视频综合| 中文字幕人妻熟人妻熟丝袜美| 3wmmmm亚洲av在线观看| 三级国产精品片| 天堂中文最新版在线下载| 久久影院123| 国产日韩欧美亚洲二区| 中文欧美无线码| 久久久色成人| 亚洲成色77777| 久久99热这里只频精品6学生| 青春草视频在线免费观看| 亚洲欧美精品专区久久| 久久国内精品自在自线图片| 亚洲色图av天堂| 男男h啪啪无遮挡| 女人久久www免费人成看片| 超碰av人人做人人爽久久| 免费看不卡的av| 激情五月婷婷亚洲| 另类亚洲欧美激情| 成人影院久久| 色5月婷婷丁香| 欧美一区二区亚洲| 久久久欧美国产精品| 噜噜噜噜噜久久久久久91| 人人妻人人看人人澡| 舔av片在线| 国产伦在线观看视频一区| 日本av手机在线免费观看| 免费看光身美女| 欧美zozozo另类| 亚洲色图av天堂| 亚洲国产最新在线播放| 最近中文字幕2019免费版| 我要看黄色一级片免费的| 身体一侧抽搐| 国产成人aa在线观看| 午夜福利在线在线| 美女高潮的动态| 国产一区二区三区av在线| 建设人人有责人人尽责人人享有的 | 成人亚洲欧美一区二区av| 一区二区三区乱码不卡18| 欧美三级亚洲精品| 国产淫片久久久久久久久| 天天躁夜夜躁狠狠久久av| 免费在线观看成人毛片| 街头女战士在线观看网站| 美女视频免费永久观看网站| 少妇丰满av| 极品少妇高潮喷水抽搐| 亚洲精品乱久久久久久| 免费人成在线观看视频色| 国产视频首页在线观看|