• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于HLS的MobileNet加速器實(shí)現(xiàn)

    2023-06-08 08:10:28韋蘇倫陶青川
    現(xiàn)代計(jì)算機(jī) 2023年8期
    關(guān)鍵詞:分塊殘差總線

    韋蘇倫,陶青川

    (四川大學(xué)電子信息學(xué)院,成都 610065)

    0 引言

    作為一種人工神經(jīng)網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò)被廣泛應(yīng)用于圖像、語(yǔ)音識(shí)別[1]等各種智能識(shí)別系統(tǒng)。隨著卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展,各種各樣的網(wǎng)絡(luò)層出不窮,并且被應(yīng)用到越來(lái)越復(fù)雜的場(chǎng)景當(dāng)中。但隨著網(wǎng)絡(luò)復(fù)雜性的增加以及隨之而來(lái)的龐大計(jì)算量,運(yùn)行卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算設(shè)備也需要更好的性能。傳統(tǒng)的CPU 并不適用于矩陣運(yùn)算占主導(dǎo)的模型訓(xùn)練和推理,GPU 雖然滿足這一特性,但對(duì)于一些嵌入式設(shè)備來(lái)說(shuō)還需要更低的功耗[2]。FPGA 作為可編程邏輯器件,具有功耗低、性能高、靈活性好的特點(diǎn),因此更加適用于卷積神經(jīng)網(wǎng)絡(luò)硬件加速的開(kāi)發(fā)研究[3],Verilog 開(kāi)發(fā)門(mén)檻比較高,開(kāi)發(fā)周期相對(duì)較長(zhǎng),這極大影響了卷積神經(jīng)網(wǎng)絡(luò)在FPGA中部署的普及。

    軟件工程師們應(yīng)該更多考慮的是大的架構(gòu),而非某個(gè)單獨(dú)部件或逐周期運(yùn)行,HLS 工具[4]的出現(xiàn)也是源自于此,它是一種代碼綜合技術(shù),具體是指采用C、C++等高級(jí)編程語(yǔ)言進(jìn)行程序編寫(xiě),而不是傳統(tǒng)的Verilog 語(yǔ)言,這大大提高了FPGA 的開(kāi)發(fā)速度。本文應(yīng)用HLS 高層次綜合工具,基于輕量化的原則選擇了Mobile?Netv2 網(wǎng)絡(luò),在賽靈思的FPGA 開(kāi)發(fā)板Kria KV260 上實(shí)現(xiàn)了一個(gè)卷積神經(jīng)網(wǎng)絡(luò)加速器,通過(guò)數(shù)據(jù)的串并轉(zhuǎn)換,充分利用AXI 總線帶寬,利用pingpong 緩存技術(shù)實(shí)現(xiàn)數(shù)據(jù)的讀寫(xiě)與計(jì)算的并行操作,同時(shí)在卷積計(jì)算中使用分組分塊計(jì)算進(jìn)一步提高推理的速度。

    1 開(kāi)發(fā)平臺(tái)與IP核的加速策略

    1.1 開(kāi)發(fā)平臺(tái)與卷積神經(jīng)網(wǎng)絡(luò)

    本文使用賽靈思的Kria KV260 FPGA 開(kāi)發(fā)板作為實(shí)驗(yàn)板卡,Kria KV260 是賽靈思專為AI視覺(jué)設(shè)計(jì)的入門(mén)級(jí)FPGA 開(kāi)發(fā)板。它的設(shè)計(jì)是一種模塊化的設(shè)計(jì)方式,分為FPGA 板卡以及接口部分,其中FPGA 板卡部分是K26 SoM,它采用Zynq UltraScale+ MPSoC 架構(gòu),包含4 核ARM Cortex-A53 處理器,提供256 K 個(gè)系統(tǒng)邏輯單元和1.2 K 個(gè)DSP 單元。在軟件開(kāi)發(fā)環(huán)境方面,使用賽靈思的統(tǒng)一軟件平臺(tái)Vitis 以及高層次綜合工具Vivado HLS作為編譯測(cè)試環(huán)境。

    神經(jīng)網(wǎng)絡(luò)模型方面使用的是MobileNetv2[5]。作為經(jīng)典輕量化網(wǎng)絡(luò)的MobileNet,自誕生就被廣泛應(yīng)用于工業(yè)界。它是一種構(gòu)造體量小、低延時(shí)的網(wǎng)絡(luò)結(jié)構(gòu),對(duì)于很多移動(dòng)和嵌入式設(shè)備的圖像應(yīng)用都比較適合。MobileNet 是由谷歌團(tuán)隊(duì)提出的應(yīng)用于移動(dòng)端或者嵌入式設(shè)備中的輕量級(jí)神經(jīng)網(wǎng)絡(luò),在準(zhǔn)確率只有極小幅降低的情況下,大量減少參數(shù)與運(yùn)算量。MobileNet 的特點(diǎn)是提出了深度可分離卷積,其還可被拆分成兩個(gè)子模塊:逐通道卷積(depthwise convolu?tion)與逐點(diǎn)卷積層(pointwise convolution)。

    表1 KV260板卡資源

    圖1 KV260開(kāi)發(fā)板俯視圖

    對(duì)于傳統(tǒng)卷積來(lái)說(shuō),若卷積核大小為Dk,數(shù)量為N,圖像的尺寸為Df,圖像和卷積核的通道深度為M,那么對(duì)于N個(gè)卷積操作來(lái)說(shuō),總的計(jì)算量如公式(1)所示。

    而對(duì)于深度可分離卷積神經(jīng)網(wǎng)絡(luò)來(lái)說(shuō),其計(jì)算量包括逐通道卷積和逐點(diǎn)卷積兩部分,如公式(2)、(3)、(4)所示。

    其中,CostDW和CostPW分別為

    所以可計(jì)算出傳統(tǒng)卷積與深度可分離卷積的計(jì)算量比值,由公式(5)可知,后者的計(jì)算效率明顯高于傳統(tǒng)卷積。

    MobileNetv2 是MobileNetv1 的升級(jí)版,在MobileNetv1 的深度可分離卷積基礎(chǔ)上,新增加了線性瓶頸和倒殘差結(jié)構(gòu),其中倒殘差結(jié)構(gòu)如圖2所示。

    圖2 MobileNetv2倒殘差結(jié)構(gòu)

    在倒殘差結(jié)構(gòu)中,先用小的1*1 卷積升維,通過(guò)3*3 的逐通道卷積提取特征,最后再使用1*1 卷積降維,呈兩頭小、中間大的梭型結(jié)構(gòu)。為了提升精度,在倒殘差結(jié)構(gòu)中,前兩個(gè)激活函數(shù)使用ReLU6 來(lái)代替ReLU,最后使用線性激活函數(shù)。

    1.2 加速核的整體設(shè)計(jì)

    本文的總體設(shè)計(jì)基于vivado HLS 高層次綜合[6]和PYNQ 平臺(tái)[7]。由HLS 工具通過(guò)C++語(yǔ)言實(shí)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)的IP 核,通過(guò)仿真和綜合之后可以打包zip 核文件,通過(guò)vivado 平臺(tái)導(dǎo)入HLS 的zip 文件進(jìn)行塊設(shè)計(jì)、布線和整體編譯得到硬件平臺(tái)的.bit 和.hwh 文件,這是PL 部分的設(shè)計(jì)。PS 端可以使用C++語(yǔ)言在Vitis 中進(jìn)行主機(jī)端的代碼編寫(xiě)或者使用Python 語(yǔ)言在PYNQ中進(jìn)行編寫(xiě),進(jìn)而控制數(shù)據(jù)的輸入與輸出并與PL 部分進(jìn)行計(jì)算與交互,其數(shù)據(jù)傳輸?shù)慕Y(jié)構(gòu)如圖3所示。

    圖3 數(shù)據(jù)傳輸結(jié)構(gòu)

    首先通過(guò)S_AXI_lite 接口將主機(jī)端與FPGA相連接,通過(guò)讀取和寫(xiě)入S_AXI_lite 端的控制寄存器來(lái)控制PL 端的行為,一般用來(lái)傳輸控制和狀態(tài)寄存器以及讀寫(xiě)的地址等。對(duì)于輸入的圖像數(shù)據(jù)、權(quán)重和偏置等數(shù)據(jù)則使用存儲(chǔ)器映射接口M_AXI 來(lái)進(jìn)行傳輸,M_AXI 存儲(chǔ)器映射接口可以支持最高4 K字節(jié)的突發(fā)量,并且具有獨(dú)立的讀取和寫(xiě)入的通道,因此單個(gè)接口也可以同時(shí)執(zhí)行讀取和寫(xiě)入的操作。在傳輸讀寫(xiě)地址之后,通過(guò)M_AXI接口將經(jīng)過(guò)主機(jī)端映射存到全局存儲(chǔ)器中的數(shù)據(jù)讀取至PL內(nèi)核中進(jìn)行計(jì)算。

    為了加快推理速度,可以進(jìn)行BN 融合,即將BN 層參數(shù)和卷積層參數(shù)融合在一起,這樣在模型訓(xùn)練之后的推理階段就可省去BN 層的計(jì)算[8]。

    考慮到MobileNetv2 結(jié)構(gòu)的重復(fù)性,將整個(gè)網(wǎng)絡(luò)分成三個(gè)部分來(lái)設(shè)計(jì):Bottleneck 部分、Bottleneck 之前以及之后的部分。在每個(gè)部分也有基礎(chǔ)的計(jì)算單元,如普通二維卷積、深度卷積、逐點(diǎn)卷積、殘差結(jié)構(gòu)以及全劇平均池化層等,本文將這些基礎(chǔ)單元單獨(dú)設(shè)計(jì)成IP計(jì)算核。

    加速器總的系統(tǒng)結(jié)構(gòu)塊設(shè)計(jì)如圖4 所示,左邊是HLS 設(shè)計(jì)導(dǎo)出的5 個(gè)IP 核,中間從上往下分別是ZYNQ 的中心處理模塊和時(shí)鐘與復(fù)位信號(hào)模塊,右邊的兩列則是傳輸總線AXI 的相關(guān)模塊,對(duì)塊設(shè)計(jì)進(jìn)行綜合之后得到總的資源使用情況,如圖5所示。

    圖4 加速器整體塊設(shè)計(jì)

    圖5 綜合資源占用情況

    1.3 加速器優(yōu)化策略

    1.3.1 pingpong操作

    在兩個(gè)計(jì)算模塊之間傳遞數(shù)據(jù)時(shí),由于前一個(gè)模塊需要等待下一個(gè)模塊計(jì)算完成才能交付數(shù)據(jù),造成了一定的性能損失,所謂ping?pong 操作是指設(shè)置緩沖來(lái)進(jìn)行交替存儲(chǔ),進(jìn)而實(shí)現(xiàn)讀、算、寫(xiě)的同步。

    數(shù)據(jù)的分塊計(jì)算使得多個(gè)模塊之間的計(jì)算滿足上述情況,所以設(shè)置兩個(gè)buffer來(lái)實(shí)現(xiàn)數(shù)據(jù)的pingpong 操作,buffer 的大小根據(jù)不同IP 核進(jìn)行獨(dú)立設(shè)置。pingpong操作的計(jì)算原理如圖6所示。

    圖6 pingpong操作原理

    1.3.2 for循環(huán)展開(kāi)

    HLS 可以使用Unroll 指令對(duì)for 循環(huán)進(jìn)行展開(kāi),for 循環(huán)在默認(rèn)狀態(tài)下是折疊狀態(tài)的,即在電路里中每一次循環(huán)都會(huì)分時(shí)地使用同一套電路。使用Unroll 可以對(duì)for 循環(huán)的代碼區(qū)進(jìn)行循環(huán)體展開(kāi),將之前的電路復(fù)制多份,實(shí)現(xiàn)以資源換取并行的計(jì)算邏輯,如圖7 所示。Unroll 允許完全展開(kāi)或部分展開(kāi),其中部分展開(kāi)需要指定循環(huán)因子factor=N,即把循環(huán)展開(kāi)N倍來(lái)減少循環(huán)迭代。

    圖7 Unroll循環(huán)展開(kāi)原理

    1.3.3 多精度計(jì)算優(yōu)化

    在IP核中采用的是AP_FIX16的精度進(jìn)行存儲(chǔ)和運(yùn)算,這就有可能會(huì)因?yàn)閿?shù)據(jù)精度過(guò)低以及數(shù)值溢出而產(chǎn)生一些計(jì)算誤差,并有可能在深度神經(jīng)網(wǎng)絡(luò)中持續(xù)積累這種誤差。于是本文在考慮資源占用的同時(shí),采用多精度數(shù)據(jù)的方式來(lái)避免這種精度的溢出:將輸入與輸出設(shè)置為AP_FIX16的數(shù)據(jù)類型,然后在計(jì)算卷積的過(guò)程中,擴(kuò)大精度來(lái)保存臨時(shí)的數(shù)值,并在最后輸出時(shí)恢復(fù)為最開(kāi)始的精度。

    1.3.4 計(jì)算分組分塊

    由于網(wǎng)絡(luò)模型的參數(shù)量比較大,直接使用FPGA 中片上資源來(lái)保存每一層所有的數(shù)據(jù)并不是一個(gè)好的方法,所以本文對(duì)網(wǎng)絡(luò)的各個(gè)模塊用數(shù)據(jù)分組分塊的方式來(lái)計(jì)算,以降低片內(nèi)資源的占用,并配合pingpong 操作等優(yōu)化方式進(jìn)行并行計(jì)算,其過(guò)程如圖8所示。

    圖8 分組分塊計(jì)算

    1.3.5 流水線優(yōu)化

    流水線的設(shè)計(jì)思想是新的輸入數(shù)據(jù)在前面的數(shù)據(jù)計(jì)算完成之前就能提前處理,例如有一個(gè)復(fù)雜電路,它需要固定的時(shí)間周期才能得出最后的穩(wěn)定結(jié)果,我們將其拆解為N個(gè)步驟,第一個(gè)步驟計(jì)算完成后將結(jié)果存起來(lái)傳送給第二個(gè)步驟,然后緊接著繼續(xù)往第一個(gè)步驟輸入數(shù)據(jù),以此類推,用這種方式實(shí)現(xiàn)流水線優(yōu)化的并行處理,如圖9所示。

    圖9 流水線加速時(shí)序

    1.3.6 加法器樹(shù)優(yōu)化

    在一次卷積計(jì)算過(guò)程中涉及到多次加法的運(yùn)算,這個(gè)時(shí)候可以采用加法器樹(shù)的設(shè)計(jì)方式,將卷積運(yùn)算單元中的相加過(guò)程設(shè)計(jì)為樹(shù)形的并行相加模式,進(jìn)而提高運(yùn)算效率,可以把時(shí)鐘周期為N的工作縮小到log2N個(gè)時(shí)鐘周期。

    1.4 實(shí)驗(yàn)對(duì)比

    通過(guò)實(shí)驗(yàn)對(duì)比,在不使用并行加速策略時(shí),單核的Arm 設(shè)備平均耗時(shí)為35.6 s,而本文使用上述的并行優(yōu)化設(shè)計(jì),在KV260 的ZYNQ 平臺(tái)中的平均計(jì)算耗時(shí)降低到0.046 s,且功耗并無(wú)明顯變化,證明該加速器在保證功耗基本不變的情況下,還能充分發(fā)揮FPGA 的并行計(jì)算優(yōu)勢(shì),提高計(jì)算速度。

    表2 加速器優(yōu)化策略性能對(duì)比

    2 卷積神經(jīng)網(wǎng)絡(luò)加速器的設(shè)計(jì)與實(shí)現(xiàn)

    2.1 普通卷積層的設(shè)計(jì)與實(shí)現(xiàn)

    該部分是神經(jīng)網(wǎng)絡(luò)最上層卷積,輸入為224×224×3 的圖像數(shù)據(jù)與該層的權(quán)重?cái)?shù)據(jù)。為了提升計(jì)算速度,我們對(duì)數(shù)據(jù)流進(jìn)行了控制,將輸入分為三個(gè)通道來(lái)處理輸入數(shù)據(jù),使用三條128位AXI總線進(jìn)行傳輸。在實(shí)際傳輸時(shí)數(shù)據(jù)為16 位的定點(diǎn)數(shù),這里將24 個(gè)16 位定點(diǎn)數(shù)打包,同時(shí)在AXI 總線上進(jìn)行并行傳輸。對(duì)于權(quán)重、偏置和輸出則分別使用一條64 位AXI 總線進(jìn)行傳輸。

    為進(jìn)一步提升計(jì)算效率,對(duì)計(jì)算分為兩路的pingpong 緩存和計(jì)算,如圖10 所示。在ping?pong 操作中進(jìn)行后續(xù)的循環(huán)展開(kāi)計(jì)算卷積模塊,將輸入數(shù)據(jù)進(jìn)行如圖8的分塊卷積操作,對(duì)于權(quán)重來(lái)說(shuō),同樣在for循環(huán)中每次讀取出8個(gè)filter來(lái)進(jìn)行卷積操作,以達(dá)到數(shù)據(jù)并行計(jì)算的目的。

    圖10 pingpong模塊偽代碼

    經(jīng)過(guò)HLS 仿真測(cè)試和綜合之后,得到其資源使用報(bào)告,如圖11所示。

    圖11 普通二維卷積IP核綜合報(bào)告

    2.2 逐通道卷積與逐點(diǎn)卷積層的設(shè)計(jì)與實(shí)現(xiàn)

    Depthwise 是逐通道卷積,是將特征圖的每個(gè)通道單獨(dú)使用卷積核來(lái)進(jìn)行卷積操作,獲得特征圖每個(gè)通道的空間特征,并使得到的特征圖和輸入的通道數(shù)保持一致。逐通道卷積的卷積計(jì)算采用PIPELINE 指令進(jìn)行流水優(yōu)化以及UNROLL 進(jìn)行循環(huán)展開(kāi),同時(shí)利用pingpong 模塊對(duì)緩存和計(jì)算進(jìn)行并行處理。在接口方面,將輸入設(shè)置為兩個(gè)不同通道來(lái)處理輸入數(shù)據(jù),使用兩條64 位AXI 總線進(jìn)行傳輸,同樣將8 個(gè)16 位定點(diǎn)數(shù)據(jù)打包到AXI 總線上并行傳輸,權(quán)重和偏置則采用一條32位AXI總線進(jìn)行傳輸。

    由于每次不同層的逐通道卷積尺寸不同,我們將數(shù)據(jù)分塊來(lái)實(shí)現(xiàn)統(tǒng)一的單元化卷積計(jì)算,具體是將數(shù)據(jù)切分為若干個(gè)8×32 的小尺寸,且進(jìn)一步將32 劃分為4×8 的多通道數(shù)據(jù),使得不同尺寸的卷積轉(zhuǎn)換為多個(gè)固定尺寸的小的卷積,有利用逐通道卷積的加速核的統(tǒng)一化設(shè)計(jì)。對(duì)于不同步長(zhǎng)的層,可通過(guò)傳入的stride 值判斷輸出特征尺寸是否需要減半。分塊卷積的偽代碼如圖12 所示,W為卷積核的大小,B_r、B_c、B_ch 分別為分塊的尺寸以及通道大小,在B_ch處進(jìn)行PIPELINE 循環(huán)展開(kāi),使用B_ch 個(gè)并行的乘法器和深度為[log2B_ch]的加法器樹(shù),每時(shí)鐘將輸入緩存的ch 個(gè)通道的特征值與對(duì)應(yīng)的權(quán)重值進(jìn)行乘法計(jì)算,然后將計(jì)算的數(shù)據(jù)進(jìn)行累加,并使用加法器樹(shù)優(yōu)化計(jì)算,最后通過(guò)輸出緩存存儲(chǔ)結(jié)果。

    圖12 分塊卷積實(shí)現(xiàn)偽代碼

    在HLS 中進(jìn)行仿真和綜合后的報(bào)告如圖13所示。

    圖13 逐通道卷積層IP核綜合報(bào)告

    Pointwise 是逐點(diǎn)卷積,使用和輸入特征圖通道相同數(shù)量的1*1 的卷積核,對(duì)特征圖深度方面做了加權(quán)組合,相當(dāng)于獲得每個(gè)點(diǎn)的特征信息,大大減小了總體的計(jì)算量。

    在具體的實(shí)現(xiàn)中,使用兩條64 位AXI 總線進(jìn)行傳輸,同樣將8 個(gè)16 位定點(diǎn)數(shù)據(jù)打包到AXI 總線上并行傳輸,權(quán)重和偏置則分別采用兩條64 位AXI 總線和用一條32 位AXI 總線進(jìn)行傳輸。計(jì)算部分由于該模塊存在許多1*1 的卷積,計(jì)算得到的通道數(shù)相對(duì)較多,同樣采用了數(shù)據(jù)分塊的思想,利用兩層pingpong 嵌套操作來(lái)讀取權(quán)重和特征數(shù)據(jù)并進(jìn)行卷積計(jì)算。

    同樣經(jīng)過(guò)仿真以及HLS 綜合之后獲得資源使用情況的報(bào)告,如圖14所示。

    圖14 逐點(diǎn)卷積層IP核綜合報(bào)告

    2.3 殘差層、全連接模塊的設(shè)計(jì)與實(shí)現(xiàn)

    由于已經(jīng)單獨(dú)實(shí)現(xiàn)了逐通道卷積和逐點(diǎn)卷積,所以這里殘差層是指最后的原始數(shù)據(jù)與經(jīng)過(guò)了殘差之后的輸出相加的操作,并通過(guò)流水展開(kāi)來(lái)進(jìn)行加速。

    全連接模塊由全局平均池化層和全連接層組成,本文將其實(shí)現(xiàn)為一個(gè)IP 核,輸入大小為7×7×Channel,輸出為最后的分類結(jié)果。接口方面直接使用一條16 位AXI 總線進(jìn)行傳輸,具體的實(shí)現(xiàn)則是將卷積核的值當(dāng)做分?jǐn)?shù)來(lái)模擬求平均的計(jì)算,使用加法器樹(shù)對(duì)齊進(jìn)行并行加速,加載數(shù)據(jù)時(shí)同樣利用pingpong 模塊來(lái)進(jìn)行緩存和計(jì)算優(yōu)化。仿真和綜合之后得到報(bào)告,如圖15所示。

    圖15 殘差層、全連接層IP核綜合報(bào)告

    3 實(shí)驗(yàn)與結(jié)果

    經(jīng)過(guò)上述的仿真和綜合之后,從Vivado HLS 2020.2 中導(dǎo)出IP 核的壓縮文件,在Vivado 2020.2 中導(dǎo)入IP 文件并在塊設(shè)計(jì)中進(jìn)行連線。對(duì)塊設(shè)計(jì)進(jìn)行仿真和綜合后得到.bit 和.hwh 文件,利用Python 語(yǔ)言調(diào)用PYNQ 軟件層的接口進(jìn)行主機(jī)端編程。

    數(shù)據(jù)集采用公開(kāi)的DeepFashion 服裝數(shù)據(jù)集來(lái)進(jìn)行訓(xùn)練和測(cè)試,其中包括運(yùn)動(dòng)夾克、毛衣、連衣裙等46種類別,并使用2000張測(cè)試圖片進(jìn)行上板驗(yàn)證。分別從計(jì)算時(shí)間、識(shí)別準(zhǔn)確率、芯片功耗幾個(gè)方面來(lái)展示在KV260 的FPGA 上推理MobileNetv2 網(wǎng)絡(luò)的實(shí)驗(yàn)結(jié)果,并且將該結(jié)果分別與網(wǎng)絡(luò)在CPU 和GPU 計(jì)算平臺(tái)上的推理結(jié)果作為對(duì)比來(lái)分析基于FPGA方法的優(yōu)勢(shì)。

    3.1 實(shí)驗(yàn)測(cè)試平臺(tái)

    對(duì)于使用FPGA 加速器的方案,使用賽靈思的Kria KV260 作為硬件計(jì)算平臺(tái);對(duì)于直接使用CPU 的方案,使用i7-12th 作為硬件計(jì)算平臺(tái);而對(duì)于使用GPU 的方案,則使用RTX3060作為硬件計(jì)算平臺(tái)。

    3.2 實(shí)驗(yàn)性能對(duì)比

    表3 計(jì)算速度對(duì)比

    4 結(jié)語(yǔ)

    本文基于賽靈思提供的Kria KV260開(kāi)發(fā)板,使用高層次綜合工具通過(guò)C++語(yǔ)言進(jìn)行Mobile?Netv2 的加速核設(shè)計(jì),并在使用Python 在PYNQ平臺(tái)中對(duì)主機(jī)端進(jìn)行編程以及驗(yàn)證推理。實(shí)驗(yàn)表明,相比單核的Arm芯片,利用FPGA的并行計(jì)算設(shè)計(jì)以及HLS 相關(guān)指令對(duì)加速核進(jìn)行計(jì)算優(yōu)化效果明顯,且該種方法設(shè)計(jì)的卷積神經(jīng)網(wǎng)絡(luò)加速器在推理Top1 上并無(wú)明顯下降,在計(jì)算速度上相較于CPU 來(lái)說(shuō)提升了2 倍左右,雖然與GPU 相比還是有一定差距,但在功耗方面降低了10倍左右,有著較大的優(yōu)勢(shì)。

    猜你喜歡
    分塊殘差總線
    基于雙向GRU與殘差擬合的車輛跟馳建模
    基于殘差學(xué)習(xí)的自適應(yīng)無(wú)人機(jī)目標(biāo)跟蹤算法
    分塊矩陣在線性代數(shù)中的應(yīng)用
    基于遞歸殘差網(wǎng)絡(luò)的圖像超分辨率重建
    基于PCI Express總線的xHC與FPGA的直接通信
    機(jī)載飛控1553B總線轉(zhuǎn)以太網(wǎng)總線設(shè)計(jì)
    反三角分塊矩陣Drazin逆新的表示
    基于自適應(yīng)中值濾波的分塊壓縮感知人臉識(shí)別
    基于多分辨率半邊的分塊LOD模型無(wú)縫表達(dá)
    平穩(wěn)自相關(guān)過(guò)程的殘差累積和控制圖
    河南科技(2015年8期)2015-03-11 16:23:52
    26uuu在线亚洲综合色| 亚洲在线自拍视频| 国产日本99.免费观看| 能在线免费观看的黄片| 亚洲精品乱码久久久v下载方式| 国内久久婷婷六月综合欲色啪| 欧洲精品卡2卡3卡4卡5卡区| 99久久无色码亚洲精品果冻| 国产av在哪里看| 成人综合一区亚洲| 最近2019中文字幕mv第一页| 欧美性猛交╳xxx乱大交人| 又粗又硬又长又爽又黄的视频 | 日韩视频在线欧美| 97在线视频观看| 日韩三级伦理在线观看| 亚洲成人久久性| av.在线天堂| 岛国在线免费视频观看| 精品人妻偷拍中文字幕| 在线观看av片永久免费下载| 久久久久久九九精品二区国产| 欧美高清成人免费视频www| 欧美丝袜亚洲另类| 国产精品久久久久久精品电影| 国产探花极品一区二区| 国产v大片淫在线免费观看| 一区二区三区四区激情视频 | 日本欧美国产在线视频| 亚洲成a人片在线一区二区| 久久99热6这里只有精品| 麻豆av噜噜一区二区三区| 一级av片app| 久久精品国产99精品国产亚洲性色| 午夜精品国产一区二区电影 | 国产一区二区激情短视频| 国产亚洲精品久久久com| 成年av动漫网址| 亚洲在久久综合| 欧美又色又爽又黄视频| 免费看美女性在线毛片视频| 啦啦啦啦在线视频资源| 成人高潮视频无遮挡免费网站| 波多野结衣高清无吗| 国产亚洲91精品色在线| 国产美女午夜福利| 一级毛片aaaaaa免费看小| 99久久久亚洲精品蜜臀av| 国产成人freesex在线| 婷婷亚洲欧美| 亚洲国产高清在线一区二区三| 全区人妻精品视频| 国产高潮美女av| 日韩中字成人| 亚州av有码| 国产高清视频在线观看网站| 欧美精品国产亚洲| 亚洲国产欧洲综合997久久,| 中文精品一卡2卡3卡4更新| 床上黄色一级片| 91久久精品国产一区二区三区| 久久综合国产亚洲精品| 一边摸一边抽搐一进一小说| 精品人妻熟女av久视频| 狂野欧美白嫩少妇大欣赏| 久久午夜亚洲精品久久| 久久久久九九精品影院| 中国美女看黄片| 午夜精品在线福利| 久久人人爽人人片av| 国产久久久一区二区三区| 尤物成人国产欧美一区二区三区| 国产精品麻豆人妻色哟哟久久 | a级毛片a级免费在线| 丰满乱子伦码专区| 久久久久久国产a免费观看| 免费大片18禁| 高清毛片免费看| 三级男女做爰猛烈吃奶摸视频| 午夜a级毛片| 亚洲婷婷狠狠爱综合网| 国产在线精品亚洲第一网站| 永久网站在线| 亚洲精品国产成人久久av| 国产美女午夜福利| 成人午夜高清在线视频| 一卡2卡三卡四卡精品乱码亚洲| 成人高潮视频无遮挡免费网站| 91av网一区二区| 午夜亚洲福利在线播放| 亚洲久久久久久中文字幕| 黄色一级大片看看| 亚洲综合色惰| 国产片特级美女逼逼视频| 国产亚洲av片在线观看秒播厂 | 欧美成人免费av一区二区三区| 欧美+日韩+精品| 色哟哟哟哟哟哟| АⅤ资源中文在线天堂| 国产日本99.免费观看| 中文资源天堂在线| eeuss影院久久| 欧美在线一区亚洲| 国产精品麻豆人妻色哟哟久久 | 国产探花极品一区二区| 丰满人妻一区二区三区视频av| 午夜免费激情av| 干丝袜人妻中文字幕| 久久鲁丝午夜福利片| 草草在线视频免费看| 两个人视频免费观看高清| 高清毛片免费看| 国产黄片美女视频| 九色成人免费人妻av| 狂野欧美白嫩少妇大欣赏| 国产av麻豆久久久久久久| 变态另类成人亚洲欧美熟女| 91av网一区二区| 成人综合一区亚洲| 亚洲久久久久久中文字幕| 老师上课跳d突然被开到最大视频| 精品99又大又爽又粗少妇毛片| 日韩大尺度精品在线看网址| 天堂影院成人在线观看| 黄片wwwwww| 国产高清激情床上av| 亚洲综合色惰| 欧美在线一区亚洲| a级毛色黄片| 亚洲丝袜综合中文字幕| .国产精品久久| 网址你懂的国产日韩在线| 国产三级中文精品| 亚洲精品影视一区二区三区av| 亚洲精品乱码久久久v下载方式| 日本黄色视频三级网站网址| 国产精品日韩av在线免费观看| 99热这里只有是精品在线观看| 久久精品国产亚洲av涩爱 | 少妇熟女欧美另类| 搞女人的毛片| 国产蜜桃级精品一区二区三区| 一本一本综合久久| 国产精品野战在线观看| 人妻夜夜爽99麻豆av| 色吧在线观看| 国产精品精品国产色婷婷| 一级毛片aaaaaa免费看小| 两个人的视频大全免费| av国产免费在线观看| 一区二区三区四区激情视频 | 99精品在免费线老司机午夜| 国产成年人精品一区二区| 99久久无色码亚洲精品果冻| 久久久久久久久久久丰满| 老熟妇乱子伦视频在线观看| 美女大奶头视频| 久久久久久大精品| 久久久久九九精品影院| 男人狂女人下面高潮的视频| 亚洲人成网站高清观看| 亚洲av二区三区四区| av国产免费在线观看| 免费人成视频x8x8入口观看| 国产高清三级在线| 美女大奶头视频| 一边摸一边抽搐一进一小说| 亚洲丝袜综合中文字幕| 天天躁夜夜躁狠狠久久av| 我要搜黄色片| 99热这里只有是精品50| 亚洲精品成人久久久久久| 一区二区三区四区激情视频 | 26uuu在线亚洲综合色| 一本久久精品| 国产精品野战在线观看| 国内揄拍国产精品人妻在线| 亚洲精品影视一区二区三区av| 精品久久久久久久久久免费视频| 国产高潮美女av| 亚洲七黄色美女视频| 日本三级黄在线观看| 亚洲人成网站在线播放欧美日韩| 99热只有精品国产| 国产一区二区在线av高清观看| 亚洲欧美日韩高清专用| 国产精品乱码一区二三区的特点| 一区二区三区免费毛片| 日韩欧美精品免费久久| 国产三级中文精品| 久久这里只有精品中国| 哪个播放器可以免费观看大片| 国产 一区精品| 国产成人福利小说| 久久九九热精品免费| 欧洲精品卡2卡3卡4卡5卡区| 国产探花极品一区二区| 男人舔女人下体高潮全视频| 超碰av人人做人人爽久久| 秋霞在线观看毛片| 亚洲av成人精品一区久久| 国内精品一区二区在线观看| 两个人的视频大全免费| 免费电影在线观看免费观看| 91久久精品国产一区二区成人| 日本黄色片子视频| 国产又黄又爽又无遮挡在线| 精品人妻视频免费看| 日韩高清综合在线| 看免费成人av毛片| 色哟哟·www| 少妇猛男粗大的猛烈进出视频 | 亚洲五月天丁香| 精品久久久久久成人av| 久久久久国产网址| 精品人妻视频免费看| 黄色视频,在线免费观看| 麻豆乱淫一区二区| 亚洲人成网站在线观看播放| 国产三级在线视频| 成人性生交大片免费视频hd| 国内精品一区二区在线观看| 淫秽高清视频在线观看| 久久久久久久亚洲中文字幕| 日本与韩国留学比较| 男人的好看免费观看在线视频| 91狼人影院| 国产精品免费一区二区三区在线| 成人鲁丝片一二三区免费| 不卡一级毛片| 一区二区三区四区激情视频 | 搡老妇女老女人老熟妇| 可以在线观看毛片的网站| avwww免费| 能在线免费观看的黄片| .国产精品久久| 国产一区二区三区在线臀色熟女| 中文字幕免费在线视频6| 亚洲国产高清在线一区二区三| 欧美日韩乱码在线| kizo精华| 变态另类丝袜制服| 亚洲人成网站高清观看| 久久久久久伊人网av| 非洲黑人性xxxx精品又粗又长| 波多野结衣巨乳人妻| 亚洲成人精品中文字幕电影| 99国产精品一区二区蜜桃av| 欧美成人免费av一区二区三区| 九草在线视频观看| 99久久中文字幕三级久久日本| 午夜精品在线福利| 搞女人的毛片| 99久久中文字幕三级久久日本| 三级毛片av免费| 尾随美女入室| 男女下面进入的视频免费午夜| 精品一区二区三区视频在线| 精品少妇黑人巨大在线播放 | 亚洲国产欧美在线一区| 久99久视频精品免费| 国产午夜精品论理片| 日韩中字成人| 人妻少妇偷人精品九色| 内射极品少妇av片p| 日日撸夜夜添| 1024手机看黄色片| 日日摸夜夜添夜夜添av毛片| 国产真实伦视频高清在线观看| 亚洲av一区综合| 蜜桃亚洲精品一区二区三区| 国产成人一区二区在线| 午夜a级毛片| 欧美激情在线99| 中文字幕制服av| 人人妻人人澡人人爽人人夜夜 | 国产一级毛片在线| 啦啦啦观看免费观看视频高清| 黄片无遮挡物在线观看| 国产精华一区二区三区| 丝袜喷水一区| 天天躁夜夜躁狠狠久久av| 免费人成视频x8x8入口观看| av专区在线播放| 人人妻人人看人人澡| 日韩av不卡免费在线播放| 听说在线观看完整版免费高清| 蜜桃久久精品国产亚洲av| 国内精品美女久久久久久| 91久久精品国产一区二区三区| 久久草成人影院| 亚洲人成网站在线播放欧美日韩| 综合色av麻豆| 久久精品国产亚洲av天美| 天堂中文最新版在线下载 | 草草在线视频免费看| 嫩草影院入口| 久久久国产成人精品二区| 婷婷亚洲欧美| 丰满的人妻完整版| 国产精品久久久久久精品电影小说 | 99久久精品一区二区三区| 日韩欧美 国产精品| 乱人视频在线观看| 非洲黑人性xxxx精品又粗又长| 欧美+日韩+精品| www.色视频.com| 最近手机中文字幕大全| 国产在视频线在精品| 美女脱内裤让男人舔精品视频 | 国产精品久久久久久av不卡| 国产大屁股一区二区在线视频| 亚洲第一区二区三区不卡| 国产一区二区激情短视频| 国产在线精品亚洲第一网站| 国产蜜桃级精品一区二区三区| 欧美成人免费av一区二区三区| 国产精品福利在线免费观看| 国产麻豆成人av免费视频| 熟女电影av网| 亚洲欧美清纯卡通| 亚洲第一区二区三区不卡| 97热精品久久久久久| 亚洲欧美日韩东京热| 国产成年人精品一区二区| 非洲黑人性xxxx精品又粗又长| 内射极品少妇av片p| av天堂在线播放| 国产精品人妻久久久影院| 国产精华一区二区三区| 国产精品永久免费网站| 亚洲国产日韩欧美精品在线观看| 免费观看a级毛片全部| 少妇猛男粗大的猛烈进出视频 | 老熟妇乱子伦视频在线观看| 免费大片18禁| 特级一级黄色大片| 青青草视频在线视频观看| 久久久久久久久中文| 又粗又硬又长又爽又黄的视频 | 成人亚洲欧美一区二区av| 一级毛片电影观看 | 天天一区二区日本电影三级| 日本爱情动作片www.在线观看| 久久久久免费精品人妻一区二区| 亚洲av一区综合| 色5月婷婷丁香| 噜噜噜噜噜久久久久久91| 亚洲三级黄色毛片| 97人妻精品一区二区三区麻豆| 中国美女看黄片| 日本一本二区三区精品| 91久久精品电影网| 嫩草影院精品99| 国产v大片淫在线免费观看| 亚洲经典国产精华液单| 色噜噜av男人的天堂激情| 午夜福利视频1000在线观看| 亚洲欧美成人精品一区二区| 看非洲黑人一级黄片| 男插女下体视频免费在线播放| 大香蕉久久网| av在线播放精品| 人妻制服诱惑在线中文字幕| 夜夜爽天天搞| 插逼视频在线观看| 禁无遮挡网站| 我的老师免费观看完整版| 性色avwww在线观看| 99视频精品全部免费 在线| 亚洲国产精品成人综合色| 白带黄色成豆腐渣| 亚洲国产精品成人综合色| 麻豆成人av视频| 国产一区二区三区在线臀色熟女| 欧美+日韩+精品| 天美传媒精品一区二区| 亚洲,欧美,日韩| 日本av手机在线免费观看| 麻豆成人av视频| 国产黄色小视频在线观看| 两性午夜刺激爽爽歪歪视频在线观看| 亚洲七黄色美女视频| 久久精品国产亚洲av涩爱 | 成人特级黄色片久久久久久久| 91久久精品国产一区二区成人| 亚洲色图av天堂| 久久午夜福利片| 夫妻性生交免费视频一级片| 久久九九热精品免费| 国产精品一区二区性色av| 国产淫片久久久久久久久| 我的老师免费观看完整版| 国产人妻一区二区三区在| 91久久精品电影网| a级毛色黄片| 精品人妻视频免费看| 99久国产av精品| 国产一区二区在线观看日韩| 精品久久久久久久久久久久久| 国产精品久久久久久精品电影| 国产精品永久免费网站| 亚洲国产欧洲综合997久久,| 一级毛片aaaaaa免费看小| 中文精品一卡2卡3卡4更新| 日本在线视频免费播放| 国产精品久久久久久亚洲av鲁大| 国产成人a∨麻豆精品| 亚洲欧美日韩东京热| 哪里可以看免费的av片| 成年av动漫网址| 精品欧美国产一区二区三| 99久久精品一区二区三区| 高清日韩中文字幕在线| 久久人人爽人人片av| 三级男女做爰猛烈吃奶摸视频| 一边亲一边摸免费视频| 日本黄色片子视频| 高清午夜精品一区二区三区 | 色5月婷婷丁香| 亚洲18禁久久av| 别揉我奶头 嗯啊视频| 2021天堂中文幕一二区在线观| 一级黄片播放器| 国产精品福利在线免费观看| 内地一区二区视频在线| 久久久久久久久大av| 久久久a久久爽久久v久久| 波多野结衣高清作品| 欧美潮喷喷水| 综合色丁香网| 在线观看66精品国产| 色播亚洲综合网| 青春草视频在线免费观看| 国产一区二区三区av在线 | 白带黄色成豆腐渣| 爱豆传媒免费全集在线观看| 久久精品国产亚洲网站| 夜夜看夜夜爽夜夜摸| 一级二级三级毛片免费看| 成人av在线播放网站| 毛片女人毛片| ponron亚洲| 日韩一区二区三区影片| 五月伊人婷婷丁香| 国产久久久一区二区三区| 爱豆传媒免费全集在线观看| 人人妻人人看人人澡| 日本爱情动作片www.在线观看| 亚洲av二区三区四区| 国内精品宾馆在线| 欧美+亚洲+日韩+国产| 免费在线观看成人毛片| 国内揄拍国产精品人妻在线| 高清在线视频一区二区三区 | 久久亚洲国产成人精品v| 又粗又硬又长又爽又黄的视频 | 国产午夜福利久久久久久| 性插视频无遮挡在线免费观看| 亚洲国产日韩欧美精品在线观看| 亚洲四区av| 少妇的逼水好多| 97在线视频观看| 亚洲久久久国产精品| 亚洲成人手机| 欧美精品一区二区大全| 日本黄色片子视频| 亚洲伊人久久精品综合| 大又大粗又爽又黄少妇毛片口| 丰满乱子伦码专区| 国产一区二区三区综合在线观看 | av线在线观看网站| 亚洲高清免费不卡视频| 亚洲av不卡在线观看| 少妇丰满av| 丝袜喷水一区| 久久久精品94久久精品| 国产一区二区三区综合在线观看 | 久久精品久久久久久久性| 精品国产乱码久久久久久小说| 久久精品国产鲁丝片午夜精品| 五月玫瑰六月丁香| 人人妻人人爽人人添夜夜欢视频| av卡一久久| 满18在线观看网站| 美女视频免费永久观看网站| 97超视频在线观看视频| 国产精品国产av在线观看| 一二三四中文在线观看免费高清| 人妻夜夜爽99麻豆av| 欧美丝袜亚洲另类| 色婷婷av一区二区三区视频| 少妇的逼水好多| 91久久精品国产一区二区成人| 男女免费视频国产| 国产亚洲一区二区精品| 制服诱惑二区| 亚洲av成人精品一区久久| 99九九线精品视频在线观看视频| 久久鲁丝午夜福利片| 大香蕉97超碰在线| 国产午夜精品久久久久久一区二区三区| 熟妇人妻不卡中文字幕| 啦啦啦在线观看免费高清www| 在线播放无遮挡| 国产免费视频播放在线视频| 男的添女的下面高潮视频| 妹子高潮喷水视频| 桃花免费在线播放| 熟女av电影| 能在线免费看毛片的网站| 亚洲精品乱码久久久久久按摩| 亚洲精品456在线播放app| 亚州av有码| 亚洲欧美成人精品一区二区| videossex国产| 亚洲精品乱码久久久久久按摩| 99热这里只有精品一区| 多毛熟女@视频| 性高湖久久久久久久久免费观看| 亚洲精品日本国产第一区| 一区在线观看完整版| 天天影视国产精品| 亚洲情色 制服丝袜| 国产亚洲一区二区精品| 在线精品无人区一区二区三| 高清欧美精品videossex| 只有这里有精品99| 老熟女久久久| 中国三级夫妇交换| 一个人免费看片子| 国产欧美另类精品又又久久亚洲欧美| 国产成人精品一,二区| 亚洲av.av天堂| 精品99又大又爽又粗少妇毛片| 哪个播放器可以免费观看大片| 国产精品久久久久久久久免| 99热国产这里只有精品6| 国产深夜福利视频在线观看| 亚洲国产精品专区欧美| 乱码一卡2卡4卡精品| 午夜激情久久久久久久| 日韩精品免费视频一区二区三区 | 看非洲黑人一级黄片| 伦理电影大哥的女人| 亚洲国产精品国产精品| 各种免费的搞黄视频| 精品人妻一区二区三区麻豆| 精品久久久久久电影网| 亚洲精品一区蜜桃| 亚洲综合色惰| tube8黄色片| xxx大片免费视频| 午夜影院在线不卡| 亚洲综合色网址| av视频免费观看在线观看| 精品久久久久久久久av| 免费看不卡的av| 一区二区三区免费毛片| 免费观看在线日韩| 国产69精品久久久久777片| av又黄又爽大尺度在线免费看| 精品少妇黑人巨大在线播放| 美女国产高潮福利片在线看| 亚洲一区二区三区欧美精品| 麻豆乱淫一区二区| 精品国产乱码久久久久久小说| 乱码一卡2卡4卡精品| 啦啦啦在线观看免费高清www| 80岁老熟妇乱子伦牲交| 亚洲国产精品一区三区| 精品少妇黑人巨大在线播放| 毛片一级片免费看久久久久| 午夜福利在线观看免费完整高清在| 99九九在线精品视频| 亚洲第一区二区三区不卡| 中文乱码字字幕精品一区二区三区| 精品人妻偷拍中文字幕| 国产精品国产三级国产专区5o| 制服诱惑二区| 久久精品国产a三级三级三级| 一本色道久久久久久精品综合| 久久这里有精品视频免费| 一级a做视频免费观看| 国产毛片在线视频| 午夜福利视频精品| 色网站视频免费| a级毛片黄视频| 亚洲国产av新网站| 欧美+日韩+精品| a 毛片基地| 日日撸夜夜添| 国产一区二区三区综合在线观看 | 亚洲av不卡在线观看| 男女国产视频网站| 免费观看在线日韩| 亚洲精品国产av蜜桃| 搡老乐熟女国产| 久久人妻熟女aⅴ| 成年av动漫网址| 成人漫画全彩无遮挡| 天堂中文最新版在线下载| 99热这里只有精品一区| 欧美另类一区| 全区人妻精品视频| 中文字幕制服av| 青春草亚洲视频在线观看| 狠狠婷婷综合久久久久久88av| 性色av一级| 一级毛片 在线播放| 午夜免费观看性视频| 啦啦啦视频在线资源免费观看| 欧美亚洲 丝袜 人妻 在线| 男女无遮挡免费网站观看| 嫩草影院入口|