• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于改進(jìn)動態(tài)配置的FPGA卷積神經(jīng)網(wǎng)絡(luò)加速器的優(yōu)化方法①

    2020-04-21 02:28:52陳慶清王海霞張怡龍劉義鵬梁榮華
    高技術(shù)通訊 2020年3期
    關(guān)鍵詞:流水線加速器定點(diǎn)

    陳 朋 陳慶清 王海霞 張怡龍 劉義鵬 梁榮華

    (*浙江工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 杭州 310000) (**浙江工業(yè)大學(xué)信息工程學(xué)院 杭州 310000)

    0 引 言

    近年來,由于卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)的結(jié)構(gòu)層次越來越深,在圖像分類、目標(biāo)檢測、目標(biāo)跟蹤[1]等計(jì)算機(jī)視覺領(lǐng)域都得到了廣泛的應(yīng)用,但高計(jì)算復(fù)雜度和大內(nèi)存占用是硬件加速的瓶頸,需要開發(fā)更高效的硬件加速解決方案來驅(qū)動實(shí)時應(yīng)用程序[2]。Li等人[3]提出了基于GPU的大規(guī)模遞歸神經(jīng)網(wǎng)絡(luò)的高效實(shí)現(xiàn)。Li等人[4]分析了GPU加速器潛在的性能瓶頸。隨著CNN模型越來越大、越來越深,CNN加速器需要更多的計(jì)算操作和數(shù)據(jù)訪問,雖然GPU具有強(qiáng)大的計(jì)算能力,但也存在著功耗較高、體積較大和成本較高等問題。

    現(xiàn)場可編程門陣列(field programmable gate arrang, FPGA)具有大量陣列形式邏輯、運(yùn)算單元,在尺寸、功耗和并行運(yùn)算方面都比GPU有優(yōu)勢[5],具有高性能、低功耗、使用靈活方便等優(yōu)點(diǎn)[6]。傳統(tǒng)構(gòu)造FPGA的卷積神經(jīng)網(wǎng)絡(luò)的方式是基于寄存器傳輸級(register transfer level,RTL)描述語言設(shè)計(jì)的。郭曉丹等人[7]在FPGA上實(shí)現(xiàn)了單比特BP人工神經(jīng)網(wǎng)絡(luò),采用了低環(huán)路延遲加法器、混合信號乘法器來減少硬件消耗,提高運(yùn)算精度。Han等人[8]在FPGA平臺上設(shè)計(jì)的網(wǎng)絡(luò)加速器,其能源效率是CPU的40倍,GPU的11.5倍。林軍等人[9]提出了基于數(shù)據(jù)流水線的資源管理,馮煜晶等人[10]針對流水線停頓提出了動態(tài)指令調(diào)度機(jī)制。Li等人[11]采用流水線結(jié)構(gòu)達(dá)到565.94 GOP/s和391 fps的峰值性能。但傳統(tǒng)的基于RTL設(shè)計(jì)的神經(jīng)網(wǎng)絡(luò)仍然具有流程復(fù)雜、周期較長和優(yōu)化空間較小等問題[12]。Ma等人[13,14]基于RTL設(shè)計(jì)了可擴(kuò)展的自動編譯器,但仍然無法避免流程復(fù)雜、周期較長等問題。

    在其他基于FPGA的CNN加速器的設(shè)計(jì)方法中,使用基于高層次綜合(high-level synthesis,HLS)工具可以將高級編程語言直接轉(zhuǎn)化為硬件描述語言(hardware description language,HDL),并且對所生成的硬件結(jié)構(gòu)可以通過插入優(yōu)化指令進(jìn)行優(yōu)化,其中包括映射硬件寄存器、循環(huán)、接口等操作[15]。Zhang等人[16]通過HLS工具,使得基于FPGA的加速器的速度是NVIDIA K80的4.75倍。盧治等人[17]使用HLS工具證明了FPGA平臺在不同的網(wǎng)絡(luò)模型下效能遠(yuǎn)高于GPU平臺。由此可見,HLS工具設(shè)計(jì)的FPGA神經(jīng)網(wǎng)絡(luò)加速器同樣具有良好的性能,而且在設(shè)計(jì)周期上遠(yuǎn)遠(yuǎn)短于傳統(tǒng)方法,具有良好的可擴(kuò)展性。

    另一方面,在數(shù)據(jù)規(guī)模較大的分類場景下,并不需要網(wǎng)絡(luò)的高精度,需要的是更高實(shí)時性。在FPGA上,實(shí)現(xiàn)定點(diǎn)運(yùn)算的效率比浮點(diǎn)運(yùn)算高得多。Gysel等人[18]和Qiu等人[19]分別在GPU平臺和基于RTL設(shè)計(jì)的FPGA平臺提出動態(tài)定點(diǎn)數(shù)據(jù)量化方法,并且Qiu等人[19]只引入了0.4%的精度損失,實(shí)現(xiàn)了4.45 fps的幀率。在可接受的精度損失的條件下,對FPGA卷積加速器采用定點(diǎn)設(shè)計(jì),可以有效減少硬件開銷,從而提升加速器的性能。

    綜上所述,本文提出改進(jìn)動態(tài)配置的FPGA卷積神經(jīng)網(wǎng)絡(luò)加速器的優(yōu)化方法。該方法采用C++作為編程語言,將加速器任務(wù)劃分到處理器系統(tǒng)與可編程邏輯上。處理器系統(tǒng)上使用基于模塊復(fù)用的流水線方式,多個模塊之間通過片內(nèi)總線實(shí)現(xiàn)高速互連。在可編程邏輯上將引入分割參數(shù),使用HLS工具設(shè)計(jì)具有可擴(kuò)展性卷積加速器并實(shí)現(xiàn)其功能。同時采用8-16位動態(tài)定點(diǎn)方案,將浮點(diǎn)數(shù)據(jù)改為動態(tài)定點(diǎn)數(shù)據(jù),引入量化參數(shù),以適配不同網(wǎng)絡(luò)層量化配置。本文將ImageNet數(shù)據(jù)庫作為數(shù)據(jù)集,在FPGA上搭建了CNN網(wǎng)絡(luò)加速器,驗(yàn)證了方法的有效性。本文的主要工作如下。

    (1) 引入分割參數(shù)后,以流水線的方式將網(wǎng)絡(luò)中相同層進(jìn)行模塊復(fù)用來實(shí)現(xiàn)并行工作,并建立沖突解決機(jī)制來解決輸入數(shù)據(jù)的競爭問題。

    (2) 根據(jù)FPGA的計(jì)算特性,采用動態(tài)定點(diǎn)數(shù)據(jù)量化方法,將浮點(diǎn)數(shù)據(jù)改為動態(tài)定點(diǎn)數(shù)據(jù)。并在HLS工具設(shè)計(jì)過程中引入量化參數(shù),以適配不同網(wǎng)絡(luò)層量化配置。

    1 FPGA卷積神經(jīng)網(wǎng)絡(luò)加速器的優(yōu)化方法

    1.1 系統(tǒng)任務(wù)的軟硬件劃分

    本文對優(yōu)化對象進(jìn)行劃分,將不同的優(yōu)化對象分別劃分到處理器系統(tǒng)(processing system,PS)與可編程邏輯(programmable logic,PL)上,優(yōu)化示意圖如圖1所示。在PS部分上實(shí)現(xiàn)基于流水線結(jié)構(gòu)的層間模塊復(fù)用,并建立對應(yīng)的沖突處理機(jī)制來解決復(fù)用造成的信號沖突;在PL部分上利用HLS工具設(shè)計(jì)優(yōu)化卷積加速器,通過仿真報(bào)告來驗(yàn)證資源占用比。完成設(shè)計(jì)后,對整個系統(tǒng)進(jìn)行聯(lián)合仿真,驗(yàn)證結(jié)果的準(zhǔn)確性,通過實(shí)驗(yàn)來驗(yàn)證設(shè)計(jì)方法的有效性。

    圖1 優(yōu)化示意圖

    1.2 具有可擴(kuò)展性的卷積加速器設(shè)計(jì)

    卷積神經(jīng)網(wǎng)絡(luò)的特征提取階段往往由多個計(jì)算層組成,例如AlexNet網(wǎng)絡(luò),它的特征提取階段可以由5個卷積層和3個池化層組成。卷積運(yùn)算如圖2所示。卷積層接收特征圖作為輸入,每個輸入特征圖通過卷積核映射生成輸出特性,輸出特征圖將形成下一個卷積層的輸入特征圖集。N表示特征圖的個數(shù),W和H分別表示輸入特征圖的寬與高,K×K表示卷積核的窗口大小,S(通常小于K)表示窗口的平移步長,M表示輸出特征圖的個數(shù)和卷積核的個數(shù),C和R分別表示輸出特征圖的寬與高。

    圖2 卷積運(yùn)算示意圖

    池化層的目標(biāo)是減少前一個卷積層產(chǎn)生的數(shù)據(jù)的大小,同時保持最相關(guān)的特性。實(shí)際上,池化層通常插入到2個卷積層之間。因?yàn)榫矸e層和池化層擁有相似的內(nèi)存訪問模式,因此它們在本文中使用相同的內(nèi)存和優(yōu)化設(shè)計(jì)方案,可以用式(1)表達(dá)。其中OUT表示輸出特征圖,W表示權(quán)重系數(shù),IN表示輸入特征圖。

    ×INti,S×row+i,S×col+j

    (1)

    在一般情況下,卷積神經(jīng)網(wǎng)絡(luò)所處理的輸入集輸出集均為3維數(shù)據(jù),需要和各個層的卷積核大小和步長一起作為函數(shù)變量進(jìn)行傳遞。但如果循環(huán)內(nèi)含有變量,就不能利用HLS工具的循環(huán)展開、循環(huán)流水線等優(yōu)化方式進(jìn)行優(yōu)化。

    為了提高數(shù)據(jù)處理的并行度,引入分割參數(shù),對輸出特征圖深度、輸入特征圖深度、輸出特征圖寬和長進(jìn)行分割。在Zhang等人[20]的工作中,不同循環(huán)迭代之間的數(shù)據(jù)共享關(guān)系可以分為3類:無關(guān)、獨(dú)立、依賴。循環(huán)參數(shù)Tr、Tc和輸入集IN是依賴關(guān)系,和輸出集OUT是獨(dú)立關(guān)系;Tm和權(quán)重集W、輸出集OUT均是獨(dú)立關(guān)系;Tn和輸入集IN、權(quán)重集W均是獨(dú)立關(guān)系。

    在卷積層加速器進(jìn)行高層次綜合之前,需要確定分割參數(shù)的數(shù)值,即將其作為固定的加速器參數(shù)。根據(jù)數(shù)據(jù)共享關(guān)系,對循環(huán)進(jìn)行分割及重排后的卷積結(jié)構(gòu)如式(2)所示。其中F(x)表示循環(huán)展開,L(x)表示循環(huán)流水線。在經(jīng)過優(yōu)化后,卷積層中的卷積運(yùn)算根據(jù)分割參數(shù)的設(shè)定,展開為多條處理通道進(jìn)行并行計(jì)算。

    (2)

    1.3 資源約束下基于流水線結(jié)構(gòu)的層間模塊復(fù)用

    對于大規(guī)模的應(yīng)用場景,圖像數(shù)據(jù)往往是具有連續(xù)性的。根據(jù)CNN數(shù)據(jù)處理特性,可知CNN內(nèi)部的數(shù)據(jù)處理過程是依照不同處理層順序進(jìn)行的,即網(wǎng)絡(luò)中前后相鄰的層之間,數(shù)據(jù)具有依賴關(guān)系,無法進(jìn)行并行處理。對于GPU來說,卷積神經(jīng)網(wǎng)絡(luò)的每一層輸入都是上一層的輸出,層間的數(shù)據(jù)關(guān)系緊密相關(guān),是一種串行結(jié)構(gòu),無法做到層間并行運(yùn)算。相比于GPU,F(xiàn)PGA的硬件結(jié)構(gòu)可以采用流水線結(jié)構(gòu),用以減少運(yùn)算的時間開銷,提高資源利用率。

    本文中的流水線由多個卷積神經(jīng)網(wǎng)絡(luò)的層級結(jié)構(gòu)組成。由于流水線中的不同層級模塊具有不同的計(jì)算時間,計(jì)算周期最長的層級模塊是流水線中瓶頸段,實(shí)際加速比也由瓶頸段所決定的。實(shí)際加速比S如式(3)所示:

    (3)

    在資源約束情況下,想要保持卷積神經(jīng)網(wǎng)絡(luò)良好的計(jì)算性能,需要充分考慮其并行運(yùn)算的情況。由于相鄰層之間具有數(shù)據(jù)依賴關(guān)系,其數(shù)據(jù)處理無法并行進(jìn)行,為達(dá)到對資源的高效利用,本文采用各個不同網(wǎng)絡(luò)層間模塊復(fù)用的方案,如圖3所示,以實(shí)現(xiàn)對硬件資源的節(jié)約并提高單個加速器的計(jì)算效能。即其中所有卷積層采用同一個卷積加速器進(jìn)行計(jì)算,所有池化層采用同一個池化層加速器進(jìn)行處理,所有全連接層采用同一個全連接層加速器進(jìn)行處理。

    圖3 網(wǎng)絡(luò)層間模塊復(fù)用示意圖

    模塊復(fù)用的關(guān)鍵在于解決輸入數(shù)據(jù)的競爭問題。模塊重用之前,各個模塊的輸入和輸出是相互獨(dú)立的。模塊重用之后,多個輸入需要整合成一個輸入,重用模塊的輸出是根據(jù)輸入選擇的。t時刻多個輸入數(shù)據(jù)的沖突信號C是由輸入數(shù)據(jù)的有效信號V組成的,如式(4)所示,其中v表示輸入數(shù)據(jù)個數(shù)。

    (4)

    如果重用模塊在t時刻檢測到?jīng)_突(C≥1),就需要建立沖突解決機(jī)制來避免沖突。我們通過增加流水線cache的方式,避免數(shù)據(jù)同時到達(dá)重用模塊的輸入端口。具體操作是在后一個模塊數(shù)據(jù)輸入前增加FIFO來緩存輸入數(shù)據(jù),直到?jīng)_突解決。

    對于流水線中的第k個模塊,它在t時刻輸入信號Vα如式(5)所示。當(dāng)Vα=0時,說明輸入無效。當(dāng)Vα>0時,則說明輸入有效。

    (5)

    在增加了x級的cache后,模塊的流水線在t時刻輸入信號Vβ如式(6)所示,此時沖突信號C如式(7)所示。其中Vx表示在增加了x級的cache后,重用模塊的輸入數(shù)據(jù)的有效信號。

    (6)

    (7)

    1.4 動態(tài)定點(diǎn)數(shù)據(jù)量化

    卷積神經(jīng)網(wǎng)絡(luò)的復(fù)雜性集中在兩部分,卷積層中存在著大量的運(yùn)算,而網(wǎng)絡(luò)權(quán)重通常集中于全連接層。例如AlexNet,超過90%的運(yùn)算集中在卷積層,超過90%的網(wǎng)絡(luò)權(quán)值集中在全連接層中,如圖4所示。

    圖4 AlexNet中不同層的運(yùn)算次數(shù)和權(quán)重?cái)?shù)

    傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)模型在CPU和GPU的訓(xùn)練過程中得到的都是32位的浮點(diǎn)型數(shù)據(jù),但是在測試或者分類階段,并不需要這樣的高精度。FPGA卷積神經(jīng)網(wǎng)絡(luò)加速器的設(shè)計(jì)目標(biāo)是以最高性能實(shí)現(xiàn)最佳精度。在Zhang等人[20]的工作中,實(shí)現(xiàn)模型采用32位的浮點(diǎn)型數(shù)據(jù)進(jìn)行計(jì)算。然而在FPGA上,實(shí)現(xiàn)定點(diǎn)運(yùn)算的效率比浮點(diǎn)運(yùn)算高得多[21]。在盡可能不影響精度的前提下,如果將網(wǎng)絡(luò)進(jìn)行量化,使用定點(diǎn)運(yùn)算來代替浮點(diǎn)運(yùn)算,直接降低存儲需求以及存儲傳輸所消耗的能量,從而提升加速器的性能。網(wǎng)絡(luò)的準(zhǔn)確性往往取決于用于表示特征圖和訓(xùn)練參數(shù)的精度參數(shù),需要合理的量化參數(shù)來保證模型量化后的網(wǎng)絡(luò)準(zhǔn)確性。

    對傳統(tǒng)的靜態(tài)定點(diǎn)方案而言,只能滿足大部分的權(quán)重取值范圍,而動態(tài)定點(diǎn)方案可以通過調(diào)整數(shù)據(jù)格式來滿足不同網(wǎng)絡(luò)層的精度需求。在動態(tài)定點(diǎn)方案中,每個數(shù)字都可以用式(8)表示:

    (8)

    其中B表示位寬,S表示符號位,F(xiàn)表示小數(shù)長度,x表示當(dāng)前位的值。動態(tài)精度量化與靜態(tài)精度量化不同之處在于FL對于不同網(wǎng)絡(luò)層的特征圖集是動態(tài)的,而在一個圖層中是靜態(tài)的,這樣做是為了將每個網(wǎng)絡(luò)層的誤差最小化。

    由于動態(tài)定點(diǎn)中每個網(wǎng)絡(luò)層的量化參數(shù)各有差異,特別是針對層間模塊復(fù)用的情況,因此在使用HLS工具設(shè)計(jì)網(wǎng)絡(luò)層加速器時,需引入量化參數(shù)來適配各種量化配置的情況。表示輸入集、輸出集、權(quán)重集所需的位寬,表示輸入集、輸出集、權(quán)重集所需的小數(shù)位。

    在完成訓(xùn)練之后需要對網(wǎng)絡(luò)進(jìn)行量化來獲取量化參數(shù),并根據(jù)網(wǎng)絡(luò)精度變化來選取最優(yōu)的量化參數(shù)。在選取量化參數(shù)時應(yīng)滿足式(9)的條件:

    F=argmin∑|R-RB,F|

    (9)

    其中,R為訓(xùn)練時得到的定點(diǎn)數(shù)據(jù),RB,F為給定條件下的定點(diǎn)格式。

    2 實(shí)驗(yàn)結(jié)果和分析

    本文實(shí)驗(yàn)采用了Xilinx公司的Xilinx SDSoC 2017.4軟件環(huán)境進(jìn)行硬件開發(fā),使用的硬件平臺為該公司的ZCU102開發(fā)板,其芯片型號為ZU9EG,使用的工作頻率為200 MHz,采用了8-16位動態(tài)定點(diǎn)方案。實(shí)驗(yàn)采用的數(shù)據(jù)集為ImageNet數(shù)據(jù)集,對比的GPU平臺為NVIDIA公司的TITAN-X,本實(shí)驗(yàn)測試的網(wǎng)絡(luò)結(jié)構(gòu)為AlexNet網(wǎng)絡(luò)和VGG網(wǎng)絡(luò)。

    卷積層加速器內(nèi)部的乘加運(yùn)算需調(diào)用數(shù)字信號處理器(digital signal processor, DSP)來進(jìn)行,在本文中,對卷積操作的循環(huán)進(jìn)行了展開,卷積層加速器所消耗的DSP數(shù)量與循環(huán)分割參數(shù)Tm和Tn的關(guān)系如圖5所示,可見卷積層加速器的DSP的消耗量與分割參數(shù)Tm×Tn呈線性關(guān)系,循環(huán)展開越大,DSP消耗量也越大。

    卷積層加速器內(nèi)部的片上緩存主要是調(diào)用雙極隨機(jī)存取存儲器(bipolar random access memory, BRAM)來進(jìn)行存儲的,在本文中卷積層加速器所消耗的BRAM與循環(huán)分割參數(shù)Tr和Tc的關(guān)系如圖6所示,可見BRAM的消耗量與分割參數(shù)Tr×Tc基本呈線性關(guān)系,便于之后的拓展設(shè)計(jì)。

    AlexNet網(wǎng)絡(luò)和VGG網(wǎng)絡(luò)在動態(tài)定點(diǎn)量化前后的Top-1和Top-5的準(zhǔn)確率如表1所示。AlexNet網(wǎng)絡(luò)量化前后Top-1和Top-5的精度損失為0.4%和0.14%,VGG網(wǎng)絡(luò)量化前后Top-1和Top-5的精度損失為0.63%和0.53%,與其他加速算法的精度損失對比如表2所示。Naveen等人[22]和Wei等人[23]采用8-16位定點(diǎn),Zhang等人[24]采用16位定點(diǎn),其算法精度損失均在1%~2%左右。而本文采用的8-16位動態(tài)定點(diǎn)設(shè)計(jì)方案在此基礎(chǔ)上將精度損失減小至0.63%。

    圖5 不同參數(shù)配置下的DSP消耗量

    圖6 不同參數(shù)配置下的BRAM消耗量表1 量化前后網(wǎng)絡(luò)模型精度比較

    準(zhǔn)確率32位浮點(diǎn)Top-1Top-58-16位動態(tài)定點(diǎn)Top-1Top-5AlexNet63.87%85.39%63.47%85.25%VGG71.59%90.07%70.96%89.54%

    表2 不同加速器的精度損失比較

    利用循環(huán)展開、流水線等HLS工具的優(yōu)化技術(shù)進(jìn)行網(wǎng)絡(luò)加速,表3顯示了優(yōu)化前后的單張圖片運(yùn)行時間和資源占用比。DSP的資源比優(yōu)化前增加7.2倍,其余資源也有增加,但都未超過系統(tǒng)所提供的硬件資源上限,同時運(yùn)算速度提升了295.7倍。在應(yīng)用層間模塊復(fù)用后,硬件資源基本沒有變動,但平均計(jì)算時間僅是原來的20%。

    表3 優(yōu)化前后運(yùn)算時間、資源占用對比

    針對AlexNet網(wǎng)絡(luò)結(jié)構(gòu),應(yīng)用本文的優(yōu)化配置后,對其性能及功耗進(jìn)行測量,并將結(jié)果與其他優(yōu)化方法比較,其對比結(jié)果如表4所示。在TIAN-X上每幅圖的計(jì)算時間為1.93 ms,本文每幅圖的計(jì)算時間為3.44 ms,是TIAN-X的1.78倍,但在TIAN-X上每幅圖所需功耗為0.511 J,本文每幅圖所需功耗僅需0.078 J,其計(jì)算能效達(dá)到了GPU的7.2倍,并且FPGA的便攜性遠(yuǎn)遠(yuǎn)高于GPU。Zhang等人[20]使用HLS工具,提出了基于循環(huán)迭代之間的數(shù)據(jù)共享關(guān)系的循環(huán)分割與重排。本文在此基礎(chǔ)上進(jìn)行8-16位的動態(tài)定點(diǎn)量化,并引入了基于流水線層間模塊復(fù)用,將計(jì)算速度提高了6.2倍,同時也優(yōu)于文獻(xiàn)[22]基于OpenCL的開發(fā)方式。文獻(xiàn)[9]基于RTL設(shè)計(jì),用流水線結(jié)構(gòu)來增加吞吐量,達(dá)到了391 fps的峰值性能。雖然Li等人[9]設(shè)計(jì)的加速器速度更快,但由于功耗更大,其計(jì)算能效和本文的方法幾乎相同,且開發(fā)周期較長,應(yīng)對不同網(wǎng)絡(luò)結(jié)構(gòu)的可擴(kuò)展性不強(qiáng)。

    針對VGG網(wǎng)絡(luò)結(jié)構(gòu)的性能比較如表5所示,在TIAN-X上每幅圖的計(jì)算時間為6.60 ms,本文每幅圖的計(jì)算時間為18.37 ms,計(jì)算能效達(dá)到了GPU的3.89倍。文獻(xiàn)[23]采用的是脈動陣列的高通量CNN設(shè)計(jì),每幅圖的計(jì)算時間為26.85 ms。文獻(xiàn)[25]針對卷積循環(huán)的內(nèi)存訪問和數(shù)據(jù)移動進(jìn)行了定量分析和優(yōu)化,每幅圖的計(jì)算時間分別為47.97 ms。文獻(xiàn)[24]使用RTL提出了一個深度流水線的多FPGA架構(gòu)。而本文結(jié)合了循環(huán)迭代優(yōu)化和流水線優(yōu)化,提高了計(jì)算速度的優(yōu)化上限,把計(jì)算速度提高了至少2倍。

    表4 AlexNet網(wǎng)絡(luò)加速器的性能比較

    表5 VGG網(wǎng)絡(luò)加速器的性能比較

    3 結(jié) 論

    本文利用HLS工具的可擴(kuò)展性,提出了一種改進(jìn)動態(tài)配置的FPGA卷積神經(jīng)網(wǎng)絡(luò)加速器的優(yōu)化方法。引入循環(huán)分割參數(shù),設(shè)計(jì)了具有可擴(kuò)展性的卷積加速器。將網(wǎng)絡(luò)層通過復(fù)用模塊,組合成流水線的工作方式,采用8-16位動態(tài)定點(diǎn)方案。在Xilinx的ZCU102開發(fā)板上實(shí)現(xiàn)了AlexNet網(wǎng)絡(luò)和VGG網(wǎng)絡(luò)。在最大精度損失0.63%的條件下,將加速器性能分別從46.3 fps和37.2 fps提高到了290.7 fps和54.4 fps,計(jì)算能效分別達(dá)到了TITAN-X的1.78倍和3.89倍。實(shí)驗(yàn)結(jié)果表明,本文所提出的改進(jìn)動態(tài)配置的FPGA卷積神經(jīng)網(wǎng)絡(luò)加速器的優(yōu)化方法,在計(jì)算能效上優(yōu)于GPU Titan-X,滿足了計(jì)算實(shí)時性的要求,同時也解決了功耗和體積問題。

    猜你喜歡
    流水線加速器定點(diǎn)
    輪滑加速器
    化學(xué)工業(yè)的“加速器”
    Gen Z Migrant Workers Are Leaving the Assembly Line
    例談圓錐曲線中的定點(diǎn)定值問題
    定點(diǎn)幫扶讓村民過上美好生活
    解析幾何中定點(diǎn)問題的處理策略
    全民小康路上的“加速器”
    直線過定點(diǎn)的5種特優(yōu)解法
    流水線
    等待“加速器”
    99国产精品一区二区三区| 免费在线观看日本一区| 在线永久观看黄色视频| 一本精品99久久精品77| 一进一出好大好爽视频| 日本一本二区三区精品| 中文字幕精品亚洲无线码一区| 亚洲 国产 在线| 成人高潮视频无遮挡免费网站| 国产av一区在线观看免费| av有码第一页| 两性午夜刺激爽爽歪歪视频在线观看 | 久久久久久久午夜电影| 成人永久免费在线观看视频| 国产精品 国内视频| 美女黄网站色视频| 精华霜和精华液先用哪个| 听说在线观看完整版免费高清| 国产成人系列免费观看| 又黄又爽又免费观看的视频| 国产精品永久免费网站| svipshipincom国产片| 久99久视频精品免费| 欧美性猛交╳xxx乱大交人| 国产成人系列免费观看| 国产视频一区二区在线看| 一级毛片女人18水好多| 非洲黑人性xxxx精品又粗又长| 男女之事视频高清在线观看| 亚洲成人中文字幕在线播放| 欧美日韩精品网址| 欧美最黄视频在线播放免费| 久久久精品国产亚洲av高清涩受| 制服丝袜大香蕉在线| 两个人免费观看高清视频| 12—13女人毛片做爰片一| 亚洲国产精品合色在线| 国产在线精品亚洲第一网站| 三级毛片av免费| 欧美成人性av电影在线观看| 国产高清视频在线观看网站| 国产午夜福利久久久久久| 午夜日韩欧美国产| 特大巨黑吊av在线直播| 亚洲人成电影免费在线| 国产伦人伦偷精品视频| 少妇被粗大的猛进出69影院| 国产一区二区三区视频了| 看黄色毛片网站| 免费在线观看亚洲国产| 一个人观看的视频www高清免费观看 | 午夜精品在线福利| 成在线人永久免费视频| 国产私拍福利视频在线观看| 无遮挡黄片免费观看| 色哟哟哟哟哟哟| 亚洲午夜理论影院| 99热这里只有是精品50| 精品一区二区三区四区五区乱码| 亚洲五月天丁香| 亚洲激情在线av| 97人妻精品一区二区三区麻豆| 小说图片视频综合网站| 久久久久国产精品人妻aⅴ院| 日韩 欧美 亚洲 中文字幕| 亚洲专区国产一区二区| 观看免费一级毛片| 午夜成年电影在线免费观看| 操出白浆在线播放| 69av精品久久久久久| 亚洲,欧美精品.| 国产精品av视频在线免费观看| 精品国产超薄肉色丝袜足j| 91九色精品人成在线观看| 亚洲国产中文字幕在线视频| 在线观看免费午夜福利视频| 国产亚洲欧美在线一区二区| 国产亚洲精品第一综合不卡| 国产亚洲精品久久久久久毛片| 91九色精品人成在线观看| 91大片在线观看| 99热这里只有精品一区 | 亚洲美女黄片视频| 成人高潮视频无遮挡免费网站| 天堂av国产一区二区熟女人妻 | 丁香六月欧美| 国产成人啪精品午夜网站| 亚洲人成伊人成综合网2020| 午夜福利在线观看吧| 免费观看人在逋| 他把我摸到了高潮在线观看| 日本免费一区二区三区高清不卡| 757午夜福利合集在线观看| 中文在线观看免费www的网站 | 曰老女人黄片| 99久久99久久久精品蜜桃| 国产成人av激情在线播放| 校园春色视频在线观看| 日本一区二区免费在线视频| 男女视频在线观看网站免费 | 日韩欧美国产在线观看| 国产激情偷乱视频一区二区| 国产又黄又爽又无遮挡在线| 成年免费大片在线观看| 好男人在线观看高清免费视频| 亚洲国产欧美一区二区综合| 亚洲av美国av| 男女下面进入的视频免费午夜| 身体一侧抽搐| 久热爱精品视频在线9| 欧美日韩国产亚洲二区| 国产亚洲精品av在线| 中文字幕久久专区| 欧美国产日韩亚洲一区| 精品欧美一区二区三区在线| 精品无人区乱码1区二区| 久9热在线精品视频| a在线观看视频网站| 亚洲黑人精品在线| 国内毛片毛片毛片毛片毛片| 88av欧美| 男女下面进入的视频免费午夜| 97碰自拍视频| 国产午夜福利久久久久久| 亚洲人成网站在线播放欧美日韩| 欧美精品啪啪一区二区三区| 日本一本二区三区精品| 午夜久久久久精精品| 高清在线国产一区| 中文字幕精品亚洲无线码一区| 国产成人影院久久av| 亚洲一码二码三码区别大吗| 淫秽高清视频在线观看| 欧美日韩中文字幕国产精品一区二区三区| 国产欧美日韩一区二区三| 此物有八面人人有两片| 国产视频一区二区在线看| 欧美不卡视频在线免费观看 | 欧美日韩中文字幕国产精品一区二区三区| 国产成年人精品一区二区| 精品国产美女av久久久久小说| 精品国产美女av久久久久小说| 国产又色又爽无遮挡免费看| 精品久久久久久,| 亚洲乱码一区二区免费版| 999久久久国产精品视频| 久久精品人妻少妇| 久久婷婷成人综合色麻豆| 国产又色又爽无遮挡免费看| 少妇粗大呻吟视频| 妹子高潮喷水视频| 一级黄色大片毛片| 国产乱人伦免费视频| 一级毛片精品| 免费观看精品视频网站| 久久久精品大字幕| 黑人欧美特级aaaaaa片| 国产成人啪精品午夜网站| 国产精品久久电影中文字幕| 日本三级黄在线观看| 午夜久久久久精精品| 欧美一级a爱片免费观看看 | 99re在线观看精品视频| 午夜福利在线在线| 国产精品综合久久久久久久免费| 国产亚洲av高清不卡| 亚洲午夜精品一区,二区,三区| 曰老女人黄片| av免费在线观看网站| 国产精品一区二区精品视频观看| 亚洲午夜精品一区,二区,三区| 欧美不卡视频在线免费观看 | 日本a在线网址| 精品免费久久久久久久清纯| 国产精品精品国产色婷婷| 国产精品av久久久久免费| 日韩欧美免费精品| 免费人成视频x8x8入口观看| 久久亚洲真实| 色精品久久人妻99蜜桃| 免费看十八禁软件| 久久久久国内视频| 午夜老司机福利片| 亚洲色图 男人天堂 中文字幕| 亚洲色图 男人天堂 中文字幕| 国产又黄又爽又无遮挡在线| 色老头精品视频在线观看| 午夜影院日韩av| 午夜福利欧美成人| 久久人妻福利社区极品人妻图片| 久久精品国产亚洲av高清一级| 免费搜索国产男女视频| 亚洲人成电影免费在线| 久99久视频精品免费| 亚洲成a人片在线一区二区| 首页视频小说图片口味搜索| 免费在线观看亚洲国产| 亚洲国产精品久久男人天堂| 日本熟妇午夜| 不卡av一区二区三区| 曰老女人黄片| 婷婷精品国产亚洲av| 精品少妇一区二区三区视频日本电影| 麻豆成人av在线观看| 一区二区三区高清视频在线| 伊人久久大香线蕉亚洲五| 国产精品香港三级国产av潘金莲| 91麻豆精品激情在线观看国产| 99在线人妻在线中文字幕| а√天堂www在线а√下载| 99久久无色码亚洲精品果冻| 日韩高清综合在线| 99久久国产精品久久久| 亚洲第一欧美日韩一区二区三区| 特大巨黑吊av在线直播| 在线播放国产精品三级| svipshipincom国产片| 久久伊人香网站| 欧美成人免费av一区二区三区| 欧美另类亚洲清纯唯美| 免费在线观看成人毛片| 欧美成人免费av一区二区三区| 国产片内射在线| 一级毛片精品| 国产亚洲精品一区二区www| 亚洲人成网站在线播放欧美日韩| 午夜福利18| 两个人免费观看高清视频| 91成年电影在线观看| 岛国在线免费视频观看| 欧美乱妇无乱码| bbb黄色大片| 久久伊人香网站| 色综合婷婷激情| 国产黄片美女视频| 欧美一区二区精品小视频在线| 国产亚洲精品第一综合不卡| 亚洲国产精品sss在线观看| 久久精品国产亚洲av香蕉五月| 国产精品九九99| 狠狠狠狠99中文字幕| tocl精华| 性欧美人与动物交配| 久久久久精品国产欧美久久久| 久久国产乱子伦精品免费另类| 国产三级中文精品| 国产真人三级小视频在线观看| 免费在线观看完整版高清| 日韩三级视频一区二区三区| 精品国产乱码久久久久久男人| 又大又爽又粗| 97超级碰碰碰精品色视频在线观看| 国产日本99.免费观看| 精品日产1卡2卡| 国产精品 欧美亚洲| 亚洲精品av麻豆狂野| 中文资源天堂在线| 777久久人妻少妇嫩草av网站| 麻豆久久精品国产亚洲av| 巨乳人妻的诱惑在线观看| 亚洲国产欧美人成| 欧美日韩亚洲综合一区二区三区_| 亚洲五月天丁香| 国产精品美女特级片免费视频播放器 | 人人妻人人澡欧美一区二区| 国产私拍福利视频在线观看| 亚洲18禁久久av| 久久中文字幕人妻熟女| 日韩av在线大香蕉| 一进一出抽搐动态| 老司机福利观看| 99热这里只有是精品50| 亚洲av片天天在线观看| 手机成人av网站| 亚洲av熟女| 男女午夜视频在线观看| 可以在线观看的亚洲视频| 色综合亚洲欧美另类图片| 久久婷婷成人综合色麻豆| 在线十欧美十亚洲十日本专区| 丝袜美腿诱惑在线| 五月伊人婷婷丁香| 亚洲精品一卡2卡三卡4卡5卡| 男男h啪啪无遮挡| 正在播放国产对白刺激| xxxwww97欧美| 欧美色视频一区免费| av超薄肉色丝袜交足视频| 听说在线观看完整版免费高清| 99久久精品热视频| 2021天堂中文幕一二区在线观| 一级黄色大片毛片| 欧美 亚洲 国产 日韩一| 免费一级毛片在线播放高清视频| 午夜成年电影在线免费观看| 亚洲成a人片在线一区二区| 俺也久久电影网| 99久久无色码亚洲精品果冻| 欧美性猛交╳xxx乱大交人| 五月玫瑰六月丁香| 免费av毛片视频| 亚洲自拍偷在线| 亚洲 国产 在线| 国产一区二区三区视频了| 成年版毛片免费区| 午夜日韩欧美国产| 精品一区二区三区av网在线观看| 一卡2卡三卡四卡精品乱码亚洲| 久久久久性生活片| 久99久视频精品免费| 欧美乱妇无乱码| 久久精品91无色码中文字幕| 日本a在线网址| 国内毛片毛片毛片毛片毛片| av有码第一页| 老汉色av国产亚洲站长工具| 久久精品国产清高在天天线| 国产不卡一卡二| 亚洲欧美日韩无卡精品| 亚洲 国产 在线| 一进一出抽搐gif免费好疼| 精品一区二区三区视频在线观看免费| 亚洲一区中文字幕在线| 免费在线观看视频国产中文字幕亚洲| 麻豆一二三区av精品| 国产激情欧美一区二区| 久久国产精品人妻蜜桃| 丰满人妻熟妇乱又伦精品不卡| 欧美成人免费av一区二区三区| 欧美3d第一页| xxxwww97欧美| av片东京热男人的天堂| 女警被强在线播放| 国产麻豆成人av免费视频| 欧美人与性动交α欧美精品济南到| 十八禁人妻一区二区| 丝袜人妻中文字幕| 啪啪无遮挡十八禁网站| 免费人成视频x8x8入口观看| 欧美zozozo另类| 亚洲一码二码三码区别大吗| 香蕉丝袜av| 日本a在线网址| 18禁美女被吸乳视频| 叶爱在线成人免费视频播放| 嫩草影院精品99| 黄色视频,在线免费观看| 99国产综合亚洲精品| 黄色视频,在线免费观看| 俄罗斯特黄特色一大片| 成在线人永久免费视频| 欧美日韩亚洲综合一区二区三区_| 黄色视频,在线免费观看| 免费看美女性在线毛片视频| 91成年电影在线观看| 91九色精品人成在线观看| 午夜免费成人在线视频| 精品久久久久久久毛片微露脸| 日韩有码中文字幕| 小说图片视频综合网站| 国产精品香港三级国产av潘金莲| videosex国产| 成人手机av| 国产激情久久老熟女| 天堂av国产一区二区熟女人妻 | 在线观看午夜福利视频| 91国产中文字幕| 久久香蕉激情| 成年免费大片在线观看| 婷婷丁香在线五月| 欧美国产日韩亚洲一区| 午夜久久久久精精品| 欧美一级a爱片免费观看看 | 国产又色又爽无遮挡免费看| 在线永久观看黄色视频| 亚洲av成人av| 久久人妻福利社区极品人妻图片| 两个人视频免费观看高清| 久久精品91无色码中文字幕| 久久国产精品人妻蜜桃| 12—13女人毛片做爰片一| 久久久国产精品麻豆| 亚洲一卡2卡3卡4卡5卡精品中文| 级片在线观看| 岛国在线观看网站| 国产三级在线视频| 天堂√8在线中文| 国产精品久久视频播放| 国产精品久久电影中文字幕| 亚洲精品一卡2卡三卡4卡5卡| 老汉色∧v一级毛片| 少妇人妻一区二区三区视频| 美女黄网站色视频| 美女大奶头视频| 久久久久久久久久黄片| 天天添夜夜摸| 国模一区二区三区四区视频 | 亚洲无线在线观看| 免费人成视频x8x8入口观看| 精品欧美国产一区二区三| 久久久久性生活片| 久久久久精品国产欧美久久久| 国产精品电影一区二区三区| 日韩国内少妇激情av| 日韩中文字幕欧美一区二区| 久久精品人妻少妇| 日韩 欧美 亚洲 中文字幕| 黄片小视频在线播放| 久久久国产精品麻豆| 亚洲黑人精品在线| 可以在线观看的亚洲视频| 特大巨黑吊av在线直播| 日韩大尺度精品在线看网址| 好看av亚洲va欧美ⅴa在| 国产精品亚洲一级av第二区| 国产精品影院久久| 1024香蕉在线观看| av在线天堂中文字幕| 国模一区二区三区四区视频 | 午夜亚洲福利在线播放| 一夜夜www| 一个人免费在线观看电影 | 一区二区三区高清视频在线| 欧美在线黄色| 国产真实乱freesex| 国内精品一区二区在线观看| 在线观看美女被高潮喷水网站 | 国产亚洲精品av在线| av国产免费在线观看| 亚洲精品美女久久av网站| 国产成人精品久久二区二区91| 一级作爱视频免费观看| 丰满人妻熟妇乱又伦精品不卡| 香蕉久久夜色| 老司机靠b影院| 一区福利在线观看| 午夜福利免费观看在线| 禁无遮挡网站| 色av中文字幕| 女人爽到高潮嗷嗷叫在线视频| 999久久久精品免费观看国产| 亚洲成av人片免费观看| 国产探花在线观看一区二区| 国产一区二区在线av高清观看| 亚洲精品一区av在线观看| 午夜福利免费观看在线| 好男人在线观看高清免费视频| 亚洲 欧美一区二区三区| 精品人妻1区二区| 国产精品亚洲一级av第二区| 色噜噜av男人的天堂激情| 日韩大码丰满熟妇| 窝窝影院91人妻| av在线播放免费不卡| 欧美色视频一区免费| 国产伦在线观看视频一区| av在线播放免费不卡| 成人高潮视频无遮挡免费网站| 亚洲欧美日韩无卡精品| 国产成人精品无人区| 最近最新中文字幕大全电影3| 一区二区三区激情视频| 黄色视频不卡| 国产精品亚洲av一区麻豆| 动漫黄色视频在线观看| 亚洲中文av在线| 免费看日本二区| 亚洲欧美精品综合一区二区三区| 亚洲熟妇中文字幕五十中出| 久久久精品国产亚洲av高清涩受| 在线观看www视频免费| 在线观看一区二区三区| 日韩大码丰满熟妇| 一区二区三区国产精品乱码| 男女午夜视频在线观看| 搡老妇女老女人老熟妇| 精品日产1卡2卡| 熟女电影av网| 亚洲性夜色夜夜综合| 高清在线国产一区| 欧美一区二区精品小视频在线| 51午夜福利影视在线观看| 精品一区二区三区av网在线观看| 少妇人妻一区二区三区视频| 欧美色视频一区免费| 国产精品免费视频内射| 精品久久久久久久毛片微露脸| 国产成人啪精品午夜网站| 国产99白浆流出| 亚洲性夜色夜夜综合| 国产精品 欧美亚洲| 999久久久精品免费观看国产| 叶爱在线成人免费视频播放| 亚洲人成网站高清观看| av国产免费在线观看| 午夜精品久久久久久毛片777| 国产精品99久久99久久久不卡| 久久中文字幕一级| 国产精品电影一区二区三区| 草草在线视频免费看| 欧美人与性动交α欧美精品济南到| 女人爽到高潮嗷嗷叫在线视频| 深夜精品福利| 老司机福利观看| 亚洲av成人不卡在线观看播放网| 午夜福利在线观看吧| 不卡av一区二区三区| 国产黄a三级三级三级人| 国产精品一区二区免费欧美| 久久九九热精品免费| 久久久久免费精品人妻一区二区| 日韩欧美一区二区三区在线观看| av片东京热男人的天堂| 妹子高潮喷水视频| a级毛片在线看网站| 久久精品亚洲精品国产色婷小说| 亚洲国产欧美人成| 亚洲 欧美一区二区三区| 99精品欧美一区二区三区四区| 色av中文字幕| 久久欧美精品欧美久久欧美| 成年人黄色毛片网站| av免费在线观看网站| 久久中文字幕一级| 亚洲国产中文字幕在线视频| 亚洲全国av大片| 久久久久国内视频| 欧美性长视频在线观看| 90打野战视频偷拍视频| 国产激情久久老熟女| 国产男靠女视频免费网站| 日本 欧美在线| 可以在线观看毛片的网站| 99热只有精品国产| 精品久久久久久成人av| 女人高潮潮喷娇喘18禁视频| 别揉我奶头~嗯~啊~动态视频| 精品少妇一区二区三区视频日本电影| 搡老妇女老女人老熟妇| 男男h啪啪无遮挡| 亚洲男人天堂网一区| 国产成人啪精品午夜网站| 国内揄拍国产精品人妻在线| 99久久综合精品五月天人人| 日韩精品青青久久久久久| 桃红色精品国产亚洲av| 手机成人av网站| 少妇裸体淫交视频免费看高清 | 婷婷亚洲欧美| 久久中文字幕人妻熟女| 看黄色毛片网站| 床上黄色一级片| 天堂影院成人在线观看| 97碰自拍视频| 在线观看免费日韩欧美大片| 亚洲欧美日韩东京热| 中文字幕熟女人妻在线| 国产av一区在线观看免费| 国产高清激情床上av| 又爽又黄无遮挡网站| 国产三级在线视频| 午夜激情福利司机影院| 伊人久久大香线蕉亚洲五| 欧美乱妇无乱码| www日本在线高清视频| 国产午夜精品久久久久久| 久久午夜综合久久蜜桃| 男女下面进入的视频免费午夜| 国产亚洲欧美98| 国产精品久久久久久亚洲av鲁大| 午夜精品久久久久久毛片777| 精品国产亚洲在线| 十八禁人妻一区二区| 国产黄片美女视频| 欧美日韩乱码在线| 欧美乱码精品一区二区三区| videosex国产| 免费观看精品视频网站| 亚洲,欧美精品.| 男女那种视频在线观看| 久久中文看片网| 久久午夜综合久久蜜桃| 一进一出好大好爽视频| 成人18禁在线播放| 男人舔女人下体高潮全视频| 亚洲第一欧美日韩一区二区三区| 91字幕亚洲| 久久久国产成人免费| 国产一级毛片七仙女欲春2| 中亚洲国语对白在线视频| 免费在线观看亚洲国产| 在线观看免费视频日本深夜| 欧美在线一区亚洲| 无限看片的www在线观看| 色综合站精品国产| 国产精品电影一区二区三区| 国产高清视频在线观看网站| 欧美大码av| 色综合亚洲欧美另类图片| 色av中文字幕| 一a级毛片在线观看| 欧美中文综合在线视频| av欧美777| 久久久久国产一级毛片高清牌| 女人高潮潮喷娇喘18禁视频| 欧美丝袜亚洲另类 | 一个人观看的视频www高清免费观看 | 国产成+人综合+亚洲专区| 中文字幕熟女人妻在线| 国产熟女xx| 18禁美女被吸乳视频| 岛国在线观看网站| 一级片免费观看大全| 国产精品98久久久久久宅男小说| 啪啪无遮挡十八禁网站|