• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于FPGA的多核可擴(kuò)展卷積加速器設(shè)計(jì)

    2021-06-28 11:39:14張坤寧孫慶斌
    關(guān)鍵詞:池化分塊加速器

    張坤寧,趙 爍,孫慶斌,鄧 寧,何 虎

    (清華大學(xué) 微電子學(xué)研究所,北京 100084)

    0 引 言

    近年來,以CNN(convolution neural networks)為代表的深度學(xué)習(xí)算法已經(jīng)成為人工智能領(lǐng)域重要的研究內(nèi)容,它在圖像識別與檢測定位、人臉識別與自動駕駛等領(lǐng)域發(fā)揮了重要作用[1]。但是隨著算法的精進(jìn)和應(yīng)用場景日益多元化,CNN網(wǎng)絡(luò)在識別準(zhǔn)確率提高的同時(shí),其結(jié)構(gòu)變得越來越復(fù)雜、深度也不斷加深[2]。尤其當(dāng)將其應(yīng)用在嵌入式設(shè)備時(shí),對計(jì)算資源和內(nèi)存資源帶來了很大的挑戰(zhàn)。因此研究CNN網(wǎng)絡(luò)的加速計(jì)算顯得尤為必要,并且對加快技術(shù)落地、拓寬應(yīng)用場景具有重要意義。

    Zhang等提出了roofline模型并在基于FPGA的卷積加速器設(shè)計(jì)中使用了數(shù)據(jù)復(fù)用、并行計(jì)算等技術(shù)[3]。Han等則提出“剪枝-定點(diǎn)壓縮-霍夫曼編碼”3種深度壓縮的技巧,極大地減少了CNN網(wǎng)絡(luò)參數(shù)所需的存儲資源,為CNN向嵌入式系統(tǒng)移植開辟了重要思路[4]。Rahman等提出了一種三維陣列結(jié)構(gòu),結(jié)合對片上緩存的優(yōu)化,將加速結(jié)構(gòu)中的乘加單元減少了22%[5]。Yao等還針對新型輕量化網(wǎng)絡(luò)的硬件加速工作進(jìn)行了研究[6]。

    本設(shè)計(jì)針對卷積計(jì)算中的循環(huán)計(jì)算順序進(jìn)行了優(yōu)化,并與片上緩存數(shù)據(jù)復(fù)用技術(shù)相結(jié)合,不僅提高了數(shù)據(jù)復(fù)用效率,還進(jìn)一步提高了加速器的通用性。設(shè)計(jì)了專門的計(jì)算單元來進(jìn)行卷積、激活、批標(biāo)準(zhǔn)化(BN)以及池化等操作,并對池化計(jì)算以及數(shù)據(jù)存取順序進(jìn)行了優(yōu)化。使用由加速器和通用處理器組成的SoC系統(tǒng),運(yùn)行VGG16網(wǎng)絡(luò)的推理運(yùn)算過程。此外還提出了一種將加速器進(jìn)行多核擴(kuò)展的方法,為其在不同F(xiàn)PGA平臺上的部署提供了一種思路。

    1 數(shù)據(jù)量化及分析

    在不影響推理準(zhǔn)確度的前提下,精簡輸入數(shù)據(jù)的位寬,能夠有效降低對片外存儲的帶寬需求[4]。因此在進(jìn)行加速器設(shè)計(jì)之前,首先使用自動化的CNN近似工具Caffe Ristretto完成了數(shù)據(jù)的量化工作。在這個(gè)過程中主要通過在參數(shù)位寬與識別精度之間進(jìn)行折衷,即在可接受的精度損失范圍內(nèi)用最短的位寬來表示網(wǎng)絡(luò)中數(shù)據(jù)。閾值越高,位寬越短;閾值越低,位寬越長。

    量化過程分為確定位寬和再訓(xùn)練兩個(gè)階段。在第一階段,輸入32 bits的單精度浮點(diǎn)數(shù),并規(guī)定識別精度的損失閾值,Ristretto工具經(jīng)過計(jì)算和迭代會給出當(dāng)前閾值下的最小位寬長度。然后可以自身具體需求來改變閾值,獲得最適合當(dāng)前設(shè)計(jì)情況下的數(shù)據(jù)位寬。在網(wǎng)絡(luò)再訓(xùn)練階段,需對網(wǎng)絡(luò)參數(shù)進(jìn)行微調(diào)。使用量化后的參數(shù)進(jìn)行前向計(jì)算,反向傳播過程先更新全精度參數(shù)然后再量化。通過若干次迭代,以盡可能將精度提升至量化前的水平。本設(shè)計(jì)將VGG16網(wǎng)絡(luò)的權(quán)值參數(shù)量化為8 bits,并保證了精度下降在1%以內(nèi)。

    為解決網(wǎng)絡(luò)不同層中數(shù)據(jù)范圍和絕對值相差較大的問題,采取了動態(tài)量化的策略[7,8],即對于網(wǎng)絡(luò)中不同的計(jì)算層,輸入的圖像數(shù)據(jù)、權(quán)重?cái)?shù)據(jù)以及計(jì)算結(jié)果的整數(shù)位數(shù)和小數(shù)位數(shù)各不相同,以確保8 bits的數(shù)據(jù)位寬能夠涵蓋相應(yīng)計(jì)算層所有數(shù)據(jù)的范圍。表1列出了經(jīng)過量化工具處理后加速器每個(gè)計(jì)算層中權(quán)重、輸入特征映射和卷積計(jì)算結(jié)果的小數(shù)位數(shù)。

    表1 3種數(shù)據(jù)的小數(shù)位數(shù)

    2 加速器架構(gòu)設(shè)計(jì)

    對于FPGA平臺中實(shí)現(xiàn)的卷積加速設(shè)計(jì),主要圍繞以下思路來展開:基于CNN網(wǎng)絡(luò)中輸入特征映射和卷積核多通道的特性,設(shè)計(jì)乘加陣列進(jìn)行并行計(jì)算[9];基于有限的片上存儲資源,對輸入和權(quán)重?cái)?shù)據(jù)進(jìn)行分塊,并通過設(shè)置片上緩存來暫時(shí)存儲分塊數(shù)據(jù)以減少加速器與片外存儲之間的數(shù)據(jù)訪存次數(shù)[10,11];通過設(shè)計(jì)特定的循環(huán)展開計(jì)算順序,實(shí)現(xiàn)片上緩存數(shù)據(jù)的復(fù)用以及高效的并行計(jì)算效率[12,13]。

    加速器主要由計(jì)算單元、片上緩存以及控制器組成。計(jì)算單元主要由乘加模塊、累加模塊、BN計(jì)算模塊、定點(diǎn)處理模塊、激活模塊以及池化模塊組成,是完成加速計(jì)算的關(guān)鍵部分。片上緩存調(diào)用FPGA的BRAM資源,將來自片外的輸入特征映射、權(quán)重?cái)?shù)據(jù)以及卷積計(jì)算結(jié)果暫存。而控制器主要產(chǎn)生一些控制卷積計(jì)算過程的信號,保證計(jì)算準(zhǔn)確有序進(jìn)行。

    2.1 計(jì)算單元

    加速器計(jì)算單元的結(jié)構(gòu)如圖1所示。根據(jù)分塊策略中卷積核在輸入和輸出通道上的分塊尺寸均為16,共包含256個(gè)乘法器和加法器的乘加模塊與累加模塊組成了乘加陣列(MAC),它們分成16組,用來完成16個(gè)輸出通道和16個(gè)輸入通道的并行卷積計(jì)算。對于一組乘加陣列,16個(gè)輸入通道上同一位置的輸入數(shù)據(jù)分別與同一輸出通道中16個(gè)輸入通道的卷積核元素相乘;不同組的乘加陣列之間輸入數(shù)據(jù)相同,卷積核元素則來自16個(gè)不同的輸出通道。由此在一個(gè)時(shí)鐘周期內(nèi)并行完成256次乘法運(yùn)算。一組乘加陣列內(nèi)15個(gè)加法器組成了加法樹,將16個(gè)輸入通道的卷積中間結(jié)果累加起來。

    圖1 加速器計(jì)算單元的結(jié)構(gòu)

    累加模塊主要用于以下兩種情況:一是將卷積核元素與輸入分塊數(shù)據(jù)做點(diǎn)乘運(yùn)算后的結(jié)果累加起來;另外由于乘加模塊每次只能完成16個(gè)輸入通道的卷積計(jì)算,而多數(shù)CNN網(wǎng)絡(luò)層的通道數(shù)均大于16,累加模塊還負(fù)責(zé)將多個(gè)16通道的計(jì)算結(jié)果累加到一起,得到最終的輸出特征映射。

    BN計(jì)算是為了解決CNN網(wǎng)絡(luò)訓(xùn)練過程中因梯度消失而難以收斂的問題而提出的,它通過將卷積計(jì)算的結(jié)果變成標(biāo)準(zhǔn)正態(tài)分布,并進(jìn)行一定的伸縮平移變換,最終在進(jìn)行激活操作之前令其處于激活函數(shù)梯度較大的區(qū)間內(nèi)。其公式為

    (1)

    在推理計(jì)算中,上述公式中mean、var、γ和β這4個(gè)參數(shù)都是訓(xùn)練好的確定值,因此可以將BN的計(jì)算公式轉(zhuǎn)換成如下一次函數(shù)的形式

    y=k*x+b

    (2)

    乘加陣列中的所有輸入數(shù)據(jù)均為定點(diǎn)8 bits,但經(jīng)過驗(yàn)證得知乘累加過程產(chǎn)生的計(jì)算結(jié)果至少為24 bits才能避免溢出。因此在完成各種乘加計(jì)算之后,定點(diǎn)處理模塊接收來自控制器的關(guān)于計(jì)算結(jié)果的小數(shù)位數(shù)信息,并將24 bits的乘累加結(jié)果截成8 bits。

    激活模塊支持ReLU和Leaky ReLU兩種函數(shù)。池化模塊支持最大池化和平均池化兩種類型的計(jì)算,并且通過設(shè)計(jì)并復(fù)用基本的池化計(jì)算單元能夠支持任意尺寸的池化計(jì)算。

    2.2 片上緩存

    片上緩存的容量不僅取決于所用FPGA開發(fā)板的BRAM資源,還取決于所用分塊策略和運(yùn)行的網(wǎng)絡(luò)結(jié)構(gòu)。根據(jù)以上提到的分塊策略,最終將各個(gè)片上緩存的容量大小確定為如表2所示。其中輸入、權(quán)重、輸出和中間結(jié)果緩存均工作在ping-pong模式下,令數(shù)據(jù)傳輸?shù)臅r(shí)間得以充分利用。

    表2 各個(gè)片上緩存的容量大小

    2.3 控制器

    控制器分為卷積計(jì)算控制器和池化計(jì)算控制器。它們均與AXI總線相連。卷積計(jì)算控制器一方面接收總線傳來的關(guān)于網(wǎng)絡(luò)每一層輸入特征映射以及卷積核各個(gè)維度上的分塊尺寸信息,另一方面在計(jì)算過程中產(chǎn)生判斷每一次分塊計(jì)算開始及完成的信號、數(shù)據(jù)傳遞的使能信號以及片上緩存讀寫數(shù)據(jù)的使能信號、地址以及ping-pong選擇信號等。池化計(jì)算控制器則從總線接收關(guān)于池化計(jì)算使能及池化類型的信號,并給出按照池化計(jì)算順序從緩存中讀取數(shù)據(jù)以及對計(jì)算結(jié)果進(jìn)行拼接的控制邏輯。關(guān)于控制邏輯的細(xì)節(jié)將在下文中介紹。

    3 加速器優(yōu)化設(shè)計(jì)

    針對加速器的優(yōu)化設(shè)計(jì)工作主要分為以下3個(gè)方面:優(yōu)化卷積循環(huán)計(jì)算順序、優(yōu)化池化計(jì)算順序和加速器的多核擴(kuò)展設(shè)計(jì)。

    3.1 卷積循環(huán)計(jì)算順序的優(yōu)化設(shè)計(jì)

    在一些前人的相關(guān)研究中,對于卷積計(jì)算單元的設(shè)計(jì)采用復(fù)用輸入數(shù)據(jù)的方法,也就是重復(fù)搬運(yùn)多次卷積核參數(shù)。這種方法的弊端在于計(jì)算單元的控制邏輯會受到卷積核尺寸的影響,尤其是在運(yùn)行具有多種不同尺寸的卷積核的網(wǎng)絡(luò)時(shí),不僅缺乏靈活性,控制邏輯的復(fù)雜性也會大大增加。

    而本設(shè)計(jì)在循環(huán)計(jì)算順序方面的優(yōu)化體現(xiàn)在將卷積核與輸入特征映射的點(diǎn)乘運(yùn)算進(jìn)行分解,即固定卷積核的一個(gè)元素,令其完成整個(gè)分塊圖像中所有需要它來參與的乘法運(yùn)算之后再移動到下一個(gè)卷積核元素。這樣依此類推,直到全部卷積核元素將它們各自負(fù)責(zé)的分塊圖像區(qū)域全部掃描一遍后,完成相應(yīng)的卷積運(yùn)算。如圖2所示,在本設(shè)計(jì)中,填充尺寸和卷積計(jì)算步長均為1,以卷積核和輸入分塊圖像的尺寸分別為3*3和9*9為例,每個(gè)卷積核元素要與7*7個(gè)數(shù)相乘。這樣經(jīng)過9*49個(gè)時(shí)鐘周期之后,將這9次相乘的結(jié)果相加,便得到了尺寸為7*7的一次中間計(jì)算結(jié)果。再按照通道數(shù)進(jìn)行累加,便可得到最終結(jié)果。

    圖2 改進(jìn)后的卷積循環(huán)計(jì)算次序

    在上述循環(huán)計(jì)算順序中,復(fù)用的數(shù)據(jù)為卷積核元素。這種令卷積核元素掃描輸入圖像數(shù)據(jù)的好處是既保證了數(shù)據(jù)復(fù)用,又避免卷積計(jì)算受到卷積核尺寸的限制。這種方法可以用于任意尺寸的分塊圖像與任意尺寸的卷積核的計(jì)算,具有非常好的通用性。本設(shè)計(jì)支持從1*1到11*11等各種尺寸的卷積核,只需將尺寸信息傳給控制器,無需設(shè)計(jì)新的控制邏輯便可完成計(jì)算,十分靈活方便。經(jīng)過優(yōu)化后完整的卷積循環(huán)計(jì)算次序如圖3所示。

    圖3 完整的卷積循環(huán)計(jì)算次序

    3.2 池化計(jì)算順序的優(yōu)化設(shè)計(jì)

    對于池化計(jì)算,為解決池化的輸入數(shù)據(jù)在卷積計(jì)算次序中非連續(xù)排列而造成卷積運(yùn)算之后無法直接開始池化計(jì)算的問題,設(shè)置了池化片上緩存。將一次分塊卷積計(jì)算的結(jié)果暫存之后,再按照池化計(jì)算的順序,從緩存中取出相應(yīng)位置的數(shù)據(jù)。

    另外以最常見的2*2池化尺寸為例,經(jīng)過池化計(jì)算后分塊圖像的尺寸變?yōu)樵瓉淼乃姆种?,為了便于網(wǎng)絡(luò)下一層的計(jì)算,使用了一種拼接策略,將4塊池化后的分塊圖像拼接成一塊與池化前尺寸相同的圖像再存入輸出緩存。當(dāng)輸入圖像的分塊尺寸為10*10時(shí),第一塊數(shù)據(jù)完成池化計(jì)算后的25個(gè)結(jié)果分別存入輸出緩存中序號為0~4,10~14,20~24,30~34,40~44的這些地址;第二塊結(jié)果存入的地址為5~9,15~19,25~29,35~39,45~49;第三塊和第四塊計(jì)算結(jié)果分別存入的地址是50~54,60~64,70~74,80~84,90~94和55~59,65~69,75~79,85~89,95~99。這樣的數(shù)據(jù)拼接結(jié)果通過池化控制器中的相應(yīng)邏輯來實(shí)現(xiàn)。而對于7*7的分塊尺寸,其總體思路與10*10的情況是類似的。但考慮到7不能被2整除,因此這種情況下還需一個(gè)額外操作,即在將數(shù)據(jù)送入加速器之前的數(shù)據(jù)重組步驟中,將分塊數(shù)據(jù)的存儲順序變?yōu)榕c池化計(jì)算類似、跨越兩行兩列的14*14。

    使用這種拼接策略能夠保證網(wǎng)絡(luò)的每一層輸入分塊圖像的尺寸都是一致的,避免了某幾層網(wǎng)絡(luò)做完池化后還要對輸入分塊數(shù)據(jù)進(jìn)行尺寸上的調(diào)整。

    3.3 加速器的多核擴(kuò)展設(shè)計(jì)

    在上述設(shè)計(jì)中,加速器的計(jì)算單元部署了256個(gè)乘法器,將計(jì)算陣列做的規(guī)模較小的原因則是為了使其適應(yīng)在不同F(xiàn)PGA平臺上的應(yīng)用。如果是在資源較少的FPGA開發(fā)板上運(yùn)行加速器,那么部署256個(gè)乘加陣列即可;如果FPGA的資源比較充裕,那么可以以包含256個(gè)乘法器的加速器為整體,進(jìn)行多個(gè)加速器核的擴(kuò)展。

    考慮到Xilinx ZCU102開發(fā)板的資源情況,主要探索了以下兩種情況下的擴(kuò)展設(shè)計(jì)。第一種情況是將輸入緩存的尺寸擴(kuò)大為原來的4倍,權(quán)重緩存的容量不變,同時(shí)部署4個(gè)加速器核。這樣便能夠?qū)崿F(xiàn)單核情況下4倍的算力。

    第二種情況則是在第一種情況的基礎(chǔ)上,將權(quán)重緩存的容量擴(kuò)大為原來的兩倍,同時(shí)加速器核的數(shù)量增加到8個(gè),此時(shí)算力和并行計(jì)算度相較于第一種情況又提高了一倍。圖4和圖5分別展示了四核和八核加速器的擴(kuò)展設(shè)計(jì)。

    圖4 四核加速器的架構(gòu)

    圖5 八核加速器的架構(gòu)

    這種擴(kuò)展設(shè)計(jì)具有十分突出的優(yōu)勢,不僅成倍提升了加速器的算力,并且這些核僅需由一個(gè)控制器進(jìn)行控制,在進(jìn)行卷積計(jì)算時(shí)它們內(nèi)部的數(shù)據(jù)流是完全一致的。而設(shè)想如果將1024(256*4)或2048(256*8)個(gè)乘法器部署在一個(gè)加速器核中,雖然其算力與以上所述的多核加速器是相同的,但是若遇到開發(fā)板資源受限而需減少計(jì)算資源的情況下,必須大幅度修改計(jì)算單元內(nèi)各個(gè)計(jì)算模塊的控制邏輯。也就是說這樣的設(shè)計(jì)會因具體的開發(fā)板資源情況而具有一定的專用性。而在當(dāng)前擴(kuò)展方式下,如果需要在不同F(xiàn)PGA上運(yùn)行加速器,可以根據(jù)當(dāng)前開發(fā)板的實(shí)際情況靈活選擇加速器核的數(shù)目以及相應(yīng)的片上緩存容量,從而大大增加了部署加速器的便捷性。

    4 SoC系統(tǒng)設(shè)計(jì)

    將加速器與AXI總線、時(shí)鐘模塊、BRAM控制器、DMA模塊、FPGA開發(fā)板上的ARM處理器以及DDR存儲器等組成可運(yùn)行完整CNN網(wǎng)絡(luò)的SoC系統(tǒng)。如圖6所示,DDR內(nèi)存、DMA控制器、ARM處理器以及加速器的控制器均與AXI總線相連,其中DMA控制DDR通過總線向片上緩存?zhèn)魉蛿?shù)據(jù),這種方式大大提高了數(shù)據(jù)傳輸?shù)男?。ARM處理器用來完成數(shù)據(jù)重組、填充(padding)、分類(softmax)以及計(jì)算準(zhǔn)確率等運(yùn)算,這種軟硬件協(xié)同設(shè)計(jì)的方式既保證了較高的運(yùn)算效率,又具有較強(qiáng)的靈活性和通用性。

    圖6 包含卷積加速器的SoC系統(tǒng)

    5 實(shí)驗(yàn)結(jié)果與分析

    將加速器部署在FPGA開發(fā)板上的流程主要分為以下3個(gè)步驟:

    (1)設(shè)計(jì)加速器各個(gè)計(jì)算模塊的功能以及控制器的邏輯,在Vivado中例化BRAM資源作為片上緩存,驗(yàn)證數(shù)據(jù)讀寫和計(jì)算是否正確。

    (2)將加速器封裝成IP,并與DDR內(nèi)存、ARM處理器、總線等構(gòu)成SoC系統(tǒng)。運(yùn)行完整的VGG16網(wǎng)絡(luò),測試加速器的性能。

    (3)按照上述擴(kuò)展思路,將加速器核的數(shù)量擴(kuò)展為4個(gè)和8個(gè),再次運(yùn)行VGG16網(wǎng)絡(luò)。

    推理計(jì)算所用數(shù)據(jù)集選用了來自ImageNet ILSVRC2012的100張圖片,每張圖片尺寸為224*224*3。將經(jīng)過定點(diǎn)處理后的圖片數(shù)據(jù)和訓(xùn)練好的權(quán)重參數(shù)存入FPGA的SD卡,然后再通過軟件從SD卡讀入DDR中。VGG16網(wǎng)絡(luò)的參數(shù)量為132 MB,每完成一張圖片的推理計(jì)算,要進(jìn)行15.84 G次乘加運(yùn)算。

    5.1 單核加速器性能分析

    運(yùn)行結(jié)果表明在300 MHz的工作頻率下,單核加速器運(yùn)行VGG16網(wǎng)絡(luò)推理一張圖片各部分所用時(shí)間為387 ms,峰值算力達(dá)到了153.5 GOP/s。通過逐層、逐模塊測試,發(fā)現(xiàn)加速器核中的各種計(jì)算以及數(shù)據(jù)在DDR和片上緩存之間傳輸占據(jù)了絕大部分的運(yùn)行時(shí)間;另外由ARM處理器負(fù)責(zé)的數(shù)據(jù)重組等計(jì)算也需要一定時(shí)間。

    表3展示了單核加速器性能與一些前人研究成果的對比。文獻(xiàn)[14]所用FPGA平臺為Xilinx Zynq-7000系列的XC7Z020,文獻(xiàn)[15]和文獻(xiàn)[7]則選用的是同一系列的XC7Z045。這兩種與本設(shè)計(jì)使用的Zynq UltraScale+MPSoC系列的XCZU9EG都是Xilinx公司開發(fā)的SoC可擴(kuò)展處理平臺,但也具有一些不同之處。Zynq-7000的XC7Z020和XC7Z045兩款SoC中的ARM處理器屬于Cortex A9系列,含有的DSP總數(shù)分別為220個(gè)和900個(gè)。而本設(shè)計(jì)中的XCZU9EG所用ARM處理器屬于Cortex A53系列,DSP總數(shù)為2520個(gè)。雖然ARM處理器的型號不同,但如前文所述,處理器計(jì)算所用時(shí)間占總運(yùn)行時(shí)間的比例較小。以及雖然DSP的總數(shù)不同,但加速器的算力并不強(qiáng)烈依賴DSP的數(shù)量。因此表3所列的數(shù)據(jù)具有良好的可比性。

    表3 本文加速器性能與前人研究成果對比

    從表中數(shù)據(jù)可以發(fā)現(xiàn),在相同量化方式下,本文中加速器實(shí)現(xiàn)了相較于文獻(xiàn)[14]和文獻(xiàn)[15]1.8倍和2.4倍的算力。在所用DSP數(shù)量與文獻(xiàn)[15]基本持平的情況下,取得了2.6倍的DSP效率;雖比文獻(xiàn)[14]用了更多的DSP,其DSP效率卻是它的1.27倍。另外在能耗方面,本文加速器的能耗比為29.0 GOP/s/W,達(dá)到了文獻(xiàn)[14]的1.2倍,文獻(xiàn)[7]的2倍。因此從工作頻率、峰值算力、DSP效率和能耗幾個(gè)方面綜合來看,本文加速器的性能要優(yōu)于前人取得的成果,在卷積加速計(jì)算方面取得了一定的進(jìn)步。

    5.2 單核與多核加速器的性能對比與分析

    表4展示了單核、四核和八核加速器的性能對比。從表中可以看出,兩種多核加速器與單核相比,算力分別提升了4倍和6.7倍。八核加速器由于工作頻率稍有下降而對算力提升產(chǎn)生了一定影響。單張圖片的推理計(jì)算時(shí)間也分別下降至260 ms和203 ms。

    表4 單核與多核加速器的性能對比

    根據(jù)以上結(jié)果可以看出,多核加速器單張圖片的推理時(shí)間沒有隨算力提升而等比例下降,原因主要在于CNN網(wǎng)絡(luò)中還有一定數(shù)量的計(jì)算由處理器來完成(這部分時(shí)間大約占總時(shí)間的四分之一),這些時(shí)間并不會隨著硬件算力增加而減少。而八核加速器的單張圖片推理時(shí)間與四核相比也沒有等比例下降,除了上述原因之外,還在于隨著硬件加速部分所花時(shí)間的減少,軟件計(jì)算時(shí)間所占的比例會逐漸增加。此外還由于在ping-pong模式下,一次分塊卷積計(jì)算的時(shí)間小于權(quán)重?cái)?shù)據(jù)的傳輸時(shí)間,而八核每次傳輸?shù)臋?quán)重?cái)?shù)據(jù)量是四核的2倍,傳數(shù)所用的時(shí)間會更長。由于算力提升減少的計(jì)算時(shí)間會被數(shù)據(jù)傳輸時(shí)間覆蓋。

    6 結(jié)束語

    本文針對目前CNN網(wǎng)絡(luò)日益復(fù)雜化帶來的計(jì)算效率較低的問題,提出了一種基于FPGA的定點(diǎn)8 bits加速器結(jié)構(gòu),通過采用有效的分塊策略并結(jié)合優(yōu)化的循環(huán)計(jì)算順序,有效地提高了CNN中卷積計(jì)算的效率。另外還提出了一種對加速器核進(jìn)行整體擴(kuò)展的策略,不僅提升了算力,還為卷積加速設(shè)計(jì)的可擴(kuò)展性應(yīng)用提供了方法。

    由于處理器中的計(jì)算在加速器運(yùn)行總時(shí)間中占有一定比例,下一步可繼續(xù)優(yōu)化軟件程序,如在加速器中實(shí)現(xiàn)數(shù)據(jù)填充操作等,降低處理器的計(jì)算時(shí)間;針對數(shù)據(jù)傳輸時(shí)間與計(jì)算時(shí)間未能完美匹配的問題,還需優(yōu)化數(shù)據(jù)傳輸機(jī)制,這對于進(jìn)一步提升加速器性能具有重要意義。

    猜你喜歡
    池化分塊加速器
    基于緊湊型雙線性網(wǎng)絡(luò)的野生茵識別方法研究
    無線電工程(2024年8期)2024-09-16 00:00:00
    輪滑加速器
    化學(xué)工業(yè)的“加速器”
    基于Sobel算子的池化算法設(shè)計(jì)
    卷積神經(jīng)網(wǎng)絡(luò)中的自適應(yīng)加權(quán)池化
    全民小康路上的“加速器”
    分塊矩陣在線性代數(shù)中的應(yīng)用
    基于卷積神經(jīng)網(wǎng)絡(luò)和池化算法的表情識別研究
    反三角分塊矩陣Drazin逆新的表示
    等待“加速器”
    桃红色精品国产亚洲av| 精品不卡国产一区二区三区| 成人亚洲精品av一区二区| 亚洲成人久久爱视频| 成年女人永久免费观看视频| 久久国产乱子伦精品免费另类| 成人国产综合亚洲| www.熟女人妻精品国产| 欧美色欧美亚洲另类二区| 中国美女看黄片| 天天添夜夜摸| 亚洲av成人av| 亚洲欧美日韩无卡精品| 三级男女做爰猛烈吃奶摸视频| 日日夜夜操网爽| 法律面前人人平等表现在哪些方面| 性色avwww在线观看| 琪琪午夜伦伦电影理论片6080| 久久国产乱子伦精品免费另类| 亚洲专区国产一区二区| 亚洲成av人片在线播放无| 精品一区二区三区av网在线观看| 成人鲁丝片一二三区免费| 一级作爱视频免费观看| 一个人观看的视频www高清免费观看 | av视频在线观看入口| 色综合亚洲欧美另类图片| 全区人妻精品视频| 亚洲午夜理论影院| 丰满人妻熟妇乱又伦精品不卡| 香蕉国产在线看| 久久精品91无色码中文字幕| 男女之事视频高清在线观看| 亚洲av成人av| 九九久久精品国产亚洲av麻豆 | 婷婷精品国产亚洲av| 丰满人妻熟妇乱又伦精品不卡| 婷婷丁香在线五月| 在线免费观看不下载黄p国产 | 男女午夜视频在线观看| 国产精品乱码一区二三区的特点| 伦理电影免费视频| 首页视频小说图片口味搜索| 一本一本综合久久| 色精品久久人妻99蜜桃| 我要搜黄色片| 岛国视频午夜一区免费看| 无遮挡黄片免费观看| 亚洲人成网站在线播放欧美日韩| 亚洲午夜精品一区,二区,三区| 精品久久久久久久人妻蜜臀av| 国产精品永久免费网站| 操出白浆在线播放| 一本久久中文字幕| 午夜亚洲福利在线播放| 黑人欧美特级aaaaaa片| 国产成人aa在线观看| 成人av在线播放网站| 欧美乱妇无乱码| 国产淫片久久久久久久久 | 女人被狂操c到高潮| 老司机午夜十八禁免费视频| 麻豆av在线久日| 亚洲欧美一区二区三区黑人| or卡值多少钱| 国产三级黄色录像| 男女床上黄色一级片免费看| 国产精品免费一区二区三区在线| 他把我摸到了高潮在线观看| 国产欧美日韩一区二区三| 一a级毛片在线观看| 搡老岳熟女国产| 悠悠久久av| 亚洲国产高清在线一区二区三| 成人国产综合亚洲| 国内精品一区二区在线观看| 中文字幕av在线有码专区| 中文字幕高清在线视频| 久久人妻av系列| 久久伊人香网站| 99久久精品国产亚洲精品| 亚洲欧美激情综合另类| 级片在线观看| 欧美乱妇无乱码| 高清毛片免费观看视频网站| 亚洲av电影在线进入| 精品久久久久久久毛片微露脸| 九九热线精品视视频播放| 久久中文看片网| 久久中文看片网| 免费电影在线观看免费观看| 97人妻精品一区二区三区麻豆| 日本免费一区二区三区高清不卡| 亚洲va日本ⅴa欧美va伊人久久| 日韩欧美在线乱码| 日韩欧美在线乱码| 精品久久久久久久人妻蜜臀av| 色av中文字幕| 国产成人啪精品午夜网站| 99久久成人亚洲精品观看| 熟女少妇亚洲综合色aaa.| 国产精品亚洲av一区麻豆| 校园春色视频在线观看| 人妻久久中文字幕网| 又爽又黄无遮挡网站| 亚洲一区高清亚洲精品| 熟女人妻精品中文字幕| 在线观看免费午夜福利视频| 亚洲精品久久国产高清桃花| 男女视频在线观看网站免费| 黄频高清免费视频| 国产不卡一卡二| 日本与韩国留学比较| 国产三级在线视频| 好男人电影高清在线观看| 成年女人看的毛片在线观看| 亚洲欧美日韩东京热| 久久久久久久久免费视频了| 久久久精品大字幕| 丰满人妻熟妇乱又伦精品不卡| 法律面前人人平等表现在哪些方面| 国产成人啪精品午夜网站| 精品久久久久久久久久久久久| 欧美成人免费av一区二区三区| 少妇的丰满在线观看| 亚洲欧美精品综合久久99| 非洲黑人性xxxx精品又粗又长| 给我免费播放毛片高清在线观看| 给我免费播放毛片高清在线观看| 99精品久久久久人妻精品| 毛片女人毛片| 男插女下体视频免费在线播放| 午夜福利视频1000在线观看| 国产精品 国内视频| 18美女黄网站色大片免费观看| 欧美乱妇无乱码| 香蕉国产在线看| 在线观看免费午夜福利视频| 亚洲成a人片在线一区二区| 色av中文字幕| 伦理电影免费视频| 国产精品美女特级片免费视频播放器 | 国产一区在线观看成人免费| 午夜免费激情av| 最近在线观看免费完整版| 伦理电影免费视频| 国产美女午夜福利| 久久这里只有精品19| 国产淫片久久久久久久久 | 99久久成人亚洲精品观看| 国产精品电影一区二区三区| 日日摸夜夜添夜夜添小说| 亚洲专区字幕在线| 国产精品一区二区三区四区免费观看 | 黑人欧美特级aaaaaa片| 人妻久久中文字幕网| 国产69精品久久久久777片 | 亚洲电影在线观看av| 免费在线观看影片大全网站| 一个人看视频在线观看www免费 | 亚洲在线自拍视频| 一级毛片高清免费大全| 天天一区二区日本电影三级| 韩国av一区二区三区四区| 久久久久久久久中文| www日本在线高清视频| 日韩精品中文字幕看吧| 久久香蕉精品热| 12—13女人毛片做爰片一| 亚洲中文字幕日韩| 国产亚洲精品久久久久久毛片| 欧美日韩综合久久久久久 | 在线观看日韩欧美| 午夜精品久久久久久毛片777| 一级作爱视频免费观看| 老司机午夜十八禁免费视频| 久久久久精品国产欧美久久久| 日韩大尺度精品在线看网址| 小蜜桃在线观看免费完整版高清| 激情在线观看视频在线高清| 亚洲熟女毛片儿| 999精品在线视频| 18禁黄网站禁片免费观看直播| 国产精品,欧美在线| 99精品欧美一区二区三区四区| 哪里可以看免费的av片| 成年女人永久免费观看视频| 午夜亚洲福利在线播放| 国产成人影院久久av| aaaaa片日本免费| 成人鲁丝片一二三区免费| 性欧美人与动物交配| 性欧美人与动物交配| 99热精品在线国产| 久久久久免费精品人妻一区二区| 国产伦在线观看视频一区| 亚洲熟女毛片儿| 国产野战对白在线观看| 搡老岳熟女国产| 亚洲美女视频黄频| 精品国产美女av久久久久小说| 99热只有精品国产| 亚洲熟妇中文字幕五十中出| 久久久水蜜桃国产精品网| 亚洲性夜色夜夜综合| 国产精品 国内视频| 麻豆av在线久日| 亚洲国产色片| 精品熟女少妇八av免费久了| 老司机午夜十八禁免费视频| 亚洲男人的天堂狠狠| 高清在线国产一区| 淫妇啪啪啪对白视频| 一级毛片高清免费大全| 老熟妇乱子伦视频在线观看| av福利片在线观看| 麻豆久久精品国产亚洲av| 日韩免费av在线播放| 色在线成人网| 男女床上黄色一级片免费看| 一夜夜www| www.www免费av| 午夜激情欧美在线| 中文字幕最新亚洲高清| 亚洲成av人片在线播放无| 又紧又爽又黄一区二区| 日韩人妻高清精品专区| 丰满的人妻完整版| 国产黄a三级三级三级人| 搡老妇女老女人老熟妇| 高清毛片免费观看视频网站| 在线免费观看不下载黄p国产 | xxxwww97欧美| 首页视频小说图片口味搜索| 久久热在线av| 久久久久免费精品人妻一区二区| 欧美三级亚洲精品| 999久久久国产精品视频| 18禁黄网站禁片免费观看直播| 婷婷亚洲欧美| 欧美日韩综合久久久久久 | 精品一区二区三区视频在线 | 亚洲精品中文字幕一二三四区| 国产成人精品久久二区二区91| 亚洲精华国产精华精| 国内精品久久久久久久电影| 国产激情久久老熟女| 高潮久久久久久久久久久不卡| 免费观看精品视频网站| 成年版毛片免费区| 亚洲中文字幕一区二区三区有码在线看 | 老汉色∧v一级毛片| 女人高潮潮喷娇喘18禁视频| 欧美午夜高清在线| 国产精品爽爽va在线观看网站| 亚洲av熟女| 在线观看日韩欧美| 色尼玛亚洲综合影院| 亚洲av成人一区二区三| 日韩中文字幕欧美一区二区| 97人妻精品一区二区三区麻豆| 国产伦精品一区二区三区视频9 | 精品国内亚洲2022精品成人| 黑人操中国人逼视频| av福利片在线观看| 男人舔女人的私密视频| 99久久精品热视频| 欧美性猛交黑人性爽| 听说在线观看完整版免费高清| 国产真实乱freesex| 亚洲第一电影网av| 熟妇人妻久久中文字幕3abv| 99久久久亚洲精品蜜臀av| 久久久久亚洲av毛片大全| 搡老岳熟女国产| 嫩草影院精品99| 熟女人妻精品中文字幕| 最近最新中文字幕大全电影3| 两性午夜刺激爽爽歪歪视频在线观看| ponron亚洲| 国产黄a三级三级三级人| 1024手机看黄色片| av黄色大香蕉| 亚洲精品一卡2卡三卡4卡5卡| 国产伦精品一区二区三区视频9 | 免费在线观看影片大全网站| 久久精品国产清高在天天线| 欧美激情在线99| xxxwww97欧美| 国产亚洲精品综合一区在线观看| 亚洲中文字幕日韩| 丰满的人妻完整版| 91av网站免费观看| 国产视频内射| 午夜久久久久精精品| 国产精品99久久久久久久久| 国产精品久久久久久亚洲av鲁大| 麻豆国产97在线/欧美| 亚洲色图 男人天堂 中文字幕| 午夜精品一区二区三区免费看| 国产乱人伦免费视频| 美女大奶头视频| 两个人视频免费观看高清| 欧美色欧美亚洲另类二区| 亚洲欧美日韩高清在线视频| 国产伦一二天堂av在线观看| 人妻丰满熟妇av一区二区三区| 黑人操中国人逼视频| 日韩欧美国产在线观看| 国产在线精品亚洲第一网站| 久久精品亚洲精品国产色婷小说| 动漫黄色视频在线观看| 国产三级在线视频| 久久中文看片网| 亚洲av第一区精品v没综合| 国产美女午夜福利| 国产美女午夜福利| 无人区码免费观看不卡| 国产单亲对白刺激| 亚洲人成伊人成综合网2020| 一区二区三区国产精品乱码| 又黄又爽又免费观看的视频| 亚洲 国产 在线| 露出奶头的视频| 高清毛片免费观看视频网站| 小说图片视频综合网站| 熟妇人妻久久中文字幕3abv| 亚洲中文字幕一区二区三区有码在线看 | 在线观看日韩欧美| 成人18禁在线播放| 在线观看免费视频日本深夜| 日韩欧美精品v在线| 欧美一区二区国产精品久久精品| bbb黄色大片| 欧美大码av| 老司机深夜福利视频在线观看| 老熟妇仑乱视频hdxx| 国产精品av视频在线免费观看| 中文字幕熟女人妻在线| 久久精品91无色码中文字幕| av片东京热男人的天堂| 精品久久久久久久久久免费视频| 精品日产1卡2卡| 在线观看舔阴道视频| 欧美三级亚洲精品| 日韩欧美三级三区| 亚洲精品中文字幕一二三四区| 两人在一起打扑克的视频| 亚洲自偷自拍图片 自拍| 夜夜看夜夜爽夜夜摸| 最新中文字幕久久久久 | 亚洲欧美精品综合一区二区三区| 精品国产亚洲在线| 国产三级黄色录像| 日韩高清综合在线| 色综合欧美亚洲国产小说| 午夜日韩欧美国产| 国内精品美女久久久久久| 村上凉子中文字幕在线| 变态另类丝袜制服| 国产精华一区二区三区| 天堂影院成人在线观看| 国产免费男女视频| 日韩中文字幕欧美一区二区| 国产精品久久久av美女十八| 亚洲精品国产精品久久久不卡| 国产伦人伦偷精品视频| 国产单亲对白刺激| 亚洲中文日韩欧美视频| 全区人妻精品视频| 2021天堂中文幕一二区在线观| 亚洲美女视频黄频| 香蕉丝袜av| 男插女下体视频免费在线播放| 法律面前人人平等表现在哪些方面| 美女被艹到高潮喷水动态| www日本在线高清视频| 香蕉av资源在线| 国产精品九九99| 岛国在线免费视频观看| 黄色片一级片一级黄色片| www.精华液| 一区二区三区国产精品乱码| av福利片在线观看| 亚洲专区中文字幕在线| 日韩欧美一区二区三区在线观看| 99国产综合亚洲精品| 老司机午夜福利在线观看视频| 99国产精品99久久久久| 日韩免费av在线播放| 国产主播在线观看一区二区| 成人无遮挡网站| 欧美日韩亚洲国产一区二区在线观看| 国产伦一二天堂av在线观看| 1000部很黄的大片| 免费av毛片视频| 国产欧美日韩一区二区精品| 精品一区二区三区av网在线观看| 特级一级黄色大片| 999久久久国产精品视频| 男女床上黄色一级片免费看| 禁无遮挡网站| 一卡2卡三卡四卡精品乱码亚洲| 久久精品国产综合久久久| 国产亚洲精品久久久久久毛片| 国产乱人视频| 男女之事视频高清在线观看| 99热6这里只有精品| 欧美大码av| 免费av不卡在线播放| 人人妻,人人澡人人爽秒播| 午夜亚洲福利在线播放| 国产麻豆成人av免费视频| 一级毛片精品| 精品电影一区二区在线| 一夜夜www| 又爽又黄无遮挡网站| 久久久久免费精品人妻一区二区| 日韩免费av在线播放| 精品免费久久久久久久清纯| e午夜精品久久久久久久| 色尼玛亚洲综合影院| 色哟哟哟哟哟哟| 欧美黑人欧美精品刺激| 亚洲五月天丁香| 国产亚洲欧美98| 少妇的逼水好多| 午夜福利高清视频| 国产精品久久久久久人妻精品电影| 99在线视频只有这里精品首页| 可以在线观看毛片的网站| 日本黄色视频三级网站网址| 久久亚洲精品不卡| 一夜夜www| 1024手机看黄色片| 精品国内亚洲2022精品成人| 一区二区三区高清视频在线| 亚洲精品中文字幕一二三四区| 欧美一级毛片孕妇| 99国产精品一区二区三区| xxxwww97欧美| www国产在线视频色| 在线国产一区二区在线| 最新中文字幕久久久久 | 偷拍熟女少妇极品色| 欧美日韩福利视频一区二区| 欧美一级a爱片免费观看看| 日本黄色视频三级网站网址| 国产精品爽爽va在线观看网站| 国产亚洲欧美98| 叶爱在线成人免费视频播放| 欧美另类亚洲清纯唯美| 国产精品1区2区在线观看.| 九九热线精品视视频播放| 国产97色在线日韩免费| 国产亚洲精品一区二区www| 久久欧美精品欧美久久欧美| or卡值多少钱| av片东京热男人的天堂| 国产伦精品一区二区三区四那| 无遮挡黄片免费观看| 日日干狠狠操夜夜爽| 亚洲国产中文字幕在线视频| 网址你懂的国产日韩在线| 淫秽高清视频在线观看| 亚洲人与动物交配视频| 在线国产一区二区在线| 国产爱豆传媒在线观看| 一个人观看的视频www高清免费观看 | 午夜福利欧美成人| 欧美日韩中文字幕国产精品一区二区三区| 欧美日韩福利视频一区二区| 网址你懂的国产日韩在线| 97超视频在线观看视频| 久久久久九九精品影院| 搞女人的毛片| 国产不卡一卡二| 禁无遮挡网站| 又黄又爽又免费观看的视频| 久久这里只有精品中国| 日本 欧美在线| 两个人看的免费小视频| 少妇人妻一区二区三区视频| 亚洲黑人精品在线| 国产在线精品亚洲第一网站| 一区福利在线观看| 亚洲成av人片免费观看| 夜夜躁狠狠躁天天躁| 99re在线观看精品视频| 欧美成人性av电影在线观看| 国产97色在线日韩免费| 国产成人av激情在线播放| 在线十欧美十亚洲十日本专区| 又粗又爽又猛毛片免费看| 欧美不卡视频在线免费观看| 老司机在亚洲福利影院| 曰老女人黄片| 国产免费男女视频| 黄色 视频免费看| 狠狠狠狠99中文字幕| 欧美极品一区二区三区四区| 亚洲色图av天堂| 国产蜜桃级精品一区二区三区| 午夜精品在线福利| 黑人操中国人逼视频| av天堂在线播放| 1024手机看黄色片| 99国产精品99久久久久| 97人妻精品一区二区三区麻豆| 黄频高清免费视频| 国产伦精品一区二区三区四那| av天堂在线播放| 久久精品91无色码中文字幕| 淫妇啪啪啪对白视频| 国产真人三级小视频在线观看| 久久亚洲真实| 窝窝影院91人妻| 无遮挡黄片免费观看| x7x7x7水蜜桃| 不卡av一区二区三区| 国产精品一及| 99热这里只有精品一区 | 91在线观看av| 欧美日本亚洲视频在线播放| 久久亚洲真实| 日韩精品中文字幕看吧| 中文字幕人妻丝袜一区二区| 亚洲第一电影网av| 黄色 视频免费看| a级毛片a级免费在线| 亚洲av成人精品一区久久| 亚洲精品在线观看二区| 精品久久久久久久末码| 又黄又爽又免费观看的视频| 亚洲国产欧洲综合997久久,| 老司机午夜十八禁免费视频| 日韩免费av在线播放| 久久亚洲真实| 高潮久久久久久久久久久不卡| 免费电影在线观看免费观看| 一本一本综合久久| 91在线观看av| 欧美日韩中文字幕国产精品一区二区三区| 欧美丝袜亚洲另类 | 无人区码免费观看不卡| 一本综合久久免费| 男女做爰动态图高潮gif福利片| 成年免费大片在线观看| 九九在线视频观看精品| 99国产综合亚洲精品| 一区二区三区国产精品乱码| 91av网一区二区| 十八禁人妻一区二区| 国产熟女xx| 精品乱码久久久久久99久播| 给我免费播放毛片高清在线观看| 一级毛片高清免费大全| 色噜噜av男人的天堂激情| 欧美色视频一区免费| 搞女人的毛片| 男女床上黄色一级片免费看| 女人被狂操c到高潮| 国产亚洲av高清不卡| 露出奶头的视频| 99久久精品一区二区三区| 色噜噜av男人的天堂激情| 久久久色成人| 国产午夜精品论理片| 黄色女人牲交| 久久久久性生活片| 变态另类成人亚洲欧美熟女| 视频区欧美日本亚洲| 夜夜夜夜夜久久久久| 夜夜看夜夜爽夜夜摸| 亚洲av日韩精品久久久久久密| 国产av麻豆久久久久久久| avwww免费| 国产成人av教育| 黄色日韩在线| 偷拍熟女少妇极品色| 欧美国产日韩亚洲一区| 精品国产三级普通话版| 成人性生交大片免费视频hd| 亚洲av片天天在线观看| 国产精品免费一区二区三区在线| 桃色一区二区三区在线观看| 国产99白浆流出| 亚洲欧美一区二区三区黑人| 日日夜夜操网爽| 精华霜和精华液先用哪个| 香蕉国产在线看| 亚洲aⅴ乱码一区二区在线播放| 久久热在线av| 欧美在线黄色| 桃色一区二区三区在线观看| av福利片在线观看| av在线天堂中文字幕| 久久国产精品人妻蜜桃| 女人高潮潮喷娇喘18禁视频| 午夜精品久久久久久毛片777| 国产成+人综合+亚洲专区| 长腿黑丝高跟| 成人鲁丝片一二三区免费| 午夜两性在线视频| 偷拍熟女少妇极品色| 国产精品野战在线观看| 亚洲av免费在线观看| 桃色一区二区三区在线观看| av在线蜜桃| 中亚洲国语对白在线视频| 一个人看视频在线观看www免费 | 国产亚洲欧美98| 午夜福利高清视频| 中文字幕精品亚洲无线码一区| 国产精品久久久久久亚洲av鲁大|