• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于Soft-NMS的候選框去冗余加速器設(shè)計*

    2021-05-11 01:59:36李景琳姜晶菲許金偉
    計算機工程與科學(xué) 2021年4期
    關(guān)鍵詞:候選框加速器最值

    李景琳,姜晶菲,竇 勇,許金偉,溫 冬

    (國防科技大學(xué)計算機學(xué)院,湖南 長沙 410073)

    1 引言

    21世紀,目標檢測算法[1 - 5]作為計算機視覺領(lǐng)域的經(jīng)典應(yīng)用獲得飛速發(fā)展,走向成熟。然而,大規(guī)模的存儲和浮點運算限制了目標檢測算法的廣泛應(yīng)用,如何將目標檢測算法部署到功率、資源受限的實時邊緣化檢測系統(tǒng)中成為新的研究熱點。通常,目標檢測算法分為前處理、特征提取和后處理3個部分,其中后處理主要使用非極大值抑制算法NMS(Non-Maximum Suppression)去除卷積神經(jīng)網(wǎng)絡(luò)輸出的冗余候選框,找到最佳的目標位置,提高檢測的準確率。文獻[6]的研究表明NMS在基于RPN+Fast-R-CNN網(wǎng)絡(luò)的目標檢測應(yīng)用計算任務(wù)中占22%左右計算延遲,因此對NMS的量化與加速也很值得研究。

    文獻[7]中給出了最常用的Hard-NMS方法,將所有的候選框按得分值從高到低排序,選取得分值最高的候選框(本文稱為靶候選框),刪除所有與靶候選框的重疊率超出閾值(本文設(shè)為Nt)的候選框,對未刪除的候選框選取得分值最高的繼續(xù)此操作。Hard-NMS是一種高復(fù)雜度的貪心算法,反復(fù)迭代計算候選框的重疊率給算法帶來了巨大的延時。不僅如此,Hard-NMS是一種基于唯一固定閾值的方法,當圖像中2個目標物體的重疊率大于Nt時,Hard-NMS會直接刪除得分值較低的目標物體的候選框,導(dǎo)致檢測精度受損。

    針對這個問題,文獻[8,9]提出了一些改進方法,其中文獻[9]提出的Soft-NMS最為簡單,與Hard-NMS中直接刪除大于預(yù)定義閾值候選框的方法不同,Soft-NMS使用一個衰減函數(shù)逐步減小候選框得分值。文獻[9]認為Soft-NMS是非極大值抑制算法的廣義版本,Hard-NMS是使用不連續(xù)的二值加權(quán)函數(shù)作為衰減函數(shù)的特例,其衰減函數(shù)如式(1)所示,當然使用線性函數(shù)和連續(xù)的高斯函數(shù)效果更佳,其衰減函數(shù)分別如式(2)和式(3)所示:

    (1)

    (2)

    (3)

    其中,M表示靶候選框;bi表示第i個候選框,得分值為si;iou(M,bi)為bi與靶候選框的面積交集與面積并集的比例,表示bi與靶候選框之間的重疊率;線性函數(shù)使用(1-iou(M,bi))作為懲罰系數(shù);高斯函數(shù)為連續(xù)函數(shù)沒有預(yù)定義閾值Nt,但存在預(yù)定義參數(shù)σ;D為靶候選框的集合,表示后處理階段的輸出候選框結(jié)果。

    實驗表明,在標準數(shù)據(jù)集PASCAL VOC2007(較R-FCN和Faster-RCNN提升1.7%)和MS-COCO(較R-FCN提升1.3%,較Faster-RCNN提升1.1%)上使用Soft-NMS檢測精度均有提升。但是,Soft-NMS仍然是一種復(fù)雜度較高的貪心算法,逐步減小候選框得分值不僅增加了大量的浮點計算,而且還使得Soft-NMS無法像Hard-NMS一樣用提前排序的方法代替迭代選取最大值的方法。Soft-NMS每輪遍歷之后必須重新調(diào)整得分值的排列順序,使得算法的并行難度大大增加。

    僅在CPU平臺上實現(xiàn)Soft-NMS計算延遲過高,不能滿足目標檢測任務(wù)對性能的要求,因此本文嘗試使用異構(gòu)計算來加速算法,提高吞吐率。Soft-NMS頻繁修改得分值的特點使得GPU平臺的異構(gòu)加速方法在付出大量功耗的代價下卻無法發(fā)揮其高度并行的優(yōu)勢。為了實現(xiàn)性能、功耗和成本之間的平衡,本文使用高性能、低成本、低功耗的FPGA平臺實現(xiàn)一種低延時、高效率的Soft-NMS專用加速器。

    本文提出一種基于Soft-NMS的加速器體系結(jié)構(gòu),設(shè)計了一種基于細粒度流水線的重疊率計算單元PE(Processing Element),并利用對數(shù)函數(shù)將計算單元中所有的浮點乘除運算轉(zhuǎn)換為定點加減運算;在加速器中加入一個最值模塊,設(shè)計了一種基于粗粒度并行的2級并行結(jié)構(gòu):包括計算單元組的循環(huán)級并行和最值模塊與計算單元組之間的模塊級并行。根據(jù)最值模塊與計算單元組之間計算速度不匹配的特性,設(shè)計了一種預(yù)取最值的方法,將可能作為下一輪遍歷靶候選框的候選框預(yù)先取入緩沖隊列,節(jié)約排序時間。Soft-NMS加速器充分利用細粒度流水和粗粒度并行組成2級優(yōu)化結(jié)構(gòu)提升算法的吞吐率,在KU-115 FPGA開發(fā)板上對COCO_2017數(shù)據(jù)集進行評估,與CPU實現(xiàn)的Soft-NMS相比,該體系結(jié)構(gòu)實現(xiàn)了36倍的性能加速比。

    2 相關(guān)工作

    Figure 1 Two Hard-NMS acceleration methods圖1 2種Hard-NMS加速方法

    3 基于Soft-NMS的加速方法

    在目標檢測任務(wù)中,卷積網(wǎng)絡(luò)輸出的候選框得分值是亂序的,上述2種方案都是用提前排序候選框的方法代替每輪迭代選取最大得分值候選框的方法,而排序操作的計算復(fù)雜度為O(N2),計算延時是不可省略的。本文分析Soft-NMS具有頻繁修改得分值的特點無法提前排序,于是加入一個最值模塊在每輪遍歷后選取得分值最大的靶候選框;為了節(jié)約排序時間,提出最值模塊與計算單元組并行計算的策略。但是,最值模塊比計算單元組的計算速度快,并且最值模塊與計算單元組之間存在數(shù)據(jù)相關(guān),即最值模塊選出的靶候選框可能被計算單元組視為冗余候選框刪除,于是本文設(shè)計一種預(yù)取最值的方法:每輪遍歷中,最值模塊將前k大候選框預(yù)先取入緩沖隊列中,每輪遍歷結(jié)束后,從緩沖隊列中直接獲得下一輪遍歷的靶候選框,節(jié)約選取靶候選框的時間。如果下一輪的靶候選框存在緩沖隊列中則稱為命中靶候選框,命中靶候選框的概率稱為命中率。當命中率較高時,排序時間幾乎可以完全省略。

    為了節(jié)約中間數(shù)據(jù)的存儲空間,與文獻[11]中的方法類似,本文也使用基于位置的位表J來存儲候選框的狀態(tài)信息。不同的是位表J需要使用2位狀態(tài)位表示“0”“1”“2”3種狀態(tài)。候選框與位表之間是一對一映射,該位置寫入“2”表示該候選框得分值低于閾值被刪除或者該候選框被選為靶候選框被輸出。對于被標記為“2”的候選框后續(xù)將不再進行任何操作。該位置寫入“1”表示在當前輪遍歷中該候選框與靶候選框的重疊率大于Nt,該候選框的得分值經(jīng)衰減函數(shù)修改,但修改后的得分值大于閾值θ。對于被標記為“1”的候選框下一輪遍歷開始之前需要將狀態(tài)位的值從“1”修改為“0”。該位置寫入“0”表示該候選框與靶候選框的重疊率小于Nt,不屬于冗余候選框,不進行任何處理或者表示位表為初始化狀態(tài)候選框,還未被處理。

    如圖2所示本文方法的步驟為:第1步,位表J所有的元素都初始為“0”,使用最值模塊比較出得分值最大的靶候選框。第2步,計算靶候選框與其它候選框的重疊率(本文將此過程稱為一輪遍歷),同時最值模塊繼續(xù)比較出得分值前k大的候選框序列作為下一輪遍歷可能的靶候選框預(yù)先存入緩沖隊列中。以候選框dy為例,計算重疊率的方法為:首先判斷,如果靶候選框與dy的重疊率高于閾值Nt,則候選框dy的得分值將被衰減函數(shù)修改,并且在位表中的狀態(tài)位從“0”修改為“1”,如第1輪遍歷中b3的得分值被修改;如果重疊率低于閾值Nt,則dy的得分值和在位表中的狀態(tài)都保持不變。

    接著判斷,修改后dy的得分值是否小于閾值θ,如果是則候選框dy的得分值修改為零,并且在位表中的狀態(tài)位修改為“2”,如第2輪遍歷中b6所示,否則dy的得分值和狀態(tài)位都保持不變,如第1輪遍歷中b6所示。靶候選框與自身的重疊率為1,衰減函數(shù)必定將其得分值修改為0,小于閾值θ,因此它在位表中的狀態(tài)位修改為“2”,如第1輪遍歷中b1所示。第3步,當一輪遍歷結(jié)束后,如果從前k大的候選框緩沖隊列中命中靶候選框,即找到位表J的狀態(tài)位為“0”的得分值最大的候選框則可以直接開始下一輪遍歷,否則需要重新調(diào)用最值模塊比較出靶候選框。第4步,將位表J中所有狀態(tài)位為“1”的值修改為“0”,繼續(xù)執(zhí)行第2步。重復(fù)這些步驟,直到位表J中所有的狀態(tài)位全為“2”時停止。

    Figure 2 Soft-NMS acceleration method圖2 Soft-NMS加速方法

    4 硬件設(shè)計

    基于Soft-NMS的候選框去冗余加速器由DDR4、控制器、最值模塊MAX、位表J、計算單元組(Computation Unit)、片上存儲BRAM(Block RAM)和靶向模塊Target組成,加速器整體結(jié)構(gòu)如圖3所示。控制器負責(zé)接收來自主機的指令,控制加速器的狀態(tài);最值模塊MAX負責(zé)選擇出N個候選框中得分值最大的候選框;位表J用于記錄N個候選框狀態(tài)信息;計算單元組由S個PE組成,負責(zé)計算靶候選框與N個候選框的重疊率并修改候選框的得分值和位表J的狀態(tài)信息;片上存儲BRAM由RAMA、RAMB和RAMC組成,用于存儲輸入數(shù)據(jù)和中間結(jié)果;靶向模塊Target負責(zé)計算每輪遍歷的靶候選框。

    Figure 3 Architecture of hardware accelerator based on Soft-NMS圖3 基于Soft-NMS算法的硬件加速器整體架構(gòu)

    加速器啟動時,片上存儲BRAM、位表J被初始化。其中位表J被初始化為全“0”,RAMA接收來自DDR4的N個候選框的坐標數(shù)據(jù)并將其發(fā)送到計算單元組,RAMB接收來自DDR4的N個候選框得分值數(shù)據(jù)并將其發(fā)送到計算單元組和RAMC。接著在每一輪遍歷中,最值模塊、計算單元組和靶向模塊3個模塊同時并行工作,去除冗余候選框。RAMC接收RAMB的N個候選框的得分值數(shù)據(jù)并將其發(fā)送到最值模塊,最值模塊接收RAMC的N個候選框的得分值數(shù)據(jù),計算出前k大得分值,并將其發(fā)送到Target;Target計算出得分值最大的靶候選框后,從RAMA中獲取靶候選框的坐標數(shù)據(jù),將靶候選框得分值數(shù)據(jù)和坐標數(shù)據(jù)發(fā)送到計算單元組和主機;計算單元組分批(每批S個候選框)接收RAMA中S個候選框的坐標數(shù)據(jù)、RAMB的S個候選框的得分值數(shù)據(jù)、位表J中S個候選框的狀態(tài)信息和來自Target的靶候選框坐標數(shù)據(jù),將計算得到的候選框得分值發(fā)送到RAMB、狀態(tài)信息值發(fā)送到位表J中。當N個候選框的重疊率計算完成時,一輪遍歷結(jié)束。每輪遍歷結(jié)束后位表J中所有狀態(tài)位為“1”的值修改為“0”。位表J中所有的狀態(tài)位全為“2”時加速器停止,Soft-NMS就完成了。主機使用PCIe傳輸通道發(fā)送N個候選框的坐標數(shù)據(jù)和得分值數(shù)據(jù)到DDR4,接收Target的靶候選框的坐標數(shù)據(jù)和得分值數(shù)據(jù)并將其發(fā)送到主存。

    本文針對Soft-NMS的計算特性提出一種細粒度流水和粗粒度并行結(jié)合的2級優(yōu)化結(jié)構(gòu)。為了提高資源利用率,減小實現(xiàn)面積和降低功耗,本文設(shè)計一種基于細粒度流水的重疊率計算單元PE;為了充分開發(fā)Soft-NMS的并行性,本文設(shè)計了一種基于粗粒度并行的2級并行結(jié)構(gòu);為了解決2級并行結(jié)構(gòu)存在的計算速度不匹配和數(shù)據(jù)相關(guān)等問題,本文設(shè)計一種預(yù)取最值方案。

    無乘除法的PE:PE是整個加速器的核心,PE的計算結(jié)構(gòu)對加速器的功耗和資源量起決定性作用。Soft-NMS計算候選框之間的重疊率時,反復(fù)進行浮點乘法和浮點除法會消耗大量的存儲空間和運算資源,因此本文使用對數(shù)函數(shù)優(yōu)化計算,設(shè)計了一個基于全流水結(jié)構(gòu)無乘除法的計算單元PE。PE由“對數(shù)映射”“計算重疊率”“指數(shù)映射”“寫回”4段流水棧組成,其結(jié)構(gòu)如圖4所示,其計算方法如算法1步驟4所示。

    Figure 4 PE based on four-level flow structure圖4 基于4級流水結(jié)構(gòu)的PE

    本文以候選框b1和候選框b2為例介紹PE計算重疊率的對數(shù)優(yōu)化方法。候選框b1的坐標表示為(x1,y1)和(x2,y2),得分值為s1,候選框b2的坐標表示為(p1,q1)和(p2,q2),得分值為s2,且s1>s2。運算符A(·)定義為區(qū)域面積,A(b1∩b2)表示候選框b1與候選框b2重疊部分面積。PE更新候選框得分值時,其衰減函數(shù)如式(2)所示。由iou(b1,b2)的定義可知,當候選框b1、b2滿足式(4)時,可認為b1、b2的重疊率過高,需要更新候選框b2的得分值。式(4)中有3個計算矩陣面積的乘法運算和1個除法運算,為了減少乘除法運算量,本文利用式(5)對式(4)的左邊進行縮放,結(jié)果如式(6)所示,繼續(xù)對式(6)不等式兩邊同時進行對數(shù)運算,結(jié)果如式(7)所示。為了方便表示,我們用lnOR(Overlap Rate)表示式(7)左邊ln (A(b1∩b2))-ln(max(A(b1),A(b2)))的運算結(jié)果,在lnOR中代入候選框b1、b2的長和寬h1=x2-x1,w1=y2-y1,h2=p2-p1,w2=q2-q1和b1、b2的重疊部分A(b1∩b2)的長和寬H=min(x2,p2)-max(x1,p1)和W=min(y2,q2)-max(y1,q1)后,如式(8)所示,lnOR中所有乘除運算將全部轉(zhuǎn)換為對數(shù)加減運算。

    A(b1∩b2)/(A(b1)+A(b2)-A(b1∩b2))≥Nt

    (4)

    max(A(b1),A(b2))≤

    (A(b1)+A(b2)-A(b1∩b2))

    (5)

    A(b1∩b2)/max(A(b1),A(b2))≥Nt

    (6)

    ln(A(b1∩b2))-

    ln(max(A(b1),A(b2)))≥ln(Nt)

    (7)

    lnOR=(lnH+lnW)-

    max(lnh1+lnw1,lnh2+lnw2)

    (8)

    文獻[9]提出了Soft-NMS的基本原理,與靶候選框重疊率越高的候選框衰減率越高,因為它們有更高的可能性是假陽性,即候選框的衰減率與重疊率之間應(yīng)該滿足正相關(guān)關(guān)系。為了簡化計算,節(jié)約資源,減少計算延遲,本文提出用查找表來實現(xiàn)重疊率與衰減率之間的正相關(guān)對數(shù)映射。

    查找表實現(xiàn)正相關(guān)對數(shù)映射的方法為:首先,如描述第1級流水?!皩?shù)映射”方法的步驟4.1所示,用查找表將候選框的長、寬等數(shù)據(jù)映射到對數(shù)空間(本文稱此查找表為ln表);然后如描述第2級流水?!坝嬎阒丿B率”方法的步驟4.2所示,使用加減運算得到用對數(shù)表示的候選框重疊率lnOR;接著,如描述第3級流水?!爸笖?shù)映射”方法的步驟4.3所示,用另一個查找表將lnOR映射到衰減率f(OR)上(本文稱此查找表為E表),將衰減率與得分值相乘得到新的得分值;最后,如描述的第4級流水?!皩懟亍狈椒ǖ牟襟E4.4所示,PE將計算得到的新得分值發(fā)送到RAMB、新狀態(tài)信息值發(fā)送到位表J。

    可以發(fā)現(xiàn),算法1步驟4.3中得分值與衰減率相乘仍然是一個乘法運算,于是本文將這個乘法運算轉(zhuǎn)化為移位加法。本文實驗部分將證明使用3位無符號定點小數(shù)表示衰減率不會影響算法的檢測精度,其數(shù)據(jù)表示范圍為0~(1-2-3),因此可以將得分值與衰減率相乘轉(zhuǎn)化為得分值的3次移位加法。

    為了減小冗余存儲,本文將使用64×3 bit的E表,因此需要將16位的lnOR右移10位作為E表的索引鍵,E表中的元素為3位無符號定點小數(shù)表示的衰減率;在圖像像素不超過1024×1024的情況下本文選擇使用1024×16 bit的ln表。由此可知,本文所使用的查找表方法占用的資源很少,適合在FPGA等硬件平臺上實現(xiàn)。

    算法1基于Soft-NMS的加速算法

    輸入:B={b1,…,bN},Score={s1,…,sN},J={j1,…,jN},Nt,θ。

    輸出:D={b1,…,bK}。

    步驟1初始化集合D為空,初始化表J全為“0”。

    步驟2表J不全為2時執(zhí)行步驟3,否則執(zhí)行步驟5。

    步驟3選取集合B中得分值最大的候選框為靶候選框,并將該候選框加入集合D中并從集合B中刪除,將表J中所有狀態(tài)位的值“1”修改為“0”。

    步驟4計算靶候選框與集合B中每一個候選框的重疊率:

    步驟4.1(對數(shù)映射) 計算出候選框b1與候選框b2的長和寬h1=x2-x1,w1=y2-y1,h2=p2-p1,w2=q2-q1;計算重疊部分的長和寬H=min(x2,p2)-max(x1,p2)和W=min(y2,q2)-max(y1,q1);查找ln表得到lnh1、lnw1、lnh2、lnw2;計算出較大的候選框面積的對數(shù)lnArea_max= max(lnh1+lnw1,lnh2+lnw2)。

    步驟4.2(計算重疊率) 查找ln表得到lnH、lnW;計算候選框b1與候選框b2的重疊部分面積的對數(shù)lnA(b1∩b2)=lnH+lnW;計算用對數(shù)表示的候選框重疊率lnOR=lnA(b1∩b2)-lnArea_max。

    步驟4.3(指數(shù)映射) 判斷當lnOR>lnNt時,以lnOR?10為索引鍵查E表得到3 bit的f(OR),通過3次移位加法更新b2的得分值s2_new,并將J2從“0”修改為“1”;否則s2_new=s2,J2不變。

    步驟4.4(寫回) 判斷s_2_new<θ時,更新集合Score中b2的得分值為0,修改J2為“2”,否則集合Score中b2的得分值不變,J2不變;當靶候選框與集合B中每一個候選框的重疊率都計算完成后返回步驟2。

    步驟5算法結(jié)束。

    2級并行結(jié)構(gòu):為了提高加速器的吞吐率,本文根據(jù)Soft-NMS的雙循環(huán)結(jié)構(gòu),設(shè)計了一種2級并行硬件結(jié)構(gòu)。此結(jié)構(gòu)包括:計算單元組的循環(huán)級并行和最值模塊與計算單元組之間模塊級并行。計算單元組由S個PE組成,為了開發(fā)計算單元組的循環(huán)級并行性,在每輪遍歷中,分批(每批S個)計算靶候選框與其他候選框的重疊率,修改候選框的得分值和位表J的狀態(tài)信息,減少重疊率的計算延遲。

    根據(jù)Soft-NMS頻繁修改得分值的特點,本文在加速器中加入一個最值模塊,用于選取每輪遍歷后得分值最大的靶候選框。為了提高并行度,節(jié)約排序時間,在模塊級別上,本文設(shè)計計算單元組與最值模塊并行工作。在每輪遍歷中,計算單元分批求取候選框重疊率的同時最值模塊反復(fù)比較出N個候選框的前k大得分值候選框,為下一輪遍歷提供靶候選框,優(yōu)化比較最值的時間。

    預(yù)取最值方法的硬件實現(xiàn):最值模塊與計算單元組并行工作時,存在計算速度不匹配和數(shù)據(jù)相關(guān)等問題,于是本文設(shè)計了一種預(yù)取最值方案,在加速器中加入一個靶向模塊。在每輪遍歷結(jié)束后,靶向模塊從前k大得分值候選框中選取靶候選框,直接開始下一輪遍歷,節(jié)約了選取最值的時間。

    本文分析最值模塊選取一個最大值的時間較短,一輪遍歷的時間可以重復(fù)進行k次最值選擇的操作,得到N個候選框的前k大得分值序列。其方法為:最值模塊每次找到最大值候選框后都將其在RAMC中的得分值數(shù)據(jù)修改為 0,然后重新選取最大值,重復(fù)進行k次最值選擇操作后,將得到N個候選框的前k大得分值序列,并存入Target的緩沖隊列中。一輪遍歷結(jié)束后,如果Target能從前k大得分值序列中找到在位表J的狀態(tài)位為“0”的得分值最大候選框作為靶候選框,則視為命中靶候選框,否則視為不命中。可以發(fā)現(xiàn),當命中率較高時,排序時間幾乎可以完全省略。

    假設(shè)最值模塊選取一次最大值的時間為tm,計算單元組計算1次候選框重疊率的時間為ts。在一輪遍歷中,最值模塊與計算單元組并行工作,最值模塊選取N個候選框的前k大得分值的時間為k×tm,并行度為S的計算單元組完成N個候選框重疊率計算的時間為N×ts/S,則最值模塊預(yù)選候選框數(shù)量k與計算單元組的并行度S滿足公式k×tm=N×ts/S。由此可知在tm、N、ts保持不變的條件下,計算單元組的并行度S與k呈反比,并行度S越小,k越大,預(yù)取最值方法的命中率越高;但是并行度S較小時,加速器吞吐率也較小,因此合適的S值才能充分發(fā)揮Soft-NMS加速器的計算優(yōu)勢。

    5 實驗與結(jié)果

    本文在XILINX KU-115 FPGA開發(fā)板及 XILINX ISE 18.3 設(shè)計環(huán)境下實現(xiàn)了該加速器。所有模塊均用 Verilog 編碼實現(xiàn),并在 XILINX ISE 18.3 環(huán)境下進行綜合、布線和實現(xiàn)。為了探索最合適的計算單元組個數(shù)S的值,本文從COCO_2017 val數(shù)據(jù)集中選取了50幅圖像,包含992個候選框進行實驗,觀察加速器吞吐率在不同PE數(shù)目下的變化情況(每個候選框的坐標信息用8 B數(shù)據(jù)表示)。如圖5所示,實驗結(jié)果表明,成倍增加PE的數(shù)量并不能成倍地提高加速器的吞吐率。這是因為PE數(shù)目過高導(dǎo)致計算單元組分批的數(shù)量減少,不能充分發(fā)揮PE的流水線計算優(yōu)勢。為了充分發(fā)揮PE流水線的計算優(yōu)勢,提高預(yù)取最值算法的命中率,實現(xiàn)性能與資源量的平衡,本文使用128個PE組成計算單元組實現(xiàn)候選框去冗余加速器,此時加速的工作頻率是100 MHz。

    Figure 5 Relationship between throuthput and number of PE in the accelerator圖5 加速器中吞吐率與PE數(shù)目的關(guān)系

    基于Soft-NMS的候選框去冗余加速器的綜合數(shù)據(jù)細節(jié)如表1所示,加速器沒有占用DSP資源,但由于FPGA片上邏輯的并行度在提高的過程中會消耗大量的BRAM,128個PE并行工作使得候選框去冗余加速器占用較多的BRAM資源??傮w上,加速器資源占用較少。

    Table 1 Resource occupancy of redundancy-reduced candidate box accelerator

    為了評估加速器的性能,本文用R-FCN模型在COCO_2017 val數(shù)據(jù)集上分別測試了CPU實現(xiàn)的Hard-NMS、CPU實現(xiàn)的線性衰減函數(shù)Soft-NMS和候選框去冗余加速器的性能。如表2所示,實驗結(jié)果表明,候選框去冗余加速器與基于線性衰減函數(shù)的Soft-NMS相比幾乎不會有精度損失,表明了本文提出的體系結(jié)構(gòu)的正確性。

    Table 2 Accuracy of R-FCN model on coco dataset under different methods

    為了評估候選框去冗余加速器的加速性能,本文選用Intel(R) Core(TM) i7-4790k CPU @4.00 GHz、NVIDIA GeForce GTX 1080 Ti、TSMC 28 nm作為對比平臺,實驗結(jié)果如表3所示,候選框去冗余加速器處理992個候選框的延時為168.95 μs,吞吐率為47.0 MB/s,比CPU平臺實現(xiàn)的Hard-NMS提高了32倍、比CPU平臺實現(xiàn)的Soft-NMS提高了36倍、比GPU平臺實現(xiàn)的Hard-NMS提高了3.9倍,但本文的硬件功耗僅為6.107 W,性能功耗比為CPU實現(xiàn)Hard-NMS的234倍、為CPU實現(xiàn)Soft-NMS的264倍、為GPU實現(xiàn)Hard-NMS的39倍。文獻[11]根據(jù)Hard-NMS在TSMC 28 nm平臺上使用1 024個計算單元CALU時,在100 MHz的頻率下的計算延時為51.13 μs,吞吐率為149.21 MB/s,本文基于Soft-NMS在FPGA平臺上實現(xiàn)1 024個PE,在100 MHz頻率下的吞吐率為108.83 MB/s。雖然本文方法的吞吐率稍稍低于文獻[11]的,但準確率較文獻[11]的提升了4%左右,并且文獻[11]沒有考慮對亂序候選框排序的時間。因此,本文提出的加速器體系結(jié)構(gòu)是解決候選框去冗余問題的有效方法。

    Table 3 Performance comparison of NMS implemented on different platforms

    6 結(jié)束語

    本文提出了一種高效加速Soft-NMS的體系結(jié)構(gòu),利用對數(shù)函數(shù)優(yōu)化復(fù)雜的浮點計算,采用細粒度流水和粗粒度模塊級并行組成2級優(yōu)化結(jié)構(gòu)進一步提升算法的吞吐率。實驗結(jié)果表明,與以前的方法相比,本文方法準確率更高、效率更高、資源消耗更少。

    猜你喜歡
    候選框加速器最值
    輪滑加速器
    化學(xué)工業(yè)的“加速器”
    重定位非極大值抑制算法
    單調(diào)任意恒成立,論參離參定最值
    面向自然場景文本檢測的改進NMS算法
    全民小康路上的“加速器”
    少先隊活動(2021年6期)2021-07-22 08:44:24
    聚焦圓錐曲線中的最值問題
    巧用不等式求最值
    數(shù)列中的最值題型例講
    基于深度學(xué)習(xí)的重疊人臉檢測
    考比视频在线观看| 少妇猛男粗大的猛烈进出视频| 一区二区av电影网| 精品熟女少妇av免费看| 一级毛片aaaaaa免费看小| 亚洲五月色婷婷综合| 啦啦啦视频在线资源免费观看| 亚洲美女黄色视频免费看| 国产熟女欧美一区二区| 欧美97在线视频| 少妇熟女欧美另类| 99九九在线精品视频| 一级毛片电影观看| 国产一区二区在线观看日韩| 男女免费视频国产| 国产毛片在线视频| 国产又色又爽无遮挡免| 日本黄色片子视频| 性色avwww在线观看| 激情五月婷婷亚洲| 极品人妻少妇av视频| 精品人妻偷拍中文字幕| 日韩熟女老妇一区二区性免费视频| 国产色婷婷99| 麻豆乱淫一区二区| 人妻人人澡人人爽人人| 久久亚洲国产成人精品v| 一本大道久久a久久精品| 国产精品三级大全| 国产精品成人在线| 成年人免费黄色播放视频| 丝袜喷水一区| 美女视频免费永久观看网站| 黑人欧美特级aaaaaa片| 在线观看三级黄色| 少妇被粗大猛烈的视频| 天堂中文最新版在线下载| 色5月婷婷丁香| 少妇精品久久久久久久| 嘟嘟电影网在线观看| 女性被躁到高潮视频| 国产av国产精品国产| 国产男女内射视频| 精品久久久久久电影网| 久久99精品国语久久久| 插逼视频在线观看| 不卡视频在线观看欧美| 日韩一区二区视频免费看| 女的被弄到高潮叫床怎么办| 亚洲欧美一区二区三区国产| 久久午夜福利片| 成人影院久久| 亚洲国产av新网站| 一区二区三区精品91| 黑丝袜美女国产一区| 欧美激情国产日韩精品一区| 极品少妇高潮喷水抽搐| 天堂俺去俺来也www色官网| 春色校园在线视频观看| 在线观看美女被高潮喷水网站| 亚洲av福利一区| 亚洲av成人精品一二三区| 2022亚洲国产成人精品| 国产免费福利视频在线观看| 黄色一级大片看看| 两个人免费观看高清视频| 十八禁高潮呻吟视频| 中文乱码字字幕精品一区二区三区| 丝袜美足系列| 黄片播放在线免费| 高清不卡的av网站| 七月丁香在线播放| 91久久精品电影网| 黄色一级大片看看| h视频一区二区三区| 亚洲在久久综合| 成人综合一区亚洲| 麻豆精品久久久久久蜜桃| 日韩成人av中文字幕在线观看| 少妇人妻久久综合中文| 日韩一本色道免费dvd| 国产伦理片在线播放av一区| 国产亚洲一区二区精品| 黑人欧美特级aaaaaa片| 菩萨蛮人人尽说江南好唐韦庄| av有码第一页| 免费黄频网站在线观看国产| 99九九在线精品视频| 久久久精品94久久精品| 亚洲精品亚洲一区二区| 国产精品99久久久久久久久| 欧美成人午夜免费资源| 国产 精品1| 国产精品久久久久久av不卡| 亚洲欧洲日产国产| 美女主播在线视频| 欧美三级亚洲精品| 亚洲,欧美,日韩| 精品亚洲成国产av| 韩国高清视频一区二区三区| 丝袜美足系列| 男女高潮啪啪啪动态图| 如日韩欧美国产精品一区二区三区 | 国产精品人妻久久久影院| 精品久久久久久久久亚洲| videosex国产| 国产成人freesex在线| 日日摸夜夜添夜夜添av毛片| 日韩欧美一区视频在线观看| 在线观看人妻少妇| 熟妇人妻不卡中文字幕| 春色校园在线视频观看| 黄片播放在线免费| 91久久精品国产一区二区三区| 各种免费的搞黄视频| 菩萨蛮人人尽说江南好唐韦庄| 日韩不卡一区二区三区视频在线| 国产 一区精品| 超色免费av| 免费高清在线观看视频在线观看| 一级,二级,三级黄色视频| 两个人的视频大全免费| 你懂的网址亚洲精品在线观看| 最近中文字幕2019免费版| 成人亚洲欧美一区二区av| 日韩熟女老妇一区二区性免费视频| 欧美人与善性xxx| a级片在线免费高清观看视频| 99久久精品一区二区三区| 国产精品麻豆人妻色哟哟久久| 国产在线一区二区三区精| 亚洲av在线观看美女高潮| 久久久久久人妻| 国产精品一二三区在线看| 少妇 在线观看| 亚洲欧美一区二区三区国产| 欧美精品亚洲一区二区| 一级毛片我不卡| av国产久精品久网站免费入址| 亚洲欧美日韩卡通动漫| 啦啦啦中文免费视频观看日本| 青春草亚洲视频在线观看| 日本猛色少妇xxxxx猛交久久| 国产精品三级大全| av天堂久久9| 午夜免费鲁丝| 观看美女的网站| 日本爱情动作片www.在线观看| 日韩成人av中文字幕在线观看| 国产高清有码在线观看视频| 日日爽夜夜爽网站| 18禁在线无遮挡免费观看视频| 丝袜美足系列| 国模一区二区三区四区视频| 日韩欧美精品免费久久| 日韩免费高清中文字幕av| 老司机亚洲免费影院| 在线 av 中文字幕| 人妻少妇偷人精品九色| 秋霞在线观看毛片| 少妇人妻精品综合一区二区| 亚洲国产色片| av黄色大香蕉| 亚洲欧美一区二区三区国产| 精品人妻偷拍中文字幕| 大陆偷拍与自拍| 日本黄大片高清| 亚洲av成人精品一二三区| 制服人妻中文乱码| 中文字幕av电影在线播放| 亚洲国产精品一区三区| 黄片播放在线免费| 日日摸夜夜添夜夜爱| 精品卡一卡二卡四卡免费| 丰满少妇做爰视频| av不卡在线播放| 日韩 亚洲 欧美在线| 免费黄色在线免费观看| 欧美3d第一页| 精品99又大又爽又粗少妇毛片| 黑人巨大精品欧美一区二区蜜桃 | 欧美精品亚洲一区二区| 国产精品一二三区在线看| 三上悠亚av全集在线观看| 国产日韩欧美亚洲二区| 夜夜爽夜夜爽视频| 久久久精品免费免费高清| 麻豆成人av视频| 老司机影院毛片| 交换朋友夫妻互换小说| av在线观看视频网站免费| 制服诱惑二区| 美女国产视频在线观看| 在线观看三级黄色| 欧美性感艳星| 精品少妇久久久久久888优播| 少妇猛男粗大的猛烈进出视频| 午夜老司机福利剧场| 日韩 亚洲 欧美在线| 香蕉精品网在线| 99久久人妻综合| 亚洲丝袜综合中文字幕| 另类亚洲欧美激情| 久久亚洲国产成人精品v| 成人免费观看视频高清| 亚洲欧美精品自产自拍| 欧美日韩成人在线一区二区| 日韩不卡一区二区三区视频在线| 日韩中文字幕视频在线看片| 欧美另类一区| 啦啦啦视频在线资源免费观看| 2021少妇久久久久久久久久久| 日韩 亚洲 欧美在线| 18禁动态无遮挡网站| 国产高清三级在线| a级片在线免费高清观看视频| 久久久国产精品麻豆| 婷婷色综合大香蕉| 极品人妻少妇av视频| 各种免费的搞黄视频| 在线观看三级黄色| 精品久久久久久久久av| 搡老乐熟女国产| 在线观看美女被高潮喷水网站| 亚洲精品久久午夜乱码| 久久97久久精品| 欧美日韩国产mv在线观看视频| 成人无遮挡网站| 能在线免费看毛片的网站| 亚洲欧美清纯卡通| 丝袜脚勾引网站| 国产精品一二三区在线看| 久热久热在线精品观看| 高清毛片免费看| 亚洲欧美色中文字幕在线| 久久精品熟女亚洲av麻豆精品| 久久精品熟女亚洲av麻豆精品| 另类亚洲欧美激情| 亚洲,欧美,日韩| 夫妻性生交免费视频一级片| 寂寞人妻少妇视频99o| 久久热精品热| 国产黄频视频在线观看| 五月伊人婷婷丁香| 日本vs欧美在线观看视频| 精品午夜福利在线看| 欧美少妇被猛烈插入视频| 综合色丁香网| 国模一区二区三区四区视频| 热99国产精品久久久久久7| 老司机亚洲免费影院| 天堂俺去俺来也www色官网| 蜜桃久久精品国产亚洲av| 国产成人精品一,二区| a级片在线免费高清观看视频| 母亲3免费完整高清在线观看 | 一边亲一边摸免费视频| 久久精品久久精品一区二区三区| 热99国产精品久久久久久7| 高清毛片免费看| 久久精品国产亚洲av涩爱| 人妻夜夜爽99麻豆av| 日本与韩国留学比较| 日日撸夜夜添| 一二三四中文在线观看免费高清| a 毛片基地| 日日啪夜夜爽| 99re6热这里在线精品视频| 天天操日日干夜夜撸| 九九久久精品国产亚洲av麻豆| 国产精品一区二区在线不卡| 久久国内精品自在自线图片| 欧美日韩亚洲高清精品| 久久久久久久久久人人人人人人| 我的女老师完整版在线观看| 大片免费播放器 马上看| 三级国产精品片| 久久婷婷青草| 在线天堂最新版资源| 日韩伦理黄色片| 美女xxoo啪啪120秒动态图| 亚洲国产精品成人久久小说| 精品人妻一区二区三区麻豆| 国产在线视频一区二区| 一级,二级,三级黄色视频| 我的女老师完整版在线观看| 美女xxoo啪啪120秒动态图| 男人爽女人下面视频在线观看| 亚洲av不卡在线观看| 国产又色又爽无遮挡免| 日本黄大片高清| 九九久久精品国产亚洲av麻豆| 国产精品三级大全| 亚洲精品国产av成人精品| 特大巨黑吊av在线直播| 午夜免费男女啪啪视频观看| 国产熟女欧美一区二区| 免费播放大片免费观看视频在线观看| av天堂久久9| 久久久久精品性色| 精品亚洲成国产av| 黄色一级大片看看| 中文欧美无线码| 亚洲精品国产色婷婷电影| 亚洲四区av| 黑人巨大精品欧美一区二区蜜桃 | 亚洲丝袜综合中文字幕| 欧美日韩一区二区视频在线观看视频在线| 欧美人与性动交α欧美精品济南到 | 十分钟在线观看高清视频www| 午夜福利视频精品| 国产成人免费无遮挡视频| 欧美日韩av久久| 亚洲av成人精品一区久久| 国产免费现黄频在线看| 男人操女人黄网站| 9色porny在线观看| 秋霞在线观看毛片| 久热这里只有精品99| 国产成人精品无人区| 我的女老师完整版在线观看| 国产成人a∨麻豆精品| 亚洲国产欧美日韩在线播放| 中国美白少妇内射xxxbb| 91午夜精品亚洲一区二区三区| 中文精品一卡2卡3卡4更新| 国产在视频线精品| 国产深夜福利视频在线观看| av国产久精品久网站免费入址| 一本久久精品| 久久久久久久久久久丰满| av有码第一页| 精品久久久久久久久亚洲| 日本av手机在线免费观看| 国产视频内射| 97超碰精品成人国产| 日韩av在线免费看完整版不卡| √禁漫天堂资源中文www| a 毛片基地| 99久久精品一区二区三区| 天天操日日干夜夜撸| 久久久国产一区二区| 中文乱码字字幕精品一区二区三区| 午夜影院在线不卡| 肉色欧美久久久久久久蜜桃| 少妇人妻久久综合中文| videossex国产| 精品人妻一区二区三区麻豆| 国产男女超爽视频在线观看| 亚洲伊人久久精品综合| 亚洲成人手机| 乱人伦中国视频| 大陆偷拍与自拍| 十分钟在线观看高清视频www| 最后的刺客免费高清国语| 高清毛片免费看| www.av在线官网国产| 黄片无遮挡物在线观看| 观看美女的网站| 欧美 日韩 精品 国产| 十八禁网站网址无遮挡| 3wmmmm亚洲av在线观看| 久久国产亚洲av麻豆专区| 18禁观看日本| 国产精品一区二区在线观看99| 又大又黄又爽视频免费| 18禁在线无遮挡免费观看视频| 国产在线一区二区三区精| 欧美日韩综合久久久久久| av免费在线看不卡| 免费日韩欧美在线观看| 亚洲丝袜综合中文字幕| 亚洲精品亚洲一区二区| 青春草亚洲视频在线观看| 热re99久久精品国产66热6| 十八禁网站网址无遮挡| 日韩精品有码人妻一区| av卡一久久| 91成人精品电影| 人妻夜夜爽99麻豆av| 国产精品欧美亚洲77777| 国产日韩欧美视频二区| 不卡视频在线观看欧美| 免费播放大片免费观看视频在线观看| 18禁在线无遮挡免费观看视频| 一个人免费看片子| 亚洲av日韩在线播放| 97在线视频观看| 97精品久久久久久久久久精品| 国产不卡av网站在线观看| 国产一区二区三区av在线| 国产综合精华液| 亚洲精品国产av蜜桃| 最近中文字幕2019免费版| 久久久精品94久久精品| 国产乱来视频区| 国产精品不卡视频一区二区| 免费高清在线观看视频在线观看| 久久午夜综合久久蜜桃| 久久久久久久亚洲中文字幕| 汤姆久久久久久久影院中文字幕| 18禁在线播放成人免费| 天堂俺去俺来也www色官网| 一本一本久久a久久精品综合妖精 国产伦在线观看视频一区 | 欧美亚洲 丝袜 人妻 在线| 国产片内射在线| a级毛色黄片| 在线精品无人区一区二区三| 日本与韩国留学比较| 校园人妻丝袜中文字幕| 欧美日韩亚洲高清精品| 日本黄色日本黄色录像| 国产极品粉嫩免费观看在线 | av女优亚洲男人天堂| h视频一区二区三区| 亚洲av中文av极速乱| 亚洲情色 制服丝袜| 另类精品久久| av有码第一页| 国产成人免费观看mmmm| av不卡在线播放| 久久这里有精品视频免费| 日韩av在线免费看完整版不卡| 搡老乐熟女国产| 国产精品久久久久久久久免| 看免费成人av毛片| 草草在线视频免费看| 中文字幕精品免费在线观看视频 | 人妻系列 视频| 免费看光身美女| 国产国语露脸激情在线看| 最后的刺客免费高清国语| 国产免费又黄又爽又色| 久久免费观看电影| 久久人人爽av亚洲精品天堂| 麻豆乱淫一区二区| 亚洲国产日韩一区二区| 精品一区二区免费观看| 热99国产精品久久久久久7| 少妇被粗大的猛进出69影院 | 国产又色又爽无遮挡免| 婷婷色综合大香蕉| 久久久久精品性色| 熟女av电影| 99热网站在线观看| 久久久精品区二区三区| 欧美三级亚洲精品| 观看美女的网站| 国产亚洲av片在线观看秒播厂| 久久热精品热| 精品久久久精品久久久| 人人妻人人爽人人添夜夜欢视频| 91精品三级在线观看| 国产成人精品久久久久久| 天堂8中文在线网| 国产亚洲av片在线观看秒播厂| 亚洲精品自拍成人| 91精品伊人久久大香线蕉| 国产免费又黄又爽又色| 国产一区二区三区av在线| 免费观看的影片在线观看| 蜜桃在线观看..| 日本vs欧美在线观看视频| 少妇人妻精品综合一区二区| 久久精品人人爽人人爽视色| 国产精品三级大全| 免费黄网站久久成人精品| 美女大奶头黄色视频| 久久国产亚洲av麻豆专区| av专区在线播放| 又大又黄又爽视频免费| a 毛片基地| 久久精品人人爽人人爽视色| 97在线视频观看| 乱人伦中国视频| 超色免费av| 欧美 亚洲 国产 日韩一| 亚洲,欧美,日韩| 日韩制服骚丝袜av| 秋霞在线观看毛片| 在线天堂最新版资源| 人人澡人人妻人| 青春草视频在线免费观看| 又大又黄又爽视频免费| 亚洲欧美日韩另类电影网站| 国产av精品麻豆| 观看美女的网站| 在线观看免费视频网站a站| 一区二区av电影网| 韩国av在线不卡| 大话2 男鬼变身卡| 男男h啪啪无遮挡| 日韩成人伦理影院| 国产欧美另类精品又又久久亚洲欧美| 91精品国产九色| 亚洲激情五月婷婷啪啪| 亚洲精品国产av成人精品| 伊人久久精品亚洲午夜| 精品久久国产蜜桃| 在线观看人妻少妇| 欧美日韩精品成人综合77777| 亚洲国产色片| 大陆偷拍与自拍| 最近中文字幕高清免费大全6| 精品人妻在线不人妻| 亚洲一级一片aⅴ在线观看| 国产精品蜜桃在线观看| 亚洲精品视频女| 国内精品宾馆在线| 国产免费现黄频在线看| 黄片播放在线免费| 人妻 亚洲 视频| 一本色道久久久久久精品综合| 亚洲国产成人一精品久久久| 这个男人来自地球电影免费观看 | videossex国产| 夜夜爽夜夜爽视频| 伊人亚洲综合成人网| 一本久久精品| 国产欧美亚洲国产| 欧美性感艳星| 午夜视频国产福利| 中文精品一卡2卡3卡4更新| 亚洲图色成人| 欧美日韩视频精品一区| 亚洲欧美日韩另类电影网站| 精品人妻偷拍中文字幕| 国产老妇伦熟女老妇高清| 天堂中文最新版在线下载| 国内精品宾馆在线| 九草在线视频观看| 国产高清国产精品国产三级| 欧美97在线视频| 成人国产av品久久久| 午夜日本视频在线| 最后的刺客免费高清国语| 大香蕉久久网| 色视频在线一区二区三区| 亚洲精品久久成人aⅴ小说 | 国产免费一区二区三区四区乱码| 国产成人freesex在线| 中国国产av一级| 午夜视频国产福利| 国产男女内射视频| 精品久久久噜噜| 久久久久久伊人网av| 久久久久久人妻| 观看av在线不卡| 蜜桃国产av成人99| 国产午夜精品久久久久久一区二区三区| 九色亚洲精品在线播放| 边亲边吃奶的免费视频| 国内精品宾馆在线| 国产精品久久久久久久电影| 一区二区三区免费毛片| 看免费成人av毛片| 日本爱情动作片www.在线观看| 色5月婷婷丁香| 亚洲av电影在线观看一区二区三区| 成人午夜精彩视频在线观看| 2018国产大陆天天弄谢| 国产高清三级在线| 日韩大片免费观看网站| 国产亚洲精品第一综合不卡 | 国产极品粉嫩免费观看在线 | 国产伦理片在线播放av一区| a级毛片免费高清观看在线播放| 一级毛片aaaaaa免费看小| 久久人人爽人人爽人人片va| 欧美一级a爱片免费观看看| 日韩三级伦理在线观看| 国产高清三级在线| 国产欧美另类精品又又久久亚洲欧美| 精品亚洲成a人片在线观看| 日日撸夜夜添| 国产亚洲精品第一综合不卡 | 搡女人真爽免费视频火全软件| 蜜桃久久精品国产亚洲av| 亚洲第一区二区三区不卡| 亚洲欧美清纯卡通| 狠狠婷婷综合久久久久久88av| 最后的刺客免费高清国语| 国产av精品麻豆| 插阴视频在线观看视频| 熟女电影av网| av不卡在线播放| 亚洲精品aⅴ在线观看| 国产老妇伦熟女老妇高清| 两个人的视频大全免费| 亚洲欧美中文字幕日韩二区| 满18在线观看网站| 欧美日韩av久久| 亚洲精品视频女| 99热这里只有是精品在线观看| 大香蕉久久成人网| 欧美亚洲日本最大视频资源| 亚洲欧美成人综合另类久久久| 在线亚洲精品国产二区图片欧美 | 亚洲欧美中文字幕日韩二区| 满18在线观看网站| a级毛片黄视频| 91久久精品电影网| a 毛片基地| 一级,二级,三级黄色视频| 久久久久国产精品人妻一区二区| 三级国产精品欧美在线观看| 国产片特级美女逼逼视频| 寂寞人妻少妇视频99o| 亚洲精品日本国产第一区| 成人毛片60女人毛片免费| 国产精品久久久久久精品电影小说| 永久免费av网站大全| 国产老妇伦熟女老妇高清| 亚洲精品aⅴ在线观看| 午夜激情av网站|