• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    一款人工智能芯片上FCOS模型的應(yīng)用研究

    2023-05-19 07:50:58林廣棟黃光紅陸俊峰
    關(guān)鍵詞:深度人工智能模型

    林廣棟,黃光紅,陸俊峰

    (中國電子科技集團(tuán)公司第三十八研究所,安徽 合肥 230094)

    0 引 言

    近年來,深度學(xué)習(xí)模型在計算機(jī)視覺、語音處理等人工智能領(lǐng)域得到了越來越廣泛的應(yīng)用,很多應(yīng)用領(lǐng)域要求快速且低功耗地完成深度學(xué)習(xí)模型的推理。例如,在自動駕駛領(lǐng)域,要求深度學(xué)習(xí)模型在限定的時間內(nèi)完成圖像傳感器拍攝的圖像中的目標(biāo)識別任務(wù);在手機(jī)等端側(cè)設(shè)備中,要求進(jìn)行圖像識別、目標(biāo)檢測的深度學(xué)習(xí)模型的能耗盡可能小;在大型數(shù)據(jù)中心,能耗已經(jīng)成為其成本的重要組成部分,降低深度學(xué)習(xí)模型在數(shù)據(jù)中心推理和訓(xùn)練的能耗成為降低數(shù)據(jù)中心成本的重要因素。然而,深度學(xué)習(xí)模型的參數(shù)量和計算量巨大,在傳統(tǒng)的CPU/DSP上難以完成高性能且低功耗的推理。因此,專門用于深度學(xué)習(xí)模型推理的人工智能芯片成為目前研究的熱點(diǎn),且已經(jīng)有成熟的產(chǎn)品出現(xiàn)[1-2]。中國電子科技集團(tuán)公司第三十八所研制了一款人工智能芯片,該芯片是一個異構(gòu)的SOC(System On Chip)芯片,由支持通用軟件的中央處理核心(Central Processing Unit,CPU)和神經(jīng)網(wǎng)絡(luò)加速核(Neural Network Accelerator,NNA)構(gòu)成。其中CPU負(fù)責(zé)一般的軟件(如Linux或嵌入式操作系統(tǒng))的運(yùn)行,而NNA負(fù)責(zé)在CPU的調(diào)度下完成數(shù)值計算密集的神經(jīng)網(wǎng)絡(luò)推理任務(wù),兩者配合高效地完成深度學(xué)習(xí)模型的推理。FCOS模型是目前比較先進(jìn)的一種單階段無錨框的目標(biāo)檢測深度學(xué)習(xí)模型[3],該模型首次提出了對目標(biāo)框內(nèi)的所有特征點(diǎn)輸出目標(biāo)的位置并進(jìn)行訓(xùn)練的機(jī)制。這種機(jī)制在后續(xù)很多新的目標(biāo)檢測深度學(xué)習(xí)模型中得到應(yīng)用。該文研究了FCOS模型在該人工智能芯片上的硬件加速技術(shù),介紹了深度學(xué)習(xí)模型在該人工智能芯片上部署的一般流程,并研究了人工智能芯片的關(guān)鍵配置如算力、DDR帶寬、數(shù)據(jù)類型對推理性能、最終效果的影響。

    1 FCOS模型介紹

    FCOS是一個一階段的不基于錨框的目標(biāo)檢測深度學(xué)習(xí)模型。與其他的一階段深度學(xué)習(xí)模型類似,它不需要提取候選區(qū)域然后在候選區(qū)域上執(zhí)行圖像分類操作。與yolo系列基于錨框的目標(biāo)檢測模型相反,它不需要預(yù)先設(shè)計和定義錨框。它針對輸出特征圖的每個位置,輸出這個位置上的目標(biāo)的左上角、右下角頂點(diǎn)相對于該位置的偏移。FCOS模型由骨干(backbone)網(wǎng)絡(luò)、頸(neck)網(wǎng)絡(luò)、頭(head)網(wǎng)絡(luò)組成,其中骨干網(wǎng)絡(luò)負(fù)責(zé)提取圖像不同層次的特征,頸網(wǎng)絡(luò)負(fù)責(zé)把不同層次的特征融合,而頭網(wǎng)絡(luò)負(fù)責(zé)根據(jù)不同尺度的特征得到最終的輸出。它同樣采用了特征金字塔格式的輸出,輸出層共5個分支,分別代表不同尺度下目標(biāo)的檢測信息。FCOS目標(biāo)檢測模型的骨干網(wǎng)絡(luò)和頸網(wǎng)絡(luò)的結(jié)構(gòu)如圖1所示。

    圖1 FCOS深度學(xué)習(xí)模型骨干及頸網(wǎng)絡(luò)示意圖

    其頭部網(wǎng)絡(luò)的結(jié)構(gòu)如圖2所示。該圖僅僅是輸出的五個分支的一個分支示意圖,像這樣的輸出結(jié)構(gòu)在五個分支中都存在。該頭部由三類小分支組成,分別是以softmax方式處理后代表該位置目標(biāo)屬于各類別的概率的分支,代表該位置處于目標(biāo)的中心位置的程度的centerness分支,代表目標(biāo)左上角、右下角位置的偏移的分支。若目標(biāo)有N個類別,這三個小分支的通道數(shù)分別為:N、1、4。整個模型共5*(N+1+4)個輸出通道。

    FCOS目標(biāo)檢測深度學(xué)習(xí)模型提出了一種新的從圖像中提取更多訓(xùn)練數(shù)據(jù)的方法,即位置在真實目標(biāo)框里的點(diǎn)都可以輸出目標(biāo)的位置,都會進(jìn)行訓(xùn)練。其于FCOS模型的思想,很多新的模型被提出,如FCOS-3D[4]、TTFNet[5]等等。相比于yolo系列目標(biāo)檢測深度學(xué)習(xí)模型,FCOS模型不需要設(shè)置錨框,更便于訓(xùn)練,未來將在工業(yè)界得到更廣泛的應(yīng)用。

    圖2 FCOS深度學(xué)習(xí)模型頭部網(wǎng)絡(luò)示意圖

    2 一款人工智能芯片架構(gòu)介紹

    中國電子科技集團(tuán)公司第三十八研究所研制了一款人工智能推理芯片,其深度學(xué)習(xí)推理核心的理論峰值性能達(dá)到16TOPS(INT8),支持int8、uint8、int16、float16、bfloat16等數(shù)據(jù)類型。該芯片的核心SOC架構(gòu)如圖3所示。

    圖3 一款人工智能芯片硬件架構(gòu)

    該芯片是一個由深度學(xué)習(xí)推理加速核NNA與通用處理器CPU構(gòu)成的異構(gòu)計算系統(tǒng),兩者通過片上總線進(jìn)行交互。CPU通過AHB總線配置NNA的寄存器,而NNA通過AXI總線訪問片上存儲器與片外的DDR,CPU和DDR通過片上存儲器與片外的DDR共享數(shù)據(jù)。NNA內(nèi)部由4個同構(gòu)的計算核構(gòu)成,每核理論峰值算力為4 TOPS(INT8),4個核可以一起工作完成同一個任務(wù),也可以分別執(zhí)行不同的任務(wù)。該芯片的高速外設(shè)主要包括用于網(wǎng)絡(luò)通信的以太網(wǎng)接口(Gigabit Media Access Control,GMAC)和用于PCIE協(xié)議通信的PCIE接口。該芯片工作時,首先由CPU配置NNA,使其獲取到待執(zhí)行的神經(jīng)網(wǎng)絡(luò)模型的信息,如神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)、權(quán)重信息。由CPU控制GMAC或PCIE接口從片外設(shè)備(如傳感器芯片)獲取待處理的輸入數(shù)據(jù),存儲在DDR上。之后CPU控制NNA讀取輸入數(shù)據(jù),執(zhí)行神經(jīng)網(wǎng)絡(luò)模型的推理過程,并把神經(jīng)網(wǎng)絡(luò)模型的輸出結(jié)果寫到DDR上。之后CPU再控制GMAC或PCIE把計算結(jié)果傳輸?shù)狡庠O(shè)備,進(jìn)行下一步處理。該芯片配置了一塊片上存儲器(On Chip Memory,OCM),該存儲器相比DDR的訪問帶寬更高。神經(jīng)網(wǎng)絡(luò)推理過程中產(chǎn)生的需要反復(fù)使用的中間數(shù)據(jù),如中間特征圖的值,優(yōu)先存放在OCM上,以提高推理效率。

    3 FCOS模型部署步驟

    該人工智能芯片提供了完善的軟件工具鏈來支持深度學(xué)習(xí)模型的部署,包括如下步驟:

    ①導(dǎo)入:將各種深度學(xué)習(xí)軟件框架生成的模型文件解析為該人工智能芯片內(nèi)部的模型表示方式,以便后續(xù)處理。

    ②量化:深度學(xué)習(xí)軟件框架中一般用浮點(diǎn)數(shù)表示深度學(xué)習(xí)模型,而如果量化為低位寬的定點(diǎn)數(shù)在芯片上進(jìn)行實時推理,將可提高推理速度[6-7]。對深度學(xué)習(xí)模型的量化有兩種方式:量化敏感的訓(xùn)練[8](Quantization-Aware Training,QAT)、訓(xùn)練后量化[9](Post-Training Quantization,PTQ)。前者在量化完成之后再使用訓(xùn)練數(shù)據(jù)對量化后的模型進(jìn)行精調(diào)。后者在訓(xùn)練完成之后根據(jù)一些測量數(shù)據(jù)對激活度的范圍進(jìn)行測量后直接量化。該人工智能芯片配套工具鏈?zhǔn)褂玫氖怯?xùn)練后量化方法。量化時,需要提供少量測試數(shù)據(jù),軟件工具鏈會對這些輸入數(shù)據(jù)執(zhí)行推理過程,以得到深度學(xué)習(xí)模型各層特征圖的取值范圍,再進(jìn)行量化,以使量化后的定點(diǎn)數(shù)最大程度地覆蓋原始模型的浮點(diǎn)數(shù)的取值范圍。深度學(xué)習(xí)模型的量化分為不同的層次,包括逐層量化[10]、分組量化[11]、逐通道量化[12]等等。該人工智能芯片的軟件工具鏈的量化算法均使用逐層量化的方式。深度學(xué)習(xí)模型在芯片中的量化推理方式按量化參數(shù)是否動態(tài)變化又可分為兩類:動態(tài)量化[13]、靜態(tài)量化[14]。前者的量化參數(shù)會在運(yùn)行時根據(jù)實際激活度的變化范圍進(jìn)行調(diào)整;而后者的量化參數(shù)在推理前確定,并在運(yùn)行時保持不變。該人工智能芯片的軟件工具鏈的量化方式是靜態(tài)量化方式。

    ③優(yōu)化:該人工智能芯片的軟件工具鏈內(nèi)部以計算圖的方式表示深度學(xué)習(xí)模型,基于計算圖,可以執(zhí)行如算子合并、冗余計算刪除等計算圖優(yōu)化操作,在不降低精度的基礎(chǔ)上提高性能。

    ④導(dǎo)出:把經(jīng)過量化、優(yōu)化后的深度學(xué)習(xí)模型保存下來,輸出為模型文件。該人工智能芯片的模型文件同時包含模型的結(jié)構(gòu)與量化后的權(quán)重。

    ⑤推理:芯片上的驅(qū)動在應(yīng)用程序的調(diào)用下,加載并解析模型文件,根據(jù)具體的硬件配置對計算圖執(zhí)行進(jìn)一步的優(yōu)化,并執(zhí)行實時的模型推理任務(wù)。

    4 量化方式

    由于深度學(xué)習(xí)模型中的權(quán)重存在一定冗余性,因此把權(quán)重及激活度量化為低位寬的數(shù)據(jù),可以在不明顯降低模型精度的前提下減少模型的計算量、減小模型的大小,進(jìn)而減少模型推理時對于片外數(shù)據(jù)傳輸帶寬的需求,最終提高模型推理的效率。量化算法主要分為兩類:對稱量化[15]和非對稱量化[16]。當(dāng)以對稱量化算法量化為8位時,數(shù)據(jù)類型稱為int8;當(dāng)以非對稱量化算法量化為8位時,數(shù)據(jù)類型稱為uint8;當(dāng)以對稱量化算法量化為16位時,數(shù)據(jù)類型稱為int16。

    4.1 INT8

    量化為INT8方式時,由浮點(diǎn)數(shù)轉(zhuǎn)換為定點(diǎn)數(shù)的計算方式為:

    首先計算中間值:

    data=round(fdata*2fl)

    然后計算最終量化值:

    而由量化后的INT8值計算原始浮點(diǎn)值的方式如下:

    fdata=qdata*2-fl

    其中,fl是進(jìn)行INT8量化后的常數(shù),每一層的權(quán)重與每一層的激活度在量化后有不同的fl值,分別根據(jù)該層權(quán)重與激活度的分布計算得到。其中權(quán)重的fl的計算方法如下:

    fl=7-「log2(max(abs(w)))?

    其中,max(abs(w))代表一層的權(quán)重的絕對值的最大值。激活度的fl按類似的方法根據(jù)激活度的分布計算得到。

    4.2 UINT8

    UINT8型量化將權(quán)重和激活度都量化為無符號的8位數(shù),量化后的數(shù)值范圍在0~255之間。由浮點(diǎn)數(shù)計算UINT8量化數(shù)的計算方式如下:

    首先計算中間值:

    data=round(fdata/scale+zeropoint)

    然后計算最終量化值:

    而由量化后的UINT8型數(shù)據(jù)轉(zhuǎn)換為浮點(diǎn)數(shù)據(jù)的計算方式為:

    fdata=(qdata-zeropoint)*scale

    其中,scale和zeropoint為根據(jù)特定算法計算得到的縮放因子與零點(diǎn)。以計算某一層的權(quán)重的scale和zeropoint為例,記神經(jīng)網(wǎng)絡(luò)某層的權(quán)重的最大值為max(w),最小值為min(w),則該層的權(quán)重量化為UINT8時的scale和zeropoint的計算方式如下:

    scale=

    4.3 INT16

    量化為INT16方式時,由浮點(diǎn)數(shù)轉(zhuǎn)換為定點(diǎn)數(shù)的計算方式為:

    首先計算中間值:

    data=round(fdata*2fl)

    然后計算最終量化值:

    而由量化后的INT8值計算原始浮點(diǎn)值的方式如下:

    fdata=qdata*2-fl

    其中,fl是進(jìn)行INT8量化后的常數(shù),每一層的權(quán)重與每一層的激活度在量化后有不同的fl值,分別根據(jù)該層權(quán)重與激活度的分布計算得到。其中權(quán)重的fl的計算方法如下:

    fl=15-「log2(max(abs(w)))?

    其中,max(abs(w))代表一層的權(quán)重的絕對值的最大值。激活度的fl按類似的方法根據(jù)激活度的分布計算得到。

    4.4 FLOAT16

    FLOAT16是IEEE規(guī)定的標(biāo)準(zhǔn)數(shù)據(jù)格式,共16位,各位的含義如表1所示。

    表1 FLOAT16數(shù)據(jù)類型

    4.5 BFLOAT16

    在深度學(xué)習(xí)領(lǐng)域,由于網(wǎng)絡(luò)模型中存在大量參數(shù),這些參數(shù)具有大量的冗余性,精確地表示這些參數(shù)的重要性降低。在深度學(xué)習(xí)模型推理領(lǐng)域,人們開始使用bfloat16數(shù)據(jù)類型,這種數(shù)據(jù)類型相對于常規(guī)的float16數(shù)據(jù)類型降低了尾數(shù)的位寬,增加了指數(shù)的位寬,其效果是增加了其表示的數(shù)值的范圍,減少了表示的精度。這種數(shù)據(jù)類型能在與float16相同的數(shù)據(jù)位寬下以較低的精度表示更大的數(shù)據(jù)范圍,比較適合深度學(xué)習(xí)領(lǐng)域。這種數(shù)據(jù)類型各位的含義如表2所示。

    表2 BFLOAT16數(shù)據(jù)類型

    5 實 驗

    以下實驗基于中國電子科技集團(tuán)公司開發(fā)的針對該人工智能芯片的演示板卡完成,該演示板卡實物圖如圖4所示。

    圖4 一款人工智能芯片演示板卡實物圖

    以下實驗中,FCOS模型的輸入圖像寬度為1 216,高度為800,總卷積計算量約為138 GOPS。

    5.1 片上存儲器的影響

    該人工智能芯片內(nèi)部設(shè)置了4 MB大小的片上存儲器。片上存儲器的訪問延遲比片外的DDR小得多,并且其帶寬可以達(dá)到片上總線傳輸帶寬的上限。將FOCS模型量化為精度比較高的INT16數(shù)據(jù)類型,分別控制使用不同大小的片上存儲器,對性能的影響如表3所示。

    表3 片上存儲器大小對FCOS模型推理時間的影響

    由表3可以看出,使用芯片內(nèi)部的片上存儲器可以提高深度學(xué)習(xí)模型的推理速度。當(dāng)然,片上存儲器會增加芯片的面積與功耗,其容量不可能設(shè)置太大,需要在推理性能與芯片的面積和功耗之間進(jìn)行平衡。

    5.2 DDR帶寬的影響

    深度學(xué)習(xí)模型推理時,其中間層的通道數(shù)量很大,使得中間層特征圖無法在片上存儲器全部存儲,需要在片外容量更大的DDR中暫存。這就導(dǎo)致深度學(xué)習(xí)模型推理時需要進(jìn)行大量片上數(shù)據(jù)與片外數(shù)據(jù)的傳輸,因此,DDR的帶寬對模型推理的性能影響很大。將FCOS模型量化為INT16數(shù)據(jù)類型,然后分別配置DDR控制器的頻率為不同的數(shù)值,在不同的DDR帶寬下進(jìn)行推理,模型推理的性能如表4所示。該芯片使用DDR控制器數(shù)據(jù)位寬為64位,理論峰值帶寬(bandwidth)與頻率(frequency)的關(guān)系為:

    bandwidth=frequency*64

    其中,頻率的單位為MHz,而帶寬的單位為Mbit/s。

    表4 DDR帶寬對FCOS模型推理時間的影響

    可見,隨著DDR頻率的降低,推理性能也呈現(xiàn)明顯的降低。顯然,DDR帶寬對推理性能有著重要的影響。

    5.3 DDR配置的影響

    DDR有很多配置選項,包括配置各AXI端口的優(yōu)先級、帶寬限制、是否使能bank group、寫命令重排、命令隊列選擇等等。對DDR控制器的不同屬性進(jìn)行配置的寄存器數(shù)量多達(dá)三百多個。同DDR的帶寬配置一樣,DDR的各項配置也會對推理性能產(chǎn)生影響。該文無法窮盡所有的DDR配置,僅就是否使能bank group、是否打開寫重排功能、是否打開命令選擇功能三個選項進(jìn)行實驗,檢驗這些配置對推理性能的影響。表5為幾種典型的DDR配置及不同的DDR帶寬下FCOS模型的推理性能,該表中的數(shù)據(jù)均是在模型量化為INT16數(shù)據(jù)類型、使用4核推理、片上存儲器容量為4 MB時統(tǒng)計出來的。

    其中bank group是DDR4設(shè)備專用的概念,它把區(qū)分bank group的第[0]地址放到區(qū)分DRR顆?!傲小钡牡刂肺恢?使DDR控制器同時維護(hù)兩個bank group的狀態(tài),可以以更高的效率支持連續(xù)的burst讀寫。在本芯片的DDR配置中,支持bank group時,bank group的第[0]位位于軟件視角的地址的第[6]位。當(dāng)DDR收到的burst請求大于64 byte時,使能bank group的效果更好。但實驗表明,使能bank group這個功能(bg_rotate_en)反而會降低性能,這是因為NNA發(fā)出的burst請求大小一般為64個byte或更小,而很少發(fā)出更大burst請求,這是由NNA的核心架構(gòu)決定的。因此,NNA無法利用bank group的優(yōu)勢。

    表5 不同DDR配置下FCOS模型推理時間 ms

    DDR控制器維護(hù)了一個命令隊列,按照一定的邏輯把來自不同總線端口的訪問請求放入隊列中,并支持按一定的邏輯從隊列頭部的4個命令中選擇最適當(dāng)?shù)拿畎l(fā)送給DDR顆粒。DDR控制器一般根據(jù)bank是否沖突、地址是否沖突等規(guī)則決定從命令隊列前4個命令中取出命令的順序。若關(guān)閉命令隊列選擇(in_order_accept)功能,則DDR控制器總是選擇隊列頭部的命令發(fā)送給顆粒。實驗表明,打開命令隊列選擇的推理性能更好,這是因為DDR控制器會在隊列頭部的命令因為顆粒未準(zhǔn)備好等原因而無法執(zhí)行時,選擇隊列頭部前4個命令中的其他命令執(zhí)行,從而提高了效率。

    DDR控制器對來自不同端口的寫命令有三種策略(wr_order_req):(1)不論是否是來自相同的總線端口的寫請求,也不論命令I(lǐng)D是否相同,都可以改變寫的順序;(2)來自相同總線端口的帶有相同寫命令I(lǐng)D的請求不會被重排,其他的寫命令可以被重排;(3)只要是來自相同總線端口的寫請求,都會按發(fā)送到DDR控制器的順序執(zhí)行,不會被重排;來自不同總線端口的寫請求會被重排。顯然,根據(jù)DDR顆粒的狀態(tài)及時改變寫命令的執(zhí)行順序,將可以提高寫命令的執(zhí)行效率。實驗表明,寫重排功能打開時的推理性能要優(yōu)于寫重排關(guān)閉時的推理性能。

    5.4 算力的影響

    該人工智能芯片中,深度學(xué)習(xí)推理加速核內(nèi)部由4個結(jié)構(gòu)相同的核構(gòu)成,每個核的理論峰值算力為4 TOPS(int8),這4個核可以組合配置為不同的算力。作為深度學(xué)習(xí)推理的核心部件,算力的配置顯然也對推理性能產(chǎn)生影響。表6統(tǒng)計出不同算力配置下FCOS模型的推理性能,此表中的數(shù)據(jù)均是模型量化為INT16數(shù)據(jù)類型、片上存儲器容量設(shè)為4 MB時統(tǒng)計出的。

    表6 算力配置對FCOS模型推理時間的影響

    顯然,算力配置越高,推理性能越強(qiáng)。但推理性能與算力之間并不是線性關(guān)系。例如,四核配置下的推理時間并不是單核配置下推理時間的1/4,主要原因有兩點(diǎn):(1)算力提高,計算需要的數(shù)據(jù)量線性增長,對帶寬的要求也相應(yīng)提高,但芯片的整體帶寬不變,因此推理性能不能線性增長;(2)核數(shù)量增加,需要額外的操作進(jìn)行特征圖的切分與計算結(jié)果的合并、核之間計算的同步,帶來額外的負(fù)擔(dān)。因此,推理性能并不能隨著算力配置的增加而線性增加。

    5.5 數(shù)據(jù)類型的影響

    部分硬件電路可復(fù)用為支持不同的數(shù)據(jù)類型。例如,一個計算INT16乘法的電路可以復(fù)用為4個INT8乘法的電路。同樣,該電路也可復(fù)用于計算浮點(diǎn)數(shù)據(jù)類型尾數(shù)的乘法。理論上,本芯片計算INT8數(shù)據(jù)類型的算力是計算INT16數(shù)據(jù)類型時算力的4倍。由于芯片帶寬、片上存儲器容量等其他因素限制,實際執(zhí)行推理運(yùn)算時,INT8與INT16數(shù)據(jù)類型的表現(xiàn)并不完全是4倍的關(guān)系。在CPU運(yùn)行在1 200 MHz、NNA運(yùn)行在660 MHz、DDR運(yùn)行在2 400 MHz頻率下,片上存儲器容量固定為4 MB時,量化為各種數(shù)據(jù)類型的FCOS模型的運(yùn)行速度如表7所示。

    表7 數(shù)據(jù)類型對FCOS模型推理時間的影響

    從推理性能上看,int8和uint8數(shù)據(jù)類型的推理性能幾乎相同,int16和float16的推理性能約是int8和uint8的3~4倍。Bfloat16由于需要在推理前和推理后執(zhí)行向常規(guī)數(shù)據(jù)類型的轉(zhuǎn)換,性能最差。

    使用不同數(shù)據(jù)類型對FCOS模型進(jìn)行量化后進(jìn)行目標(biāo)檢測的實際效果如表8所示。

    表8 FCOS模型量化為不同數(shù)據(jù)類型后的實際目標(biāo)檢測效果

    從以上結(jié)果可以看出,量化為BFLOAT和INT16數(shù)量類型的FCOS模型可以檢測出最左側(cè)一列中從網(wǎng)球到網(wǎng)球拍、人三種不同尺度的物體,表現(xiàn)最好。最終推理的結(jié)果精度上看,效果從好到差依次為:bfloat16=int16>float16>uint8>int8。其中int16數(shù)據(jù)類型等效于對同一層的特征圖,使用統(tǒng)一的指數(shù)來表示,由于其尾數(shù)位數(shù)大于float16數(shù)據(jù)類型的尾數(shù)位數(shù)(10位),因此,其最終的效果比float16更高。

    6 結(jié)束語

    該文介紹了FCOS目標(biāo)檢測模型的基本網(wǎng)絡(luò)結(jié)構(gòu)。同時介紹了一款人工智能芯片的基本硬件結(jié)構(gòu)。研究了把FCOS深度學(xué)習(xí)模型應(yīng)用到該人工智能芯片的方法,并研究了片上存儲器大小、DDR帶寬、DDR配置、算力、不同的量化算法等因素對推理效果的影響。研究表明,從對推理精度的影響來看,int16量化方法和bfloat16數(shù)據(jù)類型的精度最高,float16、uint8數(shù)據(jù)類型的精度依次降低,int8最差。從對推理時間的影響來看,bfloat16數(shù)據(jù)類型的效果最差,int16和float16的性能次之,int8和uint8的推理時間最短。研究結(jié)果證實,片上存儲器容量越大、DDR帶寬都對推理時間產(chǎn)生重要的影響,片上存儲器容量越大、DDR帶寬越大,推理時間越短;反之則越長。另外,研究還表明,DDR的配置,如是否使能bank group、是否使能命令隊列選擇功能、是否支持寫重排,也會對推理時間產(chǎn)生影響,但影響的程度不如DDR帶寬的影響。研究成果將為人工智能芯片、深度學(xué)習(xí)模型推理算法的研究者提供參考。

    猜你喜歡
    深度人工智能模型
    一半模型
    深度理解一元一次方程
    重要模型『一線三等角』
    重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
    深度觀察
    深度觀察
    2019:人工智能
    商界(2019年12期)2019-01-03 06:59:05
    人工智能與就業(yè)
    深度觀察
    數(shù)讀人工智能
    小康(2017年16期)2017-06-07 09:00:59
    成人鲁丝片一二三区免费| 九色成人免费人妻av| 日韩中文字幕欧美一区二区| 黑人欧美特级aaaaaa片| 成人无遮挡网站| 99久久精品热视频| 手机成人av网站| 精品人妻一区二区三区麻豆 | www.熟女人妻精品国产| 夜夜爽天天搞| av欧美777| 韩国av一区二区三区四区| 国内精品久久久久久久电影| 制服丝袜大香蕉在线| 亚洲乱码一区二区免费版| 国产亚洲精品综合一区在线观看| aaaaa片日本免费| 最近视频中文字幕2019在线8| 国产男靠女视频免费网站| 欧美+日韩+精品| 亚洲第一欧美日韩一区二区三区| 欧美激情在线99| 高清日韩中文字幕在线| 成年女人看的毛片在线观看| 免费在线观看日本一区| x7x7x7水蜜桃| av视频在线观看入口| 99久久精品热视频| 悠悠久久av| 亚洲国产欧美网| 亚洲欧美精品综合久久99| 亚洲精品影视一区二区三区av| 99热只有精品国产| 久久久久久九九精品二区国产| 国产亚洲精品一区二区www| 首页视频小说图片口味搜索| 免费人成视频x8x8入口观看| 国产91精品成人一区二区三区| 国产高清视频在线播放一区| 成人永久免费在线观看视频| 精品久久久久久成人av| 日本一二三区视频观看| 亚洲国产欧美人成| 精华霜和精华液先用哪个| 色老头精品视频在线观看| 两个人看的免费小视频| 51国产日韩欧美| 国产黄色小视频在线观看| 精品国产美女av久久久久小说| 色哟哟哟哟哟哟| 亚洲一区二区三区不卡视频| 人妻久久中文字幕网| 国产精华一区二区三区| 欧美极品一区二区三区四区| 免费大片18禁| 九九久久精品国产亚洲av麻豆| av在线蜜桃| 国产精品亚洲美女久久久| 最新美女视频免费是黄的| 操出白浆在线播放| or卡值多少钱| 国产伦精品一区二区三区视频9 | av天堂在线播放| 免费无遮挡裸体视频| 国产av麻豆久久久久久久| 成人鲁丝片一二三区免费| a在线观看视频网站| a级毛片a级免费在线| 婷婷六月久久综合丁香| 每晚都被弄得嗷嗷叫到高潮| 国产精品亚洲美女久久久| 国产综合懂色| 国产97色在线日韩免费| 性色avwww在线观看| 九色成人免费人妻av| 18禁黄网站禁片免费观看直播| 熟女电影av网| 成人精品一区二区免费| 国产精品永久免费网站| 国产精品美女特级片免费视频播放器| 狠狠狠狠99中文字幕| АⅤ资源中文在线天堂| 国产成人系列免费观看| 我的老师免费观看完整版| 老司机深夜福利视频在线观看| 国产aⅴ精品一区二区三区波| 色视频www国产| 禁无遮挡网站| 性色av乱码一区二区三区2| 天堂动漫精品| 村上凉子中文字幕在线| 婷婷精品国产亚洲av| 日日摸夜夜添夜夜添小说| 18禁裸乳无遮挡免费网站照片| 18禁在线播放成人免费| 欧美黄色片欧美黄色片| 一级a爱片免费观看的视频| 免费在线观看影片大全网站| 欧美日韩精品网址| 亚洲国产欧美网| 国产成人av激情在线播放| 亚洲avbb在线观看| 国产精品美女特级片免费视频播放器| 一区二区三区免费毛片| 黄色视频,在线免费观看| 亚洲av免费在线观看| 久久亚洲精品不卡| 亚洲av成人不卡在线观看播放网| 国产视频一区二区在线看| 欧美乱色亚洲激情| 精品一区二区三区av网在线观看| 国产v大片淫在线免费观看| 国产麻豆成人av免费视频| 舔av片在线| 十八禁网站免费在线| 久久99热这里只有精品18| 日韩成人在线观看一区二区三区| 12—13女人毛片做爰片一| 亚洲精品一卡2卡三卡4卡5卡| 欧美日韩国产亚洲二区| 国产av麻豆久久久久久久| 国产色爽女视频免费观看| 性欧美人与动物交配| 国产精品美女特级片免费视频播放器| 岛国视频午夜一区免费看| 国内揄拍国产精品人妻在线| 欧美又色又爽又黄视频| 亚洲一区二区三区色噜噜| 精品福利观看| 国产伦一二天堂av在线观看| 日日摸夜夜添夜夜添小说| 午夜久久久久精精品| 美女高潮的动态| 国产成人av教育| 午夜福利在线观看吧| 久久6这里有精品| 久久亚洲精品不卡| 特级一级黄色大片| 免费在线观看成人毛片| 亚洲18禁久久av| 黄色成人免费大全| 久久久久精品国产欧美久久久| 午夜福利免费观看在线| 国产午夜福利久久久久久| 国产精品久久久久久久久免 | 久久久国产成人免费| 亚洲美女视频黄频| 搡老熟女国产l中国老女人| 制服人妻中文乱码| 两人在一起打扑克的视频| 最近在线观看免费完整版| 舔av片在线| 国产av不卡久久| 欧美黄色片欧美黄色片| 草草在线视频免费看| 午夜福利在线观看免费完整高清在 | 51国产日韩欧美| 欧美乱妇无乱码| 国产成人影院久久av| 欧美zozozo另类| а√天堂www在线а√下载| 舔av片在线| 国产一区二区在线av高清观看| 99热只有精品国产| 少妇丰满av| 亚洲国产精品999在线| 成人国产一区最新在线观看| 国产午夜福利久久久久久| 国产老妇女一区| 欧美乱色亚洲激情| 亚洲国产日韩欧美精品在线观看 | 久久精品国产自在天天线| 人人妻人人澡欧美一区二区| 欧美+亚洲+日韩+国产| 日韩欧美 国产精品| 全区人妻精品视频| 国产精品98久久久久久宅男小说| 亚洲欧美日韩东京热| 亚洲国产日韩欧美精品在线观看 | 日韩欧美三级三区| 亚洲美女视频黄频| 搡女人真爽免费视频火全软件 | 免费在线观看日本一区| 人妻丰满熟妇av一区二区三区| 级片在线观看| 国产综合懂色| 亚洲人成网站高清观看| 日本一本二区三区精品| 久久国产精品人妻蜜桃| 欧美大码av| 国产综合懂色| 淫妇啪啪啪对白视频| 人妻丰满熟妇av一区二区三区| 精品久久久久久久久久免费视频| 国产在线精品亚洲第一网站| 久久人妻av系列| 国产精品一区二区免费欧美| 国产高清三级在线| 久久国产精品人妻蜜桃| 精品一区二区三区av网在线观看| 国产成人a区在线观看| 亚洲av成人精品一区久久| 两个人看的免费小视频| 亚洲在线观看片| 两个人看的免费小视频| 人妻丰满熟妇av一区二区三区| 精品国内亚洲2022精品成人| 成人一区二区视频在线观看| 成人一区二区视频在线观看| 丁香六月欧美| 午夜免费男女啪啪视频观看 | 99久久成人亚洲精品观看| 色尼玛亚洲综合影院| 国产aⅴ精品一区二区三区波| 亚洲在线自拍视频| 免费人成在线观看视频色| 看黄色毛片网站| 搞女人的毛片| www日本在线高清视频| 欧美最新免费一区二区三区 | 色综合欧美亚洲国产小说| 欧洲精品卡2卡3卡4卡5卡区| 精品久久久久久久久久久久久| 国产在线精品亚洲第一网站| 可以在线观看毛片的网站| 国产一级毛片七仙女欲春2| 网址你懂的国产日韩在线| 在线天堂最新版资源| 国产高潮美女av| 国产三级中文精品| 免费看a级黄色片| 国产成人系列免费观看| 国产精品av视频在线免费观看| www.色视频.com| 天堂√8在线中文| 国产精品精品国产色婷婷| 少妇裸体淫交视频免费看高清| 一个人观看的视频www高清免费观看| 久久精品91无色码中文字幕| 国产精华一区二区三区| 亚洲成人久久爱视频| 国产单亲对白刺激| 日本三级黄在线观看| 观看免费一级毛片| a级一级毛片免费在线观看| 国产精品99久久久久久久久| 亚洲av二区三区四区| 国内精品美女久久久久久| 97碰自拍视频| 亚洲成人中文字幕在线播放| 九九久久精品国产亚洲av麻豆| 在线免费观看的www视频| 欧美一区二区国产精品久久精品| 观看美女的网站| 最后的刺客免费高清国语| 成人av在线播放网站| 国产亚洲欧美98| www.熟女人妻精品国产| 可以在线观看毛片的网站| 内射极品少妇av片p| 岛国在线观看网站| 国产99白浆流出| 村上凉子中文字幕在线| 国产精品久久久久久久电影 | 女人高潮潮喷娇喘18禁视频| 精品福利观看| 中文字幕高清在线视频| 熟女少妇亚洲综合色aaa.| 亚洲国产色片| 久久久久久久精品吃奶| 国产三级黄色录像| 婷婷六月久久综合丁香| 神马国产精品三级电影在线观看| 波野结衣二区三区在线 | 亚洲午夜理论影院| 男女那种视频在线观看| 老司机福利观看| 精品日产1卡2卡| 精品一区二区三区av网在线观看| 欧美乱色亚洲激情| 亚洲电影在线观看av| 97碰自拍视频| 精品国产美女av久久久久小说| 亚洲狠狠婷婷综合久久图片| 最后的刺客免费高清国语| e午夜精品久久久久久久| 国产又黄又爽又无遮挡在线| 国产午夜精品论理片| 精品国产超薄肉色丝袜足j| 成人三级黄色视频| 亚洲熟妇中文字幕五十中出| 亚洲欧美日韩卡通动漫| 一进一出抽搐动态| 国内久久婷婷六月综合欲色啪| 欧美高清成人免费视频www| 国产视频一区二区在线看| 亚洲成人精品中文字幕电影| 波多野结衣高清作品| 欧美在线一区亚洲| 在线免费观看不下载黄p国产 | 国产不卡一卡二| 亚洲精品国产精品久久久不卡| 色播亚洲综合网| 51国产日韩欧美| 男女那种视频在线观看| 国内精品一区二区在线观看| 中文字幕av成人在线电影| 国产精品久久久久久精品电影| 偷拍熟女少妇极品色| 精品一区二区三区视频在线 | 亚洲欧美日韩无卡精品| 久久精品影院6| 午夜福利在线观看吧| 欧美3d第一页| a级一级毛片免费在线观看| 欧美区成人在线视频| 一级a爱片免费观看的视频| 国产精品一区二区三区四区久久| 搡老妇女老女人老熟妇| 亚洲人与动物交配视频| av女优亚洲男人天堂| 男人和女人高潮做爰伦理| 精品久久久久久久末码| 久久久久久久精品吃奶| 99国产综合亚洲精品| 嫩草影院精品99| 国产亚洲欧美在线一区二区| 十八禁网站免费在线| 男女床上黄色一级片免费看| 少妇高潮的动态图| 无限看片的www在线观看| 久久久久免费精品人妻一区二区| av专区在线播放| 99热精品在线国产| 国内精品久久久久精免费| 国产综合懂色| 亚洲天堂国产精品一区在线| 中文在线观看免费www的网站| 欧美中文日本在线观看视频| 一级黄片播放器| 午夜激情欧美在线| 午夜激情欧美在线| 无人区码免费观看不卡| 国产美女午夜福利| 99久久综合精品五月天人人| 欧美高清成人免费视频www| 1000部很黄的大片| 国产精品av视频在线免费观看| 观看美女的网站| 一级黄片播放器| 美女被艹到高潮喷水动态| 国产视频一区二区在线看| 国产精品香港三级国产av潘金莲| 极品教师在线免费播放| 国产成人aa在线观看| 夜夜躁狠狠躁天天躁| 波野结衣二区三区在线 | 亚洲狠狠婷婷综合久久图片| 久久久国产成人免费| 国产 一区 欧美 日韩| 国产精品国产高清国产av| 亚洲乱码一区二区免费版| 欧美日韩中文字幕国产精品一区二区三区| 给我免费播放毛片高清在线观看| 熟女少妇亚洲综合色aaa.| 特级一级黄色大片| 女人高潮潮喷娇喘18禁视频| 国产亚洲欧美在线一区二区| 成年人黄色毛片网站| 欧美国产日韩亚洲一区| 成人高潮视频无遮挡免费网站| 国产男靠女视频免费网站| 成人特级av手机在线观看| 精品一区二区三区视频在线 | 亚洲美女视频黄频| 69av精品久久久久久| 99久国产av精品| 国产午夜精品论理片| 日本五十路高清| 亚洲av日韩精品久久久久久密| 国产真实乱freesex| 日韩大尺度精品在线看网址| 精品一区二区三区视频在线观看免费| 免费av毛片视频| 欧美xxxx黑人xx丫x性爽| 国产精品久久电影中文字幕| 好看av亚洲va欧美ⅴa在| 日本五十路高清| 乱人视频在线观看| 两人在一起打扑克的视频| 欧美日本视频| av天堂在线播放| 国产精品自产拍在线观看55亚洲| 午夜激情欧美在线| 在线国产一区二区在线| 神马国产精品三级电影在线观看| 久久久国产精品麻豆| x7x7x7水蜜桃| 欧美乱码精品一区二区三区| 亚洲精品在线观看二区| 天天添夜夜摸| 久久草成人影院| 内射极品少妇av片p| av国产免费在线观看| 欧美激情在线99| 日本三级黄在线观看| 免费av不卡在线播放| 国产欧美日韩一区二区三| 最后的刺客免费高清国语| 真实男女啪啪啪动态图| 欧美日韩黄片免| 哪里可以看免费的av片| 久久久国产成人免费| 一级毛片高清免费大全| 亚洲av成人不卡在线观看播放网| 国产一区二区三区在线臀色熟女| aaaaa片日本免费| 久久精品国产亚洲av涩爱 | 国产精品美女特级片免费视频播放器| 丁香六月欧美| 欧美午夜高清在线| 国产成人欧美在线观看| 国产99白浆流出| 国产高清有码在线观看视频| 国产精品永久免费网站| 成人特级黄色片久久久久久久| 男女床上黄色一级片免费看| 国产真实乱freesex| 午夜日韩欧美国产| 久久人人精品亚洲av| 亚洲av第一区精品v没综合| 亚洲人成网站在线播| 757午夜福利合集在线观看| 我的老师免费观看完整版| 床上黄色一级片| 日本黄色片子视频| 成人国产综合亚洲| 18禁国产床啪视频网站| 麻豆国产av国片精品| 成人欧美大片| 亚洲真实伦在线观看| 免费人成视频x8x8入口观看| 观看免费一级毛片| 在线观看av片永久免费下载| 国产精品女同一区二区软件 | 欧美av亚洲av综合av国产av| 男女视频在线观看网站免费| 亚洲av成人精品一区久久| 又粗又爽又猛毛片免费看| 亚洲人成电影免费在线| 99久久精品国产亚洲精品| 99久久九九国产精品国产免费| www.999成人在线观看| av片东京热男人的天堂| 欧美不卡视频在线免费观看| 岛国视频午夜一区免费看| 午夜福利视频1000在线观看| 麻豆一二三区av精品| 精华霜和精华液先用哪个| 黄片大片在线免费观看| 色综合婷婷激情| 国产主播在线观看一区二区| 欧美色视频一区免费| 欧美+日韩+精品| 国产91精品成人一区二区三区| 熟女人妻精品中文字幕| 免费看光身美女| 岛国视频午夜一区免费看| 久久久久性生活片| 一级黄色大片毛片| 亚洲国产欧美人成| 成人亚洲精品av一区二区| 国产一区二区三区视频了| 深爱激情五月婷婷| 午夜久久久久精精品| 国产精品综合久久久久久久免费| 亚洲av一区综合| 国产综合懂色| av中文乱码字幕在线| 午夜福利在线观看吧| 小蜜桃在线观看免费完整版高清| 色噜噜av男人的天堂激情| 麻豆国产av国片精品| 亚洲欧美日韩东京热| 88av欧美| 国产97色在线日韩免费| 国产视频一区二区在线看| 狂野欧美白嫩少妇大欣赏| 脱女人内裤的视频| 亚洲专区中文字幕在线| 香蕉丝袜av| 啦啦啦观看免费观看视频高清| 男女午夜视频在线观看| 国产精品精品国产色婷婷| 香蕉丝袜av| xxx96com| 夜夜看夜夜爽夜夜摸| 亚洲精品日韩av片在线观看 | 欧美成狂野欧美在线观看| www日本在线高清视频| www.999成人在线观看| 99热这里只有精品一区| 国产野战对白在线观看| 国产淫片久久久久久久久 | 亚洲久久久久久中文字幕| 亚洲欧美日韩东京热| 日本五十路高清| 欧美黑人巨大hd| 在线播放国产精品三级| 91字幕亚洲| 日韩欧美精品免费久久 | 人妻丰满熟妇av一区二区三区| 亚洲国产精品999在线| www.www免费av| 老熟妇乱子伦视频在线观看| 亚洲性夜色夜夜综合| 亚洲av成人精品一区久久| 国产一区在线观看成人免费| 国产精华一区二区三区| 国产亚洲精品一区二区www| 色吧在线观看| 中文字幕精品亚洲无线码一区| 久久精品国产综合久久久| 国产精品一及| 国产69精品久久久久777片| 日本黄色视频三级网站网址| 国产精品女同一区二区软件 | 日本五十路高清| 亚洲欧美日韩高清专用| 国产毛片a区久久久久| 噜噜噜噜噜久久久久久91| 精品国内亚洲2022精品成人| www.色视频.com| 中出人妻视频一区二区| 久久人人精品亚洲av| 国产成人aa在线观看| 日韩欧美在线乱码| 欧美午夜高清在线| 欧洲精品卡2卡3卡4卡5卡区| 久久精品人妻少妇| 欧美xxxx黑人xx丫x性爽| 免费av观看视频| 美女高潮喷水抽搐中文字幕| 熟女少妇亚洲综合色aaa.| 免费看a级黄色片| 欧美日韩福利视频一区二区| 夜夜看夜夜爽夜夜摸| 一区二区三区免费毛片| 老熟妇乱子伦视频在线观看| 成人午夜高清在线视频| 看片在线看免费视频| 亚洲av美国av| 99热这里只有精品一区| 亚洲成人中文字幕在线播放| 美女高潮的动态| 日韩欧美精品v在线| 一级黄片播放器| 中文字幕av成人在线电影| 日韩有码中文字幕| 老汉色∧v一级毛片| 久久九九热精品免费| 黄色成人免费大全| 亚洲欧美一区二区三区黑人| 中文字幕高清在线视频| 天堂动漫精品| 99久久成人亚洲精品观看| 在线视频色国产色| 在线免费观看不下载黄p国产 | 成年人黄色毛片网站| 女同久久另类99精品国产91| 国模一区二区三区四区视频| 日本成人三级电影网站| 毛片女人毛片| 国产高清视频在线播放一区| 午夜精品在线福利| 色哟哟哟哟哟哟| 免费观看的影片在线观看| 国产毛片a区久久久久| 51午夜福利影视在线观看| 国产亚洲精品一区二区www| 亚洲性夜色夜夜综合| 亚洲成av人片在线播放无| 岛国视频午夜一区免费看| 观看免费一级毛片| 男女下面进入的视频免费午夜| 成人亚洲精品av一区二区| 国产精品香港三级国产av潘金莲| 亚洲国产中文字幕在线视频| av欧美777| 久久伊人香网站| 色综合亚洲欧美另类图片| 日韩欧美国产在线观看| 久久99热这里只有精品18| av黄色大香蕉| 国产私拍福利视频在线观看| 老师上课跳d突然被开到最大视频 久久午夜综合久久蜜桃 | 婷婷丁香在线五月| 国产野战对白在线观看| 精品日产1卡2卡| 一a级毛片在线观看| 婷婷丁香在线五月| 中文字幕人成人乱码亚洲影| 色综合欧美亚洲国产小说| 在线观看一区二区三区| 国产精品久久电影中文字幕| 国产精品av视频在线免费观看| 黄色丝袜av网址大全| 97超视频在线观看视频| 国产激情欧美一区二区| 露出奶头的视频| 亚洲无线观看免费| 欧美日韩乱码在线| 伊人久久精品亚洲午夜| 51午夜福利影视在线观看| 少妇高潮的动态图|