• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于OpenCL 的駕駛監(jiān)控系統(tǒng)自調(diào)優(yōu)化研究

    2024-04-20 17:09:58劉創(chuàng)李智
    電子制作 2024年7期
    關(guān)鍵詞:內(nèi)核異構(gòu)內(nèi)存

    劉創(chuàng),李智

    (四川大學(xué) 電子信息學(xué)院,四川成都,610000)

    0 引言

    人工智能在視頻圖像領(lǐng)域已經(jīng)從理論研究進(jìn)入了工業(yè)和生活,例如自動(dòng)駕駛、智能視頻監(jiān)控分析等。這項(xiàng)技術(shù)的實(shí)現(xiàn)與應(yīng)用就是讓計(jì)算機(jī)系統(tǒng)能快速地讀取大量的視頻圖像信息,并及時(shí)做出一系列判斷和反饋。因此,如何在有限的時(shí)間內(nèi)分析處理大批量圖像數(shù)據(jù)是實(shí)際產(chǎn)業(yè)應(yīng)用系統(tǒng)設(shè)計(jì)中的難點(diǎn)。為了滿足駕駛員監(jiān)控系統(tǒng)(DMS)的應(yīng)用需求,各類計(jì)算機(jī)視覺算法及框架層出不窮,各種異構(gòu)計(jì)算架構(gòu)及高性能計(jì)算平臺(tái)百花齊放。與此同時(shí),面對特定場景需求的復(fù)雜性,學(xué)術(shù)界和產(chǎn)業(yè)界陸續(xù)展開了關(guān)于如何將算法模型輕松高效部署在特定計(jì)算平臺(tái)的研究與應(yīng)用工作[1-4]。

    OpenCL 是專門為異構(gòu)計(jì)算制定的標(biāo)準(zhǔn),它可以協(xié)調(diào)具有不同架構(gòu)的處理器同時(shí)進(jìn)行工作,這就解決了傳統(tǒng)的同構(gòu)架構(gòu)下資源利用率低、處理速率慢的問題。同時(shí),OpenCL可以充分發(fā)揮不同架構(gòu)處理器的性能,比如將C 與GPU 和FPGA 強(qiáng)大的并行處理能力相結(jié)合,可以完成高性能和低功耗的產(chǎn)品設(shè)計(jì)以及物聯(lián)網(wǎng)應(yīng)用等[5]。

    以駕駛員監(jiān)控系統(tǒng)應(yīng)用為項(xiàng)目背景,針對深度學(xué)習(xí)模型計(jì)算量大,視頻圖像識(shí)別實(shí)時(shí)性要求高,應(yīng)用場景設(shè)備資源受限等問題,利用 OpenCL 在基于 CPU+GPU 的異構(gòu)計(jì)算平臺(tái)上研究實(shí)現(xiàn) YOLOv3 算法的并行化,并且結(jié)合最新自動(dòng)化的端到端的深度學(xué)習(xí)優(yōu)化編譯器 TVM 解決算法的多平臺(tái)移植和部署問題[6-7]。

    1 背景與相關(guān)研究

    1.1 車載監(jiān)控系統(tǒng)

    駕駛員監(jiān)控系統(tǒng),縮寫DMS,主要是實(shí)現(xiàn)對駕駛員的身份識(shí)別、駕駛員疲勞駕駛以及危險(xiǎn)行為的檢測功能[8]。在現(xiàn)階段開始量產(chǎn)的L2-L3 級自動(dòng)駕駛中,其實(shí)都只有在特定條件下才可以實(shí)行,很多實(shí)際情況需要駕駛員能及時(shí)接管車輛進(jìn)行處置。因此,在駕駛員過于信任自動(dòng)駕駛而放棄或減弱對駕駛過程的掌控時(shí)可能會(huì)導(dǎo)致某些事故的發(fā)生,而DMS 的引入可以有效減輕這一問題的出現(xiàn)。因此,近年來各國的政策法規(guī)等多方面開始推進(jìn)DMS 的上車:歐盟和中國均出臺(tái)法律法規(guī)。國內(nèi)已率先對“兩客一?!钡壬逃密囓囆桶惭bDMS 系統(tǒng)作出強(qiáng)制要求,乘用車搭載要求也在推進(jìn)制定中。而歐盟則將DMS 納入EuroNCAP 五星安全評級的關(guān)鍵要素,而且是必要條件。幾乎是從2020 年開始,DMS系統(tǒng)的裝車率快速提升,行業(yè)進(jìn)入發(fā)展快車道。

    DMS 的核心功能主要是疲勞監(jiān)測、分心監(jiān)測、危險(xiǎn)行為監(jiān)測。早期的DMS 方案主要通過非生物特征的技術(shù)來實(shí)現(xiàn),比如通過方向盤及轉(zhuǎn)向傳感器,監(jiān)測任何不穩(wěn)定的方向盤運(yùn)動(dòng)、車道偏離或無故改變速度等。但由于系統(tǒng)復(fù)雜,非直觀感知,整體的搭載率一直很低?,F(xiàn)階段的DMS 則大多是基于攝像頭的面部識(shí)別和眼球跟蹤技術(shù),通過紅外光等采集駕駛員面部信息再經(jīng)過算法分析出人員當(dāng)下的身體狀態(tài),在檢測到駕駛員處于不安全狀態(tài)時(shí),再通過閃爍紅光或是方向盤震動(dòng)等方案對駕駛者進(jìn)行提醒。整個(gè)系統(tǒng)的硬件部分是由攝像頭+集成座艙車機(jī)/域控制器解決方案組成;軟件部分則主要涉及視覺加速算法。

    1.2 異構(gòu)編程模型設(shè)計(jì)

    OpenCL 在高性能計(jì)算領(lǐng)域具有許多優(yōu)勢,而最重要的優(yōu)勢之一就是可移植性,允許使用多種加速器,包括多核CPU,GPU,DSP,F(xiàn)PGA 和專用硬件[9]。OpenCL 由三個(gè)模塊構(gòu)成:實(shí)現(xiàn)執(zhí)行在OpenCL 設(shè)備上的內(nèi)核程序的編程語言,定義和控制平臺(tái)的應(yīng)用編程接口和運(yùn)行時(shí)系統(tǒng)。OpenCL 支持任務(wù)與數(shù)據(jù)兩種并行化計(jì)算模式,很大程度上增強(qiáng)了GPU 的計(jì)算性能,其整體核心架構(gòu)包括:平臺(tái)模型,執(zhí)行模型,存儲(chǔ)模型,編程模型四種模型?;贠penCL的異構(gòu)編程模型設(shè)計(jì)如圖1 所示。

    圖1 基于OpenCL 的異構(gòu)編程模型設(shè)計(jì)

    在CPU+GPU 異構(gòu)硬件平臺(tái)上,通過OpenCL API 調(diào)用查詢平臺(tái)和設(shè)備屬性,選擇合適的平臺(tái)和設(shè)備進(jìn)行初始化。主機(jī)端創(chuàng)建上下文、命令隊(duì)列,分配內(nèi)存,并在主機(jī)與設(shè)備之間進(jìn)行數(shù)據(jù)傳輸和計(jì)算。異構(gòu)平臺(tái)上,主機(jī)封裝設(shè)備內(nèi)存為內(nèi)存對象以實(shí)現(xiàn)數(shù)據(jù)管理,通過命令隊(duì)列向設(shè)備發(fā)送命令,使用上下文與設(shè)備進(jìn)行信息交互。設(shè)備端實(shí)現(xiàn)并行算法核函數(shù),創(chuàng)建程序?qū)ο髨?zhí)行內(nèi)核,最后將設(shè)備執(zhí)行的數(shù)據(jù)結(jié)果映射到主機(jī)內(nèi)存,以生成最終的結(jié)果文件。

    基于CPU+GPU 異構(gòu)架構(gòu),將計(jì)算任務(wù)劃分為塊。CPU 負(fù)責(zé)任務(wù)調(diào)配、復(fù)雜邏輯處理和事務(wù)管理,GPU 處理簡單邏輯、計(jì)算密集、大規(guī)模并行的任務(wù)。通過并發(fā)執(zhí)行映射到CPU+GPU 多個(gè)計(jì)算單元的子任務(wù),進(jìn)一步細(xì)粒度劃分模塊以提高CPU 和GPU 的協(xié)同計(jì)算效率。

    1.3 TVM 深度學(xué)習(xí)自動(dòng)化端到端優(yōu)化編譯器

    TVM 是一種編譯器,支持計(jì)算圖級和運(yùn)算符級優(yōu)化,能將深度學(xué)習(xí)任務(wù)映射到各種硬件原語,實(shí)現(xiàn)性能在不同硬件設(shè)備上的可移植性。通過機(jī)器學(xué)習(xí)方法解決高級算子融合和內(nèi)存延遲等優(yōu)化問題,并提出了基于成本建模的高效搜索方法,自動(dòng)優(yōu)化生成滿足底層硬件特性的程序。

    TVM 系統(tǒng)框架與執(zhí)行流程如下:導(dǎo)入現(xiàn)有框架中的網(wǎng)絡(luò)模型,轉(zhuǎn)換為計(jì)算圖,利用高級數(shù)據(jù)流對計(jì)算圖進(jìn)行優(yōu)化。運(yùn)算符級優(yōu)化生成高效可執(zhí)行代碼,其中運(yùn)算符的定義簡化為使用張量描述語言宏觀指定。TVM 結(jié)合用戶設(shè)定的硬件目標(biāo)將運(yùn)算符映射到可能的代碼優(yōu)化集合,通過基于機(jī)器學(xué)習(xí)的成本模型在優(yōu)化空間中搜索運(yùn)算符的優(yōu)化。最終,系統(tǒng)將訓(xùn)練得到的優(yōu)化代碼整合為可部署的編譯運(yùn)行時(shí)模塊,包括優(yōu)化處理的計(jì)算圖、映射及搜索生成的運(yùn)算符庫和目標(biāo)設(shè)備的運(yùn)行參數(shù)。

    2 實(shí)現(xiàn)與優(yōu)化

    2.1 性能模型的設(shè)計(jì)與實(shí)現(xiàn)

    設(shè)計(jì)一種基于GPU 架構(gòu)的自調(diào)優(yōu)性能模型[10~11]。參數(shù)化影響GPU 程序性能的因素并確定取值范圍,構(gòu)建參數(shù)集合空間。通過在GPU 平臺(tái)上配置所有可能的參數(shù)并測量實(shí)際的kernel 執(zhí)行時(shí)間,從測試結(jié)果中選取最小值,對應(yīng)于最優(yōu)配置。首先,向Host 端主機(jī)內(nèi)存輸入并初始化數(shù)據(jù)。利用搜索空間優(yōu)化算法選擇一組最優(yōu)參數(shù)配置。然后,將輸入數(shù)據(jù)和kernel 函數(shù)的參數(shù)配置傳輸?shù)紻evice 端顯存內(nèi),初始化設(shè)備平臺(tái),并在GPU 上執(zhí)行kernel 函數(shù)進(jìn)行自調(diào)優(yōu)。最后,將最優(yōu)配置和實(shí)際執(zhí)行時(shí)間返回到Host 端并輸出結(jié)果。

    基于GPU 架構(gòu)的OpenCL 性能模型實(shí)現(xiàn)如圖2 所示,分為兩方面:一是從并行粒度出發(fā),包括設(shè)置OpenCL 核函數(shù)中work-group 大小和每個(gè)線程處理任務(wù)量,workgroup 的維度根據(jù)具體應(yīng)用確定。二是布爾型變量,評估GPU 平臺(tái)的優(yōu)化方法,如局部內(nèi)存使用、循環(huán)展開、避免bank conflict 等,以確定這些優(yōu)化方法對特定算法應(yīng)用的有效性。

    圖2 基于 GPU 架構(gòu)的自調(diào)優(yōu)性能模型實(shí)現(xiàn)

    步驟1:讀取輸入數(shù)據(jù),對平臺(tái)配置參數(shù)化;

    步驟2:將輸入數(shù)據(jù)從host 內(nèi)存拷貝到device 的全局內(nèi)存中;

    步驟3:通過搜索空間優(yōu)化算法選取參數(shù)配置,所選取的參數(shù)配置用來初始化OpenCL 核函數(shù);

    步驟4:在device 端執(zhí)行kernel 函數(shù),得出測試時(shí)間并將結(jié)果返回host 中;

    步驟5:重復(fù)步驟3、4,直至遍歷完全部的搜索空間;

    步驟6:對所有測試時(shí)間進(jìn)行排序,即可得出最小時(shí)間與最優(yōu)配置。

    2.2 YOLOv3 算法在異構(gòu)計(jì)算的實(shí)現(xiàn)

    在上文模型搭建完成的基礎(chǔ)上,設(shè)計(jì)實(shí)現(xiàn)基于 OpenCL的 YOLOv3 視頻圖像識(shí)別算法的并行加速[12~13],根據(jù)用 C語言和 CUDA 編寫的開源神經(jīng)網(wǎng)絡(luò)框架 DarkNet 項(xiàng)目,然后結(jié)合視頻圖像識(shí)別任務(wù)需求、硬件平臺(tái)特征和 OpenCL編程模型,利用OpenCL 的可移植性,在異構(gòu)系統(tǒng)上實(shí)現(xiàn)基于OpenCL 的YOLOv3 卷積神經(jīng)網(wǎng)絡(luò)算法模型。

    使用并行編程模型OpenCL 設(shè)計(jì)規(guī)范實(shí)現(xiàn)算法,主機(jī)應(yīng)完成OpenCL 平臺(tái)設(shè)備選擇,內(nèi)存聲明,建立上下文并創(chuàng)建命令執(zhí)行隊(duì)列等工作,為設(shè)備創(chuàng)建緩沖內(nèi)存及內(nèi)存對象,將數(shù)據(jù)從主機(jī)端緩存區(qū)發(fā)送到目標(biāo)設(shè)備的緩存區(qū)。設(shè)備端應(yīng)編寫算法中需要并行化設(shè)計(jì)的內(nèi)核代碼,然后創(chuàng)建對應(yīng)的程序?qū)ο蟛⒃谠O(shè)備上執(zhí)行內(nèi)核,在主機(jī)代碼中,需要使用clSetKernelArg()設(shè)置內(nèi)核參數(shù),然后調(diào)用clEnqueueNDRangeKernel()劃分安排NDRange 工作項(xiàng)和工作組的大小,調(diào)用OpenCL 內(nèi)核函數(shù)啟動(dòng)內(nèi)核。內(nèi)核運(yùn)行后得到的結(jié)果數(shù)據(jù)仍然存儲(chǔ)在設(shè)備內(nèi)存空間,主機(jī)需要將數(shù)據(jù)映射主機(jī)內(nèi)存空間中,最后在設(shè)備任務(wù)執(zhí)行完成后,由主機(jī)清理工作期間創(chuàng)建的內(nèi)存緩沖區(qū)并關(guān)閉OpenCL 對象等。主機(jī)函數(shù)設(shè)計(jì)流程圖如圖3 所示。

    圖3 主機(jī)函數(shù)設(shè)計(jì)流程圖

    本文基于clBLAS 庫(OpenCLBLAS,基于OpenCL 內(nèi)核的基礎(chǔ)線性代數(shù)操作數(shù)值庫),采用im2col 法將整個(gè)卷積過程轉(zhuǎn)換為GEMM(通用矩陣乘法)過程實(shí)現(xiàn)卷積層內(nèi)核函數(shù)。采用NDRange模式實(shí)現(xiàn)數(shù)據(jù)并行,利用系統(tǒng)的多級存儲(chǔ)結(jié)構(gòu)和程序執(zhí)行的局部性來充分加速運(yùn)算。

    傳統(tǒng)卷積計(jì)算的復(fù)雜度很高,需要7 層循環(huán)遍歷圖像batch 數(shù)、batch 大小、圖像通道、圖像尺寸、卷積尺寸。采用矩陣乘法的方式將卷積計(jì)算轉(zhuǎn)化,將圖像通道和卷積核按矩陣拼接,減少循環(huán)層數(shù)。通過OpenCL 執(zhí)行模型中的單指令多線程(SIMT)特性,利用多個(gè)工作項(xiàng)同時(shí)計(jì)算,實(shí)現(xiàn)并行加速。

    在二維卷積運(yùn)算中,每個(gè)輸出點(diǎn)的計(jì)算是獨(dú)立且不依賴的,因此,通過將OpenCL 工作項(xiàng)一對一映射到輸出點(diǎn),可以輕松實(shí)現(xiàn)多輸出點(diǎn)的并行計(jì)算。在卷積神經(jīng)網(wǎng)絡(luò)中,卷積層、批量歸一化和激活函數(shù)層通常形成一個(gè)固定的結(jié)構(gòu)。為了進(jìn)一步優(yōu)化數(shù)據(jù)流,采用算子融合,將固定結(jié)構(gòu)的計(jì)算集中處理,減少數(shù)據(jù)移動(dòng)和內(nèi)核啟動(dòng)關(guān)閉帶來的額外性能開銷。下面為卷積計(jì)算convolutional_kernels_cl.cpp 函數(shù)設(shè)計(jì):

    2.3 基于TVM 的加速優(yōu)化設(shè)計(jì)實(shí)現(xiàn)

    為了描述算法模型中計(jì)算操作指定的張量輸出大小以及每個(gè)元素的計(jì)算表達(dá)式,TVM 采用一種張量描述語言來描述張量在索引空間中的每個(gè)操作,張量描述語言不僅支持常見的數(shù)學(xué)運(yùn)算表示,而且實(shí)現(xiàn)了常見的深度學(xué)習(xí)運(yùn)算符的表示。借用Halide 將計(jì)算算法和調(diào)度邏輯進(jìn)行抽象并分離的思想優(yōu)化神經(jīng)網(wǎng)絡(luò)算子,然后采用一些搜索算法來找到較優(yōu)的調(diào)度方案,從而自動(dòng)生成最終的執(zhí)行代碼。其中Halide 是C++實(shí)現(xiàn)的圖像處理領(lǐng)域的領(lǐng)域?qū)S谜Z言(DomainSpecifiedLanguage,DSL)。它的特點(diǎn)是實(shí)現(xiàn)了圖像算法的運(yùn)算(包含函數(shù)及表達(dá)式),這些運(yùn)算在計(jì)算硬件單元上以函數(shù)為單位進(jìn)行可分離性的調(diào)度。

    2.3.1 TVM 運(yùn)行環(huán)境搭建

    在異構(gòu)平臺(tái)上構(gòu)建TVM 運(yùn)行環(huán)境,運(yùn)行系統(tǒng)為Windows10 x64,由于TVM 需要將張量表達(dá)式映射到特定的低級代碼以便部署在異構(gòu)平臺(tái)上,因此需要采用低級編譯器中間表示(IR),準(zhǔn)備visualstudio2017,CMake。由于TVM 在CPU 平臺(tái)的編譯會(huì)依賴LLVM,下載LLVM source code 和Clang source code 并使用CMake 編譯,再添加到系統(tǒng)路徑下配置系統(tǒng)環(huán)境變量,配置CUDA 及OpenCL。

    接下來安裝TVM,從GitHub 上下載整個(gè)安裝包,修改tvm 源碼下面的CMakeLists.txt,把USE_LLVM、USE_OPENCL、USE_CUDA 等設(shè)置修改為ON。使用CMake 編譯生成tvm.sln,打開tvm.sln,確認(rèn)編譯的平臺(tái)和版本release x64,編譯成功后,獲取Windows 動(dòng)態(tài)庫libtvm.dll,libtvm_topi.dll, 進(jìn) 入tvm/python,tvm/topi/python,運(yùn)行pythonsetup.pyinstall,安裝成功便可以導(dǎo)入tvm 包文件。

    2.3.2 YOLOv3 模型優(yōu)化部署

    使用TVM 進(jìn)行模型部署的完整流程:

    (1)導(dǎo)入DarkNet 深度學(xué)習(xí)框架的YOLOv3 模型,以實(shí)現(xiàn)計(jì)算圖 iR(中間表示)的轉(zhuǎn)換。

    (2)對原始計(jì)算圖中間表示(IR)進(jìn)行計(jì)算圖優(yōu)化,得到優(yōu)化的計(jì)算圖。

    (3)對計(jì)算圖中的每個(gè)計(jì)算操作用張量表示描述語言描述的張量計(jì)算表達(dá)式,并針對異構(gòu)硬件平臺(tái),選擇最小計(jì)算原語生成具體的調(diào)度。

    (4)使用基于成本模型的機(jī)器學(xué)習(xí)自動(dòng)優(yōu)化器生成經(jīng)過優(yōu)化的特定的低級代碼。

    (5)生成特定于硬件設(shè)備的二進(jìn)制程序。

    (6)構(gòu)建異構(gòu)平臺(tái)可部署的模型。

    訓(xùn)練好的模型編譯為TVM 模型,TVM 模型由deploy.dll、deploy.json、deploy.params 三個(gè)文件組成。將生成的TVM 部署庫文件deploy.dll 添加到動(dòng)態(tài)鏈接庫,deploy.json、deploy.params 作為資源文件加入工程項(xiàng)目中。部分核心代碼代碼如下:

    3 實(shí)驗(yàn)結(jié)果與分析

    本文分為三組實(shí)驗(yàn)組進(jìn)行對比實(shí)驗(yàn),實(shí)驗(yàn)組一從MagicData 發(fā)布的開源DMS 駕駛員行為數(shù)據(jù)集中隨機(jī)抽5000 張圖,劃分為5 個(gè)圖片集,將準(zhǔn)備好的每組測試集圖片的路徑全部存放在一個(gè)txt 文件里建立測試文件,修改detector.c 文件,在異構(gòu)平臺(tái)上用GPU+CUDA cuDNN 庫執(zhí)行批量測試,重新make Darknet 框架,進(jìn)行五次重復(fù)測試,并記錄圖片識(shí)別推理時(shí)間,得到原模型在 GPU 并行運(yùn)行的性能數(shù)據(jù),該實(shí)驗(yàn)為基準(zhǔn)實(shí)驗(yàn)組。

    實(shí)驗(yàn)組二將YOLOv3 算法移植到基于 OpenCL 的異構(gòu)平臺(tái)上實(shí)現(xiàn)優(yōu)化卷積計(jì)算過程,融合卷積層+批量歸一化+激活函數(shù)層固定的組成結(jié)構(gòu),在主機(jī)函數(shù)和內(nèi)核函數(shù)設(shè)計(jì)實(shí)現(xiàn)過程中運(yùn)用循環(huán)展開、向量化、數(shù)據(jù)重排、多線程并行和內(nèi)存訪問優(yōu)化等運(yùn)算并行化策略,同時(shí)將計(jì)算負(fù)載合理分配給 CPU 和 GPU,通過 OpenCL 實(shí)現(xiàn)異構(gòu)并行計(jì)算并解決移植性問題?;?OpenCL 的異構(gòu)并行編程模型,在CPU+GPU 異構(gòu)計(jì)算平臺(tái)上運(yùn)行 YOLOv3 算法模型,得到手動(dòng)優(yōu)化算法模型運(yùn)行性能數(shù)據(jù)。

    手動(dòng)憑借經(jīng)驗(yàn)在異構(gòu)平臺(tái)對算法模型優(yōu)化設(shè)計(jì),存在局限性,無法實(shí)現(xiàn)全局最優(yōu)以及負(fù)載均衡,對于算法的優(yōu)化,涉及高性能張量分解,數(shù)據(jù)布局,低開銷負(fù)載平衡調(diào)度,內(nèi)存分配、通信、同步等多重優(yōu)化方案。引入TVM 自動(dòng)優(yōu)化算法模型,并面向目標(biāo)平臺(tái)編譯生成部署代碼。以實(shí)驗(yàn)組一和實(shí)驗(yàn)組二為參考,在實(shí)驗(yàn)組二算法實(shí)現(xiàn)的基礎(chǔ)上植入TVM 的 CPU/GPU 自動(dòng)編譯優(yōu)化部署運(yùn)行測試,得到測試結(jié)果。對比結(jié)果如表1,圖4 所示。

    表1 優(yōu)化對比實(shí)驗(yàn)

    圖4 優(yōu)化對比實(shí)驗(yàn)結(jié)果

    通過實(shí)驗(yàn)數(shù)據(jù)結(jié)果,計(jì)算三個(gè)實(shí)驗(yàn)組的平均時(shí)間分別53.635(ms)、37.542(ms)、34.200(ms),實(shí)驗(yàn)表明 YOLOv3 算法在基于OpenCL 的 CPU+GPU 異構(gòu)計(jì)算平臺(tái)上相對于GPU 加速比達(dá)到 1.42。TVM 優(yōu)化部署在GPU加速比達(dá)到 1.56,并且相對于手動(dòng)優(yōu)化也能達(dá)到1.10 的加速比。結(jié)果表明,本文提出的基于OpenCL 異構(gòu)平臺(tái)的視頻監(jiān)控圖像處理加速方案和自調(diào)優(yōu)化編譯方法具有可行性和有效性,突破了原算法的應(yīng)用平臺(tái)局限性,有利于與其他設(shè)備擴(kuò)展結(jié)合及移植且自動(dòng)編譯優(yōu)化方案可快速部署在各種設(shè)備端。

    4 結(jié)束語

    本文主要從汽車智能化的駕駛員監(jiān)控系統(tǒng)實(shí)際應(yīng)用出發(fā),構(gòu)建了OpenCL 框架下的自調(diào)編程模型和TVM 優(yōu)化編譯器以及算法研究,利用 OpenCL 在基于GPU 的異構(gòu)計(jì)算平臺(tái)上實(shí)現(xiàn)視頻圖像識(shí)別 YOLO 算法的并行化加速,并進(jìn)一步結(jié)合TVM 進(jìn)行自動(dòng)編譯優(yōu)化部署,完成了三個(gè)對照組實(shí)驗(yàn),結(jié)果表明相較于基準(zhǔn)對照實(shí)驗(yàn),植入YOLOv3 算法的OpenCL 異構(gòu)并行編程模型的加速比能達(dá)到1.42,基于TVM 優(yōu)化部署后加速比能達(dá)到1.56。表明本文提出的基于異構(gòu)平臺(tái)的圖像識(shí)別加速方案和基于 TVM 的端到端自動(dòng)優(yōu)化編譯方法具有可行性和有效性,且OpenCL 框架突破了原始基于 CUDA 的應(yīng)用平臺(tái)局限性,利于與其他設(shè)備擴(kuò)展結(jié)合及移植且自動(dòng)編譯優(yōu)化方案可快速部署在各種設(shè)備端。

    猜你喜歡
    內(nèi)核異構(gòu)內(nèi)存
    萬物皆可IP的時(shí)代,我們當(dāng)夯實(shí)的IP內(nèi)核是什么?
    試論同課異構(gòu)之“同”與“異”
    強(qiáng)化『高新』內(nèi)核 打造農(nóng)業(yè)『硅谷』
    “春夏秋冬”的內(nèi)存
    基于嵌入式Linux內(nèi)核的自恢復(fù)設(shè)計(jì)
    Linux內(nèi)核mmap保護(hù)機(jī)制研究
    overlay SDN實(shí)現(xiàn)異構(gòu)兼容的關(guān)鍵技術(shù)
    LTE異構(gòu)網(wǎng)技術(shù)與組網(wǎng)研究
    在新興異構(gòu)SoCs上集成多種系統(tǒng)
    基于內(nèi)存的地理信息訪問技術(shù)
    天堂俺去俺来也www色官网| 老鸭窝网址在线观看| 亚洲国产精品999在线| 亚洲专区中文字幕在线| 国产亚洲av高清不卡| 亚洲,欧美精品.| 亚洲全国av大片| 老熟妇仑乱视频hdxx| 欧美av亚洲av综合av国产av| 久久精品aⅴ一区二区三区四区| 久久中文看片网| 美女高潮喷水抽搐中文字幕| 亚洲成人久久性| 欧美一级毛片孕妇| 97超级碰碰碰精品色视频在线观看| 在线观看日韩欧美| 99riav亚洲国产免费| 国产精品九九99| 精品久久蜜臀av无| 午夜视频精品福利| 男女床上黄色一级片免费看| 中文欧美无线码| 日韩精品青青久久久久久| 亚洲自偷自拍图片 自拍| 日韩免费高清中文字幕av| 午夜福利影视在线免费观看| 又黄又粗又硬又大视频| 亚洲一区中文字幕在线| a级毛片黄视频| 国产乱人伦免费视频| 国产成人av激情在线播放| 两个人看的免费小视频| 9色porny在线观看| 看免费av毛片| 亚洲精品av麻豆狂野| 久久 成人 亚洲| 男男h啪啪无遮挡| 在线观看免费高清a一片| 亚洲av成人一区二区三| 久久 成人 亚洲| 国产亚洲精品综合一区在线观看 | 精品熟女少妇八av免费久了| 久久久国产成人免费| 无人区码免费观看不卡| 很黄的视频免费| 可以免费在线观看a视频的电影网站| 日本撒尿小便嘘嘘汇集6| 亚洲成国产人片在线观看| 欧美成人免费av一区二区三区| 免费久久久久久久精品成人欧美视频| 国产高清国产精品国产三级| 亚洲精品久久午夜乱码| 亚洲色图综合在线观看| 国产亚洲精品一区二区www| 757午夜福利合集在线观看| 一本大道久久a久久精品| 高清欧美精品videossex| 色综合婷婷激情| 精品久久久精品久久久| 国产亚洲精品综合一区在线观看 | 亚洲国产精品合色在线| 精品福利观看| 777久久人妻少妇嫩草av网站| 久热爱精品视频在线9| 亚洲三区欧美一区| 日本黄色视频三级网站网址| 麻豆久久精品国产亚洲av | 99国产精品一区二区蜜桃av| 日韩人妻精品一区2区三区| 满18在线观看网站| a级毛片在线看网站| 丝袜人妻中文字幕| 一级,二级,三级黄色视频| 欧美乱妇无乱码| 99在线视频只有这里精品首页| 国产欧美日韩一区二区精品| 男人操女人黄网站| 日本vs欧美在线观看视频| 中出人妻视频一区二区| 婷婷丁香在线五月| 亚洲国产中文字幕在线视频| 国产精品 欧美亚洲| 男女高潮啪啪啪动态图| 夜夜躁狠狠躁天天躁| 欧美乱码精品一区二区三区| 九色亚洲精品在线播放| 欧美成人午夜精品| 色哟哟哟哟哟哟| 亚洲成人免费av在线播放| 黄片播放在线免费| 狂野欧美激情性xxxx| 色婷婷av一区二区三区视频| 伦理电影免费视频| 午夜免费鲁丝| 夜夜躁狠狠躁天天躁| 欧美日韩国产mv在线观看视频| 国产成+人综合+亚洲专区| 亚洲一区中文字幕在线| 国产欧美日韩一区二区三区在线| 一级a爱片免费观看的视频| 亚洲精品美女久久久久99蜜臀| 色综合站精品国产| 高清黄色对白视频在线免费看| 国产精品美女特级片免费视频播放器 | 久久久久国内视频| 人人妻人人澡人人看| 日韩一卡2卡3卡4卡2021年| 免费av中文字幕在线| 搡老熟女国产l中国老女人| 亚洲成人免费电影在线观看| www.自偷自拍.com| 黄色女人牲交| 女性生殖器流出的白浆| 亚洲一区二区三区欧美精品| 97超级碰碰碰精品色视频在线观看| 黄片播放在线免费| 国产乱人伦免费视频| 国产av在哪里看| 91麻豆精品激情在线观看国产 | 丁香六月欧美| 97人妻天天添夜夜摸| 男人舔女人的私密视频| 一区福利在线观看| 90打野战视频偷拍视频| 啪啪无遮挡十八禁网站| 嫁个100分男人电影在线观看| 真人一进一出gif抽搐免费| 成人18禁在线播放| 国产亚洲精品一区二区www| 久久婷婷成人综合色麻豆| 欧美黑人精品巨大| 免费高清在线观看日韩| 麻豆国产av国片精品| 一级片'在线观看视频| 啦啦啦在线免费观看视频4| 亚洲一区中文字幕在线| 亚洲伊人色综图| 亚洲精品国产精品久久久不卡| 在线观看午夜福利视频| 三级毛片av免费| 最新美女视频免费是黄的| 搡老熟女国产l中国老女人| 亚洲人成网站在线播放欧美日韩| 日日摸夜夜添夜夜添小说| 精品少妇一区二区三区视频日本电影| 欧美日韩瑟瑟在线播放| 美国免费a级毛片| 黑人操中国人逼视频| 欧美大码av| 亚洲国产欧美网| 又紧又爽又黄一区二区| 最好的美女福利视频网| 日本精品一区二区三区蜜桃| 在线看a的网站| 国产97色在线日韩免费| 亚洲欧洲精品一区二区精品久久久| netflix在线观看网站| 动漫黄色视频在线观看| 久久精品国产亚洲av香蕉五月| 精品久久久久久久毛片微露脸| 超色免费av| 性欧美人与动物交配| 91老司机精品| 久热爱精品视频在线9| www.自偷自拍.com| 美女高潮喷水抽搐中文字幕| 国产成人精品无人区| 很黄的视频免费| 久久久久久久久免费视频了| 老熟妇乱子伦视频在线观看| 999久久久国产精品视频| 国产精品久久久av美女十八| 亚洲av成人av| 亚洲一区二区三区欧美精品| 国产精品美女特级片免费视频播放器 | 欧美激情久久久久久爽电影 | 天天躁狠狠躁夜夜躁狠狠躁| 亚洲精品国产精品久久久不卡| 中国美女看黄片| 欧美另类亚洲清纯唯美| 国产熟女xx| 嫩草影视91久久| 一二三四社区在线视频社区8| 中亚洲国语对白在线视频| 精品久久蜜臀av无| 亚洲av片天天在线观看| 欧美亚洲日本最大视频资源| 国产精品久久久人人做人人爽| 满18在线观看网站| 成人国语在线视频| 久久 成人 亚洲| 精品国产美女av久久久久小说| 国产欧美日韩一区二区三| 99国产综合亚洲精品| tocl精华| 搡老乐熟女国产| 精品福利观看| 男女下面进入的视频免费午夜 | 精品国内亚洲2022精品成人| 亚洲三区欧美一区| 黄色成人免费大全| 欧美精品亚洲一区二区| 亚洲精品国产区一区二| 一二三四社区在线视频社区8| 91av网站免费观看| 校园春色视频在线观看| 少妇 在线观看| 99国产精品免费福利视频| 人人妻人人澡人人看| 在线观看舔阴道视频| 日韩成人在线观看一区二区三区| 欧美日韩乱码在线| 在线av久久热| 免费日韩欧美在线观看| 丁香欧美五月| 中国美女看黄片| 91大片在线观看| 亚洲熟女毛片儿| 日韩欧美国产一区二区入口| 国产av精品麻豆| 成人三级做爰电影| 亚洲av五月六月丁香网| 精品国产一区二区三区四区第35| av有码第一页| 在线av久久热| 国内久久婷婷六月综合欲色啪| 欧美大码av| 欧美国产精品va在线观看不卡| 亚洲精品久久午夜乱码| 757午夜福利合集在线观看| 亚洲中文字幕日韩| 男女午夜视频在线观看| 深夜精品福利| 狠狠狠狠99中文字幕| a在线观看视频网站| 欧美国产精品va在线观看不卡| 亚洲,欧美精品.| 五月开心婷婷网| 一区二区三区精品91| 日韩一卡2卡3卡4卡2021年| 亚洲欧美日韩高清在线视频| 女性被躁到高潮视频| 三上悠亚av全集在线观看| 另类亚洲欧美激情| 少妇裸体淫交视频免费看高清 | 国产精品偷伦视频观看了| 看片在线看免费视频| 亚洲精品一区av在线观看| 亚洲一码二码三码区别大吗| 国产精品一区二区在线不卡| 麻豆久久精品国产亚洲av | 超碰成人久久| 在线观看一区二区三区激情| 亚洲九九香蕉| 可以免费在线观看a视频的电影网站| 欧美人与性动交α欧美软件| 婷婷六月久久综合丁香| 电影成人av| 黑人猛操日本美女一级片| 国产日韩一区二区三区精品不卡| 黄网站色视频无遮挡免费观看| 久久精品亚洲精品国产色婷小说| 国产亚洲精品久久久久久毛片| 99热只有精品国产| 欧美成人性av电影在线观看| www.熟女人妻精品国产| 亚洲精品成人av观看孕妇| 精品国产亚洲在线| 国产91精品成人一区二区三区| 一个人免费在线观看的高清视频| 国产欧美日韩一区二区精品| 波多野结衣一区麻豆| 两人在一起打扑克的视频| 搡老乐熟女国产| 一进一出抽搐gif免费好疼 | 首页视频小说图片口味搜索| 黄色毛片三级朝国网站| 国产亚洲精品久久久久久毛片| 亚洲视频免费观看视频| 长腿黑丝高跟| 亚洲一区二区三区欧美精品| 国产区一区二久久| 免费在线观看日本一区| 好男人电影高清在线观看| 免费观看人在逋| 久久天躁狠狠躁夜夜2o2o| 精品一区二区三区av网在线观看| 黄网站色视频无遮挡免费观看| 日韩欧美一区视频在线观看| 午夜精品国产一区二区电影| 91成年电影在线观看| 国产精品偷伦视频观看了| 久久青草综合色| 亚洲自拍偷在线| 电影成人av| 啦啦啦在线免费观看视频4| 亚洲国产毛片av蜜桃av| 一边摸一边抽搐一进一小说| 久久 成人 亚洲| 在线观看免费视频网站a站| 久久性视频一级片| 男男h啪啪无遮挡| 国产av一区二区精品久久| 午夜老司机福利片| 日韩大尺度精品在线看网址 | 国产极品粉嫩免费观看在线| 精品国产乱子伦一区二区三区| 亚洲少妇的诱惑av| 日韩人妻精品一区2区三区| 黄色a级毛片大全视频| 国产野战对白在线观看| 亚洲国产欧美一区二区综合| 国产aⅴ精品一区二区三区波| 夜夜夜夜夜久久久久| 国产成人啪精品午夜网站| 不卡一级毛片| 免费女性裸体啪啪无遮挡网站| 亚洲精品国产色婷婷电影| 少妇粗大呻吟视频| 国产av精品麻豆| 美女扒开内裤让男人捅视频| 男人舔女人的私密视频| 久久久久九九精品影院| 两性午夜刺激爽爽歪歪视频在线观看 | 成人三级黄色视频| 亚洲人成电影免费在线| 黄色成人免费大全| 精品久久久久久久毛片微露脸| 国产片内射在线| 亚洲成人免费av在线播放| 两性夫妻黄色片| 国产免费男女视频| 亚洲精品粉嫩美女一区| √禁漫天堂资源中文www| 亚洲专区中文字幕在线| a在线观看视频网站| 韩国av一区二区三区四区| 欧美黑人精品巨大| 午夜免费激情av| 亚洲av成人一区二区三| 国产高清激情床上av| 久久午夜亚洲精品久久| 9191精品国产免费久久| 亚洲国产看品久久| 人人妻,人人澡人人爽秒播| 国产亚洲精品第一综合不卡| 桃红色精品国产亚洲av| 国产成+人综合+亚洲专区| 国产精品久久久人人做人人爽| 久久九九热精品免费| 午夜91福利影院| 日韩精品免费视频一区二区三区| 99热国产这里只有精品6| 无限看片的www在线观看| 久久久水蜜桃国产精品网| 欧美另类亚洲清纯唯美| 涩涩av久久男人的天堂| av福利片在线| 久热爱精品视频在线9| 91av网站免费观看| 两个人看的免费小视频| 日韩精品青青久久久久久| 成在线人永久免费视频| 日韩一卡2卡3卡4卡2021年| 亚洲熟女毛片儿| 亚洲国产精品一区二区三区在线| 窝窝影院91人妻| 亚洲精品一二三| 校园春色视频在线观看| 午夜精品国产一区二区电影| 日本a在线网址| 亚洲精品av麻豆狂野| 国产精品国产av在线观看| e午夜精品久久久久久久| 99久久久亚洲精品蜜臀av| 最近最新中文字幕大全免费视频| 丰满迷人的少妇在线观看| 国产三级在线视频| 一级片免费观看大全| 免费一级毛片在线播放高清视频 | 久久久久久人人人人人| 一边摸一边抽搐一进一小说| 欧美乱色亚洲激情| 淫秽高清视频在线观看| 国产aⅴ精品一区二区三区波| 在线观看一区二区三区| 亚洲人成伊人成综合网2020| 亚洲熟女毛片儿| 国产av精品麻豆| 国产成人免费无遮挡视频| 久久精品国产清高在天天线| 精品日产1卡2卡| 老熟妇仑乱视频hdxx| 一边摸一边抽搐一进一小说| 色婷婷久久久亚洲欧美| 久久久水蜜桃国产精品网| 最新美女视频免费是黄的| 午夜福利一区二区在线看| 日本wwww免费看| 亚洲中文字幕日韩| 一夜夜www| 久久国产亚洲av麻豆专区| 黄色女人牲交| 久久久久久亚洲精品国产蜜桃av| 不卡一级毛片| 午夜免费激情av| 亚洲午夜精品一区,二区,三区| 欧美激情极品国产一区二区三区| 欧美中文综合在线视频| 成人国产一区最新在线观看| 免费人成视频x8x8入口观看| 亚洲精品av麻豆狂野| 两个人免费观看高清视频| bbb黄色大片| 欧美成人午夜精品| 91av网站免费观看| 免费在线观看日本一区| 精品一品国产午夜福利视频| 日本一区二区免费在线视频| 中文亚洲av片在线观看爽| 久久人妻熟女aⅴ| 9191精品国产免费久久| 久久久国产精品麻豆| 日日夜夜操网爽| 午夜福利,免费看| 久久伊人香网站| 美女午夜性视频免费| 性少妇av在线| 999久久久国产精品视频| 69精品国产乱码久久久| 亚洲精品在线美女| 日本a在线网址| 老司机深夜福利视频在线观看| 露出奶头的视频| 国产1区2区3区精品| 男女床上黄色一级片免费看| 美女扒开内裤让男人捅视频| 亚洲国产精品sss在线观看 | 9191精品国产免费久久| 午夜福利免费观看在线| 国产1区2区3区精品| 国产精品二区激情视频| 制服人妻中文乱码| 黄色女人牲交| 国产高清videossex| 久热这里只有精品99| 法律面前人人平等表现在哪些方面| 高清av免费在线| 在线视频色国产色| 女警被强在线播放| 亚洲 国产 在线| 中亚洲国语对白在线视频| a级毛片黄视频| 最近最新中文字幕大全免费视频| 精品久久久精品久久久| 黄色视频不卡| 国产人伦9x9x在线观看| 久久人人精品亚洲av| 在线观看一区二区三区| e午夜精品久久久久久久| 免费在线观看影片大全网站| 欧美av亚洲av综合av国产av| 妹子高潮喷水视频| 久久国产乱子伦精品免费另类| 日本一区二区免费在线视频| 成人av一区二区三区在线看| 麻豆国产av国片精品| 又黄又爽又免费观看的视频| 国产亚洲精品久久久久5区| 午夜日韩欧美国产| 国产欧美日韩精品亚洲av| 婷婷丁香在线五月| 亚洲国产精品999在线| 国产亚洲欧美98| 色在线成人网| 精品欧美一区二区三区在线| 天天躁狠狠躁夜夜躁狠狠躁| 欧美一级毛片孕妇| 在线观看一区二区三区| 国产av一区在线观看免费| 久久精品国产清高在天天线| 最近最新中文字幕大全电影3 | 国产精品av久久久久免费| 香蕉久久夜色| 国内毛片毛片毛片毛片毛片| 中文字幕高清在线视频| 露出奶头的视频| 午夜福利影视在线免费观看| 国产精品av久久久久免费| 国产成+人综合+亚洲专区| 亚洲精品中文字幕一二三四区| 日韩精品中文字幕看吧| 国产精品久久久久久人妻精品电影| 亚洲色图av天堂| 在线看a的网站| 色婷婷久久久亚洲欧美| 性色av乱码一区二区三区2| 麻豆一二三区av精品| 日韩三级视频一区二区三区| 黄片播放在线免费| a级片在线免费高清观看视频| 成人18禁在线播放| 久久精品国产清高在天天线| 欧美大码av| 日本五十路高清| 久久天堂一区二区三区四区| 日韩欧美一区视频在线观看| 久久香蕉激情| 自线自在国产av| 久久久精品国产亚洲av高清涩受| 九色亚洲精品在线播放| 啪啪无遮挡十八禁网站| 97人妻天天添夜夜摸| 久久久久国内视频| 久热爱精品视频在线9| 日日干狠狠操夜夜爽| 在线国产一区二区在线| 久久久久久大精品| 99国产精品99久久久久| 黄色视频不卡| 亚洲在线自拍视频| 岛国视频午夜一区免费看| 制服人妻中文乱码| 丰满的人妻完整版| 精品欧美一区二区三区在线| 在线观看免费视频网站a站| 久久人妻av系列| 天堂√8在线中文| 黄色毛片三级朝国网站| 久久中文字幕人妻熟女| 又黄又爽又免费观看的视频| 国产成人影院久久av| 午夜两性在线视频| 久久性视频一级片| 天堂俺去俺来也www色官网| 制服诱惑二区| 欧美+亚洲+日韩+国产| 色婷婷av一区二区三区视频| 国产又爽黄色视频| 国产人伦9x9x在线观看| 十八禁网站免费在线| 99国产精品99久久久久| 亚洲狠狠婷婷综合久久图片| 亚洲国产精品合色在线| 久久久久国内视频| 女同久久另类99精品国产91| 成人手机av| 18禁观看日本| 十分钟在线观看高清视频www| 午夜a级毛片| 精品久久久久久久久久免费视频 | 母亲3免费完整高清在线观看| 亚洲欧美精品综合一区二区三区| 亚洲精华国产精华精| 侵犯人妻中文字幕一二三四区| 久久久久国内视频| 国产亚洲精品久久久久久毛片| 高清毛片免费观看视频网站 | 首页视频小说图片口味搜索| 欧美精品亚洲一区二区| 麻豆av在线久日| 国产精品1区2区在线观看.| tocl精华| 久久久久亚洲av毛片大全| 性欧美人与动物交配| 国产xxxxx性猛交| 狂野欧美激情性xxxx| 国产av一区二区精品久久| 久久青草综合色| 中文字幕另类日韩欧美亚洲嫩草| 激情在线观看视频在线高清| 高清毛片免费观看视频网站 | 亚洲av美国av| 免费一级毛片在线播放高清视频 | 午夜亚洲福利在线播放| 97人妻天天添夜夜摸| 两性夫妻黄色片| 亚洲全国av大片| 亚洲一区高清亚洲精品| 国产精品久久久人人做人人爽| 久久伊人香网站| 日本精品一区二区三区蜜桃| 美女福利国产在线| 一夜夜www| 老司机深夜福利视频在线观看| 搡老熟女国产l中国老女人| 国产亚洲欧美在线一区二区| 丝袜美足系列| 亚洲av熟女| 天堂俺去俺来也www色官网| bbb黄色大片| 男女下面进入的视频免费午夜 | 国产亚洲精品久久久久久毛片| 国产熟女午夜一区二区三区| 亚洲自拍偷在线| av天堂久久9| 女性生殖器流出的白浆| 成人永久免费在线观看视频| 麻豆av在线久日| 91字幕亚洲| 老司机午夜福利在线观看视频| 日韩欧美一区视频在线观看| 人人澡人人妻人| 91成年电影在线观看| 成年版毛片免费区| 麻豆国产av国片精品| 涩涩av久久男人的天堂| 校园春色视频在线观看| a级片在线免费高清观看视频| 国产成人免费无遮挡视频| 精品久久久久久久毛片微露脸| 美女国产高潮福利片在线看| 波多野结衣一区麻豆| 美女大奶头视频| 成人影院久久|