• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    異構(gòu)并行平臺(tái)的Caffe推理速度提升方法①

    2022-05-10 02:29:16王子曦邵培南
    關(guān)鍵詞:分塊異構(gòu)分配

    王子曦,邵培南,鄧 暢

    (中國電子科技集團(tuán)公司第三十二研究所,上海 201808)

    1 引言

    隨著計(jì)算機(jī)硬件性能提升,多核心CPU 已經(jīng)成為主流,越來越多云服務(wù)器開始使用GPU 加速機(jī)器學(xué)習(xí)等計(jì)算任務(wù).性能較高的個(gè)人計(jì)算機(jī)一般是多核CPU+單個(gè)獨(dú)立GPU的模式.依靠計(jì)算機(jī)性能的發(fā)展,擅長圖形相關(guān)機(jī)器學(xué)習(xí)任務(wù)的深度學(xué)習(xí)發(fā)展迅速,不僅在云服務(wù)器上作為API 提供,在用戶客戶端上也已出現(xiàn)使用預(yù)訓(xùn)練模型進(jìn)行數(shù)據(jù)處理的需求和實(shí)現(xiàn)[1],例如相冊(cè)根據(jù)圖片內(nèi)容進(jìn)行分類、相機(jī)檢測拍攝場景類型等[2].

    由于深度學(xué)習(xí)一般運(yùn)算量大且處理的數(shù)據(jù)多是圖像等復(fù)雜數(shù)據(jù),所以有必要讓程序充分并行化且盡可能利用硬件加速,來提升運(yùn)算速度和用戶使用體驗(yàn).為了提高硬件利用率,需要同時(shí)使用CPU的多個(gè)核心和GPU執(zhí)行任務(wù).由于在實(shí)際應(yīng)用中GPU 在執(zhí)行不同類型任務(wù)時(shí)相對(duì)CPU的速度并不成固定比例,如果將任務(wù)簡單地按照固定比例分配給CPU和GPU,無法在不同類型的任務(wù)上均能充分利用硬件,所以需要使用恰當(dāng)?shù)娜蝿?wù)調(diào)度算法在運(yùn)行時(shí)進(jìn)行任務(wù)分配以均衡硬件的負(fù)載.

    Caffe[3]是一款使用廣泛的深度學(xué)習(xí)框架,主要面向圖像分類任務(wù),主要優(yōu)點(diǎn)是速度極快.在目前的主流深度學(xué)習(xí)框架中,Caffe的速度、編程工作量、穩(wěn)定性比較均衡[4],而且模塊化設(shè)計(jì)便于調(diào)用和擴(kuò)展.通過部署已經(jīng)提前訓(xùn)練好的Caffe 模型,可以在毫秒級(jí)對(duì)輸入的新數(shù)據(jù)完成推理.Caffe的使用流程是先用已標(biāo)注的數(shù)據(jù)進(jìn)行較慢的訓(xùn)練,然后使用訓(xùn)練結(jié)果進(jìn)行較快的推理.在實(shí)際使用中,生產(chǎn)環(huán)境和普通用戶終端一般都是使用預(yù)訓(xùn)練模型執(zhí)行推理任務(wù).如果已經(jīng)有訓(xùn)練好的Caffe 模型,需要使用Caffe的Python 或者C++、Matlab 接口[5]編寫程序,然而在默認(rèn)情況下只能使用單個(gè)GPU 或者單個(gè)CPU 核心進(jìn)行推理.在使用BLAS編譯Caffe 后可以提升多CPU 核心上的并行效果.不過直接部署Caffe 無法簡單同時(shí)使用多核心CPU和GPU 甚至多CPU、GPU 加速推理速度.

    為了提高Caffe 在異構(gòu)并行計(jì)算設(shè)備上的表現(xiàn),目前有一些提高Caffe 并行表現(xiàn)的研究.例如英特爾的修改版Caffe 可以在多處理器多核多線程(NUMA 架構(gòu))CPU 計(jì)算平臺(tái),尤其是使用特定Xeon Phi 處理器的平臺(tái)上大幅提升Caffe的性能[6].英偉達(dá)的gpu-rest-engine項(xiàng)目[7]可以讓使用英偉達(dá)GPU 進(jìn)行運(yùn)算的Caffe 提供低延遲的REST API 圖像分類微服務(wù).還有AMD 修改的OpenCL 版Caffe[8],經(jīng)過AMD 優(yōu)化并測試,在AMD的CPU、GPU、APU 等多核異構(gòu)的計(jì)算設(shè)備上訓(xùn)練和推理的速度都有提升,且訓(xùn)練速度的提升倍數(shù)更大[9].還有結(jié)合特定平臺(tái)上的編譯工具進(jìn)行編譯并擴(kuò)展到分布式服務(wù)器來提高Caffe 運(yùn)算速度的研究[10].這些提高Caffe 并行表現(xiàn)的方法對(duì)于平臺(tái)有一定限制,且很多需要自行編譯,使用難度較高,無法簡單充分利用異構(gòu)并行計(jì)算硬件的計(jì)算性能.

    為了使部署的Caffe 能充分使用異構(gòu)并行計(jì)算平臺(tái)上的所有計(jì)算設(shè)備,本文做了以下工作.

    (1)為了使部署的Caffe 調(diào)用更靈活,本文封裝了Caffe的部署程序接口[11],并擴(kuò)展了功能,使之可以在初始化運(yùn)行后通過本地環(huán)回提供服務(wù),接收并根據(jù)預(yù)訓(xùn)練模型執(zhí)行推理任務(wù).

    (2)分析并總結(jié)了現(xiàn)有的幾種異構(gòu)調(diào)度算法,將這些算法應(yīng)用到在異構(gòu)并行計(jì)算平臺(tái)上加速Caffe 執(zhí)行典型圖像分類任務(wù).通過分析實(shí)驗(yàn)數(shù)據(jù)和觀察已有調(diào)度算法的不足之處,提出了兩種新的調(diào)度算法,并進(jìn)行了相應(yīng)的實(shí)驗(yàn)和數(shù)據(jù)分析.

    2 目前已有調(diào)度算法

    對(duì)于并行化的任務(wù),任務(wù)調(diào)度算法決定了負(fù)載均衡的效果和各個(gè)計(jì)算節(jié)點(diǎn)的利用率.由于GPU和CPU執(zhí)行不同任務(wù)的速度之比并非固定且GPU 性能隨著負(fù)載變化性能會(huì)有微小變化[12],還考慮到任務(wù)調(diào)度、同步帶來的開銷,需要合適的任務(wù)調(diào)度算法才能進(jìn)一步提高模型的推理速度.當(dāng)前使用的幾種主流調(diào)度算法[13]如下.

    2.1 靜態(tài)調(diào)度

    靜態(tài)調(diào)度是一種簡單的調(diào)度算法,此算法直接將任務(wù)按照固定比例分配到不同的運(yùn)算核心.假設(shè)總?cè)蝿?wù)數(shù)量為W,用戶指定的n個(gè)計(jì)算設(shè)備工作量比例r=[r1,r2,···,rn],則第i個(gè)計(jì)算設(shè)備在開始時(shí)分配任務(wù)數(shù)量wi為:

    由于通常無法知道各個(gè)設(shè)備在未知任務(wù)上的計(jì)算能力,所以只能將任務(wù)均勻分配給各個(gè)設(shè)備,此時(shí)第i個(gè)計(jì)算設(shè)備在開始時(shí)分配的任務(wù)數(shù)量wi為:

    由于CPU 核心和GPU 之間的運(yùn)算速度比例在不同運(yùn)算任務(wù)上不同,所以不可能存在一個(gè)固定的比例在所有運(yùn)算任務(wù)上都能自始至終充分利用所有核心.

    2.2 快速調(diào)度

    考慮到靜態(tài)調(diào)度無法根據(jù)不同運(yùn)算核心的性能區(qū)別分配任務(wù),快速調(diào)度將任務(wù)執(zhí)行分成以下兩步.

    第1 步為小規(guī)模測試,給所有計(jì)算核心分配相同的數(shù)量較小的任務(wù),并等待這些核心執(zhí)行完畢.

    第2 步為正式執(zhí)行,根據(jù)之前第1 步各個(gè)核心的執(zhí)行時(shí)間,可以計(jì)算出各個(gè)核心的執(zhí)行速度.根據(jù)核心的速度之比將剩下的所有任務(wù)按照這個(gè)比例分配給相應(yīng)核心.

    假設(shè)第1 步小規(guī)模測試得出各個(gè)設(shè)備的計(jì)算性能v=[v1,v2,···,vn],此時(shí)剩余任務(wù)數(shù)量為w剩余,則第2 步正式執(zhí)行中第i個(gè)設(shè)備分配到的任務(wù)數(shù)量wi為:

    這種調(diào)度方法優(yōu)點(diǎn)是任務(wù)沒有劃分很多,所以引入的額外開銷很小.缺點(diǎn)是第1 步分配的任務(wù)數(shù)量會(huì)影響到最終效果.如果分配過少,偶然誤差更大,更有可能因?yàn)樗俣裙罍y不準(zhǔn)導(dǎo)致第2 步分配效果不好;如果分配過多,雖然估測更加精準(zhǔn),但是等待第1 步結(jié)束的同步時(shí)間更長,浪費(fèi)了速度更快的計(jì)算設(shè)備的計(jì)算能力.

    2.3 分片調(diào)度

    分片調(diào)度將任務(wù)分成等量的小塊,第一次將小塊任務(wù)等量分配給各個(gè)計(jì)算單元.之后每一次等待前一次所有運(yùn)算完成得出運(yùn)算速度后按照相應(yīng)比例分配后續(xù)小塊.

    假設(shè)某次同步時(shí)得出上一輪各個(gè)設(shè)備的計(jì)算性能v=[v1,v2,···,vn],每一個(gè)小塊包含的任務(wù)數(shù)量為w,則第i個(gè)設(shè)備分配到的任務(wù)數(shù)量wi為:

    此算法優(yōu)點(diǎn)是對(duì)于各個(gè)計(jì)算設(shè)備的計(jì)算能力估測更準(zhǔn)確.缺點(diǎn)是如果小塊偏小,等待計(jì)算完畢同步的時(shí)間會(huì)積少成多;如果小塊偏大,剛開始各個(gè)設(shè)備之間任務(wù)完成的時(shí)間差距更大,導(dǎo)致計(jì)算能力的浪費(fèi).

    2.4 HAT 調(diào)度

    HAT 調(diào)度相比分片調(diào)度,在每一次分片時(shí)考慮上一次的任務(wù)執(zhí)行情況,如果上一次各個(gè)計(jì)算設(shè)備的任務(wù)執(zhí)行時(shí)間已經(jīng)很接近或者剩下任務(wù)不夠多,就直接把剩余所有任務(wù)按照比例分配,否則把分片大小擴(kuò)大一倍按照比例分配.

    此方法的優(yōu)點(diǎn)是減少了同步開銷,還避免了開始時(shí)各個(gè)計(jì)算設(shè)備計(jì)算能力的差異導(dǎo)致完成時(shí)間差距過大.

    3 算法設(shè)計(jì)

    目前已有的快速調(diào)度、分片調(diào)度、HAT 調(diào)度算法,由于存在等待各個(gè)計(jì)算設(shè)備任務(wù)完成來統(tǒng)計(jì)計(jì)算性能這一同步步驟,會(huì)帶來開銷.為減少同步開銷,本文提出以下兩種無需等待同步的調(diào)度算法.

    3.1 先進(jìn)先出調(diào)度

    此調(diào)度算法設(shè)計(jì)思想來自常見的先進(jìn)先出算法.將固定任務(wù)數(shù)量的小塊分配給各個(gè)計(jì)算設(shè)備.假如用戶定義的小塊大小是c,則第i個(gè)設(shè)備分配到的任務(wù)數(shù)量wi為:

    如果某個(gè)設(shè)備計(jì)算完畢則立即再分配任務(wù)小塊,直到所有任務(wù)完成.此方法沒有等待各個(gè)設(shè)備同步的開銷,能充分利用所有設(shè)備的計(jì)算能力.

    先進(jìn)先出調(diào)度中的小塊始終大小相等,對(duì)于前期來說分片過多會(huì)造成更多開銷,而在最后結(jié)尾部分很容易各個(gè)設(shè)備結(jié)束時(shí)間差別過大.因此,本文進(jìn)一步提出下面的快速分塊調(diào)度算法.

    3.2 快速分塊調(diào)度

    此算法同時(shí)吸收了分片算法估測計(jì)算設(shè)備性能準(zhǔn)確的優(yōu)點(diǎn)和HAT 分塊數(shù)量少的優(yōu)點(diǎn).首先將固定的任務(wù)小塊ws分給各個(gè)計(jì)算設(shè)備,如果某設(shè)備完成了小塊任務(wù)但此時(shí)不是所有設(shè)備都完成過至少一次小塊任務(wù),就再次給該設(shè)備相同任務(wù)數(shù)量的小塊,直到所有設(shè)備都至少完成過一次小塊任務(wù).每次小塊任務(wù)完成,都統(tǒng)計(jì)出該設(shè)備的計(jì)算性能vi.之后按照設(shè)備計(jì)算性能給每個(gè)空閑設(shè)備分配剩余任務(wù)的固定比例.考慮到后期任務(wù)會(huì)分配過少,所以剩余任務(wù)少于100 時(shí)則分配全部剩余任務(wù).假設(shè)已得出所有設(shè)備的計(jì)算性能v=[v1,v2,···,vn],固定比例為r,當(dāng)前剩余工作量為w剩余.則給空閑設(shè)備分配的任務(wù)數(shù)量為:

    每個(gè)計(jì)算設(shè)備的程序流程如圖1所示.

    圖1 快速分塊調(diào)度流程圖

    4 接口擴(kuò)展

    Caffe的使用流程是先用已標(biāo)注的數(shù)據(jù)進(jìn)行較慢的訓(xùn)練,然后使用訓(xùn)練結(jié)果進(jìn)行較快的推理.在實(shí)際使用中,生產(chǎn)環(huán)境和普通用戶終端需求的多是推理任務(wù).Caffe 默認(rèn)只能使用GPU 或者單個(gè)CPU 進(jìn)行推理.為了解決重復(fù)初始化Caffe 帶來的開銷和提高Caffe 推理對(duì)異構(gòu)并行硬件的利用率,本文編寫了封裝的Caffe部署程序(后續(xù)簡稱服務(wù)端),提供簡潔高效的調(diào)用接口且易于部署.

    為了能夠一次初始化Caffe 并載入預(yù)訓(xùn)練模型后多次推理,且可以通過程序分配任務(wù)便于后續(xù)使用自定義調(diào)度算法,采用了本地環(huán)回網(wǎng)絡(luò)通信,服務(wù)端通過UDP和調(diào)用程序通信.通信時(shí)通過UDP 發(fā)送JSON 數(shù)據(jù),數(shù)據(jù)可以包括執(zhí)行的命令和參數(shù)等,便于擴(kuò)展.

    為了使服務(wù)端的部署更加便捷,使用了Caffe的Docker 版.運(yùn)行時(shí),可以通過Docker 啟動(dòng)參數(shù)直接使用某個(gè)特定的CPU 核心[14].由于即使使用GPU 版進(jìn)行Caffe 推理也需要CPU 分配任務(wù)處理數(shù)據(jù),會(huì)大量占用一個(gè)CPU 核心,所以服務(wù)端需要預(yù)留一個(gè)CPU核心用于工作在GPU 模式的Caffe.

    5 實(shí)驗(yàn)測試和分析

    使用本文編寫的服務(wù)端,自定義程序可以便捷地調(diào)用Caffe 進(jìn)行推理.本節(jié)給出有關(guān)測試結(jié)果,實(shí)驗(yàn)環(huán)境配置參數(shù)列于表1.

    表1 實(shí)驗(yàn)環(huán)境配置表

    實(shí)驗(yàn)使用MNIST[15]和Cifar-10[16]這兩個(gè)經(jīng)典的圖像分類任務(wù)數(shù)據(jù)集.MNIST 數(shù)據(jù)集為單通道灰度28×28 圖片,Cifar-10 數(shù)據(jù)集為三通道彩色32×32 圖片.測試時(shí)這兩個(gè)數(shù)據(jù)集均預(yù)處理為Caffe 推理支持的numpy 格式的.npy 文件且載入內(nèi)存,避免磁盤讀取緩存帶來的誤差.

    首先,測試了不使用并行化而只使用CPU 單核或者單個(gè)GPU 在MNIST和Cifar-10 數(shù)據(jù)集上進(jìn)行推理的速度,總?cè)蝿?wù)數(shù)量為10 000,得到的每秒執(zhí)行推理任務(wù)數(shù)列在表2中.

    表2 每秒執(zhí)行的推理任務(wù)數(shù)

    結(jié)果表明,每次提交的任務(wù)數(shù)過少會(huì)因?yàn)殚_銷導(dǎo)致性能下降.而且,對(duì)于不同任務(wù),CPU和GPU的性能之比不是恒定的.

    根據(jù)表2數(shù)據(jù),得到Caffe 推理速度與每次提交任務(wù)數(shù)的變化關(guān)系,見圖2.可以看到,無論是CPU和GPU,如果每次提交任務(wù)數(shù)偏少都會(huì)因?yàn)殚_銷導(dǎo)致性能下降,且GPU 下降更明顯.從圖2中可以看出,如果任務(wù)拆分到1 000 個(gè)左右作為一次提交,對(duì)性能的影響不大,如果小于100 個(gè)左右,影響就較大,出現(xiàn)性能明顯下降.因此,后面實(shí)驗(yàn)測試異構(gòu)并行計(jì)算平臺(tái)的Caffe推理調(diào)度算法時(shí),避免將任務(wù)拆分到小于100 個(gè)任務(wù)的小塊.

    圖2 Caffe 推理速度和每次提交任務(wù)數(shù)的關(guān)系圖

    接下來在異構(gòu)并行平臺(tái)測試了幾種調(diào)度算法對(duì)MNIST和Cifar-10 數(shù)據(jù)集上的Caffe 推理任務(wù)的加速效果.考慮到某些算法的參數(shù)可變,實(shí)驗(yàn)中針對(duì)這些參數(shù)的意義,在其合理范圍內(nèi)取了多個(gè)典型值,以測試不同參數(shù)下的運(yùn)行效果.不同算法中可變參數(shù)的含義和取值列于表3.

    表3 調(diào)度算法的參數(shù)和實(shí)驗(yàn)取值

    分別使用上文中的各種調(diào)度算法及按表3的參數(shù)取值,在MNIST和Cifar-10 數(shù)據(jù)集上進(jìn)行Caffe 推理(測試的任務(wù)數(shù)均為100 000)并計(jì)時(shí),根據(jù)完成任務(wù)所用時(shí)間計(jì)算出每秒推理數(shù),即推理速度,總結(jié)在圖3和圖4中.圖中同一調(diào)度算法從左到右的幾個(gè)推理速度分別對(duì)應(yīng)表3中從左到右的參數(shù)取值.為了便于比較,同樣任務(wù)數(shù)下只使用CPU 單核和單個(gè)GPU的推理速度也畫在圖中.

    從圖3和圖4都能看到,使用能在運(yùn)行時(shí)根據(jù)運(yùn)算設(shè)備性能動(dòng)態(tài)分配任務(wù)的調(diào)度算法,例如快速調(diào)度、分片調(diào)度、HAT 調(diào)度、先進(jìn)先出調(diào)度、快速分塊調(diào)度算法,相比不將推理過程并行化或者簡單地靜態(tài)分配,都能大幅提升推理速度.實(shí)驗(yàn)中發(fā)現(xiàn),計(jì)算機(jī)的各個(gè)計(jì)算設(shè)備占用率基本維持在滿載,且各個(gè)設(shè)備任務(wù)完成的時(shí)間差異不大,說明上述能在運(yùn)行時(shí)動(dòng)態(tài)分配任務(wù)的調(diào)度算法都成功使用異構(gòu)并行設(shè)備的計(jì)算能力,提高了Caffe 推理的速度.

    圖3和圖4也給出了對(duì)于同一算法改變可調(diào)參數(shù)后的推理速度的變化.可以看出,對(duì)于分片調(diào)度、HAT調(diào)度和快速分塊調(diào)度這3 種算法,參數(shù)改變產(chǎn)生的差異更小.分析其算法原理可以知道,這幾種算法通過更多分片能更準(zhǔn)確地度量各個(gè)計(jì)算設(shè)備的當(dāng)前計(jì)算能力,從而更加準(zhǔn)確地分配任務(wù).相比之下,快速調(diào)度由于只通過一次小規(guī)模測試來度量各個(gè)計(jì)算設(shè)備的計(jì)算能力,無法適應(yīng)隨著計(jì)算設(shè)備負(fù)載變化而出現(xiàn)的性能變化.先進(jìn)先出調(diào)度由于分塊大小固定,如果分塊過小,會(huì)帶來更多開銷;如果分塊過大,每個(gè)計(jì)算設(shè)備最后任務(wù)完成時(shí)間可能差異較大導(dǎo)致某個(gè)設(shè)備任務(wù)完成時(shí)間遠(yuǎn)晚于其他設(shè)備.

    圖3 不同調(diào)度算法下Caffe 在MNIST數(shù)據(jù)集上的每秒推理數(shù)

    圖4 不同調(diào)度算法下Caffe 在Cifar-10數(shù)據(jù)集上的每秒推理數(shù)

    比較性能表現(xiàn)較好的幾個(gè)調(diào)度算法,本文提出的快速分塊調(diào)度算法不僅性能表現(xiàn)頂尖,而且即使改變可變參數(shù),性能變化不大,更不會(huì)出現(xiàn)明顯下降.說明快速分塊調(diào)度算法不僅具有提升推理速度的優(yōu)勢(shì),還有很好的魯棒性,不容易因?yàn)槿狈?jīng)驗(yàn)對(duì)可變參數(shù)的設(shè)定不準(zhǔn)而導(dǎo)致推理性能明顯下降.根據(jù)算法原理,可以推測出,由于快速分塊調(diào)度算法前期分塊較大后期分塊較小,相比HAT 算法更不容易造成每個(gè)計(jì)算設(shè)備最后任務(wù)完成時(shí)間較大差異,同時(shí)分塊不會(huì)過多,所以性能和HAT 算法一樣較為優(yōu)秀且總體表現(xiàn)好于HAT 算法.

    根據(jù)實(shí)驗(yàn)數(shù)據(jù),將同一算法在實(shí)驗(yàn)中取不同參數(shù)得到的推理速度數(shù)據(jù)求平均值作為該算法的平均推理速度,比較各算法在兩個(gè)數(shù)據(jù)集上的平均推理速度,總結(jié)在表4和表5中.表中數(shù)據(jù)是所在列的算法和所在行的算法平均推理的速度的比較,例如127.7%對(duì)應(yīng)的意思是單GPU 推理速度比單CPU 快127.7%.可以看出使用能在運(yùn)行時(shí)根據(jù)運(yùn)算設(shè)備性能動(dòng)態(tài)分配任務(wù)的調(diào)度算法對(duì)Caffe 深度學(xué)習(xí)推理速度的提升很大,其中快速分塊調(diào)度算法表現(xiàn)最好.

    表4 各種調(diào)度算法在MNIST 數(shù)據(jù)集上推理速度表現(xiàn)比較(%)

    表5 各種調(diào)度算法在Cifar-10 數(shù)據(jù)集上推理速度表現(xiàn)比較(%)

    以CPU和GPU 單核計(jì)算性能乘以相應(yīng)核心數(shù)量,作為理論最高性能.定義某一算法的性能與理論最高性能的差別為:差別=(理論最高性能?某種算法性能)/理論最高性能.差別越小,表示該算法的表現(xiàn)性能越好.圖5將實(shí)驗(yàn)中得到的幾種在運(yùn)行時(shí)分配任務(wù)的調(diào)度算法的性能數(shù)據(jù)與理論最高性能的差別做了比較.結(jié)果表明,快速分塊調(diào)度表現(xiàn)最好,與其余4 個(gè)調(diào)度算法中表現(xiàn)最好的HAT 算法相比,快速分塊調(diào)度算法與理論最高性能的差別在MNIST和Cifar-10 這兩個(gè)數(shù)據(jù)集上分別減小了7.4%和21.0%,表明該算法對(duì)計(jì)算設(shè)備性能的利用率更高.

    圖5 不同調(diào)度算法性能相比理論最高性能的差別百分比

    6 總結(jié)和展望

    為了在異構(gòu)并行計(jì)算平臺(tái)上提升Caffe 框架的深度學(xué)習(xí)推理速度,本文擴(kuò)展了Caffe的部署程序,使用戶可以自定義編程調(diào)用Caffe 推理.然后將已有的異構(gòu)調(diào)度算法擴(kuò)展了多設(shè)備支持.針對(duì)已有調(diào)度算法的不足,提出了能夠減少同步等待的先進(jìn)先出算法、能夠同時(shí)減少同步等待且減少分塊次數(shù)的快速分塊調(diào)度算法.測試結(jié)果表明使用擴(kuò)展的Caffe 部署程序,已有的快速調(diào)度、分片調(diào)度、HAT 調(diào)度等算法,以及本文提出的先進(jìn)先出調(diào)度、快速分塊調(diào)度算法都能大幅提高推理時(shí)異構(gòu)并行計(jì)算硬件的利用率.其中快速分塊調(diào)度表現(xiàn)優(yōu)秀穩(wěn)定,在MNIST和Cifar-10 數(shù)據(jù)集上推理速度相比CPU 單核分別提升了378%和736%,相比單GPU 分別提升了110%和34%;相比已有最好的HAT 調(diào)度算法,在MNIST和Cifar-10 這兩個(gè)數(shù)據(jù)集上分別減小了7.4%和21.0%的計(jì)算性能浪費(fèi).

    在將來的研究中,可以探索深度學(xué)習(xí)模型中使用的神經(jīng)網(wǎng)絡(luò)類型或者輸入數(shù)據(jù)規(guī)模如何造成CPU和GPU的推理速度差異.根據(jù)神經(jīng)網(wǎng)絡(luò)類型、輸入數(shù)據(jù)規(guī)模等信息更快地選擇出合適的調(diào)度算法參數(shù)來優(yōu)化推理速度的提升.

    猜你喜歡
    分塊異構(gòu)分配
    試論同課異構(gòu)之“同”與“異”
    分塊矩陣在線性代數(shù)中的應(yīng)用
    應(yīng)答器THR和TFFR分配及SIL等級(jí)探討
    遺產(chǎn)的分配
    一種分配十分不均的財(cái)富
    績效考核分配的實(shí)踐與思考
    overlay SDN實(shí)現(xiàn)異構(gòu)兼容的關(guān)鍵技術(shù)
    反三角分塊矩陣Drazin逆新的表示
    LTE異構(gòu)網(wǎng)技術(shù)與組網(wǎng)研究
    基于自適應(yīng)中值濾波的分塊壓縮感知人臉識(shí)別
    女人被狂操c到高潮| 日韩欧美一区二区三区在线观看 | tube8黄色片| 亚洲中文av在线| 高清毛片免费观看视频网站 | 人妻久久中文字幕网| 国产高清国产精品国产三级| 咕卡用的链子| 在线观看免费视频日本深夜| 日韩 欧美 亚洲 中文字幕| 大陆偷拍与自拍| 一区二区三区精品91| 亚洲欧美激情综合另类| 看片在线看免费视频| 成人永久免费在线观看视频| 嫩草影视91久久| 日韩精品免费视频一区二区三区| 国产精品av久久久久免费| 日本一区二区免费在线视频| aaaaa片日本免费| 亚洲国产欧美日韩在线播放| 成年版毛片免费区| 色老头精品视频在线观看| 在线国产一区二区在线| 50天的宝宝边吃奶边哭怎么回事| 久久人人爽av亚洲精品天堂| 亚洲精品国产色婷婷电影| 精品久久蜜臀av无| 国产精华一区二区三区| 欧美乱妇无乱码| 精品无人区乱码1区二区| 99香蕉大伊视频| 欧美亚洲 丝袜 人妻 在线| 国产有黄有色有爽视频| 叶爱在线成人免费视频播放| 大型av网站在线播放| 欧美亚洲 丝袜 人妻 在线| 国产精品偷伦视频观看了| 中文欧美无线码| 午夜福利免费观看在线| 一个人免费在线观看的高清视频| 国产精品av久久久久免费| 亚洲男人天堂网一区| 国产亚洲精品第一综合不卡| 老汉色∧v一级毛片| 精品久久久久久电影网| 性少妇av在线| 免费女性裸体啪啪无遮挡网站| 丝袜美足系列| 狂野欧美激情性xxxx| 欧美久久黑人一区二区| 少妇猛男粗大的猛烈进出视频| 国产亚洲av高清不卡| 色在线成人网| 欧美老熟妇乱子伦牲交| 午夜亚洲福利在线播放| 嫁个100分男人电影在线观看| 亚洲成a人片在线一区二区| 午夜成年电影在线免费观看| 中文字幕av电影在线播放| 国产乱人伦免费视频| 欧美 日韩 精品 国产| 亚洲国产看品久久| 在线天堂中文资源库| 在线看a的网站| 国产极品粉嫩免费观看在线| 成人18禁在线播放| 在线国产一区二区在线| 建设人人有责人人尽责人人享有的| 国产在线一区二区三区精| 国产免费av片在线观看野外av| 99国产综合亚洲精品| 又大又爽又粗| 亚洲午夜理论影院| 亚洲国产欧美网| 99国产精品一区二区三区| 久热爱精品视频在线9| 亚洲精品在线美女| 亚洲一区中文字幕在线| 少妇 在线观看| 亚洲欧美日韩另类电影网站| 久久午夜综合久久蜜桃| 久久国产亚洲av麻豆专区| 制服人妻中文乱码| 又黄又粗又硬又大视频| 老司机靠b影院| 80岁老熟妇乱子伦牲交| 国产欧美日韩精品亚洲av| 午夜福利在线观看吧| 久久久久国产一级毛片高清牌| 看黄色毛片网站| 中文亚洲av片在线观看爽 | 亚洲av成人av| 人成视频在线观看免费观看| 大香蕉久久成人网| 国产精品亚洲av一区麻豆| 国产aⅴ精品一区二区三区波| 淫妇啪啪啪对白视频| 热re99久久国产66热| 9热在线视频观看99| 女同久久另类99精品国产91| 不卡一级毛片| 午夜视频精品福利| 男人舔女人的私密视频| 啦啦啦免费观看视频1| 国产主播在线观看一区二区| 两个人看的免费小视频| 国产精品永久免费网站| 制服人妻中文乱码| 欧美日韩国产mv在线观看视频| 老司机深夜福利视频在线观看| 又紧又爽又黄一区二区| 亚洲午夜精品一区,二区,三区| 成人手机av| 国产av又大| 亚洲全国av大片| 韩国精品一区二区三区| 婷婷精品国产亚洲av在线 | 天堂√8在线中文| 91精品三级在线观看| 少妇裸体淫交视频免费看高清 | 人人妻,人人澡人人爽秒播| 久久精品亚洲熟妇少妇任你| 无限看片的www在线观看| 久久婷婷成人综合色麻豆| 丰满的人妻完整版| 99在线人妻在线中文字幕 | 国产又爽黄色视频| tube8黄色片| 国产精品二区激情视频| 国内毛片毛片毛片毛片毛片| 国产精品成人在线| 最新在线观看一区二区三区| 久久影院123| 夜夜躁狠狠躁天天躁| 看免费av毛片| 亚洲欧美精品综合一区二区三区| 午夜激情av网站| 国产欧美日韩一区二区三区在线| 国产主播在线观看一区二区| 国产成人系列免费观看| 美女高潮喷水抽搐中文字幕| 欧美日韩乱码在线| 无人区码免费观看不卡| 成人18禁高潮啪啪吃奶动态图| av电影中文网址| 午夜两性在线视频| 老司机靠b影院| 十八禁高潮呻吟视频| 啦啦啦 在线观看视频| 精品免费久久久久久久清纯 | 免费观看精品视频网站| 不卡av一区二区三区| 黄色丝袜av网址大全| 91大片在线观看| 很黄的视频免费| 久久久久久久久免费视频了| 黑人操中国人逼视频| 在线av久久热| 老司机午夜十八禁免费视频| 国产精品久久久av美女十八| 国产一区二区激情短视频| 亚洲国产欧美一区二区综合| 国产亚洲欧美精品永久| 国产精品永久免费网站| 两性午夜刺激爽爽歪歪视频在线观看 | 制服诱惑二区| 成人黄色视频免费在线看| 老司机午夜福利在线观看视频| xxxhd国产人妻xxx| 侵犯人妻中文字幕一二三四区| 自线自在国产av| 久久中文看片网| 国产成人精品久久二区二区91| 一进一出抽搐动态| 精品一区二区三区av网在线观看| 国产99白浆流出| 日本精品一区二区三区蜜桃| 一区二区三区精品91| 国产亚洲欧美98| 窝窝影院91人妻| 女同久久另类99精品国产91| 国产深夜福利视频在线观看| 99国产精品99久久久久| 国产成+人综合+亚洲专区| 亚洲全国av大片| 亚洲第一青青草原| 中亚洲国语对白在线视频| 女人精品久久久久毛片| 91精品国产国语对白视频| 黄色成人免费大全| 国产欧美日韩一区二区三| 亚洲久久久国产精品| 亚洲精品自拍成人| 久99久视频精品免费| 亚洲色图综合在线观看| 成人国产一区最新在线观看| 亚洲成av片中文字幕在线观看| 男人操女人黄网站| 精品国产乱子伦一区二区三区| 久久香蕉精品热| 人人妻人人爽人人添夜夜欢视频| 91国产中文字幕| 岛国毛片在线播放| 亚洲一码二码三码区别大吗| 黄色片一级片一级黄色片| 美女福利国产在线| 精品亚洲成国产av| avwww免费| 日本a在线网址| 精品欧美一区二区三区在线| 亚洲色图综合在线观看| 欧美日韩av久久| 久久国产乱子伦精品免费另类| 亚洲男人天堂网一区| 久久人妻熟女aⅴ| 国产欧美日韩一区二区精品| 欧美黄色淫秽网站| 欧美久久黑人一区二区| 女性被躁到高潮视频| 久久久久久人人人人人| 午夜精品国产一区二区电影| 国产高清激情床上av| 国产男女超爽视频在线观看| 18禁裸乳无遮挡免费网站照片 | 日本欧美视频一区| 亚洲视频免费观看视频| 91成年电影在线观看| 1024视频免费在线观看| 久99久视频精品免费| 日韩欧美在线二视频 | 亚洲视频免费观看视频| 一个人免费在线观看的高清视频| 麻豆av在线久日| 操美女的视频在线观看| 中文字幕最新亚洲高清| 看黄色毛片网站| 欧美成人午夜精品| 国产成人系列免费观看| 黄色视频不卡| 国产成人精品在线电影| 视频在线观看一区二区三区| 成年女人毛片免费观看观看9 | 天天影视国产精品| 久久中文字幕人妻熟女| 妹子高潮喷水视频| 亚洲 国产 在线| 99精品欧美一区二区三区四区| 国产精品一区二区在线观看99| 久久久精品免费免费高清| 夜夜爽天天搞| 91大片在线观看| 亚洲成人免费电影在线观看| 久久精品国产清高在天天线| 一级,二级,三级黄色视频| 性少妇av在线| 色综合婷婷激情| 天堂俺去俺来也www色官网| 欧美激情 高清一区二区三区| 久久精品亚洲av国产电影网| av国产精品久久久久影院| 精品电影一区二区在线| 老汉色av国产亚洲站长工具| 最新的欧美精品一区二区| 91麻豆av在线| 99久久综合精品五月天人人| www日本在线高清视频| 久热这里只有精品99| 亚洲av第一区精品v没综合| 久久午夜综合久久蜜桃| 每晚都被弄得嗷嗷叫到高潮| 国产一卡二卡三卡精品| 久久精品成人免费网站| 国产精品美女特级片免费视频播放器 | 久久狼人影院| 日韩欧美免费精品| 女人被狂操c到高潮| 日韩免费高清中文字幕av| 国产又色又爽无遮挡免费看| а√天堂www在线а√下载 | av线在线观看网站| 亚洲性夜色夜夜综合| 午夜精品在线福利| 高潮久久久久久久久久久不卡| 纯流量卡能插随身wifi吗| 精品国产一区二区三区久久久樱花| 国产成人免费观看mmmm| 老司机在亚洲福利影院| 国产在线一区二区三区精| 一进一出抽搐gif免费好疼 | 国产蜜桃级精品一区二区三区 | 老熟妇乱子伦视频在线观看| 人人妻人人添人人爽欧美一区卜| 大片电影免费在线观看免费| 精品少妇一区二区三区视频日本电影| 亚洲成人免费av在线播放| 69av精品久久久久久| av一本久久久久| ponron亚洲| 天天添夜夜摸| 一进一出抽搐动态| 激情在线观看视频在线高清 | 人妻久久中文字幕网| 精品电影一区二区在线| 69av精品久久久久久| 91精品国产国语对白视频| 亚洲国产精品sss在线观看 | 国产又爽黄色视频| 亚洲欧美色中文字幕在线| 交换朋友夫妻互换小说| 操美女的视频在线观看| 777久久人妻少妇嫩草av网站| 午夜福利一区二区在线看| 午夜老司机福利片| 热99国产精品久久久久久7| 99re在线观看精品视频| 黄片大片在线免费观看| 男男h啪啪无遮挡| 宅男免费午夜| 国产精品自产拍在线观看55亚洲 | 大型黄色视频在线免费观看| 亚洲熟妇熟女久久| 欧美一级毛片孕妇| 丝袜在线中文字幕| 亚洲精品中文字幕一二三四区| 国产精品永久免费网站| 老司机在亚洲福利影院| 香蕉久久夜色| 999久久久国产精品视频| 女人久久www免费人成看片| 日本撒尿小便嘘嘘汇集6| 成年版毛片免费区| 人妻一区二区av| 极品人妻少妇av视频| 精品福利观看| 国产午夜精品久久久久久| 一进一出抽搐动态| 老司机深夜福利视频在线观看| 国产主播在线观看一区二区| 在线观看日韩欧美| 欧美精品啪啪一区二区三区| 日韩欧美一区二区三区在线观看 | 国产成人精品久久二区二区91| 国产精品永久免费网站| 悠悠久久av| 日韩欧美免费精品| 久久午夜综合久久蜜桃| 男人舔女人的私密视频| 人人妻人人澡人人爽人人夜夜| 女人被狂操c到高潮| 久久香蕉精品热| 亚洲人成77777在线视频| 成人国语在线视频| 建设人人有责人人尽责人人享有的| 国产精品九九99| 国产单亲对白刺激| 亚洲精品一卡2卡三卡4卡5卡| 女人久久www免费人成看片| 国产精品亚洲av一区麻豆| 每晚都被弄得嗷嗷叫到高潮| 亚洲av熟女| 久久午夜综合久久蜜桃| 男人舔女人的私密视频| 久久精品国产亚洲av高清一级| 欧美大码av| 91成人精品电影| 91国产中文字幕| 日韩免费高清中文字幕av| 国产欧美日韩一区二区三区在线| 日本黄色视频三级网站网址 | 91麻豆av在线| 久热爱精品视频在线9| 国产淫语在线视频| 久久精品成人免费网站| 国产日韩一区二区三区精品不卡| 精品少妇一区二区三区视频日本电影| 国产精品自产拍在线观看55亚洲 | av天堂在线播放| 亚洲黑人精品在线| 脱女人内裤的视频| 热99久久久久精品小说推荐| 中出人妻视频一区二区| 涩涩av久久男人的天堂| 一进一出抽搐动态| 日本黄色视频三级网站网址 | av电影中文网址| 国产精品免费一区二区三区在线 | 色老头精品视频在线观看| 在线天堂中文资源库| 亚洲第一欧美日韩一区二区三区| 亚洲精品成人av观看孕妇| a级片在线免费高清观看视频| 欧美色视频一区免费| 国产在线精品亚洲第一网站| 亚洲伊人色综图| 国产黄色免费在线视频| 久久精品国产综合久久久| 国产蜜桃级精品一区二区三区 | 午夜视频精品福利| 色精品久久人妻99蜜桃| xxx96com| 国产主播在线观看一区二区| 十分钟在线观看高清视频www| 久久婷婷成人综合色麻豆| 久9热在线精品视频| 999久久久国产精品视频| 国产麻豆69| 99国产极品粉嫩在线观看| 国产亚洲欧美98| 免费黄频网站在线观看国产| 欧美日韩亚洲国产一区二区在线观看 | 国产男女超爽视频在线观看| 天天躁日日躁夜夜躁夜夜| 丝袜美腿诱惑在线| 欧美精品啪啪一区二区三区| 亚洲av欧美aⅴ国产| 欧美精品亚洲一区二区| 久久久久国内视频| 精品国产超薄肉色丝袜足j| 久久香蕉激情| 韩国精品一区二区三区| 狂野欧美激情性xxxx| 国产在线观看jvid| 男女高潮啪啪啪动态图| 男女床上黄色一级片免费看| 在线观看免费高清a一片| 一个人免费在线观看的高清视频| 精品久久久精品久久久| 亚洲七黄色美女视频| 国产精品国产高清国产av | 国产欧美日韩一区二区三区在线| 99久久精品国产亚洲精品| 丁香欧美五月| 一级片'在线观看视频| 国产高清激情床上av| 国产日韩一区二区三区精品不卡| 日韩三级视频一区二区三区| 搡老熟女国产l中国老女人| 性色av乱码一区二区三区2| 欧美日韩av久久| 黄片大片在线免费观看| 18禁观看日本| 免费不卡黄色视频| 日本欧美视频一区| 91大片在线观看| 操美女的视频在线观看| 国产淫语在线视频| 别揉我奶头~嗯~啊~动态视频| www日本在线高清视频| 午夜福利在线免费观看网站| 免费观看精品视频网站| 亚洲第一青青草原| 男女高潮啪啪啪动态图| 成年动漫av网址| 成年女人毛片免费观看观看9 | 精品乱码久久久久久99久播| 夫妻午夜视频| 黄片小视频在线播放| 国产99久久九九免费精品| 露出奶头的视频| 欧美国产精品va在线观看不卡| 1024视频免费在线观看| 12—13女人毛片做爰片一| 夜夜夜夜夜久久久久| 欧美在线黄色| 国产成人av激情在线播放| 露出奶头的视频| 欧美激情久久久久久爽电影 | 亚洲欧美一区二区三区黑人| 又紧又爽又黄一区二区| bbb黄色大片| 国产成人系列免费观看| 久久人妻av系列| 国产精品九九99| 超碰成人久久| 久久性视频一级片| 亚洲少妇的诱惑av| 国产片内射在线| 天堂√8在线中文| 香蕉久久夜色| 中亚洲国语对白在线视频| 国产一区二区三区视频了| 日韩一卡2卡3卡4卡2021年| 国产真人三级小视频在线观看| 91大片在线观看| 人人妻人人澡人人爽人人夜夜| 女性被躁到高潮视频| 99riav亚洲国产免费| 纯流量卡能插随身wifi吗| 久久草成人影院| 宅男免费午夜| 亚洲午夜理论影院| 中国美女看黄片| 亚洲 国产 在线| 精品久久蜜臀av无| 国产精品二区激情视频| 美国免费a级毛片| 亚洲国产欧美一区二区综合| 午夜精品国产一区二区电影| 校园春色视频在线观看| 精品人妻熟女毛片av久久网站| 美女福利国产在线| 电影成人av| 一进一出抽搐gif免费好疼 | 老司机亚洲免费影院| 黄片大片在线免费观看| 精品亚洲成a人片在线观看| 国产精品 欧美亚洲| 黄色视频不卡| 欧美国产精品va在线观看不卡| 久久性视频一级片| tube8黄色片| 久久热在线av| 中文字幕另类日韩欧美亚洲嫩草| 日本黄色视频三级网站网址 | 精品午夜福利视频在线观看一区| 亚洲成人国产一区在线观看| 天天躁日日躁夜夜躁夜夜| 免费看十八禁软件| 精品人妻1区二区| 国产高清videossex| 久久香蕉国产精品| 欧美日韩av久久| 久99久视频精品免费| av在线播放免费不卡| av国产精品久久久久影院| 狠狠狠狠99中文字幕| 美女视频免费永久观看网站| 99久久综合精品五月天人人| 捣出白浆h1v1| 757午夜福利合集在线观看| 免费观看a级毛片全部| 天天躁狠狠躁夜夜躁狠狠躁| 人人妻人人添人人爽欧美一区卜| 亚洲av第一区精品v没综合| 超碰97精品在线观看| 成年女人毛片免费观看观看9 | 精品熟女少妇八av免费久了| 精品电影一区二区在线| 精品一区二区三卡| 亚洲综合色网址| 国产免费av片在线观看野外av| 多毛熟女@视频| 国产蜜桃级精品一区二区三区 | 夜夜躁狠狠躁天天躁| 老汉色av国产亚洲站长工具| 色播在线永久视频| 亚洲av日韩在线播放| 国产精品99久久99久久久不卡| 欧美亚洲 丝袜 人妻 在线| 久久久久久免费高清国产稀缺| 在线观看免费午夜福利视频| videos熟女内射| 午夜成年电影在线免费观看| 精品国产美女av久久久久小说| 国产在线精品亚洲第一网站| 欧美日韩中文字幕国产精品一区二区三区 | 亚洲av片天天在线观看| 国产一区二区三区综合在线观看| 中文字幕av电影在线播放| 叶爱在线成人免费视频播放| a级毛片黄视频| 成年人黄色毛片网站| 中文字幕制服av| 亚洲免费av在线视频| 婷婷精品国产亚洲av在线 | 黑人巨大精品欧美一区二区蜜桃| 亚洲精品乱久久久久久| 一区福利在线观看| 欧美久久黑人一区二区| 女人久久www免费人成看片| 在线观看舔阴道视频| 国产精品av久久久久免费| 成人永久免费在线观看视频| 久久人妻熟女aⅴ| 欧美精品亚洲一区二区| 久久性视频一级片| 大型黄色视频在线免费观看| 久久这里只有精品19| 大型黄色视频在线免费观看| 久久久久视频综合| 国产主播在线观看一区二区| 亚洲精品国产色婷婷电影| 老汉色av国产亚洲站长工具| 91大片在线观看| 亚洲熟妇熟女久久| 王馨瑶露胸无遮挡在线观看| 性色av乱码一区二区三区2| 成年版毛片免费区| 这个男人来自地球电影免费观看| ponron亚洲| 十分钟在线观看高清视频www| 中文字幕制服av| av片东京热男人的天堂| 国产又色又爽无遮挡免费看| 黄色丝袜av网址大全| 亚洲av美国av| 黄色怎么调成土黄色| 久久国产精品大桥未久av| 国产精品久久久久成人av| 俄罗斯特黄特色一大片| 国产精品国产高清国产av | 欧美日韩精品网址| 久久久久久久久久久久大奶| 国产亚洲av高清不卡| bbb黄色大片| 免费少妇av软件| 制服人妻中文乱码| 亚洲成人国产一区在线观看| 成人影院久久| 啦啦啦 在线观看视频| 99国产精品一区二区三区| 日韩大码丰满熟妇| 国产精品亚洲一级av第二区| 欧美成狂野欧美在线观看|