• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于異構(gòu)平臺(tái)的卷積神經(jīng)網(wǎng)絡(luò)加速系統(tǒng)設(shè)計(jì)*

    2024-01-24 14:37:54秦文強(qiáng)吳仲城
    關(guān)鍵詞:流水資源系統(tǒng)

    秦文強(qiáng),吳仲城,張 俊,李 芳

    (1.安徽大學(xué)物質(zhì)科學(xué)與信息技術(shù)研究院,安徽 合肥 230601; 2.中國科學(xué)院合肥物質(zhì)科學(xué)研究院強(qiáng)磁場科學(xué)中心,安徽 合肥 230031;3.強(qiáng)磁場安徽省實(shí)驗(yàn)室,安徽 合肥 230031)

    1 引言

    隨著深度神經(jīng)網(wǎng)絡(luò)算法的發(fā)展[1,2],智能應(yīng)用不再局限于在云端服務(wù)器上運(yùn)行,諸如智慧城市、智能安防等應(yīng)用場景,對算法的移動(dòng)嵌入式計(jì)算提出了迫切需求[3]。卷積神經(jīng)網(wǎng)絡(luò)CNN(Convolutional Neural Network)的前向推理過程是計(jì)算密集型任務(wù),由于網(wǎng)絡(luò)參數(shù)量和推理計(jì)算量大,使其難以高效地部署于資源有限的低功耗嵌入式設(shè)備。近年來,卷積神經(jīng)網(wǎng)絡(luò)在終端和邊緣側(cè)的應(yīng)用處于快速發(fā)展階段,模型的加速計(jì)算通??刹捎肅PU、GPU、專用ASIC、FPGA 4類芯片實(shí)現(xiàn)。直接使用CPU進(jìn)行CNN的前向運(yùn)算,很難滿足實(shí)時(shí)性的要求;基于GPU的運(yùn)算雖然速度快,但該類硬件平臺(tái)一般體積大、成本高、功耗高。專用ASIC通過定制化可以有效提升模型運(yùn)算速度,但開發(fā)周期長、難度大,一次性成本高。而FPGA因其高并行、低功耗、靈活可編程的優(yōu)勢,成為嵌入式設(shè)備部署智能應(yīng)用的主要選擇[4]。

    在基于FPGA的嵌入式設(shè)備上實(shí)現(xiàn)高效的CNN模型部署,業(yè)界主要聚焦于研究如何降低網(wǎng)絡(luò)在硬件上的實(shí)現(xiàn)復(fù)雜度,并實(shí)現(xiàn)高并行計(jì)算,減少訪存開銷,提升系統(tǒng)的吞吐率,同時(shí)保證模型推理精度。文獻(xiàn)[5]采用量化的方法,降低資源消耗;文獻(xiàn)[6]利用循環(huán)展開實(shí)現(xiàn)并行計(jì)算,利用流水化操作提升計(jì)算效率,但由于數(shù)據(jù)加載和卷積計(jì)算是串行進(jìn)行,系統(tǒng)吞吐率較低;文獻(xiàn)[7]利用循環(huán)優(yōu)化增大并行度,同時(shí)提出了一種數(shù)據(jù)路由器,減少了內(nèi)存訪問的開銷,但是該文獻(xiàn)中的方法將權(quán)重參數(shù)全部導(dǎo)入片上BRAM,消耗大量資源,導(dǎo)致該方法難以應(yīng)用于資源受限的平臺(tái),伸縮性較差。

    目前,大部分神經(jīng)網(wǎng)絡(luò)加速器[8,9]都是針對大型CNN模型(如VGG16、ResNet50)進(jìn)行設(shè)計(jì)的,硬件資源消耗較多且難以獲得較高性能。近年來,一些研究人員開始研究輕量化網(wǎng)絡(luò)的加速,文獻(xiàn)[10]實(shí)現(xiàn)了輕量化模型SqueezeNet的FPGA加速器,利用特征圖的稀疏性,采用跳過零激活及數(shù)據(jù)共享的方法,減少了計(jì)算量,但其批標(biāo)準(zhǔn)化在FPGA上實(shí)現(xiàn),導(dǎo)致硬件復(fù)雜度和資源開銷較大。文獻(xiàn)[11]針對輕量化MobileNet設(shè)計(jì)了一個(gè)并行加速單元,并在卷積層之間實(shí)現(xiàn)了流水化操作,但由于其數(shù)據(jù)讀取的速度不能很好地與計(jì)算并行度相匹配,導(dǎo)致計(jì)算效率不高。

    針對以上問題,本文分別從網(wǎng)絡(luò)模型優(yōu)化以及硬件加速優(yōu)化2個(gè)方面進(jìn)行研究,通過批標(biāo)準(zhǔn)化融合和動(dòng)態(tài)定點(diǎn)數(shù)量化對模型進(jìn)行預(yù)處理,降低硬件實(shí)現(xiàn)復(fù)雜度;利用卷積分塊策略,使系統(tǒng)具有較好的伸縮性;通過循環(huán)展開、流水化、數(shù)組分割的方法實(shí)現(xiàn)高效并行卷積計(jì)算,同時(shí)通過數(shù)據(jù)流優(yōu)化的方法,提升了系統(tǒng)吞吐率。根據(jù)MobileNet網(wǎng)絡(luò)結(jié)構(gòu)特點(diǎn),基于FPGA分別設(shè)計(jì)了標(biāo)準(zhǔn)卷積、逐點(diǎn)卷積、深度卷積、殘差連接、池化和全連接IP (Intellectual Property)核,并結(jié)合CPU進(jìn)行資源調(diào)度,實(shí)現(xiàn)了基于異構(gòu)平臺(tái)的MobileNet神經(jīng)網(wǎng)絡(luò)加速系統(tǒng)。

    2 MobileNet神經(jīng)網(wǎng)絡(luò)

    MobileNet系列網(wǎng)絡(luò)模型[12-14]的主要特點(diǎn)是引入了深度可分離卷積的設(shè)計(jì)理念[15]。深度可分離卷積由深度Dw(Depthwise)卷積和逐點(diǎn)Pw(Pointwise)卷積組成,分別起到濾波和轉(zhuǎn)換通道的作用。相比標(biāo)準(zhǔn)卷積操作,Dw卷積的卷積核負(fù)責(zé)單個(gè)通道的特征提取,通道間不疊加;Pw卷積是卷積核為1*1的標(biāo)準(zhǔn)卷積,通過將特征圖在深度方向上進(jìn)行加權(quán)組合,實(shí)現(xiàn)通道間信息的融合。該系列模型中,MobileNetV2網(wǎng)絡(luò)采用線性瓶頸的反向殘差結(jié)構(gòu),對特征空間先升維再降維,在移動(dòng)應(yīng)用上可提供高效的內(nèi)存實(shí)現(xiàn)[13]。如圖1所示,反向殘差結(jié)構(gòu)分為卷積步長分別為1和2的2種類型,圖1中BN(Batch Normalization)為批標(biāo)準(zhǔn)化操作,ReLU6和Linear為激活函數(shù)。

    Figure 1 Structure of reverse residual圖1 反向殘差結(jié)構(gòu)

    MobileNetV2網(wǎng)絡(luò)整體配置如表1所示。其中,Conv 為標(biāo)準(zhǔn)卷積,bottleneck為線性瓶頸的反向殘差結(jié)構(gòu),Avgpool 為平均池化,c為輸出通道數(shù),n為該模塊重復(fù)次數(shù),s為步長。

    3 網(wǎng)絡(luò)模型優(yōu)化

    3.1 批標(biāo)準(zhǔn)化融合

    網(wǎng)絡(luò)中每個(gè)卷積層的結(jié)構(gòu)包括:卷積計(jì)算、批標(biāo)準(zhǔn)化和激活函數(shù)。本文將批標(biāo)準(zhǔn)化作為一個(gè)線性的操作融合到卷積計(jì)算中,融合過程如下所示。

    卷積計(jì)算公式如式(1)所示:

    y=w*x+b

    (1)

    其中,w為權(quán)重,b為偏置。

    批標(biāo)準(zhǔn)化計(jì)算公式如式(2)所示:

    (2)

    其中,mean為均值,var為方差,γ為縮放系數(shù),β為偏移系數(shù)。

    將式(1)和式(2)進(jìn)行結(jié)合得到式(3):

    (3)

    融合后,得到的卷積層新參數(shù)權(quán)重w_new和偏置b_new分別如式(4)和式(5)所示:

    (4)

    (5)

    批標(biāo)準(zhǔn)化融合之后,在FPGA上,只需要讓融合后得到的權(quán)重參數(shù)w_new和b_new參加卷積計(jì)算即可,省去了批標(biāo)準(zhǔn)化運(yùn)算在FPGA端的實(shí)現(xiàn)以及批標(biāo)準(zhǔn)化參數(shù)傳輸?shù)拈_銷,同時(shí)降低了FPGA資源的消耗,提升了網(wǎng)絡(luò)在硬件上的執(zhí)行效率。

    3.2 量化

    神經(jīng)網(wǎng)絡(luò)訓(xùn)練完成后得到的參數(shù)是浮點(diǎn)型的,而在FPGA上進(jìn)行浮點(diǎn)數(shù)運(yùn)算,需要消耗大量的DSP資源和較多的時(shí)鐘周期。因此,本文采用動(dòng)態(tài)定點(diǎn)數(shù)量化方法[16],將32位的浮點(diǎn)型參數(shù)量化為16位的定點(diǎn)數(shù),以減少資源的消耗和數(shù)據(jù)傳輸?shù)拈_銷,加快網(wǎng)絡(luò)的推理速度。浮點(diǎn)數(shù)轉(zhuǎn)化為定點(diǎn)數(shù)如式(6)所示:

    xfixed=(int)(xfloat*2wd)

    (6)

    其中,wd為定點(diǎn)數(shù)中小數(shù)部分的位寬。

    量化流程如下所示:

    (7)

    (2)確定第i層參數(shù)和特征圖數(shù)據(jù)的整數(shù)位寬Ii,如式(8)所示:

    (8)

    (3)確定第i層參數(shù)和特征圖數(shù)據(jù)的小數(shù)位寬Fi,如式(9)所示:

    Fi=16-Ii

    (9)

    前向推理時(shí),權(quán)重參數(shù)是固定的,但由于不同的網(wǎng)絡(luò)輸入,得到的每層輸出不同。為了能保證最終結(jié)果的精度,本文用1 000幅圖像進(jìn)行推理,通過對每一層的輸出求平均值,使特征圖的數(shù)據(jù)范圍更加準(zhǔn)確。

    4 硬件加速系統(tǒng)設(shè)計(jì)與優(yōu)化

    XILINX公司推出Vivado高層次綜合HLS(High Level Synthesis),可以將高級抽象語言如 C、C++轉(zhuǎn)換成 VHDL硬件描述語言,方便用戶進(jìn)行FPGA電路的設(shè)計(jì)、調(diào)試,提高開發(fā)效率[17,18]。本文利用Vivado HLS和C語言進(jìn)行MobileNet加速器的FPGA設(shè)計(jì)與優(yōu)化。

    4.1 系統(tǒng)總體架構(gòu)及功能劃分

    本文利用軟硬件協(xié)同設(shè)計(jì)的方法。其中,CPU負(fù)責(zé)完成上層應(yīng)用程序的執(zhí)行以及系統(tǒng)的調(diào)度和控制,FPGA負(fù)責(zé)加速神經(jīng)網(wǎng)絡(luò)的前向推理,充分結(jié)合CPU的邏輯控制能力和FPGA的并行計(jì)算優(yōu)勢。異構(gòu)系統(tǒng)需要在FPGA中設(shè)計(jì)軟核處理器,雖然會(huì)消耗一定的FPGA資源,但可以實(shí)現(xiàn)軟硬件設(shè)計(jì)的分離,底層的硬件開發(fā)人員負(fù)責(zé)對FPGA進(jìn)行設(shè)計(jì)并封裝,軟件開發(fā)人員負(fù)責(zé)編寫應(yīng)用驅(qū)動(dòng)程序,調(diào)用設(shè)計(jì)好的硬件模塊。同時(shí),在面對不同的上層應(yīng)用需求時(shí),無需再對底層的硬件設(shè)計(jì)進(jìn)行不斷的修改和調(diào)試,實(shí)現(xiàn)硬件模塊的復(fù)用,較好地滿足終端設(shè)備復(fù)雜的應(yīng)用需求,非常適合人工智能在嵌入式邊緣場景中的應(yīng)用。

    Figure 2 Overall framework of accelerated system圖2 加速系統(tǒng)總體框架

    圖2為加速系統(tǒng)總體框架。在CPU端,設(shè)計(jì)應(yīng)用驅(qū)動(dòng)程序,完成推理前的準(zhǔn)備工作。根據(jù)網(wǎng)絡(luò)結(jié)構(gòu)調(diào)用加速器中的相應(yīng)模塊完成前向推理,主要包括:系統(tǒng)初始化;為網(wǎng)絡(luò)參數(shù)分配內(nèi)存空間,加載參數(shù)到內(nèi)存;對輸入圖像進(jìn)行歸一化、量化等預(yù)處理;將網(wǎng)絡(luò)各層的配置參數(shù)傳給加速器并調(diào)用具體功能模塊進(jìn)行計(jì)算;對加速器返回的圖像分類結(jié)果進(jìn)行評估。在FPGA端,根據(jù)MobileNet網(wǎng)絡(luò)的結(jié)構(gòu)特點(diǎn),設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)加速器,主要包括:標(biāo)準(zhǔn)卷積模塊、深度卷積模塊、逐點(diǎn)卷積模塊、殘差連接模塊、池化模塊、全連接模塊。同時(shí),在FPGA的片上BRAM中分別設(shè)計(jì)輸入緩存、輸出緩存、權(quán)重緩存,然后將FPGA加速器與CPU集成,構(gòu)建模型加速SoC(System on a Chip)異構(gòu)系統(tǒng)。加速器通過AXI4總線與CPU的AXI_HP接口連接,緩存與DDR3內(nèi)存之間通過AXI4總線進(jìn)行數(shù)據(jù)交互;通過AXI_Lite總線與CPU的AXI_GP接口連接,CPU利用AXI_Lite總線對加速器內(nèi)部寄存器進(jìn)行配置。內(nèi)存DDR與AXI接口之間的數(shù)據(jù)交互主要由DDR控制器負(fù)責(zé)控制。

    4.2 卷積加速架構(gòu)設(shè)計(jì)

    4.2.1 卷積分塊

    由于神經(jīng)網(wǎng)絡(luò)每層具有不同的規(guī)模,為了使設(shè)計(jì)具有一定的伸縮性,本文采用卷積分塊策略[19],設(shè)計(jì)一個(gè)固定規(guī)模大小的通用卷積塊單元,對卷積進(jìn)行分塊計(jì)算。如圖3所示,輸入的分塊變量表示包括通道數(shù)Tn、寬Tic和高Tir,卷積核分塊表示包括通道數(shù)Tm*Tn、寬Tkc和高Tkr,輸出的分塊變量表示包括通道數(shù)Tm、寬Toc和高Tor。其中,輸入和輸出分塊變量滿足如下關(guān)系:Tir=(Tor-1)*S+Tkr,Tic=(Toc-1)*S+Tkc,其中S為卷積核移動(dòng)步長。

    Figure 3 Computation in blocks of convolution圖3 卷積分塊計(jì)算

    卷積塊單元每次進(jìn)行固定塊大小的卷積計(jì)算,同時(shí)通過滑動(dòng)窗口的方式對卷積塊單元進(jìn)行分時(shí)復(fù)用,從而完成所有輸出特征圖的計(jì)算。卷積塊單元規(guī)模的確定需要綜合考慮整個(gè)網(wǎng)絡(luò)中所有卷積層的特征圖尺寸、卷積核尺寸、輸入和輸出通道大小以及硬件開發(fā)平臺(tái)的資源情況。在理想情況下,規(guī)模越大,并行計(jì)算時(shí)計(jì)算并行度越高,前向推理速度越快,但同時(shí)消耗的DSP和片上BRAM等硬件資源也越多??紤]到本文使用的目標(biāo)硬件Zynq-7020芯片共有220個(gè)DSP,BRAM數(shù)量也較少,還需要給其他模塊預(yù)留空間和資源,最終確定標(biāo)準(zhǔn)卷積的分塊變量大小為:Tm=8,Tn=3,Tkc=Tkr=3,Toc=Tor=28。在實(shí)際應(yīng)用中,需要在推理速度和資源消耗上進(jìn)行折衷考慮。通過調(diào)節(jié)卷積塊單元規(guī)模,使設(shè)計(jì)具備一定的伸縮性,以適應(yīng)不同資源規(guī)模的平臺(tái)。

    4.2.2 并行卷積計(jì)算

    卷積計(jì)算主要由輸出特征圖(高、寬)、輸出通道、輸入通道、卷積核(高、寬)6個(gè)維度嵌套的循環(huán)結(jié)構(gòu)組成。本文通過調(diào)整卷積塊內(nèi)的嵌套循環(huán)順序,將輸出通道和輸入通道的循環(huán)置于最內(nèi)層,并且通過UNROOL指令對這2個(gè)維度進(jìn)行循環(huán)展開,讓編譯器創(chuàng)建多組相同的硬件計(jì)算單元來實(shí)現(xiàn)并行計(jì)算,以此提高卷積計(jì)算效率。同時(shí),通過PIPELINE指令進(jìn)行流水化(如圖4所示),使讀數(shù)據(jù)(RD)、計(jì)算(CMP)和寫數(shù)據(jù)(WR)流水化進(jìn)行,增大吞吐率[20]。

    Figure 4 Schematic diagram of pipelining圖4 流水化示意圖

    Figure 5 Core hardware structure of parallel computing圖5 并行計(jì)算的核心硬件結(jié)構(gòu)

    4.2.3 緩存分割

    卷積塊內(nèi)的計(jì)算并行度分別為Tn、Tm*Tn和Tm,為了滿足并行計(jì)算,需要在一個(gè)周期內(nèi)完成數(shù)組中多個(gè)數(shù)據(jù)的同時(shí)讀寫。然而,數(shù)組在BRAM中是連續(xù)存放的,最多只有2個(gè)數(shù)據(jù)端口,為實(shí)現(xiàn)數(shù)據(jù)同時(shí)讀寫,本文采用了緩存分割的設(shè)計(jì)。如圖6所示,ARRAY PARTIRION指令將輸入緩存、權(quán)重緩存、輸出緩存分別分割為具有Tn個(gè)讀端口、Tm*Tn個(gè)讀端口、Tm個(gè)寫端口的BRAM區(qū)塊,由此增加其讀寫端口的數(shù)量,從而實(shí)現(xiàn)了并行讀寫。圖6中,Tm表示分割后BRAM區(qū)塊的個(gè)數(shù),[Tor][Toc]表示分割后BRAM區(qū)塊的大小為Tor*Toc,[Tor]表示數(shù)組的行數(shù),[Toc]表示數(shù)組的列數(shù),其他變量的含義類似。

    Figure 6 Schematic diagram of cache segmentation圖6 緩存分割示意圖

    4.3 數(shù)據(jù)流優(yōu)化

    4.3.1 數(shù)據(jù)傳輸優(yōu)化

    由于FPGA 訪問內(nèi)存DDR會(huì)有較大的延時(shí),為了減少訪存開銷,本文在設(shè)計(jì)上增加了讀取數(shù)據(jù)的接口數(shù)量和接口位寬。如圖7所示,將數(shù)據(jù)地址空間平均劃分為4塊,將每一塊的首地址作為每個(gè)通道的入口地址,利用4個(gè)AXI接口并行讀取數(shù)據(jù),增加數(shù)據(jù)傳輸帶寬,并且設(shè)置每個(gè)接口的位寬最大為64 bit。由于量化后的每個(gè)數(shù)據(jù)位寬為16 bit,所以每個(gè)通道可以同時(shí)傳送4個(gè)數(shù)據(jù),數(shù)據(jù)到達(dá)緩存后按16 bit分解為單個(gè)數(shù)據(jù),并同時(shí)送入PE陣列進(jìn)行運(yùn)算。

    Figure 7 Schematic diagram of data transmission optimization圖7 數(shù)據(jù)傳輸優(yōu)化示意圖

    同時(shí),將數(shù)據(jù)在內(nèi)存中以行優(yōu)先的方式排布,使數(shù)據(jù)的讀取順序與數(shù)據(jù)在內(nèi)存中的排布方式一致。在并行傳輸數(shù)據(jù)的同時(shí),通過較長的突發(fā)傳輸長度抵消讀地址通道握手的時(shí)間和一個(gè)數(shù)據(jù)讀出所需等待的時(shí)間,以減少數(shù)據(jù)傳輸延遲。

    Figure 8 Ping-pong caching mechanisms圖8 “乒乓”緩存機(jī)制

    4.3.2 任務(wù)級流水化

    卷積分塊計(jì)算可分為3個(gè)階段:加載數(shù)據(jù)、卷積計(jì)算和寫回結(jié)果。為了掩蓋數(shù)據(jù)傳輸?shù)臅r(shí)間,本文采用“乒乓”緩存機(jī)制實(shí)現(xiàn)任務(wù)級流水化。如圖8所示,在FPGA的片上BRAM中設(shè)置2塊同樣大小的輸入緩存、權(quán)重緩存和輸出緩存,當(dāng)緩存1加載數(shù)據(jù)時(shí),PE陣列處理緩存2中的數(shù)據(jù),并將結(jié)果寫回;當(dāng)緩存2加載數(shù)據(jù)時(shí),PE陣列處理緩存1中的數(shù)據(jù),并將結(jié)果寫回。通過這種方式,使數(shù)據(jù)傳輸時(shí)間與計(jì)算時(shí)間重疊,減少了延遲并改善吞吐量,進(jìn)一步提高了加速系統(tǒng)的性能。圖8中的×代表沒有數(shù)據(jù)流,該通路不工作。

    Vivado HLS的綜合結(jié)果分析界面如圖9所示。可以看到,經(jīng)過緩存分割和數(shù)據(jù)流優(yōu)化后,模塊的數(shù)據(jù)加載、卷積計(jì)算和寫回結(jié)果3個(gè)過程同時(shí)執(zhí)行。

    Figure 9 Synthesis results analysis of Vivado HLS圖9 Vivado HLS綜合結(jié)果分析

    4.4 其它模塊設(shè)計(jì)

    4.4.1 深度卷積模塊

    深度卷積計(jì)算方式與標(biāo)準(zhǔn)卷積不同,一個(gè)卷積核只負(fù)責(zé)卷積特征圖的一個(gè)通道。因此,深度卷積只需要5個(gè)維度嵌套的循環(huán),其它實(shí)現(xiàn)方法與標(biāo)準(zhǔn)卷積基本一致。首先,進(jìn)行卷積分塊,根據(jù)深度卷積層的特征,確定分塊大小為:Tm=8,Tkc=Tkr=3,Toc=Tor=7,然后,在輸出通道上進(jìn)行循環(huán)展開、流水化、數(shù)組分割操作,并利用數(shù)據(jù)傳輸優(yōu)化和“乒乓”緩存機(jī)制進(jìn)行數(shù)據(jù)流優(yōu)化,以提高計(jì)算的并行度和吞吐率。

    4.4.2 逐點(diǎn)卷積模塊

    逐點(diǎn)卷積與標(biāo)準(zhǔn)卷積計(jì)算方式一致。卷積核尺寸為1*1。先進(jìn)行卷積分塊,確定分塊大小為:Tm=Tn=8,Toc=Tor=14,之后將塊內(nèi)的計(jì)算變?yōu)槎S矩陣的乘法運(yùn)算,即A[14*14][8]*B[8][8]=C[14*14][8]。然后,在輸入、輸出通道2個(gè)維度上進(jìn)行循環(huán)展開、流水化、數(shù)組分割操作,利用數(shù)據(jù)傳輸優(yōu)化和“乒乓”緩存機(jī)制進(jìn)行數(shù)據(jù)流優(yōu)化。

    4.4.3 殘差連接模塊

    該模塊用來完成反向殘差結(jié)構(gòu)中的支路殘差求和,輸入2幅同樣大小的特征圖,將2幅圖對應(yīng)位置的數(shù)據(jù)相加取和,得到輸出數(shù)據(jù)。通過在通道維度上使用循環(huán)展開和流水化的方法來加快運(yùn)算過程。

    4.4.4 池化模塊

    池化部分采用一種基于“部分和緩存”的多路并行計(jì)算方法,池化核大小為7*7,內(nèi)部邏輯如圖10所示,計(jì)算原理如下所示:

    (1)模塊先從DDR讀取數(shù)據(jù)到In_buf中,用通道指針來控制數(shù)據(jù)讀取的位置,在設(shè)計(jì)中使用5個(gè)部分和緩存Psum存儲(chǔ)中間結(jié)果。

    (2)將每個(gè)通道的數(shù)據(jù)兩兩相加,放入Psum中,并通過PIPELINE指令使部分和間的計(jì)算并行流水進(jìn)行,得到最終的平均池化值,送入Out_buf。

    (3)同時(shí),在輸入通道維度進(jìn)行循環(huán)展開和流水化,設(shè)置通道并行度T=32,直到完成所有通道的池化計(jì)算。

    該池化操作通過多路通道并行的部分和累加計(jì)算,加快了池化計(jì)算的速度。

    Figure 10 Pooling operation process圖10 池化運(yùn)算過程

    4.4.5 全連接模塊

    全連接用于最終的分類輸出。本文使用的ImageNet數(shù)據(jù)集共有1 000個(gè)類別。全連接計(jì)算的實(shí)質(zhì)為:向量A[1280]與矩陣B[1280][1000]相乘得到向量C[1000]。本文對矩陣的行、列2個(gè)維度進(jìn)行循環(huán)展開和流水化,設(shè)置并行度為:Tn=32和Tm=10,并使用“乒乓”緩存機(jī)制來加快計(jì)算過程。

    5 實(shí)驗(yàn)及結(jié)果分析

    實(shí)驗(yàn)采用XILINX公司推出的 PYNQ-Z2開發(fā)板作為測試平臺(tái),該平臺(tái)采用ZYNQ-7020芯片,芯片內(nèi)部資源如表2所示,FPGA端的時(shí)鐘頻率為125 MHz,ARM端的時(shí)鐘頻率為667 MHz。

    Table 2 Chip resources表2 芯片資源

    本文首先在PC端用ImageNet數(shù)據(jù)集訓(xùn)練MobileNetV2網(wǎng)絡(luò),得到網(wǎng)絡(luò)每層的權(quán)重參數(shù)和批標(biāo)準(zhǔn)化參數(shù);然后經(jīng)過批標(biāo)準(zhǔn)化融合和量化將最終的權(quán)重參數(shù)導(dǎo)入開發(fā)板中。實(shí)驗(yàn)對比了分別利用CPU和CPU+FPGA進(jìn)行CNN推理的性能表現(xiàn)。CPU方案是指在ARM端安裝TensorFlow深度學(xué)習(xí)框架,搭建MobileNetV2網(wǎng)絡(luò)模型,只利用CPU進(jìn)行網(wǎng)絡(luò)前向推理;CPU+FPGA方案是指不使用深度學(xué)習(xí)框架,利用本文設(shè)計(jì)的加速器進(jìn)行前向推理。

    加速系統(tǒng)的實(shí)驗(yàn)流程設(shè)計(jì)如下:

    (1)首先,基于FPGA使用Vivado HLS完成加速器各模塊IP核的設(shè)計(jì);

    (2)然后,利用Vivado將加速器IP核結(jié)合CPU搭建加速系統(tǒng),驗(yàn)證設(shè)計(jì)并生成比特流,加載到開發(fā)板;

    (3)最后,在CPU端設(shè)計(jì)應(yīng)用驅(qū)動(dòng)程序,調(diào)用加速器完成神經(jīng)網(wǎng)絡(luò)的前向推理。

    實(shí)驗(yàn)結(jié)果如表3所示??梢钥吹?基于MobileNet神經(jīng)網(wǎng)絡(luò)的加速系統(tǒng)對單幀圖像的推理時(shí)間為0.18 s,相對于僅使用ARM單核處理器實(shí)現(xiàn)了128倍的加速效果。本文采用了動(dòng)態(tài)定點(diǎn)數(shù)量化的方法,將32位浮點(diǎn)型參數(shù)量化為16位的定點(diǎn)數(shù)。為了比較量化前后模型的準(zhǔn)確率,采用1 000幅圖像進(jìn)行測試。結(jié)果表明,量化后的準(zhǔn)確率僅下降了0.3%,說明本文采用的量化方法對模型的精度影響較小;加速系統(tǒng)運(yùn)行時(shí)的平均功耗為2.62 W,滿足低功耗的設(shè)計(jì)要求。

    Table 3 Experimental results表3 實(shí)驗(yàn)結(jié)果

    各模塊資源占用情況如表4所示,可以看到加速系統(tǒng)整體資源消耗較少。由于本文采用了卷積并行計(jì)算和任務(wù)級流水化等方法使卷積部分資源消耗占比較大,其中卷積部分消耗的DSP資源占總耗資源的97%,消耗的BRAM資源占總耗資源的65%。

    Table 4 Resource usage of each module表4 各模塊資源占用情況

    表5對比了本文工作與相關(guān)工作的綜合性能。其中,文獻(xiàn)[8]提出了一種數(shù)據(jù)重排方法,提高了外部存儲(chǔ)器帶寬的利用率,但由于其加速的網(wǎng)絡(luò)為參數(shù)量較大的VGG16,在占用較大資源的情況下,單幀推理時(shí)間較長且功耗較高;文獻(xiàn)[11]實(shí)現(xiàn)了卷積層之間的流水化,增大了系統(tǒng)的吞吐率,整體設(shè)計(jì)消耗的資源較少,系統(tǒng)功耗也較低,但系統(tǒng)的推理延遲較大;文獻(xiàn)[21]在FPGA中直接用32位的浮點(diǎn)數(shù)進(jìn)行運(yùn)算,盡管通過通道間并行計(jì)算提升了卷積計(jì)算效率,同時(shí)采用DMA加快了數(shù)據(jù)在內(nèi)存和FPGA片上緩存之間的交互,減小了訪存延遲,但最終的推理延遲較大。在量化策略上,本文和文獻(xiàn)[8]、文獻(xiàn)[11]的設(shè)計(jì)中都將網(wǎng)絡(luò)參數(shù)量化為16位定點(diǎn)數(shù)??梢钥闯?本文單幀推理速度是文獻(xiàn)[11]的16.08倍,是文獻(xiàn)[21]的99倍。

    6 結(jié)束語

    本文提出了一種新的基于異構(gòu)平臺(tái)的卷積神經(jīng)網(wǎng)絡(luò)加速架構(gòu),設(shè)計(jì)并實(shí)現(xiàn)了基于MobileNet的輕量化卷積神經(jīng)網(wǎng)絡(luò)加速系統(tǒng),利用動(dòng)態(tài)定點(diǎn)數(shù)量化和批標(biāo)準(zhǔn)化融合的方法,減少了硬件復(fù)雜度和資源開銷;利用卷積分塊、并行卷積計(jì)算、數(shù)據(jù)流優(yōu)化的方法,提高了卷積運(yùn)算效率,增大了系統(tǒng)吞吐率,使系統(tǒng)具有較好的伸縮性。在PYNQ-Z2平臺(tái)的實(shí)驗(yàn)結(jié)果表明,該系統(tǒng)具有高效的計(jì)算內(nèi)核,圖像識(shí)別速度快,加速效果明顯且功耗低,可以將Mobilenet網(wǎng)絡(luò)高效地應(yīng)用于資源有限的嵌入式設(shè)備。下一步利用卷積神經(jīng)網(wǎng)絡(luò)加速系統(tǒng)研制面向行業(yè)應(yīng)用的視覺檢測智能終端,將系統(tǒng)部署于實(shí)際應(yīng)用場景中。

    Table 5 Comparison of system design synthesis results表5 系統(tǒng)設(shè)計(jì)綜合對比

    猜你喜歡
    流水資源系統(tǒng)
    Smartflower POP 一體式光伏系統(tǒng)
    基礎(chǔ)教育資源展示
    WJ-700無人機(jī)系統(tǒng)
    ZC系列無人機(jī)遙感系統(tǒng)
    北京測繪(2020年12期)2020-12-29 01:33:58
    流水
    文苑(2020年10期)2020-11-07 03:15:26
    一樣的資源,不一樣的收獲
    資源回收
    流水有心
    天津詩人(2017年2期)2017-11-29 01:24:12
    連通與提升系統(tǒng)的最后一塊拼圖 Audiolab 傲立 M-DAC mini
    資源再生 歡迎訂閱
    資源再生(2017年3期)2017-06-01 12:20:59
    一本大道久久a久久精品| 在线 av 中文字幕| 亚洲国产精品成人久久小说| tube8黄色片| 亚洲国产精品999| 全区人妻精品视频| 亚洲美女视频黄频| 国产亚洲欧美精品永久| 免费观看性生交大片5| 国产亚洲最大av| 一二三四中文在线观看免费高清| 国产成人欧美| 精品人妻熟女毛片av久久网站| 欧美精品人与动牲交sv欧美| 精品久久国产蜜桃| 最近手机中文字幕大全| 韩国精品一区二区三区 | 女人精品久久久久毛片| 一级毛片我不卡| 中文字幕免费在线视频6| 欧美激情国产日韩精品一区| 婷婷色综合大香蕉| 91精品伊人久久大香线蕉| 亚洲精品中文字幕在线视频| 一本一本久久a久久精品综合妖精 国产伦在线观看视频一区 | 亚洲成人av在线免费| 少妇被粗大猛烈的视频| xxxhd国产人妻xxx| 一边摸一边做爽爽视频免费| 少妇的逼水好多| 人成视频在线观看免费观看| 亚洲内射少妇av| 老司机影院成人| 国产又爽黄色视频| 人成视频在线观看免费观看| 丰满乱子伦码专区| 天堂俺去俺来也www色官网| 午夜视频国产福利| 久久久亚洲精品成人影院| 自拍欧美九色日韩亚洲蝌蚪91| 亚洲四区av| 午夜福利视频在线观看免费| 男女免费视频国产| 久久人人爽人人爽人人片va| 亚洲人与动物交配视频| 另类亚洲欧美激情| 丝袜人妻中文字幕| 日韩成人av中文字幕在线观看| 久久久精品区二区三区| 黄色配什么色好看| 国产成人91sexporn| 精品少妇内射三级| 男女午夜视频在线观看 | 丝袜脚勾引网站| 国产免费又黄又爽又色| 2022亚洲国产成人精品| 国产综合精华液| 丰满饥渴人妻一区二区三| 亚洲精华国产精华液的使用体验| 男人操女人黄网站| 18禁在线无遮挡免费观看视频| 久久久久久人妻| 欧美激情极品国产一区二区三区 | av在线老鸭窝| 久久久久久久久久久久大奶| 黄片播放在线免费| 欧美亚洲日本最大视频资源| 免费av不卡在线播放| 精品国产一区二区久久| 9191精品国产免费久久| 伊人久久国产一区二区| 香蕉丝袜av| 18禁裸乳无遮挡动漫免费视频| 2021少妇久久久久久久久久久| 国产高清三级在线| 一级,二级,三级黄色视频| 97在线视频观看| 侵犯人妻中文字幕一二三四区| 亚洲人成网站在线观看播放| 成人黄色视频免费在线看| 综合色丁香网| 男人舔女人的私密视频| 精品熟女少妇av免费看| 亚洲精品国产色婷婷电影| 侵犯人妻中文字幕一二三四区| 宅男免费午夜| 亚洲天堂av无毛| 91在线精品国自产拍蜜月| 亚洲国产成人一精品久久久| 一级毛片黄色毛片免费观看视频| 欧美另类一区| 丰满饥渴人妻一区二区三| 日本黄色日本黄色录像| av免费在线看不卡| 人妻少妇偷人精品九色| 亚洲,欧美,日韩| 制服诱惑二区| 精品少妇内射三级| 亚洲精品久久成人aⅴ小说| 日韩人妻精品一区2区三区| 中文精品一卡2卡3卡4更新| 亚洲精品av麻豆狂野| 水蜜桃什么品种好| 亚洲人与动物交配视频| 人妻少妇偷人精品九色| 欧美成人午夜免费资源| 久久精品熟女亚洲av麻豆精品| 欧美+日韩+精品| 寂寞人妻少妇视频99o| 国产精品一国产av| 国产成人精品婷婷| 大片免费播放器 马上看| 一级黄片播放器| 午夜福利视频在线观看免费| 久久久久久久久久成人| 人成视频在线观看免费观看| 菩萨蛮人人尽说江南好唐韦庄| 黄片播放在线免费| 欧美xxxx性猛交bbbb| 97在线人人人人妻| videosex国产| 啦啦啦在线观看免费高清www| 97人妻天天添夜夜摸| 宅男免费午夜| 桃花免费在线播放| 亚洲精品成人av观看孕妇| 亚洲久久久国产精品| 日韩伦理黄色片| 欧美日韩国产mv在线观看视频| 久久久久久久亚洲中文字幕| 91国产中文字幕| 亚洲色图综合在线观看| 国产又爽黄色视频| av在线观看视频网站免费| 看免费av毛片| 国产高清三级在线| 国产精品一国产av| 一本久久精品| a级片在线免费高清观看视频| 成人黄色视频免费在线看| 王馨瑶露胸无遮挡在线观看| 日韩一区二区视频免费看| 超色免费av| 亚洲色图综合在线观看| 亚洲三级黄色毛片| 日本午夜av视频| 精品卡一卡二卡四卡免费| 国产精品麻豆人妻色哟哟久久| 男的添女的下面高潮视频| 青春草亚洲视频在线观看| 女的被弄到高潮叫床怎么办| 精品熟女少妇av免费看| 啦啦啦中文免费视频观看日本| av线在线观看网站| 一级片免费观看大全| 午夜免费鲁丝| 国产日韩欧美在线精品| 91aial.com中文字幕在线观看| 男男h啪啪无遮挡| 一级爰片在线观看| 亚洲色图 男人天堂 中文字幕 | 久久久久久久亚洲中文字幕| 黄片无遮挡物在线观看| 在线 av 中文字幕| 成年人免费黄色播放视频| 国产成人免费观看mmmm| 国产精品久久久久久精品古装| 少妇高潮的动态图| 国产一区亚洲一区在线观看| 中文字幕制服av| 国产精品久久久久久久电影| 日韩成人av中文字幕在线观看| 国产亚洲精品第一综合不卡 | 亚洲国产欧美日韩在线播放| videosex国产| 有码 亚洲区| 国产精品嫩草影院av在线观看| 一本一本久久a久久精品综合妖精 国产伦在线观看视频一区 | 各种免费的搞黄视频| 国产成人aa在线观看| 不卡视频在线观看欧美| 夫妻午夜视频| 日日啪夜夜爽| 黄片无遮挡物在线观看| 国内精品宾馆在线| 黄色配什么色好看| 国产精品一区二区在线不卡| 精品亚洲成国产av| 两性夫妻黄色片 | 黄色配什么色好看| 免费av中文字幕在线| 晚上一个人看的免费电影| 日本黄大片高清| 9色porny在线观看| 秋霞伦理黄片| 美女国产视频在线观看| 国产69精品久久久久777片| 老司机影院毛片| 夫妻午夜视频| 久久久久久久亚洲中文字幕| 精品国产一区二区久久| 蜜桃国产av成人99| 精品人妻偷拍中文字幕| 中文字幕精品免费在线观看视频 | 成人无遮挡网站| 久热这里只有精品99| 日韩不卡一区二区三区视频在线| 热re99久久精品国产66热6| 99国产综合亚洲精品| 男女高潮啪啪啪动态图| 国产色婷婷99| 菩萨蛮人人尽说江南好唐韦庄| 一级黄片播放器| 亚洲精品美女久久久久99蜜臀 | 免费在线观看完整版高清| 亚洲伊人久久精品综合| 国产精品蜜桃在线观看| 这个男人来自地球电影免费观看 | 国产亚洲午夜精品一区二区久久| 亚洲国产精品国产精品| 成人黄色视频免费在线看| 老司机影院成人| 精品人妻熟女毛片av久久网站| 午夜激情久久久久久久| 乱码一卡2卡4卡精品| 免费高清在线观看视频在线观看| 老司机影院成人| 国产成人精品福利久久| 一级毛片电影观看| 又黄又爽又刺激的免费视频.| 亚洲精品,欧美精品| 性色avwww在线观看| 亚洲,欧美,日韩| 国产成人精品婷婷| 久久久a久久爽久久v久久| 欧美日韩视频精品一区| 午夜激情av网站| 色网站视频免费| 天堂8中文在线网| 亚洲国产毛片av蜜桃av| 亚洲综合色惰| 婷婷色av中文字幕| 亚洲激情五月婷婷啪啪| 波多野结衣一区麻豆| a级毛片黄视频| 午夜免费观看性视频| 日韩人妻精品一区2区三区| 啦啦啦在线观看免费高清www| 日韩人妻精品一区2区三区| 亚洲国产精品一区三区| 亚洲人成网站在线观看播放| 亚洲内射少妇av| 久久精品国产鲁丝片午夜精品| 亚洲av国产av综合av卡| 亚洲欧美中文字幕日韩二区| 你懂的网址亚洲精品在线观看| 免费观看性生交大片5| 午夜视频国产福利| 成人国产av品久久久| 欧美日韩视频高清一区二区三区二| 巨乳人妻的诱惑在线观看| 69精品国产乱码久久久| 亚洲成人一二三区av| 国产成人精品无人区| 久久国产亚洲av麻豆专区| 另类亚洲欧美激情| 黑人猛操日本美女一级片| 亚洲伊人色综图| 国产精品成人在线| 三级国产精品片| 熟女电影av网| 亚洲高清免费不卡视频| 岛国毛片在线播放| 国产成人av激情在线播放| 美女中出高潮动态图| 亚洲欧洲国产日韩| 国产精品久久久久久精品古装| 22中文网久久字幕| 国产精品一区www在线观看| 香蕉丝袜av| 国产1区2区3区精品| 亚洲,欧美精品.| 啦啦啦在线观看免费高清www| av线在线观看网站| 国产熟女午夜一区二区三区| 午夜激情av网站| 日本-黄色视频高清免费观看| 免费观看无遮挡的男女| 亚洲国产日韩一区二区| 综合色丁香网| 在线精品无人区一区二区三| 久久影院123| 精品一区二区三卡| 少妇人妻久久综合中文| 高清毛片免费看| 哪个播放器可以免费观看大片| 在线免费观看不下载黄p国产| 满18在线观看网站| 欧美 亚洲 国产 日韩一| 伦理电影大哥的女人| 成人18禁高潮啪啪吃奶动态图| h视频一区二区三区| 我的女老师完整版在线观看| 亚洲精品一区蜜桃| 日本vs欧美在线观看视频| 国产成人欧美| 99香蕉大伊视频| 欧美丝袜亚洲另类| 国产精品国产三级专区第一集| 熟女人妻精品中文字幕| 男女下面插进去视频免费观看 | 欧美亚洲 丝袜 人妻 在线| www日本在线高清视频| 久久女婷五月综合色啪小说| 国产免费视频播放在线视频| 成人亚洲精品一区在线观看| 一二三四中文在线观看免费高清| 女性生殖器流出的白浆| 久久 成人 亚洲| 欧美+日韩+精品| 成人影院久久| 国产不卡av网站在线观看| 国产激情久久老熟女| 亚洲第一av免费看| 久久久国产一区二区| 欧美精品高潮呻吟av久久| 日日撸夜夜添| 国产高清三级在线| 亚洲av福利一区| 精品亚洲成a人片在线观看| 久久这里只有精品19| 18禁观看日本| 免费在线观看黄色视频的| 国产精品久久久久久久久免| 看非洲黑人一级黄片| 亚洲精品456在线播放app| av在线观看视频网站免费| 一级黄片播放器| 亚洲激情五月婷婷啪啪| 国产乱来视频区| 一级片免费观看大全| 9热在线视频观看99| 国产成人精品无人区| 色婷婷久久久亚洲欧美| 日本黄大片高清| 国内精品宾馆在线| 久久人妻熟女aⅴ| 最后的刺客免费高清国语| 久久精品人人爽人人爽视色| 欧美日韩国产mv在线观看视频| 免费av不卡在线播放| 黄色毛片三级朝国网站| 日韩熟女老妇一区二区性免费视频| 高清不卡的av网站| 亚洲人成77777在线视频| 啦啦啦视频在线资源免费观看| 久久久久国产网址| 亚洲精品av麻豆狂野| 九草在线视频观看| 亚洲婷婷狠狠爱综合网| 成人亚洲欧美一区二区av| 美女福利国产在线| 老司机影院毛片| 久久精品国产综合久久久 | 亚洲国产最新在线播放| 国产av码专区亚洲av| 午夜福利影视在线免费观看| 寂寞人妻少妇视频99o| 国产精品嫩草影院av在线观看| 日本黄大片高清| 国产片特级美女逼逼视频| 亚洲精品aⅴ在线观看| 色婷婷久久久亚洲欧美| 久久免费观看电影| 久久久精品区二区三区| av福利片在线| 新久久久久国产一级毛片| 国产麻豆69| 国产欧美日韩一区二区三区在线| 26uuu在线亚洲综合色| 成年av动漫网址| 亚洲国产av新网站| 欧美精品高潮呻吟av久久| 亚洲综合色网址| 巨乳人妻的诱惑在线观看| 大片电影免费在线观看免费| 日韩欧美一区视频在线观看| 伦理电影免费视频| 色5月婷婷丁香| 9色porny在线观看| av有码第一页| 婷婷色综合www| 天堂中文最新版在线下载| 高清欧美精品videossex| 日本黄大片高清| 人妻少妇偷人精品九色| 国产黄频视频在线观看| 三上悠亚av全集在线观看| 日本wwww免费看| 99久久人妻综合| 亚洲国产精品专区欧美| 欧美97在线视频| 少妇的逼好多水| 国产午夜精品一二区理论片| 国产精品女同一区二区软件| av有码第一页| 中文字幕精品免费在线观看视频 | 婷婷色av中文字幕| 精品国产一区二区久久| 国产成人精品一,二区| 国产男人的电影天堂91| 国产不卡av网站在线观看| 国产成人av激情在线播放| 大香蕉久久网| 人妻人人澡人人爽人人| 久久久久久久久久久久大奶| 另类精品久久| 久久久久精品久久久久真实原创| 国产日韩欧美亚洲二区| 有码 亚洲区| 欧美激情 高清一区二区三区| 亚洲精品久久午夜乱码| 人人妻人人澡人人爽人人夜夜| 日韩免费高清中文字幕av| 99视频精品全部免费 在线| 最近手机中文字幕大全| 边亲边吃奶的免费视频| 久久精品久久久久久久性| 国产一区二区在线观看日韩| 亚洲精品一区蜜桃| 少妇的逼好多水| 日韩在线高清观看一区二区三区| 成人毛片60女人毛片免费| 亚洲成人手机| 国产在线视频一区二区| 777米奇影视久久| 国产深夜福利视频在线观看| 日产精品乱码卡一卡2卡三| www日本在线高清视频| 成人亚洲欧美一区二区av| 一区二区三区四区激情视频| 97超碰精品成人国产| 大码成人一级视频| 日日啪夜夜爽| 国产欧美日韩综合在线一区二区| 国产乱来视频区| 日韩一本色道免费dvd| 在现免费观看毛片| 全区人妻精品视频| 好男人视频免费观看在线| 91精品三级在线观看| 亚洲av电影在线观看一区二区三区| 亚洲精品久久成人aⅴ小说| 成人国产av品久久久| 亚洲人成77777在线视频| 国产1区2区3区精品| 黄色配什么色好看| 两个人看的免费小视频| 国产成人精品在线电影| 亚洲欧美中文字幕日韩二区| 男人操女人黄网站| 亚洲伊人色综图| 2018国产大陆天天弄谢| 国产伦理片在线播放av一区| 亚洲婷婷狠狠爱综合网| 伊人亚洲综合成人网| 国产无遮挡羞羞视频在线观看| 久久久久精品久久久久真实原创| 成人综合一区亚洲| 国产日韩一区二区三区精品不卡| 夫妻性生交免费视频一级片| 美女国产高潮福利片在线看| 91国产中文字幕| 久久精品国产a三级三级三级| 啦啦啦在线观看免费高清www| a级片在线免费高清观看视频| 亚洲欧美日韩卡通动漫| 日本免费在线观看一区| 人妻系列 视频| 亚洲欧美成人综合另类久久久| 国产精品女同一区二区软件| 另类亚洲欧美激情| 男男h啪啪无遮挡| 国产成人精品无人区| 亚洲精品成人av观看孕妇| 国产欧美日韩综合在线一区二区| 亚洲三级黄色毛片| 日本爱情动作片www.在线观看| 全区人妻精品视频| 建设人人有责人人尽责人人享有的| 少妇被粗大猛烈的视频| 男人添女人高潮全过程视频| 精品少妇久久久久久888优播| 老司机影院毛片| 亚洲欧美一区二区三区国产| 久久久久精品久久久久真实原创| 免费人成在线观看视频色| 黑人欧美特级aaaaaa片| 99视频精品全部免费 在线| 久久久久国产精品人妻一区二区| 亚洲欧洲国产日韩| 两个人免费观看高清视频| 精品少妇久久久久久888优播| 欧美日韩一区二区视频在线观看视频在线| 欧美成人午夜精品| 亚洲国产av新网站| 热99久久久久精品小说推荐| 黄色毛片三级朝国网站| 伊人亚洲综合成人网| 久久久久久久大尺度免费视频| 国产精品国产三级国产av玫瑰| 少妇的逼水好多| 国产精品久久久久久av不卡| 久久免费观看电影| 久久精品国产亚洲av天美| 一边亲一边摸免费视频| 欧美日本中文国产一区发布| 亚洲av免费高清在线观看| 制服诱惑二区| 夜夜爽夜夜爽视频| 天美传媒精品一区二区| 日本黄大片高清| 国产一级毛片在线| 黑人高潮一二区| 99国产精品免费福利视频| av不卡在线播放| 亚洲熟女精品中文字幕| 精品一区二区三卡| 日日爽夜夜爽网站| 22中文网久久字幕| 丝瓜视频免费看黄片| 男女高潮啪啪啪动态图| 99精国产麻豆久久婷婷| 国产亚洲一区二区精品| 美女国产视频在线观看| 久久av网站| av不卡在线播放| 日本色播在线视频| 成年动漫av网址| 卡戴珊不雅视频在线播放| 日韩人妻精品一区2区三区| 午夜精品国产一区二区电影| av又黄又爽大尺度在线免费看| 国产毛片在线视频| 国内精品宾馆在线| 最黄视频免费看| 久久这里有精品视频免费| 91精品伊人久久大香线蕉| 亚洲精品视频女| 丝瓜视频免费看黄片| 欧美精品av麻豆av| 欧美日韩综合久久久久久| 韩国高清视频一区二区三区| 十分钟在线观看高清视频www| 伦精品一区二区三区| 国产精品熟女久久久久浪| 中文字幕人妻熟女乱码| 成年动漫av网址| 亚洲高清免费不卡视频| 免费人妻精品一区二区三区视频| 国产一区有黄有色的免费视频| 国产综合精华液| 国产免费一级a男人的天堂| 国产爽快片一区二区三区| 午夜久久久在线观看| av有码第一页| 久久人人爽人人片av| 99热网站在线观看| 亚洲,欧美精品.| 99久国产av精品国产电影| 成人黄色视频免费在线看| 久久婷婷青草| 男男h啪啪无遮挡| 欧美亚洲 丝袜 人妻 在线| 国产精品麻豆人妻色哟哟久久| av在线播放精品| 亚洲激情五月婷婷啪啪| 午夜福利视频在线观看免费| 亚洲色图综合在线观看| 亚洲激情五月婷婷啪啪| 丝袜喷水一区| 免费大片18禁| 中文天堂在线官网| 国产日韩欧美亚洲二区| 天美传媒精品一区二区| 日韩人妻精品一区2区三区| 国产亚洲精品第一综合不卡 | 狠狠婷婷综合久久久久久88av| 香蕉精品网在线| www.熟女人妻精品国产 | 天堂俺去俺来也www色官网| 精品午夜福利在线看| videosex国产| 国产69精品久久久久777片| 日韩av免费高清视频| 亚洲成人av在线免费| a级毛色黄片| 少妇的逼好多水| 99精国产麻豆久久婷婷| 亚洲国产欧美日韩在线播放| 一级毛片电影观看| 免费观看av网站的网址| 男人舔女人的私密视频| 精品第一国产精品| 成人毛片a级毛片在线播放| 黑人巨大精品欧美一区二区蜜桃 | 亚洲成人av在线免费| 丝袜在线中文字幕| 国产精品欧美亚洲77777| 日本免费在线观看一区| 狠狠精品人妻久久久久久综合| 制服人妻中文乱码| 寂寞人妻少妇视频99o| av线在线观看网站| 亚洲精品久久午夜乱码|