• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    面向嵌入式的卷積神經(jīng)網(wǎng)絡(luò)硬件加速器設(shè)計(jì)

    2021-02-22 12:00:30焦繼業(yè)徐華昊
    關(guān)鍵詞:定點(diǎn)運(yùn)算卷積

    唐 蕊,焦繼業(yè),徐華昊

    西安郵電大學(xué) 計(jì)算機(jī)學(xué)院,西安 710121

    近年來(lái),隨著人工智能應(yīng)用需求的快速增長(zhǎng),神經(jīng)網(wǎng)絡(luò)在學(xué)術(shù)研究和人工智能相關(guān)應(yīng)用中蓬勃發(fā)展,并被應(yīng)用于各種新興的智能領(lǐng)域,如語(yǔ)音識(shí)別、圖像分類等[1-4]。與此同時(shí),加速卷積運(yùn)算的硬件設(shè)計(jì)隨之產(chǎn)生,針對(duì)神經(jīng)網(wǎng)絡(luò)推理的加速芯片已成為該領(lǐng)域重要的發(fā)展方向。

    目前針對(duì)嵌入式端的神經(jīng)網(wǎng)絡(luò)加速優(yōu)化,可以從模型壓縮和優(yōu)化加速運(yùn)算兩方面出發(fā)。從模型壓縮角度講,主要通過(guò)一定的優(yōu)化方式來(lái)減小網(wǎng)絡(luò)模型所占的存儲(chǔ)空間,其中包括模型剪枝和模型參數(shù)低精度量化,參數(shù)的低精度量化對(duì)卷積網(wǎng)絡(luò)中所有的運(yùn)算加速都有效。從優(yōu)化加速運(yùn)算來(lái)講,主要針對(duì)神經(jīng)網(wǎng)絡(luò)中的結(jié)構(gòu)及權(quán)重參數(shù)的共享性進(jìn)行相關(guān)硬件單元的設(shè)計(jì),可用來(lái)加快神經(jīng)網(wǎng)絡(luò)的執(zhí)行速度,優(yōu)化設(shè)計(jì)的整體性能[5-7]。文獻(xiàn)[1]采用了數(shù)據(jù)量化的方式,分析參數(shù)的取值范圍,先確定量化的大致精度,然后選出最優(yōu)量化精度,將原有參數(shù)從64 位浮點(diǎn)數(shù)量化為16 位定點(diǎn)數(shù)來(lái)表示,顯著提升了運(yùn)行速度,并提出相應(yīng)的計(jì)算和存儲(chǔ)設(shè)計(jì),結(jié)果證明對(duì)卷積網(wǎng)絡(luò)的性能有明顯提升。文獻(xiàn)[2]采用動(dòng)態(tài)可配置定點(diǎn)數(shù)據(jù)來(lái)表示網(wǎng)絡(luò)的權(quán)重和激活函數(shù),在推斷的過(guò)程中也可保持較高的準(zhǔn)確率。結(jié)果表明,低精度量化后,在盡可能保持準(zhǔn)確性的前提下,對(duì)內(nèi)存容量和帶寬的需求減小了50%。文獻(xiàn)[3]在進(jìn)行數(shù)據(jù)量化時(shí),采用的是非線性量化,分析每一層參數(shù)的范圍,確定數(shù)據(jù)量化的系數(shù),對(duì)參數(shù)進(jìn)行量化。谷歌TPU、NVIDIA Tesla V100、寒武紀(jì)DianNao[8-9]等是具有代表性的人工智能加速芯片,均采用了數(shù)據(jù)低精度量化的思想。在卷積神經(jīng)網(wǎng)絡(luò)中,網(wǎng)絡(luò)各層參數(shù)范圍各有差異,不同網(wǎng)絡(luò)層權(quán)重的概率分布也有一定的差異。

    一般來(lái)說(shuō),神經(jīng)網(wǎng)絡(luò)中的參數(shù)主要為32 位和64 位浮點(diǎn)數(shù)。然而,隨著卷積神經(jīng)網(wǎng)絡(luò)模型的層數(shù)越來(lái)越多,其中權(quán)重參數(shù)數(shù)量也在增長(zhǎng)。因此網(wǎng)絡(luò)中包含的運(yùn)算量愈加復(fù)雜,在一些場(chǎng)景上限制了相應(yīng)網(wǎng)絡(luò)模型的部署,需要借助模型壓縮、優(yōu)化加速運(yùn)算等方法突破瓶頸[10-11]。通常情況下,嵌入式設(shè)備上計(jì)算資源是非常有限的,并且對(duì)功耗有著比較嚴(yán)格的要求,使得嵌入式設(shè)備的計(jì)算能力與存儲(chǔ)訪問(wèn)能力受到了極大的限制。卷積神經(jīng)網(wǎng)絡(luò)中較為復(fù)雜的運(yùn)算及存儲(chǔ)訪問(wèn)需求使其在嵌入端的部署成為難點(diǎn)[12],其中最為復(fù)雜的便是卷積運(yùn)算。針對(duì)以上情況,神經(jīng)網(wǎng)絡(luò)模型在嵌入式設(shè)備上進(jìn)行實(shí)現(xiàn),需在保持準(zhǔn)確性的前提下,解決其運(yùn)算量大、存儲(chǔ)需求大的問(wèn)題[13]。

    為了解決該問(wèn)題,本文主要采用了將模型參數(shù)量化與硬件設(shè)計(jì)加速運(yùn)算的方式結(jié)合起來(lái)的方法,更大程度優(yōu)化網(wǎng)絡(luò)模型。首先,提出并設(shè)計(jì)了針對(duì)嵌入式平臺(tái)的低精度定點(diǎn)量化單元,研究了神經(jīng)網(wǎng)絡(luò)中經(jīng)過(guò)訓(xùn)練后的數(shù)據(jù)分布范圍及數(shù)據(jù)量化原理,根據(jù)最小誤差量化算法設(shè)計(jì)了動(dòng)態(tài)低精度量化單元,對(duì)數(shù)據(jù)進(jìn)行低精度定點(diǎn)量化。在保持精度的同時(shí)減小了數(shù)據(jù)的位寬,進(jìn)而減小了對(duì)內(nèi)存及帶寬的需求。其次,設(shè)計(jì)了可循環(huán)調(diào)用的矩陣卷積運(yùn)算的結(jié)構(gòu),使量化后的數(shù)據(jù)可并行執(zhí)行卷積運(yùn)算,進(jìn)而縮短了運(yùn)算的執(zhí)行時(shí)間,提升整體性能。本設(shè)計(jì)在減小網(wǎng)絡(luò)中數(shù)據(jù)位寬,實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)輕量化的同時(shí),又保證了數(shù)據(jù)精度,可用在對(duì)實(shí)時(shí)性要求高的嵌入式設(shè)備中。

    1 低精度動(dòng)態(tài)量化研究

    1.1 動(dòng)態(tài)量化原理

    在神經(jīng)網(wǎng)絡(luò)中,對(duì)其中的FP32 類型的參數(shù)進(jìn)行INT16 量化,使其模型更小,推斷更快。對(duì)參數(shù)量化精簡(jiǎn)的方式之所以有效,廣義來(lái)說(shuō),是由于經(jīng)過(guò)訓(xùn)練后的神經(jīng)網(wǎng)絡(luò)對(duì)噪聲和較小的擾動(dòng)具有魯棒性,意味著在將數(shù)據(jù)量化并做相關(guān)舍入處理后,卷積網(wǎng)絡(luò)的推斷過(guò)程依舊可以得到一個(gè)相當(dāng)準(zhǔn)確的結(jié)果[14-15]。因此參數(shù)量化在幾乎不犧牲精度的情況下,可使執(zhí)行速度加快,進(jìn)而有效提升對(duì)數(shù)據(jù)的處理能力。低精度量化從某個(gè)角度來(lái)說(shuō),是一種數(shù)據(jù)在不同范圍空間的映射[16]。經(jīng)過(guò)大量研究,針對(duì)神經(jīng)網(wǎng)絡(luò)中的低精度量化,總結(jié)得出下面結(jié)論:

    (1)相比于FP32模型,低精度量化后卷積速度得到大幅提升。

    (2)量化后的網(wǎng)絡(luò)模型權(quán)重所占空間降低60%~70%,有效提升對(duì)數(shù)據(jù)的處理能力。

    (3)INT16 量化可以在提升運(yùn)行速度的同時(shí),可最大程度保持準(zhǔn)確性。

    對(duì)于INT8量化來(lái)說(shuō),在追求運(yùn)行速度的同時(shí),準(zhǔn)確性也有更大程度的損失,本設(shè)計(jì)旨在實(shí)現(xiàn)高性能的同時(shí),也盡可能保持?jǐn)?shù)據(jù)最好精度,因此將輸入的FP32數(shù)據(jù)量化為INT16定點(diǎn)數(shù)據(jù),然后進(jìn)行卷積運(yùn)算。整體設(shè)計(jì)的原理如圖1,首先需要分析神經(jīng)網(wǎng)絡(luò)中參數(shù)的數(shù)值分布范圍,如第一層神經(jīng)元的輸入、權(quán)重等,然后進(jìn)行數(shù)據(jù)的低精度量化,并將量化后的數(shù)據(jù)放入存儲(chǔ)。在執(zhí)行卷積運(yùn)算時(shí)將數(shù)據(jù)從存儲(chǔ)中取出,下一時(shí)鐘周期送入并行卷積運(yùn)算單元進(jìn)行卷積計(jì)算,實(shí)現(xiàn)了取數(shù)據(jù)和運(yùn)算的流水結(jié)構(gòu)。卷積運(yùn)算后將結(jié)果依次送至下一個(gè)存儲(chǔ)。重復(fù)調(diào)用卷積運(yùn)算單元進(jìn)行卷積運(yùn)算。

    然而,針對(duì)神經(jīng)網(wǎng)絡(luò)來(lái)說(shuō),從浮點(diǎn)數(shù)據(jù)量化而來(lái)的每個(gè)定點(diǎn)數(shù)據(jù),以及每個(gè)中間參數(shù)的精度都是不確定的,固定精度量化會(huì)產(chǎn)生一些不必要的誤差。經(jīng)過(guò)大量研究,結(jié)果表明,在對(duì)不同精度的數(shù)據(jù)進(jìn)行低精度量化時(shí),若采用固定精度定點(diǎn)量化,則量化后的數(shù)據(jù)精度越高,數(shù)據(jù)準(zhǔn)確性也越高。然而對(duì)于同等位寬數(shù)據(jù)進(jìn)行量化時(shí),采用動(dòng)態(tài)多精度量化的情況下,數(shù)據(jù)準(zhǔn)確性更高。當(dāng)采用16 bit 的數(shù)據(jù)動(dòng)態(tài)低精度量化時(shí),引入的誤差很小[17],并且對(duì)內(nèi)存容量和對(duì)帶寬的需求減小了50%。相比于固定精度定點(diǎn)量化,動(dòng)態(tài)多精度定點(diǎn)量化更適合神經(jīng)網(wǎng)絡(luò)中的卷積運(yùn)算,進(jìn)而最小化卷積網(wǎng)絡(luò)中數(shù)據(jù)量化過(guò)程產(chǎn)生的誤差。

    因此針對(duì)該問(wèn)題,在本設(shè)計(jì)中使用動(dòng)態(tài)多精度定點(diǎn)量化方法對(duì)浮點(diǎn)數(shù)據(jù)進(jìn)行量化。

    浮點(diǎn)與定點(diǎn)之間的量化關(guān)系如下所示:

    圖1 量化卷積運(yùn)算原理示意圖

    其中,x表示浮點(diǎn)數(shù),q表示這個(gè)浮點(diǎn)數(shù)對(duì)應(yīng)的Qn型定點(diǎn)數(shù)。

    在量化單元的設(shè)計(jì)過(guò)程中,采用了最小誤差量化算法的思想,如式(3):

    其中,Dfloat為輸入的原浮點(diǎn)型參數(shù),Dfixed(L,Q)為量化后的定點(diǎn)數(shù)據(jù)。由于網(wǎng)絡(luò)中的所有參數(shù)的精度不完全一致,根據(jù)輸入數(shù)據(jù)的數(shù)值范圍,選擇合適的數(shù)據(jù)量化比例并使用Q 格式表示,通過(guò)動(dòng)態(tài)設(shè)置數(shù)據(jù)的Q 值,即可調(diào)整量化后的定點(diǎn)數(shù)據(jù)精度,進(jìn)而最小化定點(diǎn)量化所帶來(lái)的誤差。

    1.2 數(shù)據(jù)類型對(duì)比

    計(jì)算機(jī)中常用的數(shù)據(jù)類型有兩種,包括定點(diǎn)數(shù)和浮點(diǎn)數(shù)。一般來(lái)說(shuō),定點(diǎn)格式允許表示的數(shù)值范圍有限,但要求的處理硬件單元比較簡(jiǎn)單。浮點(diǎn)格式則相對(duì)復(fù)雜,浮點(diǎn)運(yùn)算廣泛應(yīng)用于通用處理器,如圖形處理器[18]。

    定點(diǎn)數(shù)的小數(shù)點(diǎn)位置是固定的。定點(diǎn)運(yùn)算相比于浮點(diǎn)運(yùn)算有著更低的硬件成本,被廣泛應(yīng)用于神經(jīng)網(wǎng)絡(luò)加速器中,定點(diǎn)數(shù)可以在存儲(chǔ)數(shù)據(jù)時(shí)節(jié)省更多的內(nèi)存容量和帶寬資源。

    1.3 定點(diǎn)數(shù)的表示格式——Q表示法

    一個(gè)定點(diǎn)數(shù)據(jù)的最大數(shù)值范圍取決于所給定的字長(zhǎng)。數(shù)值中定義整數(shù)最低位和小數(shù)最高位之間的方式被稱為定標(biāo),即指示了小數(shù)點(diǎn)的位置。定標(biāo)有兩種方法,包括Q 表示法和S 表示法,本設(shè)計(jì)中的量化部分借助Q表示法完成。

    16 位定點(diǎn)數(shù)的部分Q 值以及每個(gè)Q 值的表示精度如表1。量化單元是該設(shè)計(jì)中的一大核心模塊,量化數(shù)據(jù)的精度決定了整個(gè)卷積運(yùn)算中的數(shù)據(jù)精度。對(duì)于16位的定點(diǎn)數(shù)據(jù),若保留最高精度可使用Q15 格式,即將數(shù)據(jù)放大215倍后用定點(diǎn)數(shù)表示,然而,若浮點(diǎn)數(shù)的有效數(shù)據(jù)超出該精度表示范圍,即使該數(shù)據(jù)量化后帶來(lái)的誤差非常小,但將會(huì)損失全部有效數(shù)據(jù)。因此量化適用于有效精度在Q格式可表示最高精度范圍內(nèi)的數(shù)據(jù),有效精度超出最高精度表示范圍的極少數(shù)據(jù)將被舍棄。

    表1 16位定點(diǎn)數(shù)的Q格式表示及精度

    使用數(shù)據(jù)量化會(huì)引入額外的空間存儲(chǔ)Q值,但是相比于存儲(chǔ)原本的浮點(diǎn)數(shù)據(jù),定點(diǎn)數(shù)與Q值所占的存儲(chǔ)空間會(huì)明顯降低,同時(shí)也降低了帶寬需求。

    為進(jìn)一步解決量化過(guò)程中的誤差問(wèn)題,數(shù)據(jù)量化后使用了近似舍入方法對(duì)量化結(jié)果進(jìn)行微調(diào)。

    1.4 數(shù)據(jù)量化的舍入處理

    在運(yùn)算過(guò)程中,對(duì)量化后的數(shù)據(jù)進(jìn)行數(shù)據(jù)舍入的方案也是至關(guān)重要的。例如定點(diǎn)數(shù)可以表示為[IL:FL],分別對(duì)應(yīng)著量化后定點(diǎn)數(shù)據(jù)的整數(shù)部分和小數(shù)部分,定點(diǎn)數(shù)據(jù)范圍是[-2IL-1,2IL-1-2-FL],其中IL、FL分別代表整數(shù)和小數(shù)位寬[19]。數(shù)據(jù)在量化過(guò)程中會(huì)涉及到數(shù)據(jù)截?cái)?,針?duì)此情況本設(shè)計(jì)按照就近舍入原則,對(duì)量化后的定點(diǎn)數(shù)據(jù)進(jìn)行分析,若定點(diǎn)數(shù)據(jù)中被截?cái)嗖糠肿罡呶粸?時(shí),即被舍去部分的數(shù)值大于真實(shí)數(shù)值的0.5時(shí),則將數(shù)據(jù)進(jìn)行向上取整,小于0.5時(shí)將數(shù)據(jù)向下取整,保留整數(shù)部分即可。本設(shè)計(jì)中的數(shù)據(jù)舍入公式如式(4):

    1.5 卷積運(yùn)算單元結(jié)構(gòu)

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)主要包括輸入層、卷積層、池化層、全連接層及輸出層,其中最主要的運(yùn)算為卷積運(yùn)算,并且卷積層和全連接層包含的便是神經(jīng)網(wǎng)絡(luò)中最復(fù)雜、最耗時(shí)的運(yùn)算[20]。在常用的網(wǎng)絡(luò)模型中,如Alexnet 網(wǎng)絡(luò)中包含的計(jì)算量達(dá)到上億級(jí),單是乘法運(yùn)算就至少需要進(jìn)行7 億次。對(duì)于CNN的卷積層,每層的計(jì)算公式如式(5):

    其中,w是權(quán)重矩陣,b為偏置,f是激活函數(shù),x是每一層的輸入,Y是每一層的輸出。

    詳細(xì)來(lái)說(shuō),其中主要卷積運(yùn)算如下:

    全部的n個(gè)輸入樣本為xi(i∈[1,n]),對(duì)應(yīng)的內(nèi)核權(quán)重為wi,j(i∈ [1,n],j∈[1,m]),相乘后可得到對(duì)應(yīng)的輸出w1,j x1+w2,j x2+…+wi,j xi+…+wn,j xn當(dāng)浮點(diǎn)數(shù)量化為低精度的定點(diǎn)數(shù)后,根據(jù)輸入的參數(shù)量化為使用Q格式的定點(diǎn)數(shù)據(jù)后,根據(jù)前后Q 值的變化,在計(jì)算完乘積之后,對(duì)結(jié)果進(jìn)行截?cái)嗯c舍入處理,得出最終結(jié)果。

    定點(diǎn)數(shù)據(jù)的乘法偽代碼如下:

    由偽代碼可知,首先將兩個(gè)輸入數(shù)據(jù)進(jìn)行相乘并將Q值相加,即結(jié)果中的小數(shù)部分位寬是輸入數(shù)據(jù)的小數(shù)位寬累加和,此時(shí)可得出結(jié)果的數(shù)據(jù)范圍,進(jìn)而確定Q值。然后將超出位寬的低位部分進(jìn)行截?cái)啵⑦M(jìn)行舍入處理。在數(shù)據(jù)截?cái)鄷r(shí)會(huì)產(chǎn)生誤差,但是由于截?cái)嗟氖菙?shù)據(jù)最低位部分,即小數(shù)部分最低位,帶來(lái)的誤差很小。

    而卷積中的加法運(yùn)算原理與乘法不同。對(duì)于Q 值相同的定點(diǎn)數(shù),直接進(jìn)行運(yùn)算,結(jié)果的Q 值與加數(shù)一致。然而,當(dāng)兩個(gè)Q 值不同的定點(diǎn)數(shù)進(jìn)行運(yùn)算時(shí),需先將Q 較小的定點(diǎn)數(shù)進(jìn)行移位處理,直至兩加數(shù)Q 值一致,此時(shí)可直接執(zhí)行加法運(yùn)算。

    在本設(shè)計(jì)中,原本需由浮點(diǎn)數(shù)執(zhí)行的卷積運(yùn)算轉(zhuǎn)換為量化后的定點(diǎn)數(shù)據(jù)來(lái)執(zhí)行,并將結(jié)果輸出。

    2 面向AI的動(dòng)態(tài)定點(diǎn)量化單元架構(gòu)

    2.1 數(shù)據(jù)量化單元設(shè)計(jì)

    從圖2可以看出,首先根據(jù)輸入數(shù)據(jù)可以得到結(jié)果的符號(hào)位。其次輸入數(shù)據(jù)均為符合IEEE-754標(biāo)準(zhǔn)的浮點(diǎn)數(shù),其中尾數(shù)部分給出了有效數(shù)字的位數(shù),因而決定了浮點(diǎn)數(shù)的表示精度。而階碼指明小數(shù)點(diǎn)在數(shù)據(jù)中的位置,整數(shù)部分位寬便可確定,同時(shí)決定了浮點(diǎn)數(shù)的數(shù)據(jù)范圍,因而確定了數(shù)據(jù)量化后最適合的Q 值,并做數(shù)據(jù)截?cái)嗪蛿?shù)據(jù)舍入處理,進(jìn)而使用Q格式完成參數(shù)的動(dòng)態(tài)低精度定點(diǎn)量化,將量化后的結(jié)果輸出。

    圖2 動(dòng)態(tài)低精度量化單元原理圖

    2.2 卷積運(yùn)算單元架構(gòu)設(shè)計(jì)

    卷積網(wǎng)絡(luò)中包含大量的卷積運(yùn)算,從硬件層面講,卷積運(yùn)算分解下來(lái)即為連續(xù)的乘法和加法運(yùn)算,其中乘法運(yùn)算設(shè)計(jì)原理圖如圖3所示。

    圖3 乘法單元設(shè)計(jì)原理圖

    卷積層主要是由卷積核組成的,卷積核的作用主要是對(duì)神經(jīng)網(wǎng)絡(luò)中輸入的特征圖進(jìn)行特征提取,執(zhí)行對(duì)應(yīng)參數(shù)的卷積運(yùn)算[21-22]。在該部分的乘法單元設(shè)計(jì)中,將輸入的兩個(gè)參數(shù)送入乘法器中,首先可以根據(jù)輸入數(shù)據(jù)得到乘法運(yùn)算的結(jié)果,并確定符號(hào)位,然后根據(jù)兩個(gè)輸入數(shù)據(jù)的Q值及最小誤差量化算法的思想,確定結(jié)果的Q 格式表示,對(duì)結(jié)果進(jìn)行截?cái)嗖僮骱蜕崛胩幚恚c量化原理一致,得到最終的結(jié)果并輸出。另外,針對(duì)卷積運(yùn)算原理,提出并設(shè)計(jì)了矩陣運(yùn)算單元,使數(shù)據(jù)并行執(zhí)行乘法運(yùn)算,可提升整體性能。

    一般而言,針對(duì)神經(jīng)網(wǎng)絡(luò)的卷積運(yùn)算加速的硬件設(shè)計(jì),重點(diǎn)要考慮運(yùn)算單元的并行性,如Alexnet 網(wǎng)絡(luò)模型,共包括8 層,其中有5 層為卷積層。然而,對(duì)于在嵌入式設(shè)備來(lái)講,完全實(shí)現(xiàn)卷積核之間與不同層神經(jīng)網(wǎng)絡(luò)的并行執(zhí)行幾乎是不可能的,本文主要針對(duì)卷積核內(nèi)的并行化執(zhí)行完成設(shè)計(jì)。圖4為矩陣卷積運(yùn)算設(shè)計(jì)架構(gòu),針對(duì)目前最常用的3×3 的卷積核設(shè)計(jì)了并行卷積運(yùn)算架構(gòu),輸入層是大小為13×13的神經(jīng)元矩陣。經(jīng)過(guò)量化后的結(jié)果按照一定順序存入存儲(chǔ)矩陣中,存儲(chǔ)單元中高位為量化后的定點(diǎn)數(shù),低位為對(duì)應(yīng)的Q 值,之后從存儲(chǔ)中取出對(duì)應(yīng)的數(shù)據(jù)送至卷積運(yùn)算單元的輸入端,經(jīng)邊界填充最后可得到169個(gè)神經(jīng)元輸出。

    圖4 矩陣卷積運(yùn)算單元設(shè)計(jì)架構(gòu)

    本設(shè)計(jì)可在單周期內(nèi)從對(duì)應(yīng)存儲(chǔ)中取出量化后的數(shù)據(jù)送入卷積運(yùn)算單元中,并行執(zhí)行9 次乘法操作,隨后將結(jié)果送入加法器,完成累加得到卷積結(jié)果。矩陣并行卷積運(yùn)算單元共包含了9個(gè)乘法單元,使用空間換取時(shí)間的思想,在不增加核心邏輯資源的前提下,適當(dāng)?shù)貙⒎謺r(shí)復(fù)用的電路進(jìn)行復(fù)制,在保證控制面積的前提下更好地提升性能。本設(shè)計(jì)需耗時(shí)169 個(gè)時(shí)鐘周期完成卷積運(yùn)算,有效地提升了運(yùn)算的效率。

    2.3 量化卷積架構(gòu)設(shè)計(jì)

    圖5 量化卷積單元架構(gòu)

    量化卷積單元整體架構(gòu)主要包括量化單元、存儲(chǔ)模塊以及可循環(huán)調(diào)用的并行卷積運(yùn)算單元,量化卷積單元整體架構(gòu)如圖5。

    首先將網(wǎng)絡(luò)模型中的參數(shù)如神經(jīng)元的輸入、權(quán)重等進(jìn)行動(dòng)態(tài)低精度定點(diǎn)量化,即對(duì)數(shù)據(jù)進(jìn)行預(yù)處理操作,然后分別存入對(duì)應(yīng)的存儲(chǔ)單元中。在執(zhí)行卷積運(yùn)算時(shí),將數(shù)據(jù)分別從存儲(chǔ)中取出,送入卷積運(yùn)算單元,運(yùn)算完成后將結(jié)果輸出至存儲(chǔ)并進(jìn)行截?cái)嗪蜕崛胩幚恚h(huán)調(diào)用卷積運(yùn)算單元進(jìn)行計(jì)算。

    3 驗(yàn)證與分析

    3.1 性能參數(shù)

    本設(shè)計(jì)使用0.11 μm SMIC 工藝庫(kù)進(jìn)行綜合,綜合后的參數(shù)如表2所示。

    表2 量化卷積單元參數(shù)表

    本設(shè)計(jì)實(shí)現(xiàn)的功能為量化及卷積運(yùn)算,綜合后的量化與卷積單元面積為13 740門(mén),功耗大小為0.992 5 mW。在本設(shè)計(jì)中針對(duì)運(yùn)算加速做了相關(guān)的并行卷積運(yùn)算單元設(shè)計(jì),因此可有效提升卷積運(yùn)算的性能,并且后期經(jīng)過(guò)驗(yàn)證,本設(shè)計(jì)滿足每個(gè)關(guān)鍵路徑的時(shí)序要求。該性能參數(shù)表進(jìn)一步證明本設(shè)計(jì)適合使用在對(duì)實(shí)時(shí)性有要求的嵌入式設(shè)備中。

    3.2 結(jié)果準(zhǔn)確性驗(yàn)證

    本設(shè)計(jì)在FPGA 平臺(tái)Stratix IV GX EP4SGX230進(jìn)行驗(yàn)證,并完成了結(jié)果準(zhǔn)確性對(duì)比。首先對(duì)原始的浮點(diǎn)數(shù)據(jù)不做量化處理,直接進(jìn)行卷積運(yùn)算,可得到當(dāng)前結(jié)果的準(zhǔn)確性。之后將原始的浮點(diǎn)數(shù)據(jù)分別進(jìn)行16 bit、8 bit 的固定精度量化,在16 bit 情況下量化為Q14 格式的數(shù)據(jù),8 bit情況下對(duì)權(quán)重和偏置量化為Q6格式數(shù)據(jù),將輸入輸出量化為Q8格式數(shù)據(jù),得出對(duì)應(yīng)結(jié)果。最后驗(yàn)證本設(shè)計(jì)中動(dòng)態(tài)多精度(Dynamic Multi-Precision,DMP)量化后卷積運(yùn)算的結(jié)果準(zhǔn)確性。結(jié)果準(zhǔn)確性對(duì)比如表3。

    表3 結(jié)果準(zhǔn)確性對(duì)比

    結(jié)果表明,直接使用浮點(diǎn)數(shù)據(jù)進(jìn)行卷積運(yùn)算的數(shù)據(jù)準(zhǔn)確性最高,然而分別對(duì)數(shù)據(jù)進(jìn)行16 bit和8 bit量化時(shí)發(fā)現(xiàn),量化后的數(shù)據(jù)位寬越大,準(zhǔn)確性越高。本設(shè)計(jì)中,對(duì)數(shù)據(jù)進(jìn)行16 bit 多精度量化時(shí),結(jié)果表明數(shù)據(jù)的準(zhǔn)確性達(dá)到了97.96%,由于有個(gè)別數(shù)據(jù)精度特別低,量化過(guò)程中的數(shù)據(jù)截?cái)鄷?huì)帶來(lái)一定的誤差,處于合理范圍內(nèi),不影響網(wǎng)絡(luò)推理的正常功能。

    3.3 性能測(cè)試對(duì)比

    本文還分別與使用RISC-V處理器(E203)[23]、Cortex M4與Matlab模擬執(zhí)行卷積運(yùn)算的時(shí)間進(jìn)行對(duì)比。性能測(cè)試對(duì)比如表4。

    表4 性能測(cè)試對(duì)比

    在神經(jīng)網(wǎng)絡(luò)模型中,卷積層包含的運(yùn)算占了總體的90%以上。針對(duì)神經(jīng)網(wǎng)絡(luò)Alexnet 模型進(jìn)行性能驗(yàn)證,輸入神經(jīng)元數(shù)量為169 個(gè),即輸入數(shù)據(jù)的矩陣大小為13×13,卷積核大小為3×3,跨度為1,在不同平臺(tái)模擬卷積運(yùn)算。本設(shè)計(jì)中測(cè)試激勵(lì)模擬了169 組隨機(jī)數(shù)據(jù)進(jìn)行驗(yàn)證。結(jié)果表明,編寫(xiě)C++代碼軟件模擬實(shí)現(xiàn)卷積運(yùn)算,在CortexM4 開(kāi)發(fā)板進(jìn)行測(cè)試,參與運(yùn)算的為浮點(diǎn)數(shù)。在100 MHz 時(shí)鐘頻率下測(cè)得執(zhí)行時(shí)間為4.10 ms。由于RISC-V 處理器(E203)不支持浮點(diǎn)數(shù)據(jù),模擬相同數(shù)量的INT32數(shù)據(jù),經(jīng)驗(yàn)證得出在100 MHz時(shí)鐘下執(zhí)行卷積運(yùn)算時(shí)間為3.03 ms。在Matlab上調(diào)用卷積函數(shù)的方法,模擬相同數(shù)量的浮點(diǎn)數(shù)據(jù)執(zhí)行卷積運(yùn)算,測(cè)得執(zhí)行時(shí)間為230 ms,本設(shè)計(jì)中模擬給出同等數(shù)量的浮點(diǎn)數(shù)據(jù)量化后的INT16數(shù)據(jù),在100 MHz時(shí)鐘下執(zhí)行時(shí)間約為0.001 71 ms。經(jīng)對(duì)比證明了該設(shè)計(jì)可有效提升卷積運(yùn)算性能。

    4 結(jié)束語(yǔ)

    本文面向嵌入式平臺(tái)提出一種卷積神經(jīng)網(wǎng)絡(luò)硬件加速器的設(shè)計(jì)與實(shí)現(xiàn)方法,采用卷積加速模塊化和量化精度可配置的思想,針對(duì)神經(jīng)網(wǎng)絡(luò)推理加速設(shè)計(jì)了低精度動(dòng)態(tài)量化單元與矩陣卷積運(yùn)算架構(gòu),主要針對(duì)網(wǎng)絡(luò)模型的卷積運(yùn)算做加速。該設(shè)計(jì)使用16 位定點(diǎn)數(shù)據(jù)表示,內(nèi)存占用量和帶寬需求減半,數(shù)據(jù)精確度達(dá)到97.96%,對(duì)卷積網(wǎng)絡(luò)的正常功能影響較小,與二進(jìn)制設(shè)計(jì)相比,它具有更高的精度,性能相比軟件實(shí)現(xiàn)有大幅提升,相比CortexM4 執(zhí)行卷積運(yùn)算提升了90%以上,可有效加快卷積運(yùn)算執(zhí)行速度,適用于提高神經(jīng)網(wǎng)絡(luò)在嵌入式平臺(tái)的性能,為嵌入式卷積網(wǎng)絡(luò)推理加速提供了方法。后續(xù)工作中還需繼續(xù)深入研究,更好地實(shí)現(xiàn)卷積核間及層間的并行性,同時(shí)為移植到RISC-V 處理器中并完成指令集融合的協(xié)處理器做準(zhǔn)備。

    猜你喜歡
    定點(diǎn)運(yùn)算卷積
    例談圓錐曲線中的定點(diǎn)定值問(wèn)題
    重視運(yùn)算與推理,解決數(shù)列求和題
    定點(diǎn)幫扶讓村民過(guò)上美好生活
    解析幾何中定點(diǎn)問(wèn)題的處理策略
    基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
    直線過(guò)定點(diǎn)的5種特優(yōu)解法
    有趣的運(yùn)算
    從濾波器理解卷積
    電子制作(2019年11期)2019-07-04 00:34:38
    基于傅里葉域卷積表示的目標(biāo)跟蹤算法
    “整式的乘法與因式分解”知識(shí)歸納
    久热这里只有精品99| 国产熟女午夜一区二区三区| 男女无遮挡免费网站观看| a级毛片黄视频| 这个男人来自地球电影免费观看 | 制服诱惑二区| 天天添夜夜摸| 亚洲男人天堂网一区| 免费少妇av软件| 欧美精品亚洲一区二区| 卡戴珊不雅视频在线播放| 伦理电影免费视频| 国产一区二区在线观看av| 久久久久久久久久久久大奶| 亚洲久久久国产精品| 欧美97在线视频| 日本欧美国产在线视频| 欧美久久黑人一区二区| 2018国产大陆天天弄谢| 精品国产乱码久久久久久小说| 在线观看免费午夜福利视频| 人成视频在线观看免费观看| 一级毛片黄色毛片免费观看视频| 久久久欧美国产精品| 国产爽快片一区二区三区| 久久毛片免费看一区二区三区| 日本爱情动作片www.在线观看| 久久热在线av| 国产男人的电影天堂91| 国产一区二区三区av在线| 精品免费久久久久久久清纯 | 大片免费播放器 马上看| 国产精品女同一区二区软件| 国产精品欧美亚洲77777| 两性夫妻黄色片| 中文天堂在线官网| 国产精品一区二区在线观看99| 宅男免费午夜| 欧美日韩亚洲高清精品| 色婷婷久久久亚洲欧美| 99久久99久久久精品蜜桃| 日韩大片免费观看网站| 满18在线观看网站| 中文字幕另类日韩欧美亚洲嫩草| 精品一区二区三卡| 久久久久久人人人人人| 又黄又粗又硬又大视频| 亚洲 欧美一区二区三区| 操出白浆在线播放| 亚洲一卡2卡3卡4卡5卡精品中文| 久久狼人影院| 婷婷成人精品国产| 色综合欧美亚洲国产小说| 国产高清不卡午夜福利| 蜜桃在线观看..| 一个人免费看片子| 亚洲欧洲日产国产| 中文天堂在线官网| 黑丝袜美女国产一区| 热99久久久久精品小说推荐| 成年动漫av网址| 精品亚洲成国产av| 成年av动漫网址| 欧美国产精品va在线观看不卡| 免费av中文字幕在线| 久久久国产一区二区| 亚洲av男天堂| 婷婷色麻豆天堂久久| 久久精品国产亚洲av高清一级| 岛国毛片在线播放| 日韩一区二区视频免费看| 国产精品麻豆人妻色哟哟久久| 女人被躁到高潮嗷嗷叫费观| 亚洲三区欧美一区| 嫩草影院入口| av在线播放精品| 亚洲精品国产色婷婷电影| 男女之事视频高清在线观看 | 91老司机精品| 国产精品免费大片| av福利片在线| 天天操日日干夜夜撸| 亚洲国产精品999| 亚洲男人天堂网一区| avwww免费| 极品少妇高潮喷水抽搐| 天堂俺去俺来也www色官网| 高清欧美精品videossex| av电影中文网址| 亚洲国产最新在线播放| 国产免费视频播放在线视频| 人人妻人人添人人爽欧美一区卜| 国产精品亚洲av一区麻豆 | 亚洲欧美成人综合另类久久久| 日韩制服丝袜自拍偷拍| xxx大片免费视频| av在线观看视频网站免费| 国产女主播在线喷水免费视频网站| 99re6热这里在线精品视频| 精品人妻一区二区三区麻豆| 黄色 视频免费看| 麻豆精品久久久久久蜜桃| 97人妻天天添夜夜摸| 9热在线视频观看99| 欧美精品亚洲一区二区| 五月天丁香电影| 女性被躁到高潮视频| av国产久精品久网站免费入址| 日韩欧美精品免费久久| 国产成人av激情在线播放| www.熟女人妻精品国产| 大片电影免费在线观看免费| 欧美国产精品一级二级三级| 日韩伦理黄色片| 国产一区二区在线观看av| 亚洲av中文av极速乱| 纵有疾风起免费观看全集完整版| 久久性视频一级片| 大香蕉久久成人网| 69精品国产乱码久久久| 91aial.com中文字幕在线观看| 大香蕉久久成人网| 午夜日本视频在线| 日韩av在线免费看完整版不卡| 成人黄色视频免费在线看| 亚洲精品久久久久久婷婷小说| 色精品久久人妻99蜜桃| 亚洲欧美精品自产自拍| 免费高清在线观看日韩| 国产免费福利视频在线观看| 国产精品久久久久久人妻精品电影 | 精品久久久久久电影网| 亚洲中文av在线| 亚洲精品美女久久av网站| 亚洲图色成人| 成年女人毛片免费观看观看9 | 国产成人系列免费观看| 一本大道久久a久久精品| 免费久久久久久久精品成人欧美视频| 亚洲精品视频女| 乱人伦中国视频| 少妇 在线观看| 久久精品国产亚洲av涩爱| 中文欧美无线码| 久久久久国产一级毛片高清牌| 老司机亚洲免费影院| 电影成人av| 亚洲国产精品一区二区三区在线| 日韩人妻精品一区2区三区| av免费观看日本| 亚洲熟女精品中文字幕| 99热国产这里只有精品6| 精品久久久久久电影网| 国产97色在线日韩免费| 亚洲免费av在线视频| 久久这里只有精品19| 亚洲久久久国产精品| 伦理电影大哥的女人| 肉色欧美久久久久久久蜜桃| 你懂的网址亚洲精品在线观看| 高清黄色对白视频在线免费看| 最新的欧美精品一区二区| 午夜日本视频在线| 午夜av观看不卡| 两性夫妻黄色片| 少妇被粗大猛烈的视频| 日本午夜av视频| 亚洲av男天堂| 精品一区在线观看国产| 在线观看国产h片| av在线播放精品| 精品一区在线观看国产| 国产成人av激情在线播放| 色播在线永久视频| 欧美人与性动交α欧美软件| 午夜福利影视在线免费观看| 99久国产av精品国产电影| 欧美精品亚洲一区二区| 超碰97精品在线观看| 精品亚洲成国产av| 亚洲人成网站在线观看播放| 久久鲁丝午夜福利片| 国产高清不卡午夜福利| av网站免费在线观看视频| 日本av免费视频播放| 久久免费观看电影| 国产精品偷伦视频观看了| 精品一区二区三区四区五区乱码 | 国产99久久九九免费精品| 大片免费播放器 马上看| av女优亚洲男人天堂| 少妇人妻精品综合一区二区| 亚洲成人一二三区av| 久久久精品国产亚洲av高清涩受| 黄色怎么调成土黄色| 建设人人有责人人尽责人人享有的| 男女无遮挡免费网站观看| 成人毛片60女人毛片免费| 成人国产av品久久久| 欧美日韩一区二区视频在线观看视频在线| 久久久亚洲精品成人影院| bbb黄色大片| 大码成人一级视频| 成人影院久久| 一本久久精品| 欧美精品亚洲一区二区| 日韩一区二区三区影片| 免费黄网站久久成人精品| 亚洲欧美色中文字幕在线| 欧美黑人精品巨大| 午夜免费观看性视频| 国产精品二区激情视频| 看十八女毛片水多多多| 中文字幕另类日韩欧美亚洲嫩草| 亚洲国产欧美一区二区综合| 色精品久久人妻99蜜桃| 国产极品天堂在线| 两性夫妻黄色片| 精品国产一区二区久久| 欧美中文综合在线视频| 黄片播放在线免费| 我的亚洲天堂| 色综合欧美亚洲国产小说| 色婷婷av一区二区三区视频| 国产1区2区3区精品| www日本在线高清视频| 少妇 在线观看| 免费黄色在线免费观看| 18禁观看日本| 韩国高清视频一区二区三区| 亚洲精品国产区一区二| 亚洲成人免费av在线播放| 国产精品香港三级国产av潘金莲 | 久久午夜综合久久蜜桃| 成人漫画全彩无遮挡| 亚洲 欧美一区二区三区| 卡戴珊不雅视频在线播放| a级毛片黄视频| 老汉色∧v一级毛片| 亚洲av在线观看美女高潮| 亚洲国产欧美网| 欧美日韩精品网址| 男人舔女人的私密视频| 日韩一区二区视频免费看| 国产成人精品在线电影| 亚洲天堂av无毛| 成人18禁高潮啪啪吃奶动态图| 亚洲国产精品成人久久小说| 国产一区有黄有色的免费视频| 色94色欧美一区二区| 别揉我奶头~嗯~啊~动态视频 | 丰满乱子伦码专区| www.精华液| 最近中文字幕高清免费大全6| 欧美人与性动交α欧美软件| 国产成人欧美| 久久久久久久国产电影| 少妇被粗大的猛进出69影院| 亚洲中文av在线| 久久免费观看电影| 日本wwww免费看| 国产一区二区 视频在线| 欧美日韩国产mv在线观看视频| 建设人人有责人人尽责人人享有的| 亚洲国产看品久久| 99re6热这里在线精品视频| 久久久久久久久久久久大奶| 操出白浆在线播放| 国产日韩一区二区三区精品不卡| 精品少妇内射三级| 美国免费a级毛片| 国产成人欧美| 国产av一区二区精品久久| 18禁国产床啪视频网站| av有码第一页| 日韩一本色道免费dvd| 一本—道久久a久久精品蜜桃钙片| 亚洲情色 制服丝袜| 中文乱码字字幕精品一区二区三区| 嫩草影视91久久| 久久天堂一区二区三区四区| 性高湖久久久久久久久免费观看| 大话2 男鬼变身卡| 日本wwww免费看| 黄片播放在线免费| 亚洲精品国产av成人精品| 国产乱来视频区| videos熟女内射| 国产探花极品一区二区| 永久免费av网站大全| 亚洲国产av影院在线观看| 黄色怎么调成土黄色| 麻豆精品久久久久久蜜桃| 在线观看一区二区三区激情| 国产成人精品福利久久| 只有这里有精品99| 日韩av免费高清视频| 人妻人人澡人人爽人人| 亚洲精品第二区| 亚洲国产看品久久| 亚洲欧美中文字幕日韩二区| 丝瓜视频免费看黄片| 不卡视频在线观看欧美| a级毛片在线看网站| 中国三级夫妇交换| 久久97久久精品| 韩国高清视频一区二区三区| 精品一品国产午夜福利视频| 天堂中文最新版在线下载| 少妇人妻 视频| xxx大片免费视频| 色播在线永久视频| 老司机亚洲免费影院| 老熟女久久久| www.av在线官网国产| 亚洲美女黄色视频免费看| 国产精品无大码| 国产精品欧美亚洲77777| 成年人午夜在线观看视频| www.自偷自拍.com| 亚洲在久久综合| 纵有疾风起免费观看全集完整版| 观看av在线不卡| 综合色丁香网| 韩国高清视频一区二区三区| 午夜免费观看性视频| 免费观看av网站的网址| 亚洲人成电影观看| 夫妻午夜视频| 国产精品久久久久成人av| 伊人久久国产一区二区| 亚洲伊人色综图| 女性生殖器流出的白浆| 国产成人精品福利久久| 久久精品久久久久久噜噜老黄| 亚洲av电影在线观看一区二区三区| av女优亚洲男人天堂| 亚洲精品一区蜜桃| 久久av网站| 国产女主播在线喷水免费视频网站| 日本色播在线视频| 欧美精品av麻豆av| 午夜91福利影院| 日韩一区二区三区影片| 国产色婷婷99| 国产男女超爽视频在线观看| 中文字幕人妻熟女乱码| 午夜免费鲁丝| 秋霞在线观看毛片| 午夜福利视频在线观看免费| 亚洲av电影在线进入| 国产欧美日韩综合在线一区二区| 国产亚洲午夜精品一区二区久久| 成年人午夜在线观看视频| 欧美日韩av久久| 久久国产精品男人的天堂亚洲| 亚洲av日韩精品久久久久久密 | 男女下面插进去视频免费观看| 色婷婷av一区二区三区视频| 91老司机精品| 国产日韩欧美视频二区| 亚洲精品一二三| 中文天堂在线官网| 又粗又硬又长又爽又黄的视频| 午夜91福利影院| 人人妻,人人澡人人爽秒播 | 麻豆精品久久久久久蜜桃| 成年动漫av网址| 免费人妻精品一区二区三区视频| 中文字幕av电影在线播放| 一个人免费看片子| 久久精品亚洲av国产电影网| 午夜91福利影院| 一区二区日韩欧美中文字幕| 日本午夜av视频| 又黄又粗又硬又大视频| 捣出白浆h1v1| 十分钟在线观看高清视频www| 国产乱来视频区| 久久国产精品大桥未久av| 国产精品欧美亚洲77777| 18禁观看日本| 天天躁夜夜躁狠狠久久av| 丰满迷人的少妇在线观看| 999久久久国产精品视频| 欧美精品人与动牲交sv欧美| av在线播放精品| 欧美97在线视频| 别揉我奶头~嗯~啊~动态视频 | 汤姆久久久久久久影院中文字幕| 久久国产亚洲av麻豆专区| 十八禁高潮呻吟视频| 中文天堂在线官网| 亚洲色图综合在线观看| 青春草视频在线免费观看| 精品国产乱码久久久久久小说| 国产精品久久久久久精品电影小说| 看免费成人av毛片| 亚洲精品国产一区二区精华液| 久久久久久久大尺度免费视频| 男女之事视频高清在线观看 | 一本色道久久久久久精品综合| 丰满饥渴人妻一区二区三| 国产成人精品在线电影| 欧美少妇被猛烈插入视频| 中文字幕亚洲精品专区| 精品免费久久久久久久清纯 | 男女之事视频高清在线观看 | 久久这里只有精品19| 日韩 亚洲 欧美在线| 一本一本久久a久久精品综合妖精| 日韩制服骚丝袜av| 天堂俺去俺来也www色官网| 国产精品一二三区在线看| 岛国毛片在线播放| 中文精品一卡2卡3卡4更新| 三上悠亚av全集在线观看| 纵有疾风起免费观看全集完整版| 亚洲 欧美一区二区三区| 日本欧美视频一区| 操出白浆在线播放| 97精品久久久久久久久久精品| 人人妻人人爽人人添夜夜欢视频| 七月丁香在线播放| 亚洲精品在线美女| 国产成人精品久久二区二区91 | 久久久久久免费高清国产稀缺| 亚洲精品aⅴ在线观看| 精品少妇内射三级| 免费看不卡的av| av片东京热男人的天堂| 亚洲成人一二三区av| 满18在线观看网站| 91精品国产国语对白视频| 久久精品熟女亚洲av麻豆精品| 精品久久久久久电影网| 超碰97精品在线观看| 亚洲七黄色美女视频| av卡一久久| 1024香蕉在线观看| 777米奇影视久久| av线在线观看网站| 欧美精品一区二区免费开放| 9热在线视频观看99| 欧美激情高清一区二区三区 | 国产深夜福利视频在线观看| 欧美日韩成人在线一区二区| 日本欧美国产在线视频| 女性生殖器流出的白浆| 黑人欧美特级aaaaaa片| 黑人巨大精品欧美一区二区蜜桃| 人成视频在线观看免费观看| 人人妻人人澡人人看| 国产成人啪精品午夜网站| 中文字幕制服av| 精品国产一区二区三区久久久樱花| 亚洲精品国产一区二区精华液| 久久久国产欧美日韩av| 欧美日韩一级在线毛片| 秋霞在线观看毛片| 人成视频在线观看免费观看| 一二三四中文在线观看免费高清| 麻豆精品久久久久久蜜桃| 中文天堂在线官网| 人妻人人澡人人爽人人| 亚洲精品久久成人aⅴ小说| 免费不卡黄色视频| 欧美 日韩 精品 国产| 亚洲一区二区三区欧美精品| 亚洲四区av| 人体艺术视频欧美日本| 啦啦啦在线免费观看视频4| 欧美黑人精品巨大| 中文精品一卡2卡3卡4更新| 精品人妻一区二区三区麻豆| 久久精品亚洲av国产电影网| 9热在线视频观看99| 大陆偷拍与自拍| 啦啦啦视频在线资源免费观看| 午夜福利,免费看| 可以免费在线观看a视频的电影网站 | 亚洲av成人不卡在线观看播放网 | 新久久久久国产一级毛片| 哪个播放器可以免费观看大片| 一级a爱视频在线免费观看| 制服丝袜香蕉在线| av国产久精品久网站免费入址| 国产一区二区激情短视频 | 亚洲人成77777在线视频| 精品一区二区三区av网在线观看 | 久久天堂一区二区三区四区| 大片电影免费在线观看免费| 国产日韩欧美亚洲二区| 少妇人妻 视频| 欧美成人精品欧美一级黄| 免费人妻精品一区二区三区视频| 在线 av 中文字幕| 国产精品av久久久久免费| 精品少妇久久久久久888优播| 久久天堂一区二区三区四区| 多毛熟女@视频| 久久国产精品男人的天堂亚洲| 精品国产一区二区久久| 国产精品蜜桃在线观看| 国产一区二区三区av在线| 九色亚洲精品在线播放| 久久99一区二区三区| 午夜91福利影院| 亚洲成色77777| 日日爽夜夜爽网站| 亚洲精品美女久久久久99蜜臀 | 最近中文字幕高清免费大全6| 亚洲,欧美精品.| 国产亚洲最大av| 久久天堂一区二区三区四区| svipshipincom国产片| 国产又色又爽无遮挡免| 亚洲一级一片aⅴ在线观看| 九九爱精品视频在线观看| 免费观看a级毛片全部| 久久精品久久久久久久性| 亚洲精品视频女| a 毛片基地| 制服丝袜香蕉在线| www日本在线高清视频| 亚洲第一区二区三区不卡| 好男人视频免费观看在线| 岛国毛片在线播放| 啦啦啦视频在线资源免费观看| 亚洲在久久综合| 国产日韩一区二区三区精品不卡| 国产淫语在线视频| www.精华液| 精品视频人人做人人爽| 亚洲精品国产一区二区精华液| 欧美97在线视频| 亚洲av福利一区| 亚洲欧美色中文字幕在线| 可以免费在线观看a视频的电影网站 | 亚洲精品美女久久久久99蜜臀 | 卡戴珊不雅视频在线播放| 看十八女毛片水多多多| 一区二区三区四区激情视频| 91精品三级在线观看| 天堂8中文在线网| 深夜精品福利| 美女扒开内裤让男人捅视频| 国产精品麻豆人妻色哟哟久久| 亚洲av男天堂| 女人高潮潮喷娇喘18禁视频| 99久久精品国产亚洲精品| 亚洲少妇的诱惑av| 色婷婷av一区二区三区视频| 女的被弄到高潮叫床怎么办| 观看av在线不卡| 在线亚洲精品国产二区图片欧美| 久久精品亚洲av国产电影网| 久久久精品区二区三区| 十八禁人妻一区二区| 亚洲精品成人av观看孕妇| 日韩大码丰满熟妇| 国产精品 欧美亚洲| 精品人妻在线不人妻| 国产片内射在线| 久久毛片免费看一区二区三区| 国产精品三级大全| 国产成人午夜福利电影在线观看| 久久ye,这里只有精品| 赤兔流量卡办理| 国产精品一区二区在线不卡| a级片在线免费高清观看视频| 男女高潮啪啪啪动态图| 1024香蕉在线观看| 国产片内射在线| 久久亚洲国产成人精品v| 久久午夜综合久久蜜桃| 国产精品二区激情视频| 亚洲色图综合在线观看| 日韩,欧美,国产一区二区三区| 人人澡人人妻人| 99国产精品免费福利视频| 国产精品女同一区二区软件| 亚洲视频免费观看视频| av天堂久久9| 国产在线视频一区二区| 丁香六月欧美| 亚洲成人av在线免费| 国产精品久久久久成人av| 肉色欧美久久久久久久蜜桃| 午夜福利影视在线免费观看| 人妻一区二区av| 啦啦啦在线免费观看视频4| 成年人免费黄色播放视频| 美女福利国产在线| 日韩熟女老妇一区二区性免费视频| 色视频在线一区二区三区| 深夜精品福利| 国产成人免费无遮挡视频| 最近中文字幕2019免费版| 国产片特级美女逼逼视频| 亚洲精品视频女| 超碰97精品在线观看| 午夜免费男女啪啪视频观看| 国产麻豆69| av在线老鸭窝| 国产精品三级大全| 一本一本久久a久久精品综合妖精| 色视频在线一区二区三区| 国产在线免费精品| 亚洲婷婷狠狠爱综合网| 亚洲一卡2卡3卡4卡5卡精品中文| 丰满饥渴人妻一区二区三| 中文字幕人妻熟女乱码| 国产亚洲av片在线观看秒播厂| 国产精品三级大全|