• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    多層神經(jīng)網(wǎng)絡(luò)算法的計算特征建模方法

    2019-06-26 10:04:56方榮強姚治成張偉功
    計算機研究與發(fā)展 2019年6期
    關(guān)鍵詞:模型

    方榮強 王 晶,4 姚治成 劉 暢 張偉功

    1(首都師范大學(xué)信息工程學(xué)院 北京 100048)2(體系結(jié)構(gòu)國家重點實驗室(中國科學(xué)院計算技術(shù)研究所) 北京 100190)3(高可靠嵌入式系統(tǒng)技術(shù)北京市工程研究中心(首都師范大學(xué)) 北京 100048)4(北京成像理論與技術(shù)高精尖創(chuàng)新中心(首都師范大學(xué)) 北京 100048)

    隨著神經(jīng)網(wǎng)絡(luò)越來越廣泛地應(yīng)用于語音識別、計算機視覺、智能機器人、故障檢測、市場分析、決策優(yōu)化等領(lǐng)域[1-2],人們對網(wǎng)絡(luò)精度的要求不斷提高,網(wǎng)絡(luò)層數(shù)越來越多,計算復(fù)雜度越來越高,如2014年GoogLeNet[3]網(wǎng)絡(luò)已經(jīng)達到22層.日益增加的計算復(fù)雜度使得訓(xùn)練和推理的開銷問題逐步凸顯出來,當前GPU和FPGA等專用硬件加速芯片已經(jīng)成為神經(jīng)網(wǎng)絡(luò)運行的重要平臺.而隨著人工智能技術(shù)的進步,移動設(shè)備、嵌入式設(shè)備等在計算、體積、功耗等方面受限的設(shè)備也需要應(yīng)用深度學(xué)習(xí)技術(shù).由于設(shè)備資源的約束,導(dǎo)致現(xiàn)有復(fù)雜的深度神經(jīng)網(wǎng)絡(luò)無法進行高效的計算.上述場景為計算機體系結(jié)構(gòu)提出了新的挑戰(zhàn):如何在保持現(xiàn)有神經(jīng)網(wǎng)絡(luò)精度不變的情況下,使得網(wǎng)絡(luò)模型能在資源受限的設(shè)備上高效運行,并最大化系統(tǒng)資源利用率.

    針對上述問題可以從算法角度減小網(wǎng)絡(luò)計算量,也可以從硬件角度優(yōu)化資源利用率.現(xiàn)有研究從算法角度提出了大量優(yōu)化方案[4]:針對神經(jīng)網(wǎng)絡(luò)運算矩陣和矩陣相乘的運算方式,可以利用奇異值分解來壓縮神經(jīng)網(wǎng)絡(luò)計算量[5];針對權(quán)重矩陣往往比較稀疏的特性,可以利用矩陣稀疏編碼的方式壓縮神經(jīng)網(wǎng)絡(luò)[6];通過改變卷積運算算法可以加速網(wǎng)絡(luò)執(zhí)行[7-12];權(quán)值重載方式也能夠有效減少片上存儲開銷[13].算法的優(yōu)化可以實現(xiàn)對深度神經(jīng)網(wǎng)絡(luò)的壓縮,從而削減網(wǎng)絡(luò)的計算量和存儲需求,提高網(wǎng)絡(luò)執(zhí)行的效率,但這些方法同時也都是預(yù)先靜態(tài)地對算法進行優(yōu)化,無論裁剪到什么程度的網(wǎng)絡(luò),最終都需要在實際的硬件上運行,因此從體系結(jié)構(gòu)角度,在有限硬件資源上優(yōu)化神經(jīng)網(wǎng)絡(luò)的運行效率是當前研究的重要問題.

    研究人員從體系結(jié)構(gòu)角度入手,提出多種提升神經(jīng)網(wǎng)絡(luò)執(zhí)行速度的方案:利用神經(jīng)網(wǎng)絡(luò)中數(shù)據(jù)重用的特點可以優(yōu)化卷積神經(jīng)網(wǎng)絡(luò)[14];文獻[15]將網(wǎng)絡(luò)權(quán)值矩陣和輸入矩陣進行矢量化操作,能夠大大減小運算量,提升計算效率.將神經(jīng)網(wǎng)絡(luò)從通用處理器CPU的執(zhí)行平臺,遷移到具有高并行度的GPU和FPGA平臺也是有效提高運行效率的手段.利用OpenCL將卷積計算轉(zhuǎn)化為并行度更高的矩陣乘法運算能夠進一步優(yōu)化GPU平臺上卷積運算效率.FPGA平臺上利用可重構(gòu)和流水化并行執(zhí)行的卷積運算過程能夠?qū)崿F(xiàn)對執(zhí)行速度和資源利用率的同步提升,基于FPGA的可重構(gòu)特性能夠化簡乘法運算,提高系統(tǒng)能效性[16-19].

    然而,無論哪一種神經(jīng)網(wǎng)絡(luò)加速器的設(shè)計,都需要了解算法的特征,根據(jù)不同算法的計算規(guī)模有針對性地分配計算和存儲資源,才能在提高程序運行效率的同時最大化系統(tǒng)資源利用率.此外,對于硬件加速器設(shè)計的驗證,如果運行真實的大規(guī)模神經(jīng)網(wǎng)絡(luò)將導(dǎo)致驗證的周期和成本都大幅增加.而抽取典型計算片段不但能夠保證功能驗證覆蓋率,還能有效降低驗證成本.要達到這2方面目的,都需要對算法的特征進行分析,找出模型中頻繁出現(xiàn)的層,本文稱為算子(operator),了解算子的計算和訪存特點,從而找到加速優(yōu)化的切入方向.

    因此本文提出基于基本運算的神經(jīng)網(wǎng)絡(luò)特征提取優(yōu)化方法,主要貢獻包括3個方面:

    1) 針對典型神經(jīng)網(wǎng)絡(luò)進行分析,找出其中核心算子,對每個算子分析內(nèi)部包含的基本運算、運算的數(shù)量和內(nèi)存占用量隨輸入變化的關(guān)系.

    2) 在算子的粒度,根據(jù)網(wǎng)絡(luò)的描述解析網(wǎng)絡(luò)基本結(jié)構(gòu),獲得包含算子和算子順序的模型通用表達式,并給出圖形化描述.根據(jù)分析獲得的算子內(nèi)部特征和模型通用表達式,計算網(wǎng)絡(luò)模型的乘加運算量、存儲占用量等典型特征值.

    3) 基于所獲得的運算量等網(wǎng)絡(luò)特征,結(jié)合硬件資源數(shù)量,提出基于最大值的網(wǎng)絡(luò)運行調(diào)度優(yōu)化方案,提高了神經(jīng)網(wǎng)絡(luò)的執(zhí)行效率,同時最大化硬件資源的利用率.

    1 基于運算操作的神經(jīng)網(wǎng)絡(luò)特征提取方法

    神經(jīng)網(wǎng)絡(luò)通常由不同的層,如卷積層、池化層、全連層等以特定順序組合而成,其中乘法和加法操作(operation)是基本的運算.為了分析神經(jīng)網(wǎng)絡(luò)運行對硬件資源的需求,首先從“層”的粒度分析網(wǎng)絡(luò)結(jié)構(gòu),然后基于每層的運算特點分析該層所需要的乘法和加法等基本操作的次數(shù)以及所需占用的存儲空間.

    1.1 神經(jīng)網(wǎng)絡(luò)模型解析

    深度神經(jīng)網(wǎng)絡(luò)雖然可以通過改變層級結(jié)構(gòu)、神經(jīng)元個數(shù)以及神經(jīng)元之間的連接衍生出不同的網(wǎng)絡(luò)模型,但網(wǎng)絡(luò)中所涉及的核心算子種類并不多,通常包括卷積層、池化層、激活函數(shù)和全連接層等.盡管輸入和參數(shù)不同,但每個算子的運算方式是確定的,因此可以通過分析得到計算每個算子的基本操作和基本資源需求公式.

    模型解析器可以分析神經(jīng)網(wǎng)絡(luò)模型包含的算子以及算子的執(zhí)行順序.按照算子的種類和執(zhí)行順序,建立一個僅包含算子種類和其執(zhí)行順序但不包含操作次數(shù)的圖形化通用表達式,把神經(jīng)網(wǎng)絡(luò)中各種算子看作節(jié)點,把其所需要的輸入和產(chǎn)生的輸出作為連接節(jié)點的有向邊,這樣便產(chǎn)生了一個有向無環(huán)圖(DAG),這個圖結(jié)構(gòu)作為后續(xù)特征提取模塊的輸入.

    Fig. 1 Design of network feature extraction圖1 網(wǎng)絡(luò)特征提取整體設(shè)計

    模型解析器是本文所提出的網(wǎng)絡(luò)特征提取方法的第1步,特征提取方法結(jié)構(gòu)如圖1所示.模型解析器基于輸入的神經(jīng)網(wǎng)絡(luò)模型和其對應(yīng)的參數(shù),分析模型所包含的層數(shù)和每層的功能,將網(wǎng)絡(luò)轉(zhuǎn)化成對應(yīng)的通用表達式,然后通過TensorFlow內(nèi)嵌的TensorBoard可視化組件獲得其圖形化的顯示,從而獲得模型結(jié)構(gòu)和算子種類、算子數(shù)量和算子順序.在模型解析之后,模型特征提取模塊加載所獲得的通用表達式以及包含基礎(chǔ)算子的特征描述文件,獲得算子內(nèi)包含的乘加等基本運算操作的類型、次數(shù)、存儲占用情況等特征.所獲得的計算和訪存特征作為運行調(diào)度模塊的輸入,結(jié)合系統(tǒng)硬件資源信息,例如FPGA芯片能夠支持的加法器和乘法器個數(shù),運行調(diào)度模塊采用最大值更替算法計算出在給定硬件資源下最大化資源利用率的網(wǎng)絡(luò)運行調(diào)度方案.

    1.2 基于算子的模型特征提取

    算子的計算量等特征是可以通過加載提前設(shè)定的配置文件(profile)來解析統(tǒng)計出加法和乘法等基本操作計算公式.模型特征提取模塊負責根據(jù)計算公式對輸入模型進行整體的特征提取與計算.模塊的輸入包括2部分:配置文件和模型通用表達式,其中模型通用表達式是模型解析器傳遞的包含算子種類及執(zhí)行順序的分析結(jié)果,也就是沒有神經(jīng)元具體執(zhí)行運算和內(nèi)存占用信息的圖結(jié)構(gòu).算子特征描述文件定義了算法模型中具體算子的特征.

    當模塊得到通用模型描述文件和配置信息的輸入后,遍歷代表網(wǎng)絡(luò)模型的圖結(jié)構(gòu),進行模型特征信息的構(gòu)建.對每個算子進行單獨的特征提取,通過計算參數(shù)配置文件的算子特征公式,可以獲得加法和乘法基本操作次數(shù)等神經(jīng)網(wǎng)絡(luò)的特征,并對所有特征進行統(tǒng)計與存儲.

    算子特征提取流程如圖2所示:首先判斷算子對應(yīng)的類型在配置文件中是否有定義,如果有,則從模型算子節(jié)點中加載,按照配置文件中該算子的公式定義來計算出對應(yīng)的乘法和加法等基本操作的次數(shù),而后輸出該算子的特征;如果配置文件中沒有定義,則進行第2步判斷,檢測系統(tǒng)內(nèi)部是否有內(nèi)置特征解析方法,若有,則調(diào)用提取特征的函數(shù)對該算子進行解析,若無,則輸出空特征.

    特征提取模塊通過配置文件管理器來管理所有的配置文件,管理器包含2方面的管理功能:算法模型初始化參數(shù)的管理和算法基礎(chǔ)算子的特征管理.算法模型初始化參數(shù)的管理將每個算子對應(yīng)的信息做初始化賦值,算法基礎(chǔ)算子的特征管理記錄是對每個算子預(yù)置基本操作的特定計算公式.在以Conv2D算子為例的算子配置文件內(nèi)容中,分為Var和Feature兩大部分.當解析該算子的特征時,首先利用字段Var中指定的方法進行變量初始化,即按順序從Var中讀取指定的變量提取方法,并將執(zhí)行方法得到的結(jié)果存放在指定的變量中.對于算法模型,算子的計算量往往和輸入數(shù)據(jù)大小、維度等有關(guān),所以在計算“算子的計算量”之前,需要把算子所涉及的輸入輸出數(shù)據(jù)樣式確定下來,例如模型輸入圖片的大小、批大小(batch_size)等參數(shù).神經(jīng)網(wǎng)絡(luò)算法模型由不同功能的算子通過不同的連接方式組成,算子不同則計算類型、計算量、數(shù)據(jù)處理大小等都不一樣,所以對于“特征提取模塊”而言,它需要知道用于構(gòu)建模型的每個算子參數(shù)、計算特征等,例如二維卷積算法需要知道卷積核的大小、移動步長、數(shù)據(jù)維度大小等特征后才能根據(jù)具體的算法得出該算子在模型中的特征.為了方便特征提取模塊獲取每個算子的屬性,參數(shù)配置文件管理器基于配置文件的算子管理方式,當用戶需要修改或者添加算子特征時只需修改對應(yīng)的配置文件.

    Fig. 2 Operator-based feature extraction process圖2 基于算子的特征提取流程

    1.3 算子的特征計算方法

    本文選取了10種典型神經(jīng)網(wǎng)絡(luò)算子,根據(jù)算子的輸入?yún)?shù)列表,如表1所示,以加法為例給出了每個算子計算資源需求的公式,如表2所示.

    1) Conv2D算子.它是2維卷積運算,該算子實際上是用濾波器矩陣在輸入圖像矩陣上沿水平或豎直方向上按步長數(shù)值滑動的同時做加權(quán)疊加的操作.卷積核單次計算加法次數(shù)為((f_height×f_width-1)×in_channels)×out_channels,所需加法次數(shù)為(f_height×f_width×in_channel-1)×[(in_height-f_height)strides+1]×[(in_width-f_width)strides+1],最后乘以圖片的張數(shù)和輸出結(jié)果的通道數(shù)就可以得到卷積算子包含的加法次數(shù).而二維卷積所包含的乘法次數(shù),首先計算單個卷積核單次計算的乘法次數(shù)(f_height×f_width×in_channels),再乘以圖片張數(shù)和移動步數(shù)即可獲得其包含的乘法次數(shù).

    2) Avg_Pool.它為平均池化算子,該算子是通過定義一個方形窗口濾波器矩陣,讓該窗口以不重疊的步長strides在輸入圖像上沿水平或豎直方向上運算的同時記錄下該窗口矩陣范圍內(nèi)所有輸入圖像矩陣元素的平均數(shù)作為輸出圖像矩陣的像素值,而輸出結(jié)果的圖像矩陣大小取決于定義窗口矩陣的大小.該算子可以將輸入的圖像進行有效壓縮處理以節(jié)省資源消耗.關(guān)于平均池化的加法計算,步驟1是計算出它的移動步數(shù),步驟2則是計算出它的每步所包含的數(shù)值的個數(shù).首先,計算窗口大小ksize平均值需要Π(ksize)-1次加法;接著對輸出矩陣output進行求維度運算,可以獲得一個關(guān)于輸出結(jié)果的維度矩陣,即shape(output);而后對該維度矩陣求連乘積,即可獲得輸出矩陣中所包含的元素個數(shù);最后將它們乘在一起就可以得到平均池化算子所包含的加法次數(shù).而該算子所包含的乘法次數(shù)與輸出矩陣中的元素個數(shù)相等,因為對于每步池化都需要做一次乘法,又因為該池化核所走的步數(shù)等于輸出矩陣元素個數(shù),因此其包含的乘法計算的次數(shù)為Π(shape(output)).

    3) Max_Pool.它為最大池化算子,與平均池化算子相同,都包含ksize參數(shù)和同樣的生成規(guī)則,與之不同的僅在于它不取窗口內(nèi)的平均值而取其最大值作為輸出結(jié)果.其加法計算即為在最大池化核的范圍內(nèi)進行數(shù)據(jù)比較次數(shù),實為減法操作次數(shù),故需要比較Π(shape(output)×(Π(ksize)-1)) 次.由于該算子是將池化核內(nèi)所有數(shù)據(jù)進行比較,因此不需要計算乘法.

    4) Bias_Add.它是對2維卷積層和全連接層添加偏置值的標準化函數(shù),該算子所包含的加法次數(shù)即為矩陣的維度,由于是直接相加,因此乘法計算次數(shù)為零.

    Table 1 Typical Operation Input Parameters表1 典型算子輸入?yún)?shù)

    Table 2 Analysis of Add Operation Feature of Typical Operators表2 典型算子加法特征分析

    5) MatMul.它為矩陣乘法算子,是全連層主要的運算.其輸入為Ax×m和Bm×y的矩陣,這2個矩陣經(jīng)MatMul算子運算后得到Cx×y的矩陣,因此產(chǎn)生的結(jié)果中有x×y個新數(shù)值,結(jié)果元素可計算為

    cij=ai1b1j+ai2b2j+…+aimbmj.

    每個元素的計算需要m-1個已有數(shù)值相加,因此其加法次數(shù)為x×y×(m-1)次,而乘法次數(shù)也相應(yīng)為x×y×m次.

    6) LRN.它為局部相應(yīng)歸一化算子,用來抑制過擬合現(xiàn)象,并加快收斂速度的算子[20].可計算為

    7) Softmax.它為神經(jīng)元激活函數(shù)算子,該算子將多分類的輸出數(shù)值轉(zhuǎn)化為相對概率,經(jīng)常被用于分類器后的輸出單元做處理,依據(jù)Softmax函數(shù)的計算公式:Softmax[i,j]=exp(logits[i,j])sum_j(exp(logits[i,j])),可知其分母由輸出層類別個數(shù)num_classes相加而成,因此加法計算次數(shù)為num_classes-1.又因為訓(xùn)練一個樣本有num_classes個結(jié)果需要激活函數(shù)Softmax函數(shù)進行計算,所以加法次數(shù)為num_classes×(num_classes-1),最后乘以每次訓(xùn)練投放的樣本個數(shù)batch_size可以獲得一次完整訓(xùn)練所進行的加法次數(shù).對于分母累加中的每一項,分別有l(wèi)ogits[i,j]-1次乘法,共有num_classes項相加,故有(num_classes)×(logits[i,j]-1)次乘法.又因為需要對樣本中每個數(shù)據(jù)做Softmax激活,而每次激活時需要做一次除法.除法在機器運算實為右移操作,而乘法為左移操作,在功耗上的消耗相當,因此可看做是做一次乘法,故需要做batch_size×num_classes+1次.而Softmax包含的乘法次數(shù)為(batch_size×num_classes)×num_classes×[(logits[i,j]-1)+1].

    8) Sigmoid.它也是神經(jīng)元激活函數(shù)算子,其計算公式為Sigmoid(Output_index)=1(1+e-Output_index),其加法次數(shù)為1次,乘法次數(shù)在分母運算了Output_index次,共計Output_index+1次.

    9) tanh.它是常用的激活函數(shù)算子,也稱為雙曲正切函數(shù).tanh在特征相差明顯時效果較好,在循環(huán)過程中會不斷擴大特征效果.其計算公式為

    tanh(Output_index)=(eOutput_index-e-Output_index)
    (eOutput_index+e-Output_index),

    其加法次數(shù)為2次,乘法次數(shù)由于eOutput_index計算一遍后可以多次重用,故其乘法次數(shù)為Output_index+1次.

    10) ReLU.它為激活函數(shù)算子,由于函數(shù)解析式簡單,因此能獲得更快的收斂速度.其計算公式為ReLU(Output_index)=max{0,Output_index},該算子不包含乘法,僅有一次比較,故加法次數(shù)為1.

    本文針對以VGG和AlexNet為代表的主流神經(jīng)網(wǎng)絡(luò),在層粒度進行了解析.所提出的靜態(tài)分析方案不增加動態(tài)網(wǎng)絡(luò)運行延遲和能耗開銷.同時,本文所提出的方案給出了網(wǎng)絡(luò)層粒度的任務(wù)分布,可以結(jié)合對網(wǎng)絡(luò)數(shù)據(jù)流的分析,建立動態(tài)網(wǎng)絡(luò)運行分析模型,為綜合優(yōu)化性能和能耗提供支持.

    神經(jīng)網(wǎng)絡(luò)架構(gòu)通常計算密度高、存儲需求大,為了適應(yīng)低功耗的移動等存儲環(huán)境,裁剪和量化技術(shù)被廣泛應(yīng)用.量化技術(shù)通常對所有輸入數(shù)據(jù)采用統(tǒng)一的方法,如散列和定點化進行處理,因此對于增加量化技術(shù)的神經(jīng)網(wǎng)絡(luò),量化的計算量與輸入數(shù)據(jù)規(guī)模成比例.而對于應(yīng)用剪枝技術(shù)的神經(jīng)網(wǎng)絡(luò),本方法可以計算出網(wǎng)絡(luò)的計算量和存儲量上限,結(jié)合裁剪技術(shù)的具體實現(xiàn)方案,通過對權(quán)值矩陣的分析統(tǒng)計裁剪情況,得出實際的網(wǎng)絡(luò)計算特征.

    2 基于神經(jīng)網(wǎng)絡(luò)特征的運行優(yōu)化算法

    支持深度神經(jīng)網(wǎng)絡(luò)運行的GPU和FPGA平臺能夠同時并行執(zhí)行大量乘加運算,甚至可以支持多個算子的并行執(zhí)行,流水化地執(zhí)行多個輸入可以有效提高硬件資源利用率[21].以FPGA為例,F(xiàn)PGA芯片可以劃分為多個DSP,乘法器和加法器都由若干個DSP組成,此時算子所需硬件計算單元就可以轉(zhuǎn)化為DSP數(shù)量,當算子在FPGA芯片上執(zhí)行無法占滿整個芯片時,可以根據(jù)所需DSP數(shù)量計算組合方案,在同一時間內(nèi)可以讓多個算子同時處理.

    專用硬件加速器和FPGA通常都只能包含固定數(shù)量的加法器和乘法器,具體的數(shù)值則由它的結(jié)構(gòu)和硬件工藝所確定.然而,硬件支持的乘加運算器數(shù)量和神經(jīng)網(wǎng)絡(luò)不同層次所需要的乘加操作次數(shù)難以完美匹配,也就是可以放入同一塊芯片或加速單元中運行的算子有多重組合.如果沒有對網(wǎng)絡(luò)結(jié)構(gòu)和拓撲進行全局性的分析,系統(tǒng)只能順序或者隨機地選取算子執(zhí)行,不但無法保證資源利用率,往往還會影響加速性能,加大硬件開銷.因此針對網(wǎng)絡(luò)內(nèi)部不同層對硬件資源的需求,結(jié)合實際計算資源的情況進行優(yōu)化調(diào)度是必要的.

    本文利用所提取的特征分析結(jié)果對神經(jīng)網(wǎng)絡(luò)在特定硬件資源下的運行調(diào)度方案進行優(yōu)化,我們將不同的算子轉(zhuǎn)化成乘法和加法操作次數(shù),結(jié)合系統(tǒng)資源的劃分,如FPGA中DSP的資源數(shù)量,提出最大值更替調(diào)度算法.本文以卷積層為例來進行調(diào)度的規(guī)劃,算法可以推廣到神經(jīng)網(wǎng)絡(luò)包含的各種算子的硬件資源調(diào)度.

    神經(jīng)網(wǎng)絡(luò)的基本乘法和加法操作還可以歸一化量化為基本單元數(shù),例如量化為邏輯門的數(shù)量或DSP的數(shù)量,根據(jù)不同的硬件描述和實現(xiàn)工藝,不同的層可以用乘法和加法數(shù)量乘以乘法器和加法器的門的數(shù)量需求得到本層以基本單元數(shù)為單位的尺寸.神經(jīng)網(wǎng)絡(luò)的調(diào)度算法可以建模為不同大小的層,盡可能放入有限大小的硬件芯片上,這類似于背包問題.但與背包問題有2方面區(qū)別:1)背包問題只選擇部分物品裝滿一個背包即可,而神經(jīng)網(wǎng)絡(luò)的所有操作都需要執(zhí)行,如果總的操作數(shù)量大于當前硬件能夠支持的計算量,則需要多次執(zhí)行,也就相當于多次背包;2)背包問題只給出選擇物品的數(shù)量,而調(diào)度算法需要獲得調(diào)度方案和具體順序以指導(dǎo)實際運行,因此我們改進了背包算法,提出基于最大值更替的調(diào)度算法.算法的描述如算法1所示.

    算法1.基于最大值更替的調(diào)度算法.

    輸入:硬件容量C、卷積層種數(shù)N、第i種卷積層的總個數(shù)ki、第i種卷積層綜合乘法開銷W[i];

    輸出:使用的硬件總數(shù)、每個硬件分別承載的卷積層種類和其數(shù)量.

    while (仍有卷積層未刪除) {

    if (Ci-max≥0) {

    Ci=Ci-max;

    ki=ki-1;

    記錄當前的bi;

    if (ki==0) {

    刪除該卷積層;

    最大值設(shè)為當前數(shù)據(jù)中的最大值;

    if (刪除的是最小值) {

    最小值更新為當前數(shù)據(jù)中的最小值;

    } }

    }

    else {

    if (max==min) {

    輸出所有記錄的bi;

    重置記錄bi的數(shù)組;

    算法計數(shù)器+1;

    Ci=C;

    最大值設(shè)為當前數(shù)據(jù)中的最大值;

    }

    else

    max值更改為當前數(shù)據(jù)中的次大值;

    }

    }

    算法1輸入分為2部分:1)網(wǎng)絡(luò)模型的各卷積層所包含的乘法和加法次數(shù)列表數(shù)據(jù),該部分數(shù)據(jù)來自特征提取模塊所輸出的結(jié)果;2)當前所應(yīng)用的硬件資源包含的基本單元數(shù).設(shè)網(wǎng)絡(luò)模型中卷積層的大小有N種,第i(0≤i≤N)種卷積層執(zhí)行所需的基本單元數(shù)W[i]由上一步的特征提取給出.在算法運行過程中記錄第i種的3方面信息:該種卷積層已被規(guī)劃了的次數(shù)ai、該種卷積層是輸入當中的序號bi以及該種卷積層當前的個數(shù)ki;同時將硬件平臺所包含的基本單元數(shù)量記為C.在規(guī)劃過程中,首先判斷當前基本單元數(shù)Ci是否大于當前最大卷積操作的資源需求max,如果大于那么當前卷積可以執(zhí)行,則Ci=Ci-max且最大值的ki=ki-1;此時再判斷ki是否為0,如果為0那么從當前數(shù)據(jù)中移除該種卷積,最大值max重新設(shè)為當前數(shù)據(jù)中的最大值,如果此時移除的恰好是當前最小卷積操作資源需求min,那么將該卷積移除后更新min值為當前數(shù)據(jù)中的最小值.如果當前基本單元數(shù)量Ci比卷積操作的最大值max小,那么就判斷當前的最大值是否跟當前數(shù)據(jù)中的最小值重合,如果重合那么將當前基本單元數(shù)Ci重置為C,最大值max重新設(shè)為當前數(shù)據(jù)中的最大值;而如果最大值和最小值還未重合,那么最大值設(shè)為當前數(shù)據(jù)中的次大值,而后再次進行Ci與max的比較.依次進行上述操作,直到所有卷積都完成規(guī)劃.

    3 實驗評估

    本文選取了6個被廣泛應(yīng)用于各個領(lǐng)域中的神經(jīng)網(wǎng)絡(luò)模型.

    1) 圖像識別類模型.通過多層卷積算子提取出圖像的特征,根據(jù)提取出的特征對圖像進行處理、分析和理解,以識別各種不同模式的目標和對象.常見的包括:AlexNet模型、VGG模型和Inception模型.

    2) 音頻識別類模型.主要作用是區(qū)分人聲、動物聲音或者音樂演奏等聲音,典型的神經(jīng)網(wǎng)絡(luò)模型是VGGish.

    3) 視頻識別類模型SSD.SSD是基于前向傳播的神經(jīng)網(wǎng)絡(luò)、無全連接層、參數(shù)少、運行速度快、識別精度高.

    4) 文本類模型Attention.Attention模型從網(wǎng)絡(luò)中某些狀態(tài)集合中選取與給定狀態(tài)較為相似的狀態(tài),然后訓(xùn)練一個模型來對輸入進行選擇性的學(xué)習(xí)并且在模型輸出時將輸出序列與之進行關(guān)聯(lián).

    首先,通過分析各個模型所包含的算子類型和數(shù)量,如表3所示;然后從模型復(fù)雜度和資源需求等方面對算子的特征進行分析;最后,采用所提出的最大值更替算法給出了調(diào)度方案,并同順序調(diào)度方案對比資源利用率的提升效果.本文用TensorFlow中的圖形化組件TensorBoard,按前面的設(shè)計方法,可以提取出神經(jīng)網(wǎng)絡(luò)的圖形化表示,如AlexNet的圖形化表示,如圖3所示.通過分析可以清楚地得到AlexNet網(wǎng)絡(luò)的結(jié)構(gòu)圖,由8層組成,共有5個卷積層和3個全連接層,分別是輸入層→卷積→池化→卷積→池化→卷積→卷積→卷積→池化→全連接→dropout→全連接→dropout→全連接,在每一個卷積層后都經(jīng)過了降采樣(pooling處理),同時該模型中加入了dropout操作.我們將6個神經(jīng)網(wǎng)絡(luò)模型均按照上述方式進行建模,進而分析出它們的特征.

    Table 3 Six Classical Neural Network Models表3 6個經(jīng)典神經(jīng)網(wǎng)絡(luò)模型

    Fig. 3 The visualization model of AlexNet圖3 AlexNet可視化模型

    3.1 經(jīng)網(wǎng)絡(luò)特征分析

    加速器的選取主要從3個角度進行分析:從模型的總體角度統(tǒng)計運算量,給出針對模型選用加速器的建議;從算子角度,通過對各個算子的運算量比較,得出針對該算子的加速器設(shè)計建議;考慮時間因素判斷模型各階段應(yīng)使用的加速器結(jié)構(gòu).針對這3個需求,我們主要從模型復(fù)雜程度、卷積算子占算子總數(shù)比例、各模型占用內(nèi)存量情況以及運算量4個角度對網(wǎng)絡(luò)的特征進行分類分析.

    1) 模型復(fù)雜度分析

    由模型復(fù)雜程度的對比,我們統(tǒng)計了所有算子的總數(shù)量.由于模型結(jié)構(gòu)這一概念過于抽象,很難直接對模型結(jié)構(gòu)進行討論,因此對模型的復(fù)雜度采用操作總數(shù)作為比較標準.

    Fig. 4 Model complexity圖4 模型復(fù)雜度

    從圖4對6種網(wǎng)絡(luò)的分析結(jié)果中可以看出,Attention網(wǎng)絡(luò)的算子個數(shù)最多,達到了5 905個,整個網(wǎng)絡(luò)模型也最復(fù)雜;而VGGish的算子個數(shù)最少,僅有178個,其結(jié)構(gòu)也就最簡單.因此在模型結(jié)構(gòu)復(fù)雜度角度,視頻識別模型SSD、文本識別類模型的操作數(shù)量非常龐大,因此可以在不影響模型功能的前提下從精簡算子數(shù)量的角度對模型進行優(yōu)化.

    2) 卷積算子占比分析

    卷積操作是神經(jīng)網(wǎng)絡(luò)眾多算子中計算復(fù)雜度和能耗開銷最高的算子,卷積的優(yōu)化對提高網(wǎng)絡(luò)性能有重要的影響.基于本文所提出的方法,對6種網(wǎng)絡(luò)的卷積操作比例進行了統(tǒng)計,如圖5所示:

    Fig. 5 Convolution operator proportion圖5 卷積算子占比

    由圖5可知,圖像、視頻識別類模型、卷積算子占比明顯多于文本類模型和音頻模型中的卷積算子占比.這是由于卷積在網(wǎng)絡(luò)中擔當著對輸入進行特征提取的工作,卷積算子越多,對輸入提取出的特征就越詳細.音頻分析網(wǎng)絡(luò)由于沒有圖片特征分析那么高的要求,故比例相對較低.根據(jù)這些分析,在加速器設(shè)計過程中對卷積占比高的神經(jīng)網(wǎng)絡(luò)進行加速,可以通過減少卷積操作方式或個數(shù)等技術(shù)達到更好的效果.

    Fig. 7 Radar charts of hardware resource consumption distribution for neural network models圖7 各神經(jīng)網(wǎng)絡(luò)模型硬件資源消耗分布雷達圖

    3) 內(nèi)存需求分析

    神經(jīng)網(wǎng)絡(luò)的執(zhí)行過程中要存儲大量中間結(jié)果,因此對內(nèi)存需求量往往較大.我們使用各個模型總內(nèi)存占用量除以運算次數(shù)得到如圖6所示的內(nèi)存占用量.

    針對統(tǒng)計出的模型中平均每次運算占用的內(nèi)存量設(shè)定閾值0.1B次,超過閾值的模型體現(xiàn)為訪存密集型;小于閾值的模型則體現(xiàn)計算密集型.在這些網(wǎng)絡(luò)中,AlexNet的平均每次運算占用的內(nèi)存量遠超過其他的神經(jīng)網(wǎng)絡(luò),它在這些網(wǎng)絡(luò)模型中訪存比例更高,因此調(diào)度運算順序,減小運算中間結(jié)果的存儲等優(yōu)化方法能夠有效提高這類網(wǎng)絡(luò)的性能.

    Fig. 6 Operational memory usage圖6 運算占用內(nèi)存使用量

    4) 模型特征分析

    基于對模型的操作數(shù)、卷積占比、平均內(nèi)存量、加法次數(shù)、乘法次數(shù)5個方面的統(tǒng)計信息,通過雷達圖對比不同模型的特征,如圖7所示.結(jié)果顯示每個模型都有自己的特點:SSD和Attention計算占用內(nèi)存方面比較小,其他資源消耗比較平衡.而AlexNet,Inception,VGG19和VGGish這4個模型都是卷積占比突出,因此本文針對這4個模型歸一比較,如圖8所示.模型在不同的維度展現(xiàn)出不同的特征,通過雷達圖結(jié)果的分析,能夠為未來加速器設(shè)計技術(shù)從加速卷積操作、減少內(nèi)存占用等方面的選擇提供指導(dǎo).

    Fig. 8 Detailed comparison of AlexNet, Inception, VGG19 and VGGish resources圖8 AlexNet,Inception,VGG19,VGGish網(wǎng)絡(luò)資源占比詳細分析

    3.2 神經(jīng)網(wǎng)絡(luò)調(diào)度優(yōu)化評測

    我們對比了所提出的最大值更替調(diào)度算法和順序執(zhí)行方案的資源利用率.順序調(diào)度方案將可以同時執(zhí)行的操作按從大到小的順序依次放入芯片中.若可以放下,則更新當前芯片容量,同時減少該種算子的數(shù)量;若放不下則啟用下一個芯片計數(shù)繼續(xù)放置,算法描述如算法2所示.

    算法2.順序調(diào)度.

    while (仍有卷積層未刪除) {

    if (Ci-max≥0) {

    Ci=Ci-max;

    ki=ki-1;

    記錄當前的bi;

    if (ki==0) {

    刪除該卷積層;

    最大值設(shè)為當前數(shù)據(jù)中的最大值;

    }

    }

    else {

    輸出所有記錄的bi;

    重置記錄bi的數(shù)組;

    算法計數(shù)器+1;

    Ci=C;

    最大值設(shè)為當前數(shù)據(jù)中的最大值;

    }

    }

    本文參考XC7VX690T系統(tǒng)資源進行調(diào)度,該實驗板的DSP數(shù)量為3 600.規(guī)劃方案中芯片的平均利用率如圖9所示:

    Fig. 9 Hardware resource utilization rate圖9 硬件資源利用率

    結(jié)果顯示最大值更替調(diào)度算法顯著地提高了VGG16和Inception網(wǎng)絡(luò)運行時的硬件資源利用率.VGG16網(wǎng)絡(luò)中,相對于傳統(tǒng)的順序調(diào)度,芯片利用率僅有81.31%,而在相同條件下,采用最大值更替調(diào)度算法,可以將芯片使用率提升到97.57%.于此類似,在Inception網(wǎng)絡(luò)中,最大值更替調(diào)度算法將資源利用率提高了13.89%.而對于AlexNet和VGG19兩種算法的調(diào)度結(jié)果相差不大.從網(wǎng)絡(luò)特性角度分析,AlexNet網(wǎng)絡(luò)的雷達圖同Inception以及VGG都不同,而對于AlexNet算法順序調(diào)度得到的結(jié)果已經(jīng)相對較好,因此最大值更替算法的提升效果不明顯.

    而對比VGG16和VGG19,最大值更替算法能否產(chǎn)生作用,與輸入的數(shù)據(jù)分布有關(guān).在這2個實驗中,模型上的差異只有層數(shù)不一樣,而卷積的相關(guān)參數(shù)是相同的,在這種情況下,同樣的輸入會使得調(diào)度大同小異,但若改變輸入的數(shù)據(jù),其調(diào)度結(jié)果會因調(diào)度算法的選擇而產(chǎn)生較大的不同.本文所提出算法的計算復(fù)雜度為O(n!),順序調(diào)度方式雖然計算復(fù)雜較低,但是其芯片利用率遠小于基于最大值更替調(diào)度算法所提供的調(diào)度效果.

    4 結(jié) 論

    神經(jīng)網(wǎng)絡(luò)技術(shù)日益發(fā)展的今天,各個領(lǐng)域?qū)W(wǎng)絡(luò)運算速度和精度的需求都在不斷提高.然而隨著應(yīng)用領(lǐng)域的不同,網(wǎng)絡(luò)模型也千差萬別.如何根據(jù)網(wǎng)絡(luò)規(guī)模設(shè)計高能效的加速器,以及基于有限硬件資源如何提高網(wǎng)絡(luò)性能并最大化資源利用率是當今體系結(jié)構(gòu)領(lǐng)域研究的重要問題.為此,本文提出一種基于算子的模型分析方法,將神經(jīng)網(wǎng)絡(luò)的層視為算子,首先分析模型的算子種類、數(shù)量和順序.然后基于不同算子功能分析統(tǒng)計算子中乘法和加法等基本操作數(shù)量以及內(nèi)存占用量等特征的公式,實現(xiàn)基于不同輸入的模型特征分析.此外,本文提出基于計算特征的最大值更替調(diào)度算法,實現(xiàn)基于給定硬件資源和不同模型規(guī)模的運行調(diào)度方案.實驗結(jié)果顯示,本文所提出的方法為從體系結(jié)構(gòu)角度分析神經(jīng)網(wǎng)絡(luò),優(yōu)化硬件加速器的設(shè)計提供了參考和指導(dǎo).

    猜你喜歡
    模型
    一半模型
    一種去中心化的域名服務(wù)本地化模型
    適用于BDS-3 PPP的隨機模型
    提煉模型 突破難點
    函數(shù)模型及應(yīng)用
    p150Glued在帕金森病模型中的表達及分布
    函數(shù)模型及應(yīng)用
    重要模型『一線三等角』
    重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
    3D打印中的模型分割與打包
    av国产免费在线观看| 美女xxoo啪啪120秒动态图| 日日摸夜夜添夜夜爱| 热99国产精品久久久久久7| 婷婷色av中文字幕| 国产精品欧美亚洲77777| 啦啦啦中文免费视频观看日本| 国产精品久久久久成人av| 国产美女午夜福利| 欧美变态另类bdsm刘玥| 亚洲电影在线观看av| 在线观看av片永久免费下载| 美女国产视频在线观看| 欧美一区二区亚洲| 干丝袜人妻中文字幕| 亚洲美女搞黄在线观看| 日韩国内少妇激情av| 国产免费福利视频在线观看| 日本wwww免费看| 久久人人爽av亚洲精品天堂 | 欧美xxⅹ黑人| freevideosex欧美| 一级a做视频免费观看| 777米奇影视久久| 色视频在线一区二区三区| 久久久久精品性色| 精品一品国产午夜福利视频| 亚洲色图av天堂| 中文欧美无线码| 狂野欧美激情性xxxx在线观看| 中文字幕精品免费在线观看视频 | 色吧在线观看| 日韩免费高清中文字幕av| 久久久久性生活片| 久久毛片免费看一区二区三区| 黑丝袜美女国产一区| 深夜a级毛片| 伦理电影免费视频| 国产69精品久久久久777片| 涩涩av久久男人的天堂| 在线观看人妻少妇| 夜夜爽夜夜爽视频| 丝袜喷水一区| 日韩视频在线欧美| 蜜桃在线观看..| 亚洲无线观看免费| 国产成人freesex在线| 91精品一卡2卡3卡4卡| 国产精品国产av在线观看| 亚洲av中文字字幕乱码综合| 中文在线观看免费www的网站| a级毛色黄片| 高清毛片免费看| 国产av一区二区精品久久 | 欧美日韩精品成人综合77777| 五月玫瑰六月丁香| 男人和女人高潮做爰伦理| 欧美日韩亚洲高清精品| www.av在线官网国产| 免费人妻精品一区二区三区视频| 亚洲av男天堂| 免费观看的影片在线观看| 欧美成人午夜免费资源| 精品酒店卫生间| 看非洲黑人一级黄片| 丰满乱子伦码专区| 狂野欧美激情性bbbbbb| 国产色婷婷99| 午夜福利在线在线| 搡老乐熟女国产| 97精品久久久久久久久久精品| 亚洲国产精品国产精品| 夫妻性生交免费视频一级片| 亚洲美女黄色视频免费看| 国产精品免费大片| 亚洲人与动物交配视频| 国产在线男女| 欧美亚洲 丝袜 人妻 在线| 午夜激情久久久久久久| 国产老妇伦熟女老妇高清| 精品亚洲成国产av| 永久免费av网站大全| 久久久久久伊人网av| 国产成人a∨麻豆精品| 国产精品一二三区在线看| 欧美变态另类bdsm刘玥| 少妇人妻一区二区三区视频| 久久6这里有精品| 如何舔出高潮| 国产有黄有色有爽视频| 一区二区av电影网| 五月天丁香电影| 精品视频人人做人人爽| 国产乱人视频| 嫩草影院新地址| 18禁动态无遮挡网站| 在线精品无人区一区二区三 | 亚洲精品乱码久久久v下载方式| 色5月婷婷丁香| 欧美亚洲 丝袜 人妻 在线| 日韩强制内射视频| 如何舔出高潮| 大话2 男鬼变身卡| 成人漫画全彩无遮挡| 国产精品99久久99久久久不卡 | 国产69精品久久久久777片| 日韩成人伦理影院| 日韩不卡一区二区三区视频在线| 免费观看性生交大片5| 狂野欧美激情性bbbbbb| 国产伦理片在线播放av一区| 一区二区三区精品91| 国国产精品蜜臀av免费| 成年免费大片在线观看| 九草在线视频观看| 国产一区亚洲一区在线观看| 简卡轻食公司| 亚洲欧美日韩东京热| 日本色播在线视频| 最近手机中文字幕大全| 久久婷婷青草| 大香蕉97超碰在线| 另类亚洲欧美激情| 视频区图区小说| 欧美成人一区二区免费高清观看| 丝袜喷水一区| 欧美精品一区二区大全| 丰满迷人的少妇在线观看| 日韩一区二区三区影片| 99国产精品免费福利视频| 男女边摸边吃奶| 久久综合国产亚洲精品| 少妇熟女欧美另类| 国产精品一区二区在线观看99| 亚洲综合色惰| 少妇熟女欧美另类| 插逼视频在线观看| 2018国产大陆天天弄谢| 一级黄片播放器| 在线精品无人区一区二区三 | 精品亚洲成a人片在线观看 | 国产片特级美女逼逼视频| 国产 一区 欧美 日韩| 国产av精品麻豆| 各种免费的搞黄视频| 一区二区三区乱码不卡18| 中文在线观看免费www的网站| 亚洲国产高清在线一区二区三| 亚洲一级一片aⅴ在线观看| 日本欧美国产在线视频| 99久久精品一区二区三区| 午夜福利在线观看免费完整高清在| 亚洲综合色惰| 超碰97精品在线观看| 免费看光身美女| 菩萨蛮人人尽说江南好唐韦庄| 美女福利国产在线 | 中文天堂在线官网| 精品少妇久久久久久888优播| 美女高潮的动态| 国产成人freesex在线| 观看av在线不卡| 国模一区二区三区四区视频| 秋霞伦理黄片| 成人毛片60女人毛片免费| 久久99精品国语久久久| 日韩伦理黄色片| 国产精品免费大片| 高清欧美精品videossex| 精品人妻熟女av久视频| 美女高潮的动态| 在线观看免费视频网站a站| 成人高潮视频无遮挡免费网站| 国产精品一区二区性色av| 2022亚洲国产成人精品| 十分钟在线观看高清视频www | 免费观看a级毛片全部| 97在线视频观看| 国产人妻一区二区三区在| 精品99又大又爽又粗少妇毛片| 黄色欧美视频在线观看| 欧美亚洲 丝袜 人妻 在线| 少妇裸体淫交视频免费看高清| 久久精品夜色国产| 亚洲经典国产精华液单| 国产亚洲欧美精品永久| 嘟嘟电影网在线观看| 成人免费观看视频高清| 丰满人妻一区二区三区视频av| 在线 av 中文字幕| 国产一区二区三区综合在线观看 | 免费黄频网站在线观看国产| 欧美亚洲 丝袜 人妻 在线| 久久97久久精品| 观看免费一级毛片| 只有这里有精品99| 最后的刺客免费高清国语| 国产 一区 欧美 日韩| av.在线天堂| 欧美另类一区| 亚洲国产最新在线播放| 亚洲av不卡在线观看| 久久久久久久久久人人人人人人| xxx大片免费视频| 久久99热6这里只有精品| 高清视频免费观看一区二区| 久久久久久伊人网av| 女性被躁到高潮视频| h视频一区二区三区| 身体一侧抽搐| 91精品国产国语对白视频| 国产欧美日韩一区二区三区在线 | 人妻一区二区av| 久久久久久久久大av| 麻豆成人午夜福利视频| 五月开心婷婷网| 一级片'在线观看视频| 麻豆乱淫一区二区| 男女免费视频国产| 丰满少妇做爰视频| 久久精品国产亚洲av涩爱| 91午夜精品亚洲一区二区三区| 亚洲欧美日韩无卡精品| 一区二区三区乱码不卡18| 香蕉精品网在线| 色综合色国产| 在线观看国产h片| 国产高清三级在线| 亚洲av成人精品一二三区| 国产免费一区二区三区四区乱码| 亚洲国产毛片av蜜桃av| 男女啪啪激烈高潮av片| 91在线精品国自产拍蜜月| 国产精品蜜桃在线观看| 肉色欧美久久久久久久蜜桃| 视频中文字幕在线观看| 亚洲美女搞黄在线观看| 只有这里有精品99| 亚洲欧美中文字幕日韩二区| 国产精品.久久久| 欧美国产精品一级二级三级 | 久久久久久久精品精品| 国产日韩欧美亚洲二区| .国产精品久久| 日本与韩国留学比较| 亚洲人成网站在线播| 国产精品精品国产色婷婷| 最新中文字幕久久久久| 国产精品爽爽va在线观看网站| 免费观看的影片在线观看| 亚洲美女搞黄在线观看| 精品少妇黑人巨大在线播放| 亚洲精品日韩在线中文字幕| 我的女老师完整版在线观看| 欧美zozozo另类| 欧美高清性xxxxhd video| 免费大片黄手机在线观看| av免费观看日本| 午夜福利视频精品| 老熟女久久久| www.av在线官网国产| 成人黄色视频免费在线看| 啦啦啦中文免费视频观看日本| 久久精品国产亚洲av天美| 国内少妇人妻偷人精品xxx网站| 最近中文字幕高清免费大全6| 精品亚洲成国产av| 久久99热这里只有精品18| 亚洲精品第二区| 国产精品久久久久久久电影| 深爱激情五月婷婷| 在线播放无遮挡| 国产国拍精品亚洲av在线观看| 亚洲精品成人av观看孕妇| 人妻制服诱惑在线中文字幕| 亚洲精品视频女| 又大又黄又爽视频免费| 美女内射精品一级片tv| 观看免费一级毛片| 亚洲精品自拍成人| 18禁在线播放成人免费| 日韩 亚洲 欧美在线| 中文字幕久久专区| 蜜臀久久99精品久久宅男| 久久影院123| 亚洲国产成人一精品久久久| 国产黄片美女视频| 自拍欧美九色日韩亚洲蝌蚪91 | 国产免费视频播放在线视频| 日本黄色片子视频| 黄色配什么色好看| 高清日韩中文字幕在线| 欧美日韩国产mv在线观看视频 | 各种免费的搞黄视频| 亚洲av免费高清在线观看| 国产成人a区在线观看| 身体一侧抽搐| 在线观看国产h片| 欧美成人午夜免费资源| 国产精品久久久久久久电影| 亚洲精品乱久久久久久| a 毛片基地| 日韩欧美一区视频在线观看 | 久久热精品热| 午夜激情久久久久久久| 成人无遮挡网站| 亚洲av成人精品一区久久| 永久免费av网站大全| a级毛片免费高清观看在线播放| 一级黄片播放器| 国产精品.久久久| 大码成人一级视频| 久久久久国产精品人妻一区二区| 日韩电影二区| 国产黄频视频在线观看| 成人漫画全彩无遮挡| 国产精品蜜桃在线观看| 欧美最新免费一区二区三区| 亚洲综合色惰| 在线免费观看不下载黄p国产| 中国美白少妇内射xxxbb| 男女下面进入的视频免费午夜| 亚洲,一卡二卡三卡| 蜜桃久久精品国产亚洲av| 人人妻人人澡人人爽人人夜夜| 黄色一级大片看看| av.在线天堂| 久久影院123| 中文字幕人妻熟人妻熟丝袜美| 天堂中文最新版在线下载| 国产成人精品婷婷| 午夜激情福利司机影院| 赤兔流量卡办理| 国产永久视频网站| 少妇裸体淫交视频免费看高清| 欧美3d第一页| 色网站视频免费| 欧美国产精品一级二级三级 | 女性被躁到高潮视频| 免费看不卡的av| 日韩精品有码人妻一区| 午夜福利视频精品| 91精品一卡2卡3卡4卡| 久久精品国产自在天天线| 久久午夜福利片| 午夜视频国产福利| 久久99热这里只有精品18| 国产精品嫩草影院av在线观看| 精品一品国产午夜福利视频| 成人黄色视频免费在线看| 97精品久久久久久久久久精品| 久久人妻熟女aⅴ| 亚洲综合精品二区| 欧美日韩综合久久久久久| 国产精品精品国产色婷婷| h视频一区二区三区| 免费不卡的大黄色大毛片视频在线观看| 高清在线视频一区二区三区| 又大又黄又爽视频免费| 性色av一级| 2022亚洲国产成人精品| 最近2019中文字幕mv第一页| 天堂中文最新版在线下载| 欧美成人a在线观看| 久久久久久久久久成人| 国产精品一区二区在线不卡| 日韩一区二区视频免费看| 又大又黄又爽视频免费| 99热这里只有精品一区| 久久国产乱子免费精品| 麻豆精品久久久久久蜜桃| 欧美区成人在线视频| 天美传媒精品一区二区| 在线观看人妻少妇| 日本色播在线视频| 91精品伊人久久大香线蕉| 欧美3d第一页| 高清午夜精品一区二区三区| 夫妻午夜视频| 国产久久久一区二区三区| 亚洲欧美精品自产自拍| 激情 狠狠 欧美| tube8黄色片| 观看av在线不卡| 欧美精品亚洲一区二区| 欧美+日韩+精品| 日韩三级伦理在线观看| 热99国产精品久久久久久7| 日韩不卡一区二区三区视频在线| 一二三四中文在线观看免费高清| 联通29元200g的流量卡| 蜜臀久久99精品久久宅男| 女性被躁到高潮视频| 国产av码专区亚洲av| 一区二区三区免费毛片| 波野结衣二区三区在线| 午夜老司机福利剧场| 成人免费观看视频高清| 美女内射精品一级片tv| 欧美日韩综合久久久久久| 王馨瑶露胸无遮挡在线观看| 黄色日韩在线| 王馨瑶露胸无遮挡在线观看| 精品国产露脸久久av麻豆| 亚洲精品久久午夜乱码| 国产在线视频一区二区| 免费观看无遮挡的男女| 久久女婷五月综合色啪小说| 欧美zozozo另类| 亚洲中文av在线| 欧美成人一区二区免费高清观看| 熟女电影av网| 国产片特级美女逼逼视频| 成年美女黄网站色视频大全免费 | 青青草视频在线视频观看| 尾随美女入室| 久久国产亚洲av麻豆专区| 大又大粗又爽又黄少妇毛片口| 精品午夜福利在线看| 国产成人精品一,二区| 亚洲成人中文字幕在线播放| 狠狠精品人妻久久久久久综合| 日本色播在线视频| 尤物成人国产欧美一区二区三区| 亚洲精品乱久久久久久| 成人美女网站在线观看视频| 亚洲内射少妇av| 免费人成在线观看视频色| 国产成人精品婷婷| 日韩成人伦理影院| 卡戴珊不雅视频在线播放| 国产探花极品一区二区| 久久6这里有精品| 久久久久久久久久人人人人人人| 亚洲精品国产av成人精品| 免费观看av网站的网址| 最近手机中文字幕大全| 我的老师免费观看完整版| 一本一本综合久久| 免费高清在线观看视频在线观看| 亚洲av综合色区一区| av免费观看日本| 直男gayav资源| 色吧在线观看| 国产精品国产av在线观看| 舔av片在线| 欧美激情极品国产一区二区三区 | 美女脱内裤让男人舔精品视频| 亚洲精品国产成人久久av| 在线免费十八禁| 99热这里只有是精品在线观看| 黄色一级大片看看| 99久久中文字幕三级久久日本| 日本一二三区视频观看| 免费少妇av软件| 高清日韩中文字幕在线| 久热久热在线精品观看| 1000部很黄的大片| 丰满少妇做爰视频| av天堂中文字幕网| 啦啦啦视频在线资源免费观看| 国产又色又爽无遮挡免| 一本色道久久久久久精品综合| 成年免费大片在线观看| 国产免费福利视频在线观看| 91久久精品国产一区二区成人| 国产av一区二区精品久久 | 卡戴珊不雅视频在线播放| 欧美日本视频| 中文字幕精品免费在线观看视频 | 久久 成人 亚洲| 欧美日韩综合久久久久久| 日韩成人av中文字幕在线观看| 国产欧美日韩精品一区二区| 又粗又硬又长又爽又黄的视频| 精品视频人人做人人爽| 国产高清国产精品国产三级 | 精品久久久久久久末码| 制服丝袜香蕉在线| 久久精品久久久久久久性| 精品久久久久久久久亚洲| 99久久人妻综合| 中文精品一卡2卡3卡4更新| 亚洲av中文字字幕乱码综合| 欧美日韩视频高清一区二区三区二| 国产欧美亚洲国产| 日韩亚洲欧美综合| 久久99蜜桃精品久久| 嘟嘟电影网在线观看| 亚洲成人中文字幕在线播放| 久久精品国产鲁丝片午夜精品| 亚州av有码| 亚洲欧美成人精品一区二区| 国产精品一区二区在线不卡| 国产一区二区三区综合在线观看 | 身体一侧抽搐| 欧美丝袜亚洲另类| 搡女人真爽免费视频火全软件| 精品人妻一区二区三区麻豆| 少妇的逼好多水| 国产成人一区二区在线| 男男h啪啪无遮挡| 两个人的视频大全免费| 日本黄色片子视频| 一本—道久久a久久精品蜜桃钙片| 一级毛片aaaaaa免费看小| 2018国产大陆天天弄谢| 国产成人一区二区在线| 大片免费播放器 马上看| 亚洲欧美精品自产自拍| 午夜激情福利司机影院| 2022亚洲国产成人精品| 蜜桃亚洲精品一区二区三区| 搡女人真爽免费视频火全软件| 亚洲人成网站高清观看| 黑人猛操日本美女一级片| 亚洲久久久国产精品| 国产成人a∨麻豆精品| 国产免费福利视频在线观看| 青春草国产在线视频| 视频区图区小说| 国产欧美日韩精品一区二区| 校园人妻丝袜中文字幕| 国产熟女欧美一区二区| 97精品久久久久久久久久精品| 日本色播在线视频| 美女中出高潮动态图| 免费av中文字幕在线| h视频一区二区三区| 黄色怎么调成土黄色| 最近中文字幕2019免费版| 亚洲色图综合在线观看| 精品国产露脸久久av麻豆| 日韩 亚洲 欧美在线| 精华霜和精华液先用哪个| 国产 一区 欧美 日韩| 一级毛片电影观看| 黑丝袜美女国产一区| 国产老妇伦熟女老妇高清| 国产精品福利在线免费观看| 亚洲国产精品国产精品| 免费av中文字幕在线| 黄色配什么色好看| 水蜜桃什么品种好| 视频区图区小说| 亚洲人成网站高清观看| 一本色道久久久久久精品综合| 久久精品国产亚洲av天美| 在线观看一区二区三区激情| 成人亚洲精品一区在线观看 | 美女福利国产在线 | 精品国产三级普通话版| 国产成人aa在线观看| av网站免费在线观看视频| 亚洲av免费高清在线观看| 色网站视频免费| 一本久久精品| 天堂中文最新版在线下载| 王馨瑶露胸无遮挡在线观看| 欧美最新免费一区二区三区| 有码 亚洲区| a级一级毛片免费在线观看| 日日撸夜夜添| 大又大粗又爽又黄少妇毛片口| 2018国产大陆天天弄谢| videos熟女内射| 夫妻午夜视频| 不卡视频在线观看欧美| 日韩成人av中文字幕在线观看| 一个人看视频在线观看www免费| 黑人猛操日本美女一级片| h视频一区二区三区| 欧美另类一区| 免费看光身美女| 久久久精品94久久精品| 啦啦啦视频在线资源免费观看| 国产成人一区二区在线| 在线观看国产h片| 亚洲精品一二三| 亚洲自偷自拍三级| 秋霞伦理黄片| 在线观看美女被高潮喷水网站| 91狼人影院| 久久韩国三级中文字幕| 黑丝袜美女国产一区| 亚洲av免费高清在线观看| 22中文网久久字幕| 男人爽女人下面视频在线观看| 日本-黄色视频高清免费观看| 能在线免费看毛片的网站| 秋霞伦理黄片| 欧美bdsm另类| 国产精品国产三级国产专区5o| 久久女婷五月综合色啪小说| 国产亚洲欧美精品永久| 青春草视频在线免费观看| 亚洲欧洲日产国产| 伦精品一区二区三区| 校园人妻丝袜中文字幕| 少妇高潮的动态图| 性色avwww在线观看| 精品国产露脸久久av麻豆| 毛片女人毛片| 亚洲一区二区三区欧美精品| 国产乱来视频区| 日本色播在线视频| 老女人水多毛片| 97在线视频观看| 国产成人精品福利久久| 午夜老司机福利剧场| 国产免费福利视频在线观看| 国产精品一区www在线观看| 男女边摸边吃奶| 亚洲av不卡在线观看| 亚洲怡红院男人天堂|