• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    CRNN心音分類系統(tǒng)硬件加速及實(shí)現(xiàn)

    2022-11-25 07:26:02周李敏楊宏波潘家華王威廉
    關(guān)鍵詞:心音加速器運(yùn)算

    周李敏,孫 靜,楊宏波,潘家華,王威廉+

    (1.云南大學(xué) 信息學(xué)院,云南 昆明 650500;2.云南省阜外心血管病醫(yī)院 結(jié)構(gòu)性心臟病病區(qū),云南 昆明 650102)

    0 引 言

    心音信號(hào)在評(píng)估心血管疾病(cardiovascular disease,CVD)的初診篩查中起著至關(guān)重要的作用[1],但心音聽診在很大程度上取決于醫(yī)師的臨床經(jīng)驗(yàn)和檢查技能。與此同時(shí)人工智能興起,故而將深度學(xué)習(xí)應(yīng)用于心音自動(dòng)分類系統(tǒng)的研究應(yīng)運(yùn)而生[1,2]。心音自動(dòng)分類系統(tǒng)包括心音信號(hào)預(yù)處理、特征提取以及分類3個(gè)部分,可將深度學(xué)習(xí)的方法用于分類部分以達(dá)到智能識(shí)別正、異常心音信號(hào)的目的。

    卷積神經(jīng)網(wǎng)絡(luò)(convolutional neutral network,CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)是深度學(xué)習(xí)的代表算法,但其計(jì)算密集、參數(shù)龐大的特點(diǎn)對(duì)擅長(zhǎng)處理調(diào)度的中央處理器(central processing unit,CPU)并不友好[3]。圖形處理器(graphics processing unit,GPU)的架構(gòu)雖適用于密集型計(jì)算,然而功耗太大的缺點(diǎn)導(dǎo)致其難以應(yīng)用于移動(dòng)端。專用集成電路(application specific integrated circuit,ASIC)具有低功耗、高性能的優(yōu)點(diǎn),但其研發(fā)周期長(zhǎng)、成本高,難以做到廣泛的適配?,F(xiàn)場(chǎng)可編程邏輯門陣列(field programmable gate array,F(xiàn)PGA)兼?zhèn)銰PU和ASIC的優(yōu)勢(shì),且可根據(jù)不同算法的運(yùn)算邏輯靈活設(shè)計(jì)對(duì)應(yīng)的硬件電路。故在FPGA上設(shè)計(jì)的CNN、RNN加速器將更適于實(shí)際的開發(fā)場(chǎng)景。

    在硬件加速研究領(lǐng)域,Kowsaly提出了一種可替代傳統(tǒng)二叉樹加法器的新加法器,進(jìn)一步降低了硬件利用率,從而顯著提升了CNN在FPGA上的運(yùn)行效率[4]。張強(qiáng)使用高層次綜合(high-level synthesis,HLS)對(duì)CNN各層進(jìn)行定制化編程,并利用流水線約束實(shí)現(xiàn)硬件加速,對(duì)比于單CPU部署方案效率提升了約14.7倍[5]。余運(yùn)俊等采用剪枝的方法對(duì)長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(long short-term memory,LSTM)進(jìn)行精簡(jiǎn)壓縮,并最終實(shí)現(xiàn)了低功耗下相對(duì)較高性能的LSTM加速器[6]。近年來,許多研究者將CNN和RNN應(yīng)用于心音分類領(lǐng)域,取得了良好的分類效果[7,8]。LSTM神經(jīng)網(wǎng)絡(luò)是一種特殊的RNN,在語音、自然語言處理等領(lǐng)域有不可替代的作用。Deng M等結(jié)合了CNN和LSTM兩種網(wǎng)絡(luò)架構(gòu),首次在心音信號(hào)分類過程中采用遞歸卷積神經(jīng)網(wǎng)絡(luò)(recurrent convolutional neural network,CRNN),達(dá)到了目前效果最好的分類準(zhǔn)確率[9]。雖然目前已有不少研究者設(shè)計(jì)了基于FPGA的定制化CNN或LSTM加速器,但缺少兼?zhèn)銫NN和LSTM優(yōu)勢(shì)的CRNN硬件加速器。此外,定制化的加速器無法兼容不同網(wǎng)絡(luò)結(jié)構(gòu),且具有硬件占用率高、模型加載延時(shí)長(zhǎng)的缺點(diǎn)。

    為解決上述問題,本文設(shè)計(jì)了一個(gè)基于FPGA的CRNN硬件加速器,該加速器的CNN加速模塊可根據(jù)不同網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行動(dòng)態(tài)配置,并將此加速器實(shí)際應(yīng)用于心音分類系統(tǒng)中的分類部分。根據(jù)卷積層和LSTM層的運(yùn)算特點(diǎn),通過采用參數(shù)量化、交錯(cuò)緩存、分片緩存、滑動(dòng)窗機(jī)制及HLS指令優(yōu)化等方法,在性能與功耗上取得了較好的加速效果。

    1 技術(shù)背景

    CRNN的網(wǎng)絡(luò)結(jié)構(gòu)非常靈活,其可由卷積層、LSTM層、池化層、全連接層4種通用部分組合構(gòu)成。對(duì)于傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)而言,卷積層計(jì)算量占整個(gè)卷積神經(jīng)網(wǎng)絡(luò)計(jì)算量的90%以上[10]。CRNN中除了卷積層以外,LSTM層中大量的向量矩陣乘法運(yùn)算同樣需要消耗很大的算力。因此,CRNN硬件加速的核心在于卷積層和LSTM層。

    1.1 卷積層運(yùn)算理論

    卷積層由若干卷積核構(gòu)成,目的是從輸入特征圖中提取更高級(jí)的特征。卷積核在輸入特征圖上滑動(dòng)并與窗口內(nèi)的像素點(diǎn)進(jìn)行內(nèi)積運(yùn)算得到下一級(jí)特征圖。卷積核實(shí)際上是一種離散濾波器,濾波器參數(shù)即權(quán)值。卷積層運(yùn)算的偽代碼如代碼1所示。

    代碼1:卷積層前向計(jì)算偽代碼。

    for(n=0;n

    for(h=0;h

    for(w=0;w

    {

    newsum=0;

    for(m=0;m

    for(j=0;j

    for(k=0;k

    sum+=Fin[h+j][w+k][m]*kernel[j][k][m][n];

    Fout[h][w][n]=sum;

    }

    從算法角度來講,一次完整的卷積層運(yùn)算需要對(duì)N、H、W、M、K、J共6個(gè)維度進(jìn)行循環(huán)遍歷(一般情況下J=K)。但實(shí)際上這6層循環(huán)之間互不依賴,調(diào)換順序也毫無影響,故可以根據(jù)加速器算力峰值、硬件利用率、邏輯復(fù)雜度、最終性能等參數(shù)來選擇如何展開循環(huán)以及展開到什么程度。通俗來講,就是選擇并行度類型以及并行度大小。常見的并行度類型如圖1所示[11]。

    圖1 常見的卷積層并行度類型

    (1)輸入通道并行,如圖1(a)所示。將代碼1中的輸入通道循環(huán)部分展開,同時(shí)計(jì)算PM個(gè)輸入通道的數(shù)據(jù),因而并行度為PM。

    (2)輸出通道并行,如圖1(b)所示。將代碼1中的輸出通道循環(huán)部分展開,同時(shí)計(jì)算PN個(gè)輸入通道的數(shù)據(jù),因而并行度為PN。

    (3)卷積核內(nèi)并行,如圖1(c)所示。將代碼1中的卷積核行于列循環(huán)部分展開,同時(shí)計(jì)算PK個(gè)輸入通道的數(shù)據(jù),因而并行度為PK。

    1.2 LSTM層運(yùn)算理論

    LSTM神經(jīng)網(wǎng)絡(luò)由Sepp Hochreiter等于1997年首次提出,它獨(dú)特的設(shè)計(jì)結(jié)構(gòu)能夠存儲(chǔ)任意時(shí)間段內(nèi)的長(zhǎng)期依賴關(guān)系。LSTM由細(xì)胞狀態(tài)、輸入門、輸 入調(diào)制門、遺忘門以及輸出門5個(gè)部分組成,其中每個(gè)門包括一個(gè)向量矩陣乘法加權(quán)操作和一個(gè)使用激活函數(shù)的操作。細(xì)胞狀態(tài)的作用是讓LSTM能夠保持長(zhǎng)期的記憶;門結(jié)構(gòu)的作用是在每一時(shí)刻決定哪些信息應(yīng)該保留,哪些信息需要遺忘。在信息傳遞過程中,LSTM通過門限機(jī)制對(duì)上一時(shí)刻細(xì)胞狀態(tài)、當(dāng)前時(shí)刻輸入和上一時(shí)刻隱藏狀態(tài)進(jìn)行處理從而達(dá)到刪除或者增加信息的目的。

    圖2 LSTM層內(nèi)部結(jié)構(gòu)

    如圖2所示,LSTM神經(jīng)網(wǎng)絡(luò)的前向計(jì)算流程主要分為:忘記階段、選擇記憶階段、輸出階段[12]。忘記階段首先需要計(jì)算遺忘門的輸出ft,再根據(jù)計(jì)算結(jié)果對(duì)上一時(shí)刻輸入的細(xì)胞狀態(tài)ct-1進(jìn)行選擇性忘記。該階段的計(jì)算公式為式(1)

    ft=sigmoid(Wfxxt+Wfhht-1+bf)

    (1)

    選擇記憶階段首先需要通過計(jì)算輸入門的輸出it來對(duì)當(dāng)前時(shí)刻輸入xt進(jìn)行選擇性記憶,然后再計(jì)算輸入調(diào)制門的輸出gt,最后綜合考慮上一階段沒有忘記的信息以及本階段選擇記憶的新信息,完成當(dāng)前時(shí)刻的細(xì)胞狀態(tài)ct的更新。該階段的算公式為式(2)~式(4)

    it=sigmoid(Wixxt+Wihht-1+bi)

    (2)

    gt=tanh(Wgxxt+Wghht-1+bg)

    (3)

    ct=ft⊙ct-1+it⊙gt

    (4)

    輸出階段首先需要計(jì)算輸出門的輸出ot,然后再計(jì)算當(dāng)前時(shí)刻細(xì)胞狀態(tài)ct經(jīng)過tanh激活函數(shù)后的縮放輸出,最后綜合考慮決定當(dāng)前時(shí)刻隱藏狀態(tài)ht。該階段的計(jì)算公式為式(5)、式(6)

    ot=sigmoid(Woxxt+Wohht-1+bo)

    (5)

    ht=ot⊙tanh(ct)

    (6)

    2 加速實(shí)現(xiàn)方案

    傳統(tǒng)的FPGA開發(fā)是使用VHDL/Verilog硬件描述語言進(jìn)行硬件電路設(shè)計(jì)的,該方法開發(fā)效率低、實(shí)現(xiàn)難度大。HLS可將C/C++直接綜合為VHDL或者Verilog,從而縮短了算法設(shè)計(jì)、驗(yàn)證以及實(shí)現(xiàn)的開發(fā)周期。本文實(shí)驗(yàn)將采用HLS開發(fā)方法對(duì)硬件電路進(jìn)行模塊化設(shè)計(jì),并對(duì)卷積層加速器和LSTM層加速器的設(shè)計(jì)與優(yōu)化思路做重點(diǎn)介紹。

    2.1 卷積層加速器設(shè)計(jì)

    2.1.1 整體架構(gòu)

    網(wǎng)絡(luò)結(jié)構(gòu)中不同的卷積層往往具有不同的類型參數(shù),這些參數(shù)包括輸入輸出通道數(shù)、輸入輸出特征圖尺寸、卷積核個(gè)數(shù)及輸入通道數(shù)等。最簡(jiǎn)單的硬件電路設(shè)計(jì)策略是針對(duì)每一層卷積層做定制化設(shè)計(jì)。但定制化設(shè)計(jì)的網(wǎng)絡(luò)模型在當(dāng)前卷積層的計(jì)算完成后需要花費(fèi)數(shù)百毫秒來重新配置新卷積層,嚴(yán)重影響了整體性能。為減少加載不同卷積層的延時(shí),本文將設(shè)計(jì)具有高度兼容性的動(dòng)態(tài)可配置卷積層,按照各個(gè)類型參數(shù)取其最大值的情況來設(shè)計(jì)一個(gè)適合所有卷積層的硬件架構(gòu)。

    本文設(shè)計(jì)的動(dòng)態(tài)可配置卷積層加速器整體架構(gòu)如圖3所示。直接存儲(chǔ)器訪問(direct memory access,DMA)通過HP接口訪問存儲(chǔ)在片外雙速率同步動(dòng)態(tài)隨機(jī)存儲(chǔ)器(dual date rate synchronous dynamic random memory,DDR)中的數(shù)據(jù),并將數(shù)據(jù)轉(zhuǎn)換成AXI4-Stream格式的流數(shù)據(jù)。先將當(dāng)前卷積層的全部權(quán)值通過FPGA的AXI4-Stream總線從DDR傳入片上緩存Weight_Buffer,再將輸入特征圖通過AXI4-Stream總線從DDR傳入片上緩存Input_Buffer。鑒于模型參數(shù)龐大,Input_Buffer僅存儲(chǔ)本次計(jì)算需要的數(shù)據(jù),待本次計(jì)算完成后再更新下一次計(jì)算需要的輸入特征值。數(shù)據(jù)處理模塊(data process module,DPM)從Input_Buffer中獲取輸入特征值、從Weight_Buffer中獲取權(quán)值,然后依次進(jìn)行滑動(dòng)窗乘法累加操作、輸入通道累加操作、激活函數(shù)操作,這里的激活函數(shù)選擇的是比ReLU效果更好的Leaky ReLU。計(jì)算完的輸出特征值先存入Output_Buffer中,待這一批的數(shù)據(jù)全部計(jì)算完成后,再通過AXI4-Stream總線將計(jì)算結(jié)果值從Output_Buffer傳回DDR以作為下一層卷積層的輸入特征值。Control通過AXI4-Lite接口控制卷積層加速模塊的啟動(dòng)時(shí)序以及配置其具體參數(shù)。

    圖3 卷積層加速模塊架構(gòu)

    2.1.2 定點(diǎn)量化

    在FPGA上實(shí)現(xiàn)浮點(diǎn)運(yùn)算的資源消耗和時(shí)間代價(jià)均比定點(diǎn)運(yùn)算高[13],且CRNN模型的參數(shù)類型為32位浮點(diǎn)數(shù),如果直接儲(chǔ)存將會(huì)占用較多FPGA內(nèi)存資源,因此定點(diǎn)量化勢(shì)在必行。Int16定點(diǎn)量化能在保證計(jì)算精度的同時(shí)提高計(jì)算效率、減小內(nèi)存耗用。按照式(7)、式(8)對(duì)輸入特征值、權(quán)值以及輸出特征值進(jìn)行量化與反量化[14]

    (7)

    R=(Q-Z)×S

    (8)

    其中,R表示浮點(diǎn)值,Q表示定點(diǎn)量化值,S表示所選定點(diǎn)量化模型中的最小刻度,Z表示所選定點(diǎn)量化模型中0的浮點(diǎn)值所對(duì)應(yīng)的量化值。本文實(shí)驗(yàn)中輸入特征值、權(quán)值、輸出特征值的數(shù)據(jù)位寬設(shè)為16 bit,其中高8位為整數(shù)位,低8位為小數(shù)位。為保留較高計(jì)算精度以及防止計(jì)算結(jié)果溢出,將中間計(jì)算值的數(shù)據(jù)位寬設(shè)為32 bit,其中高16位為整數(shù)位,低16位為小數(shù)位。

    2.1.3 數(shù)據(jù)緩存

    (1)Input_Buffer。以具有RGB這3個(gè)輸入通道的卷積層為例,輸入特征圖最簡(jiǎn)單的緩存方法即順序傳輸各個(gè)輸入通道內(nèi)的像素點(diǎn)至Input_Buffer,如圖4(a)所示。然而計(jì)算輸出特征值時(shí),需要遍歷所有輸入通道對(duì)卷積結(jié)果進(jìn)行累加,因此這種緩存方法會(huì)增加Output_Buffer的大小。解決方式是如圖4(b)所示的通道交錯(cuò)式緩存,該緩存方法能夠明顯減少Output_Buffer的內(nèi)存耗用。假設(shè)輸入特征圖尺寸為R×C,卷積核尺寸為K×K,CRNN模型中最大輸入通道數(shù)為M。為了同時(shí)對(duì)M個(gè)輸入通道執(zhí)行交錯(cuò)式緩存操作,故Input_Buffer應(yīng)設(shè)計(jì)為M個(gè)尺寸為K×C的Line_Buffer。

    圖4 順序緩存與交錯(cuò)緩存對(duì)比

    (2)Weight_Buffer。設(shè)CRNN模型中最大輸入通道數(shù)為M,最大輸出通道數(shù)為N,且卷積核尺寸為K×K??紤]到最糟糕的消耗情況,Weight_Buffer應(yīng)設(shè)計(jì)為M×N個(gè)尺寸為K×K的緩存區(qū)。

    (3)Output_Buffer。設(shè)CRNN模型中最大輸出通道數(shù)為N,Output_Buffer用于緩存當(dāng)前卷積層輸出特征圖所有輸出通道上同一位置的像素點(diǎn),故Output_Buffer設(shè)計(jì)為1×N的緩存區(qū)。

    2.1.4 核心運(yùn)算設(shè)計(jì)

    DPM是卷積層加速器的運(yùn)算核心,而滑動(dòng)窗乘法累加單元又是DMP的核心單元,接下來著重介紹一下該單元的運(yùn)算機(jī)制與并行優(yōu)化設(shè)計(jì)。

    (1)滑動(dòng)窗機(jī)制。圖5(a)為輸入特征圖。如圖5(b)所示,Line_Buffer本質(zhì)是一個(gè)移位寄存器陣列,每當(dāng)捕獲到新的輸入特征值時(shí),對(duì)應(yīng)列的數(shù)據(jù)將會(huì)向上移位,并在該列插入新的輸入特征值。以此類推,直至緩存到輸入特征圖的最后三行。如圖5(c)所示,當(dāng)輸入特征圖的前兩行和前三列緩存完成后,才會(huì)觸發(fā)第一次卷積運(yùn)算。第二次觸發(fā)卷積運(yùn)算如圖5(d)所示,之后每更新3個(gè)新數(shù)據(jù),觸發(fā)一次卷積運(yùn)算。滑動(dòng)窗口負(fù)責(zé)從Line_Buffer中拾取數(shù)據(jù)并觸發(fā)卷積,設(shè)卷積核尺寸為K×K,則滑動(dòng)窗口也應(yīng)設(shè)計(jì)為窗口大小為K×K的Window_Buffer。

    圖5 滑動(dòng)窗機(jī)制

    (2)HLS指令優(yōu)化。本文實(shí)驗(yàn)主要使用了HLS中的PIPELINE指令和ARRAY_PARTITION指令對(duì)算法進(jìn)行優(yōu)化。循環(huán)內(nèi)層對(duì)數(shù)據(jù)的操作大致可分為3個(gè)步驟:讀取數(shù)據(jù)、計(jì)算數(shù)據(jù)、存儲(chǔ)數(shù)據(jù)。PIPELINE指令是HLS中增加硬件運(yùn)算并行度的一項(xiàng)重要的優(yōu)化技術(shù),其能將循環(huán)外層完全流水,最大程度地增加并行度從而提升系統(tǒng)的吞吐量。ARRAY_PARTITION指令可以將多維數(shù)組分割成多個(gè)獨(dú)立的模塊,從而可以在同一個(gè)時(shí)鐘周期內(nèi)讀出多個(gè)數(shù)據(jù),提高數(shù)據(jù)帶寬。假設(shè)權(quán)值數(shù)組的尺寸為N×M×K×K,并用ARRAY_PARTITION指令將其重新排列成(Cout,Cin,K×K)的3D陣列。定點(diǎn)量化后權(quán)值的數(shù)據(jù)位寬為16位,故64位的DMA傳輸模式最多可以并行4個(gè)輸入通道,也即Cin=4,相應(yīng)地,Cout=(N×M)/4。

    (3)并行計(jì)算設(shè)計(jì)。由圖1知,常見的并行度類型有:輸入通道并行、輸出通道并行、卷積核內(nèi)并行。上文分析到由于數(shù)據(jù)位寬和DMA傳輸模式的限制,最多只能并行4個(gè)輸入通道,故只需要4個(gè)Window_Buffer配合Line_Buffer完成滑動(dòng)窗乘法累加計(jì)算。相應(yīng)地,輸入通道并行度PM=4。當(dāng)Line_Buffer緩存至輸入特征圖第K行及第K-1列數(shù)據(jù)后,觸發(fā)Window_Buffer內(nèi)第一次卷積計(jì)算?;瑒?dòng)窗乘法累加運(yùn)算相當(dāng)于對(duì)卷積核內(nèi)行列循環(huán)進(jìn)行展開,同時(shí)計(jì)算K×K個(gè)數(shù)據(jù),因此卷積核內(nèi)并行度PK=K×K。理論上不同卷積核之間的卷積計(jì)算相互獨(dú)立,因此在硬件資源充足的條件下,輸出通道并行度PN=N。對(duì)卷積層運(yùn)算進(jìn)行并行化設(shè)計(jì)后的偽代碼如代碼2所示。

    代碼2:并行優(yōu)化后的卷積層偽代碼。

    weight_typeweight[M][N]

    #pragmaHLSARRAY_PARTITIONvariable=weightblockfactor=4dim=1

    for(i=0;i

    for(j=0;j

    for(k=0;k

    {

    #pragmaHLSPIPELINEI1=1

    load_weight;

    }

    for(r=0;r

    for(c=0;c

    for(m=0;m

    {

    #pragmaHLSPIPELINEI1=ICONV

    line_buffer;

    sliding_window;

    conv_mac;

    output_stream_merge;

    }

    2.2 LSTM層加速模塊設(shè)計(jì)

    2.2.1 整體架構(gòu)

    CRNN模型通常僅有一層LSTM,故為提高硬件電路設(shè)計(jì)效率,本文將對(duì)LSTM層執(zhí)行定制化設(shè)計(jì)方案。定制化設(shè)計(jì)的LSTM層加速器整體架構(gòu)如圖6所示,主要包括緩存區(qū)、向量矩陣運(yùn)算區(qū)、逐點(diǎn)運(yùn)算區(qū)。為方便分片緩存及后續(xù)運(yùn)算,首先將當(dāng)前時(shí)刻輸入xt和上一時(shí)刻隱藏狀態(tài)ht-1合并為一個(gè)長(zhǎng)向量Input_Vec,同時(shí)將輸入門、輸入調(diào)制門、遺忘門以及輸出門各自的權(quán)重合并為一個(gè)大的權(quán)重矩陣Weight_Mat,然后對(duì)Input_Vec和Weight_Mat執(zhí)行向量矩陣運(yùn)算,并將其計(jì)算結(jié)果傳輸?shù)紸dder_Tree組件進(jìn)行并行累加,最后加上偏置向量Bias_Vec得到向量矩陣運(yùn)算區(qū)最終運(yùn)算結(jié)果。在逐點(diǎn)運(yùn)算區(qū),根據(jù)式(1)~式(6)計(jì)算分別得到it、gt、ft、ot、ct、ht,并將當(dāng)前時(shí)刻細(xì)胞狀態(tài)ct、當(dāng)前時(shí)刻隱藏狀態(tài)ht傳輸至緩存區(qū)用于下一時(shí)刻各項(xiàng)數(shù)據(jù)的計(jì)算。

    圖6 LSTM層加速模塊架構(gòu)

    2.2.2 分片緩存

    LSTM層參數(shù)主要包括權(quán)重矩陣Weight_Mat和輸入長(zhǎng)向量Input_Vec,其中Weight_Mat包含了Wix、Wgx、Wfx、Wox、Wih、Wgh、Wfh、Woh。由于FPGA存儲(chǔ)資源和查找表數(shù)量有限,本文將對(duì)權(quán)重矩陣和輸入長(zhǎng)向量采取分片緩存策略。如圖7所示,Input_Vec的大小為(Input_Vec+Hidden_Size),合并后的Weight_Mat的大小為(Input_Vec+Hidden_Size)×(4×Hidden_Size)。Input_Vec和Weight_Mat均被劃分為長(zhǎng)度為32的片區(qū),不足32的部分填充0補(bǔ)齊。在向量矩陣運(yùn)算過程中,將Input_Vec的每一個(gè)分片都與Weight_Mat的對(duì)應(yīng)數(shù)據(jù)相乘累加,直至遍歷完Input_Vec的全部分片。片緩存區(qū)中數(shù)據(jù)的乘法累加操作仍通過滑動(dòng)窗完成,滑動(dòng)窗口大小為1×32。向量矩陣運(yùn)算部分的偽代碼如代碼3所示,同樣使用了HLS指令中的PIPELINE與ARRAY_PARTITION指令對(duì)算法進(jìn)行并行優(yōu)化。

    代碼3:LSTM層向量矩陣運(yùn)算偽代碼。

    weight_typeweight[4*Hidden_Size][(Hidden_Size+Input_Vec)/32];

    #pragmaHLSARRAY_PARTITIONvariable=weightblockfactor=4dim=1

    for(i=0;i<4*Hidden_Size;i=i+1)

    for(j=0;j

    for(k=0;k<32;k=k+1)

    {

    #pragmaHLSPIPELINEI1=1

    load_weight;

    }

    for(i=0;i<4*Hidden_Size;i=i+1)

    for(j=0;j

    for(m=0;m<(Hidden_Size+Input_Vec)/4*32;m=m+1)

    {

    #pragmaHLSPIPELINEI1=ILSTM

    tile_buffer;

    sliding_window;

    tile_mac;

    output_stream_merge;

    }

    圖7 分片緩存

    2.2.3 激活函數(shù)

    FPGA實(shí)現(xiàn)激活函數(shù)的常用方法有泰勒級(jí)數(shù)展開法、查找表法以及分段函數(shù)擬合法等。泰勒級(jí)數(shù)展開法擬合效果最佳,但復(fù)雜的運(yùn)算會(huì)消耗大量乘法器資源,且計(jì)算時(shí)間較長(zhǎng)。查找表法最為簡(jiǎn)單快速且不消耗乘法器,但其需要事先將不同變量對(duì)應(yīng)的函數(shù)值存入ROM中。隨著函數(shù)計(jì)算精度的提高,其所需的存儲(chǔ)資源會(huì)顯著增加。本文采用的分段函數(shù)擬合法將低階多項(xiàng)式和查找表相結(jié)合,很好地平衡了計(jì)算精度與計(jì)算時(shí)間之間的矛盾。

    sigmoid函數(shù)和tanh函數(shù)的表達(dá)式如下[15]

    (9)

    (10)

    利用MATLAB內(nèi)置函數(shù)polyfit分別擬合式(9)、式(10)得到sigmoid、tanh的擬合函數(shù)。因LSTM層的輸入輸出數(shù)據(jù)均量化為16位定點(diǎn)數(shù),故需對(duì)擬合函數(shù)進(jìn)行相應(yīng)倍數(shù)放大。修正后的sigmoid、tanh擬合函數(shù)見表1、表2。如若輸入數(shù)據(jù)為負(fù)數(shù),則將其轉(zhuǎn)換為補(bǔ)碼再根據(jù)式(11)求解。運(yùn)算過程中除法涉及的除數(shù)4096為2的冪次方,因而可以通過移位寄存器輕易實(shí)現(xiàn)

    f(x)=4096-f(65 536-x)(32 768≤x≤65 535)

    (11)

    表2 FPGA擬合tanh函數(shù)

    3 實(shí)驗(yàn)及結(jié)果分析

    3.1 實(shí)驗(yàn)環(huán)境

    本文設(shè)計(jì)的遞歸卷積神經(jīng)網(wǎng)絡(luò)加速器選擇ARM+FPGA異構(gòu)SoC硬件平臺(tái)進(jìn)行開發(fā),其中FPGA作為從處理器部署CRNN加速器,ARM作為主處理器通過AXI4-Lite接口與CRNN加速器交互并控制其運(yùn)行。實(shí)驗(yàn)平臺(tái)為Xilinx公司Zynq-7000系列的ZedBoard開發(fā)板,開發(fā)環(huán)境為Vivado HLS 2019.01。PC端操作系統(tǒng)為Windows 10,其中央處理器型號(hào)為Intel Core i7-9750H CPU 2.60 GHz,其顯示適配器型號(hào)為NVIDIA GetForce GTX 1660 Ti。

    3.2 測(cè)試數(shù)據(jù)集與網(wǎng)絡(luò)模型

    本文實(shí)驗(yàn)中所使用的心音數(shù)據(jù)來自于心音挑戰(zhàn)賽數(shù)據(jù)庫,研究者可從PhysioNet網(wǎng)站上自行下載。先對(duì)心音信號(hào)進(jìn)行小波去噪,然后采用梅爾對(duì)數(shù)頻率系數(shù)(log Mel-frequency spectral coefficients,MFSC)對(duì)其進(jìn)行特征提取,最后將輸出的32×16時(shí)頻特征圖輸入到不同模型中進(jìn)行分類[16]。其中包含66 688張訓(xùn)練圖、11 724張測(cè)試圖。圖8為不同模型中心音分類算法的性能對(duì)比。實(shí)驗(yàn)結(jié)果表明CRNN-a模型對(duì)心音信號(hào)的分類效果最佳。如表3所示,模型CRNN-a除輸入層外共分為5層,分別是卷積層C1/C2、LSTM層LS3、池化層S4、全連接層F5。在PC端完成CRNN-a模型的訓(xùn)練過程后,保存訓(xùn)練參數(shù)值并對(duì)其進(jìn)行Int16定點(diǎn)量化,最后再移植到FPGA硬件平臺(tái)中。

    圖8 不同模型中心音分類算法性能對(duì)比

    表3 CRNN-a的網(wǎng)絡(luò)結(jié)構(gòu)

    3.3 結(jié)果分析

    在100 MHz的時(shí)鐘頻率下,PL端的各模塊資源占用情況見表4,資源利用率見表5。卷積層中的卷積運(yùn)算和LSTM層中的向量矩陣運(yùn)算均需要使用大量乘法器,且LSTM層中的激活函數(shù)運(yùn)算還需要用到查找表,故DSP和LUT的利用率都很高。此外,卷積層和LSTM層均有規(guī)模龐大的權(quán)值矩陣和偏置向量需要緩存到BRAM中,故BRAM的利用率也很高。FF主要用于構(gòu)成移位寄存器。綜上所述,各項(xiàng)資源的利用率都很高,表明此硬件加速器架構(gòu)合理。

    表4 各模塊資源占用

    該硬件加速器與CPU、GPU的對(duì)比結(jié)果見表6??梢钥闯?,F(xiàn)PGA僅需0.569 ms便可完成對(duì)一張心音特征圖的識(shí)別分類工作,其識(shí)別速度是CPU的29.79倍,然而CPU

    表5 資源消耗

    表6 CRNN硬件加速器與CPU對(duì)比

    的功耗卻是FPGA的5.89倍;該加速器雖然在識(shí)別效率方面稍遜GPU平臺(tái),但性能功耗比約為GPU的20.2倍。綜上所述,基于FPGA的CRNN加速器相比于CPU和GPU,在性能和能耗方面有巨大優(yōu)勢(shì),具有相當(dāng)?shù)膶?shí)際應(yīng)用價(jià)值。

    4 結(jié)束語

    本文以實(shí)現(xiàn)CRNN加速器為目標(biāo),采用模塊化設(shè)計(jì)的方法著重對(duì)計(jì)算量龐大的卷積層和LSTM層提出了加速方案。為了有效地實(shí)現(xiàn)卷積運(yùn)算利用了輸入通道交錯(cuò)緩存操作和滑動(dòng)窗計(jì)算機(jī)制,針對(duì)LSTM層的向量矩陣運(yùn)算提出了分片緩存以達(dá)到分片復(fù)用、并行計(jì)算的目的,并使用PIPELINE指令將循環(huán)外層完全流水最大程度地增加并行度以及提升吞吐量,使用ARRAY_PARTITION指令對(duì)多維數(shù)據(jù)進(jìn)行再分割以提高數(shù)據(jù)帶寬。在Xilinx平臺(tái)上的驗(yàn)證實(shí)驗(yàn)結(jié)果表明,與CPU和GPU相比,該CRNN加速器在性能和功耗兼顧的情況下取得了29.79倍加速效果,以及20.2倍的高能效比優(yōu)勢(shì)。

    接下來的研究應(yīng)從以下兩個(gè)方面優(yōu)化:

    (1)通過剪枝對(duì)權(quán)重矩陣和偏置向量做稀疏化處理,以減少DSP和BRAM資源消耗,并將剪枝后的CRNN模型映射到FPGA上。

    (2)將LSTM層加速模塊設(shè)計(jì)為具有高度兼容性的動(dòng)態(tài)可配置架構(gòu)。

    猜你喜歡
    心音加速器運(yùn)算
    輪滑加速器
    化學(xué)工業(yè)的“加速器”
    重視運(yùn)算與推理,解決數(shù)列求和題
    全民小康路上的“加速器”
    有趣的運(yùn)算
    基于雙閾值的心音快速分段算法及其應(yīng)用研究
    雙聲道心音能量熵比的提取與識(shí)別研究
    基于香農(nóng)熵的心音信號(hào)檢測(cè)方法研究
    “整式的乘法與因式分解”知識(shí)歸納
    撥云去“誤”學(xué)乘除運(yùn)算
    亚洲av熟女| 九九在线视频观看精品| 乱系列少妇在线播放| 国产精品爽爽va在线观看网站| 22中文网久久字幕| 97超碰精品成人国产| 麻豆国产av国片精品| 久久精品国产自在天天线| 欧美日本视频| 狂野欧美白嫩少妇大欣赏| 乱人视频在线观看| 天天躁夜夜躁狠狠久久av| 丝袜喷水一区| 最后的刺客免费高清国语| 日产精品乱码卡一卡2卡三| 久久久a久久爽久久v久久| 日韩欧美在线乱码| 蜜桃亚洲精品一区二区三区| 51国产日韩欧美| 午夜精品在线福利| 一边摸一边抽搐一进一小说| 精品久久国产蜜桃| av在线观看视频网站免费| 最近最新中文字幕大全电影3| 国产高清有码在线观看视频| 亚洲精品日韩在线中文字幕 | 97热精品久久久久久| av在线天堂中文字幕| 国产精品久久久久久精品电影| 自拍偷自拍亚洲精品老妇| 成人特级黄色片久久久久久久| 国产在线男女| 亚洲美女搞黄在线观看 | 久久久久久久久中文| 亚洲精华国产精华液的使用体验 | 久99久视频精品免费| 嫩草影院新地址| 国产 一区精品| 嫩草影视91久久| 日日啪夜夜撸| 国产一级毛片七仙女欲春2| 免费无遮挡裸体视频| .国产精品久久| 尤物成人国产欧美一区二区三区| 校园春色视频在线观看| 国产视频内射| 最近的中文字幕免费完整| 午夜福利在线观看吧| 亚洲熟妇熟女久久| 日韩欧美三级三区| www.色视频.com| 亚洲电影在线观看av| 伦理电影大哥的女人| 亚洲最大成人中文| 午夜视频国产福利| 中文字幕精品亚洲无线码一区| 91久久精品国产一区二区成人| 九九热线精品视视频播放| 97在线视频观看| 亚洲av成人av| 菩萨蛮人人尽说江南好唐韦庄 | 最新中文字幕久久久久| 日韩av不卡免费在线播放| 国内精品一区二区在线观看| 婷婷亚洲欧美| 欧美绝顶高潮抽搐喷水| 99久久精品一区二区三区| 干丝袜人妻中文字幕| 国产精品美女特级片免费视频播放器| 国产黄色小视频在线观看| 3wmmmm亚洲av在线观看| 午夜福利在线观看免费完整高清在 | 午夜精品国产一区二区电影 | 12—13女人毛片做爰片一| 久久久久久久久中文| 最新在线观看一区二区三区| 日韩欧美三级三区| 亚洲av二区三区四区| 日韩大尺度精品在线看网址| 国产视频内射| 少妇猛男粗大的猛烈进出视频 | 麻豆av噜噜一区二区三区| 亚洲av第一区精品v没综合| 久久久久久伊人网av| 网址你懂的国产日韩在线| 一级毛片我不卡| 在线观看美女被高潮喷水网站| 国产 一区精品| 欧美+日韩+精品| 免费在线观看成人毛片| 亚洲最大成人av| 日本撒尿小便嘘嘘汇集6| 美女 人体艺术 gogo| 精品99又大又爽又粗少妇毛片| 国产aⅴ精品一区二区三区波| 国产亚洲精品av在线| 亚洲av二区三区四区| 国产高清视频在线播放一区| 久久久久久久久久黄片| 夜夜爽天天搞| 日本黄色片子视频| 免费无遮挡裸体视频| 久久久成人免费电影| 国产精品久久久久久av不卡| 天堂网av新在线| 老熟妇仑乱视频hdxx| 综合色av麻豆| 内地一区二区视频在线| 亚洲成人久久性| 亚洲熟妇熟女久久| 成年免费大片在线观看| 日韩,欧美,国产一区二区三区 | 亚洲欧美精品自产自拍| 91久久精品国产一区二区三区| 99热这里只有是精品在线观看| 日韩成人伦理影院| 99热网站在线观看| 国产中年淑女户外野战色| 色5月婷婷丁香| 一级a爱片免费观看的视频| 丝袜美腿在线中文| 最近最新中文字幕大全电影3| 国产精品一区二区性色av| 国产成人福利小说| 欧美极品一区二区三区四区| 精品一区二区三区人妻视频| 一级毛片久久久久久久久女| 直男gayav资源| 久久久久国产精品人妻aⅴ院| av在线观看视频网站免费| 校园人妻丝袜中文字幕| 亚洲在线自拍视频| 日韩精品青青久久久久久| 校园人妻丝袜中文字幕| 在线播放国产精品三级| 国产成人精品久久久久久| 女生性感内裤真人,穿戴方法视频| 午夜激情福利司机影院| 人人妻人人澡人人爽人人夜夜 | 国产单亲对白刺激| 黄色一级大片看看| 国产成年人精品一区二区| 老司机影院成人| 久久久欧美国产精品| 久久人人精品亚洲av| 卡戴珊不雅视频在线播放| 乱码一卡2卡4卡精品| 12—13女人毛片做爰片一| 嫩草影院精品99| 人妻久久中文字幕网| 欧美区成人在线视频| 有码 亚洲区| 欧美3d第一页| 国产极品精品免费视频能看的| 久久久久久国产a免费观看| 夜夜夜夜夜久久久久| 一个人看的www免费观看视频| 欧美精品国产亚洲| 欧美成人精品欧美一级黄| 精品不卡国产一区二区三区| 嫩草影院精品99| 九九爱精品视频在线观看| 两个人的视频大全免费| 日日干狠狠操夜夜爽| av黄色大香蕉| 欧美日韩在线观看h| 18禁在线无遮挡免费观看视频 | 听说在线观看完整版免费高清| 啦啦啦啦在线视频资源| 你懂的网址亚洲精品在线观看 | 99热只有精品国产| 桃色一区二区三区在线观看| 一级黄色大片毛片| 黄色视频,在线免费观看| 别揉我奶头 嗯啊视频| 日韩欧美 国产精品| 18禁在线播放成人免费| 久久久久久久亚洲中文字幕| 91av网一区二区| 午夜福利视频1000在线观看| 国产成人一区二区在线| 亚州av有码| 国产视频内射| 麻豆久久精品国产亚洲av| 欧美性感艳星| 淫妇啪啪啪对白视频| 国产三级在线视频| 日韩中字成人| 给我免费播放毛片高清在线观看| 国产成人freesex在线 | 国产毛片a区久久久久| 国产精品一区二区三区四区久久| 老司机午夜福利在线观看视频| 国产精品久久久久久久电影| 国产黄色小视频在线观看| 国产精品永久免费网站| 欧美又色又爽又黄视频| 久久午夜亚洲精品久久| 熟妇人妻久久中文字幕3abv| 亚洲av成人av| 国产精品久久久久久久久免| 精品一区二区三区人妻视频| 免费人成视频x8x8入口观看| 91在线观看av| 精品久久久久久久久av| 国产综合懂色| 18禁黄网站禁片免费观看直播| 日本欧美国产在线视频| 伊人久久精品亚洲午夜| 亚洲熟妇中文字幕五十中出| 精品久久久久久成人av| 国产三级在线视频| 国产人妻一区二区三区在| 亚洲av五月六月丁香网| 我要搜黄色片| 小蜜桃在线观看免费完整版高清| 国产成年人精品一区二区| 性欧美人与动物交配| 亚洲第一区二区三区不卡| 校园人妻丝袜中文字幕| 一级毛片aaaaaa免费看小| 久久精品国产自在天天线| 在线免费十八禁| 色综合色国产| 免费观看人在逋| 国内精品久久久久精免费| 一级a爱片免费观看的视频| 99在线视频只有这里精品首页| 少妇熟女aⅴ在线视频| 国产男人的电影天堂91| 极品教师在线视频| 亚洲av中文av极速乱| 99热这里只有是精品在线观看| 国产精品亚洲一级av第二区| av视频在线观看入口| 欧美最黄视频在线播放免费| 99久久中文字幕三级久久日本| 欧美3d第一页| 国产精品久久久久久亚洲av鲁大| 男人和女人高潮做爰伦理| 国内精品一区二区在线观看| 国产精品精品国产色婷婷| 又黄又爽又刺激的免费视频.| 久久人人精品亚洲av| 久久久色成人| 国产白丝娇喘喷水9色精品| a级毛片a级免费在线| 久久精品国产鲁丝片午夜精品| 久久久午夜欧美精品| 亚洲欧美清纯卡通| 黄色配什么色好看| 免费观看人在逋| 欧美潮喷喷水| 亚州av有码| 成人亚洲精品av一区二区| 天天躁夜夜躁狠狠久久av| 性色avwww在线观看| 欧美绝顶高潮抽搐喷水| 男女边吃奶边做爰视频| 尤物成人国产欧美一区二区三区| 少妇丰满av| 少妇人妻精品综合一区二区 | 97碰自拍视频| 亚洲国产色片| 中文亚洲av片在线观看爽| 一夜夜www| 看片在线看免费视频| 国产精品av视频在线免费观看| 99热这里只有是精品在线观看| av在线蜜桃| 六月丁香七月| 99久久九九国产精品国产免费| 噜噜噜噜噜久久久久久91| 亚洲在线观看片| 一区福利在线观看| 91精品国产九色| 午夜福利高清视频| 亚洲欧美中文字幕日韩二区| 国产精品久久久久久久电影| 一边摸一边抽搐一进一小说| 亚洲av二区三区四区| 99九九线精品视频在线观看视频| 人人妻人人看人人澡| 深夜精品福利| 国产在线精品亚洲第一网站| 美女黄网站色视频| 中文在线观看免费www的网站| av国产免费在线观看| 在线免费观看不下载黄p国产| 夜夜看夜夜爽夜夜摸| 卡戴珊不雅视频在线播放| av在线亚洲专区| 国产精品三级大全| 日韩一区二区视频免费看| 亚洲av.av天堂| 人妻久久中文字幕网| 免费看a级黄色片| 国产片特级美女逼逼视频| 日本成人三级电影网站| 久久韩国三级中文字幕| 老熟妇乱子伦视频在线观看| 卡戴珊不雅视频在线播放| 久久久久免费精品人妻一区二区| 我要看日韩黄色一级片| 亚洲精华国产精华液的使用体验 | 可以在线观看的亚洲视频| 亚洲电影在线观看av| 嫩草影院入口| 国语自产精品视频在线第100页| 综合色丁香网| 伊人久久精品亚洲午夜| 深爱激情五月婷婷| 国产伦在线观看视频一区| 成人特级av手机在线观看| 黄色欧美视频在线观看| 亚洲国产欧洲综合997久久,| 亚洲国产精品国产精品| 日韩欧美一区二区三区在线观看| 亚洲第一电影网av| 99热网站在线观看| 国产aⅴ精品一区二区三区波| 男女做爰动态图高潮gif福利片| 欧美成人精品欧美一级黄| 欧美一区二区精品小视频在线| 亚洲av第一区精品v没综合| 午夜久久久久精精品| 久久久久久九九精品二区国产| 两个人视频免费观看高清| 日日摸夜夜添夜夜添av毛片| 黄色视频,在线免费观看| 真人做人爱边吃奶动态| 国国产精品蜜臀av免费| 午夜视频国产福利| 中文字幕熟女人妻在线| 日日摸夜夜添夜夜添av毛片| 淫秽高清视频在线观看| 中文资源天堂在线| 舔av片在线| 天堂av国产一区二区熟女人妻| 国产成年人精品一区二区| 国产aⅴ精品一区二区三区波| 久久99热这里只有精品18| 亚洲av电影不卡..在线观看| 热99在线观看视频| 久久精品国产亚洲av天美| 在线观看一区二区三区| 别揉我奶头 嗯啊视频| 午夜a级毛片| 成人亚洲精品av一区二区| 一级a爱片免费观看的视频| 成人鲁丝片一二三区免费| 欧美日本亚洲视频在线播放| 在线看三级毛片| 日韩av不卡免费在线播放| 乱系列少妇在线播放| 91久久精品电影网| 国产精品美女特级片免费视频播放器| 日韩av不卡免费在线播放| 亚洲成人久久爱视频| ponron亚洲| 精品人妻熟女av久视频| 国产三级中文精品| 啦啦啦啦在线视频资源| 看非洲黑人一级黄片| 女的被弄到高潮叫床怎么办| 男女做爰动态图高潮gif福利片| 亚洲精品乱码久久久v下载方式| 日韩精品有码人妻一区| 又爽又黄a免费视频| 日韩欧美一区二区三区在线观看| av黄色大香蕉| 精品午夜福利在线看| 男女那种视频在线观看| 国产黄a三级三级三级人| 青春草视频在线免费观看| 亚洲熟妇中文字幕五十中出| 免费一级毛片在线播放高清视频| 一级毛片电影观看 | 国产精品一二三区在线看| 蜜臀久久99精品久久宅男| 少妇熟女欧美另类| 国产真实伦视频高清在线观看| 美女高潮的动态| 欧美日韩在线观看h| 老司机午夜福利在线观看视频| 一级a爱片免费观看的视频| 晚上一个人看的免费电影| 国产精品无大码| 中出人妻视频一区二区| 久久精品国产自在天天线| 亚洲久久久久久中文字幕| 99久久精品热视频| 精品一区二区三区av网在线观看| 亚洲国产欧美人成| 成人永久免费在线观看视频| 狠狠狠狠99中文字幕| 国产白丝娇喘喷水9色精品| 精品久久久久久久末码| 永久网站在线| 美女 人体艺术 gogo| 日产精品乱码卡一卡2卡三| 美女高潮的动态| 亚洲成人中文字幕在线播放| 色尼玛亚洲综合影院| 国产精品一及| 精品国内亚洲2022精品成人| 露出奶头的视频| 亚洲,欧美,日韩| 成人午夜高清在线视频| 国产视频一区二区在线看| 久久九九热精品免费| 成人av一区二区三区在线看| 97超级碰碰碰精品色视频在线观看| 国产一区二区三区av在线 | 看十八女毛片水多多多| 免费观看的影片在线观看| 精品一区二区三区视频在线观看免费| 国产美女午夜福利| 深夜a级毛片| 免费黄网站久久成人精品| 精品人妻视频免费看| 一卡2卡三卡四卡精品乱码亚洲| 午夜a级毛片| 一本精品99久久精品77| 哪里可以看免费的av片| 亚洲无线观看免费| 天天躁日日操中文字幕| 亚洲国产高清在线一区二区三| 麻豆国产av国片精品| 91午夜精品亚洲一区二区三区| 国产亚洲欧美98| 亚洲自拍偷在线| 欧美丝袜亚洲另类| 国产一区二区在线观看日韩| 老师上课跳d突然被开到最大视频| 日韩欧美三级三区| 久久久久久久久中文| 少妇裸体淫交视频免费看高清| 免费看光身美女| 欧美成人a在线观看| 熟女电影av网| 热99re8久久精品国产| 日韩欧美精品v在线| 欧美另类亚洲清纯唯美| 亚洲自偷自拍三级| 国产精品不卡视频一区二区| 日韩av在线大香蕉| 在线观看66精品国产| 好男人在线观看高清免费视频| 此物有八面人人有两片| 女的被弄到高潮叫床怎么办| 成人亚洲精品av一区二区| 亚洲真实伦在线观看| 成熟少妇高潮喷水视频| 国产一区亚洲一区在线观看| 国产精品不卡视频一区二区| 毛片一级片免费看久久久久| 悠悠久久av| 少妇熟女欧美另类| 热99在线观看视频| 青春草视频在线免费观看| 国产精品精品国产色婷婷| 少妇高潮的动态图| 欧美色视频一区免费| 亚洲精品一区av在线观看| 特大巨黑吊av在线直播| 亚洲自偷自拍三级| 91狼人影院| 久久天躁狠狠躁夜夜2o2o| 两个人的视频大全免费| 欧美中文日本在线观看视频| 国产成人91sexporn| 可以在线观看毛片的网站| 我要看日韩黄色一级片| 欧美最新免费一区二区三区| 午夜爱爱视频在线播放| 婷婷色综合大香蕉| 精品久久久噜噜| 听说在线观看完整版免费高清| 精品福利观看| 久久久国产成人免费| 欧美日韩在线观看h| 亚洲第一电影网av| 欧美一区二区国产精品久久精品| 国产精品一区二区三区四区免费观看 | 国产精品野战在线观看| 狠狠狠狠99中文字幕| av.在线天堂| 中文字幕精品亚洲无线码一区| 看非洲黑人一级黄片| 亚洲在线观看片| 18禁在线播放成人免费| 插逼视频在线观看| 在线看三级毛片| 日韩制服骚丝袜av| 少妇的逼水好多| 一区二区三区四区激情视频 | 天堂√8在线中文| 色5月婷婷丁香| 国模一区二区三区四区视频| 欧美+亚洲+日韩+国产| 国产亚洲欧美98| 国产精品福利在线免费观看| 国产单亲对白刺激| 日韩三级伦理在线观看| 亚洲欧美成人精品一区二区| 成人漫画全彩无遮挡| 亚洲国产日韩欧美精品在线观看| 一个人观看的视频www高清免费观看| 我的老师免费观看完整版| 国产单亲对白刺激| 日本精品一区二区三区蜜桃| av在线亚洲专区| 99riav亚洲国产免费| 人人妻,人人澡人人爽秒播| 日本三级黄在线观看| 国产一区二区激情短视频| 看免费成人av毛片| 亚洲欧美日韩高清专用| 美女免费视频网站| 青春草视频在线免费观看| 亚洲av第一区精品v没综合| 精品一区二区三区视频在线观看免费| 亚洲一区高清亚洲精品| 国产成年人精品一区二区| 国产成人一区二区在线| 久久国内精品自在自线图片| 国产真实伦视频高清在线观看| 十八禁国产超污无遮挡网站| 在线观看美女被高潮喷水网站| 夜夜看夜夜爽夜夜摸| 最新在线观看一区二区三区| 亚洲av免费在线观看| 搡老熟女国产l中国老女人| 日韩高清综合在线| 亚洲乱码一区二区免费版| 精品人妻一区二区三区麻豆 | 免费人成在线观看视频色| 亚洲七黄色美女视频| 国产免费一级a男人的天堂| 亚洲精品456在线播放app| 国产男人的电影天堂91| 久久久久国产网址| 亚洲国产精品成人久久小说 | 一区二区三区免费毛片| av天堂在线播放| 级片在线观看| 亚洲av一区综合| 午夜福利在线观看免费完整高清在 | 亚洲第一电影网av| 我要看日韩黄色一级片| 你懂的网址亚洲精品在线观看 | 99热6这里只有精品| 国产成人91sexporn| 日日摸夜夜添夜夜添av毛片| 给我免费播放毛片高清在线观看| 一级a爱片免费观看的视频| 联通29元200g的流量卡| 男女视频在线观看网站免费| 人人妻,人人澡人人爽秒播| 国产又黄又爽又无遮挡在线| 久久久久久久午夜电影| 日本成人三级电影网站| 女人被狂操c到高潮| 亚洲熟妇中文字幕五十中出| 国产精品一区二区三区四区免费观看 | h日本视频在线播放| 51国产日韩欧美| 久久精品国产清高在天天线| 国产精品亚洲美女久久久| 久久久色成人| 精品国产三级普通话版| 看黄色毛片网站| 最近手机中文字幕大全| www日本黄色视频网| 真人做人爱边吃奶动态| 国产成人影院久久av| 国产一区二区三区av在线 | 亚洲激情五月婷婷啪啪| 国产综合懂色| 狠狠狠狠99中文字幕| 久久精品人妻少妇| 国产大屁股一区二区在线视频| 精品免费久久久久久久清纯| 日本免费一区二区三区高清不卡| 尤物成人国产欧美一区二区三区| 一级毛片久久久久久久久女| 悠悠久久av| 色尼玛亚洲综合影院| 日韩欧美免费精品| 国产高潮美女av| 精品久久久久久久久久久久久| 深爱激情五月婷婷| 国产高潮美女av| 亚洲第一电影网av| 日韩成人av中文字幕在线观看 | 晚上一个人看的免费电影| 国产精品日韩av在线免费观看| 国产老妇女一区| 亚洲精品456在线播放app| 97在线视频观看| 成人特级黄色片久久久久久久| 午夜福利成人在线免费观看| 亚洲最大成人av| 我的老师免费观看完整版| 国产精品永久免费网站| 校园人妻丝袜中文字幕| 久久精品人妻少妇| 亚洲av成人精品一区久久| 免费人成视频x8x8入口观看| 国产男靠女视频免费网站| 大又大粗又爽又黄少妇毛片口| 久久天躁狠狠躁夜夜2o2o| 国产一区二区三区av在线 | 亚洲真实伦在线观看|