• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    FitenBLAS:面向FT1000微處理器的高性能線性代數(shù)庫

    2015-05-29 18:29:58遲利華劉杰晏益慧謝林川甘新標
    湖南大學學報·自然科學版 2015年4期
    關鍵詞:性能優(yōu)化

    遲利華 劉杰 晏益慧 謝林川 甘新標 胡慶豐 蔣杰 李勝國

    摘 要:BLAS庫是基本線性代數(shù)子程序庫,是許多大型科學與工程計算的核心計算程序,F(xiàn)itenBLAS庫是在多核多線FT1000微處理器上開發(fā)的基本線性代數(shù)庫,其研制對FT1000微處理器在科學與工程計算中的應用具有重要意義.根據(jù)多級存儲結構和寄存器的數(shù)目,設計了向量與向量、矩陣與向量和矩陣與矩陣運算的多級循環(huán)展開方法,采用指令調度、數(shù)據(jù)預取等通用優(yōu)化技術,優(yōu)化BLAS庫串行程序.對于BLAS3子程序,設計了矩陣乘無冗余數(shù)據(jù)拷貝分塊算法,采用指令重排、訪存與計算的重疊、分塊等技術優(yōu)化矩陣乘子程序,基于矩陣乘子程序實現(xiàn)了其他BLAS3子程序.研制了匯編線性代數(shù)程庫FitenBLAS,其核心子程序矩陣乘的雙精度計算性能達到6.91Gflops,是峰值性能的86.4%.

    關鍵詞:FT1000微處理器;BLAS庫;性能優(yōu)化

    中圖分類號:TP332.2 文獻標識碼:A

    基本線性代數(shù)子程序BLAS(Basic Linear Algebra Subroutines)庫,提供最基本的線性代數(shù)函數(shù)接口[1],分為三級:BLAS 1(Level 1)包括向量與向量操作子程序,如點積、向量相加等.BLAS 2(Level 2)包括矩陣與向量操作子程序,如矩陣向量相乘等.BLAS 3(Level 3)包括矩陣與矩陣操作子程序,如矩陣與矩陣相乘等.

    BLAS庫是每款微處理器要移植和優(yōu)化的數(shù)學庫,是許多大型科學與工程計算的核心計算模塊,同時BLAS庫子程序可以反映許多應用程序的計算特點,如果BLAS庫可以在微處理器上獲得高性能,同樣的應用程序也可以獲得好的性能,BLAS庫程序可以驗證微處理器的功能和計算性能.因此各個廠家在新型號微處理器推出時,都會配套針對微處理器特點研制、優(yōu)化和推出高性能BLAS庫,BLAS庫已經(jīng)成為微處理器的必備數(shù)學庫之一.

    湖南大學學報(自然科學版)2015年

    第4期遲利華等:FitenBLAS:面向FT1000微處理器的高性能線性代數(shù)庫

    Intel公司針對通用CPU開發(fā)了MKL基本數(shù)學運算庫[2],包含采用多線程進行并行計算的函數(shù)庫,可以在結點內實現(xiàn)高性能;AMD公司針對通用CPU開發(fā)了ACML基本數(shù)學運算庫[3],具有MKL類似的特點;IBM公司開發(fā)了ESSL基本數(shù)學運算庫[4].上述廠商開發(fā)的基本數(shù)學運算庫,均包含了使用匯編語言手工優(yōu)化的高性能BLAS庫.GotoBLAS[5-6]是開源的針對不同類型的微處理器開發(fā)的BLAS庫,提供了OpenMP多線程并行版本,是性能最好的BLAS庫之一,2008后不再更新,不支持最新推出的微處理器;ATLAS[7-8]針對不同的微處理器提供可以自動優(yōu)化的BLAS庫.OpenBLAS是針對龍芯等微處理器開發(fā)的高性能BLAS庫[9-10].

    FT1000是由國防科學技術大學研制的單芯片多線程(CMT)處理器,是天河1A計算結點采用的微處理器之一[11].BLAS庫在FT1000上獲得高性能是需要研究的重要問題,目前沒有可以在FT1000上運行的高性能BLAS庫,本文結合FT1000多核多線微處理器特點,設計了并行計算方法和數(shù)據(jù)結構,研制了手工匯編子程序,進行了針對性的性能優(yōu)化,研制了高性能線性代數(shù)庫FitenBLAS.

    1 FT1000微處理器

    FT1000微處理器包含8個處理器核,每核包含8套硬件現(xiàn)場,支持8個線程.每個線程有1個完整的寄存器文件,大部分ASI,ASR和特權寄存器都是每個線程1份.

    每個核包含2條整數(shù)流水線、1條浮點流水線和1條存儲流水線.8個線程共享浮點流水線和存儲流水線.8個線程分成2組,每組4個線程,共享1條整數(shù)流水線.雖然8個線程同時運行,但是在任意時刻,最多兩個線程是活躍的,這兩個線程發(fā)射的指令只可能是下面的組合:1對整數(shù)操作、1個整數(shù)和1個浮點、1個整數(shù)和1個存儲、1個浮點和1個存儲.每個組內的線程按照LRU算法每個周期進行切換.

    每個核內有獨立的一級數(shù)據(jù)cache和一級指令cache.L1I Cache大小為 16 kB,8路組相聯(lián),塊大小32字節(jié).L1D Cache大小為8 kB,4路組相聯(lián),塊大小32字節(jié).指令TLB為64項全相聯(lián),數(shù)據(jù)TLB為128項全相聯(lián).8個線程共享L1I,L1D和TLB,通過TLB中的自動釋放機制使多個線程更新TLB.

    FT1000微處理器采用SPARC V9指令集,現(xiàn)有的BLAS線性代數(shù)庫不能直接運行,需要重新設計.

    2 程序優(yōu)化方法

    2.1 循環(huán)展開方法

    循環(huán)展開可以減少循環(huán)體的循環(huán)次數(shù),減少分支執(zhí)行的時間,為流水線提供更多的并行機會,是一種通用的程序優(yōu)化方法,是手工匯編優(yōu)化BLAS子程序的主要方法.在循環(huán)展開中,展開因子的選擇是核心問題,目前的編譯器一般只對循環(huán)體很小的循環(huán)進行循環(huán)展開,且使用的展開因子是很小的常數(shù),這可能損失一些計算性能,特別是對于多層嵌套循環(huán),編譯器的優(yōu)化效果不明顯,只能采用手工的循環(huán)展開優(yōu)化.

    BLAS 1(Level 1)包括向量與向量操作子程序,包含SUM,DOT,AXPY,COPY,SCAL等子程序.當跨步為1時,BLAS1程序中的計算操作針對一維數(shù)據(jù)進行連續(xù)訪問,具有良好的空間數(shù)據(jù)局部性,可以采用手工循環(huán)展開來優(yōu)化性能.采用匯編編程時寄存器的數(shù)目限制了展開次數(shù),為此,本文根據(jù)寄存器的數(shù)目進行多級展開,展開因子可以隨意調節(jié),在展開循環(huán)體內,循環(huán)使用寄存器.以AXPY為例來說明多級展開方法,圖1給出了多級展開循環(huán)體,雙精度浮點寄存器的數(shù)目為n,涉及2個向量運算,平均使用向量寄存器,每個向量使用的寄存器最大數(shù)目為n/2,循環(huán)展開因子可以取為m“*”n/2.ldd,fmuld,faddd和std是匯編指令,分別表示取數(shù)、相乘、相加和存數(shù).為了表示方便,圖1中使用了循環(huán)控制變量,在實際展開的循環(huán)體中,沒有循環(huán)控制變量,而將圖1中的循環(huán)體重復m“*”n/2次.

    AXPY使用寄存器的多級展開循環(huán)體:

    根據(jù)寄存器數(shù)目,圖1中給出的是AXPY多級循環(huán)展開的一般方法,BLAS1其它子程序中可以根據(jù)圖1中給出的展開方法,進行多級循換展開.針對FT1000微處理器,雙精度寄存器數(shù)目為32,對于AXPY子程序,每個向量至多使用16個寄存器.使用16個寄存器時,循環(huán)展開因子就是16的倍數(shù),同樣地循環(huán)展開因子可以是12,13,14和15等數(shù)的倍數(shù),可以根據(jù)實際測試情況,進行調整,以找到最佳的循環(huán)展開因子.

    BLAS2包括矩陣與向量操作子程序,如矩陣向量乘、rank1和rank2矩陣校正等,涉及二維數(shù)組A和一維數(shù)組x和y間的計算操作,計算結果為一個一維數(shù)組.以矩陣向量乘GEMV子程序為例進行說明,為了復用一維數(shù)組x,對數(shù)組x進行分段,對數(shù)組A進行分塊.在分配寄存器時,二維數(shù)組A,一維數(shù)組x和y以及保存臨時變量的一維數(shù)組z給分配寄存器總數(shù)的1/4.針對FT1000微處理器,雙精度寄存器數(shù)目為32,對于GEMV子程序,數(shù)組A至多使用8個寄存器,一維數(shù)組x和y分別使用8個寄存器.使用8個寄存器時,循環(huán)展開因子就是8的倍數(shù),同樣地循環(huán)展開因子可以是4,5,6和7等數(shù)的倍數(shù),可以根據(jù)實際測試情況,進行調整,以找到最佳的循環(huán)展開因子.圖2給出了BLAS2子程序GEMV多級展開循環(huán)體.

    BLAS 3(Level 3)包括矩陣與矩陣操作子程序,包含GEMM,SYMM,SYRK,SYR2K,TRMM和TRSM等子程序.矩陣乘GEMM子程序是BLAS3的核心,其它BLAS3子程序可以基于GEMM來實現(xiàn).下面以GEMM子程序為例來進行說明.所要求解的矩陣乘形式如下:

    C=βC+αA×B

    其中A∈Rm×k,B∈Rk×n,C∈Rm×n,α和β是實數(shù).

    矩陣乘在多級存儲結構上獲得高性能的基本方法是分塊算法,將A,B和C劃分成如下子矩陣:

    原矩陣乘算法轉化為多個子矩陣相乘,根據(jù)Cache和TLB的大小來選擇子矩陣的大小.具體實現(xiàn)時選取Aip的大小為L2 Cache大小的一半,同時保證不發(fā)生TLB失效,并駐留在二級Cache中,直到不再使用為止,即完成如下操作:

    Ci,0…Ci,N-1=Ai,p×

    Bp,0,…,Bp,N-1.

    計算時,子矩陣Bp,j(j=1,…,N)以流水的方式進入L1D Cache.Ci,j的數(shù)據(jù)不重用,不必長時間保存在L1D和L2 Cache中.

    把寄存器總數(shù)的一半分配給矩陣C使用,另一半寄存器被矩陣A,矩陣B和臨時變量平均使用.針對FT1000微處理器,雙精度寄存器數(shù)目為32,對于GEMM子程序,數(shù)組C至多使用16個寄存器,數(shù)組A和B分別使用4個寄存器,剩下的作為臨時變量寄存器使用.圖3給出了BLAS3子程序GEMM按照4*4*4展開的循環(huán)體.

    通過指令的合理調度、數(shù)據(jù)的預取和寄存器的合理使用,當Ai,p,Bp,j和Ci,j在Cache中時,可以發(fā)揮CPU的峰值性能.

    2.2 數(shù)據(jù)預取

    矩陣和向量是存放于內存中的,計算過程中,通過多級存儲結構,將數(shù)據(jù)取到寄存器中開始運算,數(shù)據(jù)的預取可以很好地實現(xiàn)數(shù)據(jù)傳輸和計算的重疊,是提高數(shù)據(jù)空間局部性的性能優(yōu)化方法.開始執(zhí)行計算時,參與運算的矩陣和向量存放在內存中,開始的取數(shù)不會命中Cache,F(xiàn)T1000上從內存中取數(shù)到二級Cache的延遲大于100拍(即100個CPU時鐘周期),Cache塊大小為32字節(jié),每次內存訪問,同時會把內存中連續(xù)的32字節(jié)分別存放到二級Cache和一級數(shù)據(jù)Cache中.

    數(shù)據(jù)預取就是將后面要用的數(shù)據(jù)提前取到L2 Cache中,將訪存的數(shù)據(jù)傳輸操作和乘加計算操作重疊起來,如果計算時間大于數(shù)據(jù)傳輸時間,那么整個計算就可以得到CPU的峰值性能,如矩陣相乘.通過參數(shù)可以調整數(shù)據(jù)預取的間隔,獲得最佳性能.

    BLAS1,BLAS2和BLAS3均用到數(shù)據(jù)預取,本文僅以雙精度AXPY為例來說明數(shù)據(jù)預取方法,圖4給出了帶數(shù)據(jù)預取的展開循環(huán)體.

    AXPY帶數(shù)據(jù)預取的展開循環(huán)體:

    令k=8,PREFECHSIZE=8,SIZE=8

    循環(huán)展開因子為m*8

    數(shù)組a(*)、b(*)和c(*)表示不同的寄存器

    for i ← 0 to m*8 step 8 do

    for j ← 0 to 4 do

    ldd x[m*i+j], a[j];

    fmuld a[j], alpha, a[j];

    ldd y[m*i+j], b[j];

    faddd a[j], b[j], b[j];

    std b[j], y[m*i+j];

    endfor

    prefetch [&x[m*i]+PREFETCHSIZE * SIZE], 0

    prefetch [&y[m*i]+PREFETCHSIZE * SIZE], 0

    for j ← 5 to 8 do

    ldd x[m*i+j], a[j];

    fmuld a[j], alpha, a[j];

    ldd y[m*i+j], b[j];

    faddd a[j], b[j], b[j];

    std b[j], y[m*i+j];

    endfor

    prefetch [&x[m*i+4]+PREFETCHSIZE * SIZE], 0

    prefetch [&y[m*i+4]+PREFETCHSIZE * SIZE], 0

    endfor

    圖4 BLAS1子程序AXPY帶數(shù)據(jù)預取的展開循環(huán)體

    Fig.4 Multilevel loop unrolling with the prefetching

    data for subroutine AXPY of BLAS1

    FT1000通過預取指令對內存數(shù)據(jù)進行操作,SIZE表示一個數(shù)據(jù)所占的內存字節(jié)數(shù),PREFECHSIZE表示提前預取數(shù)據(jù)間隔,可以根據(jù)需要改變大小.圖4中,預取的數(shù)據(jù)提供給下一次循環(huán)體使用,將數(shù)據(jù)從內存中,取到二級Cache中,預取數(shù)的時間和圖4中的兩個小循環(huán)進行時間重疊,用計算重疊數(shù)據(jù)傳輸.

    3 多線程并行計算方法

    對BLAS1采用向量一維平均劃分的方式組織并行計算.對BLAS2中涉及的二維矩陣采用按行或按列一維劃分.對BLAS3中涉及的二維矩陣采用按行和按列二維劃分.

    下面重點對BLAS3中的矩陣乘并行計算方法展開討論.

    P 個線程按 pr×pc 劃分成二維拓撲結構, 滿足 P=pr×pc.假設 P(r, c) (0≤r

    多線程矩陣乘并行算法:

    全局數(shù)組

    局部數(shù)組 r,c,

    每一個線程P(r, c),其中 ,執(zhí)行:

    for i→r×mr to r×mr+mr do

    for l←0 to k-1 do

    第r行線程中的任一線程將子矩陣 拷貝到

    for j←c×nc to c×nc+nc do

    將ij拷貝到

    Call GEMM_kernel(bm,bn,bk,,,ij, LDC)

    end for

    end for

    end for

    圖5 避免重復拷貝A子矩陣的多線程矩陣乘并行算法

    Fig.5 Multithread parallel matrix multiplication

    algorithm avoiding the redundant packing of A

    BLAS3中的SYMM,SYR2K,SYRK,TRMM和TRSM子程序并行算法均基于GEMM實現(xiàn),參考文獻\[12\].

    4 性能測試與分析

    測試環(huán)境的硬件平臺為8核FT1000微處理器,主頻為1 GHz,雙精度浮點性能8Gflops.操作系統(tǒng)為銀河麒麟操作系統(tǒng),編譯器為gcc-4.5.1.

    圖6給出了BLAS1的雙精度性能測試結果,固定向量的長度n不變,統(tǒng)一取為256 000 000.從圖6可以看出,從1線程到8線程各BLAS1程序具有明顯的加速效果,各程序在16或32線程時,達到最高性能,64線程時性能略有下降.造成32或64線程性能下降的主要原因是:1)BLAS1程序的計算訪存比是1或2,受限于訪存;2)BLAS1程序訪存有空間局部性,沒有時間局部性,也就是不存在數(shù)據(jù)的復用;3)FT1000微處理器的訪存帶寬在16或32線程時達到最大.

    No of threads

    圖6 BLAS1不同線程數(shù)性能測試結果(n=256 000 000)

    Fig.6 Computation performance for BLAS1

    on difference number of threads(n=256 000 000)

    圖7給出了BLAS2的雙精度性能測試結果,固定矩陣的長度n不變,統(tǒng)一取為16 000.從圖7可以看出,浮點性能明顯高于BLAS1的性能,性能最好的SYMV在64線程時達到最高性能,3.11Gflops/s,是峰值性能的38.8%,SYMV的計算訪存比是6,存在空間和時間局部性.BLAS2中的其他子程序的計算訪存比是3,只有空間局部性,不存在時間局部性.

    No of threads

    圖7 BLAS2不同線程數(shù)性能測試結果(n=16 000)

    Fig.7 Computation performance for BLAS2

    on difference number of threads(n=16 000)

    BLAS3雙精度浮點性能測試結果由圖8給出,由于BLAS3的計算訪存比大,對于階為N的方陣,計算量為2N3,訪存量為3N2,在64線程時獲得最高性能,對不同的計算規(guī)模展開測試.從圖8中可以看出,矩陣乘GEMM的最高性能達到6.91Gflops,是峰值性能的86.4%.SYMM,SYR2K,SYRK,TRMM和TRSM子程序的最高性能分別達到6.75,6.73,6.74,6.75和6.69Gflops,和矩陣乘GEMM的性能接近.

    影響矩陣乘GEMM性能的主要因素包括:1)數(shù)據(jù)拷貝開銷.為了充分發(fā)揮多級Cache的性能,采用了分塊算法,分塊子矩陣在內存中的存儲是不連續(xù)的,為了減少對TLB沖突,需要將矩陣A和B的數(shù)據(jù)預先拷貝到一個連續(xù)的內存空間.2)數(shù)據(jù)延遲時間.每個子矩陣塊相乘前,每個線程需要進行數(shù)據(jù)的填充,數(shù)據(jù)需要從內存中傳輸?shù)絃2 Cache,從L2 Cache到L1 Cache,從L1 Cache到寄存器,每個數(shù)據(jù)大概需要150拍,150拍過后,每拍可以取一個雙精度數(shù)據(jù).3)數(shù)據(jù)對存儲帶寬的競爭.64線程并行計算時,需要同時從內存中取數(shù),數(shù)據(jù)帶寬成為影響性能的因素.4)計算不能全覆蓋數(shù)據(jù)的存取.FT1000微處理器中每核啟動8線程,8線程共享一套硬件計算資源,靠多線程的切換來屏蔽訪存延遲.這種情況主要存在每個循環(huán)展開啟動階段,8線程需要同時取數(shù),此外循環(huán)展開計算完成后,需要把計算結果保存到矩陣C中,此時存取數(shù)據(jù)量和計算量處于相同量級.

    M=N=K

    圖8 BLAS3不同計算規(guī)模性能測試結果(64線程)

    Fig.8 Computation performance

    of difference scale of matrixes on 64 threads

    相對于其他X86微處理器,F(xiàn)T1000是多核多線體系結構,每8線程共享一個計算核,通過線程切換來屏蔽訪存延遲,相對而言更難發(fā)揮其峰值性能,我們認為矩陣乘GEMM雙精度能發(fā)揮峰值性能的86.4%已經(jīng)是能達到的最好浮點性能.

    5 結論與展望

    提煉共性基礎數(shù)值算法,研制高性能計算庫,統(tǒng)一編程接口,是用戶充分發(fā)揮微處理器峰值性能的重要手段.BLAS庫是基礎線性代數(shù)庫,需要根據(jù)CPU的具體特點,設計高性能的算法和數(shù)據(jù)結構,經(jīng)過高度的手工匯編優(yōu)化,其中的BLAS3可得到接近峰值的浮點性能,滿足用戶的性能要求.

    本文基于國防科學技術大學研制的多核多線FT1000微處理器,研制了基本線性代數(shù)匯編子程序庫FitenBLAS,根據(jù)寄存器的數(shù)目,設計了向量與向量、矩陣與向量、矩陣與矩陣運算的多級循環(huán)展開方法,采用計算指令流水線調度、數(shù)據(jù)預取等通用優(yōu)化技術,優(yōu)化BLAS庫串行程序.對于BLAS3子程序,設計了矩陣乘無冗余數(shù)據(jù)拷貝分塊算法,采用指令重排、訪存與計算的重疊、分塊等技術優(yōu)化矩陣乘子程序,基于矩陣乘子程序實現(xiàn)了其他BLAS3子程序.其核心子程序矩陣GEMM乘的雙精度計算性能達到6.91Gflops,是峰值性能的86.4%.

    下一步,面向短向量飛騰微處理器,研制支持向量優(yōu)化運算的BLAS庫,吸收并行編程框架底層調用的矩陣向量運算和稀疏線性數(shù)值算法,完善FitenBLAS庫,支持更加廣泛的數(shù)值模擬運算.

    參考文獻

    [1] DONGARRA J. Basic linear algebra subprograms technical forum standard [J]. International Journal of High Performance Applications and Supercomputing, 2002, 16(1): 1-111.

    [2] Intel MKL homepage. http://software.intel.com/zhcn/intelmkl/

    [3 AMD ACML homepage. http://developer.amd.com/cpu/ libraries/acml/

    [4] IBM ESSL homepage. http://www03.ibm.com/systems/software/essl/

    [5] GotoBLAS homepage. http://www.tacc.utexas.edu/taccprojects/gotoblas2

    [6] GOTO K, VAN DE GEIJN R. Anatomy of highperformance matrix multiplication [J]. ACM Transactions on Mathematical Software, 2008, 34(3): 1-25.

    [7] ATLAS homepage. http://mathatlas.sourceforge.net/

    [8] WHALEY R, PETITET A, DONGARRA J. Automated empirical optimizations of software and the ATLAS project [J]. Parallel Computing, 2001, 27(1): 3-35.

    [9] OpenBLAS homepage. http://xianyi.github.com/ OpenBLAS

    [10]張先軼,王茜,張云泉. OpenBLAS:龍芯3A CPU的高性能BLAS庫 [J]. 軟件學報, 2011, 22(zk2): 208-216.

    ZHANG Xianyi, WANG Qian, ZHANG Yunquan. OpenBLAS: a high performance BLAS library on Loongson 3A CPU [J]. Journal of Software, 2011, 22(zk2): 208-216. (In Chinese)

    [11]About FT1000 processor, http://www.nscctj.gov.cn/ resources/resource_1.asp, 2010-11-17.

    [12]GOTO K, VAN DE GEIJIN R. High performance implementation of the level3 BLAS[J]. ACM Transactions on Mathematical Software, 2008, 35(1): 1-14.

    猜你喜歡
    性能優(yōu)化
    大數(shù)據(jù)環(huán)境下高校選課系統(tǒng)性能優(yōu)化應用研究
    數(shù)據(jù)挖掘算法性能優(yōu)化的研究與應用
    SQL Server數(shù)據(jù)庫性能優(yōu)化的幾點分析
    Web應用的前端性能優(yōu)化
    660MW超超臨界火電機組RB性能優(yōu)化
    WEB網(wǎng)站緩存性能優(yōu)化
    淺析Lustre的優(yōu)化設置
    Oracle數(shù)據(jù)庫性能調整與優(yōu)化分析
    科技視界(2016年1期)2016-03-30 14:27:50
    基于節(jié)點緩存的Web服務器性能優(yōu)化研究
    基于SQL數(shù)據(jù)庫的性能優(yōu)化的探討
    科技資訊(2015年7期)2015-07-02 18:48:14
    99国产精品免费福利视频| 欧美日韩黄片免| 丁香六月欧美| 亚洲性夜色夜夜综合| 制服人妻中文乱码| 变态另类丝袜制服| 免费在线观看黄色视频的| 亚洲国产高清在线一区二区三 | 午夜福利视频1000在线观看 | 日韩欧美免费精品| 色播在线永久视频| 人成视频在线观看免费观看| 色av中文字幕| 国产主播在线观看一区二区| 久久久久久人人人人人| 亚洲午夜理论影院| 亚洲欧美激情在线| 亚洲国产欧美日韩在线播放| av视频免费观看在线观看| videosex国产| 一区在线观看完整版| 日本在线视频免费播放| e午夜精品久久久久久久| 午夜久久久久精精品| 女人爽到高潮嗷嗷叫在线视频| 色哟哟哟哟哟哟| 日韩精品免费视频一区二区三区| 久久中文看片网| 最近最新中文字幕大全免费视频| 亚洲一区高清亚洲精品| 搡老熟女国产l中国老女人| 亚洲国产欧美日韩在线播放| 黄色视频不卡| 国产极品粉嫩免费观看在线| 真人做人爱边吃奶动态| 伊人久久大香线蕉亚洲五| 88av欧美| 给我免费播放毛片高清在线观看| 中文字幕最新亚洲高清| 欧美激情 高清一区二区三区| 亚洲一码二码三码区别大吗| 成年版毛片免费区| 久久精品国产亚洲av香蕉五月| 日韩视频一区二区在线观看| 日韩一卡2卡3卡4卡2021年| 亚洲自拍偷在线| 亚洲无线在线观看| 国产成人av教育| 九色国产91popny在线| 亚洲午夜精品一区,二区,三区| 悠悠久久av| 国产欧美日韩一区二区三| 大型av网站在线播放| 夜夜夜夜夜久久久久| 黄色毛片三级朝国网站| 嫩草影视91久久| 长腿黑丝高跟| 国产麻豆成人av免费视频| 精品一区二区三区av网在线观看| 亚洲精品国产区一区二| АⅤ资源中文在线天堂| 国产麻豆成人av免费视频| 脱女人内裤的视频| 亚洲专区中文字幕在线| 国产精品自产拍在线观看55亚洲| 日韩一卡2卡3卡4卡2021年| 波多野结衣巨乳人妻| 悠悠久久av| 国产精品香港三级国产av潘金莲| 日日干狠狠操夜夜爽| 亚洲免费av在线视频| 色综合婷婷激情| ponron亚洲| 老汉色av国产亚洲站长工具| 国产熟女午夜一区二区三区| 99国产精品99久久久久| 最好的美女福利视频网| 极品教师在线免费播放| 婷婷丁香在线五月| 九色亚洲精品在线播放| 国产av一区二区精品久久| av网站免费在线观看视频| e午夜精品久久久久久久| 亚洲 欧美一区二区三区| 国产一区二区三区视频了| 黄片小视频在线播放| 国产成人影院久久av| 亚洲国产中文字幕在线视频| 变态另类成人亚洲欧美熟女 | 欧美 亚洲 国产 日韩一| 悠悠久久av| 亚洲熟妇熟女久久| 精品一区二区三区四区五区乱码| 欧美绝顶高潮抽搐喷水| 久久亚洲精品不卡| 禁无遮挡网站| 国产成人免费无遮挡视频| 成人av一区二区三区在线看| 国产精品自产拍在线观看55亚洲| 欧美激情久久久久久爽电影 | 国产精品永久免费网站| 在线观看www视频免费| 一进一出好大好爽视频| 99香蕉大伊视频| 国产99久久九九免费精品| 99久久久亚洲精品蜜臀av| 久久精品影院6| 一级作爱视频免费观看| 丁香六月欧美| 久久国产乱子伦精品免费另类| 久久久久久亚洲精品国产蜜桃av| 天天一区二区日本电影三级 | 精品第一国产精品| 每晚都被弄得嗷嗷叫到高潮| av在线天堂中文字幕| 在线av久久热| 久热爱精品视频在线9| 丰满的人妻完整版| 别揉我奶头~嗯~啊~动态视频| 欧美一级a爱片免费观看看 | 麻豆成人av在线观看| 在线观看免费视频网站a站| 夜夜爽天天搞| 国产成人av激情在线播放| 午夜两性在线视频| 成人免费观看视频高清| 自拍欧美九色日韩亚洲蝌蚪91| 欧美性长视频在线观看| 日韩欧美三级三区| 国产麻豆69| 亚洲av成人一区二区三| 亚洲少妇的诱惑av| 香蕉丝袜av| 成人三级做爰电影| 精品国产超薄肉色丝袜足j| 一二三四社区在线视频社区8| 欧美人与性动交α欧美精品济南到| 啦啦啦韩国在线观看视频| 自线自在国产av| 国产精品自产拍在线观看55亚洲| 日本在线视频免费播放| ponron亚洲| 国产精品爽爽va在线观看网站 | 欧美黄色淫秽网站| 女同久久另类99精品国产91| 变态另类丝袜制服| 桃色一区二区三区在线观看| 亚洲专区国产一区二区| 19禁男女啪啪无遮挡网站| 国产麻豆成人av免费视频| 国产伦一二天堂av在线观看| 午夜a级毛片| 国产精品久久视频播放| 男男h啪啪无遮挡| 久久久久久大精品| 欧美最黄视频在线播放免费| 伊人久久大香线蕉亚洲五| 国产成人精品在线电影| 成年人黄色毛片网站| 精品久久久久久久人妻蜜臀av | 在线播放国产精品三级| 久久久久久人人人人人| 亚洲av成人av| 首页视频小说图片口味搜索| 午夜两性在线视频| 久久中文字幕人妻熟女| 久99久视频精品免费| 嫁个100分男人电影在线观看| 免费高清视频大片| 国产精品香港三级国产av潘金莲| 国产日韩一区二区三区精品不卡| 国产亚洲欧美精品永久| 一本久久中文字幕| 色精品久久人妻99蜜桃| 亚洲五月天丁香| 视频在线观看一区二区三区| 十八禁人妻一区二区| 久久天躁狠狠躁夜夜2o2o| 久久精品91无色码中文字幕| 欧美成人一区二区免费高清观看 | 黄频高清免费视频| 亚洲欧美日韩高清在线视频| 两性午夜刺激爽爽歪歪视频在线观看 | 天堂影院成人在线观看| 亚洲av五月六月丁香网| 美女大奶头视频| 国产欧美日韩综合在线一区二区| 日韩欧美国产在线观看| 曰老女人黄片| 一级a爱片免费观看的视频| 国产精品自产拍在线观看55亚洲| 18禁黄网站禁片午夜丰满| 可以在线观看毛片的网站| 精品一区二区三区视频在线观看免费| 他把我摸到了高潮在线观看| 国产成人精品久久二区二区91| 中文字幕色久视频| 亚洲在线自拍视频| 国产精品国产高清国产av| 日韩成人在线观看一区二区三区| 中文字幕另类日韩欧美亚洲嫩草| av视频在线观看入口| 好男人在线观看高清免费视频 | 亚洲国产欧美日韩在线播放| 久久久久久免费高清国产稀缺| 免费av毛片视频| 午夜免费激情av| 久久热在线av| 欧美亚洲日本最大视频资源| 十八禁网站免费在线| 国产av精品麻豆| 十八禁人妻一区二区| av天堂久久9| 国产免费男女视频| 在线观看免费午夜福利视频| 国产成人一区二区三区免费视频网站| 亚洲欧美日韩高清在线视频| 欧美乱码精品一区二区三区| 久热爱精品视频在线9| 亚洲第一av免费看| 国产av精品麻豆| 99精品久久久久人妻精品| 国产一区二区三区综合在线观看| 19禁男女啪啪无遮挡网站| 欧美激情极品国产一区二区三区| 国产一区二区激情短视频| 成人手机av| 脱女人内裤的视频| 欧美一级a爱片免费观看看 | 国产三级黄色录像| 欧美日本中文国产一区发布| 成年人黄色毛片网站| 久久青草综合色| 久久精品91蜜桃| 免费在线观看完整版高清| 精品第一国产精品| 一区二区三区激情视频| 少妇被粗大的猛进出69影院| av网站免费在线观看视频| 欧美国产日韩亚洲一区| 在线观看66精品国产| 亚洲国产精品sss在线观看| 大香蕉久久成人网| 色老头精品视频在线观看| 国产一区二区在线av高清观看| 成人亚洲精品av一区二区| 日本免费一区二区三区高清不卡 | 日韩欧美一区二区三区在线观看| 国产熟女午夜一区二区三区| 日本黄色视频三级网站网址| 色播亚洲综合网| 我的亚洲天堂| 在线观看免费视频网站a站| 久久这里只有精品19| 久久国产精品影院| 亚洲av电影在线进入| 亚洲欧洲精品一区二区精品久久久| 国产精品影院久久| 久99久视频精品免费| 又紧又爽又黄一区二区| 狠狠狠狠99中文字幕| 日日夜夜操网爽| 国产精品久久久人人做人人爽| 国产97色在线日韩免费| 久久人人97超碰香蕉20202| 欧美成人一区二区免费高清观看 | 1024视频免费在线观看| 欧美性长视频在线观看| 久久中文字幕人妻熟女| 波多野结衣巨乳人妻| 人人妻人人爽人人添夜夜欢视频| 国产单亲对白刺激| 此物有八面人人有两片| 一区二区三区精品91| 欧美乱码精品一区二区三区| 成人亚洲精品一区在线观看| 黄色a级毛片大全视频| 日韩 欧美 亚洲 中文字幕| 精品国产一区二区久久| 亚洲人成网站在线播放欧美日韩| 免费看美女性在线毛片视频| 国产成人精品久久二区二区免费| 日韩三级视频一区二区三区| 最近最新中文字幕大全电影3 | 天堂动漫精品| 天堂影院成人在线观看| 他把我摸到了高潮在线观看| 法律面前人人平等表现在哪些方面| 黑人巨大精品欧美一区二区蜜桃| 亚洲一卡2卡3卡4卡5卡精品中文| 亚洲精品在线美女| 又大又爽又粗| 国产精品国产高清国产av| 天天添夜夜摸| 亚洲午夜理论影院| 亚洲精品粉嫩美女一区| 免费在线观看日本一区| 男女床上黄色一级片免费看| 9色porny在线观看| 两个人免费观看高清视频| 两人在一起打扑克的视频| 黄色 视频免费看| 亚洲精品久久国产高清桃花| 97人妻天天添夜夜摸| 久久中文字幕人妻熟女| 99久久99久久久精品蜜桃| 亚洲精品美女久久av网站| 亚洲第一电影网av| avwww免费| 国产区一区二久久| 涩涩av久久男人的天堂| 欧美日韩福利视频一区二区| 久久精品91蜜桃| 久久天躁狠狠躁夜夜2o2o| 欧美精品啪啪一区二区三区| 搡老妇女老女人老熟妇| 亚洲av片天天在线观看| 国产精品爽爽va在线观看网站 | www日本在线高清视频| 亚洲狠狠婷婷综合久久图片| 亚洲午夜理论影院| av在线天堂中文字幕| 麻豆一二三区av精品| www.999成人在线观看| 日韩欧美国产在线观看| 男女做爰动态图高潮gif福利片 | 久久欧美精品欧美久久欧美| 国产熟女午夜一区二区三区| 精品国产亚洲在线| 两性夫妻黄色片| 亚洲欧美精品综合一区二区三区| av网站免费在线观看视频| 天天一区二区日本电影三级 | 亚洲熟女毛片儿| 99国产精品一区二区蜜桃av| 9热在线视频观看99| 免费女性裸体啪啪无遮挡网站| 99久久99久久久精品蜜桃| 国产精品日韩av在线免费观看 | 免费观看人在逋| 中文字幕高清在线视频| 国产欧美日韩精品亚洲av| xxx96com| 十八禁网站免费在线| 九色国产91popny在线| 18禁国产床啪视频网站| √禁漫天堂资源中文www| 久久国产精品男人的天堂亚洲| 女人被狂操c到高潮| 国产精品久久久久久亚洲av鲁大| 日韩一卡2卡3卡4卡2021年| 欧美+亚洲+日韩+国产| 久99久视频精品免费| 黄色 视频免费看| 给我免费播放毛片高清在线观看| 不卡一级毛片| 又大又爽又粗| 欧美日韩黄片免| 亚洲精品久久国产高清桃花| 黄网站色视频无遮挡免费观看| 久久天躁狠狠躁夜夜2o2o| 成人国产一区最新在线观看| 精品国产一区二区久久| 村上凉子中文字幕在线| 首页视频小说图片口味搜索| 搡老岳熟女国产| 精品午夜福利视频在线观看一区| 一区福利在线观看| 国内久久婷婷六月综合欲色啪| 波多野结衣av一区二区av| e午夜精品久久久久久久| 亚洲专区中文字幕在线| 夜夜爽天天搞| 9191精品国产免费久久| 国产精品免费一区二区三区在线| 女人被狂操c到高潮| 欧美一区二区精品小视频在线| 亚洲七黄色美女视频| 黄色a级毛片大全视频| 亚洲少妇的诱惑av| 欧美成人一区二区免费高清观看 | 神马国产精品三级电影在线观看 | 美女免费视频网站| 如日韩欧美国产精品一区二区三区| 咕卡用的链子| 精品乱码久久久久久99久播| 国产97色在线日韩免费| 妹子高潮喷水视频| av视频在线观看入口| 丝袜美足系列| 99久久久亚洲精品蜜臀av| 亚洲aⅴ乱码一区二区在线播放 | 成人国语在线视频| 午夜福利欧美成人| 亚洲第一电影网av| 亚洲成人国产一区在线观看| 怎么达到女性高潮| 国产精品日韩av在线免费观看 | 99国产精品一区二区蜜桃av| 少妇 在线观看| a在线观看视频网站| 国产亚洲av高清不卡| 桃红色精品国产亚洲av| 身体一侧抽搐| 日韩一卡2卡3卡4卡2021年| 最好的美女福利视频网| 老司机福利观看| 一区二区日韩欧美中文字幕| 国产日韩一区二区三区精品不卡| 99在线人妻在线中文字幕| 日日爽夜夜爽网站| or卡值多少钱| 亚洲国产精品合色在线| 麻豆av在线久日| 夜夜看夜夜爽夜夜摸| 欧美色视频一区免费| 少妇粗大呻吟视频| aaaaa片日本免费| 亚洲美女黄片视频| 成熟少妇高潮喷水视频| 欧美老熟妇乱子伦牲交| 欧美一级a爱片免费观看看 | АⅤ资源中文在线天堂| 色播在线永久视频| 一夜夜www| 一边摸一边抽搐一进一出视频| 视频在线观看一区二区三区| 久久婷婷成人综合色麻豆| 国产精品美女特级片免费视频播放器 | 一级,二级,三级黄色视频| 精品不卡国产一区二区三区| 好男人在线观看高清免费视频 | 久久伊人香网站| 男男h啪啪无遮挡| 亚洲精品美女久久久久99蜜臀| 国产精品 欧美亚洲| 日韩成人在线观看一区二区三区| 性欧美人与动物交配| 欧美日本亚洲视频在线播放| 亚洲精品国产一区二区精华液| 91麻豆精品激情在线观看国产| 亚洲欧美日韩高清在线视频| 国产av精品麻豆| 久久久久国产精品人妻aⅴ院| 视频在线观看一区二区三区| 国产高清视频在线播放一区| 久久久精品国产亚洲av高清涩受| 国产又爽黄色视频| 欧洲精品卡2卡3卡4卡5卡区| 久久天堂一区二区三区四区| 国产成人免费无遮挡视频| 国产精品av久久久久免费| 亚洲国产精品合色在线| 91国产中文字幕| 91字幕亚洲| 精品国产一区二区久久| 亚洲国产看品久久| 国产精品一区二区免费欧美| 久久久精品欧美日韩精品| 欧美绝顶高潮抽搐喷水| 欧美成人性av电影在线观看| 精品久久久精品久久久| 免费高清在线观看日韩| 国产成人精品久久二区二区免费| 国产av精品麻豆| 又黄又爽又免费观看的视频| 亚洲五月婷婷丁香| 嫩草影视91久久| 精品久久蜜臀av无| 在线永久观看黄色视频| 久久国产亚洲av麻豆专区| 午夜亚洲福利在线播放| 亚洲中文字幕日韩| 一进一出抽搐动态| 久久国产精品男人的天堂亚洲| 久久午夜综合久久蜜桃| 女生性感内裤真人,穿戴方法视频| 熟妇人妻久久中文字幕3abv| 中亚洲国语对白在线视频| 麻豆久久精品国产亚洲av| 国产麻豆69| 亚洲国产看品久久| 怎么达到女性高潮| 欧美激情高清一区二区三区| 国产精品免费视频内射| 欧美日韩福利视频一区二区| 亚洲第一av免费看| 黄色a级毛片大全视频| 嫩草影院精品99| 97人妻天天添夜夜摸| 亚洲国产欧美一区二区综合| 亚洲最大成人中文| cao死你这个sao货| 国产熟女午夜一区二区三区| av免费在线观看网站| 久久亚洲真实| 久久久久国产精品人妻aⅴ院| 亚洲在线自拍视频| 日韩欧美一区二区三区在线观看| 日本三级黄在线观看| av欧美777| 老司机福利观看| 色综合亚洲欧美另类图片| 精品第一国产精品| 国产成年人精品一区二区| 黑人欧美特级aaaaaa片| 久久精品国产清高在天天线| 高清在线国产一区| 在线观看一区二区三区| 欧美成人免费av一区二区三区| 午夜福利18| av福利片在线| 丝袜在线中文字幕| 欧美日韩福利视频一区二区| 悠悠久久av| 午夜精品久久久久久毛片777| 国产一级毛片七仙女欲春2 | 国产熟女xx| 欧美av亚洲av综合av国产av| 极品人妻少妇av视频| 18禁观看日本| 久9热在线精品视频| 免费在线观看影片大全网站| 在线观看日韩欧美| 91九色精品人成在线观看| 99在线人妻在线中文字幕| 久久青草综合色| 国产一区二区激情短视频| 国产成人精品久久二区二区免费| 淫秽高清视频在线观看| 精品久久久久久久人妻蜜臀av | 三级毛片av免费| 嫩草影视91久久| 精品一区二区三区四区五区乱码| 免费看a级黄色片| 亚洲成国产人片在线观看| 丁香欧美五月| 99久久综合精品五月天人人| 男女下面进入的视频免费午夜 | 国产单亲对白刺激| 深夜精品福利| 久久精品亚洲熟妇少妇任你| 波多野结衣一区麻豆| 日韩成人在线观看一区二区三区| 午夜免费鲁丝| 男女下面插进去视频免费观看| 国产欧美日韩一区二区三区在线| 午夜久久久在线观看| 亚洲av日韩精品久久久久久密| 一级a爱视频在线免费观看| 可以在线观看的亚洲视频| 男人舔女人下体高潮全视频| 九色亚洲精品在线播放| 99久久国产精品久久久| 国产精品久久久久久精品电影 | 亚洲美女黄片视频| 人人澡人人妻人| 亚洲国产精品久久男人天堂| 久久精品人人爽人人爽视色| 亚洲五月色婷婷综合| 夜夜夜夜夜久久久久| 欧美黄色片欧美黄色片| 超碰成人久久| 精品熟女少妇八av免费久了| 亚洲精品久久成人aⅴ小说| 丝袜美足系列| 十八禁人妻一区二区| 亚洲国产精品999在线| 一级毛片女人18水好多| 亚洲aⅴ乱码一区二区在线播放 | 亚洲国产欧美日韩在线播放| 熟女少妇亚洲综合色aaa.| 色综合站精品国产| 久久国产精品影院| 亚洲一区高清亚洲精品| 亚洲av成人av| 亚洲精品一卡2卡三卡4卡5卡| 亚洲欧美激情综合另类| 中文字幕人妻丝袜一区二区| 亚洲一区中文字幕在线| 免费在线观看黄色视频的| 欧美午夜高清在线| 韩国av一区二区三区四区| 如日韩欧美国产精品一区二区三区| 中文字幕人成人乱码亚洲影| 波多野结衣巨乳人妻| 又大又爽又粗| 免费少妇av软件| 国产精品电影一区二区三区| 1024视频免费在线观看| 亚洲成人精品中文字幕电影| 人妻丰满熟妇av一区二区三区| cao死你这个sao货| 国产精品久久久久久亚洲av鲁大| 国产精品一区二区免费欧美| 大型av网站在线播放| 99国产极品粉嫩在线观看| 欧美大码av| 大型av网站在线播放| 久久欧美精品欧美久久欧美| 亚洲欧美一区二区三区黑人| 日本黄色视频三级网站网址| 免费在线观看亚洲国产| 欧美黑人精品巨大| 日日摸夜夜添夜夜添小说| 亚洲人成电影观看| 精品久久久久久,| 最近最新中文字幕大全电影3 | 免费看美女性在线毛片视频| 亚洲成人久久性| www.熟女人妻精品国产| 香蕉丝袜av| 丝袜在线中文字幕| 黄色丝袜av网址大全| 18禁美女被吸乳视频|