• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于神威·太湖之光的非結(jié)構(gòu)網(wǎng)格計(jì)算加速算法

    2022-12-13 13:51:46許樂安虹陳俊仕張鵬飛武錚
    計(jì)算機(jī)工程 2022年12期
    關(guān)鍵詞:對(duì)角分塊頂點(diǎn)

    許樂,安虹,陳俊仕,張鵬飛,武錚

    (中國(guó)科學(xué)技術(shù)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,合肥 230026)

    0 概述

    近幾十年來,計(jì)算流體力學(xué)(Computational Fluid Dynamics,CFD)呈現(xiàn)蓬勃發(fā)展的態(tài)勢(shì),在學(xué)術(shù)界與各學(xué)科相互交叉,科研成果日新月異,在工業(yè)界與各領(lǐng)域深度結(jié)合,成為輔助工程設(shè)計(jì)的新興技術(shù)。非結(jié)構(gòu)網(wǎng)格是有限元和有限體積等數(shù)值方法中最常用的離散網(wǎng)格,在CFD 計(jì)算中具有重要意義,需要基于硬件架構(gòu)精細(xì)調(diào)優(yōu)以保證其良好的性能優(yōu)勢(shì)。非結(jié)構(gòu)網(wǎng)格計(jì)算一般表示為稀疏矩陣運(yùn)算,其更新時(shí)的隨機(jī)訪存加劇了數(shù)據(jù)存儲(chǔ)的離散性。隨著網(wǎng)格規(guī)模的增加,離散訪存的規(guī)模也在成倍增加,在帶寬受限的計(jì)算系統(tǒng)中成為主要性能瓶頸。離散訪存的計(jì)算特點(diǎn)使得并行化時(shí)也會(huì)出現(xiàn)多個(gè)計(jì)算任務(wù)同時(shí)訪問相同元素的寫后讀沖突和寫寫沖突問題。

    神威·太湖之光計(jì)算機(jī)系統(tǒng)[1]是世界上第一臺(tái)峰值性能超過十億億次量級(jí)的超算系統(tǒng),使用完全自主研制的申威26010 異構(gòu)眾核處理器[2]。但非結(jié)構(gòu)網(wǎng)格在眾核處理器上的計(jì)算普遍存在離散訪存、數(shù)據(jù)依賴等問題,并行化難度較高。此外,有依賴關(guān)系的算子和對(duì)稱矩陣的計(jì)算進(jìn)一步提高了在眾核處理器上實(shí)現(xiàn)高性能非結(jié)構(gòu)網(wǎng)格計(jì)算的難度。

    為了解決非結(jié)構(gòu)網(wǎng)格計(jì)算中有依賴關(guān)系算子在眾核處理器上的優(yōu)化問題,本文對(duì)大量稀疏網(wǎng)格數(shù)據(jù)進(jìn)行分析,從網(wǎng)格本身結(jié)構(gòu)和數(shù)據(jù)之間的關(guān)系出發(fā),提出自適應(yīng)和無依賴的任務(wù)劃分策略,使任務(wù)劃分方法與具體算子不產(chǎn)生綁定關(guān)系,從而提高對(duì)不同類型算子的普適性。根據(jù)主從核架構(gòu)的特點(diǎn),本文提出N 階對(duì)角染色算法平衡主從核計(jì)算,并在從核計(jì)算時(shí)摒棄傳統(tǒng)的寄存器通信操作,便于擴(kuò)展到新一代神威平臺(tái)。此外,考慮到計(jì)算訪存重疊技術(shù)是申威處理器的常見優(yōu)化策略,本文利用該技術(shù)進(jìn)一步提升計(jì)算效率。

    1 研究背景

    1.1 申威異構(gòu)眾核處理器

    神威·太湖之光計(jì)算機(jī)系統(tǒng)是我國(guó)首臺(tái)完全自主研發(fā)的世界第一超算系統(tǒng),也是我國(guó)目前使用最廣泛的高性能計(jì)算平臺(tái)之一,為經(jīng)濟(jì)和社會(huì)發(fā)展提供了有力支撐。神威·太湖之光超算系統(tǒng)由高速計(jì)算系統(tǒng)和輔助計(jì)算系統(tǒng)及配套的互連網(wǎng)絡(luò)和存儲(chǔ)系統(tǒng)組成,配備精準(zhǔn)的資源調(diào)度系統(tǒng)和豐富的并行編程環(huán)境。系統(tǒng)由40 960 塊申威26010 處理器構(gòu)成,內(nèi)存空間為1 024 TB,訪存總帶寬為4 473 TB/s,峰值運(yùn)算速度達(dá)到125PFLOPs,比其他同量級(jí)超算系統(tǒng)節(jié)能60%以上。

    申威26010 處理器是我國(guó)通過自主核心技術(shù)研制的全新異構(gòu)眾核處理器,支持64 位申威指令集。申威處理器由4 個(gè)同構(gòu)核組構(gòu)成,每個(gè)核組內(nèi)有1 個(gè)控制核心(主核)和64 個(gè)計(jì)算核心(從核),共享統(tǒng)一編址的8 GB 主存,如圖1 所示。

    圖1 申威26010 處理器架構(gòu)Fig.1 The architecture of SW26010 processor

    在申威26010 處理器中:主核負(fù)責(zé)任務(wù)分發(fā)和調(diào)度,工作頻率為1.45 GHz,L1 Cache 為32 KB,L2 Cache(數(shù)據(jù)和指令Cache 混合)為256 KB;從核負(fù)責(zé)稠密計(jì)算,工作頻率為1.45 GHz,指令Cache 為16 KB。從核采用64 KB 的局部存儲(chǔ)(Local Data Memory,LDM)代替硬件Cache,需要用戶手動(dòng)完成數(shù)據(jù)的換入換出,有利于充分利用片上存儲(chǔ)空間,但也給編程帶來極大挑戰(zhàn)。

    申威處理器98%的計(jì)算性能來源于從核陣列,因此,挖掘從核架構(gòu)特性、充分利用從核計(jì)算資源十分重要。稀疏矩陣運(yùn)算的計(jì)算強(qiáng)度遠(yuǎn)低于稠密矩陣,為達(dá)到較高的性能,需要更高訪存帶寬的支持,而申威處理器訪存性能不佳,因此,必須充分利用從核訪存機(jī)制來盡可能降低開銷。

    從核可以通過gld/gst 指令直接對(duì)主存進(jìn)行訪問,但基準(zhǔn)測(cè)試顯示gld/gst 的延遲很高,達(dá)到上百節(jié)拍數(shù),帶寬低于1.5 GB/s,因此,在密集訪存時(shí)一般不作考慮。在通常情況下,從核使用DMA 操作連續(xù)訪問主存數(shù)據(jù)可獲得明顯的性能提升。DMA 操作帶寬如表1 所示。

    表1 DMA 操作帶寬Table 1 The bandwidth of DMA operation

    DMA 操作是指從核LDM 和主存之間的數(shù)據(jù)傳輸,它只能由從核線程發(fā)起,有單從核模式(PE_MODE)、行模式(ROW_MODE)、廣播模式(BCAST_MODE)、廣播行模式(BROW_MODE)和行集合模式(RANK_MODE)5 種,一般情況下常用單從核模式。此外,從核還支持跨步DMA,即按照一定跨步間隔連續(xù)訪問主存。

    在每個(gè)核組中,64 個(gè)從核構(gòu)成8×8 的從核陣列,從核間的數(shù)據(jù)交換通過寄存器通信機(jī)制(Register Level Communication,RLC)進(jìn)行,該機(jī)制以生產(chǎn)者/消費(fèi)者模式運(yùn)行,各從核以1 個(gè)向量長(zhǎng)度為單位在其行或列上進(jìn)行數(shù)據(jù)廣播和接收。如圖2 所示,源從核首先將256 位對(duì)齊的數(shù)據(jù)加載到寄存器中,然后通過發(fā)送緩沖區(qū)(Send Buffer)將它們發(fā)送到從核通信網(wǎng)格;目的從核通過接收緩沖區(qū)(Receive Buffer)從通信網(wǎng)格中獲取數(shù)據(jù),并將其加載到本地寄存器。

    圖2 寄存器通信機(jī)制原理Fig.2 RLC principle

    寄存器的通信延遲通常低至幾個(gè)周期,如表2所示,這使得從核間的數(shù)據(jù)可以快速交換,但每個(gè)從核只能通過行廣播向同一行中的一個(gè)或多個(gè)從核發(fā)送數(shù)據(jù),或通過列廣播在同一列中發(fā)送數(shù)據(jù),這給數(shù)據(jù)的自由傳輸帶來極大限制,不利于開發(fā)有復(fù)雜依賴關(guān)系的從核程序。

    表2 寄存器通信延遲Table 2 Register communication latency

    1.2 相關(guān)研究

    近年來,CFD 數(shù)值模擬軟件作為高性能計(jì)算領(lǐng)域中的重要應(yīng)用,已經(jīng)廣泛部署于眾多超算平臺(tái)上。商業(yè)軟件因其平臺(tái)適配性強(qiáng)和穩(wěn)定性高,曾是非結(jié)構(gòu)網(wǎng)格計(jì)算軟件的主流,如Fluent[3]、UMS3D[4-5]、FUN3D[6-7]、TAU[8]、CFD++[9]、NSU3D[10]等,但其內(nèi)部源代碼不對(duì)外公開,很難精準(zhǔn)解決用戶需求。相比而言,開源CFD軟件可以滿足用戶不同的開發(fā)需求,如OpenFOAM(Open source Field Operation And Manipulation)[11]、Featflow[12]、Gerris[13]、Code_Saturne[14]等,其中,OpenFOAM是目前應(yīng)用范圍最廣、可擴(kuò)展性最強(qiáng)、解算器最全的開源軟件包。

    CFD 軟件中的核心部分是高精度數(shù)值求解器,越來越多的研究人員開始使用異構(gòu)加速方法來改進(jìn)線性方程組的求解。BOLZ等[15]首次在GPU 上實(shí)現(xiàn)了高效的SpMV 算子,此后,基于ELLPACK格式,BELL等[16]設(shè)計(jì)HYB存儲(chǔ)格式實(shí)現(xiàn)了SpMV,而VáZQUEZ等[17]、MONAKOV等[18]和CHOI等[19]分別設(shè)計(jì)了ELLPACK-R、sliced-ELLPACK 和blocked ELLPACK 存儲(chǔ)格式。

    基于CSR格式,KOZA等[20]提出了CSMR格式以提高數(shù)據(jù)重用,GREATHOUSE等[21]和ASHARI等[22]分別提出CSR-adaptive和ACSR格式以解決負(fù)載均衡問題。此外,MERRILL等[23]和LIU等[24]還分別提出MCSR和CSR5格式,取得了良好的性能提升。對(duì)于分塊問題,BULU?等[25]、ASHARI等[26]、LIANG等[27]和YAN等[28]分別提出了CSB、BRC、HCC和BCCOO存儲(chǔ)格式。

    在國(guó)產(chǎn)申威處理器上,文獻(xiàn)[29]基于CSR 格式提出動(dòng)靜態(tài)優(yōu)化方法,其相比主核實(shí)現(xiàn)取得了6 倍的加速效果,文獻(xiàn)[30]進(jìn)一步提出雙邊多級(jí)劃分方法,相比主核實(shí)現(xiàn)取得了12 倍以上的加速效果。文獻(xiàn)[31]基于非結(jié)構(gòu)網(wǎng)格實(shí)現(xiàn)了稀疏下三角方程求解器,文獻(xiàn)[32]提出基于排序思想的通用眾核優(yōu)化算法以減少非結(jié)構(gòu)網(wǎng)格計(jì)算中的隨機(jī)訪存,隨后,文獻(xiàn)[33]提出兩階段優(yōu)化方法以克服大規(guī)模不規(guī)則訪存和帶寬利用率低的問題。

    2 非結(jié)構(gòu)網(wǎng)格計(jì)算

    OpenFOAM 是一款對(duì)連續(xù)介質(zhì)力學(xué)問題進(jìn)行數(shù)值計(jì)算的開源C++類庫,因其模塊化和可定制程度高,目前已成為超算平臺(tái)上主流的CFD 軟件。OpenFOAM基于C++語言開發(fā),利用操作符重載、繼承和模板等面向?qū)ο筇匦裕С謹(jǐn)?shù)據(jù)預(yù)處理、數(shù)據(jù)后處理和自定義偏微分方程求解,框架內(nèi)提供網(wǎng)格生成、有限體積法、線性方程組求解、輸入輸出處理等功能。

    如圖3 所示,OpenFOAM 中非結(jié)構(gòu)網(wǎng)格一般通過鄰接矩陣表示,而非結(jié)構(gòu)網(wǎng)格的稀疏性又使得鄰接矩陣為稀疏矩陣。稀疏運(yùn)算計(jì)算強(qiáng)度低,在眾核處理器上仍有很大的優(yōu)化空間,因此,本文基于申威處理器提出非結(jié)構(gòu)網(wǎng)格計(jì)算的通用加速框架。

    圖3 非結(jié)構(gòu)網(wǎng)格及其矩陣表示Fig.3 The unstructured gird and its matrix representation

    2.1 基礎(chǔ)數(shù)據(jù)結(jié)構(gòu)

    OpenFOAM 中稀疏矩陣按照LDU 格式存儲(chǔ),矩陣上除對(duì)角線元素外各非零元素用一個(gè)三元組(行號(hào),列號(hào),數(shù)值)表示,如圖4 所示。

    圖4 LDU 存儲(chǔ)格式Fig.4 LDU storage format

    整個(gè)稀疏矩陣分為對(duì)角部分(Diag)、上三角部分(Upper)和下三角部分(Lower),對(duì)角線元素即網(wǎng)格頂點(diǎn)數(shù)據(jù),上三角和下三角元素為網(wǎng)格邊數(shù)據(jù)。上三角元素的行索引(Row)對(duì)應(yīng)下三角元素的列索引(Col),而上三角元素的列索引對(duì)應(yīng)下三角元素的行索引,數(shù)據(jù)可以使用相同的索引數(shù)組存儲(chǔ)。在從核并行計(jì)算時(shí),雖然矩陣上三角每行元素按序排列,但是下三角每行元素并不連續(xù),訪問下三角元素時(shí)很難滿足空間局部性。

    2.2 計(jì)算特征分析

    非結(jié)構(gòu)網(wǎng)格能夠適應(yīng)各種復(fù)雜結(jié)構(gòu)的面網(wǎng)格劃分,是流體力學(xué)仿真軟件中最主要的空間離散化解決方案。非結(jié)構(gòu)網(wǎng)格計(jì)算存在3 種模式,即頂點(diǎn)狀態(tài)更新(點(diǎn)更新)、邊狀態(tài)更新(邊更新)和通過鄰居頂點(diǎn)與鄰接邊更新頂點(diǎn)狀態(tài)(邊點(diǎn)更新)。

    如圖5 所示,邊更新計(jì)算特征為S(e)=f(S(e),S'(v1),S'(v2)),典型計(jì)算函數(shù)為S(e)+=∑(S'(vi))。

    圖5 邊更新模式Fig.5 The edge update mode

    如圖6 所示,點(diǎn)更新計(jì)算特征為S(v)=f(S(v),S'(e1),S'(e2),S'(e3),S'(e4),S'(e5)),典型計(jì)算函數(shù)為S(v)+=∑(S'(ei))。

    圖6 點(diǎn)更新模式Fig.6 The point update mode

    如圖7 所示,邊點(diǎn)更新計(jì)算特征為S(v)=f(S(v),S'(e1),S'(e2),S'(e3),S'(e4),S'(e5),S''(v1),S''(v2),S''(v3),S''(v4),S''(v5)),典型計(jì)算函數(shù)為S(v)+=∑(S'(ei) ·S''(vi))。

    圖7 邊點(diǎn)更新模式Fig.7 The edge and point update mode

    3 種模式的共同特征在于狀態(tài)信息在頂點(diǎn)與邊之間流動(dòng)。本文將邊視為基本單元,頂點(diǎn)視為連接單元,計(jì)算過程則為遍歷非結(jié)構(gòu)網(wǎng)格的所有邊,獲取每條邊上左右頂點(diǎn)狀態(tài),并與邊自身狀態(tài)進(jìn)行運(yùn)算,最終用運(yùn)算結(jié)果更新左右頂點(diǎn)狀態(tài)或邊自身狀態(tài),如表3 所示。

    表3 非結(jié)構(gòu)網(wǎng)格計(jì)算模式Table 3 Unstructured grid computing mode

    由于數(shù)據(jù)關(guān)系的依賴性和對(duì)數(shù)據(jù)訪問的離散性等固有特點(diǎn),導(dǎo)致非結(jié)構(gòu)網(wǎng)格計(jì)算具有局部性差、數(shù)據(jù)相關(guān)、離散訪存、并發(fā)度低等問題,在眾核處理器上進(jìn)行優(yōu)化時(shí)難度較大,性能偏低。

    3 基于申威處理器的眾核加速方法

    3.1 算法思想

    由于非結(jié)構(gòu)網(wǎng)格的稀疏性,導(dǎo)致算法在計(jì)算時(shí)對(duì)元素訪問并不連續(xù),無法充分利用訪存帶寬。此外,非結(jié)構(gòu)網(wǎng)格的離散寬度(稀疏矩陣中非零元素與該行對(duì)角線元素之間的距離)較大,造成訪存間隔過大,難以滿足空間局部性。如圖8 所示,1 號(hào)邊和2 號(hào)邊的距離較大,遍歷時(shí)雖然行索引相同,但是列索引相距較遠(yuǎn),不滿足空間局部性,訪存性能較差。因此,本文采用分塊劃分的思想,將一段時(shí)間內(nèi)的訪存數(shù)據(jù)盡可能集中存儲(chǔ)在較快的存儲(chǔ)器上,降低從下層存儲(chǔ)器讀取數(shù)據(jù)的時(shí)間開銷。

    圖8 非結(jié)構(gòu)網(wǎng)格的鄰接矩陣Fig.8 The adjacent matrix of unstructured grid

    此外,非結(jié)構(gòu)網(wǎng)格計(jì)算存在大量的對(duì)稱矩陣,為節(jié)省存儲(chǔ)空間,一般僅保留上三角矩陣,但是在計(jì)算時(shí)需要對(duì)稱更新,因此,在眾核處理器上的并行化存在數(shù)據(jù)相關(guān)和輸出相關(guān)(寫沖突)的問題。例如,在圖8 中,1 號(hào)邊和2 號(hào)邊位于同一行,表示其對(duì)相同目標(biāo)結(jié)果進(jìn)行更新,存在依賴關(guān)系,如果計(jì)算任務(wù)被分配至2 個(gè)不同的線程執(zhí)行,可能會(huì)發(fā)生寫后讀沖突。此外,1 號(hào)邊和6 號(hào)邊位于同一列,且1′號(hào)邊和6 號(hào)邊位于同一行,由于對(duì)稱更新,則1 號(hào)邊和1′號(hào)邊同時(shí)更新時(shí)如果其他計(jì)算任務(wù)對(duì)6 號(hào)邊更新,就會(huì)發(fā)生寫寫沖突。本文在分析非結(jié)構(gòu)網(wǎng)格的數(shù)據(jù)特點(diǎn)和計(jì)算特征后,提出并行度更高的無依賴任務(wù)劃分方法,將數(shù)據(jù)相關(guān)和輸出相關(guān)的計(jì)算分配到相同任務(wù)隊(duì)列。

    本文提出一種N 階對(duì)角染色算法,非結(jié)構(gòu)網(wǎng)格邊線沿對(duì)角方向劃分為大小相同的方塊后,將有依賴關(guān)系的方塊染上同種顏色,分配到同一任務(wù)隊(duì)列中進(jìn)行并行計(jì)算。然后,染色器不斷向外擴(kuò)展并對(duì)其他類對(duì)角方塊染色。算法根據(jù)方塊內(nèi)元素密度決定染色階數(shù),即向外擴(kuò)展對(duì)角線的次數(shù)。該算法支持非結(jié)構(gòu)網(wǎng)格下大多數(shù)的算子模型,特別是有依賴關(guān)系的算子。算法執(zhí)行步驟如下:

    1)網(wǎng)格預(yù)處理及自適應(yīng)劃分。獲得當(dāng)前頂點(diǎn)數(shù)和邊數(shù),記錄邊線所連頂點(diǎn)。根據(jù)LDM 存儲(chǔ)空間等,針對(duì)不同網(wǎng)格拓?fù)渥赃m應(yīng)確定分塊大?。ㄟ吘€所連頂點(diǎn)范圍)和染色階數(shù),保證計(jì)算單元負(fù)載均衡。

    2)分塊染色及重排整理。根據(jù)分塊大小,從對(duì)角塊向外對(duì)網(wǎng)格逐階染色,按照邊隨頂點(diǎn)走、一階一類色的原則,同時(shí)建立索引表記錄頂點(diǎn)的塊內(nèi)位置與全局位置關(guān)系,方便后續(xù)計(jì)算結(jié)果更新。

    3)任務(wù)調(diào)度。同色塊分配至同一任務(wù)隊(duì)列,采用動(dòng)態(tài)調(diào)度方法管理任務(wù)隊(duì)列以維持從核負(fù)載平衡。

    4)訪存及計(jì)算。從核通過DMA 操作完成網(wǎng)格邊線重排序,將當(dāng)前隊(duì)列內(nèi)染色塊加載至LDM 中并執(zhí)行計(jì)算。同時(shí),為了隱藏DMA 操作時(shí)間,從核在進(jìn)行當(dāng)前計(jì)算時(shí)開始下一輪DMA 操作,使得計(jì)算與訪存重疊。在從核計(jì)算過程中,主核同時(shí)負(fù)責(zé)未染色塊計(jì)算,因?yàn)槲慈旧珘K更為稀疏,局部性更差,更適合通過主核計(jì)算,而從核通過DMA 對(duì)數(shù)據(jù)的換入換出往往會(huì)帶來更高的時(shí)間開銷,不利于發(fā)揮其性能優(yōu)勢(shì)。

    3.2 算例分析

    考慮到計(jì)算的常見性和代表性,本文以典型算子稀疏矩陣向量乘(Sparse Matrix Vector Multiplication,SpMV)為例分析眾核加速方法。

    作為最常見的稀疏運(yùn)算,雙精度SpMV 的計(jì)算強(qiáng)度僅為0.080~0.125 FLOPs/Byte,在帶寬受限的眾核處理器上性能較差。SpMV 算子描述如算法1 所示。

    算法1SpMV 算子

    在算法1 中:V為輸入/輸出向量值,即網(wǎng)格頂點(diǎn)狀態(tài);E.row/E.col 和E.val 分別為稀疏矩陣的行/列索引和值,即網(wǎng)格邊狀態(tài)。頂點(diǎn)狀態(tài)的更新由相連邊狀態(tài)及其連接頂點(diǎn)狀態(tài)的乘積累加得到。本文所提算法執(zhí)行過程如下:

    1)在算法2 中,設(shè)最小并行單位為Δ,即分塊最小頂點(diǎn)范圍。根據(jù)LDM 空間大小、DMA 特性和讀取的網(wǎng)格拓?fù)湫畔?,自適應(yīng)確定分塊因子大小α。

    算法2分塊因子判決

    2)在算法3 中,根據(jù)分塊大小αΔ掃描邊線,先將主對(duì)角塊染色并建立邊索引表,例如第一塊頂點(diǎn)范圍在0~(αΔ-1)內(nèi),第二塊頂點(diǎn)范圍在αΔ~(2αΔ-1)內(nèi),同時(shí)將頂點(diǎn)全局位置轉(zhuǎn)換為塊內(nèi)位置,建立關(guān)系映射表,原因是塊內(nèi)計(jì)算時(shí)不能使用全局地址。按照同樣的方法向二階及以上階擴(kuò)展,皆為雙側(cè)次對(duì)角塊,即包括上三角和對(duì)稱的下三角兩部分。隨后,算法4 從對(duì)角塊中挑選較稠密對(duì)角塊進(jìn)行染色,挑選標(biāo)準(zhǔn)由塊內(nèi)節(jié)點(diǎn)密度和網(wǎng)格整體密度決定,根據(jù)大量測(cè)試后得出。未被挑選的非稠密塊則分配給主核任務(wù)隊(duì)列,依據(jù)主從核的不同特點(diǎn)實(shí)現(xiàn)任務(wù)分配。三階對(duì)角染色示意圖如圖9 所示。

    圖9 三階對(duì)角染色Fig.9 Third-order diagonal dyeing

    算法3分塊染色及重排整理

    算法4挑選染色對(duì)角

    3)建立從核任務(wù)隊(duì)列queue,將全部一階色塊分入隊(duì)列,從核從隊(duì)列中獲取任務(wù)并完成計(jì)算。類似地,在一階色塊完成計(jì)算后,其他同階色塊依次被分配到任務(wù)隊(duì)列,隊(duì)列內(nèi)從核運(yùn)行狀態(tài)一致,從而避免寫后讀沖突和寫寫沖突。

    4)在算法5 中,從核通過DMA 獲取塊內(nèi)頂點(diǎn)狀態(tài)和邊狀態(tài)以及索引表并完成更新,在計(jì)算時(shí)可以預(yù)取下一輪數(shù)據(jù),從而使得DMA 時(shí)間被有效隱藏,如圖10 所示。在從核計(jì)算的同時(shí),主核負(fù)責(zé)其他未染色塊的計(jì)算,從而實(shí)現(xiàn)主從核異步并行,進(jìn)一步提升計(jì)算效率。

    圖10 計(jì)算訪存異步重疊Fig.10 The asynchronous overlap of computation and memory access

    算法5訪存及計(jì)算

    4 實(shí)驗(yàn)結(jié)果與分析

    本次實(shí)驗(yàn)基于申威26010 眾核處理器,硬件參數(shù)如表4 所示,采用swg++編譯器編譯全部C/C++程序。

    表4 申威26010 處理器硬件參數(shù)Table 4 The hardware parameters of SW26010 processor

    4.1 不同網(wǎng)格的性能分析

    為保證算法性能的可靠性,本文選取典型稀疏算子SpMV 作為標(biāo)準(zhǔn)測(cè)試算子,隨機(jī)輸入非結(jié)構(gòu)網(wǎng)格實(shí)例進(jìn)行測(cè)試分析。圖11 和圖12 分別為SpMV算子在不同網(wǎng)格規(guī)模下加速算法與主核樸素算法的運(yùn)行時(shí)間及加速比,以驗(yàn)證加速算法的通用性和優(yōu)化效果。

    圖11 不同網(wǎng)格規(guī)模下的優(yōu)化性能Fig.11 Optimization performance under different grid scales

    圖12 不同網(wǎng)格規(guī)模下的加速效果Fig.12 Acceleration effect under different grid scales

    從圖11 和圖12 中可以看出,隨著網(wǎng)格規(guī)模的增加,加速算法的加速效果基本保持穩(wěn)定,因?yàn)榫W(wǎng)格劃分根據(jù)輸入網(wǎng)格密度和拓?fù)渥赃m應(yīng)調(diào)整,染色階數(shù)也根據(jù)當(dāng)前對(duì)角線密度自動(dòng)判決,因此加速算法能在多數(shù)網(wǎng)格規(guī)模下保持穩(wěn)定的性能優(yōu)勢(shì),通用性較強(qiáng)。相比于主核上運(yùn)行的SpMV 算子,組合加速算法獲得了平均10 倍左右的加速比,最高加速比可達(dá)24 倍。

    4.2 不同算子的性能分析

    本文設(shè)計(jì)非結(jié)構(gòu)網(wǎng)格計(jì)算在申威眾核處理器上的通用加速方法,因此,需要選取多種算子進(jìn)行綜合分析。SpMV 算子的加速比如圖12 所示,Integration算子和calcLudsFcc 算子的加速比分別如圖13 和圖14 所示。

    圖13 Integration 算子在不同網(wǎng)格規(guī)模下的加速效果Fig.13 Acceleration effect of Integration operator under different grid sizes

    圖14 calcLudsFcc 算子在不同網(wǎng)格規(guī)模下的加速效果Fig.14 Acceleration effect of calcLudsFcc operator under different grid sizes

    經(jīng)過對(duì)上述2 種算子在不同網(wǎng)格規(guī)模下的測(cè)試發(fā)現(xiàn),組合加速算法分別獲得了10.22 倍和6.82 倍的平均加速比,而且本文算法對(duì)不同算子模型的性能表現(xiàn)差異并不明顯,在有依賴和無依賴情況下都能取得穩(wěn)定的性能優(yōu)勢(shì),說明算法在任務(wù)劃分和數(shù)據(jù)映射上并沒有以犧牲性能為代價(jià),自適應(yīng)和無依賴任務(wù)劃分方法取得了良好效果。由于算子在從核的計(jì)算和訪存是基于染色后的數(shù)據(jù)塊,其加速效果與數(shù)據(jù)塊中的數(shù)據(jù)分布有關(guān),在數(shù)據(jù)集中度較高的網(wǎng)格實(shí)例中,算子能獲得顯著的性能提升,可達(dá)20 多倍,但在數(shù)據(jù)非常離散的情況下效果一般。

    4.3 不同優(yōu)化策略的性能分析

    為了說明N 階對(duì)角染色算法和自適應(yīng)任務(wù)劃分方法的有效性,以SpMV 算子為例,分別采用非N 階對(duì)角染色的分塊算法和固定分塊大小的任務(wù)劃分方法進(jìn)行對(duì)比實(shí)驗(yàn),并以主核樸素算法為基準(zhǔn),實(shí)驗(yàn)結(jié)果如圖15 所示。

    圖15 不同優(yōu)化方法的加速效果Fig.15 Acceleration effect of different optimization methods

    N 階對(duì)角染色算法通過分析對(duì)角塊密度來選擇是否染色當(dāng)前對(duì)角塊,而普通分塊算法缺少對(duì)角塊信息,易將過于稀疏的對(duì)角塊交由從核陣列計(jì)算。將全部矩陣塊映射到從核陣列會(huì)造成極大的性能損失,本文通過固定前100 階對(duì)角塊由從核計(jì)算來模擬非染色的普通分塊算法性能。自適應(yīng)劃分方法根據(jù)LDM 空間大小、DMA 特性和網(wǎng)格拓?fù)湫畔⒋_定分塊大小,可以充分利用LDM 空間,而固定分塊大小則容易造成對(duì)LDM 空間的利用不足。實(shí)驗(yàn)結(jié)果表明,非N 階對(duì)角染色的分塊算法平均加速比為2.64 倍,固定分塊大小的任務(wù)劃分方法平均加速比僅為1.8 倍,難以發(fā)揮眾核架構(gòu)的計(jì)算能力,甚至有負(fù)優(yōu)化效果出現(xiàn)。采用自適應(yīng)任務(wù)劃分的N 階對(duì)角染色算法能有效利用LDM 空間并根據(jù)塊內(nèi)密度選擇從核或主核來執(zhí)行計(jì)算,平均加速比可達(dá)10 倍。

    5 結(jié)束語

    為提升非結(jié)構(gòu)網(wǎng)格計(jì)算中有依賴關(guān)系算子在眾核處理器上的性能,本文針對(duì)非結(jié)構(gòu)網(wǎng)格的計(jì)算特點(diǎn),提出一種眾核處理器上的通用加速方法,并基于申威26010 處理器架構(gòu)對(duì)其進(jìn)行精細(xì)調(diào)優(yōu)。通過自適應(yīng)任務(wù)劃分方法將從核離散訪存組織為批量訪存,以降低訪存開銷。采用無依賴劃分策略避免計(jì)算時(shí)的數(shù)據(jù)沖突,通過N 階對(duì)角染色算法將計(jì)算任務(wù)分類調(diào)度執(zhí)行,從而有效利用主從核的架構(gòu)特點(diǎn)。此外,采用計(jì)算訪存重疊技術(shù)進(jìn)一步提升計(jì)算性能。實(shí)驗(yàn)結(jié)果表明,該方法在不同網(wǎng)格規(guī)模和不同算子模型下都取得了良好的加速效果,在有依賴和無依賴情況下均能保持穩(wěn)定的性能優(yōu)勢(shì),證明了任務(wù)劃分方法的有效性。但是,本文所提方法對(duì)于數(shù)據(jù)分布極為分散的非結(jié)構(gòu)網(wǎng)格仍存在一定局限性,下一步將結(jié)合排序算法對(duì)網(wǎng)格數(shù)據(jù)進(jìn)行重排整理,提升數(shù)據(jù)的局部性,增加在從核陣列計(jì)算的數(shù)據(jù)塊,從而滿足更多稀疏網(wǎng)格數(shù)據(jù)的眾核計(jì)算需求。

    猜你喜歡
    對(duì)角分塊頂點(diǎn)
    過非等腰銳角三角形頂點(diǎn)和垂心的圓的性質(zhì)及應(yīng)用(下)
    分塊矩陣在線性代數(shù)中的應(yīng)用
    擬對(duì)角擴(kuò)張Cuntz半群的某些性質(zhì)
    關(guān)于頂點(diǎn)染色的一個(gè)猜想
    反三角分塊矩陣Drazin逆新的表示
    基于自適應(yīng)中值濾波的分塊壓縮感知人臉識(shí)別
    基于多分辨率半邊的分塊LOD模型無縫表達(dá)
    非奇異塊α1對(duì)角占優(yōu)矩陣新的實(shí)用簡(jiǎn)捷判據(jù)
    數(shù)學(xué)問答
    一個(gè)人在頂點(diǎn)
    歲月(2009年3期)2009-04-10 03:50:12
    一级毛片 在线播放| 中文欧美无线码| 日韩av不卡免费在线播放| 大话2 男鬼变身卡| 久久久国产精品麻豆| 亚洲久久久国产精品| 一个人看视频在线观看www免费| 亚洲久久久国产精品| 九草在线视频观看| 成人免费观看视频高清| 人人妻人人爽人人添夜夜欢视频| 欧美人与善性xxx| 人人妻人人爽人人添夜夜欢视频| 日韩,欧美,国产一区二区三区| 欧美人与善性xxx| 女人久久www免费人成看片| 亚洲av二区三区四区| 黑丝袜美女国产一区| 伦理电影大哥的女人| 伦理电影大哥的女人| 黑丝袜美女国产一区| 亚洲国产精品一区二区三区在线| 人妻夜夜爽99麻豆av| 久久久久久久久久久久大奶| 母亲3免费完整高清在线观看 | 亚洲高清免费不卡视频| 国模一区二区三区四区视频| 欧美 亚洲 国产 日韩一| 亚洲欧美一区二区三区国产| 少妇熟女欧美另类| 久久 成人 亚洲| 中文字幕av电影在线播放| 精品少妇内射三级| 日韩免费高清中文字幕av| 热99国产精品久久久久久7| a级毛片黄视频| 午夜激情av网站| 天堂俺去俺来也www色官网| 晚上一个人看的免费电影| 亚洲国产欧美日韩在线播放| 自线自在国产av| 丝袜喷水一区| h视频一区二区三区| 欧美老熟妇乱子伦牲交| 人妻制服诱惑在线中文字幕| 看十八女毛片水多多多| 高清午夜精品一区二区三区| 永久免费av网站大全| 最新的欧美精品一区二区| 午夜av观看不卡| 亚洲欧美成人综合另类久久久| 国产欧美另类精品又又久久亚洲欧美| 亚洲国产av新网站| 精品久久蜜臀av无| 国产亚洲最大av| 最近中文字幕高清免费大全6| 午夜老司机福利剧场| 在线 av 中文字幕| 久久人人爽人人片av| 中文字幕免费在线视频6| 一个人免费看片子| 亚洲人成网站在线观看播放| 日本黄色日本黄色录像| 欧美日韩综合久久久久久| 永久免费av网站大全| 成人黄色视频免费在线看| 日本vs欧美在线观看视频| 黑人高潮一二区| 久久ye,这里只有精品| 一二三四中文在线观看免费高清| 春色校园在线视频观看| 亚洲国产精品国产精品| 亚洲av成人精品一区久久| 午夜免费男女啪啪视频观看| 看免费成人av毛片| 狠狠婷婷综合久久久久久88av| 男女啪啪激烈高潮av片| 少妇被粗大猛烈的视频| 一本色道久久久久久精品综合| 丰满乱子伦码专区| 91精品伊人久久大香线蕉| 下体分泌物呈黄色| 国产精品久久久久久久久免| 亚洲欧美色中文字幕在线| 一本一本久久a久久精品综合妖精 国产伦在线观看视频一区 | 日韩大片免费观看网站| 多毛熟女@视频| 久久精品久久精品一区二区三区| 毛片一级片免费看久久久久| 国产片特级美女逼逼视频| 亚洲成人一二三区av| 免费黄频网站在线观看国产| 久久久精品免费免费高清| 日韩,欧美,国产一区二区三区| 熟女电影av网| 视频在线观看一区二区三区| 日韩精品有码人妻一区| 欧美精品国产亚洲| av在线播放精品| 国产精品熟女久久久久浪| 婷婷色av中文字幕| av在线老鸭窝| 日韩成人伦理影院| 亚洲人成77777在线视频| 国产精品 国内视频| 最黄视频免费看| xxx大片免费视频| 最近中文字幕高清免费大全6| av不卡在线播放| 一级黄片播放器| 熟妇人妻不卡中文字幕| 精品视频人人做人人爽| 久久精品国产亚洲av涩爱| 国产有黄有色有爽视频| freevideosex欧美| 最新中文字幕久久久久| av又黄又爽大尺度在线免费看| 久久ye,这里只有精品| 性色avwww在线观看| 久久久久国产精品人妻一区二区| 亚洲人成网站在线播| 久久婷婷青草| 国产免费现黄频在线看| av.在线天堂| 国产熟女午夜一区二区三区 | 亚洲少妇的诱惑av| av视频免费观看在线观看| 国产精品.久久久| 纵有疾风起免费观看全集完整版| 3wmmmm亚洲av在线观看| 国产国拍精品亚洲av在线观看| av在线播放精品| 中文乱码字字幕精品一区二区三区| 欧美亚洲日本最大视频资源| 丝袜喷水一区| 伦精品一区二区三区| 免费高清在线观看日韩| 七月丁香在线播放| 久久久精品94久久精品| 亚洲婷婷狠狠爱综合网| 在线免费观看不下载黄p国产| 91成人精品电影| 麻豆成人av视频| 成人毛片60女人毛片免费| 亚洲美女视频黄频| a级毛片免费高清观看在线播放| 能在线免费看毛片的网站| 三级国产精品片| 亚洲国产毛片av蜜桃av| 欧美日本中文国产一区发布| 纵有疾风起免费观看全集完整版| 亚洲av成人精品一二三区| av又黄又爽大尺度在线免费看| 日日爽夜夜爽网站| 少妇人妻精品综合一区二区| videos熟女内射| 国产毛片在线视频| 国产成人精品无人区| 日本wwww免费看| 一级二级三级毛片免费看| 老司机影院成人| 免费黄网站久久成人精品| 亚洲国产精品999| 母亲3免费完整高清在线观看 | 欧美日韩亚洲高清精品| 久热这里只有精品99| 免费高清在线观看日韩| 制服诱惑二区| 激情五月婷婷亚洲| 99久久精品国产国产毛片| 亚洲av不卡在线观看| 少妇的逼水好多| 亚洲第一区二区三区不卡| 26uuu在线亚洲综合色| 久久久久人妻精品一区果冻| 久久久久网色| 97在线人人人人妻| 高清视频免费观看一区二区| a级毛片在线看网站| 大码成人一级视频| 嫩草影院入口| 久热久热在线精品观看| 国产精品人妻久久久久久| 免费观看在线日韩| 亚洲欧美成人综合另类久久久| 青青草视频在线视频观看| 国产精品一区www在线观看| 久久久a久久爽久久v久久| 大香蕉久久网| 亚洲美女黄色视频免费看| 国产男女内射视频| 中文字幕精品免费在线观看视频 | 亚洲欧美色中文字幕在线| 亚洲人成77777在线视频| 国产熟女午夜一区二区三区 | 色5月婷婷丁香| 国产精品 国内视频| 在线观看三级黄色| 美女cb高潮喷水在线观看| 亚洲少妇的诱惑av| 日韩熟女老妇一区二区性免费视频| 日本与韩国留学比较| 国产精品欧美亚洲77777| 2021少妇久久久久久久久久久| 内地一区二区视频在线| 欧美日本中文国产一区发布| 久久99蜜桃精品久久| 久久人人爽人人爽人人片va| 欧美 亚洲 国产 日韩一| av在线app专区| 欧美最新免费一区二区三区| 99热国产这里只有精品6| 国产亚洲最大av| 亚洲欧美中文字幕日韩二区| 久久久a久久爽久久v久久| 亚洲成色77777| 国产精品一国产av| 狂野欧美激情性xxxx在线观看| 国产精品一区www在线观看| 又黄又爽又刺激的免费视频.| 国产高清不卡午夜福利| 最新中文字幕久久久久| 天美传媒精品一区二区| 99热6这里只有精品| 久久精品熟女亚洲av麻豆精品| 国产有黄有色有爽视频| 精品久久久久久电影网| 黄色毛片三级朝国网站| 亚洲精品456在线播放app| 18+在线观看网站| 天天操日日干夜夜撸| 中国三级夫妇交换| 中文字幕av电影在线播放| 亚洲成人一二三区av| 日日摸夜夜添夜夜添av毛片| 亚洲欧美一区二区三区黑人 | 久久婷婷青草| 色网站视频免费| 日本午夜av视频| 国产高清国产精品国产三级| 人妻少妇偷人精品九色| 亚洲欧美色中文字幕在线| 最近中文字幕2019免费版| 精品国产乱码久久久久久小说| 亚洲国产精品一区三区| 一级黄片播放器| kizo精华| 国产黄色免费在线视频| 午夜激情久久久久久久| 久久国内精品自在自线图片| 久久精品国产鲁丝片午夜精品| 日韩熟女老妇一区二区性免费视频| 制服诱惑二区| xxxhd国产人妻xxx| 亚洲国产成人一精品久久久| 国产在线视频一区二区| 日韩一区二区视频免费看| 久久99一区二区三区| 久久久久视频综合| 夜夜骑夜夜射夜夜干| 高清毛片免费看| 亚洲中文av在线| 最新中文字幕久久久久| 久久青草综合色| 妹子高潮喷水视频| 亚洲久久久国产精品| 国产 一区精品| 日韩成人av中文字幕在线观看| 国产一级毛片在线| 成年人免费黄色播放视频| 免费观看a级毛片全部| 精品少妇久久久久久888优播| 超碰97精品在线观看| www.av在线官网国产| 最黄视频免费看| 久久 成人 亚洲| 国产乱人偷精品视频| 国产有黄有色有爽视频| 亚洲综合色网址| 国产精品久久久久久精品电影小说| 亚洲丝袜综合中文字幕| 伊人亚洲综合成人网| 国产欧美另类精品又又久久亚洲欧美| 五月天丁香电影| 少妇被粗大的猛进出69影院 | 少妇被粗大的猛进出69影院 | 国产成人freesex在线| 五月伊人婷婷丁香| 久久 成人 亚洲| 亚洲av在线观看美女高潮| 成人免费观看视频高清| 九九久久精品国产亚洲av麻豆| 亚洲精品国产av成人精品| 国产淫语在线视频| 久久久午夜欧美精品| 亚洲情色 制服丝袜| 丝袜在线中文字幕| www.av在线官网国产| 国产一区二区在线观看av| 国产亚洲精品久久久com| 久久这里有精品视频免费| 只有这里有精品99| 观看美女的网站| 亚洲图色成人| 亚洲国产精品一区二区三区在线| 一级毛片电影观看| 亚洲精品中文字幕在线视频| 欧美激情极品国产一区二区三区 | 亚洲国产欧美在线一区| 亚洲国产色片| 97超碰精品成人国产| 看非洲黑人一级黄片| 最近手机中文字幕大全| 日韩欧美一区视频在线观看| 蜜臀久久99精品久久宅男| 精品少妇久久久久久888优播| 久久精品国产a三级三级三级| 高清午夜精品一区二区三区| 日韩av免费高清视频| 日本黄色片子视频| 女性生殖器流出的白浆| 一本色道久久久久久精品综合| 亚洲人与动物交配视频| 欧美+日韩+精品| 国产成人91sexporn| 久久久欧美国产精品| 久久精品国产自在天天线| 大香蕉97超碰在线| 亚洲人成网站在线观看播放| 国产一区二区在线观看日韩| 一本大道久久a久久精品| 热99久久久久精品小说推荐| 国产午夜精品久久久久久一区二区三区| 热re99久久国产66热| 国产成人精品一,二区| 视频在线观看一区二区三区| 久久97久久精品| 久久久久久久亚洲中文字幕| 日韩一本色道免费dvd| 人人澡人人妻人| 极品少妇高潮喷水抽搐| 22中文网久久字幕| 欧美日韩视频高清一区二区三区二| 九九爱精品视频在线观看| 国产成人精品久久久久久| 亚洲国产精品一区三区| 亚洲图色成人| 日本黄大片高清| 成人国产麻豆网| 午夜老司机福利剧场| 精品人妻一区二区三区麻豆| 大香蕉久久网| 国产亚洲欧美精品永久| 亚洲av综合色区一区| 久久久久久久久久人人人人人人| 日韩中文字幕视频在线看片| 国产日韩欧美视频二区| 免费av不卡在线播放| 夫妻午夜视频| 香蕉精品网在线| 日本黄大片高清| 日本av手机在线免费观看| 涩涩av久久男人的天堂| 亚洲av中文av极速乱| 黄色毛片三级朝国网站| 男女无遮挡免费网站观看| 日本色播在线视频| 一本大道久久a久久精品| a级片在线免费高清观看视频| 搡女人真爽免费视频火全软件| 国内精品宾馆在线| 亚洲,欧美,日韩| 成人国语在线视频| 热re99久久精品国产66热6| 国产av码专区亚洲av| 激情五月婷婷亚洲| 乱人伦中国视频| 亚洲精品久久久久久婷婷小说| 精品国产国语对白av| 亚洲欧美成人精品一区二区| 日韩制服骚丝袜av| 国产乱来视频区| 熟女电影av网| 欧美日韩视频高清一区二区三区二| 欧美精品高潮呻吟av久久| 免费观看a级毛片全部| 久久久久精品性色| 国产白丝娇喘喷水9色精品| 丰满乱子伦码专区| 极品少妇高潮喷水抽搐| 成人手机av| 久久久久网色| 亚洲成色77777| 久久影院123| 国产高清三级在线| 免费观看a级毛片全部| 国产精品久久久久久精品电影小说| 国产成人精品福利久久| 夫妻午夜视频| 啦啦啦啦在线视频资源| av.在线天堂| 啦啦啦中文免费视频观看日本| 日韩精品免费视频一区二区三区 | 久久国产精品大桥未久av| 国产片内射在线| 中文字幕人妻熟人妻熟丝袜美| 91国产中文字幕| 国产精品熟女久久久久浪| 欧美日本中文国产一区发布| 一级a做视频免费观看| 九九爱精品视频在线观看| 日韩av在线免费看完整版不卡| av国产久精品久网站免费入址| 蜜桃在线观看..| 18禁裸乳无遮挡动漫免费视频| 亚洲av综合色区一区| 交换朋友夫妻互换小说| 99久久综合免费| 国产成人一区二区在线| 国产国拍精品亚洲av在线观看| 内地一区二区视频在线| 免费高清在线观看视频在线观看| 欧美 亚洲 国产 日韩一| 国产在线免费精品| 久久午夜综合久久蜜桃| 黄色欧美视频在线观看| 搡女人真爽免费视频火全软件| 日本黄色片子视频| 亚洲av欧美aⅴ国产| 性色avwww在线观看| 亚洲国产日韩一区二区| 男女国产视频网站| 在线观看一区二区三区激情| 成人国产麻豆网| 超碰97精品在线观看| 精品人妻偷拍中文字幕| 最近手机中文字幕大全| 国产精品.久久久| 欧美日韩视频高清一区二区三区二| h视频一区二区三区| 日韩大片免费观看网站| 午夜精品国产一区二区电影| 2022亚洲国产成人精品| 国产片特级美女逼逼视频| 色网站视频免费| 日日爽夜夜爽网站| 久久av网站| 男女高潮啪啪啪动态图| 日本欧美视频一区| 亚洲综合色惰| 久久久久久久国产电影| 久久99精品国语久久久| 美女国产高潮福利片在线看| 99精国产麻豆久久婷婷| 国产黄片视频在线免费观看| 午夜免费观看性视频| 桃花免费在线播放| 精品99又大又爽又粗少妇毛片| 国产精品成人在线| 老司机亚洲免费影院| 亚洲人成77777在线视频| 欧美日本中文国产一区发布| 国产精品一国产av| 久久精品国产亚洲网站| 纵有疾风起免费观看全集完整版| 人妻人人澡人人爽人人| 五月开心婷婷网| 欧美日韩视频高清一区二区三区二| 一区二区日韩欧美中文字幕 | 街头女战士在线观看网站| 水蜜桃什么品种好| 日本黄大片高清| 性色avwww在线观看| 成人免费观看视频高清| 午夜免费鲁丝| 国产精品人妻久久久久久| 国产精品免费大片| tube8黄色片| 99热网站在线观看| 中文字幕免费在线视频6| 国产一区二区三区av在线| 一边摸一边做爽爽视频免费| 成人毛片a级毛片在线播放| 午夜福利影视在线免费观看| 亚洲av二区三区四区| 啦啦啦中文免费视频观看日本| 国产成人一区二区在线| 在线观看国产h片| 日韩欧美一区视频在线观看| 大片电影免费在线观看免费| 又黄又爽又刺激的免费视频.| 亚洲av男天堂| 99久久人妻综合| 精品国产乱码久久久久久小说| 国产一级毛片在线| 欧美日韩在线观看h| 性色av一级| 亚洲精品久久久久久婷婷小说| 狂野欧美激情性bbbbbb| 久久热精品热| 下体分泌物呈黄色| 91久久精品电影网| 国产精品嫩草影院av在线观看| 九九在线视频观看精品| 最后的刺客免费高清国语| 人人妻人人澡人人爽人人夜夜| 亚洲,一卡二卡三卡| 亚洲国产日韩一区二区| 最近中文字幕高清免费大全6| 亚洲在久久综合| 18禁在线播放成人免费| 欧美激情 高清一区二区三区| 国产高清国产精品国产三级| 久久毛片免费看一区二区三区| 黑人猛操日本美女一级片| av专区在线播放| √禁漫天堂资源中文www| 青春草视频在线免费观看| 大片电影免费在线观看免费| 欧美97在线视频| 亚洲av福利一区| 精品视频人人做人人爽| 午夜激情久久久久久久| 青春草视频在线免费观看| 一级片'在线观看视频| 欧美一级a爱片免费观看看| 中文精品一卡2卡3卡4更新| 成人综合一区亚洲| 九色成人免费人妻av| 国产日韩欧美在线精品| 亚洲综合色网址| 精品一品国产午夜福利视频| 亚洲欧洲日产国产| 欧美变态另类bdsm刘玥| 狂野欧美激情性xxxx在线观看| 18+在线观看网站| 在线观看国产h片| 久久久久久久久久成人| 日本av手机在线免费观看| 欧美日本中文国产一区发布| 91久久精品国产一区二区成人| 久久久国产精品麻豆| av国产久精品久网站免费入址| 大陆偷拍与自拍| av不卡在线播放| 男的添女的下面高潮视频| 精品人妻熟女av久视频| 这个男人来自地球电影免费观看 | 国产av一区二区精品久久| av天堂久久9| 精品人妻熟女毛片av久久网站| 日日爽夜夜爽网站| 欧美最新免费一区二区三区| 精品久久久精品久久久| 国产成人精品久久久久久| 亚洲欧美中文字幕日韩二区| freevideosex欧美| 韩国高清视频一区二区三区| 男人操女人黄网站| 亚洲人成网站在线播| 日韩制服骚丝袜av| 久久久a久久爽久久v久久| 欧美精品国产亚洲| 男人添女人高潮全过程视频| 97在线视频观看| 欧美+日韩+精品| 毛片一级片免费看久久久久| 在线天堂最新版资源| 国产精品久久久久久精品电影小说| 午夜日本视频在线| 国产一级毛片在线| 日韩制服骚丝袜av| 欧美97在线视频| 制服人妻中文乱码| 黄色一级大片看看| 人妻人人澡人人爽人人| 永久网站在线| 亚洲欧美一区二区三区国产| 91aial.com中文字幕在线观看| 久久久久久久大尺度免费视频| 色婷婷av一区二区三区视频| 亚洲三级黄色毛片| 99九九线精品视频在线观看视频| 国产欧美亚洲国产| 一本久久精品| 国产精品 国内视频| 成人二区视频| 亚洲综合色惰| 秋霞伦理黄片| 午夜免费鲁丝| 最近中文字幕2019免费版| 中文乱码字字幕精品一区二区三区| 婷婷色麻豆天堂久久| 国产精品蜜桃在线观看| 日本vs欧美在线观看视频| 男人添女人高潮全过程视频| 久久久久人妻精品一区果冻| www.av在线官网国产| 中文字幕精品免费在线观看视频 | 国产 一区精品| 新久久久久国产一级毛片| 日韩av免费高清视频| 亚洲,欧美,日韩| 成人无遮挡网站| 国产永久视频网站| 久热久热在线精品观看| 桃花免费在线播放| 两个人免费观看高清视频| 精品久久国产蜜桃| 精品人妻熟女毛片av久久网站| 美女内射精品一级片tv| 欧美xxⅹ黑人| 天堂俺去俺来也www色官网| 亚洲国产av新网站| 午夜免费观看性视频|