• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    Silicon-Crystal應(yīng)用的神威OpenACC移植與數(shù)據(jù)流驅(qū)動(dòng)任務(wù)圖并行化

    2019-05-22 02:59:48
    關(guān)鍵詞:神威任務(wù)調(diào)度數(shù)據(jù)流

    (山東科技大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院,山東 青島 266590)

    分子動(dòng)力學(xué)(molecular dynamics,MD)模擬是指使用數(shù)值方法,利用計(jì)算機(jī)模擬原子核和電子所構(gòu)成的多體系統(tǒng)的運(yùn)動(dòng)過(guò)程,已被廣泛應(yīng)用于物理、化學(xué)、生物、材料、醫(yī)學(xué)等多個(gè)領(lǐng)域,用來(lái)研究系統(tǒng)的結(jié)構(gòu)和性質(zhì)[1]。在材料領(lǐng)域虛擬過(guò)程工程中,Silicon-Crystal應(yīng)用是研究硅晶體熱傳導(dǎo)性的MD模擬應(yīng)用,有限的計(jì)算能力一直是制約模擬效率的瓶頸[2]。近年來(lái),高性能計(jì)算技術(shù)的發(fā)展為材料領(lǐng)域的虛擬過(guò)程工程提供了可能[3]。

    “神威·太湖之光”是世界上首臺(tái)運(yùn)行速度超過(guò)十億億次的超級(jí)計(jì)算機(jī),也是我國(guó)第一臺(tái)全部采用國(guó)產(chǎn)處理器SW26010構(gòu)建的超級(jí)計(jì)算機(jī)[4]。清華大學(xué)付昊桓等[5]在“神威·太湖之光”上,利用OpenACC移植大氣模型CAM應(yīng)用,單核組內(nèi)實(shí)現(xiàn)2倍加速,但未進(jìn)行移植后優(yōu)化;上海交通大學(xué)王一超等[6]利用OpenACC移植并優(yōu)化了磁約束聚變領(lǐng)域GTC-P應(yīng)用,單核組內(nèi)實(shí)現(xiàn)2.5倍加速,但缺少對(duì)訪存密集型應(yīng)用帶寬訪存優(yōu)化;中國(guó)科學(xué)院計(jì)算應(yīng)用研究中心張帥等[7]在GPU平臺(tái)上對(duì)MD模擬進(jìn)行訪存優(yōu)化,但未提供模擬中跨時(shí)間迭代問(wèn)題的解決方法。CPU、GPU架構(gòu)與SW26010架構(gòu)存在著差異。SW26010采用片上計(jì)算陣列群和分布式共享存儲(chǔ)相結(jié)合的異構(gòu)眾核體系架構(gòu),使得MD模擬應(yīng)用的移植具有更大的靈活性,但也使得移植難度加大,目前對(duì)MD模擬移植到“神威·太湖之光”超級(jí)計(jì)算機(jī)上的相關(guān)研究尚未見(jiàn)到。

    本文設(shè)計(jì)了一種SW26010主從計(jì)算并行化方案,實(shí)現(xiàn)對(duì)Silicon-Crystal應(yīng)用的神威OpenACC移植與優(yōu)化;以數(shù)據(jù)流驅(qū)動(dòng)的任務(wù)圖并行化方法解決任務(wù)間的峰值訪存、跨時(shí)間迭代問(wèn)題,針對(duì)該應(yīng)用訪存密集型特點(diǎn)進(jìn)行帶寬訪存優(yōu)化。

    1 背景介紹

    1.1 SW26010處理器架構(gòu)及神威OpenACC執(zhí)行模型

    “神威·太湖之光”是中國(guó)自主研發(fā)的超級(jí)計(jì)算機(jī),峰值性能為125.4 PFlops,實(shí)測(cè)峰值約為93 PFlops。采用新一代的眾核異構(gòu)處理器SW26010(架構(gòu)如圖1)。神威OpenACC程序的執(zhí)行模型是在主核指導(dǎo)下,主從核協(xié)同工作,其加速執(zhí)行模型如圖2所示。

    圖1 “SW26010”異構(gòu)眾核架構(gòu)Fig.1 Heterogeneous multi-core processor architecture of “SW26010”

    SW26010異構(gòu)眾核架構(gòu)中,各核組之間采用片上網(wǎng)絡(luò)互連,每個(gè)核組包含1個(gè)主核(management processing element MPE)、1個(gè)從核簇(8×8=64個(gè),computing processing element,CPE)、1個(gè)協(xié)議處理單元和1個(gè)內(nèi)存控制器。核組內(nèi)采用共享存儲(chǔ)架構(gòu),內(nèi)存與主、從核之間可通過(guò)內(nèi)存控制器傳輸數(shù)據(jù),處理器可通過(guò)系統(tǒng)接口與外部設(shè)備相連[8]。申威眾核處理器旨在用少量具備指令級(jí)并行能力的管理核心集成眾多面向計(jì)算開(kāi)發(fā)的精簡(jiǎn)運(yùn)算核心高效處理線程級(jí)并行,從而大幅提高芯片性能[9]。

    程序首先在MPE上啟動(dòng),以一個(gè)主線程串行執(zhí)行,計(jì)算密集區(qū)域則在主線程的控制下作為加速任務(wù)被加載到加速設(shè)備CPE上執(zhí)行[10]。任務(wù)的執(zhí)行過(guò)程包括:在CPE設(shè)備內(nèi)存上分配所需的數(shù)據(jù)空間;加載任務(wù)代碼至CPE;任務(wù)將所需的數(shù)據(jù)從MPE傳輸至CPE內(nèi)存;等待數(shù)據(jù)傳輸完成;CPE進(jìn)行計(jì)算并將計(jì)算結(jié)果傳送回主存;釋放設(shè)備上的數(shù)據(jù)空間等步驟。

    圖2 神威OpenACC執(zhí)行模型Fig.2 Execution model of the Sunway OpenACC

    MPE加載一系列任務(wù)到加速設(shè)備上同時(shí)執(zhí)行,但這種fork-join模式在訪存帶寬有限的SW26010處理器上易產(chǎn)生峰值訪存問(wèn)題,使CPE之間相互爭(zhēng)搶帶寬,從而影響計(jì)算性能。

    1.2 AceMesh編程框架

    AceMesh編程框架是面向網(wǎng)格應(yīng)用[11-12]、以數(shù)據(jù)為中心,應(yīng)用于多核、眾核平臺(tái)上的數(shù)據(jù)流驅(qū)動(dòng)并行編程框架。AceMesh并行編程框架通過(guò)底層的任務(wù)調(diào)度系統(tǒng)[13](運(yùn)行時(shí)庫(kù))對(duì)網(wǎng)格應(yīng)用進(jìn)行任務(wù)圖并行,其核心設(shè)計(jì)思想來(lái)源于圖論中的有向無(wú)環(huán)圖(directed acyclic graph,DAG)。

    任務(wù)調(diào)度系統(tǒng)采用探測(cè)-執(zhí)行(inspector-executor)兩階段執(zhí)行的并行模式[14],該模式對(duì)并行區(qū)域進(jìn)行代碼級(jí)調(diào)度。探測(cè)階段將代碼區(qū)域的控制流和數(shù)據(jù)流信息提交給運(yùn)行時(shí)系統(tǒng),由運(yùn)行時(shí)系統(tǒng)根據(jù)任務(wù)間依賴關(guān)系建立任務(wù)依賴圖。執(zhí)行階段以構(gòu)建的任務(wù)圖為基礎(chǔ),依據(jù)資源配置及利用率搭配不同的任務(wù)調(diào)度策略和算法,動(dòng)態(tài)的調(diào)度并行任務(wù)。

    圖3 AceMesh編程框架任務(wù)調(diào)度系統(tǒng)Fig.3 Task scheduling system ofAceMesh programming framework

    AceMesh編程框架任務(wù)調(diào)度系統(tǒng)結(jié)構(gòu)圖如圖3所示,該調(diào)度系統(tǒng)包括四層:

    1) 用戶接口層,收集任務(wù)粒度[15]的描述、數(shù)據(jù)流信息、任務(wù)構(gòu)造等信息;

    2) 任務(wù)構(gòu)建層,根據(jù)上層用戶提供的信息,在系統(tǒng)內(nèi)部產(chǎn)生任務(wù)、建立依賴和進(jìn)行任務(wù)圖管理;

    3) 任務(wù)調(diào)度層,通過(guò)靜態(tài)調(diào)度和動(dòng)靜結(jié)合調(diào)度兩種方式提供任務(wù)調(diào)度支持。靜態(tài)調(diào)度采用輪詢法按權(quán)值將任務(wù)分配至線程;動(dòng)靜結(jié)合調(diào)度指靜態(tài)調(diào)度策略與任務(wù)竊取調(diào)度算法[13,16]相結(jié)合,提高任務(wù)數(shù)據(jù)重用率和線程間負(fù)載均衡性;

    4) 隊(duì)列調(diào)度層,利用線程庫(kù)對(duì)線程私有并發(fā)任務(wù)調(diào)度隊(duì)列進(jìn)行任務(wù)級(jí)調(diào)度。

    2 Silicon-Crystal應(yīng)用分析及移植方案設(shè)計(jì)

    2.1 應(yīng)用算法和模擬過(guò)程數(shù)據(jù)特征分析

    MD模擬中,通過(guò)差分求解牛頓運(yùn)動(dòng)方程可得到系統(tǒng)中原子的一系列位形。由于模擬過(guò)程中力的計(jì)算工作量很大,常用的龍格-庫(kù)塔法已不再適用,Silicon-Crystal應(yīng)用中的TP(Tersoff Potent)模塊利用leap-frog算法[17]模擬原子在Tersoff勢(shì)能作用下的運(yùn)動(dòng)軌跡,在所有的線性微分方程的求解器中都有應(yīng)用。

    基于有限差分法leap-frog算法,求解線性常微分方程公式如下:

    (1)

    (2)

    其中,r、V、m、F分別為原子的位置矢量、速度、質(zhì)量、所受勢(shì)能力,Δt為計(jì)算時(shí)間步長(zhǎng)。

    2.2 TP模塊并行方案

    加速線程庫(kù)(athread庫(kù))是針對(duì)主從加速編程模型所設(shè)計(jì)的程序加速庫(kù),旨在使用戶能夠方便、快捷地使用核組內(nèi)的線程進(jìn)行控制和調(diào)度,從而更好地發(fā)揮組內(nèi)多計(jì)算核的性能。本研究使用加速線程庫(kù)將TP模塊移植到從核的運(yùn)算模式如圖4所示。

    圖4 TP模塊并行方案設(shè)計(jì)Fig.4 Parallel scheme design of TP module

    TP模塊的移植主要分為:

    1) 計(jì)算網(wǎng)絡(luò)劃分。MPE端沿三維空間x、y和z三個(gè)方向?qū)?shù)據(jù)區(qū)域按比例分成若干矩形體,每一矩形體計(jì)算視為一個(gè)任務(wù)。這樣的劃分方式有兩個(gè)好處:其一,CPE端得到的數(shù)據(jù)在空間上是連續(xù)的,數(shù)據(jù)塊訪問(wèn)開(kāi)銷比較小;其二,分塊內(nèi)中心原子占比相對(duì)較高,減少分塊間的原子通信量,提升計(jì)算效率。

    2) 初始化環(huán)境。CPE端對(duì)劃分后任務(wù)內(nèi)的原子信息進(jìn)行初始化,初始化信息包括原子的位置矢量、加速度、速度等。

    3) 計(jì)算參數(shù)初始化。初始化MPE端對(duì)Tersoff勢(shì)能下的離散計(jì)算參數(shù)。

    4) 力場(chǎng)計(jì)算。以任務(wù)為基本單位將原子信息加載至CPE端進(jìn)行加速計(jì)算,首先進(jìn)行MPE端至CPE端的數(shù)據(jù)拷貝,其次利用CPE端的計(jì)算陣列群加速核心計(jì)算,最后將計(jì)算后的各個(gè)任務(wù)原子信息由CPE端傳回MPE端。

    5) 同步力場(chǎng)數(shù)據(jù)。MPE端按照鄰居關(guān)系索引表進(jìn)行任務(wù)間數(shù)據(jù)更新操作,保證數(shù)據(jù)全局一致性。

    6) 更新殘量和輸出文件信息。CPE端進(jìn)行每個(gè)時(shí)間步計(jì)算后的殘量更新,MPE端將計(jì)算范數(shù)值輸出至文件系統(tǒng)。

    3 神威OpenACC從核移植

    神威OpenACC并行編程模型,用編譯指示的方式把應(yīng)用中可并行化的計(jì)算循環(huán)移植到申威處理器從核以加速計(jì)算。具體到Silicon-Crystal應(yīng)用的從核移植,主要分為以下三個(gè)步驟:

    1) 循環(huán)并行化。Silicon-Crystal應(yīng)用以任務(wù)分片存儲(chǔ)的數(shù)據(jù)為基本單位進(jìn)行模擬計(jì)算,在分塊級(jí)的for循環(huán)上添加相應(yīng)的指導(dǎo)語(yǔ)句#pragma acc parallel loop,將計(jì)算部署在64個(gè)從核上并行執(zhí)行。

    需要注意的是,gang、worker、vecotr是OpenACC2.0中的3層循環(huán)設(shè)計(jì),由于神威眾核架構(gòu)在物理上并沒(méi)有分層需求,所以神威OpenACC的實(shí)現(xiàn)是把gang設(shè)置成64,worker設(shè)為1。

    2) 基于計(jì)算數(shù)據(jù)優(yōu)先的數(shù)據(jù)管理。神威眾核架構(gòu)中存在訪存帶寬較小的問(wèn)題,故從核移植并行化過(guò)程最為關(guān)鍵的是將加速計(jì)算需要的數(shù)據(jù)提前拷貝到訪問(wèn)延遲低的SPM(scratch pad memory)。本研究采用計(jì)算數(shù)據(jù)優(yōu)先傳輸策略即將所有計(jì)算涉及的數(shù)據(jù)優(yōu)先傳至SPM。

    計(jì)算數(shù)據(jù)優(yōu)先傳輸過(guò)程如下:

    i) 按循環(huán)索引劃分傳輸。若數(shù)組的索引變量與循環(huán)索引變量緊耦合時(shí),神威OpenACC編譯器將數(shù)組劃分為64份,然后利用DMA的方式將劃分后的數(shù)據(jù)集中傳輸至各從核SPM中,并將任務(wù)內(nèi)的鄰居關(guān)系表、打包后的計(jì)算參數(shù)順序傳遞給從核。具體使用copy/copyin/cpoyout等指導(dǎo)語(yǔ)句完成(如圖5)。

    ①#pragma acc parallel loop?②local(pi) //變量局存私有化③copy(ax,ay,az,pox,poy,poz)annotate(dimension(ax(PN,N),ay(PN,N),az(PN,N))) //按循環(huán)索引傳輸④copyin(maplis) annotate(dimension(maplist(4?N))) //鄰居關(guān)系表傳輸⑤packin(deltaT,soma,Mu,Lamda,Beta,nexp,InteriorCutoff,ExteriorCutoff) //離散計(jì)算參數(shù)打包傳輸⑥for (pi = 0; pi < PN ; pi++){…}

    圖5 數(shù)據(jù)管理過(guò)程的函數(shù)指導(dǎo)語(yǔ)言實(shí)現(xiàn)
    Fig.5 Implementation of functional instruction language based on data management

    ii) 變量局存私有化。對(duì)于并行循環(huán)索引變量等線程私有變量,既可使用private子句也可使用local子句將變量私有化,考慮到private是線程私有化變量,變量值仍在主存中,而local是線程私有化的局存變量,存儲(chǔ)在SPM中,數(shù)據(jù)訪問(wèn)更加高效,故采用local子句進(jìn)行變量的私有化。

    iii) 離散計(jì)算參數(shù)打包傳輸。Silicon-Crystal應(yīng)用存在多個(gè)離散標(biāo)量的模擬參數(shù)需要傳送至從核,若一一傳輸需要頻繁的使用DMA方式,會(huì)大大增加訪存開(kāi)銷。在此情況下,本文利用pack/packin/packout等神威定制的指導(dǎo)語(yǔ)句將離散數(shù)據(jù)打包后一次傳遞,以更充分有效地利用有限的訪存帶寬。

    綜上,得到 Silion-Crystal應(yīng)用移植中的數(shù)據(jù)管理過(guò)程的函數(shù)指導(dǎo)語(yǔ)言實(shí)現(xiàn)如圖5。

    3) 加速代碼區(qū)約束處理。SWACC編譯器進(jìn)行OpenACC并行化過(guò)程中,對(duì)并行區(qū)的代碼有一定的要求。如在加速區(qū)代碼中存在函數(shù)調(diào)用時(shí),需在函數(shù)定義處添加routine子句指示,否則生成從核代碼將找不到函數(shù)的位置。但目前routine子句只適用Fortran程序,C代碼暫不支持。Silicon-Crystal應(yīng)用程序是C代碼程序,無(wú)法利用routine子句修飾從核函數(shù)。本研究通過(guò)利用宏定義實(shí)現(xiàn)力場(chǎng)計(jì)算的內(nèi)聯(lián)函數(shù),來(lái)解決移植過(guò)程中加速區(qū)函數(shù)返回值異常的問(wèn)題。

    圖6 神威OpenACC移植性能數(shù)據(jù)Fig.6 Performance data of the Sunway OpenACC transplant

    將運(yùn)行在1個(gè)主核上的Silicon-Crystal作為測(cè)試基準(zhǔn),分別與循環(huán)并行化、基于計(jì)算數(shù)據(jù)優(yōu)先的訪存和離散計(jì)算參數(shù)打包傳輸3個(gè)方面在單核組上進(jìn)行性能測(cè)試(圖6)。測(cè)試問(wèn)題規(guī)模:回環(huán)中存在131 072個(gè)粒子,迭代計(jì)算次數(shù)為1 000次。

    可以看出,對(duì)于訪存密集型的應(yīng)用,僅進(jìn)行循環(huán)并行化將計(jì)算過(guò)程移至CPE端,性能反而會(huì)降低;按照計(jì)算數(shù)據(jù)優(yōu)先方式通過(guò)DMA方式放入從核SPM中,性能開(kāi)始超越主核;通過(guò)pack子句對(duì)離散計(jì)算參數(shù)打包后再傳輸,性能進(jìn)一步提升,整體應(yīng)用較主核版實(shí)現(xiàn)了2.26倍的加速。

    4 數(shù)據(jù)流驅(qū)動(dòng)的任務(wù)圖并行化

    AceMesh任務(wù)調(diào)度系統(tǒng)的設(shè)計(jì)思想來(lái)源于數(shù)據(jù)結(jié)構(gòu)中的有向無(wú)環(huán)圖,即任務(wù)依賴圖。任務(wù)依賴圖在圖論中是指:如果一個(gè)有向圖無(wú)法從某個(gè)頂點(diǎn)出發(fā)經(jīng)過(guò)若干條邊回到該點(diǎn),則這個(gè)圖是一個(gè)任務(wù)依賴圖。任務(wù)依賴圖中的頂點(diǎn)代表任務(wù),圖中的邊代表任務(wù)間的依賴關(guān)系。根據(jù)任務(wù)依賴圖的特點(diǎn),將并行計(jì)算中的大規(guī)模計(jì)算問(wèn)題劃分為N(N≥1)個(gè)任務(wù),并根據(jù)各個(gè)任務(wù)的依賴關(guān)系建立任務(wù)依賴圖,圖中所有沒(méi)有后繼的頂點(diǎn)都執(zhí)行完后,任務(wù)依賴圖的執(zhí)行完成。

    在神威眾核處理器上任務(wù)圖并行化過(guò)程分為任務(wù)構(gòu)圖期和任務(wù)執(zhí)行期。構(gòu)圖期是任務(wù)構(gòu)建的探測(cè)過(guò)程,旨在根據(jù)注冊(cè)的數(shù)據(jù)地址去建立任務(wù)間的依賴關(guān)系,在不改變串行序結(jié)果的情況下以數(shù)據(jù)流調(diào)整執(zhí)行序列;執(zhí)行期是指按照構(gòu)圖期間構(gòu)建的DAG圖,搭配任務(wù)調(diào)度系統(tǒng)的不同調(diào)度策略執(zhí)行任務(wù)的過(guò)程。故任務(wù)圖并行化總時(shí)間等于構(gòu)圖時(shí)間(graph time)加執(zhí)行時(shí)間(execution time)。

    Silicon-Crystal應(yīng)用在太湖之光上使用任務(wù)圖并行化主要分為以下3個(gè)步驟:

    1)主核構(gòu)建任務(wù)依賴圖。根據(jù)不同并行區(qū)內(nèi)劃分的任務(wù)按照對(duì)內(nèi)部訪問(wèn)的數(shù)據(jù)依賴關(guān)系進(jìn)行地址注冊(cè),構(gòu)建出任務(wù)執(zhí)行序DAG圖。

    圖7為Silicon-Crystal應(yīng)用2線程4任務(wù)依賴圖。其中,每個(gè)橢圓代表包裝后的一個(gè)任務(wù),橢圓中第一個(gè)數(shù)字為并行區(qū)編號(hào),第二個(gè)數(shù)字為任務(wù)編號(hào);箭頭代表任務(wù)間的數(shù)據(jù)訪問(wèn)先后的依賴關(guān)系;陰影、非陰影圓圈代表執(zhí)行時(shí)不同的線程;實(shí)線邊是任務(wù)垂直后繼依賴邊,虛線邊是普通后繼依賴邊。在任務(wù)執(zhí)行期間,采用的調(diào)度策略使垂直后繼任務(wù)優(yōu)先于普通后繼任務(wù)執(zhí)行,旨在使任務(wù)間的數(shù)據(jù)重用得到最大化。此外,截?cái)嗖⑿袇^(qū)間任務(wù)執(zhí)行的依賴關(guān)系,按照與神威OpenACC相同的控制流驅(qū)動(dòng)的fork-join執(zhí)行模式,稱為任務(wù)圖單步執(zhí)行。

    圖7 2線程4任務(wù)時(shí)TP模塊任務(wù)依賴圖Fig.7 Task dependency graph of TP module under 2 threads 4 tasks

    圖8 神威OpenACC與任務(wù)圖并行化性能Fig.8 Performance of the Sunway Open ACC andtask graph parallelization

    2)從核包裝任務(wù)函數(shù),將應(yīng)用主要的計(jì)算代碼包裝成任務(wù)函數(shù)。從核任務(wù)函數(shù)根據(jù)構(gòu)圖期分配的函數(shù)參數(shù)、循環(huán)劃分尺寸、數(shù)據(jù)區(qū)劃分尺寸等信息,包裝任務(wù)函數(shù),放入從核陣列并行計(jì)算。

    3)從核數(shù)據(jù)管理。SW26010主從核間的數(shù)據(jù)傳輸通過(guò)DMA實(shí)現(xiàn),DMA只能由從核發(fā)起,主核被動(dòng)進(jìn)行數(shù)據(jù)傳輸。從核制定傳輸?shù)哪J綍r(shí),數(shù)據(jù)傳輸依據(jù)數(shù)據(jù)在主存數(shù)據(jù)區(qū)內(nèi)存儲(chǔ)地址的連續(xù)性和從核計(jì)算實(shí)際需要的數(shù)據(jù)尺寸進(jìn)行傳輸。DMA數(shù)據(jù)傳輸方式分為跨步式數(shù)據(jù)傳輸和非跨步式數(shù)據(jù)傳輸。兩種傳輸模式下,軟件開(kāi)銷主要體現(xiàn)在傳輸?shù)膯?dòng)和對(duì)DMA傳輸回答字的處理。本研究采用數(shù)據(jù)分片存儲(chǔ)的數(shù)據(jù)結(jié)構(gòu),將任務(wù)訪問(wèn)的數(shù)據(jù)進(jìn)行分片存儲(chǔ),并以數(shù)據(jù)塊編號(hào)為索引劃定數(shù)據(jù)區(qū),通過(guò)athread_get/athread_put接口進(jìn)行非跨步傳輸;對(duì)于離散數(shù)據(jù)訪問(wèn),在主核代碼中對(duì)離散數(shù)據(jù)打包后,使用DMA方式進(jìn)行數(shù)據(jù)傳輸,最后在從核代碼中對(duì)數(shù)據(jù)進(jìn)行解包,提高離散數(shù)據(jù)的訪問(wèn)效率。

    本節(jié)將第3節(jié)中OpenACC優(yōu)化后的版本(ACC)作為基礎(chǔ)版,同等的優(yōu)化條件下,與任務(wù)圖單步版(single step of DAG)、任務(wù)圖亂序版(Unordered DAG)進(jìn)行實(shí)驗(yàn)對(duì)比。迭代時(shí)間步長(zhǎng)為1時(shí),Silicon-Crystal應(yīng)用性能如圖8所示。

    可以看出,由于任務(wù)圖單步版和OpenACC采用相同的fork-join模式,即并行區(qū)開(kāi)始spawn線程,并行區(qū)結(jié)束wait所有線程,故二者的執(zhí)行時(shí)間一致,說(shuō)明兩者具有計(jì)算一致性。任務(wù)圖亂序版比任務(wù)單步版提升27%,驗(yàn)證了任務(wù)間的亂序執(zhí)行,可以錯(cuò)開(kāi)峰值帶寬競(jìng)爭(zhēng),充分的利用從核訪存帶寬。但是,由于神威OpenACC采用fork-join模式,其執(zhí)行時(shí)間即為總時(shí)間;數(shù)據(jù)流驅(qū)動(dòng)的任務(wù)圖并行需要在構(gòu)圖期構(gòu)建任務(wù)執(zhí)行的依賴關(guān)系,故其總時(shí)間為構(gòu)圖時(shí)間與執(zhí)行時(shí)間之和。實(shí)驗(yàn)結(jié)果表明,Silicon-Crystal應(yīng)用的任務(wù)圖并行化存在相對(duì)總時(shí)間8%的構(gòu)圖時(shí)間,加上此部分構(gòu)圖開(kāi)銷,總時(shí)間上任務(wù)圖并行比ACC性能提升11.5%。

    表1 多時(shí)間步擴(kuò)展下任務(wù)圖并行化構(gòu)時(shí)間Tab.1 Times of task graph parallelization based on multiple time steps

    圖9 多時(shí)間步下任務(wù)圖并行化加速比Fig.9 Acceleration ratio of task graph parallelizationunder multiple time steps

    傳統(tǒng)的fork-join模式無(wú)法擴(kuò)展多時(shí)間步的迭代計(jì)算,任務(wù)圖卻可打通迭代時(shí)間步間的并行區(qū)域,即在構(gòu)圖期依據(jù)多個(gè)時(shí)間步下任務(wù)的數(shù)據(jù)流構(gòu)建出任務(wù)依賴圖,執(zhí)行期按多時(shí)間步下任務(wù)亂序調(diào)度方式執(zhí)行任務(wù),從而將迭代時(shí)間步由單時(shí)間步擴(kuò)展至多時(shí)間步,如表1所示,隨著任務(wù)圖并行在多時(shí)間步的擴(kuò)展,執(zhí)行時(shí)間進(jìn)一步降低,構(gòu)圖時(shí)間逐漸降低,使得任務(wù)圖并行性能進(jìn)一步提升。

    多時(shí)間步下任務(wù)圖并行化加速比如圖9所示,以主核版作為基準(zhǔn)版,使用神威OpenACC移植利用從核加速,實(shí)現(xiàn)2.26倍加速比;時(shí)間步為1時(shí)任務(wù)圖并行加速比為2.52;隨著時(shí)間步的擴(kuò)展,任務(wù)圖規(guī)模隨之增加,任務(wù)的亂序使錯(cuò)峰訪存的優(yōu)勢(shì)進(jìn)一步擴(kuò)大,時(shí)間步擴(kuò)展至20時(shí)趨于平穩(wěn),加速比達(dá)到3.2。

    5 總結(jié)與未來(lái)工作

    本研究為Silicon-Crystal應(yīng)用設(shè)計(jì)了一套在SW26010上實(shí)現(xiàn)主從計(jì)算的并行化方案,利用OpenACC完成了向目標(biāo)平臺(tái)“神威·太湖之光”上的移植,在單核組內(nèi)實(shí)現(xiàn)了2.52倍加速;針對(duì)該應(yīng)用訪存密集的行為特點(diǎn),以數(shù)據(jù)流驅(qū)動(dòng)的任務(wù)圖并行化方法解決任務(wù)間的峰值訪存和跨時(shí)間迭代問(wèn)題,結(jié)果表明,Silicon-Crystal應(yīng)用在數(shù)據(jù)流驅(qū)動(dòng)的任務(wù)圖并行在單時(shí)間步下性能提升11.5%,多時(shí)間步下性能提升42%,總體較主核實(shí)現(xiàn)3.2倍加速。

    數(shù)據(jù)流驅(qū)動(dòng)的任務(wù)圖并行編程模型采用AceMesh任務(wù)調(diào)度系統(tǒng)中的低級(jí)接口對(duì)程序源碼進(jìn)行優(yōu)化,隨著本課題組數(shù)據(jù)驅(qū)動(dòng)的并行調(diào)度系統(tǒng)自動(dòng)轉(zhuǎn)譯器的完善,未來(lái)將使用指導(dǎo)語(yǔ)言的高級(jí)形式對(duì)代碼進(jìn)行自動(dòng)源源變換,從而實(shí)現(xiàn)通過(guò)指導(dǎo)語(yǔ)言方式對(duì)應(yīng)用任務(wù)圖并行的自動(dòng)化過(guò)程。

    猜你喜歡
    神威任務(wù)調(diào)度數(shù)據(jù)流
    流翔高鈣顯神威 科學(xué)種植促增收
    汽車維修數(shù)據(jù)流基礎(chǔ)(下)
    基于改進(jìn)NSGA-Ⅱ算法的協(xié)同制造任務(wù)調(diào)度研究
    基于時(shí)間負(fù)載均衡蟻群算法的云任務(wù)調(diào)度優(yōu)化
    一種提高TCP與UDP數(shù)據(jù)流公平性的擁塞控制機(jī)制
    三角函數(shù)結(jié)論求值顯神威
    云計(jì)算環(huán)境中任務(wù)調(diào)度策略
    基于數(shù)據(jù)流聚類的多目標(biāo)跟蹤算法
    云計(jì)算中基于進(jìn)化算法的任務(wù)調(diào)度策略
    《神威啟示錄》系列報(bào)道三 神威現(xiàn)代中藥研發(fā)的新思考
    少妇精品久久久久久久| 日韩av在线免费看完整版不卡| 两性夫妻黄色片| 国产一区亚洲一区在线观看| 亚洲精品国产av成人精品| 国产精品蜜桃在线观看| 老汉色av国产亚洲站长工具| 亚洲熟女精品中文字幕| 97在线人人人人妻| 久久精品aⅴ一区二区三区四区 | 国产精品人妻久久久影院| 国产av国产精品国产| 99热全是精品| 国产成人午夜福利电影在线观看| 国产黄色免费在线视频| www.熟女人妻精品国产| 亚洲av免费高清在线观看| 亚洲美女搞黄在线观看| 久久女婷五月综合色啪小说| 久久这里只有精品19| 最近中文字幕高清免费大全6| 一级黄片播放器| 精品一区二区三卡| 亚洲国产精品一区二区三区在线| 日韩三级伦理在线观看| 老司机亚洲免费影院| 精品人妻一区二区三区麻豆| 中文字幕另类日韩欧美亚洲嫩草| 日韩大片免费观看网站| 日韩免费高清中文字幕av| 久久人人97超碰香蕉20202| 99国产精品免费福利视频| 天天躁夜夜躁狠狠久久av| 中文字幕人妻熟女乱码| 美女福利国产在线| 亚洲少妇的诱惑av| 成人亚洲欧美一区二区av| 免费在线观看黄色视频的| 午夜免费鲁丝| 日韩一区二区三区影片| 欧美av亚洲av综合av国产av | 久热久热在线精品观看| 亚洲精品美女久久久久99蜜臀 | 国产不卡av网站在线观看| 久久久久久久久久久久大奶| 欧美精品av麻豆av| 久久久久久免费高清国产稀缺| 久久毛片免费看一区二区三区| 男女免费视频国产| 中文字幕色久视频| a 毛片基地| 国产色婷婷99| 成人毛片60女人毛片免费| 成人国语在线视频| 国产老妇伦熟女老妇高清| tube8黄色片| 国产av精品麻豆| 国产一区二区在线观看av| 国产成人免费无遮挡视频| 欧美日韩亚洲高清精品| 欧美最新免费一区二区三区| 国产麻豆69| 少妇猛男粗大的猛烈进出视频| 欧美日韩亚洲高清精品| 国产av码专区亚洲av| 性少妇av在线| 老司机影院成人| 国产日韩欧美在线精品| 男的添女的下面高潮视频| 午夜激情久久久久久久| 秋霞在线观看毛片| 国产在线视频一区二区| 国产极品粉嫩免费观看在线| 欧美亚洲 丝袜 人妻 在线| 一本—道久久a久久精品蜜桃钙片| 亚洲国产最新在线播放| 亚洲第一av免费看| 老鸭窝网址在线观看| 免费久久久久久久精品成人欧美视频| 精品少妇一区二区三区视频日本电影 | 国产精品免费大片| 看免费av毛片| 人妻少妇偷人精品九色| 中文字幕制服av| 三上悠亚av全集在线观看| 女人高潮潮喷娇喘18禁视频| 在线观看免费视频网站a站| 黄片小视频在线播放| 国产一区二区激情短视频 | 久久精品国产自在天天线| 成人国产av品久久久| 色网站视频免费| 黄色一级大片看看| 捣出白浆h1v1| 看非洲黑人一级黄片| 国产成人a∨麻豆精品| 九九爱精品视频在线观看| 久久久国产精品麻豆| 又大又黄又爽视频免费| 国产精品久久久久成人av| 日本欧美视频一区| 欧美亚洲 丝袜 人妻 在线| 我的亚洲天堂| 女人高潮潮喷娇喘18禁视频| 91午夜精品亚洲一区二区三区| 91久久精品国产一区二区三区| 少妇熟女欧美另类| 国产一区二区激情短视频 | 免费黄频网站在线观看国产| 国产精品国产三级专区第一集| 久久热在线av| 久久精品国产鲁丝片午夜精品| 国产av码专区亚洲av| 大码成人一级视频| 久久久久国产精品人妻一区二区| 亚洲精品美女久久久久99蜜臀 | 日韩av在线免费看完整版不卡| 在线观看国产h片| 妹子高潮喷水视频| 色网站视频免费| 又粗又硬又长又爽又黄的视频| 人妻少妇偷人精品九色| 国产在线视频一区二区| 久久久久视频综合| 麻豆精品久久久久久蜜桃| 一本一本久久a久久精品综合妖精 国产伦在线观看视频一区 | 在现免费观看毛片| 欧美激情 高清一区二区三区| 日韩中字成人| av不卡在线播放| 在线观看免费视频网站a站| 欧美亚洲 丝袜 人妻 在线| 日本爱情动作片www.在线观看| 999久久久国产精品视频| 夫妻性生交免费视频一级片| 欧美日韩亚洲国产一区二区在线观看 | 电影成人av| 中国国产av一级| 国产欧美日韩一区二区三区在线| 性高湖久久久久久久久免费观看| 99热网站在线观看| 五月天丁香电影| 国产精品国产av在线观看| 久久99蜜桃精品久久| 亚洲色图综合在线观看| 日日啪夜夜爽| 边亲边吃奶的免费视频| 久久青草综合色| 黑人巨大精品欧美一区二区蜜桃| 美女大奶头黄色视频| 国产成人av激情在线播放| 午夜精品国产一区二区电影| 肉色欧美久久久久久久蜜桃| 精品第一国产精品| videos熟女内射| 成人毛片60女人毛片免费| 久久影院123| 女人被躁到高潮嗷嗷叫费观| 国产av码专区亚洲av| 97在线视频观看| 香蕉精品网在线| 国产高清不卡午夜福利| 午夜久久久在线观看| 久久久精品区二区三区| 黑丝袜美女国产一区| 免费久久久久久久精品成人欧美视频| 国产爽快片一区二区三区| 在线天堂最新版资源| 国产激情久久老熟女| 韩国高清视频一区二区三区| 亚洲欧美精品自产自拍| 黑人欧美特级aaaaaa片| 亚洲精品一区蜜桃| 最新的欧美精品一区二区| 最近中文字幕高清免费大全6| 涩涩av久久男人的天堂| 国产黄频视频在线观看| 精品卡一卡二卡四卡免费| 日韩精品免费视频一区二区三区| 亚洲美女视频黄频| 欧美日韩av久久| 91精品三级在线观看| 菩萨蛮人人尽说江南好唐韦庄| 亚洲精品日本国产第一区| 亚洲视频免费观看视频| 桃花免费在线播放| 热re99久久精品国产66热6| 90打野战视频偷拍视频| 色哟哟·www| 18禁动态无遮挡网站| 一级毛片黄色毛片免费观看视频| 我的亚洲天堂| 国产精品久久久av美女十八| 汤姆久久久久久久影院中文字幕| 一本久久精品| 国产探花极品一区二区| 2018国产大陆天天弄谢| 欧美成人午夜免费资源| 中文天堂在线官网| 午夜日韩欧美国产| 午夜福利乱码中文字幕| 女性生殖器流出的白浆| av又黄又爽大尺度在线免费看| 麻豆乱淫一区二区| 国产福利在线免费观看视频| 啦啦啦中文免费视频观看日本| 老女人水多毛片| 大香蕉久久成人网| 老司机影院成人| 日本黄色日本黄色录像| 伦理电影免费视频| 国产xxxxx性猛交| 在线观看免费日韩欧美大片| 国产精品嫩草影院av在线观看| 亚洲男人天堂网一区| 成人国产av品久久久| 久久久国产欧美日韩av| 国产欧美日韩综合在线一区二区| 少妇人妻精品综合一区二区| 欧美xxⅹ黑人| 亚洲国产欧美网| 亚洲视频免费观看视频| 一本色道久久久久久精品综合| 一级黄片播放器| 国产av精品麻豆| 黑人欧美特级aaaaaa片| 如何舔出高潮| 在线天堂中文资源库| 亚洲一码二码三码区别大吗| 桃花免费在线播放| 国产成人欧美| 丝袜人妻中文字幕| 丰满少妇做爰视频| 亚洲久久久国产精品| 18禁裸乳无遮挡动漫免费视频| 妹子高潮喷水视频| 1024视频免费在线观看| 在线观看免费高清a一片| 国产一区有黄有色的免费视频| 在线天堂最新版资源| 国产精品无大码| 亚洲欧洲精品一区二区精品久久久 | 在线天堂最新版资源| 在线观看国产h片| 久久久国产欧美日韩av| 中文欧美无线码| 在线 av 中文字幕| 国产高清不卡午夜福利| 欧美日韩视频高清一区二区三区二| 亚洲图色成人| 考比视频在线观看| 99久国产av精品国产电影| 国产无遮挡羞羞视频在线观看| 久久久久久久亚洲中文字幕| 最近中文字幕2019免费版| 如日韩欧美国产精品一区二区三区| 精品一区在线观看国产| 伊人久久大香线蕉亚洲五| 亚洲av中文av极速乱| 午夜老司机福利剧场| 午夜福利,免费看| 中文字幕色久视频| 新久久久久国产一级毛片| 亚洲精品,欧美精品| 欧美人与性动交α欧美软件| 久久精品人人爽人人爽视色| 天美传媒精品一区二区| 国产不卡av网站在线观看| 中文字幕色久视频| 精品亚洲乱码少妇综合久久| 婷婷色综合大香蕉| 久久久精品区二区三区| 亚洲精品久久久久久婷婷小说| 亚洲精品国产av成人精品| 看免费成人av毛片| 成人影院久久| 美女中出高潮动态图| 日韩不卡一区二区三区视频在线| 亚洲三区欧美一区| 精品福利永久在线观看| 夜夜骑夜夜射夜夜干| 捣出白浆h1v1| 观看美女的网站| 老女人水多毛片| 免费在线观看黄色视频的| 麻豆精品久久久久久蜜桃| 国产福利在线免费观看视频| 亚洲四区av| 女人久久www免费人成看片| 成人影院久久| 国产又色又爽无遮挡免| 激情五月婷婷亚洲| 久久婷婷青草| 亚洲内射少妇av| 国产在线一区二区三区精| 黄片无遮挡物在线观看| 一边摸一边做爽爽视频免费| 亚洲精品aⅴ在线观看| 一级毛片我不卡| 国产一区二区三区综合在线观看| 国产一区二区 视频在线| 美女午夜性视频免费| 久久久精品国产亚洲av高清涩受| 天堂俺去俺来也www色官网| 国产一区二区激情短视频 | 美女大奶头黄色视频| 成年女人毛片免费观看观看9 | 色哟哟·www| tube8黄色片| 亚洲国产av影院在线观看| 久久久久久免费高清国产稀缺| 日韩av不卡免费在线播放| 婷婷色综合www| 女人久久www免费人成看片| 在线观看美女被高潮喷水网站| 亚洲人成网站在线观看播放| 欧美中文综合在线视频| 亚洲欧美色中文字幕在线| 免费在线观看黄色视频的| 超碰97精品在线观看| 午夜日本视频在线| 日韩 亚洲 欧美在线| 肉色欧美久久久久久久蜜桃| 免费在线观看视频国产中文字幕亚洲 | 可以免费在线观看a视频的电影网站 | 日日啪夜夜爽| av片东京热男人的天堂| 久久精品国产a三级三级三级| 国产一区二区三区av在线| 少妇人妻精品综合一区二区| freevideosex欧美| 少妇 在线观看| 男女免费视频国产| 亚洲国产色片| 日本-黄色视频高清免费观看| 大片免费播放器 马上看| av有码第一页| 一二三四中文在线观看免费高清| 国产一区二区三区综合在线观看| 亚洲色图综合在线观看| av有码第一页| 亚洲精品av麻豆狂野| 国产成人一区二区在线| 国产一区二区 视频在线| 另类亚洲欧美激情| 91久久精品国产一区二区三区| 午夜福利乱码中文字幕| 丰满乱子伦码专区| 欧美老熟妇乱子伦牲交| 国产高清国产精品国产三级| 午夜福利,免费看| 成人18禁高潮啪啪吃奶动态图| 精品人妻在线不人妻| 嫩草影院入口| 1024香蕉在线观看| 国产精品一区二区在线不卡| av视频免费观看在线观看| 夫妻午夜视频| 80岁老熟妇乱子伦牲交| 中文字幕最新亚洲高清| 1024香蕉在线观看| 久久人人爽av亚洲精品天堂| 不卡视频在线观看欧美| 国产成人免费无遮挡视频| 国产在线免费精品| 亚洲国产欧美网| 国产精品一区二区在线观看99| 国产av国产精品国产| 91精品三级在线观看| 我的亚洲天堂| av有码第一页| 亚洲国产最新在线播放| 日本-黄色视频高清免费观看| 日韩免费高清中文字幕av| 在线天堂最新版资源| 春色校园在线视频观看| 欧美xxⅹ黑人| 777久久人妻少妇嫩草av网站| 亚洲一码二码三码区别大吗| 亚洲欧美精品综合一区二区三区 | av卡一久久| 亚洲中文av在线| 亚洲色图综合在线观看| 欧美最新免费一区二区三区| 亚洲精品国产av成人精品| 波野结衣二区三区在线| 久久久久久久久免费视频了| 如何舔出高潮| 夜夜骑夜夜射夜夜干| 午夜免费观看性视频| 欧美日韩视频精品一区| 青春草国产在线视频| 成人手机av| 妹子高潮喷水视频| 欧美日韩精品成人综合77777| 超碰97精品在线观看| 一区在线观看完整版| 美女视频免费永久观看网站| 欧美bdsm另类| 99久久人妻综合| 国产一区二区在线观看av| 涩涩av久久男人的天堂| 久久久国产一区二区| 久久这里有精品视频免费| www.熟女人妻精品国产| 99国产精品免费福利视频| 亚洲色图综合在线观看| 大陆偷拍与自拍| 婷婷色综合www| 最近最新中文字幕大全免费视频 | 色哟哟·www| 国产成人午夜福利电影在线观看| 亚洲精品久久午夜乱码| 国产精品.久久久| av国产久精品久网站免费入址| 久久久久久久久久人人人人人人| 一本大道久久a久久精品| 满18在线观看网站| 秋霞在线观看毛片| 观看av在线不卡| 久久久久久久国产电影| 亚洲一级一片aⅴ在线观看| 日韩视频在线欧美| 国产高清国产精品国产三级| 久久鲁丝午夜福利片| 精品少妇内射三级| 日本免费在线观看一区| 热99国产精品久久久久久7| 久久99一区二区三区| 一二三四在线观看免费中文在| 亚洲av中文av极速乱| 国产精品一二三区在线看| 日本午夜av视频| 天天躁夜夜躁狠狠躁躁| 久久久久视频综合| 久久久欧美国产精品| 我的亚洲天堂| 免费高清在线观看日韩| 不卡av一区二区三区| 天天躁夜夜躁狠狠久久av| 青春草国产在线视频| 99香蕉大伊视频| 国产深夜福利视频在线观看| 在线观看三级黄色| 国产精品国产av在线观看| 色视频在线一区二区三区| 黄色配什么色好看| 精品久久久精品久久久| 天天躁夜夜躁狠狠久久av| 啦啦啦啦在线视频资源| 一区二区三区精品91| 国产成人aa在线观看| 亚洲美女搞黄在线观看| 欧美老熟妇乱子伦牲交| av又黄又爽大尺度在线免费看| 国产亚洲一区二区精品| 狠狠婷婷综合久久久久久88av| 国产精品女同一区二区软件| 美女xxoo啪啪120秒动态图| 18+在线观看网站| 日本爱情动作片www.在线观看| 老汉色av国产亚洲站长工具| 国语对白做爰xxxⅹ性视频网站| 制服丝袜香蕉在线| 亚洲三区欧美一区| 亚洲国产av新网站| 巨乳人妻的诱惑在线观看| 国产亚洲最大av| 欧美日本中文国产一区发布| 日韩欧美精品免费久久| 日韩一本色道免费dvd| 妹子高潮喷水视频| 日日撸夜夜添| 考比视频在线观看| 国产成人免费无遮挡视频| 中文字幕人妻丝袜制服| 日韩一区二区三区影片| 精品一区二区三区四区五区乱码 | 人人澡人人妻人| 国产精品.久久久| 亚洲四区av| 国产精品国产三级专区第一集| 三上悠亚av全集在线观看| 各种免费的搞黄视频| 一区二区日韩欧美中文字幕| 青春草亚洲视频在线观看| 1024香蕉在线观看| 久久午夜综合久久蜜桃| 久久久精品免费免费高清| 桃花免费在线播放| 久久人人97超碰香蕉20202| 看非洲黑人一级黄片| 建设人人有责人人尽责人人享有的| 午夜福利在线观看免费完整高清在| 国产在视频线精品| 日韩一本色道免费dvd| 婷婷成人精品国产| 日日撸夜夜添| 亚洲视频免费观看视频| 色播在线永久视频| 亚洲av欧美aⅴ国产| 久热久热在线精品观看| 国产精品人妻久久久影院| 尾随美女入室| 性色avwww在线观看| 久久久久久久久久久久大奶| 纯流量卡能插随身wifi吗| 亚洲精品乱久久久久久| 亚洲精品一二三| 少妇猛男粗大的猛烈进出视频| 国产成人精品久久二区二区91 | 乱人伦中国视频| 高清av免费在线| 捣出白浆h1v1| 女性被躁到高潮视频| 在线观看免费日韩欧美大片| 精品亚洲成国产av| 国产人伦9x9x在线观看 | 老司机亚洲免费影院| 黄片无遮挡物在线观看| 天天躁狠狠躁夜夜躁狠狠躁| 青春草亚洲视频在线观看| 老司机影院毛片| 免费黄色在线免费观看| 极品人妻少妇av视频| 另类亚洲欧美激情| 精品国产国语对白av| 麻豆av在线久日| 亚洲图色成人| 国产视频首页在线观看| 大陆偷拍与自拍| 日韩一区二区三区影片| 一级毛片 在线播放| 亚洲第一青青草原| 夜夜骑夜夜射夜夜干| 青草久久国产| 日本91视频免费播放| 国产精品女同一区二区软件| 免费女性裸体啪啪无遮挡网站| 在线观看www视频免费| 美女国产视频在线观看| 欧美激情 高清一区二区三区| 一级毛片我不卡| 久久99精品国语久久久| 十八禁高潮呻吟视频| 中国国产av一级| 考比视频在线观看| 91精品伊人久久大香线蕉| 亚洲精品aⅴ在线观看| 三上悠亚av全集在线观看| 有码 亚洲区| 看十八女毛片水多多多| 777久久人妻少妇嫩草av网站| 少妇人妻 视频| 亚洲人成网站在线观看播放| 亚洲国产最新在线播放| 国产精品成人在线| 午夜福利视频在线观看免费| 精品第一国产精品| 午夜福利在线观看免费完整高清在| 老汉色∧v一级毛片| 大片电影免费在线观看免费| 五月开心婷婷网| 欧美日韩av久久| 久久久精品国产亚洲av高清涩受| 热99久久久久精品小说推荐| 亚洲综合精品二区| 国产黄频视频在线观看| 国产又爽黄色视频| 日本爱情动作片www.在线观看| 纵有疾风起免费观看全集完整版| 中文字幕亚洲精品专区| 一边亲一边摸免费视频| 精品酒店卫生间| 777久久人妻少妇嫩草av网站| 亚洲国产av新网站| 亚洲国产精品999| 欧美国产精品va在线观看不卡| 欧美日韩一级在线毛片| 日韩精品免费视频一区二区三区| 精品少妇内射三级| 在线观看免费日韩欧美大片| 波多野结衣av一区二区av| 啦啦啦中文免费视频观看日本| 老鸭窝网址在线观看| 97在线人人人人妻| 日韩成人av中文字幕在线观看| 国产免费福利视频在线观看| 女人被躁到高潮嗷嗷叫费观| 一级毛片电影观看| 中文字幕另类日韩欧美亚洲嫩草| 亚洲五月色婷婷综合| 免费观看a级毛片全部| 久久精品国产a三级三级三级| 日韩一区二区视频免费看| 十分钟在线观看高清视频www| 精品国产一区二区三区四区第35| 亚洲av福利一区| 久热这里只有精品99| 人人澡人人妻人| 中文天堂在线官网| av在线app专区| 看免费av毛片| 亚洲一区二区三区欧美精品| 精品亚洲成a人片在线观看| 人人澡人人妻人| 伊人亚洲综合成人网| 男女午夜视频在线观看| 久久精品久久精品一区二区三区| 中文天堂在线官网| 国产亚洲精品第一综合不卡| av在线播放精品| 日韩一本色道免费dvd| tube8黄色片| 91精品国产国语对白视频|