• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于GPU 的LBM 遷移模塊算法優(yōu)化

    2024-02-29 04:39:52黃斌柳安軍潘景山田敏張煜朱光慧
    計(jì)算機(jī)工程 2024年2期
    關(guān)鍵詞:方向模型

    黃斌,柳安軍,潘景山*,田敏,張煜,朱光慧

    (1.齊魯工業(yè)大學(xué)(山東省科學(xué)院)山東省計(jì)算中心(國(guó)家超級(jí)計(jì)算濟(jì)南中心),山東 濟(jì)南 251013;2.濟(jì)南超級(jí)計(jì)算技術(shù)研究院高性能計(jì)算實(shí)驗(yàn)室,山東 濟(jì)南 251013;3.哈爾濱工業(yè)大學(xué)能源科學(xué)與工程學(xué)院,黑龍江 哈爾濱 150001)

    0 引言

    格子玻爾茲曼方法(LBM)是基于介觀定理的離散流體力學(xué)計(jì)算方法,通過(guò)描述粒子在固定格點(diǎn)中的運(yùn)動(dòng)來(lái)計(jì)算流體的運(yùn)動(dòng)狀態(tài)。相比于宏觀計(jì)算流體力學(xué)(CFD)方法需要求解二階偏微分方程(連續(xù)性方程、動(dòng)量方程),LBM 只需要求解一個(gè)一階偏微分方程(粒子數(shù)密度守恒方程)[1-2],通過(guò)計(jì)算介觀微團(tuán)的碰撞與遷移過(guò)程來(lái)演變宏觀物理過(guò)程。除此之外,作為一種瞬態(tài)演變算法,LBM 還具有描述簡(jiǎn)單、易于編程、復(fù)雜邊界易于設(shè)置等特性[3]。因此,該算法在提出不久后,已經(jīng)廣泛應(yīng)用于計(jì)算流體力學(xué)的相關(guān)領(lǐng)域[4-5]。另一方面,并行計(jì)算的出現(xiàn)加速了數(shù)值模擬計(jì)算的發(fā)展,高性能計(jì)算(HPC)逐漸在流體研究中扮演了重要角色。經(jīng)過(guò)幾十年的發(fā)展,并行計(jì)算已經(jīng)發(fā)展出了多種成熟的編程模型,其中基于圖形處理器(GPU)進(jìn)行加 速的有OpenCL[6]、OpenAcc[7]、統(tǒng)一計(jì) 算設(shè)備架構(gòu)(CUDA)[8-9]等。CUDA 是基于GPU 的一種并行計(jì)算平臺(tái)與編程模型,適合處理大規(guī)模的密集計(jì)算。

    與傳統(tǒng)的CFD 算法不同,LBM 算法本身就有著易于并行的特性,適合通過(guò)GPU 來(lái)對(duì)計(jì)算進(jìn)行加速。由于LBM 按照網(wǎng)格點(diǎn)來(lái)設(shè)計(jì)模型,因此計(jì)算任務(wù)可以按照網(wǎng)格點(diǎn)來(lái)分配給各個(gè)計(jì)算單元[10]?,F(xiàn)如今越來(lái)越多的研究人員選擇GPU 來(lái)對(duì)LBM 算法進(jìn)行并行加速,減少了科研計(jì)算時(shí)間:RAHMAN 等[11]利用GPU 計(jì)算基于LBM 算法的冪律非牛頓納米流體在矩形腔內(nèi)的磁流體動(dòng)力學(xué)熱溶質(zhì)自然對(duì)流流動(dòng);WATANABE 等[12]基于LBM 研究多潮汐渦輪機(jī),使用10 臺(tái)P100 GPU 加速,在9 h 內(nèi)完成了8.55×108規(guī)模網(wǎng)格點(diǎn)對(duì)10 臺(tái)潮汐渦輪機(jī)的大規(guī)模模擬;KIANI-OSHTORJANI 等[13]在GPU 上 基于LBM 研 究了流體與單個(gè)顆粒團(tuán)簇混合物中的耦合傳熱問(wèn)題。

    Palabos 是基于LBM 算法設(shè)計(jì)的計(jì)算流體力學(xué)軟件[14]。經(jīng)過(guò)十幾年的發(fā)展,Palabos 的功能逐漸完善,能夠完成更多的流體模型計(jì)算,如血液流動(dòng)模擬[15]、液滴碰撞[16]、多孔介質(zhì)[17]等。這些研究表明了Palabos 已經(jīng)成為一個(gè)熱門(mén)的研究LBM 算法的工具。KOTSALOS 等[18]在研究血液流動(dòng)時(shí)使用了GPU 并行,但是在所提算法中GPU 加速的是有限元法(npFEM),而液體的流動(dòng)計(jì)算是在CPU 上完成計(jì)算,因此,他們的研究中也沒(méi)有將LBM 算法完全GPU 并行。對(duì)于Palabos 來(lái)說(shuō),使用GPU 加速存在的難點(diǎn)是部分計(jì)算無(wú)法直接按照網(wǎng)格映射到計(jì)算單元,直接并行會(huì)存在數(shù)據(jù)沖突。

    LBM 含有兩個(gè)計(jì)算熱點(diǎn):碰撞(collide)和遷移(streaming)[19]。前者的計(jì)算是對(duì)格點(diǎn)本身的數(shù)據(jù)進(jìn)行計(jì)算,這樣并行后每個(gè)計(jì)算單元直接獲取數(shù)據(jù)就可以完成計(jì)算;后者則需要將自身的數(shù)據(jù)與周邊格點(diǎn)上的數(shù)據(jù)進(jìn)行交換,這部分存在著一定的數(shù)據(jù)依賴,不方便展開(kāi)并行。文獻(xiàn)[20]基于Palabos 對(duì)LBM算法做了并行優(yōu)化,由于遷移計(jì)算存在數(shù)據(jù)依賴,其只將碰撞計(jì)算部分做了并行,最終達(dá)到了1.5 左右的加速比。由此可見(jiàn),設(shè)計(jì)遷移模塊的并行算法能夠進(jìn)一步提升算法的計(jì)算效率。

    本文分析LBM 原算法的實(shí)現(xiàn)邏輯以及并行化的難點(diǎn),介紹并行算法的設(shè)計(jì)思路,測(cè)試優(yōu)化后算法的計(jì)算效率,并和原算法進(jìn)行對(duì)比。

    1 算法的原理與實(shí)現(xiàn)

    1.1 LBM

    LBM 由玻爾 茲曼方 程演化[21],在模型 建立時(shí)一次性完成求解非線性偏微分方程組的工作[22],這樣做使得研究人員在數(shù)值模擬計(jì)算中只需要處理簡(jiǎn)單的線性方程或方程組。通過(guò)離散分布函數(shù),LBM 使用一個(gè)碰撞算子來(lái)模擬一次迭代內(nèi)分布函數(shù)的演變,由此計(jì)算得到密度、壓強(qiáng)、內(nèi)能等諸多流場(chǎng)信息。LBM 在不同案例中的實(shí)現(xiàn)流程相似,如圖1 所示,核心的2 個(gè)計(jì)算模塊分別是碰撞和遷移。

    圖1 LBM 實(shí)現(xiàn)流程Fig.1 Implementation process of LBM

    LBM 中的基本模型為DnQm模型(n為空間維度,m為離散格點(diǎn)上的速度分量數(shù)量),本文采用的模型為D3Q19,它的速度分量分布如圖2 所示(彩色效果見(jiàn)《計(jì)算機(jī)工程》官網(wǎng)HTML 版本,下同)。

    圖2 D3Q19 速度分量模型Fig.2 D3Q19 velocity component model

    LBM 簡(jiǎn)化后的核心公式,計(jì)算平衡態(tài)的分布函數(shù)如下:

    其中:ωk為各個(gè)速度分量的權(quán)重;ck為速度分量的方向;cs為無(wú)量綱聲速;u為速度。之后由碰撞算子來(lái)更新分布函數(shù),如下所示:

    其中:τ表示平衡態(tài)的松弛時(shí)間,與宏觀下流體的擴(kuò)散系數(shù)有關(guān)。

    1.2 熱點(diǎn)分析

    針對(duì)算法進(jìn)行熱點(diǎn)分析是并行算法優(yōu)化前的必要步驟,本文選取Palabos 中的經(jīng)典案例——三維方腔流動(dòng)模型。表1 所示為三維方腔流動(dòng)計(jì)算的計(jì)算函數(shù)熱點(diǎn),該測(cè)試的網(wǎng)格數(shù)為1 283,其中碰撞與遷移部分計(jì)算時(shí)間占比超過(guò)70%。

    表1 三維方腔流動(dòng)各個(gè)計(jì)算熱點(diǎn)占比 Table 1 Each computing hotspot proportion of three-dimensional square cavity flow case %

    之前的工作大多只將碰撞計(jì)算部分放在GPU上進(jìn)行加速[20]。根據(jù)模型中的網(wǎng)格,將格點(diǎn)映射到GPU 中的計(jì)算單元,每個(gè)計(jì)算單元負(fù)責(zé)一個(gè)格點(diǎn)中的數(shù)據(jù)計(jì)算。因?yàn)榇嬖跀?shù)據(jù)依賴,完成碰撞計(jì)算后無(wú)法在GPU 繼續(xù)完成遷移部分的計(jì)算,需要將計(jì)算結(jié)果傳回CPU 計(jì)算,異構(gòu)系統(tǒng)上的數(shù)據(jù)傳輸產(chǎn)生了大量的時(shí)間消耗,所以將遷移計(jì)算部分也放在GPU上不僅能夠達(dá)到更好的優(yōu)化效果,同時(shí)對(duì)于遷移計(jì)算來(lái)說(shuō)還可以省去數(shù)據(jù)傳輸?shù)牟襟E,提升數(shù)據(jù)在GPU 端的利用率。

    1.3 遷移計(jì)算的實(shí)現(xiàn)

    在遷移計(jì)算中,每個(gè)格點(diǎn)中的速度分量需要按照一定的規(guī)律與周?chē)顸c(diǎn)中的速度分量進(jìn)行數(shù)據(jù)交換。Palabos 串行計(jì)算下遷移計(jì)算的偽代碼如算法1所示。

    上述偽代碼中主要執(zhí)行的是swap 函數(shù),其運(yùn)算法則如圖3 所示。其中:數(shù)據(jù)a與b代表當(dāng)前格點(diǎn)中位置i與位置i+9 上的速度分量,數(shù)據(jù)c與d代表相鄰格點(diǎn)中位置i與位置i+9 上的速度分量,1≤i≤9。

    圖3 swap 函數(shù)的運(yùn)算法則Fig.3 Operation law of swap function

    根據(jù)上述偽代碼以及圖3 中sawp 函數(shù)的運(yùn)算規(guī)律可以看出,在遷移計(jì)算中,除了中心點(diǎn)0 之外,剩余的18 個(gè)點(diǎn)都需要參與數(shù)據(jù)交換。每次交換涉及3 個(gè)數(shù)據(jù):兩個(gè)為格點(diǎn)本身的數(shù)據(jù),一個(gè)為周?chē)顸c(diǎn)上的數(shù)據(jù)。18 個(gè)格點(diǎn)可分為9 組,每組都有一個(gè)固定的數(shù)據(jù)交換方向,如表2 所示。交換方式為:當(dāng)前格點(diǎn)上位置為i和i+9 的速度分量與對(duì)應(yīng)方向格點(diǎn)中位置i上的速度分量相互交換。

    表2 數(shù)據(jù)交換方向與速度分量的對(duì)應(yīng)關(guān)系 Table 2 Correspondence between data exchange direction and velocity component

    1.4 并行化存在的難點(diǎn)

    由以上分析可知,程序在串行執(zhí)行時(shí),按照網(wǎng)格的坐標(biāo)進(jìn)行遍歷,一個(gè)格點(diǎn)與周?chē)顸c(diǎn)的數(shù)據(jù)交換會(huì)對(duì)下一個(gè)格點(diǎn)獲取的數(shù)據(jù)產(chǎn)生影響,大部分的格點(diǎn)需要在之前的網(wǎng)格完成計(jì)算后才能進(jìn)行遷移計(jì)算。這樣就使得遷移計(jì)算不能像碰撞計(jì)算一樣,將每個(gè)格點(diǎn)的遷移直接映射到一個(gè)計(jì)算單元上,使每個(gè)格點(diǎn)同時(shí)執(zhí)行遷移計(jì)算。

    LATT 等[23]在設(shè)計(jì)Palabos 的GPU 加速算法時(shí)也指出:遷移計(jì)算不能直接映射到一個(gè)格點(diǎn)中,因?yàn)榇嬖诜潜镜氐臄?shù)據(jù)訪問(wèn)。他們重新設(shè)計(jì)了算法,并在迭代中增加了用來(lái)推導(dǎo)數(shù)據(jù)來(lái)源的全局索引。這樣雖然解決了非本地?cái)?shù)據(jù)的訪問(wèn)問(wèn)題,但是增加了運(yùn)算成本。因此,設(shè)計(jì)合理的并行算法使得遷移計(jì)算能夠映射到每個(gè)計(jì)算單元上,能夠在不增加運(yùn)算成本的情況下解決遷移計(jì)算的數(shù)據(jù)依賴問(wèn)題。

    2 并行算法設(shè)計(jì)

    2.1 模型降維

    D3Q19 模型為三維模型,每個(gè)格點(diǎn)有x、y、z3 個(gè)下標(biāo)。通過(guò)分析算法1 可知,swap 函數(shù)獲取相鄰格點(diǎn)和當(dāng)前格點(diǎn)的坐標(biāo)至少有一個(gè)下標(biāo)是一致的,同時(shí)每個(gè)位置速度分量進(jìn)行交換的相鄰格點(diǎn)方向固定。因此,可將三維模型轉(zhuǎn)換為二維模型來(lái)進(jìn)行分析。如圖4 所示,根據(jù)速度分量的方向,三維的數(shù)據(jù)交換轉(zhuǎn)換為9 種二維數(shù)據(jù)交換。降低維度一方面使得數(shù)據(jù)依賴性降低,另一方面也使離散的算法更方便并行。將模型展開(kāi)成二維后,可以根據(jù)速度分量方向來(lái)分析遷移計(jì)算在各個(gè)方向的運(yùn)算規(guī)律。

    圖4 三維模型轉(zhuǎn)換為二維模型的示意圖Fig.4 Schematic diagram of converting a three-dimensional model to two-dimensional models

    網(wǎng)格中所有格點(diǎn)上固定位置的速度分量都和同方向的相鄰格點(diǎn)產(chǎn)生數(shù)據(jù)交換,例如坐標(biāo)為x、y、z的格點(diǎn),與位置1 上的速度分量進(jìn)行交換的格點(diǎn)坐標(biāo)為x-1、y、z。因此,相同位置速度分量進(jìn)行的數(shù)據(jù)交換都在同一條射線中完成,如圖5 所示。圖5(a)中射線與軸線平行,對(duì)應(yīng)的速度分量位置為1、2、3;圖5(b)中射線與正對(duì)角線平行,對(duì)應(yīng)的速度分量位置為4、6、8;圖5(c)中射線與正對(duì)角線垂直,對(duì)應(yīng)的速度分量位置為5、7、9。在二維模型的情況下,每個(gè)格點(diǎn)需要交換的數(shù)據(jù)只有固定方向上的格點(diǎn)。因此,二維模型數(shù)據(jù)交換可分解為多個(gè)方向一致、平行排列的一維射線。LBM 中流體模型邊界格點(diǎn)的碰撞與遷移計(jì)算與內(nèi)部不同,因此,進(jìn)行優(yōu)化的遷移計(jì)算不包括邊界上格點(diǎn)。

    圖5 二維模型下交換射線在網(wǎng)格中的排布方式Fig.5 Arrangement mode of exchange rays in grid in a two-dimensional model

    通過(guò)分析一維模型上的數(shù)據(jù)交換規(guī)律,對(duì)整體遷移計(jì)算完成前后數(shù)據(jù)的區(qū)別進(jìn)行對(duì)比,可以得到數(shù)據(jù)的交換規(guī)律。

    2.2 數(shù)據(jù)定位

    由圖5 可知,數(shù)據(jù)交換的方向有3 種:當(dāng)方向與軸線平行時(shí),每條射線上參與數(shù)據(jù)交換的格點(diǎn)數(shù)相同;當(dāng)方向與對(duì)角線平行或垂直時(shí),距離對(duì)角線越遠(yuǎn),參與數(shù)據(jù)交換的格點(diǎn)數(shù)越少。下文分別進(jìn)行討論。

    2.2.1 方向與軸線平行情況討論

    當(dāng)數(shù)據(jù)交換方向與軸線平行,同方向上參與交換的格點(diǎn)數(shù)量相同。按照?qǐng)D3 中swap 函數(shù)的交換規(guī)則,對(duì)同一條射線上的多個(gè)格點(diǎn)數(shù)據(jù)進(jìn)行交換處理,交換方式如圖6 所示。從左至右為串行情況下遷移計(jì)算的方向,第1 個(gè)格點(diǎn)為邊界格點(diǎn),不參與計(jì)算,但內(nèi)部的遷移計(jì)算會(huì)對(duì)邊界格點(diǎn)數(shù)據(jù)產(chǎn)生影響。當(dāng)參與計(jì)算的格點(diǎn)數(shù)大于3 時(shí)(正常計(jì)算時(shí)遠(yuǎn)大于這個(gè)值),除了第1、2 個(gè)以及最后一個(gè)格點(diǎn),中間部分格點(diǎn)的數(shù)據(jù)交換方式一致。

    圖6 同方向上的格點(diǎn)數(shù)大于等于3 時(shí)數(shù)據(jù)的交換方式Fig.6 Data exchange mode when the number of lattice points in the same direction is greater than or equal to 3

    按照swap 函數(shù)的計(jì)算規(guī)律,遷移計(jì)算完成后同一條射線上所有格點(diǎn)上的數(shù)據(jù)來(lái)源存在4 種不同的類型,如表3 中類型A、B、C、D 所示。

    表3 格點(diǎn)數(shù)據(jù)交換完成后獲取到的數(shù)據(jù)來(lái)源 Table 3 Data source obtained after the completion of the lattice point data exchange

    2.2.2 方向與對(duì)角線平行或垂直情況討論

    當(dāng)方向與對(duì)角線平行或垂直時(shí),大部分的數(shù)據(jù)交換情況與2.2.1 節(jié)中相同,但是存在射線上參與交換的格點(diǎn)數(shù)小于3 的情況。針對(duì)格點(diǎn)數(shù)為1 或2 的情況進(jìn)行數(shù)據(jù)交換處理,最終結(jié)果如圖7 所示。

    圖7 同方向上的格點(diǎn)數(shù)為1 或2 時(shí)數(shù)據(jù)的交換方式Fig.7 Data exchange mode when the number of lattice points in the same direction is 1 or 2

    按照swap 函數(shù)的交換規(guī)律,存在一種方式與2.2.1 節(jié)中不同,如 表3 中類 型E 所示。

    2.3 區(qū)域劃分

    完成數(shù)據(jù)定位后可以按照?qǐng)D5 中一條射線上的格點(diǎn)數(shù)量來(lái)對(duì)整體網(wǎng)格區(qū)域進(jìn)行劃分。例如:當(dāng)射線上的點(diǎn)大于等于3 個(gè)時(shí),射線上第1 個(gè)點(diǎn)(包括不在遷移計(jì)算區(qū)域的邊界格點(diǎn))的交換類型為A,第2 個(gè)點(diǎn)為類型B,中間部分的點(diǎn)為類型C,最后一個(gè)點(diǎn)為類型D;當(dāng)射線上的點(diǎn)為2 個(gè)時(shí),第1 個(gè)點(diǎn)為類型A,第2 個(gè)點(diǎn)為類型B,第3 個(gè)點(diǎn)為類型D;當(dāng)射線上的點(diǎn)只有1 個(gè)時(shí),第1 個(gè)點(diǎn)為類型A,第2 個(gè)點(diǎn)為類型E。

    將數(shù)據(jù)的交換類型映射到網(wǎng)格中,每個(gè)格點(diǎn)可以通過(guò)自身坐標(biāo)來(lái)獲取完成遷移計(jì)算需要的數(shù)據(jù)。根據(jù)格點(diǎn)的坐標(biāo)對(duì)網(wǎng)格進(jìn)行區(qū)域劃分,可以得到速度分量分組下不同數(shù)據(jù)交換類型的區(qū)域。由于在相同射線的排布方式下區(qū)域劃分的方式一致,因此只列出第一個(gè)位置上的映射區(qū)域,剩余位置區(qū)域劃分通過(guò)改變坐標(biāo)可得,結(jié)果如表4 所示,其中,N表示網(wǎng)格的長(zhǎng)度。

    表4 5 種交換類型在整體網(wǎng)格下的映射區(qū)域 Table 4 Mapping areas of five exchange types under the global grid

    通過(guò)模型降維、數(shù)據(jù)定位和區(qū)域劃分3 個(gè)步驟,可以解決串行計(jì)算中存在的數(shù)據(jù)依賴問(wèn)題。程序在CPU 端處理完數(shù)據(jù)后,將數(shù)據(jù)傳輸?shù)紾PU 端并存儲(chǔ)在全局內(nèi)存中,每個(gè)計(jì)算核心通過(guò)CUDA 模型中的線程和塊索引獲取格點(diǎn)的坐標(biāo),可直接完成碰撞部分的計(jì)算。為避免產(chǎn)生訪存沖突,需要等待所有計(jì)算核心完成碰撞計(jì)算后才能開(kāi)始遷移計(jì)算,因此,碰撞計(jì)算和遷移計(jì)算分為2 個(gè)核函數(shù)來(lái)完成。之后計(jì)算核心單元通過(guò)2.3 節(jié)中區(qū)域劃分的方式來(lái)獲取當(dāng)前格點(diǎn)計(jì)算所需要的數(shù)據(jù),完成遷移計(jì)算任務(wù)。

    3 并行算法測(cè)試與結(jié)果分析

    3.1 實(shí)驗(yàn)環(huán)境

    本文并行算法的測(cè)試在山河超級(jí)計(jì)算機(jī)單節(jié)點(diǎn)上完成,節(jié)點(diǎn)的相關(guān)信息如表5 所示。

    表5 測(cè)試環(huán)境 Table 5 Testing environment

    3.2 并行效果對(duì)比

    對(duì)于LBM 算法來(lái)說(shuō),由于需要大量的迭代計(jì)算,因此優(yōu)化每次迭代的時(shí)間消耗能夠節(jié)省大量的時(shí)間成本。根據(jù)上文設(shè)計(jì)的并行算法,測(cè)試在128×128×128 規(guī)模網(wǎng)格上并行優(yōu)化的效果,結(jié)果顯示:原程序的每次迭代平均運(yùn)行時(shí)間在0.36 s 左右,經(jīng)過(guò)優(yōu)化后時(shí)間減少到0.21 s 左右。計(jì)算的加速比在1.7 左右,表明了本文設(shè)計(jì)的并行算法具有可行性。

    通過(guò)程序在執(zhí)行時(shí)各個(gè)部分的計(jì)算時(shí)間可以了解算法的主要時(shí)間消耗,有利于優(yōu)化的進(jìn)行。中央處理器(CPU)端可以使用gprof 工具來(lái)計(jì)算函數(shù)的執(zhí)行時(shí)間,而GPU 端可以使用nvprof[24]工具來(lái)統(tǒng)計(jì)數(shù)據(jù)傳輸以及計(jì)算時(shí)間。在串行版本中,程序完成1×105步的迭代時(shí)間消耗在10 h 左右,經(jīng)過(guò)并行優(yōu)化,CPU-GPU 混合版本的計(jì)算時(shí)間消耗在5.8 h 左右。圖8 展示了CPU 版本和混合版本在128×128×128 網(wǎng)格上單次迭代中各個(gè)計(jì)算部分的時(shí)間消耗對(duì)比。從圖中可以看出,碰撞和遷移部分在并行后計(jì)算時(shí)間占比減少,由原本的71%減少到59%。

    圖8 串行算法和并行算法迭代中各個(gè)部分的執(zhí)行時(shí)間對(duì)比Fig.8 Comparison of execution time of each part in iteration by serial algorithm and parallel algorithm

    每秒百萬(wàn)網(wǎng)格更新數(shù)(MLUPS)是衡量LBM 算法性能的指標(biāo),計(jì)算方法如下:

    其中:Nx、Ny、Nz分 別為模型中x、y、z軸的長(zhǎng)度;I為迭代次數(shù);T為計(jì)算時(shí)間。MLUPS 指標(biāo)可反映流體算法的計(jì)算效率。如圖9 所示,通過(guò)對(duì)比不同規(guī)模下串行計(jì)算、只有碰撞部分并行以及本文算法的MLUPS 指標(biāo),表明設(shè)計(jì)的算法提升了流體計(jì)算的效率。

    圖9 不同網(wǎng)格規(guī)模下3 種算法的效率對(duì)比Fig.9 Efficiency comparison of three algorithms at different grid scales

    3.3 加速比與弱可擴(kuò)展性

    并行算法需要良好的擴(kuò)展性[25-26],當(dāng)計(jì)算的規(guī)模增大時(shí),并行程序仍然需要保持良好的優(yōu)化效果。針對(duì)這一問(wèn)題,對(duì)并行算法進(jìn)行其他網(wǎng)格維度下的計(jì)算測(cè)試。同時(shí),對(duì)計(jì)算的加速比與僅優(yōu)化碰撞部分的算法進(jìn)行比較,如圖10 所示。

    圖10 不同網(wǎng)格規(guī)模下加速比對(duì)比Fig.10 Comparison of acceleration ratios at different grid scales

    由圖10 可以看出,隨著網(wǎng)格規(guī)模的擴(kuò)大,算法的并行效果能保持一定的弱可擴(kuò)展性。在網(wǎng)格規(guī)模為512×512×512 時(shí),具有1.94 的加速比,同時(shí)并行算法的計(jì)算效率相比于只并行碰撞計(jì)算部分的情況提高了30%左右。

    4 結(jié)束語(yǔ)

    隨著高速計(jì)算機(jī)的發(fā)展,計(jì)算流體力學(xué)逐漸成為與理論流體力學(xué)、實(shí)驗(yàn)流體力學(xué)同樣重要的研究方向。充分發(fā)揮計(jì)算機(jī)的優(yōu)勢(shì)是計(jì)算流體力學(xué)發(fā)展過(guò)程中不可或缺的一環(huán),而這正是設(shè)計(jì)并行算法的意義所在。本文詳細(xì)分析了LBM 算法中的遷移計(jì)算部分在串行計(jì)算中的實(shí)現(xiàn)邏輯,證明了該部分并行的可行性,然后通過(guò)模型降維、數(shù)據(jù)定位、區(qū)域劃分等方法,基于CUDA 設(shè)計(jì)了并行算法。該算法成功解決了遷移計(jì)算中存在的數(shù)據(jù)依賴問(wèn)題。本文算法是基于單GPU 設(shè)計(jì)的,因此,下一階段工作將針對(duì)多GPU 的情況對(duì)算法進(jìn)行優(yōu)化,進(jìn)一步提高LBM算法的計(jì)算效率。

    猜你喜歡
    方向模型
    一半模型
    2022年組稿方向
    2022年組稿方向
    2021年組稿方向
    2021年組稿方向
    2021年組稿方向
    重要模型『一線三等角』
    重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
    3D打印中的模型分割與打包
    FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
    久久久国产成人精品二区| 亚洲国产欧美人成| 在线观看美女被高潮喷水网站 | 亚洲精华国产精华精| 国产日本99.免费观看| 一本精品99久久精品77| 啦啦啦韩国在线观看视频| 国产又黄又爽又无遮挡在线| 国产成人系列免费观看| 亚洲av成人av| 亚洲国产欧美人成| 国产一区二区在线av高清观看| 国产精品精品国产色婷婷| 欧美日韩乱码在线| 国产精品久久视频播放| 国产亚洲欧美98| 亚洲男人的天堂狠狠| 婷婷丁香在线五月| 国产精品永久免费网站| 国产又黄又爽又无遮挡在线| 免费观看精品视频网站| 欧美高清成人免费视频www| 免费看光身美女| 变态另类成人亚洲欧美熟女| 1000部很黄的大片| 嫩草影视91久久| 男女午夜视频在线观看| 免费av毛片视频| 丰满人妻一区二区三区视频av | 国产高清有码在线观看视频| av女优亚洲男人天堂| 91麻豆av在线| 日本一本二区三区精品| 国内精品美女久久久久久| 宅男免费午夜| 麻豆成人午夜福利视频| 国产亚洲精品综合一区在线观看| 国产午夜精品久久久久久一区二区三区 | 变态另类丝袜制服| 国产成人aa在线观看| 日韩大尺度精品在线看网址| 身体一侧抽搐| 舔av片在线| 一级黄片播放器| 少妇的逼水好多| 欧美一区二区精品小视频在线| 免费高清视频大片| 国产成人av教育| 天堂av国产一区二区熟女人妻| 悠悠久久av| 国产国拍精品亚洲av在线观看 | 国产精品99久久99久久久不卡| 日韩 欧美 亚洲 中文字幕| 日韩欧美免费精品| 欧美日韩亚洲国产一区二区在线观看| 国产乱人伦免费视频| 国产午夜精品久久久久久一区二区三区 | 欧美av亚洲av综合av国产av| 首页视频小说图片口味搜索| 久久久国产成人精品二区| 国产精品 国内视频| 91麻豆精品激情在线观看国产| 成人特级黄色片久久久久久久| 国产 一区 欧美 日韩| 国产久久久一区二区三区| 少妇人妻精品综合一区二区 | 国产野战对白在线观看| 岛国视频午夜一区免费看| 一个人免费在线观看电影| 欧美成人一区二区免费高清观看| 欧美日韩福利视频一区二区| 老司机福利观看| 国产欧美日韩精品一区二区| 熟妇人妻久久中文字幕3abv| 精品国产亚洲在线| 美女免费视频网站| 中文字幕熟女人妻在线| 美女 人体艺术 gogo| 成人精品一区二区免费| 久久人人精品亚洲av| 欧美性猛交╳xxx乱大交人| 国产亚洲欧美98| 国产精品乱码一区二三区的特点| 色吧在线观看| 国产精品美女特级片免费视频播放器| 无限看片的www在线观看| 亚洲午夜理论影院| 成年女人看的毛片在线观看| 中文字幕熟女人妻在线| 亚洲国产精品久久男人天堂| 国产视频一区二区在线看| 岛国视频午夜一区免费看| 精品一区二区三区视频在线 | 一个人免费在线观看电影| 特大巨黑吊av在线直播| 全区人妻精品视频| 欧美一区二区国产精品久久精品| 午夜福利成人在线免费观看| 三级国产精品欧美在线观看| 18禁在线播放成人免费| 欧美日韩亚洲国产一区二区在线观看| 色哟哟哟哟哟哟| 免费高清视频大片| 51国产日韩欧美| 久久精品国产综合久久久| 无遮挡黄片免费观看| 女人十人毛片免费观看3o分钟| 欧美国产日韩亚洲一区| 又粗又爽又猛毛片免费看| 一个人免费在线观看的高清视频| 欧美日韩亚洲国产一区二区在线观看| 亚洲专区国产一区二区| 丰满乱子伦码专区| 法律面前人人平等表现在哪些方面| av福利片在线观看| 亚洲精品粉嫩美女一区| 蜜桃亚洲精品一区二区三区| 成年女人看的毛片在线观看| 亚洲国产欧美人成| 日韩欧美在线二视频| 全区人妻精品视频| 免费看美女性在线毛片视频| 久久久久精品国产欧美久久久| 亚洲专区国产一区二区| 五月伊人婷婷丁香| 午夜日韩欧美国产| 亚洲在线观看片| 老熟妇乱子伦视频在线观看| 国产成人系列免费观看| 免费搜索国产男女视频| 色av中文字幕| h日本视频在线播放| 亚洲成人精品中文字幕电影| 舔av片在线| 很黄的视频免费| 欧美一级a爱片免费观看看| 国产精品国产高清国产av| 日韩成人在线观看一区二区三区| 露出奶头的视频| 亚洲成人久久爱视频| 久久久久久久亚洲中文字幕 | 国产乱人伦免费视频| 97人妻精品一区二区三区麻豆| 国产精品日韩av在线免费观看| 桃红色精品国产亚洲av| 日本一本二区三区精品| 久久久久久九九精品二区国产| 亚洲内射少妇av| 国产精品嫩草影院av在线观看 | 丁香欧美五月| 国产一区二区激情短视频| 69av精品久久久久久| 99热6这里只有精品| 免费人成在线观看视频色| 亚洲人成网站在线播放欧美日韩| 亚洲自拍偷在线| 哪里可以看免费的av片| 国产亚洲精品久久久com| 亚洲精品乱码久久久v下载方式 | 我要搜黄色片| 真人一进一出gif抽搐免费| 美女高潮的动态| 一本综合久久免费| 亚洲av成人不卡在线观看播放网| 男女下面进入的视频免费午夜| 欧美黑人巨大hd| 欧美中文综合在线视频| www日本在线高清视频| 精品电影一区二区在线| 黄色女人牲交| 中文字幕熟女人妻在线| 中文字幕精品亚洲无线码一区| 免费一级毛片在线播放高清视频| 精品一区二区三区人妻视频| 免费av毛片视频| 18美女黄网站色大片免费观看| 首页视频小说图片口味搜索| 亚洲成av人片在线播放无| 国内精品美女久久久久久| 欧美黑人欧美精品刺激| 免费人成视频x8x8入口观看| 极品教师在线免费播放| 欧美乱妇无乱码| 精品久久久久久成人av| 免费无遮挡裸体视频| 啦啦啦免费观看视频1| 国产一区二区三区在线臀色熟女| 日韩有码中文字幕| 免费观看精品视频网站| 麻豆成人av在线观看| av欧美777| 日韩欧美免费精品| 桃色一区二区三区在线观看| 亚洲在线观看片| 亚洲电影在线观看av| 国产精品久久久人人做人人爽| 色播亚洲综合网| 欧美另类亚洲清纯唯美| 天天一区二区日本电影三级| 亚洲真实伦在线观看| 午夜福利免费观看在线| 99在线视频只有这里精品首页| 黄色丝袜av网址大全| 日韩精品中文字幕看吧| 少妇丰满av| 午夜福利视频1000在线观看| 国产成人av激情在线播放| 午夜免费成人在线视频| 久久九九热精品免费| 搡老熟女国产l中国老女人| 香蕉av资源在线| 国产中年淑女户外野战色| 亚洲av五月六月丁香网| 极品教师在线免费播放| 精品久久久久久久久久免费视频| 麻豆久久精品国产亚洲av| 午夜福利在线观看吧| 熟女少妇亚洲综合色aaa.| 成人永久免费在线观看视频| 亚洲自拍偷在线| 久久久久久久午夜电影| 99在线视频只有这里精品首页| 久久久久久久亚洲中文字幕 | 午夜福利在线观看免费完整高清在 | 18禁黄网站禁片午夜丰满| 久久久久精品国产欧美久久久| 91九色精品人成在线观看| 精品一区二区三区视频在线观看免费| 国产一区在线观看成人免费| 制服丝袜大香蕉在线| 日本黄色片子视频| 午夜免费男女啪啪视频观看 | 男女午夜视频在线观看| 十八禁网站免费在线| 免费搜索国产男女视频| 国产97色在线日韩免费| 日韩大尺度精品在线看网址| 波野结衣二区三区在线 | 免费观看的影片在线观看| 免费在线观看日本一区| 国内少妇人妻偷人精品xxx网站| 欧美一区二区国产精品久久精品| 97超级碰碰碰精品色视频在线观看| 在线十欧美十亚洲十日本专区| 久久人人精品亚洲av| 69人妻影院| 女人被狂操c到高潮| 内射极品少妇av片p| 久久国产乱子伦精品免费另类| 欧美性猛交╳xxx乱大交人| 国产美女午夜福利| 99精品在免费线老司机午夜| 亚洲成人精品中文字幕电影| 免费观看人在逋| 丰满人妻熟妇乱又伦精品不卡| 亚洲电影在线观看av| 成人特级av手机在线观看| tocl精华| 怎么达到女性高潮| 麻豆久久精品国产亚洲av| 床上黄色一级片| 精品一区二区三区视频在线 | 欧美午夜高清在线| 一区二区三区免费毛片| 色尼玛亚洲综合影院| 国产视频一区二区在线看| 国产精品久久久久久精品电影| 亚洲欧美日韩高清专用| 亚洲国产日韩欧美精品在线观看 | 18禁黄网站禁片午夜丰满| 一本综合久久免费| 一区福利在线观看| 18禁裸乳无遮挡免费网站照片| 国产精品一区二区免费欧美| 波野结衣二区三区在线 | 久久午夜亚洲精品久久| 亚洲av中文字字幕乱码综合| 老熟妇仑乱视频hdxx| 午夜福利免费观看在线| 国产成人av教育| 国内精品久久久久精免费| 悠悠久久av| 精品久久久久久久毛片微露脸| 女警被强在线播放| 91在线观看av| 在线观看一区二区三区| 国产亚洲精品久久久com| 香蕉久久夜色| 成人三级黄色视频| 日本 欧美在线| 午夜精品一区二区三区免费看| 成人国产一区最新在线观看| 最近视频中文字幕2019在线8| 级片在线观看| 国产精品影院久久| 最近最新免费中文字幕在线| 中文字幕av在线有码专区| 亚洲自拍偷在线| 免费看十八禁软件| 成人一区二区视频在线观看| 国产一区二区在线观看日韩 | 国产高清videossex| 91久久精品电影网| 精品免费久久久久久久清纯| 国产av一区在线观看免费| 日韩精品青青久久久久久| 少妇裸体淫交视频免费看高清| 久久伊人香网站| 成年女人看的毛片在线观看| 国产精品女同一区二区软件 | 波多野结衣高清作品| 一级黄片播放器| 三级男女做爰猛烈吃奶摸视频| 一a级毛片在线观看| 成人av在线播放网站| 欧美乱色亚洲激情| 九九久久精品国产亚洲av麻豆| 1024手机看黄色片| 无限看片的www在线观看| 久久婷婷人人爽人人干人人爱| 在线观看免费午夜福利视频| 免费看光身美女| 岛国视频午夜一区免费看| 国产成人aa在线观看| 韩国av一区二区三区四区| www.色视频.com| 国产成人影院久久av| 中文在线观看免费www的网站| 亚洲中文字幕一区二区三区有码在线看| 亚洲熟妇熟女久久| 午夜精品在线福利| 亚洲在线自拍视频| 精品电影一区二区在线| 国产一区二区三区在线臀色熟女| 欧美丝袜亚洲另类 | 久久久久久大精品| 夜夜夜夜夜久久久久| www日本在线高清视频| 手机成人av网站| 九九久久精品国产亚洲av麻豆| 一级作爱视频免费观看| 欧美绝顶高潮抽搐喷水| 久久婷婷人人爽人人干人人爱| 一级作爱视频免费观看| 在线十欧美十亚洲十日本专区| 日韩欧美三级三区| 日本撒尿小便嘘嘘汇集6| 欧美日韩精品网址| 99在线人妻在线中文字幕| 中出人妻视频一区二区| 欧美三级亚洲精品| 超碰av人人做人人爽久久 | 欧美日韩综合久久久久久 | 人妻丰满熟妇av一区二区三区| 久久人人精品亚洲av| 午夜福利视频1000在线观看| 无限看片的www在线观看| 日本精品一区二区三区蜜桃| e午夜精品久久久久久久| 少妇熟女aⅴ在线视频| 亚洲激情在线av| 午夜激情欧美在线| 99国产精品一区二区三区| 久久这里只有精品中国| 熟女人妻精品中文字幕| 欧美不卡视频在线免费观看| 国产av不卡久久| 欧美极品一区二区三区四区| 人妻夜夜爽99麻豆av| 天美传媒精品一区二区| 啦啦啦观看免费观看视频高清| 亚洲精品日韩av片在线观看 | 国内精品久久久久精免费| 精华霜和精华液先用哪个| 一级作爱视频免费观看| 亚洲精品一卡2卡三卡4卡5卡| 丝袜美腿在线中文| 久久国产精品影院| 午夜福利视频1000在线观看| 日韩欧美 国产精品| 午夜精品在线福利| 日韩人妻高清精品专区| 国内精品久久久久久久电影| 亚洲自拍偷在线| 国产单亲对白刺激| 国产真人三级小视频在线观看| 婷婷丁香在线五月| 色综合亚洲欧美另类图片| 精品久久久久久久久久久久久| 99久久精品热视频| xxx96com| 少妇的逼好多水| 99精品在免费线老司机午夜| or卡值多少钱| 亚洲欧美日韩东京热| 69人妻影院| 亚洲av五月六月丁香网| 国产成人影院久久av| 国产午夜福利久久久久久| 午夜精品在线福利| 97碰自拍视频| 亚洲第一欧美日韩一区二区三区| 男女做爰动态图高潮gif福利片| 欧美中文综合在线视频| 99热只有精品国产| a级一级毛片免费在线观看| 久久久久久久午夜电影| 欧美+日韩+精品| 日本a在线网址| 国产精品国产高清国产av| 最近最新免费中文字幕在线| 不卡一级毛片| 三级毛片av免费| 女人高潮潮喷娇喘18禁视频| 亚洲欧美精品综合久久99| 国产主播在线观看一区二区| 男女那种视频在线观看| 免费高清视频大片| 欧美日本视频| 久久久久久久精品吃奶| 久久香蕉精品热| 国产欧美日韩一区二区精品| 神马国产精品三级电影在线观看| 首页视频小说图片口味搜索| 草草在线视频免费看| 级片在线观看| 亚洲精品粉嫩美女一区| 欧美+日韩+精品| 91久久精品国产一区二区成人 | 天美传媒精品一区二区| av福利片在线观看| 亚洲欧美日韩高清专用| 日韩欧美国产一区二区入口| 婷婷丁香在线五月| 丰满人妻一区二区三区视频av | 99久久精品热视频| 啦啦啦观看免费观看视频高清| 亚洲av日韩精品久久久久久密| 国产精品亚洲美女久久久| 日韩av在线大香蕉| 一区二区三区激情视频| 亚洲精华国产精华精| 免费无遮挡裸体视频| 国产成人影院久久av| 国产高清视频在线播放一区| 亚洲一区高清亚洲精品| 久久精品国产亚洲av香蕉五月| 国产精品一区二区免费欧美| 亚洲av电影在线进入| 欧美+日韩+精品| 欧美成人a在线观看| 中文亚洲av片在线观看爽| 别揉我奶头~嗯~啊~动态视频| av天堂在线播放| 色av中文字幕| 亚洲av免费在线观看| 亚洲av中文字字幕乱码综合| 狠狠狠狠99中文字幕| 波野结衣二区三区在线 | 日韩精品中文字幕看吧| 青草久久国产| 此物有八面人人有两片| 亚洲avbb在线观看| 深夜精品福利| 欧美乱码精品一区二区三区| 国产精品久久久久久人妻精品电影| 欧美区成人在线视频| 精品熟女少妇八av免费久了| 18禁黄网站禁片免费观看直播| av黄色大香蕉| 欧美性猛交黑人性爽| 两性午夜刺激爽爽歪歪视频在线观看| 十八禁人妻一区二区| 大型黄色视频在线免费观看| 色综合欧美亚洲国产小说| 久久中文看片网| 成人精品一区二区免费| 日韩av在线大香蕉| av在线蜜桃| 亚洲成a人片在线一区二区| 3wmmmm亚洲av在线观看| 欧美一级a爱片免费观看看| 嫩草影院精品99| 老司机在亚洲福利影院| 国产欧美日韩一区二区精品| 国产真实伦视频高清在线观看 | 成年女人毛片免费观看观看9| 香蕉av资源在线| 真人做人爱边吃奶动态| 亚洲国产精品成人综合色| 亚洲国产高清在线一区二区三| 三级毛片av免费| 欧美bdsm另类| 免费人成在线观看视频色| 制服丝袜大香蕉在线| 国产精品亚洲一级av第二区| 别揉我奶头~嗯~啊~动态视频| 日韩欧美精品v在线| 午夜久久久久精精品| 琪琪午夜伦伦电影理论片6080| 欧美精品啪啪一区二区三区| 精品欧美国产一区二区三| av中文乱码字幕在线| 国产成人啪精品午夜网站| АⅤ资源中文在线天堂| 国产探花极品一区二区| 男插女下体视频免费在线播放| 99久久久亚洲精品蜜臀av| 一进一出抽搐动态| 国产三级中文精品| 在线看三级毛片| 精品人妻1区二区| 99热6这里只有精品| 亚洲精品亚洲一区二区| 国产麻豆成人av免费视频| 国产亚洲精品久久久久久毛片| 久久精品91无色码中文字幕| h日本视频在线播放| 国内精品美女久久久久久| 日本一二三区视频观看| 国产一区二区三区视频了| 毛片女人毛片| 精品国产亚洲在线| 日本一二三区视频观看| 国产一级毛片七仙女欲春2| 麻豆成人午夜福利视频| 国产乱人视频| 久久九九热精品免费| 亚洲成人久久性| 亚洲成人久久爱视频| 国产爱豆传媒在线观看| 狂野欧美白嫩少妇大欣赏| 亚洲精品亚洲一区二区| 国产日本99.免费观看| 欧美一区二区精品小视频在线| 亚洲成人久久爱视频| 日韩免费av在线播放| 亚洲成人久久爱视频| 国内少妇人妻偷人精品xxx网站| 中文字幕精品亚洲无线码一区| 亚洲精品一区av在线观看| 女人被狂操c到高潮| 美女免费视频网站| 色综合欧美亚洲国产小说| 国内揄拍国产精品人妻在线| 中文在线观看免费www的网站| 精品乱码久久久久久99久播| 观看免费一级毛片| 黄片小视频在线播放| 99热精品在线国产| 久久久国产精品麻豆| 少妇的逼水好多| 久久久久久大精品| 亚洲午夜理论影院| 在线观看美女被高潮喷水网站 | 亚洲人成伊人成综合网2020| 亚洲精品一区av在线观看| 狂野欧美激情性xxxx| 久久国产乱子伦精品免费另类| 欧美日韩亚洲国产一区二区在线观看| 搡女人真爽免费视频火全软件 | 欧美日韩亚洲国产一区二区在线观看| 国产不卡一卡二| 日本三级黄在线观看| 免费av毛片视频| 男女那种视频在线观看| 免费高清视频大片| 9191精品国产免费久久| 制服丝袜大香蕉在线| 欧美乱色亚洲激情| 69av精品久久久久久| 亚洲成人免费电影在线观看| 国产精华一区二区三区| 日韩欧美 国产精品| 日本撒尿小便嘘嘘汇集6| 亚洲精品日韩av片在线观看 | 女同久久另类99精品国产91| 给我免费播放毛片高清在线观看| 我的老师免费观看完整版| x7x7x7水蜜桃| 久久国产乱子伦精品免费另类| 亚洲国产精品久久男人天堂| 免费电影在线观看免费观看| 亚洲在线观看片| 国产精品日韩av在线免费观看| 人人妻人人看人人澡| 欧美日韩乱码在线| 国产毛片a区久久久久| 十八禁人妻一区二区| 亚洲一区二区三区色噜噜| 可以在线观看的亚洲视频| 成人国产一区最新在线观看| e午夜精品久久久久久久| 一级a爱片免费观看的视频| 国产精品久久久久久久久免 | 特级一级黄色大片| av视频在线观看入口| 女同久久另类99精品国产91| 精品欧美国产一区二区三| 国产av在哪里看| 精品日产1卡2卡| 香蕉av资源在线| 亚洲在线观看片| 久久久久久国产a免费观看| 久久精品国产综合久久久| 超碰av人人做人人爽久久 | 亚洲美女黄片视频| 99久国产av精品| 国产伦精品一区二区三区视频9 | 欧美日韩综合久久久久久 | 香蕉久久夜色| 久久6这里有精品| 全区人妻精品视频| 好男人在线观看高清免费视频| 久久精品人妻少妇|