• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于CUDA的GPU條件分支分歧聚合優(yōu)化策略

    2014-10-24 22:25:12劉素芹安仲奇楊娜利王俊爽
    關鍵詞:線程分支語句

    劉素芹,王 鑫,安仲奇,楊娜利,王俊爽

    (中國石油大學計算機與通信工程學院,山東青島 266580)

    近年來由GPU作為加速部件的異構計算系統(tǒng)和技術,如CUDA[1]產生并得到發(fā)展。GPU擅長的SIMD(single instruction multiple data)執(zhí)行方式提高了系統(tǒng)的計算效率,但當程序出現(xiàn)條件分支分歧時,會部分或完全退化成串行執(zhí)行,性能損失嚴重。條件分支是控制程序執(zhí)行流的基本方式,易大量出現(xiàn),并且算法越復雜,對分支的利用就會越頻繁。因此,需要優(yōu)化GPU對條件分支的處理以更充分地發(fā)揮其并行計算的潛力。目前的研究主要集中在硬件層面設計線程調度器方面[2-5],對普通用戶而言實現(xiàn)難度較大,而利用現(xiàn)有體系結構從軟件層面優(yōu)化條件分支處理流程方面的研究還較少,因此筆者探索實現(xiàn)難度較低、可操作性較強的優(yōu)化方法。

    1 GPU條件分支處理機制分析

    1.1 基于CUDA的GPU處理條件分支的機制

    基于CUDA的GPU執(zhí)行沒有分支的語句時,線程束(warp[6])中的線程按照SIMD的方式步調一致地執(zhí)行,而遇到條件分支分歧時,處理過程則有所不同。對于較簡單的IF-ELSE語句,PTX[7]匯編器將PTX語句只編譯為GPU斷言指令。此時GPU的斷言設置指令處理IF語句的條件部分,并根據判斷結果設置斷言寄存器的各位,從而啟用或禁用對應的SIMD道。當執(zhí)行IF內部的語句時,操作被廣播至所有SIMD道,但只有斷言寄存器設為啟用的道執(zhí)行操作并流出結果,設為禁用的道并不執(zhí)行操作也不保存結果。ELSE部分處理方式與之類似。分支語句執(zhí)行結束后,SIMD道不再受斷言影響,繼續(xù)一致地執(zhí)行后續(xù)指令。當SIMD線程中的所有道都選擇了相同的路徑時,不被執(zhí)行的另一路徑的指令將被直接跳過。

    對于復雜控制流如嵌套條件語句,則需要混合使用斷言指令、GPU分支指令和同步指令。此時,當分支分歧時,棧條目被壓入分支同步棧,SIMD道轉到目標指令執(zhí)行。當分支收斂時,棧條目彈出,SIMD道轉回棧條目地址且斷言寄存器還原為上一層嵌套的掩碼。

    1.2 條件分支對計算性能的影響

    SIMD執(zhí)行方式處理條件分支時性能損失往往是顯著的。如果條件分支嵌套較深,可能導致多數SIMD道空閑,比如假設每條分支路徑的長度相同,兩層嵌套將使效率降低至25%,三層嵌套進一步降低至12.5%。在最壞情況下,所有SIMD元素將串行執(zhí)行,以 Fermi[8]架構為例,每兩個時鐘周期(SIMD線程寬度為32,執(zhí)行單元寬度為16)只能有一條SIMD道流出有效結果,其他道都被阻塞[9]。下列IF語句和IF-ELSE語句是造成SIMD執(zhí)行性能損失的兩種基本條件分支語句結構。

    (a)IF語句:

    (a)只有一條分支路徑,如果某一SIMD線程中的任意SIMD道需要執(zhí)行IF內部的語句,則同一SIMD線程中所有的SIMD道都會經過這個分支路徑,只是斷言寄存器設為禁用的道不執(zhí)行實際操作,因此部分計算資源閑置,性能有顯著損失。(b)相當于兩個(a)情況的疊加,同一SIMD線程中只有當所有SIMD道都選擇相同的路徑時才會少走一路分支路徑,其他情況下所有SIMD道都會經過兩個分支路徑,程序性能損失為(a)的兩倍。

    1.3 GPU條件分支優(yōu)化的研究現(xiàn)狀

    條件分支分歧對計算性能的影響主要是由GPU底層的處理方式造成的,因此現(xiàn)有優(yōu)化方法多傾向于設計某種新硬件機制來重新調度SIMD道,避免在SIMD線程內發(fā)生分支分歧,使其在每步計算中更充分地利用計算資源。DWF(dynamic warp formation)[10]和 DWS(dynamic warp subdivision)[11]即為兩種硬件機制:DWF的硬件調度器在每個時鐘周期分析SIMD線程,將執(zhí)行相同分支路徑的SIMD道整合生成新的SIMD線程;DWS則是將SIMD線程分解為子線程,子線程被獨立調度并交替執(zhí)行。Zhang等[12]提出了一種在運行時重新映射SIMD線程數據的方法,由于需要昂貴的CPU-GPU數據通信,整體優(yōu)化效果有限。

    以上優(yōu)化方案都是硬件層面的優(yōu)化,雖然較為有效,但對于一般的GPU計算用戶實現(xiàn)難度較大。因此,有必要探討實現(xiàn)難度更低,可操作性更強的優(yōu)化方法。本文中針對這一問題利用現(xiàn)有體系結構在軟件層面進行優(yōu)化,以期能在一定程度上優(yōu)化條件分支分歧。

    2 聚合優(yōu)化策略的設計方案

    從軟件層級入手,探索提升每步SIMD執(zhí)行的有效處理比重的方法,提出了利用“聚合”思想的SIMD分支優(yōu)化策略,該策略針對的具體情形如下列代碼所示。

    由于分支條件不能在編譯時確定,所以只有程序運行時才能決定線程的走向。此種情形由于GPU的執(zhí)行方式使得執(zhí)行某條路徑時只有選擇該路徑的SIMD道進行實際計算,其他道被阻塞,而分支處于循環(huán)體內部導致任意時刻都有大量資源閑置。

    鑒于此,聚合策略的主體思想是:在每步循環(huán)中,采用某種機制將不同SIMD道中選擇相同路徑的條件分支“聚合”到同一步循環(huán)中,力求提高每次循環(huán)的有效處理比重。為此,在具體實施過程中可以用不同的實現(xiàn)策略,本文著重對循環(huán)推遲和循環(huán)提前兩種實現(xiàn)策略進行討論。

    2.1 基于循環(huán)推遲的聚合優(yōu)化策略

    循環(huán)推遲的做法是在每一步循環(huán)中,SIMD線程中的所有SIMD道只執(zhí)行一條分支路徑,另一條分支路徑則被“掛起”,并被推遲到后續(xù)的循環(huán)中,與下一步循環(huán)合并后再擇機執(zhí)行。此前未執(zhí)行的SIMD道與即將執(zhí)行的SIMD道就“聚合”到了同一步SIMD執(zhí)行中。這樣做使得每次循環(huán)只執(zhí)行了一條路徑,另一條路徑直接跳過,因此所用時間是串行執(zhí)行兩條分支路徑的一半,從而使SIMD執(zhí)行的總數少于未優(yōu)化之前。

    圖1給出了一個SIMD線程常規(guī)分支執(zhí)行與采用循環(huán)推遲策略后分支執(zhí)行的兩種不同情況的對比示例。其中假設SIMD線程寬度為4,循環(huán)次數為3,帶下標的T和F分別代表條件判斷為真(True)和為假(False)的不同路徑,下標的左起第一位數代表的是在未優(yōu)化的情況下第幾次循環(huán)的編號,第二位數代表的是SIMD道的編號。

    圖1 使用基于循環(huán)推遲的聚合優(yōu)化策略的示例Fig.1 A branch execution example using converging optimization strategy based on loop postpone

    常規(guī)執(zhí)行時,如圖1(a),每次循環(huán)內要依次將所有分支路徑都執(zhí)行一次,從本例來說,共有6步SIMD執(zhí)行(每個循環(huán)包含兩次SIMD執(zhí)行)。采用了循環(huán)推遲的策略后,如(b)和(c)所示,雖然循環(huán)次數都有所增加,但是整體的SIMD執(zhí)行步數卻都有所減少(空路徑被直接跳過,執(zhí)行時間忽略不計),最多也與未優(yōu)化時相等。假設兩條分支路徑中的指令數目相同,則聚合后(b)情況執(zhí)行的指令數降低了16.7%,(c)情況則降低了33.3%。

    從上圖的例子中不難看出,當遇到分支分歧時“掛起”的分支路徑選擇的不同,會導致最終的聚合效果不同,因此循環(huán)推遲策略的關鍵是在每次循環(huán)中如何選擇要執(zhí)行的路徑。此處采用了兩種較為簡單的路徑選擇策略:多數優(yōu)先策略和輪轉策略。

    多數優(yōu)先策略是在每次分支分歧時選擇包含最多SIMD道的分支路徑執(zhí)行,即選擇執(zhí)行計算單元使用率最高的路徑。由于本文討論的條件分支有兩條路徑,所以這樣使得多數循環(huán)中SIMD執(zhí)行的有效道數必然大于等于SIMD總道數的一半,如圖1(b)中第0~3次循環(huán),從而提高SIMD計算單元的使用率,減少SIMD執(zhí)行的總次數,達到縮短計算時間的目的,并且整個執(zhí)行過程不會破壞每個SIMD道原有的循環(huán)執(zhí)行順序。但本策略可能導致處于冷門路徑的SIMD道遲遲得不到執(zhí)行,如圖1(b)中第2號道的第4次循環(huán),本文中稱這種現(xiàn)象為道饑餓。道饑餓現(xiàn)象的存在可能會造成最后幾步循環(huán)中只有少數SIMD道執(zhí)行實際操作,一定程度上限制了循環(huán)推遲的聚合效果,實際實現(xiàn)中可以采用周期性暫停本聚合策略來觸發(fā)冷門路徑的執(zhí)行以緩解道饑餓現(xiàn)象。

    輪轉策略是在每次循環(huán)中遇到分支分歧時,交替的選擇條件判斷為真或為假的路徑執(zhí)行,并將另一條路徑掛起和推遲到下一步循環(huán)中,從而達到聚合的效果,提高計算效率,如圖1(c)所示(采用先假后真交替循環(huán))。這樣雖然在最初幾次循環(huán)中聚合效果不如多數優(yōu)先策略,但是每次循環(huán)中有效執(zhí)行的SIMD道數卻較為均等,且多數情況下超過SIMD總道數的一半,同時還避免了道饑餓現(xiàn)象。不足之處是如果SIMD線程的所有SIMD道在某次循環(huán)中都選擇相同路徑,而此時根據輪轉策略恰好輪轉到了另一條路徑(此處稱這種現(xiàn)象為“空載”),會導致無用執(zhí)行,實際實現(xiàn)中遇到上述情況要切換分支走向。

    這兩種策略實現(xiàn)起來都非常方便,可以利用CUDA本身提供的統(tǒng)計各SIMD道狀態(tài)的函數來實現(xiàn),并且所引入的開銷也可忽略不計。

    影響循環(huán)推遲優(yōu)化效果的因素有以下4點:

    (1)如果分支指令規(guī)模小于實現(xiàn)循環(huán)推遲的指令規(guī)模,那么其帶來的收益可能不足以抵消本身的開銷,甚至會導致性能損失。

    (2)暫時阻塞分支同樣會阻塞相關SIMD元素對循環(huán)體中后續(xù)非分支代碼的執(zhí)行,如若分支指令數量相比后續(xù)非分支指令較少,循環(huán)推遲可能無法帶來理想的改進。

    (3)分支被執(zhí)行的頻率、SIMD元素分支變向的頻率等因素會影響循環(huán)推遲的效果。本文所采用的多數優(yōu)先策略和輪轉策略相對簡單,其改進效果依賴具體的分支模式。

    (4)循環(huán)推遲可能破壞原有的優(yōu)化的內存訪問模式,導致性能的下降。

    2.2 基于循環(huán)提前的聚合優(yōu)化策略

    循環(huán)提前的做法是將原本由兩次循環(huán)完成的任務“聚合”到一次循環(huán)中完成。這種策略適用于同一SIMD道執(zhí)行流中第N次循環(huán)與第N+1次循環(huán)所選擇的分支路徑不同的情況,假設程序只有兩個不同的分支路徑T路徑和F路徑,如圖2(a)和圖2(c)所示,當遇到這兩種情形時,可以考慮將第N+1次循環(huán)提前到第N次循環(huán)中執(zhí)行,如圖2(b)和圖2(d)所示,從而充分利用每一次循環(huán)。

    圖2 基于循環(huán)提前的聚合優(yōu)化策略的適用情況Fig.2 Circumstances converging optimization strategy based on loop advance targets

    循環(huán)提前策略的效果依賴于原有程序路徑選擇的情況,圖3給出了兩個使用基于循環(huán)提前的聚合優(yōu)化的兩個示例,每個示例中SIMD線程寬度為4,循環(huán)次數為4。

    示例1在使用了本策略后聚合效果達到了理想狀態(tài),如果兩條分支路徑中的指令數大致相當,則優(yōu)化后的指令數降為原來的50%。示例2在使用了本策略后聚合效果較為一般,并非所有的相鄰的循環(huán)都能使用循環(huán)提前策略,但總體性能仍然有一定提升,優(yōu)化后的指令數降為原來的75%。最壞情況下SIMD線程中的某些道在整個循環(huán)過程中都只選擇走同一條分支路徑,本策略則在這些道上不起作用,程序受這些道拖累性能沒有任何提升,還有可能下降。

    圖3 使用基于循環(huán)提前的聚合優(yōu)化策略的兩個示例Fig.3 Two branch execution examples using converging optimization strategy based on loop advance

    策略的實現(xiàn)可以通過改造原有條件分支的執(zhí)行模式,判斷相鄰兩次循環(huán)中條件分支的路徑走向,然后調整分支的執(zhí)行來實現(xiàn),引入的開銷也不大。由于循環(huán)提前可能會調換相鄰兩步循環(huán)的次序,因此需要滿足如下條件才能保證執(zhí)行結果的正確:

    (1)每步循環(huán)中各分支語句不依賴上一步循環(huán)的結果,即循環(huán)的先后次序可交換。

    (2)條件分支語句內的兩個不同分支之間不能出現(xiàn)相互依賴。

    (3)循環(huán)中條件分支以后不能直接出現(xiàn)非分支代碼。

    條件(3)的原因主要是,循環(huán)提前策略合并了相鄰的兩步循環(huán),從而減少了循環(huán)的次數,導致分支代碼之后的非分支代碼執(zhí)行的次數也相應減少,無法與之前未優(yōu)化的程序保持一致。如一定要有非分支代碼,則可以將非分支代碼整體拷貝或封裝成函數后分別移入到條件分支的不同路徑中。影響循環(huán)提前優(yōu)化效果的因素有循環(huán)推遲中的(1)、(3)、(4)條。此外,從圖3的分析也可看出,實際優(yōu)化效果依賴于程序中的分支出現(xiàn)圖2中兩種情況的比例。

    3 聚合優(yōu)化策略的實現(xiàn)

    從策略的設計來看,要實現(xiàn)聚合優(yōu)化策略勢必會引入新的條件分支判斷,這雖然會在局部影響到程序運行的效率,但其影響十分有限。因為這些額外的條件分支當中只包含很少的代碼,且多為復制和比較等簡單運算,計算時間十分短暫。本文將其歸結為“實現(xiàn)優(yōu)化策略所需的指令規(guī)?!?。只有當原有的分支指令規(guī)模接近或小于“實現(xiàn)優(yōu)化策略所需的指令規(guī)?!睍r才可能導致性能的損失。在需要采用聚合優(yōu)化策略的情況下,主要分支路徑中的指令規(guī)模要遠大于“實現(xiàn)優(yōu)化策略所需的指令規(guī)?!?,所以優(yōu)化主要分支所帶來的程序效率的提升要大于策略的開銷。

    3.1 基于循環(huán)推遲的聚合優(yōu)化策略的實現(xiàn)

    實現(xiàn)基于循環(huán)推遲的聚合策略的關鍵是實現(xiàn)兩種選擇路徑的策略,然后根據路徑選擇策略的結果掛起或執(zhí)行某些線程,其主體的示意性代碼如下:

    多數優(yōu)先策略的實現(xiàn)可以使用線程束投票函數__ballot()和整數處理函數__popc()。__ballot()函數可以檢查線程束中所有線程的斷言狀態(tài)并搜集至一個32位整數中,如果第n個線程的斷言值與參數值相同,那么返回的整數的第n位為1。__popc()能夠返回32位整數中位1的數目。使用這兩個函數可以找出被多數SIMD線程執(zhí)行的分支路徑,進而實施多數優(yōu)先策略。

    輪轉策略的實現(xiàn)方法比較直接,只需在循環(huán)中周期性地調轉分支走向即可。為避免“空載”分支路徑被執(zhí)行的情況,可以利用線程束投票函數__all()和__any()來進行判斷。如果所有SIMD線程的斷言狀態(tài)與參數相符,那么__all()返回非零值。如果SIMD線程中存在斷言狀態(tài)與參數相符的元素,那么__any()將返回非零值。利用這兩個函數可以在循環(huán)出現(xiàn)“空載”路徑時切換分支走向。

    3.2 基于循環(huán)提前的聚合優(yōu)化策略的實現(xiàn)

    由于循環(huán)提前策略需要考慮相鄰兩步循環(huán)所選的分支路徑才能決定循環(huán)是否需要提前,因此在循環(huán)體中分支語句之前需要計算出相鄰兩步循環(huán)中的分支條件。然后據此判明是圖2中的哪種具體情況,再對不同的情況分別采用不同的提前模式,處理過程的示意性代碼如下:

    代碼中將每次循環(huán)中條件分支中所要用到的不同的變量統(tǒng)稱為環(huán)境變量,可以是從某處讀取的數據,也可以是通過對循環(huán)變量i進行計算得到的數值等各種各樣的數據,但不能是循環(huán)之間相互依賴的數據。mode用于控制優(yōu)化策略模式,其取值為0、1、2。0代表無法對循環(huán)進行提前,循環(huán)按原有順序執(zhí)行。1代表圖2(b)中先F路徑后T路徑的模式,此時需要將第N+1次循環(huán)中的T路徑提前到本次進行,因此需要將循環(huán)變量以及各環(huán)境變量調整到第N+1次循環(huán)時的狀態(tài),之后再執(zhí)行第N次循環(huán)中的F路徑,此時又需要將循環(huán)變量和各環(huán)境變量重新調整回來,當兩個路徑都執(zhí)行完畢之后再把循環(huán)變量遞增1。2代表圖2(a)中先T路徑后F路徑的模式,同樣也需要類似的在兩次循環(huán)的不同循環(huán)變量和環(huán)境變量之間進行切換。

    4 試驗結果及分析

    試驗采用的GPU加速設備是GeForce GT 550M(GF108),擁有兩顆SIMD核心,每個核心有48道,單精度峰值計算性能為284.16GFlops。軟件環(huán)境是CUDA toolkit 5.0。

    4.1 基于循環(huán)推遲的聚合優(yōu)化策略試驗

    將32個SIMD線程(共32×48個CUDA線程)加載至同一SIMD核,以保證算術流水線滿載,避免指令級并行變化對性能的影響。每個SIMD線程中,各道的分支走向相互獨立,由 CURAND[13]庫通過偽隨機算法生成。每條分支路徑內部包含一系列數據依賴的混合乘加(fused-multiply-add,F(xiàn)MA)運算,并可通過改變混合乘加運算的多少來調節(jié)分支指令-非分支指令比(核函數中,分支路徑內指令數/分支路徑外指令數)。試驗對不同的分支指令-非分支指令比分別使用多數優(yōu)先和輪轉兩種選路策略進行優(yōu)化,并與未經優(yōu)化的分支執(zhí)行進行比較,得出加速比(優(yōu)化前執(zhí)行時間/優(yōu)化后執(zhí)行時間),試驗數據結果如圖4所示。

    從圖4中可以看出,當分支指令-非分支指令比較小時,由于聚合本身所帶來的開銷,加速比低于1,隨著分支指令規(guī)模的提升,加速比逐步提升。多數優(yōu)先策略測試取得的最佳加速比為1.152,輪轉策略測試取得的最佳加速比為1.256。由于多數優(yōu)先策略需要定期處理道饑餓現(xiàn)象,所以在多數情況下加速比低于輪轉策略。

    圖4 基于循環(huán)推遲的聚合優(yōu)化對性能的影響Fig.4 Performance impact of converging optimization strategy based on loop postpone

    4.2 基于循環(huán)提前的聚合優(yōu)化策略試驗

    加載的SIMD線程配置和分支路徑內的運算與基于循環(huán)推遲的聚合優(yōu)化策略相同,且同時滿足基于循環(huán)提前的聚合優(yōu)化策略的3個前提條件,針對條件(3)需要將循環(huán)內部原本位于條件分支語句后的非分支代碼封裝成函數移入條件分支內部。此處將這些函數稱為非分支代碼函數,并仍將其視作非分支代碼。

    循環(huán)提前的效果除了依賴于分支指令-非分支指令比,還依賴于循環(huán)中出現(xiàn)圖2中兩種情況的比例。此處將能夠提前的循環(huán)數與循環(huán)總數的比值稱為可提前比。由于同一SIMD道中每兩個相鄰循環(huán)都選擇不同路徑時也只有50%的循環(huán)可以提前,因此可提前比最大是0.5,最小是0,并且加速效果取決于可提前比最低的SIMD道。理想情況下,若只考慮分支代碼,則可提前比與加速比的關系為

    為更直觀反應本策略的有效性,在這里用線程號threadIdx和循環(huán)變量i使所有SIMD道中的可提前比一致,試驗時取了間隔相等的6個值。同時為了代表一般性,利用CURAND偽隨機算法生成分支走向,試驗數據結果如圖5所示。

    需要說明的是,圖中每條曲線的前兩個點的分支指令-非分支指令比是0.25和0.5,第三個點是1,以后每次遞增1。在不同的可提前比情況下,隨著分支代碼-非分支代碼比的增加,程序的加速比都在逐步提升并趨近于只有分支代碼時的理想情況。當程序中可提前比過低且分支指令少于非分支指令時,本策略產生的額外開銷將導致程序的加速比低于1。

    圖5 基于循環(huán)提前的聚合優(yōu)化對性能的影響Fig.5 Performance impact of converging optimization strategy based on loop advance

    5 結束語

    在軟件層級提出兩種利用“聚合”思想的SIMD分支優(yōu)化策略,將不同SIMD道中選擇相同路徑的條件分支“聚合”到了同一步循環(huán)中。壓縮了GPU執(zhí)行SIMD操作的實際次數,提高了GPU硬件在每次SIMD操作時的利用率。試驗表明,在滿足一定條件下能夠取得較為理想的加速比,與現(xiàn)有的硬件層面的優(yōu)化方案相比實現(xiàn)難度較低。本策略對分支結構有所要求,因此在一般性方面還存在不足。另外還可能存在一些影響優(yōu)化效果的其他因素需進一步改進。

    [1] NVIDIA.CUDA[EB/OL].[2013-05-12].https://developer.nvidia.com/cuda-downloads.

    [2] NARASIMAN V,SHEBANOW M,LEE C J,et al.Improving GPU performance via large warps and two-level warp scheduling[C]//Proceedings of the 44th Annual IEEE/ACM International Symposium on Microarchitecture.New York:ACM,c2011.

    [3] DIAMOS G,ASHBAOGH B,MAIYURAN S,et al.SIMD re-convergence at thread frontiers[C]//Proceedings of the 44th Annual IEEE/ACM International Symposium on Microarchitecture.New York:ACM,c2011.

    [4] BRUNIE N,COLLANGE S,DIAMOS G.Simultaneous branch and warp interweaving for sustained GPU performance[C]//Proceedings of the 39th International Symposium on Computer Architecture.Washington:IEEE Computer Society,c2012.

    [5] FUNG W L,AAMODT T M.Thread block compaction for efficient SIMT control flow[C]Proceedings of the 17th International Symposium on High Performance Computer Architecture(HPCA).Washington:IEEE Computer Society,c2011.

    [6] NVIDIA.CUDA C Programming Guide 5.0[EB/OL].[2013-05-12].http://docs.nvidia.com/cuda/cuda-cprogramming-guide/index.html.

    [7] NVIDIA.NVIDIA Compute:Parallel Thread Execution ISA Version 3.0[EB/OL].[2013-05-12].http://docs.nvidia.com/cuda/parallel-thread-execution/index.html.

    [8] GLASKOWSKY P N.NVIDIA1s Fermi:the first complete GPU computing architecture[EB/OL].[2013-05-12].http://www.nvidia.com/object/fermi_architecture.html.

    [9] CUI Z,LIANG Y,RUPNOW K,et al.An accurate GPU performance model for effective control flow divergence optimization[C]//Proceedings of the 26th International Symposium on Parallel& Distributed Processing.Washington:IEEE Computer Society,c2012.

    [10] MENG J,TARJAN D,SKADRON K.Dynamic warp subdivision for integrated branch and memory divergence tolerance[C]//Proceedings of the 37th annual international symposium on Computer Architecture.New York:ACM,c2010.

    [11] FUNG W W L,SHAM I,YUAN G,et al.Dynamic warp formation and scheduling for efficient gpu control flow[C]//Proceedings of the 40th Annual IEEE/ACM International Symposium on Microarchitecture.Washington:IEEE Computer Society,c2007.

    [12] ZHANG E Z,JIANG Y,GUO Z,et al.Streamlining GPU applications on the fly:thread divergence elimination through runtime thread-data remapping[C]//Proceedings of the 24th ACM International Conference on Supercomputing.New York:ACM,c2010.

    [13] NVIDIA.CUDA toolkit 5.0 CURAND guide[EB/OL].[2013-05-12].http://docs.nvidia.com/cuda/curand/index.html

    猜你喜歡
    線程分支語句
    重點:語句銜接
    巧分支與枝
    學生天地(2019年28期)2019-08-25 08:50:54
    一類擬齊次多項式中心的極限環(huán)分支
    精彩語句
    淺談linux多線程協(xié)作
    如何搞定語句銜接題
    語文知識(2014年4期)2014-02-28 21:59:52
    生成分支q-矩陣的零流出性
    碩果累累
    Linux線程實現(xiàn)技術研究
    么移動中間件線程池并發(fā)機制優(yōu)化改進
    久久伊人香网站| av国产免费在线观看| 少妇高潮的动态图| 男女那种视频在线观看| 国产精品嫩草影院av在线观看 | 成人国产综合亚洲| 尤物成人国产欧美一区二区三区| 成人av在线播放网站| a级毛片a级免费在线| 91久久精品电影网| 天堂av国产一区二区熟女人妻| 最新在线观看一区二区三区| 免费搜索国产男女视频| 麻豆国产97在线/欧美| 国产精品影院久久| 黄色日韩在线| 亚洲国产日韩欧美精品在线观看| 亚洲天堂国产精品一区在线| 蜜桃久久精品国产亚洲av| 久9热在线精品视频| 69av精品久久久久久| 淫秽高清视频在线观看| 久久国产乱子免费精品| 又紧又爽又黄一区二区| 国产精品野战在线观看| 99久久成人亚洲精品观看| 老司机午夜十八禁免费视频| 亚洲成av人片免费观看| 日本a在线网址| 精品一区二区免费观看| 亚洲成人中文字幕在线播放| 欧美最新免费一区二区三区 | 亚洲第一区二区三区不卡| 亚洲欧美日韩东京热| 真人做人爱边吃奶动态| 亚洲av成人精品一区久久| 99久久成人亚洲精品观看| 欧美中文日本在线观看视频| 久久久国产成人免费| 97热精品久久久久久| 亚洲av熟女| 老鸭窝网址在线观看| 亚洲片人在线观看| 人妻夜夜爽99麻豆av| 伊人久久精品亚洲午夜| 国产精品不卡视频一区二区 | 精品人妻1区二区| 网址你懂的国产日韩在线| av天堂中文字幕网| 丁香六月欧美| 精品久久久久久成人av| 最新在线观看一区二区三区| 亚洲成av人片免费观看| 一本久久中文字幕| 国产成人福利小说| 一a级毛片在线观看| 欧美一区二区精品小视频在线| 又黄又爽又免费观看的视频| 淫妇啪啪啪对白视频| 中出人妻视频一区二区| 精品一区二区三区视频在线| 嫁个100分男人电影在线观看| 日韩欧美三级三区| 久久国产乱子免费精品| 一进一出抽搐gif免费好疼| 五月伊人婷婷丁香| 精品国产亚洲在线| 99久久99久久久精品蜜桃| 老师上课跳d突然被开到最大视频 久久午夜综合久久蜜桃 | 成熟少妇高潮喷水视频| 国产亚洲精品久久久com| 超碰av人人做人人爽久久| 国产伦人伦偷精品视频| 天堂√8在线中文| 久久婷婷人人爽人人干人人爱| 美女大奶头视频| av中文乱码字幕在线| 亚洲成人精品中文字幕电影| 国产91精品成人一区二区三区| 国产不卡一卡二| 久久精品国产自在天天线| 久久精品人妻少妇| 亚洲精品在线美女| 亚洲av二区三区四区| 国产精品久久久久久久电影| 成人高潮视频无遮挡免费网站| 国产亚洲精品av在线| 国产午夜精品论理片| 免费av观看视频| 在线观看舔阴道视频| 午夜日韩欧美国产| 欧美日本视频| 国产激情偷乱视频一区二区| 免费在线观看日本一区| 国产综合懂色| 亚洲三级黄色毛片| 免费人成在线观看视频色| 免费在线观看日本一区| 日韩大尺度精品在线看网址| 亚洲在线自拍视频| 亚洲欧美日韩高清在线视频| 老师上课跳d突然被开到最大视频 久久午夜综合久久蜜桃 | 久久国产精品人妻蜜桃| 内地一区二区视频在线| 91麻豆av在线| 国产v大片淫在线免费观看| 欧美中文日本在线观看视频| 精品99又大又爽又粗少妇毛片 | 国产淫片久久久久久久久 | 又爽又黄a免费视频| av黄色大香蕉| 国产在视频线在精品| 内地一区二区视频在线| 又爽又黄无遮挡网站| x7x7x7水蜜桃| 亚洲人与动物交配视频| 一本一本综合久久| 日韩有码中文字幕| 国内精品久久久久久久电影| 国产淫片久久久久久久久 | 天堂影院成人在线观看| 中文在线观看免费www的网站| 精品99又大又爽又粗少妇毛片 | 特大巨黑吊av在线直播| 精品日产1卡2卡| 亚洲欧美精品综合久久99| 国产精品伦人一区二区| 国产精品伦人一区二区| 人妻久久中文字幕网| av黄色大香蕉| 亚洲不卡免费看| 别揉我奶头 嗯啊视频| 99热这里只有精品一区| 9191精品国产免费久久| 免费人成在线观看视频色| 久久久精品大字幕| 精品人妻一区二区三区麻豆 | 色5月婷婷丁香| 人人妻人人看人人澡| av福利片在线观看| 看十八女毛片水多多多| 国产精品99久久久久久久久| 在线观看舔阴道视频| 国产伦一二天堂av在线观看| 91在线观看av| 91狼人影院| 欧美+日韩+精品| 色5月婷婷丁香| 欧美日韩黄片免| 亚洲专区国产一区二区| 白带黄色成豆腐渣| 大型黄色视频在线免费观看| 久久久久亚洲av毛片大全| 欧美一区二区精品小视频在线| 日韩欧美 国产精品| 老熟妇仑乱视频hdxx| 每晚都被弄得嗷嗷叫到高潮| 成人av一区二区三区在线看| 国产一区二区三区视频了| 亚洲 国产 在线| 成人国产一区最新在线观看| 欧美+亚洲+日韩+国产| 亚洲内射少妇av| 色吧在线观看| 久久中文看片网| 国产精品一及| 麻豆国产97在线/欧美| 在线观看美女被高潮喷水网站 | 亚洲精品久久国产高清桃花| 国产成人影院久久av| 成年人黄色毛片网站| 欧美色视频一区免费| 精品人妻熟女av久视频| 97超级碰碰碰精品色视频在线观看| 如何舔出高潮| 日本三级黄在线观看| 人妻制服诱惑在线中文字幕| 日韩精品中文字幕看吧| 免费av不卡在线播放| 日本黄大片高清| ponron亚洲| 此物有八面人人有两片| 美女大奶头视频| 美女免费视频网站| 婷婷色综合大香蕉| 91麻豆精品激情在线观看国产| 麻豆国产97在线/欧美| 性插视频无遮挡在线免费观看| 如何舔出高潮| 一本精品99久久精品77| 精品国内亚洲2022精品成人| 9191精品国产免费久久| 天天一区二区日本电影三级| 欧美激情久久久久久爽电影| 国产亚洲精品久久久久久毛片| 婷婷精品国产亚洲av在线| 欧美在线黄色| 黄片小视频在线播放| 久久久久久久午夜电影| 亚洲av一区综合| 最近在线观看免费完整版| 国产成人啪精品午夜网站| 老司机深夜福利视频在线观看| 亚洲色图av天堂| 亚洲成人免费电影在线观看| 精品国产三级普通话版| 亚洲国产欧美人成| 搡老妇女老女人老熟妇| 18禁裸乳无遮挡免费网站照片| 欧美日韩亚洲国产一区二区在线观看| 国产av麻豆久久久久久久| 国产成+人综合+亚洲专区| 国产精品一区二区三区四区免费观看 | 最近在线观看免费完整版| 国产精华一区二区三区| 一本久久中文字幕| 久99久视频精品免费| 亚洲人与动物交配视频| 乱码一卡2卡4卡精品| 免费观看精品视频网站| 亚洲中文日韩欧美视频| 欧美+日韩+精品| 99视频精品全部免费 在线| 国内少妇人妻偷人精品xxx网站| 人人妻人人澡欧美一区二区| 12—13女人毛片做爰片一| 日本五十路高清| 丁香欧美五月| 18禁在线播放成人免费| 嫁个100分男人电影在线观看| 最近最新免费中文字幕在线| 97超级碰碰碰精品色视频在线观看| 亚洲一区二区三区不卡视频| 国产毛片a区久久久久| 我的老师免费观看完整版| 最好的美女福利视频网| 亚洲美女视频黄频| 午夜a级毛片| 日韩中字成人| 香蕉av资源在线| 免费看美女性在线毛片视频| 国产精品,欧美在线| 欧美精品国产亚洲| 成人三级黄色视频| 亚洲成人中文字幕在线播放| 国产私拍福利视频在线观看| 午夜福利在线观看吧| a在线观看视频网站| 欧美成狂野欧美在线观看| 午夜精品一区二区三区免费看| 亚洲在线自拍视频| 小蜜桃在线观看免费完整版高清| 久久久久国产精品人妻aⅴ院| 九九在线视频观看精品| 又粗又爽又猛毛片免费看| 最新中文字幕久久久久| 有码 亚洲区| 国模一区二区三区四区视频| aaaaa片日本免费| 中文在线观看免费www的网站| 韩国av一区二区三区四区| 国产精品亚洲一级av第二区| 亚洲精品一区av在线观看| 日本精品一区二区三区蜜桃| 女人十人毛片免费观看3o分钟| 热99re8久久精品国产| 久久热精品热| 国产高潮美女av| 国产伦精品一区二区三区视频9| 亚洲性夜色夜夜综合| 久9热在线精品视频| 国内久久婷婷六月综合欲色啪| 韩国av一区二区三区四区| 一进一出抽搐gif免费好疼| 一进一出好大好爽视频| 男女之事视频高清在线观看| 国产精品美女特级片免费视频播放器| 成人一区二区视频在线观看| 欧美激情久久久久久爽电影| 日韩精品青青久久久久久| 久久国产乱子免费精品| 黄色视频,在线免费观看| 99精品久久久久人妻精品| 国产精品野战在线观看| 麻豆成人av在线观看| 日韩人妻高清精品专区| 五月玫瑰六月丁香| 国产一区二区三区在线臀色熟女| 国产精品嫩草影院av在线观看 | 久久久久久大精品| 成人无遮挡网站| 老女人水多毛片| 欧美绝顶高潮抽搐喷水| 波多野结衣高清无吗| 亚洲无线在线观看| 国产单亲对白刺激| 99视频精品全部免费 在线| 欧美日韩中文字幕国产精品一区二区三区| 久久亚洲真实| 成人亚洲精品av一区二区| 999久久久精品免费观看国产| АⅤ资源中文在线天堂| 十八禁人妻一区二区| 成人美女网站在线观看视频| 97碰自拍视频| 亚洲精品影视一区二区三区av| 天堂网av新在线| 自拍偷自拍亚洲精品老妇| 久久久久久久精品吃奶| 亚洲avbb在线观看| 午夜精品一区二区三区免费看| 国产精品98久久久久久宅男小说| 国产真实伦视频高清在线观看 | 久久久久亚洲av毛片大全| 亚洲片人在线观看| 色吧在线观看| 色综合站精品国产| 欧美黑人巨大hd| 国产精品伦人一区二区| 亚洲中文日韩欧美视频| 国产一级毛片七仙女欲春2| 久久婷婷人人爽人人干人人爱| 日日干狠狠操夜夜爽| 美女 人体艺术 gogo| 精品人妻一区二区三区麻豆 | 午夜福利高清视频| 精品国产三级普通话版| 日本精品一区二区三区蜜桃| 国产高清有码在线观看视频| 两人在一起打扑克的视频| 日本一本二区三区精品| 亚洲人成网站在线播放欧美日韩| 亚洲精品成人久久久久久| 18禁在线播放成人免费| 狂野欧美白嫩少妇大欣赏| 免费在线观看日本一区| 国产伦一二天堂av在线观看| 嫩草影视91久久| 床上黄色一级片| 18禁裸乳无遮挡免费网站照片| 精品一区二区三区av网在线观看| 在线a可以看的网站| 婷婷六月久久综合丁香| 老鸭窝网址在线观看| 日韩亚洲欧美综合| 精品人妻一区二区三区麻豆 | 国产乱人伦免费视频| 日韩成人在线观看一区二区三区| 亚洲熟妇熟女久久| 亚洲成av人片免费观看| 丰满人妻熟妇乱又伦精品不卡| av福利片在线观看| 男女下面进入的视频免费午夜| 亚洲精品影视一区二区三区av| 国产精品久久电影中文字幕| 小蜜桃在线观看免费完整版高清| 亚洲专区国产一区二区| 一进一出好大好爽视频| 中亚洲国语对白在线视频| 亚洲欧美激情综合另类| 国产av麻豆久久久久久久| 成人国产综合亚洲| eeuss影院久久| 精品免费久久久久久久清纯| 成年免费大片在线观看| 亚洲无线观看免费| 97人妻精品一区二区三区麻豆| 欧美性感艳星| xxxwww97欧美| 日日夜夜操网爽| 永久网站在线| 国产欧美日韩精品亚洲av| 成年人黄色毛片网站| 99久久精品一区二区三区| 在线观看av片永久免费下载| 国产高清有码在线观看视频| 国内久久婷婷六月综合欲色啪| 在线观看66精品国产| 九九久久精品国产亚洲av麻豆| 91久久精品国产一区二区成人| 亚洲人成网站在线播| 成人特级黄色片久久久久久久| 亚洲av免费在线观看| 青草久久国产| 国产精品人妻久久久久久| 久久久成人免费电影| 日日干狠狠操夜夜爽| 中文字幕人妻熟人妻熟丝袜美| 动漫黄色视频在线观看| 一二三四社区在线视频社区8| 国产欧美日韩一区二区精品| 波多野结衣巨乳人妻| 精品人妻1区二区| 色精品久久人妻99蜜桃| 观看免费一级毛片| 国产精品一区二区性色av| 琪琪午夜伦伦电影理论片6080| 国产日本99.免费观看| 搞女人的毛片| av国产免费在线观看| 女人十人毛片免费观看3o分钟| 国产久久久一区二区三区| 永久网站在线| 欧美性猛交╳xxx乱大交人| av黄色大香蕉| 午夜福利在线观看免费完整高清在 | a级毛片免费高清观看在线播放| 最后的刺客免费高清国语| 怎么达到女性高潮| av中文乱码字幕在线| 亚洲av第一区精品v没综合| 欧美黄色淫秽网站| 三级国产精品欧美在线观看| 国产精品,欧美在线| 男女视频在线观看网站免费| 脱女人内裤的视频| 亚洲真实伦在线观看| 啪啪无遮挡十八禁网站| 天堂网av新在线| 自拍偷自拍亚洲精品老妇| 免费人成视频x8x8入口观看| 国产综合懂色| 在线观看免费视频日本深夜| 亚洲精品一区av在线观看| 成人无遮挡网站| 成熟少妇高潮喷水视频| 国产伦一二天堂av在线观看| 男女下面进入的视频免费午夜| 国产黄色小视频在线观看| 日韩欧美在线二视频| 色哟哟哟哟哟哟| 在线观看美女被高潮喷水网站 | 老司机深夜福利视频在线观看| 精品国产三级普通话版| 麻豆成人午夜福利视频| 国产探花极品一区二区| 久久久成人免费电影| 一级作爱视频免费观看| 国产精品不卡视频一区二区 | 国产成人欧美在线观看| 白带黄色成豆腐渣| 深夜精品福利| 他把我摸到了高潮在线观看| 久久久精品欧美日韩精品| 亚洲久久久久久中文字幕| 悠悠久久av| 一夜夜www| 淫妇啪啪啪对白视频| 午夜影院日韩av| 青草久久国产| 亚洲va日本ⅴa欧美va伊人久久| 国产一区二区在线av高清观看| 精品99又大又爽又粗少妇毛片 | 国产视频一区二区在线看| 成人特级av手机在线观看| 日韩欧美在线二视频| 在线观看av片永久免费下载| 丝袜美腿在线中文| 日日摸夜夜添夜夜添小说| 亚洲综合色惰| 首页视频小说图片口味搜索| .国产精品久久| 国产精品女同一区二区软件 | 欧美性感艳星| 精品久久久久久久久久免费视频| 欧美午夜高清在线| 亚洲精品456在线播放app | 一级a爱片免费观看的视频| 首页视频小说图片口味搜索| 成人国产一区最新在线观看| 欧美色视频一区免费| 久久精品91蜜桃| 午夜精品在线福利| 99久久九九国产精品国产免费| 国产精品女同一区二区软件 | 欧美激情久久久久久爽电影| 琪琪午夜伦伦电影理论片6080| 高潮久久久久久久久久久不卡| 婷婷六月久久综合丁香| 亚洲欧美精品综合久久99| 国产三级中文精品| 国产淫片久久久久久久久 | 人人妻人人澡欧美一区二区| 亚洲国产色片| 午夜两性在线视频| av视频在线观看入口| 可以在线观看毛片的网站| 欧美午夜高清在线| 欧美成人免费av一区二区三区| 国产老妇女一区| 啪啪无遮挡十八禁网站| 伦理电影大哥的女人| 最近中文字幕高清免费大全6 | 人妻久久中文字幕网| 91av网一区二区| 老司机午夜十八禁免费视频| 午夜福利高清视频| 成年人黄色毛片网站| 久久国产精品影院| 精品久久久久久久末码| 人妻制服诱惑在线中文字幕| 观看美女的网站| 黄色配什么色好看| 99国产精品一区二区蜜桃av| 伊人久久精品亚洲午夜| 亚洲自偷自拍三级| 久久人妻av系列| 国产精品一及| 天堂影院成人在线观看| 搡女人真爽免费视频火全软件 | 精品久久久久久久末码| 人人妻人人看人人澡| 欧美性猛交黑人性爽| 丁香六月欧美| 少妇的逼好多水| 国内久久婷婷六月综合欲色啪| 亚洲真实伦在线观看| 精品一区二区三区视频在线| 亚洲第一区二区三区不卡| 一区二区三区免费毛片| 国产黄片美女视频| 欧美xxxx黑人xx丫x性爽| 免费无遮挡裸体视频| 最近中文字幕高清免费大全6 | 亚洲五月婷婷丁香| 欧美不卡视频在线免费观看| 久久久精品欧美日韩精品| 高潮久久久久久久久久久不卡| 久久亚洲精品不卡| 国产单亲对白刺激| 好男人电影高清在线观看| 欧美成狂野欧美在线观看| 欧美最新免费一区二区三区 | 欧美色欧美亚洲另类二区| 神马国产精品三级电影在线观看| av国产免费在线观看| 欧美在线一区亚洲| 亚洲国产精品合色在线| 国产精品av视频在线免费观看| 国产精品久久电影中文字幕| 国产高清激情床上av| 亚洲男人的天堂狠狠| 亚洲精品日韩av片在线观看| 99久久精品国产亚洲精品| 2021天堂中文幕一二区在线观| 在线看三级毛片| 99国产极品粉嫩在线观看| 能在线免费观看的黄片| 国产精品久久久久久久电影| 中亚洲国语对白在线视频| 又紧又爽又黄一区二区| 午夜免费激情av| 国产高潮美女av| 久99久视频精品免费| 欧美+亚洲+日韩+国产| 国产中年淑女户外野战色| 亚洲精品亚洲一区二区| 在线免费观看不下载黄p国产 | 特级一级黄色大片| 亚洲狠狠婷婷综合久久图片| 国产激情偷乱视频一区二区| 亚洲熟妇中文字幕五十中出| 最近最新中文字幕大全电影3| 欧美bdsm另类| 老司机午夜福利在线观看视频| 人人妻,人人澡人人爽秒播| 桃红色精品国产亚洲av| 国内精品美女久久久久久| 亚洲五月婷婷丁香| 三级国产精品欧美在线观看| 国产真实乱freesex| 久久精品人妻少妇| 亚洲人成伊人成综合网2020| 国产av在哪里看| 日本撒尿小便嘘嘘汇集6| 日韩欧美精品v在线| 欧美极品一区二区三区四区| 一a级毛片在线观看| 精品久久久久久久久久久久久| 亚洲精品色激情综合| 免费在线观看日本一区| 精品久久国产蜜桃| 亚洲成av人片在线播放无| 欧美一区二区亚洲| 黄色配什么色好看| 18美女黄网站色大片免费观看| 三级男女做爰猛烈吃奶摸视频| 午夜福利视频1000在线观看| 国产高清视频在线播放一区| 国产美女午夜福利| 又粗又爽又猛毛片免费看| 一级黄片播放器| 午夜福利18| 色av中文字幕| 亚洲综合色惰| 亚洲在线自拍视频| 亚洲av电影在线进入| 搞女人的毛片| 99riav亚洲国产免费| 一区二区三区高清视频在线| 欧美xxxx性猛交bbbb| 亚洲真实伦在线观看| 精品久久久久久成人av| 我的女老师完整版在线观看| 淫妇啪啪啪对白视频| 亚洲av日韩精品久久久久久密| 欧美日韩国产亚洲二区| 亚洲欧美日韩卡通动漫| 又紧又爽又黄一区二区| 在现免费观看毛片| 91字幕亚洲| 又爽又黄无遮挡网站| 亚洲美女视频黄频| 国产高清三级在线| 欧美性猛交黑人性爽|