• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    異構高性能計算系統(tǒng)Linpack效率受限因素分析

    2018-03-06 11:11:50鄔貴明謝向輝
    計算機工程與科學 2018年2期
    關鍵詞:主從加速器異構

    賈 迅,鄔貴明,謝向輝

    (數(shù)學工程與先進計算國家重點實驗室,江蘇 無錫 214125)

    1 引言

    目前,大規(guī)??茖W與工程應用對系統(tǒng)計算能力的需求日益增長,這推動著高性能計算HPC(High Performance Computing)的不斷發(fā)展。研制具備每秒百億億次雙精度浮點運算能力的E級計算系統(tǒng)已成為世界各國競相爭奪的科技制高點?;贗ntel Xeon、IBM Power、AMD Opteron等高性能、高功耗商用處理器和高速互連網絡構建大規(guī)模并行系統(tǒng)是提升計算性能的典型方法。然而,隨著半導體工藝發(fā)展速度的放緩,對計算性能的不斷追求使得HPC系統(tǒng)整體能耗快速增長,可靠性和可擴展性急劇下降。能耗問題已經成為E級計算面臨的一大挑戰(zhàn)[1]。

    商用處理器為了支持功能通用性,指令執(zhí)行的控制邏輯占據了芯片設計的大部分面積,芯片的計算能效較低,從而導致基于商用處理器構建的HPC系統(tǒng)的規(guī)模和性能無法有效擴展。而Intel至強融核MIC(Many Integrated Core)和NVIDIA通用圖形處理單元GPGPU(General Purpose GPU)等加速器芯片中集成了大量浮點運算部件,適合高度并行的計算密集型應用。表1對比了加速器與高性能處理器在計算性能、能效和性價比等方面的差異。相同工藝下,Intel和NVIDIA加速器單芯片的計算性能、能效和性價比是通用高性能處理器的數(shù)倍。

    Table 1 Comparison among accelerators and high performance processors

    多路通用高性能處理器作為主芯片通過PCIe等互連接口連接多路MIC、GPGPU等加速器從芯片,主從芯片存儲空間分離的異構計算技術可以在實現(xiàn)通用計算的同時獲得良好的計算性能、功耗和成本的平衡,其結構如圖1所示。異構計算技術在業(yè)界被廣泛應用,并且已經成為目前HPC發(fā)展的重要趨勢[2]。根據Top500組織于2017年6月發(fā)布的排名數(shù)據[3],異構計算系統(tǒng)占HPC系統(tǒng)的比例已經達到了18.4%。其中,NVIDIA Tesla K40 GPGPU應用最多,占比為20.7%。

    Figure 1 Structure of heterogeneous interconnect computing圖1 異構計算結構

    異構計算技術被大量應用于HPC系統(tǒng)設計的同時,異構計算系統(tǒng)Linpack效率受限的問題日益凸顯。從Top500最新發(fā)布的排名數(shù)據[3]來看,異構系統(tǒng)Linpack效率的均值為62.28%,而同構系統(tǒng)達到了67.23%。異構與同構系統(tǒng)Linpack效率的差距在系統(tǒng)規(guī)模增大時更為顯著,如Tianhe-2、Piz Daint、Titan這三臺排名前十的大規(guī)模異構計算系統(tǒng),其Linpack效率最高僅為77.35%,而相當規(guī)模同構計算系統(tǒng)的Linpack效率最低也達到了73.12%。較低的Linpack效率意味著系統(tǒng)中大量的計算資源無法被充分利用,從而造成系統(tǒng)資源和能耗的浪費。

    針對異構高性能計算系統(tǒng)Linpack效率受限的問題,現(xiàn)有研究大多從軟件實現(xiàn)層面進行性能優(yōu)化,如改進任務劃分實現(xiàn)負載均衡、采用軟件流水線隱藏通信開銷等。本文從系統(tǒng)結構設計的角度,基于真實系統(tǒng)的設計參數(shù)和性能數(shù)據,深入分析了大規(guī)模異構計算系統(tǒng)Linpack效率受限的主要因素。本文的研究成果為未來加速器從芯片的優(yōu)化設計和異構系統(tǒng)的高效組織提供了有效指導。

    2 相關工作

    2.1 Linpack測試程序與核心算法

    HPLinpack(High Performance Linpack)是目前HPC領域應用最為廣泛的Linpack性能測試程序,其由美國田納西大學計算機系教授Dongarra提出的[4]。HPLinpack的核心算法是求解階為n的線性方程:Ax=b,A∈Rn×n,x,b∈Rn。算法首先使用行選主元高斯消元法對系數(shù)矩陣[A,b]進行LU分解:Pr[A,b]=[[LU],y],Pr,L,U∈Rn×n,y∈Rn。LU分解完成后,解原方程等價于求解上三角方程Ux=y。

    從上述介紹可以看出,HPLinpack測試程序的執(zhí)行分為LU分解和回代兩個過程。其中,LU分解過程的浮點操作次數(shù)為(2/3)n3-(1/2)n2;回代過程的浮點操作次數(shù)為2n2。HPLinpack將系統(tǒng)求解線性方程時單位時間內執(zhí)行的雙精度浮點操作次數(shù)作為評價系統(tǒng)實際計算性能的標準。給出程序的執(zhí)行時間t,系統(tǒng)的實測性能Rmax可表示為:

    計算系統(tǒng)的峰值性能Rpeak是單位時間內系統(tǒng)最多可執(zhí)行雙精度浮點操作的次數(shù),可表示為處理器核心數(shù)、向量運算寬度和核心工作頻率的乘積。計算系統(tǒng)的Linpack效率E定義為實測性能與峰值性能的比值,即E=Rmax/Rpeak。

    科學計算軟件庫Netlib[5]針對分布式存儲同構計算系統(tǒng),給出了HPLinpack的并行化實現(xiàn)。程序以nb×nb為單位將系數(shù)矩陣劃分為數(shù)據塊網格,同時將計算結點組織成P×Q的網格。數(shù)據塊到結點的映射采用塊循環(huán)(block-cyclic)分布方式:數(shù)據塊(i,j)映射到結點(i%P,j%Q)。程序采用right-looking式LU分解算法,完成分解共需n/nb次迭代計算。每次迭代包含Panel分解、Panel廣播、行交換和子矩陣更新。其中,前三步的計算量較少,主要為結點間通信;子矩陣更新需要大量計算,包括雙精度三角矩陣方程求解和稠密矩陣乘,程序通過調用BLAS庫DTRSM和DGEMM兩個子過程實現(xiàn)。DGEMM子過程的執(zhí)行占據了Linpack程序運行的絕大部分時間,因而是整個程序的計算核心。

    2.2 異構計算系統(tǒng)上Linpack的性能優(yōu)化

    主芯片負責程序執(zhí)行過程中的結點間通信和部分計算,從芯片負責DGEMM核心的計算加速是各異構高性能計算系統(tǒng)Linpack實現(xiàn)和性能優(yōu)化的主要方法。主從芯片計算任務的劃分和主從芯片的通信開銷是異構計算系統(tǒng)Linpack實現(xiàn)的兩大難點。學術界針對這兩個難點問題展開了研究,并提出了靜態(tài)和動態(tài)的任務劃分方法[6 - 8],以實現(xiàn)主從芯片計算任務的負載均衡,同時應用雙緩沖、數(shù)據重用、數(shù)據存儲優(yōu)化等軟件流水線技術[9 - 11],以實現(xiàn)計算和通信的重疊,從而隱藏通信開銷。這些優(yōu)化技術應用于實際的大規(guī)模異構計算系統(tǒng)時可以有效提升系統(tǒng)的Linpack性能[7]。

    從上述介紹可以看出,目前針對Linpack性能優(yōu)化的研究主要通過應用軟件實現(xiàn)技術來隱藏異構計算系統(tǒng)主從計算能力和訪存性能不對稱、存儲空間分離、主從通信開銷大的結構特點。但是,現(xiàn)有研究并未考慮異構計算系統(tǒng)的結構設計對系統(tǒng)Linpack性能或效率的約束,因而這成為本文的研究重點。

    3 Linpack效率受限因素分析

    3.1 加速器的DGEMM效率

    王申等人[12]基于單芯片多核計算結點構成的同構計算系統(tǒng),建立了Linpack并行性能模型。模型分析結果表明,在矩陣規(guī)模和互連網絡帶寬一定的情況下,結點DGEMM的計算效率對系統(tǒng)Linpack效率的影響幾乎是線性的。異構計算系統(tǒng)中,主處理器芯片上DGEMM的性能已接近峰值計算性能[13],而用于計算加速的從芯片提供了系統(tǒng)主要的計算能力。因此,本文首先統(tǒng)計了不同加速器從芯片DGEMM的計算效率以及采用這些加速器芯片構建的異構計算系統(tǒng)的Linpack效率,統(tǒng)計結果如表2所示。

    Table 2 Accelerator DGEMM efficiency and system Linpack efficiency

    從表2可以看出,無論是AMD還是NVIDIA,其早期GPGPU加速器的DGEMM的計算效率均較低,僅為70%左右[14,15]。NVIDIA于2012年發(fā)布的Kepler架構Tesla K20x才將DGEMM計算效率提升至93%[16],后續(xù)發(fā)布的K40、K80、Tesla P100等GPGPU的效率均維持在93%左右[17]。Intel MIC架構的Xeon Phi加速器DGEMM計算效率只能達到80%[18]。IBM PowerXCell 8i加速器DGEMM的計算效率最高,達到了99%[19]。

    對照各加速器從芯片DGEMM計算效率與采用這些加速器的異構計算系統(tǒng)的Linpack效率來看,兩者是正相關的關系:采用早期GPGPU進行加速的Tianhe-1和Tianhe-1A系統(tǒng)的Linpack效率最高僅為55%;采用Intel Xeon Phi進行加速的系統(tǒng)其Linpack效率也只有60%左右;而采用K20x、P100和PowerXCell 8i進行加速的系統(tǒng)其Linpack效率可以達到65%~75%。顯然,加速器DGEMM計算效率的提高有效提升了基于這些加速器構建的異構高性能計算系統(tǒng)的Linpack效率。

    為了更為直觀地體現(xiàn)加速器從芯片DGEMM的計算效率對異構計算系統(tǒng)Linpack效率的影響,表3統(tǒng)計了Top500排名中所有使用NVIDIA Fermi架構M2050/C2050和Kepler架構K20x GPGPU作為加速器的異構高性能計算系統(tǒng)的Linpack效率。

    Table 3 HPC systems based on NVIDIA GPGPU and their Linpack efficiencies

    從表3中的統(tǒng)計數(shù)據可以看出,采用M2050/C2050 GPGPU作為加速器的系統(tǒng),其效率最高僅為54.58%,而采用K20x GPGPU的計算系統(tǒng),效率最低也達到了64.88%。整體來看,NVIDIA GPGPU上DGEMM的計算效率從70%優(yōu)化至93%后,異構計算系統(tǒng)的Linpack效率顯著增長。

    目前,Intel MIC和NVIDIA GPGPU最新的加速器芯片執(zhí)行DGEMM核心的計算效率最高分別為82%和93%,這與同構系統(tǒng)中主處理器芯片執(zhí)行DGEMM的效率還存在一定差距。由于加速器從芯片的計算性能占據了異構計算系統(tǒng)總性能的主要部分,根據文獻[12]提出的Linpack性能分析模型,DGEMM計算效率的差距將直接導致系統(tǒng)Linpack效率的損失。因此,加速器從芯片DGEMM的計算效率是目前異構高性能計算系統(tǒng)Linpack效率受限的一個主要因素。

    3.2 主從芯片的資源配比

    文獻[20]將異構高性能計算系統(tǒng)上Linpack的實現(xiàn)總結為三個問題:(1)核心計算的位置,即Linpack程序的DGEMM計算核心由主芯片還是從芯片完成?(2)數(shù)據存儲的位置,即Linpack程序的矩陣數(shù)據存儲在主芯片內存還是從芯片內存?(3)非核心計算的位置,即Linpack程序的Panel分解、結點間通信由主芯片還是從芯片完成?表 4統(tǒng)計了多個大規(guī)模異構HPC系統(tǒng)針對上述三個問題的實現(xiàn)。TSUBAME 2.5和Roadrunner系統(tǒng)的核心計算僅由從芯片完成,其它系統(tǒng)中主從芯片共同完成核心計算。對于數(shù)據存儲,僅Roadrunner系統(tǒng)將矩陣數(shù)據存儲在從芯片內存上,其它異構系統(tǒng)的矩陣數(shù)據均存儲在主芯片內存上。另外,由于Linpack程序的非核心計算無法有效并行且與結點間通信緊密耦合,由于異構系統(tǒng)中僅主芯片具備通信能力,因此所有系統(tǒng)中非核心計算均由主芯片完成。

    對表 4的進一步分析可以看出,系統(tǒng)核心計算和矩陣數(shù)據的存儲位置取決于主從芯片的計算性能占比和內存容量,即資源配比。由于TSUBAME 2.5和Roadrunner系統(tǒng)中從芯片性能占比達到了96%,主芯片無需參與加速計算;其它系統(tǒng)中主芯片的計算性能占比最低為9.7%,為了盡可能提升Linpack測試的性能,必須充分利用主芯片的計算能力,即需要主從芯片共同參與DGEMM核心的計算加速。另一方面,內存容量直接決定了Linpack測試的矩陣規(guī)模。Roadrunner系統(tǒng)中主從芯片的內存容量相當,矩陣數(shù)據可以直接存儲在從芯片內存上,減少了加速計算時主從芯片之間通過片間互連接口進行數(shù)據傳輸?shù)拈_銷;其它系統(tǒng)中從芯片的內存容量遠小于主芯片,因此測試的矩陣數(shù)據只能存儲在主芯片內存上,因而每次核心計算都需要主從芯片之間進行大量的數(shù)據傳輸,此時主從通信的開銷會影響異構系統(tǒng)Linpack性能的提升[20]。

    Table 4 Linpack implementation on heterogeneous interconnected systems and host/accelerator chip resources

    針對表 4中的計算系統(tǒng),若將計算數(shù)據存儲在從芯片內存且僅由從芯片完成核心計算,此時異構計算系統(tǒng)的Linpack效率可表示為系統(tǒng)中從芯片的性能占比與從芯片DGEMM計算效率的乘積,再減去結點間通信和計算規(guī)模變化對系統(tǒng)Linpack效率的影響(大致為20%[20])。表5統(tǒng)計了各計算系統(tǒng)Linpack效率的估計值與系統(tǒng)實際Linpack效率的差值。

    Table 5 Difference between the estimated and real Linpack efficiency

    表5中,Roadrunner系統(tǒng)Linpack效率的估計值與系統(tǒng)實際Linpack效率的差為1.25%,這表明計算中采用的Linpack效率受結點間通信和計算規(guī)模影響的估計值是合理的。從效率差值隨從芯片性能占比和DGEMM效率的變化可以看出,在從芯片內存容量可以滿足測試程序矩陣規(guī)模的情況下,隨著系統(tǒng)中從芯片的性能占比和DGEMM效率的提高,異構系統(tǒng)中僅由從芯片進行核心計算時的Linpack效率可以達到甚至高于系統(tǒng)實際的Linpack效率。因此,主從芯片的資源配比是導致目前異構高性能計算系統(tǒng)Linpack效率受限的另一個主要因素。

    3.3 對異構計算系統(tǒng)結構設計的需求

    加速器從芯片DGEMM的計算效率直接影響了異構高性能計算系統(tǒng)的Linpack效率,而DGEMM效率受矩陣分塊大小、Cache性能、流水方式、訪存帶寬、計算訪存比等諸多因素的影響。其中,指令調度和存儲訪問延遲是決定NVIDIA GPGPU加速器DGEMM計算效率的兩大主要因素[23]。因此,結合從芯片計算和訪存的結構設計特點,進一步優(yōu)化從芯片DGEMM核心的計算性能對未來異構計算系統(tǒng)的性能發(fā)揮至關重要。

    目前,異構系統(tǒng)的計算和數(shù)據存儲方式受主從芯片資源配比的影響,從而限制了系統(tǒng)Linpack效率的提升。不斷增加加速器從芯片的主存容量及其在異構計算系統(tǒng)中的性能占比是應對這個問題最直接而有效的手段,但其受限于當前的技術能力。2016年NVIDIA發(fā)布了GP100架構的Tesla P100[24]GPGPU,雖然芯片集成的HBM2內存容量僅為16 GB,但其支持通過NVLink接口[25]實現(xiàn)GPGPU片間高速互連,從而有效擴展從芯片的內存容量和計算能力。隨著新一代產品應用于異構HPC系統(tǒng)以及存儲技術的進步,異構高性能計算系統(tǒng)Linpack效率受限于主從芯片資源配比的問題將得到緩解。

    4 基于Linpack性能模型的分析驗證

    為了對上述分析結論進行驗證,本文針對Linpack測試矩陣數(shù)據存儲在從芯片內存,且僅從芯片進行DGEMM核心計算的情況構建了異構系統(tǒng)的性能分析模型。假設測試采用blonM廣播算法和long行交換算法[5],且所有的通信均不沖突。加速器從芯片的性能占比Racc和DGEMM的計算效率E1是性能模型的兩個重要參數(shù),其余參數(shù)的含義和取值見表6。

    Table 6 Parameters used in the performance model

    Linpack程序單次迭代所需的時間為結點計算時間與通信時間的最大值,程序在異構計算系統(tǒng)上執(zhí)行完成所需的總時間t可表示為所有迭代時間的總和,即:

    本文采用Mathematica科學計算軟件[26]實現(xiàn)了上述性能模型,異構系統(tǒng)的Linpack效率隨加速器從芯片性能占比和DGEMM計算效率的變化情況如圖2所示。

    Figure 2 Effects of accelerator performance ratio and DGEMM efficiency on Linpack圖2 系統(tǒng)Linpack效率隨加速器從芯片性能占比和DGEMM計算效率的變化

    從圖2可以看出,從芯片性能占比Racc的值一定時,異構系統(tǒng)的Linpack效率隨從芯片DGEMM的計算效率線性變化;從芯片DGEMM的計算效率一定時,更高的從芯片性能占比對應著更高的Linpack效率。

    基于性能模型的分析結果表明,從芯片的DGEMM計算效率和性能占比是影響異構計算系統(tǒng)Linpack效率的兩大重要因素;同時也證實了測試矩陣數(shù)據分布在從芯片內存,且僅由從芯片完成核心計算加速的情況下,加速器從芯片更高的性能占比和DGEMM計算效率可以有效提升異構高性能計算系統(tǒng)的Linpack效率。

    5 結束語

    與同構系統(tǒng)相比,異構高性能計算系統(tǒng)呈現(xiàn)主從計算和訪存能力不對稱、存儲空間分離、通信開銷大的結構特點,并且系統(tǒng)的Linpack效率提升困難。與現(xiàn)有研究依賴軟件實現(xiàn)技術進行Linpack性能優(yōu)化不同,本文立足于系統(tǒng)的結構設計,對現(xiàn)有大規(guī)模異構計算系統(tǒng)的設計參數(shù)和性能數(shù)據進行了細致分析,并基于Linpack性能模型對分析結論進行了驗證。結果表明,加速器從芯片DGEMM的計算效率和主從芯片的資源配比是目前異構高性能計算系統(tǒng)Linpack效率受限的主要因素。加速器從芯片DGEMM計算核心的性能優(yōu)化以及存儲技術的進步對未來異構計算系統(tǒng)的性能發(fā)揮具有重要作用。

    [1] Kogge P, Bergman K, Borkar S, et al.Exascale computing study:Technology challenges in achieving exascale systems:TR-2008-13[R].[S.l.]:Defense Advanced Research Projects Agency Information Processing Techniques Office (DARPA IPTO),2008:1-278.

    [2] Kindratenko V, Trancoso P.Trends in high-performance computing[J].Computing in Science & Engineering,2011,13(3):92-95.

    [3] Top500 Organization.Supercomputer rank list[EB/OL].[2017-06-22].https://www.top500.org/lists/2017/06/.

    [4] Dongarra J J,Luszczek P,Petitet A.The LINPACK benchmark:Past,present and future[J].Concurrency and Computation:Practice and Experience,2003,15(9):803-820.

    [5] Repository N.HPL—A portable implementation of the high-performance linpack benchmark for distributed-memory computers[EB/OL].[2017-04-20].http://www.netlib.org/benchmark/hpl/.

    [6] Fatica M.Accelerating linpack with CUDA on heterogenous clusters[C]∥Proc of the 2nd Workshop on General Purpose Processing on Graphics Processing Units,2009:46-51.

    [7] Yang C, Wang F, Du Y,et al.Adaptive optimization for petascale heterogeneous CPU/GPU computing[C]∥Proc of 2010 IEEE International Conference on Cluster Computing (CLUSTER),2010:19-28.

    [8] Quintana-Ortí G,Igual F D,Quintana-Ortí E S,et al.Solving dense linear systems on platforms with multiple hardware accelerators[C]∥ACM Sigplan Notices.ACM,2009,44(4):121-130.

    [9] Yang C,Chen C,Tang T,et al.An energy-efficient implementation of LU factorization on heterogeneous systems[C]∥Parallel and Distributed Systems (ICPADS),2016 IEEE 22nd International Conference on.IEEE,2016:971-979.

    [10] Jo G,Nah J,Lee J,et al.Accelerating LINPACK with MPI-OpenCL on clusters of multi-GPU nodes[J].IEEE Transactions on Parallel and Distributed Systems,2015,26(7):1814-1825.

    [11] Li Jia-jia, Li Xing-jian,Tan Guang-ming. DGEMM performance on CPU/ATI GPU hybrid architectures[J].Information Technology Letter,2011,9(6):12-27.(in Chinese)

    [12] Wang Shen, Qi Feng-bin, Gu Hong-feng, et al.Linpack parallel performance model and its prediction[J].Computer Engineering,2012,38(16):81-84.(in Chinese)

    [13] Sun N H,Xing J,Huo Z G,et al.Dawning Nebulae:A PetaFLOPS supercomputer with a heterogeneous structure[J].Journal of Computer Science and Technology,2011,26(3):352-362.

    [14] AMD Corporation.Entering the golden age of heterogeneous computing[EB/OL].[2017-04-27].https://developer.amd.com/wordpress/media/2012/10/IUCAA_Pune_PEEP_2008.pdf.

    [15] NVIIDA Corporation.CUDA accelerated linpack on clusters[EB/OL].[2017-04-27].http://www.nvidia.com/content/gtc-2010/pdfs/2057_gtc2010.pdf.

    [16] NVIDIA Corporation.K20-K20X GPU accelerators benchmarks[EB/OL].[2017-04-27].http://www.nvidia.com/docs/IO/122874/K20-and-K20X-application-performance-technical-brief.pdf.

    [17] Oak Ridge National Laboratory.IBM Power8 CPU overview and deatis[EB/OL].[2017-04-27].https://www.olcf.ornl.gov/wp-content/uploads/2017/01/SummitDev_IBM-Power8-CPUs_Walkup.pdf.

    [18] Heise Online. Intel brings official Xeon Phi co-processor[EB/OL].[2017-04-27].https://www.heise.de/newsticker/meldung/SC12-Intel-bringt-Coprozessor-Xeon-Phi-offiziell-heraus-1747942.html.

    [19] Kistler M,Gunnels J,Brokenshire D,et al.Petascale computing with accelerators[C]∥Proc of ACM Sigplan Symposium on Principles and Practice of Parallel Programming,2009:241-250.

    [20] Endo T,Matsuoka S,Nukada A,et al.Linpack evaluation on a supercomputer with heterogeneous accelerators[C]∥Proc of 2010 IEEE International Symposium on Parallel & Distributed Processing (IPDPS),2010:1-8.

    [21] Liao X,Xiao L,Yang C,et al.MilkyWay-2 supercomputer:System and application[J].Frontiers of Computer Science,2014,8(3):345-356.

    [22] Wikipedia org.Titan supercomputer[EB/OL].[2017-04-27].https://en.wikipedia.org/wiki/Titan.

    [23] Tan G, Li L, Triechle S, et al.Fast implementation of DGEMM on Fermi GPU[C]∥Proc of 2011 International Conference for High Performance Computing,Networking,Storage and Analysis,2011:35.

    [24] NVIDIA Corporation.Tesla P100 [EB/OL].[2017-04-25].https://images.nvidia.com/content/pdf/tesla/whitepaper/pascal-architecture-whitepaper.pdf.

    [25] NVIDIA Corporation.NVLink high-speed interconnect:Application performance[EB/OL].[2017-04-27].http://www.nvidia.com/object/nvlink.html.

    [26] Wolfram.Wolfram Mathematica[EB/OL]. [2017-07-26].https://www.wolfram.com/.

    附中文參考文獻:

    [11] 李佳佳,李興建,譚光明.CPU/ATI GPU混合體系結構上DGEMM的性能研究[J].信息技術快報,2011,9(6):12-27.

    [12] 王申,漆鋒濱,谷洪峰,等.Linpack并行性能模型及其預測[J].計算機工程,2012,38(16):81-84.

    猜你喜歡
    主從加速器異構
    輪滑加速器
    化學工業(yè)的“加速器”
    試論同課異構之“同”與“異”
    全民小康路上的“加速器”
    少先隊活動(2021年6期)2021-07-22 08:44:24
    FANUC系統(tǒng)PROFIBUS主從功能應用
    overlay SDN實現(xiàn)異構兼容的關鍵技術
    電信科學(2016年11期)2016-11-23 05:07:56
    等待“加速器”
    LTE異構網技術與組網研究
    基于主從控制的微電網平滑切換控制策略研究
    基于飛行試驗數(shù)據的仿真模型主從一體化檢驗
    svipshipincom国产片| 男女做爰动态图高潮gif福利片| 岛国视频午夜一区免费看| or卡值多少钱| 麻豆国产av国片精品| 99久国产av精品| 黑人欧美特级aaaaaa片| 两个人看的免费小视频| 日本三级黄在线观看| 无人区码免费观看不卡| 久久午夜亚洲精品久久| 亚洲人成电影免费在线| 在线观看午夜福利视频| 久久精品91无色码中文字幕| 一本久久中文字幕| 日韩高清综合在线| 午夜精品在线福利| 亚洲人成伊人成综合网2020| 桃红色精品国产亚洲av| 制服丝袜大香蕉在线| 天天添夜夜摸| 欧美日韩中文字幕国产精品一区二区三区| a级毛片a级免费在线| 极品教师在线免费播放| 中文字幕熟女人妻在线| 久久久久久久久大av| 18禁国产床啪视频网站| 久久久久久大精品| 成人三级黄色视频| 精品久久久久久,| 亚洲精品日韩av片在线观看 | 久久人人精品亚洲av| 人人妻人人澡欧美一区二区| 欧美三级亚洲精品| 日本成人三级电影网站| 全区人妻精品视频| 亚洲色图av天堂| 国产探花极品一区二区| 国内精品一区二区在线观看| 国产成+人综合+亚洲专区| 白带黄色成豆腐渣| 色老头精品视频在线观看| www日本在线高清视频| 少妇熟女aⅴ在线视频| netflix在线观看网站| 无限看片的www在线观看| 国产伦一二天堂av在线观看| 成人国产综合亚洲| 亚洲最大成人中文| 亚洲精品在线美女| 国产高清视频在线播放一区| av中文乱码字幕在线| 1000部很黄的大片| 国产三级中文精品| 久久久久亚洲av毛片大全| 精华霜和精华液先用哪个| 国产免费av片在线观看野外av| 国产私拍福利视频在线观看| 日韩欧美三级三区| 亚洲国产欧洲综合997久久,| АⅤ资源中文在线天堂| 精品久久久久久久毛片微露脸| 亚洲狠狠婷婷综合久久图片| 国产成人av激情在线播放| 欧美最黄视频在线播放免费| 老司机福利观看| 亚洲欧美日韩高清在线视频| 亚洲国产欧美网| 网址你懂的国产日韩在线| 成年女人看的毛片在线观看| 我的老师免费观看完整版| 精品久久久久久,| 久久久久久久久大av| 97超视频在线观看视频| 99久久精品热视频| 国产精品一及| 午夜福利免费观看在线| 亚洲性夜色夜夜综合| 51午夜福利影视在线观看| 岛国在线免费视频观看| 性色av乱码一区二区三区2| 午夜福利在线观看吧| 少妇人妻精品综合一区二区 | 99视频精品全部免费 在线| 一区二区三区激情视频| 老熟妇乱子伦视频在线观看| 精品一区二区三区视频在线观看免费| 亚洲精品在线观看二区| 国产一区二区在线观看日韩 | 最近最新中文字幕大全免费视频| 国产精华一区二区三区| 婷婷丁香在线五月| 九色国产91popny在线| 91九色精品人成在线观看| 波多野结衣巨乳人妻| 日韩欧美国产在线观看| 精品一区二区三区av网在线观看| 久久久精品大字幕| 国产熟女xx| 身体一侧抽搐| 男人舔女人下体高潮全视频| 精品久久久久久久毛片微露脸| 亚洲av一区综合| 一个人免费在线观看电影| 青草久久国产| 免费看日本二区| 免费人成在线观看视频色| 一级毛片高清免费大全| 欧美最黄视频在线播放免费| 91在线观看av| 成人永久免费在线观看视频| 一区二区三区激情视频| 精品一区二区三区视频在线观看免费| 精品国产超薄肉色丝袜足j| 嫩草影视91久久| 日本五十路高清| 国产三级中文精品| 久久99热这里只有精品18| 亚洲欧美一区二区三区黑人| 国产麻豆成人av免费视频| 亚洲在线自拍视频| 亚洲人成网站在线播放欧美日韩| 国产一区二区在线观看日韩 | 亚洲国产色片| 免费在线观看成人毛片| 精品一区二区三区av网在线观看| 国产精品国产高清国产av| 麻豆久久精品国产亚洲av| 少妇人妻一区二区三区视频| 国内揄拍国产精品人妻在线| 亚洲av免费在线观看| 亚洲国产精品成人综合色| 国产高清有码在线观看视频| 国产麻豆成人av免费视频| 久久伊人香网站| 午夜日韩欧美国产| 天堂av国产一区二区熟女人妻| 日日夜夜操网爽| 午夜两性在线视频| 国产午夜精品久久久久久一区二区三区 | 人人妻人人看人人澡| 国产精品98久久久久久宅男小说| 波多野结衣高清无吗| 18禁国产床啪视频网站| 日日干狠狠操夜夜爽| 一进一出抽搐动态| 久久国产精品人妻蜜桃| 亚洲在线观看片| 国产精品久久电影中文字幕| av黄色大香蕉| 熟妇人妻久久中文字幕3abv| 天天一区二区日本电影三级| 12—13女人毛片做爰片一| 2021天堂中文幕一二区在线观| 女人高潮潮喷娇喘18禁视频| 国产欧美日韩精品亚洲av| 国产精品久久久久久人妻精品电影| 亚洲av熟女| 欧美日韩福利视频一区二区| 中出人妻视频一区二区| 看免费av毛片| 国产亚洲精品av在线| 天天一区二区日本电影三级| 手机成人av网站| 亚洲美女黄片视频| 国产精品免费一区二区三区在线| or卡值多少钱| 亚洲精华国产精华精| 很黄的视频免费| 99久久成人亚洲精品观看| 国产熟女xx| 国产精品99久久99久久久不卡| 女人高潮潮喷娇喘18禁视频| 亚洲精品色激情综合| 亚洲精品久久国产高清桃花| 日本黄色片子视频| 淫妇啪啪啪对白视频| 国产精品1区2区在线观看.| av在线蜜桃| 男人舔奶头视频| 亚洲美女视频黄频| 亚洲狠狠婷婷综合久久图片| 一本久久中文字幕| 午夜久久久久精精品| 午夜日韩欧美国产| 久久精品91蜜桃| 亚洲精品日韩av片在线观看 | 狂野欧美白嫩少妇大欣赏| 高清在线国产一区| 日韩国内少妇激情av| 精品国产亚洲在线| 少妇丰满av| 亚洲内射少妇av| 俄罗斯特黄特色一大片| 成人av在线播放网站| 精品99又大又爽又粗少妇毛片 | 日本 欧美在线| 首页视频小说图片口味搜索| 欧美日本视频| 在线观看免费视频日本深夜| 啦啦啦免费观看视频1| 黄片小视频在线播放| 欧美成人a在线观看| bbb黄色大片| 久久国产精品人妻蜜桃| 日韩国内少妇激情av| 波野结衣二区三区在线 | 母亲3免费完整高清在线观看| 熟女少妇亚洲综合色aaa.| 亚洲在线自拍视频| 在线播放无遮挡| 国产极品精品免费视频能看的| 少妇丰满av| 久久久精品欧美日韩精品| 精品欧美国产一区二区三| 成熟少妇高潮喷水视频| 在线国产一区二区在线| 国产老妇女一区| 亚洲美女视频黄频| 琪琪午夜伦伦电影理论片6080| 狠狠狠狠99中文字幕| 两人在一起打扑克的视频| 日韩欧美在线乱码| 精品福利观看| 3wmmmm亚洲av在线观看| 成年女人永久免费观看视频| 亚洲七黄色美女视频| 在线观看免费午夜福利视频| 国产aⅴ精品一区二区三区波| 好看av亚洲va欧美ⅴa在| 日韩欧美国产一区二区入口| 国产亚洲欧美在线一区二区| 99riav亚洲国产免费| 亚洲人成伊人成综合网2020| 午夜免费男女啪啪视频观看 | av中文乱码字幕在线| 国产成年人精品一区二区| 免费搜索国产男女视频| 三级毛片av免费| 免费在线观看日本一区| 亚洲国产高清在线一区二区三| 美女免费视频网站| 十八禁网站免费在线| 深爱激情五月婷婷| 精品熟女少妇八av免费久了| 一卡2卡三卡四卡精品乱码亚洲| 成人精品一区二区免费| 国产亚洲精品久久久久久毛片| 亚洲成人中文字幕在线播放| 成人特级av手机在线观看| 成人午夜高清在线视频| 欧美日韩福利视频一区二区| 制服人妻中文乱码| 日韩精品中文字幕看吧| 国产午夜精品久久久久久一区二区三区 | 在线视频色国产色| 毛片女人毛片| 亚洲国产欧美网| 久久久成人免费电影| 国产麻豆成人av免费视频| 老司机在亚洲福利影院| 欧美性猛交╳xxx乱大交人| 国产精品 欧美亚洲| 日韩人妻高清精品专区| 高清毛片免费观看视频网站| 欧美绝顶高潮抽搐喷水| 亚洲精品粉嫩美女一区| 欧美国产日韩亚洲一区| 亚洲美女黄片视频| 操出白浆在线播放| 小说图片视频综合网站| 国产伦人伦偷精品视频| 成人精品一区二区免费| 88av欧美| 国产精品久久久久久久久免 | 午夜福利在线在线| 久久午夜亚洲精品久久| 国产精品99久久99久久久不卡| 琪琪午夜伦伦电影理论片6080| 欧美中文综合在线视频| 亚洲乱码一区二区免费版| 国产亚洲av嫩草精品影院| 特级一级黄色大片| 精品国产亚洲在线| 少妇裸体淫交视频免费看高清| 黑人欧美特级aaaaaa片| 久久亚洲精品不卡| 亚洲成人久久爱视频| 激情在线观看视频在线高清| 欧美性感艳星| 国产精品电影一区二区三区| 国产91精品成人一区二区三区| 国产97色在线日韩免费| 国产乱人视频| 日本一二三区视频观看| 少妇高潮的动态图| 丰满乱子伦码专区| 国产成人a区在线观看| 成人三级黄色视频| 很黄的视频免费| 午夜两性在线视频| 久久亚洲真实| 搡老熟女国产l中国老女人| 热99在线观看视频| 成人鲁丝片一二三区免费| 亚洲一区二区三区色噜噜| 性色av乱码一区二区三区2| 免费在线观看日本一区| 国产私拍福利视频在线观看| 亚洲avbb在线观看| 午夜福利18| 欧美乱妇无乱码| 免费看光身美女| 女生性感内裤真人,穿戴方法视频| 国产精品永久免费网站| 亚洲国产精品999在线| 成人av在线播放网站| 黄色成人免费大全| 亚洲七黄色美女视频| 亚洲av中文字字幕乱码综合| 亚洲18禁久久av| 精品日产1卡2卡| 男人舔奶头视频| 免费观看的影片在线观看| 99国产精品一区二区三区| 99在线人妻在线中文字幕| 亚洲不卡免费看| 国产午夜精品久久久久久一区二区三区 | 最近最新中文字幕大全电影3| 午夜福利18| 在线观看免费午夜福利视频| 不卡一级毛片| 午夜老司机福利剧场| 老司机深夜福利视频在线观看| 九色成人免费人妻av| 精品人妻一区二区三区麻豆 | 欧美日韩福利视频一区二区| 午夜福利在线观看免费完整高清在 | 久久久久国内视频| 激情在线观看视频在线高清| 一个人免费在线观看电影| 99精品在免费线老司机午夜| 久久中文看片网| 人妻久久中文字幕网| 男人舔奶头视频| 久久午夜亚洲精品久久| 成人特级黄色片久久久久久久| 免费人成视频x8x8入口观看| 日韩国内少妇激情av| 欧美性猛交黑人性爽| 国产色爽女视频免费观看| 中文字幕人成人乱码亚洲影| 欧美中文日本在线观看视频| 午夜福利在线在线| 在线免费观看不下载黄p国产 | 免费无遮挡裸体视频| 欧美性感艳星| 亚洲国产日韩欧美精品在线观看 | 内射极品少妇av片p| 亚洲内射少妇av| 国产 一区 欧美 日韩| 少妇丰满av| 久久久国产成人精品二区| 国产三级中文精品| 三级毛片av免费| 麻豆久久精品国产亚洲av| 久久久久国内视频| 变态另类成人亚洲欧美熟女| 精品久久久久久久末码| 白带黄色成豆腐渣| 丝袜美腿在线中文| 欧美激情久久久久久爽电影| av视频在线观看入口| 一本综合久久免费| 免费大片18禁| 国产亚洲精品av在线| 久久精品综合一区二区三区| 免费一级毛片在线播放高清视频| АⅤ资源中文在线天堂| 看免费av毛片| 亚洲熟妇熟女久久| 国产探花在线观看一区二区| 老汉色av国产亚洲站长工具| 怎么达到女性高潮| 国产国拍精品亚洲av在线观看 | 最新中文字幕久久久久| 欧美一级毛片孕妇| 3wmmmm亚洲av在线观看| 老司机福利观看| 久久国产乱子伦精品免费另类| 99热6这里只有精品| 精品电影一区二区在线| 日韩有码中文字幕| 每晚都被弄得嗷嗷叫到高潮| 欧美色视频一区免费| 女同久久另类99精品国产91| 中国美女看黄片| 国语自产精品视频在线第100页| 国产黄色小视频在线观看| 91在线观看av| 18禁在线播放成人免费| 亚洲一区二区三区不卡视频| 免费观看人在逋| 好看av亚洲va欧美ⅴa在| or卡值多少钱| 中文资源天堂在线| 亚洲狠狠婷婷综合久久图片| 韩国av一区二区三区四区| a级毛片a级免费在线| 天堂av国产一区二区熟女人妻| 亚洲内射少妇av| 国产色婷婷99| 女生性感内裤真人,穿戴方法视频| 中文字幕久久专区| 床上黄色一级片| 国产高清videossex| 久久99热这里只有精品18| 欧洲精品卡2卡3卡4卡5卡区| 99久久精品热视频| 天堂影院成人在线观看| 精品乱码久久久久久99久播| 久久国产精品人妻蜜桃| 五月玫瑰六月丁香| 欧美最黄视频在线播放免费| 国产三级黄色录像| 色综合婷婷激情| 色综合站精品国产| 日韩欧美在线乱码| 免费大片18禁| 亚洲国产精品合色在线| 欧美zozozo另类| 婷婷亚洲欧美| 成人无遮挡网站| 欧美区成人在线视频| 99riav亚洲国产免费| 熟女电影av网| 亚洲av免费高清在线观看| 不卡一级毛片| 操出白浆在线播放| 波多野结衣高清无吗| 免费在线观看成人毛片| 国产男靠女视频免费网站| 两人在一起打扑克的视频| 人人妻人人澡欧美一区二区| 免费看日本二区| 亚洲成人中文字幕在线播放| 内地一区二区视频在线| 色综合亚洲欧美另类图片| 久久久久精品国产欧美久久久| 婷婷六月久久综合丁香| 国产综合懂色| 国产精品一区二区三区四区久久| 无遮挡黄片免费观看| 51国产日韩欧美| 大型黄色视频在线免费观看| 在线免费观看不下载黄p国产 | 日本黄大片高清| 亚洲av免费高清在线观看| 麻豆久久精品国产亚洲av| 99精品久久久久人妻精品| 久久久久久九九精品二区国产| 99精品久久久久人妻精品| 国产乱人视频| 国产69精品久久久久777片| 成人三级黄色视频| 欧美中文综合在线视频| 国产精品,欧美在线| 国产精品一区二区免费欧美| 19禁男女啪啪无遮挡网站| 亚洲人成网站高清观看| 国产国拍精品亚洲av在线观看 | 国产精品,欧美在线| 淫妇啪啪啪对白视频| 少妇的逼好多水| 波多野结衣巨乳人妻| 听说在线观看完整版免费高清| 搞女人的毛片| 天天躁日日操中文字幕| 成人特级黄色片久久久久久久| 好男人在线观看高清免费视频| 精品电影一区二区在线| 国产69精品久久久久777片| 美女免费视频网站| 日本在线视频免费播放| 欧美黑人欧美精品刺激| 丁香六月欧美| 日韩欧美免费精品| 欧美日韩瑟瑟在线播放| www.www免费av| 国内精品美女久久久久久| 国产美女午夜福利| 国产午夜精品久久久久久一区二区三区 | 国产精品亚洲美女久久久| 日韩欧美免费精品| 网址你懂的国产日韩在线| 性色avwww在线观看| 色哟哟哟哟哟哟| 亚洲成人久久爱视频| 男女午夜视频在线观看| 亚洲人成网站在线播| 18禁国产床啪视频网站| 国产av麻豆久久久久久久| 国产精品精品国产色婷婷| 老司机深夜福利视频在线观看| 久久亚洲真实| 日本黄大片高清| 中文字幕精品亚洲无线码一区| 亚洲美女黄片视频| 日本三级黄在线观看| 久久久久久久久久黄片| 丁香六月欧美| 观看美女的网站| 国产精品98久久久久久宅男小说| 男人和女人高潮做爰伦理| 男人舔奶头视频| 99久国产av精品| 一进一出好大好爽视频| 成人欧美大片| 天美传媒精品一区二区| 老熟妇乱子伦视频在线观看| 毛片女人毛片| 日本五十路高清| 精品99又大又爽又粗少妇毛片 | 国产一区二区在线观看日韩 | 男人舔女人下体高潮全视频| 真实男女啪啪啪动态图| 成年女人永久免费观看视频| 国产探花极品一区二区| 性色avwww在线观看| 久久久久久九九精品二区国产| 欧美3d第一页| 国产精品久久久久久精品电影| 怎么达到女性高潮| 国内毛片毛片毛片毛片毛片| 亚洲色图av天堂| 男人和女人高潮做爰伦理| 亚洲精品在线观看二区| 亚洲国产中文字幕在线视频| 亚洲av美国av| 色综合婷婷激情| 99国产精品一区二区蜜桃av| 成年女人看的毛片在线观看| 老司机午夜十八禁免费视频| 一区福利在线观看| 一级毛片女人18水好多| 日韩欧美免费精品| 国产精品亚洲一级av第二区| 国产麻豆成人av免费视频| 啦啦啦免费观看视频1| 久久人妻av系列| 久久精品综合一区二区三区| 少妇熟女aⅴ在线视频| 日本一二三区视频观看| av天堂在线播放| 熟女少妇亚洲综合色aaa.| 欧美黑人欧美精品刺激| 国产亚洲精品一区二区www| 欧美日韩乱码在线| 国产精品久久久久久久电影 | 日本 av在线| 亚洲在线观看片| 偷拍熟女少妇极品色| 日本成人三级电影网站| 热99re8久久精品国产| 亚洲精品成人久久久久久| 日韩中文字幕欧美一区二区| 国产亚洲av嫩草精品影院| 男人舔奶头视频| 精品99又大又爽又粗少妇毛片 | 亚洲美女黄片视频| av黄色大香蕉| 午夜福利免费观看在线| 白带黄色成豆腐渣| 99精品久久久久人妻精品| 亚洲精品成人久久久久久| 亚洲av成人精品一区久久| 欧美性感艳星| 在线天堂最新版资源| 在线看三级毛片| 色综合亚洲欧美另类图片| 一区二区三区国产精品乱码| 99久久无色码亚洲精品果冻| 老熟妇仑乱视频hdxx| 人妻久久中文字幕网| 国产欧美日韩精品亚洲av| 两性午夜刺激爽爽歪歪视频在线观看| 男人的好看免费观看在线视频| 波多野结衣高清无吗| 成人18禁在线播放| 亚洲无线在线观看| 亚洲av五月六月丁香网| 在线观看免费午夜福利视频| 国产精品香港三级国产av潘金莲| 啦啦啦韩国在线观看视频| 最近最新中文字幕大全免费视频| 麻豆久久精品国产亚洲av| 亚洲欧美精品综合久久99| 国产亚洲精品久久久久久毛片| 黄色片一级片一级黄色片| eeuss影院久久| 日韩大尺度精品在线看网址| 男女之事视频高清在线观看| 身体一侧抽搐| 欧美一级毛片孕妇| 国产欧美日韩精品亚洲av| www日本在线高清视频| 国产淫片久久久久久久久 | 97超视频在线观看视频| 国产伦一二天堂av在线观看| 给我免费播放毛片高清在线观看| 在线视频色国产色| 高潮久久久久久久久久久不卡| 18禁美女被吸乳视频| av在线蜜桃| 欧美日韩亚洲国产一区二区在线观看|