• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    面向國(guó)產(chǎn)平臺(tái)的LLVM 自動(dòng)向量化移植與優(yōu)化

    2022-01-14 03:02:12李嘉楠柴赟達(dá)
    計(jì)算機(jī)工程 2022年1期
    關(guān)鍵詞:基本塊標(biāo)量代價(jià)

    李嘉楠,韓 林,柴赟達(dá)

    (1.鄭州大學(xué)信息工程學(xué)院,鄭州 450000;2.國(guó)家超級(jí)計(jì)算鄭州中心,鄭州 450000)

    0 概述

    高性能計(jì)算可用于開發(fā)解決全球性問題的科學(xué)應(yīng)用程序,如疫苗研制、氣候建模等。如今,提高處理器的性能變得越來(lái)越重要,而電子器件的更新已不能滿足日益增長(zhǎng)的計(jì)算需求,在此情況下,微型的向量并行部件SIMD(Single Instruction Multiple Data)擴(kuò)展得到迅速發(fā)展,并被廣泛應(yīng)用于各種科學(xué)計(jì)算類程序的加速優(yōu)化任務(wù)。

    基于SIMD 擴(kuò)展部件的向量化已成為程序并行的重要手段,其向量寄存器和SIMD 指令是程序員以及處理器廠商的研究重點(diǎn)[1]。目前,ICC、GCC、LLVM(Low Level Virtual Machine)等編譯器已相繼支持了SIMD 的自動(dòng)向量化編譯,面向SIMD 擴(kuò)展部件的自動(dòng)向量化編譯已逐漸成為程序向量化變換的主要方式。

    LLVM 是對(duì)任意編程語(yǔ)言提供一種基于SSA(Static Single Assignment)[2]的靜態(tài)與動(dòng)態(tài)編譯的現(xiàn)代編譯技術(shù),與其他主流編譯器相比,LLVM 具有如下優(yōu)勢(shì):統(tǒng)一的IR(Intermediate Representation)與模塊化[3],能夠以庫(kù)的形式抽取其組件并用于其他領(lǐng)域;編譯器中的優(yōu)化和分析被組織成遍(Pass)結(jié)構(gòu),通過不同遍完成不同的優(yōu)化算法[4];開源License 的優(yōu)勢(shì)使其被各大公司廣泛采用。在LLVM 編譯器中,已實(shí)現(xiàn)了循環(huán)級(jí)與基本塊級(jí)的自動(dòng)向量化方法[5]。

    申威系列處理器是我國(guó)自主研發(fā)、面向高性能計(jì)算的通用微處理器,該處理器主要針對(duì)計(jì)算密集型程序,如科學(xué)計(jì)算、數(shù)字信號(hào)分析、多媒體處理等。申威系列處理器包含豐富的向量運(yùn)算指令和完善的向量重組指令,為程序的向量化提供了良好的硬件基礎(chǔ)。

    LLVM 編譯器中自動(dòng)向量化部分主要由Intel 團(tuán)隊(duì)開發(fā)推進(jìn),算法以及向量指令的應(yīng)用更適用于X86 平臺(tái)[6]。目前,LLVM 編譯器還未支持面向國(guó)產(chǎn)平臺(tái)的自動(dòng)向量化。由于指令集的差別,申威處理器與X86 處理器的自動(dòng)向量化實(shí)現(xiàn)方法有所不同,如AVX 指令集兼容256 位與128 位的向量長(zhǎng)度,而國(guó)產(chǎn)處理器一般只支持單一的向量長(zhǎng)度,導(dǎo)致向量化后生成不支持的向量類型,從而產(chǎn)生段錯(cuò)誤、結(jié)果錯(cuò)誤等問題。

    本文針對(duì)申威1621 處理器平臺(tái)進(jìn)行自動(dòng)向量化移植研究,從循環(huán)級(jí)與基本塊級(jí)2 個(gè)方面提高自動(dòng)向量化適配能力,以完善向量化所需的指令代價(jià)信息,并在精準(zhǔn)代價(jià)模型的指導(dǎo)下生成后端支持的向量指令。同時(shí),針對(duì)循環(huán)級(jí)向量化中控制流向量化進(jìn)行算法改進(jìn),以解決后端不支持掩碼訪存指令的問題。

    1 LLVM 自動(dòng)向量化框架

    1.1 循環(huán)級(jí)向量化

    循環(huán)級(jí)向量化主要是在迭代間尋找并行機(jī)會(huì)以進(jìn)行向量化,其主要流程如圖1 所示。

    圖1 循環(huán)級(jí)向量化流程Fig.1 Procedure of cyclic vectorization

    合法性分析步驟為:首先檢查是否為嵌套循環(huán),排除不能向量化的循環(huán)形式,如多出口多回邊結(jié)構(gòu);然后對(duì)包含控制流的循環(huán)進(jìn)行分析,收集分支掩碼以用于后續(xù)向量代碼生成[7];接著對(duì)phi 指令以及調(diào)用指令進(jìn)行分析,判斷其是否符合向量化格式要求;最后調(diào)用循環(huán)訪存信息,分析訪存指令是否具有阻止向量化的依賴關(guān)系。依賴分析就是根據(jù)循環(huán)內(nèi)的數(shù)據(jù)依賴關(guān)系構(gòu)造語(yǔ)句依賴圖,在語(yǔ)句依賴圖上求解強(qiáng)連通分量,不具有強(qiáng)連通分量的語(yǔ)句就是可以進(jìn)行向量執(zhí)行的語(yǔ)句[8-9]。

    通過調(diào)用代價(jià)模型,首先對(duì)基本塊中訪存指令進(jìn)行分析,連續(xù)訪存可直接獲取指令代價(jià),非連續(xù)訪存需要對(duì)比不同策略下的收益,選出訪存指令向量化的最佳執(zhí)行方案[10-11];然后將該指令與基本塊內(nèi)其他指令一起,以2 的整數(shù)冪在[2,IMaxVF]范圍內(nèi)進(jìn)行收益比較;最終將其與標(biāo)量代價(jià)進(jìn)行對(duì)比,選出最優(yōu)的向量化因子。

    向量代碼生成是在原始標(biāo)量循環(huán)結(jié)構(gòu)之前創(chuàng)建一個(gè)新的循環(huán),使其成為向量指令的載體。標(biāo)量循環(huán)中不同類型的指令分別調(diào)用不同的轉(zhuǎn)換函數(shù)以進(jìn)行向量指令生成,最后將生成的向量指令逐一添加到新的循環(huán)中,更新支配關(guān)系,原始的標(biāo)量循環(huán)將作為新向量循環(huán)的“標(biāo)量尾循環(huán)”處理[12]。

    1.2 基本塊級(jí)向量化

    緊跟在循環(huán)級(jí)向量化后的是基本塊級(jí)向量化,其主要在基本塊內(nèi)尋找同構(gòu)語(yǔ)句以發(fā)掘并行機(jī)會(huì)?;緣K級(jí)向量化流程如圖2 所示。

    圖2 基本塊級(jí)向量化流程Fig.2 Procedure of basic-block level vectorization

    在基本塊級(jí)向量化中,首先找到函數(shù)中所有的內(nèi)存引用,收集指令并進(jìn)行打包[13],包是一個(gè)同構(gòu)語(yǔ)句的集合,將多個(gè)同構(gòu)語(yǔ)句組成包的過程稱作打包,相反則稱為拆包[14];然后SLP 利用相鄰地址的存儲(chǔ)指令作為種子進(jìn)行打包,通過“定義-使用鏈”和“使用-定義鏈”啟發(fā)式地?cái)U(kuò)展包[15],若循環(huán)中的每一個(gè)操作都可以被目標(biāo)平臺(tái)以向量形式支持,則進(jìn)行語(yǔ)法樹的代價(jià)分析,在有收益的情況下構(gòu)建向量化樹,從上到下掃描基本塊的所有語(yǔ)句,在需要向量化的標(biāo)量語(yǔ)句前插入向量語(yǔ)句,以完成向量代碼生成[16];最后移至下一組指令重復(fù)以上分析,直至完成基本塊內(nèi)所有指令的向量發(fā)掘。

    2 自動(dòng)向量化移植

    近年來(lái),作為編譯優(yōu)化領(lǐng)域的研究熱點(diǎn),SIMD擴(kuò)展部件不斷發(fā)展。申威系列處理器的SIMD 向量長(zhǎng)度在持續(xù)增長(zhǎng),指令集功能也越來(lái)越豐富,因此,需要針對(duì)每一種處理器實(shí)現(xiàn)其自動(dòng)向量化功能移植。移植主要包含自動(dòng)向量化優(yōu)化遍、后端相關(guān)轉(zhuǎn)換信息2 個(gè)方面。自動(dòng)向量化可分為識(shí)別、優(yōu)化、指令生成3 個(gè)部分。識(shí)別方法在循環(huán)級(jí)向量化與基本塊級(jí)向量化中通用,最重要的是考慮SIMD 部件差異與指令集特征,其中,寄存器信息、跨幅因子、基本指令代價(jià)的精確描述是自動(dòng)向量化的基礎(chǔ)條件。另外,本文提出一種掩碼指令轉(zhuǎn)換方法,使得申威平臺(tái)支持包含控制流結(jié)構(gòu)的向量化。

    2.1 寄存器信息

    完善SIMD 向量化的寄存器基礎(chǔ)信息包含RegisterInfo 文件中向量寄存器數(shù)量、特征信息以及TargetTransformInfo 文件中寄存器寬度描述,必要時(shí)數(shù)據(jù)類型長(zhǎng)度也需要根據(jù)指令集信息進(jìn)行修改[17],否則會(huì)生成后端不支持的向量長(zhǎng)度或向量類型,增加后端指令降級(jí)工作從而導(dǎo)致向量代碼生成效率降低。

    2.2 跨幅因子

    跨幅因子即循環(huán)級(jí)向量化中的“Interleave Count”,為基本塊中單條語(yǔ)句的展開數(shù),默認(rèn)值為1。結(jié)合向量指令特征,將TargetTransformInfo 中最大跨幅因子設(shè)置為4,向量化階段調(diào)用代價(jià)模型從[1,4]范圍內(nèi)分析出最佳跨幅因子,與原始默認(rèn)值1 相比,提升了向量化性能。以TSVC(Test Suit for Vectorizing Compilers)測(cè)試集中的vpvts 函數(shù)為例,移植后進(jìn)行收益分析,選擇出最佳跨幅因子為4,以此進(jìn)行向量代碼的局部展開,相比原始向量化其性能提升了70%。

    2.3 基本指令延遲信息

    基本指令包含邏輯運(yùn)算指令、類型轉(zhuǎn)換指令、比較指令、內(nèi)建函數(shù)指令、訪存指令等。根據(jù)硬件提供的指令延遲表,在后端TargetTransformInfo 文件中對(duì)指令代價(jià)進(jìn)行精確描述,包含數(shù)據(jù)類型、操作碼識(shí)別、指令延遲數(shù)補(bǔ)充。將后端不支持的向量指令代價(jià)調(diào)高,防止向量化后產(chǎn)生倒加速問題。對(duì)于復(fù)雜指令如混洗指令,結(jié)合后端指令降級(jí)中自定義的指令拆分組合情況進(jìn)行精確描述。

    X86 平臺(tái)支持128 位的向量寄存器[18],在自動(dòng)向量化中最小向量化因子限制為2,但這在申威平臺(tái)不適用,原因是會(huì)造成數(shù)據(jù)處理過程中讀取錯(cuò)誤信息,在程序運(yùn)行時(shí)引發(fā)段錯(cuò)誤?;谏鲜鲈?,本文分別在循環(huán)級(jí)向量化與基本塊級(jí)向量化中修改最小向量化因子。

    2.4 掩碼內(nèi)建指令

    掩碼內(nèi)建函數(shù)是對(duì)LLVM 基本指令集的補(bǔ)充,由特定目標(biāo)平臺(tái)的特殊指令組合而成,但并不是所有目標(biāo)架構(gòu)指令集都具備全面的掩碼指令[18-19]。在申威平臺(tái)下進(jìn)行SIMD 編譯時(shí),自動(dòng)向量化并不支持掩碼訪存指令,導(dǎo)致大量包含控制流的循環(huán)錯(cuò)失向量化機(jī)會(huì)。在循環(huán)級(jí)向量化時(shí)將掩碼訪存指令替換為select 向量指令,可解決目標(biāo)平臺(tái)不支持掩碼訪存指令的問題,核心轉(zhuǎn)換算法描述如算法1 所示。

    算法1掩碼指令轉(zhuǎn)換算法

    3 收益評(píng)估模型

    循環(huán)或函數(shù)被向量化后的基本收益就是基本塊中減少的指令周期數(shù),收益評(píng)估用于衡量向量化是否有利于提高程序效率[7]。自動(dòng)向量化移植使得收益評(píng)估更加精準(zhǔn)與完善,可以在收益評(píng)估的指導(dǎo)下判斷是否需要進(jìn)行向量化以及如何進(jìn)行向量化,從而生成最符合申威后端需求的向量或標(biāo)量代碼。

    3.1 面向循環(huán)級(jí)向量化的收益評(píng)估

    循環(huán)級(jí)向量化收益分析流程如圖3 所示。

    圖3 循環(huán)級(jí)向量化收益分析流程Fig.3 Procedure of cost analysis in cyclic vectorization

    收益分析主要集中在2 個(gè)部分:針對(duì)訪存指令的最佳加寬決策;針對(duì)循環(huán)基本塊的最佳向量化因子選擇。具體步驟如下:

    1)計(jì)算可行的最大向量化因子IMaxVF,獲取后端向量寄存器長(zhǎng)度DWidthRegister以及數(shù)據(jù)寬度DWidthType信息,對(duì)于只支持單一向量長(zhǎng)度的后端:

    2)訪存指令對(duì)程序的向量化或性能提升起決定性作用,對(duì)于訪存指令,循環(huán)級(jí)向量化具有專屬的決策分析以求得最大收益。對(duì)于連續(xù)訪存代價(jià),直接從后端指令延遲表獲??;對(duì)于不連續(xù)訪存,比較跨幅訪存、聚合訪存、標(biāo)量化訪存3 種方案下的收益以選取最佳方案進(jìn)行執(zhí)行。

    額外代價(jià)來(lái)源于從<8 x i32>向量中的0、2、4、6 位抽取數(shù)據(jù)并插入到<4 x i32>向量過程中的插入抽取指令,設(shè)GGroupNums為跨幅訪存組指令數(shù)量,其額外代價(jià)為:

    跨幅store 指令是從子向量中提取所有元素,并將它們插入到目的向量中,例如:

    額外代價(jià)來(lái)源于從2 個(gè)<4 x i32>向量中抽取8 個(gè)元素插入到<8 x i32>向量過程中的插入抽取指令代價(jià),設(shè)跨步為SSteps,其額外代價(jià)為:

    (3)標(biāo)量化訪存代價(jià)首先獲取標(biāo)量存儲(chǔ)指令和地址計(jì)算:

    包含控制流的循環(huán)屬于不連續(xù)訪存,掩碼指令轉(zhuǎn)換算法將包含控制流的循環(huán)進(jìn)行select 指令轉(zhuǎn)換,改變包含控制流訪存收益分析的計(jì)算方式,如下:

    在更新包含控制流的代價(jià)計(jì)算后,根據(jù)基本塊執(zhí)行的概率來(lái)擴(kuò)展代價(jià)[20],循環(huán)級(jí)向量化認(rèn)為每個(gè)基本塊執(zhí)行的概率均為50%,因此,分支基本塊的代價(jià)為CCost=CCost/2。

    3)將循環(huán)中所有指令進(jìn)行累加,對(duì)比以上3 種不連續(xù)訪存的收益,選擇最優(yōu)收益方案進(jìn)行下一步向量因子的收益分析。

    最后對(duì)比標(biāo)量與向量形式下的收益,選擇進(jìn)行向量代碼生成或保持原有的標(biāo)量執(zhí)行。

    3.2 面向基本塊級(jí)向量化的收益評(píng)估

    SLP 向量化收益開銷計(jì)算算法以抽象語(yǔ)法樹為基礎(chǔ),滿足E≥VVF條件后以存儲(chǔ)指令為根節(jié)點(diǎn)遍歷樹形結(jié)構(gòu),通過“使用-定義鏈”自下而上進(jìn)行打包,其中,每個(gè)節(jié)點(diǎn)都包含可并行處理且數(shù)目相同的同構(gòu)語(yǔ)句[21-22]。

    代價(jià)模型獲取寄存器信息計(jì)算向量化所需的同構(gòu)語(yǔ)句數(shù),根據(jù)指令代價(jià)選擇收益最大的進(jìn)行向量化。首先確定同構(gòu)語(yǔ)句長(zhǎng)度(即同構(gòu)語(yǔ)句數(shù)量)與向量化因子:設(shè)同構(gòu)語(yǔ)句長(zhǎng)度為E,向量化因子為VVF(設(shè)向量寄存器長(zhǎng)度為256 位,標(biāo)量元素double 為64 bit,則向量化因子VVF等于4)。假設(shè)標(biāo)量指令代價(jià)為Si,向量指令代價(jià)為VCost,則每條向量指令的收益為:

    該基本塊向量的收益總和為:

    考慮寄存器溢出與指令重組對(duì)向量化性能存在影響,因此,自底向上遍歷語(yǔ)法樹以計(jì)算額外開銷,其值在理想狀態(tài)下為0,則總體收益為:

    另外一些計(jì)算如標(biāo)量的規(guī)約計(jì)算、向量化指針指令的索引計(jì)算,沒有被基于同構(gòu)store 組的自底向上的遍歷過程所捕獲,因?yàn)樗鼈儾话@樣的存儲(chǔ)指令,此類收益分析需考慮插入/抽取指令以及索引信息的代價(jià)(從后端相關(guān)指令延遲表中獲取,默認(rèn)值為0),則總體收益為:

    4 測(cè)試分析

    本文采用申威1621 處理器為測(cè)試平臺(tái),進(jìn)行LLVM 編譯器自動(dòng)向量化移植功能測(cè)試,編譯器版本為7.0。分別采用SPEC2006 與TSVC 測(cè)試集以及向量化應(yīng)用測(cè)試,從正確性與向量化性能2 個(gè)方面進(jìn)行對(duì)比分析。

    4.1 功能測(cè)試與分析

    SPEC2006 標(biāo)準(zhǔn)測(cè)試集是SPEC 組織推出的CPU 子系統(tǒng)評(píng)估軟件。為驗(yàn)證本文方法改進(jìn)下編譯器的健壯性,對(duì)SPEC2006 標(biāo)準(zhǔn)測(cè)試集中的29 道題進(jìn)行測(cè)試,結(jié)果如表1 所示。

    表1 SPEC 測(cè)試結(jié)果Table 1 SPEC test results

    移植前中間表示代碼在自動(dòng)向量化階段生成了后端不支持的向量類型,在后端指令降級(jí)過程中找不到匹配的降級(jí)方法與指令模板,導(dǎo)致測(cè)試題出現(xiàn)段錯(cuò)誤以及結(jié)果錯(cuò)誤的問題。從表1 可以看出,移植優(yōu)化后410、416、454 等測(cè)試題依靠后端信息的精準(zhǔn)描述以及收益分析的正確引導(dǎo),向量化程序在test、train、ref 規(guī)模下正確運(yùn)行。

    4.2 精準(zhǔn)代價(jià)指導(dǎo)下的測(cè)試分析

    基本運(yùn)算指令代價(jià)的精準(zhǔn)描述,可以使得自動(dòng)向量化做出符合后端要求的向量化決策,生成簡(jiǎn)潔高效的向量匯編指令。本文采用TSVC 測(cè)試集中的典型例題,對(duì)比移植優(yōu)化前后的加速性能,結(jié)果如圖4 所示,從圖4 可以看出,相對(duì)移植前,移植優(yōu)化后平均加速比提升42%。

    圖4 精準(zhǔn)代價(jià)指導(dǎo)下的加速性能Fig.4 Accelerated performance under precise cost guidance

    當(dāng)后端對(duì)不支持的向量指令進(jìn)行降級(jí)處理時(shí),會(huì)生成冗余標(biāo)量指令導(dǎo)致倒加速。精準(zhǔn)代價(jià)模型指導(dǎo)下的自動(dòng)向量化可排除后端不支持的向量類型,防止向量化倒加速產(chǎn)生。從圖5 可以看出,使用精準(zhǔn)代價(jià)指導(dǎo)后,選擇與后端匹配的向量化因子以及向量化方法,可以使倒加速情況得到明顯改善,在原有移植的基礎(chǔ)上平均加速比提升28%。

    圖5 精準(zhǔn)代價(jià)指導(dǎo)下的倒加速改善結(jié)果Fig.5 Reverse acceleration improvement results under precise cost guidance

    4.3 性能測(cè)試與分析

    本文分別采用SPEC CPU2006 測(cè)試題、TSVC 測(cè)試集以及被廣泛應(yīng)用的矩陣運(yùn)算測(cè)試題進(jìn)行性能測(cè)試。

    4.3.1 SPEC 測(cè)試分析

    本次實(shí)驗(yàn)對(duì)SPEC 測(cè)試集的29 道題進(jìn)行性能測(cè)試分析,編譯優(yōu)化選擇-O3-static,ref 規(guī)模,單進(jìn)程運(yùn)行。選取代表性測(cè)試題進(jìn)行分析,對(duì)比X86 平臺(tái)與國(guó)產(chǎn)平臺(tái)的向量化能力,從而驗(yàn)證移植的有效性。測(cè)試結(jié)果如圖6 所示,其中,X86 選用與申威SIMD長(zhǎng)度相同的AVX 指令集。

    圖6 SPEC 測(cè)試分析結(jié)果Fig.6 SPEC test analysis results

    前端將測(cè)試題解析為中間表示代碼,自動(dòng)向量化在此基礎(chǔ)上進(jìn)行向量代碼優(yōu)化生成,然后由后端進(jìn)行降級(jí)處理,生成特定指令集的匯編碼。從圖6 可以看出,移植優(yōu)化后的向量代碼簡(jiǎn)潔高效且符合后端指令集特征需求,移植后SPEC 整體性能提升10.8%,國(guó)產(chǎn)平臺(tái)的向量化能力優(yōu)于X86,其中,436 加速效果最為明顯,提升了97%,437 加速比提升52%,434、470、482 加速比平均提升21%。由于指令集存在差異,國(guó)產(chǎn)處理器不支持一些特殊的向量指令,導(dǎo)致其對(duì)456 與482 的加速性能低于X86。

    4.3.2 TSVC 測(cè)試分析

    TSVC 測(cè)試集主要用來(lái)對(duì)編譯器的自動(dòng)向量化能力進(jìn)行性能測(cè)試,本文采用TSVC 測(cè)試集對(duì)比移植優(yōu)化前后的加速性能,測(cè)試結(jié)果表明,移植優(yōu)化后整體加速比提升16%。對(duì)掩碼內(nèi)建指令進(jìn)行相關(guān)修改,可以使得后端兼容原本不支持的向量化實(shí)現(xiàn)方法,從而充分利用申威后端的向量指令。從圖7 可以看出,在控制流優(yōu)化下,循環(huán)識(shí)別率提升48%,平均加速比提升51%。

    圖7 控制流優(yōu)化下的加速比結(jié)果Fig.7 Acceleration ratio results under control flow optimization

    4.3.3 應(yīng)用測(cè)試分析

    快速傅立葉變換被廣泛應(yīng)用于信號(hào)分析任務(wù),其性能提升離不開矩陣運(yùn)算優(yōu)化,另外,圖形處理、游戲開發(fā)、科學(xué)計(jì)算中包含了大量的矩陣運(yùn)算,因此,本次實(shí)驗(yàn)以矩陣乘為代表,進(jìn)行應(yīng)用程序測(cè)試分析。實(shí)驗(yàn)采用3 層循環(huán),以3 種N×N規(guī)模的矩陣進(jìn)行測(cè)試,每個(gè)規(guī)模運(yùn)行3 次并取平均值,以對(duì)比移植優(yōu)化前后的運(yùn)算性能,結(jié)果如圖8 所示。從圖8 可以看出,矩陣乘運(yùn)算總體性能提升了72%,矩陣規(guī)模為1 024×1 024、2 048×2 048、4 096×4 096 時(shí),加速比分別提升了77%、79%、59%。矩陣乘性能收益主要來(lái)源于合適的跨幅因子與向量化因子,其能夠最大程度地發(fā)揮SIMD 向量指令的優(yōu)勢(shì)。

    圖8 矩陣乘運(yùn)算性能分析Fig.8 Performance analysis of matrix multiplication operation

    5 結(jié)束語(yǔ)

    本文針對(duì)申威1621 處理器進(jìn)行LLVM 自動(dòng)向量化功能移植,以解決自動(dòng)向量化過程中后端信息不匹配和向量化實(shí)現(xiàn)方法不兼容的問題。實(shí)驗(yàn)結(jié)果表明,移植優(yōu)化后不再生成后端不支持的向量類型以及不合法的向量指令,控制流向量化程度顯著提升,在TSVC 測(cè)試集中,相對(duì)自動(dòng)向量化移植前,移植優(yōu)化后平均加速比提升16%。通過對(duì)自動(dòng)向量化移植進(jìn)行研究可以看出,在申威后端存在不支持某些相對(duì)重要的向量指令的情況,這將嚴(yán)重影響向量化的效果。因此,下一步將綜合考慮申威指令集與自動(dòng)向量化后代碼生成的關(guān)系,將申威指令集中的基本向量指令進(jìn)行拼接與重組,從而提高向量指令的適用性。

    猜你喜歡
    基本塊標(biāo)量代價(jià)
    基于級(jí)聯(lián)森林的控制流錯(cuò)誤檢測(cè)優(yōu)化算法
    距離與權(quán)重相結(jié)合的導(dǎo)向式灰盒模糊測(cè)試方法
    一種檢測(cè)控制流錯(cuò)誤的多層分段標(biāo)簽方法
    一種高效的橢圓曲線密碼標(biāo)量乘算法及其實(shí)現(xiàn)
    一種靈活的橢圓曲線密碼并行化方法
    愛的代價(jià)
    海峽姐妹(2017年12期)2018-01-31 02:12:22
    代價(jià)
    成熟的代價(jià)
    單調(diào)Minkowski泛函與Henig真有效性的標(biāo)量化
    標(biāo)量電子能級(jí)束縛態(tài)的計(jì)算
    欧美黄色片欧美黄色片| 久久久久久国产a免费观看| 欧美日韩综合久久久久久 | 久久久久久国产a免费观看| 日本 av在线| 国产乱人视频| 国内精品一区二区在线观看| 中文字幕久久专区| 夜夜夜夜夜久久久久| 91av网站免费观看| 国产成人福利小说| 久久亚洲精品不卡| 老汉色∧v一级毛片| 中文字幕高清在线视频| 97超级碰碰碰精品色视频在线观看| 成人午夜高清在线视频| 亚洲av美国av| 日本免费一区二区三区高清不卡| 日本熟妇午夜| 中文在线观看免费www的网站| 日本撒尿小便嘘嘘汇集6| 免费观看的影片在线观看| 国产高清有码在线观看视频| 亚洲精品美女久久久久99蜜臀| 日韩成人在线观看一区二区三区| 亚洲精品在线美女| 岛国在线观看网站| 99国产精品99久久久久| 亚洲成a人片在线一区二区| 天天躁日日操中文字幕| 亚洲精品美女久久久久99蜜臀| 国产成人系列免费观看| 999久久久国产精品视频| 亚洲中文字幕一区二区三区有码在线看 | 麻豆国产av国片精品| 亚洲五月天丁香| a级毛片a级免费在线| 久久天堂一区二区三区四区| 美女午夜性视频免费| 哪里可以看免费的av片| 精品电影一区二区在线| 中文亚洲av片在线观看爽| 精品福利观看| 国产熟女xx| 麻豆一二三区av精品| 亚洲国产精品久久男人天堂| aaaaa片日本免费| 又大又爽又粗| 99国产综合亚洲精品| 国产午夜精品久久久久久| www日本黄色视频网| 国产午夜福利久久久久久| www日本在线高清视频| 91九色精品人成在线观看| 91在线观看av| 人人妻人人看人人澡| 亚洲人成网站高清观看| 少妇的丰满在线观看| 午夜福利视频1000在线观看| 两个人视频免费观看高清| 国产一区二区三区在线臀色熟女| 久久精品国产清高在天天线| 精品国产三级普通话版| 亚洲国产精品sss在线观看| 一进一出抽搐gif免费好疼| 国产精品一区二区三区四区免费观看 | 校园春色视频在线观看| 成年人黄色毛片网站| 亚洲国产欧美人成| 99精品欧美一区二区三区四区| 少妇人妻一区二区三区视频| 国产高潮美女av| 特级一级黄色大片| 久久精品国产综合久久久| 免费一级毛片在线播放高清视频| 精品99又大又爽又粗少妇毛片 | 国产午夜精品论理片| 国产亚洲av高清不卡| 国产精品影院久久| 久久精品夜夜夜夜夜久久蜜豆| 国产精品九九99| av视频在线观看入口| 18美女黄网站色大片免费观看| 在线观看免费午夜福利视频| 国产单亲对白刺激| 一级毛片女人18水好多| 国产成人av激情在线播放| 欧美另类亚洲清纯唯美| 这个男人来自地球电影免费观看| 叶爱在线成人免费视频播放| 舔av片在线| 1024香蕉在线观看| 欧美在线黄色| 日本免费一区二区三区高清不卡| 亚洲国产高清在线一区二区三| 一个人看视频在线观看www免费 | 一本一本综合久久| 叶爱在线成人免费视频播放| 亚洲熟妇熟女久久| 美女黄网站色视频| 99re在线观看精品视频| 亚洲真实伦在线观看| 国产高清激情床上av| 最好的美女福利视频网| 老熟妇仑乱视频hdxx| 两个人的视频大全免费| 国产精品一区二区精品视频观看| 日本一本二区三区精品| 色av中文字幕| 亚洲欧美激情综合另类| 亚洲人成伊人成综合网2020| 国产亚洲av嫩草精品影院| 精品久久久久久久末码| 国产精品九九99| 五月玫瑰六月丁香| 国产私拍福利视频在线观看| 色在线成人网| 大型黄色视频在线免费观看| 成人特级黄色片久久久久久久| 无限看片的www在线观看| 国产成人av激情在线播放| 成年女人毛片免费观看观看9| 好男人在线观看高清免费视频| 中亚洲国语对白在线视频| 亚洲九九香蕉| 国产黄a三级三级三级人| 色噜噜av男人的天堂激情| av在线蜜桃| 亚洲欧洲精品一区二区精品久久久| 国产精品美女特级片免费视频播放器 | 香蕉丝袜av| 在线永久观看黄色视频| 精品人妻1区二区| 两个人的视频大全免费| 一个人看的www免费观看视频| 久久热在线av| 欧美中文综合在线视频| 人妻久久中文字幕网| 色综合欧美亚洲国产小说| 国内精品久久久久精免费| 真人做人爱边吃奶动态| 99热这里只有是精品50| 色尼玛亚洲综合影院| 免费看日本二区| 成人鲁丝片一二三区免费| 夜夜夜夜夜久久久久| 欧美丝袜亚洲另类 | 午夜a级毛片| 午夜福利欧美成人| 国内揄拍国产精品人妻在线| 亚洲国产精品sss在线观看| 久久久久亚洲av毛片大全| 日韩人妻高清精品专区| 亚洲人成网站在线播放欧美日韩| 一个人看视频在线观看www免费 | 欧洲精品卡2卡3卡4卡5卡区| 精品无人区乱码1区二区| 成人av在线播放网站| 免费观看的影片在线观看| 久久久久久久精品吃奶| 国模一区二区三区四区视频 | 国产探花在线观看一区二区| 黑人欧美特级aaaaaa片| 精品一区二区三区av网在线观看| 成熟少妇高潮喷水视频| 99久久综合精品五月天人人| 欧美另类亚洲清纯唯美| 亚洲精品456在线播放app | 综合色av麻豆| 久久久水蜜桃国产精品网| 黄色视频,在线免费观看| 精品国产乱码久久久久久男人| 国产精品精品国产色婷婷| 欧美一区二区国产精品久久精品| 久久久久久久午夜电影| 女生性感内裤真人,穿戴方法视频| 舔av片在线| 俄罗斯特黄特色一大片| 午夜福利免费观看在线| 长腿黑丝高跟| 国产成人福利小说| 国产黄色小视频在线观看| 男女之事视频高清在线观看| 国产高清有码在线观看视频| 欧美黑人巨大hd| 男人和女人高潮做爰伦理| 日本撒尿小便嘘嘘汇集6| 成熟少妇高潮喷水视频| 日韩欧美在线二视频| 欧美最黄视频在线播放免费| 波多野结衣巨乳人妻| 国产亚洲精品一区二区www| 国产亚洲精品一区二区www| 无限看片的www在线观看| 国产毛片a区久久久久| 日本黄色视频三级网站网址| 国产一级毛片七仙女欲春2| 一区二区三区高清视频在线| 亚洲一区二区三区色噜噜| 久久久久久人人人人人| 最好的美女福利视频网| 午夜福利欧美成人| 国产精品一区二区三区四区久久| 亚洲熟妇中文字幕五十中出| 欧美黄色片欧美黄色片| 视频区欧美日本亚洲| 国内毛片毛片毛片毛片毛片| 啪啪无遮挡十八禁网站| 嫁个100分男人电影在线观看| 国产精品美女特级片免费视频播放器 | 好男人在线观看高清免费视频| bbb黄色大片| 女人被狂操c到高潮| 伦理电影免费视频| 亚洲国产精品久久男人天堂| 伦理电影免费视频| 美女 人体艺术 gogo| 国产成人一区二区三区免费视频网站| 国产精品亚洲av一区麻豆| 日韩欧美在线二视频| 亚洲欧洲精品一区二区精品久久久| 亚洲在线观看片| 成人精品一区二区免费| 757午夜福利合集在线观看| 国产三级中文精品| 久久这里只有精品中国| 亚洲av免费在线观看| 99国产综合亚洲精品| 久久午夜亚洲精品久久| 夜夜夜夜夜久久久久| 久久人妻av系列| 久久热在线av| 99久久99久久久精品蜜桃| 黑人巨大精品欧美一区二区mp4| 午夜a级毛片| 亚洲性夜色夜夜综合| 日本一二三区视频观看| bbb黄色大片| 99久久成人亚洲精品观看| 亚洲欧美日韩高清在线视频| 国产成人精品久久二区二区免费| 搡老熟女国产l中国老女人| 日韩中文字幕欧美一区二区| 日韩人妻高清精品专区| 久久久水蜜桃国产精品网| 一边摸一边抽搐一进一小说| 在线观看免费午夜福利视频| 午夜激情欧美在线| 成人18禁在线播放| 亚洲成人免费电影在线观看| cao死你这个sao货| 99久久精品热视频| 色吧在线观看| 午夜福利免费观看在线| 色播亚洲综合网| 午夜精品在线福利| 亚洲成a人片在线一区二区| 美女被艹到高潮喷水动态| 欧美绝顶高潮抽搐喷水| 黑人巨大精品欧美一区二区mp4| 日韩免费av在线播放| 中文字幕人成人乱码亚洲影| 亚洲精品美女久久久久99蜜臀| 久久中文字幕人妻熟女| 精品久久久久久久末码| 亚洲人成伊人成综合网2020| 身体一侧抽搐| 久久久久亚洲av毛片大全| 欧美午夜高清在线| 亚洲av电影在线进入| 制服丝袜大香蕉在线| 给我免费播放毛片高清在线观看| 在线观看免费午夜福利视频| 欧洲精品卡2卡3卡4卡5卡区| 99久久精品一区二区三区| 国产亚洲av高清不卡| 日本与韩国留学比较| 亚洲,欧美精品.| 日本免费a在线| 久9热在线精品视频| 婷婷丁香在线五月| 日韩大尺度精品在线看网址| 两性午夜刺激爽爽歪歪视频在线观看| 999精品在线视频| 九色成人免费人妻av| 在线看三级毛片| 欧美高清成人免费视频www| 亚洲在线观看片| 国产欧美日韩精品一区二区| 看黄色毛片网站| 超碰成人久久| 成人av一区二区三区在线看| 精品国产美女av久久久久小说| 成人特级av手机在线观看| 99riav亚洲国产免费| 精品日产1卡2卡| 看黄色毛片网站| 国内精品美女久久久久久| 亚洲国产看品久久| 亚洲av日韩精品久久久久久密| 久久久久九九精品影院| 欧美3d第一页| 一区二区三区国产精品乱码| 国产一区二区三区视频了| 亚洲成人中文字幕在线播放| 国产三级黄色录像| 性色avwww在线观看| 特大巨黑吊av在线直播| 亚洲 欧美一区二区三区| 亚洲午夜精品一区,二区,三区| 好男人电影高清在线观看| 色综合亚洲欧美另类图片| 香蕉丝袜av| 老司机午夜十八禁免费视频| 日本在线视频免费播放| 亚洲成av人片在线播放无| 国内精品美女久久久久久| 国产一区二区在线观看日韩 | 亚洲人成电影免费在线| 日韩欧美在线二视频| 国产精品国产高清国产av| 啦啦啦免费观看视频1| 观看美女的网站| 91麻豆av在线| 全区人妻精品视频| 男女床上黄色一级片免费看| 久久久久九九精品影院| 国产成人av激情在线播放| 精品国产亚洲在线| 亚洲,欧美精品.| 一级作爱视频免费观看| 99国产精品99久久久久| 1000部很黄的大片| 深夜精品福利| 亚洲av熟女| 国产精品永久免费网站| 亚洲中文字幕日韩| 在线观看一区二区三区| 中文字幕熟女人妻在线| 在线观看日韩欧美| 日韩欧美在线二视频| 久久国产精品影院| 香蕉av资源在线| 极品教师在线免费播放| 国产视频内射| 欧美大码av| 熟妇人妻久久中文字幕3abv| 天天躁狠狠躁夜夜躁狠狠躁| 长腿黑丝高跟| 国产成人影院久久av| 亚洲国产中文字幕在线视频| 日韩国内少妇激情av| 国产野战对白在线观看| 欧美性猛交╳xxx乱大交人| 久久久国产成人免费| 看黄色毛片网站| 麻豆久久精品国产亚洲av| 国产高清视频在线观看网站| 夜夜爽天天搞| 亚洲国产精品久久男人天堂| 免费av不卡在线播放| 国产91精品成人一区二区三区| 欧美成狂野欧美在线观看| 国产高清三级在线| 亚洲中文字幕一区二区三区有码在线看 | 久久久久亚洲av毛片大全| 九色成人免费人妻av| 熟女人妻精品中文字幕| 麻豆一二三区av精品| 久久国产乱子伦精品免费另类| 精品国产乱码久久久久久男人| 成人av在线播放网站| 国产激情欧美一区二区| 国语自产精品视频在线第100页| 国产不卡一卡二| 国产成人精品无人区| 亚洲avbb在线观看| 亚洲专区国产一区二区| 黄色女人牲交| 久久久久久久精品吃奶| 中出人妻视频一区二区| 久久久久免费精品人妻一区二区| 国产一区二区三区视频了| 宅男免费午夜| 中国美女看黄片| 在线播放国产精品三级| 又紧又爽又黄一区二区| 色噜噜av男人的天堂激情| 国产精品自产拍在线观看55亚洲| 99精品久久久久人妻精品| 色尼玛亚洲综合影院| 国产精品99久久99久久久不卡| 黄片小视频在线播放| 久久久久九九精品影院| 人妻丰满熟妇av一区二区三区| 国产精品久久久久久亚洲av鲁大| 欧美日韩中文字幕国产精品一区二区三区| 久99久视频精品免费| 成人永久免费在线观看视频| 少妇丰满av| 狠狠狠狠99中文字幕| 亚洲av电影不卡..在线观看| 亚洲最大成人中文| 色吧在线观看| 国产三级中文精品| 热99在线观看视频| 香蕉国产在线看| 欧美绝顶高潮抽搐喷水| 美女高潮喷水抽搐中文字幕| 成人性生交大片免费视频hd| 精品福利观看| 亚洲av免费在线观看| 美女高潮的动态| 国产亚洲精品久久久久久毛片| 国产高清视频在线观看网站| 美女 人体艺术 gogo| 香蕉久久夜色| 国产高清激情床上av| 午夜福利视频1000在线观看| 日日摸夜夜添夜夜添小说| 在线视频色国产色| 欧美zozozo另类| 九色国产91popny在线| 国产精品久久久av美女十八| 午夜福利视频1000在线观看| 一个人看的www免费观看视频| 精品国产乱码久久久久久男人| 精品国内亚洲2022精品成人| 无遮挡黄片免费观看| 日韩有码中文字幕| 99视频精品全部免费 在线 | 成年免费大片在线观看| 白带黄色成豆腐渣| 在线免费观看的www视频| 一本一本综合久久| 搡老熟女国产l中国老女人| 日韩欧美一区二区三区在线观看| 99在线视频只有这里精品首页| 可以在线观看毛片的网站| 午夜影院日韩av| 亚洲国产精品成人综合色| 法律面前人人平等表现在哪些方面| 露出奶头的视频| 黄片小视频在线播放| 精品日产1卡2卡| 亚洲av成人不卡在线观看播放网| 免费人成视频x8x8入口观看| 天堂网av新在线| 搡老岳熟女国产| 好男人在线观看高清免费视频| 国产午夜精品论理片| 久久精品国产清高在天天线| 久久天躁狠狠躁夜夜2o2o| 国产av一区在线观看免费| 999久久久精品免费观看国产| 久久久久久大精品| 久久久久国产一级毛片高清牌| 亚洲中文字幕日韩| 精品久久久久久久毛片微露脸| 色视频www国产| 白带黄色成豆腐渣| 亚洲国产欧洲综合997久久,| 国产成人一区二区三区免费视频网站| 欧美乱色亚洲激情| 国产免费av片在线观看野外av| 99精品久久久久人妻精品| 岛国在线观看网站| 岛国视频午夜一区免费看| 很黄的视频免费| 一个人看的www免费观看视频| АⅤ资源中文在线天堂| 欧美丝袜亚洲另类 | 日韩欧美在线二视频| 三级国产精品欧美在线观看 | 精品久久久久久久久久免费视频| 亚洲专区中文字幕在线| 亚洲欧美一区二区三区黑人| 日日夜夜操网爽| 亚洲成人精品中文字幕电影| 91久久精品国产一区二区成人 | 国产成人精品无人区| 亚洲欧洲精品一区二区精品久久久| av在线蜜桃| 69av精品久久久久久| 国产精品电影一区二区三区| 日韩高清综合在线| 亚洲午夜理论影院| 91麻豆精品激情在线观看国产| x7x7x7水蜜桃| 亚洲成人免费电影在线观看| а√天堂www在线а√下载| 日韩大尺度精品在线看网址| 亚洲成人中文字幕在线播放| 毛片女人毛片| 特级一级黄色大片| 国产精品久久久人人做人人爽| 老司机午夜十八禁免费视频| 亚洲人成网站在线播放欧美日韩| 叶爱在线成人免费视频播放| 久久人妻av系列| 啦啦啦免费观看视频1| 亚洲人成电影免费在线| 搞女人的毛片| 天堂动漫精品| 国产激情久久老熟女| 亚洲专区中文字幕在线| 免费看十八禁软件| 国产成+人综合+亚洲专区| 亚洲18禁久久av| 一卡2卡三卡四卡精品乱码亚洲| 悠悠久久av| 中亚洲国语对白在线视频| 亚洲国产精品合色在线| 日本免费a在线| 一级毛片女人18水好多| 国产高清激情床上av| 精品无人区乱码1区二区| 国产精品久久久久久久电影 | 国产蜜桃级精品一区二区三区| 美女高潮的动态| 国产一区二区三区视频了| 日本 欧美在线| 一个人看视频在线观看www免费 | 草草在线视频免费看| 免费在线观看亚洲国产| av在线蜜桃| 丝袜人妻中文字幕| 99国产精品一区二区三区| 成年女人永久免费观看视频| 久久久久精品国产欧美久久久| 人人妻人人澡欧美一区二区| 1024手机看黄色片| 在线观看免费视频日本深夜| 亚洲欧美日韩卡通动漫| 亚洲av成人一区二区三| 长腿黑丝高跟| 男女那种视频在线观看| 一级a爱片免费观看的视频| 非洲黑人性xxxx精品又粗又长| 身体一侧抽搐| 欧美成人一区二区免费高清观看 | 91麻豆精品激情在线观看国产| 午夜福利视频1000在线观看| 欧美绝顶高潮抽搐喷水| 亚洲精品国产精品久久久不卡| 国产黄色小视频在线观看| 国产伦精品一区二区三区四那| 1024香蕉在线观看| 国产成人啪精品午夜网站| 久久人人精品亚洲av| 欧美乱妇无乱码| 欧美日本视频| 变态另类丝袜制服| 免费观看精品视频网站| 变态另类丝袜制服| 窝窝影院91人妻| 88av欧美| 日韩欧美国产在线观看| 女人高潮潮喷娇喘18禁视频| 午夜精品久久久久久毛片777| 婷婷精品国产亚洲av| 欧美zozozo另类| 国产亚洲精品av在线| 亚洲中文av在线| 国产久久久一区二区三区| 亚洲国产看品久久| 亚洲18禁久久av| 亚洲人成伊人成综合网2020| 精品国产超薄肉色丝袜足j| 一级黄色大片毛片| 五月玫瑰六月丁香| 亚洲精品456在线播放app | 欧美xxxx黑人xx丫x性爽| 99国产精品一区二区三区| 亚洲av成人av| 在线播放国产精品三级| www.自偷自拍.com| 久9热在线精品视频| 网址你懂的国产日韩在线| 岛国在线免费视频观看| 免费一级毛片在线播放高清视频| 99re在线观看精品视频| 亚洲国产色片| 久久精品91蜜桃| 日日干狠狠操夜夜爽| 脱女人内裤的视频| 久久中文看片网| 成人鲁丝片一二三区免费| 一区二区三区激情视频| 午夜福利在线观看吧| 99久久99久久久精品蜜桃| 精品乱码久久久久久99久播| 欧美大码av| 欧美日本亚洲视频在线播放| 99在线视频只有这里精品首页| 一进一出抽搐gif免费好疼| 日日干狠狠操夜夜爽| 国产1区2区3区精品| 美女免费视频网站| 99精品久久久久人妻精品| 黄色成人免费大全| 免费人成视频x8x8入口观看| 亚洲av片天天在线观看| 亚洲激情在线av| 国产精品 欧美亚洲| 亚洲av成人不卡在线观看播放网| 国模一区二区三区四区视频 | 色老头精品视频在线观看| 国产三级黄色录像| www.熟女人妻精品国产| 久久这里只有精品中国| 国产成人欧美在线观看| 在线视频色国产色| 18禁黄网站禁片午夜丰满| 国产黄色小视频在线观看|