• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于圖元光柵化觸發(fā)的高效GPU 深度數(shù)據(jù)預(yù)?、?/h1>
    2022-02-27 03:19:18許宏杰
    高技術(shù)通訊 2022年11期
    關(guān)鍵詞:深度機(jī)制

    田 澤 張 駿 許宏杰

    (西安翔騰微電子科技有限公司 西安 710068)

    (航空工業(yè)西安航空計(jì)算技術(shù)研究所 西安 710068)

    (集成電路與微系統(tǒng)設(shè)計(jì)航空科技重點(diǎn)實(shí)驗(yàn)室 西安 710068)

    0 引言

    3D 圖形處理與2D 圖形處理最顯著的區(qū)別在于引入了深度的概念,使繪制結(jié)果產(chǎn)生了有層次的空間立體真實(shí)感受。3D 幾何圖形繪制渲染過程中的一個(gè)重要步驟就是深度測試。幀緩沖區(qū)的顏色緩沖區(qū)存儲像素的顏色值,深度緩沖區(qū)存儲像素的深度值,深度測試將像素的深度值與當(dāng)前深度緩沖區(qū)中對應(yīng)的值進(jìn)行比較,如果大于深度緩沖區(qū)的值,則丟棄該部分的像素,否則利用這個(gè)像素對應(yīng)的深度值和顏色值分別更新深度緩沖區(qū)和顏色緩沖區(qū),這樣就實(shí)現(xiàn)了判斷該像素是否需要繪制的問題。

    深度測試能避免對最終不會看到的像素點(diǎn)的繪制,從而提高圖形流水線的執(zhí)行效率,其功能是在圖形流水線中的片段處理階段實(shí)現(xiàn)的,在光柵化階段之后,對光柵化輸出的像素的深度數(shù)據(jù)進(jìn)行比較測試,是圖形處理器(graphic processing unit,GPU)像素填充率性能指標(biāo)的重要影響因素。

    圖元光柵化(rasterization)將連續(xù)方式描述的幾何圖元(點(diǎn)、線、離散三角形和扇帶)的頂點(diǎn)數(shù)據(jù)轉(zhuǎn)換為由離散片元(fragment)組成的二維圖像。片元是最初級的像素,每個(gè)片元包括顏色值(RGBA)、深度值(Z)、二維屏幕坐標(biāo)(X、Y)等信息,與幀緩沖中的一個(gè)像素對應(yīng)。在Nvidia、AMD 等主流圖形處理器普遍采用的IMR(immediately mode rendering)架構(gòu)[1]中,為了最終能夠正確顯示位置重疊區(qū)域圖形距離觀察者最近的圖元像素顏色,每一個(gè)像素的深度數(shù)據(jù)Z 都需要在片上進(jìn)行緩存,以便進(jìn)行實(shí)時(shí)深度測試來分辨當(dāng)前正在繪制像素的深度值與已經(jīng)繪制完成的像素深度值之間的前后遮擋關(guān)系。深度測試頻繁的深度數(shù)據(jù)讀寫操作不但需要的存儲器數(shù)據(jù)帶寬大,而且還在很大程度上決定了GPU 的像素填充性能。為了降低深度測試對片內(nèi)存儲資源和顯存帶寬的需求,文獻(xiàn)[2]提出的Early-Z 技術(shù)在進(jìn)行像素染色前就對像素的可見性以一種粗粒度的方式進(jìn)行提前測試。據(jù)ATI 的測試結(jié)果,采用Early-Z 技術(shù)進(jìn)行提前深度測試能夠提前捕捉到50%以上最終不會通過深度測試的像素點(diǎn)。即使這樣,目前GPU像素填充性能普遍超過30 G pixel/s,所需要的深度測試能力依然對GPU 片上Z 緩存(Z Cache)設(shè)計(jì)提出了很高的要求。

    數(shù)據(jù)預(yù)取是一種提升cache 命中率的技術(shù),中央處理器(central processing unit,CPU) Cache 數(shù)據(jù)預(yù)取由來已久,但CPU 數(shù)據(jù)訪問模式隨著應(yīng)用程序行為的變化而變化,表現(xiàn)為線性、跳躍和隨機(jī)各種模式,具有不確定性,且一次數(shù)據(jù)訪問量較少,只有4~16 bytes,導(dǎo)致CPU 數(shù)據(jù)預(yù)取效果受制于空間局部性和時(shí)間局部性因素在一些場景下不夠理想。相比之下,GPU 普遍采用高度并行數(shù)據(jù)處理架構(gòu),通常能夠一次并行實(shí)現(xiàn)32~128 個(gè)像素的深度測試處理,單次Cache 數(shù)據(jù)訪問量達(dá)到128~512 bytes,為預(yù)取數(shù)據(jù)使用的連續(xù)性和有效性奠定了基礎(chǔ)。并且,在圖形渲染過程中,GPU 的顏色和深度數(shù)據(jù)訪問模式在局部范圍相對集中和確定,顏色和深度數(shù)據(jù)在Cache 中是局部二維排布,與幾何圖形光柵化后最終在幀緩沖區(qū)中的二維顏色和深度數(shù)據(jù)的排布精確匹配,讀入Z Cache中數(shù)據(jù)使用率通常能夠達(dá)到95%以上,空間局部性捕獲效果很好,為數(shù)據(jù)預(yù)取準(zhǔn)確性提供了很好的前提。

    GPU 深度測試對片外幀緩沖存儲器數(shù)據(jù)訪問量較大,在數(shù)據(jù)的空間局部性強(qiáng)而時(shí)間局部性弱的情況下,必定周期性地發(fā)生深度Cache 缺失,導(dǎo)致處理延遲增大。如果能根據(jù)幾何圖形光柵化實(shí)時(shí)位置及像素Tile 的屏幕坐標(biāo)提前訪問外部幀緩沖存儲器,就可以及時(shí)、精確地實(shí)施GPU 深度Cache 數(shù)據(jù)預(yù)取,有效避免周期性深度Cache 缺失造成的額外延遲,提升圖形渲染效率。像素?cái)?shù)據(jù)需要GPU 的光柵化單元、像素著色器以及光柵操作單元對其依次執(zhí)行不同的操作。如果GPU 的光柵化單元能將當(dāng)前被光柵化像素Tile(由n個(gè)空間上相鄰的片元組成)的屏幕坐標(biāo)(x,y)提前發(fā)送給深度測試單元,則深度測試單元能夠依據(jù)該信息提前實(shí)施精確的預(yù)取操作。

    本文提出一種圖元光柵化觸發(fā)的圖形處理器高效深度數(shù)據(jù)預(yù)取機(jī)制(depth data pre-fetching based on primitive rasterizing triggering,DPRT),通過圖元光柵化過程中實(shí)時(shí)掃描到的片段塊地址來觸發(fā)Z Cache的深度數(shù)據(jù)預(yù)取。同時(shí)為了適應(yīng)不同實(shí)現(xiàn)中流水線處理延遲,保證數(shù)據(jù)預(yù)取有效性,為Z Cache 數(shù)據(jù)塊增加訪問一次標(biāo)志,有效提升了深度測試Z Cache訪問命中率,降低了深度測試延遲。

    1 相關(guān)研究

    GPU 研制方面,國外Nvidia、AMD(ATI)、ARM、Vivante 和Imagination[3-8],已經(jīng)形成了完整的技術(shù)體系和產(chǎn)品體系,具有完整的配套圖形庫軟件、驅(qū)動軟件、編譯軟件和相關(guān)專用知識產(chǎn)權(quán)等相關(guān)設(shè)計(jì)資源,而且具有強(qiáng)大的技術(shù)創(chuàng)新能力。在國內(nèi),南京航空航天大學(xué)、電子科技大學(xué)、山東大學(xué)基于OpenGL ES 設(shè)計(jì)了嵌入式圖形處理器或系統(tǒng)[9-11]。中國科學(xué)技術(shù)大學(xué)設(shè)計(jì)了一種面向移動設(shè)備的3D 圖形處理器[12]。華南理工大學(xué)使用SystemC 設(shè)計(jì)了圖形處理器模型[13]。哈爾濱工業(yè)大學(xué)、上海交通大學(xué)、華東師范大學(xué)、北大眾志微處理器研究中心、長沙景嘉微電子公司和航空工業(yè)計(jì)算技術(shù)研究所[14-17]也對嵌入式GPU 進(jìn)行了深入研究和設(shè)計(jì)。

    預(yù)取技術(shù)以往主要應(yīng)用于微處理器的指令和數(shù)據(jù),研究人員針對不同類型應(yīng)用程序的存儲器訪問特征以及指令和數(shù)據(jù)在內(nèi)存中的不同排布模式,提出了多種有效的順序或非順序預(yù)取策略。如針對指令預(yù)取的面向程序連續(xù)執(zhí)行的Next-Line 指令預(yù)取策略、面向程序分支的Target-Line 指令預(yù)取策略[18]、BTA 分支目標(biāo)地址預(yù)取策略[19]和硬件Markov 預(yù)取[20]。針對數(shù)據(jù)預(yù)取,Jouppi[21]提出了流緩沖區(qū)的順序預(yù)取機(jī)制,Palacharla 等人[22]提出步長檢測預(yù)取機(jī)制,Sherwood 等人[23]提出面向指針密集型的馬爾可夫與步長預(yù)取結(jié)合的數(shù)據(jù)預(yù)取策略,Roth等人[24]提出了基于跳轉(zhuǎn)指針的數(shù)據(jù)預(yù)取。另外,研究人員還提出了指令和數(shù)據(jù)的主動推送技術(shù)[25-26],與預(yù)取技術(shù)由CPU 內(nèi)核或Cache 向更底層存儲器發(fā)出預(yù)取請求,然后逐級向下傳遞請求,最終由更底層存儲器響應(yīng)請求并返回?cái)?shù)據(jù)不同,主動推送技術(shù)是由主動推送部件對內(nèi)核將要使用指令和數(shù)據(jù)的預(yù)測發(fā)出訪存請求,最終將數(shù)據(jù)向上推送到Cache 或處理器內(nèi)核中,時(shí)效性更好。

    這些預(yù)取和主動推送策略已經(jīng)廣泛應(yīng)用在各類CPU 設(shè)計(jì)領(lǐng)域,能有效降低Cache 缺失率。而GPU對于各類圖形數(shù)據(jù)和存儲帶寬的需求更為巨大,且數(shù)據(jù)訪問與圖形繪制過程直接相關(guān),數(shù)據(jù)訪問模式與通用CPU 應(yīng)用數(shù)據(jù)訪問模式差異較大,需要更有針對性和有效的數(shù)據(jù)預(yù)取機(jī)制。然而,在GPU 設(shè)計(jì)領(lǐng)域,目前沒有針對GPU 深度測試和深度數(shù)據(jù)預(yù)取機(jī)制的相關(guān)研究或報(bào)道。本文提出的GPU 深度數(shù)據(jù)預(yù)取機(jī)制基于自主設(shè)計(jì)的光柵化算法過程中的自定義關(guān)鍵時(shí)間節(jié)點(diǎn)作為深度Cache 的觸發(fā)信號進(jìn)行數(shù)據(jù)預(yù)取,其預(yù)取有效性和準(zhǔn)確性好,能夠取得較好效果。

    2 光柵化觸發(fā)的深度數(shù)據(jù)預(yù)取

    GPU 架構(gòu)的發(fā)展經(jīng)歷了2 個(gè)階段,即分離染色架構(gòu)和統(tǒng)一染色架構(gòu)。無論物理架構(gòu)是分離染色的還是統(tǒng)一染色的,在邏輯上都遵循一套完整的圖形處理流程,在實(shí)現(xiàn)時(shí)映射為圖形處理流水線。一般地,GPU 圖形渲染流水線需要依次完成頂點(diǎn)著色、幾何圖元處理、圖元光柵化、像素著色,經(jīng)過片段處理后最終寫入幀緩沖區(qū)。圖元(primitive)是頂點(diǎn)的集合,組成一個(gè)3D 實(shí)體。常見的3D 圖元包括點(diǎn)、線、離散三角形和扇帶。圖元光柵化過程就是把連續(xù)的以數(shù)學(xué)方式描述的幾何圖元映射為離散的屏幕上像素點(diǎn)的過程,主要涉及掃描轉(zhuǎn)換、像素插值、反走樣等算法及其硬件實(shí)現(xiàn)。與本文相關(guān)的主要是掃描轉(zhuǎn)換過程。圖元掃描轉(zhuǎn)換是通過遍歷操作,逐個(gè)或批量判定出位于圖元內(nèi)部所有有效的像素點(diǎn)。光柵化處理的基本圖元包括點(diǎn)、線和三角形圖元。無論哪種圖元,輸入到光柵化階段的圖元頂點(diǎn)坐標(biāo)都是浮點(diǎn)數(shù)表示,是連續(xù)的,但是屏幕上的像素是離散的,掃描轉(zhuǎn)換算法的主要任務(wù)是如何把連續(xù)的圖元用最接近的離散的柵格表示出來。對于點(diǎn)的掃描轉(zhuǎn)換,可直接對其實(shí)數(shù)坐標(biāo)進(jìn)行四舍五入,得到最接近該點(diǎn)的離散坐標(biāo)位置;線圖元的2 種常用掃描轉(zhuǎn)換算法是數(shù)字微分分析儀(digital differential analyzer,DDA)算法和Bresenham 算法[27]。三角形圖元的掃描轉(zhuǎn)換過程對GPU 幾何性能影響最大,相對于點(diǎn)和線圖元來說更加重要,包括掃描線算法(Scanline)、包圍盒算法(Bounding Box)和中心線掃描算法(Centerline)[28],遍歷的方式?jīng)Q定了三角形掃描的效率,也很大程度上確定了后續(xù)深度測試過程中對深度數(shù)據(jù)的使用順序。

    對于GPU 中深度測試功能來說,像素片段的深度數(shù)據(jù)由圖元光柵化階段產(chǎn)生,并在片段處理階段根據(jù)不同的深度測試函數(shù)將每個(gè)像素片段的深度與幀緩沖區(qū)中對應(yīng)位置像素的深度數(shù)據(jù)進(jìn)行比較,最終決定該像素片段是否應(yīng)該被寫入幀緩沖區(qū),即光柵化處理在前,深度測試在后。在深度測試功能開啟的情況下,所有光柵化產(chǎn)生的像素片段必然都要進(jìn)行深度測試(本文不考慮Early-Z 等類似提前深度測試技術(shù)帶來的層次化深度測試效果)。根據(jù)圖形處理流水線各階段先后關(guān)系以及光柵化和深度測試的這種特性,本文提出光柵化觸發(fā)的圖形處理器高效深度數(shù)據(jù)預(yù)取機(jī)制DPRT,希望能夠根據(jù)實(shí)際光柵化區(qū)域所覆蓋幀緩沖區(qū)像素區(qū)域,在片段處理單元進(jìn)行深度測試前,提前將對應(yīng)像素深度數(shù)據(jù)預(yù)取到Z Cache 中,從而達(dá)到隱藏存儲器訪問延遲的目的。

    2.1 DPRT 深度數(shù)據(jù)預(yù)取機(jī)制

    本文采用基于Tile(4×4 像素塊)的掃描線算法進(jìn)行三角形圖元掃描轉(zhuǎn)換。在此基礎(chǔ)上,DPRT深度數(shù)據(jù)預(yù)取的工作機(jī)制如圖1 所示。

    圖1 光柵化觸發(fā)的深度數(shù)據(jù)預(yù)取機(jī)制

    圖元經(jīng)過幾何階段處理后,被送入光柵化單元進(jìn)行從圖元到像素片段的轉(zhuǎn)換,輸出的像素片段格式可以根據(jù)不同設(shè)計(jì)進(jìn)行選擇,通常選擇以像素片段塊(Tile)為單位進(jìn)行掃描輸出,這樣不但能夠提升光柵化效率,而且更加符合Z Cache 的數(shù)據(jù)緩沖特性,訪存深度緩沖區(qū)效率也較高。光柵化每產(chǎn)生一個(gè)Tile,就根據(jù)Tile 在深度幀緩沖區(qū)中的地址形成一個(gè)深度數(shù)據(jù)預(yù)取請求發(fā)送到Z Cache,Z Cache收到預(yù)取請求后向外部顯示存儲器發(fā)出深度數(shù)據(jù)訪問請求,預(yù)取的深度數(shù)據(jù)通常會在其對應(yīng)的像素片段Tile 完成像素染色階段處理和其他片段處理前進(jìn)入Z Cache 中,從而實(shí)現(xiàn)隱藏像素片段Tile 深度數(shù)據(jù)訪問延遲的目的。

    在不考慮Early-Z 技術(shù)帶來的層次化深度測試效果前提下,所有光柵化單元產(chǎn)生的像素片段Tile都必然要在片段處理單元從Z Cache 中取出深度數(shù)據(jù)進(jìn)行深度測試。對Z Cache TAG 數(shù)據(jù)結(jié)構(gòu)進(jìn)行優(yōu)化,為每一個(gè)Cache 數(shù)據(jù)塊Tag 域增加一個(gè)訪問一次標(biāo)志(once touching tag,OTT),如圖2 所示。

    圖2 Z Cache TAG 數(shù)據(jù)結(jié)構(gòu)優(yōu)化

    預(yù)取的深度數(shù)據(jù)進(jìn)入Z Cache 后,未被讀取之前置OTT=0;當(dāng)Z Cache 中的深度數(shù)據(jù)被讀取一次后,置OTT=1。每次需要進(jìn)行Z Cache 替換時(shí),基于PLRU 算法優(yōu)先選擇已經(jīng)被訪問的Cache 數(shù)據(jù)塊(OTT=1,已經(jīng)完成深度測試需要的深度數(shù)據(jù)訪問)進(jìn)行替換,保留OTT=0 的Cache 數(shù)據(jù)塊,從而實(shí)現(xiàn)在訪存效率較高的情況下,保證預(yù)取回Z Cache 中深度數(shù)據(jù)不會在使用前就被替換出去,降低了Z Cache 抖動概率和訪問缺失率。

    2.2 DPRT 工作流程

    圖3 以4 路組相連Z Cache 結(jié)構(gòu)說明了DPRT機(jī)制的工作流程。光柵化模塊接收圖元光柵化任務(wù)后,開始掃描并將當(dāng)前像素Tile 的坐標(biāo)地址發(fā)送給Z Cache 模塊,觸發(fā)深度預(yù)取動作。深度地址和請求產(chǎn)生模塊將深度數(shù)據(jù)預(yù)取請求發(fā)送給仲裁模塊。仲裁模塊首先要測試本次預(yù)取的深度數(shù)據(jù)是否已經(jīng)存在于Z Cache 中,如果已經(jīng)存在則撤銷本次預(yù)取;否則就在通過第二級仲裁的情況下,基于PLRU 替換算法和OTT 標(biāo)志位優(yōu)先選擇最近訪問次數(shù)最少且OTT=1 的Cache 數(shù)據(jù)塊進(jìn)行替換,并將臟塊寫回DDR,將深度預(yù)取請求送給存儲管理單元(memory management unit,MMU),訪問外部顯示存儲器中的深度緩沖區(qū)。由于前期已經(jīng)為不命中數(shù)據(jù)準(zhǔn)備好了空Cache 塊,當(dāng)外部顯示存儲器返回預(yù)取的深度數(shù)據(jù)后,依次查找當(dāng)前組中的空行,直至將該數(shù)據(jù)寫入Z Cache DATA ARRAY 中,同時(shí)更新Cache TAG。

    圖3 DPRT 工作流程

    2.3 DPRT 有效性分析

    數(shù)據(jù)預(yù)取有效性包括2 個(gè)關(guān)鍵要素:時(shí)效性和準(zhǔn)確性。時(shí)效性是指數(shù)據(jù)既要在訪問請求到達(dá)前到達(dá)Cache 中,同時(shí)還不能被過早替換出去。

    首先,由于進(jìn)行深度測試前像素片段Tile 還需要在統(tǒng)一染色陣列上完成像素染色階段的處理和其他片段處理功能(混合、邏輯操作等),延遲較大,可以認(rèn)為形成預(yù)取地址到預(yù)取完成間的延遲與形成預(yù)取地址到使用深度數(shù)據(jù)間的延遲匹配。從光柵化、像素染色和外部顯示存儲器訪問延遲來看,深度數(shù)據(jù)能夠在進(jìn)行深度測試前被預(yù)取進(jìn)Z Cache 中。

    其次,還需要考察預(yù)取的深度數(shù)據(jù)是否能夠不被過早地替換出去。DPRT 預(yù)取方案中,預(yù)取動作的觸發(fā)條件是開始光柵化掃描或者掃描步進(jìn),而光柵化掃描持續(xù)步進(jìn)的條件是以前光柵化輸出的像素片段Tile 都完成像素染色階段處理,并發(fā)送給片段處理模塊。而片段處理模塊完成像素片段Tile 處理(包括深度測試功能)前會阻塞光柵化掃描步進(jìn)過程。也就是說,預(yù)取操作存入Z Cache 中的深度數(shù)據(jù)在使用完成前,不會過早發(fā)生掃描線步進(jìn)動作,那么下一次深度預(yù)取就不會開始,即Z Cache 中的深度數(shù)據(jù)不會被過早替換出去。另外,為了防止訪存延遲的變化和不同類型圖元導(dǎo)致的預(yù)取地址特征的變化,專門在Cache Tag 域中加入了OTT 標(biāo)志位,從而能夠優(yōu)先選擇最近訪問次數(shù)最少且已經(jīng)被訪問至少一次的Cache 數(shù)據(jù)塊進(jìn)行替換,盡量保證未被使用過的深度數(shù)據(jù)不會被過早替換出去。

    對于深度數(shù)據(jù)預(yù)取來說,準(zhǔn)確性是指在盡量多的覆蓋確定需要的數(shù)據(jù)的前提下,要盡量少地預(yù)取非圖元覆蓋區(qū)域的像素深度數(shù)據(jù)。一次預(yù)取包括少量非圖元覆蓋區(qū)域的像素深度數(shù)據(jù)是難免的,也是被允許的,這些數(shù)據(jù)可以作為其他圖元的深度預(yù)取數(shù)據(jù)來使用,但其所占比例不能太大,否則不但浪費(fèi)外部顯示存儲器帶寬,而且容易造成Z Cache 的頻繁抖動。

    預(yù)取的特性決定了會取回一些當(dāng)前用不到的數(shù)據(jù),但只要比例不大并且能夠覆蓋到本次需要使用到的數(shù)據(jù)即可。其他多余的數(shù)據(jù)可能會在繪制其他圖形的時(shí)候被使用到,從而提升了外部顯示存儲器的帶寬利用率,并且不會造成Z Cache 的抖動。

    3 測試與評估

    采用基于現(xiàn)場可編程門陣列(field programmable gate array,FPGA)構(gòu)成的原型系統(tǒng)進(jìn)行驗(yàn)證,包括基于FPGA 和一系列外圍的接口子卡,如PCIe 2.0 x16 子卡、VGA 顯示子卡和外部顯示存儲器存儲子卡等,如圖4所示。

    圖4 FPGA 原型系統(tǒng)

    將本文提出的DPRT 深度數(shù)據(jù)預(yù)取機(jī)制進(jìn)行FPGA 原型系統(tǒng)測試與評估。光柵化單元以4×4的像素片段Tile 為單位進(jìn)行掃描輸出,Z Cache 容量為32 kB,4 路組相連,能夠容納8192 個(gè)像素點(diǎn)的深度數(shù)據(jù)。進(jìn)行FPGA 綜合和布線,工作頻率可達(dá)100 MHz。

    由于OpenGL 協(xié)議的官網(wǎng)只提供針對性能的測試程序和面向API 功能的符合性測試程序,為了全面精準(zhǔn)地評測深度測試的功能和性能,本文基于FPGA 平臺,在深度測試功能打開的情況下,選擇4個(gè)典型3D 游戲場景作為測試程序[29],測試場景見圖5。這些測試場景所繪制的圖元類型不同,圖元個(gè)數(shù)不同,場景中的圖元深度值、深度比較函數(shù)的設(shè)置也不同,深度測試階段的數(shù)據(jù)訪問模式也不同,能較為全面地覆蓋深度測試功能的各種測試情形。

    圖5 深度測試場景

    本文從Z Cache 平均命中率性能和深度測試平均延遲性能2 個(gè)方面測試和評估使用DPRT 機(jī)制的設(shè)計(jì)和沒有使用DPRT 機(jī)制的設(shè)計(jì)(GPU BASE)。其中,GPU BASE 是包括了完整3D 圖形繪制流水線,但沒有添加DPRT 機(jī)制的自主研制GPU 結(jié)構(gòu),具體包括:頂點(diǎn)處理階段、幾何處理階段、光柵化階段和像素處理階段。DPRT 機(jī)制的關(guān)鍵是在光柵化模塊與像素處理階段的深度Cache 之間增加預(yù)取觸發(fā)控制通路,并為深度Cache 增加數(shù)據(jù)預(yù)取功能。

    3.1 Z Cache 命中率性能評估

    相對于CPU 來說,GPU 圖形算法硬件實(shí)現(xiàn)雖然復(fù)雜,但有針對性的算法硬件優(yōu)化卻能夠取得較好的效果。相對于GPU BASE 結(jié)構(gòu)來說,使用DPRT機(jī)制后,4 個(gè)測試場景的Z Cache 命中率均有顯著提升,如圖6 所示。場景2 的Z Cache 命中率提升最高,達(dá)到11.74%,場景4 的Z Cache 命中率提升最低,達(dá)到7.82%,平均提升9.51%。

    圖6 DPRT 機(jī)制對Z Cache 命中率的提升情況

    3.2 深度測試延遲性能評估

    在開啟深度測試的情況下,對4 個(gè)場景的深度測試延遲情況進(jìn)行了統(tǒng)計(jì)。由于Z Cache 命中率的提升,相對于GPU BASE 結(jié)構(gòu)來說,使用DPRT 機(jī)制后,4 個(gè)場景的深度測試延遲均有顯著降低。如圖7所示,場景3 的深度測試延遲降低最多,達(dá)到39.87%,場景1 的深度測試延遲降低最少,達(dá)到30.83%,平均延遲降低40.43%。

    圖7 DPRT 機(jī)制對深度測試延遲的降低情況

    4 結(jié)論

    深度測試是GPU 的關(guān)鍵功能,不但對存儲帶寬需求很大,而且決定了GPU 的像素填充率性能。針對GPU 圖形渲染流水線的結(jié)構(gòu)特性和深度測試功能的訪存行為特征,本文提出一種圖元光柵化觸發(fā)的高效深度數(shù)據(jù)預(yù)取機(jī)制DPRT,使用圖元光柵化過程中實(shí)時(shí)掃描到的像素片段塊地址來觸發(fā)Z Cache 的深度數(shù)據(jù)預(yù)取,并為Z Cache 數(shù)據(jù)塊Tag 域增加訪問一次標(biāo)志,保證了深度數(shù)據(jù)預(yù)取有效性。DPRT 使深度測試時(shí)Z Cache 訪問命中率平均提升9.51%,深度測試延遲平均降低40.43%,取得了較好的效果。

    考慮到不同的GPU 硬件實(shí)現(xiàn)中像素染色處理和片段處理單元的處理延遲以及顯示存儲器的訪問延遲可能存在差異,未來可以進(jìn)一步研究深度數(shù)據(jù)預(yù)取時(shí)機(jī)與上述幾方面處理延遲間的動態(tài)自適應(yīng)機(jī)制,使得預(yù)取數(shù)據(jù)進(jìn)入Z Cache 的時(shí)機(jī)與對應(yīng)像素片段Tile 的處理延遲更加匹配,從而進(jìn)一步降低Z Cache 抖動概率和深度測試延遲。

    猜你喜歡
    深度機(jī)制
    構(gòu)建“不敢腐、不能腐、不想腐”機(jī)制的思考
    深度理解一元一次方程
    深度觀察
    深度觀察
    深度觀察
    自制力是一種很好的篩選機(jī)制
    文苑(2018年21期)2018-11-09 01:23:06
    深度觀察
    定向培養(yǎng) 還需完善安置機(jī)制
    破除舊機(jī)制要分步推進(jìn)
    提升深度報(bào)道量與質(zhì)
    新聞傳播(2015年10期)2015-07-18 11:05:40

    亚洲欧洲国产日韩| 精品久久久噜噜| 国产高清国产精品国产三级 | 国产一区亚洲一区在线观看| 寂寞人妻少妇视频99o| 97超碰精品成人国产| 色尼玛亚洲综合影院| 色视频www国产| 69人妻影院| 国产精品一区二区三区四区久久| www.av在线官网国产| 欧美不卡视频在线免费观看| 国产成人一区二区在线| 日本一本二区三区精品| 中文字幕精品亚洲无线码一区| 成人特级av手机在线观看| 97人妻精品一区二区三区麻豆| 国产av码专区亚洲av| 91狼人影院| 蜜桃久久精品国产亚洲av| 成人性生交大片免费视频hd| 99九九线精品视频在线观看视频| 最新中文字幕久久久久| 欧美三级亚洲精品| 免费av观看视频| 99热这里只有精品一区| 亚洲欧美中文字幕日韩二区| 亚州av有码| 欧美另类亚洲清纯唯美| 久久国内精品自在自线图片| 99九九线精品视频在线观看视频| 男的添女的下面高潮视频| 伦理电影大哥的女人| 成人午夜精彩视频在线观看| 国产精品永久免费网站| 尤物成人国产欧美一区二区三区| 国产精品伦人一区二区| 淫秽高清视频在线观看| 美女大奶头视频| 内射极品少妇av片p| 九九爱精品视频在线观看| 一级毛片久久久久久久久女| 热99在线观看视频| 国产白丝娇喘喷水9色精品| 蜜桃久久精品国产亚洲av| 麻豆成人午夜福利视频| 亚洲欧美清纯卡通| 中国国产av一级| av免费在线看不卡| 1000部很黄的大片| 小蜜桃在线观看免费完整版高清| 欧美性猛交╳xxx乱大交人| 国产真实伦视频高清在线观看| 三级男女做爰猛烈吃奶摸视频| 综合色av麻豆| 亚洲av日韩在线播放| 亚洲成人精品中文字幕电影| 久久精品夜夜夜夜夜久久蜜豆| 亚洲精品色激情综合| 爱豆传媒免费全集在线观看| 精品久久久久久久末码| 男人狂女人下面高潮的视频| 尾随美女入室| 亚洲精品aⅴ在线观看| 亚洲成人中文字幕在线播放| 国产欧美另类精品又又久久亚洲欧美| 国产视频首页在线观看| 两个人的视频大全免费| 哪个播放器可以免费观看大片| 搡女人真爽免费视频火全软件| 床上黄色一级片| 国产高清有码在线观看视频| 久久99热6这里只有精品| 草草在线视频免费看| 成年女人永久免费观看视频| 久久久久性生活片| 白带黄色成豆腐渣| 免费电影在线观看免费观看| 亚洲va在线va天堂va国产| 十八禁国产超污无遮挡网站| 国产乱人视频| 久久99热这里只频精品6学生 | 91狼人影院| 精品人妻视频免费看| av在线播放精品| 国产精品99久久久久久久久| 最新中文字幕久久久久| 1024手机看黄色片| 99热精品在线国产| 村上凉子中文字幕在线| 好男人视频免费观看在线| av黄色大香蕉| 欧美精品一区二区大全| 日韩强制内射视频| 欧美另类亚洲清纯唯美| 人体艺术视频欧美日本| 亚洲国产欧美人成| 极品教师在线视频| 日本免费在线观看一区| 国产精品三级大全| 99久国产av精品| 国产毛片a区久久久久| 菩萨蛮人人尽说江南好唐韦庄 | 亚洲在久久综合| 3wmmmm亚洲av在线观看| 99久国产av精品国产电影| 久久精品熟女亚洲av麻豆精品 | 麻豆乱淫一区二区| 99久久精品一区二区三区| 日产精品乱码卡一卡2卡三| 校园人妻丝袜中文字幕| 国产又黄又爽又无遮挡在线| av.在线天堂| 国产精品一区二区三区四区久久| 又爽又黄无遮挡网站| 国产精品乱码一区二三区的特点| 美女大奶头视频| 国产成人a∨麻豆精品| 在线播放国产精品三级| 久久热精品热| 免费观看人在逋| 晚上一个人看的免费电影| 人妻制服诱惑在线中文字幕| 精品人妻视频免费看| 日日摸夜夜添夜夜爱| 国产av一区在线观看免费| 全区人妻精品视频| 青春草亚洲视频在线观看| 国产69精品久久久久777片| 日本熟妇午夜| 国产男人的电影天堂91| 亚洲一区高清亚洲精品| 网址你懂的国产日韩在线| 国产精品久久久久久精品电影| 亚洲精品国产av成人精品| 国产色婷婷99| 亚洲欧美日韩无卡精品| 国产精华一区二区三区| av在线亚洲专区| 黄片wwwwww| 亚洲精品影视一区二区三区av| 老师上课跳d突然被开到最大视频| 寂寞人妻少妇视频99o| 久久久久久大精品| 久久久国产成人精品二区| 亚洲欧美日韩东京热| 婷婷色麻豆天堂久久 | 色网站视频免费| 国产男人的电影天堂91| 一卡2卡三卡四卡精品乱码亚洲| 亚洲成人av在线免费| 国产精品一区二区三区四区久久| 中文字幕亚洲精品专区| 欧美激情国产日韩精品一区| 男人舔奶头视频| 97超视频在线观看视频| 91精品伊人久久大香线蕉| 久久草成人影院| 免费av观看视频| 国产精品一区二区性色av| 亚洲国产精品专区欧美| 熟女电影av网| 亚洲精品,欧美精品| av又黄又爽大尺度在线免费看 | 国产精品久久视频播放| 嘟嘟电影网在线观看| 看黄色毛片网站| 九九在线视频观看精品| 国产av在哪里看| 久久久久久久久久黄片| 岛国在线免费视频观看| 国产精品美女特级片免费视频播放器| 国产精品永久免费网站| 亚洲性久久影院| 寂寞人妻少妇视频99o| 亚洲欧洲国产日韩| 欧美性感艳星| 午夜爱爱视频在线播放| 亚洲天堂国产精品一区在线| 黄色配什么色好看| 欧美又色又爽又黄视频| 亚洲熟妇中文字幕五十中出| 男插女下体视频免费在线播放| 久久精品国产亚洲av天美| 黄色配什么色好看| eeuss影院久久| 99久久精品国产国产毛片| 久久亚洲国产成人精品v| 亚洲欧洲国产日韩| 久久久久九九精品影院| 99久国产av精品国产电影| 亚洲怡红院男人天堂| 久久久精品欧美日韩精品| 日韩欧美精品免费久久| 女人被狂操c到高潮| 天堂av国产一区二区熟女人妻| 看十八女毛片水多多多| 久久欧美精品欧美久久欧美| 少妇丰满av| 国产精品爽爽va在线观看网站| 少妇人妻精品综合一区二区| 18+在线观看网站| av在线蜜桃| 精品午夜福利在线看| 日韩亚洲欧美综合| 国产综合懂色| 黄色日韩在线| 亚洲精品成人久久久久久| 视频中文字幕在线观看| 非洲黑人性xxxx精品又粗又长| 成人一区二区视频在线观看| 在线a可以看的网站| 久久精品久久久久久噜噜老黄 | 国产一区有黄有色的免费视频 | 中文字幕av在线有码专区| 日本-黄色视频高清免费观看| www.色视频.com| 欧美色视频一区免费| 日韩国内少妇激情av| 亚州av有码| 蜜桃亚洲精品一区二区三区| 亚洲激情五月婷婷啪啪| 亚洲va在线va天堂va国产| 久久久欧美国产精品| 久久这里只有精品中国| 日韩一区二区三区影片| ponron亚洲| 丝袜美腿在线中文| av在线亚洲专区| 亚洲精品色激情综合| 97热精品久久久久久| 亚洲丝袜综合中文字幕| 久久久久久久久大av| 久久久国产成人免费| 国产精品.久久久| 男女边吃奶边做爰视频| 欧美另类亚洲清纯唯美| 欧美日本亚洲视频在线播放| 男人的好看免费观看在线视频| av在线亚洲专区| 亚洲国产欧美在线一区| 女的被弄到高潮叫床怎么办| 神马国产精品三级电影在线观看| 麻豆成人午夜福利视频| 欧美日韩一区二区视频在线观看视频在线 | 国产精品久久久久久av不卡| 一级黄片播放器| 久久久久久久久久久免费av| 免费av毛片视频| 一区二区三区乱码不卡18| 欧美+日韩+精品| 搡女人真爽免费视频火全软件| 国产中年淑女户外野战色| 波野结衣二区三区在线| 免费观看性生交大片5| 国产色爽女视频免费观看| 亚洲真实伦在线观看| 亚洲婷婷狠狠爱综合网| 国产在线男女| 久久久久久久久大av| 一级av片app| 中文字幕av成人在线电影| 精品久久久久久久末码| 精品酒店卫生间| 久久久精品欧美日韩精品| 成人美女网站在线观看视频| 亚洲av成人精品一二三区| 成年免费大片在线观看| 久久久亚洲精品成人影院| 最近手机中文字幕大全| 国产老妇女一区| 日日干狠狠操夜夜爽| 久久久欧美国产精品| 五月玫瑰六月丁香| 国产色爽女视频免费观看| 最新中文字幕久久久久| 成人鲁丝片一二三区免费| 午夜福利网站1000一区二区三区| 亚洲四区av| 精品酒店卫生间| 欧美性感艳星| 国产精品野战在线观看| 亚洲自偷自拍三级| 久久久久久久亚洲中文字幕| 成人国产麻豆网| 干丝袜人妻中文字幕| 国产免费一级a男人的天堂| 99久久无色码亚洲精品果冻| 伦精品一区二区三区| 久久精品综合一区二区三区| 尤物成人国产欧美一区二区三区| 日本免费一区二区三区高清不卡| 又粗又硬又长又爽又黄的视频| 天天躁夜夜躁狠狠久久av| 搡女人真爽免费视频火全软件| 一级二级三级毛片免费看| 嘟嘟电影网在线观看| 岛国毛片在线播放| 国内揄拍国产精品人妻在线| 成人无遮挡网站| 国产色爽女视频免费观看| 久久热精品热| 亚洲av一区综合| 亚洲美女搞黄在线观看| 国产成人精品久久久久久| 嫩草影院精品99| 免费黄网站久久成人精品| 精品熟女少妇av免费看| 长腿黑丝高跟| 青春草国产在线视频| 国产精品国产高清国产av| 97超视频在线观看视频| 国产黄色视频一区二区在线观看 | 亚洲av.av天堂| 99热全是精品| 人妻制服诱惑在线中文字幕| 搡老妇女老女人老熟妇| 高清视频免费观看一区二区 | 国产黄色视频一区二区在线观看 | 国产单亲对白刺激| 亚洲成人精品中文字幕电影| 女人被狂操c到高潮| 汤姆久久久久久久影院中文字幕 | 欧美成人免费av一区二区三区| 婷婷色麻豆天堂久久 | 欧美bdsm另类| 精品99又大又爽又粗少妇毛片| 亚洲欧美精品专区久久| 日韩 亚洲 欧美在线| 成人毛片60女人毛片免费| 国产精华一区二区三区| 大话2 男鬼变身卡| 亚洲欧美中文字幕日韩二区| 永久免费av网站大全| 男人和女人高潮做爰伦理| 你懂的网址亚洲精品在线观看 | 亚洲精品乱码久久久久久按摩| 亚洲四区av| 你懂的网址亚洲精品在线观看 | 久久欧美精品欧美久久欧美| 国产乱来视频区| 午夜日本视频在线| 99热这里只有是精品在线观看| 亚洲精品亚洲一区二区| 国产乱来视频区| 日日啪夜夜撸| 成年免费大片在线观看| 亚洲精品日韩av片在线观看| 欧美成人免费av一区二区三区| 精品人妻视频免费看| 免费看av在线观看网站| eeuss影院久久| 欧美成人精品欧美一级黄| 久久国产乱子免费精品| 久热久热在线精品观看| 少妇丰满av| 欧美极品一区二区三区四区| 日本色播在线视频| 亚洲人成网站在线播| 免费观看a级毛片全部| 婷婷色av中文字幕| 国产不卡一卡二| 欧美成人精品欧美一级黄| 日本五十路高清| 人妻系列 视频| 日产精品乱码卡一卡2卡三| 麻豆乱淫一区二区| 国产真实伦视频高清在线观看| 干丝袜人妻中文字幕| 日韩欧美精品v在线| 韩国高清视频一区二区三区| 国产午夜精品久久久久久一区二区三区| 一级黄片播放器| 国产av在哪里看| 色视频www国产| 亚洲成人精品中文字幕电影| 一卡2卡三卡四卡精品乱码亚洲| 欧美bdsm另类| av黄色大香蕉| 亚洲熟妇中文字幕五十中出| 国产在线男女| 少妇裸体淫交视频免费看高清| 精品少妇黑人巨大在线播放 | 国产一级毛片七仙女欲春2| 亚洲av免费高清在线观看| 麻豆久久精品国产亚洲av| av女优亚洲男人天堂| 国产精品一区二区性色av| 亚洲国产精品成人久久小说| 午夜福利在线在线| 嘟嘟电影网在线观看| 精品久久久久久久久亚洲| 精品久久久久久成人av| 我的女老师完整版在线观看| 国产成人a区在线观看| 长腿黑丝高跟| 日韩在线高清观看一区二区三区| 国产黄a三级三级三级人| 可以在线观看毛片的网站| 床上黄色一级片| 亚洲人成网站在线观看播放| 一级二级三级毛片免费看| 特级一级黄色大片| 欧美激情在线99| 国产精品1区2区在线观看.| 一级毛片我不卡| 欧美三级亚洲精品| 日韩 亚洲 欧美在线| 国产极品天堂在线| 18禁动态无遮挡网站| 男人舔女人下体高潮全视频| 国产久久久一区二区三区| av免费在线看不卡| 成人欧美大片| 乱人视频在线观看| 国产精品一区二区三区四区免费观看| 日韩欧美精品免费久久| 国产高潮美女av| 精品无人区乱码1区二区| 91aial.com中文字幕在线观看| 桃色一区二区三区在线观看| 五月伊人婷婷丁香| 中文在线观看免费www的网站| 亚洲国产精品sss在线观看| 如何舔出高潮| 最近最新中文字幕免费大全7| 国产一区有黄有色的免费视频 | 色综合站精品国产| 国产伦理片在线播放av一区| 免费搜索国产男女视频| 国产精品久久久久久久电影| 国产黄色视频一区二区在线观看 | 午夜激情福利司机影院| 日本午夜av视频| 久久久久久久久久久丰满| 国产欧美另类精品又又久久亚洲欧美| 看黄色毛片网站| 校园人妻丝袜中文字幕| 精品不卡国产一区二区三区| 国产人妻一区二区三区在| 男人舔奶头视频| 国产单亲对白刺激| 亚洲综合色惰| 成人午夜精彩视频在线观看| 69人妻影院| 精品不卡国产一区二区三区| 99在线视频只有这里精品首页| 亚洲av中文av极速乱| 久热久热在线精品观看| 我的女老师完整版在线观看| 麻豆一二三区av精品| 综合色丁香网| 九九在线视频观看精品| 51国产日韩欧美| 哪个播放器可以免费观看大片| 高清毛片免费看| 五月玫瑰六月丁香| 国产伦理片在线播放av一区| 亚洲欧美日韩东京热| 91久久精品国产一区二区三区| 欧美成人精品欧美一级黄| av在线观看视频网站免费| 丰满乱子伦码专区| 日本三级黄在线观看| 色综合亚洲欧美另类图片| 在线播放国产精品三级| 熟女电影av网| 丰满少妇做爰视频| 久久久久国产网址| 亚洲av一区综合| 久久久久免费精品人妻一区二区| 成人特级av手机在线观看| 久久精品熟女亚洲av麻豆精品 | 欧美精品一区二区大全| 亚洲av免费高清在线观看| 国产精品久久久久久久电影| 欧美成人一区二区免费高清观看| 网址你懂的国产日韩在线| 国产高清有码在线观看视频| 搞女人的毛片| av免费在线看不卡| 国产大屁股一区二区在线视频| 午夜a级毛片| 欧美成人精品欧美一级黄| 午夜日本视频在线| 热99re8久久精品国产| 日韩av不卡免费在线播放| 国产真实乱freesex| 中文天堂在线官网| 好男人在线观看高清免费视频| 成年女人看的毛片在线观看| 99热6这里只有精品| av国产免费在线观看| 日本一本二区三区精品| 免费看美女性在线毛片视频| 三级男女做爰猛烈吃奶摸视频| 成人性生交大片免费视频hd| 日韩人妻高清精品专区| 一级av片app| 国产精品国产三级国产av玫瑰| 免费观看精品视频网站| 久久精品久久精品一区二区三区| 日本免费在线观看一区| 色视频www国产| 亚洲av.av天堂| 18+在线观看网站| 亚洲精品影视一区二区三区av| 男的添女的下面高潮视频| 91久久精品国产一区二区成人| 亚洲中文字幕一区二区三区有码在线看| 久久久久性生活片| 亚洲av中文av极速乱| 麻豆精品久久久久久蜜桃| 村上凉子中文字幕在线| 秋霞在线观看毛片| 欧美又色又爽又黄视频| 欧美色视频一区免费| 中文字幕av成人在线电影| 久久精品国产99精品国产亚洲性色| 日本色播在线视频| 在线播放国产精品三级| 精品午夜福利在线看| 中文字幕av在线有码专区| 亚洲av一区综合| 成人高潮视频无遮挡免费网站| 丰满乱子伦码专区| 精品少妇黑人巨大在线播放 | 中文字幕av在线有码专区| 国产精品女同一区二区软件| 精品少妇黑人巨大在线播放 | 人人妻人人澡人人爽人人夜夜 | 亚洲内射少妇av| 十八禁国产超污无遮挡网站| 国产av不卡久久| 久久久精品大字幕| 男女边吃奶边做爰视频| 国产伦理片在线播放av一区| 观看美女的网站| 一个人看视频在线观看www免费| 国产一区二区在线av高清观看| 国产激情偷乱视频一区二区| 久久久久久大精品| 日日摸夜夜添夜夜添av毛片| 18禁在线播放成人免费| 九草在线视频观看| 亚洲婷婷狠狠爱综合网| 夜夜看夜夜爽夜夜摸| 国产老妇伦熟女老妇高清| 日本免费一区二区三区高清不卡| 三级毛片av免费| 亚洲自拍偷在线| 亚洲人成网站在线播| 美女国产视频在线观看| 久久人妻av系列| 日本猛色少妇xxxxx猛交久久| 日韩欧美在线乱码| 搡老妇女老女人老熟妇| 看十八女毛片水多多多| 亚洲精品国产av成人精品| 亚洲精品aⅴ在线观看| 99热6这里只有精品| 国产 一区精品| 亚洲图色成人| 国产精品国产三级国产av玫瑰| 欧美潮喷喷水| 免费看美女性在线毛片视频| 黄色一级大片看看| 亚洲精品影视一区二区三区av| 午夜福利高清视频| 高清在线视频一区二区三区 | 秋霞伦理黄片| 男女视频在线观看网站免费| 成人亚洲欧美一区二区av| 韩国高清视频一区二区三区| 精品午夜福利在线看| 色综合色国产| 免费在线观看成人毛片| 亚洲自偷自拍三级| 女人久久www免费人成看片 | 久久婷婷人人爽人人干人人爱| 在线播放无遮挡| 国产亚洲av嫩草精品影院| 成人三级黄色视频| 一级爰片在线观看| 亚洲国产精品成人综合色| 久久久午夜欧美精品| 亚洲av成人精品一区久久| 69av精品久久久久久| 日日啪夜夜撸| 精品久久久噜噜| 欧美成人a在线观看| 自拍偷自拍亚洲精品老妇| 中文字幕久久专区| 少妇猛男粗大的猛烈进出视频 | 高清午夜精品一区二区三区| 如何舔出高潮| 综合色av麻豆| 亚洲欧美精品自产自拍| 免费黄网站久久成人精品| 成人漫画全彩无遮挡| 国产极品精品免费视频能看的| 亚洲人成网站在线播| 青春草亚洲视频在线观看| 午夜福利网站1000一区二区三区| 久久久久久久久久久丰满| 午夜亚洲福利在线播放| 日韩人妻高清精品专区| 真实男女啪啪啪动态图| 色播亚洲综合网| 国产极品天堂在线| 大又大粗又爽又黄少妇毛片口| 卡戴珊不雅视频在线播放| 久久99蜜桃精品久久| 大又大粗又爽又黄少妇毛片口| 欧美成人一区二区免费高清观看|