A卡Fans們企盼多時的R600終于降臨,雖然目前上市的Radeon HD2900XT并非R600系列中的頂級產(chǎn)品,但它所擁有的強勁實力已足以對抗NVIDIA G80系列產(chǎn)品?!峨娔X迷》本期技術沙龍?zhí)匾庹垇砹薘adeon HD2900XT與GeForce 8800GTS這兩款市場售價相當?shù)漠a(chǎn)品,在解析R600技術特性的同時,也為大家擺下了這兩款高端產(chǎn)品的PK擂臺。
似曾相識的新一代王者
R600更新了前作R580的極線程分發(fā)處理器,它擁有自己的專屬緩存,可以有效的降低延遲,使得數(shù)據(jù)的處理情況大大優(yōu)化,降低了指令堵塞和操作單元的空閑比例。
環(huán)路顯存總線控制器再次出現(xiàn)在R600上。但R600采用了全分布式環(huán)形總線控制器。2條512Bit環(huán)形通道鏈接了四個環(huán)站,每個環(huán)站控制兩個64Bit顯存通道。所有的顯存數(shù)據(jù)都經(jīng)過四個環(huán)站,然后經(jīng)由仲裁器判定后執(zhí)行。這樣一來,我們就看到了8個顯存通道并行傳輸?shù)臓顟B(tài),充分利用了R600所配備的512bit顯存位寬。這跟我們在主板上看到的雙通道內(nèi)存模式來提升內(nèi)存帶寬的原理相近,它讓R600即便是使用更低速顯存的情況下,仍然達到更高的帶寬。而NVIDIA G80還在使用老式的成熟的交叉總線,最大位寬只有384bit(GeForce 8800GTS為320bit)。目前從這一點上看,R600無疑是領先的。但是由于驅(qū)動不成熟和環(huán)路總線本身的一些原因,這種優(yōu)秀的總線利用率不是非常令人滿意,在高分辨率和抗鋸齒的情況下,反倒是G80同檔次產(chǎn)品占優(yōu)。
全新的硬件規(guī)格
R600采用了第二代統(tǒng)一渲染架構,AMD在設計R600的時候?qū)⒚恳粋€渲染單元設計為4D+ID的形式。這樣一個渲染單元可以在一次操作中最多完成5個標量指令運算(如加乘等)。其中的4D為通常的處理單元,主要完成簡單的加乘運算,而1D除了完成加乘運算外,還可以運行一些諸如正弦、余弦、對數(shù)、冪等復雜的函數(shù)運算。這樣的單元共計64組,因而也被看成是645,共計320個流處理器。反觀對手G80,它的流處理器只有128個(GeForce 8800GTS縮減為96個),全部為標量設計,每一個流處理器就是一個1D標量ALU。在進行3D運算的時候,G80需要將所有的運算指令全部轉(zhuǎn)換為標量指令才可以進行處理。但是G80標量設計的流處理器頻率非常高,達到了核心頻率的兩倍以上,所以綜合看起來,G80的128個MIMD流處理器基本相當于64個傳統(tǒng)的4D流處理器。
隨著圖形渲染要求的不斷提升,復雜運算的地位變得日漸重要,同時比例也比以前大幅提升。所以我們才會看到R600和G80中的這種運算器配置。可以這樣說,R600更加適合于普通的、傳統(tǒng)的3D運算,而lG80的架構則非常適合于科學運算、物理運算等需要大規(guī)模并行處理的場合。
而在紋理單元方面,R600中設計了4組紋理單元,數(shù)量上看起來比R580的16個少很多,但是實際上每個紋理單元中所包含的處理器數(shù)量大大增多。如每紋理單元中包含了每單元內(nèi)建的8個紋理尋址處理器(總數(shù)32個)、20個FP32紋理采樣器(總數(shù)80個)、4個FP32紋理過濾單元(總數(shù)16個)。除了FP32紋理過濾單元外,紋理尋址處理器是R580的2倍,而FP32紋理采樣器是R580的5倍之多!加強型的紋理處理設計,能夠有效地應對更高強度的運算帶來的大紋理量處理,同時也很好的兼顧了DirectX 10的設計。
R600在幾何處理的能力也得到了大幅提升。它每個時鐘周期最多可獲取16個頂點,緩存也比R580系列增大了8倍。由于統(tǒng)一渲染架構的引進,R600的頂點處理性能大大提升,最高達到了X1000系列的10倍。同時,R600的后端處理單元也得到了大幅度的加強。為了更好地應對高倍數(shù)的全屏抗鋸齒和HDR等技術帶來的壓力,R600提供了最大8個MRT(Multiple Render Target多重渲染目標),支持8MSAA。由于可編程AA的引入,R600最大可以支持到24的CFAA。R600的后端渲染單元還可以支持MRT,讓像素著色擁有多個輸出端。
通用計算徹底解放CPU
R600核心的Radeon HD 2900XT標稱運算速度達到了473.6GFLOPS,從實際情況來看CPU想要達到理論的48GFLOPS都很困難。R600從開發(fā)之初就考慮到在通用計算方面的應用,這一代產(chǎn)品被命名為HD 2000系列不僅是因為它全面支持HDMI、HDCP以及HDTV解碼加速,同時還更能有效地進行HDTV編碼,要知道編碼操作的運算量可達解碼的10倍以上。R600能夠支持單GPU、雙GPU以及網(wǎng)絡分布式視頻編碼,能夠大大地減少系統(tǒng)內(nèi)存容量和帶寬的占用,解放CPU,更高效地進行各種格式的視頻編碼和格式轉(zhuǎn)換。而針對家庭和影音用戶引入了UVD引擎、內(nèi)置的HDMI音頻方案,更是給使用者帶來全新聲顯合一的體驗。
Radeon HD2900XT VS GeForce 8800GTS
如果晦澀難懂的技術簡介讓你感覺有些頭疼的話,那么一場直截了當?shù)腜K或許來得更加直接,也更說明問題。AMD Radeon HD2900XT(R600)與NVIDIA GeForce8800GTS(G80)兩者市場售價相當,用作對比更為合適。因而我們選取AMD公版的Radeon HD2900XT與訊景GeForce 8800GTS作為這場PK的對手。我們選用了3DMark2005、3DMark 2006兩款權威軟件進行綜合性測試,同時輔以《英雄薩姆2》、《切爾諾貝利的陰影》、《Prey掠食者》三款時下熱門游戲以及DirectX 10游戲《西部狂野》的測試包來對產(chǎn)品在游戲中的實際表現(xiàn)進行測試。
Radeon HD2900XT在3DMark 2005低分辨率測試中大幅領先對手,在高分辨率狀態(tài)下也有一定程度的領先。3DMark 2006高分辨率狀態(tài)下,Radeon HD2900XT也把GeForce 8800GTS甩開了10%左右。游戲方面,兩款高端產(chǎn)品都為我們帶來了靚麗、流暢的游戲畫質(zhì)。在默認設置或低畫質(zhì)情況下,Radeon HD2900XT仍然取得了全面勝利,但在《英雄薩姆2》和《切爾諾貝利的陰影》的高分辨率狀態(tài)下它的表現(xiàn)卻并不盡如人意,這恐怕跟驅(qū)動的完善程度有關。DirectX 10 API游戲《西部狂野》因為對硬件性能要求極高,所以兩款顯卡都僅能達到勉強流暢的水平,但Radeon HD2900XT還是憑借強大的硬件性能取得了明顯優(yōu)勢。
從測試成績上來看,Radeon HD2900XT已經(jīng)擁有了足夠的實力在高端市場上迎接G80系列的挑戰(zhàn),產(chǎn)品幾乎全面超過了對手GeForce 8800GTS,并且擁有與GeForoe8800GTX甚至是GeForce 8800UItra抗衡的實力,在高端產(chǎn)品線上扳回一城。測試完后我們更對傳說中的AMD頂級王者Radeon HD2900XTX充滿了期待。但話說回來,在未來的DirectX 10戰(zhàn)場上,真正唱主角的肯定不是R600和G80,NVIDIA G84、G86兩款主流產(chǎn)品已經(jīng)面世,并且迅速發(fā)力,而AMD要想獲得全面突破,R600后續(xù)的衍生產(chǎn)品RV610和RV630顯得尤為關鍵。