“逢7必香”,NVIDIA顯卡的性能升級步伐又回來了
在RTX 3090和RTX 3080后,9月2日NVIDIA發(fā)布會上老黃(NVIDIA CEO黃仁勛)發(fā)布的第三款顯卡如今終于揭開了其神秘的面紗。由于前兩款的市場反應(yīng)非常激烈,開賣即斷貨,所以NVIDIA也還特別推遲了RTX 3070的正式上市時間,從而準(zhǔn)備更充分的備貨量。如果說NVIDIA的顯卡有著“逢7必香”的定律,那么RTX 3070的表現(xiàn)和定位又如何呢?
熟悉顯卡發(fā)展歷史的玩家一定知道,在這幾代的顯卡中,NVIDIA顯卡有著“逢6必火”“逢7必香”的升級路線?!胺?必火”暫且不說,“逢7必香”指的是NVIDIA當(dāng)代的7字頭的型號性能會持平或超過上一代的旗艦產(chǎn)品。具體來說GTX770的綜合性能超過了GTX680,GTX970超過了GTX780Ti,GTX1070超過了GTX 980Ti。但在RTX 20系列這一代,這個升級步伐卻停了下來,RTX 2070沒能實(shí)現(xiàn)對GTX 1080 Ti的超越,這個活留給了RTX 2080。
當(dāng)然,這并不是說Turing架構(gòu)不夠優(yōu)秀,或者老黃“擠牙膏”。這是因?yàn)閺腒epler架構(gòu)(GTX680)演變到Maxwell架構(gòu)(GTX980)再升級到Pascal(GTX1080Ti)架構(gòu),每一代的CUDA核心都由FP32單元組成。在Turing架構(gòu)中,CUDA核心中加入了一個INT32單元,在運(yùn)算效率上得到了不小的提升。但問題在于,大部分玩家購買顯卡的升級動力大多來自游戲,而游戲?qū)τ诟↑c(diǎn)運(yùn)算的需求是遠(yuǎn)高于整數(shù)運(yùn)算的,所以在游戲過程中,Turing架構(gòu)中新加入的INT32單元經(jīng)常處于閑置狀態(tài),沒有實(shí)際的性能反饋。這也就是為什么RTX 2070沒法很好地替代GTX 1080 Ti的原因。
到了RTX 30系列,我們熟悉的升級路線又回來了,而新一代Ampere架構(gòu)的最大改進(jìn)就是將上一代的INT32單元變成了FP32/INT32的可變單元,即同一個單元可以在整數(shù)和浮點(diǎn)運(yùn)算間進(jìn)行切換。再加上8nm工藝帶來了單位面積下更多的晶體管數(shù)量,所以我們可以看到RTX 30系列的CUDA單元數(shù)量暴增,性能提升也非常巨大。
據(jù)NVIDIA官方介紹,RTX 3070的綜合性能就可以持平RTX 2080 Ti,遠(yuǎn)超RTX 2070,熟悉的“逢7必香”定律又重回各位玩家的視野。
RTX 3070規(guī)格解析,5888個CUDA單元搭配GDDR6顯存
NVIDIA RTX 3070基于GA104-300核心,同樣采用三星定制的8nm制程工藝。作為一款中高端產(chǎn)品,RTX 3070的核心面積僅為392.5mm2,相比RTX 3080/RTX 3090的核心面積小了三分之一。即便如此,由于制程的迭代,RTX 3070在這個尺寸下塞入了174億個晶體管,而上一代的旗艦RTX 2080 Ti,核心面積幾乎是RTX 3070的兩倍,晶體管數(shù)量卻只比RTX 3070多了12億。與此同時,RTX 3070的功耗僅為220W,比RTX 2080的225W還低,更不用說RTX 2080 Ti的260W了,這足以見得制程帶來紅利優(yōu)勢。
由于定位的關(guān)系,RTX 3070的規(guī)格相比RTX 3090和RTX 3080還是縮減了不少(但也為中間進(jìn)一步細(xì)分市場留下了空間),SM單元從RTX 3080的68組再次縮減到46組,每組128個CUDA核心,4個紋理單元,共5888個CUDA核心,184個紋理單元。Tensor Cores縮減到184個,RT Cores縮減到46個。
顯存顆粒方面,RTX 3070沒有采用RTX 3080/RTX 3090上使用的美光GDDR6X顯存,依舊還是使用的GDDR6顯存,這顯然和其定位/成本有關(guān)系。在FE公版的RTX 3070上,使用的是來自三星的GDDR6顯存,不再是之前美光的GDDR6顯存,三星的GDDR6顆粒在超頻性能上表現(xiàn)更好,也受到眾多超頻玩家喜愛。顯存容量方面,RTX 3070和上一代RTX 2070一樣是8GB,顯存位寬/頻率/帶寬也同樣是256bit/14GHz/448GB/s。
從規(guī)格上來看,RTX 3070或許有些不像想象中那么強(qiáng)大,但Ampere架構(gòu)的一個改進(jìn)值得大家注意,那就是在之前的GPU構(gòu)架中,ROP單元(光柵化處理單元)集成在內(nèi)存控制器中,如果縮減GPU位寬就會降低ROP單元數(shù)量。但Ampere架構(gòu)將ROP單元整合進(jìn)了GPC,每個GPC含有16個ROP單元。只要GPC數(shù)量不變,即使顯存位寬縮減,也不會影響ROP單元的數(shù)量。
RTX 3070擁有和RTX 3080一樣的6個GPC設(shè)計(jì),所以ROP單元數(shù)量同樣也是96個,超過了RTX 2080 Ti的88個。而這一改進(jìn),也是RTX 3070能夠“以下犯上”挑戰(zhàn)RTX 2080 Ti的規(guī)格優(yōu)勢之一。
除了ROP單元和CUDA核心外,RTX 3070可以說在硬件規(guī)格參數(shù)上全面低于RTX 2080 Ti(甚至連CUDA核心數(shù)都不能保證真的超過RTX 2080 Ti,因?yàn)镽TX 30系列的CUDA核心數(shù)是按照極限情況下,所有的CUDA核心都在進(jìn)行FP32計(jì)算時統(tǒng)計(jì),但這種情況在實(shí)際中幾乎不會遇到),它比后者少了近百個紋理單元,RT核心只有后者的70%,Tensor核心只有后者30%,顯存位寬也只有其三分之二。比較有意思的是,如果RTX 20系列是作為光線追蹤的探路者出現(xiàn),那么RTX 30系列無論是從玩家期望出發(fā)還是NVIDIA本身出發(fā),都是作為光線追蹤游戲普及的一代出現(xiàn),在這一代上如此大規(guī)模地削減RT核心和Tensor核心的數(shù)量,也說明了NVIDIA對第二代RT核心和第三代Tensor核心在性能上的信心。
如果說RTX 3080/RTX 3090以強(qiáng)大的硬件規(guī)格實(shí)現(xiàn)了在性能上對RTX 2080 Ti的超越不足為奇,那么RTX 3070以看似弱很多的規(guī)格如果真能戰(zhàn)平RTX 2080 Ti,這才真的能夠說明Ampere架構(gòu)的強(qiáng)大。
定價有驚喜,性價比竟高過RTX 2070
如果是和上一代同為7字輩的RTX 2070相比的話,RTX 3070的規(guī)格就有大幅的提升。相比RTX 2070的2304個CUDA核心來說,RTX 3070的5888個CUDA核心已經(jīng)在數(shù)量上翻倍(即使沒有全部進(jìn)行FP32運(yùn)算,也能保證在游戲中的調(diào)用超過RTX 2070),紋理單元、ROP單元、RT核心等規(guī)格也同樣高出不少。加上這一代架構(gòu)的效能提升,穩(wěn)贏RTX 2070 50%以上的性能應(yīng)該問題不大。
RTX 3080的售價幾乎只有RTX 2080 Ti的一半,性價比已經(jīng)讓玩家感到十足的驚喜。而RTX 3070的定位更低,售價自然也就再次下探到3899元(FE公版)的價位上。如果它真能戰(zhàn)平RTX 2080 Ti,那么以不到4000元的售價買到上代萬元旗艦的性能(甚至諸多非公版已經(jīng)超過了一萬元),對于玩家來說可以說是真香了,要知道3899元這個售價,不但遠(yuǎn)低于RTX 2080 Ti,甚至比RTX 2070的首發(fā)售價都低了900元(事實(shí)上后期眾多RTX 2060S都賣到這個價位),可以說是相當(dāng)驚喜了。
另外,除了硬件規(guī)格方面本身的提升之外,NVIDIA Reflex低延遲技術(shù)、BROADCAST直播串流輔助、新一代AV1編解碼、新一代HDMI2.1接口等RTX 30系列帶來的全新特性,RTX 3070均有搭載和支持。下面就讓我們一起來看看RTX 3070顯卡的實(shí)際測試,是否能真的如NVIDIA所說那樣,綜合性能戰(zhàn)平RTX 2080 Ti。