張祖強
更多地圖,畫面仍然驚艷
《我的世界》提供全局照明、反射、陰影、大氣特效、透明體反射、折射和散射等多種光線追蹤效果。例如,光線追蹤全局照明可以準確地為場景中不同表面的一次或多次間接反射所造成的動態(tài)間接散射光線建模,并使其與其他光線追蹤效果相互作用;路徑追蹤在每個世界中都添加了光線追蹤反射效果,能反射每個細節(jié)、每個群體和N P C以及其他每種視覺效果,從而在像素級別實現反射效果。目前,《我的世界》中一共擁有多達15款地圖供玩家體驗光線追蹤,下面我們不妨在這些地圖中看看光線追蹤的加持下,《我的世界》究竟能給我們帶來怎樣的視覺享受。
劃重點:你得有一張支持光線追蹤的顯卡
想要在《我的世界》中體驗光線追蹤的魅力,玩家需要一張支持該技術的顯卡才行。目前N V I D I AGeForce RTX顯卡和AMD Radeon RX6000系列顯卡均支持光線追蹤,下面我們不妨首先回顧一下上述顯卡在光線追蹤方面的技術亮點。
NVIDIA GeForce RTX顯卡相關技術解析
在NVIDIA GeForce RTX 20系列顯卡的圖靈架構上,N V I DI A引入光線追蹤核心(下簡稱為“R T核心”)。R T核心的主要作用是針對光線追蹤計算中最耗費時間的加速邊界體積層次(B V H)遍歷和光線/三角形(基元)交叉測試(光線投射)過程進行加速,將整個光線追蹤計算的時間降低至可接受的范圍內。而在NVIDIA GeForce RTX 30系列顯卡的Ampere架構上,NVIDIA將其RT核心升級至第二代。相比第一代RT核心,NVIDIA GeForce RTX 30系列顯卡的第二代RT核心在光線和三角形相交測試速率和整體G P U光線追蹤速率上均實現性能翻倍。
除了上述性能提升外,NVIDIA在Ampere架構的第二代RT核心中還帶來比較重要的技術創(chuàng)新,那就是光線追蹤動態(tài)模糊加速。動態(tài)模糊是一種非常流行且重要的計算機圖形效果,可用于電影、游戲和許多不同類型的專業(yè)渲染應用程序中。動態(tài)模糊的本質和膠片攝影相關,因為膠片攝影時,圖像不是立即創(chuàng)建的,而是通過將膠片在有限的時間段內曝光來創(chuàng)建的。這意味著目標物體在膠片快門時間內的高速移動將帶來模糊的曝光效果。對GPU來說,要創(chuàng)建類似效果,必須模擬相機和膠片工作流程。動態(tài)模糊對于電影是非常重要的,它能夠避免畫面出現斷續(xù)卡頓的效果,對游戲來說亦是如此。
為了完成動態(tài)模糊下的光線追蹤計算,N V I DI A加入有關位置和時間函數的計算,同時硬件部分還需要新加入有關時間位置計算的單元,最終在Ampere架構的第二代RT核心中,NVIDIA實現了BVH、邊界框計算、位置(時間)計算、三角形相交、命中返回五個單元的協(xié)同工作,相比之前圖靈架構的第一代R T核心,新增內插三角形位置單元,進一步提升了執(zhí)行效率。
除了率先將支持硬件實時光線追蹤渲染的RT核心加入到GPU中,NVIDIA在GPU上的另一個創(chuàng)舉就是引入張量核心(TensorCore)。在之前的Volta架構中,張量核心的引入為AI計算帶來了極高的效率,這是NVIDIA的第一代張量核心。圖靈架構中,NVIDIA又對張量核心進行微調,可以看作是第二代張量核心。目前在Ampere架構中啟用的是第三代張量核心。簡單來說,第三代張量核心主要特點是支持了更多的數據格式,大幅度加強了在稀疏矩陣計算時的效能,比如在原始矩陣具有稀疏性時,第三代張量核心的速度可達到第一代伏特架構的20倍等。另外,新的第三代張量核心還加入了對BF16等數據格式的支持。
在實際游戲中,張量核心提供的就是玩家熟悉的NVIDIADLSS功能,而第三代張量核心所提供的就是NVIDIADLSS2.1版本。這項實時渲染技術通過基于AI的超高分辨率來提升性能,這一過程包括渲染更少的像素,然后使用AI構建清晰、更高分辨率的圖像,從而以快得多的幀率運行。具體到《我的世界》這款游戲里,NVIDIADLSS2.1提供了質量、平衡、性能和超性能這4種模式—在1080p下默認為質量模式,2.5K分辨率下默認為平衡模式,4K分辨率下默認為性能模式,8K分辨率下默認為超性能模式。
AMDRadeonRX6000系列顯卡相關技術解析
支持DirectX12Ultimate讓AMDRadeonRX6000系列顯卡實現對硬件光線追蹤渲染的支持。在AMDRadeonRX6000系列顯卡使用的RDNA2架構上,AMD引入硬件光線追蹤單元(下文簡稱:RA單元)。AMD目前的消息只是提到為每個CU單元配備1個RA單元,性能方面只是宣稱RA單元的光線追蹤交叉性能是傳統(tǒng)軟件執(zhí)行的10倍,更具體的數據顯示AMDRadeonRX6000系列顯卡的RDNA2架構GPU在微軟DXRSDK的ProceduralGeometry的測試中帶來了471fps的成績,在軟件模擬下只有34fps,因此前者的性能達到軟件的13.8倍。
實際上ProceduralGeometry只是整個DXRSDK中的一部分,用于測試地面以上所有對象在光線追蹤上的性能,其圖元信息包括解析幾何、體積幾何和帶符號的距離幾何等多重內容。因此,AMD在此處給出的性能只是光線追蹤計算的一部分內容,更多的信息還有賴于更多的測試和實際游戲內容。那么在開啟光線追蹤之后,AMDRadeonRX6000系列顯卡運行《我的世界》的表現如何,其性能表現是否能夠比肩NVIDIAGeForceRTX30系列顯卡呢,我們不妨通過實測結果來尋找答案。
《我的世界》光線追蹤性能測試
我們本次測試的主要目的,是想看看NVIDIAGeForceRTX30系列顯卡和AMDRadeonRX6000系列顯卡運行《我的世界》的性能表現。為此我們特別請到NVIDIAGeForceRTX3090FE和其競品AMDRadeonRX6900XT,以及NVIDIAGeForceRTX3070FE和其競品AMDRadeonRX6800這4款顯卡參與本次測試。考慮到NVIDIAGeForceRTX30系列顯卡還支持DLSS2.1技術,所以對于NVIDIAGeForceRTX30系列顯卡的這兩款參測顯卡,我們將分別進行“光追:開+DLSS:關”,以及“光追:開+DLSS:開”這兩個項目的測試。需要說明的是,《我的世界》中擁有名為“光線追蹤渲染能見度”的選項,其設定值越高,玩家在游戲中開啟光線追蹤后的游戲畫面渲染距離就越遠,玩家能看到的游戲畫面也更加豐富。為了考察《我的世界》對顯卡性能需求的最大值,我們決定將“光線追蹤渲染能見度”設為最高,即24個區(qū)塊。
從測試成績我們可以看到,NVIDIAGeForceRTX3090FE和NVIDIAGeForceRTX3070FE運行《我的世界》的性能表現非常亮眼。例如在1080p分辨率和打開光線追蹤設定下,不開啟DLSS時NVIDIAGeForceRTX3090FE運行這款游戲的平均幀率約為134fps。作為NVIDIAGeForceRTX3090FE的競品,AMDRadeonRX6900XT的表現就有些不如人意—這款顯卡在1080p分辨率下運行《我的世界》的平均幀率僅有58fps。不僅如此,即使將分辨率提升至2.5K,NVIDIAGeForceRTX3090FE和NVIDIAGeForceRTX3070FE運行《我的世界》的平均幀率也分別達到83fps和51fps,它們的測試成績也都大幅領先各自的競品。
下面我們特別關注一下DLSS技術帶來的幀率提升。首先在1080p分辨率下,DLSS給NVIDIAGeForceRTX3090FE帶來約34%的性能提升。當分辨率提升至2.5K并開啟DLSS之后,NVIDIAGeForceRTX3090FE運行《我的世界》的平均幀率逼近關閉DLSS時的兩倍。將分辨率進一步提升至4K之后,這款顯卡運行《我的世界》的平均幀率更是達到109fps,是關閉DLSS時的2.7倍。反觀AMDRadeonRX6900XT,這款顯卡在4K分辨率下運行《我的世界》的平均幀率僅為16fps,距離30fps的基本流暢水平也相去甚遠。值得一提的是,NVIDIADLSS2.1在提升游戲幀率的同時還保證了出色的游戲畫質。例如在平衡和性能模式下,《我的世界》的游戲畫面相比關閉DLSS時的游戲畫面在細節(jié)上幾乎沒有明顯差距。
玩光追,有NVIDIAGeForceRTX30系顯卡才暢快
正如我們預料的那樣,《我的世界》Windows10正式版仍然提供了令人驚艷的光追效果,各種反射、陰影和全局光照等效果給讓《我的世界》的游戲畫面得到蛻變,同時也讓玩家的游戲體驗得到質的飛躍。不僅如此,光線追蹤的加持還讓《我的世界》中眾多物體表面的細節(jié)紋理更為逼真,對于這款像素游戲來說,這是非常難能可貴的。
從我們的測試成績也可以看出,參與本次測試的這兩款NVIDIAGeForceRTX30系顯卡在運行這款游戲時的平均幀率非常亮眼,并且將AMD的兩款參測顯卡遠遠甩在身后。更加喜人的是,DLSS的加持還讓這兩款NVIDIAGeForceRTX30系顯卡運行《我的世界》的平均幀率大幅提升,并且游戲畫面也更加流暢,而沒有DLSS加持的RX6900XT和RX6800就完全不是前者的對手。因此我們認為,對于那些想要在《我的世界》中享受暢快光追體驗的玩家來說,NVIDIAGeForceRTX30系顯卡更值得入手。