OverLord
這里的3D立體顯示技術(shù)不是指顯卡生成的3D、立體感的畫面,而是讓畫面“脫離”顯示器的平面,立體地展示在人們眼前的一種顯示技術(shù)方案(圖2)。
英偉達(dá)和AMD都曾提出了自己的3D顯示解決方案,它們固然有所差異,但原理都是讓左右眼看到不同的信號(模擬現(xiàn)實世界中左右眼分別看到的略有差別的視角),從而欺騙大腦“生成”3D畫面。因此3D顯示技術(shù)的關(guān)鍵在于對左/右眼畫面的分幀送達(dá),常見的實現(xiàn)方式有色分法(紅藍(lán)眼鏡)、光分法(偏振式)、時分法(快門式),均需要搭配相應(yīng)的眼鏡觀看,這一路線最終發(fā)展出了VR眼鏡或稱VR頭戴式顯示器(圖3)。其中,紅藍(lán)眼鏡成本低廉但是效果非常有限,只能夠讓玩家體驗到最基本的景深效果,眼鏡片帶來的嚴(yán)重的色偏甚至讓玩家不能看清楚物體本身的顏色,短時間佩戴也會造成頭暈?zāi)垦5膯栴}。
偏振式與快門式3D技術(shù)的實現(xiàn)方式相差很大。偏振式3D的原理是用特殊薄膜貼在3D顯示器表面和眼鏡上,以不同的光線振動方向分離左側(cè)影像和右側(cè)影像,左/右眼鏡片只能透過適合自己偏振方向的光線,從而實現(xiàn)分幀顯示。偏振式3D平臺無需發(fā)射器、眼鏡電池,更簡單易用,而且畫面不會閃爍,但畫面分辨率會減半,而且最佳觀賞角度很有限。
在快門式3D平臺上,3D眼鏡的兩塊鏡片都內(nèi)置遮蔽功能,它與顯示平臺同步分幀信號。例如顯示左眼畫面時,左邊鏡片透光,右側(cè)鏡片遮蔽,這樣可以確保左右眼只收到屬于各自的畫面,形成立體視覺。快門式3D平臺需要高刷新率顯示器,如果刷新率不夠或同步不穩(wěn)定、鏡片遮蔽和透光轉(zhuǎn)換速度較慢,都會造成用戶看到的3D畫面出現(xiàn)閃爍,其眼鏡比較復(fù)雜,且需要與PC連接以同步信號,佩戴使用比較累贅。
英偉達(dá)一共推出了兩種3D顯示技術(shù),分別是3D Vision技術(shù)和3D Vision Discover技術(shù)。其中3D Vision技術(shù)是通過時分法來實現(xiàn)的,時分法的優(yōu)勢是成像效果更好,不過成本較高;3D Vision Discover采用的是色分法的成像原理,只要佩戴紅藍(lán)眼鏡后可以看到基礎(chǔ)的3D顯示效果。
具體來說,3D Vision技術(shù)是讓英偉達(dá)GeForce顯卡在計算游戲時(通過雙攝像頭實現(xiàn)的效果)將每一幀分別計算出兩個不同的畫面,然后將其輸出到顯示器上,然后通過專用的3D Vision眼鏡讓用戶的左、右眼分別看到不同(對應(yīng))的畫面,很顯然,這是一種快門式3D顯示技術(shù)。這一技術(shù)不僅需要配備專用的3D Vision眼鏡(圖4),同時還必須使用當(dāng)時較為昂貴的超高刷新率顯示器,門檻相當(dāng)高。
基于紅藍(lán)有色眼鏡(圖5)的3D Vision Discover技術(shù)無需改變放映設(shè)備直接就可以實現(xiàn),成本低廉,不過容易讓人眼感覺視覺疲勞。不過它有一個獨特的優(yōu)勢,就是當(dāng)時很多電影院的3D顯示就是基于色分法(圖6),因此無論更符合很多用戶的習(xí)慣,對立體視頻源的兼容性也較好。
AMD的3D顯示技術(shù)名稱為HD3D(圖7),影響力比英偉達(dá)3D Vision系列小得多。AMD HD3D采用快門式3D眼鏡采用的主動式快門設(shè)計,達(dá)到不“閃”的效果,它要求畫面刷新率必須保證在60Hz以上(單眼),同時顯示器畫面的實際切換速度要兩倍于用戶感受到的畫面(圖8),也就是說顯示器刷新率要達(dá)到120Hz才可以(因為要交替顯示雙眼顯示內(nèi)容)。
與英偉達(dá)當(dāng)初的策略不同,其時AMD的HD3D技術(shù)屬于開放式標(biāo)準(zhǔn)(英偉達(dá) 3DVision不開放授權(quán)),可以兼容眾多第三方硬件設(shè)備、解決方案。這么比較起來,AMD的HD3D技術(shù)更有前途。
不過,無論是否屬于開放標(biāo)準(zhǔn),都難以擺脫3D顯示的痼疾,紅藍(lán)眼鏡的效果不佳(圖9),只能用于簡單體驗3D顯示。快門式3D顯示設(shè)備效果較好,但成本不菲——當(dāng)時具備120Hz刷新率的顯示器價格通常在3000元以上(圖10),這還不夠,3D眼鏡的價格通常也在1000元級別。更不要談具備3D顯示技術(shù)的顯卡還要不菲的開銷。
你以為這就是阻礙3D顯示技術(shù)普及的全部了嗎?答案是否定的,除了硬件投資之外,人體自身的生理特征也是“阻礙”3D顯示技術(shù)的一個重要因素,這就是3D游戲眩暈癥。3D游戲眩暈癥的誘因和人的生理結(jié)構(gòu)有關(guān)。人通過聽覺、視覺、觸覺來獲得外界環(huán)境的信息,經(jīng)過長期的進(jìn)化,人類的各種感覺器官是高度協(xié)調(diào)合作的。比如在內(nèi)耳中有個叫“前庭器”的器官,它負(fù)責(zé)感受身體的平衡,如人體的運動方向和加速度。在眼睛里也有專門的視神經(jīng)來感受運動。這些運動感受器官都是非常敏感的,它們將感受到的運動信息傳送到神經(jīng)中樞,由神經(jīng)中樞控制人體進(jìn)行適當(dāng)?shù)姆磻?yīng),來應(yīng)對運動對人體造成的影響。
當(dāng)人體感受到的運動幅度或頻率超過某適當(dāng)?shù)闹禃r,神經(jīng)中樞會產(chǎn)生不適的感覺,比如頭暈、惡心,從客觀上達(dá)到阻止當(dāng)前運動繼續(xù)的目的。這其實是一種自我保護(hù)機(jī)制,因為大幅度、高頻率的運動是可能對人體造成損傷的。經(jīng)過漫長的進(jìn)化,這反應(yīng)機(jī)制一已經(jīng)編碼進(jìn)了人類的DNA中。但這種自我保護(hù)機(jī)制的強(qiáng)度卻是有明顯的個體差異的,有人格外敏感些,比如那些容易暈車的人;有人不太敏感,比如那些不容易暈車的人(圖11)。
在3D顯示技術(shù)的“加持”下,視神經(jīng)感受到了大幅度、高頻率的運動,本來如果游戲的畫面不那么逼真,神經(jīng)中樞會自動鑒別出運動的虛假性,并抑制視覺傳來的神經(jīng)沖動。但由于畫面逼真,神經(jīng)中樞信以為真,與此同時其他運動感受器官(如耳前庭器)卻沒感受到任何運動,這種情形對神經(jīng)中樞而言是非常矛盾和不祥的,有很大的不可預(yù)知性,因此神經(jīng)中樞強(qiáng)烈地發(fā)出眩暈指令,希望人體能停下來,擺脫這種不祥的局面。這一點在更封閉的VR眼鏡(圖12)使用中表現(xiàn)的更明顯,很多人暈VR也是同樣的原因。
也就是說,無論采用何種3D顯示技術(shù),都無法避免讓部分用戶的身體無法“接受”這種高速、高頻的運動畫面,生理上產(chǎn)生強(qiáng)烈抗拒。經(jīng)過幾年的競爭,3D顯示技術(shù)很快便歸于沉寂,以至于顯示技術(shù)制造商后期都取消了對該技術(shù)的持續(xù)支持。
曾幾何時,多卡互聯(lián)技術(shù)成為了性能王者的不二法則,想要最好的3D加速性能?多裝幾塊顯卡吧!
這一切要從1998年說起,當(dāng)時的顯卡王者還是3DFX公司(后被英偉達(dá)收購)。它推出了一個全新的技術(shù):SLI(Scalable LinkInterface),中文為可擴(kuò)展的鏈接接口,是一種將兩張或以上的顯卡連在一起并單一輸出顯示的技術(shù)(圖13)。
具體來說,它采用線性分割的技術(shù)解決方案,其中一張顯卡負(fù)責(zé)奇數(shù)的掃描幀線,另一張顯卡負(fù)責(zé)偶數(shù)的掃描幀線,然后“組合”成一個完整圖面。這種技術(shù)現(xiàn)在來看非常簡單粗暴,它的加速對象只是像素填充,對三角形的生成沒有任何“加成”。當(dāng)然也情有可原,當(dāng)時的幾何圖形運算都是交由CPU處理,顯卡并不具備這個功能。
此外,SLI技術(shù)是利用模擬信號進(jìn)行數(shù)據(jù)傳輸?shù)模盘柸菀妆桓蓴_,合成的畫面可能會出現(xiàn)問題。最先使用SLI技術(shù)的顯卡是PCI接口的Voodoo 2,其后主板開始使用AGP接口,而一臺電腦只擁有一個AGP接口(圖14),這就讓SLI技術(shù)無處使用。
2004年之后,PCIe接口的普及應(yīng)用讓SLI有了重生的機(jī)會。恰逢ATI(AMD顯卡的前身)的Radeon R300系列如日中天,擊敗了英偉達(dá)的GeForce系列成為GPU性能的王者。英偉達(dá)為了挽回性能王者的頭銜,將收購3DFX得到的SLI技術(shù)進(jìn)行改造,重新推出(圖15)。首批支持該SLI技術(shù)的顯卡是GeForce 6800和QuadroFX40 0 0。而首張支持英偉達(dá) SLI技術(shù)的主板則基于英特爾的E7525芯片組(雙卡PCIe模式是PCIe ×16+PCIe ×8)。原本,SLI技術(shù)只被GTX 6600 GT以上的顯卡支持。為了推廣SLI技術(shù),英偉達(dá)逐步開放限制,令到整個GeForce 6系列的顯卡都支持SLI技術(shù)。
在英偉達(dá)的SLI技術(shù)種兩張顯卡并不能實現(xiàn)1+1=2的效果,這是因為兩張顯卡的地位并不相同,它們有著主副之分。主顯卡會分派運算指令給副顯卡,副顯卡則會將結(jié)果通過MIO接口傳回主卡,然后合并運行輸出。理想情況下,它們可以最多實現(xiàn)1.8張顯卡的效能(圖16)。
不僅如此,SLI技術(shù)還分成不同的技術(shù)細(xì)節(jié),例如Split Frame Rendering是將畫面分為上下半部,并各自由一顆GPU運算,然后再組合成同一個圖面;AlternateFrame Rendering則是將幀分成單、雙數(shù),分別交給不同的兩張顯卡處理(圖17);SLIAntialiasing - Redefining Image Quality模式可以增強(qiáng)畫面質(zhì)量,也就是兩張顯卡分別進(jìn)行抗鋸齒驗算,然后將結(jié)果合并輸出,達(dá)到更好的抗鋸齒效果。之后還有一個SLI of SFR技術(shù),它于2006年推出,采用的門檻極高,總共要四路顯卡才可以實現(xiàn),幾乎沒有實用價值。
但是,具體到用那個SLI技術(shù),是由驅(qū)動程序判斷游戲來實現(xiàn)的,也就是說如果游戲不支持、或者支持程度有限,都會對SLI多卡互聯(lián)技術(shù)的性能產(chǎn)生影響。用哪一個SLI模式是由驅(qū)動偵測電腦游戲的可執(zhí)行文件來決定,英偉達(dá)驅(qū)動程序里已內(nèi)置一組定義數(shù)據(jù)庫,沒有被定義的就會采用兼容模式,即使用單顆GPU而不運行SLI。而用戶也可以從驅(qū)動程序設(shè)置接口中的“3D Settings”,自行新增未被定義的游戲要用哪種SLI模式,或是修改已定義的數(shù)據(jù)庫。建議定時更新顯卡驅(qū)動程序,來增加SLI預(yù)先支持游戲的數(shù)量。
既然英偉達(dá)推出了多卡互聯(lián)技術(shù),它的老對手AMD當(dāng)然不會坐以待斃,CrossFire應(yīng)運而生(圖18)。CrossFire技術(shù)于2005年6月1日正式發(fā)布,其技術(shù)原理最初與英偉達(dá)的SLI技術(shù)頗為相似,之后開始開放使用軟件交火模式。同英偉達(dá)一樣,CrossFire也可以以多種模式運行,如Scissor(等同于SplitFrame Rendering模式)、Alternate Frame Rendering、CrossFire Super AA(與SLIAntialiasing - Redefining Image Quality相似)和英偉達(dá)基本一致,SuperTiling模式則更為優(yōu)秀,它將畫面分割成很多“小格子”,讓兩個顯示核心分別處理小格內(nèi)的3D內(nèi)容,比上下分屏的負(fù)載更平衡,利用效率頗佳,只不過它只能運行與D3D上,不能支持OpenGL。
后來,CrossFire技術(shù)更進(jìn)一步,實現(xiàn)了混合交火,尤其是板載核心和獨立核心,即不同規(guī)格的3D顯示核心混合使用,用以提升性能,不過兼容性并不理想。
無論是SLI技術(shù)還是CrossFire技術(shù),想法和初衷是很好的,通過簡單的1+1獲得更多的性能。但是它的弊端也很明顯,首先是投入成本很大,收益卻不成正比(1+1<2),而且要配備更大功率的電源,否則有燒機(jī)的危險。因此,現(xiàn)在無論是AMD還是英偉達(dá),都對多卡互聯(lián)技術(shù)沒有絲毫的興趣,也不再維護(hù)更新這個技術(shù)了。
在前些年的移動市場上,AMD和英偉達(dá)無論如何“呼風(fēng)喚雨”,最終都要歸于英特爾平臺之上。而英特爾的筆記本電腦平臺都會“提供”自家顯卡,即便筆記本使用了獨立顯卡也不例外。
這就引起了一個問題,內(nèi)置顯卡處理一些要求較低的畫面時性能足夠,功耗更小;而要玩游戲時肯定是獨顯更適合。我們應(yīng)該怎樣協(xié)調(diào)這些顯卡之間的關(guān)系呢?英偉達(dá)推出了自己的切換技術(shù):Optimus優(yōu)馳(圖19)。Optimus優(yōu)馳技術(shù)專門為搭載英偉達(dá)獨立顯卡的英特爾平臺筆記本打造,它是由驅(qū)動程序根據(jù)當(dāng)前應(yīng)用的需求選擇是否切換獨立顯卡,不過理想很豐滿、現(xiàn)實卻很骨感。
第一代優(yōu)馳技術(shù)問世于2006年,它的切換方式現(xiàn)在看起來頗為可笑——你可以理解為硬切換,它需要單獨的邏輯電路實現(xiàn)切換工作,用戶在切換顯卡的時候,必須關(guān)機(jī)重新開啟(不是重啟)才可以完成。不僅使用不便,硬件額外的成本也需要最終用戶承擔(dān)。
到了2008年,英偉達(dá)推出了第二代優(yōu)馳技術(shù)(圖20),最大的改變就是用戶不需要關(guān)機(jī)重開這個步驟,而是依靠驅(qū)動層級的軟件調(diào)試切換,實用性相比第一代優(yōu)馳技術(shù)有了改善。然而它與“無縫調(diào)用”之間的差距依然很大。首先是驅(qū)動程序的安裝非常麻煩,當(dāng)時的Windows操作系統(tǒng),無論是Windows XP還是Windows Vista,都不允許安裝多個顯卡驅(qū)動程序,也就是說一臺電腦只允許同時存在一個顯卡驅(qū)動。于是廠商不得已設(shè)計了顯卡驅(qū)動程序的中介層用來管理和切換兩個顯卡的驅(qū)動程序。然而這個專用的中介層程序都是專用的,也就意味著設(shè)備無法像我們現(xiàn)在這樣隨時更新顯卡驅(qū)動程序,必須依靠“定制”的驅(qū)動程序(包含顯卡驅(qū)動及中介層程序)才能實現(xiàn)更新,非常麻煩。
如果說這還可以忍受,那么另一點就很難接受了,盡管第二代優(yōu)馳技術(shù)不需要關(guān)機(jī)重開就能切換顯卡了,但是在調(diào)用切換時還是需要花費約10秒鐘的時間,期間屏幕會出現(xiàn)閃爍、黑屏等現(xiàn)象。而且最麻煩的地方在于,如果你想切換顯卡,在此之前你需要關(guān)閉一切正在調(diào)用顯卡資源的應(yīng)用,包括游戲、視頻播放,甚至Flash視頻(網(wǎng)頁)!
顯然,這仍然和我們今天的顯卡無縫調(diào)用的技術(shù)(非切換)不可同日而語,但已經(jīng)是它的“巔峰”了。最終這個技術(shù)隨著時間流逝而淡出人們的視野。
HBM顯存技術(shù)出現(xiàn)之時甚至?xí)屓擞X得,這就是顯卡顯存的未來。然而好就一定會被采用、普及嗎?現(xiàn)實告訴我們并非如此,至少它不是一個鐵律。
如果單純從技術(shù)角度去觀察,HBM顯存(圖21)的技術(shù)明顯比GDDR顯存更好。隨著顯卡芯片的快速發(fā)展,人們對傳輸帶寬的要求也在不斷提高。理論上,GDDR5乃至GDDR6已經(jīng)不能對帶寬的需要,技術(shù)發(fā)展進(jìn)入了瓶頸期——每秒增加1GB/s的帶寬將會帶來更多的功耗,動輒以百瓦特計的功耗著實讓人吃不消。
HBM的出現(xiàn)仿佛恰如其時。GDDR的顯存附著在顯卡電路板上,并圍繞在核心芯片四周,而HBM是一種“片上”顯存,將DRAM芯片直接安裝在GPU顯示核心的基板上(圖22),這種設(shè)計會讓信息交換的時間大大縮短。而且,這種技術(shù)不僅縮小了顯卡的PCB尺寸,還有效降低了顯卡的從功耗。更為重要的是相對于板卡線路,這種連接方式可以實現(xiàn)大得多的連接位寬,能以極低的頻率實現(xiàn)超大顯存帶寬。例如英偉達(dá)GeForce RTX3090配置的GDDR6X為384bit位寬,但同架構(gòu)專業(yè)芯片A100配置的HBM2顯存可以做到5120bit的位寬!性能可想而知。
按理說是百利無一害的設(shè)計,為何經(jīng)過幾年的發(fā)展,反而沒有顯卡再采用了呢?原因主要還在于成本——HBM顯存的成本之高令人咋舌,而且要與GPU芯片集成生產(chǎn)也降低了良品率(圖23),加上消費級GPU不能充分發(fā)揮HBM顯存的理論性能優(yōu)勢,所以很快變得無人問津。
當(dāng)然,這也不能否認(rèn)HBM顯存的技術(shù)規(guī)格之先進(jìn),如果有朝一日可以讓HBM顯存的成本大幅度降低,達(dá)到近似于GDDR顯存的程度(哪怕是貴一些),HBM顯存技術(shù)依舊有機(jī)會成為“現(xiàn)在進(jìn)行時”。
其實,那些被“遺忘”的顯示技術(shù)還有很多,只不過這幾個是最具代表性的,其他還有如跟隨品牌消失的3DFXglide等獨有API、實際基本沒有用到過的顯卡訪問內(nèi)存能力等,它們的“失敗”主要集中在單純的“技術(shù)導(dǎo)向”——即“我們有什么技術(shù)可以用在哪里,而不是我們有什么使用需求,所以我們要用什么技術(shù)手段解決?!?/p>