姬婧瑛
2022年末,ChatGPT的火熱出圈,帶動了大模型和生成式AI的研發(fā)熱潮,高性能、高算力、低能耗的AI芯片銷量飆升,以英偉達A100、H100為代表的GPU芯片供不應(yīng)求,推動其業(yè)績和市值雙雙創(chuàng)歷史新高,成為2023年躋身萬億美元市值俱樂部的新一代科技寡頭,也是華人創(chuàng)立的市值最高公司。
追溯英偉達的發(fā)展史,軟硬一體化是其商業(yè)模式的關(guān)鍵詞。其以GPU硬件縱向迭代為發(fā)展主軸,從定義顯卡的GeForce256,到紙面算力達到1Exaflops(每秒進行百億億次浮點運算)的GH200芯片,其GPU產(chǎn)品性能緊貼客戶需求不斷升級,并擴展出GPU、CPU、DPU協(xié)同的硬件布局。軟件層面,其則通過開源的運算平臺CUDA,橫向開拓廣闊的應(yīng)用市場,打造了與下游客戶不斷更新的需求相匹配的算力平臺,進而鏈接千行萬業(yè),成為AI時代智能駕駛、智能云、大模型、生成式AI等科技巨頭背后的“賣鏟人”。
內(nèi)部研發(fā)與外部收購并重,則是其保持技術(shù)領(lǐng)先的要訣。與所有科技巨頭一樣,其一手專注研發(fā),成立以來累計研發(fā)投入超過370億美元,打造了內(nèi)部技術(shù)迭代與進化的澎湃動能;一手頻頻外部收購,完善技術(shù)鏈條、延伸產(chǎn)業(yè)鏈,構(gòu)建了強客戶黏性的算力生態(tài)系統(tǒng)。
有效的策略,推動英偉達在五次科技大風(fēng)口中迎風(fēng)起舞,20年間營收增長近14倍,凈利潤增長58倍。
隨著芯片產(chǎn)業(yè)整體競爭加劇,提出“做AI界的臺積電”新目標的英偉達,仍在加速奔跑。其一邊圍繞AI提升GPU硬件性能,擴大軟件生態(tài),以快速迭代的新架構(gòu)、新產(chǎn)品,加固其技術(shù)護城河,實現(xiàn)“贏家通吃”;一手加碼投資AI賽道獨角獸企業(yè),擴張其AI生態(tài)圈,以合作雙贏深度綁定B端客戶,放大平臺優(yōu)勢。
算力為王的時代,芯片是科技巨頭打造算力底座最核心的部件,微軟、谷歌、Meta、華為、百度等已自研AI芯片,并爭相構(gòu)建AI生態(tài)。算力軍備賽中,英偉達的領(lǐng)先優(yōu)勢將會持續(xù)多久呢?
作為2023年市值增長最快的科技公司,英偉達(NVDA.O)備受各方關(guān)注。
2023年10月17日,拜登政府更新了針對AI芯片的出口管制規(guī)定,計劃阻止英偉達等公司向中國出口先進的AI芯片。其A800和H800等芯片均受影響,用于游戲市場的RTX4090系列顯卡在國內(nèi)電商渠道已逐漸下架,存貨單價被炒高至5萬元。
AI時代,占據(jù)算力要沖的英偉達,2023年1至9月股價已翻了兩倍,市值達到10843億美元,替代特斯拉成為美股“萬億美元市值俱樂部”的“老五”,成為華人創(chuàng)立的市值最高公司,同時也是全球市值最高的芯片股。
為其提供芯片制造和封裝服務(wù)的臺積電(TSM.N,2330.TW),以4631億美元市值緊隨其后,市值位居芯片行業(yè)第二。
8月28日,英偉達發(fā)布2024財年第二季(2023年4月30日至7月30日)財報,當季實現(xiàn)營收135.07億美元,同比增長101%,環(huán)比增長88%;凈利潤錄得61.88億美元,同比增長843%,環(huán)比增長203%,創(chuàng)歷史紀錄。
風(fēng)口起舞的英偉達,何以成為新時代的科技寡頭?有志于國產(chǎn)替代的企業(yè),如何借鑒其成長經(jīng)驗?
英偉達的營收主要來自游戲、數(shù)據(jù)中心、專業(yè)可視化、代工及其他、自動駕駛五大市場。其中,游戲和數(shù)據(jù)中心是其營收支柱,二者占總營收的比重已由2014年的50.73%上升至2022年的89.24%,2023年二季度再度升至93.4%。
得益于這兩項業(yè)務(wù)的強勁增長,2013-2022年,英偉達營收和凈利潤分別增長5.5倍、8.9倍(圖1)。其凈資產(chǎn)收益率(ROE)由9.87%上升至19.8%,2023年二季度更升至29.93%,與A股ROE排第15名的山西汾酒(600809)接近。相比高通、AMD等芯片同行上下起伏的ROE,英偉達ROE長期穩(wěn)定在20%左右,使之堪稱性能穩(wěn)定的印鈔機(圖2)。
數(shù)據(jù)來源:公司歷年財報,新財富整理
數(shù)據(jù)來源:Wind、公司財報,新財富整理
不得不說的是,2023年二季度,英偉達業(yè)績?nèi)绱吮l(fā)式增長,全靠上年同期業(yè)績的“襯托”和大模型業(yè)務(wù)的爆發(fā)。
一方面,其2022年同期的業(yè)績比較基數(shù)低。2021年12月至2022年9月,代表美股半導(dǎo)體行情的費城半導(dǎo)體指數(shù)(SOX.GI)下跌40%,游戲市場萎縮和幣圈挖礦業(yè)務(wù)降溫,導(dǎo)致英偉達游戲業(yè)務(wù)營收驟降44%,專業(yè)可視化業(yè)務(wù)營收下降20%,代工和其他業(yè)務(wù)營收下降11%,其錄得近10年來第二差的季度業(yè)績,僅次于2019年二季度。
另一方面,芯片行業(yè)整體陷入蕭條的背景下,2022年11月末,美國科技公司OpenAI推出的ChatGPT爆火出圈,科技公司紛紛跟風(fēng)推出大模型,帶動作為算力“剛需”的英偉達高性能GPU芯片A100和H100等供不應(yīng)求、價格飆漲,英偉達業(yè)績由此實現(xiàn)連續(xù)3個季度增長。
AI暖風(fēng)勁吹,英偉達股價昂揚向上,2022年10月末至2023年6月13日,由112美元/股飆漲至400美元/股。其也因此首次躋身“萬億美元市值俱樂部”。2023年8月31日,其股價漲至494美元/股高點,市值創(chuàng)歷史新高,達1.2萬億美元,是美股“萬億俱樂部”中2023年股價漲幅最大的“當紅炸子雞”。
近5個財年(2018.1.28-2023.1.29),英偉達累計總股東回報達2.38倍,遠高于標準普爾500指數(shù)、納斯達克100指數(shù)的回報(圖3)。
數(shù)據(jù)來源:英偉達2024財年財報
英偉達市值飆漲背后,是投資機構(gòu)真金白銀的下注。
Wind數(shù)據(jù)顯示,截至2023年6月30日,英偉達機構(gòu)股東數(shù)達3178家,持股市值5956億美元,較2022年12月31日的2338家增長36%,持股市值翻了1.7倍?而這僅是投資機構(gòu)半年的回報率。其大股東貝萊德(BlackRock)和先鋒集團(Vanguard)均持股超過10年,合計持股從2017年末的11.31%增至2022年末的15.55%。大資金持股的時長,與其投資回報正相關(guān)。
值得一提的是,英偉達業(yè)績和股價雙升,是全球計算轉(zhuǎn)型的時代注腳。
算力世界正在從程序慢、成本高的通用計算,向加速計算過渡。正如英偉達創(chuàng)始人兼CEO黃仁勛所說,正在發(fā)生的計算轉(zhuǎn)型是一個轉(zhuǎn)折點,世界各地的數(shù)據(jù)中心正在對此做出反應(yīng)和轉(zhuǎn)變。這一變革中,企業(yè)提高數(shù)據(jù)吞吐量、能源效率和成本效率的最佳方式是投資加速計算和生成式AI(ArtificialIntelligenceGeneratedContent,簡稱“AIGC”)。據(jù)麥肯錫的研究,AIGC每年對全球經(jīng)濟的貢獻將達7.9萬億美元。由此可以預(yù)見,遍及全球的算力轉(zhuǎn)型需求,將為高性能AI芯片帶來廣闊成長空間。
公開數(shù)據(jù)顯示,2020-2022年,全球GPU的市場規(guī)模分別為254.1億美元、334.7億美元、448.3億美元,年復(fù)合增長率為32.8%。按照這一增速保守估算,2030年全球GPU市場規(guī)模將達到4337億美元,8年有近10倍的成長空間。如果疊加2023年爆發(fā)的大模型和AIGC的強勁推動,市場空間將更大。
在二季度財報發(fā)布后的電話會議上,黃仁勛也提到:“目前全世界數(shù)據(jù)中心的價值高達1萬億美元,其中絕大部分使用的是CPU處理器。如果未來4到5年順應(yīng)AIGC大趨勢,大部分數(shù)據(jù)中心改用GPU,這會是多么大的市場?”
英偉達顯然對獵獲這個增長紅利野心勃勃。
為了成為算力王者,向智能駕駛、智能云服務(wù)、大模型、加速計算等領(lǐng)域的掘金者“賣鏟”,英偉達正致力于成為軟硬一體化的AI算力解決方案供應(yīng)商:在硬件端,其建構(gòu)了“GPU+CPU+DPU”的全棧布局;而其開發(fā)的運算平臺CUDA(ComputeUnifiedDeviceArchitecture,一種并行計算架構(gòu)),則被認為是最適合深度學(xué)習(xí)和AI訓(xùn)練的架構(gòu),開源、可編程性能夠鏈接廣闊的軟件市場,并與通信服務(wù)提供商和數(shù)據(jù)中心建設(shè)者合力規(guī)劃下一代AI世界的基礎(chǔ)設(shè)施。
當企業(yè)巨頭用科技魔力重塑我們的生活時,那些性格色彩鮮明的商業(yè)大佬們,也在虛擬世界緊握著流量密碼。
英偉達的創(chuàng)始人兼CEO是被粉絲們稱為“華人之光”的黃仁勛。這位美籍華人在社交平臺擁有不輸明星的熱度和擁躉,其焊在身上的皮衣與英偉達的GPU產(chǎn)品一樣出圈。
1993年,30歲的皮衣刀客與另兩位合伙人克里斯(ChrisMalachowsky)和普雷艾姆(CurtisPriem)創(chuàng)立英偉達。公司名稱“NVIDIA”取自拉丁文,意為嫉妒,公司標識也用了嫉妒的綠眼睛。2023年,步入而立之年的英偉達確實成為了令人嫉妒的公司,連采購其GPU的大客戶特斯拉(TSLA.O)的CEO馬斯克也不無嫉妒地說了一句,“似乎每個人、每條狗都在購買GPU……獲得GPU比獲得毒品還難”
英偉達早期以生產(chǎn)為游戲PC(個人電腦)提供渲染特效的圖形處理器(GPU或顯卡)為主。其以超越同行的性價比獲得了全球游戲廠商的大批訂單,1998年營收首次突破1億美元,達1.58億美元。1999年,其推出全球第一款可編程顯卡GeForce256,當年營收同比增長137%,達到3.75億美元。
1999年1月22日,成立約6年的英偉達在納斯達克掛牌上市,開啟了20多年的高速增長。
2003-2022年,英偉達營業(yè)收入由18.23億美元增至269.74億美元,凈利潤由0.74億美元增至43.68億美元,分別增長了14倍、58倍。
這20年中,英偉達精準踩中了科技發(fā)展的五個大風(fēng)口:2005年的PC普及、2010年移動互聯(lián)網(wǎng)、2016年的深度學(xué)習(xí)、2021年的幣圈“挖礦”以及2022年的AI大模型,其凈利潤均出現(xiàn)了非線性暴增(圖4)。
數(shù)據(jù)來源:英偉達年度財報、季度財報,新財富整理
我們簡單將其20年的發(fā)展劃分為兩個階段,2013年之前為搭建業(yè)務(wù)架構(gòu)的蓄力階段,2013年至今為伴隨AI迎風(fēng)發(fā)展階段。
第一階段中,2005年P(guān)C銷量爆發(fā)和2006年CUDA研發(fā)面世,是英偉達搭建業(yè)務(wù)底座的兩個關(guān)鍵節(jié)點,前者奠定其產(chǎn)品搭載規(guī)模,后者為其打開通向軟件市場之門。
2005年,從工業(yè)設(shè)計、工業(yè)造型,到電影、高清廣播、醫(yī)學(xué)成像,數(shù)字革命幾乎席卷所有行業(yè),全球PC銷量達到2.185億臺,操作系統(tǒng)供應(yīng)商微軟2005財年凈利潤同比大增50%,2006財年營收突破400億美元,并以超過2600億美元的市值成為全球市值TOP10企業(yè)中唯一的科技企業(yè)。而搭乘微軟東風(fēng)的DirectX9.0GPU,在圖形處理器市場獨領(lǐng)風(fēng)騷。
DirectX9.0GPU是英偉達可編程GPU與微軟DirectX9.0高級著色語言的組合產(chǎn)品,能夠高效處理和編輯高清數(shù)字視頻、數(shù)字照片的圖像,使計算機圖形達到電影級視效。
英偉達與微軟的合作最早在2000年3月,英偉達成為微軟第一款家用電視游戲機Xbox的獨家圖形引擎供應(yīng)商。當年6月,英偉達即被《商業(yè)周刊》評為全球第一的半導(dǎo)體公司;11月,其以7000萬美元現(xiàn)金加100萬股股票收購競爭對手“3Dfx”的圖形處理器核心資產(chǎn),成為圖形處理器行業(yè)規(guī)模第一的公司。
2001-2003財年,英偉達營收由7.35億美元增至19.1億美元,年復(fù)合增長率達61%。突飛猛進的業(yè)績讓英偉達初嘗游戲產(chǎn)品的甜頭,自此,其錨定了以GPU硬件為核心主線的業(yè)務(wù)發(fā)展路徑。
2004年,英偉達GeForce6800和6600GPU量產(chǎn),推動其DirectX9.0GPU在兼容圖形處理器領(lǐng)域的市場份額從21%上升至67%。2005年,趁熱打鐵的英偉達進一步擴展其架構(gòu)和技術(shù)優(yōu)勢,當年6月發(fā)布的GeForce7800將其市場份額從67%進一步拉升到79%,成為GPU市場的第一大供應(yīng)商。此時,英偉達已將客戶需求融入產(chǎn)品DNA,其GPU隨著微軟操作系統(tǒng)迭代升級而快速升級。
英偉達的創(chuàng)始人兼CEO是被粉絲們稱為“華人之光”的黃仁勛,其焊在身上的皮衣與英偉達的GPU產(chǎn)品一樣出圈。
配合客戶需求而發(fā)展的GeForce系列,成為英偉達最長青的產(chǎn)品系列之一。其2023年推出的最新產(chǎn)品GeForceRTX4090,單價12999元起。
值得一提的,上世紀90年代,硅谷誕生了一批專研圖形處理器的公司,它們大多淹沒在技術(shù)迭代的洪流中,而英偉達能夠穿越周期,成長為全球GPU龍頭,另一個重要的基石是從硬件向更廣闊的軟件市場延伸,最重要的工具是CUDA。CUDA之于英偉達,類似安卓系統(tǒng)之于谷歌。
2003年,斯坦福大學(xué)博士生伊恩·巴克(IanBuck,現(xiàn)任英偉達加速計算總經(jīng)理)進入英偉達實習(xí),其所在團隊為解決微軟創(chuàng)建的應(yīng)用程序接口DirectX的編程門檻過高問題,推出了編程模型Brook。2006年,伊恩·巴克正式加入英偉達,并基于Brook模型研發(fā)出CUDA,利用GPU中的并行計算引擎來解決復(fù)雜的計算問題,可以加快密集型應(yīng)用程序的計算速度,比單獨使用一個CPU的速度更快。
2007年開始,英偉達將CUDA內(nèi)置入其所有GPU產(chǎn)品中。CUDA以彼時最廣泛使用的C語言為基礎(chǔ),不同客戶的程序員可以根據(jù)具體需求和處理任務(wù),對GPU進行相應(yīng)編程,這一應(yīng)用很快在程序員群體中流行,具備了成為通用計算工具的能力。這一能力,磨刀霍霍切分CPU廠商的蛋糕,引來了CPU巨頭的聯(lián)合圍剿。
2006年,從英偉達采購90%GPU的AMD,以54億美元對價收購GPU供應(yīng)商ATI,形成CPU整合GPU的新型解決方案。2007年,英特爾收購物理加速引擎公司Havok,并發(fā)布CPU融合GPU的Larrabee架構(gòu),欲在其CPU中集成GPU。
CPU大廠絞殺疊加經(jīng)濟危機影響,2008年9月,業(yè)績承壓的英偉達宣布裁員6.5%。同年11月,英偉達發(fā)布的2009財年三季度財報顯示,其營收下降20%,凈利潤下降74%至0.6億美元,回到了2000年的水平。2008年和2009年,成為英偉達上市以來唯二的虧損年度。利空催化下,其股價一年內(nèi)蒸發(fā)了85%。
業(yè)績和市值雙殺,成為黃仁勛創(chuàng)業(yè)生涯中一次刻骨銘心的失敗記憶。
試圖提振業(yè)績的英偉達,抓住了移動互聯(lián)網(wǎng)發(fā)端的“救命稻草”。2010年,英偉達開辟移動市場業(yè)務(wù),推出費米架構(gòu)(Fermi)和基于該架構(gòu)的新一代QuadroGPU,其3D應(yīng)用性能比上一代Quadro產(chǎn)品快5倍,計算模擬性能比上一代產(chǎn)品快8倍。這助推其專業(yè)解決方案(PSB)業(yè)務(wù)和消費者產(chǎn)品(CPB)業(yè)務(wù)營收分別實現(xiàn)60%、27%的增長。但是,隨著競爭對手大量涌入,英偉達決定放棄移動市場,回歸并聚焦PC端產(chǎn)品。
這次取舍對于英偉達發(fā)展的重要性不言而喻,正如黃仁勛在2023年臺灣大學(xué)畢業(yè)典禮演講中所言,“戰(zhàn)略性撤退、犧牲、決定放棄什么才是成功的核心,并且非常關(guān)鍵”。
值得一提的是,業(yè)績低迷期間,英偉達并未停下技術(shù)升級的腳步,3年投入26億美元進行研發(fā),以優(yōu)化晶體管層的設(shè)計來解決散熱壓力帶來的產(chǎn)品良率困擾,從而大幅提升產(chǎn)品性能和功耗比。
或許正是英偉達GPU和架構(gòu)的快速迭代形成的壓力,2009年末,英特爾宣布無限期推遲Larrabee架構(gòu)發(fā)行,并于2011年1月再度與英偉達簽訂6年的專利交叉許可協(xié)議。伴隨英特爾的退出,GPU領(lǐng)域英偉達和AMD的雙寡頭競爭格局成型,且持續(xù)至今。
超前設(shè)計的CUDA架構(gòu),與市場的生化反應(yīng)延遲到了2010年才發(fā)生。這一年,AI先驅(qū)吳恩達使用AI程序識別出一只貓,使用了16000個CPU處理器,但是將CPU換成GPU,只需要12個GPU。2012年的ImageNet大賽(大規(guī)模視覺識別挑戰(zhàn)賽)上,卷積神經(jīng)網(wǎng)絡(luò)模型AlexNet以超出第二名10%以上的正確率獲得冠軍,其利用英偉達GPU的計算能力解決了復(fù)雜的模型問題。自此,英偉達GPU被認為適用深度學(xué)習(xí),被AI企業(yè)大量采購。
至此,GPU和CUDA已成為英偉達故事中關(guān)鍵的“1”,此后,其發(fā)展主線聚焦于縱向技術(shù)迭代和橫向應(yīng)用拓展,不斷在后面疊加“0”。
縱向技術(shù)升級,得益于關(guān)鍵技術(shù)的引進。例如,2016年,英偉達引入TensorCore&NVLink高速互聯(lián)技術(shù),以多個GPU組建為GPU陣列,進而形成超級GPU,為超強算力奠定了硬件基礎(chǔ);2022年,其引入NVSwitch交換互聯(lián)技術(shù),大幅降低了GPU通訊的延遲,提升了AI大模型高速并行計算中數(shù)據(jù)同步的效率,為其GPU在深度學(xué)習(xí)領(lǐng)域建立了強大的競爭壁壘。
這些關(guān)鍵性的技術(shù)突破,讓英偉達的芯片可以不斷拓展出大規(guī)模的芯片集群,進而搭建出任意形式的芯片拓撲結(jié)構(gòu)。2022年末,英偉達GPU顯卡中的CUDACore(核心)數(shù)量已較2007年提升超30倍,其GPU搭載于世界上最快的超級計算機。
橫向應(yīng)用擴展方面,英偉達逐漸衍生出“GPU+CPU+DPU”的全棧布局,先后開發(fā)出Kelvin、Rankine、Curie、Tesla、Fermi、Kepler、Maxwell、Volta、Turing、Ampere、Hopper等不斷升級的架構(gòu),并在這些架構(gòu)基礎(chǔ)上推出十多個產(chǎn)品系列(表1),支持從圖像處理到并行計算再到AI數(shù)據(jù)處理等不同應(yīng)用場景,英偉達的產(chǎn)品已成為GPU芯片專業(yè)性能和兼容性的基準。
數(shù)據(jù)來源:英偉達2018財年和2023財年年報,新財富整理
英偉達的營收中,游戲和數(shù)據(jù)中心是核心支柱,二者占營收的比重由2014年的50.73%升至2023年二季度的93.4%(表2)。
數(shù)據(jù)來源:英偉達年報,新財富整理;備注:2023年上半年為2023年1月31日至7月31日,下文同。
這一變化來自游戲市場和AI產(chǎn)業(yè)對GPU日益膨脹的需求,而市場風(fēng)口的切換,直觀體現(xiàn)在英偉達營收支柱的切換(圖5)。
數(shù)據(jù)來源:英偉達年報和最新季報,新財富整理
2021年前,游戲業(yè)務(wù)是英偉達絕對的營收支柱。2014-2021年,其游戲產(chǎn)品營收由20.58億美元增至124.62億美元,年復(fù)合增長率達30%。
近20年來,全球3A/3D游戲不斷推新,催生了對GPU處理器的巨大需求。全球億萬玩家倒逼高性能3D圖形渲染成為PC制造商重要的差異化賣點,而GPU是PC實現(xiàn)這一差異化的關(guān)鍵部件,因此,PC代工廠商進一步倒逼英偉達的GPU在滿足終端用戶、程序開發(fā)商和設(shè)備制造廠商三方需求中不斷尋求平衡。
從早期的《生化危機》《全面戰(zhàn)爭》《榮譽勛章》到后來的《魔獸世界》《英雄聯(lián)盟》《王者榮耀》等網(wǎng)絡(luò)游戲,均擁有超長的生命周期,它們背后億萬付費玩家在全球培育出動視暴雪(ATVI.O,2022年1月被微軟以687億美元對價收購,2023年10月下旬完成交易)、騰訊、網(wǎng)易等多家市值超5000億元的公司。
2022年,全球游戲市場營收約為1844億美元,網(wǎng)絡(luò)游戲市場營收為1326億美元,占比達72%。其中,中國是網(wǎng)絡(luò)游戲最大市場,貢獻了全球收入的20.1%。2003-2021年,游戲市場規(guī)模急劇擴張,中國游戲市場規(guī)模由13.2億元增長至2965.13億元,18年擴大224倍。
面對如此擴容的市場,主要面對PC端用戶的英偉達開發(fā)出四類產(chǎn)品,包括用于臺式機和筆記本電腦游戲的GeForceRTX和GeForceGTXGPU、用于低功耗設(shè)備上玩PC游戲的GeForceNOW、用于電視上播放高質(zhì)量流媒體的SHIELD,以及適用于游戲主機的片上系統(tǒng)(SOC)和開發(fā)服務(wù)。
不玩網(wǎng)絡(luò)游戲的人很難體會顯卡配置的重要性,但通過間隔一年的兩代產(chǎn)品,可以看出英偉達顯卡的迭代效率。
2022年9月,英偉達發(fā)布了AdaLovelaceGPU架構(gòu),并推出了基于該架構(gòu)的首批產(chǎn)品,包括GeForceRTX4090、RTX4080和RTX4070。其中,RTX4090內(nèi)置760億個晶體管、16384個CUDA核心和24GB高速鎂光GDDR6X顯存,在4K分辨率的游戲中持續(xù)運行速度超過100FPS,光線追蹤技術(shù)帶來的纖毫畢現(xiàn)得以完美實現(xiàn)。而其于2020年9月發(fā)布的GeForceRTX3090產(chǎn)品,內(nèi)置283億個晶體管、10496個CUDA核心和24GBGDDR6X顯存。
4090較3090性能提升2-4倍,但功耗同樣保持在450W。保持同等能耗的基礎(chǔ)上大幅提升產(chǎn)品性能,對于芯片公司是翻山越嶺的難度。
即便產(chǎn)品性能提升不止,2021年后,英偉達游戲業(yè)務(wù)營收仍掉頭直下。英偉達在其年報中的解釋是,“全球宏觀經(jīng)濟狀況及中國游戲需求下降的影響”。
被英偉達特別強調(diào)的中國大陸市場,多年來一直是其銷售額最高的市場之一,但近年銷售額明顯下降,由2021年的71.11億美元下降至2022年的57.85億美元,占英偉達總營收的比重由2021年的26.42%下降至2023年上半年的20.92%(圖6、7),中國市場的重要性可見一斑。
數(shù)據(jù)來源:英偉達年報,新財富整理
數(shù)據(jù)來源:英偉達年報,新財富整理
接替游戲成為英偉達創(chuàng)收支柱的,是數(shù)據(jù)中心。2023年上半年,這一業(yè)務(wù)的營收達到146.07億美元,接近2022年全年150.05億美元的水平,直線拉升了英偉達的業(yè)績。
數(shù)據(jù)中心的營收不是突然暴增。2014-2022年,英偉達數(shù)據(jù)中心的營收年復(fù)合增長率達62%。同期,英特爾的數(shù)據(jù)中心營收由143.87億美元增至191.96億美元,年復(fù)合增長率為3.7%。兩家公司數(shù)據(jù)中心的業(yè)務(wù)雖然不同,但英偉達增速之快,可見一斑。
數(shù)據(jù)中心業(yè)務(wù)是什么?
根據(jù)英偉達財報中的闡述,我們可以將其簡單理解為算力平臺或者算力服務(wù)。
英偉達算力平臺,由英偉達的高能效GPU、數(shù)據(jù)處理單元(DPU)、互連和系統(tǒng)、CUDA編程模型,以及越來越多的軟件庫、軟件開發(fā)工具包(SDK)、應(yīng)用框架和服務(wù)組成,服務(wù)于大多數(shù)加速計算密集型的工作負載,如AI、數(shù)據(jù)分析、圖形和科學(xué)計算、超大規(guī)模云和企業(yè)、公共部門和邊緣數(shù)據(jù)中心等。該平臺既可以作為整體系統(tǒng)打包出售,也可以單獨出售,以應(yīng)對客戶的定制化需求。
英偉達的GPU和相關(guān)軟件的大規(guī)模并行計算架構(gòu)非常適合深度學(xué)習(xí)、機器學(xué)習(xí)和高性能計算,為AI時代的規(guī)?;嬎闾峁﹦恿?。加速計算的能力,令英偉達得以借力三個應(yīng)用風(fēng)口,成就AI時代的高速發(fā)展。
第一個風(fēng)口,2016年深度學(xué)習(xí)接管互聯(lián)網(wǎng)。2015年的英偉達GPU技術(shù)大會上(GTC大會),黃仁勛宣布英偉達全面轉(zhuǎn)型AI。2016年3月,谷歌的機器人阿爾法狗(AlphaGo)擊敗了圍棋世界冠軍、職業(yè)九段棋手李世石,引發(fā)全球關(guān)注深度學(xué)習(xí)。隨后,谷歌、微軟等互聯(lián)網(wǎng)巨頭快速將各自的深度學(xué)習(xí)平臺開源,供全球開發(fā)者無壁壘使用,向企業(yè)提供傳統(tǒng)編碼無法提供的云和AI服務(wù),大量數(shù)據(jù)反哺深度學(xué)習(xí),加速了AI的進化。英偉達推出NVIDIATensorRT深度學(xué)習(xí)推理框架和Inception計劃,以支持深度學(xué)習(xí)和數(shù)據(jù)科學(xué)領(lǐng)域的初創(chuàng)企業(yè)發(fā)展,這帶動其2016年GPU業(yè)務(wù)營收同比增長39%。
RTX 4090顯示芯片內(nèi)置760 億個晶體管、16384 個CUDA核心和24GB高速鎂光GDDR6X顯存,光線追蹤技術(shù)帶來的纖毫畢現(xiàn)得以完美實現(xiàn)。
第二個風(fēng)口,2021年加密貨幣“挖礦”產(chǎn)業(yè)回春。英偉達推出了LiteHashRate(LHR)和GeForceGPU,并增加了CMP(cryptocurrencyminingprocessors,加密貨幣處理器)的供應(yīng),以滿足“挖礦”大規(guī)模計算的需求。2021年一季度,CMP為英偉達創(chuàng)收1.55億美元,上半年創(chuàng)收4.21億美元,部分對沖了游戲市場下滑對其業(yè)績的負面影響。
第三個風(fēng)口,2022年11月,語言大模型催化AI時代提前到來。這一年11月30日,OpenAI推出ChatGPT,5天內(nèi)注冊用戶數(shù)超過100萬,兩個月后月活用戶超過1億,成為史上增長最快應(yīng)用,全球掀起語言大模型和AIGC研發(fā)潮。中國市場以華為盤古、百度文心、騰訊混元、阿里通義為代表的大模型如雨后春筍般涌現(xiàn),對高性能芯片的需求井噴。
AI大模型是“大數(shù)據(jù)、大算力、強算法”結(jié)合的產(chǎn)物,其中,大算力堪稱基礎(chǔ)設(shè)施。英偉達基于Hopper和Ampere架構(gòu)推出的A100、H100以及特供中國市場的A800和H800(A100和H100部分性能減配的替代產(chǎn)品)等高性能芯片,是AI大模型的核心部件。
大模型潮起,英偉達“A+H”系列芯片銷量激增。2023年8月10日,多家媒體報道,百度、騰訊、阿里等中國企業(yè)向英偉達采購約10萬顆A800、H800處理器,訂單總額或超50億美元。
AMD的CEO蘇姿豐(LisaSu)曾提出,2023年,全球數(shù)據(jù)中心AI加速器的潛在市場總額將達到300億美元左右,預(yù)計到2027年,這一數(shù)字將超過1500億美元(折合1.095萬億元),年復(fù)合增長率超過50%。這意味著,英偉達數(shù)據(jù)中心未來營收的增長空間巨大。
AI風(fēng)口上,大模型訓(xùn)練的“入門級”算力支撐,至少需要1000顆A100芯片。
除了硬件支持,英偉達也提供大模型服務(wù),推出語言模型NVIDIANeMo、圖像視頻模型NVIDIAPicasso、藥物研發(fā)模型NVIDIABioNeMo等全棧式服務(wù),用戶可自定義用例并調(diào)整模型。
值得一提的是,除了中國科技圈興起“百模大戰(zhàn)”,業(yè)務(wù)與AI毫不沾邊的上市公司也在采購高算力芯片處理器,以圖跨界“算力”提振股價。
2023年9月29日,蓮花健康(600186)公告,其全資子公司杭州蓮花科技創(chuàng)新有限公司將以6.93億元的總價,向新華三集團控股子公司新華三信息技術(shù)有限公司采購330臺英偉達H800GPU系列算力服務(wù)器(每臺服務(wù)器含8張GPU)。在此之前的一個月內(nèi),蓮花健康股價由3.22元/股上漲至5.98元/股,大漲86%,創(chuàng)5年來新高?!八懔Α备拍顚股公司市值的提振效力,可見一斑。
馬太效應(yīng)下,越來越多不同行業(yè)的企業(yè)和初創(chuàng)企業(yè)使用英偉達的GPU和軟件,將其構(gòu)建的產(chǎn)品和服務(wù)實現(xiàn)自動化。例如,專業(yè)設(shè)計師使用其GPU和軟件創(chuàng)建電影中的視覺效果,并設(shè)計從手機到商用飛機的建筑物和產(chǎn)品;交通運輸行業(yè)用其構(gòu)建自動駕駛平臺;醫(yī)療保健行業(yè)用以增強醫(yī)學(xué)成像和加速藥物發(fā)現(xiàn);金融服務(wù)行業(yè)借此進行欺詐檢測。
英偉達成為二季度全球業(yè)績增長最強勁的科技公司背后,是其在顯卡領(lǐng)域遙遙領(lǐng)先的市場份額。公開數(shù)據(jù)顯示,英偉達占據(jù)全球數(shù)據(jù)中心AI加速市場82%的份額,而且,以95%的市場占有率壟斷了全球Al訓(xùn)練市場。
近乎“壟斷”的市場地位,簡單總結(jié)源于英偉達三方面的優(yōu)勢。
一是產(chǎn)品和架構(gòu)。基于架構(gòu)的靈活性、多功能性和穩(wěn)定高速性能,英偉達能夠勝任從數(shù)據(jù)處理到訓(xùn)練、推理,推理前對數(shù)據(jù)所進行的預(yù)處理,再到后期的數(shù)據(jù)處理,語言進行標識化以便用于訓(xùn)練等任務(wù)。尤其是大模型和AIGC的工作流程強度大,大量的應(yīng)用程序需要強大的并行處理能力,英偉達的架構(gòu)組合和產(chǎn)品能夠加速中心計算程序,以保證最低的運算和保有成本。
二是規(guī)模和速度。在游戲、智能駕駛、大模型、加速計算、智能云等終端上,英偉達已擁有龐大的安裝量。龐大的規(guī)模和超快速度,決定了英偉達能夠在不同的使用模型和計算環(huán)境中,持續(xù)發(fā)展極其復(fù)雜的軟硬件、網(wǎng)絡(luò)和計算堆棧,在保質(zhì)保量的前提下加快客戶的工程進度。而軟件開發(fā)者能夠通過英偉達的平臺,接觸最大數(shù)量的終端用戶,提升業(yè)務(wù)或獲得投資回報。規(guī)模效應(yīng)下,在行業(yè)未出現(xiàn)大的技術(shù)創(chuàng)新和拐點前提下,強者愈強的馬太效應(yīng)將不斷鞏固英偉達的領(lǐng)先優(yōu)勢。
三是系統(tǒng)和生態(tài)。在AI大模型訓(xùn)練等并行工作負載中,性能強大的芯片處理器重要,軟件生態(tài)更重要。性能強大的GPU讓英偉達成為芯片巨頭,但使英偉達成為全棧計算平臺的,是其龐大的軟件體系。
英偉達除了提供CUDA并行編程模型、CUDA-X應(yīng)用加速庫、應(yīng)用程序編程接口(API)、SDK和工具以及特定領(lǐng)域的應(yīng)用程序框架,還提供NVIDIAGPUCloud注冊表(NGC),這是一個涵蓋科學(xué)計算、深度學(xué)習(xí)和機器學(xué)習(xí)等領(lǐng)域、易于使用且經(jīng)過優(yōu)化的軟件堆棧的全面目錄。借助NGC,AI開發(fā)人員、研究人員和數(shù)據(jù)科學(xué)家可以開發(fā)AI和HPC(高性能計算)應(yīng)用。
基于英偉達構(gòu)建的軟件系統(tǒng),其硬件可以在每個大型計算機制造商和大型云服務(wù)器(CSP)的行業(yè)標準服務(wù)器中使用,也可以在英偉達DGXAI超級計算機中使用(DGX是一個專門為深度學(xué)習(xí)和GPU加速應(yīng)用而構(gòu)建的系統(tǒng))。為了擴大可用客戶群體、降低使用門檻,英偉達圍繞GPU構(gòu)建了多種現(xiàn)成系統(tǒng),包括面向超大規(guī)模和超級計算數(shù)據(jù)中心的HGX、面向企業(yè)和邊緣計算的EGX、面向高精度邊緣人工智能的IGX以及面向自主機器的Argan。
算力王者背后,是英偉達從產(chǎn)品到平臺再到生態(tài)系統(tǒng)不斷進化,并擴大其領(lǐng)先優(yōu)勢。那么,英偉達這樣的優(yōu)勢能否輕易復(fù)制呢?
風(fēng)口即市場需求,連續(xù)踩中科技產(chǎn)業(yè)發(fā)展風(fēng)口,背后是英偉達滿足爆發(fā)性算力需求的能力。
這一能力,源自其對變化中的早期市場和初創(chuàng)公司的關(guān)注和長期布局。例如,在ChatGPT爆紅出圈之前的2016年,黃仁勛已拜訪創(chuàng)立于2015年12月的OpenAI,并捐贈搭載8顆P100價值百萬的超級計算機DGX-1,成為“為ChatGPT算力助攻的英偉達”。
插播一句,OpenAI采用了與AI先行者谷歌不同的技術(shù)路線,谷歌2017年6月推出具有6500萬個可調(diào)用參數(shù)的Transformer模型,而OpenAI采用GPT(生成式預(yù)訓(xùn)練)模型,并于2018年推出具有1.17億個參數(shù)的GPT-1。二者之間的技術(shù)競賽自此開啟。
我們從其產(chǎn)品迭代的時間密集度上,感受一下OpenAI進化的速度:2019年2月15億參數(shù)的GPT-2、2020年5月1750億參數(shù)的GPT-3、2021年1月120億參數(shù)的DALL-E、2021年6月120億參數(shù)的Codex、2022年3月13億參數(shù)的InstructGPT、2022年11月末20億參數(shù)的ChatGPT相繼推出。
OpenAI每一次進化,都伴隨著谷歌的迭代回應(yīng)。2021年5月,谷歌發(fā)布1370億參數(shù)的AI系統(tǒng)LaMDA對話應(yīng)用語言模型。正是巨頭之間你追我趕的競爭,才推動了全面AI時代的提前到來。
堪稱初創(chuàng)公司算力最強助攻的英偉達,全球超過30000家合作伙伴中,15000家是初創(chuàng)公司,其中包括數(shù)千家AIGC公司。截至2023年1月末,英偉達GPU支持的應(yīng)用程序已超過2800個。英偉達為全球TOP500排行榜上超過70%的超級計算機提供支持,其中包括Green500排行榜上排名前30的系統(tǒng)中的23個。正如三六零(601360)創(chuàng)始人、董事長周鴻祎評價英偉達,“對用戶真正產(chǎn)生價值,才能慢慢生出偉大”。
如前所述,從賣GPU顯卡,到賣平臺服務(wù),再到構(gòu)建軟硬一體的AI算力生態(tài)系統(tǒng),推動英偉達演進的核心動能來自研發(fā)與收購。
“Innovationisatourcore”(創(chuàng)新是我們的核心)是英偉達每一年的年報中均會出現(xiàn)的固定表達。研發(fā)是科技公司的第一生產(chǎn)力,截至2023年1月末,英偉達研發(fā)方面的投入累計超過370億美元,擁有19532名研發(fā)人員,占員工總數(shù)的75%。
其中,2013-2022年,其研發(fā)支出的絕對值保持著高速增長,研發(fā)占營收的比重穩(wěn)定維持在20%(圖8)。與同類可比上市公司相比,英偉達研發(fā)投入占營收的比重達23.47%,高于高通和AMD(表3)。
數(shù)據(jù)來源:公司年報、季報,新財富整理
數(shù)據(jù)來源:Wind,新財富整理
除了真金白銀做研發(fā),從內(nèi)部構(gòu)筑技術(shù)發(fā)展動能,英偉達也以收購從外部完善技術(shù)鏈。
科技行業(yè)是并購重組的主陣地,英偉達30年的發(fā)展歷程中,并購時有發(fā)生。從2000年收購圖形芯片廠商3dfx,到2023年計劃收購移動芯片供應(yīng)商ARM,英偉達借助收購來實現(xiàn)技術(shù)躍升、業(yè)務(wù)拓展,從而實現(xiàn)業(yè)務(wù)轉(zhuǎn)型和產(chǎn)業(yè)鏈完整。
我們從代表性的案例,來看資產(chǎn)收購對英偉達的意義。
第一,2019年3月至2020年4月,英偉達以70億美元的對價收購以色列芯片制造商邁絡(luò)思科技有限公司(MellanoxTechnologies,簡稱“Mellanox”)。該公司是全球領(lǐng)先的服務(wù)器和存儲端到端連接解決方案的供應(yīng)商,產(chǎn)品包括以太網(wǎng)交換機、InfiniBand智能互連解決方案、服務(wù)器、存儲設(shè)備和超融合基礎(chǔ)設(shè)施,應(yīng)用于高性能計算、云計算、數(shù)據(jù)中心、企業(yè)計算及存儲市場,全球500強超級計算機中超過一半使用其設(shè)備。
借此收購,英偉達硬件產(chǎn)品布局得以從GPU擴展至DPU。英偉達推出了BlueFieldDPU,由數(shù)據(jù)中心基礎(chǔ)架構(gòu)軟件DOCA提供支持,通過DOCA,開發(fā)人員可以為BlueFieldDPU構(gòu)建軟件定義、硬件加速的網(wǎng)絡(luò)、安全、存儲和管理等應(yīng)用程序。因此,英偉達可以在整個計算、網(wǎng)絡(luò)和存儲堆棧中進行優(yōu)化,以提供數(shù)據(jù)中心規(guī)模的計算解決方案。目前,BlueFieldDPU應(yīng)用于頂級的安全、存儲和網(wǎng)絡(luò)公司,但滲透率還比較低。
黃仁勛在2022財年第一季度財報發(fā)布時表示:“Mellanox收購?fù)瓿梢荒陙恚隽宋覀兊念A(yù)期,英偉達也轉(zhuǎn)型為一家數(shù)據(jù)中心級計算公司?!?/p>
第二,2022年1月10日,英偉達收購其十多年的合作伙伴BrightComputing。該公司成立于2009年,是全球領(lǐng)先的高性能計算軟件開發(fā)商,其所生產(chǎn)的軟件管理著全球700多個組織使用的高性能計算系統(tǒng)。
借此收購,英偉達強化了其軟件在邊緣計算、數(shù)據(jù)中心和公有云、混合云等領(lǐng)域的運作能力,從而進一步擴大其高性能計算市場。截至2023年1月末,全球25個高性能計算應(yīng)用程序中的23個使用英偉達的產(chǎn)品。
第三,2022年3月,英偉達收購其合作伙伴Excelero。該公司成立于2014年,是一家高性能軟件定義存儲供應(yīng)商,其開發(fā)的NVMesh軟件,可管理和保護NVMe閃存驅(qū)動器的虛擬陣列,作為跨公有云和私有云的塊存儲,其塊存儲在運行DPU的DOCA軟件框架中發(fā)揮重要作用。被收購后,Excelero的技術(shù)被集成到英偉達的軟件堆棧中,并應(yīng)用到AI和高性能計算平臺。
第四,2023年7月,英偉達收購了AI初創(chuàng)公司OmniML。該公司成立于2021年的美國加州,主要產(chǎn)品是一個旨在快速、輕松地大規(guī)模進行AI優(yōu)化的平臺Omnimizer,其軟件可以壓縮機器學(xué)習(xí)模型的大小,以便在更小的設(shè)備上驅(qū)動人工智能,但其引用的示例主要涉及計算機視覺。例如,幫助智能攝像頭或自動駕駛汽車識別周圍的物體,是汽車實現(xiàn)自動駕駛的關(guān)鍵技術(shù)之一。
值得一提的是,OmniML的三位聯(lián)合創(chuàng)始人本科均畢業(yè)于清華大學(xué),分別是麻省理工學(xué)院電氣工程和計算機科學(xué)教授韓松、Meta前軟件工程師吳迪,以及參與發(fā)明深度壓縮技術(shù)的毛慧子。
除了上述“強鏈補鏈”式收購,英偉達也曾啟動收購移動芯片巨頭,借以重回移動領(lǐng)域。
籌劃收購ARM(ARM.O),是英偉達歷史上最受矚目的收購計劃。
ARM是一家移動端CPU芯片和架構(gòu)供應(yīng)商,全球99%的智能手機和89%的平板電腦使用其芯片架構(gòu),其成立至2022年末,芯片出貨量超過2500億顆。一直面向PC客戶端的英偉達,如果收購ARM,將實現(xiàn)其在移動端的業(yè)務(wù)突破,覆蓋PC和移動端客戶,成為芯片領(lǐng)域真正的“壟斷者”。
收購的機會由ARM控股股東軟銀釋放。2020年9月14日,因多筆投資價值大縮水而在2019財年出現(xiàn)成立15年來首次虧損(虧損130億美元)的軟銀,為緩解財務(wù)壓力,宣布將ARM以400億美元對價出售給英偉達。但這一交易計劃自帶的“壟斷”屬性,很快遭到ARM公司創(chuàng)始人赫曼·豪瑟(HermannHauser)和英國、歐洲、美國和中國的監(jiān)管機構(gòu)以及高通、微軟、谷歌等公司的反對。2023年2月9日,英偉達正式宣布放棄該項收購,軟銀轉(zhuǎn)而推動ARM獨立上市。2023年9月14日,ARM在納斯達克上市,創(chuàng)下2023年全球最大規(guī)模IPO紀錄。ARM最新市值為515億美元。
長期堅守內(nèi)部研發(fā)和外部收購,造就了如今擁有算力生態(tài)系統(tǒng)的英偉達。那么,需要提問的是,英偉達有哪些“軟肋”限制其未來發(fā)展呢?
AI風(fēng)口上,GPU是一個賣方市場。
大模型訓(xùn)練的“入門級”算力支撐,至少需要1000顆A100芯片。GPT-3模型訓(xùn)練采用的超級計算機,則需搭載數(shù)萬顆英偉達A100芯片,而升級后的大模型需要的芯片更多。因此,創(chuàng)建大模型的第一門檻,就是芯片的數(shù)量和芯片價格。
供不應(yīng)求下,2022年12月至2023年6月的半年內(nèi),英偉達A100價格累計漲幅近70%。英偉達H100的單價在2023年8月末超過了4.5萬美元,專業(yè)機構(gòu)推算,其成本約3000美元,利潤率達1400%。
這樣的暴利產(chǎn)品,當然大賣特賣最好,讓利潤漲到天上去。但是,高端芯片的生產(chǎn)工藝復(fù)雜度和產(chǎn)品良率幾乎成反比,英偉達“生產(chǎn)”不出來市場所需的芯片。站在產(chǎn)業(yè)鏈頂端的科技巨頭,正在遭遇“卡脖子”。
芯片行業(yè)如同所有高端制造業(yè),有重資產(chǎn)一體化模式,也有輕資產(chǎn)的代工模式,前者的代表如英特爾(僅20%的產(chǎn)品由外部代工),后者代表如英偉達,雖然二者的產(chǎn)品結(jié)構(gòu)不同,但隨著高端產(chǎn)品占比提高以及出品規(guī)模增長,2020年開始,英偉達的凈利率超過了英特爾,2023年上半年,差距進一步拉大(圖9)。
數(shù)據(jù)來源:英偉達和英特爾公司年報,新財富整理
作為一家專注芯片設(shè)計和銷售的公司,英偉達生產(chǎn)上依靠臺積電等供應(yīng)商,其芯片產(chǎn)品升級迭代中,生產(chǎn)環(huán)節(jié)的復(fù)雜度和生產(chǎn)工藝的難度往往呈非線性增長,需要整個供應(yīng)鏈的合力支持,甚至面臨供應(yīng)鏈的重構(gòu)(表4)。
數(shù)據(jù)來源:英偉達年報,新財富整理
這就導(dǎo)致,在外包生產(chǎn)的輕資產(chǎn)模式中,如果代工廠遭遇生產(chǎn)效率低下或排產(chǎn)限制等問題,產(chǎn)品就會無法按期量產(chǎn)或交付延期。早在2012年,英偉達即出現(xiàn)過產(chǎn)品因代工廠原因而供不應(yīng)求的問題。2012年一季度,由于臺積電28納米開普勒(Kepler)GPU容量限制,英偉達無法滿足客戶對高端臺式機GPU產(chǎn)品的需求,導(dǎo)致當季營收下降4%,凈利潤下降55.3%,一直持續(xù)到2013年一季度才重回正增長軌道。
截至2023年1月,對臺積電營收貢獻排名前10的客戶分別是蘋果、聯(lián)發(fā)科、AMD、高通、博通、英偉達、Marvel、意法半導(dǎo)體、亞德諾、英特爾。2020-2022年,其來自最大單一客戶蘋果的銷售金額由3367.76億元新臺幣增至5296.5億元新臺幣,增長57%,但蘋果占臺積電總營收的比重由25%降至23%。由此可見,臺積電的客戶集中度在下降,單一大客戶很難對其業(yè)績構(gòu)成特別重大影響。
針對客戶對臺積電的產(chǎn)能占有問題,臺積電在2023年財報中明確表示,由于設(shè)計技術(shù)和功能的快速變化,代工客戶一般不會提前很多時間下采購訂單來制造產(chǎn)品,但是一部分客戶與其達成協(xié)議,通過支付臨時費用以獲得臺積電晶圓廠的指定產(chǎn)能。
這意味著,臺積電的排產(chǎn)計劃中,預(yù)留了臨時付費增產(chǎn)的空間。據(jù)悉,臺積電正以超級急件(superhotrun)生產(chǎn)英偉達GPU,但H100和A100的訂單已經(jīng)排到2024年二季度,即現(xiàn)在下訂單,明年年中才能收貨。
一般而言,芯片的性能與晶體管的數(shù)量正相關(guān),但單位面積的硅片上晶體管排布越多,能耗越大散熱問題越突出,產(chǎn)品良率也越低,因此芯片設(shè)計的關(guān)鍵在于性能與能耗必須達成平衡。
以服務(wù)于超級加速器的芯片H100為例,其是由超過3.5萬個零件和近1萬億個晶體管組成的系統(tǒng)組件,內(nèi)部設(shè)計的復(fù)雜程度,外行難以想象。
拆分芯片結(jié)構(gòu),H100主要由邏輯芯片、HBM存儲芯片、CoWoS封裝、PCB板等輔助器件組成。目前,封裝和存儲芯片是兩大“卡脖子”環(huán)節(jié)。
我們以H100最通用的版本H100SXM為例,其采用的是臺積電CoWoS的7晶粒封裝,存儲芯片則是6顆16G的HBM3芯片分列兩排、圍繞中間的邏輯芯片。
首先,臺積電CoWoS封裝是一種2.5D封裝工藝,能將計算、內(nèi)存等晶片堆疊到硅中介層或硅轉(zhuǎn)接板,通過硅中介層上的高密度布線,實現(xiàn)晶片互連,再安裝到基板上進行封裝。這提升了芯片的連接速度、降低了功耗,相較直接在芯片上打孔、布線的3D封裝工藝,其成本更低、散熱更優(yōu),數(shù)據(jù)吞吐帶寬更寬,幾乎是市場上高算力、高存儲芯片的唯一封裝工藝。
目前,英偉達、AMD的4款高性能GPU均采用這一封裝工藝。但臺積電該封裝工藝產(chǎn)能不足,且目前幾無可替代廠商,這限制了英偉達相關(guān)產(chǎn)品的產(chǎn)量,預(yù)計2024年,三星或可提供該封裝服務(wù)。
按照集邦咨詢預(yù)測,臺積電正在擴產(chǎn)能,其CoWoS月產(chǎn)能將在2023年底達到1.2萬片,即便是臺積電把CoWoS產(chǎn)能都排給英偉達,英偉達高端芯片產(chǎn)能的天花板也僅是1.2萬片/月。因此,解決了封裝環(huán)節(jié)的限制,高端芯片的出貨量才會增加。
其次,存儲芯片供應(yīng)不足。H100中的6顆HBM3存儲芯片,由韓國SK海力士獨家供應(yīng)。一張H100SXM使用6顆HBM3存儲芯片的成本約1500美元。2023年上半年,三星的HBM3量產(chǎn)出貨加快,存儲芯片在2023年下半年后或不再限制H100出貨量。
一塊H100重達70磅,這幾乎是今年市場上唯一用“體重”計量的芯片產(chǎn)品,其2023年二季度出貨量超過了900噸。從長期來看,H100的供需缺口會隨著AIGC的應(yīng)用爆發(fā)而水漲船高。根據(jù)金融時報的報道,2024年H100的出貨量預(yù)計將高達150萬-200萬張,相比于2023年的50萬張?zhí)嵘?-4倍。有華爾街投行預(yù)測,2024年英偉達“A+H”系列顯卡的出貨量合計將達到300萬-500萬張。
得益于H100等高性能產(chǎn)品的拉動,2023年二季度,英偉達的毛利率達到68.2%,較2022年末的56.9%提高了11.3個百分點,創(chuàng)歷史新高,且高于直接競爭對手英特爾和AMD(圖10)。英偉達的毛利率,在Wind美股半導(dǎo)體設(shè)備與產(chǎn)品分類的104家公司中,排名第10。排名前9的公司中,6家2022年凈利潤錄得虧損,僅博通(AVGO.O)的凈利潤高于英偉達。
數(shù)據(jù)來源:英偉達、英特爾、AMD公司年報,新財富整理
令競爭對手不寒而栗的是,H100和A100產(chǎn)能尚在爬坡階段,英偉達性能更強的新產(chǎn)品又來了,一場看不見硝煙的算力戰(zhàn)爭正在發(fā)生。
順周期航程中,站在頭部的巨頭,只會加速。
2023年8月初,在美國計算機協(xié)會計算機圖形圖像特別興趣小組(SpecialInterestGroupforComputerGRAPHICS,簡稱“SIGGRAPH”)組織的2023年年會上,英偉達發(fā)布了基于GraceHopper架構(gòu)、搭載的存儲器為全球首款HBM3e(較HBM3快50%)處理器的新顯卡GH200,可用于處理大語言模型、推薦系統(tǒng)、矢量數(shù)據(jù)庫等全球最復(fù)雜的AIGC工作負載所需。該芯片配備141GB內(nèi)存、72核ARM中央處理器和每秒5TB的帶寬,較H100芯片內(nèi)存增加1.7倍,傳輸頻寬增加1.5倍。
GH200已于2023年5月全面投產(chǎn),基于GH200GraceHopper平臺的新系統(tǒng)將于2024年第二季度開始交付。
對于使用者來說,投資800萬美元使用GraceHopper,相當于使用8800個價值1億美元的X86GPU,整體成本降低12倍、能耗降低20倍。這也是黃仁勛說的“買的越多越省”的原因。
需要強調(diào)的是,英偉達的新平臺依舊延續(xù)兼容模式,客戶可以通過英偉達NVLink與其他超級芯片連接、協(xié)同工作,進而部署大型AIGC模型。因此,英偉達的一致性技術(shù)使GPU可以訪問CPU內(nèi)存,在雙配置中可提供總計1.2TB的快速內(nèi)存。
這無疑進一步加大了使用者改換GPU和平臺的難度和成本。用戶忠誠度“被動”加固。
那么,英偉達GPU芯片的性能升級會永無止境嗎?
芯片性能提升過程中,晶體管數(shù)量增加的規(guī)律誕生了一個摩爾定律,即集成電路上可容納的元器件數(shù)目,約每隔18-24個月便會增加一倍,性能也將提升一倍。在客觀存在的物理限制下,整個行業(yè)間隔十多年便會出現(xiàn)困擾聰明大腦的問題,摩爾定律會不會失效、算力會不會鎖死?
2023 年二季度,英偉達的毛利率達到68.2%,高于直接競爭對手英特爾和AMD。
2023年9月29日,英偉達發(fā)布的一篇博客稱,在過去10年中,英偉達GPU的AI處理能力增長了1000倍。由此,“單芯片推理性能”中看到的加速不會逐漸消失,理論上會繼續(xù)出現(xiàn),這一發(fā)現(xiàn)被業(yè)內(nèi)稱為“黃氏定律”。
短期內(nèi)算力不會鎖死,但AI大模型最強助攻的英偉達,如果其顯卡所有環(huán)節(jié)都實現(xiàn)產(chǎn)能自由,那么,根據(jù)工業(yè)品規(guī)模化生產(chǎn)的萊特定律,產(chǎn)品累積產(chǎn)量翻倍,單位成本將下降固定百分比。
例如,汽車行業(yè),整車廠產(chǎn)量翻倍,其成本價格就會下降15%。據(jù)相關(guān)機構(gòu)測算,在芯片行業(yè)中,晶圓產(chǎn)量翻倍,成本下降約22%。如果技術(shù)迭代,比如芯片從10納米迭代到7納米技術(shù),交付處理器的最終成本每年可以下降30%-33%。
正如臺積電2023財年年報所示,當其產(chǎn)能利用率增加時,固定制造成本會分攤到更大的產(chǎn)量上,產(chǎn)量越大,單位成本越低。為了提升芯片制造效率,針對當前的SoC開發(fā)方法,臺積電開發(fā)了多項晶圓加工程序,多個客戶可以共用掩膜(mask芯片制造中的模具),從而降低客戶的原型成本、縮短產(chǎn)品上市周期。
OpenAI正在探索自研AI芯片,并有意收購一家芯片公司,解決被芯片短缺限制進程的障礙。
英偉達與臺積電在長期合作中,學(xué)習(xí)曲線效應(yīng)與技術(shù)難度升級共振,彼此均獲得了不可替代的優(yōu)勢。這也是AI芯片賽道上,英偉達被英特爾、AMD、微軟、谷歌等巨頭追趕多年,卻尚未被超越的根本原因,而臺積電也越來越難被替代。
但是,產(chǎn)能受限的英偉達,必然無法獨吞未來10年AI算力芯片的萬億市場蛋糕,哪些公司將會是英偉達強勁的對手呢?
全球GDP增長乏力的背景下,數(shù)字經(jīng)濟保持強勁增長。發(fā)展數(shù)字經(jīng)濟,算力是核心生產(chǎn)力,未來很長一段時間,投資算力將對經(jīng)濟增長產(chǎn)生倍增效應(yīng)?!?022-2023年全球計算力指數(shù)評估報告》顯示,算力指數(shù)平均提高1個百分點,該國的數(shù)字經(jīng)濟和GDP將分別增長3.6‰和1.7‰。
算力已成為經(jīng)濟增長的主要驅(qū)動力之一,且全球主要國家數(shù)字經(jīng)濟占GDP的比重持續(xù)增長。2022-2026年,該比重預(yù)計將從50.2%增長到54%。其中,2022年中國AI算力規(guī)模達到268百億億次/秒,超過通用算力規(guī)模。預(yù)計未來5年中國智能算力規(guī)模的年復(fù)合增長率將達52.3%。
熱門賽道上,從來沒有獨一份的生意,即使是在算力世界“廣積糧高筑墻”的英偉達,也面臨競爭對手的追擊。
目前,英偉達主要的競爭對手有兩類:一是以AMD和英特爾為代表的解決方案供應(yīng)商和許可方;二是以谷歌、亞馬遜、微軟為代表的大型云服務(wù)商。
首先,專業(yè)處理器陣營第一梯隊的英特爾和AMD,2023年均已推出對標英偉達H100的產(chǎn)品和對標CUDA的軟件系統(tǒng)。
為應(yīng)對AI時代的算力需求,2023年7月,英特爾推出面向中國市場的第二代Gaudi深度學(xué)習(xí)加速器HabanaGaudi2,用于AI訓(xùn)練,意在爭奪“百模大戰(zhàn)”的中國市場。
目前,英特爾數(shù)據(jù)中心有兩大系列產(chǎn)品,Gaudi系列為人工智能加速領(lǐng)域中的專屬產(chǎn)品,適用于大模型的工作負載,Max系列GPU適用于科學(xué)計算領(lǐng)域。預(yù)計到2025年,英特爾將把兩條產(chǎn)品線融合,推出結(jié)合第二代Gaudi的GPU產(chǎn)品。
2023年9月19日,IntelOn技術(shù)創(chuàng)新大會上,英特爾CEO基辛格(PatGelsinger)披露了5nmAI芯片Gaudi3,該芯片將于2024年推出。同時,基辛格還預(yù)覽了第五代英特爾至強可擴展CPU處理器,其較第四代的AI性能提升2-3倍。阿里巴巴的“阿里云通義千問大模型”,使用的即是英特爾第四代至強處理器。
英特爾還宣布與ARM合作推出AI推理和部署運行工具套件OpenVINO,不僅支持預(yù)訓(xùn)練模型,也支持跨平臺應(yīng)用,以構(gòu)建其軟件生態(tài)。
值得一提的是,早在2021年12月,英特爾已推出了oneAPI,作為其“軟件先行”戰(zhàn)略的重要一步。oneAPI是一個統(tǒng)一簡化的編程模型,旨在簡化跨多架構(gòu)的開發(fā)過程(如CPU、GPU、FPGA、加速器),建立類似英偉達CUDA的軟件橋梁。
2023年9月19日,英特爾的軟件計劃迎來新的跨越,Linux基金會宣布,成立統(tǒng)一加速UXL基金會。這是一個跨行業(yè)組織,致力于提供一個開放的標準加速器編程模型,簡化開發(fā)高性能、跨平臺應(yīng)用程序的過程,其核心是加速演進英特爾oneAPI計劃。
該基金會的參與組織包括ARM、富士通、谷歌云、英特爾、高通、三星、ImaginationTechnologies(2017年被凱橋資本以5.5億英鎊收購)等公司,不包括英偉達。簡單概括,這些芯片公司試圖建立一個更大更開放的生態(tài)系統(tǒng),角力英偉達的生態(tài)系統(tǒng)。
GPU二號玩家AMD,2023年6月推出InstinctMI300A和InstinctMI300X兩款加速顯卡,用于AI和高性能計算等領(lǐng)域。
前者是全球首個為AI和高性能計算打造的APU加速卡,也是AMD首款采用“CPU+GPU+內(nèi)存”的一體化組合產(chǎn)品,其中包含1460億個晶體管、24個Zen4CPU核心、1個CDNA3圖形引擎和128GBHBM3內(nèi)存。后者則是對標英偉達H100、面向AIGC推出的加速器,內(nèi)含1530億個晶體管,單卡可支持400億參數(shù)的大模型,其顯存容量和帶寬均超越H100,是AMD產(chǎn)品史上最大的芯片產(chǎn)品,預(yù)計將于2023年四季度量產(chǎn)。
除此之外,AMD還推出集合了8個MI300X的InstinctPlatform,對標英偉達CUDA,同樣以軟硬一體化模式提供AI算力解決方案。
其次,向英偉達貢獻萬顆芯片訂單的云商大客戶,也紛紛自研AI芯片。
云服務(wù)是能夠?qū)I三要素(數(shù)據(jù)、計算和模型)融合的最佳模式。微軟AWS、亞馬遜Azure、谷歌云等大型云服務(wù)商,正在自研芯片和AI模型,以降低使用算力與模型服務(wù)的成本。
以最早研發(fā)AI芯片的谷歌為例,早在2016年,其數(shù)據(jù)中心已推出TPU,2023年4月推出AI芯片TPUV4,比英偉達A100處理速度快1.2-1.7倍,功耗卻低1.3-1.9倍。更重要的是,谷歌已將AI芯片團隊調(diào)整至谷歌云團隊中,以提高谷歌云AI芯片的租用服務(wù)能力。
華為也提出全面智能化戰(zhàn)略,打造中國堅實的算力底座,為世界構(gòu)建第二選擇。有消息稱,華為的GPU技術(shù)能力已可以對標英偉達,其昇騰910芯片性能可對標A100。
而微軟則因為投資了OpenAI而躍升為大贏家,從Bing到Office再到Windows,微軟不斷將OpenAI的技術(shù)置入旗下產(chǎn)品,風(fēng)頭壓過了谷歌。2023年二季度,微軟云全球市場份額達26%。2023財年,微軟云收入同比增長22%至1116億美元。持續(xù)增長的微軟云,未來有望超越市場份額30%的亞馬遜云。
作為OpenAI的獨家云供應(yīng)商,微軟Azure支持OpenAI的所有工作負載。同時,微軟也增加了對專業(yè)超級計算機系統(tǒng)的開發(fā)和部署的投資,以加速OpenAI的相關(guān)研究。
微軟已宣布,對其生產(chǎn)力軟件中的AIGC功能收取30美元/月的費用,云計算與大模型的疊加效應(yīng)已經(jīng)為其帶來實實在在的收益。
面對日益高昂的算力費用,微軟也將于2023年11月推出AI芯片“雅典娜(Athena)”,用于其數(shù)據(jù)中心服務(wù)器,并可用于ChatGPT訓(xùn)練,從而降低微軟內(nèi)部和OpenAI大模型訓(xùn)練和推理的成本,減少對英偉達芯片的依賴。
面對科技巨頭的競爭與追趕,英偉達也在延伸服務(wù)鏈條,降低其產(chǎn)品的使用門檻和可觸達性。
AI時代,高性能的算力配置價格高昂,大模型訓(xùn)練成本動輒成千上百萬美元,并不是所有公司都擁有入場資格。
自2020年以來,OpenAI在其最大的支持者微軟建造的大型超級計算機上,開發(fā)了AIGC技術(shù),該計算機使用了1萬顆英偉達的GPU?,F(xiàn)在建造這樣一臺超級計算機,僅GPU成本已近20億元。
Bernstein分析師斯泰西·拉斯貢(StacyRasgon)分析,運行ChatGPT是非常昂貴的,每次查詢大約花費4美分,如果ChatGPT的搜索量增長到谷歌搜索量的1/10,它將需要大約價值481億美元的GPU,每年需要價值約160億美元的芯片來維持運行。隨著英偉達GPU供不應(yīng)求、價格飆漲,OpenAI不少短期計劃被迫推遲。有報道顯示,OpenAI正在探索自研AI芯片,并有意收購一家芯片公司,解決被芯片短缺限制進程的障礙。
成本高昂,但每一個企業(yè)都需要大模型和AI服務(wù),這是增長潛力巨大的長尾市場。
為此,黃仁勛提出英偉達要做“AI界的臺積電”,通過與大模型廠商、云廠商合作提供高性價比的云服務(wù)解決方案,幫助下游企業(yè)降低大模型訓(xùn)練成本。
向云業(yè)務(wù)延伸的英偉達,推出云服務(wù)相關(guān)模型的動作迅速,一手合作、一手投資。
2022年8月,英偉達發(fā)布原生AI模型OmniverseAvatarCloudEngine(ACE),任何規(guī)模的企業(yè)都能夠通過其云端的模型和服務(wù)即時獲得創(chuàng)建并部署虛擬助手和數(shù)字人所需的大規(guī)模算力。
2023年3月,英偉達推出用于自定義AI基礎(chǔ)模型的AIGC云服務(wù)BioNeMo,能夠加速新蛋白質(zhì)和治療方法的創(chuàng)建以及基因組學(xué)、化學(xué)、生物學(xué)和分子動力學(xué)等領(lǐng)域的研究。
2023年3月,英偉達宣布推出包括NVIDIANeMo、NVIDIAPicasso和NVIDIABioNemo在內(nèi)的一整套云服務(wù),使企業(yè)能夠構(gòu)建、完善和運行自定義大型語言模型和AIGC模型。
與此同時,英偉達與微軟、谷歌、甲骨文等云計算巨頭合作托管其DGXCloud,合力提升超大規(guī)模云的性能。用戶無需采購和擁有服務(wù)器,可以通過瀏覽器訪問DGXCloud,包括AI超級計算、AI框架、預(yù)訓(xùn)練模型服務(wù),DGXCloud的收費標準是每個實例36999美元/月起,每個實例包括8個H100或A10080GBGPU,每個GPU節(jié)點內(nèi)存達640GB,且計算資源專用,不與云中另外的租戶共享。
除了與大型云服務(wù)商合作外,英偉達還密集投資了云服務(wù)初創(chuàng)公司。
投資標的之一是“算力黃?!盋oreWeave。成立于2016年的CoreWeave,起初業(yè)務(wù)單一,就是用算力“挖礦”,其向英偉達采購了大量GPU組建礦機中心,并在幣圈低潮期逆周期囤積了大量GPU,一路將自己買成了英偉達的“VIP”,享有英偉達顯卡優(yōu)先配貨權(quán)。
2019年,CoreWeave將礦機中心改造為企業(yè)級數(shù)據(jù)中心,為企業(yè)級GPU加速工作負載提供AI云服務(wù)或者為計算密集型用例構(gòu)建云解決方案算力,比大型公有云快35倍,但價格便宜80%。
2023年,隨著ChatGPT爆火,英偉達顯卡市場緊俏,連馬斯克都在2023年4月成立X.AI公司,加入AI混戰(zhàn)。賣方市場下,誕生了GPU租賃服務(wù),英偉達GPU成為可抵押融資的“硬通貨”。
2023年8月,CoreWeave抵押其擁有的英偉達H100顯卡,從黑石等機構(gòu)獲得23億美元債務(wù)融資,公司估值達到80億美元。此前2023年4月,CoreWeave完成4.21億美元的B輪融資,投資者包括英偉達,彼時其估值僅20億美元。4個月時間,其估值放大了3倍,足見這個市場的熱度。
2023年6月末,黃仁勛宣布與云計算巨頭Snowflake合作,售賣英偉達的軟件和模型服務(wù)。2023年9月有媒體透露,英偉達正計劃向云服務(wù)商LambdaLabs投資3億美元,LambdaLabs最早業(yè)務(wù)是銷售GPU驅(qū)動的計算機,后轉(zhuǎn)型為GPU云服務(wù)器租賃,目前主要面向企業(yè)出租帶有英偉達芯片的服務(wù)器,從而與亞馬遜、微軟、谷歌等云服務(wù)商展開競爭。
從谷歌、微軟等科技公司的AI布局可以看到,云服務(wù)是AI業(yè)務(wù)落地的重要抓手和橋梁,英偉達在云服務(wù)上的研發(fā)、合作、投資將不會停止。
業(yè)績大好的英偉達,正在以投資的方式構(gòu)建以AI為核心的生態(tài)圈。
截至2023年7月31日,英偉達賬面趴著58億美元現(xiàn)金和現(xiàn)金等價物,較2022年末的34億美元增長了71%。足夠的錢,是英偉達對外投資的基礎(chǔ)。
不差錢的英偉達,2023年前9個月參與了至少20家AI初創(chuàng)公司的融資,堪比風(fēng)投機構(gòu)。要知道,全球最大的獨角獸投資者之一的老虎環(huán)球基金(TigerGlobalManagement)同期也僅投資了30家標的。
其中,AIGC是英偉達投資的主要賽道,2023年英偉達投資了8家相關(guān)公司(表5)。這8家公司已在AI領(lǐng)域做出領(lǐng)先產(chǎn)品,其中不乏InflectionAI和Imbue等英偉達的下游客戶。
數(shù)據(jù)來源:Wind,新財富整理
例如,在2023年6月30日完成13億美元融資的InflectionAI,投資者包括微軟、英偉達和三名個人投資者。融資完成后,其歷史總?cè)谫Y額達15.25億美元,成為融資金額僅次于OpenAI的AIGC初創(chuàng)公司。
該公司由谷歌AI實驗室DeepMind創(chuàng)始人之一的穆斯塔法·蘇萊曼(MustafaSuleyman)于2022年1月離開谷歌后創(chuàng)立,2023年5月即推出首款產(chǎn)品?名為Pi的AI個人助理,6月發(fā)布支持Pi的AI模型Inflection-1,被視為OpenAI勁敵之一。
穆斯塔法·蘇萊曼稱,英偉達和CoreWeave正在為公司部署數(shù)千個H100GPU,投入使用后Inflection的新集群將運行2.2萬個H100GPU,超過Meta公司的1.6萬個GPU集群。
另外,融資到I輪、估值超過430億美元的Databrick,2023年3月發(fā)布ToB端的語言大模型Dolly,4月發(fā)布Dolly2.0,可用于構(gòu)建商業(yè)應(yīng)用程序,有望在B2B生成式AI應(yīng)用爆發(fā)式增長時期占得先機。2023年6月,其以13億美元的對價收購了開源大模型公司MosaicML,該標的也是OpenAI的勁敵之一。強強聯(lián)合后,Databrick在AI領(lǐng)域的實力更強,IPO或?qū)⑻嵘先粘獭?/p>
AIGC之外,醫(yī)藥AI是英偉達聚焦投資的另一核心賽道。據(jù)bioSeedin不完全統(tǒng)計,2023年8月、9月及10月第一周,共有29家AI制藥企業(yè)完成新一輪融資,披露融資總金額超過16億美元,達到2021年醫(yī)藥公司融資巔峰期的1/3,其中6家公司獲得了英偉達的投資(表6)。
數(shù)據(jù)來源:Wind,新財富整理
例如,上市公司Recursion(RXRX.O)獲得英偉達5000萬美元投資后,宣布將利用英偉達的AIGC云服務(wù)來加速AI在生物和化學(xué)領(lǐng)域的基礎(chǔ)模型開發(fā),而Recursion也能通過自身龐大的數(shù)據(jù)來不斷訓(xùn)練英偉達的AI模型。IambicTherapeutics宣布將利用英偉達的DGXCloudAI超級計算平臺和BioNeMo云服務(wù),加速其藥物研發(fā)。
作為熟知AI技術(shù)路線的產(chǎn)業(yè)投資者,英偉達通過投資AI領(lǐng)域的初創(chuàng)企業(yè),并推動這些企業(yè)的發(fā)展,一方面有助于其緊跟前沿賽道的產(chǎn)品需求,不斷迭代技術(shù),保持競爭優(yōu)勢,另一方面,成為AI前沿賽道公司的股東后,這些獨角獸無論繼續(xù)融資還是上市,英偉達都將獲得不菲的投資收益。
Wind數(shù)據(jù)顯示,美股披露相關(guān)數(shù)據(jù)的88家半導(dǎo)體及半導(dǎo)體設(shè)備上市公司中,2023年10月20日的收盤價高于發(fā)行價的占比64%。由此可見,英偉達的投資從開端就大概率會實現(xiàn)雙贏。
除了投資AI下游應(yīng)用型企業(yè)外,英偉達同時向上參與光刻機制造。2023年,英偉達與臺積電、ASML、新思合作發(fā)布了計算光刻庫cuLitho。cuLitho可以通過部署有大量GPU的DGXAI計算系統(tǒng)對計算光刻(在芯片設(shè)計和制造領(lǐng)域的關(guān)鍵步驟,也是最大的計算負載之一)進行加速,使其達到基于CPU計算速度的幾十倍,同時降低計算過程的總能耗,有助于晶圓廠縮短原型周期時間、提高產(chǎn)量、減少碳排放,將長期影響產(chǎn)業(yè)發(fā)展并累積形成代際差。
以GPU為核心,英偉達向上下游延伸業(yè)務(wù),打造更龐大的AI生態(tài)圈,它也因此成為AI產(chǎn)業(yè)鏈上更重要的存在。
在算力領(lǐng)域全面出擊的英偉達,也不可避免被投資者投了看空票。多位投資人認為,受產(chǎn)能限制,英偉達的股價已提前兌現(xiàn)了未來的業(yè)績增長。
我們先看美股半導(dǎo)體行業(yè)的整體走勢。受益于OpenAI推出的ChatGPT大模型推動,2022年11月末至2023年7月末,費城半導(dǎo)體指數(shù)、標普500指數(shù)、納斯達克100指數(shù)均走出了氣勢如虹的上揚線,費城半導(dǎo)體指數(shù)更終結(jié)了此前9個月下跌40%的萎靡(2021年12月至2022年9月),但仍未回升到2021年12月的歷史高點(圖11)。
數(shù)據(jù)來源:Wind
芯片行業(yè)整體仍處在蕭條期。Wind數(shù)據(jù)顯示,截至2023年10月20日,已披露2023年二季度業(yè)績的美股93家半導(dǎo)體企業(yè)中,35家企業(yè)錄得虧損。其中,英特爾虧損12.77億美元,AMD虧損1.12億美元,美光、安霸虧損額均呈現(xiàn)逐季擴大趨勢(表7)。盈利的高通,凈利潤也同比下滑42.9%。
數(shù)據(jù)來源:Wind,新財富整理
除了虧損問題,存貨飆漲成為困擾美股半導(dǎo)體企業(yè)的另一個問題。2022年末,英特爾的存貨達到132億美元。2023年6月末,高通存貨達69億美元。二者的存貨均創(chuàng)歷史新高。
韓國也不例外,其最大的芯片企業(yè)三星電子存貨連續(xù)3年攀升,至2023年6月末,存貨達3050億元,創(chuàng)歷史新高。2023年二季度,韓國第二大芯片企業(yè)SK海力士因需求疲軟,虧損2.9萬億韓元,同比下跌169%。
同行可比公司普遍承受業(yè)績下行和庫存飆漲的雙重壓力下,英偉達股價也由高點回調(diào)。2023年8月31日至9月29日,其股價下跌12%,總市值蒸發(fā)約1500億美元。同期,費城半導(dǎo)體指數(shù)下跌6.5%,標普500指數(shù)下跌5%。
值得注意的是,這一波回調(diào),發(fā)生在英偉達發(fā)布最好二季度業(yè)績和250億美元的股票回購計劃之后。
據(jù)報道,2023年10月9日,韓國總統(tǒng)辦公室通報,美國同意三星電子和SK海力士向其位于中國的工廠提供設(shè)備,無需其他許可。這一變化或?qū)⑴まD(zhuǎn)兩家韓國企業(yè)的庫存和虧損問題。這無疑是對蕭條的芯片行業(yè)釋放的空前利好,英偉達股價此后連漲兩天。
但是,受拜登政府更新針對AI芯片的出口管制規(guī)定影響,費城半導(dǎo)體指數(shù)、標普500指數(shù)、納斯達克100指數(shù)一致下跌,英偉達市值4天內(nèi)蒸發(fā)1163億美元,股價下跌10%。
中國仍是芯片巨頭最大的單一市場。尤其是緊隨OpenAI,2023年中國科技公司興起“百模大戰(zhàn)”,更是釋放了對AI芯片的巨大需求。
中國AI頭號玩家百度,2023年初整合昆侖芯、太行DPU、飛槳深度學(xué)習(xí)框架、文心大模型、百度智能云等產(chǎn)品,構(gòu)建AI大底座。AI大底座將千卡并行加速比提升90%以上,訓(xùn)練場景資源利用率提升70%以上,模型開發(fā)迭代效率提升100%以上。目前,其萬卡訓(xùn)練集群的加速比達到95%,有效訓(xùn)練時間占比達到了96%,千帆平臺大模型調(diào)用量正以每周環(huán)比20%的增速攀升。
運營商方面,中國電信將采購I系列/G系列訓(xùn)練型服務(wù)器總計4175臺,InfiniBand交換機總計1182臺。中國移動在上半年業(yè)績會上表示,正在建設(shè)亞洲最大的智算中心。
這些“基礎(chǔ)設(shè)施”的建設(shè)中,算力儲備至關(guān)重要,而大模型訓(xùn)練需要大量的英偉達GPU。百川智能創(chuàng)始人、CEO王小川曾對媒體分析指出,在大模型中,GPU的算力成本大概占40%-70%,而其中網(wǎng)絡(luò)連接成本和GPU顯卡成本的比例大概為3:1。而從大模型訓(xùn)練、推理兩部分看,國產(chǎn)AI芯片在數(shù)據(jù)推理上可以爭取實現(xiàn)國產(chǎn)替代。目前,在模型訓(xùn)練方面,英偉達做得最好。英偉達GPU在AI訓(xùn)練領(lǐng)域的市場份額達到95%,且暫時沒有可替代產(chǎn)品或方案。
更重要的是,國內(nèi)GPU企業(yè)面臨生態(tài)遷移的難題,眾多基于CUDA的代碼和程序,轉(zhuǎn)型新生態(tài)需要大量的時間和重建成本,以及處理兼容性難題。
有私有云公司的CEO在接受媒體采訪時說,他們的公司也想過轉(zhuǎn)去買AMD的顯卡,但要把這些顯卡調(diào)試到正常運轉(zhuǎn)至少需要兩個月的時間。而為了縮短這兩個月,英偉達投入370億美元跑了30年。
因此,英偉達在AI算力的領(lǐng)先優(yōu)勢看起來仍將持續(xù)。而不斷增長的中國AI市場,或?qū)⒃俣瘸蔀槠錁I(yè)績增長的動能。
可怕的是,英偉達還在奮力奔跑。2023年5月,其宣布推出一款新型大內(nèi)存AI超級計算機,由NVIDIAGH200GraceHopper超級芯片和NVIDIANVLinkSwitchSystem驅(qū)動的NVIDIADGX超級計算機,旨在助力開發(fā)面向生成式AI語言應(yīng)用、推薦系統(tǒng)和數(shù)據(jù)分析工作負載的巨型、下一代模型。
TOB端的英偉達,與下游AI科技公司深度捆綁。未來,市場能否出現(xiàn)低成本的AI算力替換方案,或AI技術(shù)路線的顛覆性變革,挑戰(zhàn)其競爭優(yōu)勢,我們拭目以待。