每一屆英偉達(dá)GPU技術(shù)大會(huì)(GTC),黃仁勛都很少讓投資者和觀眾們失望,因?yàn)楫a(chǎn)品足夠硬核。
從數(shù)據(jù)中心DPU處理器、Jetson AI開發(fā)套件、邊緣計(jì)算EGX AI平臺(tái)到超級(jí)計(jì)算機(jī)等,圍繞AI主題,英偉達(dá)的護(hù)城河不僅越挖越深,且越挖越寬。
最讓業(yè)界關(guān)注的可能是英偉達(dá)與Arm的融合后會(huì)帶來什么?2020年9月中旬,英偉達(dá)官宣將以400億美元收購ARM讓芯片行業(yè)震動(dòng),英偉達(dá)是全球GPU和AI芯片領(lǐng)域的領(lǐng)頭羊,而ARM是全球最大的芯片IP供應(yīng)商,全球超過90%的手機(jī)和平板都采用ARM架構(gòu),收購帶來的技術(shù)整合將如何重構(gòu)計(jì)算市場(chǎng)?
英偉達(dá)正在加速擴(kuò)張其數(shù)據(jù)中心業(yè)務(wù)的雄心,新型處理器DPU將從CPU上卸下“關(guān)鍵”的網(wǎng)絡(luò)、存儲(chǔ)和安全工作負(fù)載,并啟用新的安全和管理程序功能,DPU亮相代表著英偉達(dá)朝著成為“數(shù)據(jù)中心規(guī)模公司”的目標(biāo)又邁出了一步,在其最新的財(cái)報(bào)中,數(shù)據(jù)中心的收入首次超過了游戲銷售。
黃仁勛表示:“數(shù)據(jù)中心已成為新型計(jì)算單元。在現(xiàn)代化、安全的加速數(shù)據(jù)中心中,DPU已成為其重要的組成部分。CPU、GPU和DPU的結(jié)合,可構(gòu)成完全可編程的AI計(jì)算單元,提供前所未有的安全性和算力?!?p>
英偉達(dá)推出了兩款DPU產(chǎn)品:BlueField-2 DPU與BlueField-2X DPU,BlueField-2 DPU現(xiàn)已開始提供樣品,并將于2021年正式上市。
BlueField-2 DPU集成了8顆64位Arm-cortex A72內(nèi)核,擁有2個(gè)超長(zhǎng)指令字(VLIW)加速引擎,以及兩個(gè)100Gb/s的網(wǎng)絡(luò)通道(Mellanox ConnectX 6 Dx NIC),在網(wǎng)絡(luò)性能和存儲(chǔ)性能上有大幅提升,并且提供了更多硬件安全功能,包括無代理微分段、高級(jí)惡意軟件檢測(cè)、深度包檢測(cè)和應(yīng)用程序識(shí)別,遠(yuǎn)遠(yuǎn)超過了純軟件解決方案。
據(jù)了解,DPU是一種新型芯片,將英偉達(dá)的芯片技術(shù)與該公司在2019年以75億美元收購Mellanox所獲得的網(wǎng)絡(luò),安全性和存儲(chǔ)技術(shù)相結(jié)合,CPU,GPU和DPU可以共同提供一個(gè)具有AI功能,可編程性和安全性的計(jì)算單元,單個(gè)BlueField-2 DPU可以提供高達(dá)125個(gè)CPU內(nèi)核相當(dāng)?shù)臄?shù)據(jù)中心服務(wù)。
“這使我們擁有了最好的同類服務(wù)器。它實(shí)際上是采用了所有這些軟件定義的基礎(chǔ)結(jié)構(gòu),并將其放置在同一服務(wù)器中的芯片上。我們相信,DPU將成為以后每臺(tái)服務(wù)器的核心,無論運(yùn)行的應(yīng)用程序負(fù)載如何?!秉S仁勛說道。
關(guān)于DPU的發(fā)展規(guī)劃,BlueField-2DPU現(xiàn)在每秒可以處理0.7萬億次操作(TOPs),而BlueField-2X及其AmpereGPU可以完成60 TOPS。英偉達(dá)估計(jì),到2022年,BlueField-3X將達(dá)到75 TOPS,到2023年,BlueField-4預(yù)計(jì)將達(dá)到400 TOPS,是BlueField-2的600倍。
配套的是,英偉達(dá)還推出了基于DPU的軟件生態(tài)架構(gòu)DOCA(Data-Center-Infrastructure-On-A-Chip Architecture)。DOCA架構(gòu)基于開放的API,可用于數(shù)據(jù)包處理的P4,用于網(wǎng)絡(luò)的DPDK,用于存儲(chǔ)的SPDK,CUDA和英偉達(dá)AI。DOCA可以與主要的OS和虛擬機(jī)管理程序無縫兼容、集成,而為DOCA編寫的程序可以在BlueField-2 DPU以及未來所有版本上運(yùn)行。
英偉達(dá)官方表示,DOCA就好比是服務(wù)器領(lǐng)域的CUDA(統(tǒng)一計(jì)算設(shè)備架構(gòu)),CUDA是英偉達(dá)在GPU以及AI領(lǐng)域大獲成功的關(guān)鍵,它包含了CUDA指令集架構(gòu)(ISA)以及GPU內(nèi)部的并行計(jì)算引擎,方便開發(fā)人員基于最新GPU架構(gòu)編寫程序,DOCA很大程度上是想復(fù)制這種成功經(jīng)驗(yàn),助力DPU的崛起。
英偉達(dá)表示,EGX Ai平臺(tái)已經(jīng)被科技公司廣泛采用,用于企業(yè)和邊緣數(shù)據(jù)中心,該平臺(tái)將成為加速數(shù)據(jù)中心的新組成部分。
2020 GTC期間,英偉達(dá)再次帶來兩款性能強(qiáng)大的EGx邊緣A呼臺(tái)產(chǎn)品:適用于較大型商業(yè)通用服務(wù)器上的EGX A100,和適用于微型邊緣服務(wù)器的微型EGXJetsonXavierNX。
EGX A100是首個(gè)基于NVIDIA Ampere架構(gòu)的邊緣AI產(chǎn)品,EGXletsonXavierNx則是全球體積最小、性能最強(qiáng)大的AI超級(jí)計(jì)算機(jī),適用于微型服務(wù)器和邊緣智能物聯(lián)網(wǎng)盒。借助于NVIDIA邊緣AI平臺(tái),醫(yī)院、商店、農(nóng)場(chǎng)和工廠可以實(shí)時(shí)處理和保護(hù)來自數(shù)萬億個(gè)邊緣傳感器的海量數(shù)據(jù)流,該平臺(tái)實(shí)現(xiàn)了服務(wù)器群的遠(yuǎn)程安全部署、管理和更新。
EGX A100聚合加速器和EGX JetsonXavier Nx微型邊緣服務(wù)器分別被設(shè)計(jì)用于滿足不同尺寸、成本和性能需求。例如搭載了EGX A100的服務(wù)器可以管理機(jī)場(chǎng)中的數(shù)百臺(tái)攝像頭,而EGX Jetson Xavier NX則可用于管理便利店中的少量攝像頭。而云原生技術(shù)支持能夠確保整個(gè)EGX產(chǎn)品家族都可以使用同一經(jīng)過優(yōu)化的AI軟件輕松構(gòu)建和部署AI應(yīng)用。
英偉達(dá)官方表示,未來的企業(yè)數(shù)據(jù)中心將不會(huì)在一個(gè)位置擁有10000臺(tái)服務(wù)器,而是會(huì)在10000個(gè)不同的位置(包括在辦公大樓、工廠、倉庫、基站、學(xué)校、商店和銀行中)擁有一臺(tái)或多臺(tái)服務(wù)器,這些邊緣數(shù)據(jù)中心將幫助支持物聯(lián)網(wǎng)(IoT)建設(shè)。
為了簡(jiǎn)化并確保在這些服務(wù)器上大規(guī)模部署AI應(yīng)用程序和模型的安全,英偉達(dá)還宣布了一項(xiàng)名為Nvidia Fleet Command的新服務(wù)早期訪問計(jì)劃,該混合云平臺(tái)將邊緣計(jì)算的安全性和實(shí)時(shí)處理功能與遠(yuǎn)程管理相結(jié)合,并簡(jiǎn)化了軟件即服務(wù)的工作。
為了讓新一代學(xué)生、教育工作者和愛好者能夠挖掘AI和機(jī)器人技術(shù)的潛力,英偉達(dá)發(fā)布了售價(jià)僅59美元的入門級(jí)AI開發(fā)者套件,進(jìn)一步擴(kuò)大了Jetson邊緣AI平臺(tái)的受眾范圍。
Jetson Nano 2GB開發(fā)者套件主要用于在機(jī)器人和智能物聯(lián)網(wǎng)等領(lǐng)域創(chuàng)建動(dòng)手項(xiàng)目以進(jìn)行AI教學(xué)。為支持這項(xiàng)工作,NVIDIA還宣布提供免費(fèi)在線培訓(xùn)和AI認(rèn)證計(jì)劃。Jetson社區(qū)目前已有成千上萬名開發(fā)者提供了大量開源項(xiàng)目、簡(jiǎn)略操作指南和視頻,兩者將形成互補(bǔ)。
Jetson Nano 2GB開發(fā)者套件由NVIDIAJetPack SDK提供支持,NVIDIA JetPackSDK隨附NVIDIA容器運(yùn)行時(shí)及完整的Linux軟件開發(fā)環(huán)境。
因此,開發(fā)者可以將他們的Jetson應(yīng)用程序及其所有依賴項(xiàng)打包到一個(gè)可以在任何部署環(huán)境下運(yùn)作的容器中。它還由NVIDIACUDA-X加速計(jì)算堆棧提供支持,該堆棧也被用于在自動(dòng)駕駛汽車、工業(yè)物聯(lián)網(wǎng)、醫(yī)療、智慧城市等領(lǐng)域創(chuàng)造突破性AI產(chǎn)品。
英偉達(dá)還宣布了兩款專業(yè)用途的圖形卡:RTX A6000和A40,均采用了最新的Ampere架構(gòu)。有趣的是,兩個(gè)型號(hào)都具有完全相同的GPU配置,即84個(gè)帶有GA102GPU的流式多處理器。
RTX A6000是工作站圖形卡,而A40是供服務(wù)器使用的,因此從技術(shù)上講A40可以視為Tesla T4的后繼產(chǎn)品。不同之處在于,A40將具有顯示輸出,而特斯拉服務(wù)器卡過去沒有提供。RTX A6000和A40配備了四路DisplayPort 1.4連接器。
兩款卡均具有48GB的GDDR6 non-x內(nèi)存,但是每種型號(hào)的規(guī)格都有所更改。A6000具有16 Gbps模塊,而A40則保持14.5Gbps。
全新NVIDIA RTX A6000和NVIDIAA40將幫助專業(yè)人士應(yīng)對(duì)這些挑戰(zhàn),并解決從臺(tái)式機(jī)到數(shù)據(jù)中心的企業(yè)工作負(fù)載問題。新一代GPU基于NVIDIA Ampere架構(gòu),采用了全新RT Core、Tensor Core和CUDA Core加速圖形、渲染、計(jì)算和AI,與上一代產(chǎn)品相比增速顯著。
官方表示,RTX A6000將于今年12月中旬上市,而A40將于明年年初上市,價(jià)格尚未透露。
英偉達(dá)還推出了一系列與醫(yī)療保健相關(guān)的計(jì)劃,旨在加快藥物發(fā)現(xiàn),預(yù)防醫(yī)學(xué)等方面的工作。
其一,宣布與葛蘭素史克(GSK)建立合作伙伴關(guān)系,以幫助開發(fā)用于疫苗和治療發(fā)現(xiàn)的AI驅(qū)動(dòng)的實(shí)驗(yàn)室。英偉達(dá)詳細(xì)介紹了與馬薩諸塞州布里格姆綜合醫(yī)院合作建立的AI模型,以預(yù)測(cè)具有COVID-19癥狀的急診室患者的氧氣需求;其二,英偉達(dá)透露,將為英國最快的超級(jí)計(jì)算機(jī)Cambridge-1貢獻(xiàn)硬件和專業(yè)知識(shí)。
英偉達(dá)預(yù)計(jì)將在2020年底之前將cambridge-1投入使用。cambridge-1是GSK、阿斯利康、蓋伊和圣托馬斯NHS基金會(huì)信托基金、倫敦國王學(xué)院和牛津納米孔學(xué)院的聯(lián)合項(xiàng)目,它建立在英偉達(dá)的DGxsuperPOD架構(gòu)上,預(yù)計(jì)將提供400petaflops的AI性能和8 petaflop s的Linpack性能,這將使它在全球功能最強(qiáng)的超級(jí)計(jì)算機(jī)TOP500列表中排名第29。
英偉達(dá)表示,Cambridge-1由80個(gè)NvidiaMellanox InfiniBand網(wǎng)絡(luò)連接的Nvidia DGXA100系統(tǒng)提供動(dòng)力,并將成為其第一臺(tái)設(shè)計(jì)用于外部研發(fā)訪問的超級(jí)計(jì)算機(jī),準(zhǔn)備就緒后,安裝和啟動(dòng)只需幾周的時(shí)間。
英偉達(dá)將向Cambridge-1計(jì)劃投入約4000萬英鎊資金,并提供Nvidia claraDiscovery之類的軟件,這是一套涵蓋成像、放射學(xué)和基因組學(xué)的機(jī)器學(xué)習(xí)醫(yī)療保健工具,Clara Discoverv具有經(jīng)過預(yù)先訓(xùn)練的AI模型和特定于應(yīng)用程序的框架,旨在幫助研究人員構(gòu)建藥物化合物,開發(fā)病原體反應(yīng)并應(yīng)對(duì)相關(guān)挑戰(zhàn)。
最后的最后,黃仁勛透露了將如何打好ARM這張牌:首先,英偉達(dá)將與Arm在GPU、網(wǎng)絡(luò)、存儲(chǔ)方面進(jìn)行合作;其次,英偉達(dá)還將與Arm合作為HPC、云、邊緣計(jì)算和PC創(chuàng)造平臺(tái),其中涉及芯片、系統(tǒng)和軟件;最后,英偉達(dá)將會(huì)把自身的AI能力和RTX引擎開放給Arm平臺(tái),現(xiàn)在這些功能都是X86平臺(tái)專屬的,Arm將會(huì)成為領(lǐng)先的加速和AI計(jì)算平臺(tái),幫助英偉達(dá)進(jìn)一步擴(kuò)大市場(chǎng)版圖。