供稿/NVIDIA
GTC CHINA 2016開啟人工智能黃金時代
供稿/NVIDIA
2016年9月13日,GTC CHINA 2016(GPU技術(shù)大會)在北京召開,NVIDIA聯(lián)合創(chuàng)始人、總裁兼首席執(zhí)行官黃仁勛出席大會,深度闡釋了GPU計算產(chǎn)品與解決方案平臺將如何拓展人工智能發(fā)展的想象空間,加速人工智能改變未來的進程。同時,NVIDIA全球首發(fā)了兩款深度學(xué)習(xí)和自動駕駛最新產(chǎn)品,宣布了與京東等領(lǐng)先企業(yè)的合作項目。
GTC由全球視覺計算技術(shù)的行業(yè)領(lǐng)袖及GPU的發(fā)明者NVIDIA公司主辦,每一屆GTC都匯集了數(shù)千名致力于通過GPU來解決重大計算難題的科學(xué)家、工程師、研究員、開發(fā)者乃至整個生態(tài)系統(tǒng)的企業(yè)代表的參加。在過去兩年,參會人數(shù)增長了4倍,而NVIDIA開發(fā)者增長了3倍達到400,000人。作為深度學(xué)習(xí)開發(fā)標準,使用NVIDIA GPU的人工智能開發(fā)者增長了25倍。本次GTC CHINA 2016吸引了國內(nèi)外近3000名行業(yè)精英參加,共同探討GPU在人工智能、深度學(xué)習(xí)、大數(shù)據(jù)、高性能計算,虛擬現(xiàn)實以及自動駕駛等前沿技術(shù)領(lǐng)域的應(yīng)用和前景。
黃仁勛表示:“有史以來,計算機和軟件在視覺和聽覺這兩種人類最基本的感官上,第一次達到了超越人類的水平。將GPU應(yīng)用于深度學(xué)習(xí)至關(guān)重要,如今我們有了突破性的科技能在未來數(shù)年中用于加速人工智能的發(fā)展。人工智能計算將解決許多其他軟件無法解決的問題,引領(lǐng)交通、醫(yī)療和社會生活中各個方面的人工智能革命?!?/p>
數(shù)據(jù)顯示,到2025年,人工智能市場將達到360億美元的規(guī)模,人工智能將成為IT領(lǐng)域中發(fā)展最快的部分,或?qū)⒁I(lǐng)繼蒸汽機、電力和計算機之后的第四次工業(yè)革命。人工智能是GPU計算的終極挑戰(zhàn)。來自谷歌的Jeff Dean說,深度學(xué)習(xí)將通過“更多數(shù)據(jù)、更大的模型、更多的計算”來優(yōu)化;微軟的ResNet增加了網(wǎng)絡(luò)的復(fù)雜性,它比AlexNet模型復(fù)雜16倍;百度的DeepSpeech,在一年中增漲了4倍模型尺寸、2倍數(shù)據(jù),以及10倍的計算能力。
深度學(xué)習(xí)作為全新的計算模型,正在改變計算的方方面面,不僅改變了軟件開發(fā)的方式、開發(fā)地點和運行方法,還在改變著服務(wù)器架構(gòu)、數(shù)據(jù)中心和智能設(shè)備。在深度學(xué)習(xí)的訓(xùn)練方面,網(wǎng)絡(luò)的設(shè)計和訓(xùn)練都需要數(shù)萬億次的運作,而GPU使其切實可行,可訓(xùn)練更有深度更準確的模型,加速產(chǎn)品上市時間。在數(shù)據(jù)中心推理方面,對于云服務(wù)來說,網(wǎng)絡(luò)將運行在數(shù)據(jù)中心里,每天經(jīng)歷數(shù)以萬計的圖片、聲音和視頻的查詢,而GPU推理可快速回應(yīng),實現(xiàn)數(shù)據(jù)中心吞吐量最大化。在設(shè)備推理上,即使面對數(shù)十億智能設(shè)備的運行規(guī)模,GPU也能做出實時精確響應(yīng)。
深度學(xué)習(xí)最苛刻的部分是訓(xùn)練,而NVIDIA專為深度學(xué)習(xí)設(shè)計的PASCAL架構(gòu),助推深度學(xué)習(xí)加速高達65倍,并且能夠支持每個主要的深度學(xué)習(xí)框架。在此架構(gòu)基礎(chǔ)上,NVIDIA創(chuàng)造了專為GPU深度學(xué)習(xí)所設(shè)計的超級計算機DGX1。
在本次大會上,NVIDIA全球首次發(fā)布了最新深度學(xué)習(xí)推理加速器Tesla P4/P40和自動駕駛汽車專用人工智能超級計算機DRIVEPX 2。
Tesla P4和P40是專門為深度學(xué)習(xí)推理設(shè)計的加速器,可以使用經(jīng)過訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)來識別語音、圖像或文字,以響應(yīng)用戶和設(shè)備的查詢。其中,P40專為最大吞吐量而設(shè)計,并能將CPU推理加速40倍;為加速1U OCP服務(wù)器而設(shè)計的P4,功率僅為50瓦。鑒于一個現(xiàn)代化的網(wǎng)絡(luò)可能有上百層和數(shù)以萬計的參數(shù),網(wǎng)絡(luò)的復(fù)雜性增加了多樣性和準確性,但也降低了推理性能,因此NVIDIA發(fā)布性能優(yōu)化推理的引擎TensorRT,不僅將復(fù)雜性減少2倍甚至更多,而且不通過融合操作,移除低貢獻的權(quán)重,降低FP16或INT8精度,以及許多其他影響性能的技術(shù)。未來,在今年美國GTC上發(fā)布的超大規(guī)模數(shù)據(jù)中心加速器Tesla P100將與全新Tesla P4/P40在深度學(xué)習(xí)的訓(xùn)練和推理兩端,為數(shù)據(jù)中心帶來端到端的深度學(xué)習(xí)平臺。此外,本次大會上,IBM還發(fā)布了配置有Tesla P100和NVLINK高速互聯(lián)技術(shù)的全新POWER8服務(wù)器,將為人工智能企業(yè)提供領(lǐng)先高效的計算能力。
同場發(fā)布的還有針對汽車自動巡航功能的人工智能計算機DRIVE PX 2,這款只有手掌大小的超級計算機采用新型單處理器配置,功率僅為10瓦,可以利用深度神經(jīng)網(wǎng)絡(luò)處理來自多個攝像頭和傳感器的數(shù)據(jù),通過實時了解周邊環(huán)境、在高清地圖上精確定位,以及規(guī)劃安全行車路線,實現(xiàn)安全的自動巡航。DRIVE PX 2將幫助汽車制造商為自動化無人駕駛汽車的駕駛和制圖功能提供支持,更快更順利的把研發(fā)成果應(yīng)用于實際產(chǎn)品中。
至此,NVIDIA在人工智能和自動駕駛領(lǐng)域,形成了以Tesla P100和DGX-1為核心的訓(xùn)練體系,以P4/P40和Tensor-RT為核心的數(shù)據(jù)中心推理體系,以及以Jetson TX1與Jetpack 2.3、DRIVE PX 2與Driveworks為核心的智能設(shè)備體系。NVIDIA在上述領(lǐng)域從硬軟件到解決方案上都進行了全面布局,構(gòu)建了端到端的深度學(xué)習(xí)平臺。
在深度學(xué)習(xí)與人工智能領(lǐng)域,NVIDIA與中國企業(yè)的合作由來已久,許多知名互聯(lián)網(wǎng)企業(yè)利用NVIDIA的GPU計算技術(shù)與解決方案,不斷推動自身人工智能戰(zhàn)略的全面發(fā)展。比如基于雙方合作,阿里巴巴的淘寶得以不斷加速優(yōu)化商品推薦,阿里云成功構(gòu)建中國首個基于GPU的云上高性能計算平臺;百度宣布啟動從云端到汽車的自動駕駛平臺開發(fā);科大訊飛進一步提升語音識別的速度和精準度。本次大會上,NVIDIA還與京東達成戰(zhàn)略合作并共建聯(lián)合實驗室,將在人工智能技術(shù)研發(fā)領(lǐng)域展開更深入的合作,從而助力京東在深度學(xué)習(xí)、VR/AR等人工智能戰(zhàn)略的推進。未來在中國,人工智能還將成為搜索、電商、物流和醫(yī)療等多個行業(yè)變革的核心動力。
在“大眾創(chuàng)業(yè)、萬眾創(chuàng)新”和中國制造2025的國家戰(zhàn)略指導(dǎo)下,巨大的用戶和數(shù)據(jù)基礎(chǔ),豐富的應(yīng)用場景,濃厚的技術(shù)創(chuàng)業(yè)氛圍和充滿創(chuàng)新能力的企業(yè),都推動中國走在了深度學(xué)習(xí)和人工智能領(lǐng)域發(fā)展的前列,而中國的初創(chuàng)企業(yè)也正在成為改變?nèi)蛉斯ぶ悄艿纳鷳B(tài)和行業(yè)的重要力量。蓬勃發(fā)展的技術(shù)性初創(chuàng)企業(yè),通過利用GPU在性能上的突出優(yōu)勢,應(yīng)用NVIDIA的端到端深度學(xué)習(xí)平臺,正在AR/VR、無人機、機器人、圖像識別、人臉識別、醫(yī)療成像和天氣預(yù)測等多個領(lǐng)域,搶占技術(shù)創(chuàng)新和應(yīng)用市場的先機,顛覆行業(yè)傳統(tǒng)。
伴隨著深度學(xué)習(xí)、人工智能技術(shù)的高速發(fā)展,這些技術(shù)將可預(yù)見的被應(yīng)用到更多與人類生活和社會發(fā)展息息相關(guān)的各個領(lǐng)域。比如在自動駕駛領(lǐng)域,從高清地圖到車輛的實時感知,從精確定位到安全的自動駕駛,所有一切都建立在先進的人工智能算法和性能優(yōu)越的超級計算機上。NVIDIA擁有Tesla P系列加速器,以及全新DRIVE PX 2人工智能超級計算機,將在自動駕駛領(lǐng)域打造完善的技術(shù)生態(tài)體系。NVIDIA與百度深度合作引領(lǐng)自動駕駛汽車未來,自動駕駛的端到端架構(gòu)包含人工智能車載超級電腦、搭載操作系統(tǒng)的高性能傳感器、人工智能算法和云端高清地圖。不久前,李彥宏和黃仁勛先生在百度世界大會宣布的合作將共同開發(fā)出業(yè)界第一個端到端架構(gòu),由NVIDIA DRIVE PX 2驅(qū)動百度無人車,同時,開放平臺可整合到所有OEM廠商汽車中。
此外,利用智能視頻監(jiān)控系統(tǒng)打造“人工智能城市”也將是一場人工智能的革命?;诙说蕉说纳疃葘W(xué)習(xí)技術(shù),視頻監(jiān)控未來將從簡單的反饋,到實時響應(yīng),甚至實現(xiàn)預(yù)測響應(yīng),為城市和社會的安全,提供更加全面智能的保障。而NVIDIA的Tesla加速器、DGX-1超級計算機、Jetson TX1嵌入式系統(tǒng)和Jetpack 2.3嵌入式平臺軟件包,將深度加速相關(guān)深度學(xué)習(xí)的訓(xùn)練和推理的進程。本次大會上,NVIDIA宣布與??低?、大華和宇視科技3家中國智能視頻分析公司合作,利用通過網(wǎng)絡(luò)訓(xùn)練和IVA服務(wù)器的NVIDIA人工智能計算平臺構(gòu)建中國的“人工智能城市”。
眾多行業(yè)領(lǐng)導(dǎo)者與NVIDIA合力創(chuàng)建人工智能解決方案,未來,人工智能將應(yīng)用在各行各業(yè),帶來更智慧、更安全的城市,實現(xiàn)自動駕駛。人工智能將服務(wù)所有人,人工智能也不再是科幻,正是GPU深度學(xué)習(xí)突破性的計算模式推動著人工智能革命。作為人工智能計算的代表性企業(yè),NVIDIA致力于加速推進相關(guān)領(lǐng)域的發(fā)展,并將人工智能的魔力帶給世界。
2016年9月21日,在GTC CHINA 2016大會上,NVIDIA與IBM共同宣布:全新POWER8家族將通過NVLINK與NVIDIA Tesla P100實現(xiàn)強勢組合。NVIDIA黑科技加IBM服務(wù)器,能加速人工智能、深度學(xué)習(xí)和數(shù)據(jù)分析這類高度融合的工作,加速人工智能的企業(yè)化應(yīng)用。
近年來,數(shù)據(jù)中心的工作負載在不斷發(fā)生變化,加速數(shù)據(jù)中心的需求也在不斷增強。不久之前,這些系統(tǒng)主要用于處理存儲和提供網(wǎng)頁,而現(xiàn)在它們越來越多地負責(zé)人工智能領(lǐng)域的工作,比如理解語音、文字、圖片和視頻,或者分析大數(shù)據(jù)以提供決策反饋。消費者層面希望快速獲得問題的答案,企業(yè)則需要分析激增的數(shù)據(jù)來更好地滿足客戶需求。這些問題都將由數(shù)據(jù)中心提供解決方案。
作為服務(wù)器系統(tǒng)領(lǐng)域的領(lǐng)導(dǎo)者,IBM在幾年前便注意到了這種趨勢,并與NVIDIA合作,加快新數(shù)據(jù)中心工作負載的處理速度。經(jīng)過四年的研發(fā),備受關(guān)注的POWER8服務(wù)器聯(lián)合了NVIDIA的Tesla P100 GPU和NVLink互聯(lián)技術(shù),實現(xiàn)了更高的數(shù)據(jù)性能分析,提升了深度學(xué)習(xí)能力。
IBM Power System S822LC系 統(tǒng) 使 用 兩 個IBM POWER8 CPU和四個NVIDIA Tesla P100 GPU,并通過NVLink高速接口使其互聯(lián)互通。這是一款定制的GPU加速器服務(wù)器,其中NVLink接口集成在主板路由上,并且使用NVIDIA的TeslaP100 GPU。IBM和NVIDIA的技術(shù)融合,使數(shù)據(jù)流動速度比PCIe快了5倍。
據(jù)悉,IBM已經(jīng)收到多個客戶的訂單,其中包括一家大型跨國公司和美國能源部橡樹嶺國家實驗室(ORNL)、勞倫斯利福摩爾國家實驗室(LLNL)等研究機構(gòu)。ORNL和LLNL將把新系統(tǒng)用作開發(fā)平臺,以充分利用NVIDIA NVLink技術(shù)。這些系統(tǒng)將作為新一代超級計算機Summit和Sierra開發(fā)應(yīng)用的試驗臺,IBM公司預(yù)計將于2017年把Summit和Sierra分別交付給ORNL和LLNL。