徐鑫
人工智能躥紅,讓曾經(jīng)的“游戲顯卡”公司英偉達(dá)兩年間市值超越了IBM和麥當(dāng)勞。
現(xiàn)在,這個(gè)當(dāng)紅AI芯片一哥的前景有了變數(shù)。
云計(jì)算從業(yè)者李杰在2017年圣誕節(jié)第二天收到了英偉達(dá)顯卡的一則消息,稱英偉達(dá)規(guī)定,游戲顯卡只能打游戲,不能放在數(shù)據(jù)中心跑深度學(xué)習(xí)。李杰難得爆了個(gè)粗口。“真是霸王條款??!我買了把刷子,你難道還要管我是刷鞋還是刷馬桶?”
這則消息迅速在國(guó)內(nèi)人工智能圈炸了?!坝绊懖恍?,因?yàn)椴簧偃擞糜ミ_(dá)游戲顯卡跑深度學(xué)習(xí)?!崩罱軐?duì)《財(cái)經(jīng)天下》周刊說。以后要做深度學(xué)習(xí),只能買英偉達(dá)的Tesla產(chǎn)品了,最高價(jià)格是普通顯卡的10多倍。
李杰身邊搞AI創(chuàng)業(yè)的人幾乎全在使用英偉達(dá)的GPU和平臺(tái)。有人對(duì)《財(cái)經(jīng)天下》周刊算過一筆帳,“一個(gè)小型AI創(chuàng)業(yè)團(tuán)隊(duì)在英偉達(dá)芯片上花費(fèi)幾十萬元是很正常的?!?/p>
這跟美國(guó)硅谷類似?!拔覀兺顿Y了一大串各個(gè)領(lǐng)域做深度學(xué)習(xí)的創(chuàng)業(yè)公司,每一個(gè)都跑在英偉達(dá)的平臺(tái)上?!惫韫让餍峭顿Y人Andreessen Horowitz說,“這就像上世紀(jì)90年代,人們都基于Windows創(chuàng)業(yè),或者在上個(gè)十年人們都在iPhone上創(chuàng)業(yè)一樣?!?/p>
為什么人們都用顯卡(GPU)做深度學(xué)習(xí)?因?yàn)樯疃葘W(xué)習(xí)對(duì)計(jì)算速度的要求是“暴力”的,英偉達(dá)GPU芯片可以讓大量處理器并行做運(yùn)算,這下它的速度比CPU快十倍甚至幾十倍,因而成為絕大部分人工智能研究者和開發(fā)者的必備“核彈”。有人戲稱英偉達(dá)創(chuàng)始人黃仁勛為“核武狂魔”。
受益于這波深度學(xué)習(xí)熱潮,英偉達(dá)股價(jià)從2015年7月的20美元一路飆升到如今的200美元上下,市值已超過IBM和麥當(dāng)勞,這大大出乎人們的意料。
有業(yè)者對(duì)《財(cái)經(jīng)天下》周刊預(yù)計(jì),英偉達(dá)數(shù)據(jù)中心業(yè)務(wù)2018財(cái)年(你沒看錯(cuò),英偉達(dá)財(cái)年比一般公司提早一年)的銷售額會(huì)達(dá)到20億美元,增長(zhǎng)率在100%以上。更讓人眼饞的是它的毛利率高達(dá)60%。
不過,在高增長(zhǎng)高股價(jià)下,英偉達(dá)這次的顯卡禁令也好像在告訴大家,它的業(yè)績(jī)?cè)鲩L(zhǎng)遇到了難題。
英偉達(dá)的瘋狂漲勢(shì),推醒了巨頭和創(chuàng)業(yè)者,AI芯片成了大家爭(zhēng)相搶奪的蛋糕。這種爭(zhēng)搶甚至讓它的客戶變成對(duì)手。
谷歌是英偉達(dá)GPU目前的最大客戶,據(jù)說占到英偉達(dá)1/3的市場(chǎng)。但現(xiàn)在,谷歌成為英偉達(dá)最大的潛在對(duì)手。
谷歌2016年對(duì)外開源了自己的深度學(xué)習(xí)框架TensorFlow。這個(gè)框架跑在芯片之上,就像一套積木,各個(gè)組件就是一個(gè)個(gè)模型或算法的一部分,用戶可以使用這些積木去搭自己的深度學(xué)習(xí)系統(tǒng),這降低了深度學(xué)習(xí)的門檻。
TensorFlow開源后大受歡迎,已占據(jù)人工智能框架的半壁江山。關(guān)鍵是谷歌還為TensorFlow設(shè)計(jì)了專用芯片TPU。2017年春天,谷歌發(fā)布TPU論文稱,“TPU處理速度比當(dāng)前GPU和CPU要快15到30倍。”
這下,英偉達(dá)急了。黃仁勛在博客上回應(yīng)谷歌的對(duì)比數(shù)據(jù),稱英偉達(dá)GPU相關(guān)芯片速度是TPU的2倍。但這似乎已經(jīng)不重要了。
“用戶要跑AI應(yīng)用,是跑在芯片上,還是跑在人工智能框架上?從谷歌的觀點(diǎn)來看,底層跑的是英偉達(dá)、英特爾還是TPU都沒關(guān)系,重要的是用戶跑在它的TensorFlow上?!币晃毁Y深業(yè)者對(duì)《財(cái)經(jīng)天下》周刊分析,“谷歌說,你不用關(guān)心我下面用的是什么芯片,谷歌就這樣把英偉達(dá)屏蔽掉了。這對(duì)英偉達(dá)來說是比較可怕的?!?img alt="" src="https://cimg.fx361.com/images/2018/02/09/cjtx201802cjtx20180222-1-l.jpg" style=""/>
雖然谷歌TPU芯片僅供自己使用,部署在谷歌云環(huán)境下,“但也不排除谷歌有一天把TensorFlow和TPU打包,賣給亞馬遜、阿里或者微軟。對(duì)于使用者來說,他們其實(shí)不關(guān)注深度學(xué)習(xí)跑在什么上面?!边@位資深業(yè)者進(jìn)一步說。
除了谷歌,芯片行業(yè)老大英特爾也醒悟了,在2015年結(jié)束了對(duì)AI市場(chǎng)的觀望。一位英特爾相關(guān)負(fù)責(zé)人對(duì)《財(cái)經(jīng)天下》周刊透露,正是由于人工智能技術(shù)在過去40年中起起伏伏,始終沒有突破性進(jìn)展,英特爾才疏忽大意了。確實(shí),2012年,當(dāng)深度學(xué)習(xí)技術(shù)悄然興起時(shí),英特爾還在與高通扳手腕——爭(zhēng)奪移動(dòng)芯片市場(chǎng)。
在發(fā)現(xiàn)AI市場(chǎng)躥紅后,如夢(mèng)方醒的英特爾啟動(dòng)了全方位的AI戰(zhàn)略。首先是設(shè)法讓自己的X86與英偉達(dá)跑得一樣快。這樣,英偉達(dá)不就沒戲了嗎?然后是并購專用芯片,這些芯片完全為深度學(xué)習(xí)而生,像神經(jīng)網(wǎng)絡(luò)處理器Nervana、計(jì)算機(jī)視覺Movidius、自動(dòng)駕駛技術(shù)方案Mobileye等。接下來,就是做生態(tài),這是英特爾最擅長(zhǎng)的事。
“我們?cè)趹?zhàn)略上的廣度和深度都超過我們的對(duì)手?!庇⑻貭柸斯ぶ悄墚a(chǎn)品事業(yè)部業(yè)務(wù)拓展總經(jīng)理Fiaz Mohamed對(duì)《財(cái)經(jīng)天下》周刊強(qiáng)調(diào)說。
為了狙擊英偉達(dá),英特爾甚至還聯(lián)合它的老冤家AMD,因?yàn)锳MD也生產(chǎn)GPU芯片。這是20世紀(jì)80年代以來英特爾與AMD的首次合作,AMD的GPU將裝入英特爾的系統(tǒng)芯片中,在2018年第一季度交付給客戶。
“實(shí)際上,英偉達(dá)是在英特爾X86生態(tài)沃土里,長(zhǎng)出的一顆奇葩,這完全超乎英特爾的想象?!辟Y深業(yè)者說。在過去20年中,整個(gè)IT基礎(chǔ)設(shè)施生態(tài)完全由英特爾架構(gòu)起來,它建立了成員的分工合作,離開英特爾,英偉達(dá)的GPU也玩不轉(zhuǎn)。英偉達(dá)得承認(rèn),英特爾是它現(xiàn)實(shí)中最大的對(duì)手。
新競(jìng)爭(zhēng)者還在源源不斷入場(chǎng)。深度學(xué)習(xí)分兩大場(chǎng)景,先是訓(xùn)練深度學(xué)習(xí)模型,后是部署到實(shí)際生產(chǎn)環(huán)境中,這叫AI的推理和識(shí)別(AI inference)。過去兩年,英偉達(dá)在訓(xùn)練市場(chǎng)占據(jù)了絕對(duì)份額,但隨著AI部署到實(shí)際生產(chǎn)環(huán)境中,另一件讓英偉達(dá)害怕的事情正在發(fā)生。在實(shí)際生產(chǎn)中,比拼的不僅是速度,還有性價(jià)比、性能功耗比和低延遲。
2014年,微軟在自己的云端加入了一張F(tuán)PGA卡進(jìn)行計(jì)算,在相同算力情況下,成本降低了一倍。FPGA是現(xiàn)場(chǎng)可編程門陣列芯片,此前多用于通信基站等產(chǎn)品。此后,亞馬遜AWS也把FPGA應(yīng)用到了自己的數(shù)據(jù)中心上。2016年,AWS首席布道者Jeff Barr在一個(gè)開發(fā)者預(yù)告中公布了AWS實(shí)例,稱在基因組排序、地震分析、金融風(fēng)險(xiǎn)分析等應(yīng)用,采用FPGA解決方案能帶來30倍的速度提升。endprint
“FPGA還能這么用。”FPGA第一大廠商賽靈思的數(shù)據(jù)中心專家王曉群博士對(duì)《財(cái)經(jīng)天下》周刊說。此后,中國(guó)的超大型云企業(yè)聞風(fēng)而動(dòng),騰訊云、阿里云、百度云、華為云相繼發(fā)布基于FPGA的加速云服務(wù)。除了云,在邊緣計(jì)算領(lǐng)域,F(xiàn)PGA也應(yīng)用于人工智能創(chuàng)業(yè)公司深鑒科技、曠視、瑞為等的機(jī)器學(xué)習(xí)場(chǎng)景中。
相對(duì)GPU,F(xiàn)PGA有低延時(shí)、低能耗和架構(gòu)靈活的特性,這讓企業(yè)在實(shí)際生產(chǎn)中考慮選擇它。比如,亞馬遜的智能語音助手Alexa與人對(duì)話,GPU的反應(yīng)速度是幾十毫秒,消耗75瓦到100瓦功耗,而FPGA的響應(yīng)時(shí)間是幾個(gè)毫秒,功耗為幾十瓦。“對(duì)指標(biāo)有硬性要求時(shí),你會(huì)選誰?”
在AWS數(shù)據(jù)中心里,白天FPGA上可以跑語音識(shí)別、圖片分類,晚上就能跑Netflix視頻文件轉(zhuǎn)碼?!癋PGA可以實(shí)現(xiàn)不同應(yīng)用的切換,提升數(shù)據(jù)中心的使用效率。”王曉群說。
在自動(dòng)駕駛領(lǐng)域,明星公司特斯拉從去年Model S開始一直內(nèi)置英偉達(dá)Drive PX 2自動(dòng)駕駛芯片,但在2017年11月的NIPS大會(huì),埃隆·馬斯克宣布,“特斯拉正在開發(fā)專門的人工智能硬件,而且將是全球最好的。”
一些創(chuàng)業(yè)公司也加入AI芯片的戰(zhàn)爭(zhēng)。DeepMind聯(lián)合創(chuàng)始人哈薩比斯投資的AI芯片公司Graphcore稱,自己的IPU芯片相比同類產(chǎn)品性能提升10~100倍,并且在訓(xùn)練和推理兩方面都同樣出色。
國(guó)內(nèi)深鑒科技、比特大陸也扎進(jìn)AI芯片市場(chǎng)。如做比特幣礦機(jī)起家的比特大陸,去年發(fā)布了與谷歌TPU對(duì)標(biāo)的專用芯片,適用于深度學(xué)習(xí)的訓(xùn)練和推理。
深鑒科技CEO姚頌認(rèn)為,單從成本來考量就能理解玩家為何前仆后繼奔赴AI芯片戰(zhàn)場(chǎng)?!癎PU行業(yè)的毛利率達(dá)到60%以上,這是非??植赖?。但服務(wù)器特別講究性價(jià)比,谷歌如果有1000萬臺(tái)服務(wù)器,一臺(tái)每年的運(yùn)行費(fèi)用是1萬美元,哪怕運(yùn)營(yíng)節(jié)省10%,100億美元就能省出來。他們因此特別愿意為之買單。”
巨頭和創(chuàng)業(yè)公司在輪番轟炸。不過,大家不得不承認(rèn),英偉達(dá)的地位目前仍難撼動(dòng)。
英特爾一位員工對(duì)《財(cái)經(jīng)天下》周刊說,8年前,英特爾曾想收購英偉達(dá),但就收購后英偉達(dá)創(chuàng)始人黃仁勛的任職上沒有達(dá)成一致意見而不了了之。“誰知道深度學(xué)習(xí)現(xiàn)在會(huì)這么火。早知道,把它收購了就好了?!?/p>
人們都認(rèn)為,做游戲顯卡起家的英偉達(dá),是被天上掉下來的深度學(xué)習(xí)大餡餅砸中了。不過,浪潮集團(tuán)AI與高性能產(chǎn)品總經(jīng)理劉軍認(rèn)為,這是英偉達(dá)在10年前布局生態(tài),遇到深度學(xué)習(xí)節(jié)點(diǎn)水到渠成的事。
AI芯片創(chuàng)業(yè)公司深鑒科技CEO姚頌聽過一個(gè)段子。2007年,英偉達(dá)CEO黃仁勛在華爾街看到一些做高頻交易和金融量化的人,在用英偉達(dá)GPU跑交易,但這些人覺得GPU編程太麻煩了。彼時(shí),英偉達(dá)的主業(yè)還在游戲市場(chǎng)。黃仁勛意識(shí)到市場(chǎng)對(duì)通用編程環(huán)境的需求,他行動(dòng)了。
在英偉達(dá)發(fā)布通用開發(fā)環(huán)境CUDA之前,GPU編程是個(gè)非常痛苦的事。程序員不得不編寫大量低級(jí)機(jī)器代碼。英偉達(dá)推出CUDA,GPU逐漸從游戲領(lǐng)域擴(kuò)展到了更為通用的計(jì)算場(chǎng)景。在國(guó)內(nèi),浪潮劉軍見證了這個(gè)過程,浪潮當(dāng)時(shí)有一個(gè)團(tuán)隊(duì)專門與英偉達(dá)一起將客戶的應(yīng)用遷移到GPU上。
一些石油、氣象和生命科學(xué)的客戶受益于GPU的計(jì)算力。劉軍記得,當(dāng)時(shí)中石油在海外找油用勘探軟件分析地塊數(shù)據(jù)時(shí)經(jīng)常犯難。要一兩周時(shí)間,沒有國(guó)內(nèi)那么大的機(jī)房,數(shù)據(jù)還傳不回來。
“我們和英偉達(dá)合作,將應(yīng)用遷移到GPU上。原來一兩百臺(tái)CPU服務(wù)器,后來用十幾臺(tái)GPU服務(wù)器就解決了。在委內(nèi)瑞拉賓館里租一個(gè)房間,就能放下全部機(jī)器了。”劉軍回憶說。
從無到有做GPU的生態(tài)很具挑戰(zhàn)性。懂GPU應(yīng)用開發(fā)的人不多,能源、生命等不同項(xiàng)目間的可復(fù)制性不強(qiáng),每個(gè)項(xiàng)目都要從頭開始。從2008年起,浪潮也開始做GPU開發(fā)培訓(xùn),近10年培訓(xùn)了幾千名工程師。
轉(zhuǎn)機(jī)發(fā)生在2012年,深度學(xué)習(xí)來了。在ImageNet大賽中,多倫多大學(xué)提交了一個(gè)名為AlexNet的深度卷積神經(jīng)網(wǎng)絡(luò)架構(gòu),使用了兩個(gè)GPU,實(shí)現(xiàn)了準(zhǔn)確率10.8%的大幅提升。這樣,到2013年,比賽上所有參賽者都采用深度學(xué)習(xí)算法,也都跑在英偉達(dá)的GPU和CUDA上。
深鑒科技CEO姚頌也是因?yàn)檫@次大賽了解到深度學(xué)習(xí)和GPU的優(yōu)勢(shì)的。“我們很快跟進(jìn)神經(jīng)網(wǎng)絡(luò)的硬件結(jié)構(gòu)設(shè)計(jì),當(dāng)時(shí)國(guó)內(nèi)只有我們和社科院計(jì)算所在做這個(gè)?!币灥纳铊b科技的芯片明年流片,切入安防的端智能市場(chǎng)。
“英偉達(dá)一直在做生態(tài)。當(dāng)開發(fā)者越來越大,軟件生態(tài)越來越成熟,硬件性能不斷迭代提升時(shí),就到了這么一個(gè)時(shí)間點(diǎn)——很多前沿做深度學(xué)習(xí)的人,就會(huì)發(fā)現(xiàn)這個(gè)生態(tài),會(huì)把實(shí)驗(yàn)、開發(fā)轉(zhuǎn)到GPU上。”劉軍補(bǔ)充說。
在原來的云計(jì)算環(huán)境下,計(jì)算的主力是英特爾CPU?,F(xiàn)在到了AI計(jì)算場(chǎng)景,計(jì)算主力變成了GPU和其他專用加速器。英偉達(dá)迎來了屬于它的時(shí)代。
劉軍回憶,百度、阿里、科大訊飛、奇虎、搜狗后來也把語音識(shí)別、網(wǎng)絡(luò)安全、搜索這些深度學(xué)習(xí)算法放到GPU上?!盎ヂ?lián)網(wǎng)客戶看到了GPU的潛力,再結(jié)合上深度學(xué)習(xí)算法,一下子就變成了一個(gè)特別大的機(jī)會(huì)?!崩顺币岔樌沓烧麻_啟了AI服務(wù)器市場(chǎng)。
英偉達(dá)用十年才建成了護(hù)城河,這是競(jìng)爭(zhēng)對(duì)手難以簡(jiǎn)單模仿和復(fù)制的東西,它靠的是時(shí)間。
從業(yè)者說,現(xiàn)在的英偉達(dá)有點(diǎn)像20年前的英特爾。
“那時(shí),在著名CEO安迪格魯夫的帶領(lǐng)下,英特爾創(chuàng)造出一個(gè)PC市場(chǎng),又進(jìn)軍服務(wù)器市場(chǎng),把原來IBM、惠普的小型機(jī)用X86系統(tǒng)替代掉。英特爾推動(dòng)的是整個(gè)技術(shù)架構(gòu)的進(jìn)步,包括生態(tài)的升級(jí)。”資深業(yè)者對(duì)《財(cái)經(jīng)天下》周刊說,“現(xiàn)在,英偉達(dá)正用GPU技術(shù),去升級(jí)AI時(shí)代?!?/p>
當(dāng)年,安迪格魯夫那句著名的話:只有偏執(zhí)狂才能生存。“15年來我說的差不多是同樣的事,所以幾乎不怎么改我的Slide?!秉S仁勛對(duì)《財(cái)富》透露。這位華人CEO個(gè)性鮮明,喜歡冒險(xiǎn),他的經(jīng)典裝扮黑色皮夾克在硅谷幾乎與喬布斯的牛仔T恤一樣有名?!八前驳稀じ耵敺蛩f的那種偏執(zhí)狂。精力旺盛,侵略性強(qiáng),非常有個(gè)性?!苯佑|過黃仁勛的人說。endprint
在抓到人工智能這個(gè)潛力市場(chǎng)后,黃仁勛變得更為激進(jìn)?!斑^去,整個(gè)行業(yè)都是依賴摩爾定律來推動(dòng),但它太老了,太慢了,GPU才是全新的‘超級(jí)摩爾定律,這也是整個(gè)行業(yè)一次千載難逢的機(jī)遇。”黃仁勛在2017年全球GTC大會(huì)北京站一字一頓地說。
不過,英特爾一位負(fù)責(zé)人對(duì)此不以為然?!拔覀儠?huì)用全方位戰(zhàn)略,我們有CPU、GPU、FPGA和各種專用芯片,我們有完整的體系?!彼麑?duì)《財(cái)經(jīng)天下》周刊分析,“你知道,當(dāng)年互聯(lián)網(wǎng)剛起來時(shí),SUN公司CEO也曾宣稱,SUN就是.com時(shí)代‘com之前的那個(gè)點(diǎn),哪一家都缺不了它。但是,后來英特爾把不可能的事情做成了?,F(xiàn)在在數(shù)據(jù)中心中,你再也看不到SUN了?!?/p>
在2017年年底舉辦的英特爾人工智能會(huì)議上,百度、海康威視、科大訊飛以及人工智能AI創(chuàng)業(yè)公司展示與英特爾的合作?!拔覀円恢庇糜⑻貭柡陀ミ_(dá)跑深度學(xué)習(xí)。英特爾管理團(tuán)隊(duì)與我們的老大更熟,技術(shù)員工給的支持更大。我們現(xiàn)在用英特爾平臺(tái)跑應(yīng)用?!币患褹I醫(yī)療創(chuàng)業(yè)公司對(duì)《財(cái)經(jīng)天下》周刊說。雙方的商戰(zhàn)很激烈,另一家創(chuàng)業(yè)公司產(chǎn)品手冊(cè)上因有英偉達(dá)幾個(gè)字,而不能在這次會(huì)議上露臉。
FPGA對(duì)市場(chǎng)的爭(zhēng)奪剛剛開始,它要像10年前的英偉達(dá),培養(yǎng)一個(gè)龐大生態(tài)?!拔磥碣愳`思會(huì)把80%的基礎(chǔ)開發(fā)做完,讓應(yīng)用開發(fā)者們專注于自己那部分定制開發(fā)的20%?!?/p>
從2017年開始,賽靈思打算每年召開一次開發(fā)者大會(huì),期望5年內(nèi)讓FPGA使用者從5萬人提升到25萬人。
一位不愿具名的AI芯片從業(yè)者認(rèn)為,過往股價(jià)漲幅已讓黃仁勛在業(yè)績(jī)表現(xiàn)上面臨極大壓力?!坝螒蚩ú荒苡糜跀?shù)據(jù)中心,但在挖礦上卻不限制,這條禁令就是壓力的表現(xiàn)?!鄙疃葘W(xué)習(xí)訓(xùn)練市場(chǎng)的需求并不會(huì)減弱,這是英偉達(dá)的優(yōu)勢(shì)領(lǐng)域,但在正在發(fā)展的推理領(lǐng)域,隨著人工智能普及,這個(gè)市場(chǎng)難以估量。
深鑒科技姚頌則不確定GPU在訓(xùn)練市場(chǎng)的增速。“前些年加速卡已經(jīng)賣得很多了,市場(chǎng)可能會(huì)增速減緩甚至保持平緩狀態(tài)?!?/p>
變數(shù)還存在于技術(shù)的突破性變革中?,F(xiàn)在不排除有某種革新式硬件出來,完全為深度學(xué)習(xí)而生。如果新硬件性能的提升超出英偉達(dá)很多時(shí),可能會(huì)引發(fā)整個(gè)生態(tài)系統(tǒng)的變遷。
“挑戰(zhàn)一定會(huì)存在,你看時(shí)代的變化發(fā)生得非常迅速。幾年前誰也沒料到深度學(xué)習(xí)會(huì)崛起。不能及時(shí)跟進(jìn)或提供最合適的技術(shù)選擇,很快就落伍。即便是深度學(xué)習(xí)的發(fā)展也不代表英偉達(dá)可以高枕無憂?!崩顺眲④姺治稣f。
“大家都不知道未來會(huì)發(fā)生什么,唯一能做的就是跑得更快,讓后面的人看不見你。”他說,“這是目前最安全的方法?!眅ndprint