榮智慧
過去一個月,谷歌模型Gemini發(fā)布,超威芯片MI300X面世,OpenAI“換帥風波”后曝光NPU芯片,以及IBM領頭成立“AI”聯(lián)盟—說的都是一件事:科技公司極力避免一家獨大,無論在軟件上,還是在硬件上。
獨立研發(fā)模型和組團研發(fā)模型,對抗的是靠ChatGPT聲名鵲起、年化收入飆升4500%的OpenAI;更快、更大內(nèi)存和帶寬的芯片,針對的是全球第一家市值超萬億美元的芯片公司英偉達。
簡而言之,一年來久仰OpenAI和英偉達鼻息的大小巨頭,已經(jīng)火速“合縱連橫”:有單挑,也有群毆。
商場如戰(zhàn)場。一邊是科技公司“以十倍之地,百萬之眾,叩關而攻秦”,一邊是兩大贏家“因利乘便,宰割天下”。而戰(zhàn)場亦如商場,從來沒有“子孫萬世之業(yè)”。
細究下去,反而是OpenAI布局的NPU芯片,很值得研究。
OpenAI是當之無愧的新星。
2023年年底,CEO山姆·阿爾特曼被解雇、隨即恢復職位,幾乎成為全世界媒體頭條新聞。一年前,以GPT為基礎的聊天機器人ChatGPT發(fā)布,三個月之內(nèi)創(chuàng)下1億用戶、月訪問量18億次的歷史記錄。
2022年,該公司全年收入僅為2800萬美元。2023年,其年化收入達到13億美元,是2022年的45倍,平均每月收入超1億美元。
2023年4月,OpenAI完成103億美元的第五輪融資,估值達270億—290億美元。估值不那么高,主要是因為其“不營利”的初衷。
對比它的競爭對手,人工智能初創(chuàng)公司Anthropic,后者年化收入僅1億美元,約合每個月800萬美元,還不到OpenAI的1%,但它的估值也在200億—300億美元。
業(yè)內(nèi)其他公司漸顯頹勢。像AI語音識別初創(chuàng)公司Deepgram,已啟動年內(nèi)第二次裁員,規(guī)模達總?cè)藬?shù)的二成。另一家AI初創(chuàng)公司JasperAI宣布裁員并削減收入預期,連公司的聯(lián)合創(chuàng)始人、CEO和CTO也相繼離職。
急需靠Gemini翻身的谷歌,過去一年很不好過。根據(jù)財務報告,DeepMind的2022年凈利潤下降了超過40%,從2021年近1.26億美元降至2022年的近7490萬美元。
12月6日現(xiàn)身的Gemini,意為“雙子星”,旨在紀念2023年4月谷歌兩個人工智能團隊DeepMind與谷歌大腦合并。它被谷歌宣傳為“迄今為止最強大、最通用的模型”,“有30項指標都優(yōu)于GPT-4”,而且自詡“原生”多模態(tài),而不是GPT-4的“近似”多模態(tài)。
近似多模態(tài),指的是把文本、代碼、音頻、圖像、視頻等多個模態(tài)訓練為不同模型,再將模型混雜。Gemini的原生多模態(tài)則一開始就把不同類型的數(shù)據(jù)放在一起訓練,使用同一個模型完成不同模態(tài)的輸出。
孰優(yōu)孰劣,差距至少目前看起來不大。這就跟喝“果粒橙”類似—晃勻了與否,還是那么一瓶飲料。
OpenAI的GPT也好,Anthropic的Claude也好,DeepMind的Gemini也好—目前世界上最先進的多模態(tài)模型,背后都是大規(guī)模多任務語言理解模型,水平相差不大。原生還是近似,其“評判標準”并不透明。
Gemini剛剛遭群嘲:演示視頻經(jīng)“巧妙”剪輯而得出最佳效果,折線圖的縱軸被壓縮才顯示驚人攀升—總之不要以為科技公司就沒有營銷。
對于普通用戶而言,所有應用的區(qū)別更多是便利性、可得性、集成度和品牌認知度的差異。
而ChatGPT第一個引爆市場關注,率先塑造了業(yè)界的黃金標準,成為展示大型語言模型從研究項目到實用工具的樣板,給了競爭對手極大的心理壓力。
谷歌為Gemin大造聲勢,也是逼急了要一雪前恥:ChatGPT面世不久,谷歌趕緊把Bard也推了出去,結果在回答韋布空間望遠鏡時出現(xiàn)事實性錯誤,導致谷歌股價應聲下跌超7%,市值蒸發(fā)約1000億美元。
競品之間“單挑”此起彼伏,在所難免。
同時,“群毆”的聲量也上來了。
12月5日,IBM宣布與Meta、英特爾、超威、戴爾、康奈爾大學、達特茅斯大學、索尼等全球50多家創(chuàng)始成員,共同合作成立人工智能聯(lián)盟(AI Alliance),目標是打造一個開放的人工智能開發(fā)模式,構筑多樣化的人工智能生態(tài)系統(tǒng)。
說白了,相當于一起制作一個安卓系統(tǒng),減少對OpenAI的依賴。
人工智能聯(lián)盟主打人(錢)多力量大,創(chuàng)始會員將共同投資一年超800億美元來促成研發(fā),投入員工超100萬名。
“30歲”的英偉達,2023年成為全球第一家市值突破萬億美元的芯片公司、全球第一家由華人創(chuàng)立的萬億美元市值公司、第七家市值越過1萬億美元的美國公司。
其市值僅次于蘋果、微軟、Alphabet、亞馬遜,為美股第五大科技股,大致相當于1.8個臺積電、2.6個騰訊、3.3個貴州茅臺、4.9個阿里。
憑借ChatGPT引發(fā)大模型激烈競爭的東風,英偉達的GPU(圖形處理器)一路斷貨。2019年時,微軟就花費數(shù)億美元為OpenAI購買了上千塊A100芯片。2023年以來,每塊售價4萬美元的H100必須“先下手為強”:沙特阿拉伯、阿聯(lián)酋以及中國的科技巨頭騰訊、阿里巴巴,都是大客戶之一。
自2007年起,英偉達投入重金打造編程軟件CUDA,通過利用GPU的處理能力大幅提升計算性能。2012年,卷積神經(jīng)網(wǎng)絡開啟人工智能新浪潮,英偉達GeForce GTX 580芯片一舉成名。
如今,英偉達的GPU加上CUDA,基本上成為大模型訓練的默認選項,也幾乎壟斷整個大模型市場。英偉達現(xiàn)在已經(jīng)占據(jù)至少八成以上的人工智能GPU市場。
據(jù)最新財報,英偉達第三財季營收為181.20億美元,與上年同期59.31億美元相比增長206%,與上一財季的135.07億美元相比增長34%。
利潤方面,英偉達第三財季凈利潤為92.43億美元,與上年同期的6.80億美元相比增長1259%,與上一財季的61.88億美元相比增長49%。
正在和英偉達爭奪“最強GPU”的超威,第三季度收入58億美元,預計第四季度收入為61億美元。它的季度收入,還趕不上英偉達的季度凈利潤。
機會在于競爭,不在于“等靠要”。
英偉達上個月剛推出最新款GPU—H200。而超威于12月6日發(fā)布的MI300X處理器,晶體管數(shù)量高達1530億個,內(nèi)存是H100的2.4倍,帶寬是H100的1.6倍,部分紙面數(shù)據(jù)也優(yōu)于H200。超威的MI300X比H200多用了兩顆HBM(High Bandwidth Memory),它的上市將很快緩解英偉達GPU短缺帶來的行業(yè)焦慮。
谷歌發(fā)布Gemini的當天,還帶來了新款人工智能芯片TPUv5p。其性能指標只有英偉達三年前產(chǎn)品A100的六成,H100的一半。
谷歌的辦法是“人海戰(zhàn)術”,單塊不行,湊一起還可以一戰(zhàn)。大模型訓練參數(shù),使用的芯片量相當巨大。OpenAI在2022年訓練GPT-4,用了 2.5萬顆A100,耗時三個多月。谷歌從2015年起就自研芯片,兩年后TPU訓練集群問世,供內(nèi)部業(yè)務如YouTube、Gmail、Google Map、Android使用。
據(jù)說,一個TPUv4最多有4096塊芯片,而Gemini1.0使用了14個TPUv4集群,耗費的算力超過GPT-4。下一步,Gemini的升級版基于TPUv5集群,消耗算力大概是GPT-4的五倍。
權力之爭剛落下帷幕的OpenAI,被曝光布局NPU(Neural Process Unit)芯片。CEO山姆·阿爾特曼此前與公司RainAI簽訂了一份價值5100萬美元的意向書,承諾購買其芯片。
RainAI的創(chuàng)始人曾宣稱:“NPU芯片將定義新的AI芯片市場,并大幅顛覆現(xiàn)有市場?!?/p>
真的這么神奇?
山姆·阿爾特曼“徇私舞弊”就跟RainAI有關。阿爾特曼自己向RainAI投資過100萬美元,2019年又簽了5100萬美元的訂單,作為CEO,這種采購顯然不合規(guī),類似學校食堂是校長舅舅承包的。
拋開這點不說,RainAI是一家生產(chǎn)NPU芯片的初創(chuàng)公司,成立于2017年;2022年拿到Prosperity7領投的2500萬美元融資,總?cè)谫Y額約3300萬美元,夠公司運營到2025年初。Prosperity7屬于沙特阿美,股份被美國跨部門外國投資委員強迫出售,最后由Grep VC收購。
RainAI創(chuàng)始人宣傳其產(chǎn)品會比GPU強大一百倍,耗能減少一萬倍,既可以訓練AI模型,也可以運行大模型。其設計基于RISC-V開源架構。直到今天,產(chǎn)品還沒有面世。
阿爾特曼稱贊它的原型,認為“可以大大降低創(chuàng)建強大AI模型的成本,并希望有一天有助于實現(xiàn)真正的通用人工智能”。
NPU倒不是什么新東西,它通過神經(jīng)網(wǎng)絡突觸權重取值、拓撲結構等辦法處理任務。比起CPU擅長“發(fā)號施令”,GPU擅長圖像處理、并行計算,NPU主打存算一體,提高運行效率,從而處理人工智能任務。
它的指令集是特定的,只能滿足部分機器學習的需要,而不支持的指令或多個神經(jīng)網(wǎng)絡的組合計算,仍然需要回落至通用處理器計算。
最早出名的NPU,是IBM于2014年推出的TrueNorth:54億個硅晶體管,內(nèi)置4096個內(nèi)核,100萬個“神經(jīng)元”,2.56億個“突觸”,能力相當于一臺超級計算機,功耗只有65毫瓦。
開發(fā)NPU的公司不少。英特爾即將推出“Meteor Lake”處理器,其中采用了NPU。IBM也在構建一個NPU,投入數(shù)十億美元,計劃2023年底發(fā)布NPU。近年國內(nèi)外公司也量產(chǎn)了不少NPU。
山姆·阿爾特曼買NPU,重點不是什么“類腦”不“類腦”,而在于他非??春谩按嫠阋惑w”。
D-IMC(數(shù)字內(nèi)存計劃)、SRAM(靜態(tài)內(nèi)存)存算一體架構圖,以及業(yè)務團隊顧問、存內(nèi)處理專家Arijit Raychowdhury都赫然擺在RainAI的官網(wǎng)上。
存算一體方案,就是芯片的計算和存儲功能合在一起,不用分開部署在不同的節(jié)點或設備上。而CPU、GPU都依照馮諾依曼架構的存算分離方案,不可避免地會撞上“內(nèi)存墻”和“功耗墻”兩堵鐵壁。
存算一體方案分三種,近存計算,存內(nèi)處理和行內(nèi)計算。據(jù)目前的有限信息,RainAI關注存內(nèi)處理,本質(zhì)是利用不同存儲介質(zhì)的物理特性,對存儲電路重新設計,令其同時具備計算和存儲能力,消除存算界限,在存儲原位實現(xiàn)計算。
有意思的是,據(jù)悉山姆·阿爾特曼不僅投了存內(nèi)處理,也投了近存計算。結合OpenAI官網(wǎng)上有關“人工智能與計算”的研究文章,這位具有敏銳眼光的投資者,正在關注“存算一體”下不同方案定制芯片,及其能為大規(guī)模計算帶來的優(yōu)勢。
當下全球的存算一體玩家,主要分為兩大陣營:一類是國際巨頭,如英特爾、IBM、特斯拉、三星、阿里等。它們對存算技術布局較早,代表存儲器未來趨勢的磁性存儲器(MRAM)、憶阻器(RRAM)等產(chǎn)品也相繼在頭部代工廠傳出量產(chǎn)消息。
另一類是國內(nèi)外的初創(chuàng)企業(yè),比如Mythic、Tenstorrent、知存科技、后摩智能、千芯科技、億鑄科技、九天睿芯、蘋芯科技等。
據(jù)最新消息,清華大學團隊剛研制出全球首款全系統(tǒng)集成、支持高效片上學習(機器學習能在硬件端直接完成)的憶阻器存算一體芯片,相關研究成果已發(fā)表在《科學》(Science)上。
憶阻器是繼電阻、電容、電感之后的第四種電路基本元件。它可以在斷電之后,仍能“記憶”通過的電荷,因此被當做新型納米電子突觸器件。
相同任務下,該芯片實現(xiàn)片上學習的能耗僅為先進工藝下專用集成電路(ASIC)系統(tǒng)的1/35,同時有望實現(xiàn)75倍的能效提升。
總結一下,誰能“遙遙領先”總是備受熱議。其實科技公司的營銷手法也好,換帥“宮斗”也好,關鍵要去粗取精,看技術思路?!按嫠阋惑w”,值得繼續(xù)關注。