朱秋雨
“這一輪AI浪潮,到底怎么掙錢?”
10月17日,在深圳舉辦的世界人工智能大會上,一名國內(nèi)頭部AI公司的負(fù)責(zé)人以此為標(biāo)題,開始了他的演講。
現(xiàn)場座無虛席。觀眾手機(jī)舉得很高,后排站了滿滿的兩排人。
毫無疑問,落地、掙錢是當(dāng)下AI從業(yè)者最關(guān)注的話題。年初人們對AI大模型的歡呼聲量變低,越來越多人開始發(fā)問:這一輪的生成式AI,與往常有什么不同?它能帶來新的價值嗎?
智譜AI的CEO張鵬,也在長期思考著這些問題:AI,目前為止普通人摸不著的技術(shù),如何才能正確判斷它的價值。他的公司由清華大學(xué)知識工程實(shí)驗(yàn)室(KEG)孵化,在2023年一舉成為中國AI明星企業(yè)之一。
這一年,智譜AI獲得了25億人民幣的投資。投資方集合一眾大廠:美團(tuán)、螞蟻、阿里、騰訊。
令互聯(lián)網(wǎng)大廠競相跟投的,不止是清華系的“背景”。
這家創(chuàng)業(yè)公司最特別的是,它擁有與國際頂級機(jī)構(gòu)不一樣的技術(shù)路徑,GLM(General Language Model),一個獨(dú)屬于中國的自研路徑。
回到2022年3月。一篇7位中國作者合寫的論文發(fā)布,轟動學(xué)界。
他們在文中大膽指出,目前所有的預(yù)訓(xùn)練模型框架中,都有各自的缺陷。比如,眾所周知的GPT,原理是根據(jù)前一個詞預(yù)測后面詞的出現(xiàn)概率,生成了答案。這是一個單向的過程,不利于機(jī)器理解語言。
而世界級大廠谷歌提出的Bert模型框架,是在一句話里挖空一個單詞,讓機(jī)器學(xué)會完形填空。它卻又不利于迅速生成答案。
“我們提出了一種通用語言模型(GLM)來應(yīng)對這一挑戰(zhàn)?!痹谡撐睦?,一個全新的大模型路徑被提出。緊接著,2022年8月,智譜AI對外發(fā)布,基于GLM的1300億參數(shù)開源大模型GLM-130B。這是當(dāng)年全亞洲唯一入選斯坦福評測的主流大模型。
一切就像命運(yùn)般“賭”對了。
三個月后,這個年輕的創(chuàng)業(yè)公司隨著ChatGPT的發(fā)布備受矚目。有人形容,這是最像OpenAI的中國公司,研究背景強(qiáng),同樣追求更遠(yuǎn)的事情—讓機(jī)器像人一樣思考。
面對火熱的關(guān)注,畢業(yè)于清華的張鵬卻很冷靜,習(xí)慣反思。他告訴南風(fēng)窗,早在2022年中旬,團(tuán)隊(duì)已經(jīng)預(yù)料到了這一輪技術(shù)帶來的爆發(fā)。但當(dāng)下的AI大模型雖然迭代迅速,仍舊面臨如何創(chuàng)造新價值的問題。
他預(yù)想了很多種情況的發(fā)生。如果有一天,AI的進(jìn)步真的讓技術(shù)持有者面臨奧本海默的抉擇,張鵬說,他會堅(jiān)持一個原則:Don t do evil。
“基于已有認(rèn)知情況,不要作惡。”
以下是南風(fēng)窗與張鵬的對話:
南風(fēng)窗:從2019年創(chuàng)業(yè)到現(xiàn)在,這幾年你自己有什么感受的變化?尤其是AI行業(yè)經(jīng)歷了幾年的“冷板凳”,今年大家的關(guān)注度突然間上升了那么多。
張鵬:我的感覺跟你的不太一樣?;厮菸覈斯ぶ悄墚a(chǎn)業(yè)更多在2012年隨著“AI四小龍”的興起開始進(jìn)入市場。只有十幾年發(fā)展時間,速度卻非??臁T谖已劾?,人工智能領(lǐng)域一直是快速上揚(yáng)的進(jìn)程。當(dāng)然,以前在學(xué)校,我看得更多是全球最頂尖的研究成果,感知上和國內(nèi)的市場可能是兩碼事。
所以,我沒覺得AI是一個“冷板凳”。但ChatGPT出現(xiàn)后,確實(shí)改變了一些事情,讓人工智能行業(yè)從過去單在技術(shù)上推進(jìn),到如今整個產(chǎn)業(yè)對AI的關(guān)注。這是兩條線。兩條線交匯到一起,形成現(xiàn)在這個局面。
南風(fēng)窗:上述我偏向投資的角度,今年對AI領(lǐng)域的投資確實(shí)更熱一點(diǎn)?;乜慈昵埃?020年6月11日,GPT-3發(fā)布,這是一個學(xué)術(shù)和產(chǎn)業(yè)界關(guān)注到的大事。這一天剛好是智譜AI成立一周年。“生日”碰上GPT-3的發(fā)布,有改變智譜AI的命運(yùn)軌跡嗎?
張鵬:我們2016、2017年開始研究AI產(chǎn)業(yè)時就一直在討論,到底應(yīng)該做什么事。上一代的AI技術(shù)(即行業(yè)大模型)不是我們想要的,因?yàn)轭A(yù)見得到技術(shù)天花板。果然,2018、2019年前后,AI企業(yè)紛紛到達(dá)發(fā)展的天花板,陷入瓶頸。
2019年時智譜成立。我們很明確的想法是,做下一代的人工智能。這就是清華大學(xué)人工智能研究院名譽(yù)院長張鈸院士所說的,要發(fā)展第三代人工智能—“認(rèn)知智能”。與張鈸院士聊時,我們想清楚一件事,AI未來的方向里一定要有兩條腿:一是數(shù)據(jù)驅(qū)動,另一個是知識驅(qū)動。從籌備創(chuàng)業(yè)一直到2020年,我們都在這個框架下用各種技術(shù),如信息學(xué)習(xí)、數(shù)據(jù)挖掘、訓(xùn)練模型,推動認(rèn)知智能的落地。
2020年,智譜成立一周年,正好碰上GPT-3的發(fā)布。那一天,我們請了張鈸院士等人座談,討論的便是:GPT-3為代表的大模型,是不是我們所追尋的認(rèn)知智能可能的解決方案。
我們接著做了一些小規(guī)模的實(shí)驗(yàn),取得了一點(diǎn)成果。但到2021年初,我們發(fā)現(xiàn),世界頂尖的水平領(lǐng)先我們挺多的。既然要去做下一代的技術(shù),不上不下還是不行,應(yīng)該瞄準(zhǔn)最先進(jìn)的技術(shù)去追趕;于是開始考慮,投入資源做一個世界頂級水平、類似GPT-3的千億級模型。
2022年8月,智譜AI對外發(fā)布,基于GLM的1300億參數(shù)開源大模型GLM-130B。這是當(dāng)年全亞洲唯一入選斯坦福評測的主流大模型。
那時候,公司內(nèi)部討論最多的問題便是,要不要投這么多錢,做一個無法保證成功的大模型。經(jīng)過對我們實(shí)力的評估,我們最終決定還是冒一點(diǎn)風(fēng)險。做出投入的最本質(zhì)原因,還是我們篤定AI大模型會是未來很重要的一件事。
當(dāng)時國內(nèi)這樣認(rèn)知的人非常少。別說創(chuàng)業(yè)公司了,大廠可能都很少。
南風(fēng)窗:你剛剛說,想對標(biāo)GPT-3。智譜AI最特別的一點(diǎn)就是GLM的路徑。當(dāng)時就確定,想走的路徑是區(qū)別于谷歌和OpenAI,基于中國人自研的GLM路徑嗎?
張鵬:對。我們投入大成本做千億模型的時候,在算法的研究層面已經(jīng)完成了。GLM的路徑在百億模型上驗(yàn)證成功了,區(qū)別是我們沒做千億參數(shù)模型的驗(yàn)證,并不確定基于GLM能不能讓我們超越GPT-3的水平。
南風(fēng)窗:如此看來,百億參數(shù)級的模型,對很多創(chuàng)業(yè)公司是可以接受的成本。但如果跨到千億級參數(shù),這就是一個飆升的難度,是決定一個公司的攸關(guān)時刻。
張鵬:對,一個是公司從經(jīng)營層面怎么來決策,是否要冒這個風(fēng)險。
另一個更大的層面,從百億到千億參數(shù)的研發(fā),難度不是簡單的乘10倍。很多技術(shù)上的風(fēng)險和問題,不是說有決心、有錢,敢冒風(fēng)險就能解決,這是大家比較害怕的事,也是到現(xiàn)在為止能跑出千億模型的機(jī)構(gòu)還非常少的原因之一。
南風(fēng)窗:GLM還有一個特點(diǎn),它比較節(jié)約算力,國產(chǎn)芯片也可以使用。這個特點(diǎn)怎么做到的?
張鵬:這就是所謂的“窮人的孩子早當(dāng)家”。2020年底、2021年初做大模型研發(fā)時,算力不夠,我們只能到處去借。借到的算力要一點(diǎn)一點(diǎn)地?fù)赋鰜?,分給研究和工程。
所以我們天然地對資源的浪費(fèi)挺關(guān)注。當(dāng)時的模型除了訓(xùn)練,還進(jìn)行算法優(yōu)化,做了很多提速量化壓縮的輔助性工作。這些工作的目的是為了降成本,讓大家更好地使用它。
而且我們必須篤信能這么做,否則,我們資源厚度不如國外的企業(yè),起步比人家晚。在又不如人家的前提下,如果不做出一些創(chuàng)新,怎么可能追得上?
不要把我們做的事情定義成中國版ChatGPT。我們眼里,ChatGPT只是一個階段性的成果。它不是我們的終極目標(biāo)。
南風(fēng)窗:背靠清華,智譜在中國的發(fā)展有一種“天之驕子”的感覺,這三年,智譜在發(fā)展的過程中有遇到灰暗的時刻嗎?
張鵬:我們沒有認(rèn)為自己是天才。剛創(chuàng)業(yè)出來跟投資人聊天,他們最大的一個質(zhì)疑就是:“你們一幫從學(xué)校出來的,整個創(chuàng)業(yè)院隊(duì)又不年輕,你們憑什么能成功?沒有一個人有市場和創(chuàng)業(yè)的經(jīng)驗(yàn),憑什么能成功?”一開始其實(shí)挺困難的,得面對這些問題。
南風(fēng)窗:所以與外界想象的不同,清華系在投資者面前沒有太多的加成
張鵬:“清華系”能起到錦上添花的作用。它不能是一個創(chuàng)業(yè)公司的全部,甚至都不能是你的最重要的三件事情之一。對于我們想做的事情而言,一開始資源方面確實(shí)緊缺。
南風(fēng)窗:上述來看,智譜AI的氣質(zhì)還是與OpenAI有些相似,創(chuàng)業(yè)公司,注重技術(shù)和研究,靠技術(shù)奪得頭籌。但你之前在受訪時強(qiáng)調(diào),智譜不是中國版OpenAI,你為什么會這樣說?
張鵬:這里我要糾正一下外界的解讀。從我的角度看,我們確實(shí)很多方向上的選擇和決策,都和OpenAI有點(diǎn)像。我之前說的是,不要盯著OpenAI實(shí)現(xiàn)階段性的目標(biāo)。也就是說,不要把我們做的事情定義成中國版ChatGPT。我們眼里,ChatGPT只是一個階段性的成果。它不是我們的終極目標(biāo)。
我們的終極目標(biāo)和OpenAI很接近,那就是實(shí)現(xiàn)通用人工智能。OpenAI畢竟還是比我們領(lǐng)先,所以在很多選擇上,我們第一步就是虛心學(xué)習(xí)。他們做了很多創(chuàng)新,如果我們覺得有道理的,就想辦法去做。
南風(fēng)窗:智譜與OpenAI有相似的目標(biāo),實(shí)現(xiàn)通用人工智能(AGI)。你的AGI定義是什么樣的?現(xiàn)在我們有了涌現(xiàn)很多智能的大語言模型,你覺得實(shí)現(xiàn)通用人工智能的下一個突破的點(diǎn)在哪里?
張鵬:通用人工智能,在不同的專家和學(xué)者眼里,有不同的解讀。很難說清楚AGI的具體定義是什么。但我相信一種更簡單的描繪:拿人做對比。像圖靈測試,通過行為學(xué)的定義,用對話的方式讓人分辨機(jī)器和人(如果人分辨不清哪個是機(jī)器哪個是人,說明機(jī)器通過了測試)。
目前的AI早就通過了“圖靈測試”,但還有很多問題,比如容易出現(xiàn)幻覺和有毒性的詞匯,邏輯能力也不足。這些還有賴于工程問題的解決。
目前的AI早就通過了“圖靈測試”,但還有很多問題,比如容易出現(xiàn)幻覺和有毒性的詞匯,邏輯能力也不足。這些還有賴于工程問題的解決。
今后我認(rèn)為還有幾個重要的方向:
一是多模態(tài)。人類的智能包含了很多能力,視覺、聽覺等。我們在嘗試這些能力跟大模型融合。這是未來很重要的方向。
第二,如同紅杉資本在《Generative AI s Act Two》的文章中所說的,生成式AI的故事進(jìn)入了第二幕。所謂的第二幕就是應(yīng)用?,F(xiàn)在,大模型的智能能力已經(jīng)初步具備了,具備基本的人際溝通能力了。但怎么把它用到實(shí)際當(dāng)中去,產(chǎn)生真正價值,怎么來做這個事情,還待解答。
第三,上述事情假如我們都能實(shí)現(xiàn)了,下一步我們該考慮,AI是否不僅達(dá)到人的水平,還能超過人。也就是Super Intelligence(超級人工智能)的出現(xiàn)。
南風(fēng)窗:剛剛我們一直在聊說落地和技術(shù),這是智譜的兩條腿。大模型在國內(nèi)掀起浪潮半年多了,想知道在未來,這兩條腿共同前進(jìn)的目標(biāo)是什么?
張鵬:有一個比較抽象的目標(biāo),那就是讓大模型的能力,真正創(chuàng)造出一些比較大價值的應(yīng)用。面向消費(fèi)者端,那便是創(chuàng)造一個Super App(超級應(yīng)用)。
在面向企業(yè)端,即在應(yīng)用場景給客戶帶來更大的價值。我們常提的叫“降本增效”,后面我還補(bǔ)了兩個詞,叫作“提質(zhì)”,提升質(zhì)量;還有,“創(chuàng)新”。
我最近和行業(yè)的人聊,有新的想法。大家都認(rèn)為,大模型好比一個威力巨大的錘子。有人曾經(jīng)以為說錘子可以把所有原來的釘子全部砸一遍。原來所有事情都可以拿AI重做一遍,對吧?但我更強(qiáng)調(diào),不要把已有的釘子全部砸一遍,最終收獲還是原來那么多的價值。
錘子除了能用來把原來釘子砸一遍以外,其實(shí)還有一個可能性:用來砸墻,砸天花板。砸出來的窟窿,你會看到更多的空間,更多的釘子。
南風(fēng)窗:要創(chuàng)造新的東西。
張鵬:對。要有新的東西,有新的空間產(chǎn)生。這才是我們看重這一波技術(shù)革新帶來的機(jī)會。
南風(fēng)窗:“新的東西”,有具體的想法嗎?
張鵬:這個階段有一些苗頭出現(xiàn)。但更多的還是需要整個生態(tài),合作伙伴們包括客戶們一起摸索,尋找新的可能。這也涉及認(rèn)知問題。大家的注意力不能在已知的這些釘子上,沒有人去想說有沒有可能有新的定位?;蛘呶覀冇袥]有可能把這堵墻拆了,讓現(xiàn)實(shí)世界變得更好,空間會變得更大。
南風(fēng)窗:像硅谷今年下半年,聊得最多的除了AIGC(AI生成內(nèi)容)以外,便是AI agent(AI智能體,讓AI模擬人類行為和決策過程)。你怎么看AI agent?這會是一個“砸墻”比較重要的方向嗎?
張鵬:智能體從技術(shù)角度來看肯定是很重要的領(lǐng)域。但是它還是技術(shù)層面的新東西,并不是我剛才說的,創(chuàng)造了一個新的市場,或者創(chuàng)造了一個新需求。這個技術(shù)能創(chuàng)造出什么東西來,還得再去琢磨。
南風(fēng)窗:智譜AI在2022年時已經(jīng)做好了千億大模型。2022年8月,智譜發(fā)布高精度雙語稠密千億大模型GLM-130B。緊接著,11月30日,ChatGPT發(fā)布,引起眾人對生成式AI的狂歡和追捧。ChatGPT發(fā)布后,有沒有意識到萬眾矚目的AI時刻就要發(fā)生了?
張鵬:2022年8月,智譜發(fā)布千億級大模型時,我們自己內(nèi)部就有一個預(yù)測,在半年最晚不超過一年的時間里,也就是在2022年底或者2023年初會爆發(fā)。
這就是一種技術(shù)的客觀規(guī)律。技術(shù)發(fā)展到了點(diǎn)上,所有的積累爆發(fā)出來的能量,會有持續(xù)爆發(fā)的過程。只要掌握到數(shù)據(jù)和這種客觀的因素,就可以預(yù)測未來一段時間的走勢。
南風(fēng)窗:你說的預(yù)測的“爆發(fā)”,是指像ChatGPT帶來的這樣,AI已經(jīng)可以影響到公眾層面對新技術(shù)的一個認(rèn)知上了嗎?
張鵬:對,不止停留在開發(fā)者手里,而是以實(shí)際的應(yīng)用走入公眾的視野。ChatGPT出來后,我開玩笑說,這還幫了我們一個忙。去年8月,我們把 GLM-130B發(fā)布出來,大概10月份開始做新一輪的融資。當(dāng)時跟很多投資人在聊,別人都會問,你這個東西看起來好像還不錯,但能做什么、怎么能掙錢?接著OpenAI的ChatGPT上線,幫我們回答了這些問題。
南風(fēng)窗:經(jīng)歷了這一年關(guān)注和教育,現(xiàn)在企業(yè)對大模型的認(rèn)知和年初的時候會不會有區(qū)別?
張鵬:應(yīng)該來說,我們越早接觸和達(dá)成合作的客戶,對于AI的認(rèn)知反而越長遠(yuǎn)。這一點(diǎn),可能互聯(lián)網(wǎng)廠商會更敏感。因?yàn)樗麄儽旧韮r值計(jì)算的邏輯就是往未來看,可以燒錢可以虧,但是絕對不允許錯過。
因?yàn)橐坏╁e過,可能錯過的就是一個時代,想要再進(jìn)去搶灘會很難。
南風(fēng)窗:回看一路,智譜采用的是中國自研技術(shù),一直對標(biāo)的也是OpenAI。在中美的AI大模型競爭中,到現(xiàn)在為止你覺得差距還有多少?
跟很多投資人在聊,別人都會問,你這個東西看起來好像還不錯,但能做什么、怎么能掙錢?接著OpenAI的ChatGPT上線,幫我們回答了這些問題。
張鵬:我們承認(rèn)跟世界頂級的水平還是有差距的,但我們有信心去追趕這個差距。
南風(fēng)窗:回到你個人層面上,這半年多,大家都會進(jìn)入技術(shù)的過度興奮和冷靜兩者交替的狀態(tài),你如何平衡外界的興奮和對事情可能走向的謹(jǐn)慎?
張鵬:如果用一個詞來形容,那就是篤信。信當(dāng)然就是相信這件事情,大模型一定是未來的大方向,能創(chuàng)造更大的價值。“篤”是一種態(tài)度,踏實(shí)、審慎。我們的相信要基于對這件事情的理解和鉆研,并不是狂熱、沒有根基的。
南風(fēng)窗:你是比較樂觀的人?
張鵬:在這個事上,我還是比較樂觀。
南風(fēng)窗:在人工智能行業(yè)這么多年,會有一個方針或者目標(biāo),給予你相信的力量嗎?
張鵬:我一直在想一件事,人工智能到底把它搬到現(xiàn)實(shí)社會當(dāng)中,會是一個什么樣的?最終的目的是什么?
答案也很簡單,讓社會或者里面的人更美好。比如大家的工作更輕松一些,有更多的閑余時間去享受生活,而不是一天天996。我想過很多的產(chǎn)品,像電影里體現(xiàn)的,人工智能的助手。這些能不能實(shí)現(xiàn)?我覺得應(yīng)該快了。
我用一個詞描述過這個夢想,叫人機(jī)共生。比如在現(xiàn)實(shí)世界,可能有聰明的機(jī)器人,甚至是類人機(jī)器人,這些智能的設(shè)備可以讓你的生活更方便美好。老人不再擔(dān)心說沒有人陪伴,獨(dú)生子女不擔(dān)心沒有人跟他/她作伴了。以后在現(xiàn)實(shí)世界外,還有虛擬世界的疊加,要是這樣,世界是不是會更好一些?
南風(fēng)窗:無意質(zhì)疑你。但技術(shù)本身還會帶來負(fù)面性。你會擔(dān)心自己能影響更多人的生活以后,就像奧本海默一樣,在一些關(guān)鍵的節(jié)點(diǎn),面臨著是讓技術(shù)發(fā)展,還是按下暫停鍵的抉擇。如果是這樣,你會繼續(xù)希望這個技術(shù)是往前迭代的嗎?
張鵬:這時候要盡量審慎。有一句話叫dont do evil,在你的認(rèn)知范圍之內(nèi),不要作惡。當(dāng)然有時候就像奧本海默一樣,他最初的目的也不是為了作惡。所以產(chǎn)生惡果有時候不一定由你控制。但要盡全力確保這個事情在人的意愿里。在做事情過程當(dāng)中,將一切后果考慮周全。