時代變了。前一個移動互聯(lián)網(wǎng)的時代,代表人物是喬布斯;后一個AI的時代,代表人物可能是山姆·奧特曼,也有可能是別人。
2023年,OpenAI以斷崖式領先的姿態(tài),睥睨所有它的同行。現(xiàn)在是2024年,情況已經(jīng)很不一樣。
先笑的人,不一定能笑到最后,在硅谷尤其如是。
半導體時代初啟時,“仙童八叛逆”取代了半導體之父肖克利,成為硅谷真正的話事人;計算機時代初啟時,“八叛逆”陸續(xù)出走,創(chuàng)立英特爾、微軟等一眾公司,摘光了仙童所有的“桃子”;互聯(lián)網(wǎng)時代初啟時,網(wǎng)景瀏覽器一家獨大,不過四五年光景,一鯨落而萬物生……
先驅成先烈的故事,誰能保證不在OpenAI身上重演呢?
山姆·奧特曼既有遠慮,也有近憂。
近憂者,OpenAI起個大早,很可能趕個晚集。文生視頻的AI產(chǎn)品Sora發(fā)布已近半年,海外的Runnway、Pika、HeyGen,國內的“可靈”等同類產(chǎn)品已經(jīng)應用得火熱,Sora仍然未見光明;同樣處境的還有GPT4o新的語音及多模態(tài)交互功能。有人嘲諷說,OpenAI從做AI的變成了賣期貨的。
遠慮者,OpenAI的周邊虎狼環(huán)伺。美國時間7月23日,Meta更新開源模型至Llama3.1,最大模型的參數(shù)達到405B。不久前Claude 3.5技術 “對齊”O(jiān)penAI,已經(jīng)分走不少用戶,如今走開源路線的Meta如同野蠻人,也已經(jīng)抵達了家門口。何況在大洋彼岸,中國一眾大模型也正虎視眈眈,積極出海,力圖“齊家治國平天下”。
說到底,AI的時代才剛剛拉開序幕,群雄逐鹿,成敗未定。
今年6月,OpenAI上演了一場小型“鯨落”:大量用戶被告知,OpenAI“將停止對某些未受支持的國家和地區(qū)提供API服務”,包含中國大陸和中國香港,業(yè)內著實震動了一番。
API是指應用程序編程接口(Application Programming Interface),由它定義不同軟件應用程序之間的通信方式和交互規(guī)則。一部分開發(fā)者使用OpenAI的API提供AI服務,也就是俗稱的“套殼”,一旦斷供則武藝盡失。
這場震動持續(xù)了不到半天。很快,國內一眾大模型公司大開方便之門,搶著“收留”這些開發(fā)者,智譜、百度文心、零一、Minimax等一擁而上,很快升級成為“一鍵搬家”式的服務。
智譜是最快作出反應的大模型廠商,一名智譜AI內部人員告訴南風窗,開發(fā)者將應用遷移到智譜大模型,過程很簡單,“如果僅僅是切換,僅需修改一個base_url,其他參數(shù)都不需要改變”。涉及提示詞等內容的適配,操作也不復雜。
技術方面,國內大模型絲毫不虛。國內目前一線水平的大模型能力已經(jīng)全面逼近OpenAI,甚至有些方面,比如很多中文任務能力已有超越。
以智譜AI的GLM-4大模型為例,評估結果顯示,GLM-4在MMLU、GSM8K、MATH、BBH、GPQA和HumanEval等多個通用指標上的表現(xiàn)與GPT-4非常接近,甚至在某些方面超過了GPT-4。
成本上,國內大模型價格遠低于OpenAI,“物美價優(yōu)”一向是制勝法寶。
OpenAI“斷供”行為的背后,無論它是作何考慮,最后一定會意識到“挑錯了對手”。中國不是它予取予奪的對象。事實上,中美兩國是全球唯二的大模型重量級玩家,各有優(yōu)勢。
2024全球數(shù)字經(jīng)濟大會上,中國信通院院長余曉暉發(fā)布的《全球數(shù)字經(jīng)濟白皮書(2024年)》顯示,截至2024年第一季度,全球AI企業(yè)近3萬家,美國占全球的34%,中國占全球的15%。
從全球范圍看,美國和中國發(fā)布的通用大模型總數(shù)占全球發(fā)布量的80%,兩國成為大模型技術領域的引領者。
AI企業(yè)數(shù)量,體現(xiàn)的是一國在AI領域的活躍度,而大模型的數(shù)量更加彰顯“硬實力”。眾所周知,訓練大模型是一件燒錢的活兒,但一切與AI有關的功能都建立在大模型的能力上。大模型考驗一國的經(jīng)濟實力、資本市場活力、技術水平,還有人才教育程度。當前,只有中美兩國可以一戰(zhàn)。
ChatGPT發(fā)布于2022年11月底,真正引起廣泛關注則是在2023年3月。當時,微軟宣布將為旗下辦公套件引入ChatGPT的AI功能,這是AI第一次被認可擁有可泛化的實際用途。
曾經(jīng)的AI當然也有用途,但它們是專用AI,一個模型只有一個用處—人臉識別的模型負責識別人臉,自動駕駛的模型負責開車。OpenAI的GPT系列模型,走向了通用人工智能(AGI),一舉聲名鵲起。
ChatGPT的成功一度引起“反思”:為什么中國沒有這樣的產(chǎn)品?及至國內大模型井噴而出,又有評論認為,其中技術水平的差距甚大。如今再看,并不屬實。OpenAI最初的光芒過于耀眼,連谷歌等也成為其“亂拳”下被打死的老師傅,這樣的評價并不公允。
簡單回顧AI的發(fā)展歷程,即可發(fā)現(xiàn),中國從未錯過關鍵時刻。
按AI的世界發(fā)展史,目前共有四個階段。第一階段是上世紀50年代,美國提出AI概念,研發(fā)多層感知機。中國并未參與這一階段,不過,多層感知機后被證實“毫無用處”,但它奠定了一些機器學習概念。
第二階段,上世紀80年代,“AI教父”之一辛頓等人提出“反向傳播”這一訓練機器的方法。中國也在這一時期介入AI,1986年,國務院通過《國家高技術研究發(fā)展計劃綱要》,這一系列計劃被稱為“863”計劃,其中,“863-306”代表智能計算機主題。
“863-306”是中國AI的搖籃,也是曙光、科大訊飛、中科星圖、寒武紀等一大批高技術公司的源頭。國內目前AI行業(yè)中的領軍人物也多與此計劃有關。
第三階段,上世紀90年代,“神經(jīng)網(wǎng)絡”大行其道。第四階段,就是從2010年至今的這一時期。大模型的概念,就來自第四階段。
細看第四階段。
首先是“AI教母”李飛飛,其和團隊制作了一個大規(guī)模的圖像數(shù)據(jù)集,取名ImageNet,其中包含了數(shù)百萬張有標記的高分辨率圖像,極大促進了CV(計算機視覺)發(fā)展。
2012年,AlexNet在當年的ImageNet大規(guī)模視覺識別挑戰(zhàn)賽(ILSVRC)中取得了顯著成績,大幅超越了傳統(tǒng)的機器學習方法。自此,卷積神經(jīng)網(wǎng)絡(CNN)成為主流架構。
這一時期,CV的高速發(fā)展孕育出中國的“AI四小龍”,商湯、曠視、依圖、云從。已故的前商湯科技董事長湯曉鷗,在2014年3月發(fā)布GaussianFace人臉識別算法,在LFW數(shù)據(jù)庫上準確率達98.52%,在全球首次突破人眼識別能力。
CV狂飆的同時,自然語言處理(NLP)乏善可陳,轉折點的推動者是谷歌。2016年,谷歌提出如今取代了CNN的新架構Transformer。在此基礎上,谷歌在2018年推出預訓練模型BERT。
不同于公眾,從2018年起,AI業(yè)內人士就意識到了“大事發(fā)生”。
接下來,交接棒到了OpenAI手里。在“老師傅”谷歌的框架和“預訓練”思路上,OpenAI開始它的暴力美學,并在2020年推出1750億參數(shù)的大模型GPT-3。
在OpenAI之前,沒有科研人員想過堆算力、堆參數(shù),也沒人想到“暴力”堆出的大模型會出現(xiàn)“涌現(xiàn)智能”,也就是模型的能力可泛化,從而脫離專用思路。
這一時期,“中國隊”沒有落下。從“大煉模型”到“煉大模型”,在五道口的智源研究院內,研究者的目光始終追隨。2021年3月,智源推出中國第一個系列大模型,因“五道口”的諧音,取名“悟道”。
GPT-3出現(xiàn)的2020年,即是AI業(yè)內研究轉向的分水嶺,也是OpenAI風格轉變的節(jié)點。自那以后,OpenAI收起了所有與訓練大模型有關的數(shù)據(jù)、技術文檔更新,每當發(fā)布新產(chǎn)品,都只有可憐的技術簡介與幾張PPT,逐漸成為被嘲諷的“CloseAI”。
后來的事大家都清楚了,OpenAI的確憋了個大招。
自2022年11月底發(fā)布ChatGPT,OpenAI將大模型或說AGI,從研究室?guī)У搅斯娝诘默F(xiàn)實生活,一時風光無限,將內功深厚的“老師傅”們統(tǒng)統(tǒng)打趴下。2023年的“百模大戰(zhàn)”,始終是在山姆·奧特曼活躍的陰影之下。
“老師傅”們自然不服輸,比OpenAI更新的勢力也在尋求出頭,AI生態(tài)仍在劇烈地洗牌。
海外市場,最引人注目的是OpenAI的“二叛逆”創(chuàng)辦的AI公司Anthropic。今年6月,Anthropic發(fā)布AI模型Claude 3.5 Sonnet,在多個關鍵指標上“反超”ChatGPT,新的交互方式“Artifacts”廣受好評,社媒X上的許多技術博主號召“逃離ChatGPT”。
谷歌動作頻頻,從Bard、Gemma到Gemini,一個個模型排隊上場,打不過就“換名”再來。不說反超了OpenAI,至少谷歌最重要的搜索市場,如今還是固若金湯。
Meta走的路子更野,其核心大模型Llama系列,盡數(shù)開源,如今已是全球開源類AI生態(tài)位中的第一名。新的Llama3.1(405B)更是在指標上對齊了GPT-4,憑借開源生態(tài),有望成為新王。
放眼國內,AI各個生態(tài)位中,選手摩肩接踵,品類齊備。以“出身”為別,可以分為三類:一類是AI初創(chuàng),有智譜、月之暗面、MiniMax、百川智能等;一類是大廠出身,如百度文心、阿里通義、騰訊混元、字節(jié)豆包等;一類是研究型機構的大模型產(chǎn)品,如智源等。
“血戰(zhàn)”在所難免,不必忙于封神。如前文所說,AI的時代才剛剛開啟。
故事仍要從OpenAI講起,如今,它的尷尬之處在于,“期貨”與“現(xiàn)貨”之間的落差太大。
OpenAI的“期貨”,如Sora,如GPT4o的新語音交互,在推出時總是刷屏網(wǎng)絡,讓人以為“未來已來”。Sora生成的電影質感小視頻仍歷歷在目,GPT4o的語音交互儼然《Her》中的阿曼達;可惜,仍停留在“發(fā)布會階段”。
比起科幻未來,OpenAI的“現(xiàn)貨”很骨感。7月18日,OpenAI終于推出的新東西是“GPT-4o mini”,一個入門級別的AI模型,號稱“功能最強、性價比最高的小參數(shù)模型”。
按慣例,OpenAI沒有公開新模型的參數(shù)量,不過,目前小模型參數(shù)大都在1.5B到13B。OpenAI強調它的“廉價”:每百萬個輸入Token為15美分(約合人民幣 1.09 元),每百萬個輸出Token為60美分(約合人民幣4.36元)。這一價格相較GPT-3.5 Turbo便宜超 60%。
是的,OpenAI也必須加入“價格戰(zhàn)”,加入當下最實際的端側模型賽道來了?!拔磥怼迸c“理想”,都得放放。
業(yè)內關注OpenAI出了什么問題,本質上,就是在關注AI大模型的發(fā)展會出現(xiàn)什么問題。
一般認為,驅動大模型發(fā)展的三要素,分別是算法(人才)、算力和數(shù)據(jù)。不過,三要素真正形成驅動力,還需滿足一個前提,即“Scaling Law”(縮放法則)依然有效。
“Scaling Law”是指,大模型的能力隨著參數(shù)的增加、訓練數(shù)據(jù)的增加而增加。這就是OpenAI的“暴力美學”,倡導大力出奇跡。
盡管OpenAI自GPT-3以后不再公開模型參數(shù)量,但業(yè)界普遍的推斷是,GPT-4的參數(shù)量有1.8萬億(1800B)。而人腦中有10萬億神經(jīng)元,這一跨界而來的數(shù)據(jù),給很多AI從業(yè)者以“Scaling Law”仍有突破空間的信心。
但現(xiàn)在,越來越多模型趕上GPT-4的水平,依然不見GPT-5的發(fā)布,是不是“Scaling Law”已經(jīng)遇到瓶頸?
另有觀點認為,OpenAI不推新品,并非Scaling Law失效,可能是因為收不回成本。昆侖萬維董事長兼CEO方漢在今年5月曾說:“根據(jù)我得到的消息,OpenAI已經(jīng)訓出來了(GPT-5),也不是能力不行,但是它現(xiàn)在沒有把握在工程上把這個東西效益最大化?!?/p>
換言之,當前AI仍沒有找到合適的場景變現(xiàn)。如Sora,可能技術已經(jīng)達標,但成本太高,不適合大范圍地推廣。
智能上限和應用場景,是當前大模型公司的兩個焦慮源泉。這一點上,中美公司殊途同歸。
智能上限的方面,“暴力美學”的上限仍未見頂,但與此同時,“知識密度”被看作未來大模型新的智力增長曲線。
該概念由智源出身、現(xiàn)面壁智能創(chuàng)始人劉知遠提出,由此出發(fā),其提出“AI時代的摩爾定律”為,平均每8個月,大模型的知識密度提升一倍。
該路徑下,擴大參數(shù)不再是唯一解,小模型也能有大能力。這正是主打性價比的GPT4o Mini提倡的,面壁為其的誕生發(fā)文稱,“歡迎一起Mini”。
在尋找AI落地場景方面,國內大模型公司明顯更具優(yōu)勢。
首先,國內大模型較早地、更專注于做垂直的基礎大模型。這似乎是從中國第一個大模型系列“悟道”而生的一種傳統(tǒng),“悟道1.0”包含“文源”“文瀾”“文匯”“文溯”四個模型,各有專攻。再到華為,今年6月發(fā)布的盤古大模型5.0,包含盤古自然語言大模型、多模態(tài)大模型、視覺大模型、預測大模型、科學計算大模型等。
其次,國內對新技術的接受度一向較高,“AI+”的風潮已吹向各行各業(yè),這在日常生活中就能感受到,無須列舉。
最后也最重要的是,中國本土強大且完備的制造業(yè)供應鏈,能夠提供給AI更多的空間。
以自動駕駛為例,中國市場的新能源汽車滲透率已接近過半,“下半場”的智能化已經(jīng)開打,以大模型為基礎的“端到端”新一代智駕技術,如今在中國已有多家公司研發(fā)并開始上車試驗。而在美國,僅有特斯拉一家。
依托制造業(yè),中國對新技術的吸收和開發(fā)速度極為靈敏。這是中國大模型公司相比美國同行的一大優(yōu)勢。AI時代的序幕拉開后,真正的決戰(zhàn)戰(zhàn)場必在于此。