不出意外的話,“深度求索”是國外媒體普遍熟悉的名字,在中國,它最被周知的名字是“DeepSeek”。
過去兩三年,人工智能領(lǐng)域群雄并起,但唯ChatGPT馬首是瞻。中國農(nóng)歷乙巳蛇年新年前后,1985年出生的深度求索創(chuàng)始人梁文鋒參加了總理座談會,關(guān)于他和“幻方量化”的新聞報道就開始像鞭炮一樣,條條炸響。響聲撼動了大洋對岸,美國新任總統(tǒng)特朗普讓美國人工智能企業(yè)好好反思;“人工智能兵工廠”英偉達創(chuàng)始人黃仁勛一邊贊嘆深度求索的成就,一邊強調(diào)高端顯卡仍然威力無窮,還一邊不得不面對自家股票急剎車。人工智能巨頭OpenAI創(chuàng)始人站出來談深度求索的“抄襲”問題,說它使用了ChatGPT的數(shù)據(jù)訓(xùn)練,卻同時耐人尋味地表示,對這個異軍突起的勁敵“不會采取法律訴訟行動”。
故事有點婉轉(zhuǎn),精彩部分如連綿的煙花般絢爛:深度求索實現(xiàn)了在中國境內(nèi)合理合法使用頂級人工智能的平權(quán)。春節(jié)長假中,一系列圍繞它的知識付費產(chǎn)品,使用教程,一批模仿并追趕它的同行,以及一波追著給它遞送“彈藥”的投資人,上演了一部部“人工智能版”的賀新年大劇。
這是深度求索送給中國創(chuàng)業(yè)者的新年禮物。
說深度求索是美國“送”給中國的禮物,也不為過。
ChatGPT自發(fā)布以來,芯片、人工智能技術(shù)等高科技行業(yè)或產(chǎn)業(yè),就被美國列為不對中國開放和貿(mào)易的領(lǐng)域。不僅禁止相關(guān)投資,更禁止相關(guān)芯片產(chǎn)品貿(mào)易、技術(shù)交流和產(chǎn)品的使用,建立了以美國及其核心盟友為中心的科技版的“小院高墻”。
中國是為數(shù)不多不能合理使用ChatGPT等有美國元素的人工智能產(chǎn)品的國家或地區(qū)之一。為此,他們從注冊、使用等方面設(shè)立了許多壁壘。
劉磊是中國人工智能創(chuàng)業(yè)者之一。ChatGPT還沒發(fā)布,他就以開發(fā)者的身份,目睹和體驗了這類通用人工智能給人類帶來的震撼。ChatGPT一上市,他就計劃組織團隊,打造自己的人工智能產(chǎn)品。
事情卻沒有像他預(yù)想得那么簡單。ChatGPT并不對中國內(nèi)地及中國香港地區(qū)開放使用。如果要繞開這一限制,首先要用網(wǎng)絡(luò)代理軟件更改網(wǎng)絡(luò)IP,然后用美國或者其他被許可國家或地區(qū)的手機注冊。同時,相關(guān)API和會員服務(wù),還必須使用美國或者其他被許可國家或地區(qū)的信用卡支付。
一切軟硬件準備好后,還要面臨網(wǎng)絡(luò)代理帶來的網(wǎng)速不穩(wěn)定,問答不流暢等問題。個人使用都成了問題,更不用說要對其進行二次開發(fā)。除非投入海量資金改善網(wǎng)絡(luò)、使用和服務(wù)環(huán)境。
以網(wǎng)絡(luò)代理為例,普通個人使用的網(wǎng)絡(luò)代理,價格多在每月十幾元到幾百元不等,每月從1G到十幾G流量不等。他們通過在國外建立服務(wù)器,以不合法的方式在中國提供網(wǎng)絡(luò)代理服務(wù)。如果要升格到企業(yè)級代理,費用和難度就會指數(shù)級上升。
不過,ChatGPT建立起來的所謂高墻,就在這些螞蟻搬家式的小生意中,變得千瘡百孔。
一邊是被高墻圍起來的一棵參天大樹,一邊是墻外草地、灌木、森林交錯的競爭生態(tài)。中國人工智能產(chǎn)業(yè)贏得了難得的喘息、修煉機會。Kimi、文心一言、豆包、通義千問、深度求索等,中國本土大語言模型紛紛涌現(xiàn),并在不同的訓(xùn)練和優(yōu)化路徑中,各自形成了自己的特色和優(yōu)勢。
從人類最初只使用弓箭、長矛等冷兵器,到學(xué)會馴服馬匹,再到大航海時代、電力革命、載人登月、互聯(lián)網(wǎng)發(fā)明,每一項偉大發(fā)明背后都有一系列圍繞發(fā)明的創(chuàng)新。LED替代鎢絲點燃燈泡,不銹鋼取代碳纖維放飛火箭,5G扯掉網(wǎng)線讓信號騰飛,把發(fā)明和創(chuàng)新交還市場,才會在市場中看到更多發(fā)明和創(chuàng)新。
圍追堵截中,中國的人工智能從造輪子加速到了造未來的階段。
農(nóng)歷除夕前一天(2025年1月27日),深度求索應(yīng)用同時登頂蘋果中國地區(qū)和美國地區(qū)應(yīng)用商店免費App下載排行榜,超過了ChatGPT。同日,英偉達股價歷史性重挫17%,市值蒸發(fā)近6 000億美元,寫下美國股市史上一家公司的最高單日跌幅紀錄,歐美科技股也連帶大跌。
至今,這股沖擊波仍在回蕩。人們原本以為,開發(fā)領(lǐng)先的人工智能需要使用大量昂貴的芯片,結(jié)果深度求索顛覆了這個預(yù)設(shè),無異于在人工智能領(lǐng)域為中國繞彎開出了一條新路。
梁文鋒曾說,他轉(zhuǎn)換跑道的決定完全出于對科學(xué)的好奇,而不是盈利。他說,即使問他,他也找不到創(chuàng)建深度求索的商業(yè)理由。因為從商業(yè)的角度,這不值得做,基礎(chǔ)科學(xué)研究的投資回報率很低。
就是這股“想做”的沖勁,今天的深度求索不僅能脫穎而出,而且還是中國唯一一家不依賴百度、阿里或字節(jié)等科技巨頭融資的領(lǐng)先人工智能公司之一。
其實深度求索放在全球都是非常另類的人工智能初創(chuàng)公司。梁文鋒2015年成立了一家對沖基金,成為首只募集資金超過1 000億元的量化對沖基金。深度求索只是這只基金深度學(xué)習(xí)研究的分支之一,名為Fire-Flyer。
多年來,F(xiàn)ire-Flyer一直被用來處理財務(wù)數(shù)據(jù)。與其他大廠動不動10萬、幾十萬最高端英偉達顯卡相比,只有區(qū)區(qū)10 000塊英偉達H100芯片,梁文鋒就在2023年憑借“想做”這股勁,成立了深度求索。
因此,深度求索必須想出更高效的方法訓(xùn)練它。他們使用了一系列工程技巧,比如優(yōu)化芯片之間的通信方案、減少字段節(jié)省內(nèi)存,以及創(chuàng)新地使用模型混合等。任何一個工程技巧都不是什么新方法,但結(jié)合在一起,卻產(chǎn)生了尖端模型。其R1模型在多項數(shù)學(xué)和推理基準測試中,擊敗了ChatGPT-o1。
全球最大的書籍和論文共享網(wǎng)站“安娜的檔案”發(fā)文稱,包括深度求索在內(nèi)30多家人工智能公司與它建立了合作,以“捐贈”或者資源交換的方式,將數(shù)據(jù)庫里數(shù)百萬的各種語言的圖書和論文分享給前者,供其訓(xùn)練。
盡管梁文鋒并沒有否認深度求索對ChatGPT的數(shù)據(jù)進行二次開發(fā),但從回答效果、對中文的理解程度、推理的邏輯和深度等方面對比,使用深度求索與ChatGPT的體感完全不同。
也正因為在能力、成本和開放性等多個指標上的出類拔萃,深度求索被稱為人工智能版的拼多多。再加上梁文鋒100多人的初創(chuàng)團隊,只招像羅福莉(雷軍想千萬年薪挖角)一樣的“天才”,終于讓深度求索有了彎道超越和四兩撥千斤的能力。
創(chuàng)新的大門肯定不會只開向一邊,未來也不是“一夫當關(guān),萬夫莫開”的劍門關(guān),創(chuàng)新和未來的樹一旦掐去頂端優(yōu)勢,就會分化出無數(shù)的枝條,那才是人類文明該有的樣子。
如果ChatGPT像一把匕首,將通用人工智能的未來割開了一個口子,那么深度求索就像一把斧頭,將口子撕扯得更大、更深,可以窺見更多可能性。
德意志銀行發(fā)布了一份報告,指出深度求索的崛起更像是人工智能的“斯普特尼克時刻”。斯普特尼克是蘇聯(lián)第一顆人造衛(wèi)星的名字。廣義上說,斯普特尼克時刻是指美蘇冷戰(zhàn)中,科技給兩國的政治走向帶來的重要轉(zhuǎn)折,讓美國意識到自己在科技領(lǐng)域,特別是在航空技術(shù)上可能已經(jīng)落后于蘇聯(lián)。
從某種意義上說,斯普特尼克時刻直接促成了一個以太空技術(shù)為核心的新的科技時代到來,人們由此進入太空時代。
深度求索的成功是否意味著中國人工智能進入斯普特尼克時刻,尚需觀察;但由此引發(fā)的斯普特尼克效應(yīng),卻明白無遺。
這意味著人工智能領(lǐng)域的競爭進入了新的階段,大國之間在技術(shù)博弈中更可能刺刀見紅。同時也意味著,人工智能領(lǐng)域的競爭結(jié)果可能對世界經(jīng)濟乃至政治格局產(chǎn)生深遠影響。由人工智能應(yīng)用開辟出來的醫(yī)療診斷、自動駕駛、智能制造、文案策劃、法務(wù)財稅等多個領(lǐng)域,都可能迎來顛覆性的變革。
宏觀是微觀的集合。張丹丹是北大國發(fā)院的資深教授之一,她長期關(guān)注勞動經(jīng)濟學(xué)。2022年11月,ChatGPT發(fā)布后,她和團隊從某頭部招聘平臺獲取了1 100種職業(yè)的上百萬份招聘啟事。拆解出了2萬多個崗位,衡量這些崗位被大語言模型影響的程度。
財務(wù)、審計、稅務(wù)、翻譯、銀行、銷售、軟件和互聯(lián)網(wǎng)開發(fā)……人工智能對腦力、規(guī)律、數(shù)據(jù)型的勞動替代度高,對藍領(lǐng)、體力勞動者的替代程度低。
比如一部蘋果手機的裝配,需要有3 000個工人,一只蘋果手表的生產(chǎn)則需要5 000個工人。在精細手表里擰螺絲,目前機器還做不到。按照當前的技術(shù)進步程度,電子產(chǎn)品的組裝仍然是高度勞動密集的,中國的大量制造業(yè)用工也集中在這個領(lǐng)域。
但這并不意味著隨著人工智能操作越來越精細化,這類工作最終不會被替代。
文字處理幾乎占據(jù)了目前人類高級工作的絕大部分,而在文本處理方面,人工智能就是一個天然可以提取、歸納文字,覆蓋了人類所有知識的巨型圖書館。
深度求索是送給中國創(chuàng)業(yè)者和普通用戶的新年禮物,一份盲盒,一個潘多拉,開出什么,生長出什么,不在于禮物本身。廣義上,它讓人工智能實現(xiàn)了全球平權(quán)。狹義上,它的使用提高了許多崗位和工作的下限,對有經(jīng)驗、有邏輯的老板凳們友好,對沒有建立自己的知識體系、目標和經(jīng)驗有限、習(xí)慣于按部就班的年輕人產(chǎn)生了極大的危機。
不過年輕人就應(yīng)該闖出新路。人類只能重新回到創(chuàng)造這條路上,將人工智能當作拐杖,拄著這根用人類智慧之光做成的拐杖,就是拄著人類的過去,去創(chuàng)造未來。