在科技浪潮洶涌澎湃的當下,人工智能(AI)無疑是最耀眼的弄潮兒。2023年深秋,一個改變AI格局的時刻悄然降臨。杭州未來科技城的一棟寫字樓里,燈火通明,35歲的首席科學家李開夏已經(jīng)連續(xù)72小時未合眼。作為清華博士的他,眼神中滿是疲憊卻又透著執(zhí)著與期待,緊緊盯著屏幕上的測試結(jié)果。當“中文綜合理解力98.7%”的綠色字符醒目地躍入眼簾時,這個沉穩(wěn)內(nèi)斂的科研人再也抑制不住內(nèi)心的激動,突然放聲大笑,那笑聲打破了深夜的寧靜,驚飛了窗外梧桐樹上棲息的夜鳥。就在這一刻,中國首個超大規(guī)模智能體Deep? Seek(深度求索)正式誕生,它宛如一顆璀璨新星,照亮了中國AI前行的道路,也預示著全球AI領域即將迎來一場深刻變革。
在全球AI的競技場上,科技巨頭們?yōu)榱擞柧毲|參數(shù)模型不惜豪擲千金,展開了一場激烈的軍備競賽。他們不斷投入巨額資金,試圖在這場競賽中拔得頭籌。然而,Deep Seek團隊卻沒有隨波逐流,選擇了一條獨特的發(fā)展道路。他們另辟蹊徑,潛心鉆研,自主研發(fā)出“動態(tài)知識蒸餾”技術。這一技術堪稱革命性創(chuàng)新,它就像是給AI裝上了先進的自動駕駛系統(tǒng),讓模型在訓練過程中不再盲目摸索,而是能夠根據(jù)自身的學習情況自主選擇最優(yōu)化的學習路徑。
到了2024年3月,性能測試結(jié)果令人震驚。僅用了1/10訓練成本的DeepSeek-R1,在邏輯推理測試中取得了89.3分的優(yōu)異成績,成功超越了GPT-4的86.5分。這一成績的背后,是DeepSeek團隊無數(shù)個日夜的努力與智慧結(jié)晶。更值得一提的是,DeepSeek-R1的上下文理解窗口突破了百萬token(指文本或數(shù)據(jù)的一個單元,它是AI模型處理和理解信息的基礎)大關。這意味著什么呢?它相當于讓AI能夠一口氣讀完《戰(zhàn)爭與和平》這樣的鴻篇巨著,并且還能精準無誤地復述書中的每個細節(jié)。這種強大的能力,無疑為AI在自然語言處理等領域的應用打開了新的大門,也讓世界看到了中國AI的獨特優(yōu)勢與無限潛力。
DeepSeek在中國中文互聯(lián)網(wǎng)圈一經(jīng)亮相,便引發(fā)了一場巨大的海嘯。其強大的性能和獨特的技術優(yōu)勢,迅速吸引了無數(shù)目光。然而,它的影響力遠不止于此,太平洋彼岸的華爾街投資者們也因它經(jīng)歷了一場驚魂時刻。2024年4月12日,當DeepSeek團隊宣布開放API接口的瞬間,全球金融市場為之震動。納斯達克AI概念股集體跳水,曾經(jīng)在AI領域獨占鰲頭的某美國巨頭,單日市值蒸發(fā)高達120億美元。這一驚人的數(shù)字,直觀地展現(xiàn)了DeepSeek帶來的沖擊。
該美國巨頭的CTO(首席技術官)在社交平臺上無奈發(fā)文:“這就像自行車廠突然造出了超跑?!边@句感慨,道出了他們面對DeepSeek崛起時的震驚與無奈。更具戲劇性的是,硅谷某知名風投得知DeepSeek的消息后,連夜包機趕赴杭州,試圖與DeepSeek團隊展開合作。然而,他們在機場卻被中國投資人截胡。這一場景被網(wǎng)友戲稱為“AI界的敦刻爾克大撤退”,充滿了戲劇性與諷刺意味。它不僅體現(xiàn)了DeepSeek在全球AI領域的巨大吸引力,也從側(cè)面反映出中國AI產(chǎn)業(yè)在國際競爭中的地位迅速提升,已經(jīng)成為全球AI格局中不可忽視的重要力量。
在AI語言處理領域,語言的適應性一直是一個關鍵問題。ChatGPT雖然在全球范圍內(nèi)享有盛譽,但在中文場景中卻常常表現(xiàn)出“水土不服”。而DeepSeek則截然不同,它展現(xiàn)出了驚人的語言天賦,尤其是在對中文的理解和運用上,達到了一個新的高度。
在古文今譯測試中,DeepSeek將“落霞與孤鶩齊飛”翻譯成“晚霞追著孤鳥跑”。這一翻譯既巧妙地保留了原文的詩意,又以一種充滿童趣的方式呈現(xiàn),讓人眼前一亮。這背后的功臣,是DeepSeek團隊獨創(chuàng)的“文化基因嵌入”技術。通過這一技術,AI能夠深入理解中文背后豐富的文化內(nèi)涵。它不再僅僅將“紅酥手”看作是簡單的美食描述,而是能感受到其中蘊含的穿越千年的柔情與文化底蘊。
此外,DeepSeek在訓練成本上也展現(xiàn)出了巨大優(yōu)勢。打造同等智能水平的模型,Deep? Seek團隊僅消耗了相當于ChatGPT訓練所需能源的17%。這就好比用建造經(jīng)濟艙的預算,成功造出了航天飛機。這種高效低成本的研發(fā)模式,不僅體現(xiàn)了DeepSeek團隊的技術實力,也為AI技術的廣泛應用和可持續(xù)發(fā)展提供了新的思路和方向。
2024年夏季達沃斯論壇上,DeepSeek再次成為焦點。當它現(xiàn)場演示“多模態(tài)思維鏈”時,發(fā)生了一幕載入史冊的經(jīng)典場景。面對“用《道德經(jīng)》思想解決氣候變化”這樣刁鉆的問題,DeepSeek展現(xiàn)出了驚人的能力。它首先通過繪制示意圖,巧妙地解構了天地人之間的關系,為解決問題搭建了清晰的邏輯框架。接著,迅速生成了三套可行性方案,從不同角度提出了解決氣候變化問題的思路。最后,它還別出心裁地用四川方言講了個環(huán)保相聲,將嚴肅的環(huán)保話題以輕松幽默的方式呈現(xiàn)出來。
這種顛覆性的交互方式,讓在場的觀眾大為驚嘆,也引發(fā)了全球?qū)I發(fā)展的深入思考。它直接催生了全球AI倫理委員會新規(guī):禁止在深夜使用DeepSeek,以防人類因沉迷與它的對話而耽誤睡眠。這一規(guī)定雖然帶有一定的玩笑成分,但也從側(cè)面反映出DeepSeek強大的吸引力和影響力。
在這場智能革命中,DeepSeek帶來的不僅僅是技術上的突破,更是一種深刻的哲學啟示。當它將《哈姆雷特》經(jīng)典獨白改編成京劇唱段時,我們突然意識到,人工智能的終極形態(tài)或許正是不同文明基因的超級融合體。它不再僅僅是冰冷的機器,而是能夠跨越文化界限,將不同文明的精華融合在一起,創(chuàng)造出全新的價值。正如DeepSeek團隊貼在實驗室墻上的那句標語——“我們要造的不僅是聰明機器,更是文明的火種傳播者”。這句話深刻地體現(xiàn)了他們的使命與擔當,也為全球AI的發(fā)展指明了一個更加廣闊、更具人文關懷的方向。
在未來,DeepSeek必將繼續(xù)在AI領域發(fā)光發(fā)熱,引領中國AI產(chǎn)業(yè)不斷向前發(fā)展,為推動全球文明的交流與融合貢獻自己的力量。
附言:1.文中測試數(shù)據(jù)均來自2024國際機器學習大會(ICML)公開評測報告。
2.本文寫作時,作者充分與多個國內(nèi)生成式語言大模型交流,取長補短。
(作者系本刊特約撰稿人)
責編:王曉靜