2025年春天,全球科技界的目光聚焦在梁文峰身上。在他的帶領下,DeepSeek的國產人工智能大模型震驚了世界,無論是性能還是受歡迎程度,都躍居全球前列。用低成本的芯片實現(xiàn)與OpenAI等頂尖公司花費巨大成本打造的旗艦模型同樣的性能,這讓科技界大佬和硅谷的技術高管們都大吃一驚。游戲科學創(chuàng)始人、《黑神話:悟空》制作人馮驥,更是將DeepSeek譽為“國運級別科技成果”。梁文峰,這位DeepSeek的創(chuàng)始人,以其卓越的創(chuàng)新能力、堅定的理想信念和強烈的家國情懷,成為了AI領域的領軍人物。
拆收音機的男孩,從小就是數(shù)學天才
梁文鋒1985年出生于廣東湛江一個小村莊里。父母為人淳樸,都是小學老師。雖然家庭并不富裕,但卻給了他充滿智慧和堅韌的成長環(huán)境。父親對他的教育方式與眾不同,更注重解決問題的能力,而非單純的分數(shù)。梁文峰從小就展現(xiàn)出對數(shù)學和科學的天賦。他喜歡把家里的收音機拆了又裝、裝了又拆,前前后后折騰了30多次。這種對事物的好奇心和探索欲,不僅鍛煉了他的動手能力,更培養(yǎng)了他的數(shù)理思維。他通過拆解和重新組裝收音機,學會了如何從復雜的問題中找到規(guī)律,如何用邏輯去解決問題。這種能力,正是數(shù)學思維的核心,也為他后來的創(chuàng)新之路奠定了基礎。
梁文鋒的數(shù)學天賦,很快就表現(xiàn)了出來。讀小學六年級時,他就憑借出色的數(shù)學成績考入?yún)谴ㄒ恢?。在旁人還在為簡單的加減乘除煩惱時,他已經開始自學高中數(shù)學,甚至提前解鎖了大學數(shù)學的高階知識。他對數(shù)字與邏輯的敏感性遠超同齡人。
讀中學時,他為了攻克一道幾何難題,自創(chuàng)了“坐標系窮舉法”,每天花3個小時,把所有可能的輔助線都試一遍。后來,這種方法竟成了他開發(fā)AI模型時的關鍵算法。
2002年,17歲的梁文峰考入浙江大學電子信息工程專業(yè),攻讀人工智能方向。其間,他不僅刻苦學習,還積極參加各種數(shù)學建模競賽,逐漸在學術圈小有名氣。
本科畢業(yè)后,他繼續(xù)攻讀浙江大學的碩士研究生,研究方向轉向了更具前沿性的機器視覺。他的導師項志宇教授是國內這一領域的專家。這段時期,讓梁文鋒的學術能力得到了極大提升,也讓他進一步接觸到了人工智能領域的技術發(fā)展。
大學期間,梁文峰堅信“AI將改變世界”,當時他對金融市場產生了濃厚的興趣,嘗試用機器學習的方法分析金融市場數(shù)據(jù),并開始編寫人工智能算法來選股。甚至在全球金融危機的陰影下,他帶領一群志同道合的伙伴,探索量化交易與人工智能的結合,嘗試進行全自動量化交易。他們采集海量的市場行情數(shù)據(jù)、宏觀經濟信息,并用數(shù)學建模的方法研究價格波動規(guī)律,積累早期數(shù)據(jù)和經驗。這些“超前”的嘗試,為他日后的創(chuàng)業(yè)埋下了伏筆。
當時,量化投資在國內還是新鮮事物,但梁文峰敏銳地察覺到其中的潛力。為掌握量化投資的核心技術,他開始瘋狂學習金融知識。除了讀了不少專業(yè)書籍外,他還利用網絡資源,學習國內外頂尖量化投資機構的經驗與方法。
與許多追求高薪體面工作的同學不同,梁文鋒的目標從來不局限于做一名普通工程師。他在學術研究之余,開始關注更大的產業(yè)變革方向,尤其是人工智能在實際場景中的應用。他堅信,科技將成為未來社會的核心驅動力,而自己必須抓住這場時代機遇。他決定自己創(chuàng)業(yè)。
成立DeepSeek,進軍AI大模型
2015年,梁文峰與浙大同學共同創(chuàng)立了自己的量化私募基金——幻方量化投資。這是一個融合金融、數(shù)學和計算機科學的交叉領域,需要具備深厚的專業(yè)知識和強大的技術能力。
隨著幻方量化基金規(guī)模不斷膨脹,從2019年起,梁文鋒累計投資超10億元建設“螢火一號”和“螢火二號”AI算力集群,成為國內少數(shù)具備超強算力的非互聯(lián)網企業(yè)。
到2021年,梁文鋒已躋身千億量化私募“四大天王”之列,但他并沒有滿足于此。2023年,隨著ChatGPT的爆火,AI大模型成為全球科技領域的焦點,一場沒有硝煙的大模型競賽,在全球范圍內激烈展開。
當許多人還在質疑中國能否在AI領域取得突破時,梁文鋒看到了人工智能領域的巨大潛力和無限可能。2023年7月,他成立了深度求索(DeepSeek)公司,全力進軍AI大模型研究開發(fā)領域,專注于通用人工智能的研發(fā)。
很多人難以理解,甚至有人覺得他瘋了。搞大模型不僅燒錢,而且國內普遍認為只有美國才能搞得出來。也許當時連梁文鋒都沒想到,他的這一瘋狂決定,成就了如今國產AI的一段傳奇。
在團隊組建方面,梁文峰展現(xiàn)出獨特的眼光和魄力。他沒有像其他公司那樣,執(zhí)著于聘請具有豐富AI技術經驗的老將,而是將目光投向充滿朝氣和潛力的年輕人。在他看來,如果追求短期目標,找現(xiàn)成有經驗的人是對的,但如果看長遠,經驗就沒那么重要,基礎能力、創(chuàng)造性、熱愛等更重要。
梁文鋒認為,年輕人思維活躍,富有創(chuàng)新精神,沒有被傳統(tǒng)思維模式束縛,更有可能在AI領域取得突破性進展。于是,一群來自清華、北大、北航等中國頂尖高校的應屆畢業(yè)生、在讀生以及畢業(yè)才幾年的年輕人,會聚在DeepSeek。
怎么看,當時梁文鋒的公司都沒法在AI領域闖出一片天地。他的團隊僅139人,多為本土高校畢業(yè)生和實習生,沒有一個有海外留學背景。而對手美國的OpenAI公司卻有1200多名研究員,還有幾萬塊最先進的GPU,以及10億美元的資金。
雖然梁文鋒團隊很年輕,他們卻都是出類拔萃的。有的在國際大學生程序設計競賽中屢獲金獎,有的在頂尖學術會議上發(fā)表過高水平論文……盡管缺乏實際工作經驗,但大家對研究充滿熱情和好奇心,擁有扎實的專業(yè)知識和強大的學習能力。比如DeepSeek核心成員趙成鋼,曾是衡水中學信息學競賽班成員,獲得CCFNOI2016銀牌,后進入清華大學,曾經三次獲得世界大學生超算競賽冠軍。
在DeepSeek團隊,沒有嚴格的上下級之分,每個人都能根據(jù)自己的興趣和專長,自由加入不同的研究小組。這種管理模式,極大地激發(fā)了員工的積極性和創(chuàng)造力,讓他們能夠充分發(fā)揮自己的才能。也正是因此,這個沒有知名技術大牛的純本土創(chuàng)業(yè)團隊,成了最快追上OpenAI的隊伍。
過去,梁文鋒看到人工智能技術被美國少數(shù)公司壟斷,并借此收取很高的費用,就非常痛恨。他曾發(fā)誓:“一定要讓AI變成人人可以用得起的東西?!彼裕髞硭肿龀鲆粋€最重要的決定,那就是將代碼開源,讓任何人都可以訪問。目標是用低成本、高性能的技術,打破國際巨頭在人工智能領域的壟斷。
DeepSeek堪稱創(chuàng)新思維與實踐的完美結合,其核心競爭力在于其獨特的技術創(chuàng)新。比如,梁文鋒提出了用戶反饋驅動的迭代優(yōu)化理念。傳統(tǒng)的AI模型往往依賴于固定的訓練數(shù)據(jù)集,而DeepSeek則引入了一個動態(tài)的學習機制,允許模型根據(jù)用戶的實時反饋不斷調整和改進。
2024年5月,梁文鋒發(fā)布了其首款混合專家語言模型DeepSeek-V2。這一模型以超低的價格震驚市場:每百萬Tokens輸入1元、輸出2元,僅為GPT-4Turbo價格的1%。憑借出色的性能和性價比,DeepSeek-V2引發(fā)了一場大模型價格戰(zhàn),國內外科技巨頭紛紛跟進降價。
DeepSeek成立僅一年,就憑借其創(chuàng)新能力,成為AI領域一顆耀眼的新星。
一戰(zhàn)成名,被譽為“國運級科技成果”
2024年12月,梁文鋒推出了新一代大模型DeepSeek-V3。這款模型不僅在數(shù)學運算、代碼生成和中文問答等方面表現(xiàn)出色,更令人震驚的是,它的訓練成本僅為557.6萬美元,而OpenAI的GPT-4o訓練成本高達7800萬美元。他用低成本的芯片,以不到對方十分之一的成本,實現(xiàn)了對GPT-4o的全面對標,被美國科技圈稱為“來自東方的神秘力量”。從此,梁文鋒成為業(yè)界的一匹黑馬!
梁文峰真正的人生“爆發(fā)點”,出現(xiàn)在2025年1月27日。這天,他發(fā)布了新的開源模型DeepSeekR1,不僅性能追上了全球最頂尖的OpenAIo1完整版,而且用550萬美元的訓練開銷,就做到硅谷投入上億美元的效果。
當世界各地的大量用戶突然涌入使用時,梁文鋒和公司措手不及,甚至導致了局部服務器短暫的系統(tǒng)崩潰。令梁文峰沒想到的是,短短幾天,這個新的開源模型就引起了世界級的轟動。
游戲科學創(chuàng)始人、《黑神話:悟空》制作人馮驥在微博發(fā)表長文,列舉了DeepSeek同時實現(xiàn)的六大驚人突破——每一項拎出來都足以震動世人,而DeepSeek卻全部做到了:可以比肩OpenAI付費版ChatGPTo1模型的推理能力,暫時沒有之一;參數(shù)規(guī)模更小,訓練和使用的經濟門檻大幅下降,讓普惠AI成為可能;模型、論文、訓練細節(jié)全部公開,甚至提供可運行在手機端的迷你版,技術透明度高;官方服務零門檻開放,用戶無需付費即可體驗到世界頂尖AI模型能力;暫時唯一支持聯(lián)網搜索的推理模型,反觀OpenAI付費版ChatGPTo1推理模型至今還不支持聯(lián)網搜索;開發(fā)團隊由毫無海外背景的年輕中國工程師組成,印證本土科技力量的崛起。他說:“這六條,DeepSeek全部、同時做到了!”
馮驥很少公開為他人的技術產品站臺,而這次卻極力推薦梁文峰的AI大模型。他直言:“這可能是國運級別的科技成果?!?/p>
ScaleAI創(chuàng)始人評價說,過去十年來,美國可能一直在人工智能競賽中領先于中國,但DeepSeek的AI大模型發(fā)布可能會“改變一切”。
正如Linux操作系統(tǒng)的開源催生了無數(shù)基于它的軟件和應用,推動了整個計算機行業(yè)的發(fā)展。DeepSeek的模型開源,也迅速吸引了全球開發(fā)者的關注和參與。他們在DeepSeek模型的基礎上,開發(fā)出各種各樣的應用,從智能客服到智能寫作,從圖像識別到數(shù)據(jù)分析,涵蓋各個領域。這些應用不僅豐富了AI的應用場景,也讓更多人體驗到了AI的魅力。
同時,梁文峰通過技術創(chuàng)新,不斷優(yōu)化模型的性能和效率,使其在保持高性能的同時,推理成本大幅降低。這使得中小企業(yè)和個人開發(fā)者,也能夠負擔得起AI技術的使用,為AI的普及和應用提供了更廣闊的空間。在AI領域,DeepSeek宛如一顆重磅炸彈,迅速登上蘋果全球免費榜榜首,引發(fā)廣泛關注。其采用開源戰(zhàn)略,實現(xiàn)算法革命,在成本控制上也表現(xiàn)卓越,以顛覆性的姿態(tài)沖擊著美國AI從軟件、硬件到生態(tài)的科技金融化邏輯。
更牛的是,DeepSeek是目前唯一支持聯(lián)網搜索的推理模型,全球頂尖的美國OpenAI還沒做到。毫無疑問,那些AI巨頭躺著賺錢的日子,即將變成“過去式”。一位硅谷大佬在電視節(jié)目中說,中國的AI能力正在迅速趕超美國,在某些方面甚至可以與美國頂尖模型相媲美,這出乎許多人的意料。
DeepSeek服務覆蓋了工業(yè)、農業(yè)、教育、醫(yī)療等多個領域。它就像一個深不見底的寶庫,任何人都能從中找到自己需要的寶貝。有人說,梁文峰讓AI技術真正普惠大眾,這不僅是在顛覆AI市場的游戲規(guī)則,更是他送給全世界的一份春節(jié)大禮!
此外,傳統(tǒng)認知中都是美國擅長從0到1的創(chuàng)新,中國擅長從1到10的應用創(chuàng)新。而DeepSeek的出現(xiàn),讓中國也可以引領從0到1的創(chuàng)新。所以,將其稱為“國運級別的科技成果”并不為過。
梁文鋒始終站在技術創(chuàng)新的最前沿。DeepSeek的成功,證明了他的遠見和堅持。在全球AI競爭愈發(fā)激烈的今天,他用技術和創(chuàng)新,讓中國AI力量在國際舞臺上贏得了一席之地。正如他所說:“我們不只是追趕,更要在核心技術上實現(xiàn)真正的超越?!?/p>