2025年春節(jié)期間,全球科技界的目光聚集在梁文鋒身上。在他的帶領(lǐng)下,杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司的國產(chǎn)人工智能(AI)大模型DeepSeek震驚世界,無論是性能還是受歡迎程度,都躍居全球前列。這讓科技界大吃一驚。人們開始好奇,梁文鋒是誰?他是如何一舉成為業(yè)界黑馬的?他的人生,又有怎樣的經(jīng)歷?
喜歡拆收音機(jī),從小就是數(shù)學(xué)天才
1985年,梁文峰出生于廣東湛江的一個(gè)小村莊。父母為人淳樸,都是小學(xué)老師。父親對他的教育方式與眾不同,更注重解決問題的能力,而非單純追求分?jǐn)?shù)。雖然家庭并不富裕,但給了他理性和堅(jiān)韌的成長環(huán)境。
梁文鋒從小就展現(xiàn)出對數(shù)學(xué)和科學(xué)的天賦。他喜歡把家里的“飛躍牌”收音機(jī)拆了又裝,裝了又拆,前前后后折騰了30多次。這種對事物的好奇心和探索欲,不僅鍛煉了他的動(dòng)手能力,更培養(yǎng)了他的數(shù)理思維。他通過拆解和重新組裝收音機(jī),學(xué)會(huì)了如何從復(fù)雜的問題中找到規(guī)律,以及如何用邏輯去解決問題。這種能力,正是數(shù)學(xué)思維的核心,也為他后來的創(chuàng)新之路奠定基礎(chǔ)。
讀小學(xué)六年級時(shí),梁文峰憑借出色的數(shù)學(xué)成績考入?yún)谴ㄒ恢小E匀诉€在為簡單的加減乘除煩惱時(shí),他已經(jīng)開始自學(xué)高中數(shù)學(xué),甚至提前“解鎖”大學(xué)數(shù)學(xué)的高階知識。他對數(shù)字與邏輯的敏感性遠(yuǎn)超同齡人。中學(xué)時(shí),他為了攻克一道幾何難題,自創(chuàng)“坐標(biāo)系窮舉法”,每天花3個(gè)小時(shí),把所有可能的輔助線都試了一遍。后來,這種方法竟成了他開發(fā)AI模型時(shí)的關(guān)鍵算法。
2002年,17歲的梁文鋒考入浙江大學(xué),就讀其王牌學(xué)科——電子信息工程,攻讀人工智能方向。其間,他不僅刻苦學(xué)習(xí),還積極參加各種數(shù)學(xué)建模競賽,逐漸在學(xué)術(shù)圈小有名氣。
本科畢業(yè)后,梁文峰繼續(xù)攻讀浙江大學(xué)的碩士研究生,研究方向轉(zhuǎn)向更具前沿性的機(jī)器視覺。他的導(dǎo)師項(xiàng)志宇教授,是國內(nèi)這一領(lǐng)域的專家。跟從項(xiàng)志宇教授學(xué)習(xí)期間,梁文鋒的學(xué)術(shù)能力得到極大提升。大學(xué)期間,梁文鋒堅(jiān)信“AI將改變世界”。當(dāng)時(shí),他對金融市場產(chǎn)生了濃厚的興趣,嘗試用機(jī)器學(xué)習(xí)的方法分析金融市場數(shù)據(jù),并開始用編寫的人工智能算法選股。在全球金融危機(jī)的陰影下,他帶領(lǐng)一群志同道合的伙伴,探索量化交易與人工智能的結(jié)合,嘗試進(jìn)行全自動(dòng)量化交易。他們采集海量的市場行情數(shù)據(jù)、宏觀經(jīng)濟(jì)信息,并用數(shù)學(xué)建模的方法研究價(jià)格波動(dòng)規(guī)律,積累早期數(shù)據(jù)和經(jīng)驗(yàn)。這些“超前”的嘗試,為他日后的創(chuàng)業(yè)埋下伏筆。
當(dāng)時(shí),量化投資(是指利用數(shù)學(xué)模型和計(jì)算機(jī)算法來進(jìn)行投資決策的一種投資方式)在國內(nèi)還是新鮮事物,但梁文鋒敏銳地察覺到其中的潛力。為掌握量化投資的核心技術(shù),他開始瘋狂學(xué)習(xí)金融知識。除了讀不少專業(yè)書籍外,他還利用網(wǎng)絡(luò)資源,學(xué)習(xí)國內(nèi)外頂尖量化投資機(jī)構(gòu)的經(jīng)驗(yàn)與方法。
與許多追求“高薪體面”工作的同學(xué)不同,梁文鋒的目標(biāo)從來不局限于做一名普通工程師。他在學(xué)術(shù)研究之余,開始關(guān)注更大的產(chǎn)業(yè)變革方向,尤其是人工智能在實(shí)際場景中的應(yīng)用。他堅(jiān)信,科技將成為未來社會(huì)的核心驅(qū)動(dòng)力,而自己必須抓住這場時(shí)代機(jī)遇。思來想去,他決定自己創(chuàng)業(yè)。
成立公司,進(jìn)軍AI大模型
2015年,梁文鋒與浙大同學(xué)共同創(chuàng)立了自己的量化私募基金——幻方量化基金。將量化用于投資領(lǐng)域,這是一個(gè)融合金融、數(shù)學(xué)和計(jì)算機(jī)科學(xué)的交叉領(lǐng)域,需要具備深厚的專業(yè)知識和強(qiáng)大的技術(shù)能力。隨著幻方量化基金規(guī)模不斷膨脹,梁文峰從2019年起累計(jì)投資超10億元建設(shè)“螢火一號”和“螢火二號”AI算力集群,這讓幻方量化成為國內(nèi)少數(shù)具備超強(qiáng)算力的企業(yè)。
到2021年,梁文鋒已躋身千億量化私募“四大天王”之列,但他并沒有滿足于此。2023年,隨著ChatGPT(是美國OpenAI公司開發(fā)的大型語言模型)的爆火,AI大模型成為全球科技領(lǐng)域的焦點(diǎn),一場沒有硝煙的大模型競賽在全球范圍內(nèi)激烈展開。
當(dāng)許多人還在質(zhì)疑中國能否在人工智能領(lǐng)域取得突破時(shí),梁文鋒看到了人工智能領(lǐng)域的巨大潛力和無限可能。2023年7月,他成立了人工智能研究公司,全力進(jìn)軍AI大模型研究開發(fā)領(lǐng)域,專注于通用人工智能的研發(fā)。
很多人難以理解,甚至有人覺得他瘋了。搞AI大模型不僅燒錢,而且國內(nèi)普遍認(rèn)為我國在這方面的能力有限。也許當(dāng)時(shí)連梁文鋒都沒想到,他的這一瘋狂決定,成就了如今國產(chǎn)AI的一段傳奇。
在團(tuán)隊(duì)組建方面,梁文鋒展現(xiàn)出獨(dú)特的眼光和魄力。他沒有像其他公司那樣,執(zhí)著于聘請具有豐富AI技術(shù)經(jīng)驗(yàn)的老將,而是將目光投向充滿朝氣和潛力的年輕人。在他看來,如果追求短期目標(biāo),找現(xiàn)成有經(jīng)驗(yàn)的人是對的,但如果看長遠(yuǎn),經(jīng)驗(yàn)就沒那么重要,基礎(chǔ)能力、創(chuàng)造性、熱愛才更為重要。
梁文鋒認(rèn)為,年輕人思維活躍,富有創(chuàng)新精神,沒有被傳統(tǒng)思維模式束縛,更有可能在AI領(lǐng)域取得突破性進(jìn)展。于是,一群來自清華大學(xué)、北京大學(xué)、浙江大學(xué)等中國頂尖高校的應(yīng)屆畢業(yè)生、在讀生以及畢業(yè)才幾年的年輕人,匯聚在一起。
怎么看,當(dāng)時(shí)梁文鋒的公司都沒法在AI領(lǐng)域闖出一片天。他的團(tuán)隊(duì)僅139人,多為本土高校畢業(yè)生和實(shí)習(xí)生,團(tuán)隊(duì)成員沒有一個(gè)有海外留學(xué)背景。不過,雖然梁文鋒團(tuán)隊(duì)很年輕,但他們卻都是出類拔萃的。有的在國際大學(xué)生程序設(shè)計(jì)競賽中屢獲金獎(jiǎng),有的在頂尖學(xué)術(shù)會(huì)議上發(fā)表過高水平論文……盡管缺乏實(shí)際工作經(jīng)驗(yàn),但大家對研究充滿熱情和好奇,擁有扎實(shí)的專業(yè)知識和強(qiáng)大的學(xué)習(xí)能力。在團(tuán)隊(duì)里,大家沒有嚴(yán)格的上下級之分,每個(gè)人都能根據(jù)自己的興趣和專長,自由加入不同的研究小組。這種管理模式,極大地激發(fā)員工的積極性和創(chuàng)造力,讓他們能夠充分發(fā)揮自己的才能。
過去,梁文鋒看到人工智能技術(shù)被美國少數(shù)公司壟斷,并借此收取很高的費(fèi)用,就非常痛恨。他曾發(fā)誓——“一定要讓AI變成人人可以用得起的東西!”所以,當(dāng)他的團(tuán)隊(duì)研發(fā)出AI大模型后,他做出了一個(gè)最重要的決定,那就是將代碼開源,讓任何人都可以訪問,目標(biāo)是用低成本、高性能的技術(shù)。DeepSeek堪稱創(chuàng)新思維與實(shí)踐的完美結(jié)合,其核心競爭力在于獨(dú)特的技術(shù)創(chuàng)新。梁文峰的公司成立僅一年,就憑借其團(tuán)隊(duì)創(chuàng)新能力,成為AI領(lǐng)域一顆耀眼的新星。
一戰(zhàn)成名,
用中國科技書寫震撼全球的故事
2024年12月,梁文鋒推出了新一代AI大模型DeepSeek-V3。這款模型在數(shù)學(xué)運(yùn)算、代碼生成和中文問答等方面表現(xiàn)出色。更令人震驚的是,它用低成本的芯片,實(shí)現(xiàn)了對GPT-4的全面對標(biāo),被美國科技圈稱為“來自東方的神秘力量”。從此,梁文鋒成為業(yè)界的一匹黑馬!
梁文鋒真正的人生“爆發(fā)點(diǎn)”,是在2025年1月27日。這天,他發(fā)布了新的開源AI大模型DeepSeek R1,這一大模型不僅在性能上追上了全球最頂尖的GPT-4完整版,而且用550萬美元的訓(xùn)練開銷,就做到硅谷投入上億美元的效果。同時(shí),梁文鋒通過技術(shù)創(chuàng)新,不斷優(yōu)化模型的性能和效率,使其在保持高性能的同時(shí),推理成本大幅降低。這使得中小企業(yè)和個(gè)人開發(fā)者,也能夠負(fù)擔(dān)得起AI技術(shù)的使用,為AI的普及和應(yīng)用提供了更廣闊的空間。
當(dāng)世界各地的大量用戶突然涌入使用時(shí),梁文鋒和公司措手不及,甚至導(dǎo)致局部服務(wù)器短暫的系統(tǒng)崩潰。令梁文鋒沒想到的是,短短幾天,這個(gè)新的AI大模型就引起世界級的轟動(dòng)。
在AI領(lǐng)域,DeepSeek宛如一顆重磅炸彈,迅速登上蘋果全球免費(fèi)榜榜首,引發(fā)廣泛關(guān)注。其采用開源戰(zhàn)略,實(shí)現(xiàn)算法革命,在成本控制上也表現(xiàn)卓越,以顛覆性的姿態(tài)沖擊著美國AI從軟件、硬件到生態(tài)的科技金融化邏輯。
更厲害的是,DeepSeek是目前唯一支持聯(lián)網(wǎng)搜索的推理模型,這一點(diǎn),就連全球頂尖的美國OpenAI還沒做到。毫無疑問,那些AI巨頭躺著賺錢的日子,即將變成“過去式”。
一位業(yè)內(nèi)大佬在電視節(jié)目中說:“中國的AI能力正在迅速趕超美國,在某些方面甚至可以與美國頂尖模型相媲美,這出乎許多人的意料?!?/p>
DeepSeek服務(wù)覆蓋了工業(yè)、農(nóng)業(yè)、教育、醫(yī)療等多個(gè)領(lǐng)域。它就像一個(gè)深不見底的寶庫,任何人都能從中找到自己需要的寶貝。有人說,梁文鋒讓AI技術(shù)真正惠及大眾,這不僅是在顛覆AI市場的游戲規(guī)則,更是他2025年送給全世界的一份春節(jié)大禮!
DeepSeek的成功,證明了梁文峰的遠(yuǎn)見和堅(jiān)持。在全球AI競爭愈發(fā)激烈的今天,他用技術(shù)和創(chuàng)新讓中國AI力量在國際舞臺(tái)上占據(jù)了一席之地。正如他所說:“我們不只是追趕,更要在核心技術(shù)上實(shí)現(xiàn)真正的超越?!?/p>
目前,梁文鋒已經(jīng)將自己的公司定位在中國人工智能革命的最前沿。今年40歲的他,正利用自己的聰明才智,全力以赴地報(bào)效祖國,為中國科技書寫更多震撼全球的故事。
編輯|郭緒書