去年3月,聚焦通用人工智能大模型研發(fā)的公司Moonshot AI月之暗面成立,10月即推出全球首個(gè)支持輸入20萬漢字的智能助手產(chǎn)品Kimi,在用戶端和資本市場(chǎng)都引起了巨大的反響。在今年5月份舉行的第五屆上海創(chuàng)新創(chuàng)業(yè)青年50人論壇上,月之暗面創(chuàng)始人楊植麟分享了自己的創(chuàng)業(yè)經(jīng)歷與心得。
很少有人知道,潛心鉆研硬科技的背后,這個(gè)高材生兒時(shí)的夢(mèng)想是做搖滾歌手和流浪詩人。他說:“創(chuàng)新的精神和搖滾的精神一樣,都是用新東西帶來新增量。計(jì)算機(jī)剛開始發(fā)展的時(shí)候,IBM是全世界最大、市值最高的公司,大家形容IBM既是太陽又是月亮又是星星,日月星辰都被它包攬了。當(dāng)時(shí)微軟只有幾個(gè)人,但還是做出了顛覆式的創(chuàng)新成果。這可能是我們想要努力的一個(gè)方向?!?/p>
楊植麟正沿著自己設(shè)想的創(chuàng)業(yè)道路前進(jìn)——去年成立的月之暗面,現(xiàn)在已經(jīng)成為國(guó)內(nèi)通用大模型領(lǐng)域的六家獨(dú)角獸之一。今年2月19日,月之暗面完成了最新一輪的融資,金額超過10億美元,刷新了國(guó)內(nèi)AI領(lǐng)域最大單筆融資紀(jì)錄。該輪融資過后,月之暗面的估值已達(dá)約25億美元(約合人民幣180億元)。
1992年出生的楊植麟,本科畢業(yè)于清華大學(xué)計(jì)算機(jī)系,擁有卡耐基梅隆大學(xué)計(jì)算機(jī)專業(yè)博士學(xué)位,師從蘋果公司前AI負(fù)責(zé)人,曾在Facebook AI Research(臉書人工智能研究)和Google Brain(谷歌大腦)工作,是中國(guó)35歲以下自然語言處理領(lǐng)域引用最高的研究者。
2019年,博士畢業(yè)后,楊植麟緊張籌備著回國(guó)創(chuàng)業(yè)計(jì)劃。但直到2023年才開始在AI大模型領(lǐng)域創(chuàng)業(yè)。此前3年他蟄伏在其讀博第二年(2016年)創(chuàng)立的循環(huán)智能,繼續(xù)做著服務(wù)AI大平臺(tái)的工作。
直到2022年下半年,ChatGPT用數(shù)周斬獲上億用戶的輝煌戰(zhàn)績(jī),宣告了大模型在2C領(lǐng)域的爆發(fā)。感到時(shí)機(jī)成熟的楊植麟于2023年3月1日,馬不停蹄創(chuàng)立了大模型公司月之暗面,并用上了自己的英文名Kimi。像一只蟄伏了3年的獵豹,當(dāng)獵物出現(xiàn)后,楊植麟選擇了迅速出擊。而Kimi 也開啟了以月為單位的“光速”融資。當(dāng)年6月,Kimi完成了超2億美元天使輪融資。次年2月,Kimi完成超10億美元A輪融資,紅杉、阿里、小紅書都是背后金主。另據(jù)阿里財(cái)報(bào)披露,該公司于2024 財(cái)年向月之暗面投資 8 億美元,購入36%的股權(quán)。
kimi推出5個(gè)月后,其產(chǎn)品可支持的無損上下文長(zhǎng)度限制從20萬字提升到200萬字,而GPT-4.5 Turbo也只能處理20萬個(gè)單詞。今年3月,Kimi月度訪問量環(huán)比更是增長(zhǎng)了321%,一度火到宕機(jī)。
優(yōu)秀的互聯(lián)網(wǎng)公司,歷來用產(chǎn)品說話,楊植麟尤勝他的前輩。他認(rèn)為傳統(tǒng)互聯(lián)網(wǎng)和AI產(chǎn)品最大的區(qū)別,前者是先設(shè)計(jì)后制造,后者是通過制造完成設(shè)計(jì),比如讓產(chǎn)品具備很強(qiáng)的in-context learning (情緒學(xué)習(xí))的能力、instruction following(指令遵循)的能力,就是一個(gè)在制造中完成設(shè)計(jì)的過程。這些思考,很多源于創(chuàng)立kimi前的那段摸索與蟄伏。
在國(guó)內(nèi)最早的大模型競(jìng)逐中,沒有深度涉水的楊植麟甘愿充當(dāng)配角:但別人走過的坎兒,踩過的坑,他一個(gè)也沒拉下?;蛟S也是基于此,kimi創(chuàng)立后出奇的順?biāo)臁?/p>
“技術(shù)的發(fā)展是非常神奇的,為什么2022年底發(fā)布的GPT-4可以成為里程碑?因?yàn)樗茏龅揭郧安豢赡茏龅降氖隆!睏钪谗胝f,這其實(shí)是一個(gè)天時(shí)地利的結(jié)果,互聯(lián)網(wǎng)發(fā)展二十多年,本身創(chuàng)造了很大的價(jià)值,但很有可能再過三四十年回頭看,會(huì)發(fā)現(xiàn)互聯(lián)網(wǎng)最大的價(jià)值是為AI積累了大量數(shù)據(jù)。此外,AI的出現(xiàn)還得益于硬件的進(jìn)步,包括Transfomer(變壓器)架構(gòu)的提出以及半導(dǎo)體發(fā)展。
那么人工智能接下來的發(fā)展新方向是什么?在楊植麟看來,是要從回答簡(jiǎn)單的問題,發(fā)展到解決長(zhǎng)鏈路的復(fù)雜任務(wù),還要從完成1%的工作流到90%的工作流?!氨热缫砸恍┓浅I(yè)的文檔為基礎(chǔ),你接下來所有的學(xué)習(xí)過程都在人工智能中進(jìn)行,就可以快速在一個(gè)新的領(lǐng)域成為專家,這也是非常重要的應(yīng)用場(chǎng)景?!?/p>
究竟什么叫作處理更復(fù)雜問題的能力?楊植麟解釋,比如在用人工智能分析一項(xiàng)研究進(jìn)展時(shí),它不僅要能知道是最新進(jìn)展如何,哪些研究機(jī)構(gòu)做得好,甚至可以直接編寫代碼、分析實(shí)驗(yàn)結(jié)果,還可以和實(shí)驗(yàn)者討論接下來的研究方向。“也就是說,它不光可以被動(dòng)地遵循你的指令,還可能給你提出挑戰(zhàn)。你給它一個(gè)指令,如果指令本身有問題,它是可以跟你探討,然后和你一起去工作的。”
在創(chuàng)業(yè)的過程中,楊植麟學(xué)到的重要一課是——對(duì)創(chuàng)業(yè)公司而言,組織方式要能適應(yīng)新的生產(chǎn)方式。而新技術(shù)往往又會(huì)很大程度上影響生產(chǎn)方式。
“大模型的開發(fā)方式和互聯(lián)網(wǎng)有很大不同?;ヂ?lián)網(wǎng)更多是規(guī)劃式的發(fā)展,定好一個(gè)目標(biāo),接下來每一步要開發(fā)什么都是有序的,很少遇到因?yàn)槟硞€(gè)技術(shù)瓶頸導(dǎo)致這個(gè)東西開發(fā)不出來。但大模型是涌現(xiàn)式的,比如說我們現(xiàn)在在產(chǎn)業(yè)的開端,做到了10的25次方的運(yùn)算,接下來還要進(jìn)行26、27、28次方的運(yùn)算,但不知道到哪個(gè)節(jié)點(diǎn)會(huì)出現(xiàn)什么新的能力,所以要更多關(guān)注基礎(chǔ)能力,讓模型不斷涌現(xiàn)出來?!彼f,對(duì)應(yīng)的生產(chǎn)方式的變化就是,不是在一個(gè)地方種一棵樹,而是要直接把整片森林承包下來。
他關(guān)于創(chuàng)業(yè)的另一個(gè)重要領(lǐng)悟,就是要“爬樓梯,而不只是看風(fēng)景”,也就是要在商業(yè)化和技術(shù)發(fā)展之間取得平衡?!拔覀儸F(xiàn)階段的重要目標(biāo)是不斷去提升模型的能力,探索智能的上限,給用戶帶來更好的體驗(yàn),這是我們第一個(gè)目標(biāo),也就是‘爬樓梯’。我們希望能更多把優(yōu)先級(jí)放在‘爬樓梯’上,而不僅僅只是‘看風(fēng)景’?!?/p>
近期,月之暗面旗下大模型產(chǎn)品Kimi新增了“Kimi+”功能,覆蓋了辦公、娛樂、生活實(shí)用等多個(gè)場(chǎng)景?!凹夹g(shù)的發(fā)展可以定義新的問題和新的場(chǎng)景。”楊植麟介紹,他們最近還在持續(xù)迭代,深入更多專業(yè)場(chǎng)景和生活場(chǎng)景。隨著新用戶的不斷加入,他們接下來要進(jìn)一步提升用戶體驗(yàn),降低產(chǎn)品的使用門檻,讓產(chǎn)品發(fā)揮更大價(jià)值。“我們跟用戶走得很近,通過用戶的反饋也能知道哪些地方還有可能提升的空間?!?/p>
楊植麟的創(chuàng)業(yè)路看似一帆風(fēng)順,但他笑說,挫折基本上是以“天”為單位出現(xiàn)的,“每天都可能遇到研發(fā)的問題、招人的問題、融資的問題,我們克服了很多困難走到現(xiàn)在,很重要的原因是有包容的環(huán)境,有人才和資源的支持。”
巨大的商業(yè)成功,將楊植麟推入了全球大模型領(lǐng)軍人物的序列。
不少人將他看作李彥宏“第二”。他們的人生的軌跡確實(shí)有些相似:學(xué)霸、海龜、技術(shù)大拿、海外從業(yè)經(jīng)歷,李彥宏31歲創(chuàng)立百度,如今楊植麟也31歲。
更重要的是,兩者都身處大模型賽道,都堅(jiān)信閉環(huán)的價(jià)值。李彥宏頭頂中國(guó)大模型“第一人”光環(huán),楊植麟則是Transformer-XL與XLNet兩篇重要論文的第一作者,兩者均涉及大語言模型領(lǐng)域的核心技術(shù)。
就財(cái)富而言,楊植麟在李彥宏面前還算后浪,但這個(gè)年輕人身上已經(jīng)具備了獨(dú)特的個(gè)人魅力。楊植麟之所以屢屢被資本看中,或許在于其從內(nèi)而外散發(fā)的那股不按常理出牌的“顛覆勁兒”:不斷反叛、并打破常規(guī)。
高中時(shí),沒有任何編程基礎(chǔ)的他被選進(jìn)信息學(xué)奧林匹克競(jìng)賽培訓(xùn)班,之后楊植麟在全國(guó)青少年信息學(xué)奧林匹克聯(lián)賽中奪得廣東賽區(qū)一等獎(jiǎng),因此獲得清華大學(xué)保送生資格。但這年,楊植麟還是憑自己努力在高考中拿下了667高分,遠(yuǎn)超清華大學(xué)在廣東的錄取線。
最初,楊植麟在清華熱能工程學(xué)的好好的,但大二時(shí)他又決定轉(zhuǎn)入計(jì)算機(jī)系。這個(gè)決定,是其科研與創(chuàng)業(yè)的前提。
此外,作為第一作者,楊植麟發(fā)表的XLNet也在20項(xiàng)任務(wù)上超越了Google BERT,還被多家媒體評(píng)為2019年全球最重要的論文top 10。這篇論文,也是2019年度全球所有NLP論文中引用數(shù)量最高的(截至2020年6月)。
除了有出色的學(xué)業(yè)成績(jī)及科研成果,楊植麟還是校園搖滾樂隊(duì)Splay的創(chuàng)始人,曾晉級(jí)清華大學(xué)校園歌手大賽原創(chuàng)決賽。這讓人深感驚嘆:“學(xué)霸怎么還有時(shí)間去玩樂隊(duì)?”
實(shí)際上,求學(xué)過程中,楊植麟并非“書呆子”,無論是高中或是大學(xué),他都會(huì)花時(shí)間練習(xí)打鼓并加入校園樂隊(duì),他說,“打鼓是我生活不可或缺的一部分。我開心時(shí)喜歡打鼓,壓力大時(shí)也會(huì)以此減壓?!?/p>
“該拼的時(shí)候要拼,該玩的時(shí)候要玩,能盡量花最少的時(shí)間,做最有質(zhì)量的事情”,楊植麟說,不管是學(xué)習(xí)還是個(gè)人興趣愛好,只要認(rèn)定了就一定投入百分之百的努力。在楊植麟眼里,學(xué)習(xí)并不是生活的全部,求學(xué)最重要的是多實(shí)踐,并且多與不同文化、不同領(lǐng)域的人交流,體驗(yàn)各種新鮮的事物,拓寬自己的視野。
當(dāng)然對(duì)楊植麟而言,搖滾不算一個(gè)夢(mèng),它的精神本質(zhì)與創(chuàng)業(yè)相通。他甚至認(rèn)為,對(duì)自己(人生)啟發(fā)最大就是搖滾。而搖滾和創(chuàng)業(yè)都代表了一種反叛和打破常規(guī)的精神。一如月之暗名最核心本質(zhì)的內(nèi)涵:創(chuàng)新、長(zhǎng)久、第一性原理。