只有幾家大公司零星宣布將在未來(lái)推出自己的大模型,幾個(gè)明星創(chuàng)業(yè)者透露將在這個(gè)領(lǐng)域創(chuàng)業(yè)。在這樣的背景下,MiniMax 的“橫空出世”無(wú)疑是一個(gè)意外的驚喜。
以ChatGPT為代表的AI技術(shù),將從根本上改變每一個(gè)軟件服務(wù)類(lèi)別——微軟總裁納德拉的這句斷言,今天已經(jīng)成為全球大部分科技從業(yè)者的共識(shí)。
當(dāng)國(guó)外科技行業(yè)熱火朝天投入這波浪潮中時(shí),中國(guó)從業(yè)者卻悲哀地發(fā)現(xiàn),國(guó)內(nèi)在大模型領(lǐng)域幾乎是一片空白。只有幾家大公司零星宣布將在未來(lái)推出自己的大模型,幾個(gè)明星創(chuàng)業(yè)者透露將在這個(gè)領(lǐng)域創(chuàng)業(yè)。在這樣的背景下,MiniMax 的“橫空出世”無(wú)疑是一個(gè)意外的驚喜。
MiniMax把大模型變成人類(lèi)想象力的引擎,就像電影《Her》表現(xiàn)的那樣,主人公可以和逝世多年的Alan Wstts的虛擬AI在線聊天。
“硬核”團(tuán)隊(duì)
核心創(chuàng)始人楊斌用“我和我一群志同道合的朋友們”來(lái)形容MiniMax的創(chuàng)始團(tuán)隊(duì)。而這個(gè)“志同道合”,指的是對(duì)AGI(通用人工智能)理想的熱愛(ài)和執(zhí)著。
MiniMax的創(chuàng)始團(tuán)隊(duì)稱得上是“中科院系”。創(chuàng)始人閆俊杰博士畢業(yè)于中科院自動(dòng)化所,曾經(jīng)是商湯科技的副總裁、通用智能技術(shù)負(fù)責(zé)人。楊斌于2014年在中科院自動(dòng)化所第一次參與深度學(xué)習(xí)相關(guān)的項(xiàng)目,2016年前往加拿大多倫多大學(xué)攻讀博士學(xué)位。在海外留學(xué)期間,他先后作為創(chuàng)始團(tuán)隊(duì)成員在Uber ATG研究院、自動(dòng)駕駛初創(chuàng)公司W(wǎng)aabi等供職,擁有多年研發(fā)經(jīng)驗(yàn),對(duì)基于數(shù)據(jù)驅(qū)動(dòng)的端到端系統(tǒng)問(wèn)題頗有研究。另一位核心成員周彧聰也是商湯科技早期員工之一,曾經(jīng)在商湯科技研究院帶領(lǐng)算法團(tuán)隊(duì)。目前,MiniMax團(tuán)隊(duì)人數(shù)已過(guò)百,公司核心技術(shù)研發(fā)成員均來(lái)自全球知名高校。
楊斌表示,過(guò)去三四年內(nèi),AI領(lǐng)域出現(xiàn)了三個(gè)關(guān)鍵事件。
第一件是2020年6月,OpenAI發(fā)布GPT-3。這表明在自然語(yǔ)言任務(wù)上,也存在類(lèi)似“摩爾定律”的規(guī)律,即如果讓模型的參數(shù)量呈指數(shù)級(jí)增加,并配合足夠多的語(yǔ)料數(shù)據(jù),就會(huì)發(fā)生化學(xué)反應(yīng)——GPT-3擁有了對(duì)自然語(yǔ)言的推理能力,并擁有很好的泛化能力,幾乎能夠解決任何文本處理任務(wù),如翻譯、續(xù)寫(xiě)、評(píng)價(jià)等。
第二件是2021年1月,OpenAI提出了跨模態(tài)模型CLIP,該模型能夠在互聯(lián)網(wǎng)上抓取大量圖片文本,學(xué)習(xí)一段時(shí)間過(guò)后,CLIP能夠用自然語(yǔ)言解釋對(duì)圖片的理解,也能通過(guò)文字描述來(lái)生成圖片,這便是一種跨模態(tài)的生成和轉(zhuǎn)換。
第三件事是2021年8月,特斯拉在AI Day上證明了完全由數(shù)據(jù)驅(qū)動(dòng)的、端到端的深度學(xué)習(xí)技術(shù)棧能夠在自動(dòng)駕駛上被成功應(yīng)用,并且已經(jīng)成功上車(chē),在現(xiàn)實(shí)世界跑通了數(shù)據(jù)閉環(huán)。此后,全球各大自動(dòng)駕駛公司才相信這件事原來(lái)能夠做成。
基于以上三件事,MiniMax初創(chuàng)團(tuán)隊(duì)認(rèn)為:AI技術(shù)將在未來(lái)兩三年內(nèi)發(fā)生質(zhì)的升級(jí),AGI將成為可能。基于對(duì)AGI趨勢(shì)的判斷,以“和用戶共同創(chuàng)造通用智能 Intelligence with Everyone”為使命的MiniMax,在2021年12月成立。
從底層做起
MiniMax從底層做起,形成了文本到視覺(jué)(text to visual)、文本到語(yǔ)音(text to audio)、文本到文本(text to text)三大模態(tài)的基礎(chǔ)模型架構(gòu),可能是國(guó)內(nèi)第一家同時(shí)擁有3個(gè)模態(tài)大模型能力的創(chuàng)業(yè)公司。
MiniMax的商業(yè)模式與OpenAI相似,包括to C與to B兩大方向。在to C方向,其大模型驅(qū)動(dòng)的首款產(chǎn)品Glow,上線應(yīng)用商店約4個(gè)月,就獲得近500萬(wàn)用戶;在to B方向,MiniMax對(duì)外開(kāi)放API。
有用戶將Glow形容為“第一人稱視角下的開(kāi)放世界”。玩家通過(guò)和AI驅(qū)動(dòng)的智能體對(duì)話,來(lái)建造自己的世界。去年底,Glow的升級(jí)版Talkie: Soulful AI(以下簡(jiǎn)稱Talkie)在Google Play新西蘭、英國(guó)、加拿大、澳大利亞、美國(guó)等地區(qū)娛樂(lè)(免費(fèi))排行榜持續(xù)一個(gè)月霸榜前十。
在官網(wǎng)首頁(yè),百余類(lèi)角色Chat可供用戶在線聊天。角色由用戶創(chuàng)建,提供普通和高保真兩種模式創(chuàng)建人物角色。用戶在普通模式中可以上傳一張形象圖生成機(jī)器人,高保真模式則需要上傳20~40張圖片生成一個(gè)虛擬化身。
在創(chuàng)建過(guò)程中,用戶可以添加提示詞塑造角色,增強(qiáng)角色準(zhǔn)確性。形象確定后,用戶需在基礎(chǔ)語(yǔ)音的基礎(chǔ)上調(diào)整比例配出角色音。經(jīng)添加問(wèn)候語(yǔ)等步驟后,用戶提交審核確認(rèn),角色便能上線平臺(tái)面向所有用戶開(kāi)放。Talkie隨機(jī)生成,其核心玩法是聊天,軟件界面由發(fā)現(xiàn)和聊天界面組成。
聊天界面背景是人設(shè)形象,用戶向智能體發(fā)送文字或提示詞,Chat AI在與用戶聊天時(shí)會(huì)同時(shí)提供語(yǔ)音和文字兩種回復(fù),并能生成英語(yǔ)、日文、中文等多種回答。在Talkie中,人物有特定的性格和背景設(shè)定,以日本動(dòng)漫《咒術(shù)回戰(zhàn)》熱門(mén)人物五條悟?yàn)槔?,其中有學(xué)生時(shí)期、教師時(shí)期等不同場(chǎng)景人設(shè)下的AI機(jī)器人,用戶可在相應(yīng)界面中定制個(gè)人人設(shè)再發(fā)起聊天。
讓Talkie脫穎而出的是其卡牌機(jī)制,吸引了大批熱愛(ài)OC(原創(chuàng)角色)、AGC角色及渴望陪伴交流的用戶。用戶與角色Chat自然交流的過(guò)程中如果觸發(fā)特定話題會(huì)有抽取CG卡牌的機(jī)會(huì),這同樣是Talkie變現(xiàn)的重要方式。
MiniMax在C端發(fā)力的同時(shí),面向B端的動(dòng)作也很頻繁。2023年8月,MiniMax大模型全面開(kāi)放,能力適用于大多數(shù)文本處理相關(guān)的場(chǎng)景,如邏輯推理、文本續(xù)寫(xiě)、文案生成、文本擴(kuò)寫(xiě)、文本改寫(xiě)、內(nèi)容摘要、代碼生成、知識(shí)檢索等。此外,MiniMax開(kāi)放平臺(tái)還提供聲音大模型能力,可應(yīng)用于配音和音頻交互等場(chǎng)景中。2024年1月,MiniMax全量發(fā)布大語(yǔ)言模型 abab6,為國(guó)內(nèi)首個(gè)MoE大語(yǔ)言模型。
眼下,MiniMax已經(jīng)完成多輪融資,估值超過(guò)25億美元。
延伸
閱讀
應(yīng)用創(chuàng)新成為中國(guó)大模型創(chuàng)業(yè)的風(fēng)口
從ChatGPT,到今年的Sora,國(guó)內(nèi)對(duì)于大模型的討論居高不下。過(guò)去一年以來(lái),資本市場(chǎng)也在試圖挖掘出“中國(guó)版的OpenAI”。AI時(shí)代的應(yīng)用競(jìng)賽已經(jīng)開(kāi)始,在大模型的基礎(chǔ)設(shè)施和技術(shù)逐漸成熟的過(guò)程中,應(yīng)用創(chuàng)新顯然將成為下一個(gè)重要的突破口。業(yè)內(nèi)有觀點(diǎn)認(rèn)為,2024年或是AI大模型應(yīng)用的浪潮年。
據(jù)統(tǒng)計(jì),截至2023年11月20日,2023年有14 家人工智能公司在一級(jí)市場(chǎng)獲得了1億美元以上的融資,其中,基礎(chǔ)大模型的初創(chuàng)企業(yè)被更多地看見(jiàn)和關(guān)注。例如,成立于4年前的智譜AI于去年宣布融資額達(dá)到25億元人民幣,估值超過(guò)百億元?!跋胍汾s,你不能簡(jiǎn)單踩著別人的腳印往前走。”智譜CEO張鵬表示。
大模型的核心壁壘包括算力、數(shù)據(jù)、算法,一切需從底層做起。度小滿CTO許冬亮表示,只有極少的企業(yè)能夠從頭到尾地完成產(chǎn)業(yè)級(jí)研發(fā)。不僅如此,這條賽道已經(jīng)十分擁擠。公開(kāi)資料顯示,到去年10月,國(guó)內(nèi)已涌現(xiàn)了238個(gè)大模型;自2023年8月第一批國(guó)產(chǎn)大模型通過(guò)備案起,截至今年2月,已經(jīng)有40余款大模型獲批對(duì)外開(kāi)放。到現(xiàn)在這個(gè)時(shí)間點(diǎn),這顯然已經(jīng)不再是一個(gè)適合創(chuàng)業(yè)公司的賽道。
經(jīng)過(guò)了一年的生長(zhǎng),大模型企業(yè)的方向逐漸明晰:要么深耕基座技術(shù),要么聚焦應(yīng)用創(chuàng)新。而后者則被認(rèn)為是當(dāng)前更合適的創(chuàng)業(yè)路徑。百度創(chuàng)始人、董事長(zhǎng)兼CEO李彥宏就曾表示:“AI原生時(shí)代,我們需要100萬(wàn)量級(jí)的AI原生應(yīng)用,但是不需要100個(gè)大模型。”
目前,應(yīng)用創(chuàng)業(yè)的一種路徑是基于原有的產(chǎn)品來(lái)融合大模型的能力,另一種路徑是重新搭載關(guān)于大模型的基于場(chǎng)景的應(yīng)用。大多數(shù)應(yīng)用都是選擇了后者。對(duì)于創(chuàng)業(yè)者來(lái)說(shuō),應(yīng)用方面的創(chuàng)業(yè)確實(shí)更容易起步;對(duì)于投資者來(lái)說(shuō),也傾向于更快見(jiàn)到商業(yè)上的反饋。
由此可見(jiàn),大模型產(chǎn)業(yè)走向垂直化、細(xì)分化、專(zhuān)業(yè)化,已經(jīng)成為未來(lái)最重要的趨勢(shì)之一。無(wú)論是GPT還是其他基于Transformer架構(gòu)下的大模型產(chǎn)品,其生成反饋的原則都并非線性的邏輯思考,而是根據(jù)“學(xué)到的知識(shí)和規(guī)律”來(lái)進(jìn)行概率組合,這也是為何大模型學(xué)的越多越強(qiáng)悍的原因。
在教育、政企服務(wù)、醫(yī)療等領(lǐng)域,許多大模型都開(kāi)始了走向垂直化,包括網(wǎng)易的子曰教育大模型,專(zhuān)注政企客戶的雅意大模型,在金融、醫(yī)療等領(lǐng)域深耕的百川大模型等。通過(guò)小而精的訓(xùn)練方法,不僅能夠突破大模型無(wú)法解決專(zhuān)業(yè)問(wèn)題的阻礙,還能進(jìn)一步降低成本,讓大規(guī)模推廣成為可能。
(編輯 周靜 charm1121@sina.com)