我們正在迎來(lái)一個(gè)屬于AI的新時(shí)代。
“沒(méi)有大數(shù)據(jù),數(shù)字經(jīng)濟(jì)便是‘無(wú)米之炊;沒(méi)有智能算法,數(shù)字經(jīng)濟(jì)就不能‘創(chuàng)造價(jià)值?!?/p>
在日前的2023世界人工智能大會(huì)(以下簡(jiǎn)稱(chēng)WAIC)“大模型生產(chǎn)與產(chǎn)業(yè)落地合作論壇”上,國(guó)務(wù)院參事、中國(guó)科學(xué)院虛擬經(jīng)濟(jì)與數(shù)據(jù)科學(xué)研究中心主任、中國(guó)科學(xué)院大數(shù)據(jù)挖掘與知識(shí)管理重點(diǎn)實(shí)驗(yàn)室主任石勇說(shuō)。
近一年來(lái),隨著通用人工智能(AGI)與生成式人工智能(AIGC)的興起,人工智能產(chǎn)業(yè)掀開(kāi)了新的篇章——AI對(duì)部分產(chǎn)業(yè)的顛覆開(kāi)始加速,我們正在迎來(lái)一個(gè)屬于AI的新時(shí)代。
縱觀(guān)整個(gè)計(jì)算機(jī)科學(xué)歷史,進(jìn)入AI時(shí)代后,中國(guó)AI產(chǎn)業(yè)與國(guó)際先進(jìn)水平之間的差距正在不斷縮小。但業(yè)界也清醒地認(rèn)識(shí)到,中國(guó)AI產(chǎn)業(yè)的基礎(chǔ)設(shè)施仍然有很大的提升空間。
正如石勇所言,在AGI時(shí)代,數(shù)據(jù)、算力以及算法、算法開(kāi)發(fā)平臺(tái),都是中國(guó)AI產(chǎn)業(yè)發(fā)展壯大不可或缺的基礎(chǔ)設(shè)施。
在今年的WAIC大會(huì)上,越來(lái)越多的專(zhuān)家、學(xué)者以及AI、芯片等領(lǐng)域的從業(yè)者們都開(kāi)始關(guān)注到這一問(wèn)題,并希望能從底層入手,夯實(shí)中國(guó)AI產(chǎn)業(yè)的“地基”。
AI產(chǎn)業(yè)需要什么樣的基礎(chǔ)設(shè)施?
隨著AI技術(shù)進(jìn)入大模型時(shí)代,AI產(chǎn)業(yè)對(duì)于數(shù)據(jù)、算力的需求急劇膨脹。
以ChatGPT為例,根據(jù)媒體報(bào)道及投資、咨詢(xún)機(jī)構(gòu)的分析,GPT-3時(shí)期的ChatGPT數(shù)據(jù)量達(dá)到了45TB,對(duì)于純文本數(shù)據(jù)而言,這一數(shù)字堪稱(chēng)驚人。
與此同時(shí),ChatGPT的算力消耗巨大,參與訓(xùn)練的算力在萬(wàn)張英偉達(dá)A100級(jí)別,單次訓(xùn)練成本就高達(dá)140萬(wàn)美元。此外,ChatGPT在運(yùn)營(yíng)過(guò)程中,用戶(hù)的每次互動(dòng)都會(huì)產(chǎn)生一定的算力成本。
而在數(shù)據(jù)、算力之外,AI從業(yè)者,特別是最核心的算法工程師,還需要大量的開(kāi)發(fā)工具。
“算法工程師很多時(shí)候并沒(méi)有真正研究算法,而是把時(shí)間浪費(fèi)在了環(huán)境搭建的工作上?!痹赪AIC大會(huì)上,閃馬智能創(chuàng)始人、董事長(zhǎng)兼CEO彭垚說(shuō):“我們希望人能更好地利用工具,而不是被工具利用?!?/p>
有AI從業(yè)者將AI訓(xùn)練調(diào)侃為“煉丹”,可靠的算法訓(xùn)練平臺(tái),可以有效減輕算法工程師的“煉丹”籌備時(shí)間。在這一背景下,越來(lái)越多的AI企業(yè)開(kāi)始關(guān)注到AI開(kāi)發(fā)平臺(tái),閃馬智能便是其中之一。在WAIC上,閃馬智能發(fā)布了新一代的ATOM AI生產(chǎn)力平臺(tái),希望通過(guò)更友好的開(kāi)發(fā)平臺(tái),幫助算法工程師提升效率。
據(jù)悉,閃馬智能的ATOM AI生產(chǎn)力平臺(tái)構(gòu)建了從標(biāo)注、訓(xùn)練、測(cè)試到落地的全鏈路自動(dòng)生產(chǎn)體系,可以實(shí)現(xiàn)模型快速生產(chǎn)、迭代與驗(yàn)證的一站式管理,保障技術(shù)成果積累和數(shù)據(jù)資產(chǎn)沉淀。
具體而言,ATOM AI平臺(tái)支持跨云、跨集群靈活調(diào)度,基于DataExpress數(shù)據(jù)多級(jí)緩存與數(shù)據(jù)pipeline,可支撐千卡級(jí)大模型訓(xùn)練及各類(lèi)場(chǎng)景微調(diào)模型的穩(wěn)定運(yùn)行。
ATOM AI生產(chǎn)力平臺(tái)的前身,是閃馬智能團(tuán)隊(duì)推出的ATOM深度學(xué)習(xí)平臺(tái)。官方資料顯示,該平臺(tái)經(jīng)多年迭代后,已成為1000余位算法科學(xué)家和數(shù)十所高校師生使用的AI模型開(kāi)發(fā)工具。
視頻大模型方興未艾
與目前AI產(chǎn)業(yè)時(shí)下火熱的ChatGPT、Midjourney不同,ATOM AI平臺(tái)關(guān)注的是另一賽道。前兩者通過(guò)大模型實(shí)現(xiàn)了文本、圖片的AIGC,而后者則關(guān)注視頻領(lǐng)域,希望打造出更多視頻專(zhuān)屬的AI模型。
在AI視覺(jué)領(lǐng)域,業(yè)界現(xiàn)有的模型大多基于靜態(tài)圖片。目前,針對(duì)人臉、車(chē)牌、敏感內(nèi)容審查領(lǐng)域的AI模型已高度成熟。但在視頻領(lǐng)域,特別是較長(zhǎng)視頻中的物體跟蹤與行為檢測(cè),現(xiàn)有AI模型的表現(xiàn)仍然不夠理想。
這背后的原因是,大部分視覺(jué)模型針對(duì)靜態(tài)圖片表現(xiàn)良好,但針對(duì)動(dòng)態(tài)視頻,模型需要根據(jù)時(shí)序模型,對(duì)單幀靜態(tài)圖片進(jìn)行空間-時(shí)間建模,再提取視覺(jué)特征。這一過(guò)程的效率極低,且需要大量的算力支持。
此外,相較于圖片數(shù)據(jù),視頻數(shù)據(jù)更稀缺、體積更大、標(biāo)注也更加困難。因此,在整個(gè)AI產(chǎn)業(yè),視頻大模型仍處于方興未艾階段,增長(zhǎng)潛力巨大。
針對(duì)視頻模型開(kāi)發(fā)的特殊需求,閃馬智能的ATOM AI生產(chǎn)力平臺(tái)提供了集成數(shù)據(jù)管理、標(biāo)注、訓(xùn)練、優(yōu)化和推理功能的一體化服務(wù),并通過(guò)打通算力、數(shù)據(jù)資源的形式,幫助算法工程師專(zhuān)注于模型訓(xùn)練本身。
事實(shí)上,閃馬智能自身也在持續(xù)投入模型開(kāi)發(fā)。目前,閃馬智能解決方案已經(jīng)在智慧交管、智慧高速、智慧軌交、智慧建造、智慧電站和揚(yáng)塵治理等業(yè)務(wù)場(chǎng)景中落地應(yīng)用。
“大模型存在的意義一定是需要應(yīng)用到實(shí)際場(chǎng)景中,為人們解決問(wèn)題,賦能社會(huì)發(fā)展?!迸韴惙Q(chēng),“對(duì)于大模型本身,我們是理智的——不盲目投入極大參數(shù)LLM(大型語(yǔ)言模型),而是結(jié)合自身優(yōu)勢(shì),基于視覺(jué)拓展做了感知大模型?!?/p>
例如,閃馬智能日前發(fā)布的SupreMeta感知大模型,就融合了視覺(jué)、激光、雷達(dá)等多模態(tài),對(duì)于目標(biāo)及場(chǎng)景擁有更強(qiáng)的泛化能力,針對(duì)同一物體的不同視角、光照、遮擋,都能實(shí)現(xiàn)準(zhǔn)確識(shí)別。
聯(lián)合算力、算法,打造AI生產(chǎn)生態(tài)
作為一家AI企業(yè),閃馬智能以智慧交通解決方案為主營(yíng)業(yè)務(wù)。對(duì)于ATOM AI開(kāi)發(fā)平臺(tái),閃馬智能更希望借此打造一個(gè)AI生態(tài)。
在WAIC大會(huì)上,閃馬智能宣布與北京國(guó)科智算科技有限公司、北京國(guó)科未來(lái)科技有限公司聯(lián)合成立“中科閃馬”,意在借助更多資源,共同推廣ATOM新一代異構(gòu)人工智能計(jì)算平臺(tái)和DataOcean新一代存儲(chǔ)系統(tǒng),打造主可控、軟硬一體的人工智能計(jì)算與存貯設(shè)備,并為大模型的訓(xùn)練與實(shí)戰(zhàn)提供可靠的計(jì)算平臺(tái)。
中國(guó)科學(xué)院虛擬經(jīng)濟(jì)與數(shù)據(jù)科學(xué)研究中心特聘研究員張影飛表示:“中科閃馬智能有限公司具有三大優(yōu)勢(shì):第一,強(qiáng)強(qiáng)聯(lián)合、資源整合;第二,技術(shù)融合、拓展應(yīng)用;第三,聚力發(fā)力、突破難點(diǎn)。期待與閃馬智能共同推動(dòng)自主可控的國(guó)產(chǎn)技術(shù)發(fā)展與創(chuàng)新?!?/p>
毫無(wú)疑問(wèn)的是,在大模型時(shí)代,算力的意義變得無(wú)比重大。在日前的WAIC大會(huì)上,閃馬智能便邀請(qǐng)了國(guó)產(chǎn)GPU及解決方案廠(chǎng)商沐曦加入ATOM產(chǎn)業(yè)生態(tài)。
在沐曦創(chuàng)始人陳維良看來(lái),以GPU為代表的芯片產(chǎn)業(yè)已經(jīng)成為了AI產(chǎn)業(yè)的發(fā)展瓶頸。AI產(chǎn)業(yè)旺盛的需求催生出了GPU的廣闊市場(chǎng),GPU未來(lái)的發(fā)展架構(gòu)也將針對(duì)AI產(chǎn)業(yè)需求進(jìn)行定義。
閃馬智能的生態(tài)圈也在嘗試將更多伙伴拉入自身的生態(tài)圈。例如,在WAIC上,閃馬智能宣布將與3D互動(dòng)內(nèi)容創(chuàng)作和運(yùn)營(yíng)平臺(tái)Unity中國(guó)合作,基于3D孿生技術(shù)和“AI+交通”的算法能力,打造實(shí)時(shí)全息的智慧交通系統(tǒng)與靈活彈性的渲染云平臺(tái)。
以往,Unity大多被用于游戲開(kāi)發(fā),客戶(hù)以游戲廠(chǎng)商為主。但近年來(lái),隨著科技業(yè)對(duì)于3D引擎需求的增長(zhǎng),越來(lái)越多的開(kāi)發(fā)者開(kāi)始將Unity用于非游戲領(lǐng)域的開(kāi)發(fā),如汽車(chē)智能座艙、數(shù)字孿生、元宇宙等等。特別是在汽車(chē)領(lǐng)域,包括閃馬智能在內(nèi)的眾多廠(chǎng)商,都在使用Unity作為3D渲染工具。
而Unity也在積極擁抱AIGC。日前,Unity中國(guó)公布了其在AIGC相關(guān)領(lǐng)域的規(guī)劃——打造U3D Copilot——開(kāi)發(fā)者只需要使用自然語(yǔ)言下達(dá)需求,AI就可以通過(guò)大語(yǔ)言模型和用戶(hù)更自然的交互界面,串起3D的AIGC模型,以及引擎內(nèi)部能提供的包括資產(chǎn)庫(kù)和程序化生成等這種工具。
U3D Copilot同時(shí)面向游戲和非游戲行業(yè)的開(kāi)發(fā)者。在2023世界人工智能大會(huì)上,Unity中國(guó)CEO張俊波在接受36氪采訪(fǎng)時(shí)表示,以U3D Copilot為代表的3D渲染AIGC工具,對(duì)于非游戲行業(yè)意義更大。與游戲開(kāi)發(fā)者相比,這些開(kāi)發(fā)者在3D渲染方面的經(jīng)驗(yàn)有限,而AI則可以為他們提供更多助力。
不難看出從上游的算力、數(shù)據(jù)資源,到下游的行業(yè)應(yīng)用,閃馬智能結(jié)合自身業(yè)務(wù),搭建起了一整套面向大模型開(kāi)發(fā)的生態(tài)系統(tǒng)。從某種程度而言,閃馬智能自身也成為了AI大模型產(chǎn)業(yè)基礎(chǔ)設(shè)施的一部分。
如今,中國(guó)AI大模型正在蓬勃發(fā)展。根據(jù)科技部新一代人工智能發(fā)展研究中心發(fā)布的《中國(guó)人工智能大模型地圖研究報(bào)告》,據(jù)不完全統(tǒng)計(jì),國(guó)內(nèi)參數(shù)在10億規(guī)模以上的大模型全國(guó)已發(fā)布了79個(gè)。
對(duì)于大模型的未來(lái)前景,彭垚給出的答案是,這條賽道如今從業(yè)者甚多,但并不擁擠,因?yàn)榇竽P唾惖罉O其廣闊:“今天,仍有很多領(lǐng)域的大模型甚至還沒(méi)有完成定義?!?/p>
“所以,我們一定要擁有自己的GPU、自己的算力,有更多做模型、做算法、做平臺(tái)的公司,這樣,中國(guó)的大模型產(chǎn)業(yè)才能發(fā)展起來(lái)。”他進(jìn)一步解釋到。