日前,華為推出參數(shù)規(guī)模高達(dá)7180億的全新模型盤古Ultra MoE。令人振奮的是,這是一個(gè)全流程在國(guó)產(chǎn)昇騰人工智能(AI)計(jì)算平臺(tái)上訓(xùn)練出來的準(zhǔn)萬億MoE模型,證明國(guó)產(chǎn)計(jì)算平臺(tái)完全具備訓(xùn)練頂尖大模型的能力。
一直以來,對(duì)國(guó)產(chǎn)算力“難堪大任”的憂慮聲不時(shí)響起:其能否長(zhǎng)期穩(wěn)定支持國(guó)產(chǎn)模型推理及訓(xùn)練,能否訓(xùn)練出一流大模型?
技術(shù)公開把問號(hào)拉直。前不久,華為首次集中披露昇騰推理、訓(xùn)練、基礎(chǔ)設(shè)施等技術(shù)細(xì)節(jié),詳解萬卡集群訓(xùn)練出準(zhǔn)萬億模型的全流程,對(duì)“國(guó)產(chǎn)算力無法訓(xùn)練一流大模型”論調(diào)作出有力回應(yīng)。
算力是人工智能的“發(fā)動(dòng)機(jī)”,是支撐人工智能算法運(yùn)行和數(shù)據(jù)處理的基礎(chǔ)設(shè)施。算力之難,難在技術(shù)與生態(tài)。當(dāng)前,美國(guó)在先進(jìn)算力領(lǐng)域居于領(lǐng)先地位,國(guó)產(chǎn)算力在性能、生態(tài)成熟度、市場(chǎng)占有率等方面尚有差距。我國(guó)大模型產(chǎn)業(yè)雖成果領(lǐng)先、應(yīng)用廣泛,但模型的訓(xùn)練嚴(yán)重依賴國(guó)外芯片。高塔看似巍然,卻建立在別人的地基之上。
近一年,全球大模型競(jìng)爭(zhēng)愈演愈烈,美國(guó)AI技術(shù)封鎖持續(xù)加碼,試圖拖慢中國(guó)AI發(fā)展腳步。此時(shí),昇騰用萬卡集群訓(xùn)練準(zhǔn)萬億模型,可謂一次成功突圍。
這項(xiàng)重大突破絕非一蹴而就,而是歸功于華為長(zhǎng)期堅(jiān)持做“難而正確”的事??萍奸L(zhǎng)跑比拼的是耐心和定力。華為近十年研發(fā)累計(jì)投入12490億元,2024年更高達(dá)1797億元,占全年收入的20.8%。持續(xù)、高強(qiáng)度的研發(fā)投入,為技術(shù)突破注入不竭動(dòng)力。
而要做成“難而正確”的事,自主創(chuàng)新是唯一道路。昇騰的最大亮點(diǎn)是系統(tǒng)工程創(chuàng)新,即通過以數(shù)學(xué)補(bǔ)物理、以集群計(jì)算能力補(bǔ)單芯片短板等路徑,形成強(qiáng)大算力,并以算法優(yōu)化降低對(duì)硬件的依賴,實(shí)現(xiàn)整體性能領(lǐng)先。這些創(chuàng)新,為國(guó)產(chǎn)芯片的差異化競(jìng)爭(zhēng)開辟了新路徑。
事實(shí)上,長(zhǎng)期以來,為解“卡脖子”之痛,一代代科技工作者一直在做“難而正確”之事,當(dāng)行而行、無所怨悔。從1994年北斗一號(hào)啟動(dòng)到2020年北斗三號(hào)開通,我國(guó)終成世界上第三個(gè)獨(dú)立擁有全球衛(wèi)星導(dǎo)航系統(tǒng)的國(guó)家;從2007年大飛機(jī)立項(xiàng)到2023年商業(yè)首航,15年艱辛探索才有C919一飛沖天;2015年至今,華為原生鴻蒙操作系統(tǒng)從無到有、從有到優(yōu),實(shí)現(xiàn)操作系統(tǒng)自主可控……
人生萬事須自為,跬步江山即寥廓。突破核心技術(shù)絕不能“等靠要”。當(dāng)今時(shí)代,科技革命與大國(guó)博弈相互交織,唯有知難而進(jìn),堅(jiān)定做“難而正確”的事,才能不斷打開科技事業(yè)發(fā)展新局面,贏得科技競(jìng)爭(zhēng)和未來發(fā)展的戰(zhàn)略主動(dòng)。