摘 要:近年來(lái),以ChatGPT、文心一言等為代表的人工智能大模型相繼發(fā)布,其能力快速迭代更新,標(biāo)志著人工智能技術(shù)的重大飛躍。這些大模型不僅僅是技術(shù)創(chuàng)新的前沿成果,更是推動(dòng)產(chǎn)業(yè)革新、激發(fā)經(jīng)濟(jì)新模式、培育發(fā)展新動(dòng)能的新質(zhì)生產(chǎn)力。在產(chǎn)業(yè)發(fā)展浪潮和國(guó)家政策引導(dǎo)下,全國(guó)多地?fù)屪ゴ竽P蜋C(jī)遇,開展大模型創(chuàng)新算法及關(guān)鍵技術(shù)研究,致力于打造人工智能創(chuàng)新高地。然而,與歐美發(fā)達(dá)國(guó)家相比,我國(guó)大模型發(fā)展仍存在不少短板和弱項(xiàng)。同時(shí),地方在發(fā)展大模型產(chǎn)業(yè)過(guò)程中,也存在項(xiàng)目盲目跟風(fēng)等問(wèn)題。對(duì)此,各地應(yīng)立足區(qū)域發(fā)展基礎(chǔ),圍繞我國(guó)大模型技術(shù)演進(jìn)路線及存在短板,科學(xué)布局大模型產(chǎn)業(yè),協(xié)同做大做強(qiáng)我國(guó)人工智能產(chǎn)業(yè)。
關(guān)鍵詞:大模型;發(fā)展模式;算力;人工智能
當(dāng)前,人工智能技術(shù)的快速演進(jìn)將大模型推向了全球科技競(jìng)爭(zhēng)的制高點(diǎn),相關(guān)技術(shù)進(jìn)入成果爆發(fā)期,通用大模型、行業(yè)定制大模型、端側(cè)大模型蓬勃發(fā)展,使得大模型產(chǎn)業(yè)的應(yīng)用落地和商業(yè)化進(jìn)程顯著加速。這些模型不僅在技術(shù)上實(shí)現(xiàn)了突破,更在推動(dòng)各行各業(yè)的數(shù)字化轉(zhuǎn)型和智能化升級(jí)中發(fā)揮著核心作用,推動(dòng)人工智能發(fā)展的奇點(diǎn)時(shí)刻更快到來(lái)。大模型技術(shù)的發(fā)展呈現(xiàn)以下三個(gè)明顯趨勢(shì):
(一)模型訓(xùn)練算力增長(zhǎng)速度超越摩爾定律
隨著大模型參數(shù)規(guī)模的持續(xù)增大,其算力需求也快速增長(zhǎng),相較于深度學(xué)習(xí)時(shí)代,大模型的整體算力需求已實(shí)現(xiàn)2-3個(gè)數(shù)量級(jí)的躍遷。以英偉達(dá)為代表的人工智能芯片廠商加速推進(jìn)計(jì)算芯片創(chuàng)新升級(jí),在過(guò)去8年間,英偉達(dá)GPU單卡算力性能增長(zhǎng)了1000倍,遠(yuǎn)超芯片摩爾定律的晶體管數(shù)量每18個(gè)月翻一倍的增長(zhǎng)速度。未來(lái)10年將是人工智能算力的“超摩爾時(shí)代”,通過(guò)計(jì)算芯片、軟件棧、網(wǎng)絡(luò)等智能計(jì)算系統(tǒng)全域協(xié)同優(yōu)化,構(gòu)建出大型人工智能超算集群,將進(jìn)一步超越摩爾定律的約束。
(二)龍頭企業(yè)創(chuàng)新牽引推動(dòng)大模型創(chuàng)新
大模型發(fā)展浪潮主要由大模型算法企業(yè)和智能芯片設(shè)計(jì)企業(yè)共同主導(dǎo),技術(shù)門檻高,高科技龍頭企業(yè)的主體作用明顯。從大模型看,2022年年底引爆行業(yè)的ChatGPT以及2024年爆火的Sora均由OpenAI公司研發(fā)推出,受業(yè)界廣泛認(rèn)可的開源大模型LLaMA系列由Meta公司推出。國(guó)內(nèi)的ChatGLM、通義千問(wèn)、文心一言等也均由人工智能領(lǐng)軍企業(yè)研發(fā)推出。從智能芯片來(lái)看,英偉達(dá)、AMD等龍頭企業(yè)主導(dǎo)并推動(dòng)了算力變革,國(guó)內(nèi)華為、摩爾線程等企業(yè)也在加速追趕。
(三)高質(zhì)量數(shù)據(jù)集支撐模型訓(xùn)練
大量高質(zhì)量的數(shù)據(jù)是人工智能訓(xùn)練和學(xué)習(xí)的基礎(chǔ),數(shù)據(jù)對(duì)于人工智能就如同燃料對(duì)于引擎,豐富的數(shù)據(jù)能讓模型更好地理解和識(shí)別各種模式,隨著數(shù)據(jù)的不斷積累和更新,模型還可以持續(xù)進(jìn)化并提升性能,更好地適應(yīng)不斷變化的環(huán)境和需求。OpenAI公司為迭代升級(jí)GPT模型,投入大量資金和人力建立高質(zhì)量數(shù)據(jù)集,從維基百科、電子書、新聞網(wǎng)站、博客、推特和Reddit等平臺(tái)和論壇中搜羅了大量數(shù)據(jù)用于模型訓(xùn)練,數(shù)據(jù)要素產(chǎn)業(yè)也因此迎來(lái)了發(fā)展風(fēng)口。
隨著人工智能領(lǐng)域中大模型技術(shù)的快速發(fā)展,我國(guó)各地方政府紛紛出臺(tái)相關(guān)支持政策,加快推動(dòng)大模型產(chǎn)業(yè)的持續(xù)發(fā)展,但在發(fā)展過(guò)程中也面臨一些挑戰(zhàn)和瓶頸。
(一)區(qū)域分布上,全國(guó)形成三大聚集區(qū)
目前,我國(guó)已經(jīng)形成了京津冀、長(zhǎng)三角、珠三角三大產(chǎn)業(yè)集聚發(fā)展區(qū),涌現(xiàn)出一批行業(yè)龍頭和獨(dú)角獸企業(yè),推動(dòng)我國(guó)人工智能產(chǎn)業(yè)集群快速發(fā)展,其中,北京在全國(guó)優(yōu)勢(shì)突出?!吨袊?guó)新一代人工智能科技產(chǎn)業(yè)發(fā)展報(bào)告2023》顯示,在全國(guó)2200家人工智能骨干企業(yè)中,北京的企業(yè)數(shù)量占比為28.09%,位居全國(guó)第一。全國(guó)已有117家“大模型”完成備案,其中北京市51個(gè)、上海市24個(gè),廣州市9個(gè)、深圳市8個(gè)、杭州市7個(gè),其他城市備案數(shù)量均不超過(guò)2個(gè)。賽迪顧問(wèn)發(fā)布的《中國(guó)人工智能區(qū)域競(jìng)爭(zhēng)力研究報(bào)告(2024)》顯示,我國(guó)31個(gè)?。ㄊ?、區(qū))人工智能發(fā)展分為四個(gè)梯隊(duì),其中北京、廣東、上海形成的引領(lǐng)者梯隊(duì)具備明顯優(yōu)勢(shì);浙江、江蘇、山東、湖南構(gòu)成的挑戰(zhàn)者梯隊(duì)已初步形成區(qū)域特色產(chǎn)業(yè);安徽、四川、天津組成的期待者梯隊(duì)產(chǎn)業(yè)基礎(chǔ)較為扎實(shí);其余19個(gè)?。ㄊ?、區(qū))處于跟隨者梯隊(duì)。
(二)算力、算法、數(shù)據(jù)三大要素方面依然存在短板
算力方面,發(fā)展供需不平衡、“大而不強(qiáng)”的現(xiàn)象仍然存在,主要表現(xiàn)在芯片關(guān)鍵技術(shù)受制于人,我國(guó)算力關(guān)鍵技術(shù)面臨“卡脖子”問(wèn)題,超算算力和智算算力總體規(guī)模較小。算法方面,與歐美國(guó)家相比,國(guó)內(nèi)企業(yè)仍然存在差距,底層架構(gòu)設(shè)計(jì)方面,目前國(guó)內(nèi)外大模型訓(xùn)練時(shí)均采用谷歌公司的Transformer模型,國(guó)內(nèi)尚沒有類似的底層架構(gòu),大模型的預(yù)訓(xùn)練方面只能“在別人的地基上蓋房子”。在大模型的迭代升級(jí)、更新?lián)Q代方面,國(guó)內(nèi)企業(yè)也普遍落后于歐美企業(yè),競(jìng)爭(zhēng)劣勢(shì)較為明顯。數(shù)據(jù)方面,雖然我國(guó)的數(shù)據(jù)量很大,但產(chǎn)業(yè)化發(fā)展還存在不足,相對(duì)標(biāo)準(zhǔn)化的數(shù)據(jù)服務(wù)商較少,數(shù)據(jù)質(zhì)量普遍較低,存在不少噪音和錯(cuò)誤,使得大模型的訓(xùn)練面臨巨大挑戰(zhàn),影響了模型的準(zhǔn)確性和穩(wěn)定性。
(三)演進(jìn)路線上,垂直行業(yè)應(yīng)用成為競(jìng)爭(zhēng)關(guān)鍵賽道
通用大模型的國(guó)內(nèi)應(yīng)用主要圍繞寫作、作圖等淺層階段,而深入場(chǎng)景、靠用戶驅(qū)動(dòng)的行業(yè)大模型將會(huì)迎來(lái)爆發(fā)式增長(zhǎng)。與通用大模型相比,垂直行業(yè)大模型能夠更直接地深入特定行業(yè)與業(yè)務(wù)場(chǎng)景,更精準(zhǔn)地滿足行業(yè)特定需求,彌補(bǔ)通用大模型無(wú)法最優(yōu)化適配到垂直行業(yè)中的不足。國(guó)內(nèi)大模型的發(fā)展路徑是“通用+垂直”雙軌并行,其中垂直類大模型落地速度最快。通過(guò)通用大模型企業(yè)和行業(yè)頭部企業(yè)的聯(lián)合創(chuàng)新,教育、旅游、醫(yī)療、汽車、化工、生物醫(yī)藥等垂直行業(yè)大模型大量出現(xiàn)。2023年12月,中國(guó)信通院發(fā)布的《2023大模型落地應(yīng)用案例集》評(píng)選出52個(gè)大模型商業(yè)落地優(yōu)秀示范,其中超過(guò)65%為垂直行業(yè)應(yīng)用。
當(dāng)前,我國(guó)大模型發(fā)展勢(shì)頭迅猛,各地和各大企業(yè)紛紛加大對(duì)大模型的布局,但部分地方仍簡(jiǎn)單地將發(fā)展大模型歸結(jié)于硬件投資,盲目跟風(fēng)上項(xiàng)目,很可能導(dǎo)致大模型項(xiàng)目的過(guò)度投資、重復(fù)布局和低效建設(shè)。從全國(guó)發(fā)展布局來(lái)看,一方面發(fā)展大模型門檻高、投入大,人才素質(zhì)要求高,在我國(guó)眾多地區(qū)不具備研發(fā)和培育通用大模型的基礎(chǔ)條件。另一方面,我國(guó)大模型在算力、數(shù)據(jù)和應(yīng)用等多方面仍存在短板,產(chǎn)業(yè)化水平不高。各地發(fā)展除了需要聚焦大模型本身,更應(yīng)立足區(qū)域發(fā)展水平和企業(yè)發(fā)展條件,合理布局發(fā)展大模型產(chǎn)業(yè)鏈,聯(lián)合做大做強(qiáng)我國(guó)大模型產(chǎn)業(yè)。
通過(guò)地方實(shí)踐,我國(guó)大模型產(chǎn)業(yè)初步形成了三種主要發(fā)展模式,即產(chǎn)業(yè)聚集和技術(shù)創(chuàng)新模式、行業(yè)應(yīng)用導(dǎo)向模式以及資源要素導(dǎo)向模式。
(一)產(chǎn)業(yè)聚集和技術(shù)創(chuàng)新模式
以北京市、上海市和深圳市等地區(qū)為典型代表,此類地區(qū)是我國(guó)大模型產(chǎn)業(yè)發(fā)展的高地和聚集區(qū),科研實(shí)力強(qiáng)大,人工智能軟硬件優(yōu)勢(shì)突出。在推進(jìn)路徑上,此類地區(qū)應(yīng)重點(diǎn)推進(jìn)大模型基礎(chǔ)理論研究和關(guān)鍵技術(shù)的突破,建設(shè)具有全國(guó)影響力的數(shù)據(jù)要素市場(chǎng)、打造優(yōu)質(zhì)數(shù)據(jù)流通產(chǎn)業(yè)生態(tài),研發(fā)具有全球影響力的通用大模型底座。此外,全面推動(dòng)軟件企業(yè)融入大模型,引導(dǎo)行業(yè)領(lǐng)域開放應(yīng)用場(chǎng)景,以“通用大模型+行業(yè)模型+軟件生態(tài)”等多要素合力建設(shè)大模型產(chǎn)業(yè)集群。
以北京市為例,北京致力于打造大模型之都,預(yù)計(jì)2025年基本形成要素齊全、技術(shù)領(lǐng)先、生態(tài)完備的通用人工智能大模型產(chǎn)業(yè)發(fā)展格局。在推進(jìn)路徑上,北京市將推動(dòng)人工智能大模型創(chuàng)新體系發(fā)展作為重點(diǎn)任務(wù),通過(guò)揭榜掛帥、創(chuàng)新聯(lián)合體等方式,支持新型研發(fā)機(jī)構(gòu)、領(lǐng)軍企業(yè)、創(chuàng)新型企業(yè)等各類創(chuàng)新主體攻關(guān)大模型全流程關(guān)鍵核心技術(shù),推進(jìn)開源開放,打造全棧國(guó)產(chǎn)化人工智能體系。此外,北京市重點(diǎn)圍繞提升算力資源供給、提升高質(zhì)量數(shù)據(jù)要素、推動(dòng)創(chuàng)新場(chǎng)景應(yīng)用等維度全面構(gòu)建全產(chǎn)業(yè)鏈生態(tài)。
(二)行業(yè)應(yīng)用導(dǎo)向模式
以重慶市、武漢市和蘇州市等地區(qū)為典型代表,此類地區(qū)人工智能產(chǎn)業(yè)鏈相對(duì)完善,已形成一批具備競(jìng)爭(zhēng)力的人工智能產(chǎn)品和行業(yè)解決方案,同時(shí),這些地區(qū)傳統(tǒng)產(chǎn)業(yè)基礎(chǔ)雄厚,應(yīng)用場(chǎng)景豐富,為大模型的應(yīng)用提供了廣闊空間。在推進(jìn)路徑上,重點(diǎn)以行業(yè)模型和高質(zhì)量行業(yè)數(shù)據(jù)集為抓手,推進(jìn)大模型在行業(yè)的應(yīng)用示范,以提供軟硬件一體化解決方案為目標(biāo)進(jìn)行招商和布局產(chǎn)業(yè),占據(jù)產(chǎn)業(yè)鏈高端環(huán)節(jié)。
以武漢市為例,武漢市是我國(guó)中部地區(qū)首個(gè)軟件名城,在基礎(chǔ)軟件、工業(yè)軟件、嵌入式系統(tǒng)、遙感解譯、地理信息等領(lǐng)域優(yōu)勢(shì)突出,已形成涵蓋基礎(chǔ)層、技術(shù)層、應(yīng)用層的較為完整的人工智能產(chǎn)業(yè)鏈,在智能機(jī)器人、智能網(wǎng)聯(lián)汽車、機(jī)器視覺等領(lǐng)域形成了一批特色產(chǎn)品。但在發(fā)展大模型產(chǎn)業(yè)方面,武漢市有影響力的大模型龍頭企業(yè)較少,缺乏有影響力且能夠面向用戶提供服務(wù)的大模型,本地的人工智能人才缺口較大,制約了當(dāng)?shù)卮竽P彤a(chǎn)業(yè)的發(fā)展。在發(fā)展路徑上,武漢市擬選取工業(yè)制造、醫(yī)療健康等重點(diǎn)行業(yè)領(lǐng)域開展數(shù)據(jù)產(chǎn)品開發(fā)利用,形成高價(jià)值數(shù)據(jù)集,推動(dòng)人工智能企業(yè)與各領(lǐng)域頭部企業(yè)合作,打造深度匹配行業(yè)需求的人工智能垂直領(lǐng)域大模型,在制造、醫(yī)療、教育、物流、城市治理等領(lǐng)域培育應(yīng)用場(chǎng)景,打造大中小場(chǎng)景協(xié)同發(fā)展體系,形成場(chǎng)景牽引大模型產(chǎn)業(yè)發(fā)展的良好局面。
(三)資源要素導(dǎo)向模式
以貴州、寧夏、內(nèi)蒙古等地區(qū)為典型代表,圍繞算力資源導(dǎo)向,由政府主導(dǎo)建設(shè)高水平的算力基礎(chǔ)設(shè)施,營(yíng)造有利的政策環(huán)境,依托區(qū)域能源稟賦和氣候優(yōu)勢(shì)構(gòu)建算力綜合成本優(yōu)勢(shì),以算力資源和價(jià)格進(jìn)行強(qiáng)有力的招商引資。一方面為落地的大模型龍頭企業(yè)提供配套產(chǎn)業(yè)和服務(wù),另一方面,依托全國(guó)一體化算力網(wǎng),將本地算力服務(wù)于全國(guó)大模型企業(yè)。圍繞數(shù)據(jù)要素資源導(dǎo)向,以大同、??诘鹊貐^(qū)為典型代表,通過(guò)建設(shè)全國(guó)數(shù)據(jù)標(biāo)注基地,助力行業(yè)大模型產(chǎn)業(yè)化。
以寧夏為例,寧夏氣候環(huán)境適宜,數(shù)據(jù)中心采用全自然風(fēng)冷,PUE值最低達(dá)到1.1,年平均氣溫8.8℃,全年環(huán)境優(yōu)良天數(shù)達(dá)280天以上,非常適宜建設(shè)全自然風(fēng)冷數(shù)據(jù)中心,是國(guó)家認(rèn)定的最適宜建設(shè)數(shù)據(jù)中心的一類地區(qū),同時(shí)其電力供給充足穩(wěn)定、價(jià)格優(yōu)惠,數(shù)據(jù)中心到戶電價(jià)不高于0.36元/千瓦時(shí)。在推進(jìn)路徑上,寧夏以智算來(lái)?yè)屨即竽P惋L(fēng)口,已建成我國(guó)西部唯一的算力和互聯(lián)網(wǎng)交換“雙中心”和全國(guó)首批“萬(wàn)卡級(jí)”智算基地,算網(wǎng)融合支持落地企業(yè)開展大規(guī)模模型訓(xùn)練,建成了全國(guó)首批人工智能芯片適配基地,可以為國(guó)產(chǎn)芯片提供測(cè)試、驗(yàn)證等服務(wù)。下一步,寧夏將盡快建成全國(guó)大型智算基地,依托“東數(shù)西算”,讓寧夏的電力變成全國(guó)的算力,支持全國(guó)大模型產(chǎn)業(yè)發(fā)展。
今年“人工智能+”首次被寫入《政府工作報(bào)告》,凸顯了以大模型為代表的人工智能技術(shù)已成為國(guó)家發(fā)展戰(zhàn)略的關(guān)鍵組成部分,因此前瞻布局大模型產(chǎn)業(yè)是各地區(qū)因地制宜發(fā)展新質(zhì)生產(chǎn)力的應(yīng)有之舉。當(dāng)前,大模型產(chǎn)業(yè)化進(jìn)程以前所未有的速度提檔推進(jìn),技術(shù)潛力與市場(chǎng)空間巨大,但實(shí)現(xiàn)與產(chǎn)業(yè)場(chǎng)景的深度融合離不開各方合作。面向未來(lái),我國(guó)需進(jìn)一步加強(qiáng)產(chǎn)業(yè)協(xié)同攻關(guān)和技術(shù)創(chuàng)新,在全國(guó)范圍內(nèi)強(qiáng)化算法、算力和數(shù)據(jù)以及通用大模型和行業(yè)模型等各層級(jí)生產(chǎn)力要素的統(tǒng)籌布局,從技術(shù)、市場(chǎng)、政策等多維度支持共同推動(dòng)我國(guó)大模型產(chǎn)業(yè)的突破性發(fā)展,打造新質(zhì)生產(chǎn)力重要引擎。
參考文獻(xiàn)
[1] 《北京市人工智能行業(yè)大模型創(chuàng)新應(yīng)用白皮書(2023年)》[J].中國(guó)信息安全,2023(12):92.
[2] 李論.大模型發(fā)展仍需系統(tǒng)布局,有序引導(dǎo)[J].通信世界,2023(14):7-7.
[3] 汪玉凱.“數(shù)據(jù)要素×”與“東數(shù)西算”:全國(guó)一體化算力網(wǎng)建設(shè)的關(guān)鍵[J].人民論壇,2024(08):52-56.
[4] 趙子忠,王喆.2023年國(guó)內(nèi)大模型發(fā)展綜述與趨勢(shì)研判[J].青年記者,2024(02):44-47.
[5] 肖仰華.生成式語(yǔ)言模型與通用人工智能:內(nèi)涵,路徑與啟示[J].學(xué)術(shù)前沿,2023(14):49-57.
[6] 陳嬋,韓栩仟.武漢數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展探索[J].合作經(jīng)濟(jì)與科技,2024(5):34-35.
[7] 石勇,劉平,馮錦源.“東數(shù)西算”寧夏節(jié)點(diǎn)數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)發(fā)展研究[J].大數(shù)據(jù),2023,9(05):100-110.
(作者單位:中國(guó)信息通信研究院工業(yè)互聯(lián)網(wǎng)與物聯(lián)網(wǎng)研究所 、中國(guó)信息通信研究院產(chǎn)業(yè)與規(guī)劃研究所)