汪玉 汝鵬 謝其軍
2023年7月,上海世博展覽館,2023世界人工智能大會上AIGC大模型應(yīng)用受到關(guān)注,一些觀眾在商湯展區(qū)與AI繪畫生成藝術(shù)互動。圖/視覺中國
今年以來,以ChatGPT為代表的AI大模型的出現(xiàn)標(biāo)志著一個嶄新時代的開啟。大模型技術(shù)的快速迭代催生出一批如Midjourney、Character.AI等類型的AIGC(Artificial Intelligence Generated Content)應(yīng)用,為辦公、電商、教育、醫(yī)療和法律等領(lǐng)域帶來了革命性的改變。
復(fù)雜的AI算法需要大量的計算資源來實現(xiàn),算力是支撐AI算法運行的基礎(chǔ)。AI芯片是專門用于處理AI計算相關(guān)任務(wù)的協(xié)處理器,為AI算法提供了高效的算力,可以顯著提升深度學(xué)習(xí)等AI算法模型的訓(xùn)練和推理效率。
AIGC產(chǎn)業(yè)的發(fā)展,對算力的需求不斷提升,但中國在算力領(lǐng)域面臨諸多挑戰(zhàn)。
2023年10月17日,美國商務(wù)部工業(yè)安全局(BIS)公布最新半導(dǎo)體管制規(guī)則(下稱“1017新規(guī)”),升級了BIS于2022年10月7日發(fā)布的《對向中國出口的先進計算和半導(dǎo)體制造物項實施新的出口管制》(下稱“107規(guī)則”)。1017新規(guī)分為三個部分:一是調(diào)整先進計算芯片出口管制規(guī)則,二是調(diào)整半導(dǎo)體制造設(shè)備出口管制規(guī)則;三是公布了新增的實體清單企業(yè)名單。包括A100、H100、A800、H800等在內(nèi)的GPU芯片對華出口都將受到影響。A100、H100是英偉達的高性能GPU,廣泛應(yīng)用于AI、數(shù)據(jù)分析等工作場景。A800和H800是A100、H100的替代產(chǎn)品,也即在去年美國107規(guī)則下,英偉達特供給中國大陸市場的,降低傳輸速率以符合規(guī)定的替代產(chǎn)品,但在今年1017新規(guī)后被禁售。上述產(chǎn)品均是目前最適合AI算法研發(fā)和部署的高算力芯片。
中國在AI領(lǐng)域?qū)λ懔τ兄鴱姶蟮男枨螅蕾嚫咝阅蹵I芯片來支持其應(yīng)用和研究。1017新規(guī)取消了“互聯(lián)帶寬”參數(shù)限制,同時新增“性能密度”的參數(shù)限制。該新規(guī)旨在進一步收窄高端計算芯片的出口范圍;在大模型AI時代,限制中國計算能力,將會限制AIGC在中國的發(fā)展和創(chuàng)新。
本文將逐一解讀中國算力面臨的主要挑戰(zhàn),包括芯片架構(gòu)的性能提升到達瓶頸、現(xiàn)有芯片的算力利用率不足、美國出口管制帶來的供應(yīng)鏈風(fēng)險。進而分析破局之策,在軟件方面優(yōu)化模型和算法,降低算力需求;在硬件方面開發(fā)新架構(gòu),提高AI芯片能效比;在系統(tǒng)方面協(xié)同整合軟硬件,提升系統(tǒng)效率,減少能源消耗;在產(chǎn)業(yè)方面加強生態(tài)鏈建設(shè)與多方協(xié)作,推動共同投入。
當(dāng)前中國大模型技術(shù)仍處于研發(fā)和迭代的早期階段,但產(chǎn)業(yè)潛力巨大。中國的高校、互聯(lián)網(wǎng)科技企業(yè)、初創(chuàng)科技公司等都紛紛加入AI大模型的浪潮,已誕生超過100個各種類型的大模型。
根據(jù)艾瑞咨詢的預(yù)測,2023年中國的AIGC產(chǎn)業(yè)規(guī)模將達到143億元,未來幾年增長迅速。預(yù)計到2028年,中國AIGC產(chǎn)業(yè)規(guī)模將達到7202億元,在重點領(lǐng)域和關(guān)鍵場景完成技術(shù)落地。
AIGC技術(shù)在NLP(自然語言處理)和CV(計算機視覺)領(lǐng)域經(jīng)歷了顯著的演進。AIGC技術(shù)和能力的提升,會為各行業(yè)帶來更多的創(chuàng)新和應(yīng)用機會,主要表現(xiàn)在:
從單一任務(wù)到多任務(wù)。初始AIGC技術(shù)主要關(guān)注單一任務(wù),如自然語言生成、圖像生成和翻譯。但未來趨勢是訓(xùn)練模型同時處理多種任務(wù),并提高模型的泛化能力。
從單模態(tài)到多模態(tài)。單模態(tài)生成式模型通常專注于一種數(shù)據(jù)類型,如文本或圖像。多模態(tài)生成式模型能夠同時處理多種數(shù)據(jù)類型,如文本和圖像的聯(lián)合生成,為增強現(xiàn)實、智能對話系統(tǒng)和自動文檔生成等多領(lǐng)域的應(yīng)用帶來新機會。
從通用模型到垂域模型。通用生成式模型在各領(lǐng)域表現(xiàn)出色,但未來趨勢是朝著更專業(yè)化和垂域化的方向前進。
隨著AIGC的發(fā)展,模型越來越復(fù)雜,參數(shù)量越來越大,導(dǎo)致算力需求的增長速度已遠(yuǎn)超芯片的性能增長速度。在AIGC算法模型部署早期,算力消耗主要集中于大模型訓(xùn)練,但隨著大模型用戶量增長,推理成本將成為主要算力開支。
AIGC對算力的具體需求,以三個典型應(yīng)用場景加以說明:
若Google采用GPT等大模型用于推薦搜索:Google每天接受搜索請求35億次,按照GPT-4 API 0.14元/次的價格,Google每年需要支付1788億元人民幣的API費用。若采用自建算力集群的方案,需要提供每秒約10萬次的峰值訪問能力,一輪GPT-4對話涉及200多萬億次浮點運算,在計算資源利用率約60%的情況下,需要約10萬塊A100集群。
若每個MicrosoftOffice用戶都采用大模型用于辦公:微軟使用基于大模型的Copilot賦能辦公軟件、操作系統(tǒng)與代碼編輯場景,有潛力重構(gòu)未來辦公場景。未來的軟件開發(fā)、文案寫作、藝術(shù)創(chuàng)作將在與AI的頻繁互動對話中完成。根據(jù)信息技術(shù)研究公司的報告《中國數(shù)據(jù)分析與AI技術(shù)成熟度曲線》,中國的學(xué)生與白領(lǐng)人群達到2.8億人,按每人每天10次的訪問需求計算,每年具有1.02萬億次訪問需求,需要8萬塊A100的算力支持。
若人人都有一個定制化的AI個人助理(大模型原生應(yīng)用),AI個人助理向中國12億網(wǎng)民提供定制化的教育、醫(yī)療、政務(wù)、財務(wù)管理等服務(wù)。在每人10次的日訪問條件下,需要34萬塊A100算力支持。
根據(jù)AMD全球CEO(首席執(zhí)行官)蘇姿豐在2023年的主題演講,從單一算力中心的角度看,過去十年,超級計算機發(fā)展迅速,芯片架構(gòu)創(chuàng)新與制造工藝的進步使得計算機性能每1.2年翻一番。而計算機的能量效率(即單位能量下的計算次數(shù))增長速度僅為每2.2年翻一番。在保持這個趨勢的情況下,到2035年,一個高性能的超級計算機功率將達到500MW,約為半個核電站的發(fā)電功率。
AIGC嚴(yán)重依賴于高算力,但目前中國在算力方面卻遇到了極大挑戰(zhàn)。
半導(dǎo)體器件的尺寸已逼近物理極限,而制程進步帶來的性能提升幅度在收窄。芯片能效比增速明顯放緩,更高的晶體管密度也帶來更大的散熱挑戰(zhàn)與更低的生產(chǎn)良率。目前AIGC對算力的需求遠(yuǎn)遠(yuǎn)超過AI芯片的發(fā)展速度,現(xiàn)有的芯片硬件性能的提升速度難以滿足算法模型急劇增長的算力需求,需要新的硬件架構(gòu)突破。
大模型在處理大量數(shù)據(jù)時,由于算力調(diào)度、系統(tǒng)架構(gòu)、算法優(yōu)化等諸多問題,很多大模型企業(yè)的GPU算力利用率不足50%,造成了巨大的浪費。
目前主流的AI算法都是基于英偉達CUDA進行適配,英偉達的CUDA軟件自2006年問世以來,經(jīng)過十多年的積累,形成了包括驅(qū)動、編譯、框架、庫、編程模型等在內(nèi)的成熟生態(tài)。目前主流AIGC算法訓(xùn)練,大多基于CUDA生態(tài)進行開發(fā),壁壘極強。AIGC公司若要更換英偉達GPU,面臨極高的遷移成本和穩(wěn)定性的風(fēng)險。因此國產(chǎn)GPGPU產(chǎn)品想要大規(guī)模部署,軟件生態(tài)是一個極大挑戰(zhàn)。
資料來源:本文作者整理
資料來源:艾瑞咨詢研究院
資料來源:根據(jù)模型參數(shù)與算力由清華實驗室測算
大算力芯片是大模型研發(fā)的基礎(chǔ)設(shè)施,英偉達高性能GPU芯片具有兩個核心優(yōu)勢:一是更大的顯存配置與通信帶寬。高帶寬的芯片之間互聯(lián)對提升大模型訓(xùn)練效率至關(guān)重要。二是更高的大模型訓(xùn)練耐用性。消費顯卡面向個人應(yīng)用,故障率和穩(wěn)定性遠(yuǎn)差于服務(wù)器版本。千億參數(shù)大模型訓(xùn)練需要數(shù)千GPU長周期同步運算,任何單一顯卡的故障均需要中斷訓(xùn)練、檢修硬件。相比于消費級顯卡或其他芯片,高性能GPU可以減短60%-90%大模型訓(xùn)練周期。
然而,英偉達GPU產(chǎn)能不足,且美國逐漸加碼對中國高性能芯片禁售力度。去年10月,美國對出口中國的AI芯片實施帶寬速率限制,其中,涉及英偉達A100和H100芯片。此后,英偉達向中國企業(yè)提供替代版本A800和H800。根據(jù)1017新規(guī),英偉達包括A800和H800在內(nèi)的芯片對華出口都將受到影響,國內(nèi)的高性能AI芯片供給出現(xiàn)嚴(yán)重短缺。
目前大模型訓(xùn)練主要依賴于英偉達高性能GPU,禁售對于國內(nèi)大模型研發(fā)進度,帶來極大影響。例如,使用符合1017新規(guī)的V100 GPU替代A100,算力和帶寬的下降將使得大模型訓(xùn)練時間增加3到6倍,顯存的下降也將使能訓(xùn)練模型的最大參數(shù)量下降2.5倍。
美國將先進芯片的出口許可證要求增加到22個國家。繼先前限制EUV光刻機出口到中國之后,也開始限制更低一代的DUV光刻機。此外,美商務(wù)部將中國本土領(lǐng)先的GPU芯片企業(yè)加入到實體清單中,這將會導(dǎo)致國內(nèi)自研芯片難以使用最新的工藝制程進行流片量產(chǎn)。
算力中心的計算、制冷與通信設(shè)施均為高能耗硬件。中國電子節(jié)能技術(shù)協(xié)會數(shù)據(jù)顯示,目前中國數(shù)據(jù)中心的耗電量平均增長率超過12%,2022年全國數(shù)據(jù)中心耗電量達2700億千瓦時,占全社會用電量的3%。在大模型時代,中國數(shù)據(jù)中心耗電量會加大增長幅度,并在2025年預(yù)計達到4200億千瓦時耗電量,約占社會總用電量的5%。數(shù)據(jù)中心的電力供應(yīng)以及系統(tǒng)散熱,都將給現(xiàn)有的電力系統(tǒng)帶來很大的壓力。
面對不利局面,中國的算力瓶頸需要以系統(tǒng)觀念統(tǒng)籌謀劃,逐步突破,主要包含技術(shù)和產(chǎn)業(yè)兩個層面,方式主要是“開源”和“節(jié)流”。
技術(shù)層面,我們的建議如下:
通過精簡模型參數(shù)的方式降低對算力的需求。壓縮即智能,大模型旨在對數(shù)據(jù)進行無損壓縮。今年2月28日OpenAI核心研發(fā)人員Jack Rae表示,通用AI(AGI)的目標(biāo)是實現(xiàn)對有效信息最大限度的無損壓縮。隨著大模型發(fā)展,在AI復(fù)雜性提升的同時,相同參數(shù)規(guī)模下,算法模型能力也會持續(xù)提升。未來或出現(xiàn)具有更高信息壓縮效率的大模型,以百億級參數(shù)規(guī)模獲取媲美萬億級參數(shù)規(guī)模GPT-4的算法能力。
此外,大模型可以面向特定業(yè)務(wù)場景做領(lǐng)域適配和能力取舍,減少算力開支。例如在政務(wù)問答場景中,模型可以謝絕回答非業(yè)務(wù)請求。原本依靠千億參數(shù)通用模型才可以解決的任務(wù),有望使用百億參數(shù)量模型即可完成。
如果將GPT-3前后的AI發(fā)展劃分成1.0與2.0時代,那么AI 1.0時代的軟件優(yōu)化核心任務(wù)是使深度學(xué)習(xí)模型可以在邊緣、端側(cè)的低功耗設(shè)備上運行,實現(xiàn)自動化與智能化,以在AIoT、智能安防與智能汽車等領(lǐng)域大面積應(yīng)用。而AI 2.0時代的模型壓縮則是規(guī)?;⒓谢懔π枨蟮恼w優(yōu)化,應(yīng)用場景需要從“中心”側(cè)開始,然后向邊、端側(cè)輻射。
模型壓縮是最直接降低算法算力需求的方法,這一AI1.0時代的技術(shù)在AI2.0時代也將得到繼承與發(fā)展。
剪枝利用了深度學(xué)習(xí)模型參數(shù)冗余的特點,將對準(zhǔn)確率影響小的權(quán)重裁剪,保留網(wǎng)絡(luò)主干并降低整體計算開支。在AI2.0時代中,Transformer算法模型在長序列輸入的情況下,計算延時的瓶頸在注意力機制算子,通過對注意力機制算子的激活值進行裁剪,目前可達到2倍的端到端的加速比,未來有望進一步加速。
參數(shù)量化利用了GPU處理定點數(shù)的等效算力顯著高于浮點數(shù)計算算力的優(yōu)勢,利用16比特、8比特、4比特定點數(shù)替代32比特浮點數(shù),有望同步降低推理算力需求。
算子融合(Operator Fusion)將多個算子融合成一個算子,提高中間張量數(shù)據(jù)的訪問局部性,以減少內(nèi)存訪問,解決內(nèi)存訪問瓶頸問題。算子循環(huán)空間的設(shè)計與尋優(yōu)則通過將計算圖中的算子節(jié)點進行并行編排,提升整體計算并行度。
總之,通過對現(xiàn)有大模型進行壓縮和量化,可以顯著減少模型參數(shù)量、降低模型計算復(fù)雜度,節(jié)約存儲空間,目前可提升2倍-3倍的計算效率。在降低大模型響應(yīng)用戶的延遲的同時,模型優(yōu)化技術(shù)更可以將大模型高效部署在汽車、個人電腦、手機、AIoT等邊、端側(cè)設(shè)備中,支持具有高實時、隱私保護、安全性等特點的本地大模型應(yīng)用。
傳統(tǒng)計算芯片的能效到達瓶頸,需要通過對芯片架構(gòu)、互聯(lián)、封裝的改進,從而實現(xiàn)更高的能效。目前主要的方式是數(shù)據(jù)流架構(gòu)、存算一體、Chiplet技術(shù)等。
數(shù)據(jù)流架構(gòu):通過數(shù)據(jù)流流動次序來控制計算順序,消除指令操作導(dǎo)致的額外時間開銷。數(shù)據(jù)流架構(gòu)能夠?qū)崿F(xiàn)高效流水線運算,同時可并行執(zhí)行數(shù)據(jù)訪問和數(shù)據(jù)計算,進一步減少計算單元的空閑時間,充分利用芯片的計算資源。與指令集架構(gòu)不同的數(shù)據(jù)流架構(gòu),使用專用數(shù)據(jù)通道連接不同類型的高度優(yōu)化的計算模塊。利用分布式的本地存儲,數(shù)據(jù)讀寫與計算同時進行,節(jié)省了數(shù)據(jù)傳輸時間和計算時間。
存算一體:存算一體芯片的核心是將存儲與計算完全融合,利用新興存儲器件與存儲器陣列電路結(jié)構(gòu)設(shè)計,將存儲和計算功能集成在同一個存儲芯片上,消除了矩陣數(shù)據(jù)在存儲和計算單元中的數(shù)據(jù)搬運,從而高效支持智能算法中的矩陣計算,在同等工藝上大幅提升計算芯片的“性能密度”。
資料來源:清華大學(xué)電子工程系NICS-efc實驗室實驗結(jié)果
Chiplet技術(shù):傳統(tǒng)集成電路將大量晶體管集成制造在一個硅襯底的二維平面上,從而形成芯片。集成芯片是指先將晶體管等元器件集成制造為特定功能的芯粒(Chiplet),再按照應(yīng)用需求將芯粒通過半導(dǎo)體技術(shù)集成制造為芯片。Chiplet技術(shù)可以實現(xiàn)更大的芯片面積,提升總算力;通過chiplet/IP等的復(fù)用和組合,提升芯片的設(shè)計效率;把大芯片拆成多個小尺寸chiplet,提升良率,降低成本;不同芯??梢酝ㄟ^不同工藝完成制備,通過異構(gòu)實現(xiàn)更高性能。
全新的計算架構(gòu),可以打破現(xiàn)有芯片的存儲墻和互聯(lián)墻,將更多算力單元高密度、高效率、低功耗地連接在一起,極大提高異構(gòu)核之間的傳輸速率,降低數(shù)據(jù)訪問功耗和成本,從而為大模型提供高算力保障。
在大模型系統(tǒng)中,軟硬件協(xié)同對于實現(xiàn)高性能和高能效至關(guān)重要。通過稀疏+混合精度+多樣算子的高效架構(gòu)設(shè)計、算法優(yōu)化、系統(tǒng)資源管理、軟件框架與硬件平臺的協(xié)同以及系統(tǒng)監(jiān)控與調(diào)優(yōu)等技術(shù),可以更好發(fā)揮整個算力系統(tǒng)的優(yōu)勢。
在大模型訓(xùn)練方面,由于訓(xùn)練所需的算力與存儲開銷巨大,多卡互聯(lián)的高性能集群計算系統(tǒng)是大模型訓(xùn)練的必然途徑。英偉達高性能GPU的供應(yīng)鏈在中國受到制約,國產(chǎn)化芯片單卡性能受工藝限制,如何使用萬卡規(guī)模的國產(chǎn)化芯片進行可靠、穩(wěn)定的大模型訓(xùn)練將是一個必須解決的關(guān)鍵問題。除了提高計算系統(tǒng)規(guī)模外,還需開展軟硬件協(xié)同的高效微調(diào)方案研究,降低大模型訓(xùn)練與微調(diào)的硬件資源開銷。
在大模型系統(tǒng)中,有效的系統(tǒng)資源管理對于確保高性能和高效率至關(guān)重要。這包括合理分配計算資源(如CPU、GPU等),優(yōu)化內(nèi)存管理和數(shù)據(jù)傳輸策略,以降低延遲和提高吞吐量。
為了實現(xiàn)軟硬件協(xié)同,深度學(xué)習(xí)軟件框架需要與硬件平臺緊密配合。這包括針對特定硬件平臺進行優(yōu)化,以充分利用其計算能力和存儲資源,以及提供易用的API和工具,以簡化模型訓(xùn)練和部署過程。
由于AI算法模型參數(shù)量與計算復(fù)雜度急劇提升,大模型訓(xùn)練需要大規(guī)??绻?jié)點的多卡集群,其硬件挑戰(zhàn)來自計算、存儲、通信。構(gòu)建一個千卡規(guī)模的大模型數(shù)據(jù)中心,成本高達上億元,很多初創(chuàng)公司難以承受。為解決上述難題,降低數(shù)據(jù)中心建設(shè)成本,亟待構(gòu)建集中算力中心,整合不同架構(gòu)的異構(gòu)芯片,實現(xiàn)滿足各類應(yīng)用場景需求的大算力平臺。統(tǒng)一的大模型中間層,向上可以適配不同垂直領(lǐng)域大模型,向下可以兼容不同國產(chǎn)AI芯片,從而提升異構(gòu)算力平臺的使用效率,降低用戶在不同模型、不同芯片之間的遷移成本,是解決大模型時代算力挑戰(zhàn)的關(guān)鍵方向之一。
“性能密度”這一核心指標(biāo),是由制造工藝、芯片設(shè)計水平、先進封裝等多個層面協(xié)同之后的作用。在當(dāng)前國內(nèi)對3nm/5nm等先進制造工藝獲取受限的背景下,需要持續(xù)攻關(guān)先進制造工藝環(huán)節(jié)中的重要設(shè)備和材料,如DUV/EUV光刻機、光刻膠等。
在碳中和背景下,應(yīng)對算力中心極高的能耗需求,“數(shù)據(jù)中心+清潔電力+儲能”將是必要發(fā)展的路徑。數(shù)據(jù)中心將成為負(fù)荷可變、可調(diào)的復(fù)合體,以便于響應(yīng)發(fā)電、電網(wǎng)側(cè)需求,并通過參與電力交易實現(xiàn)智能化“削峰填谷”套利,降低運營成本。
根據(jù)《數(shù)據(jù)中心能源十大趨勢白皮書》,高能耗算力中心無法依靠風(fēng)冷實現(xiàn)有效散熱,液冷將成為標(biāo)配,供水效率也成為算力中心的關(guān)鍵。傳統(tǒng)數(shù)據(jù)中心散熱的水資源消耗極大,對缺水地區(qū)的生態(tài)環(huán)境造成影響。水資源利用效率(WUE)成為國際關(guān)注的重要參考指標(biāo),無水或少水的制冷技術(shù)是未來的發(fā)展趨勢。
資料來源:2023集成芯片與芯粒技術(shù)白皮書
資料來源:清華大學(xué)電子工程系NICS-efc實驗室實驗結(jié)果
產(chǎn)業(yè)層面,我們則有以下建議:
1)加強頂層設(shè)計,謀劃算力產(chǎn)業(yè)的戰(zhàn)略部署;日前,工信部等六部門聯(lián)合印發(fā)《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計劃》,加強對算力產(chǎn)業(yè)的頂層設(shè)計,但仍需要進一步加強整體性謀劃。建議在現(xiàn)有相關(guān)領(lǐng)導(dǎo)小組中設(shè)置算力發(fā)展委員會(或聯(lián)席會),秉持適時適度干預(yù)立場,加強算力發(fā)展的頂層設(shè)計,健全信息交換機制,形成統(tǒng)一協(xié)調(diào)的決策機制。
2)優(yōu)化空間布局,整體性推進算力基礎(chǔ)設(shè)施建設(shè);在貫徹落實“十四五”相關(guān)規(guī)劃的基層上,加強一體化算力網(wǎng)絡(luò)國家樞紐節(jié)點建設(shè),針對京津冀、長三角、粵港澳大灣區(qū)等關(guān)鍵算力節(jié)點,有序按需推進算力基礎(chǔ)設(shè)施建設(shè),著力推動已建及新建算力設(shè)施利用率。
3)布局引領(lǐng)項目,提升行業(yè)共性關(guān)鍵技術(shù)儲備。發(fā)揮國家科技計劃的標(biāo)志性引領(lǐng)性作用,可考慮在國家自然科學(xué)基金啟動一批項目,開展計算架構(gòu)、計算方式和算法創(chuàng)新等基礎(chǔ)研究;同時,在國家重點研發(fā)計劃中設(shè)立一批項目,開展算力關(guān)鍵技術(shù)的應(yīng)用示范研究,加強算力與相關(guān)產(chǎn)業(yè)融合應(yīng)用。
4)探索多元投入,助推算力產(chǎn)業(yè)高質(zhì)量發(fā)展。充分發(fā)揮產(chǎn)業(yè)引導(dǎo)基金的撬動作用,鼓勵地方政府通過引導(dǎo)基金加大對算力產(chǎn)業(yè)的投入,培育更多好企業(yè)、好項目。探索新型科技金融模式,加大對算力重點項目的金融支持。創(chuàng)新算力基礎(chǔ)設(shè)施項目的社會融資模式,支持社會資本向算力產(chǎn)業(yè)流動。
5)營造開放生態(tài),共同構(gòu)筑新業(yè)態(tài)新模式。算力的高投入、高風(fēng)險、高壟斷性決定了算力的競爭是少數(shù)大國的少數(shù)企業(yè)才能參與的游戲。政府要大力推動產(chǎn)學(xué)研深度融合,引導(dǎo)龍頭企業(yè)在算力相關(guān)的關(guān)鍵技術(shù)上下功夫,提升研發(fā)能力,搭建開放平臺,吸引上下游企業(yè)有效銜接,共享算力創(chuàng)新成果。鼓勵國內(nèi)企業(yè)、高校等組織與境外有關(guān)組織拓展合作。
總結(jié)而言,破局算力瓶頸,需要硬件、軟件、系統(tǒng)的耦合,基金、生態(tài)、產(chǎn)業(yè)的協(xié)作,具備多層次、多學(xué)科大體系的特點。需要把產(chǎn)業(yè)應(yīng)用、科學(xué)研究、人才培養(yǎng)、基礎(chǔ)平臺等結(jié)合起來,推動相應(yīng)的研究及最終商業(yè)化落地。
(編輯:郭麗琴)