在人工智能技術驅動下,智算中心作為一種新的數(shù)字基礎設施應運而生。所謂智算中心,即提供智能算力、用于人工智能大模型訓練與推理的數(shù)據(jù)中心。
過去三年,全國各地興起智算中心建設熱潮。中國電信研究院《智算產(chǎn)業(yè)發(fā)展研究報告(2024)》顯示,截至2024年6月,中國已建和正在建設的智算中心超250個。
相對于傳統(tǒng)數(shù)據(jù)中心,智算中心是典型的吞金獸,硬件投入高昂。智算服務器配置多塊高性能GPU/NPU板卡,單價可達傳統(tǒng)服務器的數(shù)十倍(如單臺價格約100萬-400萬元)。智算服務器功耗遠超傳統(tǒng)設備,配套制冷與供電系統(tǒng)建設成本高,長期運維費用占比大。一臺中等規(guī)模(約500臺服務器)智算中心的建設成本大約為20億至30億元人民幣。
據(jù)不完全統(tǒng)計,中國智算中心相關投資累計已經(jīng)超過千億元人民幣。工信部數(shù)據(jù)顯示,截至2024年底,中國算力總規(guī)模達280EFLOPS(每秒百億億次浮點運算,以FP32單精度計算),排名全球第二,其中智能算力規(guī)模達90EFLOPS(FP32),占比達32%。
硬幣的另一面是智算中心的利用率問題。部分公共智算中心因規(guī)劃不足,導致算力利用率低,資源閑置。多位行業(yè)人士向《財經(jīng)》表示,當下國內(nèi)智算中心閑置情況比較嚴重。
如何提升公共智算中心使用效率是一個現(xiàn)實問題。今年3月底,《財經(jīng)》調研甘肅慶陽的燧弘華創(chuàng)綠色智算中心,該智算中心超2萬PFLOPS(千萬億次浮點運算/秒,以下簡稱P)),在國內(nèi)屬于大規(guī)模智算中心。服務阿里云、百度等用戶,屬于“真正用起來的”智算中心。
調研發(fā)現(xiàn),DeepSeek為閑置智算中心帶來希望,但公共智算中心亟需轉型,才能接住來自千行百業(yè)的AI推理算力需求。
2022年,中國啟動“東數(shù)西算”工程,計劃在京津冀、長三角、甘肅、寧夏等八地啟動建設國家算力樞紐節(jié)點,并規(guī)劃了十個國家數(shù)據(jù)中心集群。與“西電東送”“南水北調”等工程相似,“東數(shù)西算”是一個國家級算力資源跨域調配的戰(zhàn)略工程。
在甘肅,能源資源豐富、地理位置有優(yōu)勢的慶陽市抓住機會,成為“東數(shù)西算”八大國家算力樞紐之一,慶陽這座原本以農(nóng)產(chǎn)品為特色的西部小城,現(xiàn)在的目標是打造“中國算谷”。
截至2024年底,慶陽已建成投運智算中心六個,投入運行機架3.1萬個,算力規(guī)模超過5萬P,園區(qū)綠電供給超80%,成為全國八大樞紐節(jié)點中增量最大、增速最快的數(shù)據(jù)中心集群。
燧弘華創(chuàng)是弘信電子(股票代碼300657)的全資子公司。2023年8月,燧弘華創(chuàng)與慶陽相關政府機構達成合作協(xié)議,成為首家入駐慶陽的數(shù)據(jù)中心企業(yè),當時慶陽算力樞紐的算力為0。
通過與聯(lián)想、燧原科技等合作伙伴的協(xié)同創(chuàng)新,燧弘華創(chuàng)在2023年12月底就搭建起一個算力超過1000P的萬卡燧原集群,這也是國內(nèi)第一個國產(chǎn)萬卡算力集群。目前,燧弘華創(chuàng)慶陽智算中心已經(jīng)超過2萬P。公開資料顯示,阿里云、騰訊云、百川智能、智譜AI、百度等國內(nèi)典型人工智能企業(yè)都是其客戶。
但事實上,這個智算中心非常年輕。燧弘華創(chuàng)是一家成立僅兩年不到的新公司,母公司弘信電子將其作為向AI轉型的抓手(弘信電子主營業(yè)務為柔性電子)。燧弘華創(chuàng)執(zhí)行總裁唐峰在今年3月底的一次對外交流中自稱是一群“草臺班子”。他稱,團隊用一年半時間完成“與GPU芯片廠家的合作、自有品牌的AI服務器工廠建造、智算中心點亮、組網(wǎng)調優(yōu),還有算力客戶的租賃”。
聯(lián)想為燧弘華創(chuàng)提供多種層面的支持,包括協(xié)助建設服務器工廠、提供智算設備、支持算力調優(yōu)以及日常運維相關問題。聯(lián)想中國基礎設施業(yè)務群戰(zhàn)略管理總監(jiān)黃山是該項目負責人,他評價,燧弘華創(chuàng)慶陽智算中心是個純智算中心,它最大的價值“真正用起來了”。
作為項目負責人,黃山的觀感是,這家公司不僅很拼,也很懂得管理資源和利用資源,如充分利用聯(lián)想等合作伙伴快速達成技術升級。
慶陽市政府在支持算力企業(yè)方面有自己的方式,比如,采用算力券獎勵模式,讓燧弘華創(chuàng)的算力價格在市場上較有競爭力;比如,慶陽市定期召開一次“東數(shù)西算”工程推進會,及時解決企業(yè)在發(fā)展過程中遇到的問題。規(guī)劃建設1.7萬余畝的國家數(shù)據(jù)中心集群(甘肅·慶陽)“東數(shù)西算”產(chǎn)業(yè)園區(qū),為燧弘華創(chuàng)等算力企業(yè)提供優(yōu)質的基礎設施和配套服務,降低企業(yè)的建設和運營成本。
市場在不斷變化,盡管燧弘華創(chuàng)快速建好智算中心并成功地將算力租了出去,但年初由DeepSeek引發(fā)的AI拐點在產(chǎn)業(yè)鏈上下游均產(chǎn)生化反,包括燧弘華創(chuàng)在內(nèi)的公共智算中心迎來全新挑戰(zhàn)。
在DeepSeek爆火之前,無論國內(nèi)還是國外,建設智算中心主要目的是滿足基礎大模型的預訓練需求。例如,去年聯(lián)想跟包括慶陽在內(nèi)的很多智算中心一起來攻關的是,如何做好預訓練,如何將訓練平臺從千卡擴大到萬卡甚至十萬卡,以及如何解決規(guī)模擴大帶來的基礎設施管理復雜度、效率瓶頸等問題。
DeepSeek興起后,市場對算力的需求從預訓練轉向了后訓練和推理,智算中心的客戶群體也明顯變了。
唐峰向《財經(jīng)》表示,智算中心原來主要服務大型互聯(lián)網(wǎng)公司和大模型公司,現(xiàn)在迎來了很多基于DeepSeek大模型的應用創(chuàng)業(yè)者。原來的客戶數(shù)量有限,租用算力主要用于大模型預訓練,動輒租用幾十臺、上百臺的算力服務器;現(xiàn)在DeepSeek相關創(chuàng)業(yè)者數(shù)量多,租用算力主要用于大模型后訓練和推理,并且創(chuàng)業(yè)者們往往買不起一整臺算力服務器,需要把算力“切分”后賣給他們。
智算中心實際面臨大客戶(指有大模型預訓練需求的公司)數(shù)量減少的風險。一位AI產(chǎn)業(yè)資深人士表示,受DeepSeek影響,國內(nèi)堅持研發(fā)基礎大模型的公司會越來越少,越來越向頭部聚集。
綜合來看,DeepSeek雖然改變了智算中心用戶群體構成,但它將引爆AI推理需求,改變當下智算算力供大于求的局面,為智算中心帶來希望。
聯(lián)想中國基礎設施業(yè)務群高級產(chǎn)品經(jīng)理郭晉兵還認為,DeepSeek為智算中心提供了一種新的資源銷售方式,即裝上各種大模型,以對外賣Token數(shù)的方式銷售算力資源。該方式好處是客戶將不關心智算中心的硬件組合,只要智算中心的算法夠強,智算中心可以使用國產(chǎn)硬件,甚至可以用低端硬件。
智算中心轉型首先從軟件層面開始。
黃山向《財經(jīng)》表示,之前慶陽等智算中心主要采用裸金屬模式對外出租算力,如今要服務大模型后訓練與推理,智算中心需要增強云服務和算力調優(yōu)能力,所使用的軟件無論是算力調優(yōu)還是計費還是運維,也都與之前完全不一樣。
上述能力要求對聯(lián)想等算力基礎設施提供方也是較大的挑戰(zhàn)。黃山認為,這主要是考驗算力設施提供商的軟硬件協(xié)同設計能力,接下來,聯(lián)想會聯(lián)合燧弘華創(chuàng)以及GPU芯片廠商在異構算力調優(yōu)上進行聯(lián)合創(chuàng)新,聯(lián)想對燧弘華創(chuàng)的支持重點也主要聚焦在算力調優(yōu)上。
聯(lián)想已幫助燧弘華創(chuàng)在慶陽綠色智算中心部署了多元異構算力調度平臺。建設該平臺的目的是為統(tǒng)一管理智算中心的異構算力,為智算中心用戶提供更融合、更穩(wěn)定的智能和科學算力。同時,聯(lián)想也在提升其AI服務器在DeepSeek大模型上的能力表現(xiàn)。最新數(shù)據(jù)顯示,聯(lián)想AI服務器在全速運轉滿血版DeepSeek R1大模型時,極限吞吐量可超8000 tokens/s,這將有助為智算中心更好地贏得DeepSeek大模型相關客戶。
除了技術層面,智算中心算力銷售模式也需要轉變。唐峰表示過去模式是在各主要城市建立智算中心就近服務客戶,推理算力的市場是分散的,現(xiàn)在他們也開始嘗試通過各種渠道比如網(wǎng)絡平臺銷售算力。
智算中心的云化、智算云的建設大概率將成為主要建設方向。例如,3月25日上海市出臺《上海市關于促進智算云產(chǎn)業(yè)創(chuàng)新發(fā)展的實施意見(2025-2027年)》。該政策中“智算云”成高頻詞,例如到2027年上海市智算云產(chǎn)業(yè)規(guī)模力爭突破2000億元、打造若干綜合型智算云平臺和一批垂直型智算云平臺、形成一批智算云標桿應用等等。
多位行業(yè)人士表示,智算中心運維不易,智算云的運維難度將指數(shù)級增高。
中科院計算所研究員張云泉呼吁,應加強AI人才培養(yǎng)。他表示,基于AI大模型的后訓練與推理需求雖暴增,但非常缺乏了解行業(yè)需求又掌握AI應用方法的人才,會阻礙AI應用創(chuàng)新。例如,目前懂得將行業(yè)數(shù)據(jù)和DeepSeek大模型進行精調的人才就很少,需培養(yǎng)大量工程師,解決AI落地的“最后一公里”問題。