萬宏蕾
上海超級計算中心
UCloud(優(yōu)刻得科技股份有限公司)是中國知名的中立云計算服務(wù)商,其兩大云基地分別位于“東數(shù)西算”工程規(guī)劃的國家算力樞紐節(jié)點,內(nèi)蒙古(烏蘭察布)和長三角(上海青浦)。
“其實我們布局烏蘭察布數(shù)據(jù)中心時,‘東數(shù)西算8個樞紐節(jié)點還未發(fā)布。當時考慮烏蘭察布離北京近,海拔更高,有電價低廉、自然低溫等優(yōu)勢,能耗控制較好;上海數(shù)據(jù)中心則位于長三角一體化等多個國家戰(zhàn)略交匯點,適合布局核心計算業(yè)務(wù)、高時效業(yè)務(wù)?!盪Cloud副總裁劉杰告訴《瞭望東方周刊》。
“兩個基地各有優(yōu)勢。比如,人工智能企業(yè)可以構(gòu)建混合云,將模型訓(xùn)練等非實時計算部署在烏蘭察布,將需要實時計算的推理工作部署在上海,降低成本的同時提高創(chuàng)新效率?!眲⒔苷f。
“縱觀當下中國整體算力分布,東部算力規(guī)模仍遠高于中西部地區(qū),但依然無法滿足日益增長的算力需求?!鄙虾I缈圃盒畔⒀芯克彼L丁波濤告訴《瞭望東方周刊》,“東部地區(qū)不僅有科學計算和大數(shù)據(jù)處理的需求,還有增長更快的人工智能訓(xùn)練和推理計算等需求,這些都需要體量更大的多種類型智能計算。隨著‘東數(shù)西算工程推進,未來我國將逐步形成東、中、西部更加均衡分布的算力體系?!?p>
濟南超算中心的山河超算平臺
在過去一年里,各地紛紛通過出臺政策、活動招商、建設(shè)重點項目等,響應(yīng)國家“東數(shù)西算”戰(zhàn)略,加快推進算力基礎(chǔ)設(shè)施建設(shè)和升級。
作為全國信息化發(fā)展的“排頭兵”,上海具有領(lǐng)先的產(chǎn)業(yè)發(fā)展優(yōu)勢和積極的地方政策。2022年6月,上海市通信管理局印發(fā)的《新型數(shù)據(jù)中心“算力浦江”行動計劃(2022-2024年)》明確,力爭到2024年初步建成全國一體化算力網(wǎng)絡(luò)上海樞紐節(jié)點,形成與本市數(shù)字經(jīng)濟發(fā)展方式相適應(yīng),長三角地區(qū)協(xié)同發(fā)展的算力服務(wù)發(fā)展格局,建成具有亞太乃至全球影響力的高能級算力樞紐中心。
2022年1月,江蘇省工業(yè)和信息化廳印發(fā)《江蘇省新型數(shù)據(jù)中心統(tǒng)籌發(fā)展實施意見》,提出到2023年底,江蘇省數(shù)據(jù)中心機架規(guī)模年均增速保持在20%左右,平均利用率提升到65%,全省新型數(shù)據(jù)中心比例不低于30%,高性能算力占比達10%,新建大型及以上數(shù)據(jù)中心電能利用效率(PUE)降低到1.3以下;到2025年底,江蘇省數(shù)據(jù)中心機架規(guī)模達70萬標準機架,新型數(shù)據(jù)中心占比進一步提升,算力算效水平顯著提高。
數(shù)字經(jīng)濟大省浙江也于2021年發(fā)布《浙江省推動數(shù)據(jù)中心能效提升行動方案(2021-2025年)》,提出到“十四五”期末,浙江省數(shù)據(jù)中心平均PUE下降至1.5以下,其中大型以上數(shù)據(jù)中心 PUE 降至1.3以下,長三角樞紐區(qū)集群內(nèi)數(shù)據(jù)中心PUE達到1.25以下,全省數(shù)據(jù)中心可再生能源使用率達到30%以上。
在算力基礎(chǔ)設(shè)施方面,據(jù)浙江省經(jīng)濟和信息化廳統(tǒng)計數(shù)據(jù),截至2023年2月底,全省已建成數(shù)據(jù)中心150多個,主要布局在杭州、嘉興、湖州、金華、溫州等地。算力規(guī)模達8.86EFlops,已用算力規(guī)模5.07EFlops,另有在建算力規(guī)模7.48EFlops。
圍繞濟南超算中心,濟南市歷城區(qū)規(guī)劃打造了14.2 平方公里的超算數(shù)字經(jīng)濟生態(tài)創(chuàng)新圈。
2022年7月,首屆中國算力大會在山東濟南舉辦。在這場我國算力領(lǐng)域首個全國性會議上,現(xiàn)場簽約啟動項目總投資額約461億元,涉及中國移動、中國聯(lián)通、中國電信、中國鐵塔、中國廣電、華為、阿里、浪潮等算力龍頭企業(yè)。業(yè)內(nèi)人士梳理這些項目發(fā)現(xiàn),“東數(shù)西算”已成為這些項目決策和落地的重要依據(jù)。一年多時間來,多家行業(yè)龍頭在8大樞紐和10大集群積極布局,申請土地空間和能耗指標,推動自身算力基礎(chǔ)設(shè)施建設(shè)。
自2022年2月之后一年間,全國新開工建設(shè)的數(shù)據(jù)中心項目中,以長三角樞紐及其內(nèi)長三角生態(tài)綠色一體化發(fā)展示范區(qū)集群、蕪湖集群承建項目數(shù)量最多,西部樞紐中則以成渝樞紐及其內(nèi)的天府集群、重慶集群為首。
“當前,大部分算力需求集中在數(shù)字經(jīng)濟發(fā)展較發(fā)達的東部沿海地區(qū)?!倍〔治?,即使在“東數(shù)西算”政策引導(dǎo)之下,許多企業(yè)簽約落地項目的地區(qū)仍首選東部地區(qū),算力業(yè)務(wù)向西遷移的增量還是集中在成渝等準一線城市,部分互聯(lián)網(wǎng)巨頭和三大運營商已經(jīng)在貴州、寧夏等西部地區(qū)率先有了進一步的探索。
“目前,西部地區(qū)項目主要承載的是對網(wǎng)絡(luò)依賴不強的冷數(shù)據(jù)處理需求和備份需求等業(yè)務(wù),真正意義的‘西算市場還需要加大培育力度。”中國科學院計算技術(shù)研究所研究員、中國計算機學會高性能計算專委會秘書長張云泉告訴《瞭望東方周刊》。
2022年底,美國OpenAI推出的ChatGPT引爆了國內(nèi)市場對于大模型的熱情,大模型本身對GPU算力有極強的需求?!澳壳?,國內(nèi)能提供對應(yīng)算力支持的超算中心還不多,國家超級計算濟南中心(以下簡稱“濟南超算中心”)的神器——山河超算平臺部署的智能計算集群能夠提供人工智能計算能力?!睆堅迫榻B。
“在大模型熱潮襲來后,不少國內(nèi)企業(yè)找過來,希望能夠使用山河的人工智能算力訓(xùn)練大模型。”國家超級計算濟南中心研究員郭猛告訴《瞭望東方周刊》,“目前不少科研機構(gòu)、高校、互聯(lián)網(wǎng)公司排隊已經(jīng)很長時間,簡直‘一卡難求?!?/p>
“這個‘卡主要是說目前人工智能大模型訓(xùn)練最常用的專業(yè)級顯卡?!惫驼f。
濟南超算中心是我國完全采用自主處理器研制的千萬億次超級計算機神威·藍光的誕生地,也是我國超算領(lǐng)域的“領(lǐng)頭羊”之一。
2019年,借助新建全球首個以“超算”為主題的科技園——國家超級計算濟南中心科技園的契機,濟南超算中心謀定建設(shè)山河超算平臺。這個平臺不僅可以提供傳統(tǒng)高性能計算算力,還能提供云計算和智能計算服務(wù),后兩者將滿足更多民生、產(chǎn)業(yè)領(lǐng)域的算力需求。
“全球的超算都在沖速度,尤其是高性能計算在不斷追求更快、更強,如何讓超算的算力得到更好的利用?讓超算機構(gòu)更好地運轉(zhuǎn)?”濟南超算中心副主任郭瑩說,“超算研制瞄準的是解決大問題,比如‘超算諾貝爾獎戈登貝爾獎獲獎的那些案例,但這些大問題可能占比不到20%,真正消耗大量算力的還是大批量的中小規(guī)模應(yīng)用,所以我們的超算要同時滿足這兩類需求?!?/p>
在服務(wù)更多產(chǎn)業(yè)和企業(yè)的背景下,山河超算平臺應(yīng)運而生。2021年建成的山河平臺高性能計算能力達80PFlops (每秒千萬億次計算),人工智能計算能力達到1000PFlops,整體性能居世界先進水平,在德國漢堡舉行的ISC2022高性能計算大會上,一舉登頂世界最新IO500榜單,且大幅刷新了該榜單歷史最好成績。
“山河平臺建成后,我們服務(wù)的用戶面越來越廣,對接的需求也越來越多元,圍繞山河平臺正在形成一個越來越豐富的超算應(yīng)用生態(tài)。”郭猛說。
“由于選對了技術(shù)路線,濟南超算中心發(fā)展勢頭迅猛。”張云泉評價。
為了進一步挖掘算力底座的潛力。圍繞濟南超算中心,濟南市歷城區(qū)規(guī)劃打造了14.2平方公里的超算數(shù)字經(jīng)濟生態(tài)創(chuàng)新圈。2022年底,濟南超算中心和濟南超算數(shù)字經(jīng)濟創(chuàng)新圈服務(wù)中心等機構(gòu)以聯(lián)合招商小組的名義向全球發(fā)布招商。
“這不是一次單純的招商,更重要的是我們想讓大家都知道濟南有一個超算中心,我們的算力能賦能你的產(chǎn)業(yè)?!睗铣阒行母敝魅巍铣慵夹g(shù)研究院院長潘景山說。
“算力對企業(yè)的重要性和吸引力不斷增長,越來越多的企業(yè)來科技園考察,越來越多的企業(yè)家在琢磨怎么能用上這種算力?!迸司吧秸f,“一些企業(yè)因為超算中心而選擇落地濟南超算數(shù)字經(jīng)濟生態(tài)創(chuàng)新圈。”按照規(guī)劃,到2025年,這一創(chuàng)新圈將集聚50家龍頭企業(yè),引進和培育企業(yè)500家,新增就業(yè)崗位5000個,形成千億級數(shù)字經(jīng)濟集群。
2022年6月23日,之江實驗室計算與數(shù)據(jù)中心,工程師們通過“之江云”系統(tǒng)監(jiān)測服務(wù)器集群的運行狀態(tài)(黃宗治/ 攝)
新藥研發(fā)中的分子篩選、智能網(wǎng)聯(lián)汽車的車路協(xié)同、無人值守的“黑燈工廠”……這些對算力有大量剛需的產(chǎn)業(yè)場景,過去不得不面對排隊申請算力的無奈。
2023年2月20日,依托上海超算中心建設(shè)及運用的上海市人工智能公共算力服務(wù)平臺正式揭牌啟用。以該平臺為核心,上?!?+N”算網(wǎng)體系初步形成。
“上海超算中心屬于政府公共算力服務(wù)平臺,通過對公共算力和各種商業(yè)算力的集聚調(diào)度,努力實現(xiàn)算力如水電等基礎(chǔ)設(shè)施一樣便利使用,為科研機構(gòu)和廣大中小企業(yè)提供具有公信力的普惠算力,幫助企業(yè)降低使用算力的成本,實現(xiàn)異構(gòu)異地資源共享?!鄙虾3阒行木C合管理部部長林薇告訴《瞭望東方周刊》。
據(jù)介紹,新建平臺是采用國產(chǎn)自研達芬奇架構(gòu)的人工智能算力平臺,計算峰值能力(FP16)達到100PFlops。主要器件CPU和AI處理器采用冷板式液冷,輔助設(shè)備通過風液換熱器進行間接冷卻,能耗PUE低于1.3。目前,三大運營商以及商湯、華為、騰訊等智算中心的算力都在踴躍加盟這一算力調(diào)度平臺。
“當然,要實現(xiàn)算力抱團也面臨不小的挑戰(zhàn)。現(xiàn)在各種算力的技術(shù)標準、接入方式等都不盡相同,如何通過平臺將這些算力資源匯聚起來,進行統(tǒng)一調(diào)度,需要研究相應(yīng)的策略和方法。”林薇說。
根據(jù)中國信通院發(fā)布的《中國綜合算力指數(shù)(2022年)》,截至2021年底,上海市算力指數(shù)排名位列全國第一,綜合算力指數(shù)排名位列全國第二。報告顯示,上海市算力、存力、運力發(fā)展水平均處于全國前列。從算力規(guī)模來看,截至2021年底,上海市在用算力規(guī)模超過13EFlops,在建算力規(guī)模超過7EFlops。
在上海,集成電路、生物醫(yī)藥、人工智能三大先導(dǎo)產(chǎn)業(yè),數(shù)字經(jīng)濟、綠色低碳、元宇宙、智能終端四大新賽道,以及前瞻布局的未來健康、未來智能、未來能源、未來空間、未來材料等五大未來產(chǎn)業(yè),無不是算力需求大戶。
“比如,一名神經(jīng)系統(tǒng)疾病患者的檢查和治療數(shù)據(jù)高達500G,急重癥患者每天產(chǎn)生的用藥、化驗數(shù)據(jù)等,都迫切需要充沛算力輔助?!比A山醫(yī)院神經(jīng)外科副主任醫(yī)師、教授孫一睿說,“現(xiàn)在,由上海超算中心提供公共服務(wù)算力支撐,華為提供自主可控的昇騰芯片及MindSpore昇思人工智能技術(shù)框架,上海聯(lián)通提供算網(wǎng)一體技術(shù)、聯(lián)通云和算力集成運營服務(wù),多方共同打造上海公共服務(wù)算力孵化人工智能輔助醫(yī)學的創(chuàng)新應(yīng)用,有力推動醫(yī)療系統(tǒng)數(shù)智化升級?!?/p>
“不過,即便上海有這樣的算力基礎(chǔ),由于全社會對于數(shù)字資源的存儲、計算和應(yīng)用需求與日俱增,導(dǎo)致算力仍供不應(yīng)求?!倍〔f。
在國內(nèi)多地出臺清退落后產(chǎn)能的相關(guān)政策文件中,一些東部地區(qū)的數(shù)據(jù)中心也赫然在列。
隨著“雙碳”目標提出和全社會數(shù)字化轉(zhuǎn)型的加速,數(shù)據(jù)中心作為海量數(shù)據(jù)的主要存儲與運算處理實體,其規(guī)模不斷擴大,由此帶來的能源消耗問題受到廣泛關(guān)注。
據(jù)中國信通院云計算與大數(shù)據(jù)研究所測算,到2030年,我國數(shù)據(jù)中心耗電量將超過3800億千瓦時,如果不采用可再生能源,碳排放量將超過2億噸,算力基礎(chǔ)設(shè)施的綠色低碳亟待實現(xiàn)。
為此,國家及各地政府相繼出臺多項政策性文件,對電能利用效率(PUE值)指標控制呈現(xiàn)嚴格趨勢,在數(shù)據(jù)中心建設(shè)項目審批、運營管理、差別電價等方面不斷將PUE值作為剛性指標。
根據(jù)工信部《新型數(shù)據(jù)中心發(fā)展三年行動計劃(2021-2023年)》發(fā)布的數(shù)據(jù),到2023年底,全國數(shù)據(jù)中心機架規(guī)模年均增速保持在20%左右,平均利用率力爭提升到60%以上。
同時,在國內(nèi)多地出臺清退落后產(chǎn)能的相關(guān)政策文件中,一些東部地區(qū)的數(shù)據(jù)中心也赫然在列。廣東省提出,珠三角地區(qū)60%中高時延數(shù)據(jù)業(yè)務(wù)遷至粵東粵西粵北地區(qū);浙江省提出,對于省內(nèi)數(shù)據(jù)中心整體上架率(建成投用1年以上)低于50%的運營單位,不支持新建大型和超大型數(shù)據(jù)中心項目,對已建數(shù)據(jù)中心“整合一批、改造一批、淘汰一批”;北京市出臺《低效數(shù)據(jù)中心綜合治理工作方案》,對低效數(shù)據(jù)中心,分批開展整治工作,有序遷移關(guān)閉。
“淘汰一部分東部數(shù)據(jù)中心、把一部分算力轉(zhuǎn)移到西部,本質(zhì)上都是基于實現(xiàn)‘雙碳目標的考慮,‘東數(shù)西算不僅能夠節(jié)約‘西電東送的成本,還能提高對西部光伏、風電等綠色能源的使用?!倍〔f。
“UCloud幫助客戶將原本部署在東部的服務(wù)器中對時延敏感性低的業(yè)務(wù)西遷至烏蘭察布數(shù)據(jù)中心,遷移后可以幫助客戶將IT運營成本降低50%?!?劉杰說。
“我們公司的主營業(yè)務(wù)是云計算。云計算本身就是一種綠色的計算資源,通過集群化管理、高效運營,相對于傳統(tǒng)架構(gòu),降低能源消耗和資源消耗;烏蘭察布數(shù)據(jù)中心選址可以助力新能源消納,同時降低數(shù)據(jù)中心的PUE和耗電量;上海青浦云計算中心建設(shè)光伏發(fā)電,抵消自身碳排放?!?UCloud基礎(chǔ)設(shè)施工程管理經(jīng)理楊淑寶告訴《瞭望東方周刊》。
“同時,我們的數(shù)據(jù)中心還利用很多創(chuàng)新性技術(shù)手段,諸如自然冷卻、間接蒸發(fā)、熱回收、高壓直流、智能化運營等,降低數(shù)據(jù)中心PUE,降低能耗和碳排放。比如在上海數(shù)據(jù)中心采用的白露間接蒸發(fā)冷卻技術(shù),通過重構(gòu)間接蒸發(fā)冷卻流程,極大地提高了制冷效率。”楊淑寶補充道,這項技術(shù)獲得了2022年“云計算中心科技獎卓越獎”。
“‘東數(shù)西算工程剛啟動一年多,相關(guān)規(guī)劃和基礎(chǔ)設(shè)施目前還在推進過程中。對于企業(yè)來說,‘東數(shù)要不要‘西算,目前看來是可選項,未來可能是必選項?!倍〔f。
國家超級計算深圳中心(深圳云計算中心)
注釋:EFlops 即每秒100 億億(=1018) 次浮點運算。