雷波 趙倩穎 凌澤軍
摘要:算力網(wǎng)絡(luò)(CPN)通過網(wǎng)絡(luò)控制面將資源信息進行分發(fā),有機地實現(xiàn)多維資源信息的整合。除此之外,CPN還需要與算力交易、網(wǎng)絡(luò)訂購等業(yè)務(wù)關(guān)聯(lián)起來,形成統(tǒng)一的體系架構(gòu),實現(xiàn)對多類資源的優(yōu)化分配。在屏蔽底層資源的差異與異構(gòu)特性的基礎(chǔ)上,所提出的算力網(wǎng)絡(luò)交易平臺向算力需求方提供了從資源選擇到使用的一體化服務(wù),形成了統(tǒng)一的資源供給機制,滿足各類新興業(yè)務(wù)的多樣化需求。
關(guān)鍵詞:算力網(wǎng)絡(luò);算力網(wǎng)絡(luò)交易平臺;多維資源;一體化
Abstract: Computing power network (CPN) distributes computing power resources information through the network control plane, which realizes the integration of multi-dimensional resource information. To form a unified architecture and realize the optimal allocation of multiple kinds of resources, CPN also needs to be associated with computing power transactions, online orders, and other businesses. Based on the shielding differences and heterogeneous characteristics of the underlying resources, the proposed computing power network transaction platform provides integrated services from resource selection to use to the demand side of the computing power, forming a unified resource supply mechanism to meet the diversified needs of various emerging businesses.
Keywords: computing power network; computing power transaction platform; multi-dimensional resource; integration
隨著人工智能、車聯(lián)網(wǎng)、邊緣計算、工業(yè)互聯(lián)網(wǎng)等業(yè)務(wù)的興起,算力資源作為關(guān)鍵生產(chǎn)要素,受到了業(yè)界的廣泛重視,但目前仍存在度量困難、種類繁多、分布廣泛、歸屬復(fù)雜等特點。
這些特點使得現(xiàn)有業(yè)務(wù)大多在特定類型的算力資源中部署,很難在不同類型、不同級別的算力資源之間靈活調(diào)度。從長期來看,能夠綜合利用不同等級的資源,業(yè)務(wù)才能實現(xiàn)性能與成本的優(yōu)化,從而才能提升競爭力。
因此,將多級算力資源整合成一體化算力服務(wù)體系已是業(yè)界共識,并成為國家產(chǎn)業(yè)導(dǎo)向[1]。
1算力資源的定義與特點
在分析算力資源的特點前,我們首先要明確算力的概念。算力,也稱為計算力或計算能力。該詞的最早來源已經(jīng)不可查證,互聯(lián)網(wǎng)上的資料大多與區(qū)塊鏈相關(guān)。這是因為區(qū)塊鏈技術(shù)采用的是哈希算法,即在相同時間內(nèi)挖出更多的“幣”,也就是說誰算得快誰就能獲得更多的收益。因此,人們就以“算力”這個詞來描述計算的快慢,比如“算力大”則意味著單位時間內(nèi)計算得更快。為了計算得更快、更靈活,需要將分散的算力集中起來形成資源池,這就是所謂的算力資源。
通過分析、對比不同類型的算力資源,可將算力資源的特點歸納為4個方面:度量困難、種類繁多、分布廣泛、歸屬復(fù)雜。
(1)度量困難
當(dāng)業(yè)務(wù)在各類算力資源之間部署、遷移時,需要綜合評估節(jié)點空閑算力資源余量,這就需要使用一個簡單、公認的量綱來衡量算力大小。由于計算快慢不僅與算力大小相關(guān),也與所選擇的算法有關(guān),同一個算力節(jié)點運行不同的算法會有完全不同的效果。因此,對算力的度量往往不是單一維度的,這遠比電力、水力的度量困難得多。
(2)種類繁多
算力資源從不同維度被劃分成不同類型,按核心芯片類型可以分為中央處理器(CPU)、圖形處理器(GPU)、專用集成電路(ASIC)等,按所在位置可以分為云、邊、端等。
(3)分布廣泛
算力資源的構(gòu)建具有靈活性,只要能有一定的空間,并提供電力,任何單位甚至個人都可以構(gòu)建相應(yīng)類型的算力資源節(jié)點。這使得各類算力資源可以分布在不同的物理空間上:越是遠離人口密集區(qū)域的算力資源,規(guī)模就越大,成本就越低;越是靠近城市核心區(qū)域的算力資源,規(guī)模則越小,成本越高。
(4)歸屬復(fù)雜
不同類型算力資源的建設(shè)難度相差極大。例如,對于云計算節(jié)點,算力資源的建設(shè)需要占用大量的土地、電力等資源,還需要通過國家規(guī)定的各項審批流程,并需要規(guī)模效應(yīng)來降低單位成本,技術(shù)門檻非常高,一般只有大型投資方有意愿實施;對于邊緣計算節(jié)點,只要具有一定的機房空間(如室外機柜)就可構(gòu)建,成本不高且不需要太復(fù)雜的技術(shù),中小型企業(yè)能夠自建;而對于端計算節(jié)點,個人就可以購買一套適合的設(shè)備對外提供服務(wù)。在整合算力資源來提供一體化算力服務(wù)時,就必須考慮到算力資源歸屬于多方的這一特點,因此需要盡量簡化在多方之間的交易與調(diào)度過程。
2一體化服務(wù)與算力網(wǎng)絡(luò)
雖然算力資源存在以上4個特點,但新興業(yè)務(wù)可以將算力資源整合起來,形成一體化的服務(wù)機制,讓算力隨時隨地按需供給。
國家發(fā)展和改革委員會、工業(yè)和信息化部等部委在《關(guān)于加快構(gòu)建全國一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系的指導(dǎo)意見》中提出“推動算力資源服務(wù)化”,這包括兩方面的要求[1]:
(1)構(gòu)建一體化算力服務(wù)體系。加快云資源接入和一體化調(diào)度機制的建立和完善,以云服務(wù)方式提供算力資源,降低算力使用成本和門檻。
(2)優(yōu)化算力資源需求結(jié)構(gòu)。以應(yīng)用為導(dǎo)向,充分發(fā)揮云集約調(diào)度優(yōu)勢,引導(dǎo)各行業(yè)合理使用算力資源,以提升基礎(chǔ)設(shè)施的利用效能。
針對以上目標,業(yè)界已出現(xiàn)一些解決方案。例如,云服務(wù)提供商提出了云邊緣的概念,希望通過擴展云的使用范圍來統(tǒng)一各級算力資源,提供統(tǒng)一服務(wù)。另外,還有以網(wǎng)絡(luò)為平臺來設(shè)計的算力網(wǎng)絡(luò)(CPN)技術(shù)方案。CPN是一種有機整合多級算力資源、存儲資源與網(wǎng)絡(luò)資源的新型技術(shù)方案,能夠提供新型的一體化算力服務(wù)。CPN技術(shù)核心在于通過網(wǎng)絡(luò)控制面分發(fā)多維資源信息,通過計算最佳路徑的方式實現(xiàn)多維資源的有機結(jié)合。
目前,已有多種基于CPN的技術(shù)路線被提出,如集中式、分布式、混合式等。這些技術(shù)路線開發(fā)了CPN資源調(diào)度系統(tǒng)原型[2-3]和CPN交易平臺系統(tǒng)原型。算力資源調(diào)度系統(tǒng)根據(jù)資源分配策略,建立算力消費者與算力資源提供者之間的網(wǎng)絡(luò)連接,并根據(jù)業(yè)務(wù)需求變化及時調(diào)整資源分配。在此基礎(chǔ)上,CPN交易平臺成為連接算力消費者和算力資源提供者的紐帶,從商業(yè)模式上連接了算力消費者、算力資源提供者與網(wǎng)絡(luò)運營者,實現(xiàn)從用戶需求到資源分配、資源交易、資源使用的一體化算力資源服務(wù)。
3 CPN交易系統(tǒng)設(shè)計與實踐
3.1總體設(shè)計思路
為滿足算力資源一體化服務(wù)的需求,CPN交易平臺應(yīng)具有以下功能:
(1)CPN交易平臺需要將算力消費者、算力提供者以及CPN控制層結(jié)合,以實現(xiàn)消費者提出的資源或業(yè)務(wù)需求;交易平臺制定分配策略,CPN控制層則根據(jù)分配策略,建立算力消費者與算力提供者之間連接的一體化服務(wù)。
(2)不同能力的CPN消費者的資源與業(yè)務(wù)需求的分析能力不盡相同。CPN平臺還應(yīng)具備對用戶業(yè)務(wù)需求進行人工智能(AI)分析的能力,以提供更加智能的服務(wù),滿足不同用戶對CPN交易平臺的使用需求。
(3)CPN交易平臺還應(yīng)提供可供應(yīng)用開發(fā)者上傳第三方應(yīng)用的應(yīng)用商店,實現(xiàn)從資源到應(yīng)用的全生態(tài)服務(wù)。
根據(jù)上述需求,CPN交易系統(tǒng)與各方參與者之間的關(guān)系如圖1所示[4]。
在CPN基本框架中:
(1)CPN消費者是CPN交易平臺的主要使用者,因此CPN交易平臺需要提供消費者賬戶管理能力,并使CPN消費者在該平臺中選擇合適的資源,然后購買。
(2)作為資源供應(yīng)方,算力提供者需要在CPN交易平臺中進行資源注冊,對資源的使用情況進行實時監(jiān)測。
(3)作為底層資源和算力平臺之間的樞紐,CPN控制面需要與CPN交易平臺聯(lián)動,將所有采集到的資源信息上報給CPN交易平臺,并根據(jù)交易平臺形成的調(diào)度策略,對底層資源進行調(diào)度,構(gòu)建網(wǎng)絡(luò)連接。
(4)為滿足算力消費者的智能分析需求以及使用訴求,CPN交易平臺還應(yīng)連接AI賦能平臺,對用戶的需求進行智能分析,并根據(jù)用戶的意圖為其匹配最佳資源。
3.2資源交易視圖生成模型
多類型、多歸屬方的泛在資源池位于網(wǎng)絡(luò)的各個位置。如何獲得資源池的各項信息成為利用資源池的前提。在CPN中,資源信息的發(fā)現(xiàn)由CPN控制面實現(xiàn),資源池的各項信息由集中式的管理控制系統(tǒng)或分布式路由算法來獲得,包括但不限于資源類型、大小、功能、路由。信息由CPN控制面發(fā)送至CPN交易平臺,結(jié)合用戶信息后生成資源交易視圖。本節(jié)中,我們將對資源交易視圖生成模型[5]進行介紹。
網(wǎng)絡(luò)控制層所獲得的資源信息模型為Ф={С,Т,Χ,Я},其中計算能力為С,包括計算資源類型、現(xiàn)有資源數(shù)量;存儲能力為Т,包括存儲資源類型、資源數(shù)量;算法能力為Χ,包括算法種類、算法復(fù)雜度;路由為Я。
3.3系統(tǒng)功能模塊
根據(jù)總體設(shè)計思路,CPN交易平臺需要提供賬戶管理、交易監(jiān)測控制、交易流程、日志管理、用戶體驗反饋、采集和監(jiān)測控制、對象存儲服務(wù)(OSS)接口、應(yīng)用市場、增強編排調(diào)度等模塊。CPN交易平臺系統(tǒng)的功能架構(gòu)如圖2所示。
賬戶管理模塊:對算力消費者賬戶、算力提供者賬戶,以及權(quán)限賬戶進行管理,包括賬戶申請注冊、查詢、登錄、退出等功能。
交易監(jiān)測控制模塊:對交易過程(如交易合約的執(zhí)行過程)、交易資源、交易記錄進行管理,確保交易過程的安全性,及時掌握資源的占用情況及輸出交易記錄。
交易流程模塊:支持用戶的交易申請、可交易資源的展示、交易套餐的選擇和提交、交易的驗證和生效,以及交易結(jié)束后的資源釋放,處理用戶從選擇到購買的整個流程。
日志管理模塊:對報警日志、故障日志進行管理,以便更好地對交易平臺信息進行跟蹤、管理,對報警、故障進行診斷和解決。
用戶體驗反饋模塊:對用戶意見進行反饋和匯總,更好地提升交易平臺的使用體驗。
采集和監(jiān)測控制模塊:對可交易資源進行采集、匯總及監(jiān)測控制,對資源信息及時進行更新。
應(yīng)用市場模塊:支持應(yīng)用市場展示、應(yīng)用上線申請和提交、應(yīng)用的審核驗證和批準、應(yīng)用的撤銷和刪除以及應(yīng)用版本的更新。對CPN交易平臺中準備上線的應(yīng)用進行安全管理和交易。
OSS接口模塊:與CPN控制面中的資源告警與性能收集、告警上報、性能上報、告警處理流程進行對接。
增強編排調(diào)度模塊:支持需求分析、算法選擇、應(yīng)用部署、算力調(diào)度和網(wǎng)絡(luò)調(diào)度,為CPN交易平臺提供資源管控服務(wù)。
3.4基于AI游戲場景下的試驗驗證
CPN交易平臺可以為眾多新興業(yè)務(wù)場景提供服務(wù),如基于AI的人機互動游戲。由于應(yīng)用開發(fā)者往往選擇虛擬資源進行應(yīng)用部署,因此,在眾多資源池中選擇與業(yè)務(wù)場景匹配的資源便成為關(guān)鍵問題。在AI交互類游戲中,時延對用戶體驗起到?jīng)Q定性作用。當(dāng)端到端時延超過50 ms時,體驗感開始下降;超過100 ms時,將出現(xiàn)明顯卡頓[6]。因此,在不考慮其他處理過程所需時間的情況下,AI交互類游戲網(wǎng)絡(luò)時延要盡量控制在50 ms以下甚至更低。綜合游戲以及AI類應(yīng)用的各項指標[7],在本文測試例中需要為AI類交互游戲匹配一個算力不小于4 TFLOPS、存儲容量不小于1 TB、網(wǎng)絡(luò)帶寬不小于1 Gbit/s、網(wǎng)絡(luò)時延不大于50 ms的算力資源。
當(dāng)一名AI交互類游戲開發(fā)者(以下統(tǒng)稱CPN消費者)想要購買合適的資源為某區(qū)域(以北京市亦莊經(jīng)濟開發(fā)區(qū)為例)的用戶提供服務(wù)時,可以注冊并登錄CPN交易平臺。注冊登錄界面如圖3所示。
當(dāng)該CPN消費者具有豐富的資源使用經(jīng)驗時,會比較了解應(yīng)用與資源的匹配情況,那么可以根據(jù)自己的經(jīng)驗填寫相應(yīng)的服務(wù)位置及資源需求。依據(jù)前文分析即填寫(北京,北京,亦莊經(jīng)濟開發(fā)區(qū))(4,1,0,1,50),如圖4所示。
當(dāng)CPN消費者并不明確所需資源情況,而只清楚資源所要應(yīng)用的場景是AI游戲類時,可以選擇服務(wù)位置以及相應(yīng)的應(yīng)用場景,如AI游戲。CPN交易平臺將通過自身的AI增強功能,按場景對所需資源進行分析,從而查詢到滿足需求的資源池。
CPN消費者輸入資源需求(如圖5所示)或業(yè)務(wù)需求后,CPN交易平臺會生成以用戶為中心的資源視圖,如圖6所示。資源視圖的中心位置表示應(yīng)用提供服務(wù)位置,每一圈虛線表示距離用戶(使用應(yīng)用服務(wù)的用戶)的不同時延,虛線上的點表示時延圈內(nèi)的資源池,點的面積越大則代表計算資源則越多。
資源視圖生成后,CPN交易平臺還會生成與可用資源相匹配的資源池列表。列表中詳細介紹各資源池的資源狀況與報價,如圖7所示。CPN消費者可以根據(jù)自己的支付能力選擇合適的資源池。
CPN消費者選擇合適的資源池后,便可在支付中心進行交易支付,如圖8所示。
在整個交易流程中,CPN交易平臺將持續(xù)跟蹤資源占用情況。交易結(jié)束時,CPN交易平臺將終止服務(wù),釋放算力資源與網(wǎng)絡(luò)資源。
3.5未來發(fā)展方向
CPN交易平臺能夠?qū)崿F(xiàn)分布式資源與資源用戶之間的交易,為用戶提供算力資源一體化服務(wù)的同時,保證了交易的安全性、可靠性。安全性主要體現(xiàn)在算力消費者、算力提供方的身份認證及算力交易過程中有安全保證。基于分布式賬本的屬性,區(qū)塊鏈技術(shù)可以為基于分布式資源的CPN提供更加合理的安全保障。區(qū)塊鏈可有效連接分布式計算、存儲能力和數(shù)據(jù)資源,實現(xiàn)多種異構(gòu)網(wǎng)絡(luò)資源共享和數(shù)據(jù)流轉(zhuǎn)?;趨^(qū)塊鏈構(gòu)建的數(shù)字身份系統(tǒng),可以對算力消費者及算力提供者進行有效的身份認證。區(qū)塊鏈技術(shù)可以支持用戶按需購買算力資源,并將購買記錄和資源使用情況上鏈存儲,業(yè)務(wù)運營方就可以根據(jù)記錄進行計費和結(jié)算。在未來,區(qū)塊鏈技術(shù)將是保證算力交易的一種重要技術(shù),CPN也將借助區(qū)塊鏈技術(shù),為用戶提供更加全面更加可靠的一體化服務(wù)[8-9]。
4結(jié)束語
CPN技術(shù)在標準制定、原型開發(fā)等方面已取得了重大進展。CPN交易平臺為用戶提供了一體化的算力資源服務(wù),將融合的多維資源智能化、可視化地提供給用戶,創(chuàng)新性地提供了一種融合各算力參與方的商業(yè)模式。CPN商業(yè)模式的相關(guān)研究正在開展,前景逐漸清晰,但在算力平臺的安全性、如何實現(xiàn)AI能力增強等方面仍需進行更加深入的研究。
本研究得到北京郵電大學(xué)梅杰的幫助,謹致謝意!
參考文獻
[1]關(guān)于加快構(gòu)建全國一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系的指導(dǎo)意見(發(fā)改高技〔2020〕1922號) [R].國家發(fā)展和改革委員會, 2020
[2]雷波,劉增義,王旭亮,等.基于云、網(wǎng)、邊融合的邊緣計算新方案:算力網(wǎng)絡(luò)[J].電信科學(xué), 2019, 35(9):44-51
[3]雷波,趙倩穎. CPN:一種計算/網(wǎng)絡(luò)資源聯(lián)合優(yōu)化方案探討[J].數(shù)據(jù)與計算發(fā)展前沿, 2020, 2(4): 55-64
[4]雷波,陳運清.邊緣計算與算力網(wǎng)絡(luò)——5G+AI時代的新型算力平臺與網(wǎng)絡(luò)連接[M].北京:電子工業(yè)出版社, 2020
[5]胡宇翔,伊鵬.全維可定義的多模態(tài)智慧網(wǎng)絡(luò)體系研究[J].通信學(xué)報, 2019, 40(8):1-12
[6]中國寬帶發(fā)展聯(lián)盟.千兆寬帶網(wǎng)絡(luò)商業(yè)應(yīng)用場景白皮書[R]. 2019
[7]中國聯(lián)通.面向業(yè)務(wù)體驗的算力需求量化與建模研究[R]. 2020
[8]任夢璇.區(qū)塊鏈+邊緣計算應(yīng)用研究與探討[EB/ OL]. (2021-01-25)[2021-06-07]. https://blog.csdn.net/weixin_41033724/article/details/113153834
[9]方軍.超入門區(qū)塊鏈[M].北京:機械工業(yè)出版社, 2019
作者簡介
雷波,中國電信股份有限公司研究院高級工程師,擔(dān)任邊緣計算產(chǎn)業(yè)聯(lián)盟E C N I工作組聯(lián)席主席、C C S A“網(wǎng)絡(luò)5 .0技術(shù)標準推進委員會”管理與運營組組長等職務(wù);主要研究方向為未來網(wǎng)絡(luò)架構(gòu)、新型IP網(wǎng)絡(luò)技術(shù)等;發(fā)表論文1 0余篇,出版圖書《邊緣計算與算力網(wǎng)絡(luò)》《邊緣計算2 .0:網(wǎng)絡(luò)架構(gòu)與技術(shù)體系》。
趙倩穎,中國電信股份有限公司研究院工程師;主要研究方向為未來網(wǎng)絡(luò)、算力網(wǎng)絡(luò)等;發(fā)表論文3篇,參與出版圖書《邊緣計算與算力網(wǎng)絡(luò)》《邊緣計算2 .0:網(wǎng)絡(luò)架構(gòu)與技術(shù)體系》。
凌澤軍,中國電信股份有限公司研究院高級工程師;主要研究方向為未來網(wǎng)絡(luò)、算力網(wǎng)絡(luò)、軟件開發(fā)、終端研究等;發(fā)表論文1 0余篇,出版圖書《構(gòu)建運營級的L T E網(wǎng)絡(luò)》。