張婷婷 王升 李瑩 張昊
(中國移動(dòng)通信研究院網(wǎng)絡(luò)與IT技術(shù)研究所,北京100053)
在國家“新基建”戰(zhàn)略指引下,互聯(lián)網(wǎng)以新發(fā)展理念為引領(lǐng),以技術(shù)創(chuàng)新為驅(qū)動(dòng),以數(shù)據(jù)為核心,以信息網(wǎng)絡(luò)為基礎(chǔ),強(qiáng)調(diào)提供數(shù)字轉(zhuǎn)型、智能升級、融合創(chuàng)新等服務(wù)融合基礎(chǔ)設(shè)施。在算網(wǎng)融合成為必然趨勢的背景下,業(yè)界為盤活通信網(wǎng)絡(luò)基礎(chǔ)設(shè)施和新技術(shù)服務(wù)基礎(chǔ)設(shè)施、促進(jìn)共享新型服務(wù)體系和架構(gòu)演進(jìn)開展了積極的探索。
本文結(jié)合新興信息計(jì)算服務(wù)的演進(jìn)驅(qū)動(dòng),對業(yè)界算網(wǎng)融合的演進(jìn)架構(gòu)進(jìn)行了全面分析對比,提出了泛在計(jì)算服務(wù)的架構(gòu)設(shè)計(jì)理念,并介紹了其所涉及的關(guān)鍵技術(shù),以期對現(xiàn)有算網(wǎng)融合體系架構(gòu)的演進(jìn)發(fā)展提供多種借鑒思路。
縱觀人類計(jì)算服務(wù)架構(gòu)的演進(jìn)歷史不難發(fā)現(xiàn),集中式計(jì)算與分布式計(jì)算呈螺旋式交替上升演進(jìn)。20世紀(jì)六七十年代大型機(jī)出現(xiàn),開始向人類提供集中式計(jì)算服務(wù);20世紀(jì)八九十年代消費(fèi)級PC占領(lǐng)用戶桌面,使計(jì)算服務(wù)進(jìn)入千家萬戶并廣泛分布;2006年,以虛擬化、云化技術(shù)為基礎(chǔ)的云計(jì)算出現(xiàn),集中式的超大規(guī)模數(shù)據(jù)中心開始通過網(wǎng)絡(luò)向千行百業(yè)提供敏捷彈性的計(jì)算服務(wù);近些年來,隨著5G與邊緣計(jì)算加速發(fā)展,芯片制程工藝提升,端側(cè)算力也將迎來提升,新興應(yīng)用驅(qū)動(dòng)數(shù)據(jù)處理越來越向邊端擴(kuò)散,以獲得更低的時(shí)延響應(yīng),這一階段計(jì)算服務(wù)具備典型的分布式特征。未來,隨著算力分布與網(wǎng)絡(luò)連接的泛在化,算網(wǎng)融合已成趨勢,計(jì)算服務(wù)的架構(gòu)演進(jìn)又將呈現(xiàn)算網(wǎng)一體的新特征,形成一個(gè)集中和分散統(tǒng)一協(xié)同的云網(wǎng)邊端泛在化計(jì)算服務(wù)框架。
新型應(yīng)用的不斷涌現(xiàn)對算力精度、強(qiáng)度、時(shí)延轉(zhuǎn)發(fā)等不同方面都提出了差異化需求,致使云數(shù)據(jù)中心出現(xiàn)了CPU、GPU、FPGA等多種硬件設(shè)施平臺。與此同時(shí),國內(nèi)IT市場硬軟件百花齊放,國產(chǎn)化芯片發(fā)展促使云平臺資源異構(gòu)化成為必然。但是,這種趨勢也加速了芯片生態(tài)封閉、編程工具語言專用、一個(gè)應(yīng)用需要基于多種異構(gòu)芯片開發(fā)不同代碼且無法跨芯片移植的局面。對開發(fā)者而言,硬件升級、應(yīng)用遷移都需對代碼進(jìn)行更新,加重了應(yīng)用開發(fā)的負(fù)擔(dān);對云服務(wù)商而言,采購各種異構(gòu)硬件形成不同的池化環(huán)境,也會導(dǎo)致不同異構(gòu)硬件利用率差異較大、硬件持有成本居高不下。統(tǒng)一的異構(gòu)算力管理涉及不同芯片的加載、抽象、虛擬化、掛載、刪除等一系列生命周期管理工作,需要較長時(shí)間演進(jìn)成熟。因此,為簡化應(yīng)用開發(fā),將異構(gòu)算力架構(gòu)進(jìn)行屏蔽,實(shí)現(xiàn)一套代碼在不同架構(gòu)計(jì)算芯片上有效運(yùn)轉(zhuǎn),是當(dāng)前云服務(wù)商和云化應(yīng)用關(guān)注的方向之一。
區(qū)塊鏈正驅(qū)動(dòng)網(wǎng)絡(luò)從“信息互聯(lián)網(wǎng)”到“價(jià)值互聯(lián)網(wǎng)”變遷,作為互聯(lián)網(wǎng)的第二次革命,區(qū)塊鏈給數(shù)字世界帶來了“價(jià)值表示”和“價(jià)值轉(zhuǎn)移”兩項(xiàng)全新的基礎(chǔ)功能。區(qū)塊鏈已經(jīng)不僅僅是一項(xiàng)技術(shù)、一種工具,更是一種思維方式。區(qū)塊鏈作為一種新型技術(shù)組合,其去中心化、難以篡改、不可抵賴、面向場景等特點(diǎn)可為泛在計(jì)算服務(wù)帶來一種全新的信用模式,使其數(shù)字服務(wù)更具競爭力。在共享經(jīng)濟(jì)繁榮的社會背景下,區(qū)塊鏈技術(shù)的使用可以激發(fā)算力服務(wù)提供方提供算力共享服務(wù)的積極性,并對算力消費(fèi)者提供交易結(jié)算公開透明的賬單,甚至還可以基于區(qū)塊鏈的記塊信息進(jìn)行算力追溯和服務(wù)保障,使能可信的泛在計(jì)算服務(wù)。
在新基建背景下,截止到2020年,第三方數(shù)據(jù)中心服務(wù)商在建規(guī)劃機(jī)柜總規(guī)模為1 484 981個(gè),占中國在建規(guī)劃機(jī)柜總規(guī)模的44.8%;其次是運(yùn)營商的在建規(guī)劃機(jī)柜規(guī)模,占比為26.5%;互聯(lián)網(wǎng)企業(yè)和其他跨界參與者在建規(guī)劃機(jī)柜規(guī)模占比分別為11.8%、16.9%[1]??梢?,第三方數(shù)據(jù)中心服務(wù)商已經(jīng)成為未來新基建市場投資的主體,運(yùn)營商更多將資金用于5G建設(shè)和云服務(wù)轉(zhuǎn)型,數(shù)據(jù)中心上下游企業(yè)、能源/制造/房地產(chǎn)類跨界新進(jìn)入者紛紛布局?jǐn)?shù)據(jù)中心領(lǐng)域。因此,未來融合基礎(chǔ)設(shè)施的提供者可以是云服務(wù)商、運(yùn)營商甚至是中小企業(yè)的第三方數(shù)據(jù)中心服務(wù)者和設(shè)備商。隨著泛在計(jì)算的云網(wǎng)邊端架構(gòu)融合,云服務(wù)商(如AWS、阿里云、騰訊云等)正在尋求5G網(wǎng)絡(luò)服務(wù)的增強(qiáng)和加持,運(yùn)營商也在依托強(qiáng)大的網(wǎng)絡(luò)積極布局云計(jì)算服務(wù)向信息化服務(wù)商轉(zhuǎn)型,而設(shè)備商(如華為、浪潮、Xilinx等)則正在依托各自的硬件技術(shù)棧和生態(tài)積極拓展服務(wù)化的平臺能力。這個(gè)過程給一些中小企業(yè)算力提供者提供了機(jī)會,使之通過加入泛在共享算力交易服務(wù)提升自己的價(jià)值和售賣市場。因此,產(chǎn)業(yè)生態(tài)中不同產(chǎn)業(yè)角色的切入也在加速算網(wǎng)一體融合、促進(jìn)可持續(xù)發(fā)展。
美國施樂公司首席科學(xué)家馬克威瑟(Mark Weiser)博士在1988年首次提出了泛在計(jì)算(Ubiquitous Computing)的概念,認(rèn)為泛在計(jì)算是要建立一個(gè)充滿計(jì)算和通信能力的環(huán)境,同時(shí)使這個(gè)環(huán)境與人們逐漸融合在一起。在該定義中,泛在計(jì)算是一個(gè)強(qiáng)調(diào)和環(huán)境融為一體的計(jì)算概念,而不強(qiáng)調(diào)計(jì)算設(shè)備的存在。本文提出的泛在計(jì)算服務(wù)的愿景和理念正是泛在計(jì)算的一種具象化服務(wù),是基于上述驅(qū)動(dòng)力實(shí)現(xiàn)的一種促進(jìn)算網(wǎng)融合的新型服務(wù)模式和架構(gòu)。其核心概念即通過自動(dòng)化、智能化調(diào)度,使人們可在任何時(shí)間/地點(diǎn)無感知地將計(jì)算(算力、存儲、網(wǎng)絡(luò)等)需求與云邊端多級計(jì)算服務(wù)能力連接適配,通過多方算力貢獻(xiàn)者和消費(fèi)者共同參與,實(shí)現(xiàn)算力從產(chǎn)生、調(diào)度、交易到消費(fèi)的閉環(huán),形成算網(wǎng)一體、算隨人選、算隨人動(dòng)的可信共享計(jì)算服務(wù)模式[2]。
算力網(wǎng)絡(luò)是通過網(wǎng)絡(luò)控制面分發(fā)服務(wù)節(jié)點(diǎn)的算力、存儲、算法等資源信息,并結(jié)合網(wǎng)絡(luò)信息和用戶需求,提供最佳的計(jì)算、存儲、網(wǎng)絡(luò)等資源的分發(fā)、關(guān)聯(lián)、交易與調(diào)配,從而實(shí)現(xiàn)整網(wǎng)資源的最優(yōu)化配置和使用的新型網(wǎng)絡(luò)[3]。算力網(wǎng)絡(luò)架構(gòu)提出的出發(fā)點(diǎn)是為解決邊緣計(jì)算節(jié)點(diǎn)之間的協(xié)同問題,其實(shí)現(xiàn)機(jī)制是將算力與網(wǎng)絡(luò)能力作為路由信息發(fā)布到網(wǎng)絡(luò)層之上的算力路由層,并由算力路由節(jié)點(diǎn)基于虛擬的服務(wù)ID將計(jì)算任務(wù)報(bào)文路由到最合適的計(jì)算節(jié)點(diǎn),以實(shí)現(xiàn)用戶體驗(yàn)最優(yōu)、計(jì)算資源利用率最優(yōu)、網(wǎng)絡(luò)效率最優(yōu)(見圖1)。算力網(wǎng)絡(luò)架構(gòu)的技術(shù)特征包括:是計(jì)算與網(wǎng)絡(luò)深度融合的新型網(wǎng)絡(luò)架構(gòu);包含新型算力網(wǎng)絡(luò)路由協(xié)議,如基于邊界網(wǎng)關(guān)協(xié)議/內(nèi)部網(wǎng)關(guān)協(xié)議(BGP/IGP),設(shè)計(jì)算力路由標(biāo)識、算力路由控制、算力狀態(tài)網(wǎng)絡(luò)通告、算力路由尋址、算力路由轉(zhuǎn)發(fā)等。
圖1 算力網(wǎng)絡(luò)架構(gòu)圖
分布式云架構(gòu)是從云計(jì)算下沉角度進(jìn)行設(shè)計(jì)延伸的,已成為云計(jì)算服務(wù)發(fā)展的新趨勢。分布式云把云的類型分成核心云(Core Cloud)、區(qū)域云(Regional Cloud)、邊緣云(Edge Cloud)三層邏輯(見圖2)。ITU-T已發(fā)布的分布式云高層需求標(biāo)準(zhǔn)Y.3508[4]描述了結(jié)合典型云計(jì)算部署需求的3種配置模型,其中模型1要求在部署云的時(shí)候把核心云和區(qū)域云的配置進(jìn)行統(tǒng)一協(xié)同;模型2是單純的核心云和邊緣云協(xié)同服務(wù);模型3包含的邊緣云更靠近區(qū)域云,需要逐層把云服務(wù)推到邊緣,進(jìn)行分層的低時(shí)延處理,例如一些大型AI訓(xùn)練推理應(yīng)用場景需要在核心云基于大數(shù)據(jù)和高算力做模型訓(xùn)練,配合區(qū)域特性可把一些訓(xùn)練規(guī)則部署在區(qū)域云中,而真正要做推理和實(shí)施時(shí),則會在邊緣云上提高其實(shí)時(shí)性。
圖2 分布式云中的邊緣、區(qū)域、核心云配置模型(來源:ITU-T Y.3508)
在分布式云的協(xié)同管理上最復(fù)雜的第3種模型中會引入云—區(qū)域—邊的協(xié)同調(diào)度和邊邊協(xié)同調(diào)度,以提高統(tǒng)一用戶感知的服務(wù),所有管理調(diào)度的前提是所有的云類型能力都來自于同一個(gè)云服務(wù)商(CSP)??稍诤诵脑乒芾砟芰ι仙壢终{(diào)度,在邊緣側(cè)引入邊緣云管理負(fù)責(zé)邊緣云自治和邊邊協(xié)同(見圖3)。目前,分布式云管理和架構(gòu)類的標(biāo)準(zhǔn)正在ITU-T進(jìn)行研究制定中。
圖3 分布式云管理調(diào)度邏輯架構(gòu)
泛在計(jì)算服務(wù)化架構(gòu)借鑒了NFV/SDN集中管理和云計(jì)算池化調(diào)度理念,通過集中化和分級化扁平平臺實(shí)現(xiàn)對泛在計(jì)算設(shè)備的算力和網(wǎng)絡(luò)信息收集、應(yīng)用管理調(diào)度和部署分發(fā),為用戶提供最優(yōu)的算力分配及網(wǎng)絡(luò)連接方案。分級調(diào)度的泛在計(jì)算的邏輯架構(gòu)由算力+網(wǎng)絡(luò)基礎(chǔ)設(shè)施層、算網(wǎng)管理調(diào)度層、計(jì)費(fèi)運(yùn)營層組成,這3層之間通過標(biāo)準(zhǔn)應(yīng)用程序接口(Application Programming Interface, API)互通,完成算力生成、調(diào)度、交易的閉環(huán)(見圖4)。其中,算網(wǎng)+基礎(chǔ)設(shè)施層提供異構(gòu)算力資源與確定性、無損的泛在網(wǎng)絡(luò)連接,是泛在計(jì)算服務(wù)大廈的基柱;算網(wǎng)管理調(diào)度層負(fù)責(zé)底層算網(wǎng)資源的算力注冊、智能調(diào)度、算力分解以及算法框架和應(yīng)用部署等功能,是泛在計(jì)算服務(wù)大廈的頂梁;計(jì)費(fèi)運(yùn)營層實(shí)現(xiàn)算力分級、交互界面、應(yīng)用商店、開發(fā)平臺等運(yùn)營功能,并利用區(qū)塊鏈技術(shù)實(shí)現(xiàn)基于智能合約的算力記賬,是泛在計(jì)算服務(wù)大廈的門戶。泛在計(jì)算服務(wù)化架構(gòu)具備3個(gè)特征:一是對社會泛在計(jì)算設(shè)備、云邊端三層多級算力的集中管理調(diào)度,實(shí)現(xiàn)控制與數(shù)據(jù)平面的分離;二是不改變當(dāng)前底層網(wǎng)絡(luò)架構(gòu)與IP協(xié)議實(shí)現(xiàn),通過平臺自身的多級調(diào)度能力實(shí)現(xiàn)互聯(lián)協(xié)同,調(diào)度參數(shù)通過松耦合的平臺調(diào)度邏輯實(shí)現(xiàn);三是一方面可以兼容當(dāng)前單體業(yè)務(wù)、應(yīng)用的架構(gòu)設(shè)計(jì)的組資源調(diào)度,同時(shí)也能支撐各類輕量化微服務(wù)架構(gòu)的細(xì)粒度調(diào)度。
圖4 泛在計(jì)算服務(wù)功能架構(gòu)
算力網(wǎng)絡(luò)本質(zhì)上是一種新型網(wǎng)絡(luò)架構(gòu)的分布式解決方案,其設(shè)計(jì)思想是從網(wǎng)絡(luò)出發(fā),將節(jié)點(diǎn)算力信息和網(wǎng)絡(luò)信息附著在新型算力路由協(xié)議之中并在基礎(chǔ)網(wǎng)絡(luò)中進(jìn)行擴(kuò)散,同時(shí)利用各個(gè)算力路由節(jié)點(diǎn)上基于服務(wù)標(biāo)識(Service ID)生成的路由轉(zhuǎn)發(fā)表,將用戶的算力請求轉(zhuǎn)發(fā)到合適的算力節(jié)點(diǎn)。算力網(wǎng)絡(luò)架構(gòu)當(dāng)前待解決的問題包括:一是基于算力路由的分布式轉(zhuǎn)發(fā)機(jī)制在應(yīng)用服務(wù)數(shù)量巨大、網(wǎng)絡(luò)規(guī)模龐大時(shí),每臺路由器需針對每個(gè)應(yīng)用服務(wù)在獲取全網(wǎng)信息后再獨(dú)立進(jìn)行路徑的計(jì)算,因此導(dǎo)致的網(wǎng)絡(luò)維護(hù)工作量巨大,此問題需克服;二是目前算力網(wǎng)絡(luò)協(xié)議關(guān)于匯聚、內(nèi)部網(wǎng)關(guān)協(xié)議(Interior Gateway Protocol, IGP)、邊界網(wǎng)關(guān)協(xié)議(Border Gateway Protocol, BGP)之間的交互以及不同網(wǎng)絡(luò)自治域(Autonomous System, AS)之間的交互細(xì)節(jié)研究尚不成熟,需進(jìn)一步加強(qiáng)[5];三是業(yè)務(wù)流粘性保持、算力節(jié)點(diǎn)業(yè)務(wù)指標(biāo)的通告頻率、準(zhǔn)確性等問題尚無一致方案,需繼續(xù)探討。
泛在計(jì)算設(shè)計(jì)思想從云計(jì)算出發(fā),通過集中化、分級化管理調(diào)度平臺實(shí)現(xiàn)對泛在計(jì)算設(shè)備算力和網(wǎng)絡(luò)信息的收集、管理編排、部署分發(fā),并通過統(tǒng)一的運(yùn)營門戶對客戶提供服務(wù),本質(zhì)上是一種集中式的解決方案。
泛在計(jì)算屬于疊加網(wǎng)絡(luò)(Overlay)方案,不改變底層網(wǎng)絡(luò)架構(gòu),應(yīng)用設(shè)計(jì)方式,在對傳統(tǒng)多方云邊資源池進(jìn)行納管的同時(shí),積極嘗試對泛終端設(shè)備進(jìn)行管理調(diào)度。由于引入多方算力提供者,因此在可信共識方案中將利用區(qū)塊鏈技術(shù)促進(jìn)云邊網(wǎng)端鏈五維協(xié)同,實(shí)現(xiàn)全社會泛在算力的可信共享交易,達(dá)到算網(wǎng)一體、算隨人選、算隨人動(dòng)的目標(biāo)愿景。
上述3種架構(gòu)的對比情況如表1所示,可見,算力網(wǎng)絡(luò)架構(gòu)與分布式云架構(gòu)、泛在計(jì)算服務(wù)化架構(gòu)不同,其作為一種新型的網(wǎng)絡(luò)架構(gòu),設(shè)計(jì)思想是從網(wǎng)絡(luò)出發(fā),利用分布式算力路由節(jié)點(diǎn)將用戶的算力需求轉(zhuǎn)發(fā)至最優(yōu)節(jié)點(diǎn),以此提升網(wǎng)絡(luò)自身的服務(wù)能力,可解決應(yīng)用在已知服務(wù)部署位置后幫助選取最優(yōu)服務(wù)接入的問題。分布式云架構(gòu)作為云計(jì)算發(fā)展的趨勢,通過云邊、邊邊協(xié)同機(jī)制,為用戶提供更低的延遲、更快的算力響應(yīng)速度,實(shí)現(xiàn)云計(jì)算技術(shù)的分布式下沉和整體云服務(wù)協(xié)同。當(dāng)前其實(shí)現(xiàn)主要在單云服務(wù)商內(nèi)部進(jìn)行擴(kuò)展。用戶在應(yīng)用分布式云架構(gòu)時(shí)仍需先選取云服務(wù)商再進(jìn)行單云內(nèi)調(diào)度。泛在計(jì)算服務(wù)化架構(gòu)作為分布式云發(fā)展的下一階段,在架構(gòu)設(shè)計(jì)理念上與分布式云架構(gòu)高度一致,不同之處在于可納管第三方云池甚至是端側(cè)設(shè)備,并可將網(wǎng)絡(luò)也作為調(diào)度考慮的重要因素之一,借助區(qū)塊鏈提供可信共享的算網(wǎng)一體化計(jì)算服務(wù),拓寬了計(jì)算服務(wù)的邊界。對用戶應(yīng)用而言,其可直接使用“算力”淘寶模式,完全無須關(guān)注應(yīng)用部署在何處。
表1 架構(gòu)方案對比分析
算力抽象是算力基礎(chǔ)設(shè)施層的關(guān)鍵技術(shù)之一。泛在計(jì)算基礎(chǔ)設(shè)施層所提供的算力資源,包含多種不同類型指令集、不同體系架構(gòu)異構(gòu)硬件,比如CPU、GPU、FPGA等。算力抽象主要在異構(gòu)基礎(chǔ)設(shè)施上對算力進(jìn)行抽象建模,通過在軟件層面提供跨硬件、跨廠家的標(biāo)準(zhǔn)、開放的編程環(huán)境與編程接口,使得應(yīng)用開發(fā)者無需了解底層硬件的具體信息,可以實(shí)現(xiàn)一套應(yīng)用代碼在任意底層硬件上執(zhí)行。算力抽象能夠提高算力基礎(chǔ)設(shè)施層的通用性、易用性,實(shí)現(xiàn)應(yīng)用基于算力而非硬件類型的部署,提升泛在算力的整體利用率,繁榮泛在計(jì)算生態(tài)。該技術(shù)可以從操作系統(tǒng)層面和異構(gòu)硬件層面進(jìn)行研究,制定相應(yīng)的開發(fā)模型。
算力調(diào)度是管理調(diào)度層的關(guān)鍵技術(shù)之一,為實(shí)現(xiàn)泛在計(jì)算的愿景,在云網(wǎng)邊端之上需要構(gòu)建多級的算力調(diào)度系統(tǒng)層以形成全網(wǎng)算力與網(wǎng)絡(luò)的調(diào)度、匹配,成為一個(gè)“算力操作系統(tǒng)”,將整個(gè)社會的算力節(jié)點(diǎn)與網(wǎng)絡(luò)管理納入統(tǒng)一的體系。算力調(diào)度平臺需要實(shí)時(shí)高效地獲取云網(wǎng)邊端各級算力節(jié)點(diǎn)資源信息,分析用戶需求,通過自動(dòng)化、智能化的調(diào)度方法及算法,提供最優(yōu)化的應(yīng)用部署及動(dòng)態(tài)管理方案。算力調(diào)度包含算力注冊、算力分解、算力調(diào)整與移動(dòng)性管理、算力生命周期管理等多個(gè)能力,是泛在計(jì)算的核心技術(shù)之一。該技術(shù)需要突破的難點(diǎn)包括如何納管異構(gòu)基礎(chǔ)設(shè)施設(shè)備、如何實(shí)現(xiàn)多級算力節(jié)點(diǎn)之間的網(wǎng)絡(luò)互通、如何構(gòu)建算隨人選和算隨人動(dòng)的系統(tǒng)能力、如何實(shí)現(xiàn)算力調(diào)度系統(tǒng)的分級部署等。
可信交易是計(jì)費(fèi)運(yùn)營層的關(guān)鍵技術(shù)之一,泛在計(jì)算的服務(wù)化可以考慮結(jié)合區(qū)塊鏈來實(shí)現(xiàn)可信交易,促進(jìn)共享經(jīng)濟(jì)式算力服務(wù)模式的商業(yè)模式實(shí)現(xiàn)。泛在計(jì)算的終端或云資源池都可以注冊在鏈上,由泛在計(jì)算交易平臺將這些算力源的使用情況記錄上鏈,并給予算力源一定的“代幣”或真實(shí)金額結(jié)算,鏈上的算力源都具備權(quán)限查閱自身的“代幣”或交易賬單,并可以使用“代幣”兌換獎(jiǎng)勵(lì)。該技術(shù)需要突破算力節(jié)點(diǎn)評級、算力計(jì)費(fèi)、算力記賬等難關(guān)。
算力建模和分級是對應(yīng)用進(jìn)行細(xì)化拆解的基礎(chǔ)技術(shù),是指針對業(yè)務(wù)場景分類,將業(yè)務(wù)所需算力需求按照一定分級標(biāo)準(zhǔn)劃分為多個(gè)等級,為算力提供者設(shè)計(jì)業(yè)務(wù)套餐提供參考,或作為其算力調(diào)度的輸入?yún)?shù)依據(jù)。以智能應(yīng)用為例,其算力訴求主要是浮點(diǎn)運(yùn)算能力,因此可以浮點(diǎn)計(jì)算能力的大小作為算力分級的依據(jù)。針對目前應(yīng)用的算力需求,超算類應(yīng)用、大型渲染類業(yè)務(wù)對算力的需求是最高的,可達(dá)到高于1 PFLOPS(每秒所執(zhí)行的浮點(diǎn)運(yùn)算次數(shù))以上的P級算力需求;AI訓(xùn)練類應(yīng)用,根據(jù)算法的不同以及訓(xùn)練數(shù)據(jù)的類型和大小,其所需的算力從G級到T級不等,如一般訓(xùn)練模型算力需求為300 GFLOPS(10億次/s的浮點(diǎn)運(yùn)算次數(shù)),tensorFlow算力需求達(dá)12 TFLOPS(1萬億次/s的浮點(diǎn)運(yùn)算次數(shù));AI 推理類業(yè)務(wù)對算力的需求稍弱,根據(jù)業(yè)務(wù)場景的不同,其所需算力一般在從幾百GFLOPS到 T 級不等,如智能安防業(yè)務(wù)所需算力較高可達(dá)到幾十TFLOPS。算力建模和分級有助于精確評估不同類型業(yè)務(wù)的服務(wù)能力需求,形成通用的算力服務(wù),為客戶的業(yè)務(wù)體驗(yàn)提供基礎(chǔ)保障[6]。
本文在算網(wǎng)融合背景下對泛在計(jì)算服務(wù)產(chǎn)生的驅(qū)動(dòng)力及演進(jìn)趨勢進(jìn)行了分析,提出了泛在計(jì)算服務(wù)的架構(gòu),并對當(dāng)前算網(wǎng)融合演進(jìn)目標(biāo)架構(gòu)進(jìn)行了對比分析,最后還闡述了算力抽象、算力調(diào)度、可信交易、算力建模和分級4個(gè)泛在計(jì)算服務(wù)的關(guān)鍵技術(shù)。未來,泛在計(jì)算將影響更為廣闊的生產(chǎn)與生活領(lǐng)域,如云游戲、高性能計(jì)算、電力生產(chǎn)管理、泛在感知領(lǐng)域等,將更大程度地提高生活品質(zhì)、提高生產(chǎn)效率、促進(jìn)社會算力流通交易。