“多樣性的應(yīng)用產(chǎn)生了多樣性的數(shù)據(jù),如此也就要求計(jì)算是多樣性的。既有X86,也有專門用于處理圖像的GPU、用于AI領(lǐng)域有NPU、用于信號處理領(lǐng)域的DSP。”華為公司董事、戰(zhàn)略Marketing總裁徐文偉在1月7日的發(fā)布會上表示,沒有單一技術(shù)架構(gòu)可以滿足所有場景,多重架構(gòu)是未來發(fā)展之路。而這場發(fā)布會的主角,就是基于ARM異構(gòu)計(jì)算的服務(wù)器CPU鯤鵬920芯片(以及基于該芯片的3款泰山服務(wù)器)。對于普通消費(fèi)者而言,這鯤鵬920的意義在哪里,他們根本無從知曉。甚至,在搜索引擎里我們還看到了如“麒麟980和鯤鵬920到底誰更強(qiáng)”這樣的疑問,貽笑大方倒也無妨,但這恰恰說明我們很有必要對此進(jìn)行一個(gè)簡單的解讀。
鯤鵬有志
之前我們看到,華為全球產(chǎn)業(yè)展望(GIV,Global Industry Vision)報(bào)告預(yù)測,到2025年,個(gè)人智能終端數(shù)量將達(dá)400億、個(gè)人智能助理普及率達(dá)90%、智能服務(wù)機(jī)器人將步入12%家庭,個(gè)人潛能將在終端感知、雙向交流和主動(dòng)服務(wù)的支持下大幅釋放。在商業(yè)和社會層面,到2025年,全球1000億聯(lián)接將泛在于公用事業(yè)、交通、制造、醫(yī)療、農(nóng)業(yè)和金融等各個(gè)領(lǐng)域,推動(dòng)數(shù)字化轉(zhuǎn)型,屆時(shí)企業(yè)應(yīng)用云化率將達(dá)85%、AI利用率達(dá)86%、數(shù)據(jù)利用率將劇增至80%.每年1800億TB的新增數(shù)據(jù)將源源不斷地創(chuàng)造智能和價(jià)值。
繼麒麟、巴龍、異騰后,鯤鵬920(Kunpeng920)的出現(xiàn)-主要就是為了覆蓋基于鯤鵬920的泰山( TaiShan)服務(wù)器、華為云服務(wù),進(jìn)一步擴(kuò)展其自主芯片陣營。單就意義來看,這款7nm工藝芯片亦是其首款基于ARM架構(gòu)的服務(wù)器CPU,面向智能時(shí)代到來打通從端到云的ARM價(jià)值鏈。前面提到,華為鯤鵬920服務(wù)器芯片是華為首二欠發(fā)布的基于ARM架構(gòu)的處理器芯片且該芯片基于ARM v8架構(gòu)的TaiShan(泰山)核是由華為自主研發(fā)。鯤鵬920單芯片支持64核,主頻高達(dá)2.6GHz,支持8通道DDR4、PCIe 4.0和CCIX互聯(lián)芯片。簡單來說,鯤鵬920具備高性能、高吞吐、高集成、高能效的特征。我們了解到,它SPECint跑分較當(dāng)前最好成績高出25%-為目前業(yè)界性能最高的CPU.因此,鯤鵬920的主戰(zhàn)場是應(yīng)用于大數(shù)據(jù)、分布式存儲、ARM原生應(yīng)用等場景,與麒麟處理器平臺出去完全不同的兩個(gè)應(yīng)用方向。
具體來說-為改善在低延時(shí)條件下高并發(fā)的能力,華為在鯤鵬920上采取了三項(xiàng)措施。首先將業(yè)界DDR通道數(shù)量從6通道增加到8通道,速率從2666MHz提升至2933MHz,總帶寬達(dá)到1.5T比特每秒,超出業(yè)界主流內(nèi)存帶寬46%;其次將PCle從3.0升級到4.0,速率翻番,帶寬達(dá)到640Gbps,比業(yè)界主流提升66%;第三將網(wǎng)口帶寬從25G直接提升到100G,帶寬翻了4倍。同時(shí),在傳統(tǒng)服務(wù)器架構(gòu)上CPU/南橋/網(wǎng)卡/硬盤控制器是系統(tǒng)標(biāo)配-需要4顆芯片來實(shí)現(xiàn)(隨著workload的豐富多樣、異構(gòu)計(jì)算的不斷興起-在服務(wù)器層面需要更多的槽位來部署不同的業(yè)務(wù)加速部件,而槽位在服務(wù)器上是一個(gè)緊缺資源)-而鯤鵬920不僅是一顆通用CPU,還同時(shí)集成了南橋、網(wǎng)卡、SAS存儲控制器等三種芯片的功能,做到集成度業(yè)界第一,單顆芯片實(shí)現(xiàn)4顆芯片的功能,從而可以釋放出更多槽位擴(kuò)展更多功能,大幅提高系統(tǒng)的集成度并為客戶帶來總體擁有成本上的收益。
況且,云計(jì)算的興起,使得數(shù)據(jù)中心規(guī)模越來越大,從幾臺服務(wù)器、幾個(gè)機(jī)架演變成以萬臺服務(wù)器為單位的數(shù)據(jù)中心集群,占地空間和能源消耗成為大型數(shù)據(jù)中心的重要影響因素,節(jié)能具有更重要的意義。正因每個(gè)機(jī)架的供電能力是有限的,每個(gè)機(jī)架的計(jì)算能力越強(qiáng),在大規(guī)模數(shù)據(jù)中心建設(shè)時(shí)越能有效減少總體占地和減少功耗?;邛H鵬920,在大規(guī)模數(shù)據(jù)中心業(yè)務(wù)實(shí)踐中-每萬臺服務(wù)器可每年省電1000萬度,這可不是一個(gè)能夠被忽略的數(shù)據(jù)。
正如徐文偉所談到的那樣,“如今萬物互聯(lián)的智能世界正在到來,華為致力于帶來無處不在的連接、無所不及的智能,以及實(shí)現(xiàn)個(gè)性化體驗(yàn)、打造數(shù)字化平臺?!?018年,華為面向終端領(lǐng)域發(fā)布了將手機(jī)推向智慧新高度麒麟980.面向AI發(fā)布了邊緣計(jì)算算力最強(qiáng)的SoC異騰310,鯤鵬920的發(fā)布亦是為此。
打好基礎(chǔ)才算布局
業(yè)務(wù)與數(shù)據(jù)的多樣性,驅(qū)動(dòng)計(jì)算的多樣性,這是必然的趨勢。沒有一個(gè)單一的計(jì)算架構(gòu)能夠滿足所有場景、所有數(shù)據(jù)類型的處理,我們看到各種CPU、DSP、GPU、AI芯片、FPGA等同時(shí)存在,多種計(jì)算架構(gòu)共存的異構(gòu)計(jì)算,是未來的發(fā)展之路。任何一個(gè)新事物的出現(xiàn)都脫離不了時(shí)代大背景,鯤鵬920的誕生同樣如此。首先,業(yè)務(wù)和數(shù)據(jù)的多樣性需要新的計(jì)算架構(gòu)。智能時(shí)代的信息量巨大-計(jì)算無處不在,計(jì)算應(yīng)用的場景多種多樣,從智能手機(jī)終端到IoT物聯(lián)網(wǎng),再到智能駕駛的智能家居,場景的多樣性,帶來數(shù)據(jù)的多樣性,多重結(jié)構(gòu)化數(shù)據(jù)(比如音頻和圖像相結(jié)合的智能識別操作)對于各種“點(diǎn)端”運(yùn)算有著更具象的要求,而且非常迫切。更重要的是,海量的數(shù)據(jù)增長帶來了更高的計(jì)算需求。有預(yù)測機(jī)構(gòu)報(bào)道,到2025年,全球的智能端點(diǎn)運(yùn)算數(shù)據(jù)鏈容量是2018年的18倍。面對如此巨大的數(shù)據(jù)增長,對計(jì)算和存儲都提出了很高的要求。算力供應(yīng)問題,存在嚴(yán)重的供需不平衡,特別是隨著人工智能走向成熟增長期,每年增長約10倍,這將驅(qū)動(dòng)一個(gè)指數(shù)級增長的巨大計(jì)算空間。
于是,鯤鵬920的市場本身就具備一種逆向推動(dòng)性。這款芯片基于ARM架構(gòu)授權(quán)(有報(bào)道顯示,華為擁有ARM的架構(gòu)授權(quán)長達(dá)20年).由華為自主設(shè)計(jì)完成,為目前業(yè)界最高性能的ARM-Based CPU。之前,華為創(chuàng)始人任正非早在2012年的一二欠內(nèi)部講話中即指出,“我們在做高端芯爿的時(shí)候,我并沒有反對你們買美國的高端芯片。我認(rèn)為你們要盡可能的用他們的高端芯片,好好的理解它。只有他們不賣給我們的時(shí)候,我們的東西稍微差一點(diǎn),也要湊合能用上去……主要是讓別人允許我們用,而不是斷了我們的糧食。斷了我們糧食的時(shí)候,備份系統(tǒng)要能用得上。”
“斷糧”這事,真的很令人頓足捶胸。眾所周知,目前國內(nèi)智能制造的發(fā)展如火如禁,中國制造在自動(dòng)化、數(shù)字化、智能化的道路上“快馬加鞭”.國內(nèi)制造業(yè)顯現(xiàn)出優(yōu)化升級的一片大好場景。但是有些技術(shù)和應(yīng)用仍然處于低端水平-據(jù)調(diào)查顯示,當(dāng)前中國核心集成電路國產(chǎn)芯片占有率低,在計(jì)算卡幾、移動(dòng)通信終端等領(lǐng)域的芯片國產(chǎn)占有率幾近為零。不免讓人感慨,中國制造雖火,但仍舊掩蓋不了芯片的短處,實(shí)在有些“堵芯”啊。
中國芯片制造業(yè)為何難以突破?究其原因,一方面是卡在了制造環(huán)節(jié)上?,F(xiàn)在中國大陸第一領(lǐng)軍是紫光國芯的技術(shù)還仍停留在28nm制程上,并且優(yōu)良率只達(dá)到40% 。與高通、臺積電國際芯片制造廠商10nm-7nm相比,可以看到很明顯的差距。另一方面-光刻機(jī)成套設(shè)備成為阻礙國內(nèi)芯片制造的大難矣。在高端光刻機(jī)方面-全球僅日本的尼康、佳能、荷蘭的ASML三大企業(yè)掌握了該項(xiàng)技術(shù)。也正因?yàn)樾酒叨酥圃煜拗疲L期以來,我國芯爿的需求大部分都依托國外進(jìn)口,也使得中國芯片自主創(chuàng)新能以實(shí)現(xiàn)突破,無法打破國外芯片壟斷市場的局面。客觀來說,目前的中國芯片制造雖然整體成果不顯著,但是仍阻止不了行業(yè)的高速發(fā)展,大部分行業(yè)處于拼命追趕階段,個(gè)別行業(yè)甚至是關(guān)鍵領(lǐng)域已經(jīng)處躍進(jìn)世界前茅,可以說,中國芯片制造還是道阻且長。此二欠華為鯤鵬920芯片的發(fā)布,無疑給國內(nèi)芯片制造打了一針強(qiáng)心劑,相信未來中國芯片制造將會實(shí)現(xiàn)更大的突破,徹底掙脫“缺心而被斷糧”的隱憂。
寫在最后
在兩年前的2017年-基于ARM架構(gòu)的芯片全球出貨量超過了1200億片一一技術(shù)的不斷進(jìn)步-特別是開放的生態(tài)-推動(dòng)ARM架構(gòu)從最早的終端走向邊緣計(jì)算,如今更走向服務(wù)器和數(shù)據(jù)中心。僅僅因?yàn)檫@個(gè)“市場需求”的原因,華為就不可能忽視ARM構(gòu)架服務(wù)器處理平臺的市場,這其中更重要的原因,在于華為的“野心”,或者說“不能瘸腿且不求于人的全線布局”。有趣的是,鯤鵬920芯片暫不對外銷售,只用于華為自己的服務(wù)器和云(但將會與英特爾保持長期戰(zhàn)略合作),這里面很有值得玩昧的地方。顯然,華為發(fā)布鯤鵬920也有著展現(xiàn)強(qiáng)大創(chuàng)新實(shí)力以及對外部形勢未雨綢繆的考量。