全球科技變革的當(dāng)下,AI、5G與AIoT時(shí)代的大門緩緩開(kāi)啟,眾多新技術(shù)、新應(yīng)用、新產(chǎn)品潛移默化推動(dòng)人們數(shù)字生活變革的同時(shí),各類定制化芯片開(kāi)始嶄露頭角。在以數(shù)據(jù)為驅(qū)動(dòng)的第五波計(jì)算浪潮下,ASIC與FPGA定制芯片開(kāi)始頻繁出現(xiàn)在人們眼前,對(duì)于習(xí)慣了CPU、GPU等芯片的大眾而言,ASIC與FPGA芯片多少有些陌生,但對(duì)于整個(gè)半導(dǎo)體產(chǎn)業(yè)而言,ASIC與FPGA卻代表著方向與未來(lái)……
定制化芯片大趨勢(shì)
第五波計(jì)算浪潮下,異構(gòu)計(jì)算、云AI、5G基礎(chǔ)等領(lǐng)域不斷崛起,催生市場(chǎng)對(duì)定制化芯片的需求。以人們熟悉的消費(fèi)市場(chǎng)SoC芯片為例,芯片廠商設(shè)計(jì)完整的系統(tǒng)級(jí)解決方案,集成有CPU、GPU、ISP、DSP、基帶、藍(lán)牙、Wi-Fi等多種模塊,可以為設(shè)備制造商大幅度減少研發(fā)成本和開(kāi)發(fā)周期,這類SoC芯片屬于通用型的標(biāo)準(zhǔn)芯片產(chǎn)品。而在數(shù)據(jù)中心、物聯(lián)網(wǎng)、云AI、5G基礎(chǔ)設(shè)施等多種企業(yè)級(jí)場(chǎng)景中,由于各廠商采用的運(yùn)行邏輯存在很大差異化,很難通過(guò)標(biāo)準(zhǔn)的通用型方案來(lái)解決問(wèn)題,于是廠商會(huì)采用ASIC芯片定制方案。
例如物聯(lián)網(wǎng)市場(chǎng),在各種物聯(lián)網(wǎng)設(shè)備傳輸大量數(shù)據(jù)的過(guò)程中,各類廠商之間存在不一樣的云端架構(gòu)和數(shù)據(jù)處理邏輯,因此廠商會(huì)通過(guò)ASIC服務(wù)定制SerDes方案來(lái)提升數(shù)據(jù)傳輸能力,讓網(wǎng)絡(luò)和數(shù)據(jù)中心能夠快速有效地處理大量特定類型數(shù)據(jù),從而提升云端的處理速度,有效創(chuàng)建連接應(yīng)用以滿足特定需求。
除了ASIC定制化芯片之外,GPU(GraphicsProcessing Unit,圖形處理單元)、半定制化的FPGA以及神經(jīng)擬態(tài)芯片等技術(shù)架構(gòu)芯片開(kāi)始在AI、物聯(lián)網(wǎng)等領(lǐng)域嶄露頭角,而隨著時(shí)間的推移,定制化芯片領(lǐng)域開(kāi)始出現(xiàn)ASIC與FPGA兩大陣營(yíng),兩大陣營(yíng)產(chǎn)品在滿足不同細(xì)分市場(chǎng)差異化需求的同時(shí),也開(kāi)始出現(xiàn)“交集”,而英特爾等實(shí)力強(qiáng)悍的半導(dǎo)體芯片廠商,更是同步推出FPGA、eASIC和ASIC在內(nèi)的一系列自定義邏輯產(chǎn)品組合以滿足終端消費(fèi)市場(chǎng)差異化需求。與此同時(shí),以礦機(jī)為代表的特定場(chǎng)景用途產(chǎn)品的崛起,開(kāi)始讓ASIC與FPGA成為越來(lái)越多大眾市場(chǎng)消費(fèi)者關(guān)注的對(duì)象。
具有科普性質(zhì)的數(shù)字礦機(jī)
以往,ASIC與FPGA應(yīng)用的領(lǐng)域更偏商用,普通消費(fèi)者很難有清晰的認(rèn)知,但在定制化芯片發(fā)展過(guò)程中,數(shù)字貨幣礦機(jī)成為ASIC與FPGA走向大眾消費(fèi)市場(chǎng)乃至重構(gòu)市場(chǎng)對(duì)定制芯片認(rèn)知的契機(jī)。
這些年隨著以比特幣為代表的虛擬貨幣市場(chǎng)的火爆,催生了一大批生產(chǎn)“挖掘”虛擬貨幣設(shè)備的“礦機(jī)”廠商,其中最為知名的要屬比特大陸了。而比特大陸之所以能夠在礦機(jī)市場(chǎng)異軍突起,則主要得益于其自主設(shè)計(jì)的針對(duì)比特幣礦機(jī)的ASIC芯片。因?yàn)橄鄬?duì)于CPU、GPU來(lái)說(shuō),采用專用的ASIC芯片來(lái)“挖礦”
更具效率。以比特大陸的Antminer S9礦機(jī)為例,其內(nèi)部集成了189個(gè) ASIC芯片(BM1387),而且采用的是臺(tái)積電16nm FinFET制程。同樣,目前主流的礦機(jī)廠商都采用的是定制的ASIC芯片。這也使得ASIC芯片開(kāi)始被大眾所熟知。
而在比特大陸ASIC礦機(jī)風(fēng)行以前,最早期的礦機(jī)其實(shí)是FPGA礦機(jī),使用FPGA芯片作為算力核心的礦機(jī)首次出現(xiàn)在2011年末,在當(dāng)時(shí)一度被看好,但活躍期并不長(zhǎng),后逐漸被ASIC礦機(jī)與GPU礦機(jī)取代,但在沉淀一段時(shí)間后,F(xiàn)PGA礦機(jī)開(kāi)始重出江湖,除強(qiáng)于GPU的運(yùn)算能力外,F(xiàn)PGA礦機(jī)擁有低于ASIC礦機(jī)的制造成本與更短的生產(chǎn)周期,再加上可編程設(shè)計(jì),讓礦機(jī)商可通過(guò)軟件升級(jí)讓礦機(jī)挖取不同算法的POW幣種,進(jìn)而重新受到大眾歡迎。
事實(shí)上,ASIC與FPGA在礦機(jī)市場(chǎng)的爭(zhēng)斗只是兩者在定制化芯片領(lǐng)域應(yīng)用的一個(gè)小小的插曲,但卻在機(jī)緣巧合下成為ASIC與FPGA在大眾市場(chǎng)的科普案例,人們進(jìn)一步且更為清晰認(rèn)識(shí)到兩種芯片差異及可能的應(yīng)用方向。
走近ASIC與FPGA
在解析ASIC與FPGA芯片應(yīng)用方向及對(duì)數(shù)字社會(huì)推動(dòng)作用以前,清楚明白地了解ASIC與FPGA異同格外重要。目前,在集成電路界ASIC被認(rèn)為是一種為專門目的而設(shè)計(jì)的集成電路。是指應(yīng)特定用戶要求和特定電子系統(tǒng)的需要而設(shè)計(jì)、制造的集成電路。ASIC的特點(diǎn)是面向特定用戶的需求,ASIC在批量生產(chǎn)時(shí)與通用集成電路相比具有體積更小、功耗更低、可靠性提高、性能提高、保密性增強(qiáng)、成本降低等優(yōu)點(diǎn)。
而FPGA(Field-ProgrammableGateArray)指現(xiàn)場(chǎng)可編程門陣列,它是在PAL、GAL、CPLD等可編程器件的基礎(chǔ)上進(jìn)一步發(fā)展的產(chǎn)物。它是作為專用集成電路(ASIC)領(lǐng)域中的一種半定制電路而出現(xiàn)的,既解決了定制電路的不足,又克服了原有可編程器件門電路數(shù)有限的缺點(diǎn)。
ASIC具有高性能、低功耗的優(yōu)勢(shì),但它們包含的任何算法—除了那些在軟件內(nèi)部處理器內(nèi)核執(zhí)行的—其余都是“凍結(jié)的”。所以這個(gè)時(shí)候我們就需要現(xiàn)場(chǎng)可編程門陣列(FPGA)了。早期的FPGA器件的架構(gòu)相對(duì)簡(jiǎn)單—只是一系列通過(guò)可編程互連的可編程模塊。總的來(lái)說(shuō),ASIC 可以更有針對(duì)性地進(jìn)行硬件層次的優(yōu)化,從而獲得更好的性能、功耗比,但是ASIC芯片的設(shè)計(jì)和制造需要大量的資金、較長(zhǎng)的研發(fā)周期和工程周期,而且深度學(xué)習(xí)算法仍在快速發(fā)展,若深度學(xué)習(xí)算法發(fā)生大的變化,F(xiàn)PGA能很快改變架構(gòu),適應(yīng)最新的變化,ASIC類芯片一旦定制則難于進(jìn)行修改。
兩大芯片陣營(yíng)技術(shù)的差異化帶來(lái)應(yīng)用情景的不同,而在AI、5G等各新興技術(shù)領(lǐng)域崛起的大時(shí)代背景下,ASIC與FPGA在各實(shí)際應(yīng)用中并沒(méi)有絕對(duì)的優(yōu)劣,各自推動(dòng)著技術(shù)及產(chǎn)業(yè)的更迭。
半定制與全定制的博弈
在定制化芯片領(lǐng)域,F(xiàn)PGA(現(xiàn)場(chǎng)可編程門陣列)是一直可編程的半定制芯片,而傳統(tǒng)ASIC則通常被稱為全定制芯片。具體使用過(guò)程中,通電時(shí),F(xiàn)PGA芯片將EPROM中數(shù)據(jù)讀入片內(nèi)編程RAM中,配置完成后,F(xiàn)PGA進(jìn)入工作狀態(tài)。掉電后,F(xiàn)PGA恢復(fù)成白片,內(nèi)部邏輯關(guān)系消失,因此,F(xiàn)PGA能夠反復(fù)使用。 因此,F(xiàn)PGA在理論上允許無(wú)限次的編程,可以被修改來(lái)改正程序中的錯(cuò)誤和更便宜的造價(jià)。
全定制的ASIC則面向特定用戶的需求打造,在批量生產(chǎn)時(shí)與通用集成電路相比具有體積更小、功耗更低、可靠性提高、性能提高、保密性增強(qiáng)、成本降低等優(yōu)點(diǎn)。但ASIC需要較長(zhǎng)的開(kāi)發(fā)周期,風(fēng)險(xiǎn)較大,一旦有問(wèn)題,成片全部作廢,在一些體量較小的領(lǐng)域初創(chuàng)型企業(yè)希望用小批量產(chǎn)品打開(kāi)市場(chǎng)時(shí),ASIC就不太合適了。
但FPGA獲得靈活性、可編程以及反復(fù)使用的優(yōu)勢(shì)并非沒(méi)有代價(jià),相同的工藝和設(shè)計(jì)下,基于通用的結(jié)構(gòu)的FPGA上的速度理論上會(huì)慢于ASIC,這是因?yàn)镕PGA內(nèi)部是LUT(look up table),它可以實(shí)現(xiàn)加法器,組合邏輯等等,而ASIC,一般加法器就是加法器,而比較器就是比較器,F(xiàn)PGA結(jié)構(gòu)上的通用性必然導(dǎo)致冗余;另外,作為FPGA基本單元是LUT(LUT組成SLICE,SLICE組成CLB——這是xilinx的結(jié)構(gòu)),為此大的設(shè)計(jì)假如一個(gè)LUT實(shí)現(xiàn)不了,就得用兩個(gè)LUT,一個(gè)SLICE實(shí)現(xiàn)不了就要用CLB,不同結(jié)構(gòu)處于特定的位置,信號(hào)之間的互聯(lián),導(dǎo)致的線延遲(wiredelay)是不可忽略的一部分。
此外,F(xiàn)PGA貴在單片,開(kāi)發(fā)工具和風(fēng)險(xiǎn)基本不存在。對(duì)于ASIC貴在流片的費(fèi)用和開(kāi)發(fā)工具,NRE費(fèi)用隨著工藝的提高變相當(dāng)貴,除非你的芯片一次成功可以量產(chǎn),否則單片費(fèi)用同樣會(huì)昂貴到一些企業(yè)直接放棄。
總體而言,ASIC用于大型項(xiàng)目,如CPU、DSP或多層交換芯片等,或者是應(yīng)用于技術(shù)非常成熟且利潤(rùn)率非常低的產(chǎn)品,如家用電器和其他消費(fèi)類電器,抑或是大量應(yīng)用的通用器件如RAM、PHY等。而對(duì)于需要快速投放市場(chǎng)且支持遠(yuǎn)程升級(jí)的小型項(xiàng)目,F(xiàn)PGA則更為適合,如PDH、2.5G以下SDH設(shè)備和大部分的接口轉(zhuǎn)換芯片等。
極具潛力的應(yīng)用領(lǐng)域
AI、5G、數(shù)據(jù)中心等新興技術(shù)領(lǐng)域的崛起為ASIC與FPGA提供廣闊的應(yīng)用空間,兩者均能應(yīng)用于這類新興技術(shù)產(chǎn)業(yè)生態(tài),不過(guò)在具體分支賽道上,卻又各有不同。以AI領(lǐng)域?yàn)槔ミ_(dá)首款專門為深度學(xué)習(xí)從零開(kāi)始設(shè)計(jì)的芯片Tesla P100數(shù)據(jù)處理速度是其 2014 年推出GPU系列的12倍。谷歌為機(jī)器學(xué)習(xí)定制的芯片TPU將硬件性能提升至相當(dāng)于當(dāng)前芯片按摩爾定律發(fā)展7年后的水平。正如CPU改變了當(dāng)年龐大的計(jì)算機(jī)一樣,人工智能ASI C芯片也將大幅改變?nèi)缃馎I硬件設(shè)備的面貌。如大名鼎鼎的 AlphaGo 使用了約170個(gè)圖形處理器(GPU)和1200個(gè)中央處理器(CPU),這些設(shè)備需要占用一個(gè)機(jī)房,還要配備大功率的空調(diào),以及多名專家進(jìn)行系統(tǒng)維護(hù)。而如果全部使用專用芯片,極大可能只需要一個(gè)普通收納盒大小的空間,且功耗也會(huì)大幅降低。
而從服務(wù)器,計(jì)算機(jī)到無(wú)人駕駛汽車、無(wú)人機(jī)再到智能家居的各類家電,至少數(shù)十倍于智能手機(jī)體量的設(shè)備需要引入感知交互能力和人工智能計(jì)算能力,這些領(lǐng)域?qū)I專用芯片的需求,都將成為ASIC 芯片的成長(zhǎng)空間。至于靈活且運(yùn)行深度學(xué)習(xí)算法能效更高的FPGA,新一代百度大腦也是基于FPGA平臺(tái)研發(fā)。
事實(shí)上,ASIC與FPGA在應(yīng)用上并非絕對(duì)固定的,不少企業(yè)在開(kāi)發(fā)“深度學(xué)習(xí)處理單元”(DeepProcessing Unit,DPU)的芯片時(shí),通常第一批產(chǎn)品就是基于FPGA平臺(tái)開(kāi)發(fā)研制出來(lái)的,這種半定制芯片雖然依托于FPGA平臺(tái),但是抽象出了指令集與編譯器,可以快速開(kāi)發(fā)、快速迭代,一旦產(chǎn)品成熟便會(huì)以ASIC芯片的形態(tài)大規(guī)模投入市場(chǎng)。
而在數(shù)據(jù)中心領(lǐng)域,數(shù)據(jù)企業(yè)對(duì)流水線并行和數(shù)據(jù)并行處理需求以及密集通信任務(wù)需求,讓傳統(tǒng)GPU芯片不堪重負(fù),而CPU也難以兼顧功耗比ASIC專用芯片在吞吐量、延遲和功耗三方面都無(wú)可指摘,但其劣勢(shì)也是非常明顯的,微軟曾因放棄使用ASIC專用芯片而給出這樣的理由——“數(shù)據(jù)中心的計(jì)算任務(wù)是靈活多變的,而ASIC研發(fā)成本高、周期長(zhǎng)。好不容易大規(guī)模部署了一批某種神經(jīng)網(wǎng)絡(luò)的加速卡,結(jié)果另一種神經(jīng)網(wǎng)絡(luò)更火了,錢就白費(fèi)了。FPGA只需要幾百毫秒就可以更新邏輯功能。FPGA的靈活性可以保護(hù)投資,事實(shí)上,微軟現(xiàn)在的 FPGA玩法與最初的設(shè)想大不相同。數(shù)據(jù)中心是租給不同的租戶使用的,如果有的機(jī)器上有神經(jīng)網(wǎng)絡(luò)加速卡,有的機(jī)器上有Bing搜索加速卡,有的機(jī)器上有網(wǎng)絡(luò)虛擬化加速卡,任務(wù)的調(diào)度和服務(wù)器的運(yùn)維會(huì)很麻煩。使用FPGA可以保持?jǐn)?shù)據(jù)中心的同構(gòu)性。”
因此,F(xiàn)PGA在數(shù)據(jù)中心里憑借穩(wěn)定又極低的延遲以及充分的靈活性,適用于流式的計(jì)算密集型任務(wù)和通信密集型任務(wù),
事實(shí)上,ASIC與FPGA在市場(chǎng)應(yīng)用上并不存在絕對(duì)的競(jìng)爭(zhēng)關(guān)系,F(xiàn)PGA常年來(lái)被用作專用芯片ASIC的小批量替代品,然而近年來(lái)在微軟、百度等公司的數(shù)據(jù)中心大規(guī)模部署,以同時(shí)提供強(qiáng)大的計(jì)算能力和足夠的靈活性。
積極落子的巨頭們
“讓專業(yè)的人做專業(yè)的事兒”——相對(duì)于傳統(tǒng)CPU和GPU產(chǎn)品,ASIC與FPGA產(chǎn)品的出現(xiàn),即大幅提升芯片產(chǎn)品能效,又獲得了不輸傳統(tǒng)CPU產(chǎn)品的兼容性,更伴隨AI、5G、數(shù)據(jù)中心等領(lǐng)域的崛起成為絕對(duì)的市場(chǎng)風(fēng)口。而面對(duì)這些足以改變甚至重構(gòu)全球數(shù)字生態(tài),動(dòng)輒達(dá)到萬(wàn)億美元規(guī)模的科技基建領(lǐng)域,高通、英偉達(dá)等半導(dǎo)體科技領(lǐng)域巨頭自然不會(huì)錯(cuò)過(guò)。
大舉并購(gòu)成為巨頭們進(jìn)入ASIC與FPGA最直接有效的方式。2020年10月27日,AMD與Xilinx(賽靈思)宣布達(dá)成最終協(xié)議,AMD以全股票交易的方式收購(gòu)賽靈思,交易金額為350億美元,收下賽靈思,AMD就兼?zhèn)淞薈PU、GPU、FPGA、自適應(yīng)SoC和軟件的完整能力,業(yè)務(wù)橫跨個(gè)人電腦、數(shù)據(jù)中心、5G通信、汽車芯片、游戲產(chǎn)品、航空航天等諸多產(chǎn)品領(lǐng)域;2021年,高通宣布以14億美元的價(jià)格成功收購(gòu)NUVIA,后者是一家專門設(shè)計(jì)用于各種應(yīng)用程序(包括高端計(jì)算和服務(wù)器應(yīng)用程序)的基于ARM的定制CPU的公司,此次并購(gòu)NUVIA的交易表明,高通公司正在尋求將高端集成CPU設(shè)計(jì)納入其產(chǎn)品組合,以及創(chuàng)建組合5G SoC設(shè)計(jì)的可能性。
而早在2015年,英特爾就以167億美元的代價(jià)收購(gòu)邏輯編程芯片巨頭Altera公司,加上這次AMD收購(gòu)賽靈思,業(yè)界兩大獨(dú)立的FPGA的廠商都被收購(gòu),那么此后江湖似乎再無(wú)規(guī)模稍大的FPGA廠商。公開(kāi)資料顯示,F(xiàn)PGA原有四大巨頭分別是賽靈思、Altera、Lattice和Actel。英特爾收購(gòu)Altera,Microsemi(美高森)收購(gòu)Actel(微芯收購(gòu)美高森),AMD收購(gòu)賽靈思。
巨頭們?cè)义X搶入ASIC與FPGA賽道絕不可能只是為了技術(shù)儲(chǔ)備,新一代信息技術(shù)升級(jí)大背景下,布局ASIC與FPGA賽道的巨頭早早地開(kāi)始了紅利爭(zhēng)奪戰(zhàn)。
率先開(kāi)打的數(shù)據(jù)中心爭(zhēng)奪戰(zhàn)
相對(duì)于遙不可及的AI以及專業(yè)性更強(qiáng)、更細(xì)分的5G通信,數(shù)據(jù)中心成為眾多巨頭布局ASIC與FPGA賽道的關(guān)鍵目標(biāo),畢竟無(wú)論是數(shù)據(jù)中心本身還是云計(jì)算、大數(shù)據(jù)等相關(guān)領(lǐng)域,數(shù)據(jù)中心都能給市場(chǎng)帶來(lái)巨大的想象空間和當(dāng)下就已經(jīng)存在的剛需與經(jīng)濟(jì)價(jià)值。
在不少人眼里,數(shù)據(jù)中心是一個(gè)無(wú)比豐盈的大市場(chǎng),而且數(shù)據(jù)中心加速器的需求正爆發(fā)增長(zhǎng)。據(jù)Semico研究公司預(yù)測(cè),全球數(shù)據(jù)中心加速器(包括CPU、GPU、FPGA和ASIC)市場(chǎng)規(guī)模將從2018年的28.4億美元增長(zhǎng)到2023年的211.9億美元,年復(fù)合增長(zhǎng)率(CAGR)高達(dá)50%。其中增長(zhǎng)最快的FPGA加速器,2018年只有10億美元,到2023年將超過(guò)50億美元,其增長(zhǎng)驅(qū)動(dòng)力主要來(lái)自企業(yè)級(jí)數(shù)據(jù)負(fù)載加速應(yīng)用。事實(shí)上,包括微軟、AWS到阿里云等幾乎每個(gè)全球云計(jì)算巨頭的數(shù)據(jù)中心都密布著大量的FPGA產(chǎn)品。
2020年10月,由于NVIDIA將基于Mellanox的SmartNIC卡(智能網(wǎng)卡)命名為“DPU”,DPU這一概念一炮而紅。DPU(Data Processing Unit的縮寫(xiě))也就是所謂的數(shù)據(jù)處理單元。它是最新發(fā)展起來(lái)的專用處理器的一個(gè)大類,為高帶寬、低延遲、數(shù)據(jù)密集的計(jì)算場(chǎng)景提供計(jì)算引擎。算力源于芯片,目前數(shù)據(jù)中心中核心算力芯片包括CPU、GPU、FPGA和少量ASIC,其中各類通用CPU占比還是絕對(duì)統(tǒng)治地位。根據(jù)Nvidia和初創(chuàng)公司Fungible的預(yù)測(cè),用于數(shù)據(jù)中心的DPU量級(jí)將達(dá)到和數(shù)據(jù)中心服務(wù)器等量的級(jí)別。服務(wù)器每年新增大約千萬(wàn)量級(jí),每臺(tái)服務(wù)器可能沒(méi)有GPU,但一定會(huì)有一顆或者多顆DPU,好比每臺(tái)服務(wù)器都必須配網(wǎng)卡一樣。而且服務(wù)器每年新增大約1500萬(wàn)臺(tái),每顆DPU如果以1萬(wàn)元計(jì)算,這將是千億量級(jí)的市場(chǎng)規(guī)模。
除NVIDIA外,有Intel (收購(gòu)Bear foot)、Mellanox(已被Nvidia收購(gòu))、Mar vell(收購(gòu)了Cavium)、Broadcom、Fungible(初創(chuàng))、Pensando(初創(chuàng))等企業(yè)都有推出DPU產(chǎn)品,但是每家的DPU在具體功能定位和技術(shù)上還是有明顯差異的,其中,Intel是基于FPGA實(shí)現(xiàn)的,主要面向交換機(jī)、路由器芯片;Broadcom基于Arm實(shí)現(xiàn),也是主要面向交換機(jī)、路由器芯片;Marvell通過(guò)收購(gòu)Cavium,基于Arm實(shí)現(xiàn),主要面向5G的基帶;初創(chuàng)公司Pensando通過(guò)軟件定義網(wǎng)絡(luò)處理器,主要面向支持P4的SDN;另外一家初創(chuàng)公司Fungible基于MIPS實(shí)現(xiàn),主要面向網(wǎng)絡(luò)、存儲(chǔ)、虛擬化;Nvidi收購(gòu)Mellanox的網(wǎng)絡(luò)方案,其他功能基于Arm實(shí)現(xiàn),主要面向數(shù)據(jù)安全、網(wǎng)絡(luò)、存儲(chǔ)卸載。
然而,在DPU大舉進(jìn)入數(shù)字中心領(lǐng)域以前,以英特爾為代表的傳統(tǒng)半導(dǎo)體企業(yè)一直牢牢把持著數(shù)據(jù)中心CPU產(chǎn)品,雖然英特爾自己也有相關(guān)DPU產(chǎn)品,但面對(duì)全面發(fā)力的DPU產(chǎn)品集團(tuán)軍,英特爾也走出了數(shù)據(jù)自己的融合與創(chuàng)新之路。
掌握著英特爾未來(lái)大門鑰匙的IPU
如果說(shuō)X86 CPU鑄就了英特爾輝煌的過(guò)去,那IPU則成為英特爾打開(kāi)未來(lái)世界的鑰匙。在物聯(lián)網(wǎng)時(shí)代,我們已經(jīng)看到了太多以“xPU”命名的處理器,無(wú)論是英偉達(dá)的DPU還是谷歌的NPU與TPU,這類產(chǎn)品從數(shù)據(jù)中心入手,在萬(wàn)物互聯(lián)大背景下,不斷向傳統(tǒng)CPU/GPU領(lǐng)域發(fā)起沖擊,而英特爾在Six Five峰會(huì)上,公布了其對(duì)基礎(chǔ)設(shè)施處理器(IPU)的愿景,除自身技術(shù)、產(chǎn)品系列升級(jí)外,同樣可以看作是對(duì)“xPU”類產(chǎn)品的反擊。
按照英特爾官方的介紹,推出面向基礎(chǔ)設(shè)施應(yīng)用的 IPU處理器是為了滿足數(shù)據(jù)中心和云服務(wù)提供商的最新需求。據(jù)悉,IPU 全稱為“InfrastructureProcessing Unit”,官方描述為一種可編程網(wǎng)絡(luò)設(shè)備,旨在幫助云與通信服務(wù)提供商減少相關(guān)任務(wù)對(duì)中央處理器(CPU)的資源開(kāi)銷需求,并進(jìn)一步釋放相關(guān)平臺(tái)的性能潛力。
X86時(shí)代,英特爾原本在數(shù)據(jù)中心市場(chǎng)擁有絕對(duì)的話語(yǔ)權(quán),但隨著5G、AI、云計(jì)算等新興技術(shù)的崛起以及數(shù)據(jù)中心自身技術(shù)的更迭和應(yīng)用的變化,大量ASIC芯片、FPGA芯片逐步滲透進(jìn)入市場(chǎng),大有動(dòng)搖英特爾在數(shù)據(jù)中心市場(chǎng)地位的態(tài)勢(shì)。
作為自身SmartNIC產(chǎn)品服務(wù)的延續(xù),IPC產(chǎn)品不僅可以滿足邊緣計(jì)算需求外,IPU本身更可通過(guò)AI學(xué)習(xí)實(shí)現(xiàn)部分?jǐn)?shù)據(jù)的處理,為CPU核心減負(fù)的同時(shí),專注提升整個(gè)網(wǎng)絡(luò)數(shù)據(jù)處理效率,同英特爾其他ASIC、FPGA芯片產(chǎn)品配合使用,進(jìn)而提升整體數(shù)據(jù)中心解決方案的效率。
FPGA與ASIC的融合猜想
無(wú)論是眾多半導(dǎo)體巨頭推出的“xPU”產(chǎn)品還是英特爾主導(dǎo)的IPU產(chǎn)品,無(wú)非是將“分工”做到極致,讓芯片專注某一方面甚至某一環(huán)節(jié)的工作,從而極大提升產(chǎn)品工作效率。既然芯片間可以協(xié)作,那芯片從設(shè)計(jì)之處,何嘗不具備融合的可能?
隨著新一代FPGA SoC的出現(xiàn),人們發(fā)現(xiàn)當(dāng)FPGA越來(lái)越像SoC,F(xiàn)PGA同ASIC的產(chǎn)品邊際開(kāi)始被打破。許多公司創(chuàng)建RTL并對(duì)其進(jìn)行驗(yàn)證,但幾乎不知道他們最終會(huì)選擇FPGA還是ASIC,因?yàn)檫@個(gè)決定可能會(huì)變很多次。芯片設(shè)計(jì)企業(yè)可以從FPGA開(kāi)始,當(dāng)達(dá)到一定數(shù)量后,如果ASIC成本更低,就轉(zhuǎn)到ASIC上,降低硬件成本驅(qū)動(dòng)著芯片設(shè)計(jì)企業(yè)用更靈活、高效的方式完成產(chǎn)品從設(shè)計(jì)到量產(chǎn)的過(guò)程。
Intel繼收購(gòu)Altera之后,于2018年收購(gòu)了芯片公司eASIC,該公司提供一種介于FPGA與ASIC中間的技術(shù)。通過(guò)半成品的結(jié)構(gòu)化ASIC,能夠節(jié)省NRE費(fèi)用和設(shè)計(jì)時(shí)間,而芯片的性能和功耗又接近標(biāo)準(zhǔn)單元ASIC。此舉被看作是Intel在FPGA和標(biāo)準(zhǔn)ASIC之間的戰(zhàn)略布局。
相應(yīng)的還有eFPGA的形式,例如Achronix,F(xiàn)lexLogix等廠商,通過(guò)將一個(gè)或多個(gè)FPGA以IP的形式嵌入ASIC或SoC等芯片中,實(shí)現(xiàn)數(shù)字可重構(gòu)的結(jié)構(gòu),從而使芯片實(shí)現(xiàn)更高的靈活性和可重新配置的特性。
這種方法在航空航天、無(wú)線基站、無(wú)人駕駛等領(lǐng)域收到了相當(dāng)大的關(guān)注,畢竟一個(gè)新興技術(shù)領(lǐng)域的成長(zhǎng),需要從技術(shù)到產(chǎn)品不斷的調(diào)試,才能最終成型,而這個(gè)不斷學(xué)習(xí)甚至不斷試錯(cuò)的過(guò)程,F(xiàn)PGA與ASIC的融合型產(chǎn)品能更好地滿足市場(chǎng)差異化需求。
寫(xiě)在最后:放緩了的摩爾定律
隨著摩爾定律的放緩,提高能效成本效益的唯一途徑就是定制和專業(yè)化。人們心中最理想的芯片,其速度可以比肩GPU,效率不輸ASIC,同時(shí)又具備CPU的適用性和FPGA的可定制性。越來(lái)越多半導(dǎo)體科技巨頭開(kāi)始往這方面嘗試,谷歌的TPU、賽靈思的ACAP、英偉達(dá)、三星、ThinkForce、ThinCI、REXComputing、Graphcore、Cambricon、Cerebras、SpiNNaker和地平線等,巨頭們升級(jí)自身技術(shù)及產(chǎn)品線更迭的同時(shí),何嘗不是想要在未來(lái)的搬到離領(lǐng)域獲得足夠多的話語(yǔ)權(quán)呢?
同時(shí),F(xiàn)PGA與ASIC未來(lái)的競(jìng)爭(zhēng)邊界被模糊并不會(huì)讓人感到意外,即使是在當(dāng)下的數(shù)據(jù)中心應(yīng)用領(lǐng)域,更實(shí)用的做法也是FPGA和CPU協(xié)同工作,局部性和重復(fù)性強(qiáng)的歸FPGA,復(fù)雜的歸CPU,唯有分工,才能讓標(biāo)準(zhǔn)化推動(dòng)整個(gè)行業(yè)的進(jìn)步。