張平
蘋果在2020年作出的最重要舉動就是推出了搭載自研M1芯片的全新系列筆記本電腦。相比英特爾的產(chǎn)品,蘋果宣稱這款名為M1的芯片擁有更為出色的效能和更低的電力消耗。隨后的實(shí)測結(jié)果顯示,蘋果M1的確展示出了卓越的性能,甚至一度超越了英特爾的旗艦產(chǎn)品。那么,蘋果是如何做到這一點(diǎn)的?這款SoC的設(shè)計(jì)有何獨(dú)特之處呢?
蘋果是全球移動產(chǎn)業(yè)最強(qiáng)大的企業(yè)之一,這一點(diǎn)也反映在蘋果旗下的產(chǎn)品上。雖然在每次發(fā)布會上,蘋果都很少從技術(shù)層面介紹自家的SoC產(chǎn)品,但是其強(qiáng)悍的性能、極高的性能功耗比往往會在實(shí)際產(chǎn)品上市后給用戶和業(yè)界帶來震驚,甚至部分性能超過了相近時(shí)間發(fā)布的其他廠商的SoC的生能的數(shù)代之多。
在M1發(fā)布后,各大媒體迅速對這款產(chǎn)品進(jìn)行了測試,測試數(shù)據(jù)表明,M1的CPU性能在包括CineBenchR23、GeekBench 5、GFXBench等多種、多類型的測試中都取得了卓越的成績。在CineBench R23的單線程性能、GeekBench 5的單線程性能測試中,M1的CPU性能甚至可以和全新的Zen 3架構(gòu)的銳龍9 5950X以及英特爾第11代酷睿系列處理器打得有來有回,甚至部分性能還能有所超越。
那么,一個(gè)值得探討的問題就出現(xiàn)了。蘋果的M1的CPU性能為什么這么出色?它真的超越了目前的桌面頂級產(chǎn)品嗎?對于這一些問題,本文嘗試通過一些探討和數(shù)據(jù)來予以解釋。需要提前說明的是,由于蘋果在產(chǎn)品細(xì)節(jié)和技術(shù)細(xì)節(jié)上的缺失,本文的部分內(nèi)容屬于探討性質(zhì),可能和實(shí)際情況存在差異,建議大家參考閱讀。
蘋果M1:一顆復(fù)雜的SoC產(chǎn)品
首先需要明確的一點(diǎn)是,蘋果M1芯片并不是一個(gè)單一的CPU或者GPU,它是一個(gè)包含了包含了CPU、GPU、ISP、NPU、DSP、緩存等諸多單元模塊的SoC產(chǎn)品。它采用的是臺積電的5nm工藝,包含了大約160億個(gè)晶體管。
在相關(guān)組成部分方面,M1包含了4個(gè)Firestrom高性能CPU核心和4個(gè)Icestrom低功耗CPU核心,以及一個(gè)規(guī)模較大的、擁有8個(gè)核心的GPU(包含了1024個(gè)EU單元),此外還有擁有16核心的NPU單元、所有核心共享的系統(tǒng)級別緩存。內(nèi)存方面支持雙通道64bit LPDDR4X 2133內(nèi)存,還擁有包括PCle總線控制器和雷電4接口控制器這樣的外部鏈接單元模塊等。
從M1的設(shè)計(jì)和規(guī)模來看,蘋果的目的是要在一個(gè)芯片上達(dá)成幾乎所有的功能,同時(shí)實(shí)現(xiàn)性能和功耗的平衡。作為面向性能市場的產(chǎn)品,M1這樣的做法在之前其他廠商那里完全沒有出現(xiàn)。因此,必須很深入地了解蘋果在M1的CPU部分做了什么又做對了什么,才能理解為什么M1的CPU部分為何擁有如此出色的性能表現(xiàn)。但是令人遺憾的是,蘋果現(xiàn)在公布的資料遠(yuǎn)遠(yuǎn)不足,我們依舊只能通過第三方手段和報(bào)道才能管中窺豹了解M1這顆堪稱劃時(shí)代產(chǎn)品的一角。
多就是好:Firestrom核心晶體數(shù)量巨大
蘋果一直以來幾乎不發(fā)布任何有關(guān)產(chǎn)品的內(nèi)部細(xì)節(jié)設(shè)計(jì),尤其是芯片類產(chǎn)品。因此,這部分的分析將從第三方資料入手。可能和實(shí)際情況存在差異。
從現(xiàn)在第三方媒體公布的M1的晶圓照片來看,其中最大部分的面積是GPU,大概占據(jù)了整個(gè)M1 lg%的面積。接下來則是4個(gè)FireStrom大核心和12MB L2緩存,大約占據(jù)了13%的芯片面積。
考慮到整個(gè)M1 SoC擁有160億晶體管,并假設(shè)整個(gè)SoC上晶體管密度是均勻分布的。那么,M1的GPU部分大約有30億晶體管,與此類似的是,M1 SoC的4個(gè)高性能CPU搭配12MB L2緩存則占據(jù)了20億晶體管。
在晶體管數(shù)量明確后,我們可以用于對比目前比較主流的處理器了。比如AMD之前公布過Zen 3架構(gòu)的每個(gè)CCD的晶體管數(shù)量為41.5億,擁有8個(gè)核心和總計(jì)約36MB緩存( 12+13)。如果這個(gè)數(shù)據(jù)減半的話,比如4個(gè)核心搭配18MB緩存,那么大約占據(jù)20.5億晶體管。相比M1 CPU部分的數(shù)據(jù),AMD Zen 3在緩存多了6MB的情況下,晶體管數(shù)量基本持平,這也意味著蘋果的M1的FireStrom大核心的每一個(gè)核心所使用的晶體管數(shù)量是顯著大于AMD Zen3的,也就是說M1的CPU架構(gòu)要比Zen3更為龐大。
從臺積電公開的一些數(shù)據(jù)來看,臺積電的7nm工藝每平方毫米大約可以容納0.9億個(gè)晶體管。對蘋果而言,根據(jù)同為5nm工藝的A14芯片的最終效果,臺積電的5nm工藝密度相比7nm提升了49%,為每平方毫米1.34億,每平方毫米約1.34億晶體管??紤]到1MB SRAM在6T的情況下?lián)碛屑s5000萬個(gè)晶體管,但往往SRAM在實(shí)際使用中可能會使用8T或者10T的版本,因此綜合來看,1MBSRAM以0.7億晶體管計(jì)算,那么可以估計(jì)出7nm工藝下1MB SRAM的面積約為0.8平方毫米,5nm工藝下為約為0.5平方毫米。
有了上文的數(shù)據(jù),本文再度假設(shè)這些數(shù)據(jù)和AMD、蘋果最終產(chǎn)品呈現(xiàn)出來的實(shí)際數(shù)據(jù)是基本相當(dāng)?shù)摹?/p>
這樣一來,Zen 3每個(gè)核心除去L2+L3緩存的話,大約擁有(41.5-36x0.7) /8=約2億晶體管,占據(jù)核心面積是2.2平方毫米。蘋果的M1的高性能核心每個(gè)核心則擁有( 20-12x0.7) /4=2.9億晶體管,每個(gè)占據(jù)核心面積為2.16平方毫米。在這種粗略的計(jì)算下,蘋果的高性能核心每個(gè)核心的晶體管數(shù)量比AMD的Zen3多出了接近1億。也就是說,蘋果M1 Firestrom核心的晶體管用量,是AMD Zen 3晶體管用量的大約1.5倍左右。當(dāng)然,這個(gè)數(shù)據(jù)是估計(jì)值,極有可能和實(shí)際情況差別很大,但無論怎樣,蘋果M1使用的Firestrom核心史無前例地大,那是肯定跑不掉的。
這樣的結(jié)果就很有意思了。因?yàn)閷ΜF(xiàn)代CPU設(shè)計(jì)來說,其基本的設(shè)計(jì)理念和道路都是非常明確的,在當(dāng)前物理?xiàng)l件下,AMD、蘋果乃至英特爾、ARM等廠商在CPU在設(shè)計(jì)中獲取最大化的性能或者性能功耗比的手段是基本是一樣的,因此很難或者基本不存在某個(gè)廠商擁有突破級別的技術(shù)。之所以市場上存在各種獨(dú)特的CPU產(chǎn)品,那是因?yàn)槠涿嫦虻膶ο?、競爭?yōu)勢的區(qū)間以及成本衡量存在巨大差異。當(dāng)然,部分廠商依舊擁有自己獨(dú)特的優(yōu)勢,比如英特爾在分支預(yù)測方面一直獨(dú)步業(yè)界,但是綜合來看,如果約束條件相當(dāng)?shù)脑?,這些廠商設(shè)計(jì)出來的處理器綜合性能應(yīng)該是基本相同的。唯一能有所突破的地方就是使用更多的晶體管構(gòu)建更大規(guī)模的架構(gòu)。顯而易見的是,蘋果之前在這樣做,現(xiàn)在也持續(xù)在這樣做。
僅僅從晶體管數(shù)量來看的話,蘋果M1的Firestrom核心強(qiáng)悍不是沒有理由的,肆無忌憚堆資源,不強(qiáng)悍也難。那么,蘋果將這些晶體管資源用在了哪里呢?
大就是好:來自蘋果8寬度CPU構(gòu)架
蘋果在CPU架構(gòu)設(shè)計(jì)方面擁有接近十年的歷史。蘋果首個(gè)定制化的SoC是2012年發(fā)布的A6,隨后的每一年,蘋果都會推出一個(gè)全新的CPU微架構(gòu)。早在2013年,蘋果便推出了一個(gè)名為Cyclone的微架構(gòu)并宣稱其為“桌面級別”微架構(gòu),這也是業(yè)界史上首個(gè)在移動設(shè)備上實(shí)現(xiàn)64bit計(jì)算的CPU架構(gòu),ARM和安卓世界要在一年以后才能趕上蘋果的步伐。最新的蘋果處理器是2020年發(fā)布的iPhone 12系列手機(jī)的A14 SoC中使用的名為Firestrom的大核心架構(gòu),和M1芯片中使用的Firestrom架構(gòu)基本一致。
還是那個(gè)原因,蘋果不發(fā)布所有有關(guān)處理器架構(gòu)的信息,因此外界一般無從得知蘋果對CPU微架構(gòu)都干了些什么。好在作為業(yè)內(nèi)老牌技術(shù)網(wǎng)站的anandtech通過深入測試和合理推測,給出了有關(guān)Firestrom核心架構(gòu)的簡圖。
根據(jù)anandtech的資料顯示,蘋果Firestrom核心是一個(gè)8寬度的超寬、超標(biāo)量、亂序的核心。相比之下,X86處理器比如AMD Zen 3依1日只有4寬度,英特爾的產(chǎn)品也只有4+1寬度設(shè)計(jì),和其他ARM處理器相比的話,ARM出品的最新Cortex-X1擁有5寬度,其余都采用4寬度,三星M3雖然是6寬度,但是實(shí)際表現(xiàn)并不出色。
在亂序執(zhí)行能力方面,通過測試可以看出,蘋果的ROB單元能夠允許的指令排序容量大約是630條目左右,雖然并不是很確定蘋果在這部分是否采用了和其他處理器類似的設(shè)計(jì),否則如此巨大的容量,顯示蘋果Firestrom擁有龐大的亂序執(zhí)行排序能力和調(diào)度能力,當(dāng)然這也對應(yīng)著后端龐大的執(zhí)行單元部分。作為對比的是,英特爾的Sunny Cove和Willow Cove的ROB容量僅僅352,這已經(jīng)是目前除了Firestrom外我們知道的處理器中最大的了,AMD的Zen3僅為256條目,ARM的Cortex-X1僅為224條目。
在后端來看的話,整數(shù)執(zhí)行部分,有關(guān)重命名寄存器的容量估計(jì)為354條目,這也是非常巨大的容量,此外還擁有至少7個(gè)執(zhí)行端口用于計(jì)算相應(yīng)的算術(shù)計(jì)算,包括4個(gè)具有ADD執(zhí)行能力的ALU,2個(gè)可以執(zhí)行MUL的復(fù)雜計(jì)算單元和可能存在的專用整數(shù)除法單元。
在浮點(diǎn)和矢量部分,F(xiàn)irestrom帶來了全新的第四條執(zhí)行管道,進(jìn)一步提升了浮點(diǎn)計(jì)算的理論性能。浮點(diǎn)重命名寄存器容量約為384條目,還包含4個(gè)128b.t的NEON浮點(diǎn)流水線。此外,F(xiàn)irestrom每周期還可以執(zhí)行4個(gè)FADD和4個(gè)FMUL,延遲分別是3個(gè)和4個(gè)周期。這樣龐大的浮點(diǎn)計(jì)算規(guī)模是AMD Zen 3的2倍、是英特爾和AMD之前架構(gòu)每周期吞吐量的大約4倍。
在加載存儲方面,目前的測試顯示Firestrom可能會有4個(gè)執(zhí)行端口,1個(gè)加載存儲單元、1個(gè)專用存儲單元和2個(gè)專用家在單元。每個(gè)周期可以執(zhí)行3個(gè)負(fù)載任務(wù),每個(gè)周期最多可以執(zhí)行2個(gè)存儲,但是最多只能同時(shí)執(zhí)行2個(gè)負(fù)載和2個(gè)存儲。
在TLB方面,L1的TLB從1 28頁增加了一倍至256頁,L2 TLB從2048頁增加到了3072頁。由于每個(gè)TLB頁面大小為16KB,因此3072的TLB可以覆蓋48MB的緩存,這實(shí)際上是超過了現(xiàn)在的M1 SoC或者之前的A14的緩存容量的。因此這部分的設(shè)計(jì)具體如何實(shí)現(xiàn)還有待進(jìn)一步探查。
最后來看緩存體系結(jié)構(gòu)。之前A13的設(shè)計(jì)的有關(guān)推測中,蘋果就設(shè)計(jì)了高達(dá)128KB的L1指令緩存和128KB L1數(shù)據(jù)緩存,從處理器設(shè)計(jì)角度來看這是極為不可思議的,因?yàn)橐话闾幚砥鞯腖1緩存不會超過32KB(新的Sunny Cove是48KB),甚至部分處理器只使用16KB。當(dāng)然,更大的緩存能顯著幫助處理器內(nèi)核快速獲取指令,不過成本代價(jià)和晶體管數(shù)量代價(jià)非常高昂。在新的Firestrom上,可能這個(gè)容量已經(jīng)進(jìn)一步提升至192KB,這可以解釋為什么蘋果的處理器在高指令壓力工作負(fù)載中表現(xiàn)出色。
在高速緩存的速度方面,F(xiàn)irestrom的L1數(shù)據(jù)緩存可以以3個(gè)周期的延遲載入,對于如此巨大的緩存架構(gòu)而言這是非常難得的數(shù)據(jù)。相比之下,英特爾Sunny Cove只是增加至48KB,就需要5個(gè)周期載入,AMD 32KB的L1緩存則需要4個(gè)周期,相比蘋果的設(shè)計(jì)還是存在一定的差異。L2方面,蘋果一直以來都直接選擇一個(gè)容量較大且快速的L2緩存設(shè)計(jì),比如2個(gè)內(nèi)核共享8MB緩存。在早前的A14芯片上,L2的延遲為16個(gè)周期。
另外值得注意的是,蘋果在M1設(shè)計(jì)中還設(shè)計(jì)了一個(gè)SLC緩存,這個(gè)緩存位于整個(gè)芯片的中央部位,考慮到M1的內(nèi)存帶寬較小,因此這個(gè)SLC緩存可能是用于暫存部分?jǐn)?shù)據(jù)信息,充當(dāng)整個(gè)M1芯片的緩存使用。不過蘋果沒有公布SLC的使用方法和容量,一些測試顯示,SLC的緩存容量可能為32MB,延遲可能為40ns,這個(gè)數(shù)據(jù)如果屬實(shí)的話,那么M1 SoC在緩存設(shè)計(jì)上應(yīng)該還有更多的信息可供挖掘。
最后則是Firestrom架構(gòu)的有關(guān)時(shí)鐘頻率方面的內(nèi)容。對Firestrom這種比較寬大的體系架構(gòu)來說,一般認(rèn)為其頻率難以達(dá)到比較高的水平。不過在蘋果的A14上,F(xiàn)irestrom的頻率可以達(dá)到最高3GHz,2個(gè)Firestrom核心啟用的時(shí)候頻率會降低至2.89GHz。在M1處理器商,F(xiàn)irestrom能達(dá)到的最高頻率為3.2GHz,也沒有太大的提升。
總的來看,蘋果在A14和M1處理器上實(shí)現(xiàn)了一個(gè)寬度高達(dá)8,并且緩存、執(zhí)行資源非常充裕的超大核心,這也是前文提及的Firestrom核心可能單核心的晶體管數(shù)量就要比包括Zen 3、Sunny Cove、Zen 2等架構(gòu)高出許多的原因。從蘋果在架構(gòu)方面的努力來看,蘋果致力于“頻率不夠、規(guī)模來湊”,并且較低的頻率能夠帶來較低的功耗和極高的性能功耗比。這也是蘋果一貫以來的操作策略了。
蘋果在M1的Firestrom設(shè)計(jì)中采用了高達(dá)8解碼的前端,那么為什么X86處理器難以做到這一點(diǎn)呢?實(shí)際上,這里很可能是由于CISC指令集天生的痼疾導(dǎo)致這個(gè)問題的出現(xiàn),現(xiàn)在難以解決。
對Firestrom架構(gòu)來說,采用的是RISC精簡指令集,所有的指令都是等長的,因此可以將整個(gè)指令序列按照一定的等長規(guī)則進(jìn)行分割再交由解碼器解碼,就可以實(shí)現(xiàn)同時(shí)并發(fā)多個(gè)指令。不過這一點(diǎn)對CISC復(fù)雜指令集來說卻很困難,X86使用的CISC指令集是不等長的,在前一個(gè)指令沒有讀完之前不知道后部的指令頭位置在哪里,難以并行解碼。當(dāng)然,現(xiàn)代X86 CPU往往通過各種手段繞開CSIC指令集的不等長缺陷,比如通過經(jīng)驗(yàn)來猜測指令的結(jié)尾,或者對指令可能存在的起點(diǎn)都進(jìn)行一次解碼并拋棄完全錯(cuò)誤的部分。由于CSIC不等長指令集的問題,X86目前可以做到4個(gè)解碼器或者4+1解碼器已經(jīng)是極限了。不僅如此,這種不等長的復(fù)雜指令還影響到了CPU亂序執(zhí)行和的部分,因?yàn)椴坏乳L和不可預(yù)測性,亂序執(zhí)行變得很困難。鑒于此,在現(xiàn)代X86 CPU的內(nèi)部,所有的CSIC指令集都會被翻譯為成為uOP也就是“微指令”或者“微碼”( Micro Operations),通過規(guī)整的微碼來統(tǒng)-CPU內(nèi)部的流程。也正是由于uOP的出現(xiàn),X86處理器才有可能在效率和性能上趕上RISC架構(gòu)。
當(dāng)然,CISC也不是沒有優(yōu)點(diǎn),那就是一個(gè)指令可以執(zhí)行更多的操作,整體效率相對較高,占用內(nèi)存較少。RISC需要多條指令完成的任務(wù),CSIC可能只用一條指令就可以實(shí)現(xiàn),這也是CSIC相對RISC的優(yōu)勢所在。
統(tǒng)一內(nèi)存架構(gòu)的實(shí)現(xiàn):蘋果的全新創(chuàng)舉
上文我們提到了蘋果在CPU設(shè)計(jì)上的一些獨(dú)特之處。在這一部分,我們將從更為宏觀的角度來審視蘋果M1處理器的設(shè)計(jì)。
正如前文所說,蘋果M1處理器內(nèi)部包含了大量的不同單元,除了CPU、GPU、NPU等外,還有最重要的,就是統(tǒng)一內(nèi)存架構(gòu)。
在M1處理器中,CPU、GPU、NPU和所有的單元都使用了一個(gè)統(tǒng)一的、和芯片緊密靠近的統(tǒng)一內(nèi)存架構(gòu)。這個(gè)架構(gòu)的好處在于,CPU和GPU之間可以互相訪問數(shù)據(jù),這樣可以大大降低數(shù)據(jù)搬運(yùn)和復(fù)制的時(shí)間,也能夠縮減各個(gè)不同的處理模塊之間等待數(shù)據(jù)準(zhǔn)備的時(shí)間。M1在硬件和軟件上首次統(tǒng)一,完成了迄今為止首個(gè)真正進(jìn)入商業(yè)化和民用市場的統(tǒng)一內(nèi)存架構(gòu)。
對傳統(tǒng)PC而言,CPU的數(shù)據(jù)存放在內(nèi)存中,GPU的數(shù)據(jù)存放在本地存儲(顯存)中。當(dāng)GPU需要做什么事情的時(shí)候,或者說CPU需要讓GPU去做什么事情的時(shí)候,數(shù)據(jù)會從內(nèi)存中經(jīng)過總線拷貝至GPU的顯存中,這個(gè)拷貝的過程帶來了比較明顯的延遲和功耗的提升。反過來,GPU在計(jì)算完成后,需要將數(shù)據(jù)放置在CPU的內(nèi)存中,再告訴CPU數(shù)據(jù)的位置,這個(gè)過程也存在延遲和功耗提升。不過,現(xiàn)在存在一些技術(shù)可以讓CPU讀取GPU顯存中的數(shù)據(jù),或者反過來GPU也可以訪問CPU的數(shù)據(jù),但受制于兼容性和各個(gè)廠商之間的協(xié)調(diào)以及操作系統(tǒng)、軟件適配、軟件生態(tài)等原因,這樣的技術(shù)并不成熟。
在M1上,由于CPU、GPU、NPU等等計(jì)算核心包括操作系統(tǒng)、軟件等都來自蘋果公司自己,因此這樣的問題可以在一個(gè)體系下進(jìn)行協(xié)調(diào),最終我們看到的是一個(gè)完整的、基于統(tǒng)一內(nèi)存架構(gòu)的SoC-M1。整個(gè)M1內(nèi)部所有的硬件模塊都擁有統(tǒng)一的內(nèi)存地址,數(shù)據(jù)不再需要額外轉(zhuǎn)移,這在很大程度上提升了整個(gè)系統(tǒng)的效率。
另外,在內(nèi)存的部署中,M1芯片采用的是目前移動SoC慣用的“Package-on-Package”的方法,也就是讓內(nèi)存芯片盡可能靠近應(yīng)用處理器,讓他們之間的距離盡可能縮小。這樣的優(yōu)勢在于,—方面盡可能地降低了內(nèi)存?zhèn)鬏數(shù)哪芎模硪环矫婵梢越档蛢?nèi)存?zhèn)鬏數(shù)难舆t。M1的內(nèi)存理論帶寬為68.2GB/s,從這個(gè)數(shù)據(jù)來看,和目前桌面主流的比如AMD Zen 2、英特爾十代酷睿,是顯著更低的,比如AMD Zen 2的內(nèi)存帶寬可達(dá)100G B/s以上。但是,考慮到蘋果在統(tǒng)一內(nèi)存架構(gòu)、內(nèi)存POP封裝上以及本身處理器內(nèi)部超大緩存的設(shè)計(jì)等,因此整體性能表現(xiàn)還是非常出色的。
異構(gòu)計(jì)算的上馬:專業(yè)的人做專業(yè)的事情
作為一個(gè)擁有1 60億晶體管的龐大SoC,M1內(nèi)部包含的各個(gè)功能模塊是非常多而且復(fù)雜的。除了前文深入分析的CPU外,還包括進(jìn)行3D圖像計(jì)算的GPU、進(jìn)行神經(jīng)網(wǎng)絡(luò)計(jì)算的NPU、視頻編解碼器、音頻處理單元、HDR視頻處理單元、HDR圖像處理單元、常開處理器、矩陣協(xié)處理器等。在M1的設(shè)計(jì)中,蘋果貫徹了能用專業(yè)單元就不用通用單元的思想,“讓專業(yè)的人做專業(yè)的事情”,這會讓性能表現(xiàn)更加高效。
在蘋果對M1相關(guān)產(chǎn)品的宣傳中,有針對M1在視頻處理計(jì)算上優(yōu)勢的專門介紹。實(shí)際上,由于蘋果在M1內(nèi)部專門設(shè)置了HDR視頻處理單元和視頻編解碼單元,在經(jīng)過操作系統(tǒng)和專業(yè)軟件的調(diào)用后,就能夠地輕松發(fā)揮出這些專用單元的效能,從而獲得極為優(yōu)秀的性能表現(xiàn)。另外值得一提的是蘋果的矩陣協(xié)處理器,它可以用于執(zhí)行一些常規(guī)代碼加速而不是專門調(diào)用GPU或者NPU。換句話說,蘋果通過這樣的設(shè)置,帶來了非常出色的性能功耗比表現(xiàn)。
對M1采用大量專用單元進(jìn)行針對性加速的方法,業(yè)內(nèi)往往以異構(gòu)計(jì)算對其進(jìn)行歸類和稱呼。一般來說,異構(gòu)計(jì)算是指擁有多種不同類型計(jì)算能力和優(yōu)勢的模塊在統(tǒng)一調(diào)度下進(jìn)行計(jì)算的方式。對于M1來說,蘋果的軟件和M1的硬件,以及其他相關(guān)軟件配合,實(shí)現(xiàn)了迄今為止業(yè)內(nèi)面向消費(fèi)者最為出色的異構(gòu)計(jì)算架構(gòu)。
不過,雖然M1在異構(gòu)計(jì)算上做得非常出色,但是異構(gòu)計(jì)算還存在一個(gè)致命的問題,那就是由于硬件固定了計(jì)算路徑,未來如果算法和應(yīng)用升級的話,那么相關(guān)的異構(gòu)計(jì)算單元可能就無法發(fā)揮作用??紤]到蘋果同時(shí)控制了操作系統(tǒng)和軟件開發(fā)環(huán)境,這樣的問題可能短時(shí)間內(nèi)不會出現(xiàn),但依舊需要進(jìn)一步觀察。
開辟一條全新的道路?
到這里,本文對M1處理器的分析就基本告一段落了。從蘋果在M1處理器中的設(shè)計(jì)來看,依托于5nm的強(qiáng)大優(yōu)勢,蘋果通過集成高達(dá)160億個(gè)晶體管資源,超大規(guī)模的CPU核心、大量專用的模塊以及緩存設(shè)計(jì),在較低的功耗下取得了相對于現(xiàn)有高端X86處理器部分相當(dāng)?shù)男阅?,甚至在部分測試中還有所超出,這是非常了不起的成績,凸顯了蘋果強(qiáng)大的軟硬件技術(shù)實(shí)力。
從M1以及蘋果在軟件、系統(tǒng)上的努力可以看出,似乎蘋果正在開辟一條全新的道路來挑戰(zhàn)X86在個(gè)人電腦中的領(lǐng)導(dǎo)地位。之前RISC陣營也曾經(jīng)挑戰(zhàn)過X86在PC上的領(lǐng)導(dǎo)地位,但是顯然失敗了。蘋果則借由移動計(jì)算開始,現(xiàn)在通過統(tǒng)一移動和桌面端的架構(gòu),模糊移動設(shè)備和個(gè)人電腦之間的界限,并借由M1這樣性能卓越、功能強(qiáng)勁的產(chǎn)品來吸引消費(fèi)者關(guān)注,這不得不說是一招秒棋。從技術(shù)角度來看,M1充分發(fā)揮了RISC CPU架構(gòu)的優(yōu)勢,再加上蘋果不惜工本地投入大量晶體管資源、統(tǒng)一內(nèi)存架構(gòu)、異構(gòu)計(jì)算、定制各種不同功能的計(jì)算單元以及全新的操作系統(tǒng)、軟件生態(tài),都給人帶來了耳目一新的感覺。接下來,蘋果要怎么走呢?是推出更強(qiáng)大的M2、M3以及更加緊密的生態(tài)系統(tǒng)?還是進(jìn)一步統(tǒng)一移動端和桌面端呢?這都讓人相當(dāng)期待。