黃陽(yáng)棋
(中國(guó)電子信息產(chǎn)業(yè)發(fā)展研究院,北京 100048)
為滿足對(duì)海量信息的高速處理需求,同時(shí)兼顧系統(tǒng)功耗和成本,當(dāng)前信息系統(tǒng)中所使用的存儲(chǔ)器已經(jīng)發(fā)展出了一套由不同特性存儲(chǔ)器組成的多級(jí)存儲(chǔ)架構(gòu)。一般而言,這一存儲(chǔ)架構(gòu)由靠近計(jì)算端的內(nèi)核存儲(chǔ)器、承上啟下的主存儲(chǔ)器,以及靠近數(shù)據(jù)端的外部存儲(chǔ)器組成。
多級(jí)存儲(chǔ)器中每一級(jí)存儲(chǔ)器在容量、速度、價(jià)格、功耗這4個(gè)方面均有不同的取舍[1]。
內(nèi)核存儲(chǔ)器,又稱為緩存(Cache),主要使用嵌入式存儲(chǔ),屬于中央處理器(CPU)結(jié)構(gòu)中的一部分,速度在三級(jí)存儲(chǔ)中最快但容量最小,且造價(jià)高昂、功耗也較高,只能用于存放計(jì)算過(guò)程中的臨時(shí)數(shù)據(jù)。主存儲(chǔ)器主要使用動(dòng)態(tài)隨機(jī)存儲(chǔ)器(Dynamic Random Access Memory,DRAM),速度只有緩存的1/4,但容量是緩存的1 000倍,造價(jià)和功耗也相對(duì)內(nèi)核存儲(chǔ)更低,主要用于存儲(chǔ)運(yùn)行中的程序及數(shù)據(jù)。外部存儲(chǔ)器早期使用機(jī)械硬盤(pán)(Hard Disk Drive,HDD),近年來(lái)采用與非型閃存(NAND Flash)組成的固態(tài)硬盤(pán)(Solid State Disk,SSD)正在成為主流,其速度只有DRAM內(nèi)存的幾百分之一,但容量是內(nèi)存的1 000倍以上,造價(jià)低廉,且具備非易失的低功耗特性,用于長(zhǎng)期存儲(chǔ)海量信息。
由于內(nèi)核存儲(chǔ)器、主存儲(chǔ)器、外部存儲(chǔ)器之間均存在較大的讀寫(xiě)速度差距,形成了制約整個(gè)系統(tǒng)性能的“存儲(chǔ)墻”[2](見(jiàn)圖1)。而隨著處理器速度和核數(shù)的持續(xù)增長(zhǎng),存儲(chǔ)墻對(duì)系統(tǒng)性能的限制愈發(fā)明顯。同時(shí),物聯(lián)網(wǎng)、智能傳感器、人工智能等特定應(yīng)用的發(fā)展也對(duì)極低功耗的高性能存儲(chǔ)器提出了新的產(chǎn)業(yè)化需求。新型存儲(chǔ)器采用與現(xiàn)有DRAM和NAND Flash等成熟存儲(chǔ)器截然不同的存儲(chǔ)原理,能夠滿足未來(lái)更加多樣化的存儲(chǔ)需求[3]。同時(shí),經(jīng)過(guò)數(shù)十年的科學(xué)探索,新型存儲(chǔ)器已經(jīng)初步具備了產(chǎn)業(yè)化的研究基礎(chǔ),臺(tái)積電、三星、英特爾等越來(lái)越多的產(chǎn)業(yè)巨頭開(kāi)始將其推向產(chǎn)業(yè)化應(yīng)用。
目前,新型存儲(chǔ)領(lǐng)域較為成熟的技術(shù)路線主要有相變存儲(chǔ)器(PCM)、磁變存儲(chǔ)器(MRAM)以及阻變存儲(chǔ)器(RRAM)3種。PCM通過(guò)相變材料相態(tài)的變化獲得不同的電阻值,主要用于獨(dú)立式存儲(chǔ);MRAM通過(guò)磁性材料中磁籌的方向變化改變電阻,主要用于嵌入式存儲(chǔ);RRAM則利用阻變材料中導(dǎo)電通道的產(chǎn)生或關(guān)閉實(shí)現(xiàn)電阻變化,目前主要用于物理不可克隆芯片(Physical Unclonable Function,PUF),也被看好用于人工智能硬件。
2.1.1 新型存儲(chǔ)器未來(lái)應(yīng)用的機(jī)遇
在獨(dú)立式存儲(chǔ)應(yīng)用領(lǐng)域,存儲(chǔ)級(jí)內(nèi)存(Storage Class Memory,SCM)將會(huì)是新型存儲(chǔ)應(yīng)用的重要領(lǐng)域[4]。2017年,英特爾推出了基于PCM的SCM應(yīng)用存儲(chǔ)器傲騰(Optane),在內(nèi)存與外部存儲(chǔ)之間提供了一個(gè)容量、速度均介于二者的非易失SCM,能夠顯著提升整體的數(shù)據(jù)傳輸性能。
在嵌入式存儲(chǔ)應(yīng)用領(lǐng)域,新型存儲(chǔ)將在多種智能儀表、傳感器、可穿戴設(shè)備中獲得應(yīng)用,逐步取代嵌入式Flash、DRAM和SRAM。三星和臺(tái)積電均在嵌入式存儲(chǔ)領(lǐng)域推出了MRAM的代工業(yè)務(wù)。
在未來(lái)可能的新存儲(chǔ)架構(gòu)領(lǐng)域,面向人工智能等應(yīng)用的新計(jì)算架構(gòu)的出現(xiàn)將為新型存儲(chǔ)的應(yīng)用提供機(jī)遇。例如,RRAM憑借類似神經(jīng)突觸的可塑特性,將可能應(yīng)用于存算一體、類腦等領(lǐng)域。
2.1.2 新型存儲(chǔ)產(chǎn)業(yè)化發(fā)展的挑戰(zhàn)
新型存儲(chǔ)的制造工藝還需要進(jìn)一步完善,當(dāng)前產(chǎn)品成本過(guò)高。當(dāng)前新型存儲(chǔ)的制造工藝還沒(méi)有解決不同存儲(chǔ)單元之間的一致性問(wèn)題,良率不高,單位容量成本很高,存儲(chǔ)密度優(yōu)勢(shì)不顯著。在嵌入式存儲(chǔ)領(lǐng)域,MRAM的單位容量成本是當(dāng)前方案NOR Flash的10倍以上,在存儲(chǔ)密度上僅有微弱優(yōu)勢(shì);在獨(dú)立式存儲(chǔ)領(lǐng)域,作為外部存儲(chǔ)的PCM的單位容量成本是NAND Flash的10倍以上,存儲(chǔ)密度僅為NAND Flash的1/5。
新型存儲(chǔ)需要開(kāi)發(fā)新的軟硬件配套。當(dāng)前的成熟計(jì)算架構(gòu)是基于DRAM和NAND Flash為基礎(chǔ)構(gòu)建,硬件電路和軟件驅(qū)動(dòng)均是根據(jù)傳統(tǒng)存儲(chǔ)的特點(diǎn)設(shè)計(jì)。新型存儲(chǔ)在物理特性上迥異于傳統(tǒng)存儲(chǔ),需要開(kāi)發(fā)新的輔助芯片和對(duì)應(yīng)的軟件程序才能發(fā)揮性能。以使用基于PCM的英特爾傲騰SCM的百度Feed-Cube數(shù)據(jù)庫(kù)為例,兩家公司針對(duì)系統(tǒng)硬件、操作系統(tǒng)、內(nèi)核等組建都進(jìn)行了相應(yīng)優(yōu)化,包括選擇支持傲騰的處理器、加入支持傲騰的BIOS驅(qū)動(dòng)、增添Linux內(nèi)核的相關(guān)補(bǔ)丁等一系列配套優(yōu)化[5]。這些額外的投入都增加了用戶使用新型存儲(chǔ)器的成本。
PCM目前產(chǎn)業(yè)化進(jìn)展最快,主要用于獨(dú)立式存儲(chǔ)領(lǐng)域。英特爾和美光聯(lián)合研發(fā)的3D Xpoint存儲(chǔ)器是目前唯一大規(guī)模商用的PCM產(chǎn)品。英特爾為推廣這一產(chǎn)品將其加入了相應(yīng)CPU的支持,同時(shí)還提供了配套的各類驅(qū)動(dòng)程序,使得其數(shù)據(jù)訪問(wèn)速度得到顯著提升,目前已應(yīng)用于百度信息流服務(wù)數(shù)據(jù)中心[5]。
技術(shù)方面,英特爾與美光優(yōu)勢(shì)顯著,IBM與三星也有一定技術(shù)積累。英特爾與美光聯(lián)合研發(fā)了PCM相關(guān)技術(shù),并于2015年率先量產(chǎn)了具有商業(yè)化價(jià)值的128 Gb 3D Xpoint芯片,這也是目前唯一商用的PCM產(chǎn)品。IBM從2006年開(kāi)始研發(fā)PCM,技術(shù)路線與英特爾、美光不同,擁有完整的專利布局。三星目前僅實(shí)現(xiàn)了小容量PCM樣片,技術(shù)路線與英特爾、美光相同,處于跟隨狀態(tài)。
產(chǎn)業(yè)方面,英特爾已經(jīng)在SCM領(lǐng)域形成封閉生態(tài),未來(lái)在通用領(lǐng)域?qū)⒚媾R美光的競(jìng)爭(zhēng)。英特爾的3D Xpoint存儲(chǔ)器2020年銷售收入約5.5億美元,主要用于SCM領(lǐng)域。但由于SCM是英特爾自身定義的一種存儲(chǔ)架構(gòu),需要相應(yīng)的CPU、芯片組、配套驅(qū)動(dòng)和軟件支持,其他企業(yè)難以進(jìn)入這一封閉生態(tài)。2019年,美光結(jié)束與英特爾在PCM領(lǐng)域的合作,獨(dú)立發(fā)展出了基于PCM的SSD產(chǎn)品X100。未來(lái)英特爾仍將主導(dǎo)SCM應(yīng)用的PCM市場(chǎng),但在SSD等通用市場(chǎng)會(huì)面臨美光的競(jìng)爭(zhēng)。
MRAM已經(jīng)進(jìn)入產(chǎn)業(yè)化階段,主要用于嵌入式存儲(chǔ)。三星的嵌入式MRAM已經(jīng)大規(guī)模應(yīng)用于華為GT 2智能手表的衛(wèi)星定位模塊中,能夠有效地降低功耗,延長(zhǎng)待機(jī)時(shí)間。MRAM也有少量獨(dú)立式存儲(chǔ)應(yīng)用,主要利用其抗輻射性能,用于航空航天等特殊市場(chǎng),如空客A350飛機(jī)使用MRAM作為機(jī)上存儲(chǔ)器。
技術(shù)方面,美國(guó)Everspin公司和格羅方德公司在獨(dú)立式存儲(chǔ)上遙遙領(lǐng)先,三星和臺(tái)積電將發(fā)力嵌入式存儲(chǔ)。美國(guó)Everspin公司與格羅方德公司合作,是目前獨(dú)立式MRAM技術(shù)的領(lǐng)頭羊,已經(jīng)量產(chǎn)了三代MRAM產(chǎn)品,包括全球容量最大的1 Gb第三代自旋轉(zhuǎn)移矩磁變存儲(chǔ)器(STT-MRAM)。三星和臺(tái)積電已經(jīng)開(kāi)始將MRAM應(yīng)用于嵌入式存儲(chǔ)中,如三星在2019年為索尼代工的衛(wèi)星定位模塊中使用MRAM技術(shù),已隨華為GT 2手表出貨超過(guò)100萬(wàn)套。臺(tái)積電在2020年集成電路設(shè)計(jì)領(lǐng)域最高級(jí)別的國(guó)際會(huì)議ISSCC上發(fā)布了32 Mb嵌入式STT-MRAM。此外,專利方面,日本東芝位列全球MRAM專利第一,專利總數(shù)幾乎是第二名三星的兩倍,高通、索尼、IBM等企業(yè)也擁有大量MRAM專利。
產(chǎn)業(yè)方面,獨(dú)立式MRAM市場(chǎng)較小,三星、臺(tái)積電等企業(yè)將大力推動(dòng)嵌入式市場(chǎng)。一方面,Everspin公司的產(chǎn)品是目前唯一實(shí)現(xiàn)商業(yè)化應(yīng)用的獨(dú)立式MRAM,2019年市場(chǎng)銷售總額約為0.4億美元,應(yīng)用于航空航天、計(jì)算加速卡等特定市場(chǎng),市場(chǎng)容量小,國(guó)際龍頭不愿意在這樣的小市場(chǎng)中投入研發(fā)。另一方面,MRAM在嵌入式領(lǐng)域具有顯著的功耗優(yōu)勢(shì),最多能夠降低系統(tǒng)超過(guò)90%的功耗。三星、臺(tái)積電等龍頭代工企業(yè)紛紛在該領(lǐng)域布局,三星已經(jīng)實(shí)現(xiàn)了最早的商業(yè)化應(yīng)用。隨著系統(tǒng)集成度要求的提高,MRAM的嵌入式系統(tǒng)將會(huì)應(yīng)用在更加廣泛的領(lǐng)域。
RRAM目前尚無(wú)大規(guī)模商用。由于RRAM的讀寫(xiě)方式與人工神經(jīng)網(wǎng)絡(luò)中的計(jì)算節(jié)點(diǎn)讀寫(xiě)方式類似,在實(shí)驗(yàn)室中被大量研究用于人工智能相關(guān)應(yīng)用,尤其是作為存算一體計(jì)算架構(gòu)中的存儲(chǔ)單元[6]。相關(guān)企業(yè)主要包括以色列的Weebit Nano和美國(guó)的CrossBar。2021年,CrossBar已經(jīng)將RRAM應(yīng)用于PUF、多次可編程芯片(Multi-Time-Programmable,MTP)、少次可編程芯片(Few-Time Programmable,F(xiàn)TP)和一次性可編程芯片(One-Time-Programmable,OTP)中。Weebit Nano在2022年2月完成了獨(dú)立式RRAM芯片的原型驗(yàn)證,未來(lái)將可能推出相關(guān)芯片產(chǎn)品替代NOR Flash,或應(yīng)用于存算一體和人工智能領(lǐng)域。
PCM將向更高層數(shù)的三維集成發(fā)展。目前,唯一商用的PCM產(chǎn)品英特爾傲騰存儲(chǔ)器第一代僅僅實(shí)現(xiàn)了二層三維集成,2020年發(fā)布的第二代也僅僅做到了四層堆疊。PCM在隨機(jī)讀寫(xiě)速度和壽命方面相比于NAND Flash都有數(shù)量級(jí)上的優(yōu)勢(shì),三維集成層數(shù)是制約其容量快速發(fā)展的主要瓶頸。英特爾已經(jīng)在著手研發(fā)相關(guān)三維制造技術(shù)。
MRAM將更加廣泛地運(yùn)用于嵌入式系統(tǒng)中。目前獨(dú)立式的MRAM由于容量難以進(jìn)一步增長(zhǎng),成本較高,市場(chǎng)應(yīng)用空間有限。未來(lái)MRAM將主要針對(duì)嵌入式市場(chǎng),逐步替代現(xiàn)有的嵌入式閃存技術(shù),將成為嵌入式系統(tǒng)中的主流存儲(chǔ)器。
RRAM將與神經(jīng)網(wǎng)絡(luò)計(jì)算深度結(jié)合發(fā)展全新的計(jì)算架構(gòu)。RRAM在傳統(tǒng)存儲(chǔ)領(lǐng)域優(yōu)勢(shì)并不明顯,新的存儲(chǔ)架構(gòu)將會(huì)是RRAM的發(fā)展機(jī)會(huì)。例如,將RRAM作為神經(jīng)網(wǎng)絡(luò)中突觸節(jié)點(diǎn)的權(quán)重存儲(chǔ)單元,或是應(yīng)用于存算一體架構(gòu),從而大幅度提升神經(jīng)網(wǎng)絡(luò)芯片的性能并降低功耗。
本文主要討論了相變存儲(chǔ)、磁變存儲(chǔ)和阻變存儲(chǔ)等新型存儲(chǔ)器的應(yīng)用特點(diǎn)、機(jī)遇與挑戰(zhàn)、產(chǎn)業(yè)發(fā)展現(xiàn)狀、未來(lái)產(chǎn)業(yè)發(fā)展趨勢(shì)等方面內(nèi)容。希望本文能有助于進(jìn)一步推動(dòng)產(chǎn)業(yè)界對(duì)新型存儲(chǔ)器的認(rèn)識(shí),并為未來(lái)的技術(shù)變革作好相應(yīng)的準(zhǔn)備。