特約通訊員 黃俏丹
當前,存儲器發(fā)展的一個方向是朝著“利用新的物理規(guī)律,研發(fā)新的存儲器結(jié)構(gòu)”邁進,如相變存儲器,電熔斷存儲器,阻抗存儲器,磁性隨機存儲器MRAM等等,這一方向極大地豐富了現(xiàn)有存儲器的種類,展現(xiàn)了繁多的存儲器特色,但有兩個缺陷是致命的:與CMOS工藝兼容性,生產(chǎn)效率。最近有一個新的趨勢漸漸浮出水面,那就是算法存儲器(Algorithmic Memory)。這是一種新的思路,這種思路源自對微處理器(CPU/MCU)體系結(jié)構(gòu)的發(fā)展與現(xiàn)有存儲器通訊時的瓶頸這一問題的思考得出的。處理器經(jīng)過多年發(fā)展無論在速度、性能、數(shù)據(jù)吞吐量等方面有了很大的提升,但存儲器在這方面似乎沒有跟上CPU的發(fā)展。舉例說明一下,4核的CPU+2G內(nèi)存的機器上跑一個多線程軟件,在8核的機器上可以提速到2倍,但在16核的機器上就只能獲得將近2.5倍的提速,而不是期望的4倍,這就是CPU與內(nèi)存之間通訊帶寬的限制。
這種Algorithmic MemoryTM源自一家初創(chuàng)公司Memoir Systems的專利技術,他們在存儲器芯片內(nèi)部采用了緩存(caching)、虛擬機制(virtualization)、管道 (pipelining),以及數(shù)據(jù)編碼等技術,然后將它們“編織成數(shù)據(jù)流”進行無縫地操作,這種存儲器還提供了多個接口支持數(shù)據(jù)并發(fā)訪問,極大地提升了訪問性能。
Memoir Systems公司于2009年3月由Sundar Iyer(CTO)and Da Chuang(COO)共同發(fā)起成立,由光速創(chuàng)投公司投資支持。Adam Kablanian是Memoir的首席執(zhí)行官(CEO)。公司總部設在美國加州硅谷,Memoir Systems是全球領先的提供存儲器性能解決方案的半導體供應商,入選2012 Red Herring北美100強科技公司。Memoir關于存儲器設計方面的革命技術——Algorithmic Memory,大大縮短了設計開發(fā)時間,提高了每秒存儲操作(MOPS)訪問性能。該公司的Renaissance系列產(chǎn)品為多接口嵌入式存儲器模塊提供了即插即用的一種替代。在不犧牲性能的情況下,也能減少芯片面積和降低功耗。此項技術的特點是線程、節(jié)點、Foundry之間相互獨立,并且能無縫集成到各種SoC片上系統(tǒng)。
因為它是進程獨立的,所以Memoir此項技術對先后進程結(jié)點同樣適用,并且可以集成到各種SoC系統(tǒng) , 包 括 ASICs,ASSPs,GPPs and FPGAs。這些設備要求具有很高的MOPS才可以使存儲性能得到提升改善。
公司創(chuàng)始人兼首席技術官Sundar Iyer表示:“Algorithmic MemoryTM技術在半導體行業(yè)是獨一無二的。我們的設計方法是引入一個新的概念‘chisel’,這不同于在存儲器集成電路上使用的傳統(tǒng)方法‘hamma’,我們從一個更高的抽象層面來解決這個性能瓶頸。新方法在集成電路技術上得到了補充,并且填補了processor-memory之間的鴻溝?!?/p>
Memoir技術總概
Algorithmic Memory技術對存儲器模塊的性能提升表現(xiàn)在以下5個方面:
·10X每秒存儲操作(MOPS):Algorithmic Memory通過“在存儲器芯片內(nèi)部采用了緩存,虛擬機制,管道,以及數(shù)據(jù)編碼等技術,然后編織成數(shù)據(jù)流進行無縫地操作”提升現(xiàn)有嵌入式存儲器模塊的性能。
·100X縮短設計開發(fā)時間:存儲器模塊開發(fā)通常需要6到12個月的時間,但是Memoir技術可以把開發(fā)時間縮短到以天計算。
·1000X加快存儲器架構(gòu)分析時間:分析一個自定制的存儲器模塊通常要花費一周時間,但是利用Memoir可以在10秒內(nèi)搭建和分析一個存儲器模塊。
·低芯片面積,低功耗:Memoir可以把一塊面積功率比較低、性能較差的內(nèi)存合成為具有較高性能的存儲器模塊。Algorithmic Memory通過改變集成電路使存儲器模塊具有較高性能,還降低了芯片面積和功率消耗。
·方便地與現(xiàn)有的各種存儲器相兼容配置:通過簡單配置,可以快速地集成到不同的系統(tǒng)中去。
由于Algorithmic Memory技術可以為嵌入式存儲性能提供一個數(shù)量級的增加,該公司的初始產(chǎn)品應用主要專注于各種SoC系統(tǒng)設計 (例如,ASICs,ASSPs,GPPs and FPGAs)和網(wǎng)絡交換器(Network Switches)、存儲局域網(wǎng)(SAN)交換器設計。
Memoir的CEO Adam Kablanian解釋說:“我們?yōu)榍度胧酱鎯κ澜玳_創(chuàng)了一個全新的篇章。如此通用和強大的技術可以為系統(tǒng)架構(gòu)師和SoC設計工程師提供下一代卓越的存儲性能。我們相信,網(wǎng)絡和多核計算這兩個產(chǎn)品領域可以最初地從我們的解決方案中受益”。
嵌入式存儲性能已成為SoC設計中整個系統(tǒng)性能的限制因素。Memoir用它的專利技術解決了這個瓶頸,最大化了算法效率。Algorithmic Memory以軟RTL IP的形式提供,可以快速地集成到不同的系統(tǒng)中去。它還提出多個接口并發(fā)訪問,提供10倍快的每秒內(nèi)存操作。
光速創(chuàng)投 (Lightspeed Venture Partners),一家全球領先的風險投資公司,是Memoir Systems的一個主要投資者。光速創(chuàng)投的總經(jīng)理Barry Eggers說道:“我們投資Memoir Systems主要有兩個關鍵原因:首先,Memoir團隊在存儲算法領域擁有世界一流的專業(yè)知識;其次,它獨特的專利技術可以跨越當前和未來的存儲應用技術。我們相信,這種團隊和技術的實力組合將來能把Memoir推向一個更重要的地位,在某些市場領域占有更大的份額。”
Memoir公司創(chuàng)始人兼首席技術官Sundar Iyer指出:“通過Memoir的Algorithmic Memory技術,存儲器訪問性能可以被視為一個可配置資源實體。系統(tǒng)架構(gòu)師和設計師只需要通過一個簡單的按鈕接口就能配置他們所需的存儲模塊性能,例如,設定讀寫接口的數(shù)目,時間操作頻率,以及其他關于芯片面積和功耗優(yōu)化方面的特制需求?!惫緞?chuàng)始人和首席運營官Da Chuang解釋說:“Memoir的綜合方法平臺可以從存儲IP庫中自動選擇合適的模塊,并將我們的存儲算法綜合到新定制的目標應用程序中?!?/p>
嵌入式存儲器模塊性能在網(wǎng)絡SoC設計應用中是一個主要的限制性因素。隨著網(wǎng)絡傳輸速度日益增加,交換機的架構(gòu)師發(fā)現(xiàn)越來越難跟上數(shù)據(jù)報文處理速度以避免緩沖區(qū)溢出。例如,在一張4*100 Gb/s的線卡上,新數(shù)據(jù)包每1.6納秒到達一次系統(tǒng),此外,數(shù)據(jù)包處理系統(tǒng)支持廣泛的報文頭分析——比如,查找技術、網(wǎng)絡即時流量統(tǒng)計、計數(shù)器、流量管理等等,和支持有效載荷處理應用程序——比如,指令檢測、基于內(nèi)容的負載平衡、病毒掃描,這些導致對于每次數(shù)據(jù)包的到來都要產(chǎn)生數(shù)次的存儲訪問。僅是加快處理器的速度是不能提高網(wǎng)絡性能的,除非增加總的每秒存儲操作(MOPS)。這里,Memoir的 Algorithmic Memory技術能為系統(tǒng)架構(gòu)提供更快的MOPS,并且能自定義存儲容量、提供多個讀寫接口。
高速多核處理器改變了桌面、服務器應用和嵌入式計算世界的游戲規(guī)則。然而,因為爭用共享存儲資源(比如,二級緩存或三級緩存),SoC系統(tǒng)的整體性能也會有所拖延。如果可以避免這些存儲方面瓶頸,系統(tǒng)架構(gòu)可以發(fā)揮更好的性能。
Renaissance 4X是Memoir Systems公司繼Renaissance 2X推出的第二代商業(yè)產(chǎn)品?;贛emoir的Algorithmic Memory技術,Renaissance 4X相對于傳統(tǒng)多端口系統(tǒng),它引進了一項革命性的技術,不僅提升了存儲器性能,也節(jié)省了功耗和芯片面積,縮短了產(chǎn)品上市時間,而且不要求進行Silicon Validation(硅片物理驗證)。如同所有的Memoir產(chǎn)品,Renaissance 4X利用“把算法綜合到固件”方法來提升現(xiàn)有嵌入式存儲器模塊的性能。它以軟RTL IP的形式交付,能快速地集成到不同的系統(tǒng)中去,并且線程、節(jié)點、Foundry之間相互獨立。Memoir提供的就像是一個標準的嵌入式存儲器模塊,并且可以方便地集成到現(xiàn)有的標準SoC設計流程。Renaissance 4X提供6個獨立的內(nèi)存生成器:一個3端口的2R1W,一個3端口的1R2W,一個4端口的3R1W,一個4端口的2R2W,還有專門設計的3Ror1W、4Ror1W內(nèi)存生成器。
IBM Microelectronics是Memoir的首批客戶之一,IBM高級工程師Robert Busch說:“一系列創(chuàng)新技術(例如,IBM的嵌入式DRAM技術)正在推動著片上系統(tǒng)設計性能的發(fā)展。通過與Memoir合作,我們能給芯片設計師設計SoC系統(tǒng)提供一種很高效的存儲子系統(tǒng),可以改進系統(tǒng)吞吐量并且加快復雜產(chǎn)品上市時間。”
Renaissance 4X可以緩解存儲解決方案定制的需求,并且它可以創(chuàng)建一個能提供6個多端口內(nèi)存生成器的通用存儲組合,這樣的通用組合能滿足不同的存儲和應用需求。Memoir的產(chǎn)品使用標準6T BIST(內(nèi)建自修復)和DFT(診斷功能測試)測試方法,它包含的RTL級已使用正式方法詳盡驗證過,不再需要硅片物理驗證。通過上述各種優(yōu)勢的組合,Renaissance 4X提供了一個重要的投放市場的時間優(yōu)勢,降低了產(chǎn)品開發(fā)成本和減少了風險。有了Renaissance 4X,顧客的選擇靈活多種,不用再拘泥于自定制的解決方案。例如,內(nèi)存復制,它的工作方式是以大功耗去換取較高的讀性能。再者,定制多接口芯片會造成更高的成本和風險,并且產(chǎn)品投放市場的時間也比較長。這意味著一般不能通過第三方IP核供應商提供通用接口IP核。
“所有傳統(tǒng)的多接口設計都有一些很大的缺點,”Adam Kablanian解釋說,“它們都有成本高、風險高、開發(fā)時間被硅片驗證拖延等缺點,但是有了Renaissance 4X,我們就能交付一個高性能、實惠、方便、通用多端口存儲器解決方案,可以解決整個行業(yè)的大部分需求?!?/p>
從應用程序的角度看,Renaissance 4X滿足下一代應用于網(wǎng)絡和通信子系統(tǒng)的SoC系統(tǒng)設計的數(shù)據(jù)處理要求,這種數(shù)據(jù)要求傳輸聚合速度超過400 Gb/s。這意味著,Renaissance 4X可以為存儲器在一個周期內(nèi)多次訪問提供廣泛的適用性,例如,包緩沖區(qū)、計數(shù)器、即時流量、鏈表、調(diào)度器、表查找等等。另外,Renaissance 4X為多端口存儲器提供二級、三級緩存共享結(jié)構(gòu),為多核SoC設計提供高訪問性能。
參考資料:www.memoir-systems.com