李 川,鄭 浩,王彥輝
(江南計(jì)算技術(shù)研究所,江蘇 無錫 214083)
隨著大數(shù)據(jù)、云計(jì)算、智能計(jì)算和高性能計(jì)算領(lǐng)域的飛速發(fā)展,芯片存儲(chǔ)帶寬需求急劇增加,尤其是T Byte/s(1E12 Byte/s)帶寬需求。為了縮小存儲(chǔ)帶寬與芯片計(jì)算性能之間的差距,動(dòng)態(tài)隨機(jī)存儲(chǔ)架構(gòu)(DRAM)的I/O速率逐年增加,DDR5規(guī)范中I/O最高速率達(dá)到6.4 Gbps,GDDR6產(chǎn)品最高速率達(dá)18 Gbps。但是,對于T Byte/s帶寬需求,DDR5所需 I/O數(shù)量大,封裝以及存儲(chǔ)顆粒布局難以解決,GDDR6實(shí)現(xiàn)T級存儲(chǔ)帶寬,其匹配帶寬的顆粒數(shù)量與可靠的高速并行互連難以兼得。由此,基于3D堆疊且具有超高位寬的HBM(High-Bandwidth Memory)存儲(chǔ)技術(shù)發(fā)展迅速。
為了實(shí)現(xiàn)HBM存儲(chǔ)顆粒與CPU/GPU芯片之間的高位寬信號互連,需要引入超細(xì)線寬和間距的轉(zhuǎn)接板,常規(guī)的封裝基板和印制板互連密度難以滿足需求[1,2]。目前,硅基轉(zhuǎn)接板工藝相對于有機(jī)和玻璃轉(zhuǎn)接板更為成熟,并且布線更靈活,硅基轉(zhuǎn)接板是HBM顆粒和CPU/GPU芯片之間互連的主流介質(zhì)[3]。
硅轉(zhuǎn)接板中,HBM相關(guān)的物理傳輸路徑如圖1所示分為2類。一類是HBM與芯片之間的信號互連,包括8個(gè)通道的數(shù)據(jù)組信號和地址組信號,以單端信號為主,分布在硅轉(zhuǎn)接板的RDL(ReDistribution Layer)。另一類是HBM相關(guān)的電源和地信號以及少量的外測試信號,貫穿整個(gè)轉(zhuǎn)接板,通過微焊球與封裝基板和印制板連接。本文主要分析HBM與芯片之間互連信號的電傳輸特性,屬于第一類。
Figure 1 HBM structures and its signal interconnection圖1 HBM結(jié)構(gòu)及其信號互連示意圖
硅轉(zhuǎn)接板不同于常規(guī)的封裝基板和印制板,其硅基損耗特性明顯,微小尺寸的阻抗特性特殊,經(jīng)典的印制線阻抗近似理論不再適用。韓國科學(xué)院的Heegon Kim團(tuán)隊(duì)基于早期HBM產(chǎn)品的信號互連作了大量的仿真分析[4 - 7],國內(nèi)專家學(xué)者也在持續(xù)關(guān)注轉(zhuǎn)接板上的多種信號傳輸特性[8,9]。但是,隨著HBM顆粒升級到HBM2E的3.2 Gbps,接口電平降至1.2 V,這對于微Bump細(xì)節(jié)距條件下的串?dāng)_、損耗控制是極大的考驗(yàn),有必要針對新的應(yīng)用環(huán)境對互連傳輸通道的信號完整性進(jìn)行深入研究。
根據(jù)固態(tài)技術(shù)協(xié)會(huì)關(guān)于HBM的最新規(guī)范[10],單HBM存儲(chǔ)顆粒與芯片互連信號共8組,約1 800個(gè)。每組代表一個(gè)信號傳輸通道,有獨(dú)立的數(shù)據(jù)組信號和地址組信號。8組信號用后綴a,b,c,d,e,f,g,h區(qū)分,a~d組信號管腳從上至下沿顆粒長邊一字排開,e~h組管腳與a~d組管腳并列。
無論是2顆粒HBM還是4顆粒HBM與芯片互連,沿顆粒長邊平行方向放置顆粒和芯片可以最大程度增加同信號層布線數(shù)量。如果信號盤引出空間允許,2個(gè)信號層即可實(shí)現(xiàn)8組信號互連,a~d組通道信號同層,e~f組信號布設(shè)在另一層。
每通道包括16字節(jié)數(shù)據(jù)信號和一組約20 Pin的地址信號。2字節(jié)共24 Pin數(shù)據(jù)信號為一個(gè)管腳陣列單元,通過上、下2排電/地信號與其它單元進(jìn)行分隔。地址信號陣列與2字節(jié)數(shù)據(jù)信號陣列類似。
通道內(nèi)部2字節(jié)信號管腳排布如圖2所示,24 Pin信號在圖中用字母D標(biāo)識(shí)。最上一排管腳是地管腳,最下一排管腳是接口電源管腳。假設(shè)芯片位于右側(cè),HBM顆粒位于左側(cè),24個(gè)信號同時(shí)向右側(cè)引出,瓶頸位置在最右列的電、地管腳之間,粗略估算,每個(gè)信號可以利用的空間為55*3/24 μm,即6.875 μm。也就是說單根信號線寬度及信號間距之和小于6.8 μm時(shí),2個(gè)信號層可以滿足布線的引出需求。
Figure 2 HBM signal ball-map and line distribution圖2 信號管腳及布線引出空間示意圖
根據(jù)上述分析,總共的1 800 Pin信號分2個(gè)信號層布設(shè),單層信號個(gè)數(shù)為900,沿顆粒長邊方向布線寬度約為900*6.8 μm,即6.1 mm?;ミB線長度可以用存儲(chǔ)顆粒最內(nèi)層信號管腳距封裝殼邊沿距離加上芯片外管腳距芯片封裝殼邊沿距離估算,約為4.6 mm+1.5 mm,即6.1 mm。單HBM存儲(chǔ)顆粒與芯片互連布線區(qū)域面積估計(jì)為6.1*6.1 mm2。
2個(gè)信號層的互連通道仿真模型如圖3所示。圖3a中,從下至上依次是硅基板、二氧化硅層、信號層M1、二氧化硅層、電地層、二氧化硅層、信號層M3、二氧化硅層和氮化硅層。圖3b與3a疊層結(jié)構(gòu)相同,不同的是,M1層和M3層的信號線之間加入了地屏蔽線。由此,用基本模型和GND屏蔽模型將二者進(jìn)行區(qū)分。
Figure 3 Simulation model圖3 仿真模型
基本模型的參數(shù)類別及其意義如表1所示,屏蔽模型參數(shù)類別及意義如表2所示。電地層,即圖中的P/G層采用柵格結(jié)構(gòu),所以也具有線寬和間距2種參數(shù)。柵格結(jié)構(gòu)便于硅基銅工藝制造,同時(shí)對于近硅層的線損耗起到抑制作用。2種模型中材料參數(shù)相同,如表3所示。
Table 1 Parameters of basic model
Table 2 Parameters of shielding model
Table 3 Material parameters of model
PCB印制線特征阻抗計(jì)算通常采用Johnson and Graham的近似理論公式[11],商用軟件Polar9000與該理論計(jì)算結(jié)果誤差小于1 Ω。但是對于硅基板上的HBM信號線,傳輸線銅厚與線寬比值,以及傳輸線銅厚與介質(zhì)厚度比值均大于PCB傳輸線的相應(yīng)比值,與近似條件相違背。所以,無論近似公式的數(shù)值計(jì)算還是商用阻抗計(jì)算軟件,對HBM信號傳輸線阻抗分析都不適用。本文從基本的RLGC參數(shù)著手,先理論計(jì)算用RLGC描述的特征阻抗,然后對HBM傳輸線進(jìn)行三維仿真,提取物理結(jié)構(gòu)對應(yīng)的參數(shù),最后對HBM信號線阻抗特性進(jìn)行分析。
Z=R+jωL=γZ0
Y=G+jωC=γ/Z0
G=G0+Gd·f
其中,Z0為信號線的特征阻抗,γ是傳播常數(shù),Z和Y分別是信號線的阻抗和導(dǎo)納,R和G是隨頻率變化的電阻和電導(dǎo),R0和G0是低頻條件下的電阻和電導(dǎo),RS和Gd是由趨膚效應(yīng)和介質(zhì)損耗造成的高頻電阻和電導(dǎo)。L和C是電感和電容。Z0的計(jì)算方式如下所示:
通過對基本模型中單信號線進(jìn)行三維電磁場仿真可以提取參數(shù)R0、Rs、G0、Gd、L、C,從而得到信號線的阻抗頻率曲線。HBM2/HBM2E信號目標(biāo)速率在2 Gbps~4 Gbps,對應(yīng)奈奎斯特頻率為1 GHz~2 GHz,這里稱為目標(biāo)頻率。頻域曲線橫坐標(biāo)統(tǒng)一采用對數(shù)坐標(biāo)形式,便于觀察目標(biāo)頻率結(jié)果及高頻趨勢。每幅圖中線條采用了不同形狀進(jìn)行標(biāo)識(shí)區(qū)分,為了清晰顯示,標(biāo)識(shí)密度遠(yuǎn)遠(yuǎn)低于實(shí)際仿真頻點(diǎn)。
圖4a是固定線長5 mm和信號層M1,線寬從1 μm增加至4 μm時(shí)的阻抗頻率曲線,可以看出,隨著頻率的增加,不同線寬的阻抗都逐漸降低。5 GHz以下,阻抗下降趨勢明顯;;5 GHz以上,阻抗值下降緩慢,趨于平穩(wěn)。隨著線寬的增加,各頻點(diǎn)的阻抗值降低。目標(biāo)頻率內(nèi),1 μm線寬阻抗范圍為95 Ω~72 Ω,2 μm線寬阻抗范圍為63 Ω~49 Ω,3 μm線寬阻抗范圍為46 Ω~36 Ω,4 μm線寬阻抗范圍為37 Ω~31 Ω。圖4b是固定線寬3 μm和信號層M1,線長從4 mm增加至7 mm時(shí)的阻抗頻率曲線。結(jié)果顯示,線長的改變對各頻點(diǎn)的阻抗影響極小。圖4c和圖4d是不同信號層在2 μm線寬和3 μm線寬時(shí)的阻抗對比??梢钥闯觯瑹o論線寬是否變化,各頻點(diǎn)M3層的信號線阻抗都比M1層的信號線高6 Ω~8 Ω。
Figure 4 Impedance curves under four conditions圖4 4種條件下的阻抗曲線
在基本模型基礎(chǔ)上仿真4種不同條件對應(yīng)的插入損耗,分析HBM信號線的損耗特性及敏感參數(shù)。
圖5a是在基本模型參照表1參數(shù)條件下,M1層和M3層多條信號線的插損曲線。其中,嵌入的小圖為M1層信號線插損曲線,大圖為M3層信號線插損曲線。L1至L5代表各層中多條參數(shù)相同的信號線??梢钥闯?,每個(gè)信號層的不同信號線差損曲線比較一致,2個(gè)信號層的差損曲線差異很小。200 MHz以下,插入損耗值穩(wěn)定在-2.8 dB,可以把該值稱為與結(jié)構(gòu)對應(yīng)的固有損耗;200 MHz~1 GHz,插入損耗緩慢增加;1 GHz以后隨頻率增幅明顯。目標(biāo)頻率內(nèi),插入損耗值為-3.5 dB~-4.8 dB。
Figure 5 Curves of insertion loss under four conditions圖5 4種條件下插入損耗曲線
圖5b是在基本模型基礎(chǔ)上,固定線寬為3 μm,間距為3 μm,信號層M1,線長從4 mm增加至8 mm時(shí)的插入損耗曲線。每一種線長的插損曲線具有相同的低頻區(qū)平穩(wěn),高頻區(qū)急劇下降的趨勢。隨著線長的增加,每個(gè)頻點(diǎn)對應(yīng)的損耗相應(yīng)增加,從4 mm至8 mm,固有損耗增幅為1.6 dB。頻率越高,增幅越大。
圖5c是在基本模型基礎(chǔ)上,固定線長為6 mm,間距為3 μm,信號層M1,線寬從1 μm增加至4 μm時(shí)的插入損耗曲線。線寬越大,固有損耗越小。1 μm與4 μm線寬的固有損耗相差4 dB。頻率大于500 MHz時(shí),插入損耗與線寬不再是單調(diào)遞減關(guān)系:線寬從1 μm增加至3 μm時(shí),各頻點(diǎn)的插入損耗都逐漸變小,差值與固有損耗差值相當(dāng);線寬從3 μm增加至4 μm時(shí),插入損耗曲線存在相交點(diǎn)。相交頻點(diǎn)以前,細(xì)線寬損耗大。
圖5d是在基本模型基礎(chǔ)上,固定線長為6 mm,線寬為3 μm,信號層M1,間距從1 μm增加至4 μm時(shí)的插入損耗曲線。間距的改變對固有損耗沒影響。高頻區(qū)域,插入損耗隨間距變化沒有固定規(guī)律,雖然存在差異,但幅度明顯小于線長和線寬改變引起的損耗變化。
本節(jié)進(jìn)一步仿真分析信號線之間的相互影響以及消除干擾的辦法。
首先,選定M1層最中間的信號線為目標(biāo)線,M1層其它信號線及M3層所有信號線為干擾線。借鑒文獻(xiàn)[12]中的總串?dāng)_計(jì)算方法,用總串?dāng)_值評估不同結(jié)構(gòu)參數(shù)的串?dāng)_情況??偞?dāng)_PSXT的計(jì)算如下所示:
PSXT(f)=-10 log(10-PSNEXT(f)/10+10-PSFEXT(f)/10)
選擇目標(biāo)傳輸線一側(cè)端口為目標(biāo)端口,用i標(biāo)識(shí)。近端串?dāng)_NEXT(f)為:干擾線在與i端口同側(cè)的所有端口的Sni(f)參數(shù),n代表近端打擾端口。遠(yuǎn)端串?dāng)_FEXT(f)為:干擾線與i端口異側(cè)的所有端口的Smi(f)參數(shù),m代表遠(yuǎn)端打擾端口。
計(jì)算結(jié)果如圖6所示,圖6a是在基本模型基礎(chǔ)上,固定線長為6 mm,線寬為3 μm,信號層M1,間距從1 μm增加至4 μm時(shí)的總串?dāng)_頻變曲線。圖6b是在基本模型基礎(chǔ)上,固定線長為6 mm,間距為3 μm,信號層M1,線寬從1 μm增加至4 μm時(shí)的總串?dāng)_頻變曲線。圖6c是在基本模型基礎(chǔ)上,固定線寬為3 μm,間距為3 μm,信號層M1,線長從4 mm增加至7 mm時(shí)的總串?dāng)_頻變曲線。
Figure 6 PSXT curves under four conditions圖6 4種條件下總串?dāng)_曲線
圖6a~圖6c中所有結(jié)構(gòu)的總串?dāng)_最大值均在3 GHz頻點(diǎn)附近,全頻段內(nèi),總串?dāng)_與信號間距呈反比關(guān)系,間距越大,耦合作用越小,總串?dāng)_值越小,間距增加1 μm,總串?dāng)_值減小約1 dB。線寬從2 μm增加至4 μm對總串?dāng)_曲線幾乎沒影響,線寬為1 μm時(shí),總串?dāng)_有2 dB~3 dB左右改善。目標(biāo)頻段以下,線長與串?dāng)_成正比關(guān)系,這時(shí)的耦合距離與耦合作用正相關(guān),從4 mm至5 mm,總串?dāng)_增幅為1 dB,從5 mm至7 mm,每mm串?dāng)_增幅為0.5 dB??梢钥闯?,增加間距是全頻段內(nèi)改善串?dāng)_的有效途徑,其它結(jié)構(gòu)參數(shù)也對串?dāng)_值有一定影響,但需要明確工作頻點(diǎn)進(jìn)行篩選。并且,根據(jù)第2節(jié)對線寬和間距極值的評估,這些改善幅度十分有限。
在信號線中加入地屏蔽線,搭建地屏蔽結(jié)構(gòu)仿真模型,設(shè)置如表2中滿足極值6.8 μm的結(jié)構(gòu)參數(shù),總串?dāng)_頻率曲線如圖6d中方形標(biāo)注線所示??梢钥闯?,加入地屏蔽線后,總串?dāng)_值大幅降低,在目標(biāo)頻段內(nèi)降低8 dB~12 dB。
頻域分析可以快速反映HBM信號通道結(jié)構(gòu)參數(shù)對阻抗、損耗和串?dāng)_特性的規(guī)律性影響,便于參數(shù)優(yōu)化設(shè)計(jì)。但是,JEDEC規(guī)范中對于HBM收發(fā)信號是基于時(shí)域進(jìn)行要求的,需要再從時(shí)域角度進(jìn)行驗(yàn)證。
搭建如圖7所示的時(shí)域仿真拓?fù)洌?.2 V、3.2 Gbps脈沖信號作為發(fā)射源,傳輸線采用對應(yīng)模型在頻域仿真中提取的S參數(shù),接收負(fù)載根據(jù)規(guī)范要求設(shè)置為0.4 pf,在傳輸線末端查看接收眼圖。Victim通道為M1層最中間通道,others代表除目標(biāo)通道外的其它所有通道。為最大程度反映通道間的相互作用,目標(biāo)通道與其它通道采用不同信號源碼型。
Figure 7 Topology of time-domain simulation圖7 時(shí)域仿真拓?fù)?/p>
圖8a是在基本模型基礎(chǔ)上改變線寬為1 μm的信號通道對應(yīng)的接收眼圖,圖8b是在基本模型基礎(chǔ)上改變線長為8 mm的接收眼圖,圖8c是基本模型信號通道接收眼圖,圖8d是屏蔽模型信號通道接收眼圖??梢钥闯?,8 mm長度通道眼圖已經(jīng)閉合,基本模型3 μm線寬通道的眼高略高于1 μm線寬通道,但是3 μm線寬通道受串?dāng)_影響抖動(dòng)極大。地線屏蔽模型既具有3 μm線寬的低損優(yōu)勢,又有效解決了信號間的干擾,所以眼高和抖動(dòng)參數(shù)明顯優(yōu)于3 μm線寬的,在滿足規(guī)范中的200 ps最小脈寬和600±240 mV電平要求上,裕量充足。
Figure 8 Eye_Probel.Density of different signal channel structures圖8 不同信號通道結(jié)構(gòu)對應(yīng)的時(shí)域眼圖
本文從HBM顆粒管腳陣列結(jié)構(gòu)出發(fā),分析信號分布及單信號線布線空間極限值。通過建立2層信號線傳輸模型,提煉頻域阻抗分析方法和總串?dāng)_計(jì)算方法,從頻域角度分析信號層數(shù)、線寬、間距和線長對電性能傳輸參數(shù)的影響。進(jìn)一步結(jié)合規(guī)范要求,從時(shí)域進(jìn)行部分模型分析驗(yàn)證,結(jié)果顯示:
(1)阻抗是頻變的,5 GHz以上趨于平穩(wěn)。線寬越大,阻抗越小。目標(biāo)頻率范圍內(nèi)3 μm線寬更接近于50 Ω。線長對阻抗影響微小,遠(yuǎn)硅層阻抗比近硅層阻抗大6 Ω~8 Ω。
(2)線寬和線長是插入損耗敏感參數(shù),其中,針對低頻區(qū)的固有損耗,線寬影響占主導(dǎo),針對高頻區(qū)線損耗,線長影響較大。間距和布線層對損耗影響較小。
(3)增加間距是全頻段內(nèi)改善串?dāng)_的有效途徑,但由于布線空間限制,改善幅度十分有限。在信號線中加入地屏蔽線,總串?dāng)_值大幅降低,在目標(biāo)頻段內(nèi)降低8 dB~12 dB。
(4)地線屏蔽模型既具有3 μm線寬的低損優(yōu)勢,又有效抑制了信號間干擾,眼圖參數(shù)質(zhì)量高,是HBM信號傳輸結(jié)構(gòu)設(shè)計(jì)中的優(yōu)選。