曾樂業(yè),李翔
(1. 北京星網(wǎng)船電科技有限公司 湖南分公司,長沙 410006; 2. 電子科技大學(xué) 航空航天學(xué)院,成都 611731)
軍用加固計算機是指控系統(tǒng)的核心,是戰(zhàn)場指揮管理和武器控制的重要工具。隨著電子集成技術(shù)的發(fā)展,其向著多功能、高密度、高功率方向發(fā)展,由此帶來計算機的熱流密度不斷提高。為滿足復(fù)雜惡劣戰(zhàn)場環(huán)境下可靠性要求,對芯片的散熱提出了更高要求[1]。熱設(shè)計的目的是控制電子設(shè)備內(nèi)部所有電子元器件的溫度,使其在設(shè)備所處的工作環(huán)境條件下不超過規(guī)定的最高允許溫度[2]。
熱管是傳熱領(lǐng)域在20 世紀(jì)最重要的發(fā)明之一,它利用工質(zhì)的相變潛熱進行熱量傳遞。相比固體熱傳導(dǎo),單位質(zhì)量的熱管可多傳遞幾個數(shù)量級的熱量,且具有更優(yōu)的等溫性、快速的熱響應(yīng)性及可變換熱流密度的功能[3-5]。熱管的傳熱特性、長壽命及可靠性使其廣泛應(yīng)用于機載、艦載等電子設(shè)備的熱控制。
文中以某軍用加固計算機的散熱冷卻為背景,研制了一種低熱阻結(jié)構(gòu)的熱管冷板,進行了不同熱流密度下的常溫與高溫試驗,并與原結(jié)構(gòu)熱管冷板在相同工況下進行了對比研究,以期為該新型結(jié)構(gòu)的熱管冷板的實際應(yīng)用奠定基礎(chǔ)。
加固計算機是基于CPCI 總線的標(biāo)準(zhǔn)19 英寸6U密封機箱,內(nèi)裝模塊是6U CPCI 加固模塊。其中主板模塊寬度為4 HP,其主要芯片CPU 與GPU 的總熱設(shè)計功耗大于65 W。原主板模塊冷板采用經(jīng)黑色陽極氧化的鋁合金,并在表面嵌入熱管構(gòu)成,熱管采用導(dǎo)熱膠粘接,如圖1 所示。整機進行高溫+55 ℃試驗時, CPU 與GPU 溫度過高,甚至接近閥值。GJB 6603—2008 中6.1.2 款“模塊的功耗”規(guī)定了插件寬度為4 HP的模塊單件功耗不宜超過40 W[6],插件寬度為8 HP的模塊單件功耗不宜超過70 W[6]。因此,主板模塊的熱設(shè)計功耗超過了GJB 6603 的要求,原冷板難以滿足芯片及整機的可靠性要求[7]。
圖1 計算機與原冷板結(jié)構(gòu)Fig.1 Structure of computer and the original cold plate
由于機箱為密封無風(fēng)扇結(jié)構(gòu),熱傳導(dǎo)為主要傳熱方式,主板熱源芯片的傳熱可采用圖2 所示的熱阻網(wǎng)絡(luò)模擬[8]。
圖2 主板模塊傳導(dǎo)冷卻熱阻網(wǎng)絡(luò)Fig.2 Motherboard module conduction cooled thermal resistance network
芯片結(jié)溫Tj可表示為:
式中:Φ 為芯片耗散的熱量;Rs為總熱阻。根據(jù)熱阻網(wǎng)絡(luò),Rs可表示為:
在主板功耗確定情況下,對原結(jié)構(gòu)冷板進行優(yōu)化設(shè)計時,只有從降低總熱阻Rs著手。當(dāng)機箱散熱方式及冷板鎖緊機構(gòu)方式確定后,采取降低模塊結(jié)構(gòu)熱阻Rm及降低各界面接觸熱阻成為最有效途徑。文獻[9]介紹了一種測量板間接觸熱阻的新方法,文獻[10]采用有限元數(shù)值計算方法得到了接觸熱阻的近似計算公式,可表示為:
式中:hy為表面粗糙度;λ1、λ2、λ3為接觸面材料及間隙物導(dǎo)熱系數(shù);k1、k2、k3為接觸面系數(shù)。
熱設(shè)計的原則就是自芯片至耗散環(huán)境之間,構(gòu)建一條熱阻盡可能低的熱流路徑[4]。通過傳熱分析,新型冷板結(jié)構(gòu)應(yīng)盡可能降低模塊傳導(dǎo)熱阻Rm及各界面接觸熱阻Rt。與原冷板不同之處在于,新型冷板設(shè)計了CPU 與GPU 熱管模組,熱管模組采用熱管與紫銅塊焊接而成。將其蒸發(fā)段替代原紫銅塊與芯片接觸,其冷凝段為銅導(dǎo)軌,通過楔塊鎖緊機構(gòu)與機箱壁搭接。利用熱管相變傳熱特性來降低Rm,將CPU 與GPU 的熱量以低熱阻路徑快速傳導(dǎo)至機箱上下側(cè)壁,如圖3 所示。為了降低各界面接觸熱阻Rt,采用高導(dǎo)熱系數(shù)的紫銅導(dǎo)軌及低溫焊錫膏替代鋁導(dǎo)軌及導(dǎo)熱膠,其中錫膏導(dǎo)熱系數(shù)達到50 W/(m·K),遠(yuǎn)大于一般的熱界面材料(TIM)。
圖3 新型冷板結(jié)構(gòu)與裝配圖Fig.3 Structure and assembly drawing of new cold plate
為了驗證新型冷板的傳熱性能,對改進前后兩種冷板進行了常溫及高溫試驗。將兩種冷板構(gòu)成的單板測試平臺及加固計算機分別置于試驗環(huán)境中。試驗過程中,通過測試程序加載主板功耗,對比冷板在30 W及65 W 熱功耗情況下的傳熱性能。
試驗裝置由單板測試平臺、加固計算機、功率計、TP-700 多路數(shù)據(jù)記錄儀、K 型熱電偶、溫度試驗箱及軟件測試平臺等組成,測點及芯片結(jié)溫分別由數(shù)據(jù)記錄儀及監(jiān)控軟件自動采集。試驗及測試程序按照既定的步驟進行:將熱電偶用導(dǎo)熱膠粘接主板、冷板及機箱測試點,搭載測試平臺(單板或整機)。高溫試驗需按照GJB 150.3A 中試驗方法將單板或整機進行保溫?zé)峤?,觀察數(shù)據(jù)記錄儀及監(jiān)控軟件在初始功耗(30 W)的溫度曲線,待溫度曲線平直后,通過測試程序Burin Test 加載功耗至65 W,直至各測點溫度再次達到穩(wěn)態(tài)。
常溫試驗環(huán)境溫度為+23 ℃,兩種結(jié)構(gòu)的熱管冷板在30 W 及65 W 兩種不同熱流密度下的單板及整機啟動性能及穩(wěn)態(tài)性能如圖4 所示。圖中新型結(jié)構(gòu)冷板芯片溫度以CPU+及GPU+表示,穩(wěn)態(tài)溫度數(shù)據(jù)對比見表1。
由圖4 及表1 結(jié)果分析可知,當(dāng)主板功耗為30 W時,由于CPU 為主要發(fā)熱芯片,單板及整機狀態(tài)下兩種冷板GPU 溫度達到穩(wěn)定后基本相同,CPU 溫度分別下降了7.4 ℃及4.5 ℃。測試程序加載功耗到65 W 時(時間軸45 min 位置),即CPU 及GPU 均達到滿負(fù)荷工作,單板試驗中新型結(jié)構(gòu)冷板使CPU 及GPU 溫度分別降低了14.3 ℃及5.4 ℃,而整機試驗中分別降低了7.2 ℃及6.1 ℃。
圖4 常溫試驗溫度響應(yīng)對比Fig.4 Temperature response of normal temperature test: a) single chip; b) whole machine chip
表1 常溫試驗主板芯片穩(wěn)態(tài)溫度Tab.1 Motherboard chip steady temperature in normal temperature test ℃
對于新型結(jié)構(gòu)熱管冷板,由于其熱管模組采用焊錫膏焊接而成,極大地降低了界面熱阻。單板試驗時,熱量通過自然對流與輻射散發(fā)至熱沉,故CPU 及GPU 溫差極小,CPU+及GPU+曲線基本重合。整機試驗時,由于熱管模組的冷凝段作為導(dǎo)軌,與機殼上下內(nèi)壁搭接,構(gòu)建了由熱源至機殼的最短傳熱路徑,當(dāng)主板功耗為65 W 時,改善效果非常顯著。
由于采用原結(jié)構(gòu)冷板的加固計算機在高溫+55 ℃環(huán)境試驗過程中滿負(fù)載運行時出現(xiàn)高溫過載,需對優(yōu)化設(shè)計后的熱管冷板在高溫環(huán)境下的傳熱性能進行驗證。試驗過程中,同樣加載主板功耗至65 W,兩種結(jié)構(gòu)的熱管冷板在不同熱流密度下的單板及整機啟動性能及穩(wěn)態(tài)性能如圖5 所示,高溫芯片的穩(wěn)態(tài)溫度數(shù)據(jù)對比見表2。
圖5 高溫整機芯片溫度響應(yīng)對比Fig.5 Temperature response of high temperature test: a) single chip; b) whole machine chip
表2 高溫試驗主板芯片穩(wěn)態(tài)溫度Tab.2 Motherboard chip steady temperature in high temperature test ℃
由圖5 及表2 結(jié)果分析并對比常溫試驗響應(yīng)曲線,高溫試驗時,新型結(jié)構(gòu)熱管冷板響應(yīng)特性與常溫相同。當(dāng)主板功耗為30 W 時,單板及整機CPU 溫度分別下降了7.2 ℃及9.4 ℃;將主板功耗加載到65 W,單板試驗中新型結(jié)構(gòu)冷板使CPU 及GPU 溫度分別降低了10.2 ℃及4.2 ℃,而整機試驗中分別降低了9.1 ℃及7.5 ℃。
由表2 可知,原冷板在單板滿負(fù)載運行時,CPU結(jié)溫為100.5 ℃,而在整機試驗時已達到105.1 ℃,已接近芯片的允許結(jié)溫,會影響芯片壽命及產(chǎn)品的可靠性。對于半導(dǎo)體器件,溫度每升高10 ℃,其可靠性將會降低50%,采用優(yōu)化設(shè)計后的熱管冷板能明顯地提高芯片工作壽命及整機可靠性。
對改進前后的熱管冷板進行了常溫與高溫試驗研究,并考察了不同熱流密度下冷板的傳熱特性,試驗得出以下結(jié)論:
1)采用熱阻網(wǎng)絡(luò)模型對芯片散熱進行傳熱分析,通過降低模塊傳導(dǎo)熱阻及界面接觸熱阻,冷板傳熱特性得到改善。
2)當(dāng)主板熱流密度達到最大負(fù)荷運行時,原結(jié)構(gòu)冷板已不能滿足高溫試驗要求。改進后的熱管冷板使CPU 及GPU 溫度在極限工況下分別下降了9.1 ℃及7.5 ℃,有效解決了高溫高熱流密度狀態(tài)下散熱問題,提高了整機環(huán)境適應(yīng)性和可靠性。
該熱管冷板結(jié)構(gòu)設(shè)計方法可應(yīng)用于采用CPCI、CPEX 及VPX 等總線架構(gòu)的加固計算機產(chǎn)品中,對其他電子設(shè)備散熱設(shè)計也有較好的借鑒作用。