馬英起,朱 翔,李悅,韓建偉
(中國科學院國家空間科學中心,北京 101499)
飛機在巡航高度會遭遇大氣中子、質子等次級粒子組成的大氣輻射環(huán)境。其中,大氣中子由銀河宇宙射線和太陽耀斑爆發(fā)所釋放的高能粒子與中性大氣中的氮和氧發(fā)生核反應而形成。大氣中子不帶電、穿透力強,可穿透飛機蒙皮和機箱入射機載電子設備內部,誘發(fā)半導體器件的大氣中子單粒子效應(neutron induced single event effect, NSEE),導致電子設備出現數據錯誤、數據丟失、自動復位、功能異常、功能喪失、死機、復位重啟,甚至電路燒毀等故障。隨著半導體集成電路工藝尺寸的縮小及深亞微米工藝器件(特征尺寸≤90 nm)的廣泛應用,NSEE 嚴重影響機載電子設備的可靠性,甚至危及飛機安全,已引起世界各國航空安全管理部門和航空工業(yè)方的廣泛關注[1-4]。從航空電子系統(tǒng)發(fā)生故障的歷史數據和經驗來看,國際上通常認定商用航空器航空電子系統(tǒng)中所發(fā)生的不能復現的故障中大約有20%是由NSEE造成的。國內機載電子設備生產廠家和飛機總體單位也逐步認識到NSEE的危害,在某型號飛機上針對40多件關鍵核心機載電子設備開展NSEE實驗,結果表明:80%受試機載電子設備對NSEE 敏感[5]。
國外針對機載電子設備NSEE 的研究總體呈現出以下特點:重視大氣輻射環(huán)境數據實測,已建立成熟的大氣中子能譜預計模型,并考慮中子隨太陽活動的變化,可進行地面高度的器件翻轉率計算;器件內部晶體管級SEE 機理研究的理論體系已趨于完整,針對中子與半導體器件硅材料之間的核反應過程及產物、電荷收集過程、臨界電荷、SER 預計模型等開展了大量研究,建立了核反應數據庫、機理模型及仿真計算方法,如美國IBM、Boeing 等公司聯合開展了大量飛行實驗,各大主流芯片廠家也基于實驗室輻射源開展了大量實驗,在驗證基礎模型的同時,積累了大量基礎數據以支持SEE 危害分析及防護設計。
國內方面,雖然有航天領域形成的電荷收集機制、臨界電荷理論、SEE 失效率預計模型等基礎研究成果可以借鑒,但針對航空用關鍵核心器件及機載電子系統(tǒng)的研究相對缺乏,缺少SEE分析和防護設計的基礎數據,對NSEE的影響危害還沒有形成系統(tǒng)的認識;航天領域針對重離子、高能質子SEE開展了大量深入研究,也基于粒子加速器開展了大量實驗驗證,但是針對航空機載電子設備及其器件的NSEE 危害機理研究不足。同時,由于大氣層和空間中誘發(fā)SEE的粒子種類不同(大氣層中主要是中子,空間中主要是重離子和質子),航天裝備和航空裝備在SEE 防護減緩思路上也存在不同,航天多采用價格昂貴的抗輻射加固器件來避免硬錯誤;航空裝備多采用低等級器件,一般采取容錯設計思路以減緩SEU 誘發(fā)的軟錯誤。因此,航天SEE的研究成果不能直接用于航空用機載電子設備的NSEE 防護。應借鑒航天抗輻射效應研究經驗,大力開展航空大氣中子輻射效應危害機理和傳播機制研究,為機載電子設備的NSEE 危害分析、防護設計和綜合評價等提供必要的技術支撐,以突破照搬國際標準與技術要求的摸索階段,建立機載電子設備受NSEE影響的器件—電路—系統(tǒng)完整因果鏈及其評價機制。
當前,針對航空電子系統(tǒng)的SEE 失效率分析基本局限于器件層級,缺乏系統(tǒng)級的SEE 故障傳播分析手段。傳統(tǒng)的航空電子系統(tǒng)失效率分析方法,如FMECA、故障樹模型、Markov 過程分析等,都是針對宏觀的功能單元故障展開,無法準確分析NSEE的故障傳播機理、評估系統(tǒng)面臨的NSEE風險。因此,如何利用傳統(tǒng)失效率分析方法,結合NSEE故障分析的特殊要求,建立系統(tǒng)級NSEE傳播分析方法是亟待解決的問題。對航空電子設備的NSEE防護從實施層面上有IEC 62396-1國際標準[6]可以參考,但是也僅局限于器件級的NSEE 率預測、錯誤表現和相應防護設計,缺乏系統(tǒng)級的具體分析技術,難以形成閉環(huán)測試,亟需開展NSEE 導致的器件—電路—系統(tǒng)故障及傳播分析方面的實驗研究。
用于開展NSEE 實驗的中子源主要有放射性同位素中子源、反應堆中子源、散裂中子源和加速器中子源等[7-9]。IEC 62396-1標準中特別推薦了利用脈沖激光觸發(fā)器件內部特定敏感區(qū)域的NSEE并持續(xù)便捷地獲取相關特征信息的實驗方法[6],通過建立激光實驗能量-截面數據與中子實驗能量-截面曲線的對應關系,可以為NSEE 故障率預測提供實驗數據支持。近年來,國內外均有采用激光故障注入方式實現系統(tǒng)級的SEE 危害分析,并最終實現對整個系統(tǒng)的故障定位和機理驗證的報道[10-12]。
相比常規(guī)的重離子加速器和中子地面模擬實驗手段,激光技術的優(yōu)勢主要體現在:激光微束掃描方式與大氣中子入射器件的場景相似,可克服地面寬束高能粒子輻照模擬的劑量效應對實驗測試的干擾;能夠定位至芯片的關注區(qū)域,便利地進行重復驗證實驗,精確控制輻照激光脈沖個數與頻次,提供電路時序狀態(tài)下SEE 動態(tài)響應的測試條件等,以實現對不同功能模塊的大規(guī)模集成電路NSEE 的全面細致觀測。
鑒于此,本文通過分析針對機載電子設備典型應用的器件單粒子效應激光實驗、測試和分析方法,獲取敏感器件的NSEE 特征,開展電路級機載電子設備NSEE防護設計的有效驗證。
表1所示為航天和航空領域對SEE研究的異同對比,可以看到,航天領域已針對空間重離子、高能質子的SEE開展了大量的深入理論研究和實驗驗證。而航空方面主要針對大氣層中的中子,較多采用散裂中子源和加速器中子源進行實驗研究[13];此外,地面(高山)大氣環(huán)境也可提供無誤差大氣中子輻射環(huán)境,但中子注量率較低,NSEE 實驗的時間成本高。因此,NSEE研究應在借鑒航天抗輻射效應研究經驗的同時,開展綜合實驗方法研究,為機載電子設備的NSEE 危害分析、防護設計和綜合評價等提供必要的技術支撐。
表1 航天與航空領域的SEE研究對比Table 1 Comparison of SEE studies in aerospace field and aviation field
衡量器件抗SEE性能的重要指標是其LET 閾值,而脈沖激光模擬實驗能夠直接給出的實驗結果為器件的SEE 激光能量閾值,因此需建立兩者之間的對應關系。器件背部的激光能量傳輸過程如圖1所示,通過普適的芯片內部縱向有效激光能量/等效LET值測算與控制技術,建立脈沖激光能量在器件材料中傳輸衰減及在有源區(qū)附近沉積能量的物理模型,可得到聚焦激光有效能量Eeff為
式中各參數含義參見表2,T1=e-αh,T2=e-α′d。
圖1 器件背部的激光能量傳輸過程示意Fig.1 Process of laser energy transmission from the backside of the device
對于敏感節(jié)點尺寸不小于聚焦激光光斑(直徑≤2μm)的SEE,如SEL 等,建立誘發(fā)器件SEE的LET 值與激光有效能量Eeff及入射能量E0的對應關系,理論與實驗研究得到觸發(fā)SEE 的有效激光能量Eeff與等效重離子LET(ELET)值間為線性對應關系,即
同時,上述情況下,利用激光有效能量對應得到的ELET 值與實測的重離子LET 值在85%置信度下的不確定度不超過25%。
對于敏感節(jié)點尺寸小于聚焦激光光斑的SEE,如特征尺寸≤0.18μm 的器件的SEU 等,ELET 值的計算必須考慮橫向光斑的影響,需通過光斑影響因子f進行校正,即
器件敏感功能單元定位是故障注入測試的前提。芯片發(fā)生故障的敏感區(qū)域既可能是芯片基礎功能單元發(fā)生故障(如最常見的存儲位數據翻轉)的敏感區(qū),也可能是芯片應用功能發(fā)生錯誤(如FPGA應用程序發(fā)生錯誤)的敏感區(qū)。針對機載電子設備的SEE 敏感器件,特別是復雜功能的大規(guī)模集成電路,發(fā)揮激光束便捷聚焦調控的優(yōu)勢,通過激光在芯片內部光斑及能量控制、芯片移動-激光輻照-SEE 檢測協同控制,實現器件敏感功能單元掃描測繪與定位,可為器件特定敏感功能單元進行不同模式的故障注入提供明確指導信息。
定位技術系統(tǒng)的關鍵是將激光輻照、器件掃描和SEE 檢測協調起來,實現操作和數據處理的同步控制,配合背部成像部件、電控移動臺、芯片坐標系設定方法和測繪軟件,進行器件SEE敏感區(qū)域的測繪與定位。SEE激光掃描定位協同測試原理如圖2所示。
圖2 SEE 敏感功能單元掃描定位測試原理Fig.2 Principle for scanning and mapping of single event effects sensitive functional units
SEE觸發(fā)檢測時空同步控制系統(tǒng)原理如圖3所示,其核心為基于標準總線接口(如PXI 或VXI 等)開發(fā)系列的SEE測試儀器、移動臺控制電路和同步控制電路,通過通用化的信號調理與轉接裝置可與被測器件及移動臺控制箱方便地連接,具有高度的通用性和擴展性。測試軟件基于使用的總線協議,同樣采用標準架構進行開發(fā)。完成SEE敏感單元定位后,可實時記錄并標記敏感區(qū),實現敏感區(qū)域的快速測繪。
圖3 SEE 觸發(fā)檢測時空同步控制系統(tǒng)原理Fig.3 Principle of synchronization control system for single event effects trigger detection
對于機載電子設備必須使用的對SEE較敏感的高性能器件,需要加強電路系統(tǒng)級的防護設計與驗證。除了關注會導致整個電路系統(tǒng)電流瞬間增大、功能異常、器件燒毀失效的SEL、SEB等,更需分析SEU、單粒子多位翻轉(MBU)等可能導致的系統(tǒng)軟錯誤異常。設計師需要充分了解這些器件單粒子現象的特征及其對電路系統(tǒng)的連鎖影響,開展充分、精細的故障注入測試,以便在此基礎上設計和調試出合理的軟硬件加固防護措施。
利用聚焦脈沖激光注入時間和空間可控的優(yōu)點,可實現與系統(tǒng)功能相同步的動態(tài)激光注入,在較大范圍調節(jié)輻照注量率,從而實現高效、準確、可控的故障注入測試。通過對激光在芯片內部光斑及能量控制、SEE 故障檢測及模式控制,建立可在芯片中實施隨機位置、特定位置、注入特定數目等不同模式的故障注入技術,測試電路系統(tǒng)的響應,可驗證電路系統(tǒng)防護措施的有效性及可靠性。
針對閂鎖故障注入,為實時記錄和控制器件發(fā)生SEL 的時間與位置,同步開發(fā)專用的SEL 檢測控制系統(tǒng),可實現對器件電源電流實時監(jiān)測記錄、SEL保護、過流保護、自動重新加電等功能。針對翻轉故障注入,通過對激光能量及輻照位置的控制,建立單、多位翻轉故障注入模式控制方法。以常用的Xilinx 公司Virtex-2系列FPGA 芯片為例,其CLB單元、BRAM單元以及BRAM互連單元的單、多位翻轉的比例隨脈沖激光能量的變化情況如圖4~圖6所示:當脈沖激光能量低于300 pJ 時,SEE 表現為單位翻轉;當激光能量增大時,CLB和BRAM 互連單元出現2位、3位乃至4位的多位翻轉[14]。因此,在進行故障注入實驗時,可以根據用戶具體需求實現指定位置的單、多位故障觸發(fā)。
圖4 CLB單元單、多位翻轉比例隨激光能量變化Fig.4 The ratio of SEU and MBU of CLB cells against the laser energy
圖5 BRAM 單元單、多位翻轉比例隨激光能量變化Fig.5 The ratio of SEU and MBU of BRAM cells against the laser energy
圖6 BRAM 互連單元單、多位翻轉比例隨激光能量變化Fig.6 The ratio of SEU and MBU of BRAM connection cells against the laser energy
脈沖激光手段可以為機載電子設備提供有效單粒子故障實驗測試,具有精確分辨SEE時空特性、能量連續(xù)可調、無放射性、無須抽真空、操作便捷、實驗效率高、成本低等特點。某機載電源轉換電路進行脈沖激光故障注入的電路原理和測試現場如圖7所示。針對電源轉換電路中的關鍵器件——微處理器(TI公司TMS320)進行激光故障注入,快速獲取了器件—電路—系統(tǒng)的故障特征,包括故障傳遞的模式和閾值條件,其DSP器件內部不同敏感單元NSEE 導致系統(tǒng)輸出跳變的幅度不同,最惡劣情況導致DC/DC電源轉換電路輸出由4.98 V 跳變?yōu)?.51 V,超過下降0.5 V 的安全閾值范圍,導致系統(tǒng)停止工作。上述激光故障注入實驗為機載電子設備的系統(tǒng)級失效分析提供了有效輸入。
圖7 某機載電源轉換電路脈沖激光故障注入實驗的電路原理和測試現場Fig.7 Circuit diagram and field test picture of pulsed laser fault injection test for airborne power conversion circuit
區(qū)別于航天衛(wèi)星平臺及載荷等電子設備的單粒子效應,大氣中子誘發(fā)的航空電子設備單粒子效應更易使各種高性能、低等級應用器件產生軟錯誤。采用脈沖激光模擬源可以實現大量機載電子設備用非宇航級器件單粒子效應敏感器件的篩選,對電子設備的關鍵器件進行輻照實驗,檢測關鍵器件可能發(fā)生的NSEU 等故障、電路錯誤和計算機系統(tǒng)失效類型及次數,全鏈條地檢驗上述NSEE導致的器件故障、電路錯誤及系統(tǒng)失效等危害機理和故障傳播特征。同時,利用脈沖激光故障注入技術,能夠方便地驗證機載電子設備NSEE防護設計的有效性,指導防護設計實施、驗證評價等工作,對深入開展機載電子設備抗大氣中子單粒子效應研究和工程設計具有廣泛的參考價值。