方世源等* /北京特種工程設(shè)計研究院
質(zhì)量是航天發(fā)射場設(shè)備的生命線,科學(xué)有效的故障信息管理方法是提高航天發(fā)射場設(shè)備質(zhì)量管理水平的重要基礎(chǔ)。同時,故障信息是航天發(fā)射場地面設(shè)施以及火箭、衛(wèi)星、測控通信等各類設(shè)備研制、生產(chǎn)、試驗和使用全生命周期各項質(zhì)量保證活動的重要資源,是進行質(zhì)量管理的重要依據(jù)。沒有高質(zhì)量的故障信息,質(zhì)量與可靠性分析、設(shè)計、評價和改進就成了無源之水。因此,做好對航天發(fā)射場設(shè)備的故障信息收集以及相關(guān)流程的規(guī)范化管理對促進航天發(fā)射場設(shè)備質(zhì)量提高有重要作用。本文重點分析了航天發(fā)射場各類設(shè)備的故障信息及其管理現(xiàn)狀,設(shè)計并規(guī)定了故障信息標(biāo)準(zhǔn)化格式要求,最后借助故障信息管理原型系統(tǒng)實現(xiàn)了應(yīng)用。
根據(jù)GJB 451A的定義,故障是指產(chǎn)品不能執(zhí)行規(guī)定功能的狀態(tài),通常指功能故障。據(jù)統(tǒng)計,航天發(fā)射場各單位在日常維護及執(zhí)行任務(wù)時發(fā)生的各類故障涵蓋了火箭、衛(wèi)星、測控、通信以及發(fā)射場地面設(shè)施等各類型設(shè)備。從故障信息的統(tǒng)計分析情況看,航天發(fā)射任務(wù)故障數(shù)量仍處于較高水平,影響任務(wù)成敗的重大問題時有發(fā)生。另一方面,故障信息的要素不全面,故障原因和處理解決措施內(nèi)容方面的標(biāo)準(zhǔn)化程度還有待加強,故障信息管理的模式還未完全有效建立。
(1)故障要素不全面
目前的故障統(tǒng)計表格中包括任務(wù)名稱、發(fā)射工位、時間、問題名稱、責(zé)任單位/部門、問題現(xiàn)象、問題原因、歸零情況、任務(wù)影響等要素,初步對不同時間內(nèi)各類設(shè)備的故障情況進行了匯總。根據(jù)故障信息標(biāo)準(zhǔn)化的設(shè)計要求以及故障信息管理系統(tǒng)的建設(shè)需要,還應(yīng)該添加部分故障要素,如處置措施、原因分類、嚴(yán)重程度、發(fā)生階段等,并且規(guī)范目前要素中需要填寫的內(nèi)容。如:歸零情況規(guī)定包括任務(wù)中歸零、事后歸零、未歸零、無需歸零,并應(yīng)明確是技術(shù)歸零還是管理歸零;任務(wù)影響應(yīng)包括影響任務(wù)成敗、推遲發(fā)射和無影響。
(2)故障描述不規(guī)范
故障統(tǒng)計表格中對于故障描述的方式不盡統(tǒng)一。如對于故障現(xiàn)象的描述,有的詳細描述了故障事件,包括執(zhí)行任務(wù)時的具體過程,有的可能僅有一句話,沒有前后因果,難以體現(xiàn)故障的真實現(xiàn)象,再如對于故障解決措施的描述中,沒有體現(xiàn)出處置措施和解決措施的區(qū)別,有的是把歸零中的信息直接照搬,有的則是僅有臨時的處置措施,不能體現(xiàn)出解決故障的根本措施是什么,不利于后續(xù)的信息利用。
(3)故障原因分類不清晰
目前,統(tǒng)計的故障中沒有列明某個故障具體的原因分類,在以往對故障統(tǒng)計分析的過程中,也是以簡單的技術(shù)原因或管理原因進行分類,而技術(shù)原因也簡單地歸類為設(shè)計、生產(chǎn)制造、安裝調(diào)試、維修、操作使用、軟件,雖然進行了分類,但是缺乏科學(xué)規(guī)范的故障原因分類定義。
(4)故障嚴(yán)重程度缺乏判據(jù)
GJB 5711中規(guī)定,對于質(zhì)量問題的嚴(yán)重程度定義為重大、嚴(yán)重和一般,目前的故障統(tǒng)計中也沿用了這一概念,但是標(biāo)準(zhǔn)里的定義較為模糊和寬泛,不能體現(xiàn)航天發(fā)射場設(shè)備故障嚴(yán)重等級的特點,因此,需要對發(fā)射場各類設(shè)備進行故障嚴(yán)重程度的定義,細化管理要求,從而更加有效精確地判定某故障的嚴(yán)重程度,且要體現(xiàn)出不同類別設(shè)備的差異性。
(1)故障信息管理機制不健全
經(jīng)過多年建設(shè)發(fā)展和任務(wù)實踐,航天試驗各方質(zhì)量責(zé)任基本得到固化,但是在故障信息管理機制的健全與優(yōu)化方面還需加強。從各級機關(guān)和各單位的職責(zé)來看,目前沒有專門的故障信息管理部門,有時分工界面和責(zé)任不清,各級機構(gòu)不能很好地履行故障信息管理職能。同時,尚未形成定期收集發(fā)射場設(shè)備故障信息的機制,以及設(shè)計需求與質(zhì)量信息閉環(huán)反饋機制,需求獲取不及時、變化不受控的現(xiàn)象還客觀存在,參與主體之間的故障信息管理工作協(xié)同還不夠有力,信息交互向上流動還比較遲緩,綜合利用效率不高。
(2)故障信息管理缺乏共享性和延續(xù)性
近年來各級單位都組織開展過對于故障的統(tǒng)計工作并做了一定程度的分析,但是仍未完全建立起系統(tǒng)性、定期性的信息共享和上報制度,導(dǎo)致故障信息及其管理缺乏共享性和延續(xù)性。一方面,在實際工作中,發(fā)射場各單位對于試驗設(shè)備的質(zhì)量管理和使用情況沒有及時與設(shè)計、生產(chǎn)單位交流和溝通,故障信息不能充分共享;另一方面,出現(xiàn)故障時,只是組織解決具體問題,對設(shè)備的技術(shù)狀態(tài)、可靠性程度等沒有總體把握,對故障信息的分析不夠深入,對應(yīng)用統(tǒng)計技術(shù)做深入細致的分析與預(yù)測不夠,導(dǎo)致故障信息管理沒有延續(xù)性,不利于設(shè)備的全系統(tǒng)全壽命管理和持續(xù)改進。
(3)故障信息化管理手段不夠完善
目前,各單位關(guān)于故障信息化的規(guī)章制度不完善,定期收集的故障信息基本上都是以簡單的excel表格呈現(xiàn),沒有專門的故障信息管理系統(tǒng)。有些單位建立了部站級設(shè)備管理系統(tǒng),但沒有形成完善的網(wǎng)絡(luò)系統(tǒng),數(shù)據(jù)庫建設(shè)還不完善,對信息的收集、分析、傳遞和利用也不夠。
故障信息標(biāo)準(zhǔn)化設(shè)計的思路是將故障要素分類化管理,將故障從發(fā)生到最后歸零過程中包含的所有信息按照發(fā)生的時間順序進行分類,包括以下3類信息:
(1)故障基本信息:是指故障發(fā)生后,錄入人員對故障情況的簡要概括描述。
(2)故障分析及處置信息:是指故障發(fā)生后,崗位人員或技術(shù)人員對故障采取的分析及處置措施,包含現(xiàn)場處置以及事后的分析和處置信息。
(3)故障歸零信息:包括故障歸零情況、故障歸零類型以及歸零報告。
航天發(fā)射場故障信息標(biāo)準(zhǔn)化設(shè)計的總體技術(shù)流程如圖1所示。
圖1 航天發(fā)射場故障信息標(biāo)準(zhǔn)化設(shè)計流程
故障基本信息主要包括上報單位、故障時間、故障發(fā)生階段、故障名稱、故障現(xiàn)象、所屬系統(tǒng)/分系統(tǒng)、所屬任務(wù)、研制單位、發(fā)現(xiàn)人員等要素。
(1)上報單位:填寫具體的上報單位名稱;
(2)故障時間:故障發(fā)生/發(fā)現(xiàn)的具體時間;
(3)故障發(fā)生階段:包括檢測、地面試驗、交付驗收、技術(shù)陣地準(zhǔn)備、發(fā)射陣地測試、發(fā)射、飛行、在軌運行、返回、其他;
(4)故障名稱:針對故障事件的概要描述,必須包產(chǎn)品名稱、產(chǎn)品工作狀態(tài)、故障模式或故障現(xiàn)象。故障名稱一般與相應(yīng)的歸零報告上的名稱一致,應(yīng)簡單清晰明了;
(5)故障現(xiàn)象:詳細說明故障現(xiàn)象,包括發(fā)生的過程、時機、實際表象等;
(6)所屬系統(tǒng)/分系統(tǒng):包括火箭系統(tǒng)、衛(wèi)星系統(tǒng)、發(fā)射場系統(tǒng)、測控系統(tǒng)、通信系統(tǒng);
(7)所屬任務(wù):如果是任務(wù)實施階段的故障,應(yīng)注明任務(wù)代號;
(8)研制單位:故障所屬設(shè)施/設(shè)備/產(chǎn)品的研制(設(shè)計和生產(chǎn))單位;
(9)發(fā)現(xiàn)人員:故障的具體發(fā)現(xiàn)人員。
故障分析及處置信息包括故障原因分析、故障原因分類、故障嚴(yán)重程度、處置措施、處置完成時間、處置人員等信息。
(1)故障原因分析:詳細說明故障原因分析情況;
(2)故障原因分類:設(shè)計缺陷、生產(chǎn)質(zhì)量、操作不當(dāng)、設(shè)備老化、軟件、管理、其他;
(3)故障嚴(yán)重程度:重大、嚴(yán)重、一般;
(4)處置措施:詳細說明針對故障的處置措施,包括現(xiàn)場處置以及經(jīng)事后分析的處置措施信息,以及達到的效果,分為有預(yù)案處置和無預(yù)案處置;
(5)處置完成時間:故障處置完成的具體時間;
(6)處置人員:故障的具體處置人員。
故障歸零信息是對故障定位、故障機理、故障復(fù)現(xiàn)、解決措施以及舉一反三等信息的詳細說明,包含了前兩部分的信息。主要包括:
(1)故障歸零情況:包括任務(wù)中歸零、事后歸零、未歸零、無需歸零;
(2)故障歸零類型:技術(shù)歸零、管理歸零、技術(shù)管理雙歸零;
(3)對任務(wù)的影響:分為任務(wù)失敗、發(fā)射推遲、無影響等;
(4)歸零報告:按照相關(guān)要求,編寫完整的歸零報告,詳細說明故障原因分析情況。
對發(fā)射場發(fā)生的各類故障進行精準(zhǔn)的原因分類有助于完善質(zhì)量數(shù)據(jù)統(tǒng)計信息,挖掘質(zhì)量問題的共性和深層因素,制定更為合理的預(yù)防和控制措施。根據(jù)對故障原因和規(guī)律的分析,結(jié)合現(xiàn)有故障統(tǒng)計情況,對故障原因分類做出定義(見表1)。
表1 故障原因分類說明
依據(jù)GJB 5711-2006《裝備質(zhì)量問題處理通用要求》的規(guī)定,將故障嚴(yán)重程度定義為三級,即重大故障、嚴(yán)重故障、一般故障。針對火箭故障、衛(wèi)星故障以及發(fā)射場相關(guān)的故障,分別對3種故障嚴(yán)重程度等級進行了定義和說明,見表2、表3和表4。
表2 火箭故障嚴(yán)重程度分類說明
表3 衛(wèi)星故障嚴(yán)重程度分類說明
表4 發(fā)射場相關(guān)故障嚴(yán)重程度分類說明
針對當(dāng)前航天發(fā)射場故障管理規(guī)范性不足、缺乏技術(shù)手段的問題,開發(fā)發(fā)射場故障信息綜合管理系統(tǒng),對發(fā)射場設(shè)備故障數(shù)據(jù)進行收集、存儲、傳遞、匯總、分析和處理,實現(xiàn)設(shè)備故障數(shù)據(jù)的規(guī)范化和可視化管理。發(fā)射場故障信息綜合管理系統(tǒng)總體架構(gòu)分為資源層、數(shù)據(jù)層、模型層、應(yīng)用層、用戶層5個層次,如圖2所示。資源層為數(shù)據(jù)層提供環(huán)境支撐,數(shù)據(jù)層為資源層提出存儲需求;數(shù)據(jù)層為模型層提供數(shù)據(jù)支撐,模型層為數(shù)據(jù)層提出數(shù)據(jù)要求;模型層為應(yīng)用層提供模型支撐,應(yīng)用層為模型層提出功能需求;應(yīng)用層為目標(biāo)用戶提供服務(wù)支撐,目標(biāo)用戶為應(yīng)用層提出反饋迭代意見。
圖2 發(fā)射場故障信息綜合管理系統(tǒng)總體架構(gòu)圖
資源層主要為整個系統(tǒng)尤其是數(shù)據(jù)層提供基礎(chǔ)運行環(huán)境支撐,根據(jù)數(shù)據(jù)層提出的存儲規(guī)范制定數(shù)據(jù)格式要求。包括服務(wù)器、存儲集群、計算集群、安全防護等。其中服務(wù)器為系統(tǒng)提供基礎(chǔ)應(yīng)用服務(wù)部署環(huán)境;存儲集群為數(shù)據(jù)層提供數(shù)據(jù)存儲環(huán)境;計算集群為模型層提供模型訓(xùn)練環(huán)境;安全防護為整個系統(tǒng)提供等保二級以上的信息系統(tǒng)安全保障,確保相關(guān)業(yè)務(wù)數(shù)據(jù)、功能需求及應(yīng)用場景的絕對安全。
數(shù)據(jù)層主要為整個系統(tǒng)尤其是模型層提供數(shù)據(jù)支撐,根據(jù)數(shù)據(jù)的類型、格式及內(nèi)容要求為資源層提出存儲需求,根據(jù)模型層提出的數(shù)據(jù)要求進行相應(yīng)的數(shù)據(jù)處理操作,主要包括故障數(shù)據(jù)和基礎(chǔ)數(shù)據(jù),其中故障數(shù)據(jù)包括故障基本信息、故障分析處置信息、故障歸零信息、故障報告信息;基礎(chǔ)數(shù)據(jù)包括機構(gòu)數(shù)據(jù)、用戶數(shù)據(jù)、權(quán)限數(shù)據(jù)、日志數(shù)據(jù)和規(guī)章制度數(shù)據(jù)。
模型層主要為整個系統(tǒng)尤其是應(yīng)用層提供模型支撐,根據(jù)模型的輸入數(shù)據(jù)規(guī)范對數(shù)據(jù)層提出數(shù)據(jù)要求,根據(jù)應(yīng)用層所需的功能需求,確定模型的輸出數(shù)據(jù)格式,主要包括統(tǒng)計分析模型與報告生成模型。其中,統(tǒng)計分析模型對數(shù)據(jù)進行分析挖掘,為表格、餅圖、直方圖、折線圖等常用圖表提供標(biāo)準(zhǔn)化的數(shù)據(jù)輸入,并允許用戶自定義部分維度屬性(時間段、發(fā)射場、故障設(shè)備、故障類型等),以便從各個角度對設(shè)備故障信息進行深入的統(tǒng)計分析,使用戶快速而較全面地掌握各發(fā)射場當(dāng)前設(shè)備故障總體態(tài)勢。報告生成模型可按預(yù)設(shè)規(guī)則對匯集的設(shè)備故障信息進行分析,結(jié)果自動填充至預(yù)設(shè)的設(shè)備故障分析報告模板,形成當(dāng)期設(shè)備故障分析報告,以便向機關(guān)報送。
應(yīng)用層主要為整個系統(tǒng)尤其是用戶層提供服務(wù)支撐,根據(jù)用戶層的反饋意見持續(xù)迭代應(yīng)用功能,提供更優(yōu)質(zhì)的服務(wù)保障,對模型層提出相應(yīng)的功能需求,確定模型的輸出數(shù)據(jù)格式,主要包括統(tǒng)計分析模塊、信息管理模塊、規(guī)章制度模塊等核心功能和用戶登錄模塊、系統(tǒng)管理模塊等基本功能。其中,統(tǒng)計分析模塊包括數(shù)據(jù)統(tǒng)計、圖表分析、趨勢分析、報告生成等,數(shù)據(jù)統(tǒng)計通過在一個頁面中以數(shù)字的形式集中展示故障數(shù)量、處理進度等重要信息,使用戶快速而較全面地掌握各發(fā)射場當(dāng)前設(shè)備故障總體態(tài)勢。統(tǒng)計分析提供表格、餅圖、直方圖等常用圖表,以便從各個角度對設(shè)備故障信息進行深入的統(tǒng)計分析。故障報告生成可按預(yù)設(shè)規(guī)則對匯集的設(shè)備故障信息進行分析,結(jié)果自動填充至預(yù)設(shè)的設(shè)備故障分析報告模板,形成當(dāng)期設(shè)備故障分析報告,以便向主管機關(guān)報送。信息管理模塊包括信息錄入、信息上報、信息審批和信息查詢模塊,實現(xiàn)對故障基本信息、故障分析及處置信息、故障歸零信息的錄入,可按照關(guān)鍵信息和多元要素進行信息查詢。系統(tǒng)管理實現(xiàn)對機構(gòu)、權(quán)限、用戶、日志的集中管理。
用戶層是系統(tǒng)的最終用戶,通過系統(tǒng)提供的功能進行故障數(shù)據(jù)管理,也為系統(tǒng)提出實際使用過程中存在的問題,提供反饋意見。主要包括普通用戶、單位管理員、機關(guān)管理員、系統(tǒng)管理員等。普通用戶主要是發(fā)射場各專業(yè)直接負責(zé)故障信息錄入的人員;單位管理員主要是發(fā)射場各系統(tǒng)負責(zé)設(shè)備故障信息管理的人員;機關(guān)管理員主要是各發(fā)射場負責(zé)設(shè)備故障信息管理的人員;系統(tǒng)管理員主要是機關(guān)主管參謀/負責(zé)數(shù)據(jù)維護的技術(shù)人員。
航天發(fā)射場故障信息管理作為質(zhì)量管理活動的一項重要內(nèi)容,在提高發(fā)射場設(shè)備質(zhì)量方面發(fā)揮著重要作用。本文詳細分析了航天發(fā)射場各類設(shè)備的故障信息及管理現(xiàn)狀,結(jié)合發(fā)射場現(xiàn)行故障信息收集、存儲和管理模式,開展發(fā)射場設(shè)備故障信息格式標(biāo)準(zhǔn)化設(shè)計工作,給出故障信息管理系統(tǒng)的總體架構(gòu)設(shè)計方案,明確故障信息管理流程,實現(xiàn)了信息快速、準(zhǔn)確、全面?zhèn)鬟f和共享。同時,后續(xù)隨著數(shù)據(jù)的積累,可以在此系統(tǒng)基礎(chǔ)上開展故障診斷、知識管理等模塊的研究和開發(fā),進一步提高故障信息利用效能,不斷提升發(fā)射場精細化質(zhì)量管理水平。