何薇、李宇、賈東海、魏杰 /首都航天機械有限公司
王立軍 /中國運載火箭技術研究院物流中心
檔案資源綜合管理是航天制造企業(yè)管理必不可少的重要組成部分,是航天型號產(chǎn)品制造過程中的重要環(huán)節(jié)之一。目前,隨著運載火箭發(fā)射任務日益繁重,科研生產(chǎn)管理模式的持續(xù)改進,產(chǎn)品數(shù)據(jù)管理系統(tǒng)、制造執(zhí)行系統(tǒng)、質量系統(tǒng)建設不斷完善,型號產(chǎn)品生產(chǎn)過程中產(chǎn)生的各種二維圖紙、三維模型、設計、工藝、質量等電子文件逐年增多,這些電子文件形成的多維數(shù)據(jù)量大且離散,難以高效和直接地為檔案提供利用服務。因此,如何采用信息化手段與大數(shù)據(jù)技術從中挖掘價值數(shù)據(jù)、可視化大數(shù)據(jù)檔案資源,以輔助企業(yè)決策,提高工作效率,提升檔案管理質量,成為目前航天制造企業(yè)生產(chǎn)過程中需要解決的一個重要問題。
大數(shù)據(jù)這個術語,最早應用于著名開源軟件社區(qū)Apache 的Nutch 項目中,大數(shù)據(jù)基本涵蓋了數(shù)據(jù)體量大、數(shù)據(jù)服務開放、數(shù)據(jù)結構復雜3 個特征,具有數(shù)據(jù)可視化、數(shù)據(jù)挖掘、數(shù)據(jù)清洗、數(shù)據(jù)存儲、數(shù)據(jù)采集5 個核心部分技術。大數(shù)據(jù)與航天制造檔案數(shù)據(jù)密切相關,應用大數(shù)據(jù)技術發(fā)展檔案工作、建立檔案數(shù)據(jù)中心尤其重要,能夠更好地為各級決策者提供知識或洞察力。
為此,筆者首先梳理了十一門類館藏檔案數(shù)據(jù)和檔案工作中形成的過程數(shù)據(jù),通過大數(shù)據(jù)技術建立各類角色關注的信息數(shù)據(jù)倉庫,根據(jù)檔案的特點進行數(shù)據(jù)的分類、分析及數(shù)據(jù)整合和語義挖掘,形成了不同業(yè)務領域需要的分析圖,并在此基礎上形成檔案數(shù)據(jù)中心系統(tǒng),促進 “數(shù)據(jù)自下而上,決策自上而下”的協(xié)調(diào)運作機制。
航天制造企業(yè)的檔案工作主要分為五大類,分別是圖紙與型號技術文件的管理工作、綜合檔案管理工作、檔案編研工作、檔案加工工作、聲像檔案工作。其中,圖紙與型號技術文件的管理工作是航天制造企業(yè)檔案業(yè)務的重點,其在科研生產(chǎn)過程中是數(shù)據(jù)的源頭,負責二維圖紙、三維模型的接收、分發(fā)及管理,生產(chǎn)現(xiàn)場加工、裝配的型號產(chǎn)品是以檔案部門下發(fā)的圖紙、模型為依據(jù),組織開展工藝、生產(chǎn)、質量等工作。
航天制造企業(yè)檔案工作的業(yè)務流程主要涉及現(xiàn)行技術文件分發(fā)流程與綜合檔案歸檔流程兩大類?,F(xiàn)行技術文件分發(fā)流程包括分發(fā)人員接收、登記和分發(fā)、更改、補發(fā)和換發(fā)、調(diào)撥和配套、銷毀;綜合檔案歸檔流程包括各單位兼職檔案人員形成十二門類預歸檔文件、檔案人員立卷歸檔、檔案人員編目著錄、借閱者借閱檔案等過程
航天制造企業(yè)檔案工作過程通過多年努力建立了檔案管理系統(tǒng),基本覆蓋了檔案工作的兩大類業(yè)務流程,涉及領導、工藝、調(diào)度、工裝設計等角色,有著較復雜的業(yè)務功能以及大量的數(shù)據(jù)量。檔案管理系統(tǒng)解決了電子圖紙分發(fā)、工藝文件在線歸檔、底圖取消曬藍、異地瀏覽圖紙、科研產(chǎn)品在線歸檔等問題,積累了可用于指導生產(chǎn)的工藝數(shù)據(jù),實現(xiàn)了檔案資源的動態(tài)管理,應用效果良好。
基于航天制造企業(yè)檔案工作的2 個主要業(yè)務流程,檔案數(shù)據(jù)可分為現(xiàn)行文件數(shù)據(jù)、十二門類檔案數(shù)據(jù)、標準資料數(shù)據(jù)。現(xiàn)行文件數(shù)據(jù)分為3 類:第一類包含二維圖紙、三維模型“兩單”等產(chǎn)品設計文件,是科研生產(chǎn)的數(shù)據(jù)源與生產(chǎn)依據(jù);第二類包含工藝路線、材料定額、工藝規(guī)程、質疑單、質控卡等工藝設計文件和質量設計文件,是科研生產(chǎn)過程的重要保障;第三類包含工裝二維圖紙信息等輔助產(chǎn)品設計文件,是科研生產(chǎn)進度的重要信息。十二門類檔案數(shù)據(jù)包含文書、經(jīng)營、航天產(chǎn)品工藝檔案、科研、質量、設備、基建等信息,是科研生產(chǎn)的基礎。標準資料數(shù)據(jù)包含國家標準、行業(yè)標準、上級標準、企業(yè)技術標準和管理標準,是科研生產(chǎn)的基準。
現(xiàn)行文件是生產(chǎn)的依據(jù),也是元數(shù)據(jù)的開始,其產(chǎn)生的數(shù)據(jù)分別保存在各自的業(yè)務數(shù)據(jù)庫中,通過集成的關系將其進行數(shù)據(jù)關聯(lián)。系統(tǒng)中一般只能進行同類數(shù)據(jù)的查詢,不能多類數(shù)據(jù)統(tǒng)計顯示。例如,展示“王二在2018 年3 月1 日―4 月15 日之間作為操作工人簽署的工種為銑工的工序內(nèi)容、操作結果、檢驗人員姓名”,該類信息是領導者在實際生產(chǎn)中迫切需要的信息,但是由于數(shù)據(jù)類型較復雜,使用SQL 語句關聯(lián)數(shù)據(jù)庫的表,降低了科研數(shù)據(jù)的利用效率。再者,科研生產(chǎn)元數(shù)據(jù)是原始基礎維度數(shù)據(jù),沒有經(jīng)過處理,意義不明,不能使用。此時,要將科研生產(chǎn)或者經(jīng)營管理的元數(shù)據(jù)經(jīng)過分類、統(tǒng)計、分析,形成各類決策指標數(shù)據(jù),如能力數(shù)據(jù)、成本數(shù)據(jù)、競爭力數(shù)據(jù)、資源數(shù)據(jù)等??蒲猩a(chǎn)檔案工作數(shù)據(jù)分析如圖1 所示。
圖1 科研生產(chǎn)檔案工作數(shù)據(jù)分析圖
航天制造企業(yè)檔案數(shù)據(jù)中心應用大數(shù)據(jù)技術,對科研生產(chǎn)檔案信息進行收集、整理和分析,將數(shù)據(jù)倉庫、Hadoop 和流計算等結合起來應用。具體過程為:先從科研生產(chǎn)檔案的現(xiàn)行文件數(shù)據(jù)源和重點檔案數(shù)據(jù)源采集數(shù)據(jù),如質量檔案,如果數(shù)據(jù)是結構化數(shù)據(jù),需經(jīng)過提取、整理、轉換和加載進入數(shù)據(jù)倉庫;如果數(shù)據(jù)是非結構化數(shù)據(jù),需經(jīng)提取相關數(shù)據(jù)特征、特征相似度匹配,信息返回給使用者。然后,使用檢索、分析工具對信息進行有效的組織和管理,將信息轉變?yōu)檩o助決策的指標報表、圖表等。
航天制造企業(yè)檔案數(shù)據(jù)中心系統(tǒng)是一個龐大的系統(tǒng)工程,由于檔案數(shù)據(jù)是一個異構數(shù)據(jù),包括關系型數(shù)據(jù)庫產(chǎn)生的結構化數(shù)據(jù),如工藝規(guī)程信息、質控卡信息等,還包括非結構化數(shù)據(jù),如圖紙、報告等,而這些異構的檔案數(shù)據(jù)在檔案數(shù)據(jù)中心系統(tǒng)進行流轉和使用需要先進的信息技術進行支撐,如大數(shù)據(jù)處理技術、存儲技術、表達技術、計算平臺技術等,通過這些技術的融合,構建航天制造企業(yè)檔案數(shù)據(jù)中心。航天制造企業(yè)檔案數(shù)據(jù)平臺和應用框架如圖2 所示。
圖2 檔案數(shù)據(jù)平臺和應用框架
航天制造企業(yè)檔案數(shù)據(jù)中心系統(tǒng)的建設是系統(tǒng)性工程,需要業(yè)務部門、檔案部門、技術部門開展聯(lián)合課題攻關,建設周期可分為3 期。第一期開展的工作是基礎數(shù)據(jù)的采集,工作重點是檔案人員精準梳理工作流程、融合業(yè)務部門工作流程、建立檔案系統(tǒng)等;第二期開展的工作是數(shù)據(jù)組織與管理,工作重點是數(shù)據(jù)分析、數(shù)據(jù)治理、技術與業(yè)務融合等;第三期開展的工作是數(shù)據(jù)應用,工作重點是數(shù)據(jù)挖掘、分類展示、數(shù)據(jù)決策等。目前,系統(tǒng)建設已經(jīng)完成第一期工作,正在開展第二期、第三期工作的研究和典型實踐。
航天制造企業(yè)檔案數(shù)據(jù)中心系統(tǒng)如同人的身體一般,海量的檔案數(shù)據(jù)就像人體的細胞,隨著大數(shù)據(jù)技術的發(fā)展,大量的檔案數(shù)據(jù)信息給檔案工作帶來巨大的挑戰(zhàn),是企業(yè)決策的重要數(shù)據(jù)來源,檔案數(shù)據(jù)中心系統(tǒng)的建設迫在眉睫。因此,及時開展檔案數(shù)據(jù)中心建設的籌劃工作,是保證檔案工作在新形勢下“不落伍、不掉隊”的重要舉措,即便現(xiàn)在由于條件所限不能深入地開展建設工作,也應統(tǒng)籌規(guī)劃,統(tǒng)一建設標準,積累經(jīng)驗,為將來企業(yè)決策打好基礎。