關(guān)鍵詞:數(shù)字兵器,數(shù)據(jù),數(shù)據(jù)質(zhì)量,數(shù)據(jù)治理
DOI編碼:10.3969/j.issn.1002-5944.2024.12.006
0 引言
據(jù)中國信息通信研究院發(fā)布的《中國數(shù)字經(jīng)濟發(fā)展白皮書(2020)》,從生產(chǎn)力和生產(chǎn)關(guān)系的角度來看,數(shù)字經(jīng)濟由數(shù)字產(chǎn)業(yè)化、產(chǎn)業(yè)數(shù)字化、數(shù)字化治理和數(shù)據(jù)價值化構(gòu)成,其中數(shù)字化治理和數(shù)據(jù)價值化是基礎(chǔ)和保障。對于兵器制造業(yè)來說,數(shù)據(jù)是企業(yè)的核心資產(chǎn)。面對數(shù)字化轉(zhuǎn)型和智能化升級,數(shù)據(jù)的質(zhì)量和價值至關(guān)重要。但優(yōu)質(zhì)數(shù)據(jù)產(chǎn)生的同時也必然存在大量的錯誤數(shù)據(jù),垃圾數(shù)據(jù)給企業(yè)應(yīng)用系統(tǒng)和運營管理帶來很大的困擾。數(shù)據(jù)治理可以確保數(shù)據(jù)湖、數(shù)據(jù)倉庫和數(shù)據(jù)分析等環(huán)節(jié)的合規(guī)性和一致性,提供可信的數(shù)據(jù)支持。
1 數(shù)據(jù)治理概述
1.1 數(shù)據(jù)治理的概念
數(shù)據(jù)治理(Data Governance)是組織中涉及數(shù)據(jù)使用的一整套管理行為,是數(shù)據(jù)價值發(fā)掘的基礎(chǔ)性工作[1]。由企業(yè)數(shù)據(jù)治理部門發(fā)起并推行,關(guān)于如何制定和實施針對整個企業(yè)內(nèi)部數(shù)據(jù)的商業(yè)應(yīng)用和技術(shù)管理的一系列政策和流程。國際數(shù)據(jù)管理協(xié)會(DAMA)給出的定義:數(shù)據(jù)治理是對數(shù)據(jù)資產(chǎn)管理行使權(quán)力和控制的活動集合。國際數(shù)據(jù)治理研究所(DGI)給出的定義:數(shù)據(jù)治理是一個通過一系列信息相關(guān)的過程來實現(xiàn)決策權(quán)和職責(zé)分工的系統(tǒng),這些過程來實現(xiàn)決策權(quán)和職責(zé)分工的系統(tǒng),這些過程按照達成共識的模型來執(zhí)行。該模型描述了誰(Who)能根據(jù)什么信息,在什么時間(When)和情況(Where)下,用什么方法(How),采取什么行動(What)。
1.2 數(shù)據(jù)治理的背景
2022年第五屆數(shù)字中國建設(shè)峰會,國家網(wǎng)信辦在開幕式上發(fā)布了《數(shù)字中國發(fā)展報告(2021 年)》。報告顯示,2021 年全年,我國數(shù)據(jù)產(chǎn)量達到 6.6 ZB,同比增加 29.4%,占全球數(shù)據(jù)總產(chǎn)量(67 ZB)的 9.9%,僅次于美國(16 ZB),位列全球第二[2]。近三年來,我國數(shù)據(jù)產(chǎn)量每年保持 30% 左右的增速。2017 年到 2021年,我國數(shù)據(jù)產(chǎn)量從 2.3 ZB 增長至 6.6 ZB。
目前,各軍工企業(yè)在信息化、數(shù)字化建設(shè)方面已有了顯著的進展,ERP、PLM、主數(shù)據(jù)管理系統(tǒng)、數(shù)字化檔案館和自動化生產(chǎn)線也在被不同程度地應(yīng)用和實施,在對橫向業(yè)務(wù)拓展和縱向打通方面有了質(zhì)的改變。發(fā)展的同時,為滿足裝備研制、生產(chǎn)制造、企業(yè)運營能力的高度提升,對數(shù)據(jù)的標(biāo)準(zhǔn)化和有效性也有了更高的要求。
2 數(shù)據(jù)管理現(xiàn)狀和存在的問題
2.1 黑暗數(shù)據(jù)和數(shù)據(jù)尾氣
黑暗數(shù)據(jù)又稱睡眠數(shù)據(jù),指被收集、處理但又不用于任何用途的數(shù)據(jù)。這些數(shù)據(jù)雖然有,但從不被任何業(yè)務(wù)使用,甚至企業(yè)中的大部分領(lǐng)導(dǎo)和業(yè)務(wù)人員都不知道此類數(shù)據(jù)的存在,這些數(shù)據(jù)可能會慢慢成為歷史被徹底埋沒。
數(shù)據(jù)尾氣與黑暗數(shù)據(jù)相似卻不完全相同,這類數(shù)據(jù)在收集、處理后被短暫使用過,但因初期收集時面向的業(yè)務(wù)范圍較窄,目標(biāo)較單一,利用價值不高,故在使用后被閑置和遺棄。
之所以產(chǎn)生黑暗數(shù)據(jù)和數(shù)據(jù)尾氣主要大致分為三點。一是信息化建設(shè)過程中,系統(tǒng)設(shè)計者對業(yè)務(wù)數(shù)據(jù)不夠了解,數(shù)據(jù)采集范圍過大或過??;二是業(yè)務(wù)人員對系統(tǒng)建設(shè)的配合度不夠高,數(shù)據(jù)收集敷衍了事,數(shù)據(jù)質(zhì)量無法保障;三是大部分軍工企業(yè)信息化數(shù)字化落后,數(shù)據(jù)標(biāo)準(zhǔn)化未能先行。據(jù)統(tǒng)計,企業(yè)的數(shù)據(jù)中有50%~80%可能為睡眠數(shù)據(jù),始終無人知曉。
2.2 數(shù)據(jù)孤島
眾所周知,數(shù)字化建設(shè)對軍工企業(yè)來說是必要而艱難的。很多企業(yè)尚處于建設(shè)初期,由于缺乏整體規(guī)劃,內(nèi)部還未形成完整的、連貫的系統(tǒng)域,各業(yè)務(wù)部門獨立的應(yīng)用系統(tǒng)都是各自定義和存儲的,彼此之間數(shù)據(jù)沒有關(guān)聯(lián),從而形成了數(shù)據(jù)孤島[3]。
2.3 數(shù)據(jù)“巴別塔”
巴別塔是《圣經(jīng)》中的一個故事。這個故事有很多隱喻,其中之一就是強調(diào)在協(xié)作過程中順暢溝通的重要性。順暢溝通的前提是彼此之間有一套共同認(rèn)可的對話標(biāo)準(zhǔn)。在很多企業(yè)中存在著數(shù)據(jù)“巴別塔”。不同企業(yè)、企業(yè)中的不同部門由于沒有統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)而出現(xiàn)溝通不順暢甚至是互相推諉的情況。
2.4 糟糕的數(shù)據(jù)質(zhì)量
數(shù)據(jù)質(zhì)量是在組織業(yè)務(wù)、管理要求下,符合數(shù)據(jù)使用者滿足業(yè)務(wù)及管理需求的評價方式,其標(biāo)準(zhǔn)不僅限于業(yè)務(wù)管理的價值,還包括其價值的準(zhǔn)確性和周期。數(shù)據(jù)質(zhì)量差是個大問題,企業(yè)數(shù)據(jù)普遍存在各系統(tǒng)不一致、屬性不完整、描述信息不準(zhǔn)確、維護不及時等諸多問題。數(shù)據(jù)質(zhì)量得不到保證,其價值的發(fā)掘就無從談起。
3 數(shù)據(jù)治理基礎(chǔ)
3.1 搭建統(tǒng)一的數(shù)據(jù)管理平臺
目前,企業(yè)已在信息化、數(shù)字化道路上穩(wěn)步前進,多種應(yīng)用系統(tǒng)的構(gòu)建讓曾經(jīng)存在于Excel表格甚至是經(jīng)驗性的數(shù)據(jù)具象化地落于實處,但由于還未形成打通式的體系架構(gòu),數(shù)據(jù)更多的是獨立存在各應(yīng)用系統(tǒng)。數(shù)據(jù)管理平臺可以幫助企業(yè)整合、管理、分析和利用數(shù)據(jù)資源,打通各應(yīng)用系統(tǒng)數(shù)據(jù)資源,實現(xiàn)數(shù)據(jù)的統(tǒng)一管理、統(tǒng)一存儲[4]。支持不同業(yè)務(wù)的數(shù)據(jù)源和數(shù)據(jù)模板,將所有數(shù)據(jù)匯總到統(tǒng)一平臺,同時為下游各種業(yè)務(wù)提供有價值的數(shù)據(jù),這也是數(shù)據(jù)治理的基礎(chǔ)。
3.2 建立統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)
企業(yè)內(nèi)部數(shù)據(jù)普遍具有種類多、類型繁雜的特點,原材料、工具工裝、設(shè)備備件、往來單位等不同業(yè)務(wù)方面的數(shù)據(jù)分類混亂,沒有標(biāo)準(zhǔn)的存儲模板,給系統(tǒng)應(yīng)用帶來困難和阻礙。數(shù)據(jù)標(biāo)準(zhǔn)化不統(tǒng)一,導(dǎo)致不同來源甚至同一來源的數(shù)據(jù)矛盾,產(chǎn)生大量的誤碼和重碼,這些數(shù)據(jù)增加了不必要的業(yè)務(wù)溝通時間和成本上的浪費。
標(biāo)準(zhǔn)化管理就是根據(jù)國家標(biāo)準(zhǔn)、行業(yè)規(guī)范和企業(yè)具體情況,對數(shù)據(jù)的名稱、屬性、字段、計量單位等進行統(tǒng)一規(guī)定。通過標(biāo)準(zhǔn)化管理可以提高數(shù)據(jù)的通用性、共享性、復(fù)用性和可移植性[5-6]。包括業(yè)務(wù)標(biāo)準(zhǔn)和數(shù)據(jù)模型標(biāo)準(zhǔn),其中業(yè)務(wù)標(biāo)準(zhǔn)指的是數(shù)據(jù)來源、數(shù)據(jù)的管理級次、統(tǒng)一管理的基礎(chǔ)數(shù)據(jù)項、數(shù)據(jù)項在相關(guān)業(yè)務(wù)環(huán)境中產(chǎn)生過程的描述及含義解釋、數(shù)據(jù)之間的制約關(guān)系、數(shù)據(jù)產(chǎn)生過程中所要遵循的業(yè)務(wù)規(guī)則;數(shù)據(jù)模型標(biāo)準(zhǔn)指的是數(shù)據(jù)的存儲結(jié)構(gòu)表,包括對數(shù)據(jù)長度、數(shù)據(jù)類型、數(shù)據(jù)格式、數(shù)據(jù)的缺省值、可否為空的約束關(guān)系,保證數(shù)據(jù)的唯一性編碼能夠準(zhǔn)確地自動生成,并能與各應(yīng)用系統(tǒng)集成傳輸[7-8]。
4 基于數(shù)字化轉(zhuǎn)型的數(shù)據(jù)治理
4.1 制定數(shù)據(jù)規(guī)劃
數(shù)據(jù)規(guī)劃是數(shù)據(jù)治理實施的第一步,也是至關(guān)重要的一步,其目的是為數(shù)據(jù)的完整性、準(zhǔn)確性和唯一性提供來源和方法的保障。眾所周知,所有企業(yè)內(nèi)部劃分出機構(gòu)部門,但數(shù)據(jù)規(guī)劃時,不能簡單地依靠現(xiàn)行的機構(gòu)部門,而是應(yīng)該以業(yè)務(wù)內(nèi)容為單元成立相應(yīng)項目小組,分別對各自業(yè)務(wù)領(lǐng)域內(nèi)的數(shù)據(jù)進行收集分析。數(shù)據(jù)規(guī)劃強調(diào)的是橫向全范圍和縱向業(yè)務(wù)關(guān)聯(lián),業(yè)務(wù)調(diào)研是基礎(chǔ)。在調(diào)研分析后,收集上來的數(shù)據(jù)多且雜,涵蓋業(yè)務(wù)部門間、數(shù)據(jù)庫、各應(yīng)用系統(tǒng)和流程等,數(shù)據(jù)量多達幾十萬甚至上百萬。數(shù)據(jù)治理初期無法同時處理全部信息,所以需要識別出當(dāng)前著重處理的數(shù)據(jù)。識別依據(jù)可以是當(dāng)年有訂單任務(wù)的產(chǎn)品。數(shù)據(jù)規(guī)劃的關(guān)鍵是參照標(biāo)準(zhǔn)和體系宣貫,項目小組的力量是有限的。數(shù)據(jù)治理的根本是企業(yè)內(nèi)全體人員都能按照統(tǒng)一標(biāo)準(zhǔn)維護和使用數(shù)據(jù),所以需要在初期通過培訓(xùn)、公告或宣貫的形式讓各級管理人員和員工掌握標(biāo)準(zhǔn)和規(guī)范,保障數(shù)據(jù)治理的全過程順利進行。
4.2 數(shù)據(jù)分類
集團公司下發(fā)了關(guān)于數(shù)據(jù)管理和數(shù)據(jù)治理的范圍,按照類別對數(shù)據(jù)進行分類和編碼,主要包括:
(1)通用類:地區(qū)名稱、行政區(qū)、省份、計量單位、貨幣資金等;
(2)單位類:組織機構(gòu)、往來單位代碼等;
(3)人事類:人員、工號等;
(4)財務(wù)會計類:會計科目、固定資產(chǎn)類別等;
(5)物品類:工具工裝、原輔料、設(shè)備備件、辦公用品、標(biāo)識代碼等;
(6)產(chǎn)品類:產(chǎn)品分類、零件、部件、組件等;
(7)質(zhì)量類:質(zhì)量問題分類、質(zhì)量問題標(biāo)識代碼等;
(8)合同類:合同分類、標(biāo)識代碼等。
4.3 制定數(shù)據(jù)標(biāo)準(zhǔn)和規(guī)范要求
制定數(shù)據(jù)標(biāo)準(zhǔn)是數(shù)據(jù)治理的基礎(chǔ),也是多應(yīng)用系統(tǒng)間數(shù)據(jù)共享的保障。數(shù)據(jù)標(biāo)準(zhǔn)需要綜合考慮簡單、唯一、可擴展三個特性,便于人員更替的業(yè)務(wù)交接,同時要便于當(dāng)前已搭建的應(yīng)用系統(tǒng)數(shù)據(jù)交流和未來可能搭建的應(yīng)用系統(tǒng)做集成。
4.4 制定數(shù)據(jù)模板
不同的數(shù)據(jù)對應(yīng)不同的模板,提前規(guī)劃制作數(shù)據(jù)模板便于更快捷、更標(biāo)準(zhǔn)地新增和使用數(shù)據(jù),解決不同應(yīng)用系統(tǒng)間的信息孤島和數(shù)據(jù)描述不規(guī)范等問題。以物料為例,其數(shù)據(jù)模版由物料的大中小分類、物料描述和物料代碼組成的,其中物料說明包括名稱、規(guī)格型號、技術(shù)條件、狀態(tài)、圖號等。不同類別的物料,其描述的屬性組合也不同。搭建數(shù)據(jù)管理平臺時,需要通過業(yè)務(wù)調(diào)研和數(shù)據(jù)分析劃分出不同的數(shù)據(jù)模板,以便實現(xiàn)準(zhǔn)確又快捷的數(shù)據(jù)填報。
4.5 數(shù)據(jù)收集與清洗
前文已提到,收集上來的數(shù)據(jù)無法被直接使用,若歷史數(shù)據(jù)不準(zhǔn)確不完整,數(shù)據(jù)治理也無從談起,此時數(shù)據(jù)清洗就顯得尤為重要。數(shù)據(jù)清洗是發(fā)現(xiàn)并糾正數(shù)據(jù)中可識別錯誤的最后一道程序,包括檢查數(shù)據(jù)的一致性,處理無效值和缺省值等,一般包括“準(zhǔn)備”“檢測”“定位”“修正”和“驗證”5個步驟。
4.5.1 準(zhǔn)備
數(shù)據(jù)清洗準(zhǔn)備的核心工作就是確定清洗方案,首先通過分析當(dāng)前企業(yè)數(shù)據(jù)管理平臺存在的問題,尤其是針對生產(chǎn)制造業(yè)務(wù)方面的隱患,信息部門需要統(tǒng)籌整體建設(shè)規(guī)劃長遠考慮,對于未來有可能出現(xiàn)的生產(chǎn)和財務(wù)角度的問題應(yīng)及時詳盡地告知相關(guān)部門和領(lǐng)導(dǎo),引起全公司的重視。其次要明確清洗任務(wù)目標(biāo)。數(shù)據(jù)的清洗是長期工作而非一次性工程,故每一次的清洗目標(biāo)都在無限靠近完美但又不盡相同。同時針對不同的任務(wù)目標(biāo),清洗方法也不同。例如清洗目標(biāo)為工具工裝類物資,因為其數(shù)據(jù)數(shù)量大類型多,清洗方法應(yīng)該是人工為主,若目標(biāo)為原材料類物資,其數(shù)據(jù)模板較為規(guī)律,可先采用Excel表格初步篩選能夠提高工作效率。
4.5.2 監(jiān)測
數(shù)據(jù)清洗監(jiān)測的目的是獲得數(shù)據(jù)質(zhì)量問題并對其進行質(zhì)量維度分析,包括準(zhǔn)確性、完整性、時效性、唯一性、合理性和一致性。目前兵器行業(yè)數(shù)據(jù)治理處于起步階段,對數(shù)據(jù)存在的問題認(rèn)知有限,質(zhì)量問題庫需要在治理中不斷完善,因此數(shù)據(jù)清洗監(jiān)測是非常必要的。
4.5.3 定位
數(shù)據(jù)清洗定位是尋根溯源找到錯誤數(shù)據(jù)產(chǎn)生的原因。這個過程需要信息部門與科研產(chǎn)品技術(shù)人員、工藝編制人員、物資采購員、標(biāo)準(zhǔn)化人員共同分析錯誤數(shù)據(jù)類型及其對業(yè)務(wù)流程的影響。重點是判斷錯誤數(shù)據(jù)是在哪個環(huán)節(jié)產(chǎn)生的,如標(biāo)準(zhǔn)化宣貫不到位、賦碼過程屬性值缺失或是個人習(xí)慣符號不一致等。進而技術(shù)人員針對不同的原因給出不同的解決方法和管理辦法。
4.5.4 修正
經(jīng)過準(zhǔn)備、監(jiān)測、定位具體問題后,數(shù)據(jù)清洗的主要內(nèi)容是修正,針對不同類型的錯誤數(shù)據(jù)修正方法具體包括補全屬性值、刪除無意義數(shù)據(jù)、相同數(shù)據(jù)合并、篩選重復(fù)數(shù)據(jù)中有價值的數(shù)據(jù)、增加數(shù)據(jù)等。過程中需要注意,涉及采購、財務(wù)和庫存等業(yè)務(wù)時,若錯誤數(shù)據(jù)存在現(xiàn)有量或未完結(jié)的事務(wù)處理,為了保證前后端一致,數(shù)據(jù)是無法進行失效和刪除的。
4.5.5 驗證
由于數(shù)據(jù)清洗往往是人工與信息化結(jié)合工作,且操作者普遍對具體業(yè)務(wù)數(shù)據(jù)并不熟悉,數(shù)據(jù)清洗驗證起到檢驗、進一步提高準(zhǔn)確率的作用。數(shù)據(jù)治理工作需要經(jīng)過幾輪反復(fù),為了最大限度發(fā)揮數(shù)據(jù)治理作用,需要對整體數(shù)據(jù)治理體系運行效果進行評估,通過建立完整準(zhǔn)確的評價標(biāo)準(zhǔn),保證數(shù)據(jù)治理的有效性[9]。
5 結(jié)語
數(shù)據(jù)是數(shù)字兵器建設(shè)中的重要戰(zhàn)略資源,數(shù)據(jù)標(biāo)準(zhǔn)化是數(shù)據(jù)使用和價值挖掘的基礎(chǔ)工作。數(shù)據(jù)治理主要價值點是統(tǒng)一業(yè)務(wù)信息定義,打通業(yè)務(wù)、系統(tǒng)壁壘,實現(xiàn)信息集成與資源共享,支撐戰(zhàn)略協(xié)同[10]。本文從數(shù)據(jù)治理的背景、意義、方法等角度闡述了此項工作是一個復(fù)雜的系統(tǒng)工程,涉及多個部門和單位的多個業(yè)務(wù)領(lǐng)域。同時,支撐軍工企業(yè)數(shù)字化轉(zhuǎn)型,數(shù)據(jù)治理也是一項必須進行且迫在眉睫的工作。
作者簡介
郭蕊,通信作者,本科,工程師,研究方向為電子信息科學(xué)與技術(shù)。
苗洋,本科,工程師,研究方向為計算機科學(xué)技術(shù)。
王廣福,研究生,高級工程師,研究方向為機械制造及自動化。
羅娜,本科,工程師,研究方向為計算機科學(xué)技術(shù)。
馬冬梅,本科,高級工程師,研究方向為計算機科學(xué)技術(shù)。
(責(zé)任編輯:張佩玉)