翁瑜卿
(中海油能源發(fā)展裝備技術(shù)有限公司 天津 300452)
目前數(shù)據(jù)作為生產(chǎn)要素,已經(jīng)獲得官方的認(rèn)可,國家在政策層面大力推動數(shù)字化產(chǎn)業(yè)的發(fā)展,明確要求政企加快數(shù)字化轉(zhuǎn)型、數(shù)據(jù)治理等工作。國務(wù)院頒布《關(guān)于加快推進國有企業(yè)數(shù)字化轉(zhuǎn)型工作的通知》中,要求國企加快集團數(shù)據(jù)治理體系建設(shè),明確數(shù)據(jù)治理歸口管理部門,加強數(shù)據(jù)標(biāo)準(zhǔn)化、元數(shù)據(jù)和主數(shù)據(jù)管理工作,定期評估數(shù)據(jù)治理能力成熟度等。對于油氣能源企業(yè)而言,擁有龐大的數(shù)據(jù)體量,數(shù)據(jù)分類的復(fù)雜度高,數(shù)據(jù)的專業(yè)性強,亟須通過數(shù)據(jù)治理,建立覆蓋面廣的數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)規(guī)則,提高數(shù)據(jù)質(zhì)量,實現(xiàn)數(shù)據(jù)對象全生命周期管理。
關(guān)于數(shù)據(jù)治理有多種定義,在中國通信標(biāo)準(zhǔn)化協(xié)會發(fā)布的《數(shù)據(jù)治理標(biāo)準(zhǔn)化白皮書》[1]中,將數(shù)據(jù)治理定義為通過法律法規(guī)、管理制度、標(biāo)準(zhǔn)規(guī)范、技術(shù)工具等一系列手段,面向個人數(shù)據(jù)、企業(yè)數(shù)據(jù)、政府?dāng)?shù)據(jù)、公共數(shù)據(jù)等不同類型數(shù)據(jù)對象全生命周期開展有效的管控,以滿足企業(yè)管理、行業(yè)監(jiān)管、國家治理、國際協(xié)作等場景下數(shù)據(jù)應(yīng)用的要求[2]。
《“十四五”大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃》[3]要求圍繞數(shù)據(jù)全生命周期,提高數(shù)據(jù)質(zhì)量,打造分類科學(xué)、分級準(zhǔn) 確、管理有序的數(shù)據(jù)治理體系。并設(shè)置數(shù)據(jù)治理能力提升行動,引導(dǎo)企業(yè)貫標(biāo)、鼓勵標(biāo)準(zhǔn)研究、加快重點標(biāo)準(zhǔn)研制、加速國際標(biāo)準(zhǔn)化進程。
目前油氣能源公司大部分已經(jīng)開展數(shù)據(jù)治理工作,在數(shù)據(jù)治理實施過程中,普遍遇到的幾大問題:
(1)數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一
由于分屬于不同的集團公司,國內(nèi)各油氣田當(dāng)前階段其生產(chǎn)運行過程中所配套應(yīng)用的各類數(shù)據(jù)管理與軟件系統(tǒng)也多種多樣,由于不同的數(shù)據(jù)與軟件系統(tǒng)其針對數(shù)據(jù)的管理遵循不同的標(biāo)準(zhǔn),因此,數(shù)據(jù)呈現(xiàn)海量且雜亂的現(xiàn)象就成了國內(nèi)各油氣田目前階段數(shù)據(jù)的一大顯著特點,在生產(chǎn)中也出現(xiàn)了不同油氣田之間開展相關(guān)業(yè)務(wù)時出現(xiàn)了數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一、不匹配的問題,不得不再通過相關(guān)的軟件及數(shù)據(jù)處理系統(tǒng)進行數(shù)據(jù)的轉(zhuǎn)移與轉(zhuǎn)換,給企業(yè)數(shù)據(jù)安全及數(shù)據(jù)利用效率都產(chǎn)生了諸多不利影響[4-5]。
(2)數(shù)據(jù)源頭界定不清
油氣能源行業(yè)專業(yè)性較強,涉及勘探、油藏、工程、建造、交付、運營等,在現(xiàn)有的環(huán)境下,每個環(huán)節(jié)都有自己的全生命周期管理系統(tǒng),而各個系統(tǒng)極大概率會采集同源數(shù)據(jù),該數(shù)據(jù)分布在各部門的數(shù)據(jù)系統(tǒng)中,這些復(fù)雜重復(fù)的數(shù)據(jù),給數(shù)據(jù)清洗帶了非常大的難度,導(dǎo)致許多數(shù)據(jù)治理系統(tǒng)中定義的數(shù)據(jù)源頭界定不清。
(3)數(shù)據(jù)采集效率低
數(shù)據(jù)采集依賴于采集工具或采集系統(tǒng),采集工具或采集系統(tǒng)的效率大大制約數(shù)據(jù)時效性,以及數(shù)據(jù)維護團隊人力資源的投入。由于油氣能源行業(yè)的特殊性,許多數(shù)據(jù)源頭采集現(xiàn)場,受到網(wǎng)絡(luò)硬件資源,采集工具或采集系統(tǒng)的限制,許多數(shù)據(jù)源頭采集仍然由線下暫存,后續(xù)補錄的方式。這樣勢必造成數(shù)據(jù)時效性低,數(shù)據(jù)出錯率高,數(shù)據(jù)采集人力資源投入量巨大的問題。
(4)數(shù)據(jù)治理人才匱乏
數(shù)據(jù)治理的實施,針對油氣能源行業(yè)而言,數(shù)據(jù)治理團隊不僅需要掌握數(shù)據(jù)采集工具、數(shù)據(jù)采集系統(tǒng)的了解,更加需要對涉及業(yè)務(wù)領(lǐng)域的專業(yè)數(shù)據(jù)擁有深入的理解。目前許多能源公司,通過委托外部數(shù)據(jù)公司的數(shù)據(jù)治理團隊,對公司各部門進行數(shù)據(jù)治理實施,但是介于能源行業(yè)的特殊性,許多數(shù)據(jù)是跨部門或者重疊產(chǎn)生,或者有專業(yè)關(guān)聯(lián)關(guān)系的存在,僅依靠通用數(shù)據(jù)治理人才,數(shù)據(jù)治理的實施將是事半功倍,拉長完成數(shù)據(jù)治理的周期。目前的情況而言,亟須具備通用數(shù)據(jù)治理知識及業(yè)務(wù)領(lǐng)域知識的復(fù)合型人才。
(1)數(shù)據(jù)的“隔離性”,數(shù)據(jù)均來自獨立物理隔離的信息系統(tǒng)或者是專業(yè)系統(tǒng),各自都成了數(shù)據(jù)孤島。
(2)數(shù)據(jù)“多模態(tài)”,油氣系統(tǒng)數(shù)據(jù)來源多樣,結(jié)構(gòu)復(fù)雜。除生產(chǎn)過程中儀表所采集的溫度、壓力、流量等時序數(shù)據(jù)之外,還包括地質(zhì)數(shù)據(jù)、勘探數(shù)據(jù)、專業(yè)井控數(shù)據(jù)等。
(3)數(shù)據(jù)的“關(guān)聯(lián)性”。油氣系統(tǒng)復(fù)雜,內(nèi)部系統(tǒng)多,導(dǎo)致系統(tǒng)關(guān)聯(lián)度高,生產(chǎn)狀態(tài)數(shù)據(jù)互相影響,或者因果關(guān)系,導(dǎo)致一處系統(tǒng)的數(shù)據(jù)采集錯誤,勢必導(dǎo)致關(guān)聯(lián)系統(tǒng)出現(xiàn)問題,因此,內(nèi)部系統(tǒng)數(shù)據(jù)關(guān)聯(lián)度極強。
(4)數(shù)據(jù)的“高通量”。實時設(shè)備檢測傳感器眾多所采集的時序數(shù)據(jù)具有內(nèi)部設(shè)備多、測點多、頻率高、吞吐量大、連續(xù)不間斷的特點。數(shù)據(jù)帶來巨大的存儲成本,還存在銜接不連貫、標(biāo)準(zhǔn)不統(tǒng)一、數(shù)據(jù)不對稱、無效數(shù)據(jù)等質(zhì)量問題,無法為數(shù)據(jù)分析提供有效接口,如何提升數(shù)據(jù)價值密度、提高數(shù)據(jù)挖掘效率是現(xiàn)階段亟待解決的問題[6]。
(5)數(shù)據(jù)的“重復(fù)性”。油氣項目涉及多部門銜接執(zhí)行項目,因此在數(shù)據(jù)移交時,對數(shù)據(jù)質(zhì)量的要求非常高,必須經(jīng)過審核或者第三方審核過的數(shù)據(jù),才能夠進入下一個流程環(huán)節(jié),然而各個部門在對數(shù)據(jù)采集方面,又存在重疊的工作,移交后的數(shù)據(jù),無法在接收部門進行很好的管理,導(dǎo)致接收部門在自主系統(tǒng)中,仍然對重復(fù)的數(shù)據(jù)進行采集。
根據(jù)對目前某油氣能源行業(yè)公司開展數(shù)據(jù)治理實施的研究,該公司由集團設(shè)立數(shù)據(jù)治理總部,各子分公司建立數(shù)據(jù)治理分部。首先由數(shù)據(jù)治理總部建立統(tǒng)一的標(biāo)準(zhǔn)及規(guī)范。
2.2.1 數(shù)據(jù)治理標(biāo)準(zhǔn)及規(guī)范制定
(1)數(shù)據(jù)標(biāo)準(zhǔn)制定,數(shù)據(jù)治理總部對現(xiàn)有整個油氣項目業(yè)務(wù)進行頂層分析及設(shè)計,明確業(yè)務(wù)部門劃分。由各部門分別成立數(shù)據(jù)治理部門團隊,各部門分別對各部門原有的元數(shù)據(jù),主數(shù)據(jù),及業(yè)務(wù)數(shù)據(jù)進行第一次清洗,并匯總,匯總至數(shù)據(jù)治理總部,由總部數(shù)據(jù)治理團隊及各部門專業(yè)人員一同,對匯總數(shù)據(jù)進行第二次清洗,重復(fù)數(shù)據(jù)剔除,跨部門數(shù)據(jù)疑問澄清等。完成元數(shù)據(jù),主數(shù)據(jù),及業(yè)務(wù)數(shù)據(jù)標(biāo)準(zhǔn)的編制,標(biāo)準(zhǔn)成果通過總部審核。
(2)數(shù)據(jù)采集規(guī)范,首先,從業(yè)務(wù)規(guī)范角度,以數(shù)據(jù)標(biāo)準(zhǔn)為基礎(chǔ),由部門對數(shù)據(jù)標(biāo)準(zhǔn)與采集數(shù)據(jù)進行映射,確定源頭采集數(shù)據(jù)與數(shù)據(jù)標(biāo)準(zhǔn)的數(shù)據(jù)邏輯含義一致,確保采集單位,采集內(nèi)容,采集時間等信息的完整。其次,管理規(guī)范流程中,確定源頭采集數(shù)據(jù)對應(yīng)的業(yè)務(wù)人員及劃分,落實數(shù)據(jù)采集崗位人員,審核崗人員等。再者,由于業(yè)務(wù)數(shù)據(jù)的產(chǎn)生存在時序關(guān)系,在采集規(guī)范中確定業(yè)務(wù)流程中各采集步驟的時效性,并且采集崗人員需使用采集工具對采集數(shù)據(jù)進行核驗后,再進行系統(tǒng)上傳。各自部門根據(jù)自有業(yè)務(wù)流程,制定各自部門的采集規(guī)范后,交由數(shù)據(jù)治理總部進行匯總(見圖1)。
圖1 數(shù)據(jù)采集規(guī)范結(jié)構(gòu)圖
(3)數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn),對采集數(shù)據(jù)實施多級數(shù)據(jù)審核,確保上線數(shù)據(jù)的規(guī)范性及準(zhǔn)確性。在數(shù)據(jù)用于決策時,保證數(shù)據(jù)的時效性。在數(shù)據(jù)綜合分析應(yīng)用時,保證數(shù)據(jù)的完整性。在數(shù)據(jù)邏輯關(guān)系中,保證數(shù)據(jù)的一致性。因此數(shù)據(jù)質(zhì)量不僅要保證數(shù)據(jù)的準(zhǔn)確性,也要保證數(shù)據(jù)的規(guī)范性、完整性、時效性、一致性,才能構(gòu)成一條高質(zhì)量的數(shù)據(jù)(見圖2)。
圖2 數(shù)據(jù)質(zhì)量屬性圖
其次,在數(shù)據(jù)治理標(biāo)準(zhǔn)及規(guī)范的基礎(chǔ)上,確定數(shù)據(jù)治理工作范圍及目標(biāo)。
2.2.2 數(shù)據(jù)治理工作范圍及目標(biāo)
(1)管理制度的制定:明確企業(yè)中各部門崗位職責(zé)的劃分,治理制度和流程制定,由數(shù)據(jù)治理總部決策,建立數(shù)據(jù)責(zé)任制及考核機制,增加數(shù)據(jù)采集崗位人員的積極性。
(2)數(shù)據(jù)治理范圍:明確企業(yè)數(shù)據(jù)治理的對象,數(shù)據(jù)治理的范圍,數(shù)據(jù)治理的數(shù)據(jù)深度。
(3)數(shù)據(jù)治理技術(shù)路線:明確企業(yè)數(shù)據(jù)治理技術(shù)路線,優(yōu)先考慮我國擁有自主知識產(chǎn)權(quán)的技術(shù)產(chǎn)品,避免西方的卡脖子問題。打通各個系統(tǒng)間的隔閡,實現(xiàn)有效高速的數(shù)據(jù)共享通道,建立數(shù)據(jù)治理主系統(tǒng)。
(4)數(shù)據(jù)治理成熟度評估:需定期對企業(yè)的數(shù)據(jù)治理效果進行評估,根據(jù)GB / T 34960.5—2018《信息技術(shù)服務(wù)治理第5部分:數(shù)據(jù)治理規(guī)范》[7]中,為了促進組織有效、高效、合理地利用數(shù)據(jù),有必要在數(shù)據(jù)獲取、存儲、整合、分析、應(yīng)用、呈現(xiàn)、歸檔和銷毀過程中,提出數(shù)據(jù)治理的相關(guān) 規(guī)范,規(guī)定了數(shù)據(jù)治理的頂層設(shè)計、數(shù)據(jù)治理環(huán)境、數(shù)據(jù)治理域及數(shù)據(jù)治理過程的要求,從而實現(xiàn)運營合規(guī)、風(fēng)險可控和價值實現(xiàn)的目標(biāo)。
GB / T 36073—2018《數(shù)據(jù)管理能力成熟度評估模型》[8]適用于組織和機構(gòu)對內(nèi)部數(shù)據(jù)管理能力成熟度 進行評估,給出了數(shù)據(jù)管理的8個能力域、能力成熟度評估模型以及成熟度等級,該標(biāo)準(zhǔn)取得了廣泛的關(guān)注 和認(rèn)可,為企業(yè)的數(shù)據(jù)管理能力提升提供了重要路徑和關(guān)鍵手段。構(gòu)建工業(yè)大數(shù)據(jù)管理能力評估體系,提升企業(yè)的數(shù)據(jù)管理能力,驗證數(shù)據(jù)治理效果[9]。
(5)數(shù)據(jù)治理目標(biāo):按照企業(yè)數(shù)據(jù)標(biāo)準(zhǔn)和采集規(guī)范,實現(xiàn)各分公司,各部門內(nèi)的數(shù)據(jù)達到數(shù)據(jù)治理的效果,確保主系統(tǒng)中的數(shù)據(jù)擁有五大屬性(見圖2)。數(shù)據(jù)治理后的數(shù)據(jù)有效地幫助企業(yè)實現(xiàn)真正的大數(shù)據(jù)分析及大數(shù)據(jù)應(yīng)用,實現(xiàn)數(shù)據(jù)的全生命周期管理,為企業(yè)帶來真正的經(jīng)濟價值。
最后,在完成數(shù)據(jù)治理標(biāo)準(zhǔn)及規(guī)范制定、落實數(shù)據(jù)治理工作范圍、確定工作目標(biāo)后,需對信息系統(tǒng)進行相應(yīng)的改造,以及原有歷史數(shù)據(jù)清洗遷移。
2.2.3 信息系統(tǒng)改造及數(shù)據(jù)清洗遷移
(1)系統(tǒng)應(yīng)用性改造,根據(jù)數(shù)據(jù)標(biāo)準(zhǔn)及數(shù)據(jù)采集規(guī)范,對各部門已有業(yè)務(wù)系統(tǒng)進行分析改造,將數(shù)據(jù)標(biāo)準(zhǔn)與現(xiàn)有系統(tǒng)數(shù)據(jù)庫數(shù)據(jù)屬性進行對應(yīng),排查疑問數(shù)據(jù),由專業(yè)工程師或跨部門工程師與數(shù)據(jù)治理團隊進行界定,確保疑問數(shù)據(jù)通過各部門的審核,對數(shù)據(jù)庫數(shù)據(jù)屬性進行修正,完成新的數(shù)據(jù)模型搭建。業(yè)務(wù)系統(tǒng)改造完成后,將系統(tǒng)數(shù)據(jù)共享至數(shù)據(jù)治理主系統(tǒng)對應(yīng)數(shù)據(jù)庫中,數(shù)據(jù)治理主系統(tǒng)實現(xiàn)對各業(yè)務(wù)系統(tǒng)的信息抽取。
(2)歷史數(shù)據(jù)清洗遷移,由于油氣行業(yè)數(shù)據(jù)產(chǎn)生周期較長,歷史數(shù)據(jù)跨越的年份較久,歷史數(shù)據(jù)分為非系統(tǒng)歷史數(shù)據(jù),系統(tǒng)歷史數(shù)據(jù)。對于非系統(tǒng)歷史數(shù)據(jù),需要人為進行梳理,錄入到數(shù)據(jù)治理主系統(tǒng)。系統(tǒng)歷史數(shù)據(jù),分析歷史數(shù)據(jù)是否符合改造后系統(tǒng),若符合系統(tǒng)要求,則僅需對數(shù)據(jù)進行核對,無需再次采集。若不符合系統(tǒng)要求,則需對歷史數(shù)據(jù)進行線下數(shù)據(jù)復(fù)核及采集。
本文研究了目前油氣能源行業(yè)實施數(shù)據(jù)治理的案例,案例以管理制度、數(shù)據(jù)標(biāo)準(zhǔn)、采集規(guī)范為基礎(chǔ),對各業(yè)務(wù)系統(tǒng)進行標(biāo)準(zhǔn)化的改造,實現(xiàn)各業(yè)務(wù)系統(tǒng)數(shù)據(jù)的標(biāo)準(zhǔn)化,使得該企業(yè)提高了業(yè)務(wù)數(shù)據(jù)的質(zhì)量,也為數(shù)據(jù)后續(xù)實現(xiàn)全生命周期管理打下了堅實的基礎(chǔ)。該案例對于解決數(shù)據(jù)治理目前普遍遇到的問題,也有非常大的借鑒作用。
隨著未來越來越多新的技術(shù)及解決方案的引入,油氣能源行業(yè)的數(shù)據(jù)能夠發(fā)揮更多的數(shù)據(jù)價值,產(chǎn)生更多的經(jīng)濟效益。