楊東寧,徐 敏,李 沙,鄒璞玉
(1.云南電網(wǎng)有限責(zé)任公司信息中心,云南 昆明 650217;2.云南云電同方科技有限公司,云南 昆明 650217)
2017年,云南電網(wǎng)公司開展數(shù)據(jù)認(rèn)責(zé)體系建設(shè),依據(jù)云南電網(wǎng)公司管理體系,通過業(yè)務(wù)部門專責(zé)或班組人員按數(shù)據(jù)主題、責(zé)任人建立責(zé)任關(guān)系,明確各方的職責(zé),以落實最小管理單元的數(shù)據(jù)責(zé)任。構(gòu)建各業(yè)務(wù)域內(nèi)核心數(shù)據(jù)的數(shù)據(jù)標(biāo)準(zhǔn)、錄入規(guī)范,促進(jìn)數(shù)據(jù)操作規(guī)范、準(zhǔn)確、完整,確保數(shù)據(jù)質(zhì)量問題責(zé)任明確清晰,使數(shù)據(jù)質(zhì)量問題能夠找到具體的責(zé)任人,各類數(shù)據(jù)質(zhì)量問題沖突能夠得到解決。
同時,云南電網(wǎng)公司將數(shù)據(jù)認(rèn)責(zé)工作納入了組織績效考核,從2017年起,每年組織開展現(xiàn)場檢查整改工作,完成18家供電局生產(chǎn)域、營銷域、物資域及人資域的數(shù)據(jù)完整性、準(zhǔn)確性檢查整改?,F(xiàn)場檢查過程中發(fā)現(xiàn),工作效率和效果都亟待提高。
檢查人員需要提前在系統(tǒng)中查看數(shù)據(jù)、打印資料,到工作現(xiàn)場與設(shè)備銘牌等資料核對數(shù)據(jù)是否正確,并提示整改,整改后需要再次進(jìn)行現(xiàn)場核對,整個檢查整改過程費(fèi)時費(fèi)力。以2017年為例,共組織近百名專家,耗時兩周,完成全省18家供電局生產(chǎn)、營銷業(yè)務(wù)域數(shù)據(jù)的核查,但是由于業(yè)務(wù)數(shù)據(jù)量龐大,檢查人員只能完成抽查工作,檢查整改工作僅覆蓋極小部分的問題數(shù)據(jù)。其中,生產(chǎn)業(yè)務(wù)域共抽查145 604個字段,發(fā)現(xiàn)待整改問題數(shù)22 733個;營銷業(yè)務(wù)域共抽查3 379個字段,發(fā)現(xiàn)待整改問題數(shù)109個。
檢查過程中發(fā)現(xiàn)一些數(shù)據(jù)源頭的質(zhì)量問題,如由于人員錄入錯誤造成的設(shè)備技術(shù)參數(shù)缺失、數(shù)據(jù)填寫標(biāo)準(zhǔn)不統(tǒng)一及數(shù)據(jù)不準(zhǔn)確等。檢查發(fā)現(xiàn)的問題數(shù)據(jù)需再次由人工補(bǔ)錄、修改,依然存在人工失誤造成的問題數(shù)據(jù)。
針對這些現(xiàn)狀和問題,為了提高數(shù)據(jù)核查工作效率,保證數(shù)據(jù)認(rèn)責(zé)工作質(zhì)量,迫切需要借助圖像識別技術(shù)等人工智能手段作為工具支撐,保障公司數(shù)據(jù)認(rèn)責(zé)工作規(guī)范有序地開展。
圖像識別是指利用計算機(jī)對圖像進(jìn)行處理、分析和理解,以識別各種不同模式的目標(biāo)和對像的技術(shù)。使用圖像識別技術(shù),通過圖像讀取、邊緣檢測、抽象、分割及分類等過程,可將圖像中的文本信息轉(zhuǎn)化為計算機(jī)可存儲的數(shù)據(jù)。其中,圖像讀取是把圖像電子化以圖片的方式進(jìn)行傳播;邊緣檢測在于確認(rèn)圖片中圖像的邊緣,確定圖像的范圍;抽像就是把復(fù)雜的圖像簡化,得到骨架,以準(zhǔn)確表示圖像;分割就是對骨架進(jìn)行切割,便于以更簡單的圖形反映圖像。分割也叫不變幾何特征提取,通過分割可以以環(huán)、交差點(diǎn)、端點(diǎn)等圖形表示圖像。分類是通過神經(jīng)網(wǎng)絡(luò)對圖形進(jìn)行識別歸類的過程。在圖像識別的過程中,對于同一物體的圖像很容易受到各種噪聲的干擾,如圖像位置、大小、角度、顏色、光影及背景等,都會對識別造成影響。例如,同一個物體,位置旋轉(zhuǎn)了一定角度,從圖片中看是明顯的不同,此時網(wǎng)絡(luò)是否又能正確識別。對于同一物體的圖像,不管位置、大小、角度、顏色、光影及背景如何變化,都必須能夠識別出來,這是技術(shù)實現(xiàn)的一個難點(diǎn)。對于輕微畸變或是輕微殘缺的物體的圖像,是否能正確分類到正常物體的一類,這也是一個難點(diǎn)。
圖像識別是人工智能的一個重要領(lǐng)域,目前在金融、政府、工業(yè)、教育及醫(yī)療等行業(yè)都有常見的應(yīng)用場景。例如,人臉識別、監(jiān)控視頻快速檢索及防控預(yù)警在公安系統(tǒng)中的應(yīng)用;在自動化生產(chǎn)過程中,人們將機(jī)器視覺系統(tǒng)廣泛地用于工況監(jiān)視、成品檢驗和質(zhì)量控制等領(lǐng)域;醫(yī)療影像數(shù)據(jù)的識別和診斷輔助,提升了醫(yī)生的診斷效率;通過圖片文字識別,實現(xiàn)了文字高速錄入。
對于電網(wǎng)企業(yè)數(shù)據(jù),可用在電網(wǎng)設(shè)備臺賬建立、物資倉儲信息管理及實物數(shù)據(jù)與系統(tǒng)數(shù)據(jù)之間的核查對比等與數(shù)據(jù)質(zhì)量管理密切相關(guān)的業(yè)務(wù)領(lǐng)域。但是,目前常見的圖像識別技術(shù)解析效果有限,對識別對象的格式標(biāo)準(zhǔn)、參數(shù)規(guī)范及清晰度等均有較高要求,而根據(jù)電網(wǎng)數(shù)據(jù)的特性,并不能直接使用現(xiàn)有圖像識別技術(shù)。以電力設(shè)備為例,電力設(shè)備存在種類多、型號多及參數(shù)規(guī)則眾多等特性,不同類型的設(shè)備參數(shù)描述可能完全不同,現(xiàn)有圖像識別技術(shù)未能一一識別電力設(shè)備參數(shù)名和參數(shù)值。因此,鑒于準(zhǔn)確性、電力設(shè)備的獨(dú)特性要求和電網(wǎng)設(shè)備、客戶信息及物資等數(shù)據(jù)來源的廣泛性、特殊性,需要在圖像識別技術(shù)的基礎(chǔ)上進(jìn)行個性化開發(fā),針對不同業(yè)務(wù)域建立模型,實現(xiàn)參數(shù)解析、參數(shù)結(jié)構(gòu)化修正,提高參數(shù)名和參數(shù)值的識別準(zhǔn)確率,實現(xiàn)圖像識別技術(shù)和電力數(shù)據(jù)質(zhì)量治理的有機(jī)結(jié)合。
基于圖像識別技術(shù)的數(shù)據(jù)核查系統(tǒng)架構(gòu)從下到上分為數(shù)據(jù)層、核心業(yè)務(wù)層及應(yīng)用層,如圖1所示。
5.1.1 數(shù)據(jù)層
數(shù)據(jù)層是系統(tǒng)的信息數(shù)據(jù)物理存儲,包括設(shè)備數(shù)據(jù)、認(rèn)責(zé)權(quán)限數(shù)據(jù)及核查結(jié)果數(shù)據(jù)。
(1)設(shè)備數(shù)據(jù)。系統(tǒng)定時從CSGⅡ系統(tǒng)源數(shù)據(jù)庫中同步地生產(chǎn)、營銷管理系統(tǒng)相關(guān)數(shù)據(jù)。
(2)認(rèn)責(zé)權(quán)限數(shù)據(jù)。云南電網(wǎng)公司數(shù)據(jù)認(rèn)責(zé)體系中按數(shù)據(jù)主題、責(zé)任人建立的責(zé)任關(guān)系,即最小管理單元的數(shù)據(jù)責(zé)任,實現(xiàn)數(shù)據(jù)責(zé)任到崗的管理目標(biāo)。
(3)核查結(jié)果數(shù)據(jù)為系統(tǒng)核查后保存的核查整改清單,以供用戶對比整改。
5.1.2 核心業(yè)務(wù)層
核心業(yè)務(wù)層是系統(tǒng)進(jìn)行圖像識別、核查對比的核心模塊。
圖1 基于圖像識別技術(shù)的數(shù)據(jù)核查系統(tǒng)架構(gòu)設(shè)計
(1)圖像預(yù)處理。使用圖像識別技術(shù),對采集的圖片進(jìn)行圖像傾斜矯正、切割、局部二值化及去邊框等處理。
(2)圖像解析。使用圖像識別技術(shù),根據(jù)空白區(qū)域、冒號及橫線進(jìn)行內(nèi)容定位和切割,標(biāo)記內(nèi)容區(qū)域的4個定位坐標(biāo)值,獲取圖像中的參數(shù)信息。
(3)參數(shù)結(jié)構(gòu)化。根據(jù)圖像解析獲取的參數(shù),與數(shù)據(jù)層中的設(shè)備數(shù)據(jù)驗證,匹配現(xiàn)有系統(tǒng)設(shè)備臺賬參數(shù)、電力相關(guān)數(shù)據(jù)單位,對解析出的參數(shù)名和參數(shù)進(jìn)行修正,包括合并、拆分、整合,獲得準(zhǔn)確的設(shè)備參數(shù)和參數(shù)值組合。
(4)核查驗證。根據(jù)圖像識別技術(shù)和參數(shù)結(jié)構(gòu)化獲取的數(shù)據(jù),與同步的設(shè)備數(shù)據(jù)進(jìn)行對比。
(5)核查結(jié)果整合。以列表形式整合實物數(shù)據(jù)與系統(tǒng)數(shù)據(jù)對比結(jié)果,對差異數(shù)據(jù)進(jìn)行標(biāo)識。
5.1.3 應(yīng)用層
應(yīng)用層分為PC端應(yīng)用和移動應(yīng)用,可為工作人員提供現(xiàn)場核查和后臺批量核查兩種處理方式。
(1)PC端應(yīng)用提供任務(wù)分配、批量上傳、整改提交及統(tǒng)計分析等功能應(yīng)用。
(2)移動應(yīng)用提供任務(wù)查詢、圖像采集、結(jié)果查詢及統(tǒng)計分析等功能應(yīng)用。
數(shù)據(jù)核查的核心處理過程是使用圖像識別技術(shù),對各業(yè)務(wù)域現(xiàn)場實物與數(shù)據(jù)庫中的現(xiàn)有數(shù)據(jù)對比核查、整改。
5.2.1 同步業(yè)務(wù)系統(tǒng)數(shù)據(jù)
數(shù)據(jù)核查系統(tǒng)定時從各系統(tǒng)將生產(chǎn)設(shè)備臺賬、營銷檔案等信息同步存儲到本地數(shù)據(jù)庫。
5.2.2 現(xiàn)場實物數(shù)據(jù)獲取
工作人員通過圖像識別技術(shù)對現(xiàn)場實物進(jìn)行圖像采集、識別解析,系統(tǒng)對解析后的結(jié)果完成參數(shù)結(jié)構(gòu)化處理。由于電網(wǎng)設(shè)備種類、型號眾多,不同型號的設(shè)備,參數(shù)標(biāo)準(zhǔn)千差萬別,圖像識別的目標(biāo)參數(shù)是未知和繁瑣的,需要對識別解析的內(nèi)容進(jìn)行定制化地參數(shù)格式化處理。此過程也是系統(tǒng)的核心業(yè)務(wù)功能。
5.2.3 核查對比
根據(jù)解析并結(jié)構(gòu)化后的實物數(shù)據(jù),與系統(tǒng)數(shù)據(jù)的對比檢查,展示核查結(jié)果,對需要整改的信息進(jìn)行提示。
5.2.4 一致率統(tǒng)計分析
根據(jù)核查對比的情況,對各項數(shù)據(jù)指標(biāo)的核查一致率進(jìn)行統(tǒng)計分析。
根據(jù)實際業(yè)務(wù)需求,基于圖像識別技術(shù)的數(shù)據(jù)核查系統(tǒng)提供兩種數(shù)據(jù)核查方式,分別是使用移動應(yīng)用進(jìn)行的現(xiàn)場核查方式和使用PC端應(yīng)用進(jìn)行的后臺批量核查方式。
5.3.1 移動應(yīng)用現(xiàn)場核查方式
系統(tǒng)提供移動應(yīng)用,可直接連通系統(tǒng)數(shù)據(jù)庫及后臺業(yè)務(wù)處理,對現(xiàn)場采集到的圖片信息完成圖像識別后進(jìn)行參數(shù)獲取和核查對比操作,適用于生產(chǎn)一線員工日常巡檢、現(xiàn)場檢查等應(yīng)用場景。
現(xiàn)場核查處理流程如圖2所示[1],不同于過去“檢查人員提前準(zhǔn)備資料→現(xiàn)場對比→手工標(biāo)注錯誤→手工整改數(shù)據(jù)→返回現(xiàn)場核對”的核查過程,通過移動應(yīng)用,實現(xiàn)一拍即核查,解決了核查工作繁瑣、消耗人力時間的問題,更有效地提升了整改數(shù)據(jù)的準(zhǔn)確性。
圖2 現(xiàn)場核查處理流程
5.3.2 后臺批量核查方式
系統(tǒng)還提供PC端應(yīng)用,支持批量上傳圖片,對收集的圖片信息完成圖像識別后進(jìn)行參數(shù)獲取和核查對比操作,適用于已有設(shè)備圖片、工作現(xiàn)場無法使用移動設(shè)備及不能及時上傳采集圖片等情況,實現(xiàn)后臺批量處理[2]。
通過PC端系統(tǒng)的應(yīng)用,對于已有完善資料的設(shè)備,工作人員就無需再抵達(dá)現(xiàn)場采集信息,可更加便捷地完成數(shù)據(jù)核查,并在此基礎(chǔ)上實現(xiàn)自動生成新設(shè)備臺賬數(shù)據(jù)。新設(shè)備投產(chǎn)時,減少了人工錄入的工作量,在數(shù)據(jù)源頭就避免了因人員錄入錯誤而造成的數(shù)據(jù)質(zhì)量問題。后臺批量核查處理流程如圖3所示。
基于圖像識別技術(shù)的數(shù)據(jù)核查系統(tǒng)已完成在云南電網(wǎng)公司的部署,目前已在試點(diǎn)供電局應(yīng)用。通過系統(tǒng)的應(yīng)用,基層一線員工在現(xiàn)場操作、日常巡檢工作中,實現(xiàn)一拍即核查、一查即整改的效果,改善了過去檢查專家多、耗時久及檢查范圍受限的情況,節(jié)省了人力物力,實現(xiàn)了系統(tǒng)建設(shè)預(yù)期目標(biāo)。有效提升試點(diǎn)供電局?jǐn)?shù)據(jù)整改工作效率,提高數(shù)據(jù)質(zhì)量水平,下一步將按計劃推廣到全省應(yīng)用。
基于圖像識別技術(shù)的數(shù)據(jù)核查系統(tǒng)目前實現(xiàn)了與生產(chǎn)管理系統(tǒng)、營銷管理系統(tǒng)的基礎(chǔ)數(shù)據(jù)實時核查、整改,避免了人工核查的時間、費(fèi)用成本,提高了數(shù)據(jù)的完整性、準(zhǔn)確性、規(guī)范性。后續(xù)系統(tǒng)擴(kuò)展中將進(jìn)一步擴(kuò)展核查范圍,如人資業(yè)務(wù)域、物資業(yè)務(wù)域等,增加員工信息、物資合同及倉儲資產(chǎn)等基礎(chǔ)數(shù)據(jù)的圖像識別、參數(shù)結(jié)構(gòu)化處理功能,進(jìn)一步支撐云南電網(wǎng)公司數(shù)據(jù)認(rèn)責(zé)工作,促進(jìn)公司數(shù)據(jù)質(zhì)量提升。
圖3 后臺批量核查處理流程
本文主要介紹了圖像識別技術(shù)在云南電網(wǎng)數(shù)據(jù)認(rèn)責(zé)中的研究與應(yīng)用,以供參考。