摘要:文章對基于深度學(xué)習(xí)的風(fēng)場關(guān)口計量表圖像識別系統(tǒng)進行了研究,主要是識別關(guān)口計量表上參數(shù),無須對儀器進行改造。文章以先進的云計算和數(shù)據(jù)分析為輔助并結(jié)合關(guān)口計量表采集數(shù)據(jù),開發(fā)一套簡單方便的微信小程序輕應(yīng)用系統(tǒng)。該系統(tǒng)識別目標(biāo)準(zhǔn)確率高,圖片處理時間快,且不直接與計量表計對接,具有完備的電力生產(chǎn)系統(tǒng)網(wǎng)絡(luò)安全性,且通過光學(xué)圖片采集信息,可屏蔽生產(chǎn)場所產(chǎn)生的電磁干擾,對發(fā)電企業(yè)起到挖掘數(shù)據(jù)能效、開發(fā)運維潛力、提升管理質(zhì)量的效果。
關(guān)鍵詞:深度學(xué)習(xí);關(guān)口計量表;圖像識別系統(tǒng)
中圖分類號:TP391.41 文獻標(biāo)志碼:A文獻標(biāo)志碼
0 引言
關(guān)口電能計量表是電網(wǎng)公司和新能源發(fā)電企業(yè)之間最重要的一類計量表。對于電網(wǎng)公司,它是計量發(fā)電企業(yè)發(fā)電量,購電核算的重要工具[1]。對于發(fā)電企業(yè),它用于計量該線路上的總供電量。是否可用該計量值參與考核線損等問題,是新能源發(fā)電企業(yè)關(guān)注的重點。
目前,國內(nèi)外針對關(guān)口計量表的監(jiān)測研究問題主要集中在以下2點:(1)計量表數(shù)據(jù)的遠程采集和遠程校驗;(2)智能感知和數(shù)據(jù)挖掘?qū)崿F(xiàn)對電能表運行狀況的實時監(jiān)測。由于計量表由電網(wǎng)安裝校正,通信接口已被實施鉛封,不允許其他電子設(shè)備接入。發(fā)電企業(yè)在運維過程中,只能由人工定時讀表,手動記錄。該方式工作效率低,數(shù)據(jù)時效性差,不易形成結(jié)構(gòu)化數(shù)據(jù),進而進行深度分析,在很大程度上阻礙了發(fā)電企業(yè)與電網(wǎng)之間的貿(mào)易結(jié)算,特別是在以新能源為主體的新型電力系統(tǒng)極具時效要求的現(xiàn)貨交易流程中。
隨著人工智能技術(shù)的發(fā)展,圖像識別技術(shù)早已被廣泛運用到如物聯(lián)網(wǎng)二維碼中的字符識別等各個方面,其核心技術(shù)也愈加趨于成熟。利用圖像處理進行遠程采集儀表數(shù)據(jù)的技術(shù)也開始發(fā)展起來[2],這種遠程圖像識別參數(shù)的方法相較于傳統(tǒng)的遠程抄表技術(shù),具備不受電表本身硬件限制的優(yōu)點,無須對電表進行改裝或更換就能被大量應(yīng)用,減少了資金的消耗。目前已有很多關(guān)于圖像處理識別數(shù)字儀表的研究[3],表明該技術(shù)實現(xiàn)了數(shù)字提取、分割、識別,并能在各種約束條件下得到較理想的識別效果。
鑒于國家電網(wǎng)對關(guān)口計量表通信接口進行鉛封,發(fā)電企業(yè)須要實時了解關(guān)口電量表數(shù)據(jù)以支撐現(xiàn)場和經(jīng)營層面的決策,本文創(chuàng)新性地研發(fā)了智能的關(guān)口計量數(shù)據(jù)監(jiān)控系統(tǒng)。該系統(tǒng)具有廣闊的社會前景和經(jīng)濟效益。
1 研究內(nèi)容
新能源發(fā)電行業(yè)均積極從傳統(tǒng)運維向智能運維模式轉(zhuǎn)變。傳統(tǒng)運維依靠經(jīng)驗和制度規(guī)章驅(qū)動,形成靜態(tài)模糊決策,再依規(guī)開票實施;智能運維則依靠電力生產(chǎn)過程中產(chǎn)生的實時數(shù)據(jù)驅(qū)動,通過信息系統(tǒng)的強大數(shù)據(jù)分析能力精準(zhǔn)把握動態(tài),從而快速決策。實現(xiàn)轉(zhuǎn)變的關(guān)鍵就是以新一代信息論、系統(tǒng)論為基石的人工智能技術(shù)的發(fā)展和應(yīng)用。電能關(guān)口計量表是電網(wǎng)公司和發(fā)電企業(yè)之間購售電核算的主要工具,大部分國有企業(yè)類發(fā)電廠目前仍使用人工抄表、手動收集數(shù)據(jù)的方式,讀數(shù)的實時性差,準(zhǔn)確性不可控,嚴重減弱了生產(chǎn)數(shù)據(jù)的分析效果,影響發(fā)電過程的整體決策。
針對當(dāng)前關(guān)口計量表存在的問題,企業(yè)應(yīng)運用工業(yè)相機在關(guān)口計量表處采集液晶屏幕圖像,再應(yīng)用以Tensorflow/Keras為框架的YOLOv5網(wǎng)絡(luò)圖像分割和OCR圖像識別技術(shù)進行處理,還原成文本并發(fā)送到數(shù)據(jù)中心,最后進行結(jié)構(gòu)化存儲與分析。結(jié)果最終以微信小程序輕量化展示給用戶,以實現(xiàn)數(shù)據(jù)的實時讀取與分析,盤活數(shù)字資產(chǎn),達到提高決策效率的目的。
研究內(nèi)容主要有:
(1)關(guān)口計量表圖像采集,以Linux為核心的SoC系統(tǒng)驅(qū)動工業(yè)相機拍攝計量表液晶屏區(qū)域圖像信息,利用物聯(lián)感知網(wǎng)和升壓站信息承載網(wǎng)絡(luò)將圖片傳輸?shù)皆品?wù)器。
(2)圖像識別與數(shù)據(jù)存儲,由云服務(wù)器對圖片采用深度學(xué)習(xí)聯(lián)系YOLOv5網(wǎng)絡(luò)圖像定位分割和OCR機器學(xué)習(xí)方式對圖片進行識別,解析的字符串生成結(jié)構(gòu)化文本數(shù)據(jù),通過TCP/IP或RS-485等協(xié)議,傳輸?shù)郊刂行臄?shù)據(jù)庫。
(3)數(shù)據(jù)展示,采取直連數(shù)據(jù)庫的方式實時傳輸數(shù)據(jù),開發(fā)一套簡單方便的微信小程序輕應(yīng)用系統(tǒng)實時傳輸風(fēng)場相關(guān)數(shù)據(jù)(上/下網(wǎng)電量和相關(guān)生產(chǎn)經(jīng)營信息),為設(shè)備精細化運行和維護人力資源調(diào)度提供科學(xué)可靠的決策支撐。
2 系統(tǒng)結(jié)構(gòu)
風(fēng)場關(guān)口計量表識別系統(tǒng)的結(jié)構(gòu)如圖1所示。
2.1 關(guān)口計量表圖像采集設(shè)備
圖像采集由工業(yè)相機對電表液晶屏幕進行拍攝。將相機貼在屏柜玻璃外壁,在柜外對單個關(guān)口計量表進行拍攝,采用照明方式提高亮度及清晰度。前置工控機采用以Linux為核心的SoC系統(tǒng),通過執(zhí)行定時程序驅(qū)動照明電路和攝像頭拍攝圖片,配置開關(guān)電源為其供電,設(shè)置路徑存儲程序?qū)⑴臄z的照片存儲到相應(yīng)目錄中,驅(qū)動socket通信將其傳到云服務(wù)器中,采用無連接的數(shù)據(jù)傳輸方式SOCK_DGRAM,保證計算機只傳輸數(shù)據(jù)不做數(shù)據(jù)局校驗,提升數(shù)據(jù)傳輸速度,將發(fā)送的數(shù)據(jù)存入接收緩存區(qū)。
2.2 圖像識別與數(shù)據(jù)存儲
本研究結(jié)合傳統(tǒng)圖像處理和深度學(xué)習(xí)技術(shù)實現(xiàn)計量表智能讀數(shù)算法,如圖2所示。
首先,本文采用YOLOv5網(wǎng)絡(luò)圖像分割技術(shù)分割出計量表LCD液晶屏區(qū)域,根據(jù)先驗知識在液晶屏區(qū)域中裁切出有效數(shù)字所在的大致區(qū)域,減少背景噪聲影響,提升讀取的準(zhǔn)確率,通過圖像特征采用SENet算法對圖像進行分割。
采用LSTM+CTC+CNN架構(gòu)的OCR圖像識別技術(shù)結(jié)合深度學(xué)習(xí)技術(shù)識別出液晶屏中前述數(shù)字區(qū)域中的數(shù)字進行識別解碼,將圖片解析成字符串,送入云端數(shù)據(jù)庫,再在云端服務(wù)器上搭建Web服務(wù)器,將已存入數(shù)據(jù)庫的計量數(shù)據(jù)通過Web服務(wù)發(fā)布到頁面。外網(wǎng)可通過Web頁面獲取關(guān)口計量表的碼表數(shù)據(jù)。另外,在數(shù)據(jù)庫形成的結(jié)構(gòu)化數(shù)據(jù)可供系統(tǒng)隨時調(diào)用,為發(fā)電運營和風(fēng)場生產(chǎn)的相關(guān)決策提供支撐。
2.3 數(shù)據(jù)展示
本文通過微信公眾平臺申請小程序并對界面進行設(shè)計開發(fā),經(jīng)過后臺程序計算后的生產(chǎn)相關(guān)數(shù)據(jù),直連數(shù)據(jù)庫的傳輸方式對數(shù)據(jù)實時顯示。
3 技術(shù)路線
本研究的實施技術(shù)路線與成果規(guī)劃如圖3所示。通過查閱文件、實地調(diào)研,首先設(shè)計關(guān)口計量表圖像采集設(shè)備,然后在TensorFlow/Keras平臺上采用YOLOv5網(wǎng)絡(luò)模型、SENet算法對圖像進行分割,利用OCR圖像識別技術(shù)對圖片進行識別解碼,對數(shù)字字符區(qū)域分割生成結(jié)構(gòu)化文本數(shù)據(jù),并傳輸至集控中心數(shù)據(jù)庫,最后以微信小程序的形式展示。
3.1 YOLOv5網(wǎng)絡(luò)圖像分割技術(shù)
本文對LCD屏定位采用YOLOv5算法,利用整張圖片作為網(wǎng)絡(luò)的輸入,直接在輸出層回歸位置和所屬類別,對除去所需監(jiān)測數(shù)據(jù)圖片的其他噪聲進行預(yù)處理,精準(zhǔn)定位到設(shè)備數(shù)據(jù)圖片位置。
本文對定位圖片中的數(shù)據(jù)進行識別,采用SENet算法,在原圖像中找到符合閾值的部分,之后再對每一部分進行2次投影分割,并篩選出符合讀數(shù)區(qū)域長寬比的部分。該方法比較容易實現(xiàn),在處理電表圖像時能得到一個較為良好的結(jié)果。
YOLOv5通過形態(tài)學(xué)操作和減法可以實現(xiàn)獲取圖像的邊界,設(shè)置為8位單通道的二值圖像,將攝像頭所拍圖像處理為二值圖像后再將其作為image的參數(shù),最后返回當(dāng)前圖片中的輪廓層次關(guān)系。上述代碼對檢測到的輪廓建立等級關(guān)系,依次遍歷,然后壓縮水平、垂直對角線方向的元素,只保留該方向的終點坐標(biāo),通過該方式定位到圖片中的數(shù)字位置。接下來對定位到的矩形邊框中的信息進行擬合,依次縮進所取范圍直到鎖定所需數(shù)字輪廓。
SENet中的SE模塊如圖4所示,圖中的Ftr是傳統(tǒng)的卷積結(jié)構(gòu);X和U是Ftr的輸入(C’×H’×W’)和輸出(C×H×W),這些都是以往結(jié)構(gòu)中已存在的。SENet增加的部分是U后的結(jié)構(gòu):對U先做一個Global Average Pooling,輸出的1×1×C數(shù)據(jù)再經(jīng)過兩級全連接,最后用Sigmoid限制到[0,1]的范圍,把這個值作為scale乘到U的C個通道上,作為下一級的輸入數(shù)據(jù)。該方式控制scale的大小,把所需的數(shù)字特征增強,不需要的其他特征減弱,讓鎖定輪廓中的數(shù)據(jù)信息指向性更強。
3.2 OCR圖像識別技術(shù)
對所識別數(shù)據(jù)進行處理,首先利用OCR算法以字符形態(tài)為分析樣本,確定在圖像中字符特征邊緣區(qū)域的選擇,然后找出每個字符的特征特性,通過大量試驗得出每個字符的特征規(guī)律,最后通過相似性概率統(tǒng)計方法實現(xiàn)字符的識別。
將圖片中的數(shù)字區(qū)域位置鎖定后,還須對區(qū)域內(nèi)的數(shù)字進行識別。該項目使用LSTM+CTC+CNN架構(gòu),通過采用標(biāo)準(zhǔn)CNN模型(去除全連接層)中的卷積層和最大池化層來構(gòu)造卷積層的組件,用于從輸入圖像中提取序列特征表示。在進入網(wǎng)絡(luò)之前,所有的圖像須要縮放到相同的高度,然后從卷積層組件產(chǎn)生的特征圖中提取特征向量序列,這些特征向量序列作為循環(huán)層的輸入。長短時記憶(LSTM)存儲單元存儲過去的上下文,輸入和輸出門允許單元長時間地存儲上下文,單元中的存儲可以被遺忘門清除,擴大存儲的上下文范圍,給訓(xùn)練過程減負,得到更加精確的結(jié)果。轉(zhuǎn)錄采用CTC算法,用于處理序列標(biāo)注問題中的輸入與輸出標(biāo)簽的對齊問題,CTC擴展了標(biāo)簽集合,添加空元素,使用擴展標(biāo)簽集合對序列進行標(biāo)注后,所有可以通過映射函數(shù)轉(zhuǎn)換為真實序列的預(yù)測序列,都是正確的預(yù)測結(jié)果,也就是無需數(shù)據(jù)對齊處理即可得到預(yù)測序列。該方法檢索過程結(jié)合額外的信息,提高搜索的準(zhǔn)確度。
所有模型和算法均是基于TensorFlow/Keras平臺進行有效性驗證,在驗證通過的基礎(chǔ)上基于Python語言架構(gòu)開發(fā)用于實際環(huán)境的應(yīng)用程序。
4 特色與創(chuàng)新
針對發(fā)電企業(yè)關(guān)口計量數(shù)據(jù)采用“非接觸”采集方案,確保網(wǎng)絡(luò)安全的同時屏蔽相關(guān)干擾,獲取準(zhǔn)確表計讀數(shù)。設(shè)計基于Linux內(nèi)核的前置終端作為物聯(lián)網(wǎng)感知節(jié)點采集圖片信號,利用發(fā)電場站信息承載網(wǎng)將信息傳入位于云終端的深度學(xué)習(xí)模型進行識別和處理。
在云端建立基于深度學(xué)習(xí)的字符識別模型,并針對關(guān)口計量表特定字符進行訓(xùn)練,獲得結(jié)果形成結(jié)構(gòu)化數(shù)據(jù)存儲到相關(guān)的云數(shù)據(jù)庫,發(fā)布到生產(chǎn)平臺和相關(guān)終端。貫通生產(chǎn)平臺數(shù)據(jù),深入挖掘關(guān)口計量表相關(guān)經(jīng)營數(shù)據(jù),為實際生產(chǎn)提供決策支撐。
應(yīng)用移動互聯(lián)網(wǎng)小程序輕應(yīng)用,采集和發(fā)布生產(chǎn)一線發(fā)電計量、設(shè)備運維情況,形成扁平化管理體系,為生產(chǎn)事務(wù)安排和現(xiàn)貨電量交易提供決策支撐,開發(fā)運維潛力,提升精細化管理水平。
5 應(yīng)用前景
本文研究的基于深度學(xué)習(xí)的風(fēng)場關(guān)口計量表圖像識別系統(tǒng),識別目標(biāo)準(zhǔn)確率高,對發(fā)電企業(yè)起到挖掘數(shù)據(jù)能效,開發(fā)運維潛力,提升管理質(zhì)量效果具有顯著成效。此套系統(tǒng)也可運用到輻射、極端溫度等危險行業(yè)中所用到的儀表監(jiān)測,對保障人員安全以及穩(wěn)定社會發(fā)展具有巨大作用。
參考文獻
[1]張鼎衢,楊路,宋強,等.一種用于關(guān)口電能計量裝置遠程校驗的多路模擬采集器的研制[J].電測與儀表,2022(9):181-187.
[2]馬學(xué)文.基于圖像識別的指針式工業(yè)儀表遠程抄錄技術(shù)研究[D].西安:西安電子科技大學(xué),2021.
[3]王麗芳.基于圖像處理的數(shù)字儀表字符自動識別研究[J].電子世界,2020(15):60-61.
Research on image recognition system of wind pass meter based on deep learning
Abstract: This research mainly focuses on the image recognition system of wind field pass meter based on deep learning, which is mainly to identify parameters on the pass meter without the need to transform the instrument. Assisted by advanced cloud computing and data analysis, combined with the pass meter to collect data, a set of simple and convenient wechat mini program light application system is developed, with high target identification accuracy and fast image processing time. And does not directly docking with the metering meter, with a complete power production system network security, and through the optical picture collection of information, can shield the electromagnetic interference in the production site, the power generation enterprises to tap data energy efficiency, development of operation and maintenance potential, improve the quality of management effect.
Key words: deep learning gateway; metrology meter; image recognition system