梁林森
?
復(fù)雜背景下電力客戶證件識別關(guān)鍵技術(shù)的研究與實現(xiàn)
梁林森
(廣州供電局信息中心,廣東 廣州 510200)
當(dāng)今社會是信息化時代,很多企業(yè)都在運用證件識別技術(shù),自動化錄入證件信息,這樣不僅可以降低人力成本,還可以提高客戶辦理業(yè)務(wù)的效率。證件識別關(guān)鍵技術(shù)的實現(xiàn)主要是基于光學(xué)字符識別技術(shù),識別過程比較煩瑣,包括多種技術(shù),在此背景下電力公司研究并實現(xiàn)了電力客戶證件識別的關(guān)鍵技術(shù),優(yōu)化電力客戶的檔案管理渠道,為電力客戶提供更好的服務(wù),并提高對于營銷業(yè)務(wù),特別是人工錄入客戶信息的風(fēng)險控制能力。主要介紹了在光學(xué)字符識別技術(shù)下如何研究電力客戶證件識別的關(guān)鍵技術(shù),簡述了實現(xiàn)電力客戶證件識別關(guān)鍵技術(shù)后的現(xiàn)實作用。
電力客戶;證件識別;光學(xué)字符識別;OCR
證件是一種具有法律效力的、可以證明身份的證書和資格證明文件,證件對我們的生活所起的作用很大,比如企業(yè)的營業(yè)執(zhí)照可證明企業(yè)具有從事某種活動的資格,身份證可以證明個人身份,駕駛證可以證明持有人具有駕駛車輛的資格等。隨著信息化時代的到來和計算機與互聯(lián)網(wǎng)技術(shù)不斷發(fā)展,證件識別技術(shù)逐漸被研究與實現(xiàn),自動化識別客戶證件不僅可以節(jié)約人力,還可以縮短客戶辦理業(yè)務(wù)的時間,提高運營效率。提供優(yōu)質(zhì)服務(wù)是電力公司生存、發(fā)展的必要條件,為電力客戶提供服務(wù)的優(yōu)劣可以直接影響到客戶對公司的滿意度和社會贊譽度,電力公司必須緊隨時代潮流,運用先進(jìn)技術(shù)為電力客戶提供最好的服務(wù),滿足客戶的多種樣需求。因此,電力公司在此復(fù)雜背景下研究與實現(xiàn)證件識別技術(shù),對電力客戶證件上的文字信息進(jìn)行識別,自動化錄入、校驗、歸檔電力客戶的信息,實現(xiàn)客戶電子化檔案管理的精益化與高效化。證件識別關(guān)鍵技術(shù)是光學(xué)字符識別技術(shù)(OCR),OCR技術(shù)在很多行業(yè)已經(jīng)被應(yīng)用,比如銀行、海關(guān)、車管所等。證件識別技術(shù)與傳統(tǒng)的人工錄入方式有很大差別,可以提高證件信息錄入的速度和準(zhǔn)確率。
光學(xué)識別技術(shù)是20世紀(jì)60年代出現(xiàn)的,經(jīng)過不斷發(fā)展,已經(jīng)有了印刷體OCR識別技術(shù),可以識別多種字體,比如宋體、楷體、黑體等,并且還可以對不同字號的字體進(jìn)行排版,目前已經(jīng)被廣泛應(yīng)用在圖書館、新聞、出版社等行業(yè)。除此之外,還有專業(yè)型的OCR技術(shù),在銀行、海關(guān)、郵政等每天需要處理很多證件信息的行業(yè)被廣泛應(yīng)用。光學(xué)字符技術(shù)是一項很強的專業(yè)技術(shù),包括證件圖像的預(yù)處理、文字區(qū)域檢測、字符切割、字符識別四個過程,這項技術(shù)需要大量資金支持。
證件包括身份證、銀行卡、產(chǎn)權(quán)證明、戶口本、駕駛證、行駛證等,是記錄個人信息的重要憑證,可以證明持有人信息,也可以為群眾生活提供便利,保護(hù)群眾的合法權(quán)益。電力公司研究電力客戶證件識別關(guān)鍵技術(shù)基于光學(xué)字符識別技術(shù),讀取二代身份證上的個人信息資料,再通過計算機技術(shù)將信息傳輸至計算機,這樣可以大大提高電力客戶證件信息錄入的準(zhǔn)確度、及時性和安全性,為快速登記電力客戶信息提供便利。研究電力客戶證件識別關(guān)鍵技術(shù)過程包括客戶證件信息的預(yù)處理、證件上的文字區(qū)域檢測、字符切割及字符識別,流程如圖1所示。
圖1 流程圖
電力客戶證件識別關(guān)鍵技術(shù)的首要步驟是客戶證件信息的預(yù)處理,預(yù)處理技術(shù)主要有灰度化、二值化、膨脹與腐蝕等技術(shù),主要是利用圖像處理技術(shù)獲取所需要的客戶的特征信息,提升圖像的質(zhì)量,抑制不需要的干擾性的噪聲。預(yù)處理的首要工作就是根據(jù)噪聲的特征對待識別的圖像進(jìn)行去噪處理,由于人工拍攝證件會出現(xiàn)傾斜,因此還需要進(jìn)行傾斜矯正處理。這個步驟會直接影響到是否能夠順利提取目標(biāo)證件所在的區(qū)域,進(jìn)而影響到后續(xù)步驟的進(jìn)行。
客戶證件信息預(yù)處理完成后需要進(jìn)行的是檢測證件上的文字區(qū)域,常見文字區(qū)域檢測方法有紋理特征檢測方法,基于連通區(qū)域的檢測方法,或者兩者結(jié)合起來進(jìn)行文字區(qū)域檢測的方法。證件上的文字具有自身特有的屬性,不同證件文字的筆畫、大小、結(jié)構(gòu)都不一樣,采用基于膨脹算法的版面分析方法實現(xiàn)對每行信息進(jìn)行準(zhǔn)確切割:在進(jìn)行版面分析的時候,采用自底向上的方法比較準(zhǔn)確,適合一些比較復(fù)雜的版面,而由于字符、文本行之間有間隙,從而使各個連通區(qū)域比較瑣碎,這樣就大大地增加了運算量。
以前的版面分析技術(shù)采用“自底向上”的方法,是直接對版面圖像上的黑點進(jìn)行搜索,獲得連通區(qū)域,這種方式容易受噪聲的干擾,運算速度比較慢,并且給后面的連通區(qū)域合并帶來很大的困難。
字符切割是進(jìn)行字符識別的前提,字符切割方法主要有三種:①經(jīng)典方法,即把圖像進(jìn)行切割,把可能的字符切割出來;②基于識別的分割方法,即搜索待識別的圖像以找出可能的字符;③將整個單詞(word)作為整體來識別。
電力客戶證件識別關(guān)鍵技術(shù)的最后一步是字符識別,也是最重要的一步,電力客戶證件信息的字符識別正確率直接影響著整個證件識別技術(shù)系統(tǒng),字符識別方法是基于數(shù)學(xué)理論設(shè)計的,主要方法有特征提取和降維。
特征是用來識別文字的關(guān)鍵信息,每個不同的文字都能通過特征來和其他文字進(jìn)行區(qū)分。對于數(shù)字和英文字母來說,這個特征提取是比較容易的,因為數(shù)字只有10個,英文字母只有52個,都是小字符集。對于漢字來說,特征提取比較困難,因為首先漢字是大字符集,國標(biāo)中光是最常用的,第一級漢字就有3 755個;第二個漢字結(jié)構(gòu)復(fù)雜,形近字多。在確定了使用何種特征后,視情況而定,還有可能要進(jìn)行特征降維,如果特征的維數(shù)過高(特征一般用一個向量表示,維數(shù)即該向量的分量數(shù)),分類器的效率會受到很大的影響,為了提高識別速率,往往就要進(jìn)行降維,這個過程也很重要,既要降低維數(shù),又得使減少維數(shù)后的特征向量還保留足夠的信息量(以區(qū)分不同的文字)。
電力客戶證件識別關(guān)鍵技術(shù)的實現(xiàn)方法是選擇合適的證件圖像預(yù)處理方法、證件文字區(qū)域檢測方法、字符切割方法、字符識別方法、字符匹配方法,自動化錄入電力客戶證件信息。目前,用戶可通過網(wǎng)上營業(yè)廳、微信在線辦理用電業(yè)務(wù),辦理時直接上傳用戶證件照片,系統(tǒng)即可自動提取識別關(guān)鍵信息,解決用電客戶手工錄入體驗不佳的問題,提高業(yè)務(wù)辦理效率。
實現(xiàn)電力客戶證件識別關(guān)鍵技術(shù)可以提升供電營業(yè)服務(wù)水平,完善電力客戶的檔案信息電子化渠道的建設(shè),提高業(yè)務(wù)辦理效率,解決業(yè)務(wù)人員手工錄入客戶信息速度慢、準(zhǔn)確率低的情況,具有方便快捷、準(zhǔn)確率高的優(yōu)勢,提高客戶的滿意程度,減少電力客戶的投訴,提升電力公司的形象。
綜上所述,電力客戶證件識別關(guān)鍵技術(shù)的研究與實現(xiàn)具有快速準(zhǔn)確的優(yōu)勢,讓用戶在線辦理用電業(yè)務(wù)時感受到技術(shù)進(jìn)步帶來的便利,這種技術(shù)可以縮短電力客戶辦理業(yè)務(wù)時間,也可以提高供電局的業(yè)務(wù)辦理效率,減少營業(yè)廳柜臺的壓力,節(jié)約人力成本,創(chuàng)造一個良好的電力經(jīng)營環(huán)境。
[1]李文芳,鄭抗震.基于二代身份證識別技術(shù)的營業(yè)廳深化服務(wù)系統(tǒng):中國,CN103632315A[P].2013-11-29.
[2]楊鈞.面向電力營銷服務(wù)的客戶身份自動識別系統(tǒng)設(shè)計[D].南寧:廣西大學(xué),2011.
2095-6835(2019)07-0070-02
TP391.4
A
10.15913/j.cnki.kjycx.2019.07.070
〔編輯:嚴(yán)麗琴〕