苗智耀 賈翠萍 孫杭雨 李志剛 馮家瑤 梁建賓 張詩薈
(河北北方學院信息科學與工程學院 河北·張家口 075000)
校園卡實現(xiàn)了對學校師生和學校員工日常活動的集中管理,它是一種包括門禁卡、消費卡、多媒體借閱卡等各種功能的卡片。校園卡的使用和普及能給師生帶來很多方便,但是也存在容易丟失、丟失后不易找回的問題,造成了成本的浪費。目前的校園卡丟失招領(lǐng)過程存在系統(tǒng)管理困難、人手動參與環(huán)節(jié)較多等問題。本文通過MATLAB軟件,實現(xiàn)了一種基于OCR算法的校園卡卡號識別方法,主要目標是自動識別卡片中的有效身份信息,并生成文字輸出,以便于實際信息進行對比和驗證。
二十世紀六十年代初期,美國Murray Eden率先提出了一種用于數(shù)字字符識別的識別算法。該算法通過描述由零至九這十個數(shù)字體現(xiàn)的基本特征出發(fā),為此后數(shù)字以及其他字符的識別研究,奠定了十分堅實的基礎(chǔ)。到二十世紀七十年代,Parks等多位研究者提出了一種新的多級結(jié)構(gòu)鏈接識別方法以及對拓撲結(jié)構(gòu)進行特征抽取的辦法,這一方法的提出,在很大程度上提高了數(shù)字字符識別的識別效率和精確率。在我國,專門針對數(shù)字字符識別的研究工作最早開始于20世紀70年代初。最初把十個數(shù)字字符識別的算法應(yīng)用到郵政信函分揀系統(tǒng)之中。在此之后的研究中,來自復(fù)旦大學的研究者們開發(fā)了中國第一臺數(shù)字字符識別的機器,這臺機器能做到十分精確地把標準印刷體數(shù)字字符識別出來。與此同時,中國科學院成功研制出一臺郵政編碼識別樣機,并把樣機應(yīng)用于信件郵政編碼的識別。經(jīng)過多年的研究與成果的積累,目前我國數(shù)字識別領(lǐng)域已經(jīng)取得了很多突破,并在不斷深入中。
本文通過MATLAB強大的圖像數(shù)字處理功能,采用基于OCR技術(shù)的識別算法,在MATLAB強大的計算能力基礎(chǔ)上,通過使用MATLAB提供的數(shù)字圖像處理工具箱,完成了校園卡數(shù)字字符信息的提取和識別過程。
在計算機中,可以將一幅二維圖像定義為一個與之對應(yīng)的二維函數(shù),表示為f(x,y),其中(x,y)是平面坐標系坐標,在任意坐標(x,y)處的幅度,則被定義為該幅圖像在此坐標位置處的對應(yīng)亮度值。由該二維函數(shù)f(x,y)可知,圖像的坐標值和亮度變化之間的關(guān)系表示為f。本文的圖像處理方法是基于數(shù)字圖像的方法,因此,首先要把一幅待處理的字符圖像進行數(shù)字化處理。對模擬圖像進行數(shù)字化處理時,需要將其坐標和幅度均進行數(shù)字化分析。分析和處理的過程中,把坐標值數(shù)字化的過程被稱之為“取樣”,把幅度值數(shù)字化的過程稱之為“量化”。當表示圖像的x、y兩個分量值及幅度值都是有限且離散的量時,稱圖像為數(shù)字圖像。
以下為一種數(shù)字圖像的數(shù)學表達方式。坐標位置(x,y)=(0,0)被定義為圖像坐標原點,圖像中沿Y的下一坐標位置被記為(x,y)=(0,1),因此(x,y)=(0,1),表示為沿Y軸的第2個取樣點。圖1表示為圖像數(shù)字化坐標表達方式。
圖1:圖像數(shù)字化坐標表達方式
根據(jù)圖1表示的坐標系,可以得到數(shù)字圖像的數(shù)學表達方式,如以下公式所示:
光學字符識別技術(shù),即OCR(Optical Character Recognition)技術(shù),始于1929年,由德國科學家Tausheck提出的。到20世紀70年代,我國的研究者開始進行漢字字符識別研究工作,直到1986年“863”高新科技研究計劃的提出把我國的漢字識別研究推向一個更高的領(lǐng)域,經(jīng)過潛心研究,清華大學的丁曉青教授和中科院的研究者們陸續(xù)推出了相關(guān)的中文光學字符識別產(chǎn)品。20世紀90年代,平臺式掃描儀地進入大眾的視野,并被不斷應(yīng)用的生活和生產(chǎn)工作中,使得辦公自動化、高效化、智能化過程不斷提升的同時,也大力推動了光學字符識別技術(shù)地進一步發(fā)展。使OCR的識別正確率、識別速度滿足了廣大用戶的要求。
從工作流程來看,OCR識別技術(shù)的基本過程如圖2所示:
圖2:OCR技術(shù)路線圖
圖像預(yù)處理,在本文中是指對輸入的字符圖像自身成像問題進行預(yù)處理。常見的預(yù)處理過程包括:圖像數(shù)字化、直方圖變換、畸變校正、圖像的幾何變換、圖像增強等。
文字檢測,文字檢測過程即檢測文本內(nèi)容(本文中指數(shù)字字符內(nèi)容)在原始圖像中的布局,以及其所占位置、比例大小等,主要解決要識別的文字在哪里,范圍有多大等問題。
文本識別,即在上一步驟文本檢測的基礎(chǔ)上,對數(shù)字字符內(nèi)容進行進一步分析,這一步驟中,圖像中的文本信息被識別并輸出為最終所需要的文本信息。文字識別主要解決的是每個文字代表什么含義的問題。
2.2.1 圖像預(yù)處理
在圖像預(yù)處理過程中,首先讀取原始卡片圖像并顯示原圖,判斷原始圖像是否為RGB圖像,如果是RGB圖像,將其轉(zhuǎn)換為灰度圖并進行歸一化處理。加入高斯噪聲后,利用graythresh函數(shù)獲取一個閾值,將圖像二值化,以便更清晰的凸顯目標數(shù)字的輪廓。原始卡片圖像如圖3所示。
圖3:卡片身份數(shù)字信息
圖像處理結(jié)果如圖4所示。包括圖像灰度化、加噪、二值化和去噪結(jié)果。
圖4:圖像處理結(jié)果
2.2.2 卡號識別
校園卡卡號識別過程是通過字符分割函數(shù),將卡片上字符進行分割,通過與創(chuàng)建的字符模板進行匹配,獲得匹配的數(shù)字字符,最后將各個匹配結(jié)果進行連接,并輸出為文本。
識別過程如圖5所示。
文本輸出結(jié)果如圖6所示??蓽蚀_識別出卡面上的卡號數(shù)字信息和學號數(shù)字信息,為后續(xù)身份識別提供可靠依據(jù)。
圖5:算法流程圖
圖6:文本輸出結(jié)果
通過基于OCR字符識別技術(shù),將校園卡上的身份信息數(shù)字進行分割和識別后再連接,可以得到有效的校園卡身份識別結(jié)果。該方法為進一步實現(xiàn)校園卡的信息管理、丟失找回過等程提供了基礎(chǔ),使得校園卡的使用過程更加方便、安全。