許鵬飛
(西北大學(xué) 信息科學(xué)與技術(shù)學(xué)院,陜西 西安 710127)
?
基于Guide-filter的中國書法作品中印章信息的提取*
許鵬飛
(西北大學(xué) 信息科學(xué)與技術(shù)學(xué)院,陜西 西安 710127)
針對中國書法作品中存在的印章信息難以準確提取的問題,提出基于Guide-filter的中國書法作品中印章信息的提取算法。算法充分利用Guide-filter具有較好保持圖像邊緣信息的能力,以及最大限度逼近目標信息的特性,以雙閾值法得到的二值圖像之間的殘差圖像作為Guide-filter的輸入圖像,以原始圖像作為Guide-filter的引導(dǎo)圖像,最終獲得較為準確的印章信息。此外,利用邊緣密度的概念,通過計算提取印章區(qū)域的邊緣密度來對印章提取效果進行客觀性評價。實驗表明:提出算法能夠較好地提取出中國書法作品中的印章信息。
中國書法作品; 印章; Guide-filter; 邊緣密度
近年來,已有眾多中國古代書法大家的大量書法作品進行數(shù)字化,并獲得不同清晰程度的數(shù)字圖像數(shù)據(jù)[1~3],但對印章信息的研究較少。
針對書法作品中印章的研究,目前已有一些在其數(shù)字圖像中對印章信息進行提取與分析的研究成果。例如:Roy等人[4]提出了一種基于廣義Hough變換(GHT)的文本圖像中印章信息的提取與識別算法,該算法結(jié)合光學(xué)字符識別(OCR)技術(shù)對印章中的文本信息進行識別,進而利用GHT檢測圖像中存在的印章信息。婁海濤[5]為進行書畫作品的檢索,提出了一種利用圖像的低層視覺特征自動提取書畫作品中印章圖像的方法。張曉東等人[6]提出了一種基于非線性回歸原理的印章自適應(yīng)特征提取算法,通過相關(guān)分析和顯著性檢驗,給出了相應(yīng)的特征描述。而針對背景較為復(fù)雜的圖像,宋永紅等人[7]提出了一種基于背景密度估計的印章圖像提取算法。曾銳[8]在進行印章圖像矯正的研究中,利用LOG算子檢測出圖像中的印章信息。此外,還有基于Radon變換[9]、圖像分割[10]、圖像語義[11]等方法和理論的印章提取算法。
由于古代書法作品年代久遠,印章存在一定程度的模糊,且圖像背景復(fù)雜,導(dǎo)致傳統(tǒng)算法難以準確提取其印章信息。為此,本文提出一種提出基于Guide-filter的中國書法作品中印章信息的提取算法。算法充分利用Guide-filter具有較好保持圖像邊緣信息的能力,以不同閾值得到的二值圖像之間的殘差圖像作為Guide-filter的輸入圖像,而以原始圖像作為Guide-filter的引導(dǎo)圖像,最終獲得較為準確的印章信息。此外,為更準確地評價不同印章提取算法的性能,本文利用邊緣密度的概念,通過計算提取印章區(qū)域的邊緣密度來對印章提取效果進行客觀性評價。
Guide-filter又稱導(dǎo)向濾波器,它的濾波結(jié)果與引導(dǎo)圖像的內(nèi)容密切相關(guān)。由于引導(dǎo)濾波器具有雙邊濾波器保持邊緣平滑的特點,具有較好的圖像邊緣保持能力。因此,基于Guide-filter的印章提取算法能夠更準確,更完整地提取書法作品中的印章信息。
實質(zhì)上,Guide-filter的處理過程是依據(jù)輸入圖像對引導(dǎo)圖像進行的一種線性變換。例如,輸入圖像Ii,引導(dǎo)圖Ig,按式(1)進行計算
IO(x,y)=akIg(x,y)+bk,?(x,y)∈wk
(1)
式中IO為輸出圖像,ak和bk為線性系數(shù),wk為一個局部窗口,它以像素點 (x,y)為中心,以r為半徑。如果使式(2)的值達到最小,即能使得輸入圖像和輸出結(jié)果之間的差異最小,所以對式(2)進行最小化處理如下
(2)
式中 E為輸出圖像IO與輸入圖像Ii之間的差異值,正則化參數(shù)ε是為防止ak的值過大。當系數(shù)ak和bk分別由式(3)計算得到的數(shù)值時,E的值將達到最小
(3)
(4)
對于除氧器的暫態(tài)過程分析,一個很重要的參數(shù)就是進入除氧器的凝結(jié)水焓ic。為更加接近真實的物理過程,應(yīng)將凝結(jié)水管路分段模擬,同時考慮金屬蓄熱對凝結(jié)水焓值的影響,每段管路都按照凝結(jié)水的實際焓值計算。以下基于低壓加熱器出口溫度逐漸降為熱井水溫,作為整個暫態(tài)過程進入除氧器的凝結(jié)水溫來推導(dǎo):
從Guide-filter的基本理論可以看出,輸入圖像在較大程度上影響濾波的輸出結(jié)果。依據(jù)書法作品中書法字與印章在色彩深淺之間的差異,本文利用雙閾值法提取印章的模板圖像,并將其作為Guide-filter的輸入圖像。較大閾值下得到的二值圖中含有書法字和印章的輪廓,而較小閾值下得到的二值圖中主要含有書法字,二者的差異圖中就含有印章的基本信息,則可以將該差異圖作為Guide-filter的輸入圖像。然后以原始圖像的灰度圖作為Guide-filter的引導(dǎo)圖像,經(jīng)過濾波處理后可以獲得較為完整的印章提取圖。
目前,已有較多的算法可應(yīng)用于印章信息的提取,但是針對不同算法提取結(jié)果的評價主要還是基于視覺觀察,沒有利用或提出相應(yīng)的方法來對不同算法的性能做出客觀評價。為此,本文提出利用邊緣密度的概念來對不同算法提取的印章圖像質(zhì)量進行客觀評價。邊緣密度是一種用以表征圖像中邊緣信息的復(fù)雜程度的度量,能夠在一定程度上反映圖像中各區(qū)域邊緣信息的復(fù)雜度和密集程度。對于提取的印章圖像,如果其區(qū)域邊緣密度較大,表明該提取的印章不連續(xù);如果區(qū)域邊緣密度較小,則表明提取的印章較為完整。
區(qū)域邊緣密度:區(qū)域內(nèi)邊緣像素點的總個數(shù)與該區(qū)域像素點總個數(shù)之比,邊緣密度ρ可定義為
(5)
式中 pij為邊緣圖像中邊緣像素點的像素值,邊緣點pij=1,非邊緣點pij=0,M×N為區(qū)域大小。
對于提取的印章圖像,可利用Canny邊緣檢測算子對其進行邊緣檢測[13],并將檢測出的邊緣信息再通過上述邊緣密度的定義,對其進行計算,得到各區(qū)域的邊緣密度。然后可根據(jù)計算得到的邊緣密度信息對不同算法下提取出的結(jié)果進行對比分析。
為驗證本文算法的有效性,利用一副大小為1 951×1 420的中國古代書法作品圖像作為測試圖像,如圖1所示。圖像中書法字較為清晰,與背景之間差異較大,利用一般的閾值二值化方法或者圖像分割算法即可準確提?。欢渲泻械挠≌滦畔⑾鄬^為模糊,特別是印章的邊緣區(qū)域與背景差異較小,導(dǎo)致傳統(tǒng)算法難以準確提取。
圖1 原始中國書法作品圖像Fig 1 The original image of Chinese calligraphy work
圖2 FCM提取的印章圖及其局部放大圖Fig 2 Seals extracted by FCM and their detailed images
圖3 利用雙閾值法獲得Guide-filter的輸入圖像Fig 3 Input image of Guide-filter obtained by double threshold values method
圖4 基于Guide-filter提取的印章圖及其局部放大圖Fig 4 Seals extracted by Guide-filter and their detailed images
為進一步客觀地評價兩種算法在提取印章信息方面的優(yōu)劣,利用區(qū)域像素數(shù)和區(qū)域邊緣密度來做具體的分析。首先對提取印章圖像進行二值化處理,得到印章的二值圖像,并計算各區(qū)域的像素數(shù);然后,利用Canny邊緣檢測算子檢測出提取印章圖像的邊緣信息,并計算印章區(qū)域的邊緣密度。
印章圖像區(qū)域像素統(tǒng)計曲線圖如圖5所示,較細虛線表示本文算法提取印章的區(qū)域像素點統(tǒng)計結(jié)果(區(qū)域大小為100×100),較粗實線表示FCM提取印章的區(qū)域像素點統(tǒng)計結(jié)果??梢姳疚乃惴ㄌ崛〉挠≌聟^(qū)域像素都高于FCM提取的結(jié)果,這是由于本文算法獲得的印章信息更完整,邊緣信息更為豐富,所以,印章區(qū)域的像素點相對FCM的結(jié)果更多。
印章圖像區(qū)域邊緣密度統(tǒng)計曲線如圖6所示, Guide-filter提取的印章線劃更連續(xù),因此, Guide-filter提取的印章區(qū)域的邊緣密度理論上應(yīng)該相對較小,但從圖6中可以看出,在大部分區(qū)域兩者的邊緣密度大致相同。但由于印章圖像的右上方和右下方的印章提取的效果差異較大,F(xiàn)CM提取的結(jié)果中該區(qū)域含有很少的印章像素,導(dǎo)致某些區(qū)域幾乎不含有邊緣,因此,Guide-filter提取的結(jié)果在這些區(qū)域偏高(圖中標記部分),即曲線的起始部分和結(jié)尾部分,較細虛線明顯高于較粗實線。這并不是表明FCM的提取結(jié)果勝于Guide-filter的提取結(jié)果,而是因為FCM提取的印章在該區(qū)域丟失過多信息。
圖5 區(qū)域像素統(tǒng)計對比Fig 5 Comparison of statistics of pixels in areas
圖6 區(qū)域邊緣密度對比Fig 6 Comparison of edge density in areas
本文針對中國書法作品中的印章信息,提出基于Guide-filter的中國書法作品中印章信息的提取算法。該算法能夠較準確地提取書法圖像中的印章信息,提取的印章信息更完整,線劃更連續(xù)。利用邊緣密度的概念對不同的印章提取算法的性能進行客觀評價,以避免基于視覺評價的主觀性。通過仿真實驗與分析,表明本文提出算法具有更好的性能。
[1] Yao C,Bai X,Shi B,et al.Strokelets:A learned multi-scale representation for scene text recognition[C]∥2014 IEEE Confe-rence on Computer Vision and Pattern Recognition(CVPR),IEEE,2014:4042-4049.
[2] Yi C,Tian Y.Scene text recognition in mobile applications by character descriptor and structure configuration[J].IEEE Tran-sactions on Image Processing,2014,23(7):2972-2982.
[3] 安計勇,高貴閣,史志強,等.一種改進的K均值文本聚類算法[J].傳感器與微系統(tǒng),2015,34(5):130-133.
[4] Roy P P,Pal U,Lladós J.Document seal detection using GHT
and character proximity graphs[J].Pattern Recognition,2011,44(6):1282-1295.
[5] 婁海濤.中國書畫印章圖像的提取與識別[D].北京:北京郵電大學(xué),2008.
[6] 張曉東,陳 鋒,杜 凱.一種印章圖像的自適應(yīng)特征提取算法[J].哈爾濱工業(yè)大學(xué)學(xué)報,2004,36(8):1065-1067.
[7] 宋永紅,龔 晨,張元林.基于背景密度估計的印章圖像提取方法:中國,CN104408721A[P].2015.
[8] 曾 銳.印章特征提取算法研究[D].杭州:浙江大學(xué),2007.
[9] 陳至坤,潘曉娣,王福斌,等.基于Radon變換的圖像輪廓提取方法研究[J].傳感器與微系統(tǒng),2010,29(2):63-65.
[10] 陳 英,楊豐玉,符 祥.基于支持向量機和灰度共生矩陣的紋理圖像分割方法[J].傳感器與微系統(tǒng),2012,31(9):60-63.
[11] 鮑 泓,婁海濤.一種自動提取中國書畫作品中印章圖像的方法[J].計算機科學(xué),2009,36(3):250-252.
[12] 胡佳林,劉波峰,何玉成.基于遺傳算法的Canny邊緣檢測算子在配藥機器人中的應(yīng)用[J].傳感器與微系統(tǒng),2013,32(7):141-143.
Extraction of seals from Chinese calligraphy works based on Guide-filter*
XU Peng-fei
(School of Information Science and Technology,Northwest University,Xi’an 710127,China)
In order to solve the problem that the seals are difficult to extract accurately from the Chinese calligraphy works,an algorithm for extraction of seals based on Guide-filter is proposed.This algorithm makes full use of advantage that Guide-filter can preserve the edges of the images,and can approximate the objects greatly.The residual image between binary images obtained by the double threshold values method is used as the input image of Guide-filter,and the original image as guiding image,finally,accurate seal image can be obtained.Besides,the edge density is used to evaluate the effect of seal extraction objectively.The experiment results show that the proposed algorithm can extract the seals information better.
Chinese calligraphy works; seal; guide-filter; edge density
10.13873/J.1000—9787(2016)12—0125—04
2016—09—19
國家自然科學(xué)基金青年基金資助項目(61502387);陜西省教育廳專項科研計劃資助項目(15JK1748);西北大學(xué)科學(xué)研究基金資助項目(14NW25,14NW27,14NW28)
TP 391
A
1000—9787(2016)12—0125—04
許鵬飛(1987-),男,安徽巢湖人,博士,講師,主要從事數(shù)字圖像處理工作。