顧紹通
(1. 徐州師范大學 語言研究所,江蘇 徐州 221009;2. 語言科學與神經(jīng)認知工程江蘇省重點實驗室,江蘇 徐州 221009;3. 徐州師范大學 語言科學學院,江蘇 徐州 221009)
上個世紀以來,隨著考古工作的深入開展,陸續(xù)出土了大量的古代珍貴文獻,這些出土文獻中有相當一部分是書寫在龜甲和獸骨上面的,如甲骨文,是我國迄今發(fā)現(xiàn)的最早的一種成熟文字系統(tǒng), 具有極其重要的學術(shù)價值和文化遺產(chǎn)保護價值。甲骨文是書寫在龜甲和獸骨上的文字,由于龜甲和獸骨質(zhì)地本身并非平滑如鏡,又深埋地下經(jīng)歷了幾千年的歲月滄桑,加上發(fā)掘和運輸?shù)奈蹞p,損壞已很嚴重,字形的邊緣已經(jīng)非常模糊,呈現(xiàn)出非常明顯的鋸齒形態(tài)。這樣受污損的字形不利于甲骨文字形的進一步使用[1]。由于字形邊緣已經(jīng)變得非常模糊,對于甲骨文字形的識讀和研究帶來極大不便,因而非常需要對甲骨拓片上的字形進行復(fù)原。目前采用某些圖像處理軟件可以近似恢復(fù)甲骨文字形的原始面貌,但是涉及非常復(fù)雜的手工交互,而且需要具有豐富經(jīng)驗的專業(yè)人員操作,耗時耗力,修復(fù)效果也不如人意。目前已出現(xiàn)多種圖像修復(fù)算法,如偏微分方程方法[2-3]、整體變分方法(Total Variational,TV)[4]、基于曲率的擴散模型(Curvature-driven Diffusion,CDD)[5]、基于高斯卷積核對圖像濾波方法[6]、徑向基函數(shù)方法(Radial Basis Functions,RBF)[7-8]、Mumford-Shah-Euler圖像模型[9],紋理合成的方法[10]、基于數(shù)學形態(tài)學的方法[11]、基于Cahn-Hilliard方程的方法[12]、空間變量高斯尺度混合的方法[13]、機器學習方法[14]、基于小波拉普拉斯變換的方法[15]、基于近鄰像素相關(guān)函數(shù)和邊緣檢測的圖像平滑細化方法[16]等。以上方法均采用圖像處理的方法修復(fù)破損區(qū)域,并沒有分析噪聲區(qū)域的統(tǒng)計特征,而且對于像甲骨拓片這種書寫材料比較特殊、污染原因多樣化以及埋藏時間漫長的字形圖像缺乏針對性,修復(fù)效果也難以如意。
本文針對出土甲骨拓片上字形的特點,采用基于自適應(yīng)閾值和分形幾何(Fractal Geometry)的方法對甲骨拓片上的字形進行計算機輔助復(fù)原。通過對甲骨拓片上高斯噪聲進行Bayes估計,計算噪聲區(qū)域的自適應(yīng)閾值,對噪聲區(qū)域進行填充,進而去除拓片圖像中的噪聲區(qū)域。然后計算拓片上字形圖像邊緣的分形維數(shù),對字形圖像的邊緣進行壓縮變換,平滑字形圖像邊緣因腐蝕所造成的凹凸形態(tài)。
文章其余部分的組織結(jié)構(gòu)如下:第二節(jié)分析了甲骨拓片字形圖像的特征,介紹了基于自適應(yīng)閾值的修復(fù)方法;第三節(jié)敘述了分形幾何以及壓縮變換的原理;第四節(jié)是實驗結(jié)果示例,并對實驗結(jié)果進行了分析;第五節(jié)對全文進行總結(jié)。
甲骨文是契刻在龜和獸骨上的文字,因而字形的筆劃線條具有以下特點[17]:構(gòu)成甲骨文的線條多為直線,且線條瘦勁挺直,兩端尖銳,轉(zhuǎn)折處往往以兩條直線相接成屈折狀。甲骨拓片在地下深埋上千年,由于受到腐蝕、發(fā)掘損壞以及拓片質(zhì)地本身等原因,導(dǎo)致甲骨拓片有許多噪聲點,如圖1、圖2所示。圖3 為經(jīng)過二值化處理的甲骨拓片圖像,圖4是甲骨拓片字形圖像的輪廓圖。甲骨拓片上的噪聲點具有如下特點:(1)噪聲區(qū)域的亮度低于甲骨文字形筆劃的亮度;(2)噪聲區(qū)域呈離散狀態(tài),連通區(qū)域面積較小,區(qū)域面積呈正態(tài)分布。相比之下,甲骨拓片上字形圖像的特征有:(1)分形:甲骨拓片在地下深埋上千年,由于受到腐蝕,甲骨文字形圖像邊緣部分與整體具有相似性,具備分形特征,如圖4所示; (2)筆劃區(qū)域連通性:甲骨文字形的筆劃一般是單連通區(qū)域,個別筆段會出現(xiàn)斷裂;(3)像素值空間的聚斂性:甲骨文字形筆劃的像素亮度較高,而且比較連續(xù),且在某個像素值區(qū)域比較集中。
圖1 《甲骨文合集》559(正面)
圖2 《甲骨文合集》559正之局部放大
圖3 經(jīng)過二值化處理的甲骨拓片圖像
圖4 輪廓圖
(1)
(2)
其中,
標準密度函數(shù)
從而得
(3)
TB(σX)是對T*的一個近似,最大偏差不超過1%。下面來估計式(3)中的參數(shù)。
(4)
(5)
(6)
因此得到數(shù)據(jù)驅(qū)動的、基于子帶的自適應(yīng)閾值:
(7)
這里的閾值公式(7)在MSE意義上是近優(yōu)的,其去噪效果與SURE閾值法相當,但計算量要比SURE閾值法小得多。
甲骨拓片圖像中的噪聲是由于受到腐蝕、發(fā)掘損壞以及拓片質(zhì)地本身等原因產(chǎn)生的,噪聲區(qū)域具有區(qū)域面積小、正態(tài)分布等特點,通過計算自適應(yīng)閾值,將噪聲區(qū)域面積和閾值進行對比,將小于閾值的噪聲區(qū)域視為噪聲,對其進行填充。
分形是20世紀70年代初由Mandelbrot[18]引入的關(guān)于自相似性的一般概念,是描述具有相似結(jié)構(gòu)的幾何形狀的工具,后來發(fā)展成對各種復(fù)雜系統(tǒng)的自相似性進行研究的工具。具有分形特征的表面具有自相似性,n維歐氏空間中的有界集合A, 若A可以表示為其自身Nr個互不覆蓋的子集的并時, 則A是自相似的。此時,A的分形相似維數(shù)D定義為
其中,r是所有坐標方向上的尺度因子,Nr是有界集合A的互不覆蓋的子集個數(shù)。對于圖像而言, 把二維圖像視作一個三維空間中的一個表面(x,y,f(x,y)), 其中f(x,y)為圖像(x,y)位置處的灰度值, 于是圖像灰度的變化情況將反映在該表面的粗糙程度上, 使用不同尺度去度量該表面, 得到的維數(shù)就是圖像的分形維數(shù)。目前已有許多估計其分形維數(shù)的方法, 例如頻域方法[19]、計盒維數(shù)法[20]、數(shù)學形態(tài)學的方法[11]、網(wǎng)格計數(shù)法[21]、差分盒維數(shù)算法(Differential Box Counting,DBC)[22-23]等。其中,差分盒維數(shù)法由于易于計算,性能較好等優(yōu)點,在實際中得到了廣泛的應(yīng)用。
差分盒維數(shù)法的主要思想是:將m×n大小的圖像分割成s×s的子塊,s是介于 1 和m/2之間的一個整數(shù)。令r=s/m, 將圖像視為一個三維空間中的一個表面(x,y,f(x,y)),(x,y)表示像素點的平面位置, 第三維用來表示像素點的灰度值f(x,y)。平面被分割成許多s×s的網(wǎng)格,在每個網(wǎng)格上, 是一列s×s×s的盒子。假設(shè)在圖像的第(i,j)個網(wǎng)格內(nèi)圖像灰度的最高值和最低值分別落在第l個和第k個盒子內(nèi), 則Nr在第(i,j)個網(wǎng)格內(nèi)的分布nr(i,j)為
nr(i,j)=l-k+1
nr(i,j)是覆蓋第(i,j)網(wǎng)格中的圖像所需的盒子數(shù),則覆蓋整個圖像所需的盒子數(shù)Nr為
(i,j)
對于不同的r, 可以得到不同的Nr值, 采用最小二乘法可以擬合出lgNr~lg(1/r)的斜率, 即可得到對應(yīng)的分形維數(shù)值D。
甲骨拓片在地下深埋上千年,由于受到腐蝕,字形邊緣呈現(xiàn)出連綿起伏的鋸齒形狀。甲骨文字形圖像的鋸齒形狀邊緣部分與整體具有相似性,具備分形特征,如圖5所示。
圖5 圖4圖像之局部放大
構(gòu)成甲骨文字形的筆畫多為直線,由于甲骨拓片受到腐蝕,字形圖像邊緣呈現(xiàn)凹凸不平連綿起伏的鋸齒形狀,和海岸線的形狀特征是非常相似的。字形圖像邊緣可以通過分形壓縮變換進行平滑,從而改善甲骨拓片字形圖像邊緣的鋸齒形狀。
在平面歐氏空間中,伸縮變換可以表示為:
上式中,r為伸縮比,r大于1時為伸長變換,r小于1時為壓縮變換。
在字形輪廓上取點P0、P1、P2…Pn,將字形輪廓等分為n個部分。Pil(xil,yil)、Pir(xir,yir)分別為輪廓段PiPi+1(i=0,1,…,n)的左端點和右端點,Pit(xit,yit)、Pib(xib,yib)分別為輪廓段PiPi+1(i=0,1,…,n)的上頂點和下頂點,對于輪廓段PiPi+1上任意一點Pi(xi,yi),有xl≤xi≤xr,yb≤yi≤yt。Pij(xij,yij)、Pij+1(xij+1,yij+1)、Pij+2(xij+2,yij+2)、Pij+3(xij+3,yij+3)、Pij+4(xij+4,yij+4)、Pij+5(xij+5,yij+5)為PiPi+1上的局部極值點。直線L是過PibPit中點且平行于x軸的直線。左端點、右端點、上頂點、下頂點以及局部極值點稱為輪廓的特征點,對這些特征點進行壓縮變換后得到圖6中的虛線部分,這是伸縮比為1/2、1/4時壓縮變換后得到的曲線。可以看出,經(jīng)過壓縮變換后,圖像邊緣趨于平滑。圖6顯示的是L與x軸平行的情況,L與y軸平行時的情況可以仿此。
圖6 字形輪廓的特征點及壓縮變換后的曲線
經(jīng)過統(tǒng)計,甲骨拓片字形圖像邊緣的分形維數(shù)在1.2~1.3之間,設(shè)定分形維數(shù)閾值T,當壓縮變換后的圖像分形維數(shù)小于T時,處理結(jié)束。直線的分形維數(shù)是1,通常,甲骨拓片字形圖像分形維數(shù)閾值設(shè)為1.05即可。
算法步驟如下:
Step1 使用freeman鏈碼對輸入圖像f(x,y)進行輪廓跟蹤。
Step2 在x和y方向上對f(x,y)進行壓縮變換,得到圖像f′(x,y)。
Step3 計算圖像f′(x,y)的分形維數(shù)D,如果D 算法流程圖如圖7所示。 圖7 算法流程圖 我們在Apple Mac Pro工作站上在Windows環(huán)境下,用Visual C++和OpenCV實現(xiàn)了上述所有算法。圖8是經(jīng)過面積閾值處理后的圖像,圖9是分形維數(shù)閾值分別為1.2、1.1、1.05時經(jīng)過壓縮變換后的圖像。可見,圖像經(jīng)過壓縮變換后,圖像邊緣由分形產(chǎn)生的鋸齒狀態(tài)得到了平滑。分形維數(shù)閾值越低,平滑的效果越好,但是同時數(shù)據(jù)運算量也加大。 圖8 面積閾值為10、20、30、40填充后的圖像 圖9 分形維數(shù)閾值分別為1.2、1.1、1.05時經(jīng)過壓縮變換后的圖像 甲骨文是我國迄今發(fā)現(xiàn)的最早的一種成熟文字系統(tǒng),其本身具有極其重要的學術(shù)價值和文化遺產(chǎn)保護價值。如何借助先進的計算機技術(shù)對中國最早的成熟文字——甲骨文進行數(shù)字化,展示以及有效保護和方便使用,具有重要的現(xiàn)實意義。本文分析了甲骨文拓片中噪聲的特點以及字形圖像邊緣的分形特征,提出了一種基于自適應(yīng)面積閾值和分形幾何的甲骨拓片字形圖像復(fù)原方法。通過Bayes風險函數(shù)來估計甲骨拓片上噪聲區(qū)域面積的優(yōu)化閾值,對噪聲區(qū)域進行填充,從而去除拓片中的背景噪聲。采用統(tǒng)計的方法計算甲骨拓片字形圖像邊緣的分形維數(shù),對甲骨拓片字形圖像的邊緣進行基于數(shù)學分形的壓縮變換操作,進而對甲骨拓片上甲骨文字形圖像邊緣進行平滑,改善甲骨文拓片圖像邊緣的鋸齒形態(tài)。實驗結(jié)果顯示,這一方法的圖像修復(fù)效果是比較明顯的。 [1]顧紹通,馬小虎,楊亦鳴.基于字形拓撲結(jié)構(gòu)的甲骨文輸入編碼研究[J].中文信息學報,2008,22(4):123-128. [2]M. Bertalmio, G. Sapiro, V. Caselles, et al. Image inpainting[C]//Proceedings of SIGGRAPH 2000. New Orleans, USA, 2000:417-424. [3]M. Bertalmio, A. L. Bertozzi, G. Sapiro, et al. Navier-stokes, fluid dynamics, and image and video inpainting[C]//Proceedings of the International Conference on Computer Visionand Pattern Recognition, Kauai, HI, 2001, I, 355-362. [4]T. Chan, J. Shen. Mathematical Models for Local Deterministic Inpaintings[P]. TR00-11, Department of Mathematics, University of California-Los Angeles, Los Angeles, Califormia, USA, 2000. [5]T. Chan, J. Shen. Non-Texture Inpainting by Curvature-Driven Diffusions[P]. TR00-35. Department of Mathematics, University of California-Los Angeles, Los Angeles, Califormia, USA, 2000. [6]M. Oliveira, B. Bowen, R. McKenna, et al. Fast digital image inpainting[C]//Proceedings of the Visualization, Imaging, and Image Processing IASTED Conference. Marbella, Spain, 2001:261-266. [7]J. C. Carr, R. K. Beatson, J. B. Cherrie, et al. Reconstruction and representation of 3D objects with radial basis functions[C]//Proceedings of ACM SIGGRAPH 2001, Los Angeles, California, USA, 2001:67-76. [8]J. C. Carr, W. R. Fright. Beatson R K.. Surface interpolation with radial basis functions for medical imaging[J]. IEEE Transactions on Medical Imaging, 1997,16(1):96-107. [9]S. Esedoglu and J. Shen. Digital inpainting based on the Mumford-Shah-Euler image model[J]. Eur. J. Appl. Math., 2002,13(4):353-370. [10]A. Criminisi, P. Perez, K. Toyama. Object removal by exemplar-based inpainting[C]//Proceedings of 2003 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. Madison, Wisconsin, 2003, 2:721-728. [11]M. Elad, J. L. Starck, P. Querre, and D. L. Donoho. Simultaneous cartoon texture image inpaitning using morphological component analysis[J].Appl. Comput. Harmon. Anal., 2005, 19(3):340-358. [12]A. Bertozzi, S. Esedoglu, and A. Gillette. Inpainting of binary image using the Cahn-Hilliard equation[J]. IEEE Transactions on Image Processing, January 2007, 16(1):285-291. [13]J. A. Guerrero-Colón, L. Mancera, and J. Portilla. Image restoration using space-variant Gaussian scale mixture in overcomplete pyramids[J]. IEEE Transactions on Image Processing, January 2008, 17(1):27-41. [14]Philippe Henri Gosselin and Matthieu Cord. Active Learning Methods for Interactive Image Retrieval[J]. IEEE Transactions on Image Processing, July 2008, 17(7):1200-1211. [15]Julia A. Dobrosotskaya and Andrea L. Bertozzi. A Wavelet-Laplace Variational Technique For Image Deconvolution and Inpainting[J]. IEEE Transactions on Image Processing, May, 2008, 17(5):657-663. [16]唐松,郭椿標,鄭南寧.基于文字結(jié)構(gòu)特征的快速平滑細化方法[J].中文信息學報,1990,4(2):49-54. [17]馬小虎,黃文帆,顧紹通,楊亦鳴.甲骨文點陣字形轉(zhuǎn)換為甲骨文輪廓字形的方法[J].語言科學,2004,3(3):3-11. [18]B. B. Mandelbrot. Fractals:Form, Chance and Dimension[M]. San Francisco:W. H. Freeman & Co., 1977. [19]A. P. Pentland. Fractal-Based Description of Natural Scenes[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1984, 6(6):661-674. [20]Chaudhuribb, N. Sarkar, Texture segmentation using fractal dimension[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1995, vol. 17(1):72-77. [21]J. Gangepain, C. Roques-Carmes. Fractal approach to two dimensional and three dimensional surface roughness, Wear, 1986,109(1-4):119-126. [22]N. Sarkar, Chaudhuribb. An efficient differential box-counting approach to compute fractal dimension of image[J]. IEEE Transactions on System Man and Cybernet. 1994, 24(1):115-120. [23]N. Sarkar, Chaudhuribb. An efficient approach to estimate fractal dimension of texture images[J]. Pattern Recognition, 1992, 25(9):1035-1041.4 實驗和分析
5 結(jié)論