陳舒祥,薛安懿,許 爽,戰(zhàn)國(guó)棟
(1.大連民族大學(xué) a.信息與通信工程學(xué)院;b.設(shè)計(jì)學(xué)院;c. 大連市漢字計(jì)算機(jī)字庫(kù)設(shè)計(jì)技術(shù)創(chuàng)新中心,遼寧 大連 116605)
漢字字體骨架代表字體的結(jié)構(gòu)特征。漢字字體骨架化是將字體圖像由外輪廓起逐漸剝離,得到與原圖結(jié)構(gòu)類似但由單像素線條組成的圖像[1]。目前,利用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行字體生成的技術(shù)得到廣泛的應(yīng)用,但參考字體對(duì)于生成效果具有影響如圖1。以宋體作為參考字體生成目標(biāo)字體,因?yàn)槟繕?biāo)字體與參考字體結(jié)構(gòu)差異大,容易產(chǎn)生錯(cuò)誤的結(jié)果。Lei等[2]證明了源字體的結(jié)構(gòu)對(duì)生成結(jié)果影響較大。
圖1 參考字體圖像對(duì)神經(jīng)網(wǎng)絡(luò)生成的影響
因此,本文擬先把字體骨架化,通過(guò)字體骨架相似度對(duì)比尋找與目標(biāo)字體更相近的參考字體,進(jìn)而生成更高質(zhì)量的目標(biāo)字體。
目前字體骨架提取的研究中,主要對(duì)于漢字圖像進(jìn)行細(xì)化處理[3],經(jīng)處理后提取出的骨架能夠表達(dá)字體的結(jié)構(gòu)特征。骨架與原始字體保持了一致的拓?fù)浣Y(jié)構(gòu)。此外,由于書(shū)法字筆劃交叉處存在變形彎曲等情況,利用ZS并行細(xì)化算法[4]在整體上能取得不錯(cuò)的效果,但是在細(xì)節(jié)上比如書(shū)法字骨架上出現(xiàn)的冗余像素及毛刺現(xiàn)象還需要進(jìn)一步完善。
本文在分析書(shū)法字結(jié)構(gòu)特點(diǎn)的基礎(chǔ)上,發(fā)現(xiàn)書(shū)法字的傾斜筆畫(huà)上容易出現(xiàn)冗余像素,也就是斜線區(qū)域易出現(xiàn)細(xì)化不完整的情況,同樣由于書(shū)法字書(shū)寫(xiě)隨意,容易在交叉處產(chǎn)生骨架毛刺如圖2。
圖2 斜線和交叉處冗余示意圖
本文提出一種改進(jìn)的書(shū)法字骨架化算法如圖3。
圖3 本文書(shū)法字骨架化算法流程圖
本文使用斜線冗余像素消除模板對(duì)骨架細(xì)節(jié)進(jìn)行冗余去除如圖4。其中P1代表待檢測(cè)的中心像素點(diǎn),領(lǐng)域中的數(shù)值包括0、1和X,其中X表示該位置可以為任意值。
圖4 斜線冗余像素消除模板
其中消除模板中P1須滿足公式(1)條件。
(1)
公式(1)表明P2和P8須同時(shí)為黑色像素,且P4、P5、P6和P9須同時(shí)為白色像素,此時(shí)存在一條向左下方的斜線如圖4a所示,其中P1是冗余的,可以刪除;類似地,對(duì)于圖4b,4c和4d四個(gè)方向的斜線冗余點(diǎn),添加以下公式(2)~(4)進(jìn)行刪除。
(2)
(3)
(4)
上述4個(gè)條件主要用來(lái)消除圖中斜線區(qū)域的像素冗余。當(dāng)N(P1) = 3時(shí),其中N(P1)為目標(biāo)像素點(diǎn)P1八鄰域中像素值是1的點(diǎn)的數(shù)量,P1表示是分叉點(diǎn)或邊界點(diǎn)中的一種。由于圖像分叉處也會(huì)出現(xiàn)像素冗余的情況,添加了消除模板如圖5。
圖5 消除模板示意圖
其中,P1需要滿足以下條件如式(5):
(5)
其中,第一是P、P4、P6和P8都同時(shí)為白色背景像素,第二是P1、P3、P5和P7中需要有三個(gè)黑色像素,其構(gòu)成了如圖5所示的四個(gè)方向上的分叉情況,此時(shí),P1成為分叉情況中的冗余點(diǎn),需要?jiǎng)h除。
(6)
基于索引表的細(xì)化結(jié)果如圖6。,可以看出由于各個(gè)方向的像素剝離速度不一致,會(huì)導(dǎo)致出現(xiàn)明顯的斷裂以及毛刺情況,在筆畫(huà)端點(diǎn)處還會(huì)出現(xiàn)單個(gè)像素,破壞了原有字體的拓?fù)浣Y(jié)構(gòu)。
圖6 基于索引表的細(xì)化結(jié)果
ZS算法和本文改進(jìn)的ZS算法的實(shí)驗(yàn)結(jié)果對(duì)比如圖7。通過(guò)筆畫(huà)對(duì)交叉處以及斜線區(qū)域的放大圖可以看出,相較傳統(tǒng)的ZS算法,本文改進(jìn)后的算法不僅保證像素寬度為1,還去除了ZS細(xì)化算法中的毛刺及冗余像素,可以充分準(zhǔn)確地保留書(shū)法字的拓?fù)浣Y(jié)構(gòu)特征。
圖7 本文改進(jìn)算法細(xì)化結(jié)果
在書(shū)法字體設(shè)計(jì)中,存在字體的中心線,中心線即指書(shū)法字體的簡(jiǎn)化版本,而骨架與書(shū)法字中心線非常近似,其可以代表書(shū)法字體整體結(jié)構(gòu)特征和拓?fù)湫畔?。本文中,利用不變矩以及皮爾遜相關(guān)系數(shù)度量幾種書(shū)法字骨架之間的相似程度,利用計(jì)算得出的相似度作為書(shū)法字之間的相似度評(píng)分。
對(duì)書(shū)法圖像骨架的提取算法,本文在嘗試多種骨架化方法后提出了改進(jìn)的ZS骨架提取算法,該算法經(jīng)前文論證可以證明其能夠較好的保留書(shū)法字體的形體特征,同時(shí)在處理時(shí)能消除筆畫(huà)毛刺和冗余點(diǎn),保護(hù)了筆畫(huà)端點(diǎn)及交叉點(diǎn)的筆形信息,不會(huì)造成由于細(xì)化而產(chǎn)生的筆畫(huà)斷裂,使用該方法提取出的骨架能夠較好地完成本文后續(xù)的書(shū)法字體相似度計(jì)算。
矩是用來(lái)量化描述圖像特征的算子[5],其定義為圖像像素強(qiáng)度的加權(quán)平均值,對(duì)所有像素的總和進(jìn)行計(jì)算,也就是說(shuō)像素的強(qiáng)度的權(quán)重與它們所處的圖像的位置無(wú)關(guān)。一幅圖像的Hu矩能夠表示一幅圖像的全局性結(jié)構(gòu)特征,它的值相對(duì)穩(wěn)定,在平移、旋轉(zhuǎn)和尺度變換之后仍舊保持著相對(duì)不變性,因此,不變矩在計(jì)算機(jī)視覺(jué)、目標(biāo)識(shí)別等等領(lǐng)域被廣泛運(yùn)用。因此,Hu矩能夠表達(dá)書(shū)法字骨架的結(jié)構(gòu)特征。
在提取圖像Hu矩時(shí),首先要將圖像進(jìn)行二值化處理,假設(shè)處理完的圖像為pic(x,y),它的p+q階原點(diǎn)矩可以作如下式(7)表示[6]:
(7)
那么,連續(xù)函數(shù)pic(x,y)的p+q階矩陣的離散形式為式(8):
(8)
上述公式求得的矩的值是唯一的,所以能夠反映書(shū)法字骨架圖像的拓?fù)湫螤钐卣鳌?/p>
圖像的中心位置可以由公式(9)計(jì)算出:
(9)
求中心矩陣的公式為(10):
(10)
(11)
由中心矩以及普通矩的公式,可以推導(dǎo)出不變矩組如式(12):
(12)
Hu矩為普通矩和中心距變化而成,所以有平移,旋轉(zhuǎn),縮放不變性,因此本文用其描述骨架形狀特征[7]。
提取書(shū)法字骨架圖像的Hu矩后,計(jì)算書(shū)法字骨架之間的相似度就變成了計(jì)算Hu矩之間的相似程度。皮爾遜相關(guān)系數(shù)提供了對(duì)變量的取值范圍不同的處理步驟,相比歐幾里得更加復(fù)雜,結(jié)果更加精確[8],本文采用皮爾遜相關(guān)系數(shù)計(jì)算書(shū)法字骨架之間不變矩的相關(guān)程度,用以測(cè)試兩個(gè)書(shū)法字骨架之間的相似程度。
皮爾遜相關(guān)系數(shù)輸出的范圍在-1到+1之間,0代表不相關(guān),負(fù)數(shù)值代表負(fù)相關(guān),正數(shù)值代表正相關(guān)。在對(duì)兩組數(shù)據(jù)X和Y進(jìn)行相似度計(jì)算時(shí),它們的相關(guān)公式為式(13):
(13)
本文實(shí)驗(yàn)的書(shū)法字骨架相似度對(duì)比見(jiàn)表1。目標(biāo)書(shū)法字骨架提取之后,分別與源字體庫(kù)中楷書(shū)、仿宋、隸書(shū)、行書(shū)、黑體以及宋體六類中同一個(gè)字做骨架九宮格相似度判別,實(shí)驗(yàn)結(jié)果表示,目標(biāo)書(shū)法字與行書(shū)較為類似,與隸書(shū)、仿宋等相差較大。
表1 書(shū)法字骨架相似度評(píng)價(jià)
本文主要為字體風(fēng)格預(yù)配對(duì)網(wǎng)絡(luò)設(shè)計(jì)解決方案,研究算法并實(shí)現(xiàn)。主要分為兩部分:一是分析了幾種常用的細(xì)化算法,并提出一種基于ZS細(xì)化算法的改進(jìn)算法進(jìn)行書(shū)法字骨架化實(shí)驗(yàn),使用這種方法處理得到的書(shū)法字圖像一方面減少了冗余像素點(diǎn),一方面在筆畫(huà)相交處無(wú)斷點(diǎn)情況,整體骨架連通性好,毛刺少,能夠較好保留書(shū)法字的拓?fù)浣Y(jié)構(gòu)信息,并且提取出的骨架大致位于書(shū)法字圖像中心線上;二是將書(shū)法字采用九宮格方法分割后,利用不變矩和皮爾遜相關(guān)系數(shù)計(jì)算兩個(gè)書(shū)法字之間的相似度,對(duì)其進(jìn)行評(píng)分。
大連民族大學(xué)學(xué)報(bào)2022年5期