楊澤昊,閆 宇,戰(zhàn)國棟
(大連民族大學(xué) a.計算機科學(xué)與工程學(xué)院;b.設(shè)計學(xué)院;c.大連市漢字計算機字庫設(shè)計技術(shù)創(chuàng)新中心,遼寧 大連116605)
水印嵌入到載體圖像后,圖像中的特殊信息以可見的形式顯示出來,即稱為可見水印,這主要應(yīng)用于版權(quán)維護(hù)和紀(jì)念留影[1]。 在某些場景下需要逆向恢復(fù)原圖像。
去除水印的前提是鎖定文本水印區(qū)域,文本作為語言的物理化身,是保存和交流信息的基本工具之一。傳統(tǒng)上,文本識別一直專注于文檔圖像,其中OCR技術(shù)非常適合數(shù)字化平面紙質(zhì)文檔。當(dāng)應(yīng)用于自然場景圖像時,這些OCR技術(shù)效果會變差,甚至失敗,因為它們被調(diào)整為黑白色差、基于行的打印文檔環(huán)境。自然場景圖像中出現(xiàn)的文本在外觀和布局上變化很大,從大量字體與樣式中提取,受到不同光照、遮擋、方向、噪聲的影響。此外,背景對象的存在會導(dǎo)致虛假誤報檢測,這使得自然圖像文本定位更具有挑戰(zhàn)性。
去除水印算法的相關(guān)研究中。Lin等[2]提出一種子采樣技術(shù)自適應(yīng)去除水印,維持圖像質(zhì)量。Zhang等[3]提出了一種加密圖像的可逆方案,此方案利用逐位異或運算對原始圖像加密,并修改了對應(yīng)二進(jìn)制標(biāo)志的部分嵌入可見水印。Weng等[4]提出一種基于動態(tài)圖像同時保持上下文聯(lián)系的水印方案,隱藏信息不同位置提取方法和恢復(fù)方式各不相同。Chen等[5]提出差分?jǐn)U展的可逆宿主圖像的水印方案。利用深度學(xué)習(xí)去除水印的方法主要利用信號重建去除水印圖像。Lehtinen等[6]提出一種無需損壞統(tǒng)計似然模型或圖像先驗的模型,該模型從訓(xùn)練數(shù)據(jù)間接學(xué)習(xí)的方案。深度學(xué)習(xí)運算周期長,需要大量標(biāo)注性數(shù)據(jù)集。
本文提出一種端到端的混雜文本型自然圖像可見水印去除方法,該方法依靠文字區(qū)域檢測結(jié)合色差值,鎖定水印確切位置,再利用快速推進(jìn)算法消除水印,達(dá)到在多樣本條件下的精細(xì)化去除。
本次數(shù)據(jù)集主要采自中國少數(shù)民族藝術(shù)平臺的文物圖像,共有22 379張圖像,劃分為17類,特征歸屬于自然圖像。它們不僅具備自然圖像背景復(fù)雜,顏色與布局差異大的特點,還集中體現(xiàn)了水印文字與內(nèi)容文字混雜的特殊問題。此類圖文混雜的自然圖像,無論是傳統(tǒng)方法還是新興的深度學(xué)習(xí)方法,都很難有效處理非水印文字區(qū)域內(nèi)容,容易造成誤刪,去水印錯誤示例如圖1。
a)水印圖像 b)錯誤去除圖1 去水印錯誤示例
為解決上述問題,本文提出一種端到端的可見水印去除方法,過程如圖2。
Step 1:通過文字區(qū)域檢測內(nèi)容結(jié)合色差值定位水印區(qū)域;
Step 2:融合快速修補算法去除可見水?。?/p>
Step 3:輸出去除水印圖像。
圖2 去水印流程
尋找水印位置的工作可以視作文字區(qū)域定位,作為數(shù)據(jù)的藝術(shù)圖像多數(shù)是畫作或文物圖像,不僅水印文字是明顯的文本區(qū)域內(nèi)容,字畫書法、雕刻印章、文物刻字等同樣會作為干擾內(nèi)容。
本文融合基于RPM(region proposal mechani-sm)的文字區(qū)域檢測內(nèi)容[7]。利用首部分的region proposal,首先保證較高準(zhǔn)確度,盡量把所有可能的文字區(qū)域檢測出來,然后經(jīng)過一個filtering階段,提升文字檢測的精度。
此步驟為泛化的文本區(qū)域檢測,如果圖像只存在水印文字,則可以很好地定位文本區(qū)域。但由于部分藝術(shù)圖像存在文物文字及相關(guān)的圖形印章,如圖3a。文本區(qū)域定位掩圖a的目標(biāo)塊會出現(xiàn)錯判現(xiàn)象,將其認(rèn)定為水印類文本,從而導(dǎo)致刪除原有圖畫真跡,變?yōu)闆]有文字的文物畫作。這明顯不是我們想要的去除效果,需要繼續(xù)處理掩圖數(shù)據(jù),讓掩圖只保留水印文字。
為進(jìn)一步鎖定水印區(qū)域范圍,我們根據(jù)可見水印的顏色特征進(jìn)行二值化處理,將RGB(120,120,120)至RGB(160,160,160)以外的顏色變成0,生成掩圖3b。最后將3a圖像的目標(biāo)區(qū)域與b圖像的白色區(qū)域進(jìn)行融合,形成掩碼圖像3c。
圖3 掩圖水印區(qū)域定位
根據(jù)本次數(shù)據(jù)集水印特征,去除水印算法需要提供大約為90×38像素寬高的文字掩碼塊。在區(qū)域位置進(jìn)行范圍限制,最終得到希望的文字掩碼圖像,利用此掩碼圖像可以準(zhǔn)確地定位水印文字,避免破壞自然圖像中的文本信息。
在獲得掩圖后,即可利用掩圖來去除水印內(nèi)容。關(guān)于去除水印的具體方法,本文融合了基于快速推進(jìn)法的圖像修復(fù)技術(shù)[8]。其主要考慮圖像中要修復(fù)的區(qū)域,算法從該區(qū)域的邊界開始,然后進(jìn)入?yún)^(qū)域內(nèi),逐漸填充邊界中的所有內(nèi)容。它需要在鄰近像素周圍的一個小鄰域進(jìn)行修復(fù)。該像素由鄰近所有已知像素的歸一化加權(quán)和代替。
因此,選擇權(quán)重是一個重要的因素,對于靠近該點的像素,靠近邊界的法線和位于邊界輪廓上的像素,給予更多的權(quán)重,遠(yuǎn)離此點的則給予更小權(quán)重。一旦像素被修復(fù),它將使用快速行進(jìn)方法移動到下一個最近的像素。算法確保那些靠近已知像素的糟糕部分首先被修復(fù),這就像一個輪替式啟發(fā)器,直到區(qū)域修復(fù)完成。
根據(jù)水印位置定位結(jié)果,獲取掩圖圖像如圖4b。將掩圖與原圖進(jìn)行融合,利用圖像修復(fù)技術(shù),進(jìn)行水印去除。其結(jié)果完美的保留了文物圖像原有的印章刻字,并且對水印文字進(jìn)行模糊化處理,周邊像素色彩幾乎沒有改變。
圖4 水印去除效果
由于水印區(qū)域在右下角,且文物圖像的背景顏色具有一致性,在模糊化進(jìn)程中不會有多余的色塊冗雜,修復(fù)區(qū)域能夠很好的與原背景色融合,看不出修改后的痕跡。在修補方面,快速推進(jìn)法的圖像修復(fù)技術(shù)可以很好的補充缺失,對邊界線上的像素填補給予更多權(quán)重,能夠?qū)⑺∥淖值臍埩艉圹E覆蓋,修復(fù)效果良好,且不會對圖像本身文字內(nèi)容錯誤刪除。
本文采用的數(shù)據(jù)為藝術(shù)文物圖像,屬于混雜文本型自然圖像的典型,且樣本數(shù)量巨大。本文方法主要考慮解決去除水印的重復(fù)性工作,并處理水印文字區(qū)域精確定位問題,消除水印后的圖像分類導(dǎo)入至中國少數(shù)民族藝術(shù)平臺。
目前去除水印的算法有多種多樣,但效果最好的主要是Noise2Noise[6],利用深度學(xué)習(xí)來構(gòu)建網(wǎng)絡(luò)模型,本質(zhì)上還是去噪應(yīng)用,對于混雜文本型自然圖像,文字識別效果不佳,且容易將文物原刻字磨損去除。另外,深度學(xué)習(xí)的網(wǎng)絡(luò)模型側(cè)重于深度和寬度來加強網(wǎng)絡(luò),需要計算的樣本內(nèi)容極大,在缺乏大量標(biāo)注好的樣本時,效果很不理想。對于文物圖像來說,幾乎沒有合適的數(shù)據(jù)集供網(wǎng)絡(luò)學(xué)習(xí),去除大量畫作水印成本太高。若單純使用RPM文本區(qū)域檢測并消除水印,可以有較好地去除效果,色塊融合也較為理想,但文字內(nèi)容處理方面不佳,容易將畫作原刻字消除,造成圖像信息丟失。特別是對于文物圖像,其最高優(yōu)先級應(yīng)該是保留原畫作的真實內(nèi)容。
從定性角度分析,選取各類文物圖像對比去除水印效果如圖5。利用深度學(xué)習(xí)算法Noise2Noise[6]進(jìn)行水印去除,在100次標(biāo)準(zhǔn)化迭代后,仍有較明顯痕跡;單純使用RPM文本區(qū)域檢測并消除水印,雖然能夠很好的定位文本內(nèi)容,但會把不屬于水印的文本內(nèi)容消除;本文的端到端水印去除算法,可以針對文物文字復(fù)雜背景情況,得到較好效果。
a)Noise2Noise算法 b)RPM算法 c)本文算法 圖5 算法水印去除效果對比
本文主要對混雜文本型自然圖像進(jìn)行可見水印去除研究,實現(xiàn)對中國少數(shù)民族藝術(shù)平臺兩萬余張文物圖像進(jìn)行去水印操作,從而擴(kuò)展到更具有普遍性的自然圖像。
首先,融合基于RPM的文字區(qū)域檢測內(nèi)容并進(jìn)行色差區(qū)域定位,確定水印文本掩圖,利用掩碼圖像配合基于快速推進(jìn)法的圖像修復(fù)算法進(jìn)行水印去除,形成一套端到端的可見水印去除流程。結(jié)果分析表明本文的方法具有極高穩(wěn)定性,準(zhǔn)確鎖定水印區(qū)域并進(jìn)行去除,避免誤刪自然圖像所包含的文本內(nèi)容,節(jié)省人工成本,有較好的應(yīng)用價值,提高了去除水印的效率。
最后,利用去除水印較好的結(jié)果圖,與原圖進(jìn)行一對一匹配,可以制作用于深度學(xué)習(xí)網(wǎng)絡(luò)使用的數(shù)據(jù)集,能夠為混雜文本型自然圖像的水印去除增添一份新的學(xué)習(xí)數(shù)據(jù)。雖然本文方法對于各位置水印可以很好識別,但也有部分不足之處。因為利用顏色特征進(jìn)行二值化處理,當(dāng)水印文本與周邊底色高度相似,則無法進(jìn)行高效區(qū)分,會產(chǎn)生模糊效應(yīng),減弱水印去除的效果。