徐彤陽(yáng),尹 凱(.山西財(cái)經(jīng)大學(xué)信息管理學(xué)院;2.中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心)
圖像作為一種圖文并茂、形象直觀的信息表現(xiàn)形式,廣泛應(yīng)用于信息傳遞和信息交流,是大數(shù)據(jù)時(shí)代公眾獲取信息的主要來(lái)源。隨著大量非法修改偽造圖像的出現(xiàn),公眾的版權(quán)保護(hù)意識(shí)日益增強(qiáng),在數(shù)字圖書館中圖像資源的版權(quán)保護(hù)也逐漸成為學(xué)者們的研究重點(diǎn)。目前,面對(duì)圖像資源版權(quán)侵權(quán)問(wèn)題,在健全規(guī)章制度、完善法律法規(guī)的前提下,運(yùn)用技術(shù)手段對(duì)數(shù)字圖書館的圖像資源進(jìn)行版權(quán)保護(hù)是最直接有效的方法。
圖像資源版權(quán)主動(dòng)保護(hù)方法的原理是指在圖像作品中嵌入水印或簽名等先驗(yàn)信息,通過(guò)對(duì)這些先驗(yàn)信息進(jìn)行檢測(cè)來(lái)判斷圖像作品是否被修改,以此來(lái)確保圖像作品版權(quán)的完整性(見(jiàn)圖1)。主動(dòng)保護(hù)方法是保護(hù)數(shù)字圖書館圖像資源版權(quán)的有效途徑之一,利用主動(dòng)保護(hù)方法進(jìn)行圖像資源版權(quán)保護(hù)的研究已取得了豐碩的成果。[1-6]
圖1 圖像資源版權(quán)主動(dòng)保護(hù)方法的流程
數(shù)字水印技術(shù)是指通過(guò)特定算法將少量的不容易被人的視覺(jué)所察覺(jué)的標(biāo)識(shí)性信息(即數(shù)字水?。┣度氲綌?shù)字圖書館的圖像作品中,并且是在盡量不影響原始圖像使用價(jià)值的前提下。當(dāng)需要對(duì)圖像作品進(jìn)行版權(quán)認(rèn)證時(shí),利用相應(yīng)的算法提取待測(cè)圖像中的數(shù)字水印,通過(guò)對(duì)這些數(shù)字水印進(jìn)行檢測(cè),可以達(dá)到獲取圖像內(nèi)容的原始信息和檢驗(yàn)圖像是否被修改等目的。[7]數(shù)字簽名技術(shù)是指通過(guò)對(duì)比從原始圖像作品和待檢測(cè)圖像作品中提取出來(lái)的、與內(nèi)容相關(guān)的摘要信息來(lái)確定圖像作品版權(quán)的完整性。對(duì)兩個(gè)摘要信息進(jìn)行對(duì)比,若摘要信息一致,則接收的圖像作品版權(quán)完整,否則,說(shuō)明圖像版權(quán)遭到侵犯。[8]
可見(jiàn),主動(dòng)保護(hù)方法可以有效確保數(shù)字圖書館圖像資源版權(quán)的完整性,但也存在一定的局限性。一方面,主動(dòng)保護(hù)方法需要事先在圖像中嵌入標(biāo)識(shí)信息,事后對(duì)這些信息進(jìn)行取證。但實(shí)際上,現(xiàn)有的絕大多數(shù)圖像資源并沒(méi)有被事先嵌入標(biāo)識(shí)性信息,這就導(dǎo)致該方法不能被廣泛的應(yīng)用。另一方面,在圖像資源中嵌入標(biāo)識(shí)性信息可能會(huì)影響圖像質(zhì)量,這在數(shù)字圖書館中某些對(duì)圖像質(zhì)量要求很高的領(lǐng)域是不能被接受的。因此,主動(dòng)保護(hù)方法還不能完全滿足數(shù)字圖書館圖像資源版權(quán)保護(hù)的需求。
針對(duì)主動(dòng)保護(hù)方法在圖像資源版權(quán)保護(hù)方面的局限性,本文利用被動(dòng)保護(hù)方法對(duì)數(shù)字圖書館中沒(méi)有被嵌入先驗(yàn)信息的圖像作品的真實(shí)性進(jìn)行檢測(cè)。若被檢測(cè)的圖像作品的真實(shí)性被破壞,則表明該圖像作品的版權(quán)遭到侵犯;反之,該圖像版權(quán)沒(méi)有遭到破壞。被動(dòng)保護(hù)方法是指在待測(cè)圖像作品沒(méi)有被嵌入標(biāo)識(shí)性信息的情況下,利用圖像作品本身的特征變化,對(duì)其內(nèi)容的真實(shí)性進(jìn)行檢測(cè),從而對(duì)圖像作品的版權(quán)進(jìn)行認(rèn)證和保護(hù)的一種方法。當(dāng)檢測(cè)人員對(duì)圖像作品的真實(shí)性進(jìn)行檢測(cè)時(shí),只能從圖像本身入手,沒(méi)有與圖像相關(guān)的任何原始信息。圖像資源版權(quán)的被動(dòng)保護(hù)方法的流程見(jiàn)圖2。
圖2 圖像資源版權(quán)被動(dòng)保護(hù)方法的流程
數(shù)字圖書館中被修改的圖像作品經(jīng)過(guò)了特定的后期處理,雖在大多數(shù)情況下無(wú)法被視覺(jué)感知,但會(huì)導(dǎo)致圖像本身的特征發(fā)生變化。檢測(cè)人員可以利用這個(gè)特點(diǎn)來(lái)檢測(cè)圖像作品的真實(shí)性,對(duì)其版權(quán)進(jìn)行認(rèn)證和保護(hù)。圖像作品的被動(dòng)保護(hù)方法主要有三種:基于圖像作品偽造過(guò)程遺留痕跡的檢測(cè)、基于圖像作品內(nèi)在統(tǒng)計(jì)特性的檢測(cè)和基于圖像作品成像設(shè)備一致性的檢測(cè)。[9]其中,應(yīng)用最廣的是基于圖像作品偽造過(guò)程遺留痕跡的檢測(cè),這也是本文的研究重點(diǎn)?;趫D像作品偽造過(guò)程遺留痕跡的檢測(cè)是指通過(guò)對(duì)修改后的圖像作品的特征進(jìn)行分析,找出并分析修改操作在圖像作品中遺留的修改痕跡,從而對(duì)其真實(shí)性進(jìn)行檢測(cè)。不同的修改手段會(huì)產(chǎn)生不同的遺留痕跡,盡管這些遺留痕跡不易被察覺(jué),但可以利用計(jì)算機(jī)技術(shù)來(lái)進(jìn)行分析,從而判斷出圖像作品受到的修改類型,甚至可以對(duì)修改區(qū)域進(jìn)行定位與修復(fù)。
目前,修改遺留痕跡檢測(cè)方法主要包括:復(fù)制-粘貼檢測(cè)、模糊檢測(cè)、重采樣檢測(cè)和JPEG雙重壓縮檢測(cè)等。[10]
(1)復(fù)制-粘貼檢測(cè)。復(fù)制-粘貼是在圖像作品修改操作中應(yīng)用最為廣泛而有效的手段之一,它將圖像作品中的某一區(qū)域復(fù)制出來(lái),粘貼到同一副圖或其他圖像中的某一特定區(qū)域,從而達(dá)到偽造源圖像中沒(méi)有的情景或隱藏源圖像中重要對(duì)象的目的。根據(jù)粘貼區(qū)域的來(lái)源,復(fù)制-粘貼檢測(cè)可分為同幅圖像作品的復(fù)制-粘貼修改和異幅圖像作品的復(fù)制-粘貼修改兩類。① 同幅圖像作品在色彩度和亮度等方面相對(duì)一致,變化比較平滑,圖像的局部塊與整體圖像的相容性較高,因此在同幅圖像中進(jìn)行復(fù)制-粘貼修改操作時(shí)不會(huì)讓人產(chǎn)生顯著的視覺(jué)差異,它是數(shù)字圖書館中最為常見(jiàn)的一種圖像修改手段。對(duì)同幅圖像作品進(jìn)行復(fù)制-粘貼操作后,圖像中會(huì)出現(xiàn)相似程度極高的不同區(qū)域塊,學(xué)者們根據(jù)這一特點(diǎn)提出了一些檢測(cè)方法。② 異幅圖像作品的復(fù)制-粘貼修改操作在圖像的色彩度和亮度等方面的變化比較大,在修改區(qū)域的邊緣往往會(huì)形成容易被察覺(jué)的痕跡。為了削弱甚至消除這種不同圖像結(jié)合邊緣的不連續(xù)程度,往往會(huì)在后期處理上對(duì)其進(jìn)行羽化、模糊等潤(rùn)飾操作。與同幅圖像作品的復(fù)制-粘貼修改操作相比,異幅圖像的修改往往將多種修改操作結(jié)合使用,這就使得圖像作品的真實(shí)性檢測(cè)問(wèn)題更加復(fù)雜。因此,雖然異幅圖像作品的復(fù)制-粘貼操作在圖像修改中也非常多見(jiàn),但目前學(xué)者們對(duì)這方面的研究還處在初步探索階段。
(2)模糊檢測(cè)。模糊操作是數(shù)字圖書館中圖像作品在修改后期最為常見(jiàn)而有效的一種潤(rùn)飾手段,目的是為了讓修改區(qū)域與原始圖像更好地融為一體。[11]經(jīng)過(guò)復(fù)制-粘貼修改操作的圖像會(huì)在修改區(qū)域存在視覺(jué)差異,特別是異幅圖像作品的復(fù)制-粘貼修改,為了淡化和去除在修改區(qū)域與原始圖像之間的視覺(jué)上斷層,往往會(huì)采用模糊操作進(jìn)行后期處理,掩蓋修改痕跡,從而獲得無(wú)縫的偽造圖像。模糊操作主要是對(duì)偽造圖像作品修改區(qū)域的像素值進(jìn)行平均,使修改后的圖像作品的修改區(qū)域與原始圖像更好地融合在一起。因此,檢測(cè)模糊操作痕跡能為圖像作品的真實(shí)性檢測(cè)提供有力的憑據(jù)。
(3)重采樣檢測(cè)。圖像作品在進(jìn)行過(guò)復(fù)制-粘貼修改操作后,為了消除修改痕跡,通常需要對(duì)偽造部分做幾何變換,如縮放、旋轉(zhuǎn)等。這樣的操作會(huì)對(duì)圖像進(jìn)行重采樣,并且會(huì)在偽造后的圖像作品中留下重采樣的痕跡,經(jīng)重采樣后的偽造圖像的修改區(qū)域塊的像素與其周圍原始圖像的像素之間會(huì)產(chǎn)生特殊的相關(guān)性。[12]因此,可以檢測(cè)圖像作品是否存在重采樣痕跡,進(jìn)而檢測(cè)圖像作品的真實(shí)性。但是在某些情況下,圖像作品的幾何變換操作被認(rèn)為是必要的,所以僅僅根據(jù)圖像的重采樣痕跡的檢測(cè)結(jié)果并不能說(shuō)明圖像作品被偽造過(guò),重采樣檢測(cè)方法只能作為一種輔助手段。
(4)JPEG雙重壓縮檢測(cè)。JPEG格式是數(shù)字圖書館存儲(chǔ)數(shù)字圖像時(shí)最為推薦和適用的格式,它只需要較少的存儲(chǔ)空間,就可獲得形象生動(dòng)的圖像,而且支持所有主要計(jì)算機(jī)平臺(tái)和Web瀏覽器,十分適合網(wǎng)上傳輸。JPEG格式的圖像作品在經(jīng)過(guò)偽造后需要重新保存,那么圖像作品就經(jīng)過(guò)了雙重JPEG壓縮。雙重JPEG壓縮具有某些一次JPEG壓縮所不具備的特征,可以通過(guò)檢測(cè)這些獨(dú)有的特性來(lái)確定圖像作品是否遭受雙重JPEG壓縮,進(jìn)而判斷圖像作品的真實(shí)性。需要注意的是,經(jīng)過(guò)了雙重壓縮并不能絕對(duì)說(shuō)明圖像作品被偽造過(guò),因?yàn)樵诤芏嗲闆r下為了節(jié)省存儲(chǔ)空間或者重新保存,都會(huì)經(jīng)過(guò)重壓縮操作。因此,在圖像真實(shí)性檢測(cè)過(guò)程中,JPEG雙重壓縮不能直接作為圖像偽造的依據(jù),只能作為一種輔助手段。
本文嘗試?yán)帽粍?dòng)保護(hù)方法對(duì)圖像作品的真實(shí)性進(jìn)行檢測(cè),彌補(bǔ)主動(dòng)保護(hù)方法在數(shù)字圖書館圖像資源版權(quán)保護(hù)方面的缺陷,從另一角度對(duì)數(shù)字圖書館圖像作品的版權(quán)進(jìn)行認(rèn)證和保護(hù)。本文對(duì)偽造圖像(經(jīng)過(guò)異幅圖像的復(fù)制-粘貼修改操作,再經(jīng)過(guò)模糊潤(rùn)飾操作處理后的圖像作品)進(jìn)行研究,利用一種模糊檢測(cè)方法對(duì)圖像作品真實(shí)性進(jìn)行檢測(cè),并對(duì)修改區(qū)域進(jìn)行定位(見(jiàn)圖3)。
圖3 圖像作品真實(shí)性檢測(cè)流程
劃分子塊是指對(duì)二次模糊操作的兩幅圖像分別實(shí)施位置對(duì)應(yīng)、大小相等的子塊劃分,并采用相應(yīng)的算法提取圖像子塊中的特征,進(jìn)行統(tǒng)計(jì)分析,判斷其是否經(jīng)過(guò)相應(yīng)的修改操作。需要注意的是,圖像子塊劃分的大小會(huì)影響最后修改區(qū)域定位的精度。圖像子塊劃分得過(guò)小,子塊中包含的反映修改操作特性的信息就會(huì)較少,可能導(dǎo)致在圖像子塊中提取的特征不能真實(shí)反映圖像修改操作的特性,產(chǎn)生誤判;圖像子塊劃分得過(guò)大,雖然可以包含更多信息,但會(huì)導(dǎo)致修改區(qū)域的定位結(jié)果不夠精確,特別是修改區(qū)域邊緣的圖像子塊,它們可能既包含部分修改區(qū)域也包含部分非修改區(qū)域。因此,圖像子塊劃分的大小是影響最后修改區(qū)域定位精度的關(guān)鍵。
本文基于二次模糊相關(guān)性的方法對(duì)經(jīng)過(guò)模糊處理的偽造圖像進(jìn)行真實(shí)性檢測(cè)。[13]二次模糊相關(guān)性方法的主要原理是偽造圖像的二次模糊操作前后圖像修改區(qū)域相關(guān)性要大于背景區(qū)域相關(guān)性,即可以對(duì)比不同區(qū)域?qū)?yīng)圖像子塊之間的相關(guān)系數(shù)來(lái)對(duì)偽造圖像的模糊修改區(qū)域進(jìn)行檢測(cè)和定位,從而對(duì)圖像的真實(shí)性進(jìn)行檢測(cè)。
基于二次模糊相關(guān)性的方法對(duì)模糊處理后的偽造圖像進(jìn)行二次模糊操作,具體公式為
其中,s(x,y)表示經(jīng)過(guò)模糊處理的偽造圖像,f(x,y)表示二次模糊函數(shù),h(x,y)表示經(jīng)過(guò)二次模糊處理后的偽造圖像。接下來(lái),對(duì) s(x,y) 和 h(x,y) 分別進(jìn)行位置對(duì)應(yīng)、大小相等的子塊劃分,得到smn(x,y) 和 hmn(x,y),運(yùn)算 smn(x,y) 和 hmn(x,y) 得到(i,j) 和(i,j)。二次模糊處理前后的圖像的對(duì)應(yīng)位置子塊之間的相關(guān)性可描述為
其中,ρmn為二次模糊處理前后的圖像對(duì)應(yīng)位置子塊之間相關(guān)性的相關(guān)系數(shù)。依照上述步驟,依次將所有對(duì)應(yīng)位置子塊的(i,j) 和(i,j) 帶入式 (2),則可計(jì)算出圖像所有對(duì)應(yīng)位置子塊之間的相關(guān)系數(shù)。
在計(jì)算出二次模糊處理前后的圖像中所有對(duì)應(yīng)位置子塊之間的相關(guān)系數(shù)后,基于二次模糊相關(guān)性方法就可以根據(jù)相關(guān)系數(shù)對(duì)偽造圖像的修改區(qū)域進(jìn)行檢測(cè),進(jìn)而實(shí)現(xiàn)對(duì)圖像真實(shí)性的檢測(cè)。偽造圖像修改區(qū)域的定位是指在已經(jīng)確認(rèn)圖像作品經(jīng)過(guò)修改偽造處理的情況下,通過(guò)相應(yīng)的算法來(lái)實(shí)現(xiàn)對(duì)修改區(qū)域的定位。在本文的實(shí)驗(yàn)中,根據(jù)圖像對(duì)應(yīng)子塊之間的相關(guān)系數(shù)對(duì)圖像子塊進(jìn)行定位標(biāo)識(shí),在所有子塊相關(guān)系數(shù)計(jì)算完成后,就可以在定位結(jié)果圖中看到對(duì)修改區(qū)域的標(biāo)識(shí)。
實(shí)驗(yàn)的操作軟件為Matlab2015B和Photoshop。本文選取了三組經(jīng)過(guò)Photoshop模糊操作處理后的偽造圖像為實(shí)驗(yàn)對(duì)象,大小為256x256,(a)組、(b)組為源圖像,(c)組是經(jīng)過(guò)模糊處理的偽造圖像(見(jiàn)圖4)。本文選用高斯模糊作為二次模糊方式。通過(guò)大量試驗(yàn),發(fā)現(xiàn)將劃分的子塊大小設(shè)置為8較為合適。實(shí)驗(yàn)按照?qǐng)D3所示流程進(jìn)行,將(a)組圖像中的一部分復(fù)制-粘貼到(b)組圖像中的特定區(qū)域,對(duì)修改區(qū)域進(jìn)行模糊操作得到(c)組圖像,則(c)組就是經(jīng)過(guò)模糊操作處理后的偽造圖像;對(duì)(c)組圖像進(jìn)行高斯模糊操作得到(d)組圖像,則(d)組就是經(jīng)過(guò)二次模糊處理后的圖像;對(duì)(c)組圖像和(d)組圖像分別進(jìn)行大小相同的子塊劃分,計(jì)算對(duì)應(yīng)位置子塊之間的相關(guān)性,由于(c)組圖像與(d)組圖像中修改區(qū)域的相關(guān)性要大于背景區(qū)域的相關(guān)性,因此可以實(shí)現(xiàn)對(duì)圖像模糊修改區(qū)域的檢測(cè),同時(shí)對(duì)其真實(shí)性進(jìn)行了檢測(cè),并根據(jù)相關(guān)系數(shù)對(duì)相應(yīng)位置的子塊進(jìn)行定位標(biāo)識(shí)得到(e)組圖像,則(e)組圖像就是修改區(qū)域顯示結(jié)果。
圖4 實(shí)驗(yàn)結(jié)果
(e)組圖像可以清晰地反映出圖像的偽造區(qū)域,雖然存在誤判的圖像子塊,但數(shù)量極少??梢?jiàn),本文采用的基于二次模糊相關(guān)性的方法可以有效檢測(cè)經(jīng)過(guò)模糊處理的偽造圖像的真實(shí)性,而且可以定位圖像的修改區(qū)域。
目前,雖然對(duì)于數(shù)字圖書館圖像資源版權(quán)保護(hù)的研究工作已經(jīng)取得了很多進(jìn)展,但還是有許多問(wèn)題需要進(jìn)行深入的探索。[14-16]圖像作品在經(jīng)過(guò)特定的修改操作后會(huì)引起圖像本身的特征發(fā)生變化,被動(dòng)保護(hù)方法通過(guò)檢測(cè)這種圖像特征的變化來(lái)確定圖像作品遭受的修改類型,以此來(lái)對(duì)圖像作品的真實(shí)性進(jìn)行檢測(cè),從而對(duì)圖像作品的版權(quán)進(jìn)行保護(hù)。但是被動(dòng)保護(hù)方法中所涉及的技術(shù)只能檢測(cè)一種指定的修改操作,還沒(méi)有一種通用的方法可以檢測(cè)出所有類型的修改操作,而且隨著圖像處理軟件功能的不斷強(qiáng)大,圖像真實(shí)性檢測(cè)問(wèn)題將更加復(fù)雜。因此,如何將多種檢測(cè)方法進(jìn)行有效融合,研究出能夠檢測(cè)出多種混合修改操作的檢測(cè)方法是當(dāng)前研究的重點(diǎn)。
在數(shù)字圖書館的圖像資源版權(quán)保護(hù)中,主動(dòng)保護(hù)方法和被動(dòng)保護(hù)方法都屬于事后保護(hù)手段,并不能阻止版權(quán)侵犯活動(dòng)的發(fā)生。對(duì)數(shù)字圖書館圖像資源版權(quán)的保護(hù)應(yīng)該遵循“預(yù)防為主、防治結(jié)合”的原則,因此,可以將用戶訪問(wèn)控制技術(shù)、信息加密技術(shù)、信息隱藏技術(shù)、防拷貝技術(shù)和數(shù)字版權(quán)管理技術(shù)等多種保護(hù)技術(shù)結(jié)合使用,對(duì)數(shù)字圖書館的圖像資源版權(quán)進(jìn)行較為全面的保護(hù)。同時(shí),制定嚴(yán)謹(jǐn)、合理的版權(quán)保護(hù)管理制度和法律法規(guī),用科學(xué)的保護(hù)技術(shù)和健全的管理制度共同為數(shù)字圖書館圖像資源版權(quán)保駕護(hù)航。