文/孟利
本文通過(guò)深入分析JPEG 格式圖像經(jīng)微信、抖音、微博、郵件、小紅書(shū)以及QQ 等不同傳輸路徑傳輸后,其文件屬性和Exif(可交換圖像文件格式)信息發(fā)生的變化,以期為圖像真實(shí)性的檢驗(yàn)提供有效參考。研究結(jié)果顯示,JPEG 格式圖像經(jīng)微信、抖音、小紅書(shū)和QQ 傳輸后,其文件屬性會(huì)發(fā)生本質(zhì)變化,Exif 信息的完整性會(huì)受到影響甚至丟失。也就是說(shuō),使用者可以通過(guò)觀察這些變化來(lái)檢驗(yàn)JPEG 格式圖像的真實(shí)性是否發(fā)生了改變。
隨著科學(xué)技術(shù)和數(shù)字圖像技術(shù)的不斷發(fā)展,圖像、視頻等逐漸發(fā)展成信息傳播的主要載體,并在政治、經(jīng)濟(jì)、司法訴訟以及日常生活中發(fā)揮出重要作用。特別是在一系列功能多樣、容易操作的圖像處理軟件出現(xiàn)以后,圖像篡改的情況日益普遍,甚至發(fā)展到肉眼難以察覺(jué)篡改痕跡的地步。這些被篡改的圖像在網(wǎng)絡(luò)上廣泛傳播,將大大降低圖像信息的可信度,并在一定程度上造成惡劣影響。因此,如何判斷圖像的真實(shí)性已成為社會(huì)各界普遍關(guān)注的問(wèn)題。
當(dāng)前,人們主要通過(guò)以下三種方式來(lái)驗(yàn)證圖像的真實(shí)性,即成像檢驗(yàn)、Exif 信息檢驗(yàn)以及圖像信號(hào)分析。[1-3]其中,Exif 信息檢驗(yàn)的工作原理是:驗(yàn)證圖像文件格式中包含的照相設(shè)備在拍攝圖像過(guò)程中采集的信息,如設(shè)備制造商、信號(hào)強(qiáng)度、顏色編碼、曝光時(shí)長(zhǎng)以及GPS 定位等是否被修改過(guò),進(jìn)而以此Q 為依據(jù)檢驗(yàn)圖像的真實(shí)性。在具體實(shí)踐中,大部分人對(duì)Exif 信息缺乏全面認(rèn)識(shí),無(wú)法利用Exif 信息為圖像真實(shí)性檢驗(yàn)提供可靠依據(jù)。本文在對(duì)JPEG 格式圖像進(jìn)行分析的基礎(chǔ)上,進(jìn)一步探討了不同傳輸方式對(duì)Exif 信息的影響,旨在豐富Exif 信息檢驗(yàn)圖像真實(shí)性的應(yīng)用途徑。
首先,筆者將JPEG 圖像文件以特定規(guī)則保存,其次使用JPEG 文件交換格式JFIF 對(duì)圖像數(shù)據(jù)流進(jìn)行封裝,使用“APP0”對(duì)其進(jìn)行標(biāo)記,最后以“0xFFD8”為開(kāi)頭字符串,以“0xFFD9”為結(jié)束字符串。此時(shí),JPEG 圖像文件頭中包含一系列“0xFF”格式的字符串作為信息“標(biāo)記碼”,其中,“0xFFE1”代表信息為“Exif 信息”。
通常,“0xFFE0”和“0xFFEF”之間的16 個(gè)JPEG 標(biāo)識(shí)符會(huì)被應(yīng)用程序保留,Exif 信息也正是利用這些信息串來(lái)記錄JPEG圖像參數(shù)信息的。圖1 展示的是某數(shù)字圖像Exif 信息的開(kāi)頭部分,完整的Exif 信息長(zhǎng)度為“0xFFFE”。由于JPEG 文件格式規(guī)定使用大端順序,該數(shù)字圖像Exif 信息的實(shí)際長(zhǎng)度為65534B。此外,0x457869660000是Exif 信息的ASCII 碼值,0x4D4D002A00000008 是TIFF(標(biāo)簽圖像文件格式)頭的一部分。其中,“0x4D4D”表示在該TIFF 段中使用大端順序。考慮到“0x002A”是一個(gè)固定值,0x00000008 就表示從“0x4D4D”到第一個(gè)圖像文件目錄(IFD)的偏移量為0x8。
圖1 某數(shù)字圖像Exif 信息的開(kāi)頭部分
筆者使用手機(jī)拍攝了一張圖像,分別通過(guò)微信、抖音、微博、郵件、藍(lán)牙、小紅書(shū)、QQ 等渠道進(jìn)行傳輸。隨后,筆者操作ExifToolGUI V5.16.0.0軟件分別查看了該圖像在傳輸前后的文件屬性和元數(shù)據(jù)信息。
數(shù)據(jù)信息顯示,該圖像的元數(shù)據(jù)包含Exif 信息、IPTC 信息以及JFIF 信息等多種形式。值得一提的是,IPTC 元數(shù)據(jù)標(biāo)準(zhǔn)作為一種元數(shù)據(jù)標(biāo)準(zhǔn)格式,已經(jīng)在JPEG 數(shù)字圖像處理領(lǐng)域得到廣泛應(yīng)用,它能夠詳細(xì)記錄并描述圖片的作者、版權(quán)、字幕、細(xì)節(jié)以及創(chuàng)建時(shí)間等信息。
以小紅書(shū)為例,筆者借助Photoshop CS6 13.0 軟件查看了圖像文件傳輸后的元數(shù)據(jù),并整理重要信息如下:
其中,“IPTCDigest”代表圖像中IPTC 元數(shù)據(jù)的MD5 哈希校驗(yàn)值,且當(dāng)IPTC 元數(shù)據(jù)發(fā)生變化時(shí),該值也會(huì)隨之發(fā)生變化;“DocumentID”為該圖像的全局唯一標(biāo)識(shí)符;“InstanceID”為該圖像當(dāng)前的版本標(biāo)識(shí)符,且當(dāng)圖像更新并產(chǎn)生新版本時(shí),“InstanceID”也會(huì)發(fā)生相應(yīng)變化。
與此同時(shí),筆者綜合各專業(yè)軟件的檢驗(yàn)結(jié)果發(fā)現(xiàn),該圖像經(jīng)郵件、微博和藍(lán)牙傳輸后未發(fā)生任何改變,但經(jīng)小紅書(shū)、微信、抖音以及QQ 傳輸后分別在文件名、大小、MD5 值等方面發(fā)生了不同程度的變化。
在Exif 信息方面,該圖像在經(jīng)小紅書(shū)和微信傳輸后均發(fā)生“ThumbnailOffset”變小和“GPS信息”丟失的情況。尤其是經(jīng)過(guò)小紅書(shū)傳輸后,該圖像的“ThumbnailLength”變小,其JFIF信息的“XResolution”(水平解析度)和“YResolution”(垂直解析度)均變?yōu)椤?2”。也就是說(shuō),該圖像的分辨率明顯降低。另外,該圖像在經(jīng)小紅書(shū)、微信和QQ傳輸后,其文件名分別發(fā)生不同程度的改變。其中,經(jīng)過(guò)微信和QQ 傳輸后,該圖像的原始文件名中分別加入了微信和QQ 標(biāo)志;經(jīng)過(guò)小紅書(shū)傳輸后,該圖像則根據(jù)系統(tǒng)的內(nèi)部順序進(jìn)行了重命名。筆者利用WinHex 工具查看后發(fā)現(xiàn),該圖像經(jīng)小紅書(shū)、微信和QQ 傳輸后都顯示了JFIF 信息。JFIF 信息以十六進(jìn)制數(shù)“0xFFE0”為開(kāi)始標(biāo)記,緊接著的“0x0001”兩個(gè)字節(jié)用于表示JFIF 信息的長(zhǎng)度,“0x4A4649460001”為“JFIF”的ASCII 碼值。
該圖像經(jīng)抖音和QQ 傳輸后,Exif 信息丟失,并且二者在ExifToolGUI V5.16.0.0 軟件中均不顯示各自的Exif 信息,同時(shí)該圖像的文件名也發(fā)生了改變。另外,該圖像在經(jīng)抖音傳輸后,其擴(kuò)展名也從JPEG 格式轉(zhuǎn)換成了PNG 格式。這一變化在該圖像的Exif 信息中也能體現(xiàn)出來(lái)。最后,筆者利用WinHex 工具查看了該圖像的RIFF 信息,發(fā)現(xiàn)其字符串以“0x52494646”開(kāi)頭。
該圖像經(jīng)抖音、微信、小紅書(shū)和QQ 傳輸后,其“Thumbnail-Offset”和“ThumbnailLength”均發(fā)生明顯變化。這就說(shuō)明,原始圖像的縮略圖(Thumbnail Image)同樣發(fā)生了改變??s略圖作為原始圖像的精簡(jiǎn)版,通常以文件形式存儲(chǔ)在圖像庫(kù)中。在某些特定情況下,縮略圖也可以揭示原始圖像是否存在被篡改的痕跡。在此次實(shí)驗(yàn)中,筆者用手機(jī)拍攝的圖像經(jīng)小紅書(shū)、抖音和QQ 傳輸后,縮略圖由于信息丟失,未能顯示。
另外,該圖像經(jīng)微信傳輸后,其“ThumbnailOffset”變小。一般來(lái)說(shuō),此類縮略圖的起點(diǎn)和終點(diǎn)分別用“0xFFD8”和“0xFFD9”表示,并存儲(chǔ)于“Thumbs.db”文件夾中。如果圖像被篡改,那么使用者就可以通過(guò)查看縮略圖信息來(lái)追蹤圖片的篡改痕跡。
綜上所述,不同傳輸路徑對(duì)JPEG 格式圖像的影響主要表現(xiàn)在文件屬性和Exif 信息方面,使用者可以通過(guò)分析對(duì)比JPEG 格式圖像的文件名、大小、MD5 值以及Exif 信息來(lái)檢驗(yàn)圖像的真實(shí)性。
例如,在利用Exif 信息檢驗(yàn)圖像真實(shí)性時(shí),使用者應(yīng)仔細(xì)比對(duì)檢驗(yàn)圖像中的Exif信息與相應(yīng)拍攝設(shè)備所特有的固有功能及元數(shù)據(jù),以判斷二者是否一致。一旦在比較過(guò)程中發(fā)現(xiàn)不一致的情況,使用者就要對(duì)這些不一致的現(xiàn)象進(jìn)行深入分析,以確定待驗(yàn)證圖像是否存在篡改或偽造痕跡。
本文研究了JPEG 格式圖像經(jīng)郵件、小紅書(shū)、微信、微博、藍(lán)牙、抖音和QQ 等渠道進(jìn)行傳輸后,在文件格式、大小、MD5 值以及Exif 信息方面發(fā)生的變化,基于相關(guān)實(shí)驗(yàn)數(shù)據(jù)和分析結(jié)果,進(jìn)一步探討了利用文件屬性和Exif 信息來(lái)檢驗(yàn)圖像真實(shí)性的技術(shù)方法,以期為圖像真實(shí)性檢驗(yàn)提供更多選擇。與此同時(shí),筆者還發(fā)現(xiàn),JPEG 格式圖像在不同傳輸渠道下還存在信號(hào)分析結(jié)果不統(tǒng)一、傳輸通道流量不均衡、數(shù)據(jù)丟失等諸多不確定影響因素。因此,相關(guān)研究者要充分了解圖像傳輸中的各種影響因素,深入研究文件屬性和Exif信息,通過(guò)科學(xué)準(zhǔn)確的手段來(lái)檢驗(yàn)圖像的真實(shí)性。