戴若辰, 唐 歡, 湯 斌*, 趙明富, 代理勇, 趙 雅, 龍鄒榮, 鐘年丙
1. 重慶理工大學, 重慶市光纖傳感與光電檢測重點實驗室, 重慶 400054
2. 重慶中國三峽博物館, 館藏文物有害生物控制研究國家文物局重點科研基地, 重慶 400015
3. 重慶第二師范學院, 重慶 400065
造紙術的出現(xiàn)使中華民族能夠利用紙張保存政治、 文化、 軍事等信息, 寶貴的紙質(zhì)文物蘊含了中國近2000年歷史的智慧結(jié)晶。 但在紙質(zhì)文物保存過程中, 若保存方法不當, 極易遭受“狐斑”影響。 狐斑通常表現(xiàn)為黃色、 褐色或鐵銹色斑點, 因其狐貍般狡黠的生長特性與毛皮的顏色, 故稱之為狐斑(foxing)[1]。 狐斑不僅掩蓋字跡, 影響閱讀, 而且影響范圍會不斷擴大, 甚至滲透到深層的書頁中。 由于目前針對文物表面狐斑清洗的技術方法十分有限, 因此, 狐斑一旦形成, 很難去除, 將給文物帶來不可逆轉(zhuǎn)的損壞。 狐斑的成因還未形成統(tǒng)一的結(jié)論, 主要有生物論與無機論兩種理論。 生物論認為主要是霉菌等真菌造成紙張上產(chǎn)生狐斑, 霉菌以紙張中纖維素為營養(yǎng)源, 通過分泌纖維素酶, 降解與吸收紙張中的纖維素, 導致紙張機械強度下降。 同時在霉菌代謝過程中, 產(chǎn)生的草酸、 檸檬酸等有機酸使紙質(zhì)材料內(nèi)部酸性增加, 分泌的色素在紙質(zhì)文物表面形成狐斑。 無機論認為狐斑是金屬離子如銅、 鐵等在紙張表面沉積的結(jié)果。 狐斑的形成可能涉及復雜的生物、 化學反應, 既有可能與一種或幾種真菌生長有關, 也存在無機物沉積共同作用的可能性[2-4]。 除了成因尚未明確之外, 狐斑在有機質(zhì)文物, 特別是紙質(zhì)文物表面的侵襲、 擴散、 發(fā)展規(guī)律更是少有研究。 對于狐斑的傳統(tǒng)檢測, 完全依靠人工目視觀察, 不僅在狐斑病害發(fā)生的識別上具有滯后性, 同時也存在檢測人員判別的主觀性, 對于書畫藏品被墨色、 顏料及印章等覆蓋的區(qū)域更是難以通過肉眼進行識別, 因此, 基于文物的預防性保護理念, 亟待開發(fā)對于狐斑高效、 精確識別的無損檢測技術, 以此為后續(xù)的防治提供基礎。
高光譜成像技術結(jié)合了光譜與圖像分析的優(yōu)點, 具有無損、 快速、 高效等特點, 在不損壞樣品的情況下, 快速完成光譜數(shù)據(jù)采集, 單次采集即可獲得樣本光譜、 形狀、 顏色和成分等不同方面特征, 在檢測紙質(zhì)文物特征研究中具有巨大的優(yōu)勢和潛力, 目前已在紙質(zhì)文物檢測方面有初步應用。 如: 首都博物館的武望婷等[5]利用高光譜相機采集清代張士保作品《論道圖》的影像, 經(jīng)過最小噪聲分離變換、 主成分變換、 掩膜等處理對畫作的墨線進行了提取, 實現(xiàn)了圖像增強效果, 并且發(fā)現(xiàn)了兩處人眼無法識別的隱含信息; 上海博物館的周新光等[6]為了提高印章的可辨識度, 嘗試解決印章與畫意重合的問題; 武鋒強等[7]利用高光譜成像技術對古畫顏料成分進行分析, 通過最小噪聲分離、 純凈像元提取、 光譜特征擬合, 與標準波譜庫匹配, 正確識別出彩繪藝術畫顏料成分。
針對上述現(xiàn)狀, 本研究擬通過建立光譜分析方法獲得非接觸式紙質(zhì)文物高光譜狐斑檢測系統(tǒng), 為狐斑病害風險防控提供有效數(shù)據(jù)支撐, 同時, 拓展光譜檢測技術在文物保護領域中的應用。
狐斑檢測系統(tǒng)核心高光譜相機(Gaiatracer-V10, 測量范圍360~970 nm)(Zolix Ltd., Beijing, China), 如圖1所示,系統(tǒng)主要由鹵素線型光源(光源光譜范圍350~2 500 nm, 功率300 W)、 一維掃描樣品臺(長寬為300 mm×300 mm, 移動行程300 mm)、 高光譜相機、 成像鏡頭(視場角±7)及含采集控制軟件的PC組成, 適用于實驗室環(huán)境下物體鑒別分析。 經(jīng)多次試驗, 設置參數(shù)積分時間25ms, 采集到的圖像清晰無失真。
圖1 紙質(zhì)文物狐斑檢測系統(tǒng)
紙質(zhì)文物模擬實驗樣本由重慶中國三峽博物館提供, 樣本有輕度狐斑, 狐斑為分散的棕黃色點狀, 樣本局部狐斑發(fā)生情況較為嚴重, 大面積連接成片如圖2(a)所示。 圖2(b)與圖2(c)分別是利用超景深顯微系統(tǒng)(VHX-7000, 放大倍率×1 000)(Keyence Ltd., Osaka, Japan)拍攝被狐斑侵襲的部分與無狐斑侵染的部分; 兩部分均無明顯霉菌孢子存在。
圖2 (a)狐斑樣品局部; (b), (c)超景深顯微圖片
最小噪聲分離變換[8](Minimum Noise Fraction Rotation, MNF Rotation)可用于判斷圖像數(shù)據(jù)維數(shù), 即波段數(shù), 分離數(shù)據(jù)中的噪聲, 減少處理中的計算量。 MNF本質(zhì)即是兩次疊加的主成分分析[9](principal component analysis, PCA)。 第一次PCA用于分離數(shù)據(jù)中的噪聲, 變換后噪聲數(shù)據(jù)只與最小方差有關。 第二次PCA是對噪聲白化數(shù)據(jù)的標準主成分變換。
高光譜數(shù)據(jù)由256個光譜通道數(shù)據(jù)組成, 分辨率達到2.38 nm, 由于360~450 nm波段的數(shù)據(jù)充滿噪聲信息, 不可用于特征判斷, 于是刪除前38個波段數(shù)據(jù)。 光譜數(shù)據(jù)通常表現(xiàn)出高度相關性與大量冗雜信息。 特征波段提取方法從原有光譜數(shù)據(jù)中提取與樣品狐斑有關的光譜, 利用PCA減少輸入數(shù)據(jù)維數(shù)[10], 減少信息的共線性和數(shù)據(jù)冗余, 并對所選特征波段建立的模型進行分析比較, 選擇出最優(yōu)的特征波段提取方法。
隨機劃分樣本集為訓練集與測試集后, 應用KNN算法[11]和BP神經(jīng)網(wǎng)絡[12], 建立模擬紙質(zhì)文物上狐斑的判別模型; 然后將建立的判別模型對測試集樣本進行鑒別, 并根據(jù)鑒別準確率對模型性能進行評價比較, 最終選出更優(yōu)的數(shù)據(jù)建模方法。
圖3所示為墨跡和健康的紙質(zhì)區(qū)域、 被狐斑感染區(qū)域的平均光譜信息, 由圖可知, 健康區(qū)域和感染區(qū)域的平均反射率差異明顯。 紙質(zhì)文物模擬樣品光譜在全波長范圍內(nèi)變化較為規(guī)律, 且在450~600 nm波長范圍內(nèi), 模擬樣品表面狐斑與背景中的紙張部分、 墨跡部分的差異較大。 由此可見, 基于光譜特性進行紙質(zhì)文物的狐斑檢測分析具有可行性。
圖3 紙質(zhì)文物反射光譜與平均反射光譜
紙質(zhì)文物模擬樣本在464和767 nm波段下的光譜圖像如圖4所示。 在圖4(a)464 nm波段下, 樣本表面狐斑與紙張背景差異較大, 而在圖4(b)767 nm波段下, 表面狐斑已經(jīng)“埋沒”在紙張背景中。 這種情況與不同部分的光譜曲線的差異是一致的, 但僅憑特殊波段圖像不足以提取出紙質(zhì)文物表面狐斑的特征, 需要進一步進行處理。
圖4 紙質(zhì)文物特征波段圖像
波段運算[13]增強可增強目標與背景波譜特征間的微小差別, 壓制圖像中光照差異的影響, 突出目標的反射輻射特征, 突出目標與背景間的波譜差異。 為進一步區(qū)分出健康區(qū)域與被感染區(qū)域, 對特征波段圖像進行波段運算, 如圖5所示。 雖然印章部分與被感染區(qū)域有重疊, 但被感染區(qū)域與健康區(qū)域的分布區(qū)分比較明顯, 特別是圖5(c)與圖5(d), 狐斑部分呈現(xiàn)白色, 較為突出, 易于判別。 大多數(shù)被感染區(qū)域經(jīng)波段運算后可以被較好地區(qū)分開, 波段運算方法紙質(zhì)文物狐斑識別, 有利于實施有效的紙質(zhì)文物狐斑診斷監(jiān)測和科學防治。
圖5 紙質(zhì)文物特征波段運算結(jié)果
圖6為霉變樣本高光譜圖像(360~970 nm)進行最小噪聲分離(MNF)變換后的圖像。 選擇MNF變換后的第一、 第二和第七個分量組成RGB彩色圖像, 比起人眼觀測的圖像, 被狐斑感染區(qū)域顏色呈現(xiàn)出明顯的藍色, 能直觀地分辨出狐斑的大小及分布情況, 且染病越嚴重呈現(xiàn)出的顏色越深。 作為背景的紙張部分、 墨跡部分、 印章部分分別呈現(xiàn)出紅色、 黑色、 綠色, 呈現(xiàn)出不同的顏色相比波段運算的結(jié)果, 消除了印章部分的干擾, 對于狐斑的判定更加有利。
圖6 模擬樣本經(jīng)MNF變換后圖像
用狐斑樣本的180條高光譜數(shù)據(jù)(450~970 nm)建立狐斑判別模型, 隨機地分為120條數(shù)據(jù)為訓練集, 60條數(shù)據(jù)為測試集。 樣本包含紙張部分、 墨跡部分與被感染部分共3種類型, 采用K-近鄰法(KNN)和BP神經(jīng)網(wǎng)絡兩種分類方式建立狐斑判別模型。 將經(jīng)過預處理以及特征波長提取分析的120條高光譜數(shù)據(jù)作為KNN與BP神經(jīng)網(wǎng)絡模型的輸入構(gòu)建狐斑判別模型, 然后利用測試集的60條樣本數(shù)據(jù)對模型進行驗證。
結(jié)果如表1所示, KNN模型被感染部分測試集判別率為79.1%、 對紙張部分判別率為57.1%, 對墨跡部分判別率為60%; BP神經(jīng)網(wǎng)絡被感染部分測試集判別率為83.8%、 對紙張部分判別率為63.6%, 對墨跡部分判別率為83.3%。 BP神經(jīng)網(wǎng)絡判別結(jié)果相比KNN模型而言, 對染病部分判別正確率更高, 分類效果更好。 總體上, 高光譜圖像對狐斑部分判別率更高, 可用于健康樣本與狐斑發(fā)生樣本的識別, 但由于紙張本身存在差異, 對紙張的區(qū)分結(jié)果欠佳。
表1 不同部分KNN與BP神經(jīng)網(wǎng)絡判別分析結(jié)果
基于高光譜成像研究了受狐斑侵染的紙質(zhì)文物模擬樣本的光譜圖像特征, 研究發(fā)現(xiàn)狐斑與背景的光譜具有顯著差異。 對模擬樣本不同波段的高光譜圖像進行波段運算, 發(fā)現(xiàn)波段運算后結(jié)果能夠提取被狐斑感染區(qū)域的特征。 對高光譜圖像進行最小噪聲分離法變換后, 被感染區(qū)域區(qū)分更加顯著。 基于K-近鄰法和BP神經(jīng)網(wǎng)絡的判別模型結(jié)果顯示, 高光譜圖像對狐斑判別率較高(>79%), 可用于紙質(zhì)文物狐斑的判定。 研究結(jié)果表明, 高光譜成像可用于紙質(zhì)文物狐斑的無損檢測, 特別是在印章、 墨跡、 顏料等覆蓋后、 肉眼難以識別的隱藏的狐斑。 本研究可為狐斑的產(chǎn)生及蔓延發(fā)展預測、 揭示其分布發(fā)展規(guī)律提供全新的技術手段。 后續(xù)研究可從光譜圖像預處理、 有效波段篩選、 建模方法優(yōu)化等方面開展更深入的實驗, 以提高檢測精度。