付心儀 李巖 孫志軍 杜鵑 王鳳平 徐迎慶
內(nèi)容摘要:煙熏病害是敦煌壁畫的典型病害之一,具有顏色破壞大、修復難度高、相關(guān)研究少等難點,實體修復對煙熏病害尚沒有有效的復原手段。針對敦煌壁畫所面臨的煙熏病害,以莫高窟第156窟北壁煙熏壁畫作為典型研究對象,從數(shù)字化復原和物理化學分析的角度出發(fā),利用兩次煙熏模擬實驗,探究了顏料在煙熏條件下產(chǎn)生的變化規(guī)律,收集了顏色在煙熏過程中變化的數(shù)據(jù)集,提出了基于機器學習的煙熏壁畫數(shù)字化復原方法。本研究創(chuàng)新性地采用了基于模擬實驗的數(shù)字化色彩復原研究方法,取得了珍貴的煙熏壁畫數(shù)據(jù)樣本,相關(guān)數(shù)字化研究成果可以應用在煙熏類壁畫的數(shù)字化色彩復原中,將煙熏前的顏色展現(xiàn)給社會大眾。
關(guān)鍵詞:煙熏壁畫;數(shù)字化復原;機器學習;物理化學;模擬實驗
中圖分類號:K854.3? 文獻標識碼:A? 文章編號:1000-4106(2021)01-0137-11
Abstract:Soot damage is one of the typical types of deterioration seen in Dunhuang murals, though it is a somewhat a typical research topic when compared with other types of deterioration. Soot damage is particularly damaging to the color of murals and cannot be ameliorated by conventional physical restoration methods. Focusing on the soot damaged murals in Mogao cave 156, and by conducting two simulation experiments of soot damage from the perspective of digital restoration and physicochemical analysis, this paper explores the pattern of changes in paint pigments under the influence of soot and collects relevant data on color change. The researchers then pose a digital restoration method for soot damaged murals based on machine learning that is applicable to the restoration of similarly colored murals.
Keywords:soot damaged murals; digital restoration; machine learning; physical chemistry; simulation experiment
1 引 言
敦煌莫高窟是壁畫類文化遺產(chǎn)的典型代表,現(xiàn)存壁畫4.5萬平方米。敦煌壁畫曾飽受煙熏病害的侵擾,其成因是在莫高窟尚未建立現(xiàn)代保護機制前,附近的善男信女在佛事活動期間居住在窟內(nèi)使用明火燒香、煮飯和取暖,由于香油和碳等物質(zhì)的沉降,造成壁畫顏色變黃、變暗甚至變黑的現(xiàn)象。煙熏病害對壁畫的色彩和構(gòu)圖造成了大范圍的嚴重破壞,但目前尚沒有十分有效的治理此種病害的手段。敦煌壁畫的保護專家們曾經(jīng)嘗試通過溶液清洗等方法洗掉煙漬,如段修業(yè)等人針對莫高窟第71窟的煙熏壁畫,先后使用清水、硝酸、高錳酸鉀、重鉻酸鉀等氧化劑溶液對煙熏部位進行清洗,除了已經(jīng)氧化的顏色,其余顏色基本露出[1]。然而,由于某些溶劑帶有顏色,清洗后的壁畫可能會覆蓋一層溶劑顏色,長期的清洗效果和是否有后遺癥還需要觀察。
壁畫的數(shù)字化復原方法,具有復原成本低、文物保護性高、結(jié)果可復制、復原周期短等優(yōu)勢,相關(guān)領(lǐng)域的研究工作也取得了一定的成果[2-4]。針對煙熏壁畫的色彩復原問題,我們采用煙熏實驗、顏料成分分析和數(shù)字化手段的綜合復原方法,首先對壁畫遭受煙熏的過程進行模擬分析,探索顏料和色彩在煙熏條件下的變化規(guī)律,然后在數(shù)字化維度計算壁畫煙熏前的色彩。
2 敦煌莫高窟煙熏壁畫現(xiàn)狀調(diào)研
莫高窟現(xiàn)存有壁畫和彩塑的洞窟數(shù)為492個,根據(jù)王進玉[5]等人的統(tǒng)計,具有煙熏病害的洞窟一共有47個。經(jīng)過初步篩選,我們對其中的16個洞窟(第8,57,94,99,120,156,178,227,231,235,236,237,257,370,445,450窟)進行了實地考察,期望找到一個保存相對完好,且壁畫的煙熏程度具有層次感的洞窟。
通過對洞窟的朝代、保存現(xiàn)狀、煙熏程度三個維度的考察,最終選取第156窟北壁壁畫作為典型研究對象。該窟始建于晚唐年間,位于莫高窟崖面的頂層,其壁畫內(nèi)容保存完好,煙熏程度較輕,并且方便進行數(shù)字化。
第156窟北壁的煙熏壁畫如圖1所示,該煙熏區(qū)域以煙道為中心,向兩側(cè)壁畫邊緣擴散,呈現(xiàn)越來越淺的煙熏趨勢。壁畫上半部分,由于煙霧的長期積累,形成的煙熏比壁畫下半部分更深。由于煙道內(nèi)煙霧具有比較高的溫度,高溫會影響碳顆粒的附著,所以根據(jù)壁畫距離煙熏著火點的位置,可以將壁畫的煙熏區(qū)域分為“近火高溫煙熏”和“遠火低溫煙熏”兩種。這兩種煙熏狀態(tài)形成的顏色變化不盡相同,其中近火高溫煙熏所形成的煙熏區(qū)域,碳顆粒覆蓋較厚,顏色較深,幾乎看不出壁畫本來的內(nèi)容與顏色;遠火低溫煙熏所形成的煙熏區(qū)域,碳顆粒覆蓋較薄,顏色較淺,某些位置可以分辨出原始的壁畫內(nèi)容和顏色。
3 研究方法
如圖2所示,我們采用基于典型煙熏壁畫的數(shù)字化色彩復原方法。莫高窟洞窟內(nèi)的壁畫經(jīng)過“自然煙熏過程”,由原始壁畫逐漸變色成為煙熏壁畫,對于這個自然煙熏過程和煙熏后壁畫顏料成分和色相變化的研究,是煙熏壁畫數(shù)字化復原的關(guān)鍵。由于敦煌莫高窟壁畫的不可接觸性,對煙熏顏色進行科學合理的采樣、檢測與分析難度非常大,國際上相關(guān)的工作又處在近乎空白的階段,僅能通過一些原位無損分析手段,如便攜式熒光光譜儀、便攜式拉曼光譜測量儀等[6-8],推斷煙熏后顏料的主要物質(zhì)成分。所以,經(jīng)過廣泛的專家論證,我們最終采用通過對使用與敦煌莫高窟壁畫相同顏料繪制的壁畫樣塊,使用與實際煙熏相同的燃料,進行實地煙熏的方案,來獲取煙熏壁畫色彩復原的原始數(shù)據(jù),即“煙熏實驗過程”。煙熏實驗的主要目的是,通過對相同或相近顏料的快速煙熏,得到顏色在煙熏條件下的變色過程,通過對該過程的物理化學和數(shù)字化分析,科學地總結(jié)出煙熏對壁畫顏色的影響,從而探究煙熏色彩復原的方法。我們通過對洞窟內(nèi)煙熏壁畫進行無損物質(zhì)成分分析的方法,即“成分驗證”來驗證煙熏實驗的結(jié)果符合自然煙熏過程。根據(jù)實驗煙熏壁畫的顏色變化,我們提出基于機器學習的“煙熏數(shù)字化復原模型”方法,使用煙熏實驗前后的色彩空間數(shù)據(jù)集建立色彩復原模型,最后應用到“洞窟煙熏壁畫數(shù)字化復原”中。
4 壁畫煙熏實驗的設計與實施
壁畫的煙熏實驗可以為煙熏色彩的數(shù)字化復原提供數(shù)據(jù)依據(jù)。我們于2013年春季和2015年春季赴敦煌搭建了模擬實驗平臺,分別進行了“近火高溫”煙熏實驗和“遠火低溫”煙熏實驗,兩次煙熏實驗均取得了預期的煙熏結(jié)果。
4.1 “近火高溫”煙熏實驗
本次實驗實施時間為2013年5月,選址在距離敦煌莫高窟5千米之外的戈壁環(huán)境。為了在野外環(huán)境保證煙霧對壁畫的作用,需要對煙霧進行聚攏,最終采用0.5m×0.5m×1m的立方體磚砌窯的形式,對放置于其內(nèi)的壁畫進行煙熏,磚砌窯下方具有燃料進口和通風口,頂部設置擋板用于取放畫板和控制煙量,畫板放置于磚窯內(nèi)部墻壁一側(cè),在磚窯底部生火起煙對其進行煙熏,其示意圖和實物圖如圖3所示。
本次煙熏實驗樣本制作的過程分為地仗制作、顏料選擇與調(diào)制、壁畫繪制三個步驟。首先使用敦煌土、敦煌本地麻線和植物等材料,按照與古代敦煌壁畫相同的材料和工藝為模擬樣本制作地仗,再由敦煌研究院美術(shù)所專家客觀臨摹莫高窟第71窟壁畫彌勒經(jīng)變局部圖。樣本繪制過程中,使用了由下述敦煌壁畫基本顏料按照一定比例混合形成的15種混合顏料實物樣本:石青、朱砂、蛤粉、石綠、敦煌綠、淡青、淺綠、草綠、石榴黑、大火黑、朱磦、普蘭、敦煌土、熟褐、部分國畫顏料。
在實驗進行過程中,使用本地的杏樹、楊樹等木材作為燃燒材料,燃燒穩(wěn)定生煙之后,將壁畫放入磚窯內(nèi),每隔1小時取出觀察煙熏上色程度,并進行物質(zhì)成分與數(shù)字化采樣,煙熏時間累積約24小時。提取的物質(zhì)樣本數(shù)據(jù)共計約600組,數(shù)字化拍攝圖片約400張,最終形成的完整壁畫的煙熏漸變結(jié)果如圖4所示??傮w來講,第一次煙熏實驗達到的視覺效果,基本模擬了第156窟煙熏壁畫“近火高溫” 的煙熏效果。
4.2 “遠火低溫”煙熏實驗
本次實驗實施時間為2015年6月,經(jīng)過對第一次煙熏實驗的經(jīng)驗總結(jié),本次實驗設置了較為豐富的實驗對照組,采用簡單易控制的顏色樣條來進行煙熏對比實驗。
本次設計實驗主要考慮“遠火低溫”的煙熏覆蓋模擬,為了把溫度的因素和煙霧因素分開,采用如圖5(a)所示的煙熏方法,選擇封閉的煙熏空間,將煙熏樣本豎向懸掛于墻上,生煙裝置置于煙熏場地外面,可以一定程度地減小溫度對壁畫的影響。本次實驗同時記錄了煙熏樣本及煙熏環(huán)境的高度、溫度、濕度等過程數(shù)據(jù)。
“遠火低溫”煙熏實驗共制作26塊地杖,其中25塊分為5組進行煙熏,每組5塊,1塊不煙熏,作為對照組。地仗的具體制作為:使用20cm×30cm的木板作為底層支撐材料,在木板上固定敦煌本地麻布,然后將混有細麻繩的敦煌土涂抹在麻布上,晾干后磨平表面裂隙,形成地仗板。隨后使用25種礦物顏料在地仗上制作1cm寬的色條,作為煙熏樣本。本次顏料來源為西藏“扎西彩虹”藏傳礦物顏料,每種顏料分別編號并采樣用于以后期定量分析實驗。
“遠火低溫”煙熏實驗的場地,最終選定位于敦煌合水村一處民房內(nèi)進行,民房大小約為2m×1.8m×2.2m,與一個小型洞窟相似,溫度和濕度適宜,回避了風力、日照、天氣等因素,是比較理想的煙熏實驗場地。
在民房內(nèi)將每組5塊色板,按照高度依次垂直懸掛于民房后方的墻壁上4塊,第5塊放置于民房頂部,用于模擬洞窟頂部壁畫的煙熏情況。每一高度的色板附近設置溫度計和濕度計,全程記錄煙熏時的溫度和濕度。生煙爐和火源放置于民房門外,所生煙霧通過一個約0.5米的煙道,并通過窗簾進入民房內(nèi),用來降低煙的溫度,如圖5(b)和圖5(c)所示。
本次煙熏實驗燃料全部為敦煌當?shù)氐臈顦?、杏樹木材。正式實驗中,?5塊色板分為5組,每組5塊,分別煙熏1、2、3、4、5個小時,煙熏時長結(jié)束后,將每組色板進行數(shù)字化采樣和封存處理,并按照煙熏時長標記每組的煙熏程度。實驗同時記錄了煙熏過程中共計13個采樣點的溫度和濕度變化。采樣結(jié)果顯示壁畫附近的平均溫度變化范圍為27℃—55℃,濕度范圍63%—72%,濕度主要來源于木材中的水分??梢钥闯觯鹪磁c色板的隔離,起到了溫度隔離的作用。
“遠火低溫”煙熏實驗共得到5組計25塊不同煙熏程度的色板樣本,并進行了標準數(shù)字化采樣,最終形成的階梯煙熏結(jié)果如圖6所示,總體煙熏結(jié)果從視覺上滿足“遠火低溫”的要求。
5 煙熏壁畫顏料成分分析
隨著物理化學學科的發(fā)展,對于壁畫顏料物質(zhì)成分的測量變得切實可行,通過手持式熒光光譜儀和非接觸手持拉曼光譜儀等原位無損測量手段,可以測量出壁畫顏料的主要物質(zhì)成分[9]。煙熏色彩復原研究涉及的物質(zhì)成分物理化學分析分為三種對象,分別為莫高窟煙熏壁畫顏料成分分析、煙熏前實驗顏料成分分析和煙熏后實驗顏料成分分析。
5.1 莫高窟煙熏壁畫顏料成分分析
由于相關(guān)文獻對于唐代壁畫所使用的顏料物質(zhì)成分已經(jīng)有所考證[10],故我們對莫高窟第156窟北壁的煙熏后壁畫顏料進行了分析,希望對比得出壁畫顏料經(jīng)過長年的煙熏之后,發(fā)生了怎樣的物理化學變化。得到的結(jié)果與煙熏模擬實驗前后的顏料物理成分分析結(jié)果進行對比,可以形成對照組,驗證煙熏實驗數(shù)據(jù)對于重現(xiàn)煙熏壁畫的科學合理性。
我們在莫高窟第156窟北壁的煙熏壁畫上選取了73個測量點(如圖7所示),并對這些采樣點進行了X射線熒光光譜分析(XRF)。由于XRF是一種定性的測量手段,只能測定出元素構(gòu)成,不能直接準確地確定材料成分,所以檢測出元素成分之后,需要結(jié)合壁畫顏料知識和繪畫內(nèi)容對其顏料成分進行推斷。
最終的XRF測量分析結(jié)果如表1所示,通過分析得出以下結(jié)論:紅色顏料為赭石(Fe2O3)和鉛丹(Pb3O4),藍色顏料為石青(CuCO3·Cu(OH)2),綠色為氯銅礦(Cu2(OH)3Cl),土黃色為纖鐵礦(γ-FeO(OH)),棕黑色可能為鉛丹的退化產(chǎn)物氧化鉛(PbO2),黑色大部分為煙熏碳層覆蓋導致顏色變黑。這個結(jié)果與唐代壁畫顏料常用物質(zhì)成分的分析結(jié)果[10]基本保持一致,可以初步認定,經(jīng)過煙熏之后,壁畫顏色的色相偏移主要是由黑色碳層覆蓋導致的。
5.2 煙熏前顏料成分分析
煙熏前實驗顏料成分分析,主要針對兩次煙熏實驗分別使用的顏料進行物質(zhì)成分分析,證明其與敦煌壁畫所使用顏料成分是否相同。
在“近火高溫”煙熏實驗中,我們對紅色、藍色、綠色、白色、黑色這5種典型顏色的成分進行了拉曼分析。結(jié)果表明,紅色的主要顯色成分為朱砂(HgS),藍色的主要顯色成分為大量酞菁藍(C32H16CuN8)和少量石青(Cu3(CO3)2(OH)2),綠色的主要顯色成分為酞菁綠(C32H3Cl15CuN8),白色的主要顯色成分為碳酸鈣(CaCO3)和二氧化鈦(TiO2),黑色的主要顯色成分為炭黑(C)。由于純礦物顏料比較難以獲取,所以本次煙熏實驗使用的顏料并非純礦物顏料,有部分有機合成顏料,與敦煌壁畫上所使用的顏色成分不全相同。
“遠火低溫”煙熏實驗所使用的顏料來源于西藏“扎西彩虹”純礦物顏料,我們對其使用X射線衍射分析(XRD)手段和拉曼光譜鑒定手段進行鑒定,結(jié)果如表2所示。結(jié)果表明,第二次實驗使用的顏料與敦煌壁畫基本相同,為各種礦物,顯色成分和對應色相與相關(guān)研究[10]相同?!斑h火低溫”煙熏實驗的結(jié)果,可以作為真實模擬煙熏洞窟顏色變化的重要依據(jù)。
5.3 煙熏后顏料成分分析
我們對“近火高溫”煙熏實驗和“遠火低溫”煙熏實驗煙熏后的樣本分別進行了拉曼分析實驗,得到以下分析結(jié)果。
“近火高溫”煙熏實驗后的顏料表面覆蓋了無定型碳,使得顏色色相發(fā)生了改變,未引入其他物質(zhì)。主要的顯色成分除朱砂(HgS)外,酞菁藍(C32H16CuN8)、酞菁綠(C32H3Cl15CuN8)、碳酸鈣(CaCO3)和二氧化鈦(TiO2)等未發(fā)生顯著變化。朱砂(HgS)由于其熱穩(wěn)定性較差,在高溫條件下易發(fā)生氧化反應,產(chǎn)生汞蒸氣和二氧化硫,使得紅色顏料層減少。
“遠火低溫”煙熏實驗由于嚴格控制了實驗溫度,經(jīng)過拉曼分析后發(fā)現(xiàn),所有顏料均未發(fā)生物質(zhì)成分的改變,根據(jù)煙熏時間的不同,顏料表面覆蓋的無定型碳厚度隨時間增加而增多,但由于煙熏時間較短,所以碳層非常薄,無法進行定量的厚度測量。
經(jīng)過以上物理化學分析,可以發(fā)現(xiàn)“近火高溫”煙熏實驗和“遠火低溫”煙熏實驗均科學合理地模擬了敦煌壁畫的煙熏過程,與第156窟北壁煙熏壁畫的XRF測量結(jié)果相符。
6 煙熏壁畫數(shù)字化色彩復原理論與方法
結(jié)合煙熏實驗前后的物理化學分析結(jié)果,我們采用“遠火低溫”煙熏實驗的數(shù)字化數(shù)據(jù)作為煙熏色彩數(shù)字化復原的數(shù)據(jù)樣本,并提出基于機器學習的煙熏壁畫數(shù)字化色彩復原理論與方法。
6.1 數(shù)據(jù)預處理
“遠火低溫”煙熏實驗的色板數(shù)據(jù)預處理經(jīng)過數(shù)字化采集、顏色校正、樣條生成、顏色抽取四個步驟。數(shù)字化采集使用佳能EOS 5D Mark Ⅲ 相機對26塊色板進行數(shù)字化拍攝,顏色矯正使用愛色麗護照型色卡經(jīng)Adobe Lightroom進行統(tǒng)一的顏色校正。樣條生成使用Adobe Photoshop軟件,對每塊色板上的28種顏色分別提取600×20像素大小的顏色樣條,共提取728個顏色樣條,作為后續(xù)顏色抽取的數(shù)據(jù)源。顏色抽取采用平均取樣的方法,對每一個顏色樣條進行5×5像素滑動窗口的平滑取樣,最終每個顏色樣條抽取數(shù)據(jù)點480個,煙熏色板數(shù)據(jù)集的總數(shù)據(jù)點為3494440個,數(shù)據(jù)集的規(guī)模足夠作為后續(xù)研究的訓練樣本,但仍需根據(jù)具體情況對數(shù)據(jù)集進行篩選。
6.2 典型色相的煙熏變化分析
未經(jīng)煙熏的畫板顏色可以分類為紅色、藍色、綠色、黃色、白色、黑色6種色相,每種色相又有顏色深淺之分。這種深淺的分別,在色彩數(shù)據(jù)空間上可以用顏色的灰度值進行表征。根據(jù)RGB顏色計算灰度值的方法多種,其中比較符合人眼識別顏色深淺的方法是浮點算法,也是最常用的灰度計算方法。浮點算法的計算方法如公式1所示,其中Gray是顏色灰度,R、G、B是顏色的三個分量。
Gray=R×0.299+G×0.587+B×0.114(公式1)
我們對經(jīng)過顏色抽取之后所有數(shù)據(jù)點計算了其灰度值,并按照顏色編號進行分類后,按灰度值降序排列。隨后我們選取了編號為5(二青)、13(二綠)、15(土黃)、20(暗紅)、25(仁白布粉)的5種顏料,作為藍色、綠色、黃色、紅色和白色的代表色相樣例,分析其煙熏后的變化特征。每種顏色的數(shù)據(jù)點數(shù)量為12480個,為了更好地表現(xiàn)每種顏色經(jīng)過煙熏后的色相過渡變化,將每種顏色按照平均間隔取樣,提取400個點制作成20×20大小的像素方格,形成圖8的典型色相煙熏變化圖。
從圖8中可以明顯看出,每個色相均有由淺到深的煙熏變化梯度,這也說明了煙熏實驗成功地模擬了顏色經(jīng)過煙熏之后的色相加深變化。其中藍色、綠色色相,隨著煙熏程度的加深,顏色逐漸變深,最終幾乎變成黑色,可見煙熏對這兩種色相的上色比較容易;相對于藍色和綠色,紅色、黃色和白色色相在煙熏程度較深時才有比較明顯的變化,說明這些色相在煙熏時間較長時才會有比較明顯的變化。這也與第156窟北壁煙熏壁畫的表現(xiàn)相一致,壁畫上藍色和綠色隨著煙熏程度的加深色相逐步變深,甚至有些遠火低溫煙熏區(qū)域的綠色被熏成黑色,而紅色和黃色的色相變深相對較較慢,只在近火高溫區(qū)域才呈現(xiàn)出全黑的趨勢。這一規(guī)律的發(fā)現(xiàn),對于后續(xù)不同色彩復原的研究具有較強的指導意義。
6.3 基于K-近鄰算法的壁畫數(shù)字化色彩復原理論與方法
壁畫色彩復原的主要科學問題,可以歸納為判斷變色后的色相屬于哪種原始色彩的分類問題,此類問題使用機器學習的手段可以得到較好結(jié)果。由于已有足夠的煙熏色彩樣本空間數(shù)據(jù),對于待復原的顏色,在此樣本空間內(nèi)搜索相近的顏色數(shù)據(jù),在分類準確率較高的前提下,其搜索到的顏色所對應的色相就是待復原色彩的煙熏前色彩。
常用的機器學習分類策略包括有監(jiān)督的學習策略和無監(jiān)督的學習策略兩種,針對煙熏顏色的分類問題,由于已有具有先驗知識的人工標記訓練集,所以有監(jiān)督的學習策略更為適用。比較幾種常見的有監(jiān)督學習算法策略,K-近鄰算法可以通過計算輸入目標在樣本數(shù)據(jù)空間中最鄰近的K個樣本,通過一定的投票策略,來決定輸入目標分類的問題,最符合煙熏色彩復原所面臨的科學問題,故我們采用K-近鄰算法[11]來設計并實現(xiàn)了煙熏色彩數(shù)字化復原的理論模型。其框架如圖9所示,該方法的流程描述如下:
a)由煙熏實驗色板生成具有4維特征值的顏色訓練數(shù)據(jù)集,并對訓練集數(shù)據(jù)進行人工標注分類;
b)對于待分類顏色,選擇合適的距離函數(shù),遍歷訓練集,計算該顏色與訓練集數(shù)據(jù)的距離,并按照距離由近到遠排成隊列;
c)在2的隊列中選取k個最近鄰最為分類策略的輸入;
d)使用合適的分類策略對k個最近鄰的標記結(jié)果進行分類,得到的結(jié)果作為待復原顏色的分類;
e)調(diào)試k參數(shù)、距離函數(shù)和分類策略并重復2-4步驟,直至分類模型在測試集上達到滿意的分類準確率,將優(yōu)化迭代后的分類結(jié)果作為最終結(jié)果。
顏色訓練數(shù)據(jù)集由26塊煙熏色板按照數(shù)字化工作流程提取生成,原始數(shù)據(jù)集共28種顏色分類,包含3494440個數(shù)據(jù)點,經(jīng)過篩選與分析,去掉幾類敦煌壁畫中沒有的顏色,最后選擇六種色相共12種顏色數(shù)據(jù)作為訓練集,包括黑色色相[1(黑色)],藍色色相[5(二青)、6(三青)],綠色色相[10(頭綠)、13(二綠)、14(三綠)],黃色色相[15(土黃)、16(雌黃)],紅色色相[20(暗紅)、23(淡茶色)、28(本地土紅)],白色色相[25(仁白布粉)],共149760個數(shù)據(jù)點。每個數(shù)據(jù)點包含4維特征值,分別為RGB色彩空間的三個分量值(數(shù)據(jù)范圍0—255)和該數(shù)據(jù)點的灰度值。
顏色測試集從第156窟北壁的煙熏壁畫上產(chǎn)生,選擇壁畫上出現(xiàn)的5種色相(黑色、藍色、綠色、紅色、黃色),每種色相500個測試點,形成共2500個數(shù)據(jù)點的測試集。測試集用于驗證不同參數(shù)下K-近鄰算法的分類準確率,所以對這2500個數(shù)據(jù)點進行了人工標注,用于和分類輸出結(jié)果進行比對。
距離函數(shù)在三種常用的距離函數(shù)中進行選擇,分別是歐幾里得距離(Euclidean),余弦距離(Cosine)和曼哈頓距離(Cityblock),這三種距離的定義分別見公式2、公式3和公式4。最終距離函數(shù)的選擇還需要根據(jù)參數(shù)k的大小和分類策略進行決定,通過算法在測試樣本集上的準確率來確定。
參數(shù)大小的選擇是整個算法準確率保證的核心,衡量k參數(shù)形成的分類策略的準確率通常使用近似誤差(Approximation Error)和估計誤差(Estimation Error)兩個評價標準。近似誤差可以理解為對訓練集的分類誤差,估計誤差可以理解為對測試集的測試誤差。當選擇的k比較小時,模型的復雜度越高,近似誤差越小,估計誤差越大。而選擇的k比較大時,模型的復雜度越低,近似誤差越大,對于訓練集的數(shù)據(jù)分類越差。所以k參數(shù)的選擇要通過不斷調(diào)整參數(shù)觀察測試集的分類準確率來確定,主要方法是從一個比較小的k開始(比如k=1),逐漸增加k,觀察其對分類準確率的影響。
K-近鄰的分類策略用于在最終的k個近鄰中決定輸入數(shù)據(jù)的最終分類,具體策略包括最近鄰法(Nearest),隨機法(Random)和投票法(Consensus)。最近鄰法采用k個近鄰中分類最多的數(shù)據(jù)作為最終分類,隨機法在k個近鄰中隨機選擇一類作為最終分類,而投票法只在最終的k個近鄰都為同一分類時,將其作為最終分類,如果k個近鄰屬于兩個以上分類,則投票法不給出分類。
我們使用大小為149760的訓練集訓練K-近鄰算法的分類模型,并在2500個測試樣本集上根據(jù)k的大?。╧=1,k=3,k=5,k=25)、距離函數(shù)的選擇(Euclidean,Cosine,Cityblock)和分類策略(Nearest,Random,Consensus),進行分類準確率測試,共得到36組分類結(jié)果(部分結(jié)果如表3所示),其結(jié)果按照準確率降序排序。最終結(jié)果顯示,當k=1時,使用歐幾里得距離(Euclidean)的三種分類策略表現(xiàn)相同且最好,準確率達到96.36%。
需要說明的是,對于測試數(shù)據(jù)集96.36%的分類準確率,已經(jīng)能夠滿足煙熏色彩復原的需求,但由于敦煌壁畫的繪畫線條非常復雜,即便知道了色彩的原始顏色,自動化的復原手段也是不適用的,會導致壁畫的繪畫紋理發(fā)生破壞,只有在核心算法支撐的基礎(chǔ)上,使用交互復原的手段,才能產(chǎn)出滿足需求的復原結(jié)果。
此外,該方法尚有一定的局限性,對于不同煙熏程度的壁畫,其復原效果也會有不同。目前該方法僅適用于煙熏程度較輕的壁畫,對于煙熏程度比較重,甚至被熏為黑色的壁畫,尚且無法復原。
7 結(jié) 語
本文從敦煌煙熏壁畫的數(shù)字化色彩復原入手,利用實地調(diào)研、模擬實驗、機器學習、算法設計等方法,形成了別具創(chuàng)新性的煙熏壁畫數(shù)字化色彩復原工作流程,提出了基于機器學習的煙熏壁畫數(shù)字化色彩復原理論與方法,復原準確率可達96.36%。該理論與方法,不僅可以用于煙熏壁畫的色彩復原,也可以為其他變色壁畫的數(shù)字化色彩復原提供參考。
參考文獻:
[1]段修業(yè),李云鶴.莫高窟七十一窟煙熏壁畫清洗試驗[J].敦煌研究,1982,2:176-180.
[2]付心儀,麻曉娟,孫志軍.破損壁畫的數(shù)字化復原研究:以敦煌壁畫為例[J].裝飾,2019(1):21-27.
[3]Fu,X.Y.,Han,Y.,Sun,Z.J.,Ma,X.J.,Xu,Y.Q..Line-drawing Enhanced Interactive Mural Restoration For Dunhuang Mogao Grottoes[C]//ISPRS Annals of the Pho-togrammetry,Remote Sensing and Spatial Information Sci-ences.2017,IV-2/W2:99-106.
[4]徐永明,趙靜.基于現(xiàn)代信息技術(shù)的壁畫模擬修復:以內(nèi)蒙古大昭寺“花變主題佛”壁畫為例[J].中國藏學,2015(2):175-177.
[5]王進玉.敦煌莫高窟洞窟現(xiàn)狀調(diào)查與病害分類[J].敦煌研究,2005(6):113-117.
[6]Bikiaris,D.,S.Daniilia,S.Sotiropoulou,O.Katsimbiri,E.Pavlidou,A.P.Moutsatsou,Y.Chryssoulakis.Ochrediffer-entiation through micro-Raman and micro-FTIR spectroscopies:application on wall paintings at Meteora and Mount Athos,Greece[J].Spectrochim Acta,Part A,2000,56(1):3-18.
[7]Pita,E.,E.Proniewicz,B.Szmelter-Fausek,J.Olszewska-wietlik,L.M.Proniewicz.Micro-Raman spectroscopy ana-lysis of the 17th century panel painting‘Servilius Appius by Isaac van den Blocke[J].Raman Spectrosc,2014,45(11/12):1019-1025.
[8]Chaplin,T.D.,R.J.Clark,and B.W.Singer.Early 20th C Russian painting?Raman identification of modern pigments on a pastel supposedly Painted by the renowned artist Natalia Goncharova[J].Raman Spectrosc,2014,45(11/12):1322-1325.
[9]梁金星,萬曉霞,孫志軍,等.敦煌壁畫顏料顏色數(shù)據(jù)庫構(gòu)建方法[J].敦煌研究,2017(1):132-140.
[10]李最雄.絲綢之路石窟壁畫彩塑保護[M].北京:科學出版社,2005:54-57.
[11]Cover T,Hart P.Nearest neighbor pattern classification[J].IEEE transactions on information theory,1967,13(1):21-27.