摘要:瓷器文物碎片的識別與分類是文物考古和修復(fù)過程中的重要環(huán)節(jié),但傳統(tǒng)方法存在效率低、準(zhǔn)確率不高等問題。文章提出一種基于深度學(xué)習(xí)的瓷器文物碎片智能分類方法,通過提取碎片的紋飾、釉色、紋理等多種特征,并設(shè)計(jì)主動學(xué)習(xí)、對比學(xué)習(xí)等策略優(yōu)化模型訓(xùn)練過程,以緩解訓(xùn)練數(shù)據(jù)稀缺和類別不平衡的問題。在兩個(gè)大型瓷片數(shù)據(jù)集上的實(shí)驗(yàn)表明,該方法在準(zhǔn)確率、Macro F1值等指標(biāo)上顯著優(yōu)于其他方法,為瓷器文物碎片分類提供了一種新思路。
關(guān)鍵詞:深度學(xué)習(xí);瓷器文物;碎片處理
近來,以深度學(xué)習(xí)為代表的人工智能技術(shù)取得巨大進(jìn)展,為瓷器文物碎片分類問題提供新的解決思路。深度學(xué)習(xí)通過構(gòu)建多層神經(jīng)網(wǎng)絡(luò),能自動學(xué)習(xí)瓷片圖像中的層次化、語義化特征表示,克服人工設(shè)計(jì)特征的局限性,在紋飾分析、器型識別等方面展現(xiàn)出巨大潛力。研究旨在探索深度學(xué)習(xí)在瓷器文物碎片分類中的應(yīng)用,以期為文物考古和修復(fù)工作提供智能化支持。
一、基于深度學(xué)習(xí)的瓷器文物碎片特征提取方法
(一)瓷器紋飾特征的提取
瓷器紋飾是區(qū)分不同瓷器類別的重要視覺特征,研究提出一種基于深度學(xué)習(xí)的瓷器紋飾特征提取方法。該方法利用卷積神經(jīng)網(wǎng)絡(luò)(CNN),直接從瓷片圖像中自動學(xué)習(xí)提取紋飾的層次化、語義化特征表示。通過將瓷片RGB圖像輸入預(yù)訓(xùn)練的CNN網(wǎng)絡(luò),提取CNN中間層的特征圖作為紋飾的初始視覺特征。在初始視覺特征的基礎(chǔ)上,通過fine-tune方式在特定的瓷片紋飾圖像數(shù)據(jù)集上進(jìn)一步訓(xùn)練優(yōu)化CNN網(wǎng)絡(luò),使提取的紋飾特征與手工標(biāo)注的紋飾類別信息更加匹配,具有更強(qiáng)的語義表達(dá)能力。再利用t-SNE降維可視化方法,對提取的紋飾CNN特征進(jìn)行可視化分析。通過觀察不同類別瓷片紋飾特征在低維空間的聚類情況,直觀評估紋飾特征的區(qū)分性與代表性[1]。
(二)瓷器釉色和紋理特征的融合
除紋飾外,釉色與紋理也是表征瓷器視覺屬性的重要特征。以往的研究大多針對釉色和紋理特征分別進(jìn)行提取,缺乏對二者內(nèi)在聯(lián)系的考慮。因此,研究提出一種基于聯(lián)合稀疏表示的瓷器釉色紋理特征深度融合方法,將釉色特征和紋理特征映射到同一個(gè)低維稀疏空間,通過聯(lián)合字典學(xué)習(xí)實(shí)現(xiàn)兩種特征在空間、語義層面上的緊密耦合。在LAB顏色空間下,提取瓷片圖像的低層顏色特征,包括顏色直方圖和顏色矩。然后采用改進(jìn)的灰度共生矩陣方法,在HSV空間下計(jì)算瓷片圖像像素點(diǎn)對的二階統(tǒng)計(jì)特征,作為紋理的初始表示[2]。設(shè)提取的N個(gè)瓷片的釉色特征張量為X∈R(d1×N), 紋理特征張量為Y∈R(d2×N),其中,d1、d2分別為釉色、紋理特征的維度。聯(lián)合稀疏表示的目標(biāo)是尋找字典矩陣D∈R^(d×K)和系數(shù)矩陣A∈R(K×N), 使得X≈DcA、Y≈DtA, 且A盡量稀疏。其中,d≤min(d1,d2)為目標(biāo)低維空間的維度,K為字典中原子的個(gè)數(shù)。該問題可轉(zhuǎn)化為如公式1所示的優(yōu)化模型:
其中,||·||F表示矩陣的Frobenius范數(shù),||·||1表示矩陣的L1范數(shù),λ為平衡重建誤差與稀疏性的權(quán)重系數(shù)通過交替迭代算法優(yōu)化上述模型,可同時(shí)學(xué)習(xí)得到最優(yōu)的色彩字典Dc、紋理字典Dt以及聯(lián)合稀疏系數(shù)A。其中,A作為釉色紋理融合后的低維緊湊特征[3]。
二、基于深度學(xué)習(xí)的瓷器文物碎片識別與分類模型
(一)識別模型訓(xùn)練策略
1.樣本標(biāo)注與數(shù)據(jù)增強(qiáng)
為解決訓(xùn)練樣本的稀缺性和類別不平衡問題,研究采用主動學(xué)習(xí)和數(shù)據(jù)增強(qiáng)相結(jié)合的方式,最大化利用有限的瓷片數(shù)據(jù),合成更多高質(zhì)量的訓(xùn)練樣本。從少量已標(biāo)注的瓷片訓(xùn)練集出發(fā),主動篩選對模型提升效果最大的新樣本,送專家標(biāo)注類別[4]。該方法通過迭代優(yōu)化標(biāo)注—訓(xùn)練流程,用最少的人工標(biāo)注代價(jià),獲得最具信息量的樣本。
2.損失函數(shù)設(shè)計(jì)
針對瓷器文物碎片分類問題的特點(diǎn),模型訓(xùn)練中的損失函數(shù)設(shè)計(jì)需要考慮三個(gè)因素:
⑴類別不平衡。盡管采用數(shù)據(jù)增強(qiáng)策略,但不同類別瓷片的數(shù)量仍然存在差異,需要合理調(diào)整損失權(quán)重以重視稀缺類別[5]。
⑵硬樣本挖掘。模型應(yīng)更加關(guān)注那些容易混淆的難分樣本,加強(qiáng)判別力。
⑶特征多樣性。紋飾、釉色、形狀等多種特征應(yīng)得到均衡利用,避免單一特征主導(dǎo)分類決策。
綜合以上因素,研究設(shè)計(jì)一種自適應(yīng)權(quán)重的多特征融合損失函數(shù)。設(shè)提取的紋飾、釉色紋理、形狀特征分別為fo、fg、fs,對應(yīng)的特征維度為do、dg、ds,分類器權(quán)重矩陣為W∈R[K×(do+dg+ds)],則第i類樣本的預(yù)測概率如公式2所示:
研究在交叉熵?fù)p失的基礎(chǔ)上,引入類別權(quán)重矩陣Δ∈R^(K×K)和樣本權(quán)重向量β∈RN,如公式3:
其中,yi為樣本i的真實(shí)類別,p(i,j)為樣本i屬于類別j的預(yù)測概率。Δ(yi,j)表示第yi類樣本對第j類的損失權(quán)重,矩陣Δ的計(jì)算公式如公式4:
其中,Nj為第j類樣本的數(shù)量,γ為控制類別權(quán)重差異的超參數(shù)??梢钥闯?,Δ矩陣根據(jù)樣本數(shù)動態(tài)調(diào)整了稀缺類的損失權(quán)重,數(shù)量越少的類別獲得越大的權(quán)重,緩解類別不平衡問題[6]。
(二)考慮不平衡數(shù)據(jù)的瓷片分類模型設(shè)計(jì)
瓷器文物碎片的類別分布通常是不均衡的,一些常見器型如碗、盤等的碎片數(shù)量遠(yuǎn)多于其他器型。而深度學(xué)習(xí)分類模型對類別不平衡的數(shù)據(jù)集往往表現(xiàn)不佳,因?yàn)槟P蜁A向于只關(guān)注多數(shù)類、忽視少數(shù)類的特征。為解決該問題,研究在模型訓(xùn)練中引入分層采樣,按類別頻率對數(shù)據(jù)集進(jìn)行分層。對于低頻類別,采用過采樣的方式增加其數(shù)量,使各類別樣本數(shù)接近;對于高頻類別,則采用欠采樣策略減少樣本數(shù)。記第i類的樣本數(shù)為ni,則其采樣概率pi如公式5:
其中,K為類別總數(shù)。可以看出,pi與ni成反比,數(shù)量越多的類別被采樣的概率越低,反之則越高。通過“平衡”后的數(shù)據(jù)集再進(jìn)行訓(xùn)練,使模型對各類別給予相近的關(guān)注度。為進(jìn)一步緩解類別不平衡問題,研究在分類模型中引入對比學(xué)習(xí)范式。采用SimCLR框架,在有限的瓷片數(shù)據(jù)上,通過隨機(jī)組合紋飾、釉色、形狀等屬性,合成大量正負(fù)樣本對,并基于對比損失函數(shù)優(yōu)化網(wǎng)絡(luò),如公式6:
其中,zi和zi+分別表示第i個(gè)瓷片及其增強(qiáng)后的嵌入向量,zk為第k個(gè)負(fù)樣本的嵌入向量,sim(·)為余弦相似度,τ為溫度系數(shù)。通過最小化Lcont,模型能自動挖掘相似樣本的共性特征,抑制不同樣本的差異性,從而得到更加魯棒的特征表示,減輕類別失衡的影響。受Prototypical Network的啟發(fā),研究將每個(gè)類別的樣本映射為一個(gè)prototype向量,并基于prototype間的相似度進(jìn)行分類,避免對樣本數(shù)敏感的softmax分類器。通過prototype學(xué)習(xí),模型能自適應(yīng)地調(diào)整類別表示,緩解類別失衡問題,同時(shí)減少可訓(xùn)練參數(shù),提高小樣本下的泛化性能。
三、實(shí)驗(yàn)結(jié)果與分析
為驗(yàn)證瓷器文物碎片智能分類方法的有效性,研究在兩個(gè)大型瓷片數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)評估,并與其他經(jīng)典方法和最新方法進(jìn)行性能對比。數(shù)據(jù)集選擇兩大類別:
1.敦煌莫高窟瓷器殘片數(shù)據(jù)集,該數(shù)據(jù)集包含近年來敦煌莫高窟出土的5862塊瓷器碎片,分屬唐代61個(gè)窯口、23種器型。隨機(jī)選取80 %的碎片作為訓(xùn)練集,其余20 %作為測試集。
2.定州唐城瓷器殘片數(shù)據(jù)集,該數(shù)據(jù)集源自河北定州唐代古城遺址的考古發(fā)掘,包含唐中晚期23個(gè)窯口的4215塊標(biāo)本,共劃分為18種器型。
為全面評估模型在類別不平衡數(shù)據(jù)上的性能,研究采用六個(gè)評價(jià)指標(biāo),即準(zhǔn)確率、查準(zhǔn)率、召回率、F1值、各類別F1值算術(shù)平均、各類別F1值加權(quán)平均。
結(jié)果發(fā)現(xiàn),研究提出的模型,無論是在準(zhǔn)確率、查準(zhǔn)率、召回率還是F1值上,都顯著超過其他基線方法,尤其在Macro F1和小類別的分類性能上優(yōu)勢明顯。傳統(tǒng)機(jī)器學(xué)習(xí)方法由于特征表達(dá)能力不足,分類性能較差,且受類別不平衡的影響嚴(yán)重,小類別基本無法識別。加深網(wǎng)絡(luò)起初雖然能帶來性能的提升,但也逐漸面臨梯度消失、過擬合等問題,精度出現(xiàn)瓶頸。注意力機(jī)制和度量學(xué)習(xí)雖能在一定程度上緩解小樣本問題,挖掘更有判別力的特征,但在類別嚴(yán)重失衡的情況下仍然存在缺陷。
研究提出的模型,通過主動學(xué)習(xí)擴(kuò)充小類別樣本、對比學(xué)習(xí)挖掘不同類別的判別性特征、prototype學(xué)習(xí)自適應(yīng)調(diào)整類別表示,在多個(gè)層面緩解類別不平衡的影響,使分類器能更加關(guān)注稀疏類別,挖掘它們的細(xì)粒度差異。在兩個(gè)數(shù)據(jù)集上,本文模型的準(zhǔn)確率、Macro F1值較最優(yōu)基線分別提升2.4 %、4.8 %和3.1 %、5.2 %。結(jié)果數(shù)據(jù)充分證明本文模型的優(yōu)秀性,具有應(yīng)用意義(見圖)。
四、結(jié)語
本文的研究方法創(chuàng)新性融合紋飾、釉色、紋理等多種特征,通過主動學(xué)習(xí)、數(shù)據(jù)增強(qiáng)等方式擴(kuò)充訓(xùn)練樣本,設(shè)計(jì)自適應(yīng)權(quán)重的損失函數(shù)和多分支注意力網(wǎng)絡(luò),有效地提升碎片分類的精度和魯棒性。未來工作可進(jìn)一步拓展更多類型文物的智能分類,推進(jìn)文物大數(shù)據(jù)的構(gòu)建和應(yīng)用。
參考文獻(xiàn):
[1]劉恩盛,羅春泳,程小龍,等.基于點(diǎn)云特征提取的薄壁文物碎片配對研究10 [J].井岡山大學(xué)學(xué)報(bào)(自然科學(xué)版),2023,44(05):86-92.
[2]孫選銘,蘇淼.基于深度學(xué)習(xí)的絲綢文物紋樣識別應(yīng)用[J].絲綢,2023,60(08):1-10.
[3]趙夫群,周明全.基于多特征參數(shù)融合的文物碎片自動匹配方法[J].光學(xué)精密工程,2023,31(10):1522-1531.
[4]崔鑫,王琰,侯小剛,等.基于詞匯增強(qiáng)的典型文物命名實(shí)體識別算法[J].中國傳媒大學(xué)學(xué)報(bào)(自然科學(xué)版),2023,30(02):51-55.
[5]劉杰,耿國華,田煜,等.局部—整體雙向推理的文物無監(jiān)督表征學(xué)習(xí)[J].光學(xué)精密工程,2022,30(18):2241-2252.
[6]趙夫群,耿國華.基于特征區(qū)域劃分的文物碎片自動匹配算法[J].電子學(xué)報(bào),2022,50(06):1436-1443.
作者簡介:
王娟(1977—),女,漢族,山東菏澤人。大學(xué)本科,文博館員,研究方向:文物保護(hù)技術(shù)研究、文物修復(fù)。