中圖分類號:TP399;TU564.2 文獻(xiàn)標(biāo)志碼:A 文章編號:1000-5013(2025)04-0393-07
Color Matching Method for Stone Tessellation Process Based on Convolutional Neural Network
XIE Biaofeng CHEN Shouhong HUANG Jixiang LI Jian xin HUANG Shengui
(1.Institute of Manufacturing Engineering,Huaqiao University,Xiamen 36lO21,China; 2.Nan'an-HQU Institute of Stone Industry Innovations Technology,Quanzhou 362342,China; 3.College of Mechanical Engineering and Automation,Huaqiao University,Xiamen 361o21,China)
Abstract:To addres the problem of time-consuming manual material selection and unstable product quality in the stone tesselation process,a color matching method based on convolutional neural network model is proposed. Stone samples scanned from the production workshop were preprocessed to construct the stone image dataset. Diferent convolutional neural networks were trained to screen out the best stone classification model. In order to validate the models effectiveness,the color region of the target image was extracted and used as the input for actual production. The results demonstrated that the products produced using the proposed method were excellent in terms of color consistency,and the visual perception effect was highly similar.The proposed method significantly improve the eficiency of stone selection and ensure the stability of product quality.
Keywords:tessellation process;stone classification;convolutional neural network;process optimization
石材鑲嵌產(chǎn)品具有深厚的歷史與文化積淀,活躍于許多公共藝術(shù)舞臺及家庭裝飾中[1-3]。將不同顏色、質(zhì)地的石材拼接組合成精美圖案,能使石材鑲嵌產(chǎn)品具有色彩豐富、持久度高、環(huán)保等優(yōu)點(diǎn)[4-6]。在石材鑲嵌工藝流程中,目前采用的人工選料法雖簡單直觀,但主觀因素很難保證作品的一致性和整體視覺效果。因此,如何從龐大的石材數(shù)據(jù)庫中檢索出顏色匹配的石材,是石材鑲嵌工藝急需解決的問題。
匹配顏色合適的石材可以歸類為石材的顏色分類問題,目前石材的顏色分類研究大多基于傳統(tǒng)機(jī)器學(xué)習(xí),通過對石材圖片特征提取,并對經(jīng)典分類算法加以改進(jìn)實(shí)現(xiàn)分類。杜金華提出在HSV顏色空間里采用等間距和非等間距等方式提取顏色特征,對顏色特征進(jìn)行主成分分析降維,并采用分類器對提取的顏色特征進(jìn)行處理,以實(shí)現(xiàn)花崗石圖像分類。康利娟[8提出基于圖像顏色的石材分類方法,對圖像的顏色空間進(jìn)行轉(zhuǎn)換后提取特征值進(jìn)行量化處理,采用歐式距離和改進(jìn)的距離來計(jì)算圖像之間的相似度值。楊杰等[9]采取基于全局和局部的石材圖像顏色直方圖技術(shù)進(jìn)行分類,將 HSV 色彩空間分別與直方圖相交法和環(huán)形直方圖、角度直方圖法相結(jié)合,對不同通道給予不同的權(quán)重,對不同通道分量進(jìn)行非等間隔量化以提高石材圖像匹配的效率。盡管基于傳統(tǒng)機(jī)器學(xué)習(xí)在石材分類上取得了不錯的準(zhǔn)確率,但傳統(tǒng)機(jī)器學(xué)習(xí)依賴于手工特征提取,其準(zhǔn)確率在一定程度上依賴于特征工程的質(zhì)量和數(shù)據(jù)預(yù)處理的效果[10]。而深度學(xué)習(xí)中卷積神經(jīng)網(wǎng)絡(luò)(CNN)具有自動從圖像中提取多層次的特征,在大規(guī)模、復(fù)雜的石材分類任務(wù)中具有更高的分類準(zhǔn)確率[11-13]。
近年來,深度學(xué)習(xí)等前沿技術(shù)與工業(yè)生產(chǎn)的耦合越來越緊密,使得工業(yè)向智能制造方向轉(zhuǎn)型,從而提高了生產(chǎn)效率和自動化水平[14-15]?;诋?dāng)前工業(yè)生產(chǎn)智能化的趨勢,本文利用實(shí)際生產(chǎn)中的石材數(shù)據(jù)庫建立一個高質(zhì)量的數(shù)據(jù)集,通過卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)鑲嵌工藝流程中石材顏色匹配,以提升石材鑲嵌工藝的智能化及自動化水平。
1算法介紹
ResNeXt是由Facebook AIResearch 的研究人員于 2017 年開發(fā)出的一種卷積神經(jīng)網(wǎng)絡(luò),它在VGG 和ResNet等網(wǎng)絡(luò)基礎(chǔ)上進(jìn)行擴(kuò)展和改進(jìn),豐富了深度學(xué)習(xí)模型的設(shè)計(jì)空間,使模型擁有更高的性能和更好的泛化能力[16]。作為一種高效的深度學(xué)習(xí)模型,ResNeXt通過分組卷積和基數(shù)組的設(shè)計(jì),能夠在減少計(jì)算復(fù)雜度的同時,提升分類精度和特征提取能力。
ResNeXt核心思想在于提出的“基數(shù)\"參數(shù)的概念,即在同一層中使用多個并行路。ResNeXt模塊通過增加并行路徑的數(shù)量(基數(shù))來提高網(wǎng)絡(luò)的表達(dá)能力,而每條路徑的結(jié)構(gòu)與 ResNet模塊中的相似(圖1)。這種設(shè)計(jì)允許網(wǎng)絡(luò)在保持計(jì)算復(fù)雜度不變的條件下,通過增加基數(shù)來提高性能。
Fig.1Comparison of ResNet and ResNeXt residual module structures
以 ResNeXt-50(32×4d) 為例,它表示一個包含50層、每個殘差模塊使用32個分組卷積、每組通道數(shù)為4d的卷積網(wǎng)絡(luò)。ResNeXt殘差模塊結(jié)構(gòu)采用3層卷積結(jié)構(gòu),首先通過 1×1 卷積將輸人特征通道數(shù)降維;然后通過 3×3 卷積進(jìn)行主特征提取操作;再通過 1×1 卷積升維以恢復(fù)通道數(shù);最后將并行路徑的輸出結(jié)果聚合到一起求得最終的輸出。一組聚合轉(zhuǎn)換可以表示為
式(1)中: F(x) 表示一組聚合轉(zhuǎn)換的輸出; Ti(x) 表示任意一個可以將輸入數(shù)據(jù)進(jìn)行映射轉(zhuǎn)換的函數(shù); c表示基數(shù)參數(shù),決定網(wǎng)絡(luò)的并行路徑個數(shù)。
2試驗(yàn)方案
2.1 石材圖像的掃描
用于石材分類模型訓(xùn)練的圖像數(shù)據(jù)均來自南安市水頭鎮(zhèn)某石材企業(yè)實(shí)地生產(chǎn)的圖像數(shù)據(jù)。從礦山上開采的原料經(jīng)過切割、磨削、拋光等加工工序處理后變成一系列規(guī)格尺寸的石材大板,通過鏈?zhǔn)?07智能掃描儀(圖2)拍攝記錄這些石材大板的顏色、尺寸等圖像信息。智能掃描儀總功率為 1 000W ,最大掃描尺寸為 4000mm×2200mm×40mm ,最大掃描速度為 15m ·min-1 ,線陣分辨率為 8 192px ,鏡頭畸變率不超過 1% ,最高采樣速率為 50kHz ,輸出的圖像格式為JPEG。
2.2 數(shù)據(jù)集的建立
石材大板掃描輸出的初始數(shù)據(jù)集示例,如圖3所示。掃描圖中的石材輪廓復(fù)雜,數(shù)據(jù)信息參差不齊,對模型訓(xùn)練存在干擾,需要對掃描的石材圖片進(jìn)行訓(xùn)練前預(yù)處理,剔除石材圖像冗余的黑色背景及標(biāo)尺信息,最大化保留石材部分圖像以作為模型訓(xùn)練的數(shù)據(jù)集樣本。
采用截取石材部分的最大內(nèi)接矩形圖像的方案,石材圖像截取程序,如表1所示。
石材圖像數(shù)據(jù)集有169種類別,共12539張石材圖像,其中包括訓(xùn)練集10067張和測試集2472張。
3 試驗(yàn)結(jié)果與分析
3.1分類模型參數(shù)
為驗(yàn)證卷積神經(jīng)網(wǎng)絡(luò)在石材圖像分類中的有效性,采用ResNeXt網(wǎng)絡(luò)作為主干結(jié)構(gòu),進(jìn)一步探討其在圖像目標(biāo)區(qū)域顏色選材方面的可行性??紤]網(wǎng)絡(luò)深度對特征提取能力與計(jì)算復(fù)雜度的影響,對ResNeXt50、ResNeXt101和ResNeXt152三種不同深度模型進(jìn)行訓(xùn)練,比較其在石材分類任務(wù)中的表現(xiàn)。同時,將ResNeXt與經(jīng)典網(wǎng)絡(luò)模型AlexNet、VGG 和ResNet進(jìn)行對比,分析深層網(wǎng)絡(luò)在該任務(wù)中的優(yōu)勢與局限。其中,AlexNet作為較早推動深度學(xué)習(xí)圖像分類突破的模型,結(jié)構(gòu)較為簡潔,適用于中等規(guī)模數(shù)據(jù)集[17;VGG通過堆疊大量 3×3 卷積核加深網(wǎng)絡(luò),提高了特征提取的細(xì)致度[18];ResNet引人殘差連接,緩解深層網(wǎng)絡(luò)訓(xùn)練中的梯度消失問題,支持更深的結(jié)構(gòu)構(gòu)建[19]。為確保實(shí)驗(yàn)的公平性,在訓(xùn)練不同網(wǎng)絡(luò)時統(tǒng)一了數(shù)據(jù)預(yù)處理、訓(xùn)練環(huán)境、超參數(shù)和策略,確保性能差異主要源于模型結(jié)構(gòu)本身。
算法采用ResNeXt作為主干網(wǎng)絡(luò),使用多分類交叉熵?fù)p失函數(shù)衡量模型的預(yù)測概率分布與真實(shí)標(biāo)簽分布之間的差異,從而訓(xùn)練和優(yōu)化網(wǎng)絡(luò)模型。優(yōu)化過程采用隨機(jī)梯度下降(SGD),以最小化損失函數(shù)并優(yōu)化模型參數(shù)。學(xué)習(xí)率和動量系數(shù)為模型訓(xùn)練的超參數(shù),初始設(shè)置為0.01和0.9。學(xué)習(xí)率采用階梯式下降策略,每30個訓(xùn)練周期后,學(xué)習(xí)率衰減為原來的0.1倍,以幫助加速收斂并減少振蕩。訓(xùn)練過程共進(jìn)行300次遍歷,每個批次的樣本數(shù)設(shè)置為32。模型訓(xùn)練實(shí)驗(yàn)流程,如圖4所示。
3.2 訓(xùn)練分析
不同石材圖像分類網(wǎng)絡(luò)模型訓(xùn)練結(jié)果,如表2所示。由表2可知以下2點(diǎn)結(jié)論。
1)VGG和ResNet等網(wǎng)絡(luò)模型都在 50~100 次的迭代周期間實(shí)現(xiàn)收斂,而ResNeXt網(wǎng)絡(luò)模型在50 次之內(nèi)就完成收斂。
2)在基于收集的石材圖像數(shù)據(jù)集進(jìn)行的圖像分類訓(xùn)練實(shí)驗(yàn)中,ResNet系列網(wǎng)絡(luò)模型的準(zhǔn)確率為70%~80% ,VGG系列網(wǎng)絡(luò)模型的準(zhǔn)確率為 90%~95% ,而ResNeXt系列網(wǎng)絡(luò)模型的準(zhǔn)確率均達(dá)到97% 以上。
3.3 模型效果評估
采用石材圖像數(shù)據(jù)集的測試集對訓(xùn)練后的模型進(jìn)行驗(yàn)證,通過Top-1準(zhǔn)確率 (ηA1 )、Top-5準(zhǔn)確率1 ?ηA5? )、平均準(zhǔn)確率 、平均召回率
和 F1得分 (SF1)5 項(xiàng)指標(biāo)來評估模型的分類效果。
Top-1準(zhǔn)確率用于衡量模型預(yù)測的第一選擇是否正確,其計(jì)算式為
Top-5準(zhǔn)確率用于衡量模型在前5個預(yù)測中是否包含正確答案,其計(jì)算式為
平均準(zhǔn)確率是指所有類別的分類準(zhǔn)確率的平均值,反映模型對各類別的整體表現(xiàn),其計(jì)算式為
式(4)中: C 是類別數(shù)。
平均召回率用來評估模型對正類樣本的識別能力,關(guān)注對正樣本的覆蓋程度,其計(jì)算式為
弋(5)中: TPi 為類別 i 的真正例樣本數(shù)量; FNi 為類別 i 的假負(fù)例樣本數(shù)量。
F1得分結(jié)合準(zhǔn)確率和召回率,綜合評估模型的分類性能,其計(jì)算式為
式(6)中: ηP,i 為類別 i 的精度; ηR,i 為類別 i 的召回率。
各網(wǎng)絡(luò)模型對應(yīng)的5項(xiàng)指標(biāo)評估結(jié)果,如表3所示。
由表3可知:AlexNet網(wǎng)絡(luò)模型未收斂未記錄;ResNet系列網(wǎng)絡(luò)模型對應(yīng)的5項(xiàng)評估值都較低;VGG系列網(wǎng)絡(luò)模型的 ηAl 值在 89%~95% 范圍內(nèi), 和
值在 90%~95% 范圍內(nèi);而 ResNeXt系列網(wǎng)絡(luò)模型的所有指標(biāo)都達(dá)到了最高值。由此可知,相比AlexNet、VGG和ResNet 等網(wǎng)絡(luò)模型,ResNeXt系列網(wǎng)絡(luò)模型更加適用于文中采集的石材圖像數(shù)據(jù)集,說明ResNeXt網(wǎng)絡(luò)模型的多分支架構(gòu)和組卷積設(shè)計(jì)能夠更高效地捕獲石材圖像中的復(fù)雜特征,進(jìn)一步驗(yàn)證了ResNeXt網(wǎng)絡(luò)模型在石材圖像分類領(lǐng)域的適用性。而ResNeXt系列網(wǎng)絡(luò)模型中,分類效果最好的是ResNeXt1O1,ResNeXt101擁有適中的深度,相比ResNeXt50,它能更好地捕捉到復(fù)雜特征;受限于實(shí)際車間建立的訓(xùn)練數(shù)據(jù)規(guī)模,ResNeXt152的過深網(wǎng)絡(luò)帶來了噪聲訓(xùn)練和參數(shù)冗余,使其分類效果反而不如ResNeXt101。
3.4 工程驗(yàn)證
采用具體實(shí)例驗(yàn)證基于ResNeXt網(wǎng)絡(luò)模型實(shí)現(xiàn)石材大板顏色匹配的可行性及有效性。樣例測試圖,如圖5所示。圖5中包含3種主要顏色,采用ResNeXt101訓(xùn)練的分類模型對樣例圖中的每種顏色逐一處理。
首先,借助圖像處理技術(shù)對樣例圖中的顏色區(qū)域進(jìn)行標(biāo)記,明確需要進(jìn)行分類的具體位置,確保后續(xù)處理的針對性和準(zhǔn)確性。依據(jù)標(biāo)記區(qū)域的坐標(biāo)從原樣例圖中裁剪出對應(yīng)的子圖,獲得包含單一顏色區(qū)域的圖像數(shù)據(jù)。為滿足分類模型的輸人要求,所有裁剪后的子圖被統(tǒng)一調(diào)整為固定規(guī)格(大小為 224px×224px) 。通過標(biāo)準(zhǔn)化處理,消除因圖像大小不一致對模型輸入造成的干擾,提高預(yù)測的穩(wěn)定性。其次,將這些裁剪并標(biāo)準(zhǔn)化后的圖像輸人到預(yù)先訓(xùn)練好的ResNeXt1O1網(wǎng)絡(luò)模型中。模型輸出該圖像最大概率可能的石材類別,選定為該區(qū)域圖案的預(yù)測結(jié)果,如圖6所示。
為驗(yàn)證研究的必要性,將模型選材與人工選材進(jìn)行了樣例測試的橫向?qū)Ρ?。?shí)驗(yàn)中,記錄了多名工人根據(jù)顏色在石材數(shù)據(jù)庫中進(jìn)行選材所花費(fèi)的時間及選擇出的石材種類。結(jié)果表明,工人在檢索數(shù)據(jù)庫時所用的時間與其選擇的石材種類存在顯著差異。具體來說,由于數(shù)據(jù)庫龐大且種類繁多,工人在從數(shù)據(jù)庫中選擇相匹配石材時,通常需要花費(fèi)較長時間,且選擇的石材種類較為多樣。而使用基于深度學(xué)習(xí)模型的自動選材系統(tǒng)能夠根據(jù)顏色特征自動匹配數(shù)據(jù)庫中的石材類型,模型選材的時間明顯減少,且選擇出的石材種類具有一致性。
通過上述流程,根據(jù)樣例圖生產(chǎn)出來的鑲嵌實(shí)物圖,如圖7所示。ResNeXt101網(wǎng)絡(luò)模型實(shí)現(xiàn)了對樣例圖中每種顏色的精準(zhǔn)識別與分類驗(yàn)證,證明了其在石材大板顏色匹配任務(wù)中的適用性和可靠性;與傳統(tǒng)人工選材進(jìn)行了橫向?qū)Ρ?,表明ResNeXt1O1網(wǎng)絡(luò)模型能夠顯著提高選材效率和產(chǎn)品一致性,驗(yàn)證了采用ResNeXt1O1網(wǎng)絡(luò)模型選材的必要性。
4結(jié)論
石材鑲嵌產(chǎn)品歷史悠久,具有豐富的文化內(nèi)涵,同時也能帶來較高的經(jīng)濟(jì)效益。針對在石材鑲嵌產(chǎn)品的制作工藝流程中如何從龐大的石材數(shù)據(jù)庫中快速挑選出顏色匹配的石材這一實(shí)際需求,提出一種基于卷積神經(jīng)網(wǎng)絡(luò)模型的石材鑲嵌工藝顏色匹配方法。首先,對石材數(shù)據(jù)庫中復(fù)雜多樣的石材大板圖像進(jìn)行預(yù)處理構(gòu)建數(shù)據(jù)集;然后,對比不同卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練結(jié)果,篩選出在該數(shù)據(jù)集上分類效果最好的網(wǎng)絡(luò)模型。實(shí)驗(yàn)結(jié)果表明,ResNeXt1O1網(wǎng)絡(luò)模型在文中構(gòu)建的數(shù)據(jù)集上的分類性能最佳。
基于ResNeXt1O1網(wǎng)絡(luò)模型進(jìn)行工程驗(yàn)證,提取樣例圖中的各個顏色區(qū)域片段進(jìn)行標(biāo)準(zhǔn)化處理,作為模型輸入,模型輸出為該顏色區(qū)域片段最大概率歸屬的石材類別。實(shí)際生產(chǎn)表明,輸入的顏色圖像片段與歸類的石材類別在顏色一致性方面表現(xiàn)優(yōu)異,生產(chǎn)的鑲嵌成品與目標(biāo)圖案高度一致。將文中方法運(yùn)用于石材鑲嵌行業(yè),為在大規(guī)模石材數(shù)據(jù)庫中進(jìn)行精準(zhǔn)石材匹配提供了高效、實(shí)用的解決方案。
參考文獻(xiàn):
[1]熊瑛子.石材鑲嵌藝術(shù)在中國當(dāng)代壁畫創(chuàng)作中的運(yùn)用[J].天工,2022,36(1):90-92.DOI:10.3969/j.issn.2095-7556.2022.01.024
[2]熊瑛子.石材鑲嵌藝術(shù)風(fēng)格研究[J].美術(shù)文獻(xiàn),2019(5):9-11.DOI:10.16585/j.cnki.mswx.2019.05.005.
[3]熊瑛子.石材鑲嵌藝術(shù)材料與創(chuàng)作手法分析[J].藝術(shù)品鑒,2019,15(12):294-295.
[4] 陳瑤.中國傳統(tǒng)家具鑲嵌藝術(shù)及現(xiàn)代化技術(shù)的研究[D].長沙:中南林業(yè)科技大學(xué),2006.
[5]陳韞如.清代宮廷家具中的鑲嵌工藝[J].文物鑒定與鑒賞,2022(8):116-119.DOI:10.2000/j.cnki.issn.1674-8697.2022.08.
[6]李佳明.傳統(tǒng)鑲嵌工藝在當(dāng)代漆藝中的運(yùn)用[D].沈陽:魯迅美術(shù)學(xué)院,2019.
[7] 杜金華.基于顏色特征和邏輯回歸的飾面花崗石圖像識別技術(shù)研究[D].廈門:華僑大學(xué),2018.
[8] 康利娟.基于圖像顏色的石材分類算法及測試平臺研究與實(shí)現(xiàn)[D].武漢:武漢理工大學(xué),2009.
[9]楊杰,楊靜宜.基于顏色直方圖的石材圖像檢索[J].武漢理工大學(xué)學(xué)報(bào)(信息與管理工程版),2009,31(2):173-176.DOI:10.3963/j. issn. 1007-144X. 2009.02. 001.
[10] 黃士真,耿棟.基于神經(jīng)網(wǎng)絡(luò)的建筑裝飾石材智能分類研究:以天然大理石分類為例[J].廣西城鎮(zhèn)建設(shè),2023(2):90-97.DO1:10.3969/j. issn.1672-7045.2023.02.011.
[11]AGRAWAL N,GOVIL H.A deep residual convolutional neural network for mineral classfication[J].Advances inSpace Research,2023,71(8):3186-3202.DO1:10.1016/j.asr. 2022.12.028.
[12]TROPEA M,F(xiàn)EDELE G,DE LUCA R,et al.Automatic stones clasification through a CNN-based approach[J].Sensors,2022,22(16) :6292.DO1:10.3390/s22166292.
[13]劉晨,趙曉暉,梁乃川,等.基于 ResNet50 和遷移學(xué)習(xí)的巖性識別與分類研究[J].計(jì)算機(jī)與數(shù)字工程,2021,49(12):2526-2530.DO1:10.3969/j. issn.1672-9722.2021.12.020.
[14]程志清.基于深度學(xué)習(xí)的工業(yè)機(jī)器人視覺引導(dǎo)方法研究[J].信息記錄材料,2024,25(12):110-112.DOI:10.16009/j.cnki.cn13-1295/tq. 2024.12. 048.
[15]檀為龍.深度強(qiáng)化學(xué)習(xí)在智能制造中的創(chuàng)新應(yīng)用與趨勢展望[J].中國戰(zhàn)略新興產(chǎn)業(yè),2024(33):161-163.DOI:10.3778/j. issn.1002-8331. 2008-0431.
[16]XIE Saining,GIRSHICK R,DOLLAR P,etal.Aggregated residual transformations for deep neural networks[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Honolulu: IEEE Press,2017:5987-5995.DOI:10.1109/CVPR.2017.634.
[17]BOUDIAF A,BENLAHMIDI S,DAHANE A,et al.Development of hybrid models based on alexnet and machinelearning approaches for strip stee surface defect clasificationJ]. Journal of Failure Analysis and Prevention,2024,24(3):1376-1394.DO1:10.1007/s11668-024-01927-5.
[18]WANG Wei,ZHANG Chengwen,TIAN Jinge,et al. High-resolution radar target recognition via inception-basedVGG(IVGG) networks[J]. Computational Intellgence and Neuroscience,2020,2020(1):8893419.DOI:10.1155/2020/8893419.
[19]MAHAUR B,MISHRA K K,SINGH N. Improved residual network based on norm-preservation for visual recog-nition[J]. Neural Networks,2023,157:305-322.DOI:10.1016/j.neunet.2022.10.023.
(責(zé)任編輯:黃曉楠 英文審校:吳躍勤)