一、研究背景
樂器板材的紋理特征如順直度、間距、傾斜度等作為聲學振動性能的核心指標,直接影響樂器的音色品質與聲學穩(wěn)定性。傳統(tǒng)選材依賴技師主觀經驗,通過“觀紋理”進行人工判斷,存在效率低、可重復性差的問題。黃英來對民族樂器木質共鳴體的研究表明,紋理間距與振動特性呈顯著相關性[1],但現有研究多局限于單一物理參數測試,缺乏對紋理特征的系統(tǒng)量化建模。盡管基于圖像處理的技術如邊緣檢測、灰度投影法等已嘗試替代人工檢測,但其在對小于0.1mm的微小裂紋識別和多尺度紋理融合上仍存在局限[2]。Duerinck等通過復合材料樂器的模態(tài)分析發(fā)現,紋理傾斜度偏差超過2%會導致共振頻率偏移 5%~8%[3] ,這要求檢測系統(tǒng)具備亞像素級的幾何特征捕捉能力。筆者使用支持向量機算法,結合古琴共鳴板木材表面紋理特征,建立古琴面板質量預測模型,但對于非古琴樂器檢測效果則未知[4]?;谏疃葘W習的YOLOv3算法因其多尺度目標檢測能力,為紋理特征的自動化分析提供了新思路。樂器板材的紋理檢測面臨兩大挑戰(zhàn):其一,裂紋、蟲蛀等缺陷的像素占比不足 0.5% ,屬于典型的小目標檢測問題[2];其二,紋理特征需與聲學參數如動態(tài)彈性模量、聲輻射阻尼系數等建立映射關系,需結合結構化知識建模方法[5。梁美佳等通過改進YOLOv3的錨框聚類和雙向特征融合,將小目標檢測精度提升至84. 5%[6] ,但其研究對象為列車環(huán)境圖像,未涉及木材紋理的物理特性適配。楊揚利用廣義回歸神經網絡(GRNN)建立振動參數與音質的關聯(lián)模型[7],但未解決紋理特征的實時檢測問題。這凸顯了跨模態(tài)數據融合與領域知識嵌入的必要性。為實現紋理特征的結構化表征,特征圖譜與知識圖譜技術的結合成為關鍵路徑。劉亞嵐等在地震災害遙感分析中構建了光譜-紋理-色彩特征圖譜[8],證明圖譜技術可實現復雜特征的多維度量化表達。梁雪劍在高光譜圖像分類中提出“圖譜協(xié)同”方法,通過融合紋理統(tǒng)計特征與物化參數,顯著提升了類間分類精度9。在木材檢測領域,譚菲融合Tamura紋理特征與統(tǒng)計參數,構建了木板材分類模型[10],但其特征圖譜未嵌入樂器選材標準,難以直接應用于樂器質量評估。針對上述問題,本研究提出“YOLOv3-圖譜協(xié)同框架”,整合特征圖譜(量化紋理參數)與知識圖譜(映射質量規(guī)則),實現紋理質量等級的自動分類。首先基于YOLOv3算法進行多項改進,包括多尺度特征融合、引入卷積塊注意力模塊(CBAM)以及優(yōu)化損失函數等,以提高對小目標和密集紋理區(qū)域的檢測性能;其次整合圖譜檢測技術,利用灰度投影曲線和邊緣響應量化紋理特征,并應用知識圖譜進行質量評估,最后實現紋理質量等級的自動分類。王建軍等(2021)在遙感圖像中通過增加淺層卷積深度和RFB模塊,使小目標檢測mAP提升6. 49%[11] ,該方法可適配樂器板材的紋理分析場景。陳立君(2015)利用協(xié)方差矩陣流形特征融合紋理屬性,其91.67%的分類準確率為知識規(guī)則的構建提供了可行性驗證[12]。通過跨學科方法整合,本研究可改進傳統(tǒng)檢測技術的瓶頸,為樂器制造業(yè)提供可量化的科學選材方案。
二、材料與方法
采用Canon850D相機在5000K均勻光照下拍攝2000張泡桐木和云杉板材,圖像分辨率為 5568×3712 像素,圖像標注采用LabelImg工具標注紋理關鍵點、缺陷區(qū)域及質量等級(“一等品”“二等品”“不合格”),并通過Mosaic和Mixup技術將訓練集1600張原始圖像擴展至4800張用于模型訓練。驗證集為200張,用于超參數調整。測試集為200張,用于最終性能評估。數據預處理包括調整圖像大小至 416×416 像素,像素值歸一化至[0,1],概率0.5的隨機水平翻轉。數據增強采用Mosaic(4張圖像拼接)和Mixup(混合比例0.5),將訓練集擴展至4800張圖像。測試機硬件配置為Intel 14900K中央處理器,GeForceRTX 4090 24GB顯卡,128GB RAM內存。
(一)改進的YOL0v3算法
因在實時檢測任務中表現出的高效性,本研究采用YOLOv3作為基礎目標檢測算法,但原始YOLOv3在檢測樂器板材紋理中的小目標(如細微裂紋)和密集目標時存在不足,為此進行了多項針對性改進,以提升檢測性能。針對小目標檢測難題,引入了多尺度特征融合策略,樂器板材紋理多為小尺寸目標,而原始Y0L0v3深層特征圖因降采樣倍數較大丟失細節(jié),為解決此問題,借鑒特征金字塔網絡(FPN)的思想,在Darknet53主干網絡第2殘差塊后新增殘差單元生成4倍降采樣的特征圖(分辨率為 104×104) ,保留紋理細節(jié)。隨后將深層特征圖(8倍和16倍降采樣)通過雙線性上采樣調整至淺層特征圖尺度,采用元素級相加融合,融合特征圖兼具深層語義信息和淺層空間細節(jié)。新增的 104×104 檢測層通過 3×3 和1 .×1 卷積生成預測結果,進一步提升小目標檢測精度。融合特征圖計算公式為:Ffused=Fshallow+Upsample(Fdeep) 。其中, Ffused 為淺層特征圖, Fshallow 為深層特征圖,Upsample為雙線性上采樣。
為增強模型對紋理密集區(qū)域的關注,在檢測頭前引入卷積塊注意力模塊(CBAM),通道注意力權重計算為:Mc=σ(MLP(AvgPool(F))+MLP(MaxPool(F))) 。該模塊通過通道注意力和空間注意力自適應調整特征圖權重,突出紋理特征并抑制背景噪聲??臻g注意力權重為: Ms=σ(f7×7([AvgPool(F);MaxPool(F)])) 。
其中通道注意力通過全局平均池化和最大池化生成通道權重向量,經多層感知機計算重要性得分,與原始特征圖相乘增強紋理相關通道響應,空間注意力則在通道注意力輸出上沿通道軸計算平均值和最大值生成二維空間注意力圖,通過 7×7 卷積生成空間權重,突出紋理區(qū)域,顯著提升檢測準確性。增強特征計算公式為: F′=Mc?F+Ms?F
在先驗框優(yōu)化中,使用K-mean: S++ 聚類算法分析數據集標注框,生成9組新先驗框尺寸,如 5×10,8×15 12×20 , 30×40 像素,適配紋理目標寬高比,同時將邊界框回歸損失從均方誤差(MSE)更換為GIoULoss以提高定位精度: ,并引入Focal Loss調整分類損失權重: FL(pt)=-α(1-pt)γlog(pt) 。
解決紋理密集區(qū)域正負樣本不平衡問題,總損失函數設計為:LoSS λ=λ1 GIoULoss +λ2 ·FocalLoss,綜合提升模型檢測性能。
(二)圖譜檢測技術的整合
為將紋理特征量化并支持質量評估,本研究整合圖譜檢測技術與改進的YOLOv3算法,涉及特征圖譜構建和知識圖譜應用。在特征圖譜構建中,基于YOLOv3輸出特征圖提取紋理的灰度投影曲線和邊緣響應等量化指標,灰度投影曲線通過對紋理區(qū)域水平和垂直投影生成,通過檢測峰值和谷值計算間距(峰值間距離)和順直度(曲線平滑度),反映紋理間距和順直度?;叶韧队扒€計算公式為: 。邊緣響應采用改進Canny算子提取紋理邊緣,加入高斯濾波( σ=1.5 )減少噪聲,使用自適應閾值(0tsu方法)適應不同圖像對比度,基于邊緣計算邊緣密度和傾斜度構成特征圖譜,為質量評估提供數據支持。偽代碼示例如下:
在知識圖譜應用中,構建樂器板材紋理知識圖譜,節(jié)點包括紋理參數(如間距、傾斜度、邊緣密度)和質量等級(“一等品”“二等品”“不合格”),關系定義參數與質量等級映射規(guī)則,如“紋理間距1. 8cm~2.5cm 且傾斜度 ?1° 對應一等品”[13],使用Drools規(guī)則引擎根據特征圖譜數據自動匹配規(guī)則,輸出評估結果,提升評估效率和可解釋性,使質量評估更客觀透明。偽代碼示例如下:
1.if (1.8lt;= spacinglt;=2.5)and (tiltlt;=1)and (defects==0):
2. quality Σ=Σ \" 一等品”
3.elif(1.8 1lt;= spacing ?=2,5? and(tilt ?= 3 )and(defects ?=1? :
4. quality Σ=Σ \"二等品”
5.else:
6. quality=\"不合格\"
(三)模型訓練策略
為提高模型訓練效率和性能,本研究采用多種優(yōu)化策略,包括遷移學習、學習率調度和模型剪枝。在遷移學習中,基于COCO數據集預訓練的YOLOv3模型進行微調,凍結Darknet53前50層,僅訓練后層和檢測頭,初始學習率0.001,利用預訓練模型特征提取能力加速收斂并減少數據需求。在學習率調度中,采用余弦退火策略,學習率調度采用余弦退火策略,周期 T=100 epochs,初始學習率 ηmax=0. 001 ,最小學習率 ,公式為: ηt=
,其中 ηt 為當前學習率, T 為調度周期。通過通道重要性分析剪除 30% 冗余通道,模型參數量減少約 40% ,保持檢測精度基本不變。
三、實驗過程與結果分析
(一)模型訓練
實驗過程分為三個階段:模型訓練、性能評估和對比分析。在訓練階段,以COCO數據集預訓練的YOLOv3模型作為初始權重,凍結Darknet53骨干網絡的前50層,僅微調后續(xù)層和檢測頭。優(yōu)化器選用AdamW(權重衰減0.01),初始學習率設為0.001,并通過余弦退火調度(周期50個epochs,最小學習率0.0001)動態(tài)調整學習率。批次大小為32,總訓練輪數為100epochs,并設置早停機制,即驗證集mAP連續(xù)10個epochs無提升時終止訓練。訓練后的識別效果如圖1所示。性能評估階段在測試集上計算mAP@0.5、召回率和推理速度,并結合知識圖譜評估質量分類準確率。對比分析則通過與原始YOLOv3和FasterR-CNN的性能對比,以及模塊化測試,剖析各改進模塊的貢獻。
(二)性能評估
改進YOLOv3在測試集上的檢測性能顯著優(yōu)于基準模型。表3.1總結了不同模型在mAP@0.5、召回率和推理速度上的表現。改進Y0L0v3的mAP@0.5達到85. 6% ,相比原始Y0L0v3的78.2%提升了7.4個百分點,相比FasterR-CNN的81. 4% 提升了4.2個百分點。召回率方面,改進Y0L0v3為92. 3% ,高于原始YOL0v3的85.7%和FasterR-CNN的88. 9% 。在推理速度上,改進YOLOv3達到35FPS,雖略低于原始YOLOv3的38FPS,但遠超Faster R-CNN的12 FPS,滿足實時應用需求。如表1所示:
訓練和驗證損失曲線方面,訓練集損失持續(xù)下降,驗證集損失在第70輪后趨于穩(wěn)定,表明模型收斂良好且未出現過擬合。
(三)質量評估性能
改進Y0L0v3結合知識圖譜在質量評估中的分類準確率達到91. 5% 。表2展示了質量分類混淆矩陣,其中“一等品”的分類準確率為95. 52% ,“二等品”為85. 07% ,“不合格”為90. 48% ?;煜饕l(fā)生在“二等品”與“不合格”之間,后續(xù)工作需優(yōu)化特征區(qū)分能力。
(四)模塊化分析
模塊化測試結果表3說明了各改進模塊對性能提升的貢獻。從原始YOL0v3的mA .P@0.5 ( 78.2% )開始,多尺度特征融合將其提升至81. 4% (增益 3.2% ),注意力機制(CBAM)進一步提升至83. 9% (增益 2.5% ),損失函數改進(GIoU + FocalLoss)最終達到85. 6% (增益1. 7% )。改進的累積效應顯著增強了模型性能。
四、討論
實驗結果表明,改進YOLOv3在樂器板材紋理檢測和質量評估中表現出顯著優(yōu)勢。多尺度特征融合增強了對小目標的檢測能力,注意力機制提高了模型對紋理密集區(qū)域的關注度,損失函數改進優(yōu)化了邊界框回歸和分類精度,從而共同提升了檢測性能。質量評估中,知識圖譜的應用使分類準確率達到91. 5% ,但“二等品”與“不合格”之間的混淆表明特征提取和規(guī)則定義仍有優(yōu)化空間。推理速度為35FPS,滿足實時性要求,未來通過模型剪枝可進一步提升效率。模塊化分析確認了多尺度特征融合的貢獻最大,其次為注意力機制和損失函數改進。然而,研究存在一定局限性,如200張圖像的數據集規(guī)模較小、知識圖譜的完備性不足。后續(xù)工作可通過擴展數據集和優(yōu)化圖譜規(guī)則進一步提升模型性能。
參考文獻:
[1]黃英來.幾種典型民族樂器木質共鳴體的聲學振動性能檢測與分析[D].東北林業(yè)大學,2013.
[2]戴維.基于紋理統(tǒng)計方法的木材類型識別研究[D].湖南大學,2012.
[3]uerinck
[4]曹野.基于計算機紋理分析和支持向量機的古琴面板品質預測[J].南京藝術學院學報(音樂與表演),2024,(01):53-58.
[5]李秀玲,張樹生,黃瑞,等.基于工藝知識圖譜的異構CAM模型結構化建模方法[J].計算機輔助設計與圖形學學報,2018,30(07):1342-1355.
[6]梁美佳,劉昕武,胡曉鵬.基于改進YOL0V3的列車運行環(huán)境圖像小目標檢測算法[J].計算機應用,2023,43(08):2611-2618.
[7]楊揚.基于木材振動特性的月琴聲學品質廣義回歸神經網絡預測模型[J].森林工程,2024,40(04):160-167.
[8]劉亞嵐,許清,鄭澤忠,等.典型地震次生地質災害多光譜遙感影像特征圖譜研究[J].遙感技術與應用,2015,30(01):18-24.
[9]梁雪劍.高光譜圖像地物相對含水量反演及精細分類研究[D].哈爾濱工業(yè)大學,2023.
[10]譚菲.基于特征融合的實木板材紋理判別研究[D].東北林業(yè)大學,2014.
[11]王建軍,魏江,梅少輝,等.面向遙感圖像小目標檢測的改進YOLOv3算法[J].計算機工程與應用,2021,57(20):133-141.
[12]陳立君.基于流形支持向量機的木材表面缺陷識別方法的研究[D].東北林業(yè)大學,2015.
[13]國家林業(yè)局.民族樂器鋸材第2部分:琵琶用材.[S],2011.
作者簡介:曹野,沈陽音樂學院音樂科技系教師
本文為沈陽音樂學院青年項目“YOL0v3算法結合圖譜檢測技術對樂器板材的紋理分析”(2021-2022YLQ02)結題成果。