張翔 張守震
摘 要:基于深度學習方法對數(shù)據(jù)集進行特征提取。傳統(tǒng)的殘差神經(jīng)網(wǎng)絡有效解決了網(wǎng)絡層數(shù)過深帶來的梯度彌散問題,但是低網(wǎng)絡層高分辨率對圖像語義特征提取不足,高網(wǎng)絡層低分辨率對圖像細節(jié)特征提取不足,課題研究提出了一種多尺度特征融合的方式改進網(wǎng)絡,以提升特征提取的質(zhì)量。通過遷移學習的方式在PCB圖像數(shù)據(jù)集上訓練該網(wǎng)絡并進行驗證,相比于其他神經(jīng)網(wǎng)絡得到明顯提升。對大規(guī)模數(shù)據(jù)集挖掘進行的研究有助于解決關(guān)聯(lián)規(guī)則挖掘時的內(nèi)存瓶頸問題,提高聚類算法的執(zhí)行效率以及結(jié)果的質(zhì)量,對以后相關(guān)的研究工作也有一定的借鑒意義。
關(guān)鍵詞:神經(jīng)網(wǎng)絡;特征提取;深度學習
圖像數(shù)據(jù)集的內(nèi)容千變?nèi)f化,想要通過單一的一種特征很難描述出圖像完整的信息,借助某一個特征進行的圖像檢索的結(jié)果也并不十分滿意,所以可嘗試將不同的特征融合,采取多特征相結(jié)合的方式進行圖像檢測以提高準確率。不同的特征能夠反映出不同部位的信息,整體信息和細節(jié)信息也都不一樣,因此特征也可以被分為全局特征和局部特征。在數(shù)據(jù)挖掘和知識發(fā)現(xiàn)中利用約束信息可以提高挖掘的效率、精度等等。事實上,對于大規(guī)模數(shù)據(jù)集而言,可能蘊含著巨大的關(guān)聯(lián)規(guī)則。如果盲目地進行挖掘,不僅效率很低,而且可能發(fā)現(xiàn)很多不相關(guān)的規(guī)則。利用約束,可以對具體的關(guān)聯(lián)規(guī)則挖掘任務進行定程度的控制,從而使挖掘
工作向著我們期望的方向發(fā)展。
一、神經(jīng)網(wǎng)絡數(shù)據(jù)集處理和缺陷檢測
PCB缺陷檢測的研究對象即PCB裸板的圖像數(shù)據(jù),該圖像數(shù)據(jù)是由工業(yè)相機拍攝所得,成像結(jié)果極易受到拍照時的光照條件、溫度條件、空氣條件的影響,此外傳送帶履帶的抖動、拍攝相機的抖動都有可能導致 PCB 圖像的質(zhì)量,而 PCB 圖像數(shù)據(jù)的質(zhì)量直接影響了后續(xù)對于圖像中的缺陷進行識別定位分類的準確程度,因此為了保證后續(xù)的深度學習算法的良好效果,需要對 PCB 圖像數(shù)據(jù)進行圖像預處理[1],這一步驟十分關(guān)鍵。
PCB 圖像數(shù)據(jù)集來自于北京大學智能機器人開放實驗室免費公開提供的印刷電路板瑕疵數(shù)據(jù)集(http://robotics.pkusz.edu.cn/resources/dataset/)。該數(shù)據(jù)集共包含 1386 張具有多種不同缺陷類型的原始 PCB 圖像,用于 PCB 圖像的缺陷檢測、分類和定位等問題的研究。
二、圖像數(shù)據(jù)集灰度化處理
三維顏色 RGB 空間由三原色紅綠藍(RGB)構(gòu)成,圖像可以理解為由三原色按照不同的比例疊加而成。對于相機拍攝得到的圖像進行數(shù)字離散化,則圖像中的每一個像素的像素值都在[0,225]的區(qū)間范圍內(nèi),則圖像就可以轉(zhuǎn)變成一個三維數(shù)組[H,W,C],其中 H 代表圖像的橫向量,W 代表圖像的列向量,C 代表圖像的通道數(shù)量,在 RGB 顏色空間下即為 RGB 三個通道,當計算機對圖像數(shù)據(jù)進行操作時,就需要計算三個通道的像素值,運算量太大,因此可以將三個通道的彩色圖像轉(zhuǎn)變成單通道的灰度圖[3],參數(shù)計算量會大大減少,這便是圖像灰度化,RGB 空間的灰度轉(zhuǎn)換的公式如式1 所示:
Gray(i, j) =0.29xR(i, j) +0.59xG(i, j) +0.11xB(i, j)? ? ? ? ?(1)
(一)灰度圖像均衡化消除
圖像直方圖[3]反映了圖像中不同亮度值的像素所占的比例,能夠直觀地看出圖像的亮度分布,但是對于單通道的灰度圖像來說,直方圖則反映了該圖像中不同灰度級出現(xiàn)的統(tǒng)計情況。圖像的灰度直方圖是一維離散函數(shù),如式 2 所示:
h(k) =nk, k =0,1, , 255? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(2)
其中, nk 表示為圖像的灰度值為 k 的像素點的個數(shù),圖像的灰度級有 256 種。其中p(k)表示圖像像素中灰度值為k出現(xiàn)的概率。分別計算PCB數(shù)據(jù)集的原始圖像和灰度圖像的直方圖,得到的結(jié)果如圖1所示。
三、訓練數(shù)據(jù)集的圖像實驗塊選擇
與那些在人工標注真實角點位置的實際拍攝棋盤數(shù)據(jù)集上進行訓練的基于深度學習的棋盤角度檢測方法不同[3],我們的網(wǎng)絡在帶有真實亞像素角點位置的合成訓練集上訓練。
如果在訓練時,我們僅對每個真實亞像素角點所在像素,取其15×15鄰域作為輸入圖像參與訓練 (cn與 pc在同一像素內(nèi)),那么訓練時的亞像素角點坐標偏移量真實值 dx和 dy應該在 [0.5,0.5) 范圍內(nèi)。在測試時,如果第一步的整數(shù)角點定位獲得了正確的整數(shù)位置,我們的網(wǎng)絡能夠正確進行后續(xù)的亞像素精調(diào)。但是如果測試時第一步的整數(shù)角點定位包含錯誤結(jié)果 (一般情況下是不可避免的),此時出現(xiàn)了訓練時沒有的情況,輸入網(wǎng)絡的 15×15 圖像塊的中心像素并沒有包含亞像素角點,這種情況下我們的網(wǎng)絡將無法進行亞像素位置精調(diào)。
(一)測試數(shù)據(jù)集合成測試實驗
由于合成棋盤數(shù)據(jù)集的真實亞像素角點位置是已知的,我們能夠計算平均角點定位誤差MELE,此外我們也比較了棋盤角點檢測算法中最常用的MERE。我們首先對合成測試集進行了不同下采樣系數(shù)δ的雙三次下采樣,用來測試網(wǎng)絡的輸入圖像尺寸對結(jié)果的影響。在測試圖片具有不同分辨率,15×15的網(wǎng)絡輸入大小具有最低MED誤差,因此我們選擇15×15作為網(wǎng)絡輸入圖像塊的大小。不同亞像素角點檢測方法在不進行模糊,不同噪聲等級的合成測試集上的平均歐式重投影誤差 (MERE)如表1所示。
四、總結(jié)
對于原始的數(shù)據(jù)集圖像,往往因成像條件不同導致圖像特征不明顯,并伴隨產(chǎn)生很多噪聲,不能直接用于特征提取。本文采用將圖像灰度化,以摒棄色彩信息干擾,再對灰度圖進行直方圖均衡化以增強前景與后景的對比,最后通過高斯濾波等方式降低圖像的噪聲干擾,實現(xiàn)了神經(jīng)網(wǎng)絡數(shù)據(jù)集圖像突出特征,過濾噪聲的目的。由于用于訓練神經(jīng)網(wǎng)絡的圖像數(shù)據(jù)集規(guī)模較小,且采用遷移學習的方法進行訓練,而深度學習模型對于數(shù)據(jù)集的規(guī)模需求較大,因此訓練的效果有限,后續(xù)可以對數(shù)據(jù)集進行全方位補充。
參考文獻:
[1]Zakria. 基于深度學習的快速車輛再識別研究[D].電子科技大學,2020.DOI:10.27005/d.cnki.gdzku.2020.004719.
[2]劉皓. 基于深度學習的行人再識別問題研究[D].合肥工業(yè)大學,2017.
[3]吳國清. 科學計算時變數(shù)據(jù)集的數(shù)據(jù)挖掘算法研究[D].中國工程物理研究院,2019.