賈立銘 梁少華
摘要:通過人工觀察巖石薄片來進(jìn)行分類效率低,且容易受主觀影響,在如今人工智能的時(shí)代背景下,使用計(jì)算機(jī)視覺技術(shù)對其進(jìn)行智能處理,已經(jīng)成為一種公認(rèn)的研究方法。為此本文通過使用卷積神經(jīng)網(wǎng)絡(luò)來代替人工進(jìn)行巖石薄片分類。本實(shí)驗(yàn)使用“中國科學(xué)數(shù)據(jù)”中的《部分造巖礦物、典型變質(zhì)礦物和鮞粒薄片顯微圖像數(shù)據(jù)集》部分?jǐn)?shù)據(jù),采用數(shù)據(jù)增強(qiáng)手段進(jìn)行處理,使其數(shù)據(jù)量擴(kuò)增10倍。采用了ResNet模型,對其進(jìn)行訓(xùn)練,最終準(zhǔn)確率達(dá)到了96.8%。結(jié)果表明使用卷積神經(jīng)網(wǎng)絡(luò)對巖石薄片進(jìn)行分類可以獲得高效、準(zhǔn)確的結(jié)果。
關(guān)鍵詞:巖石薄片;圖像分類;卷積神經(jīng)網(wǎng)絡(luò);殘差網(wǎng)絡(luò)
中圖分類號:TP18? ? ? ? ? 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2021)28-0107-03
開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):
A Resnet-based Recognition Method of Rock Slices
JIA Li-ming, LIANG Shao-hua
(College of Computer Science, Yangtze University, Hubei 430000, China)
Abstract: Classification by manually observing rock slices is inefficient and subject to subjective influence. In today's artificial intelligence era, the use of computer vision technology for intelligent processing has become a recognized research method. To this end, this paper uses convolutional neural networks to replace artificial rock slice classification. This experiment uses part of the data from "Partial Rock-forming Minerals, Typical Metamorphic Minerals, and Oolitic Thin Section Microscopic Image Data Set" in "Chinese Scientific Data", and uses data enhancement methods to process the data to increase the amount of data by 10 times. Using the ResNet model and training it, the final accuracy rate reached 96.8%. The results show that using convolutional neural network to classify rock slices can obtain efficient and accurate results.
Key words: rock slice; image classification; convolution neural network; residual network
1研究目的
巖石薄片鑒定技術(shù)是石油行業(yè)中的一項(xiàng)重要基本技能,現(xiàn)如今石油行業(yè)飛速發(fā)展,企業(yè)對巖石薄片鑒定方面的要求也在逐漸提高,但是現(xiàn)如今巖石薄片鑒定主要還是靠有專業(yè)能力和豐富經(jīng)驗(yàn)的技術(shù)人員進(jìn)行人工鑒定,識別結(jié)果很大程度上依賴個(gè)人經(jīng)驗(yàn),判斷標(biāo)準(zhǔn)不統(tǒng)一,處理效率不高。近年來快速發(fā)展的還有卷積神經(jīng)網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò)在人臉識別上的準(zhǔn)確度已經(jīng)超過了人類,這說明利用卷積神經(jīng)網(wǎng)絡(luò)代替人工進(jìn)行巖石薄片的鑒定是可行的。
近年來,隨著計(jì)算機(jī)技術(shù)與數(shù)字圖像處理技術(shù)的發(fā)展,很多學(xué)者在使用圖像識別技術(shù)對巖石圖像進(jìn)行識別和分類方面做了大量研究,取得不少成果。如:葛粲等人使用卷積神經(jīng)網(wǎng)絡(luò)對火山巖的構(gòu)造源區(qū)進(jìn)行判別[1],薛東杰等人使用全卷積神經(jīng)網(wǎng)絡(luò)的智能識別算法對巖石混凝土裂隙進(jìn)行智能識別[2],羅偉等人使用深度學(xué)習(xí)的算法對野外露頭區(qū)巖石裂縫進(jìn)行識別[3],白林等人對6種常見巖石薄片使用VGG神經(jīng)網(wǎng)絡(luò)進(jìn)行分類[4],這都說明了卷積神經(jīng)網(wǎng)絡(luò)技術(shù)可以應(yīng)用在地質(zhì)方面。但仍存在一些值得改進(jìn)的地方:如程國建等人使用神經(jīng)網(wǎng)絡(luò)對巖石薄片進(jìn)行分類[5],使用了三種共4800個(gè)樣本進(jìn)行訓(xùn)練,樣品數(shù)量較多,類別較少。實(shí)際應(yīng)用中往往是樣本數(shù)量較少,類別較多。
對此,本文提出一種基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的巖石圖像分類方法。使用少量樣本對8種巖石薄片進(jìn)行識別分類。
2巖石薄片
巖石薄片是在巖樣上取得的一小塊巖片,并將其磨制成幾十微米厚的薄片,在偏光顯微鏡下,對圖像進(jìn)行采樣,通過觀察圖像確定巖樣的巖石礦物成分、結(jié)構(gòu)和構(gòu)造等特征,并進(jìn)一步對巖石巖性進(jìn)行判斷。為了觀察巖樣內(nèi)部孔隙、喉道及其相應(yīng)的聯(lián)通特征的方便,還可以將彩色膠體或者樹脂注入巖石內(nèi)部,然后進(jìn)一步加工制成鑄體薄片[5]。
本文使用了“中國科學(xué)數(shù)據(jù)”中的《部分造巖礦物、典型變質(zhì)礦物和鮞粒薄片顯微圖像數(shù)據(jù)集》。數(shù)據(jù)集按礦物種類分為橄欖石、普通輝石、角閃石、黑云母、斜長石、紅柱石、堇青石、十字石、石榴子、陽起石和鮞粒,共計(jì)1446張圖片。其中9類礦物薄片在單偏光和正交偏光兩種光源環(huán)境下拍攝,2類礦物薄片只在正交偏光下拍攝,序號后面的“-”表示在單偏光環(huán)境下拍攝,“+”表示正交偏光環(huán)境,如圖1所示。本次實(shí)驗(yàn)使用其中的8種巖礦薄片,共747張圖片。
3殘差網(wǎng)絡(luò)
早期通過增加網(wǎng)絡(luò)層數(shù)可以獲得比較好的效果,但是當(dāng)網(wǎng)絡(luò)層數(shù)增加到一定的數(shù)量時(shí),網(wǎng)絡(luò)會發(fā)生退化現(xiàn)象:訓(xùn)練集loss逐漸下降,然后趨于飽和,繼續(xù)增大網(wǎng)絡(luò)深度,訓(xùn)練集loss反而會增大。使用殘差網(wǎng)絡(luò)可以解決網(wǎng)絡(luò)退化的問題。
殘差網(wǎng)絡(luò)的思想是使用直接映射來連接網(wǎng)絡(luò)不同層。當(dāng)網(wǎng)絡(luò)退化時(shí),淺層網(wǎng)絡(luò)能夠達(dá)到比深層網(wǎng)絡(luò)更好的訓(xùn)練效果,如果把淺層的特征傳到深層,那么效果應(yīng)該至少不比淺層網(wǎng)絡(luò)效果差。從信息論的角度講,由于DPI(數(shù)據(jù)處理不等式)的存在,在前向傳輸?shù)倪^程中,隨著層數(shù)的加深,F(xiàn)eature Map包含的圖像信息會逐層減少,而通過直接映射的加入,保證了[L+1]層的網(wǎng)絡(luò)一定比[L]層包含更多的圖像信息。
殘差網(wǎng)絡(luò)的核心是殘差塊,即對于一個(gè)堆積層結(jié)構(gòu)(幾層卷積層堆積而成),當(dāng)輸入為[x]時(shí)其學(xué)習(xí)到的特征記為[Hx]?,F(xiàn)在我們希望其可以學(xué)習(xí)到殘差[Fx=Hx-x],這樣其實(shí)原始的學(xué)習(xí)特征是[Fx+x]。殘差塊結(jié)構(gòu)如圖2所示。
在網(wǎng)絡(luò)的設(shè)計(jì)中,通常是將輸入[x]進(jìn)行多次卷積后得到[Fx],包括relu激活和Batch Normalization操作,然后與輸入[x]相加得到[Hx],送入下一層進(jìn)行訓(xùn)練。
通過殘差塊構(gòu)建殘差網(wǎng)絡(luò),一般有兩種結(jié)構(gòu),一種是兩個(gè)3*3的卷積疊加,一種是兩個(gè)1*1的卷積中間加入一個(gè)3*3的卷積。如果殘差路徑改變了featuremap的數(shù)量和尺寸,還需要使用1*1的卷積來升維或者降采樣使輸出與[Fx]的shape保持一致。在經(jīng)過所有殘差塊后,對輸出進(jìn)行Average Pooling得到最終的特征。
4方法
4.1數(shù)據(jù)集與預(yù)處理
首先對圖片進(jìn)行預(yù)處理,原始的圖片為2560*1920個(gè)像素的彩色圖片,將圖片轉(zhuǎn)化為224*224個(gè)像素的彩色圖片。實(shí)驗(yàn)共選取8種正交偏光下拍攝的巖石薄片,分別是橄欖石、普通輝石、角閃石、黑云母、斜長石、十字石、石榴子石、鮞粒。每種巖石薄片選取30張至140張圖片。對原始圖像進(jìn)行圖像空間尺度變換(旋轉(zhuǎn)、鏡像),經(jīng)過處理后可以將原始樣本數(shù)量增多10倍,可以防止過擬合,提升模型性能。圖3是處理后的圖像。
4.2網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN)是一種包含卷積計(jì)算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),也是目前最流行的深度學(xué)習(xí)算法之一。卷積神經(jīng)網(wǎng)絡(luò)經(jīng)過多年的發(fā)展,已經(jīng)從只有5層的LeNet網(wǎng)絡(luò)發(fā)展到如今上百層的DenseNet網(wǎng)絡(luò),隨之而來的還有準(zhǔn)確度的提升和對算力要求的提升。本文使用ResNet網(wǎng)絡(luò),ResNet在2015年ILSVRC和COCO上取得了5項(xiàng)第一。當(dāng)下Resnet已經(jīng)代替VGG成為一般計(jì)算機(jī)視覺領(lǐng)域問題中的基礎(chǔ)特征提取網(wǎng)絡(luò)。
本文使用Resnet50網(wǎng)絡(luò),首先對圖像進(jìn)行7*7的卷積和3*3的最大池化處理,然后使用16個(gè)殘差塊進(jìn)行學(xué)習(xí),每個(gè)殘差塊由2個(gè)1*1和1個(gè)3*3的卷積層組合而成。最后進(jìn)行平均池化后輸出。網(wǎng)絡(luò)結(jié)構(gòu)圖由表1所示:
4.3訓(xùn)練過程
首先對每張圖片進(jìn)行數(shù)據(jù)增強(qiáng),然后轉(zhuǎn)化成tfrecord格式,目的是為了提高讀取效率,共7470張圖片,其中訓(xùn)練集6810張圖片,測試集660張圖片。將tfrecord文件輸入到Resnet50進(jìn)行訓(xùn)練,使用梯度下降優(yōu)化損失,固定學(xué)習(xí)率為0.0001,經(jīng)過10萬次迭代后,訓(xùn)練集準(zhǔn)確率穩(wěn)定在99%左右。
4.4測試結(jié)果
測試使用660張測試集圖片進(jìn)行預(yù)測,準(zhǔn)確率達(dá)到94.8%,表1給出了8種巖石薄片的預(yù)測混淆矩陣。從表2可以看出,誤差主要是由于將橄欖巖識別成了普通輝石和十字石產(chǎn)生的。原因是普通輝石與橄欖石為共生礦物,在橄欖巖中常常含有一定比例的輝石。
本實(shí)驗(yàn)結(jié)果表明利用卷積神經(jīng)網(wǎng)絡(luò)對巖石薄片進(jìn)行識別分類有較高的準(zhǔn)確率,對與地質(zhì)研究者來說有一定的參考價(jià)值。本次實(shí)驗(yàn)僅選取8類巖石圖片,并且圖片數(shù)量較少,所以仍有一定誤差。未來可以通過遷移學(xué)習(xí)提高準(zhǔn)確率。
5結(jié)論
將巖石薄片的圖像經(jīng)過簡單處理輸入到卷積神經(jīng)網(wǎng)絡(luò),通過自動(dòng)提取特征可以降低人為主觀因素導(dǎo)致的判斷失誤,準(zhǔn)確率可以達(dá)到96.8%。說明卷積神經(jīng)網(wǎng)絡(luò)對巖石薄片的識別分類有較高的可靠性。
參考文獻(xiàn):
[1] 葛粲,汪方躍,顧海歐,等.基于卷積神經(jīng)網(wǎng)絡(luò)和火山巖大數(shù)據(jù)的構(gòu)造源區(qū)判別[J].地學(xué)前緣,2019,26(4):22-32.
[2] 薛東杰,唐麒淳,王傲,等.基于FCN的巖石混凝土裂隙幾何智能識別[J].巖石力學(xué)與工程學(xué)報(bào),2019,38(S2):3393-3403.
[3] 羅偉,梁世豪,姜鑫,等.基于深度學(xué)習(xí)的野外露頭區(qū)巖石裂縫識別[J].計(jì)算機(jī)與現(xiàn)代化,2020(5):56-62.
[4] 白林,魏昕,劉禹,等.基于VGG模型的巖石薄片圖像識別[J].地質(zhì)通報(bào),2019,38(12):2053-2058.
[5] 程國建,郭文惠,范鵬召.基于卷積神經(jīng)網(wǎng)絡(luò)的巖石圖像分類[J].西安石油大學(xué)學(xué)報(bào)(自然科學(xué)版),2017,32(4):116-122.
[6] 朱雨星,王一帆,郭寧,等.不同尺度地學(xué)數(shù)據(jù)的巖石巖性識別方法對比[J].科技視界,2020(5):143-145.
[7] 吳正文.卷積神經(jīng)網(wǎng)絡(luò)在圖像分類中的應(yīng)用研究[D].成都:電子科技大學(xué),2015.
[8] 吉春旭.基于卷積神經(jīng)網(wǎng)絡(luò)的巖石圖像分類研究與應(yīng)用[D].西安:西安石油大學(xué),2017.
[9] Ashok Kumar Patel a, Snehamoy Chatterjee b. Computer vision-based limestone rock-type classification using probabilistic neural network[J].地學(xué)前緣:英文版,2016(1): 53-60.
[10] 朱世松,楊文藝,侯廣順,等.一種巖石薄片智能分類識別方法[J].礦物學(xué)報(bào),2020,40(1):106.
【通聯(lián)編輯:唐一東】