岳翔 呼和 賈建忠
摘要:古生物化在判斷生油母質(zhì)、油氣生成和保存時(shí)代以及分析沉積環(huán)境中扮演重要角色。然而,傳統(tǒng)的微觀化石識(shí)別鑒定工作效率低下、費(fèi)時(shí)費(fèi)力,且主觀性較強(qiáng),常規(guī)方法已不能滿足高效、快速油氣勘探評(píng)價(jià)的需要;本文提出一種基于深度學(xué)習(xí)的有孔蟲化石識(shí)別方法,在三分類數(shù)據(jù)集上實(shí)驗(yàn)了VGG16模型和GoogLeNet模型,識(shí)別平均準(zhǔn)確度為85%。該方法可以大大減輕古生物鑒定人員的工作量,解決古生物專業(yè)人才匱乏問題,同時(shí)提高成果共享和利用效率。
關(guān)鍵詞:有孔蟲鑒定;CNN;深度學(xué)習(xí);VGG16;GoogLeNet
中圖分類號(hào):TP311? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2019)27-0173-01
1 引言
古生物化石如同沉積地層的“身份證”,記錄著地層形成的年齡、氣候、地理和地貌等關(guān)鍵信息,在判斷生油母質(zhì)、油氣生成和保存時(shí)代以及沉積環(huán)境分析中扮演重要角色。與我們耳熟能詳?shù)娜~蟲、恐龍等大化石不同,在鉆井巖心或巖屑中保存的一般是顯微鏡下才能觀察到的微觀化石。它們雖然渺小,卻以“數(shù)量取勝”,在地層中幾乎無處不在;它們壽命雖短,但演化迅速,更有利于精細(xì)確定地層年齡,對(duì)環(huán)境變化的反應(yīng)也更敏感。要用好這張地層的“身份證”,關(guān)鍵在于對(duì)化石進(jìn)行準(zhǔn)確分類和鑒定。
目前化石鑒定的主要方法是專業(yè)人員通過觀察標(biāo)本的外部形態(tài)和內(nèi)部結(jié)構(gòu),查找文獻(xiàn)、工具書、化石圖冊等相關(guān)研究資料,比照?qǐng)D版并結(jié)合自身經(jīng)驗(yàn),鑒定化石的屬種。但隨著古生物學(xué)研究和油氣勘探需求的快速發(fā)展,化石鑒定工作中一些不容忽視的問題便日漸凸顯。
1)古生物屬種多、數(shù)量大,人工鑒定效率低,花費(fèi)了從業(yè)人員大部分時(shí)間與精力。而且,中國近海鉆井?dāng)?shù)量龐大,實(shí)驗(yàn)鑒定人員任務(wù)繁重。若這些時(shí)間與精力被用于更高層次的研究,或許能取得更有價(jià)值的科研成果。
2)人才匱乏,主觀性強(qiáng)。具備古生物分類知識(shí)的專業(yè)人才不足,不利于科研成果快速轉(zhuǎn)化和應(yīng)用。另外,鑒定過程受專業(yè)人員主導(dǎo),鑒定結(jié)果具有主觀性。化石鑒定工作中主觀誤判不可避免,相同標(biāo)本不同人員鑒定可能得出不同的結(jié)論。
2 技術(shù)思路與算法設(shè)計(jì)
深度學(xué)習(xí)是一個(gè)復(fù)雜的機(jī)器學(xué)習(xí)算法,在語音和圖像識(shí)別方面取得的效果,遠(yuǎn)遠(yuǎn)超過先前相關(guān)技術(shù),它的最終目標(biāo)是讓機(jī)器能夠像人一樣具有分析學(xué)習(xí)能力,能夠識(shí)別文字、圖像和聲音等數(shù)據(jù)。卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡稱CNN)是深度學(xué)習(xí)的一種重要算法。卷積神經(jīng)網(wǎng)絡(luò)是在BP神經(jīng)網(wǎng)絡(luò)的改進(jìn),與BP類似,都采用了前向傳播計(jì)算輸出值,反向傳播調(diào)整權(quán)重和偏置。VGG16模型是牛津大學(xué)發(fā)布的卷積網(wǎng)絡(luò)模型,GoogLeNet是Google公司發(fā)布的卷積網(wǎng)絡(luò)模型。GoogLeNet和VGG16是2014年ImageNet挑戰(zhàn)賽的冠亞軍。
使用CNN模型對(duì)有孔蟲化石圖片進(jìn)行識(shí)別。模型訓(xùn)練流程如圖1所示,首先對(duì)圖片進(jìn)行預(yù)處理,統(tǒng)一圖片大小,然后進(jìn)行模型訓(xùn)練,訓(xùn)練完成之后保存模型。
3 實(shí)驗(yàn)結(jié)果
收集三類有孔蟲圖片,每一類大約60張圖片,共計(jì)180張,利用VGG16模型和GoogLeNet模型進(jìn)行鑒定實(shí)驗(yàn);從數(shù)據(jù)集中隨機(jī)選取80%的數(shù)據(jù)作為訓(xùn)練集,20%的數(shù)據(jù)作為測試集,進(jìn)行10次實(shí)驗(yàn),結(jié)果如表1所示。
4結(jié)論
本文提出一種基于深度學(xué)習(xí)的有孔蟲化石識(shí)別方法,利用CNN模型對(duì)有孔蟲化石圖片進(jìn)行種屬鑒定,通過實(shí)驗(yàn)驗(yàn)證此方法在三分類的數(shù)據(jù)集上準(zhǔn)確度可以達(dá)到85%,是一種可行的有孔蟲化石鑒定方法。在此基礎(chǔ)上可以建設(shè)浮游有孔蟲智能識(shí)別系統(tǒng),準(zhǔn)確、方便地識(shí)別化石屬種、時(shí)代及古環(huán)境信息,提高應(yīng)用成效;進(jìn)一步推動(dòng)古生物研究及其油氣勘探應(yīng)用走向數(shù)字化、智能化。
參考文獻(xiàn):
[1] 趙賢淑,張俊嶺,陳德嶺. 多元統(tǒng)計(jì)分析在古生物化石分類鑒定中的應(yīng)用[J].西安礦業(yè)學(xué)院學(xué)報(bào), 1996, 16(2):183-185.
[2] 夏菁,白志強(qiáng),王寶鵬,等. 化石自動(dòng)鑒定技術(shù)研究現(xiàn)狀與展望[J].地球科學(xué)前沿,2013,3: 159-164.
[3] 夏菁,白志強(qiáng),王寶鵬,等. 牙形石數(shù)字圖像采集與圖像增強(qiáng)方法研究[J].古生物學(xué)報(bào), 2014,53(3):392-399.
[4] Hossein Izadi,Javad Sadri,Nosrat-Agha Mehran.A new intelligent method for minerals segmentation in thin sections based on a novel incremental color clustering[J].Computers & Geosciences,2015(81):38-52.
[5] 劉敏.基于小波分析和神經(jīng)網(wǎng)絡(luò)的油氣產(chǎn)能預(yù)測與應(yīng)用[D].武漢:武漢理工大學(xué),2009.
[6] 焦李成,楊淑媛,劉芳,等.神經(jīng)網(wǎng)絡(luò)七十年:回顧與展望[J].計(jì)算機(jī)學(xué)報(bào),2016,39(8):1697-1716.
【通聯(lián)編輯:梁書】