• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于大規(guī)模預(yù)訓(xùn)練模型的地質(zhì)礦物屬性識(shí)別方法及應(yīng)用

    2024-04-17 08:40:18王彬彬周可法王金林汪瑋李超程寅益
    新疆地質(zhì) 2024年1期
    關(guān)鍵詞:深度神經(jīng)網(wǎng)絡(luò)

    王彬彬 周可法 王金林 汪瑋 李超 程寅益

    摘? ?要:地球科學(xué)的研究成果通常記錄在技術(shù)報(bào)告、期刊論文、書籍等文獻(xiàn)中,但許多詳細(xì)的地球科學(xué)報(bào)告未被使用,這為信息提取提供了機(jī)遇。為此,我們提出了一種名為GMNER(Geological Minerals named entity recognize,MNER)的深度神經(jīng)網(wǎng)絡(luò)模型,用于識(shí)別和提取礦物類型、地質(zhì)構(gòu)造、巖石與地質(zhì)時(shí)間等關(guān)鍵信息。與傳統(tǒng)方法不同,本次采用了大規(guī)模預(yù)訓(xùn)練模型BERT(Bidirectional Encoder Representations from Transformers,BERT)和深度神經(jīng)網(wǎng)絡(luò)來(lái)捕捉上下文信息,并結(jié)合條件隨機(jī)場(chǎng)(Conditional random field,CRF)以獲得準(zhǔn)確結(jié)果。實(shí)驗(yàn)結(jié)果表明,MNER模型在中文地質(zhì)文獻(xiàn)中表現(xiàn)出色,平均精確度為0.898 4,平均召回率0.922 7,平均F1分?jǐn)?shù)0.910 4。研究不僅為自動(dòng)礦物信息提取提供了新途徑,也有望促進(jìn)礦產(chǎn)資源管理和可持續(xù)利用。

    關(guān)鍵詞:礦物信息提取;深度神經(jīng)網(wǎng)絡(luò);礦物文獻(xiàn);命名實(shí)體識(shí)別

    地球科學(xué)的研究成果通常記錄在技術(shù)報(bào)告、期刊論文、書籍等文獻(xiàn)中。近年來(lái),開放數(shù)據(jù)倡議促使政府機(jī)構(gòu)和科研機(jī)構(gòu)將數(shù)據(jù)在線發(fā)布以供再利用[1-3]。許多國(guó)家地質(zhì)調(diào)查機(jī)構(gòu)(如USGS和CGS)已將地質(zhì)調(diào)查成果在線發(fā)布。地球科學(xué)文獻(xiàn)作為開放數(shù)據(jù)的重要組成部分,為地質(zhì)礦物信息提取研究提供了巨大機(jī)遇。

    從地質(zhì)科學(xué)文本數(shù)據(jù)中提取結(jié)構(gòu)化信息、發(fā)現(xiàn)知識(shí)的研究在數(shù)字地球科學(xué)領(lǐng)域尚未深入探討。特別是在處理中文地質(zhì)科學(xué)文獻(xiàn)時(shí)更為困難,因?yàn)橹形膯卧~之間無(wú)空格,計(jì)算機(jī)難以識(shí)別有意義的詞匯或短語(yǔ)的邊界[4-5]?;谏疃葘W(xué)習(xí)的命名礦產(chǎn)實(shí)體識(shí)別是實(shí)現(xiàn)礦產(chǎn)信息自動(dòng)提取的重要方法,也是構(gòu)建礦產(chǎn)領(lǐng)域知識(shí)圖的前提條件。

    目前,地質(zhì)礦物命名實(shí)體識(shí)別領(lǐng)域的研究相對(duì)較少,在地質(zhì)命名實(shí)體識(shí)別方面,一些學(xué)者已將深度學(xué)習(xí)應(yīng)用于該領(lǐng)域,并取得一定成果。Zhang等 針對(duì)地質(zhì)文獻(xiàn)特點(diǎn)[6],設(shè)計(jì)了一種基于深度信念網(wǎng)絡(luò)的地質(zhì)命名實(shí)體識(shí)別模型。Qiu等提出了一種將雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(Bi-directional Long Short-Term Memory,BiLSTM)與CRF相結(jié)合的模型[7],該模型利用注意機(jī)制捕捉單詞之間的關(guān)聯(lián)信息,并從地質(zhì)報(bào)告中提取地質(zhì)實(shí)體,如地質(zhì)歷史和地質(zhì)結(jié)構(gòu)。Li等構(gòu)建了一種基于地質(zhì)領(lǐng)域本體的中文分詞算法[8],并輔以自循環(huán)方法,以更好地分割地質(zhì)領(lǐng)域文本。礦物信息的提取有以下3個(gè)難點(diǎn):①礦物信息來(lái)源廣泛,包括文獻(xiàn)、專利、報(bào)告、新聞等多種類型的文本[9];②礦物信息的命名規(guī)范不統(tǒng)一,不同地區(qū)、不同領(lǐng)域、不同時(shí)間的命名方式可能存在差異,需進(jìn)行多樣化命名實(shí)體識(shí)別;③礦物信息的語(yǔ)言表達(dá)復(fù)雜,包括詞匯多樣、語(yǔ)法復(fù)雜、語(yǔ)義模糊等問題。

    為解決這些挑戰(zhàn),我們提出了一種基于深度神經(jīng)網(wǎng)絡(luò)的地質(zhì)礦物命名實(shí)體識(shí)別模型,基于5份區(qū)域礦產(chǎn)領(lǐng)域報(bào)告,據(jù)礦產(chǎn)文本的特點(diǎn),提取了礦產(chǎn)類型、地質(zhì)構(gòu)造、巖石和地質(zhì)時(shí)間、成礦區(qū)域等信息。與前人所采用的方法相比,結(jié)合大規(guī)模預(yù)訓(xùn)練模型BERT和深度神經(jīng)網(wǎng)絡(luò)來(lái)學(xué)習(xí)上下文信息,使用條件隨機(jī)場(chǎng)來(lái)獲取最優(yōu)全局標(biāo)簽序列[10],最終實(shí)現(xiàn)地質(zhì)礦物命名實(shí)體識(shí)別。

    1? 方法

    本文采用的大規(guī)模預(yù)訓(xùn)練模型BERT和深度神經(jīng)網(wǎng)絡(luò)的總體結(jié)構(gòu)如圖1。整個(gè)模型分為BERT層、BiLSTM層、全連接層和CRF層。首先,BERT預(yù)訓(xùn)練層在大規(guī)模無(wú)標(biāo)注地質(zhì)礦物數(shù)據(jù)集上進(jìn)行無(wú)監(jiān)督訓(xùn)練,提取豐富的語(yǔ)法和語(yǔ)義特征,得到詞向量表示;然后將訓(xùn)練好的詞向量輸入長(zhǎng)短期記憶網(wǎng)絡(luò)進(jìn)行特征提取,并將兩個(gè)神經(jīng)網(wǎng)絡(luò)的輸出特征進(jìn)行融合;最后,通過一個(gè)全連接層進(jìn)行降維并將輸出的特征輸入到CRF層進(jìn)行校正。

    1.1? BERT

    Devlin等提出了BERT模型[11],與OpenAI GPT中的從左到右Transformer和ELMo中的拼接雙向LSTM不同[12-13],BERT使用雙向Transformer模型架構(gòu)[14](圖2)?!癟rm”代表Transformer塊。該模型使用注意力機(jī)制將任意位置的兩個(gè)單詞之間的距離轉(zhuǎn)換為1,使模型能夠充分考慮更長(zhǎng)距離的上下文語(yǔ)義,有效解決了NLP中單詞和句子的長(zhǎng)期依賴問題,并更全面地捕捉語(yǔ)句中的雙向關(guān)系。[]

    該模型的輸入層是詞嵌入、位置嵌入和分段嵌入的組合。Transformer Block是基于注意力機(jī)制的編碼結(jié)構(gòu)(圖3),是BERT的重要組成部分。在Transformer編碼單元中使用自注意力機(jī)制的工作原理主要是計(jì)算文本序列中單詞之間的相關(guān)性。其主要功能是引導(dǎo)神經(jīng)網(wǎng)絡(luò)將注意力集中在能夠更好地影響輸出的特征上,并區(qū)分輸入對(duì)輸出的不同部分的影響。其中,編碼器由6個(gè)相同模塊堆疊而成。計(jì)算輸出公式(1)和公式(2)所示。

    outputAtt=LayerNorm(x+Attention(x)) (1)

    outputFnn=LayerNorm(outputAtt+FNN(outputAtt))…(2)

    解碼器同樣堆疊有6個(gè)相同模塊。與編碼器模塊不同,在底層注意力層中添加了遮蔽,其目的是防止模型接觸未來(lái)時(shí)刻點(diǎn)上信息而影響訓(xùn)練。單個(gè)頭的縮放點(diǎn)注意力計(jì)算公式如下:

    其中,[xt]為當(dāng)前的輸入,[ht-1]為上一步的隱藏狀態(tài),[ft]為遺忘門,[it]為輸入門,[Ot]為輸出門,b為偏置,[Ct]為神經(jīng)元在時(shí)間t記憶的信息,[Ct]為當(dāng)前神經(jīng)元要存儲(chǔ)的信息,[ht]為最終LSTM單元的輸出。

    在將BiLSTM應(yīng)用于命名實(shí)體識(shí)別時(shí),將BERT獲得的地質(zhì)礦物文本中每個(gè)單詞的向量表示作為輸入。通過使用LSTM,網(wǎng)絡(luò)可自動(dòng)學(xué)習(xí)上下文特征,然后計(jì)算當(dāng)前時(shí)間步的最佳分類結(jié)果。雖然仍為一個(gè)分類模型,但該網(wǎng)絡(luò)能夠獲取更好的上下文特征表示。

    1.3? CRF

    盡管BiLSTM和IDCNN神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)能捕捉上下文信息,但忽略了實(shí)體標(biāo)簽之間的順序和關(guān)聯(lián)。在命名實(shí)體識(shí)別中,根據(jù)標(biāo)注規(guī)則,如果某些標(biāo)簽連續(xù)出現(xiàn),則可能不符合語(yǔ)言邏輯。CRF可考慮標(biāo)簽之間的邏輯關(guān)系,以獲得全局最優(yōu)的標(biāo)簽序列,因此在模型最后一層使用它來(lái)修改識(shí)別結(jié)果。其原理如下:

    定義[Pij]為第i個(gè)符合第j個(gè)標(biāo)簽的概率,輸入的句子序列[x={x1,x2,x3,…,xn}]與其預(yù)測(cè)序列[y=][{y1,y2,y3,…,yn}]得分計(jì)算公式如下:

    公式(15)-(17)中,[y*]表示正確標(biāo)簽的對(duì)數(shù)概率,[y]表示所有可能標(biāo)記的集合,最優(yōu)序列分類通過[K(x,y)]函數(shù)完成。

    2? 實(shí)體識(shí)別實(shí)驗(yàn)

    2.1? 數(shù)據(jù)集

    本研究使用的標(biāo)注語(yǔ)料庫(kù)來(lái)自不同地區(qū)的5份中國(guó)區(qū)域調(diào)查報(bào)告,共計(jì)約50萬(wàn)字。由于原始文本中有諸多干擾信息,如標(biāo)題號(hào)、圖片和表格,這將使文本識(shí)別變得困難,因此首先對(duì)文本進(jìn)行預(yù)處理,主要檢查文本格式和內(nèi)容,去除圖片和表格,將連續(xù)的文本劃分為只包含單詞、標(biāo)點(diǎn)符號(hào)、數(shù)字和空格的標(biāo)記,且無(wú)地質(zhì)礦物實(shí)體信息的句子已被刪除,最終得到了8 000個(gè)有效句子。對(duì)這些有效數(shù)據(jù),本文按隨機(jī)選擇方法,按8∶1∶1的比例劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。

    2.2? 標(biāo)注策略和評(píng)價(jià)指標(biāo)

    文本標(biāo)注是指對(duì)文本中的實(shí)體和非實(shí)體進(jìn)行標(biāo)記。我們采用了“BIO”(Beginning、Inside、Outside)標(biāo)注策略,其中“B”表示實(shí)體詞匯的第一個(gè)字符,“I”表示實(shí)體詞匯的所有中間字符,“O”表示非實(shí)體詞匯。我們共標(biāo)注18 783個(gè)實(shí)體,包括礦產(chǎn)資源的6個(gè)主要特征:礦產(chǎn)地、巖石、地層、礦物類型、地質(zhì)構(gòu)造、地質(zhì)時(shí)間(表1)。對(duì)于復(fù)雜實(shí)體,我們分別標(biāo)注多個(gè)實(shí)體,例如“巖(B-LOC)金(I-LOC)礦(I-LOC)山(I-LOC)潛(B-ROC)火(I-ROC)山(I-ROC)巖(I-ROC)白(B-SG)山(I-SG)組(I-SG)”,“巖金礦山”、“潛火山巖”和“白山組”分別被標(biāo)記為礦產(chǎn)地、巖石和地層。在實(shí)驗(yàn)中,復(fù)雜實(shí)體也被單獨(dú)匹配。

    命名實(shí)體識(shí)別的評(píng)價(jià)指標(biāo)包括:精確率(P)、召回率(R)和F值。具體的定義如下:Tp表示模型正確識(shí)別的實(shí)體數(shù)量,F(xiàn)p表示模型誤識(shí)別的實(shí)體數(shù)量,F(xiàn)n表示模型漏掉的實(shí)體數(shù)量,即模型未能正確標(biāo)識(shí)的實(shí)際存在的實(shí)體數(shù)量。這3個(gè)指標(biāo)在NER評(píng)價(jià)標(biāo)準(zhǔn)中被廣泛使用[17-18]。

    2.3? 實(shí)驗(yàn)參數(shù)設(shè)置

    實(shí)驗(yàn)環(huán)境和參數(shù)設(shè)置模型在Python 3.7.3和TensorFlow 1.14.1中進(jìn)行訓(xùn)練和測(cè)試。實(shí)驗(yàn)使用BERT-Base模型進(jìn)行,該模型包含12個(gè)轉(zhuǎn)換層、768個(gè)維隱藏層和12頭注意機(jī)制。BiLSTM網(wǎng)絡(luò)有一個(gè)128維的隱藏層。注意機(jī)制層被設(shè)置為50維,且最大序列長(zhǎng)度被設(shè)置為256,所有模型均在4×RTX 2080 Ti GPU上進(jìn)行訓(xùn)練(表2)。

    2.4? 實(shí)驗(yàn)和分析

    在進(jìn)行深度學(xué)習(xí)模型訓(xùn)練前,合理設(shè)置超參數(shù)至關(guān)重要。學(xué)習(xí)率作為深度學(xué)習(xí)模型中的一個(gè)關(guān)鍵參數(shù),對(duì)于目標(biāo)函數(shù)的收斂速度及是否能夠收斂到局部最小值均有顯著影響。針對(duì)BERT-LSTM-CRF模型進(jìn)行了學(xué)習(xí)率調(diào)整實(shí)驗(yàn)。從實(shí)驗(yàn)結(jié)果可以明顯看出(表3),將學(xué)習(xí)率設(shè)置為4e-5時(shí)獲得了最優(yōu)的性能表現(xiàn)。

    另一個(gè)在BERT模型中常用的正則化技術(shù)是dropout。該技術(shù)會(huì)隨機(jī)地將部分神經(jīng)元輸出設(shè)為零,有助于降低模型過擬合風(fēng)險(xiǎn)。在BERT-LSTM-CRF模型中,我們對(duì)dropout率進(jìn)行調(diào)整實(shí)驗(yàn)。結(jié)果表明(表4),在實(shí)驗(yàn)中將dropout設(shè)置為0.1時(shí),能夠獲得最佳性能效果。

    實(shí)驗(yàn)結(jié)果進(jìn)一步強(qiáng)調(diào)了超參數(shù)選擇的重要性,凸顯了在BERT-LSTM-CRF模型中的學(xué)習(xí)率和dropout率對(duì)模型性能影響的關(guān)鍵性。這些參數(shù)的優(yōu)化可在一定程度上提高模型性能和泛化能力。實(shí)驗(yàn)的命名實(shí)體識(shí)別模型結(jié)果見表5。

    所有考慮的模型中,BERT-LSTM-CRF表現(xiàn)最佳,其精確度、召回率和F1值分別達(dá)0.898 4、0.992 7和0.910 4。在使用BERT與CRF結(jié)合的情況下,精確度、召回率和F1值分別為0.880 7、0.902 9和0.891 7。在引入雙向LSTM網(wǎng)絡(luò)后,F(xiàn)1值出現(xiàn)下降,可能是因?yàn)锽ERT已具良好的詞向量表示,而引入BiLSTM后導(dǎo)致過擬合現(xiàn)象。

    當(dāng)使用RoBERTa預(yù)訓(xùn)練模型時(shí),識(shí)別效果普遍下降。盡管RoBERTa和BERT均基于Transformer架構(gòu)的預(yù)訓(xùn)練語(yǔ)言模型,但在預(yù)訓(xùn)練細(xì)節(jié)、超參數(shù)等方面可能存在差異。BERT的架構(gòu)和超參數(shù)設(shè)置更適合地質(zhì)礦物領(lǐng)域的命名實(shí)體識(shí)別任務(wù)。值得注意的是,在中文文本中,巖石和礦物類型相對(duì)容易辨別,且其標(biāo)簽數(shù)量在所有實(shí)體中占比超過50%,因此,所有模型均表現(xiàn)出對(duì)“巖石”和“礦物類型”實(shí)體的良好識(shí)別效果,F(xiàn)1得分均超過90%。此外,表現(xiàn)較好的另外兩種實(shí)體類型是“地層”和“地質(zhì)時(shí)間”,且它們對(duì)應(yīng)的標(biāo)簽數(shù)量也相對(duì)較多。

    上述結(jié)果表明,在礦物實(shí)體識(shí)別任務(wù)中,BERT-LSTM-CRF模型的表現(xiàn)最佳,而RoBERTa預(yù)訓(xùn)練模型表現(xiàn)一般。不同類型的礦物實(shí)體在各模型的識(shí)別效果也呈現(xiàn)出一定差異。

    3? 結(jié)論和展望

    本研究主要致力于運(yùn)用深度學(xué)習(xí)構(gòu)建命名實(shí)體識(shí)別模型,即從大量地質(zhì)礦物相關(guān)文檔中提取命名實(shí)體。該工作為構(gòu)建地質(zhì)礦物知識(shí)圖譜提供了重要數(shù)據(jù)支持。基于BERT-LSTM-CRF模型,筆者團(tuán)隊(duì)從地質(zhì)礦物文獻(xiàn)中提取出6種類型實(shí)體,實(shí)現(xiàn)了平均精確度0.898 4,平均召回率0.922 7,平均F1分?jǐn)?shù)0.910 4。從實(shí)驗(yàn)結(jié)果中得出以下結(jié)論:

    (1) 在命名實(shí)體識(shí)別任務(wù)中,BERT-LSTM-CRF模型表現(xiàn)最佳,但引入BiLSTM會(huì)導(dǎo)致過擬合,從而降低模型性能。

    (2) 當(dāng)中文實(shí)體的語(yǔ)義區(qū)別明確且標(biāo)簽充足時(shí),實(shí)體識(shí)別效果更好。

    (3) 在地質(zhì)礦物領(lǐng)域命名實(shí)體識(shí)別任務(wù)中,RoBERTa不如BERT表現(xiàn)出色。BERT的架構(gòu)和超參數(shù)設(shè)置更適合地質(zhì)礦物領(lǐng)域命名實(shí)體識(shí)別任務(wù)。

    盡管本研究在礦物命名實(shí)體識(shí)別方面取得了良好效果,仍有待進(jìn)一步改進(jìn)的空間:

    (1) 針對(duì)標(biāo)注較少的實(shí)體類型,有進(jìn)一步提升其識(shí)別性能的空間。我們計(jì)劃通過擴(kuò)充數(shù)據(jù)集中的礦物實(shí)體數(shù)量來(lái)解決此問題。

    (2) 未來(lái)將針對(duì)地質(zhì)礦物領(lǐng)域的特點(diǎn)進(jìn)行模型調(diào)整和優(yōu)化,以提高模型的領(lǐng)域適應(yīng)性。

    (3) 根據(jù)從地質(zhì)礦物文本中所提取的信息構(gòu)建地質(zhì)礦物相關(guān)的領(lǐng)域知識(shí)圖譜。

    參考文獻(xiàn)

    [1] Ali S H,Giurco D,Arndt N,et al.Mineral supply for sustainable development requires resource governance[J].Nature,2017,543(7645):367-372.

    [2] Cernuzzi L,Pane J.Toward open government in Paraguay[J].It Professional,2014,16(5):62-64.

    [3] Ma X.Linked Geoscience Data in practice:Where W3C standards meet domain knowledge,data visualization and OGC standards[J].Earth Science Informatics,2017,10(4):429-441.

    [4] Gao J,Li M,Huang C N,et al.Chinese word segmentation and named entity recognition:A pragmatic approach[J].Computational Linguistics,2005,31(4):531-574.

    [5] Huang L,Du Y,Chen G.GeoSegmenter:A statistically learned Chinese word segmenter for the geoscience domain[J].Computers & geosciences,2015,76:11-17.

    [6] Zhang X,F(xiàn)an D,Xu J,et al.Sedimentary laminae in muddy inner continental shelf sediments of the East China Sea:Formation and implications for geochronology[J].Quaternary International,2018,464:343-351.

    [7] Qiu Q,Xie Z,Wu L,et al.BiLSTM-CRF for geological named entity recognition from the geoscience literature[J].Earth Science Informatics,2019,12:565-579.

    [8] Li W,Ma K,Qiu Q,et al.Chinese Word Segmentation Based on Self-Learning Model and Geological Knowledge for the Geoscience Domain[J].Earth and Space Science,2021,8(6):1673.

    [9] Wang B,Ma K,Wu L,et al.Visual analytics and information extraction of geological content for text-based mineral exploration reports[J].Ore Geology Reviews,2022,144:104818.

    [10] Sobhana N,Mitra P,Ghosh S K.Conditional random field based named entity recognition in geological text[J].International Journal of Computer Applications,2010,1(3):143-147.

    [11] Devlin J,Chang M W,Lee K,et al.Bert:Pre-training of deep bidirectional transformers for language understanding[J].arXiv preprint arXiv:2018,1810.

    [12] Radford A,Narasimhan K,Salimans T,et al.Improving language understanding by generative pre-training[J].2018.

    [13] Peters M E,Neumann M,Iyyer M,et al.Deep contextualized word representations[J].arXiv preprint arXiv,2018,1802.

    [14] Vaswani A,Shazeer N,Parmar N,et al.Attention is all you need[J].Advances in neural information processing systems,2017,30.

    [15] Bengio Y,Simard P,F(xiàn)rasconi P.Learning long-term dependencies with gradient descent is difficult[J].IEEE transactions on neural networks,1994,5(2):157-166.

    [16] Hochreiter S,Schmidhuber J.Long short-term memory[J].Neural computation,1997,9(8):1735-1780.

    [17] 莊云行,季鐸,馬堯,等.基于Bi-LSTM的涉恐類案件法律文書的命名實(shí)體識(shí)別研究[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2023 (7):36-39.

    [18] 邱芹軍,田苗,馬凱,等.區(qū)域地質(zhì)調(diào)查文本中文命名實(shí)體識(shí)別[J].地質(zhì)論評(píng),2023,69(04):1423-1433.

    Geological Mineral Attribute Recognition Method Based on

    Large-Scale Pre-Trained Model and Its Application

    Wang Binbin1,2,4, Zhou Kefa2,3,5, Wang Jinlin1,2,3,4, Wang Wei1,2,3,4, Li Chao5, Cheng Yinyi2

    (1.Xinjiang Research Center for Mineral Resources,Xinjiang Institute of Ecology and Geography,Chinese Academy

    of Sciences,Urumqi,Xinjiang,830011,China;2.University of Chinese Academy of Sciences,Beijing,100049,China;

    3.Technology and Engineering Center for Space Utilization, Chinese Academy of Sciences,Beijing,100094,China;

    4.Xinjiang Key Laboratory of Mineral Resources and Digital Geology,Urumqi,Xinjiang,830011,China;

    5.Institute of Geological Survey,China University of Geosciences,Wuhan,Hubei,430074,China)

    Abstract: Geoscience research results are usually documented in technical reports, journal papers, books, and other literature; however, many detailed geoscience reports are unused, which provides challenges and opportunities for information extraction. To this end, we propose a deep neural network model called GMNER (Geological Minerals named entity recognize, MNER) for recognizing and extracting key information such as mineral types, geological formations, rocks, and geological time. Unlike traditional methods, we employ a large-scale pre-trained model BERT (Bidirectional Encoder Representations from Transformers, BERT) and deep neural network to capture contextual information and combine it with a conditional random field (CRF) to obtain more accurate and accurate information. The experimental results show that the MNER model performs well in Chinese geological literature, achieving an average precision of 0.8984, an average recall of 0.9227, and an average F1 score of 0.9104. This study not only provides a new way for automated mineral information extraction but also is expected to promote the progress of mineral resource management and sustainable utilization.

    Key words: Mineral information extraction; Deep neural network; Mineral documentation; Named entity recognition

    項(xiàng)目資助:新疆維吾爾自治區(qū)重大科技專項(xiàng)(2021A03001-3)、新疆科學(xué)考察項(xiàng)目(2022xjkk1306)、深空大數(shù)據(jù)智能建設(shè)(292022000059)聯(lián)合資助

    收稿日期:2023-09-18;修訂日期:2024-01-09

    第一作者簡(jiǎn)介:王彬彬(1998-),男,陜西咸陽(yáng)人,中國(guó)科學(xué)院大學(xué)地球探測(cè)與信息技術(shù)專業(yè)在讀碩士,研究方向?yàn)榈刭|(zhì)大數(shù)據(jù);

    E-mail: wangbinbin21@mails.ucas.ac.cn

    猜你喜歡
    深度神經(jīng)網(wǎng)絡(luò)
    基于多注意力多尺度特征融合的圖像描述生成算法
    基于深度卷積神經(jīng)網(wǎng)絡(luò)的交通流量預(yù)測(cè)數(shù)學(xué)模型設(shè)計(jì)
    基于改進(jìn)SIFT特征和神經(jīng)網(wǎng)絡(luò)結(jié)合的場(chǎng)景識(shí)別
    軟件工程(2019年5期)2019-07-03 02:31:14
    基于Kaldi的語(yǔ)音識(shí)別算法
    深度神經(jīng)網(wǎng)絡(luò)在船舶自動(dòng)舵中的應(yīng)用
    基于深度神經(jīng)網(wǎng)絡(luò)的低延遲聲源分離方法
    基于大數(shù)據(jù)網(wǎng)絡(luò)的運(yùn)動(dòng)損傷評(píng)估模型研究
    試論基于深度神經(jīng)網(wǎng)絡(luò)的汽車車型識(shí)別問題
    深度神經(jīng)網(wǎng)絡(luò)的發(fā)展現(xiàn)狀
    基于深度神經(jīng)網(wǎng)絡(luò)的身份識(shí)別研究
    欧美日韩国产mv在线观看视频| 精品一品国产午夜福利视频| 亚洲精品久久成人aⅴ小说| 五月开心婷婷网| 久久精品91无色码中文字幕| 18禁黄网站禁片午夜丰满| 国产在线精品亚洲第一网站| 成年版毛片免费区| 国产淫语在线视频| 国产av精品麻豆| 操出白浆在线播放| 亚洲欧洲精品一区二区精品久久久| 在线十欧美十亚洲十日本专区| 女人高潮潮喷娇喘18禁视频| 狠狠婷婷综合久久久久久88av| 人人妻人人澡人人看| 看免费av毛片| 亚洲 国产 在线| 人妻一区二区av| 18在线观看网站| 狂野欧美激情性xxxx| 精品久久久精品久久久| 国产在线观看jvid| 天天操日日干夜夜撸| 亚洲国产av影院在线观看| 丁香六月欧美| 成人特级黄色片久久久久久久 | 亚洲av电影在线进入| 午夜精品久久久久久毛片777| 久久国产精品人妻蜜桃| 免费在线观看影片大全网站| 岛国毛片在线播放| 亚洲人成伊人成综合网2020| 美女福利国产在线| 老熟女久久久| 香蕉丝袜av| 一区二区av电影网| 看免费av毛片| 涩涩av久久男人的天堂| 在线看a的网站| 久久久久国产一级毛片高清牌| 日韩免费高清中文字幕av| 精品人妻1区二区| videosex国产| 久久久久视频综合| av免费在线观看网站| 99re在线观看精品视频| 午夜福利在线观看吧| 国产精品免费大片| 欧美成人午夜精品| 深夜精品福利| 青草久久国产| 久久久久久久久免费视频了| 亚洲精品国产区一区二| 色94色欧美一区二区| 国产精品美女特级片免费视频播放器 | 日日夜夜操网爽| 热re99久久精品国产66热6| 他把我摸到了高潮在线观看 | 老司机亚洲免费影院| tube8黄色片| 黄色视频,在线免费观看| 国产欧美日韩综合在线一区二区| 9191精品国产免费久久| 91成人精品电影| 精品国产一区二区三区久久久樱花| 国产麻豆69| 亚洲国产欧美网| av线在线观看网站| 久久99一区二区三区| 久久久国产一区二区| 国产精品国产高清国产av | 久久久久久久久久久久大奶| 人人澡人人妻人| 757午夜福利合集在线观看| 国产精品久久久av美女十八| a级毛片在线看网站| 午夜久久久在线观看| 老熟妇乱子伦视频在线观看| 在线永久观看黄色视频| 后天国语完整版免费观看| 色视频在线一区二区三区| 老汉色∧v一级毛片| 啦啦啦 在线观看视频| av福利片在线| 午夜福利影视在线免费观看| 日韩欧美一区视频在线观看| 香蕉国产在线看| 怎么达到女性高潮| 午夜免费成人在线视频| 国产成人精品无人区| 国产精品免费大片| 老司机靠b影院| 国产精品九九99| 人人妻人人澡人人看| 午夜91福利影院| 免费黄频网站在线观看国产| 麻豆av在线久日| 亚洲情色 制服丝袜| 亚洲精品中文字幕在线视频| 国产精品一区二区在线观看99| 色婷婷av一区二区三区视频| 9热在线视频观看99| 日韩欧美一区视频在线观看| 18在线观看网站| 黄片播放在线免费| av线在线观看网站| 国产精品久久久久久人妻精品电影 | 国产高清视频在线播放一区| 俄罗斯特黄特色一大片| 亚洲欧洲日产国产| 欧美日韩黄片免| 啦啦啦 在线观看视频| 国产麻豆69| 超碰成人久久| 两个人免费观看高清视频| 中国美女看黄片| 9色porny在线观看| 飞空精品影院首页| 性色av乱码一区二区三区2| 91麻豆av在线| 亚洲三区欧美一区| 人人妻人人澡人人爽人人夜夜| 两人在一起打扑克的视频| 久久精品亚洲精品国产色婷小说| 国产精品国产av在线观看| 超色免费av| 免费在线观看日本一区| 韩国精品一区二区三区| 老鸭窝网址在线观看| av一本久久久久| 精品国产亚洲在线| 国产精品av久久久久免费| 欧美一级毛片孕妇| 999精品在线视频| 90打野战视频偷拍视频| 精品午夜福利视频在线观看一区 | 国产av精品麻豆| 亚洲综合色网址| 亚洲专区国产一区二区| 性高湖久久久久久久久免费观看| 色综合欧美亚洲国产小说| 亚洲专区国产一区二区| 成人亚洲精品一区在线观看| 成人18禁在线播放| 韩国精品一区二区三区| 99国产综合亚洲精品| 免费看十八禁软件| 黄片小视频在线播放| 天天操日日干夜夜撸| 国产单亲对白刺激| 欧美乱码精品一区二区三区| 精品一区二区三区四区五区乱码| 天堂8中文在线网| 97人妻天天添夜夜摸| 热99久久久久精品小说推荐| 国产福利在线免费观看视频| 老司机福利观看| 欧美国产精品va在线观看不卡| 日韩成人在线观看一区二区三区| 老司机影院毛片| 亚洲伊人久久精品综合| 久久精品国产综合久久久| 欧美+亚洲+日韩+国产| 成人免费观看视频高清| 中文字幕人妻熟女乱码| 欧美日韩亚洲国产一区二区在线观看 | 成人亚洲精品一区在线观看| 国产区一区二久久| 国产精品久久久久成人av| tube8黄色片| 亚洲精品中文字幕一二三四区 | 啦啦啦免费观看视频1| 天堂中文最新版在线下载| 少妇的丰满在线观看| 国产精品熟女久久久久浪| 国产日韩欧美亚洲二区| 日本黄色日本黄色录像| 亚洲av第一区精品v没综合| 久久久精品国产亚洲av高清涩受| 国产激情久久老熟女| 午夜日韩欧美国产| 精品国产超薄肉色丝袜足j| 午夜福利视频在线观看免费| 性高湖久久久久久久久免费观看| 69精品国产乱码久久久| 国产成人免费无遮挡视频| 亚洲精品中文字幕在线视频| 啦啦啦 在线观看视频| 最新的欧美精品一区二区| 国产激情久久老熟女| 国产日韩欧美视频二区| a级片在线免费高清观看视频| 久久久久国内视频| 制服人妻中文乱码| 久久国产精品影院| 蜜桃在线观看..| 久久精品91无色码中文字幕| 午夜成年电影在线免费观看| 高清欧美精品videossex| 久久久久久久国产电影| 久热这里只有精品99| 日本a在线网址| 亚洲国产av新网站| 免费一级毛片在线播放高清视频 | 国产亚洲精品第一综合不卡| 欧美日韩中文字幕国产精品一区二区三区 | 国产一区二区激情短视频| 欧美精品一区二区免费开放| 青青草视频在线视频观看| 久久久精品区二区三区| 他把我摸到了高潮在线观看 | 老熟妇乱子伦视频在线观看| 国产精品久久久av美女十八| 91av网站免费观看| 久久精品国产99精品国产亚洲性色 | 蜜桃在线观看..| 黄频高清免费视频| 欧美黄色淫秽网站| 亚洲av片天天在线观看| 三上悠亚av全集在线观看| 日韩熟女老妇一区二区性免费视频| 无人区码免费观看不卡 | 亚洲成人国产一区在线观看| a在线观看视频网站| av一本久久久久| 在线观看66精品国产| 两个人免费观看高清视频| 一级,二级,三级黄色视频| 熟女少妇亚洲综合色aaa.| 午夜福利影视在线免费观看| 自线自在国产av| 日韩视频一区二区在线观看| tocl精华| 亚洲成人手机| 丝袜喷水一区| 色精品久久人妻99蜜桃| 精品第一国产精品| 日本黄色视频三级网站网址 | 大香蕉久久网| 免费人妻精品一区二区三区视频| 亚洲色图综合在线观看| 国产男靠女视频免费网站| 亚洲av第一区精品v没综合| 法律面前人人平等表现在哪些方面| 欧美日韩国产mv在线观看视频| 精品国产一区二区三区四区第35| 99精国产麻豆久久婷婷| 日韩中文字幕视频在线看片| 9191精品国产免费久久| 亚洲成人免费av在线播放| 欧美日韩亚洲综合一区二区三区_| 99久久精品国产亚洲精品| 国产av国产精品国产| 丝瓜视频免费看黄片| 中国美女看黄片| 一本大道久久a久久精品| 亚洲精品美女久久久久99蜜臀| 亚洲国产欧美在线一区| 久久久国产欧美日韩av| 精品熟女少妇八av免费久了| 国产精品久久久久久精品古装| 国产成人精品久久二区二区91| 久久青草综合色| 久久精品aⅴ一区二区三区四区| 国产精品秋霞免费鲁丝片| 国产亚洲av高清不卡| 一夜夜www| 真人做人爱边吃奶动态| 国产精品免费一区二区三区在线 | svipshipincom国产片| 涩涩av久久男人的天堂| 极品人妻少妇av视频| 老汉色∧v一级毛片| 1024视频免费在线观看| 欧美日韩精品网址| 久久99一区二区三区| 大片免费播放器 马上看| kizo精华| 黑人猛操日本美女一级片| 日韩成人在线观看一区二区三区| 免费不卡黄色视频| 国产在线一区二区三区精| 青草久久国产| 黄网站色视频无遮挡免费观看| 日本a在线网址| 色播在线永久视频| 大香蕉久久网| 窝窝影院91人妻| 国产不卡av网站在线观看| 老司机福利观看| av天堂在线播放| 美女主播在线视频| 国产成人欧美| 男人操女人黄网站| 精品一区二区三区视频在线观看免费 | 少妇 在线观看| 免费观看av网站的网址| 成人精品一区二区免费| 女性生殖器流出的白浆| 91精品国产国语对白视频| 99精品欧美一区二区三区四区| svipshipincom国产片| 天天影视国产精品| 一本色道久久久久久精品综合| 91字幕亚洲| 亚洲天堂av无毛| 午夜两性在线视频| 1024视频免费在线观看| 侵犯人妻中文字幕一二三四区| 免费观看av网站的网址| 免费在线观看视频国产中文字幕亚洲| 99精国产麻豆久久婷婷| 美女福利国产在线| 日韩熟女老妇一区二区性免费视频| 国产成人av激情在线播放| 午夜福利一区二区在线看| 日本五十路高清| 91成年电影在线观看| 人人妻人人添人人爽欧美一区卜| 99精品欧美一区二区三区四区| 国产片内射在线| 日韩精品免费视频一区二区三区| 国产激情久久老熟女| 天天影视国产精品| 午夜激情久久久久久久| 12—13女人毛片做爰片一| 亚洲国产精品一区二区三区在线| 美女主播在线视频| av网站免费在线观看视频| 亚洲情色 制服丝袜| 少妇粗大呻吟视频| 国产亚洲精品久久久久5区| 黄片播放在线免费| 亚洲第一av免费看| 夜夜爽天天搞| 国产精品欧美亚洲77777| 亚洲精品中文字幕在线视频| 国产成人精品在线电影| aaaaa片日本免费| 麻豆成人av在线观看| videosex国产| 成人18禁在线播放| 国产深夜福利视频在线观看| 天天操日日干夜夜撸| 黄片播放在线免费| 波多野结衣av一区二区av| 国产成人影院久久av| 成人精品一区二区免费| 久久亚洲精品不卡| 午夜老司机福利片| 女同久久另类99精品国产91| 人人妻人人澡人人爽人人夜夜| av一本久久久久| 精品人妻在线不人妻| 国产成人欧美在线观看 | av一本久久久久| 午夜精品久久久久久毛片777| av福利片在线| 窝窝影院91人妻| 18禁观看日本| 午夜91福利影院| 人人妻人人爽人人添夜夜欢视频| 色婷婷av一区二区三区视频| 日本黄色视频三级网站网址 | 51午夜福利影视在线观看| 人人妻人人添人人爽欧美一区卜| 国产淫语在线视频| 99热网站在线观看| 999久久久国产精品视频| 最新的欧美精品一区二区| 又黄又粗又硬又大视频| 老司机影院毛片| 天堂8中文在线网| 久热这里只有精品99| 夜夜夜夜夜久久久久| 午夜精品国产一区二区电影| 国产精品久久久久久人妻精品电影 | 99国产精品一区二区三区| 十八禁网站网址无遮挡| 最新在线观看一区二区三区| 天堂俺去俺来也www色官网| 国产精品av久久久久免费| 亚洲精品国产一区二区精华液| 自线自在国产av| 成人黄色视频免费在线看| 一二三四在线观看免费中文在| 两个人免费观看高清视频| 欧美日韩视频精品一区| 国产精品国产高清国产av | 女人久久www免费人成看片| 熟女少妇亚洲综合色aaa.| 美国免费a级毛片| 久久久欧美国产精品| 日本vs欧美在线观看视频| 超碰97精品在线观看| 少妇裸体淫交视频免费看高清 | 两人在一起打扑克的视频| 999精品在线视频| 亚洲av第一区精品v没综合| 久久99热这里只频精品6学生| 精品乱码久久久久久99久播| 久久久久视频综合| 午夜视频精品福利| 久久精品成人免费网站| 久久ye,这里只有精品| 美女午夜性视频免费| 热99re8久久精品国产| 女同久久另类99精品国产91| 欧美日韩亚洲综合一区二区三区_| 50天的宝宝边吃奶边哭怎么回事| 巨乳人妻的诱惑在线观看| 欧美人与性动交α欧美精品济南到| 侵犯人妻中文字幕一二三四区| 极品教师在线免费播放| 丰满迷人的少妇在线观看| 热99久久久久精品小说推荐| e午夜精品久久久久久久| 狠狠精品人妻久久久久久综合| www.自偷自拍.com| 女警被强在线播放| 黄色成人免费大全| 肉色欧美久久久久久久蜜桃| xxxhd国产人妻xxx| 老熟妇仑乱视频hdxx| 天堂中文最新版在线下载| 亚洲av成人一区二区三| 国产av一区二区精品久久| 人人妻人人澡人人看| 亚洲熟女毛片儿| a级毛片在线看网站| 国精品久久久久久国模美| 亚洲久久久国产精品| 丰满人妻熟妇乱又伦精品不卡| 国产成人系列免费观看| 国产成人一区二区三区免费视频网站| 精品国产亚洲在线| 久久人妻熟女aⅴ| xxxhd国产人妻xxx| 午夜福利一区二区在线看| 大片电影免费在线观看免费| 欧美精品高潮呻吟av久久| 亚洲精品自拍成人| 精品福利观看| 国产精品自产拍在线观看55亚洲 | 亚洲国产欧美在线一区| 国产一区二区三区视频了| 中国美女看黄片| 亚洲五月色婷婷综合| 亚洲黑人精品在线| 成年人午夜在线观看视频| 91av网站免费观看| 黄色a级毛片大全视频| av线在线观看网站| 亚洲人成电影免费在线| 精品一区二区三区视频在线观看免费 | 最黄视频免费看| 在线观看免费视频日本深夜| 日本a在线网址| 成人永久免费在线观看视频 | 一区二区三区乱码不卡18| 久久精品人人爽人人爽视色| 中文字幕av电影在线播放| 久久精品aⅴ一区二区三区四区| 久久久久久久久久久久大奶| 欧美日韩国产mv在线观看视频| 欧美激情极品国产一区二区三区| www日本在线高清视频| 亚洲成人手机| 男女床上黄色一级片免费看| 国产亚洲欧美精品永久| 婷婷成人精品国产| 国产色视频综合| 国产一区二区三区视频了| 最近最新中文字幕大全免费视频| 精品少妇内射三级| 蜜桃在线观看..| 久久午夜亚洲精品久久| 欧美日韩国产mv在线观看视频| 日韩欧美一区视频在线观看| 亚洲七黄色美女视频| 在线观看免费高清a一片| 成年人免费黄色播放视频| www.熟女人妻精品国产| 午夜福利视频在线观看免费| 国产精品秋霞免费鲁丝片| 丝瓜视频免费看黄片| 中文欧美无线码| 国产亚洲av高清不卡| 久久中文字幕人妻熟女| 国产成人精品久久二区二区免费| 亚洲,欧美精品.| 国产人伦9x9x在线观看| 国产伦理片在线播放av一区| 91大片在线观看| 日韩精品免费视频一区二区三区| 久久久久国产一级毛片高清牌| 国产精品麻豆人妻色哟哟久久| 亚洲人成伊人成综合网2020| 久久人人97超碰香蕉20202| 操出白浆在线播放| 在线亚洲精品国产二区图片欧美| 69精品国产乱码久久久| 悠悠久久av| 亚洲一卡2卡3卡4卡5卡精品中文| 亚洲国产成人一精品久久久| 热99re8久久精品国产| 久久人人97超碰香蕉20202| 最黄视频免费看| 亚洲全国av大片| 日本撒尿小便嘘嘘汇集6| 涩涩av久久男人的天堂| 国产区一区二久久| 国产真人三级小视频在线观看| 国产单亲对白刺激| 免费看a级黄色片| 日韩大片免费观看网站| 精品一区二区三卡| 国产激情久久老熟女| 国产av一区二区精品久久| 丰满人妻熟妇乱又伦精品不卡| 久久毛片免费看一区二区三区| av一本久久久久| 他把我摸到了高潮在线观看 | 精品亚洲成a人片在线观看| 欧美日韩福利视频一区二区| 亚洲精品中文字幕在线视频| 99热国产这里只有精品6| av线在线观看网站| 精品一区二区三区四区五区乱码| 亚洲全国av大片| 菩萨蛮人人尽说江南好唐韦庄| 免费少妇av软件| svipshipincom国产片| 久久天堂一区二区三区四区| 久久热在线av| 黄片小视频在线播放| 国产精品 欧美亚洲| 一进一出好大好爽视频| 久久99热这里只频精品6学生| 亚洲精品粉嫩美女一区| 中文字幕高清在线视频| 国产成人精品在线电影| 女人爽到高潮嗷嗷叫在线视频| 免费女性裸体啪啪无遮挡网站| 欧美性长视频在线观看| 亚洲精品中文字幕一二三四区 | 大型av网站在线播放| 国产日韩欧美视频二区| 精品熟女少妇八av免费久了| 在线观看人妻少妇| aaaaa片日本免费| 亚洲美女黄片视频| 精品一区二区三区四区五区乱码| 人人妻,人人澡人人爽秒播| 国产欧美日韩综合在线一区二区| 亚洲专区中文字幕在线| 亚洲精品乱久久久久久| 久久久国产欧美日韩av| 老司机午夜福利在线观看视频 | 日本a在线网址| 一级a爱视频在线免费观看| 亚洲人成电影观看| 国产亚洲一区二区精品| 欧美日韩福利视频一区二区| 黑人巨大精品欧美一区二区蜜桃| 日本一区二区免费在线视频| 免费看a级黄色片| 成人18禁在线播放| 久久久水蜜桃国产精品网| 亚洲专区字幕在线| 精品福利永久在线观看| 亚洲欧美精品综合一区二区三区| 亚洲七黄色美女视频| 一本大道久久a久久精品| 中国美女看黄片| 大型黄色视频在线免费观看| 亚洲第一欧美日韩一区二区三区 | 免费高清在线观看日韩| 欧美精品啪啪一区二区三区| 大香蕉久久成人网| 国产高清视频在线播放一区| 在线观看免费午夜福利视频| 无遮挡黄片免费观看| 一级毛片电影观看| 国产欧美日韩一区二区三| 青青草视频在线视频观看| 午夜福利免费观看在线| 美女国产高潮福利片在线看| 后天国语完整版免费观看| 国产精品影院久久| 亚洲国产中文字幕在线视频| 国产欧美日韩一区二区三| 国产免费视频播放在线视频| 国产一区二区激情短视频| 国产成+人综合+亚洲专区| 久久免费观看电影| 黄色 视频免费看| 日韩一卡2卡3卡4卡2021年| 国产高清激情床上av| 国产99久久九九免费精品| 天堂中文最新版在线下载| 岛国在线观看网站| 成人手机av| 精品亚洲乱码少妇综合久久| 男女高潮啪啪啪动态图| 欧美日本中文国产一区发布| 丝袜美足系列| a级毛片在线看网站| 美女视频免费永久观看网站| 两人在一起打扑克的视频| h视频一区二区三区| 脱女人内裤的视频| 精品免费久久久久久久清纯 | tube8黄色片|