• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于機器學習算法的石油鉆速研究

      2021-01-09 06:36:38張維罡東北石油大學計算機與信息技術(shù)學院黑龍江大慶163318
      化工管理 2021年20期
      關(guān)鍵詞:鉆速離群鉆井

      張維罡(東北石油大學計算機與信息技術(shù)學院,黑龍江 大慶 163318)

      0 引言

      石油行業(yè)是一個涉及了多個學科的綜合性工業(yè)領(lǐng)域,而在石油鉆井領(lǐng)域中,減少成本,提高效率是所有人長期研究的課題。在如今信息化的時代,如何將傳統(tǒng)的石油鉆井項目與機器學習等創(chuàng)新型技術(shù)結(jié)合,建立數(shù)字化油田,是石油工作者目前工作的重點之一。本項目計劃通過對鉆井過程中的數(shù)據(jù)進行分析,使得機器學習、深度學習等創(chuàng)新型項目在鉆井領(lǐng)域獲得初步應用,對鉆井速度進行優(yōu)化。

      1 系統(tǒng)總體架構(gòu)設(shè)計

      數(shù)據(jù)選擇模塊是對鉆井過程中獲得的參數(shù)進行篩選,該模塊主要內(nèi)容包括以下兩點:第一是對比不同井的鉆井數(shù)據(jù),選擇出數(shù)據(jù)量最大,參數(shù)最多,時間最長的一組鉆井數(shù)據(jù)。第二是對鉆井的參數(shù)進行對比,刪除在整個鉆井期間都維持不變的靜態(tài)參數(shù),并且把鉆速為空的時間段刪除。最終,數(shù)據(jù)選用2021年美國開源鉆井數(shù)據(jù),井號為16a_32,數(shù)據(jù)是2020年10月25日到11月4日每隔10秒收集一次的鉆井數(shù)據(jù),有32個參數(shù),大約56萬條數(shù)據(jù)。

      2 數(shù)據(jù)清洗模塊設(shè)計

      數(shù)據(jù)清洗模塊的目的為解決數(shù)據(jù)的質(zhì)量問題。例如比如數(shù)據(jù)部分缺失、特征無效等。該模塊主要工作為以下兩點:第一,刪除無關(guān)的數(shù)據(jù),即剔除掉那些對于模型的實驗結(jié)果無關(guān)的數(shù)據(jù),例如鉆頭直徑這樣的數(shù)據(jù);第二,刪除特征值全為空或為0的數(shù)據(jù)。在鉆井過程中,可能存在記錄時出現(xiàn)錯誤導致沒有記錄的情況,這些參數(shù)就會為空,可以認為其是無效參數(shù),可以在數(shù)據(jù)中刪除。通過數(shù)據(jù)選擇模塊,可以保證實驗時的鉆井數(shù)據(jù)的數(shù)據(jù)質(zhì)量,為接下來的實驗做鋪墊。

      3 離群點模塊設(shè)計

      離群點指的是那些間隔較遠、明顯偏離其他數(shù)據(jù)點的樣本點。其作用為檢測并處理數(shù)據(jù)中存在的離群點。在數(shù)據(jù)分布上,普通樣本平時聚集在一小塊區(qū)域,而離群點的分布則比較稀疏,并且與其他樣本點相距比較遠。所以需要對離群點進行檢測與刪除的工作。

      于是得出結(jié)論,即該模塊中主要進行三部分工作:(1)通過運用單元的3&離群點算法與MAD離群點算法進行模型運算,通過rmse的得分進行對比,從單元離群點算法中選擇出實驗效果較好的算法。(2)通過運用多元離群點檢測算法,例如:Isoliation Forest、Local outlier Factory、Elliptyc envelop等 算 法進行比較與選取,選出多元離群點檢測算法中實驗效果較好的一個算法。(3)將多元離群點檢測算法中實驗效果較好的那一個與單元離群點檢測算法中實驗效果較好的那一個進行融合,變成既能照顧到單元離群點檢測算法,又能照顧到多元離群點檢測算法的數(shù)據(jù),將其刪除。這樣一來,就可以得到更加適用與石油鉆井領(lǐng)域的離群點去除算法。

      4 數(shù)據(jù)分割與歸一化模塊

      對數(shù)據(jù)進行歸一化與標準化的原因是運用機器學習解決石油領(lǐng)域或其他領(lǐng)域的實際問題時,數(shù)據(jù)中有可能出現(xiàn)由于特征之間相互有不同的衡量標準,導致即使使用同一類型的度量,各個特征之間的差異性也會非常大。例如特征A與特征B都是關(guān)于路程的特征,特征A一般使用千米單位進行測量,而特征B一般運用米來進行度量。這種情況下,如果不引入數(shù)據(jù)的標準化的方法,則會使得特征A的影響要遠遠比特征B的影響要大。因此,為了對這種情況進行排除,需要將數(shù)據(jù)進行歸一化或標準化。通過離群點去除算法將離群點去除后,需要進行數(shù)據(jù)集的歸一化與標準化處理,以及對數(shù)據(jù)的清洗。首先,運用sklearn中的算法將數(shù)據(jù)集分割成media和valid兩個數(shù)據(jù)集,testsize設(shè)置為0.2,然后將midia再次通過sklearn中的數(shù)據(jù)集分割算法,testsize再次設(shè)置為0.2,最后得到訓練集,測試集以及驗證集。

      5 鉆速預測方案設(shè)計

      針對一般的優(yōu)化問題,首先要對相關(guān)輸入與輸出的關(guān)系建立映射,為了達到最優(yōu)化的目的,應基于這種映射來找到全局最優(yōu)解。要想將這種方法應用到實際的項目中去,應該做到以下兩點:第一是建立目標特征與其他特征建立對應關(guān)系,在本項目中對應的是將鉆速與其他特征例如鉆壓,大勾高度等參數(shù)建立映射關(guān)系;第二則是在模型訓練后尋找函數(shù)本身的最優(yōu)點。

      在本項目中,重點與難點是進行數(shù)據(jù)的分析,即對于石油鉆井的各項參數(shù)的可視化,圖表分析。通過對石油鉆井數(shù)據(jù)的分析,我們才能進一步得出結(jié)論。所以,該模塊分為以下兩個部分:(1)通過對數(shù)據(jù)的分析,合理的使用數(shù)據(jù)預處理的各個模型,使得模型擬合效果達到不錯的效果,并在這個過程中,通過查看各個 參數(shù)對rop鉆速的影響,來對這些參數(shù)的重要性有一個大概的了解。(2)通過使用lightgmb算法,對訓練集中的鉆速進行擬合,通過調(diào)整模型參數(shù),以及刪除離群點等操作,使得該模型的rmse評分達到最優(yōu),通過其算法的特點,找出最能影響鉆速的10個參數(shù)與數(shù)據(jù)分析時所找的參數(shù)進行分析對比。最終找出最能影響鉆速的參數(shù)。(3)使用全連接神經(jīng)網(wǎng)絡(luò)對同樣的數(shù)據(jù)集進行擬合,觀察擬合效果。(4)根據(jù)(1)(2)(3)中模型預測效果的對比以及相關(guān)分析,選擇合適的模型,確定最終模型的結(jié)構(gòu)。(5)根據(jù)訓練好的模型結(jié)構(gòu),尋找模型局部較優(yōu)點。

      6 實驗結(jié)果分析

      6.1 Lightgbm模型

      運用上述去除離群點的方法去除離群點之后,對Lightgbm模型進行訓練,得到相應的rmse的值。通過實驗結(jié)果可以推出:Lightgbm模型訓練時間段,訓練效果好,比較適合用于鉆速預測的工作。在Lightgbm模型中,數(shù)據(jù)各個特征對于目標特征的重要程度可以進行從小到大的排序,而且通過生成回歸樹進行分割的次數(shù)也能被記錄下來。雖然通過調(diào)整模型中的各個參數(shù)來對模型本身進行優(yōu)化,但是各個特征之間的關(guān)系,即對目標特征的重要程度不會發(fā)生相應的變化。通過對結(jié)果數(shù)據(jù)進行分析可以看出鉆時對最終預測結(jié)果的影響最大,遠高于其他特征,這與在數(shù)據(jù)分析時所畫的圖相同,說明該參數(shù)對于鉆速的影響確實非常大。對鉆速影響第二大的是大勾高度,在歷史擬合的實驗中,該特征往往被忽略,而該實驗則可以對傳統(tǒng)歷史擬合作出一定程度的補充。另外,還有很多參數(shù)也能對模型的結(jié)果產(chǎn)生影響,例如活動池體積、鉆壓等。在歷史擬合的實驗中,這些參數(shù)都是鉆井過程中會直接影響鉆進速度的因素,理應對鉆進速度的預測有較大的影響。而那些靜態(tài)變量,例如測量井深、垂直井深等,在一開始的數(shù)據(jù)分析中就發(fā)現(xiàn)對實驗結(jié)果影響不大,這也是合情合理的。

      6.2 神經(jīng)網(wǎng)絡(luò)模型

      在該實驗中,我們運用 pytorch對模型進行建模,進行數(shù)據(jù)訓練時,采用4層網(wǎng)絡(luò)架構(gòu),包括輸入層,dropout層,隱藏層以及輸出層。通過數(shù)據(jù)預處理將靜態(tài)變量刪除后,剩下的數(shù)據(jù)中一共包含有25個特征參數(shù),因此輸入層包含25個輸入節(jié)點;在選取激活函數(shù)時,使用Relu函數(shù),在輸出層不使用激活函數(shù),將最后一層隱層的輸出經(jīng)過加權(quán)后直接作為輸出的預測結(jié)果。在神經(jīng)網(wǎng)絡(luò)的訓練過程中,通過選取合適的batch與epoch來控制模型的訓練過程。通過設(shè)置dropout為0.2來保證數(shù)據(jù)的隨機性。通過pytorch中的優(yōu)化器進行設(shè)置使得學習率為0.000 1,優(yōu)化器選用adam。在實驗中,迭代次數(shù)為第930次迭代時目標特征的擬合程度達到最優(yōu),共耗時為892秒。通過實驗數(shù)據(jù)的分析可以看出神經(jīng)網(wǎng)絡(luò)對于相同的數(shù)據(jù)同樣展現(xiàn)出了良好的擬合能力,并且沒有異常情況出現(xiàn),如欠擬合或過擬合等。通過與Lightgmb模型進行對比,發(fā)現(xiàn)該模型訓練出的效果比lightgmb模型的效果要好。但是訓練的時長是lightgmb模型的很多倍。經(jīng)過上述模型訓練以及分析過程可以看出,即使運用最簡單的深度學習框架,也和如今流行的機器學習算法的訓練效果差不多。而普通的算法模型的訓練效果就要比深度學習的訓練效果差上不少。

      7 鉆速優(yōu)化

      本項目分別在不同的模型中對鉆速進行了預測,運用的模型有Lightgbm模型、全連接神經(jīng)網(wǎng)絡(luò)模型以及普通算法模型。根據(jù)模型得出的rmse分數(shù)以及測試集上的表現(xiàn)可以推出以下結(jié)論:(1)普通的算法模型的rmse得分較差,Lightgbm模型的rmse得分基本與全連接神經(jīng)網(wǎng)絡(luò)模型相同,比其他算法模型效果都要好。(2)全鏈接神經(jīng)網(wǎng)絡(luò)模型得出結(jié)果的時間最長,Lightgbm模型得出結(jié)果的時間是最短的。這說明在實踐過程中運用lightgbm模型的效果能達到最優(yōu)。

      8 結(jié)語

      本項目主要完成了以下三部分工作內(nèi)容:(1)通過對鉆井過程中存在的問題與機器學習算法結(jié)合起來進行研究,使得機器學習算法能與實際問題結(jié)合,并提供優(yōu)化思路。為后續(xù)研究提供理論基礎(chǔ)。(2)鉆井數(shù)據(jù)處理方案的設(shè)計。本文通過對鉆井數(shù)據(jù)特征進行研究,將不必要的特征刪除,并且結(jié)合系統(tǒng)論的思想,實現(xiàn)了對于鉆井數(shù)據(jù)的處理,其中,數(shù)據(jù)清洗最為重要,是機器學習項目中的基石。通過分析數(shù)據(jù),可以得出到底運用哪個鉆井參數(shù)的結(jié)論。(3)本文通過機器學習的常用優(yōu)化策略,實現(xiàn)對鉆速的優(yōu)化,通過常用的回歸模型來對對應鉆速的各個參數(shù)實現(xiàn)優(yōu)化與處理。

      猜你喜歡
      鉆速離群鉆井
      聰聰?shù)叵颅h(huán)游記之超深鉆井
      自升式鉆井平臺Aker操作系統(tǒng)應用探討
      海洋石油(2021年3期)2021-11-05 07:42:54
      螺桿鉆具提速技術(shù)研究
      石油研究(2020年1期)2020-05-22 12:51:40
      AWOBA-NW井施工分析
      科學與財富(2020年5期)2020-05-06 09:17:22
      掃描“藍鯨”——觀察海上鉆井平臺
      淺析提高中深井鉆速的方法
      科學與財富(2018年7期)2018-05-21 08:46:30
      離群數(shù)據(jù)挖掘在發(fā)現(xiàn)房產(chǎn)銷售潛在客戶中的應用
      離群的小雞
      G0-7“工廠化”井組鉆井工藝技術(shù)
      應用相似度測量的圖離群點檢測方法
      松阳县| 太和县| 闽侯县| 随州市| 益阳市| 福泉市| 凤山市| 古丈县| 荥经县| 疏勒县| 兴海县| 汾西县| 剑阁县| 鸡东县| 当阳市| 远安县| 开鲁县| 山丹县| 峡江县| 南投县| 文水县| 夏津县| 耒阳市| 揭西县| 织金县| 陈巴尔虎旗| 德兴市| 湛江市| 兴安县| 夹江县| 油尖旺区| 襄汾县| 许昌县| 襄垣县| 绵竹市| 馆陶县| 泗水县| 英超| 关岭| 松原市| 北宁市|