◆齊霖
基于人工智能技術(shù)的泡沫排水采氣智能化加注系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
◆齊霖
(京東物流人工智能與大數(shù)據(jù)部 北京 100000)
天然氣自氣井采集過程中,因?yàn)闅饩陨砟芰枯^弱,必須依靠外力才能及時(shí)排出井內(nèi)積液,維持氣井正常生產(chǎn)。當(dāng)前的大部分天然氣井,基本實(shí)現(xiàn)藥劑自動(dòng)配兌、自動(dòng)加注等功能,極大節(jié)約了人力物力。同時(shí)通過在原加注工藝上增加電磁閥、深度液位計(jì)等設(shè)備,實(shí)現(xiàn)了自動(dòng)加注。但是此種方式存在一些顯著弊端,泡排制度調(diào)整主要依靠人員經(jīng)驗(yàn),或簡單依靠油套壓差、產(chǎn)水量、產(chǎn)氣量情況進(jìn)行調(diào)整,存在藥劑加注量過大或加注制度不合理現(xiàn)象。另外現(xiàn)有泡排工藝效果尚無系統(tǒng)評價(jià)方法,無法對不同井況效果進(jìn)行對比。在上述背景下,本項(xiàng)目的總體目標(biāo)是基于人工智能技術(shù)建設(shè)一個(gè)能夠接收實(shí)時(shí)數(shù)據(jù)、并自動(dòng)判斷是否存在不穩(wěn)定生產(chǎn)狀況、同時(shí)對加注泡排劑劑量能調(diào)整優(yōu)化的智能化系統(tǒng),其目的是代替原有人工經(jīng)驗(yàn)判斷的傳統(tǒng)方式,自動(dòng)化地調(diào)整氣井所需的泡排劑的劑量值;與此同時(shí),系統(tǒng)也能自主判斷何時(shí)需要修改、修改的劑量值是否適合。
人工智能;天然氣井;系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn);機(jī)器學(xué)習(xí)
早在20世紀(jì)50~60年代,泡沫排水采氣就受到國外學(xué)者的關(guān)注,在前蘇聯(lián)和美國的多個(gè)氣田開展了泡沫排水,效果較好,成效很高。美國堪薩斯州、俄克拉荷馬州等氣田實(shí)施泡排工藝技術(shù),其成功率達(dá)到90%以上。
國內(nèi)開展泡沫排水采氣相對較晚,川南氣區(qū)從1978年起開始,在威遠(yuǎn)氣田酸化井開展泡沫劑排液工藝技術(shù)試驗(yàn),到1990年,川渝地區(qū)多個(gè)氣田都已推廣了泡沫排水采氣的應(yīng)用。然而,目前泡沫排水采氣技術(shù)仍存在幾大技術(shù)瓶頸,嚴(yán)重制約著泡沫排水采氣措施效率與效益的進(jìn)一步提升:(1)泡沫排水采氣年投入成本較高,主要為藥劑成本,投入產(chǎn)出比較低;(2)氣井積液診斷準(zhǔn)確率低(低于80%)、井底積液量預(yù)測誤差大(約50%),藥劑用量、加注制度設(shè)計(jì)方法缺乏;(3)施工效果評價(jià)指標(biāo)單一,缺乏經(jīng)濟(jì)有效的評價(jià)方法。工況的實(shí)時(shí)監(jiān)控與異常工況的及時(shí)判別與響應(yīng),對于工業(yè)生產(chǎn)的安全和效率至關(guān)重要。建立一套完善的風(fēng)險(xiǎn)防控和應(yīng)急管理體系、及時(shí)發(fā)現(xiàn)異常工況并予以回應(yīng)及處理,首先能避免事故發(fā)生造成的人員與財(cái)產(chǎn)損失,同時(shí)也能減少因風(fēng)險(xiǎn)隱患導(dǎo)致的停工成本。
在上述背景下,通過人工智能技術(shù)輔助修改天然氣井泡沫排水劑加注制度成為新方向。本文將以應(yīng)用人工智能方法解決天然氣井泡沫排水劑加注制度問題為主題,全面闡述泡排劑加注劑量的機(jī)器學(xué)習(xí)模型的構(gòu)建,并提出根據(jù)歷往資料的穩(wěn)定性判斷與劑量評價(jià)方法的構(gòu)建,最后整合成完整的基于機(jī)器學(xué)習(xí)技術(shù)的智能化泡沫排水加注系統(tǒng)。
為構(gòu)建模型,需要采集樣本及卷標(biāo)數(shù)據(jù)。模型構(gòu)建所采集的樣本數(shù)據(jù)來自重慶氣礦大竹作業(yè)區(qū)云和1井,數(shù)據(jù)通過實(shí)地單片機(jī)傳輸采集,采樣間隔為2秒1條。首次執(zhí)行模型構(gòu)建的所采集的數(shù)據(jù)自2018年6月至2018年10月,包含5次劑量調(diào)整。如今模型已上線部署,正在持續(xù)地定期將新產(chǎn)生的數(shù)據(jù)及事發(fā)記錄投入模型,進(jìn)行模型的學(xué)習(xí)更新。
穩(wěn)定性判斷模型構(gòu)建所采集的標(biāo)簽數(shù)據(jù)源于業(yè)務(wù)人員的臺(tái)賬記錄,共計(jì)五列資料,包含:昨日平均產(chǎn)量、劑量值、時(shí)間、油壓和差壓。臺(tái)賬記錄包含劑量調(diào)整時(shí)間及劑量。
根據(jù)項(xiàng)目業(yè)務(wù)經(jīng)驗(yàn),共有如下幾條需與數(shù)據(jù)預(yù)處理相結(jié)合:
(1)瞬時(shí)產(chǎn)量可能為0Kpa,但是累積產(chǎn)量不會(huì)為0Kpa,以此為依據(jù)刪除累積產(chǎn)量為0Kpa的樣本;
(2)連續(xù)時(shí)間內(nèi)不會(huì)出現(xiàn)相同的生產(chǎn)數(shù)據(jù),即連續(xù)一段時(shí)間內(nèi)采集的生產(chǎn)數(shù)據(jù)不可能在全部維度上相同,以此刪除重復(fù)行;
(3)平穩(wěn)生產(chǎn)過程中不會(huì)出現(xiàn)過于離群的點(diǎn),以此刪除平穩(wěn)生產(chǎn)曲線中的離異點(diǎn)[1-2]。
結(jié)合上述業(yè)務(wù)經(jīng)驗(yàn),觀察數(shù)據(jù)的基礎(chǔ)特征,制定相應(yīng)的數(shù)據(jù)預(yù)處理及特征構(gòu)建解決方案。在完成上述處理后,進(jìn)行基本的數(shù)據(jù)預(yù)處理部分,首先刪除缺失數(shù)據(jù)。對異常數(shù)據(jù),根據(jù)對數(shù)據(jù)的觀察,首先基于固定規(guī)則剔除典型的異常值(如-999等),接著對每行資料評價(jià)各列值是否超出整列平均值上下三倍標(biāo)準(zhǔn)偏差之外,對存在此情況的數(shù)據(jù)行進(jìn)行刪除。
在特征構(gòu)建部分,因?yàn)樵继卣骶S度較低會(huì)出現(xiàn)相同劑量值下相似生產(chǎn)狀況的情況,因此特征構(gòu)建的主要目的是區(qū)別相似的生產(chǎn)狀態(tài)。對于相似的生產(chǎn)狀態(tài),本模型利用固定時(shí)長的數(shù)據(jù)窗口制作新的特征,同時(shí)結(jié)合業(yè)務(wù)經(jīng)驗(yàn),構(gòu)造如油套壓差、差分特征等特征進(jìn)行描述,提升特征維度進(jìn)而區(qū)分相似樣本,使相同劑量下的不可分樣本變得可分。當(dāng)前模型分別對不同時(shí)間段內(nèi)(2s、30s、60s、10min、30min、1h、12h、1d、15d、1month)進(jìn)行變化率的刻畫,對原有8維數(shù)據(jù)進(jìn)行特征構(gòu)建,產(chǎn)出合計(jì)188維的特征數(shù)據(jù)樣本。
在特征構(gòu)建部分的最后,根據(jù)樣本卷標(biāo)對上述統(tǒng)一構(gòu)建的特征進(jìn)行篩選,排除無關(guān)噪聲干擾。通過皮爾遜相關(guān)度、f檢驗(yàn)及卡方檢驗(yàn)三種方式對特征進(jìn)行重要性評價(jià),最終選取特征88維投入模型訓(xùn)練。
本系統(tǒng)除構(gòu)建回歸模型,還需構(gòu)建一個(gè)穩(wěn)定判斷模型用以判斷何時(shí)需要?jiǎng)┝啃薷?,同時(shí)也要判斷修改后的劑量是否能使氣井穩(wěn)定生產(chǎn),從而評價(jià)此次修改。
針對穩(wěn)定性判斷,系統(tǒng)構(gòu)建了兩種判斷方式:
(1)連續(xù)多天的整體性判斷;
(2)連續(xù)兩天內(nèi)的單一性判斷。
對于第一種判斷方法,系統(tǒng)以以往歷年的調(diào)產(chǎn)記錄作為參考。根據(jù)觀察,該井歷年出現(xiàn)調(diào)產(chǎn)(即不穩(wěn)定生產(chǎn))之時(shí),其油套壓差和累積產(chǎn)氣量會(huì)出現(xiàn)一定的變化趨勢,針對這種現(xiàn)象,系統(tǒng)獲取連續(xù)五天內(nèi)的瞬時(shí)生產(chǎn)資料,對其進(jìn)行處理后轉(zhuǎn)化為天平均數(shù)據(jù),將瞬時(shí)轉(zhuǎn)化的天平均數(shù)據(jù)與歷史調(diào)產(chǎn)數(shù)據(jù)進(jìn)行對比,利用皮爾遜系數(shù)刻畫其相似性,當(dāng)相似性大于0.6時(shí)即判斷二者相似,此時(shí)認(rèn)為當(dāng)前的生產(chǎn)不穩(wěn)定,反之則穩(wěn)定。對于第二種判斷方法,根據(jù)時(shí)間劃分兩天的瞬時(shí)資料,同樣計(jì)算每一天的天平均數(shù)據(jù),根據(jù)業(yè)務(wù)經(jīng)驗(yàn)由專家或現(xiàn)場操作人員確定一個(gè)閾值,當(dāng)二者之間的變化值超過閾值時(shí),則判斷其生產(chǎn)狀況不穩(wěn)定,反之,則穩(wěn)定。
穩(wěn)定性系統(tǒng)結(jié)合上述兩種穩(wěn)定判斷方式進(jìn)行綜合判斷,當(dāng)前系統(tǒng)的設(shè)計(jì)為連續(xù)5天內(nèi)的每連續(xù)2天都穩(wěn)定且整體5天也穩(wěn)定生產(chǎn)時(shí),才會(huì)回饋穩(wěn)定生產(chǎn)。
本劑量調(diào)整系統(tǒng)所需構(gòu)建的是典型的回歸預(yù)測模型。本研究中,應(yīng)用了XGBoost模型,主要思想為構(gòu)造多棵判定樹并進(jìn)行boosting。出于時(shí)間和準(zhǔn)確性的考慮,本文也采用了XGBoost模型,該模型指令周期快,對于本次使用數(shù)據(jù)集中有明顯特征區(qū)分的部分預(yù)測正確性高。
針對該回歸模型,本文設(shè)計(jì)了兩種實(shí)驗(yàn)來驗(yàn)證模型的準(zhǔn)確性,
實(shí)驗(yàn)一:從每種劑量值的樣本中抽取20%作為測試集,其余用作訓(xùn)練集訓(xùn)練模型,并分析結(jié)果。
實(shí)驗(yàn)二:抽取最后一個(gè)月的資料作為測試集,其余數(shù)據(jù)作為訓(xùn)練集訓(xùn)練模型,并分析結(jié)果。
其中,實(shí)驗(yàn)一的目的是驗(yàn)證模型的整體準(zhǔn)確性,主要用來分析回歸模型的準(zhǔn)確性,通過對已有的數(shù)據(jù)進(jìn)行拆分,再進(jìn)行測試,其結(jié)果將直接反映在誤差上,進(jìn)而反映出模型的準(zhǔn)確率。實(shí)驗(yàn)二主要用來分析回歸模型的穩(wěn)定性,實(shí)驗(yàn)數(shù)據(jù)中,最后一個(gè)月的數(shù)據(jù)包含了新的劑量值,用其作為測試集將很好地分析模型對于新數(shù)據(jù)是否具有穩(wěn)定性(魯棒性)。
實(shí)驗(yàn)一使用了隨機(jī)抽取20%的數(shù)據(jù)作為測試集,其余作為訓(xùn)練集訓(xùn)練模型,結(jié)果偏差值在0.05kg以內(nèi),基本符合預(yù)期。
實(shí)驗(yàn)二使用了一個(gè)月的新數(shù)據(jù)作為測試集,其余作為訓(xùn)練集訓(xùn)練模型,同時(shí)保證新數(shù)據(jù)的部分卷標(biāo)在原數(shù)據(jù)中不存在。
實(shí)驗(yàn)所預(yù)期的值為新加入的劑量,即27kg的預(yù)測基本準(zhǔn)確,未加入27kg數(shù)據(jù)的訓(xùn)練集得到的模型預(yù)測的結(jié)果與真實(shí)值偏差小于0.2kg,同時(shí)也表明模型對新的劑量有一定的穩(wěn)定性。
在進(jìn)行回歸模型實(shí)驗(yàn)后,同樣對穩(wěn)定性判斷模型進(jìn)行驗(yàn)證。針對穩(wěn)定性實(shí)驗(yàn),系統(tǒng)獲取的2018年6月至2018年10月的資料中,共調(diào)產(chǎn)5次,其中第4次調(diào)產(chǎn)為實(shí)驗(yàn)性調(diào)產(chǎn),即在并未出現(xiàn)不穩(wěn)定生產(chǎn)情況下進(jìn)行調(diào)產(chǎn),僅用于增加標(biāo)簽豐富性。針對5次調(diào)產(chǎn)記錄,分別按照判斷模型的思路進(jìn)行計(jì)算,其中第4次調(diào)產(chǎn)連續(xù)5天判斷結(jié)果為1,同時(shí)連續(xù)兩天判斷結(jié)果也為1,可以認(rèn)定第4次調(diào)產(chǎn)會(huì)產(chǎn)生不穩(wěn)定狀態(tài)。其他實(shí)驗(yàn)仍然判斷其為穩(wěn)定狀態(tài)。
結(jié)合上述實(shí)驗(yàn)和驗(yàn)證的判別效果,可認(rèn)為本模型既能準(zhǔn)確地判斷生產(chǎn)的穩(wěn)定性,亦能相對準(zhǔn)確地回歸預(yù)測劑量值,具備良好應(yīng)用前景。
本智能化劑量調(diào)整系統(tǒng)已部署到現(xiàn)場進(jìn)行實(shí)地應(yīng)用。首先會(huì)對開始應(yīng)用時(shí)的生產(chǎn)狀態(tài)進(jìn)行判斷,并執(zhí)行后續(xù)操作。且該系統(tǒng)針對數(shù)據(jù)時(shí)效性的問題設(shè)計(jì)了實(shí)時(shí)更新的本地?cái)?shù)據(jù)存儲(chǔ)功能,將實(shí)時(shí)更新本地記錄的2個(gè)月的瞬時(shí)數(shù)據(jù)作為模型回歸預(yù)測的歷史數(shù)據(jù)。同時(shí),當(dāng)連續(xù)執(zhí)行6到8個(gè)月后,將對模型進(jìn)行更新,利用此段時(shí)間獲取的數(shù)據(jù)結(jié)合歷史數(shù)據(jù)重新訓(xùn)練模型,用以更新模型,提高準(zhǔn)確率。
同時(shí),本系統(tǒng)仍存在幾個(gè)問題需要在未來改進(jìn):
(1)標(biāo)簽的局限性。收到訓(xùn)練集的限制,回歸模型只能在當(dāng)前訓(xùn)練集的最大值和最小值區(qū)間進(jìn)行回歸預(yù)測,無法準(zhǔn)確預(yù)測出遠(yuǎn)大于或遠(yuǎn)小于當(dāng)前訓(xùn)練資料的劑量值。針對此種狀況,可在未來的生產(chǎn)過程中更加豐富樣本的卷標(biāo)即加注量,如上文所說及時(shí)豐富并記錄數(shù)據(jù),同時(shí)更新模型;
(2)數(shù)據(jù)傳輸具有延遲性。受限于實(shí)地場站的傳輸速度,瞬時(shí)數(shù)據(jù)采集具有一定的延遲,導(dǎo)致整體數(shù)據(jù)的獲取具有一定的延遲性,可能會(huì)造成系統(tǒng)對實(shí)時(shí)的判斷出現(xiàn)延遲。針對此種情況,只能從場站的硬設(shè)備進(jìn)行調(diào)整,盡量減小延遲,從而減小延遲對準(zhǔn)確性和實(shí)效性的影響;
(3)歷史臺(tái)賬數(shù)據(jù)的有效性。天然氣井本身存在變化性,即隨著采氣時(shí)間的增加,氣井本身的狀態(tài)會(huì)發(fā)生變化,常見情況為采氣的產(chǎn)出逐漸減少,因此會(huì)出現(xiàn)過久的臺(tái)賬記錄對當(dāng)前判斷提供負(fù)作用的情況。針對此種情況,只能根據(jù)上文提出的解決辦法,逐步更新資料,但是實(shí)效性的時(shí)間范圍仍未能確定,需要長時(shí)間觀察后才能確定數(shù)據(jù)失效的時(shí)間間隔。
[1]劉永輝,吳朋勃,羅程程,等. 泡沫排水采氣適用界限的實(shí)驗(yàn)研究[J]. 深圳大學(xué)學(xué)報(bào)(理工版),2020(5):54-60.
[2]蔣澤銀,李偉,羅鑫,等. 頁巖氣平臺(tái)井泡沫排水采氣技術(shù)[J]. 天然氣工業(yè),2020(4):91-96.
網(wǎng)絡(luò)安全技術(shù)與應(yīng)用2022年4期