陳嚴(yán)飛
(中國(guó)石油大港油田公司信息中心,天津 300280)
當(dāng)前,在數(shù)字化油氣領(lǐng)域,很多軟件工具都已經(jīng)被廣泛使用,在國(guó)際上已經(jīng)形成完善的數(shù)字化油田方案體系,數(shù)字化油田的產(chǎn)品也有了大規(guī)模的發(fā)展,數(shù)據(jù)分析軟件、知識(shí)學(xué)習(xí)軟件等系統(tǒng)已經(jīng)成為油田領(lǐng)域的重要輔助工具。數(shù)字化油田使油田勘察中有關(guān)地震檢測(cè)、地質(zhì)勘測(cè)、油藏研究、工程建設(shè)、油田管理等一體化內(nèi)容都能夠形成一個(gè)統(tǒng)一的整體。具有代表性的數(shù)字化軟件如斯倫貝謝、哈里伯頓、貝克休斯等,這些專業(yè)的油田行業(yè)數(shù)字化解決方案供應(yīng)商已經(jīng)將油田產(chǎn)業(yè)全產(chǎn)業(yè)鏈進(jìn)行了數(shù)字化覆蓋,從數(shù)據(jù)模型、應(yīng)用軟件、管理軟件,再到油田開發(fā)、監(jiān)測(cè)軟件、營(yíng)銷軟件等,實(shí)現(xiàn)了油田行業(yè)數(shù)據(jù)模型、產(chǎn)品模型統(tǒng)一的行業(yè)數(shù)字化應(yīng)用模式,通過軟件的集成將油田的發(fā)展統(tǒng)一到互聯(lián)網(wǎng)思維下,覆蓋了全油田行業(yè)的數(shù)字化模式,也使得油田行業(yè)的信息安全面臨著一定的挑戰(zhàn)。
當(dāng)前,我國(guó)油田在數(shù)字化方面的建設(shè)存在嚴(yán)重依賴技術(shù)進(jìn)口的局面,以油田數(shù)字化中廣泛應(yīng)用的商業(yè)軟件為例,我國(guó)油田行業(yè)在數(shù)字化商用軟件上幾乎沒有可競(jìng)爭(zhēng)的產(chǎn)品。行業(yè)應(yīng)用軟件缺乏是油田數(shù)字化的主要現(xiàn)狀,而在大數(shù)據(jù)應(yīng)用方面,我國(guó)油田行業(yè)也面臨著相同的問題。從全球油田行業(yè)來看,油田數(shù)字化、信息化建設(shè)歷史與計(jì)算機(jī)的發(fā)展歷史趨于同步,也就是在計(jì)算機(jī)誕生、發(fā)展及成熟的各個(gè)階段,油田行業(yè)都在利用新技術(shù)來提升自身的產(chǎn)能效率和產(chǎn)品的競(jìng)爭(zhēng)力。當(dāng)前,油田數(shù)字化逐漸從地質(zhì)模型、產(chǎn)品模型升級(jí)為大數(shù)據(jù)模型、人工智能模型,油田的數(shù)字化管理向著云端管理的方向發(fā)展,新技術(shù)應(yīng)用已經(jīng)成為數(shù)字化油田發(fā)展的主要特征。而我國(guó)油田行業(yè)由于缺乏自主技術(shù),在行業(yè)生態(tài)內(nèi)依舊扮演著應(yīng)用者、追隨者的角色,而非開發(fā)者、引領(lǐng)者的角色。
當(dāng)前,我國(guó)油田行業(yè)在大數(shù)據(jù)應(yīng)用方面存在體系不完善的問題。油田行業(yè)在國(guó)際范圍內(nèi)有著屬于其行業(yè)規(guī)范的大數(shù)據(jù)標(biāo)準(zhǔn)應(yīng)用體系,如數(shù)據(jù)模型中的RPDS、PPDM、POSC 等,針對(duì)油田全過程的大數(shù)據(jù)應(yīng)用給出了完善的建設(shè)體系。但在我國(guó)油田行業(yè)中,大數(shù)據(jù)應(yīng)用體系還處于落后的狀態(tài),尤其是在地質(zhì)模型、產(chǎn)品模型方面還缺乏自主產(chǎn)品,大數(shù)據(jù)的應(yīng)用標(biāo)準(zhǔn)仍依照發(fā)達(dá)國(guó)家的標(biāo)準(zhǔn),更難以提高對(duì)未來油田數(shù)字化核心內(nèi)容的認(rèn)識(shí)水平。這種現(xiàn)象造成了我國(guó)油田行業(yè)利用大數(shù)據(jù)進(jìn)行數(shù)字化油田建設(shè)時(shí)的不足。雖然我國(guó)在大數(shù)據(jù)、人工智能方面的應(yīng)用有了顯著的進(jìn)步和發(fā)展,但在油田領(lǐng)域的研究與應(yīng)用還未形成實(shí)際效應(yīng),其建設(shè)成果一直無法達(dá)到預(yù)期目標(biāo)。出現(xiàn)這種現(xiàn)象的最大原因便是我國(guó)油田領(lǐng)域還未形成大數(shù)據(jù)應(yīng)用體系,尤其是數(shù)據(jù)安全管理的建設(shè)非常落后,從而造成其在數(shù)據(jù)分析、應(yīng)用開發(fā)、架構(gòu)設(shè)計(jì)、業(yè)務(wù)管理方面的研發(fā)體系落后,最終也導(dǎo)致國(guó)內(nèi)油田領(lǐng)域的大數(shù)據(jù)應(yīng)用落后于其他國(guó)家。事實(shí)上,大數(shù)據(jù)應(yīng)用技術(shù)的普及能夠帶動(dòng)油田行業(yè)的發(fā)展改革,但我國(guó)油田數(shù)字化核心技術(shù)上的發(fā)展滯后問題導(dǎo)致油田產(chǎn)業(yè)與大數(shù)據(jù)的融合缺乏基礎(chǔ)。這些都較為嚴(yán)重地限制了我國(guó)數(shù)字化油田的轉(zhuǎn)型發(fā)展。因此,油田行業(yè)的從業(yè)者,尤其是技術(shù)研發(fā)人員,需要加大創(chuàng)新力度,快速完善我國(guó)油田數(shù)字化的發(fā)展體系,為打造油田數(shù)字化領(lǐng)域的核心技術(shù)和產(chǎn)品提供助力。
油田數(shù)字化是大數(shù)據(jù)應(yīng)用的重要方法,這種方法是基于油田產(chǎn)業(yè)結(jié)構(gòu)特點(diǎn)來設(shè)計(jì)和實(shí)施的。數(shù)字化應(yīng)用場(chǎng)景的打造需要實(shí)現(xiàn)兩個(gè)部分的內(nèi)容,一是智能化,二是自動(dòng)化。例如,數(shù)字化的鉆井場(chǎng)景建設(shè),首先要解決的是智能化問題,智能化的鉆井場(chǎng)景建設(shè)的直接目標(biāo)是降低成本、提高效率,而其中核心的技術(shù)是鉆速的智能化。通常鉆速會(huì)受到地質(zhì)巖性、鉆頭材質(zhì)、井筒管具、動(dòng)力裝置、鉆井液、施工參數(shù)等因素的影響,因此在解決這個(gè)問題的過程中,技術(shù)人員需要從地質(zhì)、鉆頭、管具、鉆井液、動(dòng)力、施工等方面進(jìn)行分析,首先要找出鉆速與這些影響因素之間的關(guān)系。在未應(yīng)用大數(shù)據(jù)以前,行業(yè)內(nèi)的技術(shù)人員會(huì)調(diào)取井口采集到的數(shù)據(jù)來分析這些因素與鉆速之間的關(guān)系,如泵壓、泵沖、扭矩等參數(shù),然后根據(jù)經(jīng)驗(yàn)來提升鉆速,但這種以經(jīng)驗(yàn)來解決問題的傳統(tǒng)方法顯然不具備大規(guī)模推廣的可能。在經(jīng)驗(yàn)法的應(yīng)用中,技術(shù)人員要不斷地調(diào)整參數(shù),然后對(duì)模型進(jìn)行適配,但很多時(shí)候,雖然技術(shù)人員消耗了大量的時(shí)間去調(diào)整參數(shù),但是環(huán)境的變化往往會(huì)影響模型的公式,這對(duì)于提升油田的生產(chǎn)效率非常不利。而在大數(shù)據(jù)應(yīng)用后,通過搭建數(shù)字化模型就能夠有效解決這樣的問題。通常鉆井過程中會(huì)產(chǎn)生大量的數(shù)據(jù),通過收集這些數(shù)據(jù),就可以建立起完善的數(shù)字化應(yīng)用場(chǎng)景模型。這個(gè)過程中,數(shù)字化模型的建立需要基于鉆井業(yè)務(wù)的全過程,其中包含了井口實(shí)時(shí)采集數(shù)據(jù),要精確到秒數(shù)據(jù),還有鉆頭鉆具的數(shù)據(jù)、鉆井液數(shù)據(jù)、地層數(shù)據(jù)、動(dòng)力系統(tǒng)數(shù)據(jù)、施工參數(shù)等綜合體數(shù)據(jù)模型。之后通過改進(jìn)算法,實(shí)現(xiàn)對(duì)數(shù)據(jù)模型的分析,計(jì)算機(jī)會(huì)對(duì)這些數(shù)據(jù)與鉆速的關(guān)系進(jìn)行全面的分析,最終獲得鉆速最高的模型。油田鉆井可以根據(jù)這些鉆速模型進(jìn)行自動(dòng)化系統(tǒng)的研發(fā),這也就在數(shù)字化的應(yīng)用場(chǎng)景中實(shí)現(xiàn)了鉆井成本的下降和鉆井效率的提高。
在數(shù)字化油田大數(shù)據(jù)應(yīng)用中,技術(shù)人員需要對(duì)數(shù)據(jù)安全進(jìn)行升級(jí),這些數(shù)據(jù)的安全包含了設(shè)計(jì)數(shù)據(jù)的安全、鉆井?dāng)?shù)據(jù)的安全、測(cè)錄數(shù)據(jù)的安全等內(nèi)容。通常情況下,從采集到運(yùn)用,技術(shù)人員都需要對(duì)數(shù)據(jù)進(jìn)行存檔,在存檔的過程中要對(duì)數(shù)據(jù)的安全進(jìn)行保護(hù),尤其是在搭建模型時(shí)如果頻度數(shù)據(jù)出錯(cuò),對(duì)秒數(shù)據(jù)、米數(shù)據(jù)進(jìn)行數(shù)據(jù)分析時(shí)也很容易造成差異,最終導(dǎo)致數(shù)字模型搭建失敗。因此,這個(gè)過程需要針對(duì)數(shù)據(jù)進(jìn)行多重備份,在搭建數(shù)據(jù)模型時(shí)要保證有一用一備的數(shù)據(jù),同時(shí)要對(duì)采集到的不同數(shù)據(jù)進(jìn)行分別測(cè)試,這樣才能找出最合理的模型。
鉆井井場(chǎng)的實(shí)時(shí)數(shù)據(jù)通常是以秒為單位的,在實(shí)時(shí)處理數(shù)據(jù)時(shí)要保證間隔3~5 秒進(jìn)行一次數(shù)據(jù)的采集和傳輸,這是實(shí)時(shí)處理安全的核心。在實(shí)際操作中,采集數(shù)據(jù)的設(shè)備、傳輸數(shù)據(jù)的設(shè)備的參數(shù)不同,自然會(huì)造成采集的數(shù)據(jù)不同,很多時(shí)候數(shù)據(jù)都處于混亂的狀態(tài)。在這種情況下,針對(duì)數(shù)據(jù)的處理工作是需要保證其安全的,這里所說的安全并非物理上的安全,而是指保證數(shù)據(jù)處理過程中不出現(xiàn)數(shù)據(jù)錯(cuò)誤,如數(shù)據(jù)的字段、異常值、平均值等出錯(cuò),這些數(shù)據(jù)一直是模型設(shè)計(jì)的前提。
在應(yīng)用大數(shù)據(jù)時(shí),技術(shù)人員需要根據(jù)不同數(shù)據(jù)源的不同數(shù)據(jù)按照邏輯規(guī)則進(jìn)行相應(yīng)的整合,從而實(shí)現(xiàn)邏輯命題的數(shù)字化,將模型實(shí)際構(gòu)成一個(gè)可用的產(chǎn)品。這種樣本集合的安全性通常也被稱為數(shù)據(jù)的整合安全。以鉆井?dāng)?shù)據(jù)的整合為例,鉆井的實(shí)時(shí)數(shù)據(jù)與鉆井液數(shù)據(jù)的整合是一個(gè)小型樣本的集數(shù),如果加入管具數(shù)據(jù)、鉆頭數(shù)據(jù)、地層數(shù)據(jù)、動(dòng)力數(shù)據(jù)等數(shù)據(jù),就會(huì)形成一個(gè)大的數(shù)據(jù)樣本。這個(gè)數(shù)據(jù)樣本的整合同樣是需要安全系數(shù)的,尤其是樣本的集合并非簡(jiǎn)單地將所有數(shù)據(jù)糅合到一起,而是以安全的邏輯結(jié)構(gòu)對(duì)數(shù)據(jù)進(jìn)行篩選,從而實(shí)現(xiàn)目標(biāo)數(shù)據(jù)的有效整合。
智能化的產(chǎn)品模式需要以人工智能技術(shù)為引導(dǎo),這個(gè)過程就會(huì)涉及邏輯關(guān)聯(lián)的問題。邏輯關(guān)聯(lián)是將整個(gè)油田業(yè)務(wù)中的流程節(jié)點(diǎn)進(jìn)行邏輯的關(guān)聯(lián),通過設(shè)計(jì)流程階段的特征來實(shí)現(xiàn)智能模型的建立,因此邏輯關(guān)聯(lián)的安全工作非常重要。當(dāng)前,由于油田業(yè)務(wù)復(fù)雜的邏輯結(jié)構(gòu),技術(shù)人員很難使用模塊化的工具來安全地完成邏輯的關(guān)聯(lián)。這種情況需要應(yīng)用到相關(guān)的代碼工具來實(shí)現(xiàn)邏輯關(guān)聯(lián)的安全,如可以使用TempoAI的代碼嵌入功能,然后使用Python 或R 語言來對(duì)算法進(jìn)行拓展。
在數(shù)字化油田大數(shù)據(jù)應(yīng)用中,建模是最為關(guān)鍵的一個(gè)步驟。在分析完樣本數(shù)據(jù)后,模型的框架才算基本形成,這個(gè)模型本質(zhì)上便是大數(shù)據(jù)應(yīng)用的結(jié)果,這個(gè)已經(jīng)建好的模型需要進(jìn)行安全的存儲(chǔ)后才能保證數(shù)據(jù)預(yù)測(cè)和分析的準(zhǔn)確性。例如,決策樹模型在建模完成后形成參數(shù)的樹模型,這個(gè)樹模型可以針對(duì)新產(chǎn)生的數(shù)據(jù)進(jìn)行分析。技術(shù)人員可以在這個(gè)模型中進(jìn)行各類數(shù)據(jù)的分析,但前提是保證這個(gè)模型在建模的過程中具有高度安全性。只有在模型完成安全性的測(cè)試后,才能針對(duì)模型進(jìn)行使用,而保證建模安全的前提是數(shù)據(jù)必須真實(shí)、有效。
大數(shù)據(jù)不是一門可以獨(dú)立應(yīng)用的技術(shù),而是與油田行業(yè)的結(jié)構(gòu)邏輯緊密相關(guān)的,只有保證油田行業(yè)結(jié)構(gòu)的邏輯安全,才能有效地分析數(shù)據(jù)和建立模型。這也給了數(shù)字化油田在應(yīng)用大數(shù)據(jù)的過程中需要緊密聯(lián)系“應(yīng)用安全”這個(gè)概念,從安全性方面來保證數(shù)字化油田轉(zhuǎn)型成功。