0 引言
在石油化工行業(yè),泵是關(guān)鍵的流體輸送設(shè)備。密封腔壓力作為泵的重要參數(shù),極大影響著密封系統(tǒng)的設(shè)計、沖洗方案的確定和沖洗壓力的計算,精準(zhǔn)預(yù)測密封腔壓力不僅對泵的密封效果、效率和壽命有著重要意義,還能防止泄漏和設(shè)備故障,從而提高整個系統(tǒng)的安全性和經(jīng)濟效益。密封腔壓力的影響因素多,且種類復(fù)雜,如何計算和預(yù)測泵密封腔壓力一直是相關(guān)領(lǐng)域?qū)<已芯康闹攸c課題。
API682標(biāo)準(zhǔn)最早提出了針對離心泵和回轉(zhuǎn)泵密封系統(tǒng)的密封腔壓力經(jīng)驗公式;隨著泵設(shè)計和運行條件的復(fù)雜化,單靠經(jīng)驗公式已不再足夠,P.Geiger和H.Fiedler等人通過CFD技術(shù),模擬密封腔內(nèi)的流體流動,提供壓力分布預(yù)測[2];A.Khonsari和E.Booser基于現(xiàn)代密封設(shè)計理論提出先進的設(shè)計和材料可以顯著減小密封腔內(nèi)的壓力波動,增強密封的可靠性[3]。近年來,人工智能(AD技術(shù),特別是機器學(xué)習(xí)和深度學(xué)習(xí),在處理復(fù)雜數(shù)據(jù)和預(yù)測模型方面展現(xiàn)出了強大的能力。通過學(xué)習(xí)大量的歷史運行數(shù)據(jù),機器學(xué)習(xí)能夠捕捉到傳統(tǒng)物理模型難以表達的復(fù)雜模式和關(guān)系。在工業(yè)領(lǐng)域,機器學(xué)習(xí)已經(jīng)在許多應(yīng)用場景中取得了成功,例如設(shè)備故障預(yù)測、生產(chǎn)優(yōu)化和流程控制。然而,石油化工行業(yè)由于其工藝流程的復(fù)雜性和風(fēng)險性,對AI技術(shù)的應(yīng)用還處于探索階段。
高速離心泵作為的明星產(chǎn)品之一,因具有流量小、揚程高、結(jié)構(gòu)緊湊、轉(zhuǎn)速高、可靠性好等特點,被廣泛應(yīng)用于石油化工領(lǐng)域。以高速泵為研究對象具備現(xiàn)實意義,其每年近300臺的出廠量也為研究提供了充分的數(shù)據(jù)支撐。本文旨在開發(fā)一種基于機器學(xué)習(xí)的泵密封腔壓力預(yù)測方法,以高速泵的密封腔壓力數(shù)據(jù)為載體,結(jié)合數(shù)據(jù)預(yù)處理、特征工程和模型優(yōu)化,形成一套完整的預(yù)測解決方案。本研究不僅在理論上驗證了機器學(xué)習(xí)在工業(yè)參數(shù)預(yù)測中的可行性,還在實際應(yīng)用中展示了其顯著的優(yōu)勢。
1數(shù)據(jù)收集與預(yù)處理
1.1 系統(tǒng)流程圖
機器學(xué)習(xí)的主要要素包含數(shù)據(jù)、算法和訓(xùn)練優(yōu)化過程,通過對已知數(shù)據(jù)的智能學(xué)習(xí),獲得對未知數(shù)據(jù)決策的泛化能力是智能學(xué)習(xí)的關(guān)鍵。機器學(xué)習(xí)模型在學(xué)習(xí)數(shù)據(jù)的過程中,逐步由高誤差模型向低誤差模型迭代,這不僅依賴于算法本身,更是由梯度下降優(yōu)化器決定的,這種函數(shù)作用于真實值與預(yù)測值之間誤差的導(dǎo)數(shù),實現(xiàn)對算法參數(shù)的更新,進而提高模型準(zhǔn)確度。本文針對密封腔壓力的研究,對關(guān)鍵步驟進行流程設(shè)計,如圖1所示。
1.2 數(shù)據(jù)收集
在任何基于人工智能的項目中,數(shù)據(jù)都是至關(guān)重要的,高質(zhì)量的數(shù)據(jù)是訓(xùn)練高性能模型的基礎(chǔ)。為確保預(yù)測模型的有效性和穩(wěn)定性,數(shù)據(jù)庫包含了115組泵的實驗數(shù)據(jù),每組數(shù)據(jù)的特征都具備獨特性,覆蓋了泵的設(shè)計參數(shù)、性能參數(shù)、操作環(huán)境和密封效果等多個維度,具體包括泵型號、轉(zhuǎn)速、入口壓力、誘導(dǎo)輪參數(shù)、平衡孔參數(shù)及密封方案等13個特征項。
為了確保數(shù)據(jù)的質(zhì)量,對收集到的數(shù)據(jù)進行了清洗和處理。數(shù)據(jù)清洗包括缺失值處理、異常值檢測等步驟,確保數(shù)據(jù)的完整性,并對不同格式的數(shù)據(jù)進行處理,使其具備Python程序可識別的數(shù)字、文本格式,統(tǒng)一數(shù)據(jù)的度量單位和表示方式,最終得到如表1所示形式的數(shù)據(jù)。
1.3 數(shù)據(jù)標(biāo)準(zhǔn)化
通過對收集數(shù)據(jù)的觀察,明確了數(shù)據(jù)形式多樣、數(shù)值量級不同的特點。機器學(xué)習(xí)對不同特征采取無差別學(xué)習(xí),為了進一步消除特征間的量級差異,適配數(shù)學(xué)模型,對數(shù)據(jù)進行了歸一化和標(biāo)準(zhǔn)化處理,將數(shù)值數(shù)據(jù)縮放到[0,1]區(qū)間內(nèi),均值為0,標(biāo)準(zhǔn)差為1。這些處理使得所有的特征數(shù)值范圍相近,從而提高了模型的訓(xùn)練效率,改善了梯度下降的優(yōu)化過程和預(yù)測性能。
2 數(shù)據(jù)的特征工程
2.1 特征提取
為了讓Python編程語言識別數(shù)據(jù)內(nèi)容,使得模型能夠更好地理解和利用這些數(shù)據(jù),所有特征需以數(shù)值的形式體現(xiàn),因此對高速泵的性能、結(jié)構(gòu)、運行數(shù)據(jù)進行了詳細(xì)的特征提取。
1)泵模型分解:例如,“GSB-L1-8/1303\"字段中的信息分解為型號L1、流量8和揚程1303。
②誘導(dǎo)輪參數(shù)處理:汽蝕余量為高速泵設(shè)計中重要的性能指標(biāo),為了防止汽蝕發(fā)生,部分高速泵需配備誘導(dǎo)輪增強汽蝕性能,通過數(shù)據(jù)輸入,可以自動識別是否需要配備誘導(dǎo)輪并獲取誘導(dǎo)輪信息,誘導(dǎo)輪特征提取函數(shù)如圖2所示。例如,“ ?30/?19 \"字段中的信息分解為誘導(dǎo)輪外徑30和輪轂尺寸19。
3)葉輪平衡孔參數(shù)提?。豪?,“ ?55×12×?8 ”字段中的多個數(shù)值分別表示平衡孔的位置、數(shù)量和尺寸。
2.2 特征編碼
除了特征提取外,一些字符類數(shù)據(jù)無法直接用數(shù)字表示,例如密封類型有串聯(lián)、單端面、雙端面多種文字描述。鑒于數(shù)據(jù)要參與數(shù)學(xué)模型的運算,機器學(xué)習(xí)模型可能會錯誤地認(rèn)為這些值之間存在某種大小或順序關(guān)系,進而在模型中會引入錯誤的假設(shè),因而此類無實際意義的數(shù)值無法直接用數(shù)字0,1,2,表達。
為了讓模型理解和處理分類特征,對這些特征進行了One-Hot編碼處理,將其轉(zhuǎn)換為二進制向量,以數(shù)組的形式擴展這類特征的空間域。其數(shù)學(xué)表達如下:假設(shè)有一個分類變量 X ,其可能取值有 n 種: ,如果 X=xi, 那么One-Hot編碼后向量為[0,0,…,1,0] ,其中第i位是1,其余為0。
例如,密封形式中的串聯(lián)可表示為[1,0,0],單端面為 [0,1,0] ,雙端面為 [0,0,1] 。采用One-Hot編碼避免了序列性假設(shè),消除了對類別間的任何順序或大小關(guān)系的錯誤假設(shè),也對不同機器學(xué)習(xí)模型具備極強的兼容性,拓展的特征空間也提升了模型準(zhǔn)確度上限。
3模型選擇與優(yōu)化
3.1 模型選擇
在選擇模型時,首先對機器學(xué)習(xí)算法大類進行劃分,預(yù)測密封腔壓力輸出為連續(xù)數(shù)值,而非離散數(shù)值,明確研究課題為回歸問題。另外,考慮了數(shù)據(jù)的特性、任務(wù)的復(fù)雜度和計算資源的限制,對于密封腔壓力的預(yù)測,對不同理論下產(chǎn)生的算法模型利弊分析如下:
1)多層感知器(MLP):能夠處理非線性關(guān)系,并且適合高維特征的回歸問題,模型復(fù)雜度設(shè)置靈活,可解釋性好。
2線性回歸:適用于簡單的線性關(guān)系預(yù)測,但在處理復(fù)雜的非線性關(guān)系時,性能受到限制。
3)決策樹和隨機森林:這些模型能夠處理復(fù)雜的特征交互,在高維數(shù)據(jù)中表現(xiàn)良好。但對數(shù)據(jù)量規(guī)模小、特征空間大的數(shù)據(jù)庫,可能會面臨過擬合的問題。
4支持向量機(SVM:SVM在處理高維空間的分類和回歸任務(wù)時表現(xiàn)出色,但對于數(shù)據(jù)集的計算開銷較大,且對于存在壞點、異常點的數(shù)據(jù)存在較大方差。
基于初步分析,最終選定MLP作為本次研究的主要模型。
3.2 模型訓(xùn)練與優(yōu)化
模型的訓(xùn)練過程包括數(shù)據(jù)分割、前向傳播、損失
計算和反向傳播等步驟,每一步驟的程序設(shè)計都影響著模型預(yù)測密封腔壓力學(xué)習(xí)的準(zhǔn)確度。
3.2.1 數(shù)據(jù)分割
鑒于數(shù)據(jù)庫體量適中,將數(shù)據(jù)集分為含數(shù)據(jù)量為 90% 的訓(xùn)練集和含數(shù)據(jù)量為 10% 的測試集,并進一步在訓(xùn)練集中進行交叉驗證,排除極端訓(xùn)練的情況,評估模型的平均泛化能力。
3.2.2 前向傳播
MLP由無數(shù)個神經(jīng)元組成,在前向傳播過程中,輸入數(shù)據(jù)通過神經(jīng)元的層層傳遞,經(jīng)過一系列的加權(quán)和激活函數(shù)的處理,生成最終的輸出預(yù)測值。本次采用relu激活函數(shù),實現(xiàn)非線性計算。
3.2.3 損失計算
實驗中使用均方誤差(MSE)作為損失函數(shù),計算模型預(yù)測值與真實值之間的差異,通過差值可以計算模型預(yù)測的準(zhǔn)確度,為后續(xù)模型優(yōu)化提供評判依據(jù)。損失函數(shù)的公式為:
式中: n 是樣本的數(shù)量; yi 是第i個樣本的真實值; 是模型對第i個樣本的預(yù)測值。
3.2.4 反向傳播
根據(jù)損失函數(shù)的值,計算模型參數(shù)的梯度,并使用梯度下降的優(yōu)化算法更新模型參數(shù),以最小化損失量。模型的反向傳播通過優(yōu)化器實現(xiàn),例如實驗中采用的Adam優(yōu)化器,具備自適應(yīng)學(xué)習(xí)率、對導(dǎo)數(shù)的偏差糾正、訓(xùn)練過程穩(wěn)定、收斂速度快等特點,可實現(xiàn)在迭代過程中逐漸優(yōu)化參數(shù)的作用,宏觀上體現(xiàn)為模型準(zhǔn)確度提高。
3.2.5 超參數(shù)優(yōu)化
通過網(wǎng)格搜索和交叉驗證的方法實現(xiàn)了優(yōu)化模型的超參數(shù)調(diào)節(jié),包括學(xué)習(xí)率、批量大小、訓(xùn)練輪數(shù)等。通過遍歷不同的超參數(shù)組合,選擇出最佳配置,以提高模型的性能。
4模型評估與驗證
4.1 交叉驗證
為了更全面地評估模型的泛化能力,采用了交叉驗證的方法。交叉驗證將數(shù)據(jù)分為多個子集,進行多次訓(xùn)練和評估,最終計算出模型的平均性能。這種方法有效減少了模型性能受數(shù)據(jù)分割方式影響的風(fēng)險,提高了評估的穩(wěn)定性。
4.2 實驗結(jié)果
實驗對優(yōu)化器學(xué)習(xí)率(lr)、數(shù)據(jù)批次(batch_size)、訓(xùn)練輪數(shù)(epoch)這三個超參數(shù)采用控制變量法進行了設(shè)置,得到18組不同配置的模型,實驗參數(shù)如表2所示。
通過對比18組數(shù)據(jù)的MSE值可以得出誤差最小的參數(shù)組合,即最優(yōu)解。最優(yōu)解下的實驗結(jié)果如圖3所示。
4.3 結(jié)果分析
通過實驗結(jié)果發(fā)現(xiàn),經(jīng)過100輪的模型迭代訓(xùn)練,損失量Loss總體呈下降趨勢,由最初的0.0110下降到0.0012;MSE僅為0.0003,遠(yuǎn)低于類似應(yīng)用的經(jīng)驗誤差值0.01,證明實驗?zāi)P鸵丫邆淞己玫姆夯芰Γ糜诮鉀Q高速泵密封腔壓力預(yù)測問題時精度高。最優(yōu)解結(jié)果如表3所示。
進一步分析各超參數(shù)對預(yù)測密封腔壓力問題的影響:
1優(yōu)化器學(xué)習(xí)率lr為0.001雖然比較常見,但在本次實驗中效果不如0.0005,表明較低的學(xué)習(xí)率在高速泵密封腔壓力的數(shù)據(jù)集上能更好地優(yōu)化模型,避免過大的梯度更新導(dǎo)致的訓(xùn)練不穩(wěn)定。
2)當(dāng)訓(xùn)練輪數(shù)epoch過低時,模型訓(xùn)練不充分,無法捕捉到數(shù)據(jù)中的復(fù)雜模式,導(dǎo)致預(yù)測性能不佳;隨著epoch的增加,為100時訓(xùn)練效果有顯著提高;當(dāng)epoch為200時,模型過度擬合訓(xùn)練數(shù)據(jù),反而降低了對測試集的泛化能力。
3)較大的批量大小batchsize可以加快模型訓(xùn)練的收斂速度,但由于本次研究數(shù)據(jù)體量有限,當(dāng)批量大小為12時,誤差反而增加,因此8是更加合適的批量大小,兼顧了訓(xùn)練的穩(wěn)定性和收斂速度。
研究中以MSE為模型誤差的標(biāo)準(zhǔn),為了更直觀地識別密封腔壓力預(yù)測的準(zhǔn)確度,特列舉12項測試數(shù)據(jù)的預(yù)測值與真實值如表4所示。
通過計算誤差,發(fā)現(xiàn)大多數(shù)誤差范圍都在 4% 以內(nèi),表明用機器學(xué)習(xí)的方法不僅可以預(yù)測泵密封腔壓力,預(yù)測精度也很高,完全具備了工程應(yīng)用的條件。
5 結(jié)論與展望
5.1 結(jié)論
1本文提出了一種應(yīng)用機器學(xué)習(xí)的高速泵密封腔壓力預(yù)測方法,通過全流程的研究,系統(tǒng)地開展特征工程和超參數(shù)調(diào)優(yōu),形成了基于人工智能的新解決方案。
2)探索了針對密封腔壓力預(yù)測問題的數(shù)據(jù)特征空間及參數(shù)優(yōu)化方向,優(yōu)化后的MLP模型在測試集上的均方誤差MSE僅為0.0003,表明了該方法在實際工程應(yīng)用中的高精度和可靠性。
3傳統(tǒng)的泵密封腔壓力預(yù)測主要依賴于實際運轉(zhuǎn)實驗,過程煩瑣且成本高昂。該模型的成功證明了機器學(xué)習(xí)在處理復(fù)雜非線性關(guān)系方面的強大能力,為實驗方法的更新提供了新思路,研究結(jié)果也對石油化工領(lǐng)域的設(shè)備維護和操作優(yōu)化具有重要意義。
5.2 展望
盡管本研究的模型已展現(xiàn)出較高的精度和可靠性,但其未來仍有提升空間,包括對數(shù)據(jù)集規(guī)模和多樣性的補充,對特征選擇的研究;對模型架構(gòu)的探索和改進提升;還有基于物理引導(dǎo)的機器學(xué)習(xí)技術(shù)。因此,將工程設(shè)計與人工智能結(jié)合,是值得挖掘的一個提高設(shè)計水平的方向。
[參考文獻]
[1]NG K B,DIAKOW S J.Pumps-Shaft Sealing Systems for Centrifugal and Rotary Pumps:API STD 682[S]. American Petroleum Institute,2014.
[2] GEIGER P,F(xiàn)IEDLER H.Numerical Simulationand Experimental Validation of Mechanical Seals[J]. Tribology International,2017(115):1-10.
[3]KHONSARI A,BOOSER E.Advances in Mechanical Seals Design and Operation[J].Springer,2019.
收稿日期:2025-05-14
作者簡介:何慕 (1998-) ,男,北京人,哥倫比亞大學(xué)理學(xué)碩士,助理工程師,研究方向:流體與旋轉(zhuǎn)機械研發(fā)設(shè)計、自動化機電技術(shù)、人工智能技術(shù)。
通信作者:陳乃鏑(1995一),女,遼寧大連人,中國運載火箭技術(shù)研究院工學(xué)碩士,工程師,研究方向:流體與旋轉(zhuǎn)機械設(shè)計研發(fā)。