馮博
深圳市祥為測(cè)控技術(shù)有限公司,深圳 518034
隨著全球經(jīng)濟(jì)和能源工業(yè)的迅速發(fā)展,石油管道在現(xiàn)代社會(huì)中扮演著至關(guān)重要的角色。然而,石油管道泄漏事故在生產(chǎn)實(shí)踐中時(shí)有發(fā)生,給環(huán)境和人類(lèi)的健康造成了嚴(yán)重威脅。因此,在石油管道的運(yùn)行和維護(hù)中,管道泄漏檢測(cè)技術(shù)顯得尤為重要。基于大數(shù)據(jù)聚類(lèi)算法的管道泄漏檢測(cè)技術(shù)能夠在一定程度上解決傳統(tǒng)技術(shù)存在的問(wèn)題,它能夠分析大量的傳感器數(shù)據(jù),更好地處理各種復(fù)雜情況。該技術(shù)可以將傳感器數(shù)據(jù)分成不同的數(shù)據(jù)集,為其開(kāi)發(fā)相應(yīng)的數(shù)據(jù)模型,并結(jié)合聚類(lèi)算法分析,從而提高檢測(cè)精度和效率。它還可以幫助運(yùn)營(yíng)公司及時(shí)發(fā)現(xiàn)管道問(wèn)題并采取措施,防止管道泄漏事故的發(fā)生。
聚類(lèi)算法就是將一組數(shù)據(jù)按照一定的規(guī)則分成若干組。泄漏檢測(cè)中的聚類(lèi)算法主要是把集中的數(shù)據(jù)分成一些相似或者相關(guān)的簇,然后再對(duì)每一個(gè)簇進(jìn)行分析。這種方法的好處在于能夠區(qū)分出所有的數(shù)據(jù)點(diǎn),給數(shù)據(jù)分析者提供更為準(zhǔn)確的參考,同時(shí)也可以有效地降低風(fēng)險(xiǎn)[1]。
常見(jiàn)的聚類(lèi)算法包括原型聚類(lèi)、分層聚類(lèi)和密度聚類(lèi)。其中,原型聚類(lèi)是最為簡(jiǎn)單的一種,該算法將數(shù)據(jù)集中的每個(gè)對(duì)象都看作是一個(gè)空間中的點(diǎn),然后根據(jù)距離等因素進(jìn)行聚類(lèi)。與原型聚類(lèi)不同,分層聚類(lèi)是采用自下而上的方法,逐層將數(shù)據(jù)合并成一個(gè)大的類(lèi)別。最后一種密度聚類(lèi)方法則是根據(jù)樣本點(diǎn)周?chē)拿芏葋?lái)判斷是否為核心點(diǎn),并將處于鄰域內(nèi)的其他點(diǎn)都?xì)w納到同一簇中。
在泄漏檢測(cè)過(guò)程中,一般會(huì)使用K-means 聚類(lèi)算法。在該算法中,通過(guò)計(jì)算樣本之間的歐氏距離,將數(shù)據(jù)集按照一定規(guī)則分成K 個(gè)簇,同時(shí),每個(gè)簇的中心點(diǎn)作為質(zhì)心,所有與它相似或者相關(guān)的數(shù)據(jù)點(diǎn)都打上同一個(gè)標(biāo)簽,方便后續(xù)的分析和處理。
除了K-means 算法外,還有許多其他的聚類(lèi)算法可以用于泄漏檢測(cè),如DBSCAN 和OPTICS。DBSCAN 是一種基于密度的聚類(lèi)算法,能夠?qū)?shù)據(jù)空間進(jìn)行分割,并找到具有高密度的區(qū)域;OPTICS 則是另一種聚類(lèi)算法,它可以在不指定簇?cái)?shù)的情況下自動(dòng)發(fā)現(xiàn)聚類(lèi)結(jié)構(gòu),并且可以處理任意形狀的聚類(lèi)結(jié)構(gòu)。
在實(shí)際應(yīng)用中,泄漏檢測(cè)工具會(huì)在數(shù)據(jù)集中挑選出部分標(biāo)簽樣本,使用聚類(lèi)算法將其劃分成多組數(shù)據(jù)。然后通過(guò)一定的規(guī)則找出每一組中的異常數(shù)據(jù),對(duì)每一個(gè)數(shù)據(jù)點(diǎn)進(jìn)行統(tǒng)計(jì)和分析,從而找出可能存在泄漏風(fēng)險(xiǎn)的數(shù)據(jù)。這樣的方法可以提高數(shù)據(jù)的檢測(cè)效率,減少漏報(bào)和誤報(bào)的情況,為企業(yè)和用戶(hù)提供更可靠的數(shù)據(jù)安全保障。
為了提高泄漏檢測(cè)技術(shù)的使用效率,建立管道泄漏模型,基于該模型,在處理石油管道泄漏事故的時(shí)候能夠使用適宜的檢測(cè)技術(shù)。
1.2.1 幾何模型
管道泄漏模型的幾何模型是模擬分析中非常重要的內(nèi)容。在模型設(shè)計(jì)中,需要將管道的幾何結(jié)構(gòu)劃分為具有代表性的各部分,并設(shè)置合適的網(wǎng)格劃分[2]。在建立管道泄漏模型時(shí),需要注意以下幾點(diǎn):
(1)內(nèi)部管道結(jié)構(gòu)的建立
內(nèi)部管道結(jié)構(gòu)是建立管道泄漏模型的基礎(chǔ),需要根據(jù)實(shí)際情況進(jìn)行設(shè)計(jì)。一般來(lái)說(shuō),內(nèi)部管道可以包括4 個(gè)部分:上游段、下游段、泄漏點(diǎn)和泄漏區(qū)域。其中,上游段和下游段用于模擬有壓力狀態(tài)下的流動(dòng),泄漏點(diǎn)和泄漏區(qū)域用于模擬管道泄漏后的流動(dòng)情況。
(2)網(wǎng)格劃分
網(wǎng)格劃分是建立管道泄漏模型的關(guān)鍵。根據(jù)液體或氣體的流動(dòng)特性,將管道各部分進(jìn)行適當(dāng)劃分,以獲得精確的流場(chǎng)模擬結(jié)果。在條件允許的情況下,盡可能使用ANSYS 等軟件自動(dòng)生成網(wǎng)格,以節(jié)省人工成本。
1.2.2 物理模型
建立管道泄漏模型需要考慮的第二個(gè)因素是物理模型。物理模型是建立在管道幾何模型之上,用于描述管道內(nèi)部流體的物理行為的數(shù)學(xué)方程組。
(1)流體的運(yùn)動(dòng)方程
對(duì)于流體,它的基本運(yùn)動(dòng)方程包括質(zhì)量守恒方程、動(dòng)量守恒方程和能量守恒方程。其中,質(zhì)量守恒方程描述了流體質(zhì)量的連續(xù)性;動(dòng)量守恒方程描述了流體的動(dòng)量變化;能量守恒方程描述了流體內(nèi)部的能量轉(zhuǎn)換過(guò)程。
(2)壓力方程
管道內(nèi)的流體在流動(dòng)過(guò)程中受到來(lái)自不同方向的壓力作用。為了模擬這些作用,需要建立管道內(nèi)部的壓力場(chǎng)模型。壓力方程一般可用Navier-Stokes 方程描述。在建立壓力方程時(shí),還需要考慮熱量傳遞、物質(zhì)傳遞等因素。
1.2.3 邊界條件
建立管道泄漏模型時(shí),還需要為模型設(shè)置合適的邊界條件。邊界條件是模型中最外圍邊緣的狀態(tài)值,其值對(duì)模擬結(jié)果有直接影響。具體來(lái)說(shuō),需要設(shè)置上游進(jìn)口邊界條件、下游出口邊界條件、泄漏點(diǎn)邊界條件、內(nèi)壁邊界條件和外壁邊界條件。
(1)上游進(jìn)口邊界條件
上游進(jìn)口邊界條件又稱(chēng)為“入口條件”,是指進(jìn)入管道的流體流動(dòng)情況。在設(shè)置上游進(jìn)口邊界條件時(shí),需要根據(jù)實(shí)際情況設(shè)置進(jìn)口流體的速度、壓力、溫度等參數(shù)。
(2)下游出口邊界條件
下游出口邊界條件又稱(chēng)為“出口條件”,是指離開(kāi)管道的流體流動(dòng)情況。在設(shè)置下游出口邊界條件時(shí),需要根據(jù)實(shí)際情況設(shè)置出口流體的速度、壓力、溫度等參數(shù)。
(3)泄漏點(diǎn)邊界條件
泄漏點(diǎn)邊界條件是指泄漏口周?chē)黧w的流動(dòng)情況。在設(shè)置泄漏點(diǎn)邊界條件時(shí),需要考慮泄漏的大小、風(fēng)速、氣體密度等因素,以計(jì)算泄漏口周?chē)牧黧w速度、壓力、溫度等參數(shù)。
(4)內(nèi)壁邊界條件
內(nèi)壁邊界條件是指管道內(nèi)壁與流體之間的摩擦作用和熱傳導(dǎo)作用。在設(shè)置內(nèi)壁邊界條件時(shí),需要根據(jù)實(shí)際情況設(shè)置管道內(nèi)壁的溫度、熱流量、摩擦系數(shù)等參數(shù)。
(5)外壁邊界條件
外壁邊界條件是指管道外部與環(huán)境之間的聯(lián)系。在設(shè)置外壁邊界條件時(shí),通常將管道外壁視為絕熱邊界或恒定溫度邊界。
成品油輸送管道作為石油化工行業(yè)的重要組成部分,其安全性一直備受關(guān)注和重視。在管道運(yùn)行過(guò)程中,壓力波動(dòng)是常見(jiàn)現(xiàn)象,這種波動(dòng)是由于泵流量、閥門(mén)開(kāi)度以及壓力表等因素的不穩(wěn)定變化所引起的。因此,上述因素對(duì)于管道的正常運(yùn)行并不會(huì)造成過(guò)大的影響。
然而,一些微小的異常波動(dòng)可能暗示著管道存在潛在的問(wèn)題,例如泄漏。如何及時(shí)發(fā)現(xiàn)這些微小的異常波動(dòng),保障管道運(yùn)行的安全性就成為相關(guān)從業(yè)人員需要重點(diǎn)關(guān)注的問(wèn)題。聚類(lèi)技術(shù)應(yīng)運(yùn)而生,通過(guò)分析成品油輸送管道的壓力波動(dòng),可以準(zhǔn)確地找到可能發(fā)生泄漏的位置,進(jìn)而及時(shí)采取措施進(jìn)行修復(fù)。
聚類(lèi)技術(shù)的核心思想是將數(shù)據(jù)點(diǎn)分類(lèi),并根據(jù)它們之間的相似性進(jìn)行劃分。在成品油輸送管道的案例中,可以將管道上不同站點(diǎn)的壓力數(shù)據(jù)匯總,并對(duì)其進(jìn)行聚類(lèi)分析。在聚類(lèi)分析的過(guò)程中,可以先采用常規(guī)的聚類(lèi)方法將數(shù)據(jù)點(diǎn)分類(lèi),再通過(guò)比較上下站離群點(diǎn)的差異,篩選出壓力波動(dòng)異常的點(diǎn)。
對(duì)于小幅波動(dòng)的壓力,要及時(shí)發(fā)現(xiàn)真正的異常點(diǎn)并發(fā)出預(yù)警信號(hào)。只有在發(fā)現(xiàn)異常點(diǎn)后,才能在管道出現(xiàn)問(wèn)題前及時(shí)采取措施進(jìn)行修復(fù),保障管道運(yùn)行的安全性。有了聚類(lèi)技術(shù)的幫助,可以更加準(zhǔn)確地找到異常點(diǎn)并及時(shí)處理,讓管道的泄漏風(fēng)險(xiǎn)降到最低。
本次研究中,選取了某個(gè)時(shí)間段內(nèi)石油管道的壓力數(shù)據(jù),將取樣的時(shí)間間隔設(shè)定為1 s,并將單點(diǎn)數(shù)據(jù)標(biāo)記為a1、a2、a3…,這些單點(diǎn)數(shù)據(jù)組成了一個(gè)離群數(shù)據(jù)集m。處理該數(shù)據(jù)集過(guò)程中,將時(shí)間設(shè)定為60 s,對(duì)m數(shù)據(jù)集進(jìn)行迭代計(jì)算,即:
其中,M為所有數(shù)據(jù)的集合,基于上述2 個(gè)公式,對(duì)數(shù)據(jù)集m中的所有參量進(jìn)行聚類(lèi)計(jì)算,得到:
其中,μm為m集合參量聚類(lèi)計(jì)算結(jié)果;N為聚類(lèi)計(jì)算次數(shù);σ為高斯核函數(shù)的標(biāo)準(zhǔn)差參數(shù)。根據(jù)數(shù)據(jù)集m中各個(gè)對(duì)象的聚類(lèi)計(jì)算參數(shù),將最后一個(gè)參數(shù)刪除并再次進(jìn)行聚類(lèi):
對(duì)比2 次聚類(lèi)計(jì)算所得到的結(jié)果,2 組結(jié)果之間差值的絕對(duì)值就是數(shù)據(jù)集m中最后一個(gè)數(shù)據(jù)離群點(diǎn)參數(shù),將其標(biāo)記為Vm。
每一個(gè)參量點(diǎn)與其前面的59 個(gè)參量點(diǎn)組成一個(gè)數(shù)據(jù)集,計(jì)算其離群點(diǎn)數(shù)據(jù)得分,最終得到離群系數(shù)L,其計(jì)算公式為:
成品油輸送管道的安全性需要得到充分保障,通過(guò)采用各種技術(shù)手段進(jìn)行監(jiān)測(cè)和預(yù)警成了非常必要的工作。其中,離群系數(shù)L的應(yīng)用可以有效地檢測(cè)管道中可能存在的異常情況,并及時(shí)發(fā)出報(bào)警信號(hào)[3]。然而,在實(shí)際工作過(guò)程中,不同的管段和不同的工況對(duì)于離群系數(shù)L的下閾值均有所不同,這就需要通過(guò)大數(shù)據(jù)挖掘分析得到各自閾值,才能達(dá)到真正的預(yù)警效果。離群系數(shù)L是常用于數(shù)據(jù)挖掘和異常檢測(cè)領(lǐng)域的指標(biāo),計(jì)算公式為:
其中,x為數(shù)據(jù)點(diǎn)具體數(shù)值;μ為樣本中數(shù)據(jù)點(diǎn)的均值;σ為樣本中數(shù)據(jù)點(diǎn)的標(biāo)準(zhǔn)差。在成品油輸送管道中,采集到的壓力數(shù)據(jù)可以作為x,而μ和σ可以通過(guò)歷史數(shù)據(jù)分析得到。通過(guò)計(jì)算可得到一個(gè)離群系數(shù)L的值,如果其大于某一個(gè)事先設(shè)定的閾值,就認(rèn)為該數(shù)據(jù)點(diǎn)是異常點(diǎn)。
但是,在實(shí)際工作中,不同的管段和不同的工況下,數(shù)據(jù)的分布情況是不一樣的,這就導(dǎo)致了不同的管段和工況需要設(shè)定不同的閾值,才能準(zhǔn)確地檢測(cè)到異常點(diǎn)。因此,采用大數(shù)據(jù)挖掘分析的方法來(lái)得到各自的閾值。這一過(guò)程中,需要先采集并整理大量不同管段、不同工況下的壓力數(shù)據(jù),并使用聚類(lèi)分析技術(shù)對(duì)其進(jìn)行分類(lèi)處理。在分析時(shí),需要結(jié)合實(shí)際情況,根據(jù)管道的特性和運(yùn)行狀態(tài)進(jìn)行分類(lèi),并計(jì)算出標(biāo)準(zhǔn)差和均值。通過(guò)相應(yīng)的統(tǒng)計(jì)學(xué)方法,可以得到每個(gè)管段和工況下離群系數(shù)L的下閾值,然后,將這些閾值應(yīng)用于成品油輸送管道的實(shí)際監(jiān)測(cè)中,可以避免重復(fù)報(bào)警和錯(cuò)誤報(bào)警的問(wèn)題,真正達(dá)到預(yù)警效果。
為印證大數(shù)據(jù)聚類(lèi)算法在石油管道泄漏檢測(cè)中的應(yīng)用效果,以國(guó)內(nèi)某段石油管道為例,截取A、B 2 個(gè)石油中轉(zhuǎn)站之間的管道進(jìn)行數(shù)據(jù)分析。其中,A站為下載站,B 站為末站,A、B 兩站之間的管道長(zhǎng)度為99.4 km,通過(guò)分析A 站與B 站的功能,對(duì)該段管路的2 種運(yùn)行情況進(jìn)行分析,分別為:汽油頂柴油在管道中運(yùn)行(如圖1 所示);柴油頂汽油在管道中運(yùn)行(如圖2 所示)[4]?;诖髷?shù)據(jù)挖掘技術(shù),對(duì)該段管道進(jìn)行泄漏檢測(cè)。
觀察圖1 與圖2 可以發(fā)現(xiàn):在汽油頂柴油工況下,將閾值設(shè)定在3.5 左右;在柴油頂汽油工況下,將閾值設(shè)定在2.5 左右,可以過(guò)濾掉99.5%左右的誤報(bào),提高泄漏檢測(cè)準(zhǔn)確性,同時(shí)也說(shuō)明了大數(shù)據(jù)聚類(lèi)算法在石油管道泄漏檢測(cè)中有廣闊的應(yīng)用前景[5]。
基于本次研究,相關(guān)工作人員得出2 條結(jié)論:
(1)在管道泄漏檢測(cè)報(bào)警系統(tǒng)中,聚類(lèi)算法被廣泛應(yīng)用于離群點(diǎn)挖掘技術(shù)。這項(xiàng)技術(shù)具有較強(qiáng)的使用價(jià)值,能夠令相關(guān)工作人員得到更加精確的泄漏檢測(cè)范圍,對(duì)壓力異常波動(dòng)的敏感度更高,并且反應(yīng)更加迅速;
(2)基于聚類(lèi)的離群點(diǎn)挖掘算法還可以用于其他成品油管道在不同工況下的大數(shù)據(jù)處理。通過(guò)調(diào)整相應(yīng)管道的閾值,可以將該算法模型應(yīng)用于不同的管道,實(shí)現(xiàn)對(duì)多種管道的泄漏檢測(cè)。此外,該算法還可以幫助識(shí)別管道系統(tǒng)中的異常值和離群點(diǎn),提高管道運(yùn)行效率和安全性。