潘軍明 陳小泉
摘? 要:數(shù)據(jù)分析對企業(yè)的生產(chǎn)運營具有至關(guān)重要的作用。該文以油氣田吊機設(shè)備數(shù)據(jù)為基礎(chǔ),利用生產(chǎn)過程中所產(chǎn)生的各種歷史數(shù)據(jù),采用多種分析模型,從不同角度有針對性地對數(shù)據(jù)進行分析,得到科學(xué)直觀的相關(guān)性分析結(jié)果,并對設(shè)備故障進行大概預(yù)測?;谶@些分析預(yù)測結(jié)果,現(xiàn)場人員能夠及時制訂設(shè)備預(yù)防性維護計劃,降低設(shè)備的故障率,為生產(chǎn)決策提供數(shù)據(jù)支持。
關(guān)鍵詞:吊機? 相關(guān)性分析? Pandas? Sklearn? 故障預(yù)測
中圖分類號:TH215? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標(biāo)識碼:A? ? ? ? ? ? ? ? ? ? ? ? ? ?文章編號:1672-3791(2019)04(c)-0051-03
隨著中海油信息化的不斷發(fā)展,已經(jīng)建成了資產(chǎn)管理系統(tǒng)、采辦系統(tǒng)、設(shè)備運行管理系統(tǒng)、物流配送等系統(tǒng),積累了數(shù)以千萬計的基礎(chǔ)數(shù)據(jù)和業(yè)務(wù)數(shù)據(jù)。而油氣田現(xiàn)場部署著各種各樣的設(shè)備,如何通過數(shù)據(jù)分析挖掘,給設(shè)備管理工作提供指導(dǎo)建議,降低維護成本,提高設(shè)備使用價值,已成為公司面臨的一個重大問題。
1? 問題與現(xiàn)狀
在石油勘探開發(fā)過程中需要使用到各種機電儀設(shè)備,這些設(shè)備如果發(fā)生故障,需要管理人員進行維護。目前現(xiàn)場只能根據(jù)設(shè)備的運行時長制訂維護計劃,不能很好的根據(jù)設(shè)備運行狀態(tài)、故障原因,故障次數(shù),維修費用等情況綜合起來預(yù)測設(shè)備故障趨勢,以便在下一次故障出現(xiàn)前進行提前維護,減少設(shè)備關(guān)停的次數(shù),增加設(shè)備持續(xù)運行時間。因此,該次研究有針對性的選擇了吊機為分析對象,梳理出與該設(shè)備相關(guān)的各類數(shù)據(jù),結(jié)合實際業(yè)務(wù)建立數(shù)據(jù)模型,以大量各種相關(guān)數(shù)據(jù)為基礎(chǔ),對該設(shè)備進行深入分析,驗證算法的有效性和準(zhǔn)確性,從而確定設(shè)備的總體故障趨勢。
2? 分析過程描述
從工單、物料、服務(wù)接收單、運行管理、檢修工時、故障填報等基礎(chǔ)信息中提取5年以來的數(shù)據(jù),并進行指標(biāo)量化(故障次數(shù)、維修費用、檢修次數(shù)、檢修時長、運行時長)。
Pandas是一個開放源碼的Python庫,它使用強大的數(shù)據(jù)結(jié)構(gòu)提供高性能的數(shù)據(jù)操作和分析工具。利用Pandas可以完成數(shù)據(jù)處理和分析的五個典型步驟,加載,準(zhǔn)備,操作,模型和分析。利用pandas及作圖工具對故障次數(shù)與其他屬性(指標(biāo))進行探尋獲得如下圖形。
通過數(shù)據(jù)初探發(fā)現(xiàn)圖1~圖3與圖4(線形回歸)比較接近,尤其是故障次數(shù)/檢修次數(shù)與圖4(線形回歸)最擬合。
3? 分析與預(yù)測
3.1 相關(guān)分析
相關(guān)系數(shù)是用來刻畫二維隨機變量兩個分量間相互關(guān)聯(lián)程度。利用python 數(shù)據(jù)分析包pandas 中求相關(guān)系數(shù)方法Corr()進行分析。
通過相關(guān)分析得出如圖5所示結(jié)果,故障次數(shù)與自身相關(guān)系數(shù)為1,與隱患次數(shù)相關(guān)系為0.39,與檢查次數(shù)相關(guān)系為0.97,與檢查時長相關(guān)系0.81,與維修費用相關(guān)系數(shù)為:0.73。當(dāng)?shù)弥鱾€屬性(指標(biāo))與故障次數(shù)的相關(guān)系數(shù)后,可通過關(guān)聯(lián)度較高的檢查次數(shù)、檢查時長、維修費用來側(cè)面觀察設(shè)備的故障發(fā)生次數(shù)。
3.2 預(yù)測分析
sklearn和pandas一樣是一個開放源碼的Python庫,支持回歸,分類、聚類等強大的機器學(xué)習(xí)庫。該次將利用sklearn內(nèi)置的回歸模型進行吊機設(shè)備的分析和預(yù)測。
進行回歸分析(線形回歸),需要將數(shù)據(jù)劃分為兩份數(shù)據(jù)集,一份用于訓(xùn)練,一份用于對訓(xùn)練結(jié)果的檢測(測試數(shù)據(jù)),各自占數(shù)據(jù)總體比例分別為75%、25%,其數(shù)據(jù)集劃分如圖6所示。
從構(gòu)造數(shù)據(jù)集和創(chuàng)建預(yù)測模型,輸出預(yù)測結(jié)果完整代碼如圖7所示。根據(jù)圖7輸出結(jié)果:預(yù)測故障次數(shù)為2,與實際故障次數(shù)3比較接近。
對于預(yù)測模型的好壞,以均方誤差作為評價標(biāo)準(zhǔn):其值越接近0模型越優(yōu)良。模型評測效果:如圖8 輸出的均方誤差1.733表示該模型很優(yōu)秀。
4? 結(jié)語
通過吊機設(shè)備的分析后發(fā)現(xiàn),故障次數(shù)和查次數(shù)、檢查時長、維修費相關(guān)性較強尤其是與檢修次數(shù)相關(guān)性較為接近,基本上都是線形相關(guān)。通過檢查次數(shù)和隱患次數(shù)可對故障次數(shù)進行線形回歸預(yù)測,其模型均方誤差值較小,預(yù)測的故障次數(shù)與實際故障次數(shù)比較接近,基本達到對吊機故障的分析預(yù)測。
參考文獻
[1] 萬倩,謝峰,趙明. 基于大數(shù)據(jù)的設(shè)備故障預(yù)測[J].廣播電視信息,2016(11):71-73.
[2] 續(xù)媛君,潘宏俠.設(shè)備故障趨勢預(yù)測的分析與應(yīng)用[J]. 振動、測試與診斷,2006(4):305-308,333.
[3] 王致杰,王耀才,李冬.現(xiàn)代大型設(shè)備故障智能診斷技術(shù)的現(xiàn)狀與展望[J].煤礦機械,2003(7):102-104.
[4] 何春燕,王超宇.基于python+pandas的數(shù)據(jù)分析處理應(yīng)用[J].數(shù)碼世界,2018(7):386.