劉志堅(jiān) 齊樂
“唯有不斷歸零,才能超越自我?!边@是中國石油安全環(huán)保技術(shù)研究院閻紅巧的座右銘。作為設(shè)備設(shè)施完整性技術(shù)創(chuàng)新團(tuán)隊(duì)的核心技術(shù)骨干和項(xiàng)目負(fù)責(zé)人,正是憑著這種信念、激情和擔(dān)當(dāng),她在短短9年內(nèi),參與科研及信息化建設(shè)項(xiàng)目13個(gè),發(fā)表專業(yè)學(xué)術(shù)論文14篇,獲授權(quán)發(fā)明專利6項(xiàng),用青春智慧為我國油氣行業(yè)安全生產(chǎn)保駕護(hù)航。
重大危險(xiǎn)源風(fēng)險(xiǎn)預(yù)警模型是中國石油統(tǒng)建信息化項(xiàng)目《危險(xiǎn)化學(xué)品重大危險(xiǎn)源泄漏監(jiān)測預(yù)警系統(tǒng)》的核心組件。然而“由于重大危險(xiǎn)源類型多,涉及專業(yè)公司多,不同專業(yè)公司管理重點(diǎn)和數(shù)據(jù)基礎(chǔ)差異大,預(yù)警模型構(gòu)建難度大?!遍惣t巧帶領(lǐng)團(tuán)隊(duì)深入基層調(diào)研,僅用15天便走訪了8家遍布全國的典型重大危險(xiǎn)源企業(yè),深夜啟程、日夜兼程,摸清各類重大危險(xiǎn)源的風(fēng)險(xiǎn)管控痛點(diǎn),經(jīng)過反復(fù)調(diào)研、推理,提出重大危險(xiǎn)源預(yù)警指標(biāo)體系。
一個(gè)難題解決,多個(gè)難題接踵而至,如何建立科學(xué)的預(yù)警模型呢?面對多種模型構(gòu)建方法,閻紅巧秉持“博采眾長,擇善而從”原則,分析不同模型構(gòu)建方法的優(yōu)缺點(diǎn),虛心求教國內(nèi)外專家。不少資深專家勸她,“工期如此緊,最好用最少的指標(biāo)建?!薄5?,閻紅巧認(rèn)為預(yù)警指標(biāo)不全面會(huì)降低預(yù)警準(zhǔn)確率,她不甘心,繼續(xù)研究最權(quán)威的英文技術(shù)資料,通過對預(yù)警指標(biāo)變換、替代,最終建立了包含50余項(xiàng)風(fēng)險(xiǎn)變量的重大危險(xiǎn)源預(yù)警模型,模型能夠全面、系統(tǒng)地描繪風(fēng)險(xiǎn)。
完成模型建立又向目標(biāo)邁出堅(jiān)實(shí)一步,如何精準(zhǔn)管控重大危險(xiǎn)源動(dòng)態(tài)風(fēng)險(xiǎn),是發(fā)揮模型作用的最后一道關(guān)?!皞鹘y(tǒng)方法一般是,將所有重大危險(xiǎn)源的風(fēng)險(xiǎn)值進(jìn)行等間隔劃分?!遍惣t巧通過深入思考,認(rèn)為這并不科學(xué)。于是,她將歷史數(shù)據(jù)帶入預(yù)警模型,求解各重大危險(xiǎn)源的風(fēng)險(xiǎn)分布,通過求解,發(fā)現(xiàn)大部分重大危險(xiǎn)源的風(fēng)險(xiǎn)量化值集中在一個(gè)風(fēng)險(xiǎn)區(qū)間,意味著大部分重大危險(xiǎn)源均屬同一個(gè)風(fēng)險(xiǎn)等級,這就難以精準(zhǔn)分級管理。為此,她通過分析海量數(shù)據(jù),重新確定了重大危險(xiǎn)源風(fēng)險(xiǎn)分級方法,為開展重大危險(xiǎn)源靶向管理提供了科學(xué)依據(jù)。最終,她按時(shí)高質(zhì)量完成重大危險(xiǎn)源模型構(gòu)建工作,為危險(xiǎn)化學(xué)品重大危險(xiǎn)源泄漏監(jiān)測預(yù)警系統(tǒng)提供了分析中樞,為工業(yè)互聯(lián)網(wǎng)+?;踩a(chǎn)建設(shè)提供了技術(shù)支撐。
HSE信息系統(tǒng),猶如中國石油安全生產(chǎn)“晴雨表”。自2009年啟用至今,它已匯聚了約1.2億條文本數(shù)據(jù),這些數(shù)據(jù)涵蓋了事故調(diào)查報(bào)告、監(jiān)督檢查記錄、體系審核記錄等。而閻紅巧的工作,便是對這些海量數(shù)據(jù)進(jìn)行分析和處理,為油氣安全環(huán)保戰(zhàn)略決策提供數(shù)據(jù)支撐。
過去,閻紅巧依靠人工閱讀報(bào)告文本,從中提取關(guān)鍵信息,判斷哪些環(huán)節(jié)、哪些過程和設(shè)備設(shè)施容易發(fā)生事故,從而有的放矢地開展事故防范工作。但是,人工逐字逐句閱讀提取信息,既費(fèi)時(shí)又費(fèi)力,特別是面對數(shù)萬、上千萬的安全檢查類記錄,采用人工分析的方式幾乎不現(xiàn)實(shí)。此外,專業(yè)性強(qiáng)也是一個(gè)挑戰(zhàn),油氣產(chǎn)業(yè)鏈長,安全管理貫穿上中下游全產(chǎn)業(yè)鏈,若無專業(yè)背景,很難準(zhǔn)確提取出關(guān)鍵信息。
“這些問題限制了數(shù)據(jù)價(jià)值的發(fā)揮,而歐洲國家也才開始探索安全管理數(shù)據(jù)分析手段,要想攻克這一難關(guān)實(shí)屬不易。”閻紅巧深知,如果僅收集數(shù)據(jù)而不發(fā)揮數(shù)據(jù)價(jià)值,缺乏對管理的反饋和提升,本質(zhì)上就是管理的內(nèi)耗。她設(shè)想研發(fā)一款自動(dòng)挖掘石油石化領(lǐng)域HSE文本信息的工具來解決當(dāng)前所遇到的問題。經(jīng)過大量技術(shù)調(diào)研,閻紅巧發(fā)現(xiàn)構(gòu)建領(lǐng)域詞庫是實(shí)現(xiàn)這一目標(biāo)的關(guān)鍵。有了領(lǐng)域詞庫,計(jì)算機(jī)便具備了石油石化行業(yè)的基因,能夠解讀領(lǐng)域文本。
忽如一夜春風(fēng)來,“沉睡”數(shù)據(jù)似花開。閻紅巧帶領(lǐng)團(tuán)隊(duì)對“沉睡”近20年的海量文本數(shù)據(jù)進(jìn)行了為期3年的持續(xù)攻關(guān),原創(chuàng)石油石化領(lǐng)域詞庫構(gòu)建方法,建成了包含14萬個(gè)詞匯的領(lǐng)域詞庫。研發(fā)的定制化石油石化領(lǐng)域語義識別模型賦予計(jì)算機(jī)“文本閱讀理解”能力,替代安全管理人員閱讀各類文本數(shù)據(jù)、提取風(fēng)險(xiǎn)信息、進(jìn)行多維度風(fēng)險(xiǎn)量化分析。如今,只要打開“安全管理文本大數(shù)據(jù)分析系統(tǒng)”,點(diǎn)擊“生成智能報(bào)告”按鈕,只需5秒鐘,便可生成圖文并茂的分析報(bào)告。
“與傳統(tǒng)的人工數(shù)據(jù)分析方式相比,計(jì)算機(jī)分析效率提升近4000倍,更重要的是將安全管理人員從繁雜的數(shù)據(jù)分析工作中解脫出來。”目前,基于這一創(chuàng)新成果研發(fā)的大數(shù)據(jù)分析產(chǎn)品已應(yīng)用于油氣田企業(yè)“安眼工程”。
在貫徹落實(shí)習(xí)近平總書記關(guān)于網(wǎng)絡(luò)強(qiáng)國的重要思想和數(shù)字中國戰(zhàn)略部署的征程中,建設(shè)“數(shù)智中國石油”的使命莊嚴(yán)而偉大。設(shè)備“數(shù)實(shí)融合創(chuàng)新”,如同一座巍峨的山峰,等待著勇者去攀登。閻紅巧毅然挑起了這艱難的重?fù)?dān),構(gòu)建設(shè)備健康度監(jiān)測預(yù)警大模型。為了獲取足夠的異常數(shù)據(jù)樣本,她深入各站場DCS系統(tǒng)數(shù)據(jù)庫,在那片數(shù)據(jù)海洋中奮力追尋。站場DCS數(shù)據(jù)僅保存半年,她邊收集邊分析,有時(shí)一天能獲得1-2組樣本,更多時(shí)候奔波數(shù)日卻一無所獲。整整兩個(gè)月,她不是在站場間穿梭,就是在導(dǎo)數(shù)據(jù)、分析數(shù)據(jù),最終獲取了46組異常數(shù)據(jù)樣本。
然而,難題接踵而至。基于46組數(shù)據(jù)樣本所構(gòu)建的預(yù)警模型適用范圍有限,如何建立適用性更強(qiáng)的設(shè)備健康度預(yù)警大模型?國內(nèi)外亦無成熟案例可借鑒。項(xiàng)目陷入泥沼,舉步維艱。在最困難的時(shí)候,她始終堅(jiān)信一句話:“辦法總比困難多?!彼龑ふ抑?6組異常樣本的共性特征,她翻閱著工藝、設(shè)備、高等流體力學(xué)等多門學(xué)科書籍,嘗試著用綜合知識去闡釋共性特征。結(jié)合機(jī)理和數(shù)據(jù)驅(qū)動(dòng)建模方法,通過對模型進(jìn)一步修正,終于獲得了準(zhǔn)確率高達(dá)90%以上的設(shè)備健康度預(yù)警大模型,預(yù)警大模型研發(fā)成果驗(yàn)收同年便成功落地應(yīng)用,保障了設(shè)備運(yùn)行過程本質(zhì)安全。
責(zé)任編輯 張惠清