這位“數(shù)據(jù)匠人”正用一行行代碼,叩響傳統(tǒng)能源智能化轉(zhuǎn)型的大門
清晨,北京中國石油科技園昆侖數(shù)智辦公樓內(nèi),服務(wù)器陣列的指示燈如星群般明滅。每一個(gè)第一次走進(jìn)這間辦公室的人都會(huì)驚嘆,“這里怎么有這么多機(jī)器啊!”而這每一臺(tái)機(jī)器的搭建,都離不開一個(gè)名字——?jiǎng)⑽缗!?/p>
從新疆戈壁的地震勘探員,到互聯(lián)網(wǎng)大廠的算法專家,再回歸能源行業(yè)成為AI先鋒,劉午牛始終相信,數(shù)據(jù)是工業(yè)文明最深沉的脈搏。當(dāng)二手服務(wù)器拼湊的算力集群建立起一個(gè)個(gè)私有化大模型和AI助手,這位“數(shù)據(jù)匠人”正用一行行代碼,叩響傳統(tǒng)能源智能化轉(zhuǎn)型的大門。
跨界追光:數(shù)據(jù)洪流中的求索者
2010年,劉午牛從中國石油大學(xué)畢業(yè)后加入中國石油,一頭扎進(jìn)了新疆戈壁,投身地震數(shù)據(jù)處理分析和地震解釋工作,主要負(fù)責(zé)利用大型計(jì)算集群對(duì)TB級(jí)別地震數(shù)據(jù)進(jìn)行處理分析。這段經(jīng)歷加深了他對(duì)數(shù)據(jù)價(jià)值的理解,也培養(yǎng)了他在大規(guī)模計(jì)算集群領(lǐng)域的技術(shù)能力。
然而,互聯(lián)網(wǎng)行業(yè)掀起的大數(shù)據(jù)革命讓他清晰意識(shí)到差距:傳統(tǒng)能源領(lǐng)域的數(shù)據(jù)應(yīng)用仍局限在特定場(chǎng)景,而互聯(lián)網(wǎng)企業(yè)在海量數(shù)據(jù)處理、分析和商業(yè)化應(yīng)用方面早已遙遙領(lǐng)先?!按髷?shù)據(jù)時(shí)代已來,我要去這場(chǎng)浪潮的最前沿,去看看他們是如何處理海量數(shù)據(jù)的?!边@個(gè)在戈壁灘數(shù)沙礫的年輕人,從地球物理數(shù)據(jù)分析跨入了互聯(lián)網(wǎng)大數(shù)據(jù)世界。
踏上互聯(lián)網(wǎng)行業(yè)的新征程后,他充分發(fā)揮石油人特有的鉆研精神:在網(wǎng)絡(luò)出行平臺(tái)工作期間,他深耕供需彈性算法優(yōu)化,憑借嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)分析將補(bǔ)貼策略精準(zhǔn)度提升30%;轉(zhuǎn)戰(zhàn)銀行后,他又以“數(shù)據(jù)偵探”的敏銳洞察力,從億萬條交易數(shù)據(jù)中解碼用戶行為特征,為業(yè)務(wù)決策提供有力支撐。
積累了大量互聯(lián)網(wǎng)與金融領(lǐng)域的數(shù)據(jù)分析和挖掘經(jīng)驗(yàn)后,他意識(shí)到,AI技術(shù)與行業(yè)知識(shí)的結(jié)合能創(chuàng)造更大社會(huì)價(jià)值?!盎ヂ?lián)網(wǎng)數(shù)據(jù)是‘快消品’,而能源數(shù)據(jù)則關(guān)乎萬家燈火,這份重量讓我想回來做點(diǎn)實(shí)事?!?022年,劉午牛重返中國石油。
數(shù)據(jù)攻堅(jiān):萬家燈火的守護(hù)者
回到中石油以后,劉午牛接手的第一個(gè)任務(wù)便是研究天然氣零售用戶用氣數(shù)據(jù),解決海量數(shù)據(jù)場(chǎng)景下燃?xì)庥?jì)費(fèi)異常的監(jiān)控問題,并篩選可能存在安全隱患的燃?xì)庠O(shè)備。面對(duì)329萬條錯(cuò)綜復(fù)雜的歷史用氣樣本數(shù)據(jù),他沒有急于下手,而是先花了兩周時(shí)間,廣泛查詢數(shù)據(jù)庫,摸清了數(shù)據(jù)的來龍去脈。
劉午牛一邊翻看數(shù)據(jù)字典,一邊緊盯著屏幕,記錄著數(shù)據(jù)字段的含義和關(guān)聯(lián)關(guān)系。“用戶的用氣行為是極其復(fù)雜的,我們不能用一個(gè)簡(jiǎn)單的模型來概括所有場(chǎng)景?!弊罱K,通過對(duì)數(shù)據(jù)的多角度分析,他設(shè)計(jì)了一套“數(shù)據(jù)篩網(wǎng)”——基于核密度估計(jì)的異常檢測(cè)模型。
每周,他都會(huì)生成一份詳細(xì)的周報(bào),發(fā)送給燃?xì)夤?。周?bào)中不僅包含用氣量趨勢(shì)、用戶等級(jí)劃分、管網(wǎng)流量分析等常規(guī)內(nèi)容,還增加了安檢排查方案建議模塊,便于燃?xì)夤炯皶r(shí)上門入戶排查燃?xì)庠O(shè)備隱患。從329萬條記錄中,他基于217條異常記錄精準(zhǔn)定位了128塊異常燃?xì)獗?。這份周報(bào)很快成為燃?xì)夤緵Q策的重要參考,也為后續(xù)的安檢排查提供了科學(xué)依據(jù)。
這份執(zhí)著,最終凝結(jié)成發(fā)明專利——《一種燃?xì)獗懋惓z測(cè)方法》。當(dāng)技術(shù)落地為實(shí)實(shí)在在的效益,每一份周報(bào)上的數(shù)據(jù)曲線,都化作了守護(hù)萬家燈火的安全屏障。
破局先鋒:數(shù)據(jù)資產(chǎn)化的探路者
2024年,國家加快數(shù)據(jù)要素市場(chǎng)化配置改革,推動(dòng)數(shù)據(jù)資產(chǎn)入表、交易試點(diǎn)。同年7月,集團(tuán)公司首次啟動(dòng)數(shù)據(jù)資產(chǎn)交易試點(diǎn),天然氣銷售領(lǐng)域是集團(tuán)劃定的四大試點(diǎn)之一。劉午牛敏銳察覺到數(shù)據(jù)資產(chǎn)的重要性,主動(dòng)承擔(dān)起了天然氣銷售領(lǐng)域從需求調(diào)研到數(shù)據(jù)產(chǎn)品開發(fā)的全流程工作。他帶領(lǐng)團(tuán)隊(duì)在短短四個(gè)月內(nèi)完成了數(shù)據(jù)交易產(chǎn)品的研發(fā),形成了《天然氣終端銷售月度數(shù)據(jù)分析報(bào)告——中國石油集團(tuán)公司數(shù)據(jù)交易試點(diǎn)數(shù)據(jù)產(chǎn)品》,支持?jǐn)?shù)據(jù)評(píng)估、交易所掛載等功能,不僅樹立了項(xiàng)目標(biāo)桿,還探索了數(shù)據(jù)在宏觀經(jīng)濟(jì)研究場(chǎng)景中的應(yīng)用潛力,為集團(tuán)公司后續(xù)構(gòu)建數(shù)據(jù)資產(chǎn)化運(yùn)營(yíng)體系提供了實(shí)踐經(jīng)驗(yàn),驗(yàn)證了數(shù)據(jù)資產(chǎn)交易的價(jià)值和可行性。
“數(shù)據(jù)資產(chǎn)化不是終點(diǎn),而是起點(diǎn)。”他在項(xiàng)目總結(jié)時(shí)寫道,“要讓數(shù)據(jù)流動(dòng)起來,創(chuàng)造更大的價(jià)值?!?/p>
算力突圍:大模型時(shí)代的領(lǐng)跑者
2022年11月,ChatGPT橫空出世;2023年3月,百度發(fā)布首款A(yù)I大模型“文心一言”;2024年3月,國務(wù)院總理李強(qiáng)在政府工作報(bào)告中首次提出“支持大模型廣泛應(yīng)用”,將大模型應(yīng)用上升為國家戰(zhàn)略;2025年,Deepseek在全球人工智能領(lǐng)域脫穎而出……這一系列的變化讓劉午牛意識(shí)到,大模型的時(shí)代已經(jīng)到來。然而,公司算力資源有限,英偉達(dá)顯卡價(jià)格水漲船高,AI模型訓(xùn)練的推進(jìn)陷入困境。
“算力不夠?那就自己搭建算力集群!”他充分發(fā)揚(yáng)了“有條件要上,沒有條件創(chuàng)造條件也要上”的石油優(yōu)良傳統(tǒng),轉(zhuǎn)遍了二手市場(chǎng),淘來了高性價(jià)比服務(wù)器,又自掏腰包購置GPU,充分利用有限的預(yù)算,在工位旁邊的角落搭建起一套能夠支撐大模型訓(xùn)練的算力集群,AllinAI!
這套算力集群不僅大大緩解了算力短缺的問題,還為大模型的私有化部署提供了穩(wěn)定支撐。他開發(fā)的“小葫蘆”私有化大模型,支持文檔生成、代碼生成和多智能體切換,響應(yīng)速度快,為天然氣銷售系統(tǒng)提供精準(zhǔn)的地址校正服務(wù),不僅提高了數(shù)據(jù)處理的準(zhǔn)確性,還有效降低了運(yùn)營(yíng)成本,確保了數(shù)據(jù)安全。
“AI不是遙不可及的技術(shù),而是能實(shí)實(shí)在在解決問題的工具。”他常對(duì)同事說,“如果我們不能跟上時(shí)代的腳步,就會(huì)被時(shí)代拋棄?!?/p>
繼“小葫蘆”之后,劉午牛又相繼開發(fā)了智能數(shù)據(jù)查詢工具ChatBI、智研報(bào)告助手、財(cái)報(bào)分析助手等實(shí)用AI工具,助力業(yè)務(wù)人員提高天然氣商情數(shù)據(jù)查詢和分析效率達(dá)50%。此外,他還幫助燃?xì)馄髽I(yè)研發(fā)了智能客服助手,將現(xiàn)有系統(tǒng)客服機(jī)器人語義理解準(zhǔn)確度提升至80%,有效解決了燃?xì)庥脩糇灾稍?、?bào)修等問題,賦予了客服業(yè)務(wù)新的發(fā)展動(dòng)能。
暮色籠罩京城,實(shí)驗(yàn)室的燈光依然亮如白晝。劉午牛正調(diào)試著最新的DeepSeek大模型。從戈壁勘探到AI先鋒,這位數(shù)據(jù)匠人的探索從未停歇。
責(zé)任編輯張惠清