藺紅生,王 烈
(中國鐵道科學研究院集團有限公司 科學技術信息研究所,北京 100081)
鐵路是典型的節(jié)能環(huán)保綠色交通工具,但同時也是能源消耗大戶,鐵路節(jié)能減排無論是對于經(jīng)濟效益還是對于生態(tài)環(huán)境保護都顯得尤為重要。根據(jù)中國國家鐵路集團有限公司2021年統(tǒng)計公報,國家鐵路營業(yè)里程13.1萬km,其中電化率75.4%;國家鐵路機車擁有量為2.09萬臺,其中內燃機車0.74萬臺,占比35.4%,電力機車1.35萬臺,占比64.6%;國家鐵路能源消耗折算標準煤1 580.74萬t。在鐵路運輸總能耗中,機車牽引能耗占比最大,約為全國鐵路總能耗的60% ~ 70%[1],特別是高速鐵路,機車牽引能耗占到總能耗的70% ~ 85%以上[2]。因此,研究分析電力機車牽引能耗信息,對于提高機車能耗管理水平具有重要現(xiàn)實意義。
目前,鐵路機車能源消耗原始數(shù)據(jù)來源于機車乘務員出勤時填記的“司機報單”?!八緳C報單”是統(tǒng)計機車、車輛運用效率和機車能源消耗情況,考核機車乘務員工作量的原始單據(jù),是編制各種機車統(tǒng)計報表的主要依據(jù)[3]。
我國鐵路機車能耗統(tǒng)計是基于人工抄表(或電子報單)的事后統(tǒng)計,缺乏分機車、線路、牽引質量等運輸特征的能耗信息分析,存在數(shù)據(jù)時效性不強、精細化程度較低、統(tǒng)計結果誤差較大等問題[4],造成統(tǒng)計報表無法直接反映機車擔當交路的能源消耗情況和日常機車消耗出現(xiàn)的異常情況,不利于機車能耗的精細化管理。
隨著電氣化鐵路的高速發(fā)展,特別是車載智能電表的普及和使用,從信息源點著手,由人工采集(司機報單)轉變?yōu)檐囕d設備的自動連續(xù)采集,利用大數(shù)據(jù)分析手段實現(xiàn)機車能耗的精細化應用與管理已經(jīng)具備條件。車載設備采集和記錄了海量的機車運行數(shù)據(jù)、狀態(tài)數(shù)據(jù)、安全數(shù)據(jù)及能耗數(shù)據(jù),對這些海量數(shù)據(jù)進行關聯(lián)和深入分析,深度挖掘數(shù)據(jù)背后的價值,提供按照機車、線路(區(qū)段)、牽引質量等更加細化的能耗信息,是管理決策所必需的。
機車牽引能耗不僅受牽引機型、交路任務(列車種類與運行路徑)、牽引質量、運輸組織及氣候條件等客觀因素的影響,同時司機操縱水平和操作技能對能耗也存在較大影響,同列車、同區(qū)段、同機型牽引,不同的司機操縱,能耗也有很大差別,因此通過優(yōu)化司機操縱是一種有效的節(jié)能降耗手段。機車牽引能耗是實時動態(tài)變化的,是各種因素共同作用的結果,對機車能耗信息進行深度挖掘,分析不同運輸條件下能耗變化成因,是促進節(jié)支降耗、精細化管理的重要措施。
針對上述問題,結合機車能耗分析應用需求,從機車能耗信息采集源點著手,利用現(xiàn)有車載監(jiān)測設備對能耗信息進行采集和傳輸,融合并關聯(lián)智能電表數(shù)據(jù)、列車運行數(shù)據(jù)、線路基礎信息等多源異構數(shù)據(jù),運用專業(yè)的數(shù)據(jù)挖掘技術,構建面向運輸生產(chǎn)過程和運輸產(chǎn)品的電力機車牽引能耗分析框架。系統(tǒng)總體架構設計遵循分層設計的思想[5],按照功能劃分成不同的層次,由數(shù)據(jù)預處理層、數(shù)據(jù)存儲層、數(shù)據(jù)挖掘分析層、用戶交互層4部分組成。電力機車牽引能耗數(shù)據(jù)挖掘分析框架如圖1所示。
圖1 電力機車牽引能耗數(shù)據(jù)挖掘分析框架Fig.1 Data mining and analysis framework for traction energy consumption of electric locomotives
(1)數(shù)據(jù)預處理層。根據(jù)數(shù)據(jù)挖掘分析需求,制定數(shù)據(jù)采集標準和流程,對來源不同的智能電表數(shù)據(jù)(正向有功和反向有功等),列車運行監(jiān)控裝置(LKJ)的列車運行數(shù)據(jù)(運行速度、機車號、車次、司機號、車站號、公里標、進出站、編組、牽引質量等),列車控制與監(jiān)視系統(tǒng)(TCMS)的車載微機數(shù)據(jù)(司機操縱、手柄級位等)及線路基礎數(shù)據(jù)(線路號、坡度、區(qū)間等)等進行統(tǒng)一采集,通過車載4G/5G設備進行數(shù)據(jù)實時傳輸或在機車入庫之后以無線局域網(wǎng)(WLAN)的方式進行數(shù)據(jù)轉儲。由于車載裝備采集數(shù)據(jù)存在數(shù)據(jù)不完整、缺失、不一致等問題,需要基于大數(shù)據(jù)的預處理技術進行數(shù)據(jù)清洗、數(shù)據(jù)篩選和數(shù)據(jù)歸并,對不同來源的數(shù)據(jù)進行關聯(lián)和匹配。對于不同的數(shù)據(jù)包括異常值、重復值、缺失值等需要采用相對應的預處理方法。異常值通常是由車載設備損壞或者記錄錯誤造成的,在數(shù)據(jù)預處理過程中需要盡可能剔除這種異常的數(shù)據(jù)。重復值是由于列車處于靜止狀態(tài),機車能耗、速度、里程等重復記錄,按照記錄時間、列車進出站等進行數(shù)據(jù)辨析和篩選。缺失值通常由于部分車載記錄設備故障或傳輸問題導致,可使用平均值、中位數(shù)、眾數(shù)等填充缺失值,或者使用預測值、線性插值等方法進行填充。通過數(shù)據(jù)預處理,達到數(shù)據(jù)的一致性、準確性和完整性,提高機車能耗數(shù)據(jù)分析的精確度。
(2)數(shù)據(jù)存儲層。數(shù)據(jù)倉庫是前端查詢和數(shù)據(jù)分析的基礎,關鍵在于機車能耗數(shù)據(jù)的存儲和管理。針對現(xiàn)有各業(yè)務系統(tǒng)的數(shù)據(jù),進行數(shù)據(jù)抽取、清洗、轉換,并有效集成裝載到數(shù)據(jù)倉庫中,按照業(yè)務主題進行組織,對海量機車能耗數(shù)據(jù)進行存儲和快速檢索,為能耗數(shù)據(jù)挖掘分析提供支撐。
(3)數(shù)據(jù)挖掘分析層。數(shù)據(jù)挖掘分析是針對不同的分析需求,建立不同的模型算法進行數(shù)據(jù)挖掘。根據(jù)數(shù)據(jù)挖掘主題和目標,從海量機車能耗數(shù)據(jù)中通過建立合適的挖掘模型算法(數(shù)理統(tǒng)計、機器學習、深度學習、專家系統(tǒng)等),挖掘出數(shù)據(jù)之間的內在聯(lián)系和潛在規(guī)律,生成數(shù)據(jù)多維分析表,揭示出數(shù)據(jù)之間隱藏的關系、模式或趨勢。
(4)用戶交互層。根據(jù)用戶輸入,返回分析挖掘結果,生成不同角度、不同形式的報告或圖表,以簡單明了、圖形化的方式呈現(xiàn)給終端用戶,提供分時間、線路、區(qū)間、司機、機型等不同指標維度的機車能耗和單耗數(shù)據(jù)測算和分析結果展現(xiàn),為機車操縱提供數(shù)據(jù)支撐和參考依據(jù),同時還可以實時監(jiān)測機車能耗數(shù)據(jù)并對異常狀態(tài)進行預警和提醒。
電力機車牽引能耗數(shù)據(jù)挖掘分析框架重點解決了能耗統(tǒng)計信息采集源點與生產(chǎn)運營過程聯(lián)系不夠緊密、不及時等問題,將能耗數(shù)據(jù)與運輸生產(chǎn)信息進行關聯(lián)整合,提出系統(tǒng)解決方案和方法手段,構建能耗動態(tài)變化與影響因素間完整的邏輯鏈條,可以實現(xiàn)分線路、車次、站間、司機等多維度單耗區(qū)間分布測算,以及單耗、總能耗預測,為能耗精細化分析奠定了基礎。在電力機車牽引能耗數(shù)據(jù)挖掘分析框架的基礎上,進一步可以創(chuàng)建具有能耗數(shù)據(jù)導入、處理、分析、查詢、預警等功能的機車能耗大數(shù)據(jù)分析挖掘平臺,涵蓋數(shù)據(jù)采集、預處理、建模、查詢分析到數(shù)據(jù)可視化的全過程,實現(xiàn)分機型、車次、區(qū)段、線路、司機等的機車能耗查詢對比分析,進一步提升能耗科學管理水平,促進節(jié)支降耗、降本增效。
以京滬線(北京—上海) HXD1D型電力機車擔當?shù)穆每土熊囎鳛閷嵗?,對機車牽引能耗進行分析測算。列車自北京站始發(fā),經(jīng)停天津、滄州、德州、徐州等站,終到上海站,研究區(qū)段范圍為北京—徐州段,線路全長814 km;時間范圍從2020年1月到2020年6月,合計118趟列車的運營數(shù)據(jù)。北京—徐州段分站間機車單耗數(shù)據(jù)情況如表1所示。實例測算將機車能耗數(shù)據(jù)分析細化到任意停站之間,并與司機操縱、牽引質量、列車速度等進行關聯(lián)分析,從平均值、極差、標準差、離散系數(shù)等角度對能耗數(shù)據(jù)進行深度挖掘,便于發(fā)現(xiàn)問題及時預警糾偏,進一步提高能耗分析精度,為司機操縱和節(jié)支降耗提供數(shù)據(jù)參考。
根據(jù)表1,北京—徐州段機車平均單耗163.39 kW·h/ (萬t·km),最小值146.57 kW·h/ (萬t·km),最大值198.70 kW·h/ (萬t·km),極差52.13 kW·h/ (萬t·km),相對極差達到31.9%。機車單耗在均值以上列車趟數(shù)占比44.92%,其中單耗在均值5%以上列車趟數(shù)占比14.41%,單耗在均值0 ~ 5%之間列車趟數(shù)占比30.51%。北京—天津區(qū)間的離散系數(shù)最大,為8.34%,極差也最大,為70.27 kW·h/ (萬t·km),波動幅度最大,具有較大的節(jié)支降耗空間。北京—徐州機車單耗分布圖如圖2所示。機車單耗離散系數(shù)、極差對比圖如圖3所示。
表1 北京—徐州段分站間機車單耗數(shù)據(jù)情況 kW · h / (萬t · km)Tab.1 Locomotive energy consumption for intervals between Beijing and Xuzhou
圖3 機車單耗離散系數(shù)、極差對比圖Fig.3 Comparison of coefficients of variation and ranges of locomotive energy consumption
通過上述分析可以得出京滬線北京—徐州段的機車單耗分布區(qū)間、機車單耗超出平均值的占比以及機車單耗在線路區(qū)段的波動幅度大小,對該線路區(qū)間機車單耗指標和重點降耗區(qū)段的目標設定有重要參考意義,可以為能耗管理工作精細化奠定基礎。
機車單耗按月均值對比如圖4所示,機車單耗按編組均值對比如圖5所示,機車單耗分司機均值對比如圖6所示。從圖4—圖6可知,2020年5月機車單耗均值均高于其他月份,其中北京—徐州區(qū)間2020年5月均值最大,單耗均值174.14 kW·h/ (萬t·km),2020年2月均值最小,單耗均值158.05 kW·h/ (萬t·km),極差16.09 kW·h/ (萬t·km)。12輛編組單耗均值明顯高于14輛、16輛及18輛編組的單耗均值。其中北京—徐州區(qū)間12輛編組均值最大,單耗均值177.88 kW·h/ (萬t·km),16輛編組均值最小,單耗均值158.23 kW·h/ (萬t·km),極差19.65 kW·h/ (萬t·km)。司機05單耗均值均高于其他司機均值,其中北京—徐州區(qū)間司機05均值最大,單耗均值172.39 kW·h/ (萬t·km),司機01均值最小,單耗均值157.60 kW·h/ (萬t·km),極差14.79 kW·h/ (萬t·km)。
圖4 機車單耗按月均值對比Fig.4 Comparison of monthly average locomotive energy consumption
圖5 機車單耗按編組均值對比Fig.5 Comparison of average locomotive energy consumption by marshaling
圖6 機車單耗分司機均值對比Fig.6 Comparison of average locomotive energy consumption by drivers
通過機車單耗按月歷史均值、分編組均值及分司機均值的對比分析,使機車能耗管理精確到各個運行區(qū)間、編組和不同司機,對機車單耗在該線路區(qū)段的季節(jié)性變化、運輸生產(chǎn)過程中的編組計劃及司機的考核評價、規(guī)范操縱提供重要的參考依據(jù)。
機車單耗分司機離散系數(shù)對比如圖7所示,機車單耗分司機箱線圖如圖8所示。從圖7、圖8可知,司機05離散系數(shù)明顯高于其他司機,波動幅度最大。機車單耗與司機操縱關系密切,單耗影響在3% ~ 5%,最大可達8%左右。我國鐵路規(guī)模大、里程長,不同地區(qū)或線路之間的運輸情況各異,列車司機操縱水平不一,并且在進行操縱時存在一定的自主空間,牽引能耗存在很大的節(jié)省空間[6]。篩選出優(yōu)秀司機節(jié)能、平穩(wěn)的記錄數(shù)據(jù),建立深度學習模型,固化手柄級位和優(yōu)化操縱曲線,在滿足安全、準點、舒適等多目標條件的約束下,使列車能耗最低。通過線下培訓和線上實時提醒的方式規(guī)范司機操縱,并可在輔助駕駛、自動駕駛方面進行深入探索和研究。
圖7 機車單耗分司機離散系數(shù)對比Fig.7 Comparison of coefficients of variation of locomotive energy consumption by drivers
圖8 機車單耗分司機箱線圖Fig.8 Boxplot of locomotive energy consumption by drivers
機車能耗與牽引質量曲線擬合圖如圖9所示,北京—徐州段機車能耗預測情況如表2所示。將北京—徐州段的12輛、14輛、16輛、18輛編組的機車能耗與牽引質量進行曲線擬合,得到擬合式:y = 0.019 6 x2- 23.017 x + 16 439,R2達到0.999 8, R2是趨勢線擬合程度的指標,它的數(shù)值大小直接反映趨勢線的估計值與對應的實際數(shù)據(jù)之間的擬合程度,擬合程度越高,趨勢線的可靠性就越高。同時利用趨勢線對13輛、15輛、17輛、19輛編組的機車能耗進行數(shù)據(jù)預測,與實際值進行比較,誤差均在±4%以內,取得較好的預測結果。
圖9 機車能耗與牽引質量曲線擬合圖Fig.9 Curve fitting diagram of locomotive energy consumption and traction weight
表2 北京—徐州段機車能耗預測情況Tab.2 Prediction of locomotive energy consumption between Beijing to Xuzhou
機車瞬時能耗速度曲線圖如圖10所示。選取機車單耗波動幅度最大的司機05,對同一線路、同一區(qū)間、同一車次不同日期的能耗速度曲線進行對比,其中2020年5月3日北京—徐州區(qū)間的單耗為198.70 kW·h/ (萬t·km),2020年5月28日 北京—徐州區(qū)間的單耗156.72 kW·h/ (萬t·km),前者比后者高出27%,可見列車的頻繁加速/制動對能耗影響較大,并且列車在加速段的瞬時能耗明顯高于勻速段的能耗[7]。機車運行能耗影響因素由大到小依次為起停次數(shù)、牽引質量和編組數(shù)量[8],因此應盡量避免列車在運行過程中不必要的起停,按限速、達速、恒速運行。
圖10 機車瞬時能耗速度曲線圖Fig.10 Speed curve of instantaneous locomotive energy consumption
從機車能耗信息采集源點著手,利用車載監(jiān)測設備對能耗信息進行采集和傳輸,結合機車能耗分析應用需求,構建電力機車牽引能耗數(shù)據(jù)挖掘分析框架,通過對京滬線旅客列車機車能耗數(shù)據(jù)的整理、統(tǒng)計和分析,完成分線路、車次、站間、編組、司機等多維度單耗區(qū)間分布特征研究和測算,實現(xiàn)了對能耗數(shù)據(jù)的深度挖掘,滿足了機車能耗管理和運營的信息需求。隨著車載智能裝備的不斷完善,實時監(jiān)測機車能耗數(shù)據(jù)狀態(tài),基于機車能耗分析框架,研發(fā)機車能耗大數(shù)據(jù)分析平臺,引入深度學習、專家系統(tǒng)等技術,通過大數(shù)據(jù)計算分機型、分線路、分區(qū)間機車能耗標準值區(qū)間,依托計算結果開展司機操縱評價、列車平穩(wěn)操縱、輔助/自動駕駛等方面的應用,為機車能耗總量預測、單耗分析、規(guī)范操縱、預算編制、清算結算等提供數(shù)據(jù)和平臺支撐,為機車能耗管理提供更加精細化的服務,不斷提高機車運用效率和運輸服務質量。