陳 誠
(中國鐵道科學研究院集團有限公司 運輸及經(jīng)濟研究所,北京 100081)
隨著供給側結構性改革不斷深化,我國運輸結構與特征發(fā)生快速變化,電子消費品、日用消費品、快速消費品等零散高附加值白貨物流需求增長迅速。隨著國家運輸結構調(diào)整和大氣污染防治等相關政策的推進落實,更多的公路白貨物流需求將轉(zhuǎn)移至鐵路?!鞍棕洝碧刂赋?、石油、焦炭、金屬礦石、鋼鐵、非金屬礦石、磷礦石等大宗貨物之外的品類。從客戶角度分析,白貨品類具有企業(yè)個體物流需求小、運到時限要求高、價格敏感性強等需求特點。從鐵路角度分析,白貨物流需求具有總量需求大、單個城市需求小、運輸方向不平衡等特點。由于城市點對點的白貨物流需求一般無法滿足鐵路貨車成列開行的要求,而通過編組站進行多次車流集結會造成白貨全程運到時效慢、時限不可控,致使鐵路在白貨物流市場缺乏市場競爭力。
近年來,針對鐵路白貨物流需求的研究,主要集中在貨源需求組織的策略和手段方面。鄭平標等[1]提出對于高附加值貨物應通過開發(fā)適應的運輸產(chǎn)品、保障運輸能力、完善客戶管理、制定靈活的運價政策來加強貨源組織;崔德偉等[2]針對鐵路白貨客戶采用的自營、外包和綜合3種物流模式,提出與生產(chǎn)企業(yè)加強合作、建立物流配送中心、加強無軌站建設等相應的白貨運輸對策建議;張玉召等[3]探討由鐵路貨運營銷中心、第三方物流企業(yè)、鐵路和第三方物流企業(yè)形成聯(lián)合體組織貨源等3種模式;楊文曦[4]針對鐵路白貨班列產(chǎn)品在管理模式、組織方式、時效評價等方面的不足,提出班列運到時效精益管理的建議;鞠蓓[5]分析了鐵路白貨運輸運到時限超時的原因,提出運輸組織、合理中轉(zhuǎn)、分接口接車能力等方面的建議;寧榮[6]提出基于聚類算法的區(qū)域運輸網(wǎng)絡分析理論,解決集裝箱辦理站區(qū)域運輸網(wǎng)絡布局不均的問題。目前,從鐵路白貨物流需求現(xiàn)狀出發(fā),有效解決城市鐵路白貨物流需求不足的研究較少。從鐵路物流需求數(shù)據(jù)入手,通過物流需求集聚手段,整合分散的鐵路白貨客戶需求,集零為整,以支撐區(qū)域間白貨物流產(chǎn)品的開發(fā)和運營。
通過分析鐵路白貨物流需求分布可以看出,發(fā)送到達地區(qū)需求量差異明顯,個別區(qū)域間的需求較大,這些條件為鐵路白貨物流需求集聚提供了貨源基礎。此外,中國國家鐵路集團有限公司在全國規(guī)劃了208個鐵路一級、二級物流基地,其中一級物流基地33個,服務于國家級流通節(jié)點城市,二級物流基地175個,服務于區(qū)域級流通節(jié)點城市,物流基地基本覆蓋周圍區(qū)域的白貨物流需求。截至2019年4月底,鐵路物流基地已建成136個,其中一級29個、二級107個。物流基地的建成運營,為白貨物流需求集聚提供了重要載體。鐵路班列化的運輸組織模式,同普通貨車編組集結的模式相比,具有明顯的時效優(yōu)勢,速度標尺160 km/h的班列干線旅速能達到100 km/h,速度標尺120 km/h的班列干線旅速能達到60 km/h,遠遠高于編組貨物列車的平均旅速,與公路運輸相比具有一定競爭力,能夠進一步吸引公路貨源。因此,以鐵路物流基地作為兩端物流需求的集聚載體,組織開行大節(jié)點間班列化的白貨列車,能夠有效壓縮全程時效,保持穩(wěn)定的時限,解決目前白貨物流時限過長且不穩(wěn)定的弊端,滿足白貨客戶的物流需求,因而提出基于K-means算法的鐵路白貨物流需求集聚方法,為鐵路白貨列車班列化開行提供有效的理論支撐。
聚類是一種無監(jiān)督學習的方法,其實質(zhì)是依據(jù)某種距離度量,把相似的對象放入同一集聚群中,把不相似的對象放到不同的集聚群中。聚類與分類不同,聚類不依賴預先定義的類或帶類標記的訓練實例,需要由聚類學習算法自動確定標記。聚類是觀察式學習而不是示例式學習,它是從數(shù)據(jù)集中尋找數(shù)據(jù)之間的關系,使得同一類數(shù)據(jù)之間盡可能的相似,不同類別的數(shù)據(jù)最大化可能的相異,從而發(fā)現(xiàn)數(shù)據(jù)之間隱藏的有規(guī)律的信息[7]。聚類分析算法有劃分法、系統(tǒng)聚類法、密度法、網(wǎng)格法、模型法、孤立點法、模糊分析法等。在處理大量的非空間數(shù)據(jù)對象時,劃分法中的K-means算法能夠快速收斂,是最常用的方法。
K-means算法是一種基于劃分的聚類算法,K代表集聚群個數(shù),means代表集聚群內(nèi)數(shù)據(jù)對象的均值,通過設置不同的K值,來聚集距離較近的集聚群。K-means算法以距離作為數(shù)據(jù)對象間相似性度量的標準,即數(shù)據(jù)對象間的距離越小,則它們的相似性越高,越有可能在同一個集聚群。數(shù)據(jù)對象間距離的計算有很多種,通常采用歐氏距離來計算數(shù)據(jù)對象間的距離。歐式距離的計算公式可表示為
式中:distance(xi,xj)為第i個對象和第j個對象兩點之間的歐氏距離,xi,xj分別為第i個和第j個數(shù)據(jù)對象;D為數(shù)據(jù)對象的屬性個數(shù);xi,d,xj,d分別為第i個對象和第j個對象在屬性d上的值。
K-means算法根據(jù)預先設定的k值將樣本分為k個群,每個群的均值用μk來表示,這些均值被看作每個群的中心。K-means算法的目的是要找到k個群中心,使得每個樣本離集聚中心的歐式距離的平方誤差之和最小,可表示為
式中:J表示樣本離集聚中心的歐式距離的平方誤差之和;N表示樣本總數(shù);K表示集聚群的個數(shù);rnk表示第n個樣本是否在第k個集聚群內(nèi),若在則為1,反之為0;xn表示第n個樣本點;μk表示第k個集聚群的中心;Ck表示第k個集聚群的樣本集合表示第k個樣本群中的第i個樣本點。
K-means聚類算法是首先隨機選取k個評價對象作為模型的初始聚類中心,然后依次計算每個對象與各聚類中心之間的空間距離,依據(jù)每個對象與各個聚類中心之間的距離,將所有對象分配給距離其最近的聚類中心。每個聚類中心及分配給其的聚類對象分別代表一個集聚群。當全部聚類對象都被分配完畢后,表示一次計算結束,每個聚類的聚類中心由已經(jīng)聚類分配的現(xiàn)有對象被重新計算。重復迭代此過程,直到達到最大迭代次數(shù),或者兩次迭代的差值小于某一閾值時,迭代終止,得到最終聚類結果[8-9]。K-means算法聚類流程圖如圖1所示。
圖1 K-means算法聚類流程圖Fig.1 K-means clustering algorithm flow chart
以K-means算法聚類為核心,搭建鐵路白貨物流需求集聚模型,模型搭建思路如下。①確定集聚的基本單元。鐵路日常以鐵路局集團公司、站段、車站為管理單位,貨票上的貨物始發(fā)終到位置信息體現(xiàn)為所屬的站段和車站。如果以車站為基本單元進行物流需求聚類,由于辦理白貨業(yè)務的車站有2000多個,會形成2000多個發(fā)到站之間的需求OD矩陣,數(shù)據(jù)復雜,并且部分車站名稱較為生僻,聚類結果直觀性不強。因此,提出以城市為物流需求集聚的基本單元,有效簡化了數(shù)據(jù),同時提高結果的直觀性。②利用聚類算法將相鄰城市合并為一個城市群,合并城市需求,形成城市群之間的OD需求。③通過設定城市間距離和需求量,篩選出符合條件的城市群間的白貨品類流動的主要方向。
鐵路白貨物流需求集聚的具體流程可以分為數(shù)據(jù)采集、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)聚類和結果輸出4個步驟,具體如下。
(1)數(shù)據(jù)采集。①采集鐵路物流需求數(shù)據(jù)。從貨票信息中選取了物流需求聚類需要的核心信息,得到每單貨票的貨物品類、發(fā)送噸數(shù)、發(fā)站、到站等信息。②采集城市的位置信息。通過調(diào)用網(wǎng)絡上公開的經(jīng)緯度查詢接口來獲取全國城市的經(jīng)緯度。
(2)數(shù)據(jù)轉(zhuǎn)換。①建立車站與城市的對應關系。通過查詢車站信息,同時比對鐵路貨運站分布圖,明確每個車站所在的省份和城市,將貨票上基于車站的貨物信息轉(zhuǎn)化為基于城市的貨物信息。②建立城市間的物流需求流向表。將同屬于一個城市的多個車站需求數(shù)據(jù)匯總,得到城市的鐵路物流需求。將貨票運量信息按照發(fā)送城市、到達城市和品類匯總統(tǒng)計,使得同一個城市多個車站的物流需求數(shù)據(jù)合并,得到以城市為基本單元的物流需求信息,進而建立城市間的物流需求信息表。
(3)建立基于城市群的物流需求流向表。結合之前采集到的到的城市經(jīng)緯度信息,可以得到城市間的距離。按照K-means聚類算法要求,設定k個聚類群,通過迭代計算,整合相鄰城市的物流需求,將全國劃分為k個城市群,形成k個城市群之間的鐵路物流需求,總計條物流需求線路。
鐵路白貨物流需求集聚流程圖如圖2所示。
在鐵路白貨貨源集聚問題中,將城市的經(jīng)緯度作為位置信息輸入,選取2017年全路車站白貨業(yè)務運量數(shù)據(jù)作為物流需求數(shù)據(jù)輸入,設定城市群數(shù)量為50,應用SPSS數(shù)據(jù)分析軟件嵌套的K-means聚類算法對貨運數(shù)據(jù)進行自動化聚類分析。為了進一步得到有效的白貨貨源集聚的城市群對,增加篩選條件,發(fā)送城市群至到達城市群總噸數(shù)大于100萬t且運輸距離大于800 km,符合篩選條件的白貨運輸城市群如表1所示。發(fā)送主要集中在東北、內(nèi)蒙、華北等區(qū)域,到達主要集中在東北、西南等區(qū)域。鐵路可以考慮在這些方向上重點組織開發(fā)白貨運輸產(chǎn)品。
圖2 鐵路白貨物流需求集聚流程圖Fig.2 Flow chart of demand agglomeration of railway white goods logistics
基于城市群的白貨貨源整列運輸,有效壓縮了干線運輸時間。以黑龍江東部至遼寧西部線路為例,2個城市群中心城市距離約1200 km,120 km/h標尺快速列車平均時速60 km/h,鐵路干線運輸時間約20 h,兩端群內(nèi)城市對各自中心城市的最遠距離取350 km,公路運輸時間各約6 h,公路至鐵路的短倒裝卸作業(yè)時間取4 h,綜合以上全程運輸時間最大為40 h。采用普通貨車運輸方式,按鐵路貨物運輸平均時速10 ~ 20 km/h計算,鐵路運輸需要60 ~ 120 h,加上兩端短倒裝卸各4 h,全程運輸68 ~ 128 h。可見,采用貨源集聚后,運到時限大幅縮短,同時通過班列化開行,時效穩(wěn)定性得以保障。該線路班列開行,雖然增加了城市到中心城市貨源集聚環(huán)節(jié)的費用,但通過集中分撥配送,能夠有效降低短途運輸成本,全程費用增加極為有限,且考慮到運到時限的大幅提高,抵消了費用增長帶來的影響,運輸綜合質(zhì)量明顯提高。
表1 符合篩選條件的白貨運輸城市群Tab.1 White goods transportation city clusters meeting the screening conditions
白貨物流需求集聚后,為鐵路長距離白貨運輸指明了線路方向和貨源基礎。要真正實現(xiàn)穩(wěn)定的白貨整列運輸,還需要進一步考慮適合的品類和開行時段,選擇適宜的裝載車輛和物流基地,考慮客戶對價格的承受能力,制訂貨源組織方案,為開發(fā)高質(zhì)量白貨班列提供保障。
(1)貨源季節(jié)波動。部分白貨的物流需求隨季節(jié)變化比較明顯,細致分析貨源在不同時間段的發(fā)送運量分布,是合理制定、調(diào)整運輸計劃的基礎,有利于保障貨運列車的裝載率。
(2)裝載車輛要求。白貨貨源對裝載車輛的要求各不相同,部分適用于集裝箱運輸,部分適用于棚車運輸。由于目前120 km/h標尺的棚車和集裝箱不能混編運行,因而需要對貨源進行篩選,形成單一的快速棚車列車或快速集裝箱列車。
(3)物流基地能力。根據(jù)中國國家鐵路集團有限公司發(fā)展鐵路物流基地的思路,物流基地主要承擔白貨的“運倉配”業(yè)務,因而白貨貨運班列兩端發(fā)到主要依靠物流基地。在選中的城市群中,選擇地理位置離主要貨源地較近、具備整列開行能力、設施設備條件良好、集疏運便捷的物流基地作為發(fā)到兩端的作業(yè)場所。
(4)全程物流質(zhì)量比選。物流需求集聚在兩端增加了集聚的作業(yè)環(huán)節(jié),導致物流費用有所增加,因而需要全面權衡全程物流費用與時效的變化,按照客戶的反饋篩選出對運輸時效要求較高的貨源,根據(jù)需求規(guī)模合理制定開行方案。同時考慮在開行初期對遠距離集聚的貨源進行補貼,鼓勵客戶選擇班列化的貨運產(chǎn)品。
(5)貨源組織能力。貨源統(tǒng)一集聚在物流基地,發(fā)到兩端均增加了物流基地至企業(yè)倉庫、轉(zhuǎn)運中心的短駁運輸環(huán)節(jié)。要加強與優(yōu)質(zhì)社會物流企業(yè)的合作,發(fā)揮公路靈活便捷的優(yōu)勢,通過公路運輸提高貨源集聚的效率,減少環(huán)節(jié)增加帶來的影響。
隨著國家產(chǎn)業(yè)布局優(yōu)化、能源結構調(diào)整,煤炭為代表的大宗貨物運輸需求增長幅度有限,未來鐵路增量將更多依賴提高鐵路在白貨物流市場的份額。通過K-means聚類算法實現(xiàn)基于城市群的鐵路白貨物流需求集聚,有利于鐵路組織開行點對點開行白貨班列,有效壓縮全程運到時效,提高貨運產(chǎn)品服務質(zhì)量,進而提高產(chǎn)品的市場競爭力,吸引更多的公路物流需求轉(zhuǎn)向鐵路,由鐵路主要負責大節(jié)點的干線運輸,公路負責兩端近距離的分撥和“最后一公里”的配送,充分發(fā)揮各種交通方式的優(yōu)勢,實現(xiàn)各種交通方式合理分工,促進各種交通方式的融合發(fā)展[10]。