摘要:現如今隨著油價和人員工資的不斷上漲,運輸成本的不斷提高,郵政運輸也迫切需要改進運輸方式以降低運輸成本。如何對郵政系統(tǒng)現有的海量數據進行分析,從中找出最佳的郵路管理方案,成為郵政實物網區(qū)內網運費分析系統(tǒng)的最終目標。本文討論了如何結合數據挖掘技術,對郵政已有的實物網和信息網進行分析,增強系統(tǒng)分析能力,減少不必要的人員、場地和車輛,達到更好的企業(yè)效益。
關鍵詞:數據挖掘;郵政;實物網;運費分析
1 引言
目前郵政運輸網運費用主要包括兩個方面,一方面為占用一級、二級干線實物網資源的費用,另一方面為占用區(qū)內實物網資源的費用。目前,全國已實現一級干線郵路運費的結算,我省已實現二干郵路運費的結算。
隨著郵政信息化的不斷發(fā)展,電子化支局系統(tǒng)、速遞綜合信息系統(tǒng)、中心局兩個子系統(tǒng)以及兩網互通工程的建設先后完成,郵政已經實現了收寄、運輸、處理、運輸、投遞的閉環(huán)處理的實物流與信息流合而為一。但在區(qū)內實物網費用的分析管理方面幾乎是一片空白,現在區(qū)內實物網資源使用方面尚未建立科學的結算體系,主要通過成本/工作量推算的辦法實行實物網相關費用的分攤,分析、管理過程缺少數據基礎和科學的管理辦法。首先,各實物網資源使用單位網路成本意識較淡薄,對實物網的高效運行十分不利;其次,缺少從成本角度對實物網運行效率進行分析的手段,不利于實物網郵路的持續(xù)優(yōu)化。
2 數據挖掘技術
數據挖掘是指從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中自動抽取隱藏在數據中的隱含在其中的、人們事先不知道的、但又是潛在有用信息的非平凡過程,這些信息的表現形式為:規(guī)則、概念、規(guī)律及模式等。它可幫助決策者分析歷史數據及當前數據,并從中發(fā)現隱藏的關系和模式,進而預測未來可能發(fā)生的行為。數據挖掘作為一種新的商業(yè)信息處理技術, 其主要特點是對商業(yè)數據庫中的大量業(yè)務數據進行抽取、轉換、分析和其他模型化處理, 從中提取輔助商業(yè)決策的關鍵性數據。簡而言之, 數據挖掘其實是一類深層次的數據分析方法。
因此, 數據挖掘可以描述為: 按企業(yè)既定業(yè)務目標, 對大量的企業(yè)數據進行探索和分析, 揭示隱藏的、未知的或驗證已知的規(guī)律性, 并進一步將其模型化的先進有效的方法。
3 研究方案
郵政實物網區(qū)內網運費分析系統(tǒng)以集團公司、省公司一級干線、二級干線的結算管理辦法為基礎,結合我局全區(qū)網運費用的管理現狀,主要從增強實物網網運成本觀念,促進區(qū)內實物網郵路的持續(xù)優(yōu)化兩個方面,充分挖掘中心局兩個子系統(tǒng)的交易數據,充分利用數據分析的相關手段,對全區(qū)實物網網運費用情況進行分析,實現對業(yè)務部門、郵件種類的實物網資源占用情況進行分析,對每條郵路的成本情況進行分析等,以達到輔助決策的目的。
分析實物網的三個關鍵要素:量、能、效。量直接反映實物網的資源使用狀況,實物網轉運的郵件量將影響實物網運能建設;能就是實物網運能,反映實物網轉運能力;效就是實物網的效益,反映實物網的成本情況。郵政實物網區(qū)內網運費分析系統(tǒng)從實物網郵件量的分析入手,為實物網能力建設提供決策依據。從實物網成本分析入手,為業(yè)務發(fā)展的結構優(yōu)化提供決策依據。
4 采用數據挖掘技術的郵政區(qū)內網運費分析系統(tǒng)架構
集團客戶管理系統(tǒng)根據其功能特征主要分為接口層、中間層和表現層, 其結構如圖1 所示。
4.1 接口層
接口層主要負責從中心局子系統(tǒng)數據庫、國家省結算數據庫、中心局運營成本數據庫和郵路運營成本數據庫中抽取與郵路相關的數據, 通過轉換和分析, 以既定的格式存儲到數據倉庫中, 為數據分析提供基礎數據。主要需要提取的資料包括一干結算數據、二干結算數據、中心子系統(tǒng)每日總包明細數據、郵路運行成本明細數據、中心局每月運營成本數據等。
4.2 中間層
中間層主要對數據倉庫中的數據進行分析和處理, 采用聯機分析處理(OLAP) 工具, 通過多維的方式對數據進行分析、查詢和生成報表, 在龐大的數據倉庫中檢索出具有一定規(guī)律性的東西, 它是實現郵政實物網區(qū)內網運費分析系統(tǒng)數據分析功能模塊最重要的一部分。
4.3 表現層
表現層主要實現數據統(tǒng)計、數據分析結果展現等功能。該層面主要面向管理決策層和財務人員, 其表現形式必須簡單易用, 因此, 其實現方式主要采用Web 服務器模式, 管理決策層和財務人員通過IE 瀏覽器登錄系統(tǒng)就可以使用。
5 系統(tǒng)功能及實現
5.1 數據統(tǒng)計功能模塊
市縣中心實物網處理能力測算:將實物網處理能力進行量化,便于實現與網路負載進行對比分析。對各中心處理環(huán)節(jié)的關鍵節(jié)點的處理能力進行人工估算(最大處理能力理論應為MIN(各節(jié)點最大處理能力)),科學情況應達到在該中心最大處理能力下,每個處理環(huán)節(jié)無瓶頸,影響因素主要包括人員、臺席、場地等。
全區(qū)郵路最大負載能力測算:將實物網郵路的負載能力進行量化,便于實現與網路負載進行對比分析。對每條郵路的負載能力進行人工估算,影響因素主要包括車輛荷載等。
5.2 數據分析功能模塊
各市縣局處理中心負載分析,進行最合理的設備、人員場地的配置;郵路負載分析,進行合適的車型配置和運輸班次,優(yōu)化運輸路線;負載預警,根據每日郵路的負載趨勢,當將會出現超過實際運輸能力的情況時,及時安排加班郵路,確保郵路的正常運行;實物網成本分析,給前臺郵件收費定價提供參考標準;不同業(yè)務種類平均成本趨勢分析,對不同的業(yè)務種類進行不同的定價,對前景和效益好的業(yè)務重點發(fā)展。
結束語
在郵政實物網區(qū)內網運費分析系統(tǒng)中應用數據挖掘技術, 實現了聯機分析的功能, 為郵政運營管理提供了策略決策依據。在實際運行中, 該系統(tǒng)對降低郵政運輸成本、減少不必要的場地和人員投入、制定業(yè)務推廣方案等方面都能起到很好作用, 改變了以往被動的郵路運輸的狀況, 為郵政企業(yè)的更好發(fā)展提供了依據。
參考文獻
[1]羅可,蔡碧野.數據挖掘及其發(fā)展研究[J]計算機工程與應用,2002
[2]趙丹群.數據挖掘:原理、方法及其應用[J]現代圖書情報技術,2000
[3]金從力.上市公司財務數據多維聯機分析設計[D]上海海事大學,2003
[4]李亞巍.數據倉庫與數據挖掘在機組運行數據分析中的應用[D]華北電力大學(北京),2006
[5]張蓉.數據倉庫與數據挖掘技術在銀行客戶關系管理(CRM)系統(tǒng)中的應用[J]計算機與信息技術,2006,(07) 。
[6]Agrawal J, et al. Automatic subspace clustering of high dimensional data mining applications .Proc. ACM SIGMOD Inter'l Conf. Management of Data. 1998, pages73~84