周鵬程、張舒君
鐵路客運(yùn)在我國(guó)交通體系中占據(jù)重要地位,其運(yùn)輸里程綜合規(guī)模均為世界之最。當(dāng)下階段,信息化技術(shù)對(duì)于鐵路客運(yùn)的運(yùn)營(yíng)效率有著舉足輕重的作用,12306 客票預(yù)訂系統(tǒng)已被乘客普遍認(rèn)可和使用。如今,廣大民眾出行,已經(jīng)習(xí)慣采用手機(jī)軟件預(yù)定車票,憑身份證刷卡進(jìn)站完成乘車。與普通票相比,學(xué)生票的認(rèn)證仍然依賴傳統(tǒng)的優(yōu)惠磁卡,記錄身份信息和優(yōu)惠信息。
目前,火車優(yōu)惠卡,主要適用的對(duì)象包括普通大學(xué)、大專院校、中等專業(yè)、技工學(xué)校在內(nèi)的在校學(xué)生,用于購(gòu)買固定區(qū)間的優(yōu)惠價(jià)火車票。火車票的優(yōu)惠時(shí)段為寒暑假的固定時(shí)間段,每年四次。除去休學(xué)、退學(xué)、未注冊(cè)等特殊情況,在校生均可享受優(yōu)惠。
學(xué)生票作為客票的一種類型,其購(gòu)票過(guò)程也可在12306 上完成,但其信息采集過(guò)程仍然延續(xù)傳統(tǒng)的模式。雖然,集成電路芯片做成的磁卡穩(wěn)定性高、體積小,防偽性能不錯(cuò);但是隨著鐵路運(yùn)輸信息化的發(fā)展,該方法存在一些弊端,主要集中在兩個(gè)方面:第一,學(xué)校搜集學(xué)生信息需依賴人力,由各個(gè)部門分批次逐一搜集學(xué)生的身份信息、乘車區(qū)間信息,工作量較大。第二,核驗(yàn)階段煩瑣,目前鐵路運(yùn)輸已全面進(jìn)行電子客票推廣,原先采用的取票模式與電子客票的推廣理念不符。因此,學(xué)生票的數(shù)據(jù)采集過(guò)程以及傳統(tǒng)的取票、檢票流程亟須進(jìn)行流程變更和技術(shù)更新。
針對(duì)學(xué)生票的研究集中在學(xué)生票的預(yù)訂、網(wǎng)上訂票、學(xué)生群體訂票等方面。通過(guò)信息系統(tǒng)進(jìn)行售票,該方案起源歐美,英國(guó)在20世紀(jì)70年底就提供了相關(guān)的信息系統(tǒng)對(duì)運(yùn)輸客車的時(shí)刻進(jìn)行管理,并提供車票預(yù)定、多類型車票發(fā)售等功能。德國(guó)的鐵路運(yùn)輸系統(tǒng)也較早進(jìn)入成熟運(yùn)營(yíng)階段,德國(guó)研發(fā)的車輛技術(shù)先進(jìn),由德國(guó)提供技術(shù)的鐵路運(yùn)輸車輛遍布各國(guó),其提供的訂票系統(tǒng):Trains,也在世界各國(guó)被廣泛使用。我國(guó)則到21世紀(jì)才開(kāi)始著力發(fā)展屬于中國(guó)的在線訂票系統(tǒng),并在短短幾年取得較大進(jìn)步。我國(guó)鐵路系統(tǒng)自推出12306 訂票軟件以來(lái),購(gòu)票服務(wù)效率得到極大提升,鐵路部門的相關(guān)服務(wù)種類也越來(lái)越豐富,12306 軟件本身則逐步完善功能,先后具備了候補(bǔ)選票、自助選座等功能,同時(shí)提供了多樣化的支付方式。2019年以來(lái),鐵路部門開(kāi)始推廣電子客票,乘客乘車不再依賴紙質(zhì)車票,而是可以選擇通過(guò)手機(jī)端的二維碼或身份證,檢驗(yàn)進(jìn)站。針對(duì)我國(guó)售票系統(tǒng)的信息化發(fā)展,學(xué)者們對(duì)學(xué)生票的訂票方式、數(shù)據(jù)采集流程等也進(jìn)行了進(jìn)一步的研究。王慧晶通過(guò)運(yùn)用啟發(fā)式算法,根據(jù)各種優(yōu)化目標(biāo)和限制條件構(gòu)建自動(dòng)分配學(xué)生票的數(shù)學(xué)模型,實(shí)現(xiàn)車站學(xué)生票預(yù)訂信息處理的整體最優(yōu)。屈驍勇提出一種基于中國(guó)高等教育學(xué)生信息網(wǎng),進(jìn)行學(xué)生身份核驗(yàn)的業(yè)務(wù)流程再造方案,以替代基于優(yōu)惠磁卡進(jìn)行學(xué)生身份核驗(yàn)的業(yè)務(wù)流程。蔣曉濤提出取消現(xiàn)行的優(yōu)惠卡,建議借助互聯(lián)網(wǎng)進(jìn)行前置檢驗(yàn)學(xué)生票優(yōu)惠方案是否滿足,借助教育部學(xué)生信息網(wǎng)完成檢驗(yàn)。此方法將不再依賴磁卡讀取器、磁卡等設(shè)備,大大縮減了成本支出[1]。
綜上,可以看出學(xué)生票的信息采集模式較為落后,其采集信息的流程對(duì)人力、成本等消耗較多。目前的研究雖然對(duì)學(xué)生票信息采集流程、核驗(yàn)方式進(jìn)行了探討,但對(duì)于信息采集具體模式開(kāi)展還不夠深入。本文將基于數(shù)據(jù)挖掘技術(shù),對(duì)學(xué)生票的信息采集過(guò)程以及學(xué)生票的購(gòu)票業(yè)務(wù)優(yōu)化進(jìn)行研究[2]。
為滿足學(xué)生票相關(guān)信息數(shù)據(jù)的采集,需有數(shù)據(jù)接口與12306 訂票系統(tǒng)中的個(gè)人身份信息進(jìn)行補(bǔ)充和實(shí)時(shí)更新,方可滿足購(gòu)票即核驗(yàn)和出票。前文提到相關(guān)學(xué)者建議借助學(xué)信網(wǎng)進(jìn)行信息核驗(yàn),但是學(xué)信網(wǎng)雖具備在校學(xué)生的基本信息,但學(xué)信網(wǎng)中的學(xué)生信息的更新并非實(shí)時(shí)完成,數(shù)據(jù)存在較大延遲,同時(shí)學(xué)生的乘車區(qū)間數(shù)據(jù)無(wú)法從學(xué)信網(wǎng)中獲取。因此,針對(duì)學(xué)生票的信息采集業(yè)務(wù),可借助學(xué)生票業(yè)務(wù)數(shù)據(jù)平臺(tái),依托互聯(lián)網(wǎng)獲取各個(gè)高校的相關(guān)數(shù)據(jù),可從各個(gè)高校的教務(wù)系統(tǒng)等業(yè)務(wù)系統(tǒng)中獲取[3]。
學(xué)生票業(yè)務(wù)數(shù)據(jù)平臺(tái),旨在建設(shè)一種高可用、高安全、高性能、易管理的公用技術(shù)支撐環(huán)境。借助學(xué)生票業(yè)務(wù)數(shù)據(jù)平臺(tái)中的數(shù)據(jù)中心的數(shù)據(jù),可完成學(xué)生票的身份核驗(yàn)前置,以達(dá)到目前學(xué)生票業(yè)務(wù)流程的優(yōu)化。從學(xué)生票的信息來(lái)源單位出發(fā),結(jié)合目前鐵路部門的購(gòu)票信息系統(tǒng)做現(xiàn)狀分析及診斷,結(jié)合已有應(yīng)用系統(tǒng),規(guī)劃設(shè)計(jì)公用技術(shù)支撐環(huán)境,并基于一定的應(yīng)用場(chǎng)景前瞻,部署合理的學(xué)生票業(yè)務(wù)數(shù)據(jù)平臺(tái)。一旦學(xué)生票業(yè)務(wù)數(shù)據(jù)平臺(tái)建成,就可完成學(xué)生票中的信息匯集,簡(jiǎn)化原有流程,12306 訂票系統(tǒng)以及其他相關(guān)的業(yè)務(wù)系統(tǒng)產(chǎn)生的業(yè)務(wù)數(shù)據(jù),將更具有價(jià)值[4]。
構(gòu)建學(xué)生票業(yè)務(wù)數(shù)據(jù)平臺(tái),應(yīng)從數(shù)據(jù)安全、系統(tǒng)整合、災(zāi)難備份為出發(fā)點(diǎn),學(xué)生個(gè)人信息和乘車區(qū)間信息均為敏感信息,各個(gè)學(xué)校信息化建設(shè)程度也不同,基于此,可以以范本的形式對(duì)各個(gè)打算參與輸出數(shù)據(jù)的學(xué)校單位發(fā)出標(biāo)準(zhǔn),具備數(shù)據(jù)安全條件的單位可接入數(shù)據(jù)處理中心。數(shù)據(jù)處理中心除了部署系統(tǒng)架構(gòu)外,還需具備災(zāi)難備份的功能,該備份中心可與原有12306 系統(tǒng)等信息化系統(tǒng)公用,以達(dá)最大化應(yīng)用。學(xué)生票業(yè)務(wù)數(shù)據(jù)處理中心的設(shè)計(jì)架構(gòu),如圖1所示。
數(shù)據(jù)采集方面,將不再由學(xué)校內(nèi)各個(gè)部門統(tǒng)計(jì)表格。而是由學(xué)校的信息化系統(tǒng)生成初始信息,建議該業(yè)務(wù)系統(tǒng)數(shù)據(jù)源從各個(gè)學(xué)校的教務(wù)系統(tǒng)中獲取,因?yàn)榻虅?wù)系統(tǒng)內(nèi)具備準(zhǔn)確的學(xué)生個(gè)人信息以及學(xué)籍信息,這兩大信息是學(xué)生票業(yè)務(wù)的基礎(chǔ)數(shù)據(jù)。各學(xué)校的教務(wù)平臺(tái),生成初始表格,于每年規(guī)定的時(shí)間提醒學(xué)生登錄確認(rèn)學(xué)生票優(yōu)惠信息,學(xué)生可對(duì)生成的信息發(fā)出變更申請(qǐng),可由業(yè)務(wù)管理員進(jìn)行審核,完成更新。學(xué)生確認(rèn)信息后,學(xué)生票的基本信息以數(shù)據(jù)包的形式通過(guò)網(wǎng)絡(luò),傳輸?shù)借F路部門的學(xué)生票業(yè)務(wù)數(shù)據(jù)平臺(tái)。該平臺(tái)包括數(shù)據(jù)中心、集成平臺(tái)、票務(wù)門戶、統(tǒng)一身份和訪問(wèn)管理四個(gè)組塊,通過(guò)這個(gè)四個(gè)組塊對(duì)學(xué)生票各項(xiàng)業(yè)務(wù)進(jìn)行數(shù)據(jù)整合及業(yè)務(wù)互通,如圖2所示。
學(xué)生票相關(guān)的數(shù)據(jù),來(lái)源于各個(gè)學(xué)校不同的信息系統(tǒng),其數(shù)據(jù)還需在數(shù)據(jù)平臺(tái)中完成數(shù)據(jù)處理。從前瞻性考慮,數(shù)據(jù)平臺(tái)除了現(xiàn)有學(xué)生票的基本信息,還可從12306 訂票軟件等多個(gè)其他業(yè)務(wù)系統(tǒng)中采集業(yè)務(wù)數(shù)據(jù),包含學(xué)生購(gòu)票情況、車次的時(shí)序與區(qū)間信息等,以便對(duì)學(xué)生票業(yè)務(wù)進(jìn)行多維度分析。基于此,將采集的所有數(shù)據(jù)分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。在結(jié)構(gòu)化的數(shù)據(jù)中,學(xué)校端口采集的基本信息和12306 中注冊(cè)產(chǎn)生的基本信息,是最容易產(chǎn)生數(shù)據(jù)一致性問(wèn)題的一類數(shù)據(jù),需由單獨(dú)的管控機(jī)制對(duì)其進(jìn)行管理;結(jié)構(gòu)化的數(shù)據(jù)中還存在實(shí)時(shí)數(shù)據(jù)和非實(shí)時(shí)數(shù)據(jù),其中許多實(shí)時(shí)數(shù)據(jù)主要是分級(jí)、秒級(jí)數(shù)據(jù),例如學(xué)生登陸次數(shù)、某一趟列車被查詢次數(shù)等;此類數(shù)據(jù)內(nèi)容簡(jiǎn)單,但量級(jí)很大,在數(shù)據(jù)平臺(tái)中應(yīng)實(shí)施合適存儲(chǔ)方案,在效率和全面性之前取得平衡。而非實(shí)時(shí)數(shù)據(jù)包括學(xué)生信息、購(gòu)票記錄等,此類數(shù)據(jù)明確,數(shù)據(jù)量級(jí)的可預(yù)測(cè)性高,此類數(shù)據(jù)可用作火車票合理分配的數(shù)據(jù)參考,滿足學(xué)生在不同的時(shí)間段、最大概率購(gòu)得目標(biāo)車票。非結(jié)構(gòu)化的數(shù)據(jù)諸如地理信息、設(shè)備模型等,可用于空間維度的分析與應(yīng)用[5]。
原始數(shù)據(jù)被集成平臺(tái)采集后,來(lái)自不同數(shù)據(jù)庫(kù)的相同業(yè)務(wù)類型的數(shù)據(jù),匯集在一起,形成集成視圖,存儲(chǔ)于數(shù)據(jù)操作層。這一層級(jí)中,可開(kāi)辟緩沖區(qū)臨時(shí)存儲(chǔ)由業(yè)務(wù)應(yīng)用提供的源數(shù)據(jù),作為數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)來(lái)源的一部分。該部分?jǐn)?shù)據(jù)進(jìn)行抽取和轉(zhuǎn)化,有效數(shù)據(jù)將被收集在數(shù)據(jù)倉(cāng)庫(kù)中,數(shù)據(jù)倉(cāng)庫(kù)包含相對(duì)穩(wěn)定的數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)模型,支撐大部分學(xué)生票系統(tǒng)的關(guān)聯(lián)應(yīng)用。這些數(shù)據(jù)按主題存放,存放數(shù)據(jù)及歷史信息。在數(shù)據(jù)倉(cāng)庫(kù)中,學(xué)生票相關(guān)的各類業(yè)務(wù)將被按主題分類;此時(shí)的數(shù)據(jù),不管是高校系統(tǒng)中獲取來(lái)的信息數(shù)據(jù),還是網(wǎng)上購(gòu)票系統(tǒng)的購(gòu)票記錄,都可以轉(zhuǎn)化為高度集成、高質(zhì)量的標(biāo)準(zhǔn)數(shù)據(jù),并且數(shù)據(jù)將按一定頻率更新。至此,數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)已經(jīng)是標(biāo)準(zhǔn)的,易用的[6]。
針對(duì)某個(gè)主題域、部門或用戶分類的數(shù)據(jù)集合,經(jīng)過(guò)再次匯總、轉(zhuǎn)化后,形成可滿足用戶快速訪問(wèn)的數(shù)據(jù),在數(shù)據(jù)集市中進(jìn)行呈現(xiàn)。數(shù)據(jù)集市的建設(shè)由業(yè)務(wù)需求驅(qū)動(dòng)而形成,因此,數(shù)據(jù)集市的開(kāi)發(fā)一般是迭代開(kāi)發(fā)的過(guò)程。其處理過(guò)程如圖3所示。
通過(guò)建設(shè)學(xué)生票業(yè)務(wù)數(shù)據(jù)平臺(tái),優(yōu)化了原有的學(xué)生票相關(guān)業(yè)務(wù)流程,節(jié)省了成本。數(shù)據(jù)平臺(tái)的搭建,將學(xué)生票相關(guān)業(yè)務(wù)數(shù)據(jù)進(jìn)行集中管理,運(yùn)用數(shù)據(jù)挖掘技術(shù),各類業(yè)務(wù)數(shù)據(jù)按需重新分類,并進(jìn)行可視化的呈現(xiàn),為學(xué)生票業(yè)務(wù)提供了有效的決策依據(jù)。學(xué)生票業(yè)務(wù)數(shù)據(jù)平臺(tái)可提供多協(xié)議接入、消息路由、消息映射、集成監(jiān)控和安全等功能,滿足應(yīng)用間的互聯(lián)互通需求,實(shí)現(xiàn)松耦合的應(yīng)用集成。除12306 軟件外,諸多業(yè)務(wù)系統(tǒng)數(shù)據(jù)得到有效交互,數(shù)據(jù)集成平臺(tái)對(duì)學(xué)生票相關(guān)信息實(shí)行端到端、全過(guò)程的追蹤、運(yùn)行和預(yù)警。
未來(lái),借助平臺(tái)的數(shù)據(jù)信息和分析功能,學(xué)生票的發(fā)布將更具針對(duì)性。例如,根據(jù)往年購(gòu)票數(shù)據(jù),熱門班次的列車可根據(jù)歷史數(shù)據(jù)有序調(diào)整?;趯W(xué)生購(gòu)票習(xí)慣分析,學(xué)生票的相關(guān)業(yè)務(wù)將更為智能和個(gè)性化。