中國(guó)鐵路太原局集團(tuán)有限公司科信部 王 凱
大秦鐵路股份有限公司科學(xué)技術(shù)研究所 王健慧
中國(guó)鐵路太原局集團(tuán)有限公司科信部 杜 軍
西南交通大學(xué)機(jī)械工程學(xué)院 楊 崗 周 奧
隨著鐵路行業(yè)信息化、網(wǎng)絡(luò)化的不斷深入以及重載鐵路方面的業(yè)務(wù)流程也在逐漸標(biāo)準(zhǔn)化,該過程中產(chǎn)生的數(shù)據(jù)信息在呈指數(shù)的形式日益增長(zhǎng)。針對(duì)這些海量的、多類型的數(shù)據(jù)信息,由于目前重載鐵路方面缺乏一套完整、規(guī)范及統(tǒng)一的數(shù)據(jù)管理標(biāo)準(zhǔn),使用傳統(tǒng)的數(shù)據(jù)處理方法進(jìn)行管理顯得有些能力不足。利用元數(shù)據(jù)在數(shù)據(jù)組織、管理、共享方面的優(yōu)勢(shì),可以有效的對(duì)海量的、多源異構(gòu)的重載鐵路數(shù)據(jù)進(jìn)行處理,實(shí)現(xiàn)了鐵路數(shù)據(jù)的管理和共享。針對(duì)基于元數(shù)據(jù)是實(shí)現(xiàn)數(shù)據(jù)處理的重要手段,本文從元數(shù)據(jù)概述、鐵路元數(shù)據(jù)管理及其標(biāo)準(zhǔn)、發(fā)展現(xiàn)狀和未來發(fā)展趨勢(shì)等幾個(gè)方面綜合闡述了重載鐵路元數(shù)據(jù)的研究狀況。
隨著科技的不斷發(fā)展以及鐵路工程建設(shè)網(wǎng)絡(luò)化、信息化的全面推進(jìn),動(dòng)車組信息系統(tǒng)相關(guān)信息資源日益增大,該過程中產(chǎn)生的相關(guān)數(shù)據(jù)也在以指數(shù)的形式飛速增加。但是當(dāng)前在國(guó)內(nèi)動(dòng)車組數(shù)據(jù)服務(wù)平臺(tái)建設(shè)各方面還不太成熟,且當(dāng)前傳統(tǒng)的數(shù)據(jù)處理方式在對(duì)海量的、多源異構(gòu)的數(shù)據(jù)處理上顯得能力有些欠缺,如:系統(tǒng)檢索的響應(yīng)緩慢,數(shù)據(jù)不規(guī)范、不標(biāo)準(zhǔn)缺乏嚴(yán)格的格式標(biāo)準(zhǔn),同時(shí)系統(tǒng)接口相關(guān)管理可能不統(tǒng)一。這些問題都可能給后期對(duì)數(shù)據(jù)的使用或分析帶來很多困難,導(dǎo)致這些數(shù)據(jù)資源不能都有效的發(fā)揮其價(jià)值。因此在重載鐵路方面急需要相關(guān)解決措施,對(duì)該方面海量的大數(shù)據(jù)進(jìn)行實(shí)時(shí)獲取與處理。通過研究重載鐵路元數(shù)據(jù)來制訂一套有益于互操作、統(tǒng)一的數(shù)據(jù)描述標(biāo)準(zhǔn)規(guī)范,能夠?qū)崿F(xiàn)對(duì)鐵路工程方面數(shù)據(jù)的收集、整理、存儲(chǔ)、傳遞、保存。這樣就能夠有效的解決鐵路數(shù)據(jù)信息查詢不方便、數(shù)據(jù)規(guī)范化不統(tǒng)一、數(shù)據(jù)信息不可操作性等問題。
元數(shù)據(jù)被稱為“描述(或關(guān)于)數(shù)據(jù)的數(shù)據(jù)”,它是對(duì)數(shù)據(jù)及信息資源的描述性信息,也可以表示為某種資源的相關(guān)信息的結(jié)構(gòu)數(shù)據(jù)。它不但能夠?qū)?shù)據(jù)提供相關(guān)描述的作用,同時(shí)還能夠?qū)?shù)據(jù)進(jìn)行有效管理。
元數(shù)據(jù)可以說是由一些數(shù)據(jù)項(xiàng)共同組成的集合,這些數(shù)據(jù)項(xiàng)都是用來描述某具體資源對(duì)象。其中元數(shù)據(jù)元素是它的最基本組成單元,每個(gè)元數(shù)據(jù)元素都有一些相關(guān)屬性(如:定義、約束性等)來對(duì)數(shù)據(jù)信息來進(jìn)行關(guān)鍵性描述。由于各行業(yè)產(chǎn)生的數(shù)據(jù)信息日益增加,數(shù)據(jù)類型也是各有差異,因此對(duì)于這些多源異構(gòu)的數(shù)據(jù)信息的管理和描述需要不同的元數(shù)據(jù)類型。對(duì)于元數(shù)據(jù)的類型將其按用途分類有:描述性元數(shù)據(jù)、業(yè)務(wù)性元數(shù)據(jù),管理性元數(shù)據(jù)和技術(shù)性元數(shù)據(jù)。
描述性元數(shù)據(jù)是用于闡述和識(shí)別信息資源對(duì)象的屬性、內(nèi)容和特征的元數(shù)據(jù)。如:專題索引,用戶注釋等。描述性元數(shù)據(jù)能夠?qū)π畔①Y源進(jìn)行相關(guān)敘述、定位以及檢索,可以讓用戶不需要瀏覽信息對(duì)象,也能對(duì)該信息有基本的理解和相關(guān)的認(rèn)識(shí)。
業(yè)務(wù)性元數(shù)據(jù)是用來讓用戶了解相關(guān)業(yè)務(wù)數(shù)據(jù)信息的一種方式,它是數(shù)據(jù)倉(cāng)庫(kù)環(huán)境搭建的關(guān)鍵,它是先進(jìn)決策開發(fā)的一種支持工具。業(yè)務(wù)元數(shù)據(jù)主要作用是為業(yè)務(wù)處理提供統(tǒng)一的解釋。
管理性元數(shù)據(jù)簡(jiǎn)單來說就是對(duì)信息資源進(jìn)行管控和支配的元數(shù)據(jù)。如:用戶使用權(quán)限及數(shù)據(jù)存儲(chǔ)格式、信息收集、信息管理流程、信息所有者、版權(quán)與翻版跟蹤等。
技術(shù)性元數(shù)據(jù)就是與信息系統(tǒng)運(yùn)行狀態(tài)相關(guān)的元數(shù)據(jù),通常是指用來開發(fā)和管理數(shù)據(jù)倉(cāng)庫(kù)使用的相關(guān)數(shù)據(jù)。如:軟件與硬件的信息、數(shù)據(jù)驗(yàn)證安全、軟件版本的控制、系統(tǒng)的響應(yīng)跟蹤及數(shù)字化信息的格式等。
元數(shù)據(jù)在網(wǎng)絡(luò)信息資源組織方面的作用可以概括為:描述、檢索、選擇、定位、管理和評(píng)估這六個(gè)方面。應(yīng)用元數(shù)據(jù)結(jié)構(gòu)可以構(gòu)建信息資源,利用元數(shù)據(jù)的內(nèi)容信息,可以讓用戶快速、準(zhǔn)確的查詢到數(shù)據(jù)所在的位置,實(shí)現(xiàn)數(shù)據(jù)的共享。應(yīng)為元數(shù)據(jù)是對(duì)數(shù)據(jù)的描述,所以可以讓使用者準(zhǔn)確對(duì)數(shù)據(jù)進(jìn)行了解與評(píng)價(jià);同時(shí)元數(shù)據(jù)中提供了相應(yīng)數(shù)據(jù)的位置的信息,所以通過元數(shù)據(jù)可以對(duì)數(shù)據(jù)提供者所屬機(jī)構(gòu)和個(gè)人資料進(jìn)行查詢;能夠使得數(shù)據(jù)在共享時(shí)更加方便,并且減少了冗雜數(shù)據(jù)的產(chǎn)生,大大提高了工作效率。元數(shù)據(jù)的不僅能描述信息,而且還對(duì)數(shù)據(jù)具有規(guī)范性。元數(shù)據(jù)標(biāo)準(zhǔn)性促使相關(guān)信息按照統(tǒng)一的標(biāo)準(zhǔn)呈現(xiàn),及時(shí)有效的減少了用戶在數(shù)據(jù)對(duì)接時(shí)不兼容的問題。利用以上元數(shù)據(jù)特性,可以通過搭建數(shù)據(jù)共享平臺(tái)對(duì)數(shù)據(jù)進(jìn)行及時(shí)更新、有效管理和數(shù)據(jù)共享等工作。
隨著計(jì)算機(jī)技術(shù)和信息化在各行各業(yè)的飛速發(fā)展,各行業(yè)特別是重載鐵路方面的數(shù)據(jù)資源總量正呈指數(shù)增長(zhǎng),近幾年產(chǎn)生的數(shù)據(jù)量比以往有很大增長(zhǎng),這些大量的多源異構(gòu)的數(shù)據(jù)處理起來會(huì)有很大的困難,而大數(shù)據(jù)技術(shù)提供了一種高效快速的機(jī)制去處理這些海量的數(shù)據(jù)。如今各國(guó)都在推進(jìn)大數(shù)據(jù)的發(fā)展和應(yīng)用,中國(guó)更是對(duì)其給予了厚望。而大數(shù)據(jù)發(fā)展還在起步階段,關(guān)于大數(shù)據(jù)的資源共享,面對(duì)處理哪種資源可以開放、資源的開放前提、開放什么程度等問題,必須需要制定相關(guān)的國(guó)家標(biāo)準(zhǔn)及建立相應(yīng)的元數(shù)據(jù)資源庫(kù)去解決這些問題。
目前國(guó)內(nèi)外在鐵路工程信息資源方面缺少一套完整的、統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)體系,這就導(dǎo)致無法有效的規(guī)范鐵路數(shù)據(jù)信息。在《地理信息分類與編碼規(guī)則》(GB/T 25529-2010)中,只是將鐵路工程在地理方面相關(guān)要素信息進(jìn)行了劃分,并未對(duì)鐵路工程相關(guān)領(lǐng)域做出全面的、詳細(xì)的定義和劃分。在發(fā)布的《建筑工程設(shè)計(jì)信息模型分類和編碼標(biāo)準(zhǔn)》當(dāng)中,主要對(duì)建筑工程領(lǐng)域的信息資源進(jìn)行了相關(guān)分類和編碼,其中把鐵路工程與建筑工程有重疊或類似的領(lǐng)域不再單獨(dú)編寫,而是均采用的是這個(gè)標(biāo)準(zhǔn)來進(jìn)行相關(guān)分類和編碼,但是這個(gè)標(biāo)準(zhǔn)缺少對(duì)鐵路工程元數(shù)據(jù)系統(tǒng)性和全面性的描述。因此目前在重載鐵路方面急需要一個(gè)適合鐵路工程信息數(shù)據(jù)管理的標(biāo)準(zhǔn)規(guī)范。為了響應(yīng)鐵路行業(yè)發(fā)展要求,鐵路BIM聯(lián)盟2019年發(fā)布了《鐵路基礎(chǔ)設(shè)施元數(shù)據(jù)標(biāo)準(zhǔn)》,該標(biāo)準(zhǔn)結(jié)合了鐵路行業(yè)自身特點(diǎn)及過往經(jīng)驗(yàn),對(duì)鐵路工程數(shù)據(jù)信息的元數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行了科學(xué)性、系統(tǒng)性規(guī)定。該標(biāo)準(zhǔn)根據(jù)鐵路工程項(xiàng)目生命周期包含的設(shè)計(jì)、建設(shè)、運(yùn)維三個(gè)階段所需要的元數(shù)據(jù)不一樣,將鐵路元數(shù)據(jù)劃分成了基本、設(shè)計(jì)、建設(shè)和運(yùn)維元數(shù)據(jù)四個(gè)類別。其中基本元數(shù)據(jù)是三個(gè)階段中通用的部分,該標(biāo)準(zhǔn)的發(fā)布解決了鐵路工程方面存在的數(shù)據(jù)定義、處理、儲(chǔ)存、共享和使用等方面數(shù)據(jù)格式不統(tǒng)一的問題,有效的推動(dòng)了鐵路工程建設(shè)數(shù)字化、網(wǎng)絡(luò)化和信息化快速發(fā)展。
(1)吸取過去的經(jīng)驗(yàn),結(jié)合鐵路行業(yè)的特點(diǎn)及其實(shí)際應(yīng)用需求,提高數(shù)據(jù)的可操作性及指導(dǎo)性。
(2)參照其他行業(yè)已有的標(biāo)準(zhǔn),鐵路行業(yè)與其重疊的專業(yè)領(lǐng)域不再定義專門的標(biāo)準(zhǔn),直接應(yīng)用現(xiàn)有的標(biāo)準(zhǔn),保持?jǐn)?shù)據(jù)的統(tǒng)一實(shí)現(xiàn)數(shù)據(jù)信息的共享。
(3)應(yīng)該實(shí)現(xiàn)鐵路工程信息資源的產(chǎn)生、管理、保存和使用的標(biāo)準(zhǔn)化,體現(xiàn)元數(shù)據(jù)使用的科學(xué)性及合理性。
關(guān)于BIM聯(lián)盟發(fā)布的《鐵路基礎(chǔ)設(shè)施元數(shù)據(jù)標(biāo)準(zhǔn)》該內(nèi)容主要分為了8個(gè)部分來編寫,分別是總則、規(guī)范性引用文件、術(shù)語(yǔ)和定義、各單位職責(zé)、元數(shù)據(jù)階段劃分、元數(shù)據(jù)描述方法、元數(shù)據(jù)管理及元數(shù)據(jù)管理平臺(tái)應(yīng)用接入。這里主要是對(duì)元數(shù)據(jù)描述方法進(jìn)行相關(guān)說明。該標(biāo)準(zhǔn)結(jié)合鐵路基礎(chǔ)設(shè)施數(shù)據(jù)管理要求的實(shí)際情況,將元數(shù)據(jù)從概念的層次上區(qū)分為文檔類、組織類、人員類和項(xiàng)目類。該標(biāo)準(zhǔn)分別使用了“IFD編碼、數(shù)據(jù)元中文和英文名稱、定義、目的、約束性、可重復(fù)性、元素類型、數(shù)據(jù)類型、是非枚舉、值域、數(shù)據(jù)元值的最大和最小長(zhǎng)度、表示格式、數(shù)據(jù)元最大和最小允許值、計(jì)量單位、子元素、信息來源、相關(guān)元素和注釋”18個(gè)方面對(duì)元數(shù)據(jù)元素進(jìn)行了有關(guān)描述。元數(shù)據(jù)元素描述方法如表1所示。
鐵路基礎(chǔ)設(shè)施元數(shù)據(jù)的管理主要由元數(shù)據(jù)的著錄、審核和發(fā)布三個(gè)部分組成(如圖1所示)。其中元數(shù)據(jù)的著錄和審核由鐵路BIM聯(lián)盟各個(gè)成員負(fù)責(zé),而元數(shù)據(jù)的發(fā)布有鐵路BIM聯(lián)盟負(fù)責(zé)。
表1 元數(shù)據(jù)元素描述方法
圖1 元數(shù)據(jù)管理流程
其中元數(shù)據(jù)的著錄分為錄入元數(shù)據(jù)相關(guān)填報(bào)模板、導(dǎo)入元數(shù)據(jù)填報(bào)Excel文件以及提交審核這三個(gè)步驟。即BIM聯(lián)盟各成員在完成元數(shù)據(jù)梳理后,按照規(guī)定的格式將元數(shù)據(jù)相關(guān)信息錄入填報(bào)模板,然后將元數(shù)據(jù)分類(如“項(xiàng)目”、“路線”等)導(dǎo)入BIM聯(lián)盟元數(shù)據(jù)管理平臺(tái),同時(shí)每次只能導(dǎo)入一個(gè)分類下的元數(shù)據(jù),然后提交給聯(lián)盟其他成員審核。
元數(shù)據(jù)的審核由下載元數(shù)據(jù)填報(bào)的文件、修改元數(shù)據(jù)填報(bào)文件、上傳修改后元數(shù)據(jù)文件及審核的意見四個(gè)步驟完成。即審核人員對(duì)提交的元數(shù)據(jù)文件查閱,并對(duì)相關(guān)內(nèi)容進(jìn)行修改,然后上傳BIM元數(shù)據(jù)管理平臺(tái),同時(shí)給出審核意見。當(dāng)元數(shù)據(jù)著錄和審核的成員對(duì)該文件都無異議后,將其內(nèi)容移到待發(fā)布庫(kù)中。
元數(shù)據(jù)發(fā)布。由BIM聯(lián)盟管理人員將審核通過的元數(shù)據(jù)進(jìn)行發(fā)布新版本,提供給信息供應(yīng)鏈中各方使用。同時(shí)BIM聯(lián)盟會(huì)為發(fā)布的新元數(shù)據(jù)配備相應(yīng)的版本編號(hào),并更新相關(guān)的版本列表。
針對(duì)鐵路行業(yè)數(shù)據(jù)量龐大、數(shù)據(jù)關(guān)聯(lián)復(fù)雜且數(shù)據(jù)范圍廣泛所帶來的挑戰(zhàn),元數(shù)據(jù)提供了有效的管理手段為數(shù)據(jù)資源的使用者和提供者。將鐵路元數(shù)據(jù)與大數(shù)據(jù)處理技術(shù)結(jié)合實(shí)施到鐵路數(shù)據(jù)服務(wù)平臺(tái)中,為鐵路工程建設(shè)行業(yè)各業(yè)務(wù)相關(guān)的應(yīng)用系統(tǒng)提供數(shù)據(jù)的采集、整理、儲(chǔ)存、傳遞和共享以及大數(shù)據(jù)分析等服務(wù)。
對(duì)于重載鐵路工程元數(shù)據(jù)的未來發(fā)展首先得保證元數(shù)據(jù)的質(zhì)量,目前我國(guó)的元數(shù)據(jù)質(zhì)量狀態(tài)存在很大的問題,尤其在鐵路方面沒有一套高質(zhì)量完整的元數(shù)據(jù),在數(shù)據(jù)平臺(tái)存在著“基本元數(shù)據(jù)覆蓋率(完整性)”、“開放格式”等質(zhì)量方面的問題??梢詤⒄铡皻W洲數(shù)據(jù)門戶EDP”開創(chuàng)的元數(shù)據(jù)質(zhì)量保障模塊來監(jiān)督鐵路各領(lǐng)域信息資源的相關(guān)元數(shù)據(jù)質(zhì)量。該模塊元數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)有三個(gè)度量標(biāo)準(zhǔn),第一個(gè)標(biāo)準(zhǔn)是用來考察元數(shù)據(jù)是否符合規(guī)范,后兩個(gè)標(biāo)準(zhǔn)是關(guān)于數(shù)據(jù)資源的可獲取程度以及機(jī)器可讀文件所含比率,這兩個(gè)標(biāo)準(zhǔn)用來評(píng)價(jià)元數(shù)據(jù)記錄是否具有準(zhǔn)確性以及數(shù)據(jù)集是否具有開放性。
由于信息時(shí)代的到來,各領(lǐng)域都在朝著數(shù)字化、信息化方向發(fā)展,那避免不了數(shù)據(jù)平臺(tái)或系統(tǒng)間的數(shù)據(jù)信息交換和共享。這就必須要求系統(tǒng)具備一種能夠統(tǒng)一的來正確理解和有效使用數(shù)據(jù)和元數(shù)據(jù)的能力,即數(shù)據(jù)資源在系統(tǒng)間的可互操作性。解決“語(yǔ)義可互操作性”保證了在交換數(shù)據(jù)信息時(shí),發(fā)送和接受雙方能夠有同一的方式理解和解析數(shù)據(jù)信息,知道信息所蘊(yùn)含的意義。從而突破數(shù)據(jù)資源跨領(lǐng)域和跨國(guó)界交流和共享的障礙。
結(jié)束語(yǔ):隨著鐵路網(wǎng)絡(luò)化、信息化建設(shè)的全面推進(jìn),信息化管理在重載鐵路方面進(jìn)而得到實(shí)施并產(chǎn)生了顯著的成效。目前我國(guó)對(duì)重載鐵路元數(shù)據(jù)建設(shè)還落后于國(guó)際先進(jìn)水平,為建設(shè)鐵路工程數(shù)據(jù)信息共享平臺(tái)帶來了困難,使鐵路領(lǐng)域產(chǎn)生的海量數(shù)據(jù)的處理面領(lǐng)著挑戰(zhàn)。針對(duì)鐵路工程建設(shè)的特點(diǎn),研究鐵路元數(shù)據(jù)的有效治理、元數(shù)據(jù)的高質(zhì)量以及解決互操作性等問題都將成為未來發(fā)展要解決的課題。