付清濤,龔建華,戴鈺璁
(1.國(guó)防科技大學(xué)信息通信學(xué)院,湖北 武漢 430010;2.武漢科技大學(xué)城市學(xué)院,湖北 武漢 430083;3.武漢理工大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,湖北 武漢 430070)
歐盟作為一個(gè)區(qū)域性的國(guó)際組織,組織內(nèi)部成員復(fù)雜,由于各個(gè)成員國(guó)在行政管理過程和法律上的不一致,缺乏統(tǒng)一的數(shù)據(jù)模型和通用數(shù)據(jù)標(biāo)準(zhǔn)等原因,在執(zhí)行公共服務(wù)中產(chǎn)生許多語(yǔ)義互操作沖突問題。為有效解決這些沖突問題,提高歐洲行政機(jī)構(gòu)、商業(yè)企業(yè)和公民之間的互操作性,歐盟委員會(huì)自2010年1月開始實(shí)施了歐洲公共管理、企業(yè)和公民互操作方案(Interoperability Solutions for European Public Administrations,Businesses and Citizens,ISA)[1]。
根據(jù)對(duì)客觀世界描述的抽象程度,歐盟ISA的數(shù)據(jù)模型共劃分為核心數(shù)據(jù)模型、領(lǐng)域數(shù)據(jù)模型和信息交換數(shù)據(jù)模型3層結(jié)構(gòu),如圖1所示。
圖1 歐盟ISA數(shù)據(jù)模型層次結(jié)構(gòu)
核心數(shù)據(jù)模型(Core Data Model)是與具體業(yè)務(wù)領(lǐng)域無(wú)關(guān)的數(shù)據(jù)模型,用于捕獲客觀世界實(shí)體的基本特征,其抽象層級(jí)最高。領(lǐng)域數(shù)據(jù)模型(Domain Data Model)是對(duì)特定領(lǐng)域(如justice域、healthcare域)進(jìn)行建模的數(shù)據(jù)模型,由核心數(shù)據(jù)模型擴(kuò)展而來(lái),用于描述具體業(yè)務(wù)領(lǐng)域所涉及的實(shí)體及其關(guān)系,其抽象層級(jí)較核心數(shù)據(jù)模型次之。信息交換數(shù)據(jù)模型(Information exchange Data Model)用于定義和描述滿足具體交換需求的交換數(shù)據(jù)的結(jié)構(gòu)和內(nèi)容,由業(yè)務(wù)領(lǐng)域數(shù)據(jù)模型擴(kuò)展而來(lái),其抽象程度最低。
本文所提到的核心詞匯(e-Government Core Vocabularies)屬于核心數(shù)據(jù)模型層級(jí),由核心業(yè)務(wù)詞匯、核心位置詞匯、核心人員詞匯、核心準(zhǔn)則和證據(jù)詞匯、核心公共機(jī)構(gòu)詞匯和核心公共服務(wù)詞匯及應(yīng)用規(guī)范6類[2]核心詞匯組成。核心詞匯定義為簡(jiǎn)化的、可重用的、可擴(kuò)展的數(shù)據(jù)模型,與上下文和語(yǔ)法無(wú)關(guān)(語(yǔ)法中立),具有技術(shù)獨(dú)立性、可擴(kuò)展性,不依賴于任何特定的技術(shù)手段來(lái)表示,只單純用于捕獲記錄所要描繪的數(shù)據(jù)實(shí)體的基本特征、定義等內(nèi)容,可任意應(yīng)用于信息系統(tǒng)數(shù)據(jù)模型、信息交換數(shù)據(jù)模型或關(guān)聯(lián)數(shù)據(jù)模型創(chuàng)建。
核心業(yè)務(wù)詞匯(Core Business)用于描述通過正式注冊(cè)登記程序(通常在國(guó)家或地區(qū)層級(jí))獲得法律實(shí)體地位的組織機(jī)構(gòu)(Registered Legal Organizations,RegORG)的基本特征。核心業(yè)務(wù)詞匯包括legalEntity類和對(duì)機(jī)構(gòu)的法定名稱、法定標(biāo)識(shí)符、注冊(cè)地址、注冊(cè)活動(dòng)、組織類型等的描述。該類涵蓋了業(yè)務(wù)注冊(cè)數(shù)據(jù)庫(kù)里的基本數(shù)據(jù)元素,用于整合不同來(lái)源的業(yè)務(wù)相關(guān)數(shù)據(jù),并允許不同系統(tǒng)之間進(jìn)行信息交換。如歐盟商業(yè)注冊(cè)互聯(lián)系統(tǒng)(Business Registers Interconnection System,BRIS)基于核心業(yè)務(wù)詞匯實(shí)現(xiàn)了歐盟各成員國(guó)之間跨境的數(shù)據(jù)交換。BIRS連接了來(lái)自31個(gè)國(guó)家(歐盟成員國(guó)和歐洲經(jīng)濟(jì)區(qū))的350 個(gè)歐洲企業(yè)注冊(cè)庫(kù),每天進(jìn)行10萬(wàn)條信息交換。另外,OpenCorporates門戶網(wǎng)站是世界上最大的企業(yè)開放數(shù)據(jù)庫(kù)之一,目前已有1億多家企業(yè)注冊(cè),該門戶網(wǎng)站是核心業(yè)務(wù)詞匯最早的應(yīng)用之一。
核心位置詞匯(Core Location)主要對(duì)地點(diǎn)、地址、地理名稱以及地理位置等地理信息進(jìn)行描述,應(yīng)用于土地登記和任何其他基于信息通信技術(shù)的解決方案之間交換和處理位置信息,實(shí)現(xiàn)互操作性。核心位置詞匯主要有地名、幾何圖形、郵政地址3種描述方式。
1)地名形式(Location類)。如“巴黎”“柏林”等都是地名,通過一個(gè)簡(jiǎn)單的公認(rèn)的名稱,采用簡(jiǎn)單的字符串形式即可描述出地理位置信息,除位置的簡(jiǎn)單標(biāo)簽或名稱外(字符串),Location類還定義了地理標(biāo)識(shí)符屬性,允許通過URI(例如GeoNames或DBpedia URI)定義位置,主要包括地名、地理標(biāo)識(shí)符、地址、幾何結(jié)構(gòu)等屬性。
2)幾何圖形形式(Geometry類)。采用圖形的形式,通過設(shè)置不同的坐標(biāo)參考系,使用坐標(biāo)的形式也可以表示某個(gè)具體的地理位置,共包含坐標(biāo)、坐標(biāo)參考系統(tǒng)標(biāo)識(shí)符、幾何類型屬性。
3)地址形式(Address類)。主要指郵政系統(tǒng)所使用的地址,如通過描述具體某條街道、某個(gè)小區(qū),門牌編號(hào)同樣可以定義某個(gè)具體的地理位置。
不同公共行政機(jī)構(gòu)可以基于核心位置詞匯以電子方式交換有關(guān)位置數(shù)據(jù)。如比利時(shí)政府以核心位置詞匯為基礎(chǔ),集成了國(guó)家和地區(qū)的公共管理機(jī)構(gòu)登記庫(kù),有效整合和融合了不同系統(tǒng)、組織的地址數(shù)據(jù)。
核心人員詞匯(Core Person)主要用于描述各類業(yè)務(wù)活動(dòng)中自然人的基本特征,由歐洲檢察官組織(Eurojust)負(fù)責(zé)開發(fā),為刑事案件庫(kù)之間或其他基于ICT的解決方案交換和處理有關(guān)人員信息提供方法手段,以促進(jìn)司法領(lǐng)域的互操作性,該規(guī)范于2012年5月7日發(fā)布了1.0版。
核心人員詞匯主要包含Person類,該類涵蓋了業(yè)務(wù)活動(dòng)中用于描述“自然人”的基本數(shù)據(jù)元素,對(duì)“自然人”的概念和特征進(jìn)行了定義,共包含姓氏、名、父名、性別、出生死亡日期、出生地、死亡地及出生地死亡地所在國(guó)家、居住權(quán)等屬性。核心人員詞匯可以反映人員的一些基本屬性和信息,但不包括社會(huì)關(guān)系以及在社會(huì)中的身份等內(nèi)容。
核心人員詞匯實(shí)現(xiàn)了與人員有關(guān)的數(shù)據(jù)信息描述,公共行政機(jī)構(gòu)之間可以基于核心人員詞匯實(shí)現(xiàn)人員數(shù)據(jù)的電子交換。如歐盟“e-CODEX”項(xiàng)目以核心人員詞匯為基礎(chǔ),在電子司法領(lǐng)域通過連接成員國(guó)家和歐洲的信息系統(tǒng),促進(jìn)與案件相關(guān)人員的數(shù)據(jù)信息交換,實(shí)現(xiàn)跨境司法合作。
核心準(zhǔn)則和證據(jù)詞匯(Core Criterion and Core Evidence Vocabulary,CCCEV)[3]描述了私營(yíng)實(shí)體為能夠達(dá)到有資格履行公共服務(wù)的水平所必須遵循的原則和手段,準(zhǔn)則(Criterion類)是用來(lái)判斷、評(píng)估或測(cè)試某物的規(guī)則,包含準(zhǔn)則類型、名稱、描述、完成指標(biāo)、權(quán)重等屬性;證據(jù)(Evidence類)是包含證明準(zhǔn)則存在或?yàn)檎娴囊罁?jù)信息,包含證據(jù)類型、名稱、描述、語(yǔ)言、簽發(fā)機(jī)構(gòu)等屬性。
核心準(zhǔn)則和證據(jù)詞匯用于實(shí)現(xiàn)不同單位之間對(duì)于準(zhǔn)則和依據(jù)的規(guī)范一致性,降低跨境流程和交流的理解障礙,完善評(píng)估過程和手段。如歐洲的單一采購(gòu)文件(European Single Procurement Document,ESPD),以CCCEV為基礎(chǔ),針對(duì)跨領(lǐng)域、不確定性業(yè)務(wù)需求進(jìn)行擴(kuò)展以滿足特殊的采購(gòu)流程。ESPD本質(zhì)上是一種用于公共采購(gòu)流程的自我描述表格,由歐盟各地的買家和企業(yè)提供證明材料,以滿足跨境公共采購(gòu)流程所需的條件。ESPD通過使用一種統(tǒng)一的、多語(yǔ)言的形式,大大簡(jiǎn)化了跨境投標(biāo)流程,并減輕了參與企業(yè)的行政負(fù)擔(dān)。同時(shí)ESPD與國(guó)家電子采購(gòu)門戶(e-Certis)進(jìn)行了集成,為用戶提供了多種語(yǔ)言搜索、查詢、導(dǎo)出采購(gòu)流程中證明材料信息的工具,保證了采購(gòu)評(píng)估等項(xiàng)目的公開透明。
為促進(jìn)歐洲各國(guó)國(guó)家內(nèi)部與國(guó)家之間公共組織的管理與共同發(fā)展,歐盟于2016年12月19日發(fā)布了核心公共機(jī)構(gòu)詞匯(Core Public Organization Vocabulary,CPOV)[4],用于描述組織本身及其功能,并通過統(tǒng)一規(guī)范形成一個(gè)歐盟范圍內(nèi)共同認(rèn)可的用于描述公共組織基本特征的方式。歐盟基于CPOV構(gòu)建開發(fā)了通用信息系統(tǒng)、跨境公共服務(wù)及相關(guān)機(jī)構(gòu)的數(shù)據(jù)庫(kù),實(shí)現(xiàn)公共機(jī)構(gòu)數(shù)據(jù)的發(fā)布。核心公共機(jī)構(gòu)詞匯(CPOV)共定義有6個(gè)類,其中Public Organisation類為其核心類,包含公共機(jī)構(gòu)的標(biāo)簽、描述、行政區(qū)域、職責(zé)、類型、標(biāo)志、組織成員、從屬關(guān)系等相關(guān)信息的屬性。在現(xiàn)實(shí)社會(huì)中,核心公共機(jī)構(gòu)詞匯用于定義和描述各類公共組織的基本信息,實(shí)現(xiàn)對(duì)公共組織和機(jī)構(gòu)的管理。如歐盟政府以核心公共機(jī)構(gòu)詞匯為基礎(chǔ),整合了歐洲和地區(qū)的各類公共機(jī)構(gòu)數(shù)據(jù)信息,構(gòu)建了公共機(jī)構(gòu)管理登記庫(kù)等。
公共服務(wù)是由公共組織或代表公共組織執(zhí)行的,由公共財(cái)政資助的、公共政策產(chǎn)生的強(qiáng)制性或可選擇的一系列活動(dòng),包括由歐洲公共管理機(jī)構(gòu)或代理機(jī)構(gòu)向企業(yè)、公民或其他公共管理機(jī)構(gòu)提供的任何服務(wù)。核心公共服務(wù)詞匯(Core Public Service vocabulary,CPSV)[5]及應(yīng)用規(guī)范(Core Public Service vocabulary Application Profile,CPSV-AP)主要包含描述服務(wù)本身的類和屬性,包括必要的輸入、可能的輸出、主責(zé)公共機(jī)構(gòu)和觸發(fā)服務(wù)使用的事件,服務(wù)的上下文的類和屬性(包括有關(guān)該服務(wù)的立法和操作規(guī)則),以及服務(wù)和用戶之間的接口。
核心公共服務(wù)詞匯為公共服務(wù)的統(tǒng)一描述和邏輯分組提供邏輯基礎(chǔ),有利于優(yōu)化對(duì)公共服務(wù)信息的訪問。以核心公共服務(wù)詞匯為基礎(chǔ),可在各級(jí)行政機(jī)構(gòu)(歐洲、國(guó)家、地區(qū))建立以用戶為中心的公共服務(wù)目錄,促進(jìn)不同層級(jí)政府一站式服務(wù)機(jī)構(gòu)之間公共服務(wù)信息的交換和整合,并實(shí)現(xiàn)一站式的業(yè)務(wù)事件和相關(guān)公共服務(wù)信息的發(fā)布和訪問。
ISA數(shù)據(jù)模型層次關(guān)系如圖2所示。核心詞匯位于核心數(shù)據(jù)模型層級(jí)中,僅用于描述客觀實(shí)體的基本特征,不能完全涵蓋外兩層建模需要。在實(shí)際應(yīng)用過程中,需要根據(jù)實(shí)際情況對(duì)核心詞匯表進(jìn)行擴(kuò)展或映射,構(gòu)建符合應(yīng)用需求的數(shù)據(jù)模型,其中,核心詞匯表是領(lǐng)域數(shù)據(jù)模型和信息交換模型語(yǔ)義一致性的基礎(chǔ)。
圖2 ISA數(shù)據(jù)模型層次關(guān)系
核心詞匯表的擴(kuò)展或限制方法主要包括以下4種。
1)向類中添加新屬性或關(guān)聯(lián)。當(dāng)某特定域或信息系統(tǒng)中缺少某具體表示內(nèi)容時(shí),可在原基礎(chǔ)上添加新的屬性和關(guān)聯(lián)。例如,在某個(gè)用于人的信息存儲(chǔ)服務(wù)的數(shù)據(jù)模型中,需要一個(gè)新的屬性來(lái)指示一個(gè)人是否有駕駛執(zhí)照,則可以在“Person”類中添加一個(gè)新的屬性,通過該屬性值來(lái)指示描述對(duì)象是否有駕駛執(zhí)照。
2)從類中刪除不相關(guān)的屬性和關(guān)聯(lián)。
某些屬性可能與特定域或特定的信息系統(tǒng)無(wú)關(guān),在領(lǐng)域模型或信息交換模型中可以刪除這些多余的屬性或關(guān)聯(lián)。例如,在為活人提供服務(wù)時(shí),人的死亡日期屬于無(wú)用屬性,在這種情況下,可以從結(jié)果數(shù)據(jù)模型中刪除無(wú)關(guān)的屬性或關(guān)聯(lián)。
3)具體化類、屬性或關(guān)聯(lián)。核心詞匯在不同信息系統(tǒng)或信息交換數(shù)據(jù)模型中因?yàn)樯舷挛年P(guān)系,元素的含義可能有所不同。例如,在臨床醫(yī)學(xué)情況下,一個(gè)“人”可以指代病人或醫(yī)生,兩者在核心詞匯表中共享“Person”類的共同屬性,在不同應(yīng)用場(chǎng)景中,需要增加不同的附加屬性和關(guān)聯(lián)。
4)替換類、屬性或關(guān)聯(lián)。當(dāng)核心詞匯中的元素接近數(shù)據(jù)模型的需求但仍不能完全匹配的情況下,可以對(duì)核心詞匯表中的部分元素進(jìn)行替換,從而保證完全符合數(shù)據(jù)模型的需求。
核心詞匯表具有語(yǔ)法中立性,不依賴于任何特定的技術(shù)表達(dá),同時(shí)核心詞匯表提供了到現(xiàn)有標(biāo)準(zhǔn)數(shù)據(jù)模型的映射。通過對(duì)比數(shù)據(jù)模型與核心詞匯表,可以分析數(shù)據(jù)模型之間的現(xiàn)有關(guān)系,發(fā)現(xiàn)可能存在的相似之處,解決不同數(shù)據(jù)模型之間的語(yǔ)義互操作性沖突問題。
從核心詞匯表映射到其他數(shù)據(jù)模型,主要包含核心詞匯表的類、屬性、關(guān)聯(lián)、數(shù)據(jù)類型和元素之間的映射關(guān)系。核心詞匯表借鑒了SKOS(Simple Knowledge Organization System,SKOS)詞匯[6]匹配方法,共定義了精確匹配(exact match)、近似匹配(close match)、關(guān)聯(lián)匹配(related match)、寬匹配(broad match)、窄匹配(narrow match)5種映射關(guān)系。具體形式如圖3所示。
圖3 映射關(guān)系示意圖
1)精準(zhǔn)匹配。如果A的集合等于B的集合,那么A和B的定義是等價(jià)的,A和B精確匹配。例如,“Person”類在核心詞匯表中定義為“自然人”,在UN/CEFACT核心構(gòu)件中定義為“個(gè)人”,這兩個(gè)類表示同樣的個(gè)體,因此是語(yǔ)義級(jí)別的精確匹配。精確匹配并不意味著“Person”類在結(jié)構(gòu)上是完全一樣的,它們可能定義額外的或刪除現(xiàn)有的屬性和關(guān)聯(lián)。具有精確匹配關(guān)系的元素(類、屬性或關(guān)系),可以在數(shù)據(jù)模型之間進(jìn)行雙向轉(zhuǎn)換而不會(huì)造成語(yǔ)義缺失問題。
2)近似匹配。如果A的集合與B的集合基本相等,A的集合中部分不包含在B中,B的集合的部分不包含在A中,兩者之間的差別可以忽略不計(jì),則A和B近似匹配。例如,“AddressPostName”(城市中的郵政地址)與聯(lián)合國(guó)貿(mào)易便利化與電子業(yè)務(wù)中心UN/CEFACT核心構(gòu)件的“Address.CityName.Text”近似匹配。在大多數(shù)情況下,這兩個(gè)屬性將包含相同的值,但可能存在郵政地址既不是城市,也不是城鎮(zhèn)或村莊的情況。具有近似匹配關(guān)系的元素可以在數(shù)據(jù)模型之間雙向轉(zhuǎn)換,在某些特定情況下,可能存在較小的語(yǔ)義損失。
3)關(guān)聯(lián)匹配。如果A的集合和B的集合之間存在有意義的交集,則A和B關(guān)聯(lián)匹配。關(guān)聯(lián)匹配是最松散的映射關(guān)系。例如,核心詞匯表中的PersonBirthName(人員出生全名)與UN/CEFACT核心構(gòu)件的Person.MaidenName.Text(人員婚前姓氏)互相關(guān)聯(lián)匹配。具有關(guān)聯(lián)匹配關(guān)系的元素之間的轉(zhuǎn)換,容易產(chǎn)生語(yǔ)義上的錯(cuò)誤。
4)寬/窄匹配。如果A的集合大于B的集合,則A的定義概括了B的定義,A和B寬匹配。反之,如果B的集合大于A的集合,則B的定義概括了A的定義,A和B窄匹配。具有寬/窄匹配關(guān)系的元素之間的轉(zhuǎn)換只能向更通用的數(shù)據(jù)元素方向轉(zhuǎn)換。例如,ISA核心詞匯表中的“l(fā)egalEntity”與UN/CEFACT核心組件庫(kù)中的“Organization”有著窄匹配關(guān)系,則數(shù)據(jù)源中“l(fā)egalEntity”實(shí)例可以轉(zhuǎn)換為“Organization”的實(shí)例,相反的轉(zhuǎn)換則不正確,容易造成語(yǔ)義上的錯(cuò)誤。
核心詞匯表作為保證語(yǔ)義一致性的基礎(chǔ)規(guī)范,應(yīng)用于歐盟電子政務(wù)服務(wù)和各業(yè)務(wù)領(lǐng)域各層級(jí)之間數(shù)據(jù)交換以及數(shù)據(jù)模型構(gòu)建中,其主要作用包括以下4個(gè)方面:一是系統(tǒng)之間的信息交換,以核心詞匯表為基礎(chǔ)構(gòu)建信息交換模型,實(shí)現(xiàn)現(xiàn)有信息系統(tǒng)之間交換數(shù)據(jù);二是數(shù)據(jù)集成,利用核心詞匯表集成來(lái)自不同數(shù)據(jù)源的數(shù)據(jù);三是數(shù)據(jù)發(fā)布,公共機(jī)構(gòu)按照核心詞匯表發(fā)布機(jī)構(gòu)數(shù)據(jù);四是新系統(tǒng)的開發(fā),核心詞匯表可以作為新開發(fā)的信息系統(tǒng)概念和邏輯數(shù)據(jù)模型設(shè)計(jì)的起點(diǎn)。基于核心詞匯表構(gòu)建數(shù)據(jù)模型的步驟包括需求收集、信息建模、業(yè)務(wù)規(guī)則定義、語(yǔ)法綁定或新語(yǔ)法創(chuàng)建、模型映射及校驗(yàn),如圖4所示。
圖4 基于核心詞匯表創(chuàng)建數(shù)據(jù)模型的步驟
本文以電子訂單文檔創(chuàng)建為例,介紹歐盟電子政務(wù)核心詞匯表的應(yīng)用方法。電子訂單表是通過計(jì)算機(jī)和通信技術(shù)存儲(chǔ)和傳遞的電子數(shù)據(jù)形式的訂單,主要應(yīng)用于基于互聯(lián)網(wǎng)的網(wǎng)上購(gòu)物。電子訂單文檔設(shè)計(jì)涉及的業(yè)務(wù)流程是買方向賣方提交電子訂單,賣方根據(jù)情況返回接受或拒絕訂單的響應(yīng),該項(xiàng)目由賣方設(shè)計(jì),向買家提供統(tǒng)一的電子訂單格式和內(nèi)容標(biāo)準(zhǔn),以便統(tǒng)一訂單語(yǔ)義,并改進(jìn)與其他項(xiàng)目的互操作性。
需求收集的任務(wù)是不考慮技術(shù)因素,分析該具體項(xiàng)目的業(yè)務(wù)背景,準(zhǔn)確確定業(yè)務(wù)目標(biāo)、范圍、流程,并通過分析數(shù)據(jù)模型設(shè)計(jì)所要達(dá)到的目標(biāo)進(jìn)一步確定信息需求。
在電子訂單審核流程中,其目標(biāo)、業(yè)務(wù)范圍及其他需求描述分別如表1、2、3所示。
表1 訂單審核流程的目標(biāo)
表2 訂單審核流程的范圍
表3 訂單審核流程高級(jí)要求
信息建模環(huán)節(jié)是結(jié)合第一步所派生的信息需求創(chuàng)建一個(gè)與核心詞匯表一致的概念數(shù)據(jù)模型。
3.2.1 概念數(shù)據(jù)模型的主要內(nèi)容
概念數(shù)據(jù)模型應(yīng)包含信息需求標(biāo)識(shí)、業(yè)務(wù)術(shù)語(yǔ)的類型、業(yè)務(wù)術(shù)語(yǔ)名稱、業(yè)務(wù)術(shù)語(yǔ)定義和核心詞匯標(biāo)識(shí),具體內(nèi)容描述如表4所示。
表4 概念數(shù)據(jù)模型內(nèi)容描述
3.2.2 概念數(shù)據(jù)模型構(gòu)建步驟
結(jié)合電子訂單的創(chuàng)建進(jìn)行分析,創(chuàng)建概念數(shù)據(jù)模型具體操作步驟如下。
1)從核心詞匯庫(kù)中下載核心詞匯表電子表格。根據(jù)數(shù)據(jù)模型應(yīng)用需求選取適當(dāng)?shù)暮诵脑~匯。如在創(chuàng)建訂單時(shí),考慮建模需求以及采購(gòu)業(yè)務(wù)流程中具體項(xiàng)目,針對(duì)客戶這一元素確定選用核心人員詞匯,針對(duì)接收方地理位置信息確定選用核心位置詞匯。
2)查找匹配的概念。將概念數(shù)據(jù)模型中元素所表示的概念與核心詞匯中定義的概念進(jìn)行比較,查找匹配項(xiàng)。如在創(chuàng)建訂單數(shù)據(jù)模型時(shí),確定Person類、Address類作為與數(shù)據(jù)模型中“人員”“地址”為匹配的概念,具體內(nèi)容如表5所示。在具體業(yè)務(wù)流程中還可以細(xì)分為客戶,快遞員,發(fā)貨地址,收貨地址等詳細(xì)概念。
表5 訂單概念與核心詞匯表匹配
3)對(duì)齊概念和類。主要包括:① 概念命名對(duì)齊,精確匹配時(shí),用核心詞匯表術(shù)語(yǔ)命名數(shù)據(jù)模型元素概念;非精確匹配時(shí),在概念數(shù)據(jù)模型語(yǔ)境中查找同義詞和精煉的名稱。如在創(chuàng)建訂單數(shù)據(jù)模型時(shí),“買方”與“法人”是一種窄匹配關(guān)系,“買方”是“法人”的一種角色,故需要結(jié)合概念模型中語(yǔ)境對(duì)名稱進(jìn)行精煉;② 術(shù)語(yǔ)描述對(duì)齊,可以使用核心詞匯表里的相應(yīng)的描述,也可以在核心詞匯表概念描述的基礎(chǔ)上,增加特定業(yè)務(wù)的說(shuō)明,對(duì)核心詞匯表的描述具體化;③ 類對(duì)齊,將數(shù)據(jù)模型類與核心詞匯類進(jìn)行對(duì)齊;④ 概念模型需要對(duì)核心詞匯表中對(duì)應(yīng)的類具體化,結(jié)合新的上下文,在核心詞匯表的基礎(chǔ)上增加需要的新屬性,刪除不使用的屬性,必要時(shí)替換屬性和關(guān)聯(lián)關(guān)系。
電子訂單數(shù)據(jù)模型與核心詞匯表具體對(duì)齊內(nèi)容如表6所示。
表6 “訂單”數(shù)據(jù)模型與核心詞匯表對(duì)齊
4)確定標(biāo)識(shí)符。概念數(shù)據(jù)模型的標(biāo)識(shí)符必須使用核心詞匯表對(duì)應(yīng)的標(biāo)識(shí)符。
核心詞匯表本身并不為屬性定義基數(shù)、業(yè)務(wù)規(guī)則或其他約束,在信息需求定義的基礎(chǔ)上,部分概念數(shù)據(jù)模型還需要定義操作斷言、約束和派生等內(nèi)容,設(shè)置基數(shù)和約束,以及限制編碼元素的可能值等內(nèi)容。主要包括以下內(nèi)容。
1)信息模型的完整性約束,如對(duì)數(shù)據(jù)進(jìn)行插入、修改、刪除等操作時(shí),數(shù)據(jù)庫(kù)管理系統(tǒng)自動(dòng)按照一定的約束條件對(duì)數(shù)據(jù)進(jìn)行監(jiān)測(cè),防止不符合規(guī)范的數(shù)據(jù)進(jìn)入數(shù)據(jù)庫(kù),需要信息模型設(shè)計(jì)中指定完整性約束。
2)定義推論和數(shù)學(xué)計(jì)算,在部分業(yè)務(wù)服務(wù)中需要設(shè)計(jì)數(shù)學(xué)推理和運(yùn)算的規(guī)則。
3)定義業(yè)務(wù)規(guī)則條件和同現(xiàn)約束,對(duì)業(yè)務(wù)服務(wù)的規(guī)則條件或多個(gè)業(yè)務(wù)服務(wù)的共同約束進(jìn)行定義。
4)設(shè)置編碼數(shù)據(jù)元素允許的值集,如部分業(yè)務(wù)服務(wù)中,表示月份的數(shù)字范圍為0~12,表示日期的數(shù)字范圍為0~31等。
電子訂單數(shù)據(jù)模型信息需求與核心詞匯對(duì)應(yīng)關(guān)系如表7所示。
表7 信息需求與核心詞匯對(duì)應(yīng)表
語(yǔ)法綁定作用是將信息需求綁定到具有給定語(yǔ)法的實(shí)際元素中,實(shí)現(xiàn)信息需求模型到已有的語(yǔ)法模型的映射,其過程主要包括:
1)選擇語(yǔ)法表示格式。信息需求的方式實(shí)現(xiàn)多樣,根據(jù)應(yīng)用情況不同可以選擇不同格式,如在構(gòu)建信息交換模型或領(lǐng)域模型時(shí)可選用XML Schema,關(guān)聯(lián)數(shù)據(jù)(Link Data)[7],在構(gòu)建數(shù)據(jù)庫(kù)模型時(shí)選用SQL等。
2)選擇語(yǔ)法綁定標(biāo)準(zhǔn)以及命名設(shè)計(jì)規(guī)則。根據(jù)概念數(shù)據(jù)模型的業(yè)務(wù)領(lǐng)域和選擇的表示格式,可以選擇多種標(biāo)準(zhǔn)語(yǔ)法。有些標(biāo)準(zhǔn)語(yǔ)法支持特定的業(yè)務(wù)領(lǐng)域,如HL7支持健康領(lǐng)域建模,XBRL(Extensible Business Reporting Language,XBRL)定義了財(cái)務(wù)報(bào)告業(yè)務(wù)的規(guī)范、分類標(biāo)準(zhǔn)、實(shí)例等內(nèi)容,適用于財(cái)務(wù)報(bào)告業(yè)務(wù)領(lǐng)域建模。此外,除了標(biāo)準(zhǔn)語(yǔ)法的綁定,還可以通過選擇命名設(shè)計(jì)規(guī)則創(chuàng)建實(shí)際應(yīng)用中的語(yǔ)法。
3)使用現(xiàn)有可用映射。核心詞匯表預(yù)定義了一組到現(xiàn)有標(biāo)準(zhǔn)語(yǔ)法的映射,將相同的概念映射到不同語(yǔ)法中的相同元素中,從而保證不同領(lǐng)域之間同樣的語(yǔ)法元素具有概念一致性。目前,核心詞匯表提供了與Core Vocabularies RDF Schemas、OASIS Universal Business Language 2.1、UN/CEFACT CCL 13B和NIEM 3.0等語(yǔ)法的映射關(guān)系。表8為本例中所用到核心詞匯與UBL語(yǔ)法的部分映射。
表8 核心詞匯表到UBL標(biāo)準(zhǔn)語(yǔ)法映射表
4)語(yǔ)法綁定。根據(jù)核心詞匯表提供的映射關(guān)系,針對(duì)具體訂購(gòu)業(yè)務(wù)流程中每個(gè)信息需求進(jìn)行具體的語(yǔ)法綁定。本例部分語(yǔ)法綁定如表9所示。
表9 核心詞匯表語(yǔ)法綁定
5)創(chuàng)建校驗(yàn)?zāi)J轿募?。?duì)于XML格式,可以利用XSD模式驗(yàn)證特定的XML文檔實(shí)例是否滿足標(biāo)準(zhǔn)定義的結(jié)構(gòu)和類型約束。在標(biāo)準(zhǔn)限制之上添加額外約束的情況下,需創(chuàng)建額外的驗(yàn)證規(guī)則,以允許用戶驗(yàn)證實(shí)例是否滿足新的數(shù)據(jù)模型限制。具體的創(chuàng)建校驗(yàn)?zāi)J轿募?nèi)容有:一是創(chuàng)建受限XSD模式,XSD受限模式可以限制新數(shù)據(jù)模型中元素和屬性;二是Schematron驗(yàn)證文件,可以檢查新模型中所需數(shù)據(jù)元素,并確保沒有不屬于該數(shù)據(jù)模型的元素。校驗(yàn)?zāi)J轿募?chuàng)建可以采用工具輔助完成,比如基于XML Schema的XGenerator、GEFEG.FX等工具,以及基于RDF Schema的Top Braid Composer、Protégé等工具。
此階段主要通過映射方式創(chuàng)建用戶使用的數(shù)據(jù)模型,同時(shí)在數(shù)據(jù)模型中指定在第四步創(chuàng)建的校驗(yàn)?zāi)J轿募?實(shí)現(xiàn)對(duì)用戶數(shù)據(jù)模型及數(shù)據(jù)的校驗(yàn)。映射應(yīng)按照核心詞匯表提供的映射電子表格文檔實(shí)施,該映射電子表格在核心詞匯表的最新版本壓縮包中。
在數(shù)據(jù)模型中需要通過映射元數(shù)據(jù)對(duì)映射進(jìn)行注釋,實(shí)現(xiàn)數(shù)據(jù)模型的自描述。映射元數(shù)據(jù)一般包括標(biāo)識(shí)符、標(biāo)簽、定義、URI、核心詞匯表版本號(hào)、映射關(guān)系、映射說(shuō)明等。
圖5為XML Schema中的映射注釋示例,映射元數(shù)據(jù)包含在
歐盟電子政務(wù)核心詞匯表是為解決歐盟跨領(lǐng)域電子政務(wù)信息共享服務(wù)中面臨的語(yǔ)義沖突問題,所定義的一套用于描述記錄客觀世界數(shù)據(jù)實(shí)體的基本特征、概念等內(nèi)容的簡(jiǎn)化的、可重用的、可擴(kuò)展的數(shù)據(jù)模型。核心詞匯表使用了基于UML的概念模型、XML、RDF、JOSN-LD等技術(shù)描述手段,通過擴(kuò)展類屬性、關(guān)聯(lián)的方式構(gòu)建用于滿足業(yè)務(wù)域數(shù)據(jù)交換需求的概念數(shù)據(jù)模型,實(shí)現(xiàn)從核心數(shù)據(jù)模型到領(lǐng)域數(shù)據(jù)模型、信息數(shù)據(jù)模型的擴(kuò)展派生。同時(shí),核心詞匯表提供了到現(xiàn)有標(biāo)準(zhǔn)語(yǔ)法的映射,通過語(yǔ)法綁定方式實(shí)現(xiàn)信息需求到現(xiàn)有標(biāo)準(zhǔn)語(yǔ)法中實(shí)際元素的綁定,并最終通過映射方式創(chuàng)建供用戶使用的數(shù)據(jù)模型。核心詞匯表為實(shí)現(xiàn)歐盟不同領(lǐng)域、不同系統(tǒng)之間的數(shù)據(jù)交換與共享提供了共同認(rèn)可的數(shù)據(jù)模型規(guī)范,為不同領(lǐng)域信息交換模型的開發(fā)提供了依據(jù)和參考,保證了交換數(shù)據(jù)的可理解、可共享、可整合。
歐盟電子政務(wù)核心詞匯表為我國(guó)電子政務(wù)服務(wù)中跨領(lǐng)域信息共享服務(wù)建設(shè)提供了借鑒參考,主要有以下三點(diǎn):一是構(gòu)建開放共享的數(shù)據(jù)模型標(biāo)準(zhǔn)規(guī)范,為實(shí)現(xiàn)不同系統(tǒng)之間互操作提供依據(jù);二是采用由核心層向具體領(lǐng)域?qū)訑U(kuò)展的數(shù)據(jù)模型構(gòu)建方式,保證了在構(gòu)建具體領(lǐng)域數(shù)據(jù)模型時(shí)的靈活性和可擴(kuò)展性;三是采用映射到現(xiàn)有的標(biāo)準(zhǔn)語(yǔ)法的方式構(gòu)建數(shù)據(jù)模型,可有效促進(jìn)不同語(yǔ)法之間的可理解性,同時(shí)在數(shù)據(jù)模型構(gòu)建上簡(jiǎn)化了工作流程,提高了資源的利用。在“互聯(lián)網(wǎng)+”背景下,信息資源高效共享逐漸成為我國(guó)電子政務(wù)建設(shè)中需要重點(diǎn)解決的問題。參考?xì)W盟核心詞匯設(shè)計(jì)特點(diǎn),建立統(tǒng)一的數(shù)據(jù)交換模型標(biāo)準(zhǔn),有利于建立兼容、開放、可擴(kuò)展的政務(wù)服務(wù)系統(tǒng)架構(gòu),形成互聯(lián)互通、共享共用的政務(wù)服務(wù)大數(shù)據(jù)應(yīng)用環(huán)境,有效促進(jìn)信息的開放共享和資源的整合,切實(shí)提高信息資源利用率以及政務(wù)服務(wù)的辦事效率。