摘要:為有效整合文旅行業(yè)數(shù)字化系統(tǒng)建設(shè),實現(xiàn)橫、縱向系統(tǒng)的數(shù)據(jù)融合,通過對文化和旅游行業(yè)研究,構(gòu)建符合業(yè)務(wù)管理實際現(xiàn)狀的數(shù)據(jù)分級分類和編碼規(guī)范標準,解決數(shù)據(jù)采集難、交換難、應用難的問題,破解數(shù)據(jù)多點維護、多方存儲、多頭管理的困境,通過數(shù)據(jù)編目、數(shù)據(jù)分類等方式構(gòu)建統(tǒng)一的數(shù)據(jù)編碼規(guī)范,準確識別文化和旅游數(shù)據(jù)集,將文旅數(shù)據(jù)進行分類標識,明確數(shù)據(jù)類型,形成有效的數(shù)據(jù)要素,發(fā)揮數(shù)據(jù)價值。
關(guān)鍵詞:分級分類;數(shù)據(jù)共享;數(shù)據(jù)要素;數(shù)據(jù)編目;數(shù)據(jù)編碼
一、前言
文旅融合以后,在進行機構(gòu)整合、業(yè)務(wù)整合、系統(tǒng)整合的過程中,由于各層級、各部門的信息化基礎(chǔ)水平不一,對信息化系統(tǒng)的應用程度不同,各項業(yè)務(wù)數(shù)字化的要求和流程有差異,線上線下通過不同方式存儲的各類數(shù)據(jù)紛雜繁多,行業(yè)內(nèi)沒有一個符合文旅行業(yè)和業(yè)務(wù)管理實際現(xiàn)狀的文化旅游數(shù)據(jù)分級分類及編碼規(guī)范標準,無法有效地進行跨層級、跨地域、跨系統(tǒng)、跨部門、跨業(yè)務(wù)的多源異構(gòu)數(shù)據(jù)整合,也無法將這些數(shù)據(jù)采集歸納、共享交換、分析應用[1]。為有效解決數(shù)據(jù)采集難、交換難、應用難的問題,破解數(shù)據(jù)多點維護、多方存儲、多頭管理的困境,通過數(shù)據(jù)編目、數(shù)據(jù)分類等方式構(gòu)建統(tǒng)一的《文化和旅游數(shù)據(jù)分級分類及編碼規(guī)范》(以下簡稱《規(guī)范》),準確識別文化和旅游數(shù)據(jù)集,將文旅數(shù)據(jù)進行分類標識,明確數(shù)據(jù)類型,實施對數(shù)據(jù)的有效分析,并能按類別開發(fā)、利用數(shù)據(jù),實現(xiàn)數(shù)據(jù)標準化和規(guī)范化管理,形成“多源匯集、實時共享”的文旅數(shù)據(jù)中心,進一步加強數(shù)據(jù)融合,發(fā)揮數(shù)據(jù)價值[2-3]。
二、研究思路和原則
(一) 研究思路
本規(guī)范主要以文旅管理部門職責范圍內(nèi)的管理主體為研究對象,充分考慮文化和旅游資源的基本屬性、存在形式、主要表現(xiàn)方式和數(shù)據(jù)價值,兼顧行業(yè)管理和數(shù)據(jù)采集、分析的需要,通過標準的規(guī)劃理論,開展以下研究:一是各文旅數(shù)據(jù)需求單位的業(yè)務(wù)現(xiàn)狀與問題的研究;二是數(shù)據(jù)規(guī)劃標準及方法的研究;三是文旅數(shù)據(jù)規(guī)劃及文旅數(shù)據(jù)共享創(chuàng)新應用新模式的研究。充分發(fā)揮數(shù)據(jù)要素驅(qū)動作用,讓數(shù)據(jù)資產(chǎn)“寫文旅字、 說文旅話”,讓各域數(shù)據(jù)在同一個“頻道” 溝通,為實現(xiàn)文旅全域的數(shù)據(jù)共享與融合應用奠定基礎(chǔ)[4-5]。
(二) 研究原則
按照“縱向到底、橫向到邊”的工作要求,根據(jù)“家底要清、邊界要明、數(shù)據(jù)可用”的工作原則開展編制。編制核心是使用運用數(shù)據(jù)規(guī)劃理論及方法,基于文旅行業(yè)的核心數(shù)據(jù)資產(chǎn),建立符合自身需求的數(shù)據(jù)規(guī)劃體系、編碼規(guī)范,用于提高數(shù)據(jù)質(zhì)量,將數(shù)據(jù)價值最大化。
三、研究方法
(一)業(yè)務(wù)分析
1.全面整合機構(gòu)職能,進行職能域劃分
形成文旅管理部門職責統(tǒng)一的職能域劃分,劃分按照面向全部職能域或主要職能域的范圍原則,以政務(wù)運行、行業(yè)服務(wù)、文旅產(chǎn)業(yè)、文化事業(yè)、其他等管理職責為定義的核心重點,建立省文旅管理職責與當前機構(gòu)的關(guān)系覆蓋矩陣。職能劃分和定義具有穩(wěn)定性,職能不變、職能域不變。
2.全面梳理和優(yōu)化業(yè)務(wù)流程,建立業(yè)務(wù)模型
文旅政府在職能域框架下完成業(yè)務(wù)過程定義和業(yè)務(wù)活動識別,形成穩(wěn)定的業(yè)務(wù)模型,用于指導視圖的識別分析。
3.規(guī)范用戶視圖,完成用戶視圖規(guī)范化分析
依托職能域、業(yè)務(wù)過程所涉及的主要業(yè)務(wù),規(guī)范化處理數(shù)據(jù)流轉(zhuǎn)中產(chǎn)生的用戶視圖。完成文旅政府視圖規(guī)范化整理,定義相關(guān)數(shù)據(jù)元。
(二)數(shù)據(jù)分析與定義
數(shù)據(jù)分析與定義是面向?qū)嶓w對數(shù)據(jù)元的規(guī)劃和梳理,明確數(shù)據(jù)元相關(guān)元數(shù)據(jù)、類別、層級、編碼。定義完成的數(shù)據(jù)元將歸集形成文旅數(shù)據(jù)目錄,為主題庫和數(shù)據(jù)模型的創(chuàng)建提供支撐,是系統(tǒng)集成和信息共享的基礎(chǔ)。
(三)規(guī)范制定
規(guī)范的制定是資源規(guī)劃工作的重要成果體現(xiàn),通過對重要數(shù)據(jù)元的提煉,形成核心且穩(wěn)定的分級分類及編碼約定是文旅數(shù)據(jù)應用的重要指導規(guī)范,也是全省文旅編碼的唯一標準,為各級文旅單位數(shù)據(jù)規(guī)范和擴展需求提供統(tǒng)一的作業(yè)支撐依據(jù)。
四、分級分類及編碼規(guī)范
(一)分級分類方法
分級方法:文化和旅游數(shù)據(jù)編目按業(yè)務(wù)對象的敏感程度和受影響程度劃分為8域4級。其他單位可在合規(guī)性要求下,結(jié)合自身特性需求增補更細粒度的等級。
分類方法:以科學數(shù)據(jù)分類體系為指導,每個類目以具有某種共同屬性(或特征)的事務(wù)(或概念)的歸集為特定主題,表達該主題對應學科知識的內(nèi)涵和外延。采用“線分類法”或“面分類法”進行主題劃分。
(二) 職能域與業(yè)務(wù)過程
描述文化和旅游管理部門業(yè)務(wù)模型,包括職能域標識符、職能域名稱、管理目標、業(yè)務(wù)過程標識符、業(yè)務(wù)過程名稱、單位/處室、業(yè)務(wù)過程描述。
1.職能域標識符:兩位索引號,文本數(shù)字遞增順序碼,職能域標識符從01開始編流水號。
2.職能域名稱:賦予職能域單個或多個的稱謂。
3.管理目標:對職能域所屬管理職能目標的概要描述。
4.業(yè)務(wù)過程標識符:業(yè)務(wù)過程編碼的索引號。設(shè)定7位編碼,包括1位大寫字母和6位數(shù)字,具體編碼規(guī)則如圖1所示。
5.業(yè)務(wù)過程名稱:賦予業(yè)務(wù)過程單個或多個字詞的稱謂。
6.單位/處室:業(yè)務(wù)過程組具體業(yè)務(wù)責任單位或處室名稱。
7.業(yè)務(wù)過程描述:責任單獨或處室在對應業(yè)務(wù)過程組的主要職責描述。
(三)用戶視圖目錄
匯聚業(yè)務(wù)過程所產(chǎn)生的用戶視圖,按業(yè)務(wù)過程形成用戶視圖目錄,包括用戶視圖標識符、流向、類型、來源、周期,并適配職能域、業(yè)務(wù)過程名稱。
1.職能域名稱:用戶視圖所屬職能域名稱。
2.業(yè)務(wù)過程名稱:用戶視圖所屬業(yè)務(wù)過程名稱。
3.用戶視圖標識符:用戶視圖編碼的索引號。設(shè)定7位編碼,包括1位大寫字母和6位數(shù)字,具體編碼規(guī)則如圖2所示。
4.用戶視圖名稱:用戶視圖單個或多個字詞的稱謂。
5.視圖流向:用戶視圖數(shù)據(jù)流向,分輸入(01)、存儲(02)、輸出(03)。
輸入:由其他業(yè)務(wù)過程流向所屬業(yè)務(wù)過程的用戶視圖,代碼為01。
存儲:由所屬業(yè)務(wù)過程內(nèi)部產(chǎn)生使用的用戶視圖,代碼為02。
輸出:由所屬業(yè)務(wù)過程產(chǎn)生,流出由其他業(yè)務(wù)過程使用的用戶視圖,代碼為03。
6.類型:用戶實體的填報和統(tǒng)計定義,分表單、報表、賬冊和屏幕格式等。
7.來源:用戶視圖產(chǎn)生的載體。
8.周期:用戶視圖的填報或統(tǒng)計周期表示,周期約定為實時、月度、季度、半年度、年度。
9.備注:對用戶視圖的備注說明描述。
(四)用戶視圖分析
1.職能域:用戶視圖所屬職能域名稱。
2.用戶視圖標識符:用戶視圖7位編碼的索引號。
3.序號:用戶視圖的數(shù)據(jù)項序列號。
4.數(shù)據(jù)項:組成用戶視圖的基本數(shù)據(jù)單位或一系列數(shù)據(jù)的稱謂。
5.指標名稱:數(shù)據(jù)項適配的指標名稱。指標的名稱標準由“修飾詞—基本詞—類別詞”構(gòu)成,修飾詞可有多個,也可不含(如“酒店客房數(shù)量”,“酒店”為修飾詞,“客房”為基本詞,“數(shù)量”為類別詞)。
6.數(shù)據(jù)元素名稱:數(shù)據(jù)項適配的數(shù)據(jù)元素名稱。數(shù)據(jù)元素的名稱標準由“修飾詞—基本詞—類別詞”構(gòu)成。
7.備注:數(shù)據(jù)項的備注說明描述。
(五)指標目錄
依照規(guī)劃標準定義指標的元數(shù)據(jù)用于描述和規(guī)范指標,形成指標目錄。指標目錄定義包括序號、指標名稱、英文短名、職能域、數(shù)據(jù)來源。
1.序號:唯一標識指標序列號,序列號由該指標“所屬用戶視圖標識符—所屬用戶視圖對應數(shù)據(jù)項序號”組成。
2.指標名稱:賦予指標單個或多個中文字詞的稱謂。
3.英文短名:指標的英文縮寫代碼。
英文短名遵循如下命名規(guī)則:
(1)英文短名在本標準范圍內(nèi)必須唯一。
(2)對存在于國際或行業(yè)領(lǐng)域的慣用英文縮寫,盡量采用該英文縮寫。
(3)英文短名應由構(gòu)成數(shù)據(jù)元名稱的各個成分(即修飾詞、基本詞、類別詞)的英文單詞轉(zhuǎn)化而來。
(4)英文短名可以使用英文單詞的全拼、縮寫詞、縮略詞或其他的截斷表示法,表示法盡量與常人的認知一致。
(5)縮略后的數(shù)據(jù)元英文短名長度不超過16個字符(若超過16個字符,則取各單詞首字母,且用下劃線“_ ”分隔)。如短名組成的某單詞全長不超過4位,不再縮略,比如NAME、TYPE等。
(6)在系統(tǒng)設(shè)計、開發(fā)和數(shù)據(jù)庫建設(shè)中,英文短名可等同于字段名。
4.職能域:指標所屬用戶視圖所屬的職能域名稱。
5.數(shù)據(jù)來源:指標所屬用戶視圖的載體。
(六)數(shù)據(jù)元素目錄
依照規(guī)劃標準定義數(shù)據(jù)元素的元數(shù)據(jù)用于描述和規(guī)范數(shù)據(jù)元素,形成數(shù)據(jù)元素目錄。數(shù)據(jù)元素目錄定義包括序號、中文名稱、英文短名、數(shù)據(jù)類型、是否編碼、數(shù)據(jù)分類、編碼名稱、備注。
1.序號:唯一標識數(shù)據(jù)元素序列號,序列號由該數(shù)據(jù)元素“所屬用戶視圖標識符——所屬用戶視圖對應數(shù)據(jù)項序號”組成。
2.中文名稱:賦予數(shù)據(jù)元素單個或多個中文字詞的稱謂。
3.英文短名:數(shù)據(jù)元素的英文縮寫代碼。
英文短名遵循如下命名規(guī)則:
(1)英文短名在本標準范圍內(nèi)必須唯一。
(2)對存在于國際或行業(yè)領(lǐng)域的慣用英文縮寫,盡量采用該英文縮寫。
(3)英文短名應由構(gòu)成數(shù)據(jù)元名稱的各個成分(即修飾詞、基本詞、類別詞)的英文單詞轉(zhuǎn)化而來。
(4)英文短名可以使用英文單詞的全拼、縮寫詞、縮略詞或其他的截斷表示法,表示法盡量與常人的認知一致。
(5)縮略后的數(shù)據(jù)元英文短名長度不超過16個字符(若超過16個字符,則取各單詞首字母,且用下劃線“_ ”分隔)。如短名組成的某單詞全長不超過4位,不再縮略,比如NAME、TYPE等。
(6)在系統(tǒng)設(shè)計、開發(fā)和數(shù)據(jù)庫建設(shè)中,英文短名可等同于字段名。
4.數(shù)據(jù)類型:表示數(shù)據(jù)元素值的不同值的集合。數(shù)據(jù)元素值使用的數(shù)據(jù)類型見表1數(shù)據(jù)類型表示。
5.是否編碼:通過數(shù)據(jù)元素實體屬性,定義數(shù)據(jù)元素是否需要規(guī)范編碼。
6.數(shù)據(jù)分類:按數(shù)據(jù)部署方式進行劃分,劃分為基礎(chǔ)數(shù)據(jù)和業(yè)務(wù)數(shù)據(jù)。在系統(tǒng)部署時必須進行初始化的數(shù)據(jù)歸為基礎(chǔ)數(shù)據(jù),其余為業(yè)務(wù)數(shù)據(jù)。
7.編碼名稱:需要編碼的數(shù)據(jù)元素對應編碼的稱謂。
8.備注:數(shù)據(jù)元素的備注說明描述。
(七)編碼原則
1.唯一性原則:唯一性是文化和旅游數(shù)據(jù)編碼的最基本原則,一個資源只賦予一個編碼。
2.穩(wěn)定性原則:編碼體系一旦確認,應保持其相對穩(wěn)定性。
3.實用性原則:編碼需要充分考慮文化和旅游的復雜性,不僅要保證行業(yè)內(nèi)數(shù)據(jù)的實用性,還要充分考慮相關(guān)行業(yè)、部門引用文化和旅游數(shù)據(jù)的實用性。
4.可延展性原則:為了充分保障編碼的可延展性,編碼的各個部分均保留空余代碼,保證編碼能夠充分滿足文化和旅游行業(yè)未來快速發(fā)展的需求。
(八)編碼分類
根據(jù)信息內(nèi)容的屬性或特征,將需編碼的數(shù)據(jù)元的信息對象按一定的原則和方法進行區(qū)分和歸類。按編碼名稱、編碼對象、備注三個元數(shù)據(jù)來描述和規(guī)范編碼分類。
1.編碼名稱:賦予編碼分類單個或多個中文字詞的稱謂。
2.編碼對象:編碼分級分類的具體對象名稱。
3.備注:編碼名稱或編碼對象的備注說明描述。
(九)編碼規(guī)范
1.編碼結(jié)構(gòu):文化和旅游資源編碼由行政代碼、主類代碼、亞類代碼、子類代碼、保留碼、順序碼和校驗碼組成,共21位。
2.編碼規(guī)則 :編碼規(guī)則如圖3所示。
(1)行政區(qū)劃代碼:行政區(qū)劃代碼由6位數(shù)字組成,按GB/T 2260-2007《中華人民共和國行政區(qū)劃代碼》中的要求進行表示。
(2)主類代碼:主類代碼采用2位數(shù)字構(gòu)成,代碼從“01”開始。
(3)亞類代碼:亞類代碼采用2位數(shù)字構(gòu)成,代碼從“01”開始。如主類下無亞類,使用“00”表示。代碼“99”表示該主類下其他的亞類。
(4)子類代碼:子類代碼采用3位數(shù)字構(gòu)成,代碼從“001”開始。如該亞類下無子類,使用代碼“000”表示。代碼“999”表示該亞類下其他的子類。
(5)保留碼:由2位數(shù)字構(gòu)成,保留用于對資源使用和管理方面的其他需求。
(6)順序碼:由5位數(shù)字構(gòu)成,用于標識同一子類下的資源序列。
(7)校驗碼:由1位數(shù)字構(gòu)成,由編碼的前20位代碼通過運算得出,用以檢驗該編碼的正確性。
五、結(jié)語
《規(guī)范》是全國首部文旅行業(yè)數(shù)據(jù)字典,是推動四川省數(shù)字文旅產(chǎn)業(yè)發(fā)展的基礎(chǔ)“底座”,是所有軟件系統(tǒng)中的“硬件”。該項工作的價值主要體現(xiàn)在三個方面:一是在行業(yè)管理方面,《規(guī)范》形成了文旅行業(yè)系統(tǒng)性、框架式的數(shù)據(jù)信息范式,可以指導市(州)文旅部門規(guī)劃信息化系統(tǒng)建設(shè),促進文旅數(shù)據(jù)跨平臺交換共享,提升全省文旅信息系統(tǒng)的兼容性和整體性,避免資源浪費和無效投入。二是在數(shù)據(jù)價值方面,《規(guī)范》能夠清晰展現(xiàn)文旅數(shù)據(jù)“有哪些,屬于誰,從哪來”,有利于形成基于數(shù)據(jù)確權(quán)后的共享應用,助力資源數(shù)字化、數(shù)字資產(chǎn)化、數(shù)字產(chǎn)業(yè)化,以文旅數(shù)據(jù)價值鏈重構(gòu),推動文旅產(chǎn)業(yè)鏈重塑。三是在產(chǎn)業(yè)分析方面,《規(guī)范》為文旅大數(shù)據(jù)建模提供了基本依據(jù),可以進一步清洗、形成文旅行業(yè)核心數(shù)據(jù)目錄,構(gòu)建基于大數(shù)據(jù)的文旅產(chǎn)業(yè)分析能力。
參考文獻
[1]黃震方,張子昂,李濤,等.數(shù)字賦能文旅深度融合的理論邏輯與研究框架[J].旅游科學,2024,38(01):1-16.
[2]胡康,郭金成,李健.數(shù)據(jù)分類分級標準化探索——以某研究院為例[J].中國信息化,2023(09):54-56.
[3]石兆華.吉林省冰雪資源評價及旅游開發(fā)適宜性研究[D].長春:東北師范大學,2023.
[4]文玲,李瑛.大數(shù)據(jù)和旅游統(tǒng)計[J].旅游學刊,2017,32(09):6-8.
[5]李響,張晶,江南,等.一種綜合位置簽到數(shù)據(jù)和景點分級信息的旅游景點評價方法[J].測繪科學技術(shù)學報,2015,32(04):405-411.
作者單位:王春鵬,四川智勝慧旅科技有限公司;成冬娟、張玉梅,四川省文化和旅游宣傳信息中心
責任編輯:王穎振、楊惠娟