張微微,張 立
第一作者簡介:張微微(1991-),女,北京人,助理工程師,本科,研究方向:體育信息。
作者單位:國家體育總局體育信息中心,北京 100061 Sport Information Administrative Center of General Administration of Sport, Beijing 100061, China.
《國務院關于加快發(fā)展體育產業(yè) 促進體育消費的若干意見》(國發(fā)〔2014〕46號)文件中明確指出,要加強行業(yè)管理,“完善體育及相關產業(yè)分類標準和統(tǒng)計制度”。體育單位名錄庫建設是完善體育產業(yè)統(tǒng)計制度工作中的一項重要內容。受承擔國家體育總局體育產業(yè)管理轉移職能任務的總局體育器材裝備中心的委托,總局體育信息中心專項工作團隊在2016-2017兩年里承擔并創(chuàng)新組織開展了體育單位名錄庫的結構設計、工程建設、數據處理和應用管理等研究與服務工作,這是我國首次開展網絡版的體育單位名錄庫建設項目,為各級體育部門開展體育產業(yè)基本單位核查、規(guī)模核算、產業(yè)管理和專題研究等工作提供了技術支持。其名錄庫數據結果為核算、發(fā)布我國2015年、2016年體育產業(yè)規(guī)模發(fā)揮了重要的基礎作用。在兩年多的建設周期里,項目組主要對體育單位名錄數據采集處理流程和數據庫技術支撐、管理平臺的網絡結構設計與技術實現、名錄數據的屬性設計和元數據的規(guī)范建設、名錄數據的統(tǒng)計利用、多年名錄數據的管理與檢索利用等問題進行了探索。
從國家統(tǒng)計局的國家基本單位名錄庫中檢索出的部分單位名錄數據信息,經各級地方體育部門組織審核并逐級報送的體育單位名錄信息,部分地方體育部門自行采集到的體育單位名錄信息,以及上述數據的采集、處理和共享利用等過程。
本項目主要采用了文獻研究、走訪調查、邏輯分析、軟件編程與平臺開發(fā)等研究方法。具體包括:通過查閱文獻,對相關數據元、數據庫、體育產業(yè)研究等文獻進行綜合分析;通過走訪國家統(tǒng)計局相關部門、部分地方省市體育產業(yè)管理部門、有關專家等,明確體育單位名錄庫建設需求,確定專用的庫檢索主題詞;根據體育產業(yè)研究需求,邏輯分析體育單位名錄各字段屬性間的關系,確定數理統(tǒng)計模型等。
3.1.1 數字化處理從國家和地方統(tǒng)計局等部門檢索獲得的相關單位名錄數據
體育產業(yè)統(tǒng)計作為國民經濟核算體系中的一部分(1),體育產業(yè)統(tǒng)計工作必須遵循的一個原則是體育部門要與國家統(tǒng)計部門密切合作,在共享已有統(tǒng)計數據的基礎上開展體育產業(yè)統(tǒng)計基礎數據建設活動(2)。
經走訪調研相關部門,項目組了解到國家統(tǒng)計局在經濟普查數據基礎上建立有國家基本單位名錄庫,國家體育總局體育器材裝備中心首先按照《國家體育產業(yè)分類》(3)對應的130個國民經濟行業(yè)代碼從國家統(tǒng)計局基本單位名錄庫中提取出相關單位名錄數據251萬條,然后由項目組用專用主題詞對其進行檢索處理,之后,在總局經濟司和體育器材裝備中心的統(tǒng)一組織下,項目組將初步的體育單位名錄數據下發(fā)給全國31個省區(qū)市體育局所轄的地市、區(qū)縣體育局,基層區(qū)縣體育部門對所得到的名錄數據有組織地進行了上門走訪、電話咨詢等實地核查,根據核查結果對庫中數據進行增刪、修改等處理。
部分省區(qū)市體育局從省統(tǒng)計局、工商局、稅務局、教育局、民政局等行政機構同樣利用行業(yè)代碼抽取和專用主題詞檢索等方法獲得地方數據115萬條單位名錄數據。這些省區(qū)市的數據在下發(fā)基層體育部門之前由項目組將其與總局下發(fā)數據進行融合處理,然后才下發(fā)區(qū)縣體育局。
2016年調研設計、實際使用的專用主題詞主要包含有“運動項目名稱”“體育”等專有詞匯116個。
3.1.2 對上述數據進行自動查重比對、自動分類等數字化處理后形成可分發(fā)核查的調查數據
在對多源數據進行融合處理的過程中會產生許多重復數據,查重比對功能可以幫助用戶盡快找出并修改或刪除處理系統(tǒng)中出現的重復數據。具體做法是:比較數據的“組織機構代碼/統(tǒng)一社會信用碼”和“單位名稱”兩字段內容,當出現一個或兩個重復字段內容時,即可初步判斷此類數據為重復數據。系統(tǒng)軟件針對重復數據提供了同頁比對的功能,便于基層體育部門的工作人員進行修改、刪減處理,本級賬戶可采取更改或不更改兩種處理方式,對不更改的數據可直接流轉到下一步,對擬更改的數據用戶可通過比對方式對其進行修改、刪除等操作,最終達到只保留一條準確數據的目的。
體育單位名錄數據通過系統(tǒng)的自動分類功能實現了分類處理,具體做法是:將名錄數據中的國民經濟行業(yè)分類代碼字段內容按《國家體育產業(yè)分類》文件[1]中與體育分類代碼的對應關系用編程方法進行了自動匹配,使許多單位名錄信息中自動生成了體育分類代碼,對因有一對多或多對一代碼而導致無法自動匹配的類別,軟件提供了人工匹配功能。
另外,為方便體育單位名錄數據實地核查和修改、增刪記錄等工作需要,系統(tǒng)還提供了自動顯示調查表主要字段解釋內容、多字段批量處理、對各數據記錄修改前后用不同底色顯現以示區(qū)別等功能。
3.1.3 為四級聯網核查、報審體育單位名錄數據提供數據庫技術支撐
根據體育單位名錄核查工作需要,項目組調研設計了體育總局分發(fā)數據,區(qū)縣體育部門組織實際核查與上報,地市和省區(qū)市體育部門逐級審核與上報,體育總局終審與封板數據等信息化流程。
在國家體育總局體育器材裝備中心的統(tǒng)一領導和各省區(qū)市體育局的具體組織下,區(qū)縣級體育部門組織調查人員到體育機構所在地,現場核對單位名錄信息,之后通過軟件將相關數據上報給地市級單位用戶,地市級單位用戶審核后將數據上報省級用戶,以此類推最終將各級核實過的數據上報給國家體育總局用戶,從而完成了每一條數據的流動過程。體育單位名錄庫管理軟件具有較強的審核糾錯管理功能,區(qū)縣級實地核查和體育總局、地市、省級三級審核的過程,保證了體育單位名錄數據的準確性。
圖1 體育單位名錄核查、報審信息化流程圖示
在分析上述名錄數據采集、審核流程的基礎上,項目組組織開展了開發(fā)體育單位名錄庫軟件開發(fā)及調試使用工作。具體采用了echarts+jquery輔助開發(fā)工具,在有限時間里完成了網絡版“體育單位名錄管理平臺”的軟件開發(fā)和部署建設任務,形成了系統(tǒng)管理員+四層級管理用戶的平臺框架,搭建了共建、共享的體育單位名錄采集利用平臺,實現了多級、同步導、錄、增、刪、查等多種應用功能,其中,系統(tǒng)管理員擁有用戶賬號管理、檢索分類、排重處理、分派任務等功能,國家、省區(qū)市、地市、區(qū)縣四級調研審核單位用戶擁有密碼管理、分類處理、分級核查、增刪改查等功能。
項目組設計的體育單位名錄庫的信息采集結構是:以國家統(tǒng)計局的基礎名錄庫為基礎(與體育相關的國民經濟行業(yè)代碼有130個),依托各級體育局,最終實現了1個總局、31個省/區(qū)/直轄市、340個地市、3020個區(qū)縣等眾多用戶的同步四級審核、分類處理、增刪改查的即時、動態(tài)的網絡傳輸系統(tǒng)構架。
圖2 四級、多用戶同步審核、處理體育單位名錄
3.3.1 體育單位名錄屬性設計
經走訪國家統(tǒng)計局設管司、服務業(yè)司、核算司、普查中心等部門處室負責人和相關專家,調研設計了體育單位名錄元數據基本屬性,在滿足今后長期與國家統(tǒng)計局普查中心開展數據交換及體育產業(yè)統(tǒng)計核算需求的條件下,項目組研究了體育單位名錄的基本屬性信息,初步設計了體育產業(yè)單位名錄基本情況表。在過去兩年的實際應用基礎上,根據體育產業(yè)單位特點及管理部門的管理需求又逐步補充增加了相應指標,形成了現行的體育產業(yè)單位名錄基本情況表。
表1 體育單位名錄基本屬性及相關字段設計一覽表
3.3.2 研制體育單位名錄元數據規(guī)范
體育單位名錄信息不僅是體育產業(yè)統(tǒng)計的基礎內容,也是體育信息化建設所需的基本數據,我國競技體育、全民健身、體育產業(yè)、體育管理等領域的信息化建設同樣會因有各種體育單位的參與而需要規(guī)范的名錄信息。因此,在開展體育單位名錄庫建設的同時,項目組在調研相關體育信息化工作實踐、咨詢中國標準化研究院高新技術與信息標準化研究所等單位專家的基礎上,聯手山東體育產業(yè)發(fā)展中心和北京吉瑞德商科技有限公司開展了體育單位名錄元數據規(guī)范研究。
體育單位名錄元數據規(guī)范主要是通過一系列數據屬性來表示體育單位名錄數據的,這些數據屬性主要包括:數據標識、中文名稱、同義詞、說明、數據類型、長度、數據精度、計量單位、值域、版本、約束/條件、最大出現次數等。規(guī)范文本主要由體育單位名錄基本屬性元數據列表、管理屬性元數據列表和信息分類代碼集構成。
作為體育單位名錄庫研制探索中的一項附帶成果,體育單位名錄元數據規(guī)范已于2017年通過了全國體育標準化技術委員會的立項評審,目前已并進入到了征詢意見和修改文稿階段。
在調研、分析數據內部結構規(guī)律的基礎上,項目組創(chuàng)新開發(fā)、實現了體育產業(yè)單位名錄基本屬性信息的自動統(tǒng)計等功能,可以為各級體育產業(yè)管理等相關機構開展體育產業(yè)統(tǒng)計工作所參考,促進實現了體育單位名錄數據的使用價值。另外,統(tǒng)計結果圖表也有輔助數據審核的功效,統(tǒng)計中如果出現明顯異常數據(如金額、人數數量過大等)情況,則可引起相關方面注意,以便有針對性地進一步核查、修改,以確保數據的準確性。
系統(tǒng)所提供的可直觀顯示統(tǒng)計結果的圖表有12組。
(1)不同體育類別的體育機構數量統(tǒng)計圖表:依據國家體育產業(yè)統(tǒng)計分類內容,可以直觀統(tǒng)計和顯示每個大、中、小分類中的體育機構分布數據圖表,其結果可為行業(yè)管理部門研究體育產業(yè)重點領域發(fā)展政策提供數據參考。
(2)不同層級地區(qū)體育機構數量統(tǒng)計圖表:該圖表直觀顯示各省區(qū)市、地市、區(qū)縣域內體育機構數量的統(tǒng)計結果,可以為各級體育部門促進發(fā)展體育產業(yè)工作提供數據支持。
(3)不同體育類別各層級地區(qū)體育機構數量統(tǒng)計圖表:以各層級地區(qū)及體育產業(yè)分類兩個條件開展體育機構數量統(tǒng)計,其圖表顯示結果有助于各級體育管理部門掌握所轄區(qū)域內從事不同體育產業(yè)類別活動的機構的分布情況。
(4)不同體育類別各大行政區(qū)劃體育機構數量統(tǒng)計圖表:按照東北、華北、華東、華中、華南、西南、西北等七個行政區(qū)劃進行不同體育產業(yè)類別的機構數量統(tǒng)計,可以直觀反應當年體育產業(yè)活動的區(qū)域化分布狀態(tài)。
(5)不同體育類別不同機構屬性體育機構數量統(tǒng)計圖表:圖表直觀顯示不同體育類別的不同登記注冊類型、營業(yè)狀態(tài)、機構類型、控股情況、主/兼營、會計制度類型等屬性下的體育機構數量,有助于國家相關職能管理部門全面掌握不同體育類別下的各屬性機構分布狀況。
(6)不同層級地區(qū)不同機構屬性體育機構數量統(tǒng)計圖表:直觀顯示不同層級地區(qū)的不同登記注冊類型、營業(yè)狀態(tài)、機構類型、控股情況、主/兼營、會計制度類型等屬性下的體育機構數量,有助于不同層級的體育管理者詳細掌握轄區(qū)內不同屬性的體育機構分布狀況。
(7)不同開業(yè)時間體育機構數量統(tǒng)計表:可以反應每年從事體育產業(yè)活動的機構的數量及其年度變化情況。
(8)不同體育項目體育機構數量統(tǒng)計表:反應從事相關體育項目的體育產業(yè)單位數量。
(9)不同層級地區(qū)各機構類型經濟指標統(tǒng)計表:對不同層級地區(qū)、不同機構類型體育機構的營業(yè)收入等主要經濟指標數據的統(tǒng)計結果,有助于國家相關部門全面了解機關、事業(yè)單位、社會團體、企業(yè)、民辦非營利機構等不同機構類型的產業(yè)活動經濟狀況。
(10)不同層級地區(qū)國民經濟行業(yè)類別體育機構數量從業(yè)人數經濟指標統(tǒng)計表:對省區(qū)市、地市、區(qū)縣不同層級地區(qū)不同國民經濟行業(yè)類別機構的營業(yè)收入等經濟指標和從業(yè)人數的統(tǒng)計結果,可以為核算各層級地區(qū)轄區(qū)內的體育產業(yè)規(guī)模、統(tǒng)計體育產業(yè)從業(yè)人數直接提供數據支撐。
(11)不同層級地區(qū)各體育類別體育機構數量從業(yè)人數經濟指標統(tǒng)計表:對省區(qū)市、地市、區(qū)縣不同層級地區(qū)不同體育產業(yè)類別機構的營業(yè)收入等經濟指標和從業(yè)人數的統(tǒng)計結果,可以為推動體育產業(yè)重點領域工作提供參考。
(12)不同層級地區(qū)不同機構屬性體育機構數量從業(yè)人數經濟指標統(tǒng)計表:對省區(qū)市、地市、區(qū)縣不同層級地區(qū)不同屬性(登記注冊類型、營業(yè)狀態(tài)、機構類型、控股情況、主/兼營、會計制度類型等)機構的營業(yè)收入等經濟指標和從業(yè)人數的統(tǒng)計結果,可以為精細化開展體育產業(yè)管理工作提供參考。
在對2015年的體育單位名錄數據進行核查、修改、上報之后,要進行不可更改的數據封閉處理。但系統(tǒng)仍可提供對封板數據進行查詢、統(tǒng)計的功能,查詢字段有:單位名稱、所在地(省區(qū)市、地市、區(qū)縣等)、體育產業(yè)類別、營業(yè)狀態(tài)、機構類型、控股情況、登記注冊類型等。根據封板數據查詢統(tǒng)計結果,可形成相關數據列表和部分統(tǒng)計圖表。
該系統(tǒng)同時具有分年度數據管理功能,可以查詢不同年度的體育單位名錄信息,以此方便對體育單位名錄數據開展對比研究。
圖3 2015、2016兩年不同體育產業(yè)類別的體育單位數量分布圖示
圖4 2015、2016兩年不同區(qū)域的體育單位數量分布圖示
上圖展示了我國2015、2016兩年體育單位數量在不同行業(yè)類別、不同區(qū)域分布條件下的變化情況,反應了我國體育服務業(yè)增長、體育用品制造業(yè)下滑以及華東、華中、華南區(qū)域增長較快的體育產業(yè)發(fā)展態(tài)勢。
4.1.1 在充分調研和為期2年的實踐嘗試基礎上,本項目探索出了共享國家統(tǒng)計局的國家基本單位名錄庫數據、查重和分類等數字化處理以及獨立數據庫管理全國體育單位名錄信息的基本流程和四級聯網核查、報審名錄數據的技術路線。
4.1.2 根據實際需求,項目組開展了調研設計、開發(fā)建設和調試部署體育單位名錄庫管理平臺等活動,探索實現了在體育總局信息化安全保障體系下運行國家、省區(qū)市、地市、區(qū)縣四級并行核查處理和逐級審核的數字支撐技術,為我國2016年、2017年組織開展體育單位名錄核查與體育產業(yè)統(tǒng)計核算工作提供了有效技術支撐。
4.1.3 根據體育行業(yè)特征及產業(yè)統(tǒng)計工作要求,項目組在國家統(tǒng)計局提供的國家基本單位名錄庫基本屬性字段基礎上,研究并增設了“體育產業(yè)類別”“運動項目”“主要經濟指標”等多個字段,基本滿足了體育單位名錄實際調研與核算工作的需要;同時還創(chuàng)新立項了“體育單位名錄元數據規(guī)范”研究,豐富了我國體育信息化標準體系建設內容。
4.1.4 調研設計了反應我國體育單位現實狀態(tài)及其內在關系的數理統(tǒng)計模型,軟件自動生成了可視化的數據統(tǒng)計圖表結果,直觀體現出國家、省區(qū)市、地市、區(qū)縣各層級不同區(qū)域分布、不同體育類別、不同機構類型、不同國民經濟行業(yè)類別、不同運動項目、不同經濟狀態(tài)等條件下的體育機構年度數據統(tǒng)計圖表,為各級體育部門開展體育產業(yè)規(guī)模核算和統(tǒng)計研究工作提供了數據支持。
4.1.5 為更好地挖掘使用體育單位名錄數據,本項目探索了對2015、2016兩年度數據進行封版管理、自動統(tǒng)計和可查詢利用的功能設計與技術實現方法,為開展多年度體育單位名錄數據的追蹤和對比研究創(chuàng)造了條件。
4.2.1 2016、2017年使用的體育單位名錄庫軟件是在有限的時間里邊設計邊開發(fā)、邊調試邊修改邊使用的,盡管該軟件在支撐開展體育單位名錄庫從無到有的建設中發(fā)揮了探索作用,但其系統(tǒng)構架的整體性還存在一些不足之處,建議在主要功能得以基本滿足和有相關經費保障的前提下,在組織開展新年度體育單位名錄核查工作之前,有必要對該數據庫軟件進行全面優(yōu)化升級改造。
4.2.2 盡管網絡版的體育單位名錄庫研制活動圍繞了解全國體育單位分布現狀、研究核算體育產業(yè)規(guī)模等工作進行了多角度探索,但在數據采集、數字化處理、信息化共享等方面還有許多便捷、實用、有效的技術(如移動終端、數字地圖等)可以進一步引進應用,建議在今后年度的體育單位名錄核查工作中逐步實現技術提升。另外,建議部分統(tǒng)計結果數據能夠逐步面向社會開放使用。
4.2.3 在現有國家、省區(qū)市、地市、區(qū)縣四級聯網核查、審報的基礎上,建議逐步拓展增加運動項目協(xié)會的相關功能設計,以此推動體育單位名錄核查和數據庫建設維護工作更加精細、豐富和完善。
4.2.4 建議在體育單位名錄庫建設和相關數據管理基礎上,拓展設計體育產業(yè)重點領域監(jiān)測管理信息系統(tǒng)和工作機制,以此進一步完善體育產業(yè)統(tǒng)計與核算工作制度。