胥 迅 姚 敏
(重慶圖書館,重慶 400037)
近年來,隨著數(shù)字政府的建設(shè)和數(shù)據(jù)經(jīng)濟的發(fā)展,我國從中央到地方政府都在積極推進公共數(shù)據(jù)資源開放共享建設(shè)。 2015 年,國務(wù)院印發(fā)了《促進大數(shù)據(jù)發(fā)展行動綱要》,提出要大力推動政府部門數(shù)據(jù)共享,促進公共數(shù)據(jù)資源開放提升治理能力,在2018 年底前建成國家政府?dāng)?shù)據(jù)統(tǒng)一開放平臺。2022 年8 月,中辦、國辦印發(fā)的《“十四五”文化發(fā)展規(guī)劃》,要求“加強規(guī)劃引導(dǎo)和政策指導(dǎo),打通各層級公共文化數(shù)字平臺,打造公共文化數(shù)字資源庫群,建設(shè)國家文化大數(shù)據(jù)體系”“以國家文化大數(shù)據(jù)體系建設(shè)為抓手,堅持統(tǒng)一設(shè)計、長期規(guī)劃、分步實施,統(tǒng)籌文化資源存量和增量的數(shù)字化,以物理分布、邏輯關(guān)聯(lián)、快速鏈接、高效搜索、全面共享、重點集成為目標(biāo)聚集文化數(shù)字資源”[1]。 作為公共文化體系的重要組成,公共圖書館的數(shù)據(jù)開放是貫徹落實我國數(shù)據(jù)開放共享戰(zhàn)略的重要環(huán)節(jié)[2]。
目前學(xué)術(shù)界對公共圖書館數(shù)據(jù)開放在發(fā)展途徑、經(jīng)驗借鑒及角色定位等方面都進行了研究,如劉龍[3]、黃如花[4]等提出我國圖書館參與政府?dāng)?shù)據(jù)開放的發(fā)展途徑;李斯[5]等從法律、技術(shù)兩個方面對大英圖書館資源開發(fā),數(shù)據(jù)開放和數(shù)據(jù)利用的實踐經(jīng)驗進行研究,對我國圖書館數(shù)據(jù)開放實踐提供參考;陶成煦[6]在闡述圖書館參與政府?dāng)?shù)據(jù)開放的驅(qū)動力基礎(chǔ)上,通過調(diào)查分析,明確圖書館在政府?dāng)?shù)據(jù)開放中的角色定位。 目前,我國的數(shù)據(jù)開放工作已經(jīng)開始實施,與美國、英國等國家從中央政府到地方政府的發(fā)展路徑不同,我國的公共數(shù)據(jù)開放主要實踐于地方政府。 本文針對公共圖書館參與公共數(shù)據(jù)開放的職責(zé)和義務(wù),通過梳理各省級公共圖書館在政府?dāng)?shù)據(jù)開放系統(tǒng)中的參與程度,分析公共圖書館在政府?dāng)?shù)據(jù)開放共享建設(shè)中存在的問題及主要原因,并提出改善措施,為促進公共圖書館的數(shù)據(jù)開放及利用提供參考。
為順應(yīng)現(xiàn)代信息時代的發(fā)展,黨的十八屆三中全會提出了構(gòu)建現(xiàn)代公共文化服務(wù)體系的戰(zhàn)略構(gòu)想,2015 年中辦、國辦發(fā)布的《關(guān)于加快構(gòu)建現(xiàn)代公共文化服務(wù)體系的意見》中指出要“加強公共文化大數(shù)據(jù)采集、存儲和分析處理”[7],突出了公共文化數(shù)據(jù)在現(xiàn)代公共文化服務(wù)體系建設(shè)的重要地位。 同年,國務(wù)院發(fā)布《促進大數(shù)據(jù)行動綱要》,正式將政府?dāng)?shù)據(jù)開放納入國家發(fā)展戰(zhàn)略中來,并在“未來遠(yuǎn)景規(guī)劃目標(biāo)”中提到要“面向公共數(shù)據(jù)資源建立科學(xué)合理的法規(guī)制度與政策體系”[8]。 2022 年10 月,黨的二十大報告中提出要“實施國家文化數(shù)字化戰(zhàn)略,健全現(xiàn)代公共文化服務(wù)體系,創(chuàng)新實施文化惠民工程”[9],充分說明了數(shù)據(jù)開放對于公共文化服務(wù)體系建設(shè)具有長遠(yuǎn)發(fā)展性。
據(jù)筆者不完全統(tǒng)計,黨的十八大以來,黨中央多次對數(shù)據(jù)開放及國家文化大數(shù)據(jù)體系建設(shè)工作作出部署,多個部委參與推動落實。 截至2022 年底,國務(wù)院及各部委先后頒布多項支持?jǐn)?shù)據(jù)開放的政策文件(表1),推進數(shù)據(jù)開放規(guī)劃。 公共文化數(shù)據(jù)作為數(shù)據(jù)開放體系建設(shè)的重要組成,其政策體系更加完備,發(fā)展路線更加清晰。
表1 公共服務(wù)機構(gòu)參與政府?dāng)?shù)據(jù)開放的政策文件
2015 年國務(wù)院發(fā)布的《促進大數(shù)據(jù)發(fā)展行動綱要》正式將政府?dāng)?shù)據(jù)開放納入國家發(fā)展戰(zhàn)略中來,該綱要指出要“穩(wěn)步推動公共數(shù)據(jù)資源開放”“推動建立政府部門和事業(yè)單位等公共機構(gòu)數(shù)據(jù)資源清單”“制定公共機構(gòu)數(shù)據(jù)開放計劃,落實數(shù)據(jù)開放和維護責(zé)任,推進公共機構(gòu)數(shù)據(jù)資源統(tǒng)一匯聚和集中向社會開放”[10]。 2021 年我國“十四五”規(guī)劃全文中提出要“擴大基礎(chǔ)公共信息數(shù)據(jù)安全有序開放,探索將公共數(shù)據(jù)服務(wù)納入公共服務(wù)體系”[11]。
公共圖書館作為“事業(yè)單位”“公共機構(gòu)”、公共數(shù)據(jù)重要的存儲者和提供者,在政府?dāng)?shù)據(jù)開放背景下發(fā)揮其應(yīng)有作用,推進我國形成科學(xué)的政府?dāng)?shù)據(jù)開放政策體系,具有不可推卸的職責(zé)和義務(wù)。
2016 年,國際圖聯(lián)建議在國家和社區(qū)層面提高圖書館工作人員的可持續(xù)發(fā)展意識,加強圖書館在社會發(fā)展中的作用,讓圖書館參與國家和區(qū)域?qū)用娴臄?shù)據(jù)推廣,并確保公眾能夠通過圖書館服務(wù)獲取有關(guān)可持續(xù)發(fā)展的最新信息。 2021 年12 月,該組織又發(fā)布了《開放圖書館數(shù)據(jù)聲明》,提出數(shù)據(jù)開放和可重復(fù)使用有助于讓更廣泛的參與者參與有關(guān)圖書館的討論,呼吁政府直接負(fù)責(zé)有關(guān)圖書館及其使用的數(shù)據(jù)的收集和公開發(fā)布,或通過支持他人來實現(xiàn)此事,并確保在需要時為此類數(shù)據(jù)收集提供資金支持[12]。
由此可見,圖書館應(yīng)該利用數(shù)據(jù)開放的機會,提供有價值的數(shù)據(jù)和信息,提高在社會及公眾中的影響力,公眾也可從公共圖書館中獲得更專業(yè)更深層次的信息,從而更加鞏固公共圖書館與社會服務(wù)群體的聯(lián)系,更好地推動公共圖書館向智慧圖書館轉(zhuǎn)型。
鑒于目前全國公共數(shù)據(jù)開放門戶網(wǎng)站的建設(shè)主體主要為各級地方政府,截至2022 年11 月底,筆者采用網(wǎng)絡(luò)調(diào)查法,訪問我國已上線的19 個省級政府?dāng)?shù)據(jù)開放平臺,以“圖書館”為檢索關(guān)鍵詞進行了網(wǎng)絡(luò)調(diào)查,并對檢索結(jié)果圍繞數(shù)據(jù)開放主體、數(shù)據(jù)發(fā)布數(shù)量、數(shù)據(jù)開放內(nèi)容、數(shù)據(jù)開放類型以及數(shù)據(jù)利用情況這5 個方面的內(nèi)容進行了收集(表2),為進一步分析圖書館數(shù)據(jù)開放現(xiàn)狀提供依據(jù)。
表2 19 個省級政府?dāng)?shù)據(jù)開放平臺有關(guān)“圖書館”數(shù)據(jù)開放情況
2.2.1 數(shù)據(jù)開放主體
數(shù)據(jù)開放主體即開放數(shù)據(jù)的發(fā)布單位,一般為各級行政機關(guān)、履行公共管理和服務(wù)職能的事業(yè)單位。 《山東省公共數(shù)據(jù)開放辦法》里進一步提出“具有公共服務(wù)職能的企業(yè)事業(yè)單位,人民團體等在依法履行公共管理職責(zé)、提供公共服務(wù)過程中,收集和產(chǎn)生的各類數(shù)據(jù)均屬于公共數(shù)據(jù),應(yīng)納入公共數(shù)據(jù)開放辦法管理”[13]。 從而擴大了數(shù)據(jù)開放的主體規(guī)模,拓展了公共數(shù)據(jù)的適用范圍,對保障圖書館開放數(shù)據(jù)的數(shù)量與質(zhì)量具有重要意義。
開放主體是考量數(shù)據(jù)發(fā)布權(quán)威性的重要指標(biāo)。調(diào)查發(fā)現(xiàn),各省級政府?dāng)?shù)據(jù)開放平臺圖書館數(shù)據(jù)發(fā)布單位比較單一,公共圖書館特別是省級公共圖書館作為數(shù)據(jù)開放主體的參與度不足。 例如,筆者對“浙江數(shù)據(jù)開放網(wǎng)”和“貴州省政府?dāng)?shù)據(jù)開放平臺”中共176 個包含圖書館內(nèi)容的數(shù)據(jù)集進行分析,它們的發(fā)布單位最主要是各市區(qū)縣文化旅游局,其次是省文化和旅游廳、各級統(tǒng)計局、大數(shù)據(jù)發(fā)展管理局和自然資源規(guī)劃局等相關(guān)行政部門,公共圖書館只有2 家,分別是溫州市圖書館和遵義市圖書館。
2.2.2 數(shù)據(jù)發(fā)布數(shù)量
數(shù)據(jù)發(fā)布數(shù)量可以衡量數(shù)據(jù)開放的規(guī)模,主要通過調(diào)查數(shù)據(jù)集數(shù)量、數(shù)據(jù)量和API 接口數(shù)來表現(xiàn)。 如表2 所示,在19 個政府?dāng)?shù)據(jù)開放平臺中共有開放數(shù)據(jù)集721 個,各省級政府?dāng)?shù)據(jù)開放平臺上提供的圖書館數(shù)據(jù)集數(shù)量差異較大。 其中,山東省數(shù)量最多,為257 個,而海南省、遼寧省和陜西省的數(shù)量為0。 近50%的省級平臺的圖書館開放數(shù)據(jù)集的數(shù)量在十個及以下,這些平臺還應(yīng)加大數(shù)據(jù)開放的力度。
2.2.3 數(shù)據(jù)開放內(nèi)容
數(shù)據(jù)開放內(nèi)容是由數(shù)據(jù)提供者根據(jù)數(shù)據(jù)目錄的編制規(guī)范,編制包括數(shù)據(jù)目錄、開放清單、開放屬性、開放條件等內(nèi)容,并進行動態(tài)調(diào)整,通過統(tǒng)一的數(shù)據(jù)開放平臺向社會公開。 此次調(diào)查中,圖書館開放數(shù)據(jù)的內(nèi)容基本以圖書館名稱、地址、網(wǎng)址等基本服務(wù)信息為主,其次是館藏量、流通人次、借閱人次等統(tǒng)計數(shù)據(jù)和書名、ISBN、出版社等書目數(shù)據(jù),極少數(shù)開放了館藏數(shù)據(jù)和借閱數(shù)據(jù)等內(nèi)部數(shù)據(jù),例如遵義市圖書館開放了文獻逾期信息。 開放公眾需求度高的數(shù)據(jù),是圖書館數(shù)據(jù)開放工作的開放目標(biāo)。 此外有個別平臺上傳年度報告等信息,嚴(yán)格意義上講,這些不能算作開放數(shù)據(jù)。
2.2.4 數(shù)據(jù)開放類型
數(shù)據(jù)開放類型是數(shù)據(jù)開放標(biāo)準(zhǔn)化的體現(xiàn),包括數(shù)據(jù)集文件、API 接口和APP 應(yīng)用幾方面,代表數(shù)據(jù)的可讀性和可獲得性,對開放類型的調(diào)查主要對數(shù)據(jù)集下載和API 接口兩種方式進行分類統(tǒng)計。調(diào)查發(fā)現(xiàn),74%的圖書館數(shù)據(jù)都是數(shù)據(jù)集形式,16個平臺里有8 個只提供了數(shù)據(jù)集,未提供API 接口。
不同的數(shù)據(jù)格式可以適用于不同的應(yīng)用場景,比如,CSV 格式適合用于數(shù)據(jù)分析,JSON 格式適合用于Web 開發(fā),XML 格式適合用于數(shù)據(jù)交換。 為了促進數(shù)據(jù)的共享和使用,數(shù)據(jù)開放平臺應(yīng)該提供更多類型的數(shù)據(jù)格式。 調(diào)查發(fā)現(xiàn),上海市、浙江省、山東省提供了XLS、CSV、XML、RDF、JSON 等比較全面的圖書館數(shù)據(jù)格式,更便于數(shù)據(jù)分析與開發(fā)利用工作;貴州省提供了XLS、JSON 等部分?jǐn)?shù)據(jù)格式;天津市、寧夏回族自治區(qū)僅提供了XLS 格式,個別省份還存在DOCX、ZIP 等其他格式的文件,如北京市提供的數(shù)據(jù)集里有“2020 年北京市密云區(qū)圖書館決算”等2 個文件是docx 格式,“順義區(qū)圖書館”等5個文件是zip 格式,“數(shù)字圖書館和文化館建設(shè)信息”文件是rar 格式;天津市提供的“西青區(qū)圖書館信息”文件是doc 格式;此外個別平臺提供的數(shù)據(jù)無法下載,如重慶市提供的數(shù)據(jù)均沒有下載選項。
2.2.5 數(shù)據(jù)利用情況
數(shù)據(jù)開放的目的是促進數(shù)據(jù)有效利用,數(shù)據(jù)利用情況是評估數(shù)據(jù)開放平臺對公眾產(chǎn)生的實際影響的重要途徑。 通過對比分析數(shù)據(jù)開放的預(yù)期目標(biāo)與實際效果,還可確定數(shù)據(jù)開放平臺需要改進的方面。對利用情況的調(diào)查主要從圖書館數(shù)據(jù)瀏覽量、數(shù)據(jù)集下載量以及API 接口調(diào)用量三方面進行。 如表2所示,可以看出上海市、廣東省、山東省和浙江省提供的圖書館數(shù)據(jù)數(shù)量多,下載量高。 這些數(shù)據(jù)反映了公共圖書館數(shù)據(jù)的利用價值,值得其他省份學(xué)習(xí)借鑒。
2.3.1 頂層設(shè)計賦能但標(biāo)準(zhǔn)規(guī)范缺失
調(diào)查發(fā)現(xiàn),我國政府在大數(shù)據(jù)時代高度重視公共數(shù)據(jù)開放的頂層設(shè)計,并逐步將其提升為“國家戰(zhàn)略”。 如表1 所示,黨中央、國務(wù)院、各部委及各級地方政府都相繼出臺數(shù)據(jù)開放相關(guān)政策意見,為加快公共數(shù)據(jù)開放步伐、提高開放數(shù)據(jù)質(zhì)量提供了堅實的政策保障。 但由于不同地區(qū)、不同部門參照的技術(shù)標(biāo)準(zhǔn)和管理規(guī)范存在差異,在推進數(shù)據(jù)開放的政策文件中,公共圖書館數(shù)據(jù)缺乏統(tǒng)一有效的標(biāo)準(zhǔn)化支撐,同時由于圖書館界對標(biāo)準(zhǔn)規(guī)范的實施推廣和應(yīng)用績效評估等工作不夠重視,從而降低了數(shù)據(jù)的利用價值,使公共圖書館不僅未能發(fā)揮自身優(yōu)勢,反而影響了公眾對圖書館數(shù)據(jù)的查詢與利用。
2.3.2 開放意識不足且數(shù)據(jù)質(zhì)量參差
從數(shù)據(jù)開發(fā)角度,對數(shù)據(jù)收集、處理、篩選和開發(fā)需要投入大量人力財力,但公共圖書館缺乏數(shù)據(jù)開發(fā)專項經(jīng)費和類似“全國文化信息資源共享工程”的數(shù)據(jù)開發(fā)部門,數(shù)據(jù)開發(fā)的規(guī)范化水平有待提升,在標(biāo)準(zhǔn)規(guī)范、數(shù)據(jù)開發(fā)到數(shù)據(jù)開放三個層面尚未形成有機整體。
從數(shù)據(jù)質(zhì)量角度,各政府?dāng)?shù)據(jù)開放平臺開放的圖書館數(shù)據(jù)質(zhì)量差距明顯,很多存在標(biāo)題不規(guī)范、數(shù)據(jù)格式不規(guī)范、數(shù)據(jù)字段少、數(shù)據(jù)量不足等問題,影響了數(shù)據(jù)的統(tǒng)籌管理和高效共享。 ①標(biāo)題不規(guī)范。標(biāo)題要素不全、與正文內(nèi)容有偏差就不能反映數(shù)據(jù)集的主要內(nèi)容,從而影響檢索效率。 表現(xiàn)為“種類繁多、名不副實、格式不一”,如北京市、貴州省等省市的很多數(shù)據(jù)集直接使用“圖書館”“公共圖書館”“圖書館信息”等名稱文字作為標(biāo)題,沒有揭示具體的機構(gòu)名稱、數(shù)據(jù)內(nèi)容等關(guān)鍵信息。 ②數(shù)據(jù)格式不規(guī)范。 數(shù)據(jù)開放平臺應(yīng)發(fā)布標(biāo)準(zhǔn)格式的數(shù)據(jù)文件,如XLS、CSV、XML、RDF、JSON 等,以提高開放數(shù)據(jù)資源的可用性和互操作性,一般不建議發(fā)布壓縮包、DOC 文件等其他格式的數(shù)據(jù)文件。 例如,北京市提供的數(shù)據(jù)集里有DOCX、ZIP 及RAR 格式;天津市提供的數(shù)據(jù)集有DOC 格式,這些文件格式不屬于可機讀格式,不利于數(shù)據(jù)分析與處理,增加了數(shù)據(jù)開發(fā)利用的難度。 此外部分省級數(shù)據(jù)開放平臺的數(shù)據(jù)格式較為單一,貴州省僅提供了XLS、JSON 數(shù)據(jù)格式,天津市和寧夏回族自治區(qū)僅提供了XLS 數(shù)據(jù)格式,不便于各類分析處理軟件進行數(shù)據(jù)查找讀取和選擇,從而影響利用者進行挖掘和研究。 ③數(shù)據(jù)字段少。例如貴州省“公共圖書館”這一數(shù)據(jù)集,僅有“名稱”“數(shù)量”兩個屬性字段;廣東省“2021 年順德圖書館集群成員館”僅有“名稱”“地址”兩個屬性字段。 這些數(shù)據(jù)集的數(shù)據(jù)字段不夠完整,沒有充分發(fā)揮數(shù)據(jù)價值。 此外,貴州省“公共圖書館”這一數(shù)據(jù)集中數(shù)據(jù)摘要僅為“公共圖書館”,沒有揭示數(shù)據(jù)關(guān)鍵信息,不便于快速獲取和檢索,造成數(shù)據(jù)價值密度低。④數(shù)據(jù)量少。 如天津市開放的“南開區(qū)公共圖書館信息”這一數(shù)據(jù)集僅有一條記錄;貴州省提供的“花溪區(qū)圖書館日志查詢—采編分系統(tǒng)”僅6 條數(shù)據(jù),這些數(shù)據(jù)集的數(shù)據(jù)量較少,影響數(shù)據(jù)分析的完整性和準(zhǔn)確性。
鑒于我國數(shù)據(jù)開放的起步晚于歐美國家,為了更快地推動我國數(shù)據(jù)開放的發(fā)展,可借鑒其它國家已有經(jīng)驗,并在此基礎(chǔ)上制定適合中國國情的數(shù)據(jù)開放標(biāo)準(zhǔn),比如設(shè)置推進數(shù)據(jù)開放的專門機構(gòu),完善數(shù)據(jù)開放的頂層設(shè)計,針對各級數(shù)據(jù)開放平臺建立統(tǒng)一的開放數(shù)據(jù)標(biāo)準(zhǔn),準(zhǔn)確定義數(shù)據(jù)的概念并明確數(shù)據(jù)質(zhì)量的判斷標(biāo)準(zhǔn),同時對開放數(shù)據(jù)質(zhì)量進行嚴(yán)格的監(jiān)管,對分級分類、開放數(shù)據(jù)內(nèi)容及數(shù)據(jù)安全等方面進行規(guī)定,避免出現(xiàn)重復(fù)數(shù)據(jù)和質(zhì)量較低的數(shù)據(jù)。
目前國家圖書館相繼出臺了《電子圖書元數(shù)據(jù)規(guī)范》《圖書館數(shù)字資源長期保存元數(shù)據(jù)規(guī)范》等一系列有關(guān)數(shù)據(jù)開放的行業(yè)標(biāo)準(zhǔn)規(guī)范,建議各數(shù)據(jù)開放平臺參照相關(guān)規(guī)范統(tǒng)一元數(shù)據(jù)、數(shù)據(jù)集、數(shù)據(jù)格式和數(shù)據(jù)接口等內(nèi)容,可有利于平臺的數(shù)據(jù)格式、質(zhì)量趨于一致,推進數(shù)據(jù)開放共享,提高數(shù)據(jù)利用率。
圖書館評估定級工作是對各級公共圖書館執(zhí)行政策法規(guī)和標(biāo)準(zhǔn)、開展服務(wù)水平與效果的重要監(jiān)督機制,能夠推動公共圖書館事業(yè)發(fā)展理念創(chuàng)新,帶動公共圖書館事業(yè)體系不斷完善。 調(diào)查發(fā)現(xiàn),在2022年度的第七次全國公共圖書館評估定級考核中,尚無考核指標(biāo)涉及圖書館數(shù)據(jù)開放。 因此,業(yè)界有必要制定圖書館數(shù)據(jù)開放的考核評估標(biāo)準(zhǔn),推進評估常態(tài)化建設(shè),強化政府監(jiān)管的主導(dǎo)地位,加強圖書館數(shù)據(jù)開放業(yè)務(wù)規(guī)范化,在行政管理上形成數(shù)據(jù)開放落實的相應(yīng)壓力與動力,全面加強圖書館信息化,實現(xiàn)圖書館信息化提升改造,充分發(fā)揮評估定級“以評促建、以評促管、以評促用”的作用[14]。
圖書館數(shù)據(jù)開放應(yīng)該在對技術(shù)標(biāo)準(zhǔn)、公共數(shù)據(jù)、服務(wù)數(shù)據(jù)集、應(yīng)用資源、服務(wù)系統(tǒng)和程序代碼等內(nèi)容的整合、互聯(lián)、協(xié)同基礎(chǔ)上,加快推進數(shù)據(jù)互聯(lián)互通,實現(xiàn)數(shù)據(jù)開放一體化,提高資源共享水平,滿足讀者個性化服務(wù)需求和支持圖書館服務(wù)創(chuàng)新,實現(xiàn)圖書館數(shù)據(jù)的統(tǒng)一和全方位開放。 例如截至2020 年底我國縣級以上公共圖書館的電子圖書館藏書總量近9.61 億冊,如果能讓這些數(shù)據(jù)資源實現(xiàn)開放共享,就能發(fā)揮更大的數(shù)據(jù)應(yīng)用價值。
鑒于目前我國數(shù)據(jù)開放一體化程度仍偏低,未能充分滿足社會對跨域數(shù)據(jù)融合利用的需求,建議各地公共圖書館主管部門聯(lián)手推出有利于促進數(shù)據(jù)開放區(qū)域互聯(lián)互通的政策文件,整合各區(qū)域平臺的數(shù)據(jù)集主題、數(shù)據(jù)名稱等方面內(nèi)容,實現(xiàn)相互鏈接,促進跨地區(qū)的數(shù)據(jù)融合利用,提升數(shù)據(jù)使用效能。