趙毓峰 叢磊
摘要:針對當前出版業(yè)普遍存在的對于數據交換的迫切需求,以及各種系統(tǒng)之間數據接口系統(tǒng)擴展性、開放性和兼容性差的問題,本文提出了構建“出版業(yè)通用數據交換生態(tài)”的概念,并且闡述了構建“出版業(yè)通用數據交換生態(tài)”的應用目標、構建原則、體系架構及運行模式,從而大幅降低產業(yè)鏈數據共享投入,解決產業(yè)鏈數據共享難題,為產業(yè)信息交換的規(guī)范性、科學性提供應用保障,實現(xiàn)出版業(yè)內外無差別的數據交換。
關鍵詞:出版業(yè);通用;數據交換;生態(tài)構建
在數字化、信息化大潮的引領下,各出版單位都根據自己的實際情況進行了數字化、信息化建設。從圖書的選題策劃到編輯加工、印制發(fā)行等各個環(huán)節(jié)都有相應的數字化、信息化產品在運行,并產生了海量數據。在出版業(yè)的各個環(huán)節(jié)中,利用以物聯(lián)網、大數據、云計算、人工智能、5G網絡、區(qū)塊鏈為代表的現(xiàn)代信息技術使這些數據互聯(lián)互通,消除信息孤島,從而構建全行業(yè)的通用數據交換生態(tài),為有力推進出版業(yè)信息化進程作出貢獻。
目前,出版企業(yè)存在大量數據交換、分析方面的迫切需求,不僅有企業(yè)內部數據交換需求,同時還有大量企業(yè)對外數據交換需求。
當前,國內外出版企業(yè)普遍采用“FTP+XML[1]”接口模式進行數據交換?;诖四J介_發(fā)的接口采用的是“軟件代碼與業(yè)務代碼交織在一起”的模式,任意節(jié)點業(yè)務規(guī)則的變化,都會導致所有接口需要重新開發(fā)。此種數據交換模式,無論是研發(fā)費用,還是后續(xù)的維護和修改都耗資巨大,大大超出了出版企業(yè)的承受能力。具體表現(xiàn)在:①投入費用高。交換接口需定制開發(fā),且是特定的一對一方案,開發(fā)及維護投入較高。②綁定規(guī)則死。交換接口中“軟件代碼與業(yè)務代碼交織在一起”,任意節(jié)點業(yè)務規(guī)則發(fā)生變化,所有接口都要重新開發(fā)。③應用標準難。企業(yè)既對標準的認知存在偏差,又缺少平臺去應用標準。交換接口品種繁多,對標準的應用水平參差不齊,造成“有標準不用、有標準難用”的困境。④保障安全少。企業(yè)無力投入大量資金去設計部署安全方面的硬件、軟件、網絡一體化架構,給數據安全帶來極大隱患。
針對上述問題,出版產業(yè)通用數據交換技術重點實驗室提出構建“出版業(yè)通用數據交換生態(tài)”,實現(xiàn)技術應用平臺化,從而構建“四用”新生態(tài)的概念。這里的“四用”是指:①通用。即信息互聯(lián),采用“邏輯分離、應用貼合”原則,不再需要另行開發(fā)交換接口,任意兩個信息系統(tǒng)之間均可實現(xiàn)數據交換,徹底消除“信息孤島”。②可用。降低投入,出版企業(yè)無須專門購買交換平臺(含軟件),僅用少量資金或免費的方式,即可滿足高安全性、高穩(wěn)定性、高實時性的數據交換需求。③好用。模式重組,采用“云平臺+客戶端”運行模式,用戶使用更加方便。④實用。改變交換接口只能由原廠商開發(fā)的弊端,讓更多單位(或個人)成為數據交換方案創(chuàng)作者。超額流量收費,定額流量免費,流量費與“端交換方案”創(chuàng)作者進行分成,構建行業(yè)數據交換新的應用生態(tài)。
1.出版業(yè)通用數據交換生態(tài)構建應用目標
出版業(yè)通用數據交換平臺旨在建立一個開放的、通用的信息交換生態(tài)環(huán)境,支持不同廠家、不同版本的出版業(yè)應用系統(tǒng)接入,以實現(xiàn)各種出版業(yè)應用系統(tǒng)進行數據和信息的交換,減少對特定系統(tǒng)開發(fā)廠商的依賴。同時,可利用通用數據交換自主拓展更多創(chuàng)新服務。
2.出版業(yè)通用數據交換生態(tài)構建原則
出版業(yè)通用數據交換生態(tài)構建體現(xiàn)標準化、通用性和開放性原則。
(1)標準化原則
嚴格融入并執(zhí)行國家標準、行業(yè)標準、企業(yè)標準等現(xiàn)行標準,推動標準的落地應用。有標準的,嚴格執(zhí)行基于標準的數據交換。無標準的,按創(chuàng)作規(guī)范創(chuàng)作“準中間標準”,用于數據交換。改變出版業(yè)“有標準不用、有標準難用”的現(xiàn)狀。
(2)通用性原則
出版業(yè)大數據包括七類數據,分別是機構數據、人員數據、產品數據、政務數據、商務數據、用戶數據和內容數據。出版行業(yè)數據分散在不同的主體當中,這七類數據散落在黨和政府部門、出版單位、發(fā)行商、圖書館、科研院所、廣電商、電商平臺等。主體收入數據分散,導致主管部門與出版行業(yè)主體之間、產業(yè)鏈上中下游主體之間信息不暢,信息系統(tǒng)缺乏互聯(lián)互通,產業(yè)鏈數據不能真正融合[2]。平臺提供通用的解決方案,不同系統(tǒng)廠商開發(fā)的各種業(yè)務系統(tǒng)都可以根據接口規(guī)范完成數據和業(yè)務邏輯的無縫交互。
(3)開放性原則
提出“端交換方案”創(chuàng)作標準,用以規(guī)范技術廠商(或個人)根據不同交換需求及信息系統(tǒng)業(yè)務邏輯制作的“端交換方案”,使“端交換方案”制作簡單可循,邏輯嚴謹完整,交換順暢無誤。遵循“代碼分離、應用貼合”的應用規(guī)則,將“端交換方案”的創(chuàng)作權交還給技術廠商或對信息系統(tǒng)業(yè)務規(guī)則有深入把握的第三方技術服務商(或個人),而不是由特定開發(fā)商進行定制開發(fā)。
3.出版業(yè)通用數據交換生態(tài)的體系架構
出版業(yè)通用數據交換生態(tài)以“出版產業(yè)通用數據交換云平臺”的形式體現(xiàn),通過“端交換方案+中間標準庫”的模式提供服務,具體架構包含三個層次,分別是中間標準層、數據交換層和應用層。(如圖1所示)
(1)中間標準層
中間標準層是構建出版業(yè)通用數據交換生態(tài)的基石,整合與出版產業(yè)相關的60余種出版、發(fā)行、信息類標準,如2006年頒布的《圖書流通信息交換規(guī)則》[3],以及2013年頒布的《中國出版物在線信息交換(CNONIX)圖書產品信息格式》[4]等標準,將標準中規(guī)定的信息交換的內容、類型、格式規(guī)范、技術規(guī)范等定義在出版業(yè)通用數據交換生態(tài)中,形成“中間標準庫”。在出版業(yè)通用數據交換生態(tài)中的所有數據交換行為,都以中間標準庫中的定義為藍本進行。
出版業(yè)通用數據交換生態(tài)是一套開放的、通用的系統(tǒng),中間標準庫的存在,只是為不同應用系統(tǒng)或同一系統(tǒng)的不同版本提供一套數據交換依據,絕不是要求生態(tài)中的用戶根據中間標準庫的定義修改正在運行的業(yè)務系統(tǒng),而是在原有系統(tǒng)用戶不做任何修改的前提下進行無縫對接。中間標準庫是出版業(yè)通用數據交換生態(tài)構建標準化原則的具體體現(xiàn)。
對于現(xiàn)實中有交換需求,但又無國家(或行業(yè)、企業(yè))標準的,可以由需求方按照中間標準庫”的設計規(guī)范,自行創(chuàng)作交換規(guī)范,形成“準中間標準”上傳至“中間標準庫”。
(2)數據交換層
數據交換層是出版業(yè)通用數據交換生態(tài)中通用性和開放性原則的體現(xiàn),生態(tài)中不同系統(tǒng)、不同版本的數據,依據中間標準層的定義在這里完成交換。數據交換層由兩個部分組成,分別是開發(fā)及管理終端和端交換方案。
1)開發(fā)及管理終端
開發(fā)及管理終端是出版業(yè)通用數據交換生態(tài)中的一個通用的工具軟件,以C/S架構中客戶端的形式免費提供給所有用戶,包括應用系統(tǒng)開發(fā)廠商、應用系統(tǒng)用戶、第三方開發(fā)者以及生態(tài)系統(tǒng)管理者。
對于應用系統(tǒng)開發(fā)廠商及第三方開發(fā)者,開發(fā)及管理終端可用于檢索中間標準庫中的各種定義格式,以此為依據開發(fā)應用系統(tǒng)的端交換方案和準中間標準庫。最后上傳到出版業(yè)通用數據交換生態(tài)中。
對于應用系統(tǒng)用戶,開發(fā)及管理終端用于選擇適合自己的端交換方案并進行配置。
對于生態(tài)系統(tǒng)管理者,開發(fā)及管理終端用于系統(tǒng)管理、權限管理等。
2)端交換方案
端交換方案將信息系統(tǒng)運作行為抽象為connect、select、insert、update、delete、up、down、import、export、execute等類型,開發(fā)者只需根據具體的業(yè)務系統(tǒng)的相應版本,以中間標準庫為依據,按照創(chuàng)作規(guī)范標準將數據庫交換字段及業(yè)務邏輯進行編制,并經過與中間標準庫的審核確認,即可形成該版本的端交換方案。在出版業(yè)通用數據交換生態(tài)中,任意一款應用任意版本的端交換方案,都不是唯一的,由于中間標準庫以及創(chuàng)作規(guī)范標準都是開放的,無論是系統(tǒng)的開發(fā)廠商、系統(tǒng)用戶甚至是與應用系統(tǒng)無關的第三方,只要愿意,都可以根據自己對應用系統(tǒng)的理解和使用習慣開發(fā)端交換方案,并提交到出版業(yè)通用數據交換生態(tài)中供用戶選用。端交換方案并不局限于不同實體間(如:出版社與渠道商之間)數據的交換,同樣適用于單個實體內部不同應用系統(tǒng)之間(如出版社內部ERP系統(tǒng)與官網之間)的數據交換。
端交換方案開發(fā)者能夠因“端交換方案”被用戶采用而獲得收益,從而促進更廣泛的參與,避免僅靠應用系統(tǒng)原廠商單打獨斗開發(fā)接口的局面,從而構建起數據共享、數據交換新的應用生態(tài)。
(3)應用層
應用層是出版業(yè)通用數據交換生態(tài)中的最終用戶,他們只需要根據自己的實際情況,在出版業(yè)通用數據交換生態(tài)中選擇最適合自己的端交換方案進行部署。由于所有端交換方案都是以中間標準庫為依據進行編制且進行過審核確認,因此,只要用戶選擇了自己滿意的端交換方案并且正確部署,即可與出版業(yè)通用數據交換生態(tài)中的任意系統(tǒng)進行數據交換。
由于端交換方案部署在應用系統(tǒng)的服務器端,不與應用系統(tǒng)的實際使用者發(fā)生直接的聯(lián)系,對于實際使用者是完全透明的,只需按照原來的操作運行即可,無須針對端交換方案進行專門的適應和培訓。
4.出版業(yè)通用數據交換生態(tài)的運行模式
如圖2所示,出版業(yè)通用數據交換生態(tài)由數據交換云平臺、技術廠商以及企業(yè)用戶三種角色組成。
(1)數據交換云平臺
數據交換云平臺定位于出版業(yè)通用數據交換生態(tài)的中間標準層,承擔著生態(tài)系統(tǒng)維護管理、標準制定與存儲、規(guī)則制定、端方案管理與校準、資源調度、收益分配、爭議仲裁等作用。
數據交換云平臺需要保障整個通用數據交換生態(tài)正常運轉,進行平臺內部各種系統(tǒng)的維護與控制,維護信息安全,保障傳輸網絡高效流暢,處理各種突發(fā)事件。
數據交換云平臺整合與出版產業(yè)相關的60余種出版、發(fā)行、信息類標準,將標準中規(guī)定的信息交換的內容、類型、格式規(guī)范、技術規(guī)范等定義在出版業(yè)通用數據交換生態(tài)中,形成 “中間標準庫”,并提供檢索服務。
數據交換云平臺免費提供開發(fā)及管理終端,用于技術廠商客戶端進行中間標準檢索并以此為依據編制端交換方案。
數據交換云平臺存儲各方編制的端交換方案,供需要進行數據交換的企業(yè)用戶選用。同時,對端交換方案的狀況進行評估,制定端交換方案的使用規(guī)則。
(2)技術廠商
技術廠商定位于出版業(yè)通用數據交換生態(tài)的數據交換層,主要職能是為出版業(yè)通用數據交換生態(tài)提供針對各種應用的端交換方案,具體工作流程是:
1)從數據交換云平臺獲取開發(fā)及管理終端,向平臺注冊并登錄;
2)選擇需要編制端交換方案應用系統(tǒng)及版本;
3)從數據交換云平臺中間標準庫檢索并下載對應的中間標準;
4)編制端交換方案;
5)將編制好的端交換方案上傳到數據交換云平臺;
6)經過數據交換云平臺審核認證后,成為最終的端交換方案供企業(yè)用戶使用;
7)根據數據交換云平臺制定的規(guī)則獲取收益;
8)迭代升級。
技術廠商在出版業(yè)通用數據交換生態(tài)中并不局限于某個應用系統(tǒng)的實際開發(fā)者,而是一個開放的概念,可以是應用系統(tǒng)的開發(fā)企業(yè)自身,也可以是系統(tǒng)的應用者、第三方企業(yè)甚至個人。只要對需要編制端交換方案的應用系統(tǒng)有足夠的了解和使用經驗,并且愿意參與其中,就可以以技術廠商的身份向數據交換云平臺注冊賬戶,提交自己編制的端交換方案并從中獲取收益。
(2)企業(yè)用戶
企業(yè)用戶定位于出版業(yè)通用數據交換生態(tài)中的應用層,是出版業(yè)通用數據交換生態(tài)的最終使用者。企業(yè)用戶在出版業(yè)通用數據交換生態(tài)中選擇、使用端交換方案,與各種應用系統(tǒng)進行無縫的數據交換,提出自己的端交換方案需求,并根據數據交換生態(tài)中的規(guī)則支付費用。具體工作流程是:
1)從數據交換云平臺獲取開發(fā)及管理終端,向平臺注冊并登錄;
2)選擇開發(fā)應用系統(tǒng)的廠商;
3)選擇應用系統(tǒng)及版本;
4)選擇需要進行數據交換的企業(yè)用戶;
5)選擇端交換方案;
6)選擇啟用的單據;
7)設置必要的運行參數;
8)啟動方案成功;
9)進行數據交換;
10)繳納方案使用費;
11)根據實際使用情況提交升級需求;
12)迭代升級。
企業(yè)用戶只選擇針對自己應用系統(tǒng)及版本的端交換方案,而無須選擇針對需要和自己進行數據交換對方編制的端交換方案。選擇需要進行數據交換的企業(yè),是為了通過本方選定的端交換方案向對方選定的端交換方案推送本方數據需求。由于雙方的端交換方案都是依據中間標準庫編制并經過了中間標準庫的認證,雖然雙方的應用系統(tǒng)、數據表項的表達方式、數據結構都各不相同,但是通過端交換方案的轉換,即可進行數據的有效對接和交換。
端交換方案使用費分為內網交換和外網交換兩種情況。
端交換方案的內網交換是指本企業(yè)內部各種應用系統(tǒng)之間的數據交換,由于數據交換在企業(yè)局域網內部進行,不通過數據交換云平臺,免費使用。
端交換方案的外網交換是指通過數據交換云平臺與本企業(yè)以外的其他應用系統(tǒng)進行數據交換,這種情況根據使用該方案交換的數據流量進行計費。每個企業(yè)在首次接入數據交換云平臺時,數據交換云平臺都會為這個企業(yè)設定一個流量閥值,交換的數據流量低于流量閥值時,免費使用;數據交換流量超過預設流量閥值時按照數據流量收費,并與企業(yè)所選定的端交換的編制者按照比例分成。
端交換方案使用費的收取一方面為出版業(yè)通用數據交換生態(tài)不斷注入資金,使之能夠穩(wěn)定流暢地運行并不斷提高發(fā)展;另一方面端交換方案的編制者獲得了實際收益,能夠吸引更多的技術廠商加入出版業(yè)通用數據交換生態(tài)中,并對已有的交換方案不斷改進提高;企業(yè)用戶雖然付出了少量資金,但是能夠流暢準確地與相關應用系統(tǒng)進行數據交換,大大提高工作效率。三方各取所需,形成良性循環(huán)。
出版業(yè)通用數據交換生態(tài)項目結合生產實際設計,為行業(yè)服務。由中國新聞出版研究院、新華文軒出版?zhèn)髅焦煞萦邢薰尽⒈本┯∷W院、北京理工大學出版社、北京南北天地科技股份有限公司建立聯(lián)合研究機構,該研究機構已被國家新聞出版署批準成立“出版產業(yè)通用數據交換技術重點實驗室”,共同打造開放式研發(fā)平臺。項目設計緊跟國家發(fā)展戰(zhàn)略,服務大局,在媒體深度融合、產業(yè)數據交換方面發(fā)揮主力軍作用。
出版業(yè)通用數據交換生態(tài)項目的推進,將大幅降低產業(yè)鏈數據共享投入,解決產業(yè)鏈數據共享難題,推動標準的落地應用,為產業(yè)信息交換的規(guī)范性、科學性提供應用保障,實現(xiàn)企業(yè)對內、對外無差別的數據交換,并通過大數據技術推進行業(yè)智慧決策、智慧生產、智慧服務。
[1] 葉枝平,李振坤,劉竹松,等.基于XML的數據交換平臺的研究與設計[ J ] .微計算機信息,2008(9):243-244.
[2] 劉成勇.樹立數據思維,建設新聞出版大數據體系[ J ] .出版參考,2016(7):5-8
[3] CY/T 39-2006,圖書流通信息交換規(guī)則 [ S ]
[4] GB/T 30330-2013,中國出版物在線信息交換(CNONIX)圖書產品信息格式 [S]
(作者單位:出版產業(yè)通用數據交換技術重點實驗室北京理工大學出版社有限責任公司)