何軍民
[摘 要] 分析出版人大數(shù)據(jù)思維中存在的諸如其真實(shí)性不容置疑等認(rèn)識誤區(qū),深入調(diào)查研究出版行業(yè)內(nèi)容生產(chǎn)、印刷復(fù)制和產(chǎn)品營銷等主要環(huán)節(jié)的大數(shù)據(jù)實(shí)踐并理性評估其實(shí)際成效,從統(tǒng)一數(shù)據(jù)交換標(biāo)準(zhǔn)和建設(shè)全行業(yè)基礎(chǔ)數(shù)據(jù)服務(wù)平臺等方面為出版人履行把握導(dǎo)向、服務(wù)大局、推動(dòng)高質(zhì)量發(fā)展的崇高使命尋找突破方向。
[關(guān)鍵詞] 大數(shù)據(jù) 出版業(yè) 高質(zhì)量發(fā)展 發(fā)展路徑
[中圖分類號] G237 [文獻(xiàn)標(biāo)識碼] A [文章編號] 1009-5853 (2018) 05-0082-05
[Abstract] Analyze the wrong ideas such as the truth of big data is unquestionable when publishers use big data technology. Deeply investigate, study and evaluate the practice of big data of the main links of modern publishing industry. Make huge breakthroughs from following aspects such as formulating a unified data exchange standard to provide good service for publishers fulfilling the noble mission of grasping the guidance, working hard for the overall situation and promoting high-quality development.
[Key words] Big data Publishing industry High-quality development Development path
1 引 言
1980年,未來學(xué)大師、社會(huì)思想家阿爾文·托夫勒在《第三次浪潮》中提及“大數(shù)據(jù)”一詞,并將其稱為“第三次浪潮的華彩樂章”。2001年,全球信息技術(shù)(Information Technology, IT)研究與顧問咨詢公司美國高德納公司(Gartner)從數(shù)據(jù)容量、數(shù)據(jù)類型和處理速度3個(gè)方面對“大數(shù)據(jù)”進(jìn)行了概念界定。2012年,美國奧巴馬政府頒布《大數(shù)據(jù)研究和發(fā)展計(jì)劃》,把發(fā)展大數(shù)據(jù)上升到國家戰(zhàn)略的高度。自此以來,大數(shù)據(jù)已經(jīng)成為各行各業(yè)最津津樂道的熱門話題之一[1]。具體到出版業(yè),其應(yīng)用呈現(xiàn)出兩個(gè)面向:一方面是從業(yè)者大多對大數(shù)據(jù)持開放甚至歡迎態(tài)度,但是對大數(shù)據(jù)的概念、類型、利用路徑以及發(fā)展方向不甚了了;另一方面,學(xué)界從大數(shù)據(jù)出版的內(nèi)涵與實(shí)踐、大數(shù)據(jù)給出版產(chǎn)業(yè)帶來的機(jī)遇與挑戰(zhàn)、大數(shù)據(jù)時(shí)代的出版創(chuàng)新、出版業(yè)大數(shù)據(jù)的困境與破解等多個(gè)方面對大數(shù)據(jù)與出版業(yè)的關(guān)系進(jìn)行了比較深入的研究,但是卻沒有針對出版業(yè)偏重應(yīng)用的根本特征提出具有較強(qiáng)可行性的盈利模式。本文試圖結(jié)合大數(shù)據(jù)思維的基本概念,從高質(zhì)量發(fā)展的角度研究大數(shù)據(jù)在出版行業(yè)的應(yīng)用,為當(dāng)前形勢下出版業(yè)的路徑轉(zhuǎn)型做出具有一定借鑒意義的探索。
2 大數(shù)據(jù)思維界定和出版界主要誤區(qū)
大數(shù)據(jù)本來是一個(gè)IT行業(yè)術(shù)語,其核心是“大”。國內(nèi)多位學(xué)者對“大數(shù)據(jù)”這個(gè)概念進(jìn)行了界定,其重點(diǎn)都在于對“大”這個(gè)特征的強(qiáng)調(diào)。例如王凌認(rèn)為:“從字面意義上來看,大數(shù)據(jù)指規(guī)模化的海量數(shù)據(jù)。實(shí)際上是指大小超出了典型數(shù)據(jù)庫軟件的采集、儲(chǔ)存、管理和分析能力的數(shù)據(jù)集”[2]。李燕葒認(rèn)為:“大數(shù)據(jù)是指以多元形式,自許多來源搜集而來的龐大數(shù)據(jù)組,往往具有實(shí)時(shí)性”[3]。張軍認(rèn)為,大數(shù)據(jù)“指的是需要新處理模式才能具有更強(qiáng)的決策力、洞察力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)”[4]。由此可見,這個(gè)“大”,不是指普通意義上信息的日積月累,而是指在互聯(lián)網(wǎng)時(shí)代由于信息快速、大范圍、高頻率使用而短時(shí)間甚至瞬間產(chǎn)生的體量上的巨大。根據(jù)以上界定,研究人員一般認(rèn)為大數(shù)據(jù)的特征可以用四個(gè)“V”來概括:一是“Volume Big”,即數(shù)據(jù)量大,計(jì)算能力要求高;二是“Variable Type”,即數(shù)據(jù)類型多樣和來源眾多;三是“Velocity Fast”,即數(shù)據(jù)處理速度要求快、實(shí)時(shí);四是“Value High”,即商業(yè)價(jià)值高[5]。大數(shù)據(jù)的基本概念及其主要特征啟示我們,前互聯(lián)網(wǎng)時(shí)代由于數(shù)據(jù)規(guī)模偏小、數(shù)據(jù)之間關(guān)系難以追蹤且不得不以局部樣本代表整體事物分析客觀情勢而導(dǎo)致的出版決策缺乏足夠數(shù)據(jù)支撐的不足,有望在大數(shù)據(jù)時(shí)代得以改善。正如姚春青所言:“大數(shù)據(jù)中的單個(gè)數(shù)據(jù)可能不精確,但足夠多的數(shù)據(jù)完全可以彌補(bǔ)這一不足,運(yùn)用簡單算法處理大量數(shù)據(jù)所得到的結(jié)果通常比運(yùn)用復(fù)雜算法處理少量數(shù)據(jù)更準(zhǔn)確”[6]。
然而,對于大數(shù)據(jù)的相關(guān)問題,尤其是關(guān)于大數(shù)據(jù)的功能和使用,出版界在認(rèn)識和實(shí)踐上還存在不少誤區(qū)。這直接制約了大數(shù)據(jù)在出版行業(yè)的使用效果。概括起來,出版界關(guān)于大數(shù)據(jù)的主要誤區(qū)有三種。
第一種常見的誤區(qū)是認(rèn)為利用大數(shù)據(jù)技術(shù)采集到的所有數(shù)據(jù)的真實(shí)性都不容懷疑。以閱讀行為數(shù)據(jù)分析為例,在前互聯(lián)網(wǎng)時(shí)代,我們主要靠面對面采訪等直接方式收集這方面的數(shù)據(jù),數(shù)據(jù)的準(zhǔn)確性來源于采訪對象的量大面廣,但是相對于龐大的讀者群來說,采訪對象的數(shù)量始終是有限的,因此其數(shù)據(jù)精度始終不高。在大數(shù)據(jù)時(shí)代的語境下,出版界人士很容易走向數(shù)據(jù)崇拜的誤區(qū),即認(rèn)為通過大數(shù)據(jù)工具收集到的信息全部經(jīng)過數(shù)字追蹤,因而都是真實(shí)準(zhǔn)確的。實(shí)際上,“當(dāng)下社會(huì)公眾的閱讀需求呈現(xiàn)分眾化、個(gè)性化、動(dòng)態(tài)化特點(diǎn),公眾在選擇閱讀對象和實(shí)施閱讀行為時(shí),會(huì)受到各種外部因素的干擾,或附帶較多的非理性的情感因素,甚至具有一定的盲目性,因此,一部分公眾對自身真實(shí)的閱讀需求未必有明確的體認(rèn)”[7]。
第二種常見的誤區(qū)是認(rèn)為大數(shù)據(jù)將直接推動(dòng)傳統(tǒng)出版進(jìn)入科學(xué)化時(shí)代。在前互聯(lián)網(wǎng)時(shí)代,傳統(tǒng)出版流程通常由編輯發(fā)起,從信息搜集開始,到編輯方案制訂、作者人選確定、編輯加工直到營銷計(jì)劃實(shí)施,主要憑借的是邏輯推理和經(jīng)驗(yàn)總結(jié)。在強(qiáng)調(diào)數(shù)據(jù)化支撐的互聯(lián)網(wǎng)時(shí)代,這種主要憑借經(jīng)驗(yàn)和主觀推理的出版模式日益遭受業(yè)內(nèi)外人士的質(zhì)疑。由于通過大數(shù)據(jù)技術(shù)所獲取的信息能夠做到有據(jù)可查,無疑從根本上避免了前大數(shù)據(jù)時(shí)代數(shù)據(jù)獲取方式偏重主觀印象、樣本代表性不強(qiáng)等弊端,因而使得研究者很容易直接將行業(yè)轉(zhuǎn)型升級的希望完全寄托在大數(shù)據(jù)利用上,進(jìn)而認(rèn)為大數(shù)據(jù)可以實(shí)現(xiàn)出版業(yè)決策的完全科學(xué)化。實(shí)際上,“今日的出版業(yè)依然是一個(gè)強(qiáng)調(diào)內(nèi)容積累、文化語境、知識傳承的行業(yè),很難做到完全以用戶為中心決定內(nèi)容資源配置,一切由數(shù)據(jù)說了算的定制生產(chǎn)模式一時(shí)難以取得主導(dǎo)地位”[8]。在某種意義上,由于出版業(yè)固有的強(qiáng)調(diào)內(nèi)容積累、文化語境、知識傳承的特征,大數(shù)據(jù)在相當(dāng)長的時(shí)間內(nèi)只能作為從業(yè)者主觀決策的輔助手段,而從業(yè)者對大數(shù)據(jù)的掌控能力和使用理念將決定大數(shù)據(jù)功能和作用發(fā)揮的水平。
第三種常見的誤區(qū)是認(rèn)為出版業(yè)本質(zhì)上是個(gè)數(shù)據(jù)密集的行業(yè),面對大數(shù)據(jù)時(shí)代的到來,從業(yè)人士只要做好技術(shù)和組織架構(gòu)升級等業(yè)務(wù)性工作,就可以在新的大數(shù)據(jù)時(shí)代如魚得水。實(shí)際上,前大數(shù)據(jù)時(shí)代和大數(shù)據(jù)時(shí)代的區(qū)別,既不是單純的技術(shù)是否先進(jìn)的差別,也不是單純的組織架構(gòu)是否完善的差別,而是發(fā)展理念和認(rèn)識觀念上的根本差別。在前大數(shù)據(jù)時(shí)代,包括科技感很強(qiáng)的數(shù)字出版領(lǐng)域,所有出版產(chǎn)品實(shí)際上是信息海洋的一個(gè)個(gè)“信息孤島”,“它們無法被集成和參與運(yùn)算;而實(shí)現(xiàn)了大數(shù)據(jù)出版之后,這些信息孤島就被海底的大陸架所連接,雖然其呈現(xiàn)方式可以是一本本書籍,但其內(nèi)在結(jié)構(gòu)卻是一個(gè)可被分析的大數(shù)據(jù)庫”,因?yàn)榇髷?shù)據(jù)時(shí)代的信息是“通過光學(xué)識別軟件將書本中的內(nèi)容轉(zhuǎn)化為計(jì)算機(jī)可以檢索和運(yùn)算的信息”[9]。面對這樣的數(shù)據(jù)形態(tài),出版從業(yè)人員僅僅做好技術(shù)和組織架構(gòu)升級的工作是遠(yuǎn)遠(yuǎn)不能適應(yīng)大數(shù)據(jù)時(shí)代要求的,業(yè)界人士應(yīng)該從根本上改變對行業(yè)屬性的認(rèn)識,即從過去把出版業(yè)視為純粹的傳播業(yè)轉(zhuǎn)變?yōu)樵诖髷?shù)據(jù)時(shí)代把出版業(yè)轉(zhuǎn)變?yōu)楦邔哟畏?wù)業(yè),進(jìn)而圍繞這個(gè)新的行業(yè)定位重構(gòu)產(chǎn)業(yè)生態(tài),推動(dòng)行業(yè)升級轉(zhuǎn)型。
3 出版行業(yè)大數(shù)據(jù)實(shí)踐及其成效評估
鑒于國內(nèi)出版業(yè)對于大數(shù)據(jù)技術(shù)的基本概念和發(fā)展方向存在上述誤區(qū),梳理并評估當(dāng)前出版行業(yè)的相關(guān)實(shí)踐,對于業(yè)界人士理清大數(shù)據(jù)思維的實(shí)質(zhì)并實(shí)現(xiàn)出版業(yè)在大數(shù)據(jù)時(shí)代的有效突破,具有很強(qiáng)的參考價(jià)值。從相關(guān)學(xué)者的研究成果看,出版行業(yè)的大數(shù)據(jù)實(shí)踐,集中在內(nèi)容生產(chǎn)、印刷復(fù)制和市場營銷三個(gè)方面。
3.1 內(nèi)容生產(chǎn)方面的大數(shù)據(jù)應(yīng)用
內(nèi)容生產(chǎn)領(lǐng)域的大數(shù)據(jù)應(yīng)用,主要體現(xiàn)在各個(gè)出版門類的選題策劃環(huán)節(jié)。其次,在改進(jìn)書稿編輯過程方面,出版界也有一定探索。
國外出版企業(yè)在內(nèi)容生產(chǎn)領(lǐng)域的大數(shù)據(jù)應(yīng)用方面已經(jīng)進(jìn)行了頗有成效的嘗試。全球知名的兒童圖書和多媒體軟件出版和發(fā)行商學(xué)樂公司(Scholastic Inc.),其《39條線索》系列叢書就是運(yùn)用大數(shù)據(jù)于內(nèi)容創(chuàng)意階段的成功實(shí)踐。該出版社利用大數(shù)據(jù)技術(shù)發(fā)掘讀者最喜愛的線索和人物,進(jìn)而據(jù)此進(jìn)行內(nèi)容策劃[10]。美國的奈飛公司(Netflix)利用大數(shù)據(jù)分析海量用戶信息,不僅僅對于哪位受眾喜歡什么方面的內(nèi)容等初級信息了如指掌,而且可以精確到受眾諸如“看到哪個(gè)演員出場會(huì)跳過不看”等非常具體的行為,這無疑為出版選題策劃提供了非常明確的參考[11]。
相對而言,國內(nèi)企業(yè)在應(yīng)用大數(shù)據(jù)技術(shù)進(jìn)行出版選題策劃方面起步稍晚。在這方面,表現(xiàn)比較突出的是京東和當(dāng)當(dāng)?!熬〇|出版”在深度挖掘1000萬用戶需求的基礎(chǔ)上,和出版社合作推出了第一本新書——貝克漢姆的自傳《大衛(wèi)·貝克漢姆》以及《麥迪在路上》攝影書,并實(shí)現(xiàn)了按需出版。當(dāng)當(dāng)網(wǎng)主導(dǎo)策劃了《皮皮魯送你100條命兒童安全百科》等圖書,市場反響很好[12]。此外,北京磨鐵圖書有限公司在其眾籌出版活動(dòng)中通過用戶投票方式選出用戶支持度高的內(nèi)容資源,進(jìn)而確定圖書目標(biāo)讀者,在確保項(xiàng)目精準(zhǔn)定位上積累了經(jīng)驗(yàn)[13]。
相較于選題創(chuàng)意領(lǐng)域,編輯加工過程中的大數(shù)據(jù)應(yīng)用還是初步的,目前并沒有取得大范圍成功,也沒有足夠多可供復(fù)制的經(jīng)驗(yàn)。已有算得上成功的經(jīng)驗(yàn),典型的例子是谷歌圖書。據(jù)悉,谷歌在其掃描的紙質(zhì)圖書制成的電子書的基礎(chǔ)上,結(jié)合其他內(nèi)容,輔以特定學(xué)科、特定作者、特定歷史時(shí)期、特定語言等參數(shù),允許人工智能將作者輸入的內(nèi)容和在某種程度上與相關(guān)文學(xué)作品進(jìn)行對比,快速提升了人工智能的學(xué)習(xí)效果[14]。可以預(yù)見,這項(xiàng)技術(shù)可以幫助編輯人員在完善書稿的過程中利用相關(guān)大數(shù)據(jù)成果更好地進(jìn)行比對以做出取舍。
這些典型案例傳達(dá)出一些頗具共性的信息:這些企業(yè)都擁有“海量”數(shù)據(jù),都擁有超強(qiáng)的數(shù)據(jù)分析能力和成熟的大數(shù)據(jù)挖掘理論指導(dǎo),而且大多聯(lián)合出版企業(yè)進(jìn)行內(nèi)容創(chuàng)意開發(fā),或者其本身就是知名出版企業(yè)。而大多數(shù)傳統(tǒng)出版企業(yè)雖然擁有豐富的創(chuàng)意經(jīng)驗(yàn)和內(nèi)容把控能力,作者資源也比較充足,但是卻鮮有利用大數(shù)據(jù)技術(shù)和思維于內(nèi)容創(chuàng)意領(lǐng)域的嘗試。筆者認(rèn)為,導(dǎo)致這種情況出現(xiàn)的主要原因在于:由于短時(shí)間內(nèi)難以建成大規(guī)模、一體化的出版大數(shù)據(jù)中心,各個(gè)出版企業(yè)所擁有的數(shù)據(jù)難以有效銜接和溝通,傳統(tǒng)出版企業(yè)數(shù)據(jù)的產(chǎn)生、獲取、存儲(chǔ)以及重復(fù)利用都是分別進(jìn)行的,難以集中形成“海量”數(shù)據(jù),因而難以在大數(shù)據(jù)所要求的“大”的量級上有效發(fā)揮功能。
3.2 印刷復(fù)制方面的大數(shù)據(jù)應(yīng)用
從1990年代我國出版業(yè)引進(jìn)市場化機(jī)制以來,隨著年度出書品種的逐漸增加,圖書庫存逐年增加一直是困擾出版界的一個(gè)嚴(yán)重問題。綜合各方面情況分析,導(dǎo)致圖書庫存居高不下的主要原因在于圖書銷售行業(yè)實(shí)行寄銷制以后,新華書店等經(jīng)銷商不再向出版社報(bào)送“征訂數(shù)”,而圖書編輯又無法擁有準(zhǔn)確的讀者購買意愿數(shù)據(jù),所以最終報(bào)印數(shù)字一般是編輯參考同類書銷售情況進(jìn)行預(yù)估。這就導(dǎo)致實(shí)際銷售與報(bào)印數(shù)之間有較大誤差,久而久之自然就形成大量庫存。按理說,引進(jìn)大數(shù)據(jù)技術(shù)之后,圖書報(bào)印這種以前主要由經(jīng)驗(yàn)決定的環(huán)節(jié)可以獲得足夠的數(shù)據(jù)支撐;但事實(shí)上,即便引進(jìn)了大數(shù)據(jù),相對于需要報(bào)印的圖書品種來說,大數(shù)據(jù)所提供的信息無論多么充分,都是一種基于同類書以往銷售情況、作者知名度、圖書主題在市場上受歡迎程度等要素所做出的預(yù)估,而讀者的最終購買行為受到多種因素的微妙影響。因此,這種預(yù)估永遠(yuǎn)不可能非常精確。如果把決策依據(jù)僅僅寄托在大數(shù)據(jù)所提供的信息上,庫存還是難以根除。這恐怕是大數(shù)據(jù)技術(shù)雖然最有可能為圖書報(bào)印這種最需要數(shù)據(jù)支撐的環(huán)節(jié)提供支持而實(shí)際上應(yīng)用非常有限的主要原因。
雖然大數(shù)據(jù)技術(shù)在圖書印刷復(fù)制環(huán)節(jié)的應(yīng)用上鮮有成功案例,但是印刷復(fù)制企業(yè)卻有利用大數(shù)據(jù)獲得意外成功的實(shí)踐,其最典型者就是雅昌集團(tuán)。雅昌集團(tuán)利用其創(chuàng)立的雅昌藝術(shù)網(wǎng),邁出了從傳統(tǒng)印刷業(yè)向新型文化公司轉(zhuǎn)型的第一步。該網(wǎng)站通過年復(fù)一年、日復(fù)一日的漫長積累,形成了人類歷史上空前的“藝術(shù)品數(shù)據(jù)庫”,從而實(shí)質(zhì)性地拓展了雅昌集團(tuán)的業(yè)務(wù)范圍[15]。雅昌集團(tuán)這種憑借主業(yè)上的大數(shù)據(jù)優(yōu)勢拓展業(yè)務(wù)領(lǐng)域、多元發(fā)展的模式,有望成為印刷復(fù)制企業(yè)大數(shù)據(jù)應(yīng)用未來的主要方向。
3.3 市場營銷方面的大數(shù)據(jù)應(yīng)用
從目前資料來看,出版業(yè)大數(shù)據(jù)應(yīng)用最多的還是在市場營銷方面。無論是大眾出版業(yè)、教育出版業(yè)、學(xué)術(shù)與專業(yè)出版業(yè)、新聞傳播業(yè)以及新型出版業(yè),都有值得肯定的成功實(shí)踐。具體來說,這方面的大數(shù)據(jù)應(yīng)用,大致又有四種情形。
第一種情形是利用大數(shù)據(jù)技術(shù)分析用戶的個(gè)人偏好、影響群體等方面特征,然后根據(jù)分析結(jié)果有針對性地推送內(nèi)容產(chǎn)品。企鵝集團(tuán)2012年和社交數(shù)據(jù)分析站點(diǎn)PeerIndex公司合作推出暢銷書《神沒有男人》后,在營銷過程中就精細(xì)分析了主流社交媒體不同領(lǐng)域意見領(lǐng)袖的相關(guān)信息,然后利用他們的影響力進(jìn)行精準(zhǔn)營銷,取得了很好效果。一些擁有豐富教育內(nèi)容資源的出版集團(tuán),如世界排名首位的培生教育利用大數(shù)據(jù)進(jìn)行精準(zhǔn)營銷,在個(gè)性化教學(xué)方案和智能學(xué)習(xí)平臺搭建方面做出了有效探索。網(wǎng)易新聞建立了自己的Hadoop、Spark、Storm計(jì)算平臺和緩存集群、搜索集群、消息隊(duì)列、NoSQL軟件等,實(shí)現(xiàn)了對用戶信息和訪問軌跡的多維度搜索,從而實(shí)現(xiàn)了內(nèi)容的智能化精準(zhǔn)推送[16]。
第二種情形是利用大數(shù)據(jù)技術(shù)整合內(nèi)容并分析受眾需求,然后通過整合過的內(nèi)容平臺有針對性地進(jìn)行廣告投放。美國《芝加哥論壇報(bào)》根據(jù)大數(shù)據(jù)分析結(jié)果明確了內(nèi)容整合方向,據(jù)此對報(bào)紙內(nèi)容進(jìn)行改造,然后基于受眾需求和興趣進(jìn)行網(wǎng)絡(luò)廣告推廣,走出了持續(xù)四年的破產(chǎn)保護(hù),開始盈利。2012年,《中國國家地理》雜志根據(jù)用戶的媒體使用習(xí)慣確定廣告投放渠道,并根據(jù)用戶忠誠度對用戶進(jìn)行分類,據(jù)此確定廣告投放頻率和力度,其精準(zhǔn)、靈活的廣告方式為企業(yè)帶來了更高收入[17]。
第三種情形是利用大數(shù)據(jù)技術(shù)分析用戶閱讀愛好和購買記錄等個(gè)人傾向性特征,根據(jù)分析結(jié)果為用戶提供精準(zhǔn)的商品推薦服務(wù)。蘋果公司于2014年收購了圖書分析服務(wù)商書燈(BookLamp)后,利用自然語言分析技術(shù)分析不同讀者閱讀愛好和購買記錄數(shù)據(jù),為讀者定制“圖書基因組計(jì)劃”推薦方案,從而為讀者搜索和購買圖書提供精準(zhǔn)的營銷服務(wù)。京東商城推出的“2012年京東數(shù)聚會(huì)”深度分析用戶購物行為,發(fā)現(xiàn)了諸如50%用戶在購買《淡定的人生不寂寞》的同時(shí)將《百年孤獨(dú)》收入囊中等大數(shù)據(jù)分析結(jié)果,從而為其捆綁銷售和商品關(guān)聯(lián)推薦提供了很好的數(shù)據(jù)基礎(chǔ)[18]。
第四種是利用大數(shù)據(jù)技術(shù)分析用戶的使用習(xí)慣和內(nèi)容需求,收集反饋信息,不斷提升用戶滿意度,強(qiáng)化用戶黏性。世界著名學(xué)術(shù)出版企業(yè)施普林格自然集團(tuán)(SpringerNature)的SpringerLink平臺每年記錄2.25億次資源下載詳細(xì)信息,對每個(gè)包月用戶的具體訪問、閱讀行為等信息都進(jìn)行大數(shù)據(jù)分析。中國知網(wǎng)根據(jù)對其年均20多億次檢索次數(shù)和近10億次下載量等龐大數(shù)據(jù)資源的抓取和分析,為用戶提供專業(yè)文獻(xiàn)資源服務(wù)、科研分析服務(wù)、用戶使用跟蹤服務(wù)以及行業(yè)知識服務(wù),還通過檢索幫助用戶找出并研究熱點(diǎn)。這些企業(yè)利用大數(shù)據(jù)技術(shù)分析搜集到的反饋信息,并利用對反饋信息的分析改進(jìn)各自的產(chǎn)品和服務(wù),從而大幅度提升了用戶的滿意度,強(qiáng)化了自身的盈利能力[19]。
4 大數(shù)據(jù)助力出版高質(zhì)量發(fā)展的路徑展望
習(xí)近平總書記在十九大報(bào)告中指出:“我國經(jīng)濟(jì)已由高速增長階段轉(zhuǎn)向高質(zhì)量發(fā)展階段,正處在轉(zhuǎn)變發(fā)展方式、優(yōu)化經(jīng)濟(jì)結(jié)構(gòu)、轉(zhuǎn)換增長動(dòng)力的攻關(guān)期。必須堅(jiān)持質(zhì)量第一、效益優(yōu)先,以供給側(cè)結(jié)構(gòu)性改革為主線,推動(dòng)經(jīng)濟(jì)發(fā)展質(zhì)量變革、效率變革、動(dòng)力變革?!盵20]出版業(yè)作為文化產(chǎn)業(yè)的重要組成部分,自然也必須由高速增長階段轉(zhuǎn)向高質(zhì)量發(fā)展階段,也就必須以供給側(cè)結(jié)構(gòu)性改革為主線。筆者認(rèn)為,鑒于行業(yè)現(xiàn)實(shí)及存在的突出問題,出版業(yè)應(yīng)該緊緊抓住供給側(cè)結(jié)構(gòu)性改革這條主線,深入貫徹大數(shù)據(jù)思維,從以下4條路徑推動(dòng)出版高質(zhì)量發(fā)展迅速取得突破。
第一,著眼于全行業(yè)整體范圍,統(tǒng)一在線出版信息交換標(biāo)準(zhǔn),建設(shè)統(tǒng)一的全國出版基礎(chǔ)數(shù)據(jù)服務(wù)平臺。如前所述,當(dāng)前出版業(yè)在數(shù)據(jù)利用上的突出問題是所有出版產(chǎn)品實(shí)際上是無法被集成和參與運(yùn)算的一個(gè)個(gè)“信息孤島”。因此之故,關(guān)系出版業(yè)整體質(zhì)量的選題策劃、印刷復(fù)制和產(chǎn)品營銷諸多環(huán)節(jié)的決策行為難以精準(zhǔn)應(yīng)對,從而導(dǎo)致出版業(yè)供給側(cè)質(zhì)量難以有效滿足市場需求。圖書出版業(yè)庫存居高不下就是其突出表征。從微觀角度看,不同出版企業(yè)其書名、標(biāo)題、主題、出版者、日期、類型、格式、標(biāo)識符、來源等描述出版物相關(guān)信息的數(shù)據(jù)均不存在計(jì)算機(jī)可理解、可溝通、可交流的統(tǒng)一標(biāo)準(zhǔn);從宏觀角度看,全國范圍內(nèi)也不存在一個(gè)涵蓋編輯、營銷、用戶行為等出版重要環(huán)節(jié)的全行業(yè)一體化全國出版基礎(chǔ)數(shù)據(jù)服務(wù)平臺。這兩方面的不足,決定了出版在行業(yè)數(shù)據(jù)呈幾何級增長的態(tài)勢情況下,個(gè)體出版企業(yè)的微觀決策和主管部門的宏觀決策都無法建立在行業(yè)大數(shù)據(jù)的基礎(chǔ)上且兩種決策難以協(xié)同創(chuàng)新,因此其精準(zhǔn)性和前大數(shù)據(jù)時(shí)代的決策行為難以有本質(zhì)差別。在我國由出版大國向出版強(qiáng)國邁進(jìn)的過程中,主管部門和行業(yè)協(xié)會(huì)必須充分發(fā)揮管理、組織和協(xié)調(diào)功能,制定科學(xué)可行的行業(yè)信息和數(shù)據(jù)交換標(biāo)準(zhǔn),同時(shí)建立面向全體出版企業(yè)的全國出版基礎(chǔ)數(shù)據(jù)服務(wù)平臺,讓全行業(yè)出版數(shù)據(jù)告別散兵游勇的“信息孤島”狀態(tài),真正發(fā)揮大數(shù)據(jù)的“大”功能,為出版供給側(cè)質(zhì)量提升發(fā)揮基礎(chǔ)性數(shù)據(jù)支撐作用。
第二,充分考慮出版行業(yè)特性,普及大數(shù)據(jù)思維必需的相關(guān)理論和知識技能,打造一支熟練掌握大數(shù)據(jù)思維和基本技能的人才隊(duì)伍。從根本上說,出版的專業(yè)特性就在于它的內(nèi)容和知識密集性,而內(nèi)容和知識的密集乃至對密集內(nèi)容和知識的有效利用都離不開人,尤其是掌握生產(chǎn)動(dòng)力的編輯人員。在這種情況下,要想充分發(fā)揮大數(shù)據(jù)的功能和利用大數(shù)據(jù)的價(jià)值,就必須擁有一支大數(shù)據(jù)人才隊(duì)伍。從目前情況看,面對大數(shù)據(jù)技術(shù)短期內(nèi)快速發(fā)展和相關(guān)研究不夠深入的現(xiàn)實(shí),大部分出版從業(yè)人員對大數(shù)據(jù)相關(guān)理論知識和技能尚處于一知半解甚至懵懵懂懂的狀態(tài):毫無保留歡迎者有之,根深蒂固抗拒者亦不少,而最缺乏的恰恰是深入的調(diào)查研究和精準(zhǔn)地把握應(yīng)用。按照高質(zhì)量發(fā)展的要求,我們只有具備了必要的大數(shù)據(jù)相關(guān)理論知識和技能,才可能充分挖掘大數(shù)據(jù)的價(jià)值并利用挖掘結(jié)果為觀和宏觀出版決策服務(wù)。
第三,出于積累并復(fù)制經(jīng)驗(yàn)的實(shí)際需要,在大數(shù)據(jù)知識和技能普及過程中,出版企業(yè)要選擇一些重點(diǎn)項(xiàng)目進(jìn)行“人—數(shù)”協(xié)同創(chuàng)新,積累行業(yè)大數(shù)據(jù)應(yīng)用的必要經(jīng)驗(yàn)。專業(yè)出版人員要在一些重大融合出版項(xiàng)目中有意識加大大數(shù)據(jù)應(yīng)用的比重,利用大數(shù)據(jù)技術(shù)科學(xué)分析數(shù)據(jù)構(gòu)成,找出重復(fù)出版較多的內(nèi)容領(lǐng)域,根據(jù)用戶需求和購買偏好列出負(fù)面清單,引導(dǎo)編輯人員在將來的選題策劃中有意識地避免涉及負(fù)面清單所列領(lǐng)域;找出圖書出版涉及較少而讀者需求比較強(qiáng)烈的內(nèi)容領(lǐng)域,超前謀劃,引導(dǎo)閱讀方向。通過重點(diǎn)項(xiàng)目積累大數(shù)據(jù)應(yīng)用的相關(guān)經(jīng)驗(yàn)以后,編輯人員可以在一般項(xiàng)目上復(fù)制重點(diǎn)項(xiàng)目的經(jīng)驗(yàn),從而整體上提升供給側(cè)產(chǎn)品質(zhì)量,更好地滿足人民群眾的美好生活需要。
第四,牢記把握導(dǎo)向、服務(wù)大局的崇高使命,正確認(rèn)識大數(shù)據(jù)技術(shù)的長處和不足,提升出版決策的社會(huì)效益和經(jīng)濟(jì)效益水平。從前述有關(guān)大數(shù)據(jù)應(yīng)用的案例分析可以看出,盡管大數(shù)據(jù)技術(shù)相對于前大數(shù)據(jù)時(shí)代來說可以分析更多甚至是所有行業(yè)數(shù)據(jù),但對于尚未成型和尚未投入實(shí)際使用的產(chǎn)品和服務(wù)而言,大數(shù)據(jù)所發(fā)揮的作用始終是預(yù)測,而其結(jié)果無論多么準(zhǔn)確,終究不能和實(shí)際情況完全符合。實(shí)際上,由于“數(shù)據(jù)本身價(jià)值密度低等特點(diǎn),使得探討如何在海量的數(shù)據(jù)中挖掘更多價(jià)值成為一個(gè)永恒的話題”[21]。編輯的主觀能動(dòng)作用在出版這種十分注重內(nèi)容謀劃的行業(yè)中的使用限度就尤其值得重視。筆者認(rèn)為,從根本意義上說,大數(shù)據(jù)技術(shù)和思維只能成為出版人主觀決策的一種輔助,而不能成為其決策行為的主宰。無論是針對一個(gè)個(gè)具體出版項(xiàng)目的微觀決策,還是針對整個(gè)行業(yè)發(fā)展的宏觀決策,出版人都應(yīng)該有利用大數(shù)據(jù)的主導(dǎo)思想,并在這種主導(dǎo)思想的指引下理性對待大數(shù)據(jù)技術(shù)。尤其是我國出版業(yè),肩負(fù)把握導(dǎo)向、服務(wù)大局的崇高使命,出版人更不能唯大數(shù)據(jù)分析結(jié)果馬首是瞻,一味迎合大數(shù)據(jù)分析結(jié)果體現(xiàn)的讀者趣味,尤其不能迎合少數(shù)讀者的低級趣味,而應(yīng)該在大數(shù)據(jù)價(jià)值挖掘和分析的基礎(chǔ)上,按照社會(huì)主義核心價(jià)值觀的要求,堅(jiān)持以人民為中心的創(chuàng)作導(dǎo)向和出版方向,把社會(huì)效益放在首位,實(shí)現(xiàn)社會(huì)效益和經(jīng)濟(jì)效益相統(tǒng)一。
5 結(jié) 語
總的來看,大數(shù)據(jù)既是一種信息現(xiàn)狀,也是一種技術(shù)手段,還是一種思維方向。對于這種新生事物,我們一方面要保持開放態(tài)度,認(rèn)識到它對開闊思維領(lǐng)域的重要意義;另一方面也要謹(jǐn)防業(yè)界人士成為新技術(shù)和新理論的奴隸,要對其進(jìn)行理性調(diào)查研究和深入分析。我們要清醒認(rèn)識到,大數(shù)據(jù)的主要功能在于對比和預(yù)測,而對比和預(yù)測從根本上說是一種對多數(shù)人偏好的認(rèn)可乃至迎合。但很多時(shí)候,大多數(shù)人的趣味和偏好并不高尚,甚至存在這樣那樣的問題。所以,出版人要正確認(rèn)識大數(shù)據(jù)思維和技術(shù)的誤區(qū),客觀分析大數(shù)據(jù)應(yīng)用的典型案例,發(fā)揮主觀導(dǎo)向作用,做好服務(wù)大局的工作,秉承社會(huì)效益為先的思想用好大數(shù)據(jù)思維,讓大數(shù)據(jù)技術(shù)更好地為當(dāng)前的出版高質(zhì)量發(fā)展服務(wù)。
注 釋
[1]徐立萍. 出版業(yè)大數(shù)據(jù)研究的困境與破解[J].出版發(fā)行研究,2017(6):40-43
[2][5][11]王凌.論大數(shù)據(jù)技術(shù)的應(yīng)用對出版業(yè)的影響[J].編輯之友,2014(4):21-23
[3]李燕葒.大數(shù)據(jù)時(shí)代的出版創(chuàng)新研究[J].傳播力研究,2017(2):75-80
[4]張軍.大數(shù)據(jù)時(shí)代的出版創(chuàng)新[J].科技與出版,2015(6):101-103
[6]姚春青.把握大數(shù)據(jù)思維的特點(diǎn)規(guī)律[N].中國國防報(bào),2016-05-26
[7][8]吳赟,崔波,施勇勤,楊海平.大數(shù)據(jù)出版若干問題探析[J]. 編輯之友,2016(8):12-18
[9]張振宇,周莉.“大數(shù)據(jù)出版”的理念、方法及發(fā)展路徑[J].出版發(fā)行研究,2015(1):14-17
[10]孫曉敏.淺談大數(shù)據(jù)在圖書出版中的應(yīng)用 [J].中國編輯,2017(5):54-58
[12][13][16][17][18][19][21]陸利坤,游新東.大數(shù)據(jù)技術(shù)在出版行業(yè)中的應(yīng)用研究[J].出版科學(xué),2017(6):89-95
[14][美]馬克· J. H ·弗雷茨.大數(shù)據(jù)出版 [J].出版科學(xué),2017(1):5-17
[15]石佳靚.大數(shù)據(jù):出版產(chǎn)業(yè)的機(jī)遇與實(shí)踐 [J].中國出版,2014(5)上:44-47
[20]習(xí)近平.決勝全面建成小康社會(huì),奪取新時(shí)代中國特色社會(huì)主義偉大勝利:在中國共產(chǎn)黨第十九次全國代表大會(huì)上的講話 [M].北京:人民出版社,2017:30
(收稿日期:2018-03-02)