文/趙宏源
隨著大數(shù)據(jù)的發(fā)展逐步邁入實質(zhì)應(yīng)用階段,對社會各個層面都產(chǎn)生了重大的影響:行業(yè)層面上,決策依據(jù)更加全面和準確,有助于形成新的核心競爭力,對企業(yè)的生產(chǎn)模式、商業(yè)模式以及管理模式等都產(chǎn)生了深刻的變革,行業(yè)之間的界限模糊化;思維方式層面上,從滿足于樣本數(shù)據(jù)變?yōu)槭褂萌w數(shù)據(jù),從追求精確性到容忍混雜性,從關(guān)注因果關(guān)系到關(guān)注相關(guān)關(guān)系;智慧和戰(zhàn)略層面上,數(shù)據(jù)的膨脹在“量”上引發(fā)混沌的同時,在“質(zhì)”上可能開始顯現(xiàn)出秩序,對社會發(fā)展和管理模式提出了新的挑戰(zhàn)。[1]
在這個時代背景下,數(shù)字出版的發(fā)展逐步走向多元化:網(wǎng)絡(luò)出版、移動出版、數(shù)據(jù)庫出版、融合出版以及知識服務(wù)等。數(shù)字出版本身的特征也發(fā)生重大變化,從內(nèi)容生產(chǎn)、管理過程、產(chǎn)品形態(tài)以及傳播渠道的單純的數(shù)字化1發(fā)展為內(nèi)容生產(chǎn)主體的多元化、交付方式的多樣化、服務(wù)過程的系統(tǒng)化以及內(nèi)容推薦的智能化。內(nèi)容生產(chǎn)主體的多元化體現(xiàn)為UGC(用戶生產(chǎn)內(nèi)容)、PGC(專業(yè)生產(chǎn)內(nèi)容)、OGC(職業(yè)生產(chǎn)內(nèi)容)以及DGC(設(shè)備驅(qū)動內(nèi)容)等多種內(nèi)容生產(chǎn)模式的涌現(xiàn);交付方式的多樣化如紙質(zhì)圖書、音頻圖書、VR/AR圖書、知識付費乃至知識服務(wù)等;服務(wù)過程的系統(tǒng)化體現(xiàn)在多層次的關(guān)聯(lián)體系為讀者提供完整的知識體系;內(nèi)容推薦的智能化體現(xiàn)在用戶畫像基礎(chǔ)上的精準推薦。
在數(shù)字出版上述特征的形成與演變過程中,大數(shù)據(jù)技術(shù)的應(yīng)用是最主要的推動因素。隨著數(shù)字出版產(chǎn)業(yè)的發(fā)展,大數(shù)據(jù)的應(yīng)用價值越來越大。
用戶畫像(persona)是美國交互設(shè)計師阿蘭·庫珀在《交互設(shè)計之路—讓高科技產(chǎn)品回歸人性》一書中提出的概念,persona本意為面具,引申義為“面具”所表現(xiàn)出來的“角色”,主要作用在于描述用戶特征。根據(jù)用戶的現(xiàn)實特征和潛在特征,用戶畫像可以分為靜態(tài)畫像和動態(tài)畫像兩種。前者主要針對用戶的統(tǒng)計學(xué)特征(如出生日期、性別、學(xué)歷以及職業(yè)等)和行為特征(如衣食住行、娛樂、社交以及學(xué)習等消費習慣);后者則針對用戶的可能性、潛在性和趨勢性特征。[2]前者以用戶需求為導(dǎo)向,重點在于應(yīng)用場景中的用戶行為模式,后者以生活愿景為導(dǎo)向的用戶生活方式的描述,重點在于數(shù)據(jù)挖掘基礎(chǔ)上的用戶趨勢預(yù)測。[3]
大數(shù)據(jù)視角下的用戶概念,外延擴展到所有用戶,既包括現(xiàn)實或者潛在用戶,也包括跨行業(yè)潛在用戶。界定用戶的標準在于其價值提供和價值共創(chuàng)的結(jié)果,而非是否購買企業(yè)的產(chǎn)品/服務(wù)或者參與過企業(yè)活動。[4]大數(shù)據(jù)基礎(chǔ)上的用戶畫像通過用戶標簽化,構(gòu)建數(shù)據(jù)模型研究“全樣本”用戶特征,有助于準確識別和描繪目標用戶,有效聯(lián)接用戶的屬性、行為與期待,極大地避免了主觀因素的干擾;有助于及時掌握用戶的異動,促進產(chǎn)品/服務(wù)的升級或者調(diào)整;有助于針對用戶的個性化需求實現(xiàn)精準推薦。[5]
與其他行業(yè)比較,數(shù)字出版的用戶的特點更加復(fù)雜,首先是用戶角色的多重性。同一個用戶既可能單一的服務(wù)使用角色,也可能是集內(nèi)容的創(chuàng)作者、使用者、演繹者以及傳播者中某幾個或者全部于一體的混合角色。其次是用戶之間的關(guān)聯(lián)性?;趯餐黝}內(nèi)容的關(guān)注和用戶自身知識層次產(chǎn)生用戶之間的碰撞效應(yīng)或者同化效應(yīng),形成用戶之間多種多樣的關(guān)聯(lián)關(guān)系。最后是用戶特征的動態(tài)演變。隨著用戶知識量的增加,對內(nèi)容的需求、內(nèi)容產(chǎn)業(yè)鏈上扮演的角色以及社交關(guān)系等都處于持續(xù)的動態(tài)演變過程中。數(shù)字出版的目標用戶的這些特點不僅要求準確描述用戶的現(xiàn)實特征,進行靜態(tài)畫像,以便實現(xiàn)產(chǎn)品/服務(wù)的精準推送,更要著眼未來,準確把握用戶需求的發(fā)展趨勢,進行動態(tài)畫像,以便捕捉用戶興趣與需求的變化,實現(xiàn)用戶畫像的完整構(gòu)建與不斷迭代。
2004年10 月,《連線》雜志主編克里斯·安德森提出長尾理論,他認為,“只要存儲和流通的渠道足夠大,需求不旺或銷量不佳的產(chǎn)品所共同占據(jù)的市場份額,可以和那些少數(shù)熱銷產(chǎn)品所占據(jù)的市場份額想匹敵甚至更大,即眾多小市場可匯聚成與主流大市場相匹敵的市場能量”。長尾效應(yīng)的意義在于“將所有非流行的市場累加起來會形成一個比流行市場還大的市場”[6]。
大數(shù)據(jù)時代的到來,人們獲取的信息量越來越大,長期存在的信息不對稱現(xiàn)象因此得到改善。與此同時,大數(shù)據(jù)也引發(fā)了選擇困境,面對海量的信息人們無所適從,尤其對大量價值有限甚或垃圾信息難以甄別,從而形成了大數(shù)據(jù)實踐應(yīng)用中的悖論。反映在市場經(jīng)濟中體現(xiàn)為冪律分布[7]與長尾分布的并存,一方面,由于關(guān)注度的集聚效應(yīng),頭部產(chǎn)品所占比例越來越小,單品銷量越來越大;另一方面,長尾產(chǎn)品越來越多,質(zhì)量參差不齊,人們的選擇與甄別越發(fā)困難。這一問題的解決依然要回到大數(shù)據(jù)本身,通過完整的用戶畫像與產(chǎn)品特征的描述實現(xiàn)產(chǎn)品的精準推薦。
圖書出版業(yè)屬于小眾行業(yè),一方面,大多數(shù)圖書的讀者群有限,不可能有巨大的銷量;另一方面,如此眾多的圖書充斥市場,結(jié)果是大多數(shù)圖書很難找到目標讀者,只有極少數(shù)的圖書最終成為暢銷書。[8]進入數(shù)字出版階段之后,這一特征體現(xiàn)的更加明顯,存儲和復(fù)制的邊際成本趨近于零,創(chuàng)作門檻大幅降低,所出版的作品規(guī)模急劇擴張。冪律分布與長尾分布的兩極化現(xiàn)象在數(shù)字出版業(yè)內(nèi)更加劇烈,長尾產(chǎn)品的挖掘與過濾更加困難。通過大數(shù)據(jù)技術(shù),有助于建立完整的用戶畫像,以識別用戶需求,建立完整的知識關(guān)聯(lián)體系,以導(dǎo)航定位發(fā)掘優(yōu)質(zhì)的長尾產(chǎn)品,通過用戶評價以及作品相關(guān)的各種被引用關(guān)系等實現(xiàn)劣質(zhì)長尾產(chǎn)品的過濾。
所謂協(xié)同,就是指協(xié)調(diào)兩個或者兩個以上的不同資源或者個體,協(xié)同一致地完成某一目標的過程或能力。站在具有獨立法人地位企業(yè)的角度,協(xié)同包括企業(yè)之間的協(xié)同和企業(yè)內(nèi)部的協(xié)同。企業(yè)之間的協(xié)同包括縱向協(xié)同與橫向協(xié)同,前者最典型的例子就是外包,后者即聯(lián)合開發(fā),雙方或者多方組成項目組共同開發(fā),獲取的知識產(chǎn)權(quán)和利潤按比例分攤。企業(yè)間協(xié)同根據(jù)緊密程度分為三個層次,即低耦合、中耦合和高耦合。企業(yè)內(nèi)部的協(xié)同也分為三個層次,即產(chǎn)品結(jié)構(gòu)的協(xié)同、專業(yè)技術(shù)的協(xié)同和內(nèi)部各業(yè)務(wù)部門之間的協(xié)同。[9]
大數(shù)據(jù)背景下的企業(yè)協(xié)同,更注重資源整合意義上的協(xié)同。從內(nèi)部而言,必須打破系統(tǒng)邊界,打破部門壁壘,整合企業(yè)內(nèi)外多源異構(gòu)的數(shù)據(jù),通過大數(shù)據(jù)分析,掌握企業(yè)自身優(yōu)勢與劣勢、市場環(huán)境、用戶特征與需求,改革并優(yōu)化企業(yè)內(nèi)部的管理與服務(wù)流程,為用戶提供精準的產(chǎn)品/服務(wù)。從外部而言,企業(yè)不同階段的發(fā)展需求必然不斷產(chǎn)生各種或虛或?qū)嵉膱F隊,導(dǎo)致協(xié)同的邊界不斷擴大,相應(yīng)的資源需求不斷擴大而且多變。通過大數(shù)據(jù)分析,有效整合包括人力、組織、技術(shù)以及資金等在內(nèi)的各種企業(yè)外部資源,并隨時根據(jù)實際狀況動態(tài)調(diào)整,實現(xiàn)企業(yè)內(nèi)部之間以及企業(yè)之間信息的共享和利用,優(yōu)化外部合作流程,從而大幅提升效率。[10]
相比其他行業(yè),數(shù)字出版流程涉及的因素更為復(fù)雜,用戶畫像描述、選題策劃、表達方式確定、交付方式選擇、外部審校資源與作者資源整合、關(guān)聯(lián)體系構(gòu)建、交互功能設(shè)計與內(nèi)容監(jiān)管以及版權(quán)追蹤監(jiān)控等,都必須整合企業(yè)內(nèi)部與外部的各種資源,針對不同需求進行相應(yīng)的甄別與選擇,尤其是面對快速多變的內(nèi)容創(chuàng)作創(chuàng)新,更加要求協(xié)同的出版流程,實現(xiàn)產(chǎn)品/服務(wù)市場的高效運營。大數(shù)據(jù)技術(shù)的運用,有助于提升出版流程各個環(huán)節(jié)的市場化程度,據(jù)此實現(xiàn)內(nèi)部部門之間的分工協(xié)調(diào),外部資源的充分利用,進而提升數(shù)字出版企業(yè)的協(xié)同管理效率。
供需鏈的研究起源于20世紀60年代,一般是指由進行物料獲取、加工物料成中間件或者成品,再將成品送到用戶手中的一些企業(yè)或者企業(yè)部門構(gòu)成的網(wǎng)絡(luò)。參與供需鏈的主體包括供應(yīng)商、生產(chǎn)商、配送中心、零售商以及最終用戶。供需鏈涉及的內(nèi)容包括參與供需鏈的有關(guān)實體之間的物流、信息流與資金流。[11]根據(jù)供需鏈中起核心作用的企業(yè)類型,供需鏈模式可以分為以分銷商為核心的供需鏈、以制造商為核心的供需鏈、以拍賣商為核心的供需鏈三種。[12]有效的供需鏈管理有助于企業(yè)降低成本,提高競爭力;加速整個供需鏈上物流與信息流的流動,縮短產(chǎn)品流通周期;突出企業(yè)核心能力,加強競爭力。[13]
大數(shù)據(jù)技術(shù)的出現(xiàn),通過對供需信息的量化與分析,降低供需鏈中的不確定風險,改變了傳統(tǒng)的供需鏈模式,體現(xiàn)在兩方面:一是供需從面對面模式(即傳統(tǒng)的批量模式)到點對點(即根據(jù)消費需求定點生產(chǎn)與銷售)模式的確立;二是供需分析預(yù)測的廣度、深度和準確度的提高。第一個體現(xiàn)對于生產(chǎn)者而言意味著生產(chǎn)端與消費端溝通距離的縮短,上文中的三種供需鏈模式因之分化解體,個性化需求的滿足逐步成為企業(yè)生產(chǎn)的主流模式;對于消費者而言意味著按需購買模式的盛行,用戶根據(jù)商家基于大數(shù)據(jù)分析的推薦和自身實際需求選擇合適的產(chǎn)品/服務(wù)。第二個體現(xiàn)傳統(tǒng)的樣本分析、概貌分析演變?yōu)榫珳史治?,并以此為基礎(chǔ)對未來趨勢進行預(yù)測,根據(jù)趨勢預(yù)測確定企業(yè)的戰(zhàn)略決策。[14]
數(shù)字出版與包括傳統(tǒng)出版在內(nèi)的行業(yè)供需鏈相比,構(gòu)成和運作模式都有很大不同。供需鏈的構(gòu)成上有內(nèi)容供需鏈、技術(shù)供需鏈以及載體供需鏈,其中,內(nèi)容供需鏈從作者到出版單位到平臺商(包括出版單位自建平臺)到用戶端;技術(shù)供需鏈從數(shù)據(jù)加工商(例如內(nèi)容的數(shù)字化加工或者音視頻加工)到出版單位再到技術(shù)開發(fā)商(平臺或者數(shù)據(jù)庫開發(fā));載體供需鏈從作者到出版單位到渠道商再到零售商最后到讀者。無論每一條供需鏈除了中介性質(zhì)的出版單位之外,都不是一般行業(yè)的一對一和一對多,而是多對多,而且供需鏈上的角色之間還存在重合性或者協(xié)作關(guān)系,前者如作者與讀者角色的重合,后者如數(shù)據(jù)加工商與平臺開發(fā)商之間的協(xié)作。大數(shù)據(jù)的應(yīng)用,使整個供需鏈的上下游都發(fā)生改變,從相對單一的線性結(jié)構(gòu)變?yōu)槎嘣Ⅲw的網(wǎng)狀結(jié)構(gòu)[15]。通過對最終用戶畫像的描述,供需鏈上各個角色的分析,實現(xiàn)出版不同角色供需的精準匹配,優(yōu)化供需鏈結(jié)構(gòu)。
知識服務(wù),指以知識資源為對象,以信息知識的組織、關(guān)聯(lián)、挖掘、重構(gòu)等為手段,為用戶提供個性化的智能服務(wù)。它是當今知識信息資源共享模式設(shè)計的核心指導(dǎo)思想,這種共享模式為用戶提供的是針對特定問題的解決方案,即“知識”。[16]知識包括顯性知識和隱性知識。其中,顯性知識指容易轉(zhuǎn)化為符號的知識,可以語言表述從而傳播;隱性知識隱藏在知識主體手中和頭腦中,體現(xiàn)為技能、訣竅、洞察力、經(jīng)驗等無法用語言或者特定符號編碼的知識。[17]前者最典型的呈現(xiàn)方式就是出版物,尤其是圖書,系統(tǒng)的論證與闡述、便捷的傳播與交付,成為顯性知識最佳的載體選擇;后者最常見的表現(xiàn)例如師徒傳承、實踐練習以及頭腦風暴等,“只可意會,不可言傳”是其最主要的特征。兩者同時又可以相互轉(zhuǎn)化,通過社會化實現(xiàn)隱性知識之間的轉(zhuǎn)化;通過外化實現(xiàn)隱性知識到顯性知識的轉(zhuǎn)化;通過整合實現(xiàn)顯性知識之間的轉(zhuǎn)化;通過內(nèi)化實現(xiàn)顯性知識到隱性知識的轉(zhuǎn)化。[18]通過顯性知識與隱性知識相互之間不斷的轉(zhuǎn)化,實現(xiàn)知識本身的創(chuàng)新與傳播。
大數(shù)據(jù)的出現(xiàn)使知識服務(wù)在知識生產(chǎn)與更新、典型特征、服務(wù)范圍與模式等方面都產(chǎn)生了迥異于以往的變化。首先,知識生產(chǎn)主體多元化,既有領(lǐng)域內(nèi)專家,也有普通用戶,既有職業(yè)機構(gòu),也有個體生產(chǎn),出現(xiàn)既有系統(tǒng)化的專業(yè)知識,也有碎片化的應(yīng)用/普及知識,從而增強了知識關(guān)聯(lián)體系構(gòu)建的必要性。其次,在知識更新的方式上,既有質(zhì)變性的系統(tǒng)化更新,也有知識交互過程中產(chǎn)生的量變性質(zhì)的碎片化更新,知識交互同時具有了用戶體驗與知識輸出的功能。再次,知識服務(wù)的典型特征體現(xiàn)在:面向自主需求和智慧服務(wù)、不確定性、強調(diào)用戶參與、按需使用與付費以及基于群體創(chuàng)新等。[19]
從社會功能角度看,個人認為,數(shù)字出版與圖書出版并無二致,那就是娛樂和教化。前者如網(wǎng)絡(luò)文學(xué)、網(wǎng)絡(luò)游戲、數(shù)字音樂以及網(wǎng)絡(luò)動漫等;后者如電子圖書、數(shù)字報紙、數(shù)字期刊、網(wǎng)絡(luò)教育出版物、數(shù)據(jù)庫出版物以及手機出版物等。從上文對大數(shù)據(jù)背景下數(shù)字出版和知識服務(wù)的分析可以看出,知識服務(wù)更強調(diào)用戶為中心,根據(jù)用戶的信息偏好以及具體需要,采取個性化的服務(wù)方式,為用戶提供針對實際問題的解決方案等,因此,可以把知識服務(wù)視為教化領(lǐng)域數(shù)字出版的深化。[20]依托大數(shù)據(jù)技術(shù),知識服務(wù)既可以整合已有的存量系統(tǒng)化知識資源,又可以整合社會上的相關(guān)碎片化知識資源,還可以通過知識交互產(chǎn)生新的知識。在此基礎(chǔ)上,構(gòu)建完整的知識關(guān)聯(lián)體系,實現(xiàn)系統(tǒng)知識和碎片知識的關(guān)聯(lián),自動建立新知識與已有知識的關(guān)聯(lián),消除“信息超載”“知識碎片化”和“信息孤島”等問題,促進知識服務(wù)的深層次發(fā)展。[21]
所謂用戶體驗,簡單講就是用戶的主觀感受,主要指用戶使用產(chǎn)品之前、期間和之后的認知印象和回應(yīng)。[22]影響用戶體驗的因素主要有四個,即產(chǎn)品策略、用戶界面、技術(shù)以及運營等。[23]大數(shù)據(jù)通過量化用戶的愉悅度、參與度、接受度、留存度與任務(wù)完成度等指標,建立完整的用戶靜態(tài)與動態(tài)畫像,改善影響用戶體驗的因素,
實現(xiàn)用戶體驗的優(yōu)化與迭代。
大數(shù)據(jù)在用戶體驗上的功能訴求可以分為三個,即基于銷售的智能推薦、基于選題的需求分析和基于創(chuàng)作的能力分析。所以,用戶體驗的優(yōu)化與迭代應(yīng)從這三個方面展開。
首先,應(yīng)對海量的用戶數(shù)據(jù)進行最大限度的采集與整理,分析其靜態(tài)特征,包括統(tǒng)計學(xué)特征和行為特征,從而找到產(chǎn)品的潛在用戶,進而提供精準推薦服務(wù),進行場景化的介紹,簡化用戶選擇過程,提高用戶購買體驗。
其次,加強非結(jié)構(gòu)化數(shù)據(jù)的采集整理,尤其是潛在細分領(lǐng)域中用戶共同關(guān)注的話題、發(fā)表的言論、表達的思想等等,通過挖掘與分析,發(fā)現(xiàn)用戶數(shù)據(jù)背后所反映的深層思想和預(yù)見趨勢,進而策劃細分市場選題,并且在選題策劃過程中持續(xù)追蹤這些變化,不斷迭代,最終形成符合用戶需求的選題與產(chǎn)品。
最后,通過隱性知識標引與隱性知識地圖構(gòu)建,尋找符合需求的潛在作者,并對作者的專業(yè)能力與創(chuàng)作能力進行分析。隱性知識標引通過隱性知識顯性化的方式進行:其一是個人主動提供,包括個人詳細信息、經(jīng)歷、創(chuàng)作的作品以及交互過程中的內(nèi)容輸出等,從中選取標識個人的標簽;其二是他人評價,主要是在各種交互過程中周圍人士對所輸出的內(nèi)容的各種評論、解讀以及態(tài)度等,從外部視角做出更客觀的評價。最后是系統(tǒng)自動發(fā)現(xiàn),及時捕捉個人的隱性知識,例如人與人的互動過程中不自覺顯示的某些技能等。[24]隱性知識地圖的構(gòu)建主要通過分析與作者相關(guān)的數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,包括作者與作品關(guān)系、領(lǐng)域內(nèi)作者之間關(guān)系以及領(lǐng)域內(nèi)作品之間關(guān)系等。根據(jù)作者的專業(yè)能力、創(chuàng)作能力與溝通能力確定作品的創(chuàng)作方式、表達方式以及傳播協(xié)作等。
大數(shù)據(jù)的價值由大數(shù)據(jù)的關(guān)聯(lián)性即大數(shù)據(jù)結(jié)構(gòu)表達。[25]大數(shù)據(jù)伴生的信息超載和信息孤島現(xiàn)象與數(shù)字出版的冪律分布和長尾分布并存現(xiàn)象導(dǎo)致除少數(shù)頭部內(nèi)容外,大多數(shù)內(nèi)容無法得到足夠的展示機會為用戶所知曉,部分劣質(zhì)內(nèi)容也無法及時處理,信噪比降低。解決這個問題,就必須回歸大數(shù)據(jù)的價值根本,那就是通過關(guān)聯(lián)體系的構(gòu)建,充分運用知識之間存在的多類型、多維度、多層次的關(guān)聯(lián)關(guān)系,實現(xiàn)知識的挖掘、發(fā)現(xiàn)、驗證、甄別以及過濾等。[26]
運用大數(shù)據(jù)技術(shù)構(gòu)建知識關(guān)聯(lián),實現(xiàn)優(yōu)質(zhì)內(nèi)容的發(fā)現(xiàn)與劣質(zhì)內(nèi)容的過濾,可以從幾個方面展開:
首先,通過基于大數(shù)據(jù)的自動標引、社會標引以及知識元標引等構(gòu)建顯性知識、知識內(nèi)容以及學(xué)科知識等類型的已有知識關(guān)聯(lián),在此基礎(chǔ)上,結(jié)合知識交互過程中的輸出,不斷將新產(chǎn)生知識納入既有知識體系的同時,完善知識(包括交互過程中的輸出知識,下同)的評價指標體系,進而建立隱性知識關(guān)聯(lián)與個性化的主題知識關(guān)聯(lián),通過知識之間的相互印證和用戶評價兩個角度達到知識發(fā)現(xiàn)與過濾的目的。
其次,從知識與知識之間、知識與人之間以及人與人之間等三個維度完善關(guān)聯(lián)關(guān)系,知識與知識之間的關(guān)聯(lián)即上文顯性知識之間的關(guān)聯(lián);知識與人之間的關(guān)聯(lián)意味著必須對人即讀者和作者進行標引,這種標引既包括統(tǒng)計學(xué)意義上的特征標引,也包括行為意義上的特征標引,在此基礎(chǔ)上,通過知識與作者之間的多樣化關(guān)聯(lián),確定知識內(nèi)容的真?zhèn)?。知識內(nèi)容真?zhèn)蔚谋孀R通過兩個途徑實現(xiàn):其一是類似文獻分析中的共引和耦合分析,發(fā)現(xiàn)指定知識內(nèi)容的關(guān)聯(lián)關(guān)系,從而做出正確判斷;其二是用戶評價,通過多數(shù)人的看法得出正確結(jié)論。
最后是綜合運用簡單關(guān)聯(lián)、時序關(guān)聯(lián)和因果關(guān)聯(lián)等規(guī)則,及時發(fā)現(xiàn)異常數(shù)據(jù),清除垃圾賬號與垃圾信息,減少噪聲。通過簡單關(guān)聯(lián)規(guī)則中兩類變量(例如交互過程中輸出內(nèi)容與原始內(nèi)容)之間相關(guān)程度的測算,判斷輸出內(nèi)容質(zhì)量的優(yōu)劣與輸出動機;通過行為發(fā)生的時間對行為(例如內(nèi)容輸出的行為與時間)進行時序關(guān)聯(lián)計算,判斷輸出者的勤勉程度或者輸出內(nèi)容的性質(zhì);通過關(guān)聯(lián)的時序、強度、特異性、可重復(fù)性、一致性、合理性以及相似性等標準,確定因果關(guān)聯(lián)成立的可能性,從而發(fā)現(xiàn)新知識、判斷現(xiàn)有知識的正確與否。[27]
大數(shù)據(jù)對數(shù)字出版流程優(yōu)化的作用主要通過數(shù)據(jù)分析與挖掘?qū)崿F(xiàn)決策支持,為產(chǎn)品生命周期不同階段的內(nèi)外資源整合提供識別與選擇、汲取與配置、激活和有機融合,構(gòu)建企業(yè)價值鏈,[28]促進開發(fā)過程中各個環(huán)節(jié)的有效銜接與資源利用率的最大化,及時發(fā)現(xiàn)并處理運營過程中的隱患,加快產(chǎn)品的更新迭代,實現(xiàn)產(chǎn)品的協(xié)同運營。
通過大數(shù)據(jù)技術(shù)整合資源,推動產(chǎn)品協(xié)同運營應(yīng)從以下幾個方面展開:
首先,在選題策劃階段應(yīng)從內(nèi)容和主創(chuàng)作者兩個角度考慮。內(nèi)容方面,通過大數(shù)據(jù)對現(xiàn)有海量文獻數(shù)據(jù)分析與挖掘,根據(jù)關(guān)注度、詞頻統(tǒng)計、共引度以及耦合度等多種指標,及時發(fā)現(xiàn)學(xué)科研究熱點方向、學(xué)科細分市場盲點(例如研究或者科普)、不同層次讀者關(guān)注的重點等確定選題方向(即所謂思想),然后,通過用戶畫像分析用戶的應(yīng)用場景,據(jù)此確定不同應(yīng)用場景的表達方式。主創(chuàng)作者方面,在通過現(xiàn)有海量文獻數(shù)據(jù)分析與挖掘的同時,建立作者數(shù)據(jù)庫,對作者的專業(yè)研究方向、學(xué)術(shù)關(guān)注度、媒體關(guān)注度、學(xué)術(shù)傳播度、用戶關(guān)注度、創(chuàng)作風格、粉絲群體以及動態(tài)行為等跟蹤分析,根據(jù)作品應(yīng)用場景精準選定作者?;诎鏅?quán)引進的選題分析則在此基礎(chǔ)上增加版權(quán)作品輸出區(qū)的市場分析、作者與作品在輸入?yún)^(qū)的影響力與前景分析等。
其次,在內(nèi)容生產(chǎn)階段主要考慮兩個方面:一是場景化的表達與迭代;二是內(nèi)容關(guān)聯(lián)的及時建立與更新。前者根據(jù)用戶的應(yīng)用場景細分化,并對不同場景的相關(guān)數(shù)據(jù)資源予以整合,實現(xiàn)內(nèi)容的一次創(chuàng)作,多次發(fā)布。在此基礎(chǔ)上,確定與應(yīng)用場景相匹配的表達方式和交付方式,例如沉浸式深度或者淺度閱讀、陪伴式閱讀(親子閱讀可歸入此類)、伴隨式閱讀(音頻讀物),可分別采用專業(yè)論述或者普及講述,音頻或者文字等。在創(chuàng)作過程中,不斷根據(jù)用戶反饋協(xié)助作者調(diào)整創(chuàng)作思路,完善交付設(shè)計,實現(xiàn)產(chǎn)品的更新迭代。后者則在內(nèi)容發(fā)布更新的同時,不斷建立完善內(nèi)容關(guān)聯(lián),實現(xiàn)交付的增值與迭代,方式如上文所述。
最后,在產(chǎn)品傳播階段,通過大數(shù)據(jù)技術(shù)著重解決產(chǎn)品與應(yīng)用場景的連接問題,提高產(chǎn)品交付效率。這個連接主要通過兩條途徑實現(xiàn):一是通過大數(shù)據(jù)分析找到目標用戶及其使用場景,通過用戶畫像實現(xiàn)產(chǎn)品的智能化精準推薦;二是通過針對性的誘因設(shè)計,刺激用戶的主動傳播行為,實現(xiàn)產(chǎn)品的裂變傳播。其中,智能化推薦通過兩種方式實現(xiàn),一種是整合用戶與應(yīng)用場景連接渠道基礎(chǔ)上的主動推薦,例如智能音箱最適合伴隨式閱讀場景,因此,通過智能音箱的實物分發(fā)渠道向用戶推薦適合伴隨場景的有聲讀物;另一種是基于關(guān)聯(lián)(此處關(guān)聯(lián)指普遍意義上的關(guān)聯(lián),不包括知識關(guān)聯(lián))規(guī)則挖掘的關(guān)聯(lián)推薦,通過分析關(guān)聯(lián)的提升度、置信度以及支持度等指標找到強關(guān)聯(lián)規(guī)則,為用戶提供擴展性推薦。
供需鏈優(yōu)化的主要作用在于及時識別經(jīng)營風險,降低運營成本。大數(shù)據(jù)對供需鏈優(yōu)化的兩個作用主要通過兩端即上游供應(yīng)端和下游需求端的歷史數(shù)據(jù)分析研究,在發(fā)現(xiàn)與創(chuàng)造用戶需求的前提下判斷供應(yīng)端的各種能力與風險,提高經(jīng)營水平。
通過大數(shù)據(jù)技術(shù)優(yōu)化供需鏈,實現(xiàn)經(jīng)營效率的提升應(yīng)從兩方面展開:
從供應(yīng)端角度重點加強能力分析,包括供應(yīng)端的生產(chǎn)能力、響應(yīng)能力、管理能力與風險防范能力等。數(shù)字出版的供應(yīng)端包括內(nèi)容供應(yīng)者、技術(shù)供應(yīng)者以及載體供應(yīng)者,其中,內(nèi)容供應(yīng)者是重點,各種UGC、PGC與OGC都可以歸入此類。首先通過大數(shù)據(jù)采集數(shù)字出版單位自身的業(yè)務(wù)數(shù)據(jù)、用戶體驗、交互數(shù)據(jù)等,分析并確定自身的定位、核心功能,進行動態(tài)修正與調(diào)整。在此基礎(chǔ)上,通過對PGC與OGC等內(nèi)容供應(yīng)者的分析考察,建立基于知識生產(chǎn)的分享與協(xié)作網(wǎng)絡(luò),確定系統(tǒng)化的內(nèi)容來源與供應(yīng)節(jié)奏;建立UGC內(nèi)容生產(chǎn)者的篩選與審核辦法,并對內(nèi)容建立嚴格的審查辦法,確保輸出內(nèi)容的合法性;建立對UGC內(nèi)容生產(chǎn)者的發(fā)掘與培養(yǎng)辦法,逐步往PGC方向發(fā)展,提升其內(nèi)容生產(chǎn)質(zhì)量;結(jié)合人工審核與用戶反饋,建立優(yōu)質(zhì)內(nèi)容的篩選、評價與深加工流程。
從需求端角度重點在于通過對各種半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的分析,主要是基于知識元分析的內(nèi)容、內(nèi)容交互過程中的輸出內(nèi)容(例如書評)以及各種自媒體內(nèi)容等,發(fā)現(xiàn)空白或者尚未滿足市場的內(nèi)容需求,通過與之有關(guān)的相關(guān)關(guān)聯(lián)與因果關(guān)聯(lián)分析,確定所需基本的表達思想,進一步通過用戶畫像所呈現(xiàn)的應(yīng)用場景確定內(nèi)容的表達方式。其次是用戶的基本特征數(shù)據(jù)、消費記錄數(shù)據(jù)、地理位置數(shù)據(jù)、線上互動數(shù)據(jù)、線下行為數(shù)據(jù)、web公共數(shù)據(jù)以及社交生成數(shù)據(jù)等[29]確定內(nèi)容生產(chǎn)元素與用戶數(shù)據(jù)之間的關(guān)系。最后通過與供應(yīng)端內(nèi)容生產(chǎn)者的匹配,確定不同內(nèi)容生產(chǎn)者的分工合作,滿足市場需求。
大數(shù)據(jù)對出版資源的深度開發(fā)在自有資源整合的基礎(chǔ)上完成知識的組織、關(guān)聯(lián)、挖掘與重構(gòu),完成知識服務(wù)基本架構(gòu)的搭建,進一步拓展整合外部資源并及時更新,形成知識服務(wù)產(chǎn)品的更新迭代,幫助用戶不斷實現(xiàn)知識發(fā)現(xiàn)。
通過大數(shù)據(jù)整合資源,推動知識服務(wù)不斷升級,主要通過以下幾個方面展開:
首先是在根據(jù)上述目標用戶畫像,確定知識服務(wù)產(chǎn)品主題的前提下,組織所需的內(nèi)容資源,對資源進行深加工,構(gòu)建包括知識元標引、隱性知識標引、動態(tài)標引以及社會標引在內(nèi)的知識標引體系,據(jù)此建立完整的知識關(guān)聯(lián)。
其次是不斷對知識服務(wù)產(chǎn)品運營過程中通過知識交互產(chǎn)生的輸出內(nèi)容進行標引,與已有知識內(nèi)容建立關(guān)聯(lián);及時獲取社會新產(chǎn)生的知識內(nèi)容與信息資訊,在知識標引的基礎(chǔ)上將其納入知識體系。在形成動態(tài)知識關(guān)聯(lián)的同時不斷擴展知識體系的邊界,實現(xiàn)知識服務(wù)的更新迭代。
最后是根據(jù)用戶的行為特征與知識之間的連接關(guān)系建立個性化的關(guān)聯(lián)關(guān)系,為用戶提供個性化的知識體系,實現(xiàn)個人意義上的知識發(fā)現(xiàn)。例如,用戶學(xué)習輸入假說,動機可能是研究第二外語教學(xué)理論,也可能在研究知識服務(wù)運營,還可能在研究寫作理論。因此,必須綜合考察用戶的瀏覽內(nèi)容、創(chuàng)作內(nèi)容(包含引文)、交互內(nèi)容以及其他行為特征,據(jù)此為用戶提供或二語教學(xué),或知識服務(wù)運營,或?qū)懽骼碚撗芯康年P(guān)聯(lián)內(nèi)容,提供精準的內(nèi)容推薦,有效促進用戶的知識吸收,推動知識輸出,實現(xiàn)知識的分享與協(xié)作。
與傳統(tǒng)出版比較,數(shù)字出版融合圖書、期刊、報紙、廣播電視以及互聯(lián)網(wǎng)出版等多種形態(tài),與知識服務(wù)的界限日趨模糊,不僅強調(diào)內(nèi)容的系統(tǒng)性、關(guān)聯(lián)性、交互性,更強調(diào)表達的場景化、內(nèi)容的個性化和推薦的精準化,提高思想到達的有效性。這些特征的產(chǎn)生一方面是大數(shù)據(jù)在數(shù)字出版領(lǐng)域發(fā)展的必然結(jié)果;另一方面,通過大數(shù)據(jù)技術(shù)得到了強化。
大數(shù)據(jù)通過對各種信息數(shù)據(jù)資源的整合、分析、關(guān)聯(lián)、挖掘與重構(gòu)對用戶畫像、長尾經(jīng)營、流程再造、供需鏈優(yōu)化以及知識服務(wù)深化等方面產(chǎn)生了深刻影響,形成真正以用戶為中心的內(nèi)容生產(chǎn)、交互與交付格局,從根本上顛覆了傳統(tǒng)出版的運營模式。在這種背景下,數(shù)字出版企業(yè)必須從用戶體驗優(yōu)化、內(nèi)容的發(fā)掘與過濾、產(chǎn)品的協(xié)同運營、供需鏈結(jié)構(gòu)的優(yōu)化以及知識服務(wù)的更新等方面入手,推動出版業(yè)的全面轉(zhuǎn)型發(fā)展。