【摘 要】在數(shù)據(jù)要素被納入生產(chǎn)要素的背景下,出版業(yè)作為知識(shí)密集型產(chǎn)業(yè),面臨數(shù)據(jù)采集孤島化、治理機(jī)制缺失、應(yīng)用場(chǎng)景碎片化等困境?;谡邔?dǎo)向、技術(shù)演進(jìn)與行業(yè)實(shí)踐三維框架,剖析出版業(yè)數(shù)據(jù)戰(zhàn)略認(rèn)知錯(cuò)位、技術(shù)能力鴻溝及生態(tài)協(xié)同不足等深層矛盾,提出“認(rèn)知重構(gòu)—技術(shù)升級(jí)—生態(tài)協(xié)同”的系統(tǒng)性突圍路徑。研究表明,通過(guò)建立數(shù)據(jù)資產(chǎn)運(yùn)營(yíng)體系、構(gòu)建出版業(yè)數(shù)據(jù)中臺(tái)、完善行業(yè)標(biāo)準(zhǔn)與共享機(jī)制,可推動(dòng)數(shù)據(jù)要素從資源沉淀轉(zhuǎn)向價(jià)值釋放,為出版業(yè)智能化轉(zhuǎn)型提供核心驅(qū)動(dòng)力。
【關(guān)" 鍵" 詞】人工智能;出版業(yè);數(shù)據(jù)要素;智能化
【作者單位】李嘉寧,中國(guó)新聞出版研究院;董毅敏,中國(guó)新聞出版研究院;王揚(yáng),中國(guó)新聞出版研究院。
【中圖分類號(hào)】G230.7 【文獻(xiàn)標(biāo)識(shí)碼】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2025.06.008
在農(nóng)業(yè)經(jīng)濟(jì)時(shí)代,土地與勞動(dòng)力作為核心生產(chǎn)要素,形成“土地為基、人力為本”的增長(zhǎng)模式。工業(yè)革命后,資本與技術(shù)崛起,流水線生產(chǎn)與規(guī)?;圃煲蕾嚈C(jī)器設(shè)備與技術(shù)創(chuàng)新。進(jìn)入21世紀(jì),數(shù)字技術(shù)重構(gòu)經(jīng)濟(jì)形態(tài),數(shù)據(jù)憑借獨(dú)特的非物質(zhì)屬性,成為驅(qū)動(dòng)生產(chǎn)力變革的核心引擎。2020年,中共中央、國(guó)務(wù)院發(fā)布《關(guān)于構(gòu)建更加完善的要素市場(chǎng)化配置體制機(jī)制的意見(jiàn)》,首次將數(shù)據(jù)納入生產(chǎn)要素,完成從“資源”到“要素”的制度確認(rèn),這標(biāo)志著數(shù)據(jù)要素正式成為數(shù)字經(jīng)濟(jì)發(fā)展的關(guān)鍵動(dòng)力。
數(shù)據(jù)要素是指通過(guò)采集、處理、分析后能產(chǎn)生經(jīng)濟(jì)價(jià)值與社會(huì)價(jià)值的各類數(shù)據(jù)集合。就出版業(yè)而言,數(shù)據(jù)要素涵蓋內(nèi)容數(shù)據(jù)、用戶數(shù)據(jù)、運(yùn)營(yíng)數(shù)據(jù)等多元類型,本文嘗試根據(jù)出版產(chǎn)業(yè)的實(shí)際業(yè)務(wù),將出版業(yè)數(shù)據(jù)分為8種類型(見(jiàn)表1)。在人工智能浪潮下,出版業(yè)對(duì)數(shù)據(jù)價(jià)值的討論日益熱烈,但在數(shù)據(jù)的采集、治理、應(yīng)用及安全保障等環(huán)節(jié)仍面臨諸多困境,探索有效的破解路徑對(duì)出版業(yè)在新時(shí)代的轉(zhuǎn)型升級(jí)與高質(zhì)量發(fā)展具有重要意義。
一、數(shù)據(jù)要素正成為出版業(yè)轉(zhuǎn)型發(fā)展的核心驅(qū)動(dòng)力
在數(shù)字經(jīng)濟(jì)重構(gòu)全球產(chǎn)業(yè)格局的時(shí)代背景下,數(shù)據(jù)要素以其獨(dú)特的非物質(zhì)屬性與倍增效應(yīng)重塑出版業(yè)的價(jià)值創(chuàng)造邏輯。從國(guó)家戰(zhàn)略層面的制度確認(rèn),到人工智能技術(shù)催生的應(yīng)用剛需,再到出版單位破解發(fā)展瓶頸的內(nèi)生訴求,數(shù)據(jù)要素已從邊緣資源升級(jí)為驅(qū)動(dòng)行業(yè)轉(zhuǎn)型的核心引擎。
1.國(guó)家戰(zhàn)略需要:數(shù)據(jù)要素納入頂層設(shè)計(jì),重構(gòu)出版業(yè)發(fā)展坐標(biāo)系
數(shù)據(jù)要素市場(chǎng)化配置是《“十四五”數(shù)字經(jīng)濟(jì)發(fā)展規(guī)劃》的重要內(nèi)容。近年來(lái),國(guó)家層面密集出臺(tái)數(shù)據(jù)要素相關(guān)政策文件,有力促進(jìn)了數(shù)據(jù)產(chǎn)業(yè)的發(fā)展。2022年12月,中共中央、國(guó)務(wù)院印發(fā)《關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見(jiàn)》(“數(shù)據(jù)二十條”);2023年12月,國(guó)家數(shù)據(jù)局等17部門(mén)聯(lián)合印發(fā)《“數(shù)據(jù)要素×”三年行動(dòng)計(jì)劃(2024—2026年)》;2024年12月,國(guó)家數(shù)據(jù)局等5部門(mén)發(fā)布《關(guān)于促進(jìn)企業(yè)數(shù)據(jù)資源開(kāi)發(fā)利用的意見(jiàn)》,同月,國(guó)家發(fā)展改革委等6部門(mén)印發(fā)《關(guān)于促進(jìn)數(shù)據(jù)產(chǎn)業(yè)高質(zhì)量發(fā)展的指導(dǎo)意見(jiàn)》。這些政策為數(shù)據(jù)要素作為核心資源重塑各行業(yè)發(fā)展格局提供了“金鑰匙”,深刻體現(xiàn)了國(guó)家戰(zhàn)略與行業(yè)發(fā)展的同頻共振。
數(shù)據(jù)要素納入國(guó)家頂層設(shè)計(jì),為出版業(yè)發(fā)展重新劃定坐標(biāo)原點(diǎn),推動(dòng)其在數(shù)字經(jīng)濟(jì)浪潮中實(shí)現(xiàn)從傳統(tǒng)內(nèi)容生產(chǎn)者到數(shù)據(jù)價(jià)值挖掘者的角色轉(zhuǎn)變。當(dāng)數(shù)據(jù)成為坐標(biāo)系的橫軸與縱軸,其將成為貫穿整個(gè)產(chǎn)業(yè)鏈的核心要素。一方面,數(shù)據(jù)打破了傳統(tǒng)圖書(shū)知識(shí)生產(chǎn)的單一線性內(nèi)容加工結(jié)構(gòu),通過(guò)知識(shí)圖譜技術(shù)轉(zhuǎn)化為網(wǎng)狀數(shù)據(jù)關(guān)聯(lián)。另一方面,出版業(yè)市場(chǎng)價(jià)值評(píng)估體系從“內(nèi)容發(fā)行量”轉(zhuǎn)向“數(shù)據(jù)資產(chǎn)量”,數(shù)據(jù)將為出版企業(yè)帶來(lái)更大的市場(chǎng)機(jī)會(huì)。此外,數(shù)據(jù)打破了出版業(yè)與其他產(chǎn)業(yè)的融合邊界,推動(dòng)出版業(yè)與教育、科技、金融等領(lǐng)域形成數(shù)據(jù)互通的生態(tài)網(wǎng)絡(luò)。
2.人工智能技術(shù)發(fā)展的需要:技術(shù)激發(fā)出版業(yè)數(shù)據(jù)價(jià)值
人工智能技術(shù)的突破建立在“數(shù)據(jù)+算力+算法”的三元架構(gòu)之上。其中,數(shù)據(jù)作為核心生產(chǎn)資料,直接決定了技術(shù)應(yīng)用的效能,而高質(zhì)量數(shù)據(jù)更是算法模型的剛性依賴。出版業(yè)積累的專業(yè)內(nèi)容數(shù)據(jù),正成為AI技術(shù)落地的“數(shù)據(jù)金礦”。
在人工智能時(shí)代,技術(shù)與數(shù)據(jù)要素形成“雙向增強(qiáng)”關(guān)系:技術(shù)釋放數(shù)據(jù)價(jià)值,數(shù)據(jù)反哺技術(shù)迭代。一方面,技術(shù)與數(shù)據(jù)的協(xié)同進(jìn)化正在重塑出版業(yè)的生產(chǎn)流程。從選題環(huán)節(jié)的AI輔助決策,到編輯環(huán)節(jié)的智能校對(duì),再到發(fā)行環(huán)節(jié)的精準(zhǔn)營(yíng)銷,每個(gè)場(chǎng)景的智能化改造都需要數(shù)據(jù)要素的支撐。例如,出版業(yè)自研的智能推薦系統(tǒng)的準(zhǔn)確率普遍低于互聯(lián)網(wǎng)平臺(tái),根本原因在于用戶行為數(shù)據(jù)積累不足,需要更多的動(dòng)態(tài)數(shù)據(jù)用于模型訓(xùn)練。傳統(tǒng)靜態(tài)數(shù)據(jù)(如用戶注冊(cè)信息、購(gòu)書(shū)記錄等)已無(wú)法滿足AI時(shí)代的需求洞察,這就需要采集更多的數(shù)據(jù)來(lái)源,如閱讀時(shí)長(zhǎng)、章節(jié)跳轉(zhuǎn)軌跡、分享記錄、交易數(shù)據(jù)等動(dòng)態(tài)行為數(shù)據(jù),以提升市場(chǎng)趨勢(shì)預(yù)測(cè)的準(zhǔn)確率。另一方面,人工智能技術(shù)的發(fā)展需要出版業(yè)的高質(zhì)量語(yǔ)料來(lái)調(diào)精調(diào)優(yōu)。語(yǔ)料庫(kù)的質(zhì)量在生成式AI模型的訓(xùn)練和應(yīng)用中至關(guān)重要,當(dāng)前生成式AI普遍存在“語(yǔ)料污染”問(wèn)題,導(dǎo)致“機(jī)器幻覺(jué)”現(xiàn)象頻發(fā)。因此,大模型往往需要基于出版業(yè)垂直領(lǐng)域的高質(zhì)量數(shù)據(jù)進(jìn)行精調(diào),以降低差錯(cuò)率。
3.出版單位自身發(fā)展需要:破解傳統(tǒng)困境,構(gòu)建數(shù)據(jù)驅(qū)動(dòng)的內(nèi)生增長(zhǎng)機(jī)制
在數(shù)字化浪潮的沖擊下,傳統(tǒng)出版單位正面臨前所未有的發(fā)展困境。用戶流失、創(chuàng)新乏力等問(wèn)題日益凸顯,數(shù)據(jù)要素的深度應(yīng)用為破解困境、實(shí)現(xiàn)內(nèi)生增長(zhǎng)提供了新的路徑。
出版業(yè)的核心職能是知識(shí)傳播與傳承,但人工智能時(shí)代的知識(shí)獲取方式已發(fā)生轉(zhuǎn)變。第55次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》顯示,生成式人工智能產(chǎn)品的用戶規(guī)模達(dá)2.49億人,占總?cè)丝诘?7.7%。其中,利用生成式AI產(chǎn)品回答問(wèn)題的用戶最為廣泛,占比77.6%。這意味著出版單位只有深入理解AI時(shí)代的互聯(lián)網(wǎng)空間,才能把握時(shí)代主動(dòng)權(quán)。一方面,用戶需求從標(biāo)準(zhǔn)化內(nèi)容消費(fèi)轉(zhuǎn)向個(gè)性化知識(shí)服務(wù);另一方面,AI工具已成為人們獲取知識(shí)的重要途徑,“搜索+閱讀”模式被“提問(wèn)+生成”模式所取代。數(shù)據(jù)要素由此成為滿足這些新需求的核心支撐:通過(guò)精準(zhǔn)分析用戶學(xué)習(xí)需求定制個(gè)性化方案,或基于專業(yè)出版數(shù)據(jù)構(gòu)建垂類模型,以“行業(yè)學(xué)家”的角色處理通用大模型無(wú)法處理的專業(yè)性難題。“人在哪兒,宣傳思想工作重點(diǎn)就在哪兒”,面對(duì)用戶知識(shí)獲取需求的轉(zhuǎn)變,出版單位需進(jìn)軍人工智能領(lǐng)域,發(fā)揮數(shù)據(jù)要素價(jià)值,做好新一輪轉(zhuǎn)型。
此外,傳統(tǒng)出版依賴“內(nèi)容生產(chǎn)—版權(quán)授權(quán)—產(chǎn)品銷售”的線性模式,在數(shù)字時(shí)代遭遇市場(chǎng)增長(zhǎng)瓶頸。數(shù)據(jù)要素的應(yīng)用則能催生商業(yè)模式創(chuàng)新,通過(guò)數(shù)據(jù)資產(chǎn)化運(yùn)營(yíng)構(gòu)建知識(shí)服務(wù)生態(tài)體系。
二、人工智能時(shí)代出版業(yè)數(shù)據(jù)應(yīng)用的實(shí)踐與探索
數(shù)據(jù)產(chǎn)業(yè)是利用現(xiàn)代信息技術(shù)開(kāi)發(fā)數(shù)據(jù)資源產(chǎn)品或服務(wù),并推動(dòng)其流通應(yīng)用形成的新興產(chǎn)業(yè),包括數(shù)據(jù)采集匯聚、計(jì)算存儲(chǔ)、流通交易、開(kāi)發(fā)利用、安全治理以及數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)等。在數(shù)據(jù)要素驅(qū)動(dòng)出版業(yè)轉(zhuǎn)型的浪潮下,不同類型和規(guī)模的出版單位基于自身定位與資源,在數(shù)據(jù)采集、開(kāi)發(fā)與應(yīng)用等環(huán)節(jié)形成了差異化實(shí)踐。
1.出版業(yè)數(shù)據(jù)庫(kù)建設(shè)總體概況
在出版業(yè)數(shù)字化轉(zhuǎn)型進(jìn)程中,數(shù)據(jù)庫(kù)作為數(shù)據(jù)存儲(chǔ)、管理與價(jià)值挖掘的核心載體,貫穿出版業(yè)數(shù)據(jù)價(jià)值鏈的各環(huán)節(jié),其建設(shè)水平直接決定了數(shù)據(jù)應(yīng)用的深度與廣度。2022年,中國(guó)新聞出版研究院國(guó)家知識(shí)服務(wù)平臺(tái)開(kāi)展全國(guó)出版單位數(shù)據(jù)庫(kù)建設(shè)調(diào)研,根據(jù)統(tǒng)計(jì)結(jié)果,在我國(guó)584家出版單位中(2022年數(shù)據(jù)),有151家建設(shè)了專業(yè)數(shù)據(jù)庫(kù),占比25.86%。這151家出版單位共建成271個(gè)專業(yè)數(shù)據(jù)庫(kù)服務(wù),平均每家建設(shè)1.79個(gè)專業(yè)數(shù)據(jù)庫(kù)。其中,人民衛(wèi)生出版社建設(shè)數(shù)量最多,達(dá)13個(gè),文物出版社其次(12個(gè))。調(diào)研表明,從出版產(chǎn)業(yè)的業(yè)務(wù)數(shù)據(jù)應(yīng)用情況來(lái)看,有利用計(jì)劃的單位較多,占比69.23%,但通過(guò)業(yè)務(wù)數(shù)據(jù)產(chǎn)生直接收益、指導(dǎo)產(chǎn)品優(yōu)化的單位較少,業(yè)務(wù)數(shù)據(jù)的整體利用率較低。
業(yè)務(wù)數(shù)據(jù)的使用主要包括兩種方式:一是用于內(nèi)部分析,以支撐產(chǎn)品的持續(xù)優(yōu)化,這種方式較為普遍;二是將業(yè)務(wù)數(shù)據(jù)產(chǎn)品化,整合出版元數(shù)據(jù)等數(shù)字內(nèi)容資源,提供專業(yè)內(nèi)容服務(wù)。這類產(chǎn)品構(gòu)建了智能問(wèn)答、內(nèi)容推薦等輔助功能,幫助用戶更好地獲取內(nèi)容,實(shí)現(xiàn)良好的人機(jī)交互。例如,人民法院電子音像出版社的“法信”和外語(yǔ)教學(xué)與研究出版社“外研在線”旗下的系列產(chǎn)品,已在市場(chǎng)初獲成功。
2.出版業(yè)數(shù)據(jù)采集體系的多層級(jí)實(shí)踐
出版業(yè)數(shù)據(jù)采集已突破傳統(tǒng)內(nèi)容管理范疇,形成了覆蓋全鏈條、多主體的立體化體系,行業(yè)正從“數(shù)據(jù)收集”向“價(jià)值挖掘”深度演進(jìn)。
頭部出版單位依托技術(shù)優(yōu)勢(shì)構(gòu)建了全域數(shù)據(jù)采集網(wǎng)絡(luò)。以外語(yǔ)教學(xué)與研究出版社的外語(yǔ)教育數(shù)據(jù)中臺(tái)為例,其構(gòu)建了橫跨線上線下的復(fù)合采集體系:一方面,通過(guò)自研APP采集單詞測(cè)試正確率、視頻課程完播率、互動(dòng)練習(xí)提交頻次等多維度用戶行為數(shù)據(jù);另一方面,通過(guò)教師培訓(xùn)社群、教材征訂系統(tǒng)整合線下教學(xué)場(chǎng)景數(shù)據(jù)。中信出版社的AI選題系統(tǒng)則通過(guò)三個(gè)維度實(shí)現(xiàn)數(shù)據(jù)采集:外部數(shù)據(jù)層抓取豆瓣讀書(shū)書(shū)評(píng)、當(dāng)當(dāng)網(wǎng)用戶評(píng)論及百度指數(shù)的關(guān)鍵詞熱度;內(nèi)部數(shù)據(jù)層整合近年選題通過(guò)率、作者合作版稅收益等歷史業(yè)務(wù)數(shù)據(jù);第三方數(shù)據(jù)層接入艾瑞咨詢行業(yè)報(bào)告、開(kāi)卷數(shù)據(jù)的市場(chǎng)監(jiān)測(cè)信息。
中小型出版單位受資金、技術(shù)和人才資源的限制,普遍采用場(chǎng)景聚焦策略,在核心環(huán)節(jié)實(shí)施輕量化數(shù)據(jù)采集以實(shí)現(xiàn)精準(zhǔn)突破。例如,人民交通出版社在整合《公路工程施工安全技術(shù)規(guī)范》等行業(yè)標(biāo)準(zhǔn)時(shí),不僅采集條款正文,還通過(guò)專家訪談、企業(yè)調(diào)研等方式,采集標(biāo)準(zhǔn)制定的政策背景、橋梁施工應(yīng)用案例、事故整改反饋意見(jiàn),構(gòu)建了“標(biāo)準(zhǔn)—場(chǎng)景—反饋”知識(shí)圖譜。童趣出版社在《迪士尼繪本》的數(shù)據(jù)采集中,創(chuàng)新性地納入翻頁(yè)加速度、互動(dòng)游戲失敗次數(shù)等動(dòng)態(tài)指標(biāo),并通過(guò)眼動(dòng)儀測(cè)試補(bǔ)充用戶注意力分布數(shù)據(jù),為IP向動(dòng)畫(huà)、舞臺(tái)劇改編提供精準(zhǔn)的行為依據(jù)。
3.?dāng)?shù)據(jù)應(yīng)用與商業(yè)模式場(chǎng)景拓展
數(shù)據(jù)要素催生了多元盈利模式。目前,出版單位主要依托數(shù)據(jù)資源開(kāi)展綜合知識(shí)服務(wù)和內(nèi)容IP運(yùn)營(yíng)。
在專業(yè)及學(xué)術(shù)出版領(lǐng)域,數(shù)據(jù)服務(wù)強(qiáng)調(diào)專業(yè)性和學(xué)術(shù)性,主要應(yīng)用于六大場(chǎng)景:文獻(xiàn)與信息檢索、稿件撰寫(xiě)與編輯、書(shū)目與引文管理、審校與工作流程、抄襲檢測(cè)、目標(biāo)期刊選擇。例如,中華醫(yī)學(xué)雜志社的MedAI助手、同方知網(wǎng)的騰云期刊出版平臺(tái)、清華大學(xué)出版社的SciOpen國(guó)際化學(xué)術(shù)出版平臺(tái)、國(guó)家知識(shí)服務(wù)平臺(tái)的可知AI、外語(yǔ)教學(xué)與研究出版社的中華思想文化術(shù)語(yǔ)庫(kù)AI小語(yǔ)等。
在教育出版領(lǐng)域,數(shù)據(jù)服務(wù)強(qiáng)調(diào)以學(xué)習(xí)者為中心的知識(shí)再造,借助自然語(yǔ)言處理、知識(shí)圖譜、虛擬現(xiàn)實(shí)等技術(shù),在知識(shí)獲取環(huán)節(jié)開(kāi)展教學(xué)資源獲取、教學(xué)內(nèi)容生成、輔助教研選題等場(chǎng)景應(yīng)用。例如,高等教育出版社聯(lián)合浙江大學(xué)、阿里云發(fā)布的“智海-三樂(lè)”教育垂直大模型,為“101計(jì)劃”核心課程提供智能問(wèn)答、試題生成、學(xué)習(xí)導(dǎo)航、教學(xué)評(píng)估等教學(xué)服務(wù)。
在大眾出版領(lǐng)域,數(shù)據(jù)服務(wù)內(nèi)容更加通俗化、更具普適性,利用內(nèi)容生成、多媒體、虛擬現(xiàn)實(shí)等技術(shù),在知識(shí)獲取環(huán)節(jié)應(yīng)用于輔助選題、稿件潤(rùn)色、圖文視頻生成等場(chǎng)景。例如,中信出版的夸父AI平臺(tái)可自動(dòng)生成適配各平臺(tái)的營(yíng)銷文案。
盡管不同機(jī)構(gòu)的數(shù)據(jù)應(yīng)用深度與廣度存在差異,但全行業(yè)已形成“數(shù)據(jù)驅(qū)動(dòng)”的共識(shí):從內(nèi)容生產(chǎn)的智能輔助,到用戶服務(wù)的精準(zhǔn)觸達(dá),再到商業(yè)模式的創(chuàng)新突破,數(shù)據(jù)要素正以多樣形態(tài)融入出版業(yè)轉(zhuǎn)型進(jìn)程。
三、出版業(yè)數(shù)據(jù)要素市場(chǎng)化配置的深層困境
在剖析出版業(yè)數(shù)據(jù)之困時(shí),本研究從戰(zhàn)略認(rèn)知、數(shù)據(jù)采集、技術(shù)開(kāi)發(fā)、應(yīng)用場(chǎng)景、人才體系、合規(guī)風(fēng)險(xiǎn)六個(gè)維度系統(tǒng)分析出版業(yè)數(shù)據(jù)困境的本質(zhì),即數(shù)據(jù)要素價(jià)值釋放與行業(yè)生態(tài)系統(tǒng)不匹配的矛盾,探析人工智能時(shí)代出版業(yè)數(shù)據(jù)要素市場(chǎng)化配置的深層困境。
1.戰(zhàn)略認(rèn)知:數(shù)據(jù)價(jià)值理解有待加強(qiáng)
在數(shù)據(jù)成為核心生產(chǎn)要素的時(shí)代,出版業(yè)雖已意識(shí)到數(shù)據(jù)價(jià)值對(duì)行業(yè)轉(zhuǎn)型與企業(yè)發(fā)展的重要性,但整體認(rèn)知仍存在滯后性和片面性,形成認(rèn)知斷層。主要表現(xiàn)在以下方面。
第一,數(shù)據(jù)核心資產(chǎn)認(rèn)知不足。多數(shù)出版單位仍將數(shù)據(jù)視為業(yè)務(wù)附屬品,對(duì)數(shù)據(jù)資產(chǎn)的“隱形化”認(rèn)知使其對(duì)數(shù)據(jù)可創(chuàng)造的價(jià)值缺乏全面了解。例如,教育類出版社積累了大量教材使用反饋數(shù)據(jù),卻未意識(shí)到可以開(kāi)發(fā)知識(shí)圖譜并銷售給教育平臺(tái),導(dǎo)致大量用戶行為數(shù)據(jù)、內(nèi)容消費(fèi)數(shù)據(jù)未能有效激活。此外,部分出版單位因版權(quán)問(wèn)題未將數(shù)據(jù)用于AI訓(xùn)練標(biāo)注,而出版業(yè)的智能校對(duì)、選題策劃等AI應(yīng)用工具亟須更多的行業(yè)訓(xùn)練數(shù)據(jù)以提高準(zhǔn)確率。在數(shù)據(jù)版權(quán)與合規(guī)應(yīng)用逐漸平衡的當(dāng)下,出版單位應(yīng)積極嘗試在安全框架下合理利用數(shù)據(jù),從社會(huì)效益和經(jīng)濟(jì)效益出發(fā),強(qiáng)化“數(shù)據(jù)即資產(chǎn)”的認(rèn)知。
第二,以數(shù)據(jù)為中心的出版流程再造認(rèn)知滯后。推動(dòng)數(shù)字資源在出版單位的開(kāi)發(fā)利用,需強(qiáng)化數(shù)據(jù)作為貫穿產(chǎn)業(yè)鏈上下游核心要素的認(rèn)識(shí),以“數(shù)據(jù)驅(qū)動(dòng)”取代“經(jīng)驗(yàn)驅(qū)動(dòng)”。編輯是出版工作的核心,資深編輯的經(jīng)驗(yàn)固然重要,但人為市場(chǎng)觀察存在數(shù)據(jù)滯后性,易造成市場(chǎng)偏差。傳統(tǒng)出版將“創(chuàng)作—編輯—印刷—發(fā)行”視為單向流程,缺乏數(shù)據(jù)閉環(huán)思維,未將數(shù)據(jù)作為編輯流程的原點(diǎn),割裂了數(shù)據(jù)對(duì)全流程的優(yōu)化價(jià)值。
第三,存在技術(shù)應(yīng)用認(rèn)知誤區(qū),導(dǎo)致數(shù)據(jù)開(kāi)發(fā)受阻。許多出版單位將數(shù)據(jù)應(yīng)用等同于“上系統(tǒng)、買(mǎi)工具”,導(dǎo)致“數(shù)據(jù)平臺(tái)建了一堆,實(shí)際業(yè)務(wù)沒(méi)變化”,陷入“為數(shù)字化而數(shù)字化”的誤區(qū)。這種工具化思維嚴(yán)重阻礙了對(duì)數(shù)據(jù)價(jià)值的挖掘。
2.?dāng)?shù)據(jù)采集:從“數(shù)據(jù)孤島”到“標(biāo)準(zhǔn)不統(tǒng)一”
整體來(lái)看,出版業(yè)的數(shù)據(jù)應(yīng)用基礎(chǔ)還比較薄弱。前文提到僅25.86%的出版單位建設(shè)了數(shù)據(jù)庫(kù),這表明多數(shù)出版單位尚未實(shí)現(xiàn)數(shù)據(jù)的有效數(shù)字化存儲(chǔ)和管理。出版業(yè)的數(shù)據(jù)來(lái)源主要分為傳統(tǒng)數(shù)據(jù)數(shù)字化、互聯(lián)網(wǎng)采集以及第三方數(shù)據(jù)采購(gòu)三類,無(wú)論哪種渠道,當(dāng)前出版業(yè)的數(shù)據(jù)應(yīng)用仍面臨諸多問(wèn)題,如數(shù)據(jù)孤島現(xiàn)象嚴(yán)重、標(biāo)準(zhǔn)不統(tǒng)一、數(shù)據(jù)質(zhì)量有待提升等。
第一,未將數(shù)據(jù)納入信息化建設(shè)的頂層設(shè)計(jì),導(dǎo)致數(shù)據(jù)孤島現(xiàn)象頻發(fā)。部分出版單位從選題策劃到終端銷售,各環(huán)節(jié)數(shù)據(jù)缺乏有效貫通,未建立統(tǒng)一的數(shù)據(jù)中臺(tái)。例如,編輯部門(mén)掌握作者資源數(shù)據(jù),發(fā)行部門(mén)擁有渠道銷售數(shù)據(jù),但數(shù)據(jù)無(wú)法共享互通,數(shù)據(jù)價(jià)值將難以釋放。
第二,數(shù)據(jù)采集質(zhì)量參差不齊。一方面,出版單位對(duì)數(shù)據(jù)采集的時(shí)效性缺乏明確要求,導(dǎo)致數(shù)據(jù)質(zhì)量差異較大。如部分出版單位仍依賴人工錄入銷售數(shù)據(jù),容易出現(xiàn)延遲和錯(cuò)漏,無(wú)法實(shí)時(shí)反映市場(chǎng)情況。另一方面,數(shù)據(jù)化的前提是數(shù)字化,在傳統(tǒng)出版物數(shù)字化的過(guò)程中,受資金、技術(shù)、人才等因素的影響,數(shù)據(jù)加工、標(biāo)引、清洗質(zhì)量差異較大,這直接影響了后期數(shù)據(jù)的服務(wù)價(jià)值。
第三,數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一。不同出版單位的數(shù)據(jù)加工指標(biāo)不同,從數(shù)據(jù)格式、數(shù)據(jù)定義、數(shù)據(jù)完整到數(shù)據(jù)分類,均自成體系,存在計(jì)量單位混用、術(shù)語(yǔ)歧義等問(wèn)題。例如,在關(guān)鍵詞標(biāo)引中,“人工智能”與“機(jī)器學(xué)習(xí)”是否合并缺乏統(tǒng)一標(biāo)準(zhǔn),這影響了數(shù)據(jù)的可比性和復(fù)用價(jià)值。此外,出版單位內(nèi)部業(yè)務(wù)系統(tǒng)也存在標(biāo)準(zhǔn)沖突,如編輯系統(tǒng)采用中圖法分類,發(fā)行系統(tǒng)使用電商平臺(tái)標(biāo)簽,數(shù)據(jù)整合需要人工轉(zhuǎn)換,不僅效率低下,而且錯(cuò)誤率高。
第四,數(shù)據(jù)采集忽視社會(huì)效益價(jià)值考量。出版產(chǎn)品兼具文化屬性和商品屬性,“文化商品”的雙重屬性要求出版單位在注重內(nèi)容質(zhì)量和文化影響力等隱性價(jià)值的同時(shí),還要采集非量化數(shù)據(jù),如讀者評(píng)論、社交媒體輿情數(shù)據(jù)等。
3.技術(shù)開(kāi)發(fā):能力鴻溝與創(chuàng)新瓶頸
當(dāng)前,出版業(yè)在技術(shù)應(yīng)用方面呈現(xiàn)不均衡的發(fā)展態(tài)勢(shì),頭部出版單位與中小型出版單位在技術(shù)投入上差距懸殊。中國(guó)新聞出版研究院相關(guān)課題組通過(guò)專家調(diào)研發(fā)現(xiàn),出版單位技術(shù)投入占營(yíng)收8%左右為良好發(fā)展區(qū)間。目前,頭部出版單位自建研發(fā)團(tuán)隊(duì)或信息化研發(fā)投入占比已超5%,而多數(shù)中小型出版單位既未將技術(shù)研發(fā)投入納入考核,也缺乏專職技術(shù)開(kāi)發(fā)人員。
由于資金投入不足,中小型出版單位多采購(gòu)?fù)ㄓ没疎RP軟件或標(biāo)準(zhǔn)化技術(shù)工具。一方面,這會(huì)造成采購(gòu)的標(biāo)準(zhǔn)化工具常與業(yè)務(wù)場(chǎng)景脫節(jié),無(wú)法與已有系統(tǒng)對(duì)接,數(shù)據(jù)無(wú)法有效利用。這種“技術(shù)水土不服”反映了出版業(yè)數(shù)字化轉(zhuǎn)型中通用技術(shù)與行業(yè)特性的深層矛盾。另一方面,大多數(shù)出版單位仍依賴傳統(tǒng)信息化系統(tǒng),缺乏機(jī)器學(xué)習(xí)、自然語(yǔ)言處理等先進(jìn)技術(shù),數(shù)據(jù)采集和挖掘能力不足,且不具備銷量預(yù)測(cè)、庫(kù)存優(yōu)化等預(yù)測(cè)模型以及用戶畫(huà)像分析等能力。
數(shù)據(jù)治理體系缺失同樣是制約技術(shù)開(kāi)發(fā)的重要因素。中小型出版單位普遍缺少專職數(shù)據(jù)工程師,數(shù)據(jù)清洗工作依賴編輯手動(dòng)處理,效率和效果均低于社會(huì)平均水平,甚至可能因數(shù)據(jù)清洗不徹底導(dǎo)致模型計(jì)算結(jié)果不準(zhǔn)確。此外,當(dāng)前行業(yè)尚未建立數(shù)據(jù)分類分級(jí)管理等制度。
人工智能技術(shù)自身發(fā)展不足也在一定程度上阻礙了出版業(yè)數(shù)據(jù)要素創(chuàng)新。盡管ChatGPT、DeepSeek等大語(yǔ)言模型已進(jìn)入出版行業(yè),但應(yīng)用場(chǎng)景仍主要集中在“信息提煉”和“文案生成”等基礎(chǔ)環(huán)節(jié),且存在“AI幻覺(jué)”風(fēng)險(xiǎn),實(shí)際應(yīng)用效果不佳。同時(shí),AI應(yīng)用帶來(lái)的數(shù)據(jù)隱私、數(shù)據(jù)安全、版權(quán)歸屬、倫理風(fēng)險(xiǎn)等問(wèn)題仍存在較多爭(zhēng)議,阻礙了出版單位的數(shù)據(jù)價(jià)值創(chuàng)新。
4.應(yīng)用場(chǎng)景:數(shù)據(jù)價(jià)值釋放需要新模式
雖然人工智能技術(shù)的普及為出版單位的數(shù)據(jù)價(jià)值釋放帶來(lái)了諸多可行性,但目前大部分出版單位的數(shù)據(jù)應(yīng)用仍停留在單一環(huán)節(jié)、單一場(chǎng)景,如僅用于選題或營(yíng)銷,尚未形成全鏈條聯(lián)動(dòng)機(jī)制。應(yīng)用場(chǎng)景的碎片化導(dǎo)致數(shù)據(jù)價(jià)值無(wú)法充分釋放。除了應(yīng)用環(huán)節(jié)單一,目前出版業(yè)的數(shù)據(jù)應(yīng)用多集中于編校自動(dòng)化、文案智能化等“降本增效”領(lǐng)域,而在數(shù)據(jù)資產(chǎn)交易、知識(shí)服務(wù)創(chuàng)新等“價(jià)值創(chuàng)造”方面進(jìn)展緩慢,全行業(yè)數(shù)據(jù)增值服務(wù)收入占比不高。
具體來(lái)看,出版業(yè)的數(shù)據(jù)應(yīng)用瓶頸體現(xiàn)在四個(gè)方面。一是內(nèi)容生產(chǎn)環(huán)節(jié),出版單位尚未形成以數(shù)據(jù)為中心的思維。選題策劃階段未對(duì)數(shù)據(jù)的后期應(yīng)用、交易、服務(wù)進(jìn)行系統(tǒng)化設(shè)計(jì),場(chǎng)景規(guī)劃存在不足。二是營(yíng)銷環(huán)節(jié),數(shù)據(jù)整合能力較弱。大多數(shù)出版單位獲取數(shù)據(jù)的渠道單一,無(wú)法形成購(gòu)書(shū)記錄、閱讀行為、社交互動(dòng)等立體數(shù)據(jù)維度,從而限制了后期的營(yíng)銷效果。三是數(shù)據(jù)產(chǎn)品服務(wù)對(duì)象方面過(guò)于固化,僅聚焦于C端讀者。人工智能時(shí)代,閱讀主體不僅限于人類,大模型也需要學(xué)習(xí)知識(shí),因此機(jī)構(gòu)用戶(包括技術(shù)公司和第三方平臺(tái))都應(yīng)成為數(shù)據(jù)服務(wù)的重要對(duì)象。四是數(shù)據(jù)服務(wù)模式較為單一,多采用數(shù)據(jù)庫(kù)整體銷售模式,而未注重?cái)?shù)據(jù)在不同加工程度下的不同市場(chǎng)價(jià)值,如數(shù)據(jù)庫(kù)、知識(shí)庫(kù)、向量庫(kù)等都可以通過(guò)訂閱收費(fèi)、營(yíng)銷分成、打包銷售、定制報(bào)告等模式靈活運(yùn)營(yíng)。此外,由于數(shù)據(jù)分類、數(shù)據(jù)估值、數(shù)據(jù)版權(quán)等問(wèn)題尚未解決,數(shù)據(jù)資產(chǎn)交易難以形成規(guī)模。
5.人才體系:數(shù)據(jù)應(yīng)用復(fù)合型人才短缺
技術(shù)人才短缺一直是困擾出版業(yè)數(shù)字化轉(zhuǎn)型的難題,在數(shù)據(jù)時(shí)代依然如此。出版單位通常缺乏既懂出版業(yè)務(wù)又精通數(shù)據(jù)分析的復(fù)合型人才,這類人才往往面臨“引不進(jìn)、留不住”的困境。這主要有以下方面原因。一是高校出版專業(yè)課程體系中數(shù)據(jù)科學(xué)課程占比仍然較低,數(shù)據(jù)相關(guān)專業(yè)很少開(kāi)設(shè)出版課程。二是出版單位的傳統(tǒng)業(yè)務(wù)不需要編輯主動(dòng)掌握數(shù)據(jù)思維和數(shù)據(jù)分析能力,數(shù)據(jù)工程師對(duì)出版業(yè)務(wù)流程也知之甚少。三是互聯(lián)網(wǎng)公司的同類崗位薪資通常是出版單位的2—3倍,中小型出版單位的薪酬體系難以吸引技術(shù)人才。招聘人才難,留住人才更難。一名合格的數(shù)據(jù)出版人才通常需要3—5年沉淀出版業(yè)務(wù)經(jīng)驗(yàn)(如策劃圖書(shū)項(xiàng)目)和數(shù)據(jù)技能(如主導(dǎo)用戶畫(huà)像系統(tǒng)搭建),但出版單位往往難以為新人提供足夠的成長(zhǎng)期。
在內(nèi)部人員數(shù)據(jù)技能培訓(xùn)方面,出版單位缺乏系統(tǒng)性的人才培養(yǎng)和激勵(lì)機(jī)制,未能為員工提供系統(tǒng)化的培訓(xùn)機(jī)會(huì),員工技能提升也未與考核掛鉤,激勵(lì)政策不配套,導(dǎo)致編輯自學(xué)積極性不高。有專家曾建議建立“出版業(yè)數(shù)據(jù)人才聯(lián)盟”,通過(guò)跨機(jī)構(gòu)協(xié)作解決人才短缺問(wèn)題,但目前尚未形成有效機(jī)制。
6.合規(guī)風(fēng)險(xiǎn):數(shù)據(jù)安全與隱私保護(hù)的雙重挑戰(zhàn)
技術(shù)發(fā)展是一把雙刃劍,出版業(yè)的數(shù)字化轉(zhuǎn)型在帶來(lái)便捷與創(chuàng)新的同時(shí),改變了數(shù)據(jù)處理的規(guī)模和方式,使得數(shù)據(jù)安全與隱私保護(hù)成為行業(yè)面臨的新挑戰(zhàn)。無(wú)論是數(shù)據(jù)采集的范圍,還是存儲(chǔ)、處理、傳輸、共享等數(shù)據(jù)流轉(zhuǎn)的各個(gè)環(huán)節(jié),都存在數(shù)據(jù)安全的潛在風(fēng)險(xiǎn)。《中華人民共和國(guó)數(shù)據(jù)安全法》實(shí)施后,部分出版單位因擔(dān)心用戶隱私泄露放棄采集深度行為數(shù)據(jù),如為規(guī)避風(fēng)險(xiǎn)僅采集用戶年齡、地域等基礎(chǔ)信息,導(dǎo)致個(gè)性化推薦的準(zhǔn)確率不足。這種對(duì)數(shù)據(jù)安全的普遍擔(dān)憂也反映出行業(yè)對(duì)數(shù)據(jù)合規(guī)的認(rèn)知還停留在“規(guī)避風(fēng)險(xiǎn)”層面,缺乏將合規(guī)應(yīng)用轉(zhuǎn)化為競(jìng)爭(zhēng)力的戰(zhàn)略思維和操作方法。
數(shù)據(jù)安全恐慌同樣來(lái)自技術(shù)維度。目前,行業(yè)對(duì)機(jī)器學(xué)習(xí)、數(shù)據(jù)脫敏等合規(guī)技術(shù)的認(rèn)知和應(yīng)用不足。同時(shí),合規(guī)技術(shù)的應(yīng)用需要“技術(shù)+流程”的雙重保障,但目前行業(yè)普遍缺乏配套的技術(shù)解決方案。
四、出版業(yè)數(shù)據(jù)困局的突圍路徑
在深刻剖析出版業(yè)數(shù)據(jù)困境的基礎(chǔ)上,破解數(shù)據(jù)困局需要通過(guò)系統(tǒng)性改革重塑行業(yè)生態(tài):從戰(zhàn)略認(rèn)知革新到技術(shù)架構(gòu)重構(gòu),從人才體系再造到制度標(biāo)準(zhǔn)完善,推動(dòng)數(shù)據(jù)要素從沉睡資源轉(zhuǎn)化為核心競(jìng)爭(zhēng)力。
1.戰(zhàn)略認(rèn)知重構(gòu)
在數(shù)據(jù)價(jià)值戰(zhàn)略認(rèn)知層面,出版業(yè)對(duì)數(shù)據(jù)價(jià)值的認(rèn)知變化,本質(zhì)上是從“內(nèi)容生產(chǎn)者”到“知識(shí)服務(wù)商”的思維轉(zhuǎn)變,這也是人工智能時(shí)代轉(zhuǎn)型的必經(jīng)之路。面對(duì)行業(yè)快速轉(zhuǎn)型的發(fā)展態(tài)勢(shì),出版單位需將數(shù)據(jù)戰(zhàn)略提升至企業(yè)發(fā)展的核心層面并納入頂層設(shè)計(jì)。一是強(qiáng)化數(shù)據(jù)資產(chǎn)的核心認(rèn)知。數(shù)據(jù)不僅是運(yùn)營(yíng)的副產(chǎn)品,更是與版權(quán)、作者資源同等重要的核心生產(chǎn)要素,應(yīng)在戰(zhàn)略規(guī)劃中給予同等權(quán)重的預(yù)算與人才配置。二是設(shè)置首席數(shù)據(jù)官等崗位,成立數(shù)據(jù)戰(zhàn)略委員會(huì),統(tǒng)籌數(shù)據(jù)戰(zhàn)略與規(guī)則,建立業(yè)務(wù)主導(dǎo)、數(shù)據(jù)與IT支撐的協(xié)作模式,形成跨部門(mén)合作機(jī)制。三是通過(guò)建立“數(shù)據(jù)驅(qū)動(dòng)決策”的組織文化,將數(shù)據(jù)分析貫穿于選題策劃、內(nèi)容生產(chǎn)、營(yíng)銷推廣等全流程,實(shí)現(xiàn)從“經(jīng)驗(yàn)導(dǎo)向”到“數(shù)據(jù)智能”的決策模式轉(zhuǎn)變,使數(shù)據(jù)成為重大決策的首要依據(jù)和驗(yàn)證標(biāo)準(zhǔn)。四是明確數(shù)據(jù)資產(chǎn)屬性。參照財(cái)政部2023年印發(fā)的《企業(yè)數(shù)據(jù)資源相關(guān)會(huì)計(jì)處理暫行規(guī)定》,在財(cái)報(bào)中設(shè)立“數(shù)據(jù)資產(chǎn)”科目,量化數(shù)據(jù)對(duì)收入的貢獻(xiàn)率,推動(dòng)數(shù)據(jù)從成本項(xiàng)向利潤(rùn)中心轉(zhuǎn)化。
2.制度標(biāo)準(zhǔn)完善
“行業(yè)發(fā)展,標(biāo)準(zhǔn)先行”,對(duì)出版業(yè)數(shù)據(jù)應(yīng)用而言,數(shù)據(jù)標(biāo)準(zhǔn)同樣重要。數(shù)據(jù)標(biāo)準(zhǔn)化是實(shí)現(xiàn)數(shù)據(jù)共享和互操作的基礎(chǔ),不僅有助于提高數(shù)據(jù)的可用性和準(zhǔn)確性,還能降低數(shù)據(jù)處理的復(fù)雜性和成本。出版單位只有將數(shù)據(jù)標(biāo)準(zhǔn)化,才能真正實(shí)現(xiàn)數(shù)據(jù)的高效流動(dòng)與開(kāi)發(fā)利用。一是對(duì)制度標(biāo)準(zhǔn)進(jìn)行頂層設(shè)計(jì)。出版單位可制訂《出版業(yè)數(shù)據(jù)安全管理辦法》《讀者個(gè)人信息保護(hù)細(xì)則》等,明確數(shù)據(jù)采集、數(shù)據(jù)留存期限等指標(biāo)。二是制定出版業(yè)數(shù)據(jù)標(biāo)準(zhǔn)體系。如分模塊建立覆蓋全生命周期的數(shù)據(jù)標(biāo)準(zhǔn),涵蓋數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)共享、數(shù)據(jù)應(yīng)用等各個(gè)環(huán)節(jié)(見(jiàn)表2)。三是明確數(shù)據(jù)資產(chǎn)權(quán)屬制度,探索數(shù)據(jù)資產(chǎn)交易模式。例如:對(duì)于用戶數(shù)據(jù),用戶享有所有權(quán),出版社獲得授權(quán)使用權(quán);對(duì)于內(nèi)容數(shù)據(jù),創(chuàng)作元數(shù)據(jù)上鏈存證,版權(quán)方與平臺(tái)共享衍生價(jià)值。數(shù)據(jù)確權(quán)后,可建立評(píng)估辦法,制訂數(shù)據(jù)交易規(guī)則(包括定價(jià)機(jī)制、權(quán)屬確認(rèn)、風(fēng)險(xiǎn)防控等),以更好地培育數(shù)據(jù)要素市場(chǎng)生態(tài)。
3.技術(shù)架構(gòu)升級(jí)
技術(shù)發(fā)展總會(huì)引發(fā)社會(huì)生活的變革,人工智能和大數(shù)據(jù)技術(shù)的迅猛發(fā)展和廣泛應(yīng)用催生了數(shù)智化革命。出版業(yè)的技術(shù)架構(gòu)升級(jí)并非簡(jiǎn)單的技術(shù)換代,而是通過(guò)“數(shù)據(jù)流重構(gòu)業(yè)務(wù)流”來(lái)實(shí)現(xiàn)。一是建立“內(nèi)容—用戶—運(yùn)營(yíng)”三位一體的數(shù)據(jù)中臺(tái)模式。這種模式有助于打破數(shù)據(jù)孤島,驅(qū)動(dòng)精準(zhǔn)決策,優(yōu)化內(nèi)容生產(chǎn),創(chuàng)新商業(yè)模式。數(shù)據(jù)中臺(tái)通過(guò)設(shè)定標(biāo)準(zhǔn)整合和治理各環(huán)節(jié)的關(guān)鍵數(shù)據(jù),為智能選題評(píng)估、動(dòng)態(tài)印量控制、個(gè)性化讀者服務(wù)等場(chǎng)景提供底層數(shù)據(jù)支撐。二是對(duì)技術(shù)架構(gòu)進(jìn)行系統(tǒng)化設(shè)計(jì),推動(dòng)底層技術(shù)支撐、數(shù)據(jù)處理分析層和數(shù)據(jù)應(yīng)用層從傳統(tǒng)模式向數(shù)智化轉(zhuǎn)型。例如:數(shù)據(jù)采集方式從人工錄入轉(zhuǎn)向自動(dòng)化抓取和物聯(lián)網(wǎng)設(shè)備的實(shí)時(shí)采集;數(shù)據(jù)治理引入數(shù)據(jù)清洗、脫敏、標(biāo)準(zhǔn)化等工具;數(shù)據(jù)分析采用AI算法替代傳統(tǒng)統(tǒng)計(jì)分析方法。三是與科技企業(yè)深度合作,提升數(shù)據(jù)應(yīng)用效果。出版單位可與人工智能公司、大數(shù)據(jù)技術(shù)廠商等建立長(zhǎng)期合作關(guān)系,聯(lián)合開(kāi)展項(xiàng)目研發(fā)。例如,共同開(kāi)發(fā)針對(duì)出版場(chǎng)景的大語(yǔ)言模型,使科技企業(yè)更好地理解出版專業(yè)術(shù)語(yǔ)和語(yǔ)義,從而提升內(nèi)容生成和編輯輔助的準(zhǔn)確性與專業(yè)性。
4.商業(yè)模式創(chuàng)新
數(shù)據(jù)資源的資產(chǎn)化與資本化運(yùn)營(yíng)是出版單位數(shù)據(jù)要素市場(chǎng)化配置的必然路徑,數(shù)據(jù)資產(chǎn)化為出版單位商業(yè)模式創(chuàng)新提供了更多可行性。一是加強(qiáng)數(shù)據(jù)資產(chǎn)化運(yùn)營(yíng)模式,開(kāi)發(fā)出版數(shù)據(jù)產(chǎn)品,將出版全鏈條數(shù)據(jù)加工為標(biāo)準(zhǔn)化產(chǎn)品對(duì)外輸出,如行業(yè)分析報(bào)告、版權(quán)數(shù)據(jù)圖譜、數(shù)據(jù)資產(chǎn)質(zhì)押融資等。二是提供精準(zhǔn)數(shù)據(jù)服務(wù)模式,面向C端用戶推出付費(fèi)數(shù)據(jù)服務(wù),如閱讀行為分析報(bào)告、知識(shí)圖譜服務(wù)等,根據(jù)用戶閱讀過(guò)的圖書(shū)構(gòu)建“知識(shí)關(guān)聯(lián)圖譜”、展示知識(shí)脈絡(luò),滿足用戶的個(gè)性化需求。同時(shí),創(chuàng)建供應(yīng)鏈數(shù)據(jù)協(xié)同模式,為上下游企業(yè)提供付費(fèi)供應(yīng)鏈優(yōu)化服務(wù),包括動(dòng)態(tài)備貨模型、退貨分析等。三是驅(qū)動(dòng)IP開(kāi)發(fā),通過(guò)數(shù)據(jù)挖掘潛在IP,根據(jù)用戶數(shù)據(jù)反饋調(diào)整內(nèi)容,打通內(nèi)容生產(chǎn)與營(yíng)銷之間的數(shù)據(jù)壁壘,形成“內(nèi)容—數(shù)據(jù)—營(yíng)銷”的聯(lián)動(dòng)模式。IP運(yùn)營(yíng)全生命周期可通過(guò)數(shù)據(jù)實(shí)時(shí)追蹤,構(gòu)建IP全版權(quán)數(shù)據(jù)運(yùn)營(yíng)體系。四是打造跨界數(shù)據(jù)生態(tài)模式,出版業(yè)數(shù)據(jù)不僅服務(wù)于行業(yè)內(nèi)部,還可以作為專業(yè)垂類數(shù)據(jù)賦能各產(chǎn)業(yè)領(lǐng)域,形成消費(fèi)新場(chǎng)景。例如,出版與文旅數(shù)據(jù)聯(lián)動(dòng),結(jié)合地方文化數(shù)據(jù)開(kāi)發(fā)特色產(chǎn)品、文旅圖書(shū)數(shù)據(jù)衍生品以及文化數(shù)據(jù)研學(xué)服務(wù)等。
5.人才體系再造
根據(jù)工業(yè)和信息化部的最新數(shù)據(jù),2025年我國(guó)大數(shù)據(jù)核心人才缺口將突破230萬(wàn)人。對(duì)出版業(yè)而言,數(shù)據(jù)人才同樣短缺。出版業(yè)人才體系再造的核心是培養(yǎng)“數(shù)據(jù)能力與出版專業(yè)”復(fù)合型人才,其目標(biāo)不僅是增設(shè)數(shù)據(jù)分析崗位,還讓每位出版人都成為數(shù)據(jù)的解讀者與創(chuàng)造者。
對(duì)此,出版單位可從三個(gè)方面發(fā)力。一是建立數(shù)據(jù)人才體系,包括跨界人才引入、新人培養(yǎng)、在職轉(zhuǎn)型等,該體系涉及戰(zhàn)略層和執(zhí)行層,形成“內(nèi)部數(shù)據(jù)管理專家+外部數(shù)據(jù)科學(xué)家”的聯(lián)動(dòng)模式。二是建立“業(yè)務(wù)+技術(shù)”培訓(xùn)制度,培養(yǎng)既懂出版業(yè)務(wù)又具備數(shù)據(jù)能力的復(fù)合型人才。例如,內(nèi)蒙古出版集團(tuán)實(shí)施“扁平化”改革,將優(yōu)秀編輯派駐一線參與數(shù)字化項(xiàng)目,通過(guò)實(shí)戰(zhàn)提升編輯的數(shù)據(jù)應(yīng)用能力。三是將數(shù)據(jù)應(yīng)用成效納入績(jī)效考核,獎(jiǎng)勵(lì)通過(guò)數(shù)據(jù)分析降低成本或提升收入的團(tuán)隊(duì),并提供職業(yè)發(fā)展雙通道,為技術(shù)型人才(如算法工程師)設(shè)置晉升路徑,鼓勵(lì)編輯轉(zhuǎn)型,吸引并留住數(shù)據(jù)人才。
此外,高校出版專業(yè)可增設(shè)出版大數(shù)據(jù)分析、智能出版技術(shù)數(shù)據(jù)科學(xué)模塊交叉課程,與出版企業(yè)共建實(shí)訓(xùn)基地。例如,華東師范大學(xué)上海出版研究院開(kāi)設(shè)“AIGC創(chuàng)意工作坊”,培養(yǎng)學(xué)生的人機(jī)協(xié)作與創(chuàng)意生成能力,形成“高校培養(yǎng)—企業(yè)驗(yàn)證—人才輸送”的閉環(huán)。出版業(yè)則應(yīng)積極舉辦“出版數(shù)據(jù)人才論壇”以及相關(guān)技術(shù)峰會(huì)、案例大賽等活動(dòng),促進(jìn)跨企業(yè)經(jīng)驗(yàn)分享。
6.?dāng)?shù)據(jù)合規(guī)應(yīng)用
對(duì)出版業(yè)而言,加強(qiáng)數(shù)據(jù)合規(guī)性應(yīng)用不僅是法律遵從的必然要求,還是構(gòu)建可持續(xù)數(shù)據(jù)競(jìng)爭(zhēng)力的核心戰(zhàn)略。只有當(dāng)數(shù)據(jù)合規(guī)不再是成本負(fù)擔(dān),而是創(chuàng)新的催化劑時(shí),出版單位才能安全調(diào)用全域數(shù)據(jù)資源,重塑出版價(jià)值鏈。
出版單位可從以下方面加強(qiáng)數(shù)據(jù)合規(guī)性應(yīng)用。一是深入學(xué)習(xí)并嚴(yán)格遵守?cái)?shù)據(jù)安全法和個(gè)人信息保護(hù)法等相關(guān)法規(guī),明確數(shù)據(jù)收集、存儲(chǔ)、使用、共享等各環(huán)節(jié)的合法邊界。二是建立健全內(nèi)部數(shù)據(jù)合規(guī)制度,制訂詳細(xì)的涵蓋數(shù)據(jù)全生命周期的數(shù)據(jù)管理規(guī)范,從數(shù)據(jù)采集源頭確保數(shù)據(jù)的準(zhǔn)確性和合法性,在獲取外部數(shù)據(jù)時(shí)嚴(yán)格審查數(shù)據(jù)提供方的合法性與合規(guī)性,確保數(shù)據(jù)來(lái)源清晰且合法。三是定期對(duì)數(shù)據(jù)處理活動(dòng)進(jìn)行內(nèi)部審計(jì),檢查是否存在合規(guī)漏洞,及時(shí)發(fā)現(xiàn)并整改問(wèn)題。四是加強(qiáng)對(duì)員工的數(shù)據(jù)合規(guī)培訓(xùn),提高員工的數(shù)據(jù)合規(guī)意識(shí)和專業(yè)素養(yǎng),使員工在日常工作中自覺(jué)遵守?cái)?shù)據(jù)合規(guī)要求,從人員層面降低數(shù)據(jù)合規(guī)風(fēng)險(xiǎn)。五是加強(qiáng)數(shù)據(jù)安全技術(shù)投入,運(yùn)用先進(jìn)的技術(shù)手段保障數(shù)據(jù)安全,提升數(shù)據(jù)合規(guī)性水平。例如:采用加密技術(shù)對(duì)敏感數(shù)據(jù)進(jìn)行加密存儲(chǔ)與傳輸;利用區(qū)塊鏈技術(shù)增強(qiáng)數(shù)據(jù)的可追溯性與不可篡改性,確保數(shù)據(jù)的真實(shí)性與完整性。
破解出版業(yè)數(shù)據(jù)困局是一場(chǎng)系統(tǒng)性變革,需要從戰(zhàn)略、技術(shù)、人才、制度等維度協(xié)同發(fā)力。當(dāng)數(shù)據(jù)要素真正融入出版業(yè)的生產(chǎn)、流通、消費(fèi)全鏈條,將催生智能出版、精準(zhǔn)服務(wù)、知識(shí)生態(tài)等新業(yè)態(tài)。這不僅是對(duì)數(shù)據(jù)困境的回應(yīng),也是出版業(yè)在數(shù)字時(shí)代實(shí)現(xiàn)跨越式發(fā)展的必由之路。唯有以破繭的勇氣推動(dòng)行業(yè)全面轉(zhuǎn)型,方能重構(gòu)出版業(yè)的核心競(jìng)爭(zhēng)力,在知識(shí)經(jīng)濟(jì)浪潮中占據(jù)戰(zhàn)略制高點(diǎn)。
|參考文獻(xiàn)|
[1]盛銘. 出版業(yè)數(shù)智化轉(zhuǎn)型痛點(diǎn)及破解策略[J]. 中國(guó)出版,2024(18):24-27.
[2]徐麗芳,何倩. 基于人工智能的小說(shuō)自編輯平臺(tái):Authors A. I. 個(gè)案研究[J]. 出版參考,2021(9):24-28.
[3]羅自文,熊庾彤,馬婭萌. 智能媒體的概念、特征、發(fā)展階段與未來(lái)走向:一種媒介分析的視角[J]. 新聞與傳播研究,2021(S1):59 75.
[4]云巖濤. 人工智能時(shí)代出版與閱讀生態(tài)重構(gòu)的邏輯進(jìn)路[J]. 新閱讀,2024(4):57-61.
[5]劉佳. 從資源到資產(chǎn):出版業(yè)數(shù)據(jù)要素價(jià)值化的多維分析[J]. 出版廣角,2024(16):40-46.
[6]郭晶,呂宇夢(mèng). 出版數(shù)據(jù)要素跨界賦能的內(nèi)在邏輯、多維場(chǎng)景與實(shí)踐路徑[J]. 出版廣角,2024(22):47-53.
[7]徐晨岷. 數(shù)智時(shí)代AIGC在出版業(yè)的應(yīng)用與發(fā)展:創(chuàng)新與挑戰(zhàn)[J]. 傳播與版權(quán),2024(9):46-51.
[8]人瑞人才,德勤中國(guó). 產(chǎn)業(yè)數(shù)字人才研究與發(fā)展報(bào)告(2023)[M]. 北京:社會(huì)科學(xué)文獻(xiàn)出版社,2023.
[9]歐陽(yáng)日輝. “數(shù)據(jù)要素×”驅(qū)動(dòng)新質(zhì)生產(chǎn)力加快發(fā)展:理論邏輯、典型案例及政策建議[J]. 電子科技大學(xué)學(xué)報(bào)(社科版),2024(5):16-28.
[10]陳瑩,陳家杰. 文化強(qiáng)國(guó)戰(zhàn)略背景下數(shù)字出版產(chǎn)業(yè)創(chuàng)新發(fā)展研究[J]. 出版廣角,2024(13):52-57.