隨著科學(xué)技術(shù)的快速發(fā)展,出版融合從傳統(tǒng)出版賦能走向全媒體融合階段,數(shù)字技術(shù)與出版行業(yè)的融合步伐逐漸加快[1]。傳統(tǒng)科技類出版社立足于專業(yè)學(xué)術(shù)出版,運(yùn)用現(xiàn)有的內(nèi)容資源和社會(huì)資源,在做實(shí)傳統(tǒng)出版的同時(shí),加快融合出版步伐[2]。落實(shí)到出版社具體的從業(yè)人員——傳統(tǒng)編輯,其出版融合意識(shí)還有待提高。高質(zhì)量發(fā)展是傳統(tǒng)出版和數(shù)字業(yè)務(wù)共同追逐的對(duì)象,知識(shí)服務(wù)不是單純地憑借紙質(zhì)圖書數(shù)字化的方式來實(shí)現(xiàn)對(duì)市場(chǎng)的占有,而是通過諸如優(yōu)質(zhì)內(nèi)容資源集聚、再加工、分類標(biāo)引和知識(shí)挖掘等手段,實(shí)現(xiàn)了資源重組和增值服務(wù)。2020年,更多消費(fèi)場(chǎng)景被開啟,尤其是線上產(chǎn)品的深度開發(fā)。作為書業(yè)從業(yè)者的核心人群——編輯,如何更加貼近產(chǎn)業(yè)行業(yè)縱深,將內(nèi)容與讀者做更為密切的連接,或許成為定義編輯未來職業(yè)走向的重要議題[4]。本文試圖從知識(shí)服務(wù)實(shí)踐的角度出發(fā),以青藏高原科學(xué)考察數(shù)據(jù)庫為例,主要探討內(nèi)容資源建設(shè)、人工標(biāo)引技術(shù)和信息定制服務(wù)等在數(shù)據(jù)庫建設(shè)過程中的實(shí)際應(yīng)用場(chǎng)景,梳理科技出版企業(yè)開展知識(shí)服務(wù)的核心競(jìng)爭(zhēng)力——優(yōu)質(zhì)內(nèi)容資源、專業(yè)化的編輯隊(duì)伍和作譯者團(tuán)隊(duì)在出版融合背景下的結(jié)合點(diǎn),以便為我國專業(yè)學(xué)術(shù)出版機(jī)構(gòu)數(shù)字化轉(zhuǎn)型提供借鑒。
青藏高原是地球的第三極,是“亞洲水塔”,其生境變化影響著我國乃至“一帶一路”沿線國家和地區(qū)超過20億人口的生存和發(fā)展,同時(shí)青藏高原也扮演著我國重要的生態(tài)安全屏障和戰(zhàn)略資源儲(chǔ)備基地的角色。基于其特殊的地理資源環(huán)境,第二次青藏高原綜合科學(xué)考察項(xiàng)目的啟動(dòng),將有助于審視高原環(huán)境變化機(jī)理,優(yōu)化區(qū)域生態(tài)安全格局和體系,對(duì)推動(dòng)青藏高原及周邊地區(qū)的可持續(xù)發(fā)展、推進(jìn)國家生態(tài)文明建設(shè)等方面都具有十分重要的意義[3]。“第二次青藏高原綜合科學(xué)考察”項(xiàng)目的啟動(dòng),引起國內(nèi)外學(xué)界的高度重視,從國家到地方政府,以及相關(guān)科研院所均對(duì)相關(guān)科研成果、數(shù)據(jù)和項(xiàng)目的應(yīng)用有強(qiáng)烈需求。
本項(xiàng)目旨在利用知識(shí)組織、數(shù)據(jù)挖掘和語義出版技術(shù)深度聚焦和揭示“科考”相關(guān)科研發(fā)展態(tài)勢(shì)和產(chǎn)出情況等,實(shí)現(xiàn)科研成果發(fā)布的基本需求,提升科技成果對(duì)青藏高原地區(qū)發(fā)展的引領(lǐng)和支撐作用。在此基礎(chǔ)之上,以本項(xiàng)目構(gòu)建的平臺(tái)為抓手,基于精準(zhǔn)畫像和大數(shù)據(jù)出版服務(wù),大力開展專業(yè)化、定制化科技決策支持服務(wù),將相關(guān)領(lǐng)域科技出版業(yè)務(wù)拓展至科學(xué)知識(shí)服務(wù)和科研解決方案服務(wù)。
依托“青藏高原科學(xué)考察”重大研究項(xiàng)目、科研機(jī)構(gòu)及專家信息,以及可獲取的數(shù)據(jù)信息,依托科學(xué)技術(shù)部、國家自然基金委等項(xiàng)目發(fā)布機(jī)構(gòu)和中國科學(xué)院等國家高端科技智庫,開展“青藏高原科學(xué)考察”相關(guān)科研項(xiàng)目信息發(fā)布、成果跟蹤等服務(wù)。在知識(shí)組織模式上,以大數(shù)據(jù)技術(shù)為基礎(chǔ),建立“青藏高原科學(xué)考察”相關(guān)科研項(xiàng)目、數(shù)據(jù)和信息采集、存儲(chǔ)、挖掘、分析、共享平臺(tái)。采取定向采集和合作收集科研、科考各類數(shù)據(jù)形成大數(shù)據(jù)池,支持采集和查詢結(jié)果的智能匹配與關(guān)聯(lián),實(shí)現(xiàn)統(tǒng)計(jì)學(xué)軟件智能交互分析,為“青藏高原科學(xué)考察”提供重要的信息支撐。
基于“青藏高原科學(xué)考察”科研成果形態(tài)的發(fā)布,在全媒體出版技術(shù)支持下開展內(nèi)容資源的碎片化拆分、體系化重組和智能化應(yīng)用,提升科研成果的傳播性和易用性。在知識(shí)組織模式上,建立基于“青藏高原科學(xué)考察”相關(guān)術(shù)語表、敘詞表等概念和屬性上的映射體系,確定每一類內(nèi)容資源的元數(shù)據(jù)規(guī)范形式和連接操作,對(duì)“青藏高原科學(xué)考察”相關(guān)專業(yè)領(lǐng)域內(nèi)多種類型資源進(jìn)行描述、組織、集成和建設(shè),支持檢索、展示、關(guān)聯(lián)、推送等各種科研場(chǎng)景應(yīng)用。
依托“青藏高原科學(xué)考察”信息支撐平臺(tái)和資源共享平臺(tái),對(duì)接科研成果轉(zhuǎn)化需求,為供需雙方搭建合作交流的平臺(tái),提供資源開發(fā)、建設(shè)方案、技術(shù)創(chuàng)新等方面的咨詢研究。在平臺(tái)上利用語義技術(shù)發(fā)掘科技成果、項(xiàng)目、政策、需求間的顯性和隱性關(guān)聯(lián)關(guān)系,實(shí)現(xiàn)各類文本、圖像和多媒體資源對(duì)象及其知識(shí)內(nèi)容的多維標(biāo)簽和語義描述,深入揭示多個(gè)維度中的語義關(guān)聯(lián),通過關(guān)聯(lián)數(shù)據(jù)構(gòu)建“青藏高原科學(xué)考察”科技信息和知識(shí)網(wǎng)絡(luò),實(shí)現(xiàn)需求和信息資源在語義層面的智能匹配,提升供需對(duì)接效率。
內(nèi)容資源基礎(chǔ)是專業(yè)出版社走向知識(shí)服務(wù)的第一步。傳統(tǒng)出版社數(shù)字化轉(zhuǎn)型都依托自身的優(yōu)勢(shì)資源,通過對(duì)紙質(zhì)出版物進(jìn)行結(jié)構(gòu)化處理、內(nèi)容標(biāo)引、數(shù)據(jù)集成和交互可視化表達(dá)等處理形成知識(shí)庫。通過合理地組織和使用內(nèi)容資源,有針對(duì)性地滿足用戶需求。專題數(shù)據(jù)庫的數(shù)據(jù)獲取方式包括三個(gè)方面,即自建數(shù)據(jù)庫的數(shù)據(jù)采集、深度挖掘已購數(shù)據(jù)庫資源以及通過采集外部的數(shù)字資源[5]。
青藏高原科學(xué)考察數(shù)據(jù)庫產(chǎn)品主要依托社內(nèi)專業(yè)出版積累的大量?jī)?nèi)容資源,以支撐和滿足平臺(tái)的數(shù)字化、碎片化、系統(tǒng)化和規(guī)范化重組。其中,與“青藏高原科學(xué)考察”主題最直接相關(guān)的圖書資源為兩次科考的相關(guān)成果,主要包括“青藏高原科學(xué)考察叢書”(西藏部分),合計(jì)36部41冊(cè)2 300余萬字,以及正在陸續(xù)出版的“第二次青藏高原綜合科學(xué)考察研究叢書”(100冊(cè))。青藏高原作為地球系統(tǒng)多圈同時(shí)存在并相互強(qiáng)烈作用的典型地區(qū),冰凍圈和水循環(huán)過程與影響成為這一地區(qū)最受關(guān)注的科學(xué)問題,建設(shè)主要依托地球系統(tǒng)科學(xué),相關(guān)圖書品種約1 000余種。這些選題資源和圖書出版成果可為數(shù)據(jù)庫的建立提供穩(wěn)定的內(nèi)容資源基礎(chǔ)。
在公共資源方面,可獲取的數(shù)據(jù)資源包括地理空間數(shù)據(jù)和相關(guān)的統(tǒng)計(jì)數(shù)據(jù)資料。目前,“國家青藏高原科學(xué)數(shù)據(jù)中心”“中國高寒區(qū)地表過程與環(huán)境觀測(cè)研究網(wǎng)絡(luò)”等可為數(shù)據(jù)庫提供豐富的數(shù)據(jù)資源。中國科學(xué)院青藏高原研究所、地理科學(xué)與資源研究所(包括網(wǎng)絡(luò)空間地理學(xué)實(shí)驗(yàn)室)、西雙版納熱帶植物園、空天信息研究院、西北生態(tài)環(huán)境資源研究院等單位建成或在建科研數(shù)據(jù)平臺(tái),與其合作對(duì)接能夠形成本產(chǎn)品的潛在數(shù)據(jù)源。同時(shí),中國科學(xué)院A類戰(zhàn)略性先導(dǎo)科技專項(xiàng)“泛第三極環(huán)境變化與綠色絲綢之路建設(shè)”、第二次青藏高原綜合科學(xué)考察研究國家專項(xiàng),“三極環(huán)境與氣候變化”國際大科學(xué)計(jì)劃等,都將助推知識(shí)服務(wù)平臺(tái)的建設(shè)。
在充分考慮資源規(guī)模、潛在受眾和產(chǎn)品導(dǎo)向的基礎(chǔ)上,打造以用戶需求為中心、實(shí)現(xiàn)“精準(zhǔn)畫像”的知識(shí)服務(wù)模式。此外,由于青藏高原地域特殊性和地球系統(tǒng)科學(xué)的屬性,還需要加強(qiáng)圖表庫和視頻庫的建設(shè)工作,單獨(dú)建立視頻庫,與傳統(tǒng)資源實(shí)現(xiàn)互聯(lián)互動(dòng)。
知識(shí)標(biāo)引工作是實(shí)現(xiàn)優(yōu)質(zhì)內(nèi)容資源結(jié)構(gòu)化(數(shù)字化)的最重要工具。信息檢索是開展知識(shí)服務(wù)的第一步,而標(biāo)引是實(shí)現(xiàn)信息檢索的必要前提。通過構(gòu)建適用于數(shù)據(jù)庫或知識(shí)服務(wù)平臺(tái)的標(biāo)引體系,通過主題詞表的構(gòu)建和敘詞表的完善來實(shí)現(xiàn)全面標(biāo)引,以便能夠更精準(zhǔn)化地檢索。知識(shí)體系的構(gòu)建包括多維度主題分類、領(lǐng)域主題詞表及領(lǐng)域本體,而目前多數(shù)出版社傾向于采用領(lǐng)域主題詞表的方式來完成知識(shí)體系的建構(gòu)和知識(shí)服務(wù)的運(yùn)行。選取領(lǐng)域主題詞表的構(gòu)建方式,由于主題詞的數(shù)量較為龐大,將會(huì)迫使開展知識(shí)服務(wù)的出版機(jī)構(gòu)投入更多的人力和財(cái)力[6]。
青藏高原科學(xué)考察的相關(guān)出版成果以區(qū)域案例分析研究為主,因而數(shù)據(jù)庫匯聚了大量結(jié)構(gòu)化的調(diào)查資料和一手統(tǒng)計(jì)數(shù)據(jù),它們可以為科研院所及專家學(xué)者提供豐富的一手資料和區(qū)域典型案例,也為學(xué)術(shù)研究以及現(xiàn)實(shí)成果轉(zhuǎn)化提供充足的可信依據(jù)。青藏高原科學(xué)考察數(shù)據(jù)庫項(xiàng)目以學(xué)科知識(shí)圖譜和專題標(biāo)引體系為基礎(chǔ),對(duì)內(nèi)容資源進(jìn)行細(xì)分,其標(biāo)引需要有較強(qiáng)的學(xué)科背景,同時(shí)作為典型的區(qū)域主題類數(shù)據(jù)庫,其主題詞表的構(gòu)建和流程規(guī)范的建立也具有明顯的示范意義。
1)主題詞表的構(gòu)建。根據(jù)國家科技名詞審定委員會(huì)所發(fā)布的學(xué)科科技名詞,確定各學(xué)科領(lǐng)域的敘詞,整理成為專業(yè)敘詞表(主題詞表)。依據(jù)敘詞表確定各敘詞包含的語詞(詞匯),并參考《中國圖書館分類法》建立參照系統(tǒng),形成知識(shí)庫內(nèi)容標(biāo)引、知識(shí)關(guān)聯(lián)功能實(shí)現(xiàn)的基礎(chǔ)。
2)專業(yè)編輯標(biāo)引。由于先期語料庫和經(jīng)驗(yàn)數(shù)據(jù)的缺乏,難以通過機(jī)器學(xué)習(xí)經(jīng)驗(yàn)標(biāo)引數(shù)據(jù),機(jī)器自動(dòng)標(biāo)引的準(zhǔn)確率會(huì)相對(duì)較低。因而,在數(shù)據(jù)庫建立初期,由地學(xué)及相關(guān)學(xué)科背景的專業(yè)出版編輯和數(shù)字出版編輯根據(jù)主題詞表規(guī)則,對(duì)標(biāo)引知識(shí)庫中的內(nèi)容資源進(jìn)行編輯標(biāo)引,包括內(nèi)容文本的來源、題目和作者、摘要和關(guān)鍵詞等要素,對(duì)已經(jīng)在庫的內(nèi)容文本作好分類[7]。
3)質(zhì)量審核。由于人工標(biāo)引存在主觀認(rèn)知的差異性,因而數(shù)字出版單位應(yīng)該指派具有一定專業(yè)背景的編輯來負(fù)責(zé)對(duì)已標(biāo)引內(nèi)容的質(zhì)量進(jìn)行審核,在此基礎(chǔ)之上,定期對(duì)所標(biāo)引的內(nèi)容開展批量驗(yàn)證和優(yōu)化,從而確保標(biāo)引流程的規(guī)范性及標(biāo)引結(jié)果的準(zhǔn)確性。
4)標(biāo)引規(guī)范和流程建設(shè)。在充分學(xué)習(xí)各類標(biāo)準(zhǔn)規(guī)范的基礎(chǔ)上,以國家科技名詞審定委員會(huì)所發(fā)布的學(xué)科科技名詞和中國圖書館分類法為基準(zhǔn)做映射與關(guān)聯(lián),利用青藏科考數(shù)據(jù)庫的標(biāo)引流程和方法,對(duì)區(qū)域主題類數(shù)據(jù)庫標(biāo)引體系的建立和信息檢索的完善都具有極強(qiáng)的借鑒意義,也能夠在一定程度上對(duì)區(qū)域主題類數(shù)據(jù)庫產(chǎn)品的一貫性和質(zhì)量的穩(wěn)定性做出保障。同時(shí),探索編輯標(biāo)引規(guī)范和編輯標(biāo)引質(zhì)量管理辦法,梳理優(yōu)化編輯標(biāo)引工作流程,可為主題類數(shù)據(jù)庫編輯標(biāo)引工作的規(guī)范化奠定基礎(chǔ)。
優(yōu)質(zhì)內(nèi)容資源集聚和標(biāo)引體系的建立可以滿足知識(shí)服務(wù)的基本需求,而迅猛發(fā)展的信息科技水平和快節(jié)奏的工作生活壓力使得個(gè)人閱讀需求趨向個(gè)性化和碎片化的方式。在這種情形下,精準(zhǔn)化讀者畫像并提供所需的數(shù)字化服務(wù),是融合出版時(shí)代背景下數(shù)字出版機(jī)構(gòu)重要的發(fā)展方向。加速由產(chǎn)品導(dǎo)向轉(zhuǎn)為用戶導(dǎo)向的思想轉(zhuǎn)變,模擬用戶的閱讀場(chǎng)景,把關(guān)注點(diǎn)更多的放在其閱讀體驗(yàn)和閱讀習(xí)慣改變等方面,以最適合的出版方式來呈現(xiàn)優(yōu)質(zhì)的內(nèi)容資源,打造用戶定制需求服務(wù)方案,并且根據(jù)用戶體驗(yàn)和反饋不斷地改進(jìn)已有的服務(wù)模式欠缺的方面和完善現(xiàn)有的知識(shí)服務(wù)體系,進(jìn)而達(dá)到數(shù)據(jù)庫的定制服務(wù)功能與讀者(用戶)的需求匹配的目的,而這種服務(wù)模式在目前比較適合學(xué)術(shù)性和專業(yè)性較強(qiáng)的專業(yè)出版社。
媒體融合發(fā)展背景下,出版社應(yīng)發(fā)揮自身內(nèi)容資源和社會(huì)資源等優(yōu)勢(shì),探索和完善從內(nèi)容提供商到文化服務(wù)商的融合出版之路。而作為出版的中堅(jiān)力量,圖書編輯在融合發(fā)展和知識(shí)服務(wù)轉(zhuǎn)型實(shí)踐的過程中,應(yīng)該堅(jiān)持以市場(chǎng)需求為導(dǎo)向,充分利用自身優(yōu)勢(shì)資源,增強(qiáng)自身信息拓展與整合能力,找準(zhǔn)知識(shí)服務(wù)轉(zhuǎn)型與傳統(tǒng)出版工作的結(jié)合點(diǎn),推進(jìn)出版業(yè)務(wù)同向發(fā)展。通過信息支撐平臺(tái)建設(shè),加大對(duì)內(nèi)容資源的采集和整理,及時(shí)收集領(lǐng)域內(nèi)的項(xiàng)目進(jìn)展、科研機(jī)構(gòu)和專家信息等,讓編輯或者出版社更加貼近產(chǎn)業(yè)行業(yè)縱深,為圖書出版聚集了更多的選題和作者資源;通過資源共享平臺(tái)建設(shè),利用專業(yè)優(yōu)勢(shì)和對(duì)內(nèi)容資源的把控,建立主題標(biāo)引范式和知識(shí)加工的規(guī)范流程,在圖書出版的審讀或者加工階段,就可以有意識(shí)地開展內(nèi)容資源的深度挖掘,這樣既能保障出版產(chǎn)品的質(zhì)量,又能縮短數(shù)字產(chǎn)品的生產(chǎn)周期;通過交互式服務(wù)平臺(tái)建設(shè),利用知識(shí)推薦和定制服務(wù),重構(gòu)編輯(圖書產(chǎn)品)與讀者的關(guān)系,實(shí)現(xiàn)出版社由產(chǎn)品生產(chǎn)商向服務(wù)提供商轉(zhuǎn)變。