毛文濤
讀者在手機、Pad 等移動終端上閱讀電子書的過程中,遇到生僻的字詞、生疏的知識,只要劃動手指選中它們,點擊“查詢”按鈕,詞條的讀音、釋義等內(nèi)容瞬間就被推送到讀者的終端,并以彈窗的形式呈現(xiàn)出來。這種“屏幕選詞、釋義立現(xiàn)”的知識查檢功能因為查檢順滑快捷,而且不打斷閱讀過程,體驗極佳,深受讀者歡迎。彈窗底部的一行小字告訴人們,在這背后提供服務(wù)的,就是聚典數(shù)據(jù)開放平臺(簡稱“聚典”)。
聚典是上海世紀出版集團(簡稱“世紀集團”)規(guī)劃設(shè)計、上海辭書出版社研發(fā)運營的一款創(chuàng)新的互聯(lián)網(wǎng)數(shù)據(jù)服務(wù)產(chǎn)品,開創(chuàng)了傳統(tǒng)工具書數(shù)字化轉(zhuǎn)型的新模式。概括起來說,其基本業(yè)務(wù)邏輯是:①聚合各類優(yōu)質(zhì)工具書內(nèi)容,形成系統(tǒng)可信的云端數(shù)據(jù)倉庫;②開放數(shù)據(jù)接口,授權(quán)應(yīng)用開發(fā)商實時調(diào)用;③讀者發(fā)出查詢請求時動態(tài)載入詞條數(shù)據(jù);④查詢落空時,及時增補優(yōu)化,形成業(yè)務(wù)閉環(huán)。
聚典于2020 年8 月13 日正式發(fā)布上線,已穩(wěn)定運行了三年,初具規(guī)模,還在快速發(fā)展。歸納而言,聚典取得了三方面的成果。
目前,聚典總用戶數(shù)超過4800 萬人,每月活躍用戶數(shù)超過600 萬人,已經(jīng)成為一個比較成熟的互聯(lián)網(wǎng)應(yīng)用平臺。在為用戶提供知識查檢服務(wù)的同時,用戶的查詢行為也都匯聚到聚典平臺。在聚典平臺,可以直接觀察到用戶對各類知識的查詢情況,也可以分析把握讀者閱讀行為的特點和規(guī)律,以及區(qū)域分布情況等。這些寶貴信息的獲得,在過去對出版單位而言是難以想象的。
目前,聚典已經(jīng)聚合了世紀集團內(nèi)外10多家出版社的近200 種權(quán)威工具書,共計430 多萬條詞條,已成為國內(nèi)最大的工具書數(shù)據(jù)開放平臺,為各類工具書提供了一個一致且完整的數(shù)字化解決方案。未來,聚典還會不斷增補優(yōu)質(zhì)工具書,形成學(xué)科覆蓋更加全面、詞條數(shù)據(jù)量更大的工具書數(shù)據(jù)開放平臺。
隨著技術(shù)迭代,聚典還顯示了很強的輻射力。聚典已經(jīng)從最初的數(shù)字閱讀場景,快速擴展到在線搜索、新聞資訊和智能硬件等多種應(yīng)用場景,已經(jīng)在近40 個品牌互聯(lián)網(wǎng)應(yīng)用中落地使用,不少還是頭部互聯(lián)網(wǎng)應(yīng)用。比如,在數(shù)字閱讀領(lǐng)域,有微信讀書、掌閱App、得到電子書、咪咕閱讀、起點中文網(wǎng)和七貓小說等;在新聞資訊領(lǐng)域,有澎湃新聞、學(xué)習(xí)強國和上觀新聞等;在在線搜索領(lǐng)域,有百度百科、百度漢語、搜狗漢語、抖音漢語等;在智能硬件領(lǐng)域,有小度詞典筆、小尋詞典筆、皮皮旸學(xué)習(xí)機等。
之所以能做到這一點,是因為聚典獨特的商業(yè)模式。一直以來,出版社多采用內(nèi)容授權(quán)、內(nèi)容交付的方式,通過互聯(lián)網(wǎng)應(yīng)用開發(fā)商為讀者提供服務(wù)。這種方式的局限性是非常明顯的,很大程度上制約了出版社的數(shù)字化轉(zhuǎn)型發(fā)展。
聚典的商業(yè)模式不是典型意義上的B2B模式,也不是典型意義上的B2C 模式,而是獨特的BBC 模式,即在商業(yè)上是B2B,在數(shù)據(jù)流上是B2C。也就是說數(shù)據(jù)是直接發(fā)生在用戶的終端和聚典的云服務(wù)器之間的,這保證了聚典數(shù)據(jù)的安全。
商業(yè)模式的創(chuàng)新是聚典得以快速發(fā)展的根本。BBC 模式很好地解決了讀者在數(shù)字閱讀過程中的痛點,提高了閱讀效率,改進了閱讀體驗;很好地平衡了各方利益,C 端用戶無需付費,B 端客戶付費得到增值服務(wù),在增加其用戶黏性的同時,無需進行大規(guī)模數(shù)據(jù)加工,極大節(jié)省了成本。聚典在總體上創(chuàng)造增量價值的同時,通過制度的設(shè)計很好地平衡了增量價值的合理分配,讓各方都分享到其中的一部分,調(diào)動了參與各方的積極性。
一言以蔽之,聚典是在辭海網(wǎng)絡(luò)版建設(shè)的過程中衍生出來的一個創(chuàng)新產(chǎn)品。
這一構(gòu)想大約萌發(fā)于2018 年年初。產(chǎn)生這個想法的背景是,當時正在推進辭海網(wǎng)絡(luò)版這一重大項目的建設(shè)。因為世紀集團出版了大量的優(yōu)質(zhì)工具書,因此在建設(shè)辭海網(wǎng)絡(luò)版的過程中不可避免地就要思考如何系統(tǒng)解決傳統(tǒng)工具書出版的“整體轉(zhuǎn)型”問題,為各類工具書的數(shù)字化轉(zhuǎn)型提供一個整體解決方案。
當然,這只是基于出版單位自我發(fā)展需要的考慮。只有這個來自自身的動力是不足以設(shè)計出聚典的。在不斷摸索的過程中,我們也觀察到很多互聯(lián)網(wǎng)公司對《辭?!贰稘h語大詞典》《十萬個為什么》等優(yōu)質(zhì)出版資源的需求很強烈。這種需求不僅頻度高,而且范圍廣,這讓我們認識到工具書的核心價值所在,并形成向多方提供“數(shù)據(jù)服務(wù)”的設(shè)想。
有了“數(shù)據(jù)服務(wù)”這個設(shè)想之后,如何找到合適的應(yīng)用場景和突破口成為另一道難關(guān)。巧的是,當時Kindle 推出了一個詞匯量有限的聯(lián)機詞典查詢功能,可以在Kindle 閱讀器上劃動手指選詞之后查詢聯(lián)機詞典。這個功能喚醒了我們對PC 時代屏幕選詞右鍵查詢的記憶,從而找到了工具書“數(shù)據(jù)服務(wù)”的落地場景。在這個場景中,海量內(nèi)容都可以“隨身攜帶”“隨處使用”,使工具書在移動閱讀環(huán)境繼續(xù)發(fā)揮“工具”作用。
完整的構(gòu)想就此形成:即打造一個依托世紀集團下屬各出版社豐富且權(quán)威的工具書出版資源,通過賦能B 端客戶進而滿足C 端讀者數(shù)字閱讀過程中的知識查檢需要,內(nèi)容集成、場景泛適、多向賦能的開放性知識應(yīng)用平臺—聚典。
從聚典誕生的整個過程不難看出,“強烈的使命追求、巨大的市場需要、恰當?shù)膽?yīng)用場景”催生了聚典。
我們最重要的一個體會是,對傳統(tǒng)出版單位來講,數(shù)字出版一定要深深地扎根在長期積累的優(yōu)質(zhì)出版資源的基礎(chǔ)之上。對聚典而言,《辭?!贰稘h語大詞典》以及世紀集團各出版社長期積累的大量優(yōu)質(zhì)工具書資源,是聚典模式得以成立的物質(zhì)基礎(chǔ)??梢哉f,沒有《辭海》,就沒有聚典。
同時,我們也深刻地體會到,如果沒有對互聯(lián)網(wǎng)發(fā)展規(guī)律的認識和把握,并按照規(guī)律辦事情,聚典也不會橫空出世,并發(fā)展到目前的水平。
隨著互聯(lián)網(wǎng)的普及,傳統(tǒng)行業(yè)在轉(zhuǎn)型發(fā)展過程中曾經(jīng)爭論過一個問題:究竟是“互聯(lián)網(wǎng)+”還是“+互聯(lián)網(wǎng)”?對于出版行業(yè)來說,關(guān)鍵在于搞清楚互聯(lián)網(wǎng)規(guī)律究竟是什么,如何按照互聯(lián)網(wǎng)規(guī)律推動出版的數(shù)字化轉(zhuǎn)型發(fā)展。結(jié)合聚典幾年來的發(fā)展,在這方面,我們的體會主要有四點。
出版的數(shù)字化首先要回歸基本問題,即要首先聚焦于“用戶是誰”“用戶需要什么”“用戶在什么情況下使用”“如何方便用戶使用”這些最基本的問題。觀察出版行業(yè),不少出版單位在開展數(shù)字出版工作的時候,往往還是將圖書內(nèi)容電子化之后,簡單平移或者堆積,沒有很好地考慮用戶的實際應(yīng)用場景和使用痛點,更疏于不斷打磨迭代產(chǎn)品,使得用戶體驗很不理想,只能落得無人問津的境地。相反,如果以場景化應(yīng)用為切入口,以用戶需求為導(dǎo)向,小應(yīng)用也會有大市場。聚典就是從一個很小的應(yīng)用切入,解決了讀者一個小小的痛點,后來拓展到眾多場景并形成大范圍應(yīng)用的。
縱觀20 多年來數(shù)字經(jīng)濟發(fā)展潮流,平臺經(jīng)濟占據(jù)重要位置,呈現(xiàn)蓬勃生機。出版行業(yè)推動數(shù)字化轉(zhuǎn)型,最為重要的就是把握平臺經(jīng)濟規(guī)律,打造真正具有競爭力的數(shù)字出版平臺。通過平臺化實現(xiàn)規(guī)模效應(yīng),主要體現(xiàn)在:提供一站式海量選擇、達到極低的邊際成本、實現(xiàn)流量的非線性變現(xiàn)、實現(xiàn)病毒式品牌傳播。
行業(yè)內(nèi)稱為數(shù)字出版平臺的數(shù)不勝數(shù),真正由傳統(tǒng)出版單位建設(shè)的成熟的平臺,則又屈指可數(shù)。我們認為,一個成功的集成性數(shù)字出版平臺,應(yīng)當具備三種能力:一是一體化融媒體編輯能力,這是實現(xiàn)傳統(tǒng)內(nèi)容生產(chǎn)方式向數(shù)字化內(nèi)容生產(chǎn)方式轉(zhuǎn)變,適應(yīng)網(wǎng)絡(luò)化傳播所必須具備的工具和推動組織轉(zhuǎn)型的助推器;二是門戶級用戶響應(yīng)能力,這是實現(xiàn)大規(guī)模用戶鏈接,形成廣泛應(yīng)用的保證;三是技術(shù)驅(qū)動的知識服務(wù)能力,這是平臺依靠傳統(tǒng)出版長期積累的優(yōu)質(zhì)資源發(fā)展起步之后,能否自我造血、迭代前進的動力機制。三種能力缺一不可,三種能力的有機互動,將逐步推動平臺形成為一個數(shù)字出版生態(tài)閉環(huán)。
對于數(shù)字出版而言,數(shù)據(jù)不僅包括內(nèi)容數(shù)據(jù),還包括用戶數(shù)據(jù)和閱讀行為數(shù)據(jù)等,對這些數(shù)據(jù)的有效采集、高效存儲、科學(xué)分析、合理利用,乃至以數(shù)據(jù)驅(qū)動產(chǎn)品研發(fā)和服務(wù),這是一篇大文章,是數(shù)字出版不能回避的一個重要問題。
用戶思維是從產(chǎn)品端考量的,著眼于怎樣把產(chǎn)品做得好用;平臺思維更多的是從商業(yè)端考量,著眼于如何構(gòu)建一個合理的商業(yè)模式;而聯(lián)系這兩者的是數(shù)據(jù),基礎(chǔ)則是技術(shù)。
“怎樣對待技術(shù)以及怎樣進行有效的技術(shù)管理”,這是一個長期困擾傳統(tǒng)出版人的問題。在傳統(tǒng)出版社數(shù)字化轉(zhuǎn)型的過程中,對待數(shù)字技術(shù)的應(yīng)用有兩種極端的傾向:一是對技術(shù)感到恐懼,甚至不想面對它;二是認為技術(shù)無用,認為技術(shù)問題簡單外包給開發(fā)公司即可。
在發(fā)展聚典的過程中,我們要求持續(xù)培育并形成出版單位自己獨立、完整的技術(shù)隊伍和開發(fā)能力。其可行性在于,在推進數(shù)字化轉(zhuǎn)型的過程中,所需要使用到的都是相對成熟的數(shù)字技術(shù),技術(shù)方面所做的更多的是集成,而不是做原始創(chuàng)新。對于這類技術(shù),出版單位完全可以掌握。其必要性在于,一是技術(shù)要為產(chǎn)品服務(wù)、為商業(yè)邏輯服務(wù),持續(xù)的技術(shù)迭代是保持產(chǎn)品和服務(wù)具備競爭力的基本要求,否則將制約產(chǎn)品和服務(wù)的自主性;二是技術(shù)不僅可以為產(chǎn)品提供更好的體驗、創(chuàng)新產(chǎn)品形態(tài),甚至還使得某些商業(yè)模式得以成立,而這些創(chuàng)新在早期是需要在一定的保密情況下進行的。其實,如果不是因為4G/Wi-Fi 網(wǎng)絡(luò)提供足夠高的數(shù)據(jù)傳輸速率,屏幕查詞延時超過幾秒的話,用戶體驗就極為糟糕,聚典就不成立了。所以,出版數(shù)字化轉(zhuǎn)型一定要建立在技術(shù)能力的提升和技術(shù)隊伍的成長之上。
系統(tǒng)、優(yōu)質(zhì)的工具書出版資源是聚典發(fā)展的基礎(chǔ)。知識內(nèi)容包羅萬象,涉及的學(xué)科門類眾多,僅一兩家出版社的工具書難以滿足用戶的查檢需求。因此,在設(shè)計聚典的時候,不僅需要考慮對下游客戶開放,為所有互聯(lián)網(wǎng)應(yīng)用提供服務(wù),也要對上游內(nèi)容提供方保持開放。聚典不僅整合了世紀集團內(nèi)幾乎所有優(yōu)質(zhì)工具書資源,還進一步吸收了世紀集團外其他出版社的優(yōu)質(zhì)工具書資源,并將繼續(xù)保持開放,目標是圍繞構(gòu)建系統(tǒng)權(quán)威的知識體系,將聚典打造成數(shù)據(jù)量最大、學(xué)科和專業(yè)最齊全的工具書數(shù)據(jù)開放平臺。當然,在聚典整合工具書內(nèi)容資源的過程中,也不是毫無選擇地將所有工具書都收入聚典平臺,而是要嚴格篩選經(jīng)過市場檢驗的優(yōu)質(zhì)工具書,這也正是聚典與網(wǎng)絡(luò)百科最大的區(qū)別。聚典將為用戶嚴把質(zhì)量關(guān),過濾掉不可靠信息,在擴大平臺數(shù)據(jù)規(guī)模和為用戶提供準確內(nèi)容間找到平衡,讓用戶既能“有問必應(yīng)”,又能“有應(yīng)必準”,讓用戶獲得可信賴的知識服務(wù),降低信息過濾成本和錯誤信息帶來的潛在風(fēng)險。
隨著應(yīng)用的拓展,聚典已經(jīng)開始聚合古詩文等非典型的工具書內(nèi)容。可以預(yù)見的是,伴隨著聚典的成長,它將逐步整合其他類型的優(yōu)質(zhì)出版資源、優(yōu)秀的經(jīng)典著作,從“聚合詞典”延拓為“聚合詞典”與“聚合經(jīng)典”并重,成為真正聚合中華優(yōu)秀文化、構(gòu)建完整知識體系的大平臺。
圍繞“查檢更有效、體驗更友好、服務(wù)更智能”的目標,歷時近10 個月,聚典完成了2.0 版的迭代工作,并于2023 年8 月15 日發(fā)布。
這次迭代主要在幾個方面做了改進。一是改進內(nèi)容質(zhì)量,豐富了數(shù)據(jù)類型。聚典對數(shù)據(jù)倉庫內(nèi)詞條進行了去重、糾錯和規(guī)范化處理,還對查詢落空的情況進行分析篩選,及時補充新詞新語,還增補了古詩文等類型的大量內(nèi)容。二是改善用戶體驗,通過改進參見系統(tǒng)、擴充同位詞和舉例詞等做法,改變了紙質(zhì)辭書受限于版面而不得不采用的一些傳統(tǒng)做法,改善了用戶體驗。三是提高了容錯能力,對用戶的查詢內(nèi)容進行智能化容錯,基本實現(xiàn)了對原文錯誤、切詞錯誤或者切詞遺漏等問題的智能容錯并提供分詞服務(wù)。
自2020 年聚典發(fā)布,三年來平臺迭代工作一直在不斷地推進。內(nèi)容上,通過查詢落空反饋機制及時捕捉用戶需求,不斷充實和改進;技術(shù)上,不斷適應(yīng)互聯(lián)網(wǎng)應(yīng)用的極限挑戰(zhàn),持續(xù)提高響應(yīng)能力和技術(shù)水平;服務(wù)上,不斷豐富應(yīng)用場景,改進用戶使用體驗,提高服務(wù)效能。聚典就是這樣堅守“一絲不茍、字斟句酌、作風(fēng)嚴謹”的辭海精神,堅守“數(shù)據(jù)服務(wù)”的產(chǎn)品定位,不斷完善和迭代進步,努力去服務(wù)各類應(yīng)用和最廣大的互聯(lián)網(wǎng)用戶。
1936 年《辭?!罚ǖ谝话妫┑摹熬庉嫶缶V”強調(diào):“為辭書者,自當體察用者之需要,恰如其所需以予之。”聚典發(fā)端于《辭?!?,也沿襲了《辭海》孜孜以求的事業(yè)。
聚典是一個賦能平臺,它的使命是“為閱讀賦能、為學(xué)習(xí)賦能、為搜索賦能”。長遠來說,我們希望聚典能夠像電力、自來水那樣,無論何時、何地、何種應(yīng)用場景,都可以在讀者需要的時候以最為快捷、方便的方式,甚至無感地為讀者提供完美的知識查檢服務(wù),努力“成為數(shù)字時代的文化基礎(chǔ)設(shè)施”。
以“數(shù)據(jù)服務(wù)”為產(chǎn)品定位,以“為閱讀賦能、為學(xué)習(xí)賦能、為搜索賦能”為使命追求,立志“成為數(shù)字時代的文化基礎(chǔ)設(shè)施”的聚典數(shù)據(jù)開放平臺,2023 年8 月在正式上線三周年之際發(fā)布了“查檢更有效、體驗更友好、服務(wù)更智能”的2.0 版。謹以此文,記錄聚典的誕生,回顧聚典的成長,總結(jié)聚典的特點,期許聚典的未來。