徐麗芳+池呈
亞馬遜和蘋果分別對Goodreads和BookLamp的收購是兩者在閱讀市場上角力的具現化最新縮影。哪個選擇更正確?現在還很難說。
熱詞:圖書”基因”分析 BookLamp 閱讀市場博弈
幾乎每一家購書網站和閱讀社交網站都會向讀者推薦圖書,但它們往往是基于讀者既往的購買史和閱讀史做出推薦。那么,有沒有一項服務能基于圖書本身的內容和語言進行推薦,而不被圖書的流行程度、“水軍”的造勢或者出版商的營銷手段等外部因素所左右呢?美國愛達荷州的一家大數據圖書分析服務提供商書燈公司(BookLamp)就可以提供此類圖書推薦服務。BookLamp的前身是成立于2003年6月的新奇計劃公司(Novel Projects, Inc.),這家公司希望通過語義的不斷計算與挖掘,開發(fā)出各類新穎的軟件和服務。2007年2月,他們將語義技術結合出版產業(yè),創(chuàng)立了BookLamp公司。這個團隊最有代表性的項目是2010年8月上線的“圖書基因組計劃”(Book Genome Project),該服務利用自然語言分析技術為用戶推薦圖書,并為出版行業(yè)提供幫助。
一、核心技術:圖書“基因”分析技術
一直以來,購書網站上的圖書推薦引擎提供服務的方式不外乎以下幾種:“購買了某本書的人還購買了這些書……”“這些書是編輯精選……”“這些書正在熱銷……”“這些書廣受好評……”。然而,就算購買了同一本書,不同讀者的閱讀興趣和閱讀習慣仍然可能存在巨大差異;作者熱門或圖書賣得好也不甚靠譜;而流行趨勢、編輯精選等基本就是營銷造勢的結果。以上推薦方法都不能準確地幫讀者找到自己喜歡的書,因為它們都是基于一本書外在的特征、條件和狀況,而不是根據圖書的題材、內容、語言風格以及作者能力和水平等更內在的特點來做出推薦——因此是不全面的,很多時候也是不準確的。
BookLamp的圖書“基因”分析技術則另辟蹊徑,不關注作者也不關注讀者,僅根據書籍自身的“基因”來作出閱讀推薦。具體來說,BookLamp將一本書的“基因”總結為語言風格和故事情節(jié)兩方面,其中,語言風格DNA由語言密度、語言節(jié)奏、對話、描述和運動組成;故事情節(jié)DNA則由關鍵主題詞組和寫作手法組成。對于后一點,BookLamp的創(chuàng)始人亞倫·史坦頓(Aaron Stanton)曾在接受媒體采訪時打過一個恰如其分的比喻,“就像你吃了一塊很好吃的巧克力蛋糕,如果你想找到其他口味類似的蛋糕,你所需要知道的不僅僅只有其成分,還需要知道各個成分的比例?!睆倪@個角度來看,一本書的關鍵主題就是其成分,而寫作手法就是其成分比例。在對一本書進行分析時,BookLamp會對書的內容進行掃描,將全文分解為一百個場景,然后依據自然語言算法分析每個場景的“DNA”——語言、情節(jié)、寫作思路、主題及形式等(BookLamp總結了2000多個特性),同時計算不同主題所占成分(BookLamp總結了132個主題),多方位評估書的內容,并基于評估結果繪制圖書的“基因圖譜”。比如說,史蒂芬·金的《午夜行兇》(Salem's Lot)在圖書基因組計劃中被解析出四個主要特征:吸血鬼/超自然;葬禮/死亡/追悼;家庭/家庭環(huán)境;痛苦恐懼/消極情緒。BookLamp將這四個特征隨故事線進展所占比例的變化用圖表描繪出來,遂形成《午夜行兇》的基因圖譜,如圖1所示。
圖1 《午夜行兇》基因圖譜
二、用戶價值及商業(yè)模式
“基因圖譜”分析有助于讀者找到心儀的圖書。用戶在使用BookLamp支持的服務時,先選取自己喜歡的一本或幾本書,BookLamp會將該書的“基因圖譜”與數據庫中的進行適配,為用戶推薦同類型的、用戶也可能喜歡的圖書。用戶會驚喜地發(fā)現,BookLamp為自己推薦的圖書與自己喜歡的書具有相似的語氣、觀點、描述,甚至有類似的戲劇沖突。舉例而言,如果讀者喜歡《達·芬奇密碼》,想要找一本類似的小說,BookLamp會先拉取系統此前對該小說的分析數據。分析數據顯示,《達·芬奇密碼》有18.6%的內容涉及宗教和宗教機構,9.4%的內容涉及警方和謀殺案的調查,8.2%的內容涉及藝術和藝術畫廊,6.7%的內容涉及秘密結社,以及歷史文化、旅行、尋求真相等其他元素。然后該系統會用這些故事情節(jié)DNA數據以及該書的語言風格DNA數據去比對數據庫中的其他書籍,最后返回《失落的秘符》《最后的圣殿騎士》《巴拉巴德的七把鑰匙》等小說,這些書的內容都包含與《達·芬奇密碼》相似的元素與元素比例、語言風格,如圖2所示。
圖2 《達·芬奇密碼》的基因圖譜及與之相似的圖書
上文分析了BookLamp能為讀者創(chuàng)造的價值,那么,BookLamp采用怎樣的商業(yè)模式呢?一方面,和Pandora或者豆瓣類似,BookLamp所推薦的圖書都帶有一些電商鏈接,比如eBay、亞馬遜等,當用戶購買行為產生時,BookLamp可以獲得一定的提成。另一方面也是更重要的一個收入模式,BookLamp為出版商及分銷商提供圖書數據分析服務。BookLamp利用自己收集并分析的各類書籍信息,幫助各類出版商和分銷商來更改他們的目標定位和宣傳,以更好地影響那些本來就愛看這類書的人。此外,BookLamp的數據分析服務還給出版商提供了一個平臺,出版商可以通過這個平臺來篩選手稿,分析一本書籍在特定讀者群中的受歡迎程度,或者其市場預算應該為多少。BookLamp的主要客戶包括亞馬遜、蘋果,還有像蘭登書屋這樣的圖書出版商。蘭登書屋和肯辛頓圖書公司(Kensington Books)已經讓BookLamp分析了他們的兩萬本書。
三、BookLamp VS Goodreads:巨頭間的競爭
BookLamp先進的圖書分析技術吸引了相關競爭領域巨頭公司的關注。亞馬遜曾與BookLamp展開過收購談判,但它最終于2013年3月收購了BookLamp的競爭對手——Goodreads。Goodreads是一個閱讀社交網站,可供用戶搜索、分享書籍,或發(fā)表書評、更新讀書進程等,就像豆瓣讀書一樣。作為世界上最大的在線讀書俱樂部,Goodreads上有一千多萬用戶標注自己想讀和正在讀的書,但是它提供的圖書推薦服務是基于社交網絡的,無法提供像BookLamp一樣基于書籍自身內容的圖書推薦功能。BookLamp與之相比,更像是潘多拉音樂盒(Pandora)——Pandora按照“Music Genome Project(音樂基因組項目)”算法給喜歡音樂的人推薦曲目,BookLamp同樣也是通過掃描內容以獲得可量化的相似點來完成推薦。
2014年7月,蘋果公司被曝以1000萬美元至1500萬美元的價格收購了BookLamp及其“Book Genome Project(圖書基因組計劃)”技術。之后,BookLamp在一份聲明中稱將不再向用戶推出原有服務,也證明這份收購確已成立。蘋果對BookLamp公司的收購戰(zhàn)略意圖明顯——這筆收購使蘋果公司成功地在閱讀市場布下一顆棋子,為其在閱讀推薦領域和亞馬遜的競爭贏得了足可抗衡的籌碼。一方面,收購中斷了BookLamp為亞馬遜提供的服務,使其此后只為蘋果提供服務,同時也讓蘋果獲得了其客戶;而更重要的是,該公司的技術和人才可以幫助蘋果在閱讀領域中打造更有競爭力的產品,更好地對抗亞馬遜。
亞馬遜和蘋果分別對Goodreads和BookLamp的收購是兩者在閱讀市場上角力的具現化最新縮影。隨著電子書經銷商提供的書籍越來越多,任何公司想在電子書領域有所作為,顯然不能維持現狀——單純銷售圖書。它們需要想辦法來為這些書籍增值——對于用戶而言,買書在哪兒不是買,它們必須為用戶提供額外的價值,比如符合用戶個人特點的個性化推薦。如果蘋果或亞馬遜給出的推薦能夠得到用戶認可,那么用戶就可能更加信賴它,并進一步購買或者租賃書籍。對此,亞馬遜和蘋果作出了不同的選擇。亞馬遜收購Goodreads,是選擇了基于社交網絡與口碑傳播的閱讀推薦,讓用戶的熟人或志趣相投的網絡圈子關于某本書的新鮮事引導用戶發(fā)現圖書。而蘋果對BookLamp的收購則是選擇了基于書籍自身內容的閱讀推薦。蘋果的iBook Store電子書平臺提供“編輯精選”一類的服務,但是沒有突出用戶個性化的特點,在亞馬遜收購Goodreads搶先奪取了用戶數據的情況下,要憑借什么與Kindle Store競爭呢?顯然BookLamp的內容和風格分析法可以派上用場。
哪個選擇更正確,現在還很難說。但我們能知道的是,BookLamp將幫助強化蘋果公司的電子書服務,成為其和亞馬遜在閱讀市場博弈的武器。
[作者單位系武漢大學數字出版研究所,本文為自科基金項目“科技信息用戶價值模型構建與實證研究(71373196)的研究成果]