●楊 威,張 昀
(1.武漢軟件工程職業(yè)學(xué)院 計(jì)算機(jī)與軟件學(xué)院,武漢 430205;2.武漢地方志編纂委員會辦公室 年鑒編審處,武漢 430014)
網(wǎng)絡(luò)時代傳統(tǒng)出版業(yè)的生存空間受到網(wǎng)絡(luò)銷售渠道擠壓。電子書閱讀逐漸成為人們?nèi)粘5拈喿x習(xí)慣,各種電子出版物占據(jù)了傳統(tǒng)紙質(zhì)媒體的一些市場份額。但是從統(tǒng)計(jì)數(shù)據(jù)來看卻并非完全是這樣。根據(jù)《大公報(bào)》2012年7月13日公布的數(shù)據(jù),2011年期刊和報(bào)紙的發(fā)行品種有下降:期刊和報(bào)紙分別為9849種和1928種,比2010年分別減少35種和11種,下降比例分別0.4%和0.6%。與此同時,圖書、期刊和報(bào)紙的印數(shù)卻在大幅增長:圖書、期刊和報(bào)紙分別為77.1億冊、32.9億冊和467.4億份,比2010年分別增加5.7億冊、0.7億冊和15.3億份,增長比例分別為7.5%、2.2%和3.4%。[1]從這個數(shù)據(jù)比較來看,實(shí)際上傳統(tǒng)出版物的銷售在增加而不是在減少。之所以整個市場份額下降,是因?yàn)閿?shù)字出版物的增長過于迅猛造成的。
網(wǎng)絡(luò)雖然帶來了電子出版物這一強(qiáng)有力的競爭對手,但是也打開了在線銷售這一強(qiáng)力渠道。于是,如何在網(wǎng)絡(luò)時代利用在線渠道來擴(kuò)展銷售空間成了各出版社研究的問題?;谶@個原因,本文作者在同香港德坤泰印書館有限公司合作開發(fā)的德坤泰線上用戶情報(bào)收集系統(tǒng)(Tactical Online User Intelligent Collecting System,TOUICS)的過程中,以情報(bào)工作的方法結(jié)合網(wǎng)絡(luò)技術(shù)對用戶的行為進(jìn)行預(yù)測,并建立了一套情報(bào)系統(tǒng),以期能更有針對性地出版讀者需要的書,實(shí)現(xiàn)更好的銷售。
建立一套合適的用戶情報(bào)在線收集系統(tǒng)是可即時獲取用戶的想法,然后加以統(tǒng)計(jì),得出一個動態(tài)的市場取向,以指導(dǎo)出版社的策略規(guī)劃。作者所帶領(lǐng)的團(tuán)隊(duì)對德坤泰印書館的會員用戶進(jìn)行各種統(tǒng)計(jì),得到了很多實(shí)用的結(jié)果。
對于用戶情報(bào)的收集,本文從以下六個方面研究用戶情報(bào)對購書行為的影響,根據(jù)其影響程度排序。
(1)專業(yè)及受教育程度。目前情報(bào)學(xué)界公認(rèn)的所學(xué)專業(yè)和受教育程度是對個體潛在行為影響最大的因素。這個潛在行為包括消費(fèi)行為。由于書籍上承載了各種知識和信息,因此這兩點(diǎn)在書籍購買者(即用戶)的身上表現(xiàn)的特別明顯。具體來說,某個專業(yè)所涉及的知識點(diǎn),基本上就是某個用戶可能購買的書籍范圍,單獨(dú)個體會在這個集合的基礎(chǔ)上有所突破,但是總體不會離開這個集合。而受教育程度的影響體現(xiàn)在兩方面:程度越高,越偏重理論知識和細(xì)化知識。
(2)性別和年齡。性別和年齡的影響主要體現(xiàn)在非專業(yè)書籍上。從性別看,樣本中女性用戶11439人,占53.75%,男性用戶9841人,占46.25%。女性用戶比男性多這一事實(shí)從對德坤泰印書館的市場部門職員的訪談中也得到了證實(shí)。此外,男性相對更喜歡購買運(yùn)動、汽車、旅游、軍事等類別的書籍,而女性則傾向于各種旅行筆記、時尚指南一類的書籍。
年齡的影響也體現(xiàn)在書籍題材范圍中,用戶的分布非常有特點(diǎn)。首先,德坤泰印書館的一個非常大的長期用戶群體是中學(xué)生,此類學(xué)生會大量購買各種教輔。大學(xué)在讀的學(xué)生則較多購買和自己本專業(yè)相關(guān)的書籍。工作之后的人的購買傾向則比較雜,在年齡分量上沒有明顯的統(tǒng)計(jì)特征。但24~35歲的女性較多會傾向購買3~4本孕育和育兒類的書,這與官方公布的生育年齡區(qū)間大致吻合。此外,有小孩的女性用戶會隨孩子的年齡增長購買一些適齡讀物。另外50歲以上的用戶比較喜歡購買古典書籍,而60歲以上的用戶喜歡購買中醫(yī)、養(yǎng)生一類的書籍。
(3)愛好。愛好是左右購買行為的很大一個參考因素,可以導(dǎo)致直接的購買行為。各種DIY、攝影、烘培、音響等書籍都有一定的消費(fèi)群體。愛好的另一個作用是可以帶動相關(guān)書籍的銷售,例如,膽機(jī)愛好者除購買專業(yè)膽機(jī)書籍外,一般會附帶購買各種模擬電路、金工等專業(yè)教程。
(4)職業(yè)和收入層次。職業(yè)決定收入層次,而收入本身也有一定的附加效應(yīng)。職業(yè)分量會導(dǎo)致購買和從事工作、行業(yè)相關(guān)的書籍,但并不是所有職業(yè)都有這個作用。一般律師、會計(jì)師、大學(xué)教師等人員這種情況最明顯,其他工種則相對影響較少。收入會影響購買檔次和范圍。例如月薪10000港元以下的普通職員一般會選擇2000港元以內(nèi)的書,如平裝中文版《福爾摩斯探案集》,而大學(xué)教授或律師則大多選擇英文原版且附帶各種參考資料的售價(jià)1055英鎊的《Sherlock Holmes》 套裝。
(5)居住地。不同的居住地有不同的生活習(xí)慣,也就導(dǎo)致了書籍購買分布的地區(qū)差異。例如,香港本地用戶不論年齡職業(yè),都很愿意在各種賽馬書籍上花錢。而英國用戶則對園藝書籍最有興趣。
(6)其他狀態(tài)。這里指用戶從即時到未來6個月內(nèi)所處的不同平常的狀態(tài)。例如,有用戶計(jì)劃近期旅行,多半就會購買和目的地相關(guān)的書。
上述六種用戶情報(bào)對購書行為產(chǎn)生了明顯影響。下面則是通過互聯(lián)網(wǎng)收集這些情報(bào)的幾種方法。需要指出,上面對六種用戶情報(bào)的統(tǒng)計(jì)樣本都來自于德坤泰印書館的用戶,而在線收集情報(bào)的對象則是面對所有互聯(lián)網(wǎng)用戶。
(1)電子調(diào)查問卷。根據(jù)上述六大類內(nèi)容設(shè)計(jì)好一個電子調(diào)查問卷,然后往地址簿上所有的用戶的電子郵箱中發(fā)送一份。這種方法類似郵件廣告。調(diào)查問卷最大的好處就是直接,且數(shù)據(jù)容易格式化。對問卷結(jié)果只要稍加處理即可使用。不過其缺點(diǎn)也很明顯,由于填寫問卷會占用用戶時間且涉及個人隱私(姓名、工作等),加上會被誤認(rèn)為垃圾郵件,因此,需要用到一定的獎勵措施才能提高回復(fù)率。[2]例如,只要填寫問卷并注冊為德坤泰印書館的會員,就可以獲取10英鎊或等值代金券。這樣一來就提高了成本。不過總體而言這種方法是首先應(yīng)該考慮的。
(2)職員表。學(xué)校、大型企業(yè)、政府部門等都有自己的網(wǎng)站,且上面一般都有人事安排信息,很多都非常詳細(xì)。因此只需要編寫相應(yīng)的程序就可以批量獲取這些情報(bào)。然后結(jié)合已知信息,如某個行業(yè)的對應(yīng)職位收入、專業(yè)背景等,就可以得出和調(diào)查問卷差不多的格式化的數(shù)據(jù)。這種做法好處是情報(bào)獲取及時、準(zhǔn)確。一般學(xué)校和政府部門以及大型企業(yè)都會及時更新其職員變動情況。缺點(diǎn)是不能做到細(xì)致化,如愛好、其他狀態(tài)等情報(bào)就比較難于收集。其次是情報(bào)來源較窄,對于中小企業(yè)或是沒有將這些信息上網(wǎng)的單位就無能為力。
(3)學(xué)生名冊。在校學(xué)生的基本情況一般都是上網(wǎng)的,也可以通過專用程序來批量獲取。不過并不是所有學(xué)校都對外開放了瀏覽學(xué)生信息的權(quán)限,在不采取非法手段的情況下是無法獲得這些情報(bào)的。不過就目前情況來看已經(jīng)能獲得相當(dāng)多的樣本了。
(4)俱樂部、協(xié)會、民間團(tuán)體成員名冊。很多正規(guī)組織有自己的官方網(wǎng)站,其中有相當(dāng)多的網(wǎng)站上面公布了其成員名冊,至少是部分公布。從這些網(wǎng)站上收集來的情報(bào)的最大好處是興趣范圍和收入較一致。例如,一個高爾夫俱樂部的成員,其興趣基本都會集中在高爾夫、汽車、手表、旅行、戶外等方面。
(5)社交網(wǎng)絡(luò)和微博用戶信息。社交網(wǎng)站上有很多用戶是用真實(shí)姓名填寫的,且注冊時就已經(jīng)填寫了教育程度、收入、興趣愛好等相關(guān)信息。而很多用戶為了實(shí)現(xiàn)多交友,都選擇了用戶信息完全公開。這樣只要一個專用程序就可以大量獲取相關(guān)情報(bào)并格式化。香港、英國和北美地區(qū)用戶最多的交友網(wǎng)站是Facebook,其用戶人數(shù)已經(jīng)超過10億,這無疑是一個情報(bào)金礦。Twitter的用戶也有5億,不過其用戶信息則相對開放較少,比較難于獲取。這兩個情報(bào)來源的一個共同特點(diǎn)是用戶年齡層次相對較輕,以學(xué)生和年輕職員為多數(shù)。
(6)各大論壇的用戶信息。各大論壇,尤其是專業(yè)論壇,注冊用戶數(shù)量非常多,且對外開放比例較高,是一個值得搜尋的區(qū)域。論壇還有一個好處就是已經(jīng)劃分了用戶愛好、教育層次、從業(yè)范圍等屬性。此外,雖然論壇用戶大多不具真名,但至少都會留下諸如MSN、電郵地址等在線聯(lián)系方式。因此,這種情報(bào)非常適合進(jìn)行網(wǎng)絡(luò)推廣,屬于優(yōu)質(zhì)情報(bào)源。
通過上述渠道獲得了大量的原始用戶情報(bào)之后,對這些數(shù)據(jù)進(jìn)行處理,以獲得兩類情報(bào):宏觀用戶傾向和個體用戶傾向。宏觀用戶傾向即市場導(dǎo)向,也就是當(dāng)前市場上最流行、銷售最好的圖書類型;個體用戶傾向是對單個用戶的分析。前者決定出版社下一步的出版計(jì)劃以及市場策略,而后者決定對某一個個體采取何種營銷手段。以下是對收集來的原始情報(bào)分析以及預(yù)測用戶行為的步驟。
按照第二部分所提到的收集內(nèi)容的分類,以及用戶姓名、聯(lián)系方式等,建立一個數(shù)據(jù)庫。然后將獲得的原始數(shù)據(jù)填寫進(jìn)這個數(shù)據(jù)庫。整個填充過程由TOUICS自動完成,無需人工干預(yù)。TOUICS的各個情報(bào)收集模塊會定期更新這個數(shù)據(jù)庫,將最新的數(shù)據(jù)填充進(jìn)來。這是進(jìn)行情報(bào)分析的基礎(chǔ)步驟。
數(shù)據(jù)庫中的數(shù)據(jù)并不是立即能夠使用的。很多收集來的情報(bào)明顯不能真實(shí)表達(dá)用戶的情況,這就是噪音,要去除掉。例如從某個論壇上獲取的用戶資料,用戶的所在地、年齡有可能是用戶隨意填寫的,因此,需要斟酌使用。又如某個用戶的資料在進(jìn)行格式化之后,發(fā)現(xiàn)沒有主鍵值,是無法使用的。去除噪音需要機(jī)器和人工兩方面來完成。首先由TOUICS按照事先規(guī)定的策略去除掉大部分的噪音,如缺少主鍵值的元組等。然后由工作人員進(jìn)行人工精細(xì)化篩選,去除剩余的噪音。經(jīng)過這個步驟之后,噪音仍然會存在,但是其比例可以忽略不計(jì)。
對于經(jīng)過整理的數(shù)據(jù),就可以進(jìn)行宏觀統(tǒng)計(jì)工作了。統(tǒng)計(jì)的內(nèi)容就是第二部分所述的六大類內(nèi)容,如男女比例、各年齡段、職業(yè)分布等。這些由TOUICS自動完成。然后結(jié)合當(dāng)前的市場趨勢,加上已知的各種參數(shù)對用戶群購買行為的影響進(jìn)行加權(quán)計(jì)算,權(quán)值由第二部分的統(tǒng)計(jì)工作所得,也是TOUICS最核心的數(shù)據(jù)。TOUICS還有一個很特殊的功能,就是和德坤泰的訂單系統(tǒng)連接,及時將已實(shí)施購買行為的用戶的信息采集進(jìn)系統(tǒng),然后隨時更新參數(shù)權(quán)值,作為以后的參考。計(jì)算的結(jié)果會列出當(dāng)前市場上所需圖書的類型列表及其所占比例。這就是出版社下一步進(jìn)行出版規(guī)劃時的重要依據(jù)。
對于辛苦得來的情報(bào)如果僅僅只做一個市場方向的分析就太浪費(fèi)了,好的情報(bào)人員還要想方設(shè)法挖掘情報(bào)背后的價(jià)值,即進(jìn)行增值工作。對于個體,可以預(yù)測其下一步的購買行為。只要在TOUICS中設(shè)定一系列的策略,它就可以根據(jù)已有的數(shù)據(jù)來判斷一個用戶會購買什么書。這些策略是由市場部門的職員經(jīng)過多年的經(jīng)驗(yàn)積累總結(jié)得出的,也是TOUICS的另一大核心數(shù)據(jù)。例如,一個35~40歲的男性在幾大名表論壇上有注冊,但沒有發(fā)帖記錄,則其一定會購買至少一本名表鑒定相關(guān)的書籍。甚至可以肯定其所注冊的分論壇,就是他想購買表的品牌。這時如果往他的郵箱中發(fā)送相關(guān)的廣告,成功率會非常高。TOUICS可以根據(jù)模板生成多種不同的廣告郵件,里面的內(nèi)容就是目標(biāo)用戶可能購買的書籍。然后自動填寫郵件地址、標(biāo)題,并通過德坤泰印書館的郵件服務(wù)器發(fā)送出去。
通過TOUICS得到的數(shù)據(jù)經(jīng)過處理和分析后,提交管理部門進(jìn)行討論,以制定下一步的出版計(jì)劃作參考。需要注意的是,TOUICS的結(jié)果僅僅只是對市場的統(tǒng)計(jì)性分析,且沒有考慮諸如成本、法律等相關(guān)因素,因此僅供決策者參考。同時,技術(shù)部門和市場部門的員工還要通力合作,維護(hù)系統(tǒng)數(shù)據(jù)庫并及時更新數(shù)據(jù),以實(shí)現(xiàn)對市場的動態(tài)分析。
TOUICS系統(tǒng)由6個主模塊和共計(jì)29個子功能模塊組成,如下圖所示。
圖 TOUICS的模塊劃分
在線情報(bào)收集系統(tǒng)TOUICS,經(jīng)過一年多的運(yùn)轉(zhuǎn),證實(shí)其確實(shí)能起到預(yù)測市場導(dǎo)向和用戶行為的作用。后期我們將對TOUICS進(jìn)行深層次開發(fā)和擴(kuò)展,完善TOUICS尚不健全的部分,加入更多的算法分析功能,以實(shí)現(xiàn)更精確的情報(bào)分析功能,為情報(bào)分析工作的社會化應(yīng)用作出新的貢獻(xiàn)。
[1]大公網(wǎng) [EB/OL].[2012-07-13].http://www.tak-ungpao.com.hk/mainland/content/2012-07/13/content_710087_2.htm.
[2]吳曉偉,等.基于TAM和知覺風(fēng)險(xiǎn)的網(wǎng)絡(luò)競爭情報(bào)用戶使用行為研究[J].情報(bào)科學(xué), 2010年(6):931-935.