袁 帆,李 佳
(1.上海第二工業(yè)大學 圖書館,上海 201209;2.華東師范大學 教育學部,上海 200062)
二八定律也被稱為80/20法則,是一種基于“重要的少數(shù)與瑣碎的多數(shù)”原則的量化標準,該原理由19世紀意大利經(jīng)濟學家維弗雷多·帕累托提出,他發(fā)現(xiàn)20%的產(chǎn)品或活動通常占用了80%的資源或收益。在管理學中,二八定律通常用于識別和優(yōu)化關鍵的20%因素,以獲得80%的成果[1]?!伴L尾”一詞由克里斯·安德森于2004年在《連線》雜志上提出,與80/20法則的解釋截然不同,常用于解釋如亞馬遜和Netflix的在線商業(yè)和經(jīng)濟模型,最初它指的是銷量較小或不被重視的產(chǎn)品或服務。由于它們的種類繁多,總銷量龐大,并且累計總收入超過主流熱門產(chǎn)品的收入,隨著互聯(lián)網(wǎng)和產(chǎn)品信息化的發(fā)展,數(shù)字產(chǎn)品存儲成本的壓力逐漸降低甚至抵消,當存貨存儲成本不再是一個重大問題時,長尾理論的應用就蓬勃發(fā)展[2]。
長尾理論在圖書館領域并不陌生,自2004年長尾理論提出以來,美國圖書館協(xié)會(American Library Association,ALA)多次邀請安德森進行演講,探討數(shù)字化和互聯(lián)網(wǎng)環(huán)境中的信息資源建設和用戶服務等問題,ALA確信長尾理論能夠?qū)ν卣剐畔⒂脩舴秶⑷姹U嫌脩粜枨螽a(chǎn)生積極作用。在以紙質(zhì)圖書收藏為主的傳統(tǒng)圖書館文獻資源建設中即有學者提出要抓住20%具有特色的館藏資源進行重點建設以改變過去僅依靠經(jīng)驗辦事的做法,避免信息資源建設中的盲目性和隨意性[3]。而進入信息時代后,隨著圖書館的數(shù)字化轉(zhuǎn)型,圖書館正通過提高數(shù)字資源的質(zhì)量和數(shù)量逐步加強數(shù)字資源的建設,相關學者開始關注長尾理論在圖書館服務中的應用。倪娟等[4]認為圖書館應該積極應用長尾理論,拓展新服務,發(fā)掘新的服務增長點;周歡等[5]提出了圖書館利用長尾理論中生產(chǎn)普及、傳播普及和供需相連3種力量推廣全民閱讀的策略。
過去,數(shù)字圖書館在討論長尾理論時主要聚焦于數(shù)字資源,如電子期刊資源建設和電子圖書的利用情況等。隨著數(shù)字圖書館用戶群體的不斷增加,用戶需求逐漸呈現(xiàn)多元化,如何挖掘圖書館潛在的“長尾”,以擴大資源和服務的利用率,進而提升對讀者的服務質(zhì)量,已成為數(shù)字化時代圖書館轉(zhuǎn)型與發(fā)展的重要使命[6]。而長尾理論在圖書館應用中的實證研究較少,可能缺乏準確、全面的數(shù)據(jù)證明其存在性,大部分研究停留在討論、分析和評論等方面。在數(shù)字環(huán)境中是否有確切證據(jù)表明圖書館信息資源利用情況呈現(xiàn)長尾現(xiàn)象?圖書館如何在資源建設或用戶服務中運用相關理論來有效提升其管理效率和服務質(zhì)量?本文希望在以上問題上展開分析與探討。
長尾概念被廣泛應用于在線商務、大眾傳媒、知識管理、社交網(wǎng)絡傳播、市場營銷等領域,主要面向需求較低或不太受歡迎的產(chǎn)品,安德森認為這些產(chǎn)品實際上可以增加利潤率,因為消費者正在遠離主流市場。隨著互聯(lián)網(wǎng)的發(fā)展,電子商務平臺的出現(xiàn)打破了傳統(tǒng)的銷售模式,使得長尾產(chǎn)品也能夠獲得更廣泛的市場機會。通過互聯(lián)網(wǎng)和電子商務平臺,商家可以將長尾產(chǎn)品與潛在的小眾消費者連接起來,從而實現(xiàn)銷售和利潤的增長。這種模式可以為消費者提供更多元化的選擇,并為商家創(chuàng)造更多銷售機會[7]。長尾理論的數(shù)學模型體現(xiàn)在兩個變量之間的關系成為冪律。由于長尾非常長,長尾的面積與頭部的面積相同。在實際應用中,X軸通常表示產(chǎn)品種類/文獻資源種數(shù),Y軸表示商品銷售量/文獻資源銷售量,傳統(tǒng)關注頭部(20%)的80/20法則在長尾細分市場則強調(diào)尾部(見圖1)。
圖1 長尾現(xiàn)象
過往圖書館在采購圖書和其他信息資源時通常更注重熱門和暢銷的文獻,對利用率較低的資源采購較少。然而長尾理論認為即使利用率較低的“長尾”資源也具有一定的使用價值,并可能在整體利用中占據(jù)重要比例。這與二八法則不同,但同樣適用于圖書館管理決策,即圖書館不僅應關注主流讀者、館藏資源和服務,還應善于挖掘潛在用戶需求。隨著讀者群體的多樣性增加,特別是綜合性研究型圖書館和大型公共圖書館,如何識別非主流圖書館讀者需求、進一步了解并滿足這一群體的需求以擴大圖書館資源服務的廣度與深度,已成為圖書館數(shù)字化轉(zhuǎn)型過程中信息服務的重要任務。
印度圖書館學家阮岡納贊(S.R. Ranganathan)于1931年提出了圖書館學五定律,被國際圖書館界譽為“我們職業(yè)最簡明的表述”。這五定律是:書是為了用的;每個讀者有其書;每本書有其讀者;為讀者節(jié)省時間;圖書館是一個生長著的有機體[8]。這五定律強調(diào)了圖書館的成長性、多樣性和以讀者為中心的核心理念。本研究即基于以讀者為中心的信息資源建設與服務視角,探索長尾理論在圖書館中的應用,基于讀者借閱數(shù)據(jù)以探索可能存在的“長尾分布”現(xiàn)象,并進一步分析其特征,為以讀者為中心的信息資源建設與服務模式提供參考依據(jù)。
本研究以大學數(shù)字圖書館國際合作計劃(China-America Digital Academic Library,CADAL)網(wǎng)站的用戶借閱數(shù)據(jù)為分析對象,CADAL是一個由國家投資建設的數(shù)字圖書館項目,旨在構建多學科、多類型、多語種的海量數(shù)字資源。目前,CADAL已經(jīng)擁有近280萬冊(件)的數(shù)據(jù),而本研究選取了2022年CADAL網(wǎng)站完整的322 084條借閱數(shù)據(jù)作為分析基礎。為了保護圖書館讀者的隱私,在獲取和分析數(shù)據(jù)之前,CADAL項目管理中心對由數(shù)據(jù)提供單位提供的41 587 374條涉及網(wǎng)站用戶、資源、檢索記錄、借閱記錄和瀏覽記錄等相關信息進行了預處理操作,刪除了能夠識別讀者隱私的數(shù)據(jù),如讀者姓名、電話號碼等。
長尾理論旨在探討高流通率和低流通率產(chǎn)品,本研究將圖書館的文獻資源視為圖書館的產(chǎn)品,并將圖書的利潤定義為被讀者借閱的次數(shù),因此借閱次數(shù)更多的圖書被視為高流通率的產(chǎn)品。本次研究對圖書的借閱次數(shù)進行排序,然后計算與借閱次數(shù)對應的圖書數(shù)量,從借閱次數(shù)最大和最小的端點開始累積圖書的借閱次數(shù),并檢查當這兩個累積數(shù)字最接近或相等時的情況,以確定是否呈現(xiàn)長尾現(xiàn)象。
本研究以每本書的借閱次數(shù)作為衡量其受歡迎程度的指標,借閱次數(shù)越多表示該書越受歡迎,可以被視為熱門圖書。研究根據(jù)322 084條借閱記錄對圖書的借閱次數(shù)進行聚合,并得到了98 707種圖書的有效借閱量統(tǒng)計表。最高和最低的累計借閱次數(shù)分別位于兩端,如表1所示。
表1 CADAL圖書資源借閱統(tǒng)計
研究根據(jù)不同借閱圖書種類和對應的借閱量,統(tǒng)計了各區(qū)間圖書借閱總量及其占比,以確定CADAL的信息資源利用情況是否呈現(xiàn)長尾分布(見表2),并在表2數(shù)據(jù)基礎上繪制CADAL信息資源利用分布情況圖(見圖2)。
圖2 CADAL圖書資源利用情況
結合表1和圖2的數(shù)據(jù)分析,如果從借閱次數(shù)最高的312次開始并將借閱次數(shù)進行累積,在長尾曲線中會有一個頭部和長尾的分割點。因此,研究將322 084本借閱次數(shù)為6次的書籍分為兩部分,可以發(fā)現(xiàn)頭部區(qū)域的面積等于長尾的面積,也就是圖書館借閱的書籍數(shù)量和書籍借閱次數(shù)之間的累計借閱次(冊)數(shù)是相等的,因此可以確定CADAL的書籍借閱次數(shù)與圖書館借閱數(shù)量之間呈現(xiàn)長尾現(xiàn)象。
長尾理論認為通過優(yōu)化資源的組織,可以提高資源的利用率。圖書館傳統(tǒng)觀念中那些低流通率的“冷門”文獻資源,雖然單個來看利用率很低,但由于其數(shù)量巨大,匯集起來的利用總量是巨大的。根據(jù)統(tǒng)計分析,本文認為圖書館不僅關注熱門的暢銷書和熱門話題,還應納入更多的冷門主題和專業(yè)領域的書籍,特別是對于綜合型圖書館,在不受復本數(shù)限制的數(shù)字文獻資源建設中,應優(yōu)先考慮擴大館藏范圍,盡可能提供更多長尾資源的數(shù)字版本以滿足讀者多樣化的需求,提供更廣泛的知識覆蓋。
傳統(tǒng)圖書館通常根據(jù)熱門度或借閱量進行圖書推薦,本次研究表明用戶的興趣和需求是多樣化的,他們可能對某些較小眾的主題或領域感興趣。此外,為了建設更多元、更廣泛的信息資源,本文認為圖書館可與其他機構或資源平臺合作,提供更廣泛的信息服務,通過共享資源和知識,促進“長尾”需求的滿足。
圖書館的信息資源建設應將有限的經(jīng)費和人力投入對讀者最重要和最有價值的資源建設上,通過分析讀者的借閱情況和反饋可以確定哪些資源最受讀者歡迎和最有價值,這些資源應成為圖書館重點建設的對象。本次研究可以確定CADAL的讀者對資源利用情況確實呈現(xiàn)長尾現(xiàn)象,因此本文認為圖書館應該盡可能擴展數(shù)字資源的范圍,提供多樣化的信息服務以滿足讀者“長尾”需求,不應忽視學習和研究的多樣性。
但通過進一步數(shù)據(jù)分析,本文還發(fā)現(xiàn)約20%的常用圖書可以滿足約61%的讀者需求,有70%的冷門信息資源利用率不到30%,借閱次數(shù)少于10次的書籍利用率約占89.92%,大約40%的書籍僅被借閱一次。因此本文還認為對于資源有限的圖書館,應將有限的采購經(jīng)費優(yōu)先用于購買占據(jù)讀者需求的重要資源,如對于需求量較大、借閱量較高的學科主題,可以加大資源采購力度,確保這些學科主題的資源建設得到更多的重視和投入,這樣能在有限的條件下最大限度地滿足讀者的借閱需求。而在圖書館的布局設計中,可以將重要資源、熱門區(qū)域或服務放置在易于訪問和吸引人的位置,對于數(shù)字資源平臺,可以將熱門資源放在首頁或推薦板塊,以提高資源的可獲取性和利用率。