蘭 雪,韓 毅
(西南大學(xué)計算機與信息科學(xué)學(xué)院,重慶 400715)
隨著互聯(lián)網(wǎng)的發(fā)展,人們通過社交網(wǎng)絡(luò)粘合于虛擬社區(qū)之中。人們的某些行為或習(xí)慣在互聯(lián)網(wǎng)的影響下慢慢發(fā)生改變,獲取知識的閱讀行為與方式也在網(wǎng)絡(luò)的推動下發(fā)生了潛移默化的改變,互聯(lián)網(wǎng)時代的閱讀正逐漸演變?yōu)橐环N集體行為、社會化行為。人們閱讀書籍、標記書籍、分享書籍,或是在社交網(wǎng)站發(fā)布書評,與陌生的網(wǎng)友溝通交流,社會化閱讀平臺應(yīng)運而生,豆瓣讀書、天涯讀書、Goodreaders 等是其中的典型代表。豆瓣讀書是中國最具代表性的網(wǎng)絡(luò)讀書社區(qū),它以圖書為中心,建立起關(guān)于圖書的社區(qū)[1],是當前運營比較成功、比較成熟的社會化閱讀平臺。
豆瓣評分是由許多閱讀過該書的用戶基于個人認知對圖書進行評價所得到的平均分,它成為許多用戶閱讀選擇的一個重要參考,社會化閱讀平臺中的圖書評分也被學(xué)者作為圖書評價指標體系中的一個指標,尤其在Altmetrics 評價提出之后,社交平臺的各項指標也被嘗試納入科技評價中。然而,各社會化閱讀平臺圖書評分數(shù)據(jù)是否可用值得商榷。本文以豆瓣讀書平臺為例,分析其圖書評分數(shù)據(jù)作為圖書Altmetrics 評價的數(shù)據(jù)可用性。
社會化閱讀是一種以讀者為核心,注重讀者與讀者之間、讀者與內(nèi)容之間的分享、互動與傳播的全新閱讀模式。與以書為核心內(nèi)容的傳統(tǒng)閱讀模式相比,該方式更加注重人和閱讀社交,倡導(dǎo)UGC(User Generated Content,用戶生成內(nèi)容),注重共同傳播與營利,在多方位互動的基礎(chǔ)上,實現(xiàn)閱讀價值的無限放大[2]。梁育浩[3]以豆瓣網(wǎng)旗下的“豆瓣讀書”和“豆瓣閱讀”兩個板塊構(gòu)成的社會化閱讀平臺為研究對象,梳理出豆瓣網(wǎng)從“豆瓣讀書”以圖書評論推介為主的平臺發(fā)展為兼具數(shù)字閱讀和自出版功能的社會化閱讀平臺的發(fā)展過程,探究了其發(fā)展過程中的優(yōu)勢和阻力。
圖書評價方法多樣,包括書評、基于圖書館的圖書評價、圖書被引、基于Altmetrics 的圖書評價和綜合圖書評價等。同行評議直接反映圖書的創(chuàng)新程度、學(xué)術(shù)價值和內(nèi)容質(zhì)量[4]。何峻[5]指出書評反映了讀者對一本書質(zhì)量的主觀性見解和價值判斷,對于圖書宣傳促銷、引導(dǎo)讀者閱讀、提高圖書質(zhì)量都有積極的作用,是中國當前圖書評價的一種重要形式,但是各種書評魚龍混雜,真正優(yōu)秀、有質(zhì)量的書評為數(shù)不多。陳芳芳[6]根據(jù)模糊綜合評價理論,建立了一個用于定量評價圖書使用效益的數(shù)學(xué)模型,將圖書館圖書使用效益的指標劃分為6 個:借閱次數(shù)、預(yù)約次數(shù)、點擊次數(shù)、收藏次數(shù)、一般讀者評分、專家評分。張海營[7]將營銷學(xué)上常用的RFM(Recency、Frequency 和Monetary)模型應(yīng)用于圖書館研究領(lǐng)域,將RFM 重新定義為圖書最近被借閱時間(R)、被借閱次數(shù)(F)和被借閱總時間(M),最終將這3 個指標整合成圖書評價因子,提出基于RFM 模型的圖書評價系統(tǒng)。WHITE 等[8]認為目前對人文社會科學(xué)類圖書的評價相比報刊或技術(shù)類的研究成果不夠多,提出采用引文指標的圖書質(zhì)量評價測量方式。楊思洛等[9,10]從引文分析角度分別對圖書情報、檔案學(xué)圖書影響力進行統(tǒng)計,從圖書影響力、出版社影響力、作者影響力和年代影響力以及高影響力圖書同被引情況等方面進行了統(tǒng)計分析。
美國學(xué)者PRIEM 在其Twitter 上提出了Altmetrics,它是在以數(shù)字圖書館、開放存?。∣A)、Web2.0、移動及社交網(wǎng)絡(luò)、自媒體、在線科研及MOOCs、大數(shù)據(jù)等為代表的新學(xué)術(shù)信息環(huán)境下的一系列新的計量指標及方法,雷淑義等[11]認為Altmetrics 正在成為一種更易實施的學(xué)術(shù)圖書影響力分析評價新方法。魏佳文等[12]對豆瓣讀書平臺上中文學(xué)術(shù)圖書短評的產(chǎn)生動機進行分析,認為“討論”類短評數(shù)據(jù)可用于評價中文學(xué)術(shù)圖書價值,而“分享”“消遣娛樂”“外界壓力”“情感宣泄”和“資料獲取”等動機相對來說難以較好地反映用戶對圖書的態(tài)度和認知。姜春林等[13]研究發(fā)現(xiàn),由于不同學(xué)科知識屬性與研究范式不同,理學(xué)學(xué)科的基礎(chǔ)性與專業(yè)性、工學(xué)學(xué)科的實踐性、人文學(xué)科的歷史性、社科類的社會廣泛性、醫(yī)學(xué)類學(xué)科的兼具基礎(chǔ)性與實踐性,導(dǎo)致不同學(xué)科的產(chǎn)出量、引用行為、討論度存在差異,Bookmetrix 各指標數(shù)值特征存在學(xué)科差異,指標間相關(guān)性亦呈現(xiàn)學(xué)科差異。肖敖夏等[14]基于Bookmetrix 指標建立學(xué)術(shù)圖書因子綜合得分模型,對學(xué)術(shù)圖書的影響力進行綜合分析,并討論利用Bookmetrix 指標對學(xué)術(shù)圖書影響力進行評價的價值,研究發(fā)現(xiàn)利用Bookmetrix 指標評價學(xué)術(shù)圖書對傳統(tǒng)計量指標具有一定的補充價值,但仍存在較多不足。韓毅[15]認為Altmetrics 的計量結(jié)果與傳統(tǒng)以引文為基礎(chǔ)的科技評價是相互補充關(guān)系,應(yīng)當將兩者融合進行綜合評價。
綜合圖書評價方法則融合多個維度對圖書進行評價。張玉等[16]采用的定性綜合評價指標主要有:書評、專家評價和網(wǎng)絡(luò)書評,定量綜合評價指標包含圖書引用、圖書利用和基金資助與獎勵。王偉等[17]以人文社會科學(xué)外譯圖書為研究對象,從外譯圖書學(xué)術(shù)影響和社會影響兩個方面出發(fā)構(gòu)建10 個維度細化評價指標,利用熵權(quán)法計算各項指標的權(quán)重,加權(quán)平均得到學(xué)術(shù)影響力和社會影響力得分,并對中華學(xué)術(shù)外譯項目資助的外譯圖書進行實證分析。
在信息領(lǐng)域中,可用性的最初研究大都集中于計算機軟硬件,近年來可用性理念開始逐漸滲透到數(shù)據(jù)領(lǐng)域。數(shù)據(jù)可用性具有很多度量指標,李建中等[18]用數(shù)據(jù)一致性、數(shù)據(jù)精確性、數(shù)據(jù)完整性、數(shù)據(jù)時效性以及實體同一性來衡量數(shù)據(jù)可用性。聶磊等[19]參考社會調(diào)查數(shù)據(jù)評估已有研究,認為網(wǎng)絡(luò)行為數(shù)據(jù)的適用性主要包括兩方面內(nèi)容,數(shù)據(jù)中樣本能有效推估總體的程度以及基于特定數(shù)據(jù)進行的測量能在多大程度上反映研究概念的真實含義。
本文將以典型的社會化閱讀平臺——豆瓣讀書平臺上的圖書評分數(shù)據(jù)為對象,將豆瓣圖書評分與傳統(tǒng)的圖書引文評價作相關(guān)性分析,分析豆瓣圖書評分數(shù)據(jù)作為圖書Altmetrics 評價數(shù)據(jù)的可用性。
本文的研究對象是“豆瓣讀書”平臺上不同學(xué)科的圖書,聚焦于這些書籍的讀者評分數(shù)據(jù)。
(1)樣本的選取采用分層抽樣方法,從 《讀秀中文圖書被引用情況報告(2020)》[20]22 個大類圖書分別選擇30 本圖書作為分析對象,在各大類中采取簡單隨機抽樣,采集所對應(yīng)的書名、出版年、作者、被引用次數(shù)并保存到Excel 表中。由于《讀秀中文圖書被引用情況報告(2020)》 中部分大類圖書數(shù)量較少,為了對盡量多的大類圖書進行分析,基于報告中各個大類圖書數(shù)量的綜合考量,選取了滿足相關(guān)性分析的最低樣本數(shù)量,即每個大類選擇30 本圖書進行分析。而 《讀秀中文圖書被引用情況報告(2020)》 中的圖書被引用數(shù)據(jù)為圖書引用圖書的數(shù)據(jù),為保證圖書被引用數(shù)據(jù)的完整性,在中國引文數(shù)據(jù)庫(CCD)中檢索獲取每本圖書的期刊、學(xué)位論文及會議論文引用數(shù)據(jù),形成完整的圖書被引用數(shù)據(jù)。
(2)對于選定的圖書對象,于2021 年1 月15 日通過書名和作者在豆瓣讀書平臺中檢索相應(yīng)圖書(由于讀秀提供的出版年所對應(yīng)的圖書版本大多數(shù)不存在相對應(yīng)的豆瓣評分,因此未將出版年作為檢索項),獲取其豆瓣評分數(shù)據(jù),對于豆瓣讀書平臺上不存在的圖書或沒有豆瓣評分的圖書,則將其刪除后重新在 《讀秀中文圖書被引用情況報告(2020)》 中隨機選擇圖書作為分析對象并獲取其豆瓣評分數(shù)據(jù)。
將收集的數(shù)據(jù)按圖書大類分別整理錄入到Excel 表中,添加被引用次數(shù)排名和豆瓣評分排名數(shù)據(jù)?!蹲x秀中文圖書被引用情況報告(2020)》 中部分大類圖書對應(yīng)的豆瓣評分數(shù)據(jù)量不足30 本,統(tǒng)計發(fā)現(xiàn)這些圖書大類均為自然科學(xué)部類,在數(shù)據(jù)分析時僅對數(shù)據(jù)量完整的部分圖書大類數(shù)據(jù)進行單獨分析,其余數(shù)據(jù)將作為自然科學(xué)部類圖書整體分析樣本的一部分。各大類圖書數(shù)據(jù)的收集情況詳見表1。
表1 各個大類圖書數(shù)據(jù)收集情況 單位:本Table 1 Books data collection of various categories
為了識別圖書被引用次數(shù)與豆瓣評分之間的相關(guān)性大小,選擇的數(shù)據(jù)分析方法為相關(guān)分析。圖書被引用次數(shù)的數(shù)值相對較大,因此對其進行自然對數(shù)轉(zhuǎn)換處理,對于滿足正態(tài)分布的連續(xù)數(shù)據(jù)采用皮爾遜相關(guān)分析,對于其他不滿足正態(tài)分布的連續(xù)數(shù)據(jù),則對其數(shù)據(jù)采用斯皮爾曼相關(guān)分析。
4.1.1 單樣本K-S 檢驗
單樣本K-S 檢驗是利用樣本數(shù)據(jù)推斷總體是否服從某一理論分布的方法,適用于探索連續(xù)型隨機變量的分布形態(tài)。對所有數(shù)據(jù)量完整的圖書大類(A、B、C、D、E、F、G、H、I、J、K、R、T、Z)以及各圖書部類和全部圖書的數(shù)據(jù)分別進行單樣本K-S 檢驗,分析判斷各大類圖書數(shù)據(jù)是否滿足正態(tài)分布(由于被引用次數(shù)相差甚大,因而先對其進行自然對數(shù)轉(zhuǎn)換再進行單樣本K-S 檢驗)。A 類圖書被引用次數(shù)對數(shù)轉(zhuǎn)換數(shù)據(jù)和豆瓣評分數(shù)據(jù)的單樣本K-S 檢驗分析結(jié)果詳見表2。
表2 A 類圖書數(shù)據(jù)單樣本K-S 檢驗結(jié)果Table 2 Single sample K-S test results of class A books
由表2 可見,A 類圖書被引用次數(shù)對數(shù)轉(zhuǎn)換數(shù)據(jù)和豆瓣評分數(shù)據(jù)的漸進顯著性均小于顯著性水平0.05,因此拒絕原假設(shè),即被A 類圖書的被引用次數(shù)對數(shù)轉(zhuǎn)換數(shù)據(jù)和豆瓣評分數(shù)據(jù)的總體分布與正態(tài)分布存在顯著差異,不滿足正態(tài)分布。對各大類數(shù)據(jù)及各部類數(shù)據(jù)進行單樣本K-S 檢驗,最終得到被引用次數(shù)對數(shù)轉(zhuǎn)換數(shù)據(jù)和豆瓣評分數(shù)據(jù)均符合正態(tài)分布的圖書大類為C、D、E、F、H、I、J、R 和T 共計9 類,A、B、G、K 和Z 5 個大類的被引用次數(shù)對數(shù)轉(zhuǎn)換數(shù)據(jù)和豆瓣評分數(shù)據(jù)不能同時滿足正態(tài)分布。就五大圖書部類而言,兩個變量數(shù)據(jù)均不能同時滿足正態(tài)分布,因此采用斯皮爾曼相關(guān)分析。
4.1.2 皮爾遜相關(guān)分析
針對符合正態(tài)分布的圖書大類,即C、D、E、F、H、I、J、R 和T 類圖書,采用皮爾遜相關(guān)系數(shù)來分析被引用次數(shù)對數(shù)變換數(shù)據(jù)與豆瓣評分兩個變量之間的相關(guān)性。各類圖書的兩個變量之間的皮爾遜相關(guān)系數(shù)詳見表3。
表3 C、D、E、F、H、I、J、R 和T 類圖書的被引用次數(shù)對數(shù)變換數(shù)據(jù)與豆瓣評分變量之間的皮爾遜相關(guān)系數(shù)Table 3 Pearson correlation coefficient between logarithmic transformation data of book citations of C,D,E,F,H,I,J,R and T and Douban rating score
在以上9 個大類中,E 類、J 類、R 類和T 類4 個大類圖書的被引用次數(shù)與豆瓣評分排名的斯皮爾曼相關(guān)性的顯著性均大于0.05,即兩變量之間不存在顯著相關(guān)性。對于D、F 和I 這3 個大類,被引用次數(shù)對數(shù)轉(zhuǎn)換數(shù)據(jù)與豆瓣評分之間的皮爾遜相關(guān)系數(shù)在0.3~0.5之間,且D 類的顯著性小于0.01,F(xiàn) 和I 類的顯著性小于0.05,認為兩個變量之間存在低度相關(guān)。在C、D所在的2 個大類中,圖書的被引用次數(shù)對數(shù)轉(zhuǎn)換與豆瓣評分的皮爾遜相關(guān)系數(shù)均介于0.5~0.8 之間,且顯著性均小于0.01,表示兩個變量之間存在顯著中度相關(guān)關(guān)系。
4.1.3 斯皮爾曼相關(guān)分析
對于數(shù)據(jù)量為30 但數(shù)據(jù)不符合正態(tài)分布的圖書大類(即A、B、G、K 和Z 這5 個圖書大類)的圖書被引用次數(shù)排名與豆瓣評分排名采用斯皮爾曼相關(guān)分析,斯皮爾曼相關(guān)系數(shù)用于度量兩個等級變量之間的線性相關(guān)。各大類圖書的兩個變量之間的斯皮爾曼相關(guān)系數(shù)詳見表4。
表4 A、B、G、K 和Z 類圖書的被引用次數(shù)排名與豆瓣評分排名變量之間的斯皮爾曼相關(guān)系數(shù)Table 4 Spearman correlation coefficient between the book citation ranking of A,B,G,K and Z and Douban ranking score
在以上5 個大類中,圖書的被引用次數(shù)排名與豆瓣評分排名的斯皮爾曼相關(guān)系數(shù)均介于0.5~0.8 之間,且顯著性均小于0.01,表示兩個變量之間存在顯著中度相關(guān)關(guān)系。
按照學(xué)科部類整理統(tǒng)計數(shù)據(jù),并分析各部類圖書的被引用次數(shù)排名數(shù)據(jù)與豆瓣評分排名數(shù)據(jù)的相關(guān)性,得到各部類圖書兩個變量之間的斯皮爾曼相關(guān)系數(shù),結(jié)果詳見表5。
表5 各部類圖書的被引用次數(shù)排名與豆瓣評分排名變量的斯皮爾曼相關(guān)系數(shù)Table 5 Spearman correlation coefficient between the book citation ranking for each category and Douban rating score
由表5 可見,自然科學(xué)部類圖書的被引用次數(shù)與豆瓣評分兩變量之間的斯皮爾曼相關(guān)系數(shù)為0.191,小于0.3,可認為不存在相關(guān)關(guān)系。社會科學(xué)部類圖書的被引用次數(shù)排名與豆瓣評分排名變量之間的斯皮爾曼相關(guān)系數(shù)為0.418,存在低度相關(guān)關(guān)系。馬克思主義列寧主義毛澤東思想鄧小平理論、哲學(xué)及綜合性圖書的被引用次數(shù)與豆瓣評分兩個變量之間的斯皮爾曼相關(guān)系數(shù)均在0.5~0.8 之間,存在中度相關(guān)關(guān)系。整體而言,圖書被引用次數(shù)與豆瓣評分變量之間的斯皮爾曼相關(guān)系數(shù)為0.468,即兩個變量之間存在低度相關(guān)關(guān)系。
4.2.1 各大類圖書的社會化閱讀平臺評分數(shù)據(jù)可用性
從以上研究結(jié)果可以看到,馬克思主義列寧主義毛澤東思想鄧小平理論(A)、哲學(xué)宗教(B)、社會科學(xué)總論(C)、政治法律(D)、經(jīng)濟(F)、文化科學(xué)教育體育(G)、語言文字(H)、文學(xué)(I)、歷史地理(K)、綜合性圖書(Z)共計10 個大類圖書的被引用次數(shù)與豆瓣評分數(shù)據(jù)之間的相關(guān)系數(shù)大于0.3,且顯著性小于0.05,即存在一定的相關(guān)性,因此可以認為這些大類的豆瓣評分數(shù)據(jù)可在一定程度上反映了圖書的社會影響力,社會化閱讀平臺評分數(shù)據(jù)一定的可用性,可以作為圖書Altmetrics 評價指標的數(shù)據(jù)來源。
其中,社會科學(xué)總論(C)、政治法律(D)、經(jīng)濟(F)、文化科學(xué)教育體育(G)、語言文字(H)、文學(xué)(I)、歷史地理(K)7 個大類圖書均屬于社會科學(xué),社會科學(xué)部類中僅軍事(E)和藝術(shù)(J)大類圖書的被引用次數(shù)與豆瓣評分數(shù)據(jù)之間不存在相關(guān)關(guān)系,進一步說明社會科學(xué)類圖書的社會影響力更容易凸顯。
而自然科學(xué)各個大類圖書被引用次數(shù)相關(guān)數(shù)據(jù)與豆瓣評分相關(guān)數(shù)據(jù)之間的相關(guān)性均不顯著,因此對自然科學(xué)圖書進行評價時,應(yīng)慎重考慮是否將社會化閱讀平臺的評分數(shù)據(jù)作為評價指標。并且,在數(shù)據(jù)搜集過程中發(fā)現(xiàn),相對于其他部類圖書而言,更多的自然科學(xué)圖書在豆瓣讀書平臺中由于評分人數(shù)小于10 人而無法獲取到其豆瓣評分數(shù)據(jù),部分存在豆瓣評分的自然科學(xué)圖書,其評分人數(shù)也遠遠小于其他部類圖書的評分人數(shù)。這些表明,自然科學(xué)圖書,由于其知識社會擴散壁壘較高,其社會影響力較難展現(xiàn)出來。
4.2.2 各部類圖書的社會化閱讀平臺評分數(shù)據(jù)可用性
馬克思主義列寧主義毛澤東思想鄧小平理論、哲學(xué)和綜合性圖書3 個部類的社會化閱讀平臺圖書評分數(shù)據(jù)具有較好的可用性。這3 個部類圖書被引用次數(shù)相關(guān)數(shù)據(jù)與豆瓣評分相關(guān)數(shù)據(jù)之間的相關(guān)系數(shù)介于0.5~0.8 之間,存在中度相關(guān)關(guān)系,且數(shù)據(jù)搜集過程中發(fā)現(xiàn)只有小部分圖書在豆瓣讀書平臺中沒有形成豆瓣評分,評分人數(shù)差距甚大,最多的有萬余名用戶對圖書進行了評分。因此可認為這3 個部類圖書的豆瓣評分能夠在一定程度上反映圖書的社會影響力,在對這3個部類圖書進行評價時,社會化閱讀平臺評分數(shù)據(jù)具有較好的可用性,可以作為圖書Altmetrics 評價指標的數(shù)據(jù)來源。
社會科學(xué)部類的社會化閱讀平臺圖書評分數(shù)據(jù)具有一定的可用性。其圖書被引用次數(shù)與豆瓣評分之間的相關(guān)系數(shù)為0.418,兩個變量之間存在低度相關(guān)關(guān)系,豆瓣評分能體現(xiàn)一定的圖書社會影響力。社會科學(xué)部類圖書在所有圖書中評分人數(shù)相對較多,文學(xué)大類圖書尤為顯著,文學(xué)作品較其他專業(yè)圖書的受眾更為廣泛,《百年孤獨》 《挪威的森林》 等的評價人數(shù)在30 萬左右,少量異常評分不影響圖書豆瓣評分的最終結(jié)果,能反映社會化閱讀平臺大眾對圖書社會影響力的評價。雖然社會科學(xué)部類各大類圖書被引用次數(shù)與豆瓣評分數(shù)據(jù)之間的相關(guān)程度不一,但是豆瓣評分數(shù)據(jù)總體而言能夠在一定程度上反映圖書的社會影響力,將豆瓣評分作為社會科學(xué)圖書Altmetrics 評價指標數(shù)據(jù)來源有一定的可行性。
對自然科學(xué)部類圖書而言,社會化閱讀平臺評分數(shù)據(jù)可用性較差。其圖書被引用次數(shù)與豆瓣評分之間的相關(guān)系數(shù)為0.195,可以認為兩個變量之間不存在顯著相關(guān)關(guān)系,表明豆瓣評分數(shù)據(jù)所反映的社會影響力與圖書學(xué)術(shù)影響力間是完全不同的兩個變量,主要原因可能在于自然科學(xué)部類圖書受眾相對較小,圖書專業(yè)性更強,普通的社會化閱讀平臺用戶并不關(guān)注自然科學(xué)部類圖書,少量受其影響較大的用戶評分就會對整體評分產(chǎn)生較大的影響,導(dǎo)致評分數(shù)據(jù)的可靠性、可信性不強。因此在對自然科學(xué)部類圖書社會影響力進行評價時,不建議將社會化閱讀平臺的圖書評分作為圖書Altmetrics 評價指標的數(shù)據(jù)來源。
總體而言,社會化閱讀平臺圖書評分數(shù)據(jù)具有一定的可用性。在具體大類圖書質(zhì)量評價時,確定圖書評價數(shù)據(jù)來源時要審慎選擇。對于馬克思主義列寧主義毛澤東思想鄧小平理論、哲學(xué)圖書、社會科學(xué)圖書以及綜合性圖書進行評價時,可以考慮將社會化閱讀平臺的評分數(shù)據(jù)納入其中,作為圖書Altmetrics 評價指標的數(shù)據(jù)來源。而針對自然科學(xué)圖書的質(zhì)量評價,暫時不宜選擇社會化閱讀平臺的評分數(shù)據(jù)。
本研究分析結(jié)果表明,圖書豆瓣評分與被引用次數(shù)之間存在顯著正相關(guān);不同學(xué)科豆瓣平臺圖書評分數(shù)據(jù)可用性存在差異。因此,社會化閱讀平臺圖書評分數(shù)據(jù)具有一定的可用性,在對不同大類圖書進行評價時應(yīng)謹慎考慮是否使用社會化閱讀平臺圖書評分作為圖書Altmetrics 評價指標的數(shù)據(jù)來源。
(1)對馬克思主義列寧主義毛澤東思想鄧小平理論、哲學(xué)和綜合性圖書3 個部類的圖書質(zhì)量進行評價時,社會化閱讀平臺圖書評分數(shù)據(jù)具有較好的可用性,可以作為圖書Altmetrics 評價指標的數(shù)據(jù)來源。這3 個部類圖書在社會化閱讀平臺普遍能夠獲取對應(yīng)的圖書評分,且有較多用戶參與評分,能夠在一定程度上反映大眾對該類圖書社會影響力的認知和評價,圖書評分與圖書被引用次數(shù)之間存在較高的相關(guān)性,因而能較好地反映圖書的社會價值。將社會化閱讀平臺圖書評分作為這3 個部類圖書的評價指標數(shù)據(jù)來源是可靠、可行的。
(2)在對社會科學(xué)部類圖書評價時,可根據(jù)圖書具體大類有選擇地決定是否使用社會化閱讀平臺圖書評分數(shù)據(jù)作為圖書Altmetrics 評價指標的數(shù)據(jù)來源。總體而言,社會科學(xué)部類圖書在社會化閱讀平臺中都存在圖書評分,且相當一部分圖書的評分人數(shù)數(shù)量巨大,能夠很好反映大眾對圖書的評價。大部分圖書大類的評分數(shù)據(jù)與圖書被引用次數(shù)之間存在一定的相關(guān)性,僅軍事大類和藝術(shù)大類圖書的兩個變量之間相關(guān)性不顯著,軍事大類圖書可能因為在普通用戶中受眾相對較小,專業(yè)性較高,導(dǎo)致圖書評分數(shù)據(jù)不能很好地反映圖書社會影響力價值,而在豆瓣讀書中對藝術(shù)大類圖書進行評分的普通用戶在打分時,可能更關(guān)注作品的藝術(shù)價值,因而與圖書被引用次數(shù),即學(xué)術(shù)價值,相關(guān)性不顯著。因此在對這兩類圖書進行評價時,不建議采用社會化閱讀平臺的圖書評分數(shù)據(jù)作為其圖書Altmetrics 評價指標的數(shù)據(jù)來源。而對于社會科學(xué)部類中的其他大類圖書,社會化閱讀平臺圖書評分數(shù)據(jù)具有較好的可用性。
(3)對于自然科學(xué)部類圖書而言,社會化閱讀平臺圖書評分數(shù)據(jù)可用性較差,不建議將其作為圖書Altmetrics 評價指標的數(shù)據(jù)來源。一方面,自然科學(xué)圖書專業(yè)性較強,一般為專業(yè)人士所閱讀學(xué)習(xí),社會化閱讀平臺的用戶大多不會在此類平臺上對自然科學(xué)圖書進行評分,因此導(dǎo)致社會化閱讀平臺中自然科學(xué)圖書評分數(shù)據(jù)較少。另一方面,由于只有少量用戶對這些圖書進行評分,所以每個用戶的圖書評分會對平均評分產(chǎn)生較大影響,評分數(shù)據(jù)的穩(wěn)定性較差。因此在對自然科學(xué)圖書進行評價時,建議不把社會化閱讀平臺圖書評分數(shù)據(jù)納入Altmetrics 評價指標的數(shù)據(jù)來源。
總體而言,雖然社會化閱讀平臺圖書評分與圖書被引用次數(shù)之間存在相關(guān)性,但是不同大類的圖書社會化閱讀平臺圖書評分數(shù)據(jù)可用性存在明顯差異,因此在考慮是否使用社會化閱讀平臺圖書評分數(shù)據(jù)作為圖書Altmetrics 評價指標的數(shù)據(jù)來源時,應(yīng)當根據(jù)圖書類別謹慎選擇。肖敖夏等[13]和姜春林等[14]的研究也表明,社會化評價指標在學(xué)科之間的表現(xiàn)具有較大差異,針對不同學(xué)科的評價應(yīng)該區(qū)別考量。區(qū)別在于,肖敖夏以Springer 出版的學(xué)術(shù)圖書為對象,分析發(fā)現(xiàn)自然科學(xué)和應(yīng)用科學(xué)的Bookmetrix 指標表現(xiàn)優(yōu)于人文學(xué)科和社會科學(xué),而本研究發(fā)現(xiàn)社會科學(xué)部類的社會化閱讀平臺圖書評分數(shù)據(jù)可用性優(yōu)于自然科學(xué)部類。
豆瓣讀書平臺作為社會化閱讀平臺的代表,該平臺用戶數(shù)量巨大,圖書量巨大,運營管理時間已有多年,形成了較為成熟的圖書評價管理機制,是社會大眾公認的典型社會化閱讀平臺。因此其大規(guī)模的社會化閱讀平臺評分數(shù)據(jù),具有較高的可靠性,以其作為圖書社會影響力評價的Altmetrics 評價數(shù)據(jù)指標來源,具有可行性,只是在具體操作時要選擇性使用。
本研究對于每個圖書大類僅隨機選擇了30 本圖書進行分析,樣本數(shù)量較小,且樣本來源為 《讀秀中文圖書被引用情況報告(2020)》 中提到的圖書,對結(jié)論推廣到所有圖書時可能會出現(xiàn)一定的偏差。
不同大類圖書社會化閱讀平臺評分數(shù)據(jù)可用性存在差異,對于差異存在的原因本文未進行深入探討,圖書本身、用戶、平臺等因素都有可能會對數(shù)據(jù)可用性產(chǎn)生影響,因此未來的研究可以進一步分析用戶在社會化閱讀平臺上對圖書進行評分時會受到哪些因素的影響及其影響程度。