摘 要〕作者以圖書情報圈子里的32個博客為例,選取博文數(shù)、總訪問數(shù)、熱度值、程度中心度、中介中心度等指標,使用Ucinet軟件進行社會網(wǎng)絡分析,并采用SPSS進行聚類分析,以實證評價圖書情報博客的情況。這是運用社會網(wǎng)絡分析的一些指標和傳統(tǒng)的一些指標評價博客績效。未來還可從內(nèi)容、利用等多方面,采用人工評價與自動評價相結合的方式進行綜合評價。
〔關鍵詞〕博客;評價;社會網(wǎng)絡分析;發(fā)展趨勢
DOI:10.3969/j.issn.1008-0821.2015.11.002
〔中圖分類號〕G203 〔文獻標識碼〕A 〔文章編號〕1008-0821(2015)11-0013-05
Empirical Evaluation of Blog About Library and Information
Wang Yihua
(Institute of Scientific and Technical Information,Zhengzhou University,Zhengzhou 450001,China)
〔Abstract〕The paper selected 32 individual blogs in the LIS blogosphere as an example,used five indicators(post number,total number of visits,the heat value of the degree of centrality,betweenness centrality degree),and obtained an empirical evaluation of the performance of LIS blog using Ucinet software for social network analysis and using SPSS for cluster analysis.There is the use of social network analysis indicators and some traditional performance indicators to evaluate the blog.In the future,adding other aspects of blogs such as the content,the use in evaluating the blogs,the paper can make the best use of comprehensive evaluation combined with subjective evaluation and automatic evaluation.
〔Key words〕blog;evaluation;social network analysis;development trend
博客分組織博客、個人博客。博客評價可促進寫博的積極性,提高博客的質(zhì)量。在CNKI進行以主題“博客”+主題“評價”檢索,采用當時武漢大學(目前在清華大學任教)沈陽博士的ROST軟件進行語義網(wǎng)絡分析。
語義網(wǎng)絡分析是“博客評價”的概念地圖,能刻畫出“博客評價”的內(nèi)涵。如圖1所示,主要詞簇是“模型”、“方法”、“用戶”、“影響力”,它們圍繞“評價”分布。中文比較有代表性的文獻有:朱麗、呂本富、彭賡采用AHP法對個人博客影響力從博客日志質(zhì)量、博客作者權威性、博客的互動性進行評價[1]。邱均平、徐蓓、李江基于PageRank算法從實質(zhì)性鏈接的角度對博客進行評價[2]。邱均平、于長福、馬瑞敏采用社會網(wǎng)絡法探求圖林博客圈中的核心博客[3]。張曉陽、李曉亮采用類h指數(shù)對科學網(wǎng)博客影響力進行評價[4]。常娥、魏彬以圖情博客為例構建了網(wǎng)絡原生數(shù)字資源評價指標體系,包括文章總數(shù)、瀏覽次數(shù)、回帖數(shù)、鏈接情況、發(fā)文頻率等8個指標[5]。嚴煒煒采用9個維度25個指標構建微博客服務質(zhì)量評價模型[6]。
對外文文獻采用以主題“Blog evaluation”在Web of Knowledge檢索,采用ROST英語詞頻統(tǒng)計軟件進行詞頻統(tǒng)計,然后以ROST CM標簽云的形式展現(xiàn)。
標簽云(Tag Cloud)字號的大小一般是根據(jù)單詞的出現(xiàn)頻率相關,單詞的出現(xiàn)頻率越高則字號越大。從上述標簽云圖2可知,博客評價的熱點在于retrieval(檢索)、extract(抽取)、internet(因特網(wǎng))、software(軟件)、cluster(聚類)、semantic(語義的)、wiki(維基)、algorithm(算法)、splog(垃圾博客)、spam(垃圾信息)、blogosphere(博客圈)、rss(信息聚合)、forum(論壇)、criteria(標準)、vlog(視頻博客)。也就是說,主要圍繞博客評價的標準、
博客評價的算法、博客評價的工具而展開的。
外文比較有代表性的文獻有:Li Jianjiang基于文本觀點分析構建博客熱度模型。該模型不僅考慮了博客主題的有關綜述和評論的數(shù)量以及出版時間,而且還側重于評論的傾向[7]。Tan Luke Kien-Weng、Na Jin-Cheon、Theng Yin-Leng通過博客特征分析,內(nèi)容分析和社區(qū)標識檢測帖子在博客圈的影響[8]。Nakajima Shinsuke基于博客的知識水平進行以信譽為本的博客排名[9]。Juffinger Andreas、Granitzer Michael、Lex Elisabeth通過利用已驗證的內(nèi)容對博客按可信度排名。具體做法是首先比較博客和參考語料集的數(shù)量結構;然后,分析每一個單獨的博客內(nèi)容,檢查與核實的新聞語料的相似性。根據(jù)內(nèi)容相似值的差異,作者對博客進行排名[10]。endprint
1 實證研究
e線圖情是北京雷速科技有限公司的產(chǎn)品,是面向圖情界和個人提供集數(shù)據(jù)庫服務、深度研究、專業(yè)咨詢于一體的專業(yè)網(wǎng)站,下設海外、國內(nèi)、學者、熱點、專題、論文等多個版塊,欄目內(nèi)容豐富,有20多個,如風云人物、行業(yè)聚焦、國際動態(tài)、圖情要聞、e線速遞、行業(yè)協(xié)會、圖情機構、理論技術、研究報告、圖書館建設等(http:∥www.chinalibs.net/jieshao.aspx)。筆者從“e線圖情”中博客導航(http:∥www.chinalibs.net/bkjh/Index.aspx)選擇部分有代表性的個人博客,并參考有關專家的建議,最終確定圖書情報圈子里的32個博客作為分析樣本(參見表1)。這些圖情博客的博主大部分是圖情教師或圖書館工作人員。這些比較有名的博客來自于新浪博客(http:∥blog.sina.com.cn/)、科學網(wǎng)博客(http:∥blog.sciencenet.cn/)、百度空間(http:∥hi.baidu.com/)、博客網(wǎng)(http:∥www.bokee.com/)。其中,新浪網(wǎng)博客是2005年開放,是全國主流、人氣頗高的博客頻道之一(http:∥baike.baidu.com/),其上的圖林博客圈非常有名(http:∥q.blog.sina.com.cn/library/);科學網(wǎng)博客是中國科學報社主辦的綜合性科學網(wǎng)站科學網(wǎng)(http:∥www.sciencenet.cn)下屬的一個頻道,主要是針對科學家的實名博客(http:∥bbs.sciencenet.cn/);百度空間是一個輕松記錄、分享生活的內(nèi)容社區(qū);博客網(wǎng)是方興東發(fā)起成立的知識門戶網(wǎng)站,因成立于2002年時間早,號稱“中國博客的發(fā)源地”。
本文以圖書情報圈子里的這些個人博客為例,探討圖書情報博客的情況,以便促進圖書情報界博主博客寫作的積極性,提高博客的質(zhì)量。以當年還在寫博文的博客、有訪問量統(tǒng)計的博客為例研究,因此一些名博如平凡博客、圖謀不軌、老槐因關博而未進行統(tǒng)計。
因為5個指標的“量綱不同”,因此需要進行歸一化處理。某指標得分歸一值=該指標得分值/該類數(shù)據(jù)中該指標的最大值。
基本原理:
(1)熱度值=總訪問數(shù)/博文數(shù)
(2)中心度[11-12]:程度中心性(Degree Centrality)與中介中心性(Betweenness Centrality)是計算一個人在一個團體網(wǎng)絡中最重要的兩項指標。程度中心性衡量一個人作為中心人物的能力,中介中心性衡量一個人作為中介性的能力。
標準化程度中心度:
CD(ni)=∑jXjig-1
(1)
Xji是0或1的數(shù)值,代表i與j是否有關系。g代表此網(wǎng)絡中的人數(shù)。
標準化中介中心性:
CB(ni)=2∑jkgjk(ni)/gjk(g-1)(g-2)
(2)
gjk代表j達到k的捷徑數(shù),gjk(ni)代表j達到k的快捷方式上有i的快捷方式數(shù),g代表此網(wǎng)絡中的人數(shù)。
本文使用Ucinet(http:∥faculty.ucr.edu/~hanneman/net)進行社會網(wǎng)絡分析,分析圖情博客各個博主之間的社會網(wǎng)絡關系。分析結果見圖3。
(3)聚類分析
采用SPSS進行聚類分析。最后聚類4類:許培揚、趙星各一類、武夷山、圖謀、滄浪水為一類、其余為另一類(見圖4)。
說明:①有的博客搬了幾次家,以新家為準。所以,統(tǒng)計數(shù)據(jù)僅供參考。②有的博主有幾個博客,這里以其中的一個進行介紹。比如,在本文僅對圖謀的博客網(wǎng)上的(http:∥libseeker.bokee.com/)進行了分析。③把某博客與其他博客直接鏈接的,規(guī)定為1,否則為0。④這是以這些博客為例計算的中心度,如果樣本數(shù)不同,也許結果會有所差異。⑤這些博客服務商分別為新浪博客(http:∥blog.sina.com.cn/)、科學網(wǎng)博客(http:∥blog.sciencenet.cn/)、百度空間(http:∥hi.baidu.com/)、博客網(wǎng)(http:∥www.bokee.com/)。
2 小結與體會
第一,鏈接工具對于博客評價非常重要。在評價博客甚至網(wǎng)站時,如果有一個或者一些好的評價工具,這對評價而言實用而高效。在文獻調(diào)研中,發(fā)現(xiàn)以前一些文獻中采用的鏈接工具如AllTheWeb已不存在(雅虎于2011年4月4日關閉搜索引擎AlltheWeb),有的軟件如測試可訪問性的Bobby軟件因為研發(fā)該軟件的公司被兼并,它現(xiàn)在已經(jīng)消失了。此外,現(xiàn)存的自動評價工具還不完善,結果不很穩(wěn)定,效果也不太理想??傊容^穩(wěn)定可靠的搜索引擎對于博客評價是非常重要的。
第二,本文僅是起一個拋磚引玉之作用。本文未考慮如下因素:博客評論、博客留言、鏈接訪問、鏈接篇數(shù)、文章訪問、反向鏈接(是指其他網(wǎng)站指向本網(wǎng)站的鏈接)、被推薦貼等等因素。再者,未分原創(chuàng)還是轉載。將來還可從內(nèi)容、利用等方面進行綜合評價,綜合采用人工評價與自動評價相結合。并可用百葉窗圖進行可視化顯示,某博客的某一優(yōu)劣勢一目了然。比如分析幾個博客內(nèi)容如武夷山與許培揚、書間道與圖謀等等。
第三,本文以博文數(shù)、總訪問數(shù)、熱度值、程度中心度、中介中心度五項指標采用聚類評價,也就是說,運用社會網(wǎng)絡分析的一些指標和傳統(tǒng)的一些指標來評價博客的績效,是一次有益的嘗試和探索。評價是一個“仁者見仁、智者見智”的問題。在參考有關文獻的基礎上[13-15],可以說比較好的方法是定性方法和定量方法相結合。如何更科學合理的評價博客還有很大的探索空間,尚有許多方面有待在今后的深入研究中繼續(xù)補充和完善。
參考文獻
[1]朱麗,呂本富,彭賡.基于AHP法的個人博客影響力評價方法研究[J].數(shù)學的實踐與認識,2008,(15):109-117.endprint
[2]邱均平,徐蓓,李江.BlogRank算法及其在圖書館博客中的應用[J].圖書情報知識,2008,(1):68-71,77.
[3]邱均平,于長福,馬瑞敏.圖林博客的社會網(wǎng)絡分析[J].圖書情報工作,2008,(11):6-9.
[4]張曉陽,李曉亮.科學家博客h指數(shù)評價及其相關性分析[J].圖書情報工作,2010,(2):66-69.
[5]常娥,魏彬.網(wǎng)絡原生數(shù)字資源優(yōu)選與評價研究[J].情報雜志,2012,(2):163-167.
[6]嚴煒煒.用戶滿意度視角下微博客服務質(zhì)量評價模型研究[J].圖書情報工作,2011,(18):53-56.
[7]Li Jianjiang;Zhang Xuechun;Weng Yu;等.Blog Hotness Evaluation Model Based on Text Opinion Analysis[J].Eighth IEEE International Conference on Dependable,Autonomic and Secure Computing,Proceedings,2009:235-240.
[8]Tan Luke Kien-Weng;Na Jin-Cheon;Theng Yin-Leng.Influence detection between blog posts through blog features,content analysis,and community identity[J].Online information review,2011,35(3):425-442.
[9]Nakajima Shinsuke;Zhang Jianwei;Inagaki Yoichi etal.Blog Ranking Based on Bloggers Knowledge Level for Providing Credible Information[J].Lecture Notes in Computer Science,2009,5802:227-234.
[10]Juffinger Andreas;Granitzer Michael;Lex Elisabeth.Blog Credibility Ranking by Exploiting Verified Content[J].WICOW 09,2009:51-58.
[11]Borgatti,SP.,Everett,MG.and Freeman,LC.Ucinet for Windows:Software for Social Network Analysis[M].Harvard,MA:Analytic Technologies,2002.
[12]羅家德.社會網(wǎng)分析講義(第2版)[M].北京:社會科學文獻出版社,2010.
[13]王一華.國內(nèi)外網(wǎng)站評價研究綜述[J].情報科學,2013,(11):125-132.
[14]王一華.基于超效率DEA的網(wǎng)站績效評價[J].情報科學,2012,(9):1371-1375,1384.
[15]郝曉玲,杜沁怡,黃海量.企業(yè)家微博影響力的綜合評價研究[J].情報科學,2015,(3):95-101.
(本文責任編輯:孫國雷)endprint