米云 金英偉
摘要:本研究旨在采用鏈接分析法對出版社網站進行定量分析評價,并據此討論出版社網站建設現存的問題及改善措施。
關鍵詞:網站評價;鏈接分析法;出版社網站建設
1996年美國學者Larson發(fā)表《萬維網的文獻計量:網絡空間結構初探》,揭開了將文獻計量學方法應用于網絡分析的序幕。1997年丹麥學者Peter Ingwersen和Almind首次提出了“網絡計量學”,之后Peter Ingwersen又提出了具有里程碑意義的概念“網絡影響因子”(WIF)。網絡計量學方法是最具代表性的網絡定量分析方法,而鏈接分析法又是網絡計量學方法中最主要的方法。鏈接分析法就是運用網絡數據庫、數學分析軟件等工具,利用數學和情報學方法,對網絡鏈接自身的屬性、鏈接對象、鏈接網絡等進行分析,揭示其數量特征和內在規(guī)律。許多研究表明,鏈接的數量、分布、時效和功能等方面往往與網站的性質、信息量、信息的組織具有相當密切的關系。
一、研究方案設計
因特網(Internet)是由多個網絡互聯而形成的邏輯網絡。超鏈接,即一種文件指針,是這個邏輯網絡最重要的組成部分,因此通過鏈接分析來評價網站、發(fā)現其問題進而指引網站建設就具有較強的說服力。我國網站評價方面的專家學者和組織機構認為網站評價應采用集主、客觀于一體的綜合評價法,但縱觀近十年的相關文獻,可以發(fā)現網站評價中的主觀因素所占比重較大,所使用的一些方法如德爾菲法、層次分析法,Saaty的九標度理論等雖可謂經典,但過多的主觀因素勢必會影響評價結果的權威性。本文研究的出發(fā)點旨在側重定量研究,削弱主觀因素的影響,采用鏈接分析的方法對出版社網站進行評價。
1.研究思路
本研究選取了兩套指標體系,一套是根據通用網站評價指標體系整理得來,該套指標體系包含的指標為網站評價研究的主流指標,大部分為定性指標,如信息全面性、頁面美觀程度等,在指標值獲取過程中帶有較強的主觀性,該套指標將作為對比指標;另一套指標體系選取一系列鏈接分析指標和少量能間接反映網站內部特征和功能的客觀指標,如日均IP訪問量、頁面點擊量PV等,在指標值獲取過程中不帶有主觀性,該套指標將作為研究指標。本研究對兩套指標區(qū)別開來進行評價,即對不同性質的指標采用不同的評價方法,而不是對所有的指標均采用同樣的方法進行評價。首先,利用統計分析軟件SPSS對研究指標進行主成分分析得出網站排名A;然后,用模糊綜合評價法分析對比指標得出網站排名B;最后,消除研究指標數據和對比指標數據間的量綱,再次使用主成分分析法得出綜合排名C。
對比排名A、B、C是否一致,如果一致說明單純使用研究指標數據進行網站評價的結果是可信的,即利用一系列客觀指標對網站進行評價可以排除利用定性指標進行網站評價過程中的因個人知識有限、好惡不同引起的評價偏頗;如果排名不一致則查找原由,進行進一步的分析。
2.對象選取
本研究的研究對象共14家出版社(見數據分析結果討論部分),取自“全國百佳圖書出版單位”,原則上是從社科、科技、大學、教育、古籍、少兒、美術、文藝八大類中每類取兩家,但由于有些類別的出版單位網站用戶量甚少,統計數據不具代表性,如古籍類和美術類,因此分別從這兩類中抽取了用戶量最多的一家網站作為研究對象。
3.指標設置
(1)研究指標的設置
主觀性揭示統計指標的誤差性,客觀性揭示統計指標的一致性,為了保證統計指標的一致性及可信性,在指標選取過程中要盡量消除主觀因素的影響,這對于建立科學的評價指標體系具有重要的意義。設置的指標應能反映鏈接數量特征、網站影響力、網頁重要性等多方面信息,既注重網站自身規(guī)模和信息量涵蓋,又注重外部輻射和鏈接數量,以保證指標選取的全面性。基于上述考慮,研究指標設置如下:
網頁數(Webpages):某網站所包括的全部網頁數目,該指標可從整體上衡量網站的自身規(guī)模及信息含量。
入鏈數(In Links):指向某網站的鏈接總數,包括來自網站外部的鏈接和網站內指向自己的鏈接。該指標是衡量網站鏈接數量最重要的指標之一。
反鏈數(External Links):來自某網站外部的入鏈總數。該指標能很好地反映一個網站的聲譽和外部輻射能力。
網絡影響因子(WIF,Web Impact Factor):WIF=反鏈數/本網站的網頁總數,由于規(guī)模大的網站反鏈數相對較多,所以通過該指標可以消除網站規(guī)模對評價的影響。
蹦失率(Bounce Rate):用戶從一個入口進入某網站,進入后只瀏覽一個頁面便離開本網站的訪問次數占該入口總訪問次數的比例。蹦失率指標可以衡量網站是否具有足夠的吸引力讓用戶深入訪問。
斷鏈率(Link Broken Rate):該指標用來衡量鏈接頁面的有效性、連通性。指標選取的是首頁斷鏈率而不是全站斷鏈率,因為網站首頁涵蓋了到達網站任何一處的入口,用戶使用網站基本上是從首頁開始,而且包括首頁在內的PV量有限,因此沒必要花費巨大精力去獲取全站斷鏈率。
日均IP訪問量(Daily Reach):該指標統計平均每天訪問一個站點的IP數,一天內一個用戶多次訪問也算一個訪問量。
日均PV訪問量(Daily PV):該指標統計平均每天一個站點的頁面瀏覽量,頁面每被刷新或是瀏覽一次算一個PV。
日均訪問時間(Daily Time):該指標統計一個站點每天所有用戶的平均訪問時間,以分鐘為計量單位。
需要說明的是,以上統計指標都是基于節(jié)點層次的概念,只有確定了節(jié)點的層次性,以上指標才具有統計意義,該類節(jié)點是基于網站層的節(jié)點。
(2)對比指標的設置
國內外在網站評價方面的專家學者和組織機構最早對網站評價的研究是從定性評價開始的,之后很長時間人們都專注于網站定性評價指標體系的建立與實證研究,目前定性評價網站的評價方法和指標體系已趨向成熟穩(wěn)定,本文通過總結文獻法和專家調查法相結合的方式確定研究所需的對比指標如圖1所示(其中A為目標層,B、C、D、E為準則層,其余為方案層)。
4.數據獲取
(1)研究指標數據
許多研究表明利用Google來進行中文信息的檢索是合適的,因此本文選擇Google作為主要檢索工具,Altavista用于輔助檢索。
Alexa是全球知名的流量統計網站,除了提供一系列流量指標數據外,Alexa也統計了反映網站信譽和質量的指標,如反鏈數和蹦失率等。用Alexa收集網站信息時,假定全球互聯網用戶為20億,該假定數據來源于國際電信聯盟2011年的統計數據,在此基礎上計算日均IP、日均PV。Google和Alexa是主要的數據獲取工具,另外還會使用一些站長工具作為輔助工具進行數據獲取。
(2)對比指標數據
對比指標數據主要來自問卷調查,調查對象為圖書情報界的多位學者和被研究網站的諸多用戶,調查內容為各級指標的權重和底層指標的具體得分。
二、數據分析
1.主成分分析
主成分分析的核心概念是降低原始數據中的維數,即對于某一個問題同時可以考慮好幾個因素時,并不對這些因素單個處理,而是將它們綜合起來處理,用數據的本身來尋找對全部方差最有影響力的方向,以及第二有影響力的方向等,目的是找到一兩個方向能解釋大部分數據中的變異。
(1)標準化數據,從標準化的數據中提取n個主成分。
(2)計算特征向量,設A為因子負載矩陣,U為特征向量矩陣,λ為特征向量,根據A=U* ,可以計算出每個特征值對應的特征向量,所有特征向量組成特征向量矩陣。
(3)標準化的矩陣與特征向量矩陣相乘即得主成分矩陣,設為第i個主成分,為第i個主成分的特征值,則網站綜合得分Y為:
2.研究指標數據的分析
為了使指標更具有實際意義,本文依據“越大越好”與“越小越好”的原則對收集的原始指標數據進行標準化,其中越大越好的指標為網頁數、入鏈數、反鏈數、外部WIF、日均IP、日均PV和日均訪問時間,“越小越好”的指標為蹦失率和斷鏈率;然后對標準化的數據進行主成分分析。
(1)使用統計分析軟件SPSS 17.0對標準化的數據進行主成分分析,共提取3個主成分。
(2)計算特征向量矩陣X,結果如下:
(3)網站綜合得分為:
其中
3.對比指標數據的分析
(1)層次分析法確定指標權重
本研究給圖書情報界的多位學者發(fā)送電子版調查問卷,邀請他們對網站指標的重要性進行打分,得分上線 為5分,下線為1分。統計有效問卷的指標重要性最高得分為5分,最低得分為2.07分,依次為指標B2和指標D3,差值為2.93分。將差值平均劃分為八個區(qū)間,起始數值0和各個區(qū)間所對應的數字依次為1到9的Saaty值,根據轉化后的Saaty九標度衡量表構造判斷矩陣,求各個判斷矩陣的最大特征值和特征向量,然后進行一致性檢驗和指標權重確定,經檢驗各矩陣的隨機一致性比率CR均小于0.1,說明數據具有滿意的一致性,可進一步進行綜合評價。
(2)模糊綜合評價
采用用戶調查法對各指標進行打分,標準同指標重要性的打分標準,最后對有效問卷進行統計,由于篇幅有限,對比指標的具體得分情況表未列出。設 為方案層的權重向量,W為準則層的權重向量,B、C、D、E 為方案層指標的得分矩陣。
4.綜合數據的分析
將研究指標數據和對比指標數據綜合進行分析,方法同研究指標數據的分析,依據“越大越好”“越小越好”的原則消除兩部分數據間的量綱,進而進行主成分分析,得出四個主成分,則網站綜合得分為:
其中
5.數據分析結果討論
通過上述數據分析,所選出版社網站的分析評價結果如表1所示。根據結果可知,研究指標數據、對比指標數據和綜合數據的評價結果大體呈一致性,只有較少網站的排名有微小變動,說明本研究選取的一系列基于鏈接分析的網站評價指標是合理的,利用其進行網站評價的可靠性也通過通用網站評價指標、評價方法得到了驗證。顯示本研究對網站進行定量評價不但操作簡單,而且基本消除了因個人知識有限、好惡不同引起的評價偏頗。
三、結論與建議
通過本研究發(fā)現,國內出版社網站雖不斷發(fā)展,但是不少網站的運行質量和效率令人堪憂。很多網站僅僅是實體出版機構的網絡名片,其質量水平、服務效率、用戶滿意度等大多未得到足夠的重視,除了一部分大型出版社網站、與計算機專業(yè)相關的出版社網站較為成熟和完善,很多中小型出版社網站的建設還停留在比較初級的水平上,各類問題逐漸凸顯:一是內容簡單、信息陳舊是出版社網站存在的最主要問題。如讀者在新書推薦板塊找不到該社最新出版的圖書,還有一些重點推薦書目連內容簡介都沒有。二是網站的服務意識薄弱。大多數出版社僅僅將網站作為圖書產品宣傳的場所,沒有其他的特色服務,如電子商務服務等等。三是網站風格雷同。很多出版社擔心網站的建立和維護在人力、物力和財力上投入過大,因此將網站的建立與維護工作委托給第三方機構以節(jié)省開支,同一家機構可能承擔多個出版社網站的建立與維護工作。另外很多出版社對網站建設并未給予足夠重視,網站風格內容簡單借鑒其他出版社網站。從而導致網站內容更新不及時、風格雷同現象的發(fā)生。四是網站互動性差。由于出版社網站建設人員缺乏,提供給用戶交流的空間多僅限于e-mail,諸如論壇等方式在出版社網站中則很少應用;網站后期維護不及時導致很多斷鏈、死鏈的發(fā)生也是很多出版社網站存在的問題。
在出版業(yè)走向數字化和網絡化的大趨勢下,各出版社應面向未來認真開展網站建設,作為打造自己的品牌、增強未來競爭力的強有力手段之一。一是各出版社應對自己的網站給予足夠的重視,不僅要精心設計頁面,還要建立完備的信息系統,且及時更換和補充新內容以吸引更多的用戶。二是出版社需正確看待網站建設在人力、物力、財力上投入與產出的暫時不平衡性,堅信網絡建設將會發(fā)揮更加關鍵的作用,在網站的建設與維護上提供足夠的投入,避免或者是減少網站風格雷同、后期維護不到位現象的發(fā)生。三是特色服務很重要,每個出版社都有自己的強項和優(yōu)勢,出版社可以通過自己的網站把獨有的強項和優(yōu)勢以增值服務的形式展現給用戶,以贏得更多客戶對本社的信任感和依賴感,并最終提高整體績效。如牛津大學出版社就是充分利用其工具書和專業(yè)詞典出版的強項,將這些產品電子化后放在網站供讀者免費使用,這一特色服務大大提高了牛津大學出版社的競爭力。四是出版社網站應提供功能完善的用戶交流板塊,如設置作者論壇、讀者論壇、出版社的選題創(chuàng)意論壇等,只有增強網站的互動性才能真正提高讀者、作者及市場對出版社的關注度,進而進一步提升出版社的品牌形象,加強客戶的忠誠度。
網站作為出版社21世紀新的形象標志與運營平臺,在出版數字化轉型中的作用日益凸顯,而網站分析評價研究是指導出版社網站建設的重要依據。后續(xù)研究重點應著重構建一套完善而專業(yè)的出版社網站評價體系,以對出版社網站建設進行更為系統、更為客觀有效的評價。
(米云系大連理工大學管理與經濟學部碩士研究生;金英偉系大連理工大學出版社社長、博士生導師。)
參考文獻:
[1] Larson R R. Bibliometrics of the world wide web : an exploratory analysis of the intellectual structure of cyberspace. Proceedings of the American Society for Information Science(ASIS) 59th Annual Meeting,1996.
[2] 董江山,胡吉祥,邱均平.鏈接分析法及其應用[J].情報科學,2004 (9).
[3] 王知津,鄭紅軍.網站評價中的樣本選取及鏈接測度[J].圖書與情 報,2006(3).
[4] 喬文妤.中外音樂學院網站質量評價研究——以鏈接分析為方法 [J].情報探索,2010(2).
[5] 張洋,趙蓉英.網絡連接分析的基本術語及其規(guī)范化[J].圖書情報 工作,2007(9).
[6] Thelwall M. Comparison of sources of links for academic web impact factor calculations[J].Journal of Documentation,2002(1).
[7] 姚磊.網絡鏈接分析的鏈接層次分類[J].情報探索,2008 (7).
[8] 李春平,楊益民.主成分分析法和層次分析法在對綜合指標進行定 量評價中的比較[N].南京財經大學學報,2005 (6).
[9] 賴國毅,陳超.SPSS 17中文版統計分析典型實例精粹[M].北京:電子 工業(yè)出版社,2010.
[10] 王知津,李明珍.網站評價指標體系的構建方法與過程[J].圖書與情報,2006 (3).