劉媞媞
(泰山醫(yī)學(xué)院,山東 泰安 271016)
鏈接分析是網(wǎng)絡(luò)計(jì)量學(xué)的一個(gè)重要方法,是文獻(xiàn)計(jì)量學(xué)中引文分析方法在網(wǎng)絡(luò)中的應(yīng)用。大學(xué)網(wǎng)站評(píng)價(jià)是目前網(wǎng)絡(luò)計(jì)量學(xué)研究領(lǐng)域的一個(gè)熱點(diǎn),它不僅是綜合評(píng)估大學(xué)網(wǎng)站建設(shè)的方法,也是整個(gè)鏈接分析領(lǐng)域的組成部分。網(wǎng)站質(zhì)量的優(yōu)劣、網(wǎng)絡(luò)流量和鏈接數(shù)據(jù)從側(cè)面反映著群眾對(duì)高校網(wǎng)站內(nèi)容的關(guān)注度。為此,對(duì)山東省高校網(wǎng)站的排名與相應(yīng)的網(wǎng)站鏈接特征進(jìn)行相關(guān)研究,初步分析這些問題,為進(jìn)一步深入研究和揭示其中的規(guī)律奠定基礎(chǔ)。
選取山東省綜合排名前32位的大學(xué)作為研究對(duì)象,對(duì)網(wǎng)站流量數(shù)據(jù)中的人均頁面瀏覽量、日均IP訪問量和網(wǎng)絡(luò)鏈接中的網(wǎng)頁總數(shù)、鏈接總數(shù)、外部鏈接數(shù)以及反向鏈接數(shù)幾個(gè)鏈接數(shù)據(jù)作了相關(guān)研究,分析了相互間的相關(guān)性,各數(shù)據(jù)間的聯(lián)系和影響,并對(duì)傳統(tǒng)的網(wǎng)絡(luò)影響因子與鏈接數(shù)據(jù)的相關(guān)性作了研究。
根據(jù)國(guó)內(nèi)學(xué)者對(duì)網(wǎng)絡(luò)計(jì)量工具的研究[1-3],經(jīng)過反復(fù)實(shí)驗(yàn)和分析測(cè)試,考慮數(shù)據(jù)的可靠性和有效性,最終選定Alexa作為流量統(tǒng)計(jì)工具,AltaVista作為鏈接數(shù)據(jù)收集工具。
以山東大學(xué)為例,AltaVista的檢索指令如下:
網(wǎng)頁總數(shù) =site:www.sdu.edu.cn
鏈接總數(shù) =link:www.sdu.edu.cn
外部鏈接數(shù) =must include www.sdu.edu.cn in the link to url and must not include www.sdu.edu.cn in the url
1.3.1 流量指標(biāo) 人均頁面瀏覽量是指每個(gè)用戶在一次訪問時(shí)間內(nèi)所瀏覽的該網(wǎng)絡(luò)信息資源的網(wǎng)頁數(shù)。人均頁面瀏覽量和人均訪問時(shí)間是衡量網(wǎng)絡(luò)信息資源的‘黏性’指標(biāo)。但是目前階段,人均訪問時(shí)間并不能夠準(zhǔn)確的獲取。所以,采用人均頁面瀏覽量相對(duì)于人均訪問時(shí)間來講,作為研究指標(biāo)更為合理。IP訪問量是指在指定的有效時(shí)間內(nèi)有多少不同IP訪問過該網(wǎng)站,即同一個(gè)IP在指定時(shí)間段內(nèi)對(duì)網(wǎng)絡(luò)信息資源的訪問只記作一次。
1.3.2 網(wǎng)絡(luò)鏈接指標(biāo) 網(wǎng)頁總數(shù)是網(wǎng)站收錄頁面的數(shù)量,網(wǎng)頁總數(shù)代表了一個(gè)網(wǎng)站的規(guī)模,體現(xiàn)了一個(gè)網(wǎng)站對(duì)外展示的能力和內(nèi)容豐富度。
鏈接總數(shù)是網(wǎng)站內(nèi)部含有的網(wǎng)絡(luò)鏈接的總量,是衡量網(wǎng)站鏈接數(shù)量特征最重要的指標(biāo)之一。從理論上來說,一個(gè)網(wǎng)站的鏈接總數(shù)應(yīng)該是自鏈數(shù)(selflink)和出鏈數(shù)(outlink)的數(shù)量之和。構(gòu)建一個(gè)網(wǎng)站采用的是何技術(shù)是影響網(wǎng)站總鏈接數(shù)的重要因素之一。一般來講,在網(wǎng)站各方面指標(biāo)、技術(shù)水平相同的條件下,一個(gè)網(wǎng)站的鏈接總數(shù)越多,網(wǎng)絡(luò)信息的組織結(jié)構(gòu)就越加完備,信息內(nèi)容揭示的程度就越高。
外部鏈接數(shù)指的是針對(duì)搜索引擎,與其他站點(diǎn)所做的友情鏈接的數(shù)量。高質(zhì)量的外部鏈接指:與一個(gè)網(wǎng)站建立鏈接的網(wǎng)站知名度高,訪問量大,同時(shí)相對(duì)的外部鏈接較少,有助于快速提升該網(wǎng)站的知名度和排名的其他網(wǎng)站的友情鏈接。
反向鏈接又被稱為鏈接廣泛度,即網(wǎng)絡(luò)中其他站點(diǎn)對(duì)自身站點(diǎn)投的支持票;反向鏈接數(shù)量越多,站點(diǎn)具備的價(jià)值越高,受到搜索引擎及用戶的重視也就越多。
網(wǎng)絡(luò)影響因子(web impact factor,WIF)是指在某一時(shí)間,來源于外部和自身內(nèi)部的指向特定國(guó)家或網(wǎng)站的網(wǎng)頁數(shù)與該網(wǎng)頁或網(wǎng)站中的網(wǎng)頁數(shù)之比”。
網(wǎng)絡(luò)影響因子的計(jì)算公式借鑒了期刊影響因子的計(jì)算方法,但是,研究發(fā)現(xiàn),電子期刊的鏈接與傳統(tǒng)的文獻(xiàn)引用有極大的差異性,受網(wǎng)絡(luò)地址變更、網(wǎng)絡(luò)鏈接失效、電子文獻(xiàn)編輯方式等元素的影響,WIF也很難實(shí)現(xiàn)十分準(zhǔn)確的計(jì)算。因此,以入鏈作為評(píng)價(jià)網(wǎng)絡(luò)影響力的標(biāo)準(zhǔn)更為準(zhǔn)確。
雖然對(duì)WIF的計(jì)算方式仍然存在爭(zhēng)議,但它仍然是目前階段應(yīng)用最為廣泛的網(wǎng)絡(luò)影響力評(píng)價(jià)指標(biāo),它不僅揭示了網(wǎng)絡(luò)信息資源被利用的程度,同時(shí)也消除了網(wǎng)站規(guī)模對(duì)自身評(píng)價(jià)的影響。
應(yīng)用SPSS13.0統(tǒng)計(jì)分析軟件處理數(shù)據(jù)。調(diào)查數(shù)據(jù)用絕對(duì)數(shù)及相對(duì)數(shù)表示。變量間的相關(guān)性用Kendall和Spearman兩種方法進(jìn)行相關(guān)分析。以P≤0.05為差異有統(tǒng)計(jì)學(xué)意義。
本研究各指標(biāo)數(shù)據(jù)收集結(jié)果如表1所示,數(shù)據(jù)所屬時(shí)間:2011年3月10日至3月12日。
表1 山東高校網(wǎng)站流量和鏈接數(shù)量表
本研究對(duì)網(wǎng)絡(luò)影響因子采用了兩種計(jì)算方式,即指向“網(wǎng)站的總鏈接數(shù)”和“外部鏈接數(shù)”與“該網(wǎng)站總網(wǎng)頁數(shù)”之比,分別用E-WIF和T-WIF表示:
根據(jù)兩種不同計(jì)算方式得出的高校網(wǎng)站網(wǎng)絡(luò)影響因子見表1。去除了山東中醫(yī)藥大學(xué)、濰坊醫(yī)學(xué)院、煙臺(tái)師范學(xué)院、濱州醫(yī)學(xué)院等無效數(shù)據(jù)。
2.2.1 山東高校網(wǎng)站鏈接相關(guān)性分析 對(duì)鏈接數(shù)據(jù)使用非參數(shù)相關(guān)分析統(tǒng)計(jì)方法[6-7]。主要分析各個(gè)鏈接數(shù)間的變化情況和變量間的相關(guān)性。結(jié)果如表2。
表2 山東高校網(wǎng)站鏈接數(shù)相關(guān)性(n=27)
從表2中斯皮爾曼和肯德爾相關(guān)性分析可以看出:(1)網(wǎng)頁總數(shù)與總鏈接數(shù)的斯皮爾曼相關(guān)系數(shù)為0.919,肯德爾相關(guān)系數(shù)為0.836,網(wǎng)頁總數(shù)高的網(wǎng)站其總鏈接數(shù)也越高。網(wǎng)頁總數(shù)與網(wǎng)站總鏈接數(shù)的斯皮爾曼和肯德爾假設(shè)檢驗(yàn)值P均小于0.001,是否定假設(shè),即網(wǎng)頁總數(shù)和網(wǎng)站總鏈接數(shù)是高度相關(guān)的。(2)網(wǎng)頁總數(shù)與外部鏈接數(shù)的斯皮爾曼相關(guān)系數(shù)為0.196,肯德爾相關(guān)系數(shù)為0.140,網(wǎng)頁總數(shù)與外部鏈接數(shù)的相關(guān)系數(shù)低于0.3,基本沒有相關(guān)性。說明一個(gè)網(wǎng)站對(duì)用戶的吸引力不是取決于網(wǎng)站網(wǎng)頁數(shù)量的多少,而是在于網(wǎng)頁的內(nèi)容質(zhì)量。(3)總鏈接數(shù)和外部鏈接數(shù)間的斯皮爾曼相關(guān)系數(shù)為0.209,肯德爾相關(guān)系數(shù)為0.154,均低于0.3,基本沒有相關(guān)性。朱自強(qiáng)對(duì)國(guó)內(nèi)重點(diǎn)大學(xué)的研究顯示,重點(diǎn)大學(xué)的總鏈接數(shù)與外部鏈接數(shù)存在著高度相關(guān)性[8]。這體現(xiàn)出省內(nèi)絕大部分高校網(wǎng)站與全國(guó)重點(diǎn)大學(xué)網(wǎng)站存在的差異性。除了省內(nèi)極少重點(diǎn)大學(xué)被外界所知,絕大多數(shù)省內(nèi)大學(xué)的受關(guān)注度較低,這就影響其他網(wǎng)站對(duì)省內(nèi)網(wǎng)站的作出引用鏈接,因此外部鏈接數(shù)就相對(duì)較少。
通過相關(guān)性分析,山東省高校網(wǎng)站的網(wǎng)頁總數(shù)與總鏈接數(shù)有著非常顯著的統(tǒng)計(jì)學(xué)意義,其他數(shù)據(jù)間不存在相關(guān)關(guān)系。
2.2.2 山東高校網(wǎng)絡(luò)影響因子分析 表3為網(wǎng)絡(luò)影響因子高校網(wǎng)站流量的相關(guān)性分析。
表3 網(wǎng)絡(luò)影響因子與流量相關(guān)性(n=27)
高校的人均頁面瀏覽量和日均訪問量體現(xiàn)了該校的被關(guān)注程度,但是從表3網(wǎng)絡(luò)影響因子和流量相關(guān)性上可以看出,傳統(tǒng)的計(jì)算網(wǎng)絡(luò)影響因子的方法與這種表現(xiàn)卻不存在相關(guān)性。因此,可以認(rèn)為,在省內(nèi)高校的網(wǎng)站評(píng)價(jià)研究上,傳統(tǒng)網(wǎng)絡(luò)影響因子的計(jì)算不能用來評(píng)價(jià)某個(gè)高校的網(wǎng)站情況。
對(duì)高校網(wǎng)站流量和反向鏈接做相關(guān)性分析,結(jié)果如表4所示。
表4 高校網(wǎng)站流量與反向鏈接相關(guān)性(n=27)
由表4可以看出,高校流量的日均IP訪問量與反向鏈接數(shù)的斯皮爾曼相關(guān)系數(shù)為0.607,肯德爾相關(guān)系數(shù)為0.451,即省內(nèi)高校網(wǎng)站的日均IP訪問量與反向鏈接基本上是中度相關(guān)的。人均頁面瀏覽量與反向鏈接數(shù)的斯皮爾曼相關(guān)系數(shù)為0.105,肯德爾相關(guān)系數(shù)為0.076,不具有相關(guān)性。人均頁面瀏覽量與日均IP訪問量的斯皮爾曼和肯德爾相關(guān)系數(shù)分別為0.269和0.186,人均頁面瀏覽量與日均IP訪問量不具有相關(guān)性。
日均IP訪問量與反向鏈接的相關(guān)性說明從鏈接的來源角度看,反向鏈接的增加的確給網(wǎng)站帶來了一定數(shù)量的點(diǎn)擊量。這種現(xiàn)象也存在于高校網(wǎng)站中,而這種點(diǎn)擊量并沒有提高瀏覽量的數(shù)值。因此,我們?nèi)匀豢梢詳喽?,高校網(wǎng)站在自身的內(nèi)容建設(shè)方面還有待提高,在獲得用戶的點(diǎn)擊后,能夠吸引用戶對(duì)內(nèi)部網(wǎng)站獲得更多的興趣。
基于上述比較分析,我省高校網(wǎng)站的建設(shè)和信息資源利用上存在一些問題:(1)網(wǎng)站內(nèi)容不夠豐富,網(wǎng)絡(luò)資源利用率不高;(2)網(wǎng)站自身建設(shè)不足;(3)網(wǎng)站學(xué)術(shù)交流不多。
根據(jù)以上幾點(diǎn)問題,提出如下建議:(1)提高我省高校網(wǎng)站的內(nèi)容質(zhì)量和資源利用率。從我省高校網(wǎng)站的入鏈數(shù)來看,被引率普遍偏低,這說明我省高校網(wǎng)站的可利用資源過少。高校在培育人才的同時(shí),也應(yīng)注重網(wǎng)絡(luò)資源的合理利用。借助本校網(wǎng)站收錄豐富的信息資源,提高網(wǎng)站內(nèi)容的質(zhì)量和研究信息,以得到更多的鏈接,提高網(wǎng)站鏈接的廣泛度。(2)重視網(wǎng)站的自身建設(shè)。網(wǎng)站的結(jié)構(gòu)設(shè)計(jì)和內(nèi)容顯示是網(wǎng)絡(luò)自身建設(shè)的重要內(nèi)容。而網(wǎng)絡(luò)信息資源的利用很大程度上取決于網(wǎng)絡(luò)數(shù)據(jù)挖掘的效果。被搜索工具檢索到的程度除了與大學(xué)本身的知名度相關(guān)外,還與內(nèi)因——網(wǎng)站的建設(shè)結(jié)構(gòu)有關(guān)。從網(wǎng)站的鏈接數(shù)據(jù)來看,無論在總鏈接數(shù)還是被鏈接數(shù)上,山東高校的鏈接數(shù)值都是普遍偏低的。因此,各高校在網(wǎng)絡(luò)建設(shè)的時(shí)候應(yīng)注重網(wǎng)站的整體架構(gòu),使搜索引擎對(duì)高校信息搜索的限制降到最低。(3)提高山東高校網(wǎng)站的學(xué)術(shù)影響力。理想情況下,高校網(wǎng)站的影響力是應(yīng)該與高校本身的知名度相關(guān)聯(lián)的。知名度越高,其網(wǎng)站的訪問量越大。而我省高校網(wǎng)站的學(xué)術(shù)性研究?jī)?nèi)容普遍較少,導(dǎo)致訪問量和人均頁面瀏覽量均不多。因此高校在提高網(wǎng)絡(luò)建設(shè)的同時(shí),需加大學(xué)術(shù)性研究數(shù)字化、網(wǎng)絡(luò)化的進(jìn)展。
[1] 邱均平.網(wǎng)絡(luò)計(jì)量學(xué)[M].北京,科學(xué)出版社,2010:203.
[2] 李曉明,閆宏飛,王繼民.搜索引擎——原理、技術(shù)與系統(tǒng)[M].北京:科學(xué)出版社,2005.
[3] 徐家坤.網(wǎng)絡(luò)信息計(jì)量研究中常用的四種搜索引擎的比較研究[J].現(xiàn)代圖書情報(bào)技術(shù),2004,11:46-48.
[4] 段宇峰.網(wǎng)絡(luò)鏈接分析與網(wǎng)站評(píng)價(jià)研究[M].北京:北京圖書館出版社,2005.
[5] 劉艷峰.利用肯德爾和諧系數(shù)檢驗(yàn)測(cè)量結(jié)果的可信度[J].新鄉(xiāng)教育學(xué)院學(xué)報(bào),2006,19(2):95-96.
[6] 安寧寧,韓兆洲.等級(jí)相關(guān)分析的一般方法[J].知識(shí)叢林,2006,11(2):141-142.
[7] 朱自強(qiáng).網(wǎng)絡(luò)信息計(jì)量學(xué)理論與方法——大學(xué)網(wǎng)站網(wǎng)絡(luò)流量及頁面鏈接分析研究[D].江蘇南京理工大學(xué),2005.
山東第一醫(yī)科大學(xué)(山東省醫(yī)學(xué)科學(xué)院)學(xué)報(bào)2011年12期