蘇芳荔
(鄭州航空工業(yè)管理學(xué)院信息科學(xué)系,河南 鄭州 450015)
近年來(lái),期間我國(guó)政府網(wǎng)站建設(shè)成效顯著,截至2009年底,我國(guó)政府域名(GOV.CN)注冊(cè)量達(dá)到49730個(gè)[1]。數(shù)量如此龐大的網(wǎng)站,質(zhì)量卻參差不齊,因此網(wǎng)站健康度檢查(Website Health Check)這一概念便被提出。網(wǎng)絡(luò)信息計(jì)量方法在網(wǎng)站健康度檢查中得到了廣泛應(yīng)用,尤其是鏈接分析法,能夠從結(jié)構(gòu)角度對(duì)網(wǎng)站健康度作出判斷,并為網(wǎng)站設(shè)計(jì)提供建議。
河南省的電子政務(wù)發(fā)展和政府網(wǎng)站建設(shè)在國(guó)內(nèi)一直處于中等水平,2010年1月國(guó)務(wù)院信息辦發(fā)布的《2009年中國(guó)政府網(wǎng)站績(jī)效評(píng)估報(bào)告》顯示,2009年河南省在省級(jí)政府網(wǎng)站績(jī)效得分排名中居第18位,在地市級(jí)政府網(wǎng)站績(jī)效得分排名中僅有6個(gè)城市居前100位[2]。筆者將以河南省所轄18個(gè)市級(jí)政府的門戶網(wǎng)站為對(duì)象進(jìn)行健康度檢查測(cè)評(píng),以期能夠掌握各地市政府門戶網(wǎng)站的建設(shè)現(xiàn)狀,認(rèn)清發(fā)展中存在的問(wèn)題和不足,為日后網(wǎng)站的優(yōu)化和完善提供依據(jù)。
國(guó)外專門的網(wǎng)站健康度研究處于起步階段,相關(guān)內(nèi)容及提法散見(jiàn)于論文案例和部分工具之中。國(guó)內(nèi)對(duì)于網(wǎng)站健康度的研究也只局限于網(wǎng)站評(píng)價(jià)中,有一部分工具能夠針對(duì)網(wǎng)站健康度檢查進(jìn)行優(yōu)化,但總的來(lái)說(shuō),仍沒(méi)有形成一個(gè)完整的理論體系。網(wǎng)站健康度的確切內(nèi)涵是什么,目前也沒(méi)有一個(gè)正式的定義,但大致可以從以下幾個(gè)角度來(lái)理解。
網(wǎng)絡(luò)影響力(Web Impact)是網(wǎng)站健康度的一項(xiàng)重要指標(biāo),主要體現(xiàn)在網(wǎng)絡(luò)鏈接方面。網(wǎng)絡(luò)鏈接的作用是組織網(wǎng)絡(luò)信息,表達(dá)其間的關(guān)系?!叭腈湐?shù)”可以作為評(píng)價(jià)網(wǎng)站網(wǎng)絡(luò)影響力的指標(biāo)[3]。M.Thelwall在《LinkAnalysis:An Information Science Approach》一書(shū)中對(duì)西班牙的64所大學(xué)網(wǎng)站進(jìn)行了健康度檢查,他從鏈接的角度進(jìn)行分析,度量的指標(biāo)包括:網(wǎng)站規(guī)模、網(wǎng)站入鏈數(shù)、網(wǎng)站出鏈數(shù)、網(wǎng)站指向的頂級(jí)域名分布等[4]。
網(wǎng)絡(luò)影響力的另一體現(xiàn)是網(wǎng)絡(luò)流量(Network traffic)指標(biāo)??梢詮?個(gè)方面來(lái)度量網(wǎng)絡(luò)流量:①訪問(wèn)人數(shù),指在某一時(shí)刻或時(shí)間段中,瀏覽該網(wǎng)站的人數(shù);②網(wǎng)站訪問(wèn)量,指該網(wǎng)站一段時(shí)間內(nèi)被用戶訪問(wèn)的總的頁(yè)面數(shù)[5];③人均訪問(wèn)頁(yè)面數(shù),指每個(gè)用戶在一次訪問(wèn)時(shí)間內(nèi)所瀏覽或獲取的該網(wǎng)站的網(wǎng)頁(yè)數(shù)。
網(wǎng)站可見(jiàn)度(Website visibility)是網(wǎng)站健康度的另一個(gè)重要指標(biāo),它是指特定網(wǎng)站中的信息被搜索引擎獲取和索引的數(shù)量,一般以頁(yè)面數(shù)作為計(jì)量單位[6]。根據(jù)《第25次中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》顯示,目前3.84億網(wǎng)民中使用搜索引擎的比例是73.3%。由此可見(jiàn),網(wǎng)站對(duì)于搜索引擎是否可見(jiàn),可見(jiàn)度高低,都直接影響著它的使用率,因此,網(wǎng)站可見(jiàn)度也成為網(wǎng)站健康度的一項(xiàng)重要指標(biāo)。
網(wǎng)站權(quán)威度(Page Strength)可理解為網(wǎng)站的重要性值、信任級(jí)別或者強(qiáng)度。PR值(PageRank)是一個(gè)典型的網(wǎng)站權(quán)威度指標(biāo),它可以反映一個(gè)網(wǎng)站被Google引擎收錄的狀況。一般來(lái)說(shuō),具有較高PR值的網(wǎng)站會(huì)有較高的健康度。但PR值不是網(wǎng)站權(quán)威度的唯一指標(biāo),SEOmoz開(kāi)發(fā)出一個(gè)測(cè)量網(wǎng)站權(quán)威度的工具,即trifecta,它能給出網(wǎng)站一個(gè)分?jǐn)?shù),這個(gè)分?jǐn)?shù)代表了網(wǎng)站的重要性和流行度[7]。
筆者選擇河南省所轄18個(gè)市級(jí)政府門戶網(wǎng)站作為研究對(duì)象。本案例使用的主要工具和方法有:使用搜索引擎AltaVista獲取網(wǎng)站總鏈接數(shù);使用Alexa工具檢查網(wǎng)站的流量指標(biāo)和排名;選擇Google和百度兩大搜索引擎檢查網(wǎng)站相應(yīng)的可見(jiàn)度指標(biāo);使用Google PR值來(lái)測(cè)度網(wǎng)站的權(quán)威度。
表1 河南省市級(jí)政府門戶網(wǎng)站
2.2.1 網(wǎng)絡(luò)影響力
①鏈接指標(biāo)
在搜索引擎AltaVista中,使用“l(fā)ink:www.***.gov.cn”語(yǔ)句獲得18個(gè)市級(jí)政府門戶網(wǎng)站的總鏈接數(shù),結(jié)果如圖1所示??傛溄訑?shù)是評(píng)價(jià)網(wǎng)站網(wǎng)絡(luò)影響力的重要指標(biāo)。鄭州市、洛陽(yáng)市、信陽(yáng)市和安陽(yáng)市在該指標(biāo)中居于前4的位置,表明這4個(gè)市級(jí)政府門戶網(wǎng)站在鏈接指標(biāo)上擁有較大的關(guān)注度和影響力。許昌市、周口市和平頂山市在這個(gè)指標(biāo)上則表現(xiàn)不佳,這表明它們的業(yè)務(wù)宣傳和網(wǎng)絡(luò)影響力還不夠好。
圖1 Alta Vista獲取的市級(jí)政府門戶網(wǎng)站總鏈接數(shù)
②流量指標(biāo)
Alxea提供全球范圍內(nèi)權(quán)威的網(wǎng)站流量查詢,圖2和圖3分別是18個(gè)市級(jí)政府門戶網(wǎng)站日均IP訪問(wèn)量、日均頁(yè)面瀏覽量(PV)指標(biāo)周均示意圖。鄭州市、濟(jì)源市和鶴壁市居于日均IP訪問(wèn)量的前3位,處于日均PV瀏覽量前4位的網(wǎng)站為鄭州市、洛陽(yáng)市、新鄉(xiāng)市和南陽(yáng)市。根據(jù)表2的Alxea排名可以看出,鄭州、洛陽(yáng)和南陽(yáng)這3個(gè)門戶網(wǎng)站的排名靠前。從這些結(jié)果可以看出,鄭州、洛陽(yáng)、南陽(yáng)的幾個(gè)門戶網(wǎng)站比較能吸引大家的注意。而濟(jì)源和鶴壁雖然IP訪問(wèn)量靠前,但排名和頁(yè)面瀏覽量都不占優(yōu)勢(shì),表明用戶對(duì)這些網(wǎng)站都是匆匆瀏覽,不能吸引大家進(jìn)行更細(xì)致的了解和訪問(wèn)。
圖2 市級(jí)政府門戶網(wǎng)站日均IP訪問(wèn)量(周均)
圖3 市級(jí)政府門戶網(wǎng)站日均PV瀏覽量(周均)
表2 18個(gè)門戶網(wǎng)站的Alxea排名
2.2.2 網(wǎng)站可見(jiàn)度
使用“限定要搜索指定的網(wǎng)站”選項(xiàng),分別獲取各網(wǎng)站被百度和Google收錄的頁(yè)面數(shù)。圖4給出了18個(gè)門戶網(wǎng)站在Google和百度兩大搜索引擎中的可見(jiàn)度。三門峽市和安陽(yáng)市門戶網(wǎng)站在Google中擁有絕對(duì)優(yōu)勢(shì)的可見(jiàn)度,焦作市、三門峽市、鄭州市和信陽(yáng)市在百度中擁有絕對(duì)優(yōu)勢(shì)的可見(jiàn)度,這表明這些網(wǎng)站的搜索引擎利用效率較高,其影響力也必然較高,因而具有良好的健康度。駐馬店和商丘市在網(wǎng)站可見(jiàn)度指標(biāo)中表現(xiàn)不佳。
同時(shí),由于搜索引擎本身算法的差異,同一個(gè)網(wǎng)站在不同搜索引擎中也有不同的可見(jiàn)度。百度所能獲取到的網(wǎng)站網(wǎng)頁(yè)數(shù)要遠(yuǎn)遠(yuǎn)大于Google。
圖4 18個(gè)門戶網(wǎng)站在兩大搜索引擎中的可見(jiàn)度
2.2.3 網(wǎng)站權(quán)威度
我們這里使用PR值來(lái)測(cè)定網(wǎng)站的權(quán)威度,18個(gè)門戶網(wǎng)站的PR值如圖5所示。其中鄭州市、安陽(yáng)市、南陽(yáng)市、信陽(yáng)市和濟(jì)源市的PR值為7;其他門戶網(wǎng)站的PR值均為6,焦作沒(méi)有測(cè)出。
圖5 18個(gè)門戶網(wǎng)站的PR值
河南省電子政務(wù)建設(shè)已經(jīng)初具規(guī)模,廣域骨干傳輸網(wǎng)絡(luò)已連接到18個(gè)省轄市,省直城域網(wǎng)絡(luò)基本建成并得到較好應(yīng)用。21個(gè)縱向業(yè)務(wù)系統(tǒng)依托省電子政務(wù)網(wǎng)向下延伸,省直單位電子政務(wù)外網(wǎng)接入率已達(dá)85%。18個(gè)省轄市政府、90%的省直單位和87%的縣級(jí)政府開(kāi)通了門戶網(wǎng)站[8]。但是,本研究結(jié)果顯示,多數(shù)市級(jí)政府門戶網(wǎng)站影響力極低,網(wǎng)站健康度檢查結(jié)果不盡如人意。這表明政府部門存在重網(wǎng)站建設(shè)而輕利用的現(xiàn)象,這是對(duì)資源的極大浪費(fèi),應(yīng)引起有關(guān)部門和領(lǐng)導(dǎo)的高度重視。
基于網(wǎng)站健康度檢查的網(wǎng)絡(luò)測(cè)評(píng)還存在以下問(wèn)題:
①缺乏成熟的理論指導(dǎo)。網(wǎng)絡(luò)計(jì)量學(xué)是在上世紀(jì)90年代中后期逐步形成的一門學(xué)科,對(duì)其研究不過(guò)10多年的時(shí)間。相比非網(wǎng)絡(luò)的傳統(tǒng)信息的生產(chǎn)、傳播和利用規(guī)律的研究已經(jīng)取得大量成果,網(wǎng)絡(luò)信息在形式、數(shù)量、手段、內(nèi)容等各方面與非網(wǎng)絡(luò)信息都存在極大的差異,因而,難以直接借鑒和使用已有研究成果。
②缺少完善的研究工具。筆者所作的分析都是基于商業(yè)搜索引擎的,但是,商業(yè)搜索引擎不像SCI那樣是專門為引用分析而設(shè)計(jì)和開(kāi)發(fā)的,被用于網(wǎng)絡(luò)計(jì)量學(xué)分析時(shí),存在著覆蓋率低和穩(wěn)定性差等缺陷。
③研究工具功能不完善。雖然AltaVista、Google、AllTheWeb等少數(shù)搜索引擎提供了類似link、domain、host等指令,可以利用這些功能對(duì)簡(jiǎn)單的網(wǎng)絡(luò)鏈接關(guān)系進(jìn)行分析,但對(duì)于聚類等復(fù)雜的鏈接現(xiàn)象仍缺乏有效的工具。
④數(shù)據(jù)獲取存在不確定性。網(wǎng)絡(luò)數(shù)據(jù)呈動(dòng)態(tài)分布,這種不斷變化著的網(wǎng)絡(luò)信息內(nèi)容,使得研究中所獲取的網(wǎng)絡(luò)數(shù)據(jù)反映的只能是某一時(shí)刻的情況,增加了研究結(jié)果的不確定性。
如何設(shè)計(jì)網(wǎng)站才能保證網(wǎng)站具有較高的健康度?這是進(jìn)行網(wǎng)站健康度檢查的出發(fā)點(diǎn)和根本目的所在。一般來(lái)說(shuō),網(wǎng)站設(shè)計(jì)擁有固定的原則,這是保證網(wǎng)站健康度的基礎(chǔ);從網(wǎng)絡(luò)信息計(jì)量學(xué)角度來(lái)說(shuō),網(wǎng)站的鏈接結(jié)構(gòu)對(duì)網(wǎng)站健康度意義重大,所以這也是必須要考慮的。
在關(guān)鍵字的選擇上要注意以下幾點(diǎn):①?gòu)挠脩艚嵌瘸霭l(fā)選擇關(guān)鍵字;②需要對(duì)核心關(guān)鍵字進(jìn)行擴(kuò)充和重復(fù)排列,保證網(wǎng)站對(duì)用戶的可見(jiàn)度;③避免使用涵義太寬泛的關(guān)鍵字,否則用戶可能會(huì)迷失在數(shù)量龐大的網(wǎng)頁(yè)信息中而找不到所需內(nèi)容,降低網(wǎng)站原有內(nèi)容對(duì)用戶的可見(jiàn)度;④確定合適的網(wǎng)頁(yè)關(guān)鍵字?jǐn)?shù)量。
影響搜索引擎排名的一個(gè)重要因素是網(wǎng)站的導(dǎo)入鏈接,搜索引擎認(rèn)為,如果網(wǎng)站質(zhì)量較高,就會(huì)吸引更多的入鏈,而吸引的入鏈越多,則網(wǎng)站質(zhì)量越高。另外,需要注意垃圾鏈接問(wèn)題,搜索引擎僅對(duì)高質(zhì)量的外部鏈接予以重視。
信息構(gòu)建技術(shù)并不是針對(duì)網(wǎng)站健康度設(shè)計(jì)而提出的,但它在網(wǎng)站設(shè)計(jì)方面的理念,能夠有效地提高網(wǎng)站健康度。Rosenreld和Morvile對(duì)信息構(gòu)建進(jìn)行了詳細(xì)的解釋:①信息構(gòu)建是在信息系統(tǒng)內(nèi)組織、標(biāo)識(shí)與導(dǎo)航規(guī)劃的結(jié)合。②信息構(gòu)建是對(duì)信息空間的結(jié)構(gòu)化設(shè)計(jì),以方便任務(wù)完成和直接獲取內(nèi)容。③信息構(gòu)建是對(duì)網(wǎng)站和企業(yè)內(nèi)聯(lián)網(wǎng)進(jìn)行結(jié)構(gòu)化和分類以幫助人們查找與管理信息的藝術(shù)和科學(xué)。④信息構(gòu)建是集中應(yīng)用設(shè)計(jì)科學(xué)和建筑科學(xué)之原理的新生科學(xué)和實(shí)踐領(lǐng)域[9]。
[1]中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心.第25次中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告,2010.
[2]2009中國(guó)政府網(wǎng)站績(jī)效評(píng)估報(bào)告[EB/OL].[2010-07-09].http://www.echinagov.com/gov/special/special36/page1.html.
[3]Almind,T.C.,Ingwersen,P.Information analysis on the world wide web:methodological approaches to“web metrics”[J].Journal of Document,1997(4):404-426.
[4]Thelwall,M.Link Analysis:an information science approach[M].New York:Elsevier,2004:119-134.
[5]王偉軍.電子商務(wù)網(wǎng)站評(píng)價(jià)研究與應(yīng)用分析[J].情報(bào)科學(xué),2006(6):641-642.
[6]劉偉,段宇鋒.基于網(wǎng)絡(luò)影響力的電子政務(wù)建設(shè)績(jī)效評(píng)價(jià)[J].情報(bào)科學(xué),2006(11):1705-1706.
[7]SEOmoz’s Page Strength tool[EB/OL].[2010-07-09].http://www.seomoz.org/trifecta.
[8]河南省電子政務(wù)發(fā)展規(guī)劃(2009-2012年)[EB/OL].[2010-07-09].http://www.drcnet.com.cn/DRCnet.common.web/DocViewSummary.aspx?docid=1978005&leafid=3090.
[9]潘梅.國(guó)內(nèi)外信息構(gòu)建(IA)研究綜述[J].圖書(shū)情報(bào)工作,2004(6):8-12.