●賈彥龍,譚宗穎(中國科學(xué)院 國家科學(xué)圖書館,北京 100190)
共鏈接作為網(wǎng)絡(luò)挖掘的信息源正在被逐漸的重視和利用。很多研究將共鏈接的分析應(yīng)用于學(xué)術(shù)空間,然而有學(xué)者發(fā)現(xiàn)其在競爭情報研究中也同樣可以發(fā)揮作用。本文希望在前人研究的基礎(chǔ)上,對于在傳統(tǒng)行業(yè)中應(yīng)用共鏈方法識別競爭對手的適用性作進(jìn)一步的論證。
互聯(lián)網(wǎng)的應(yīng)用能夠為企業(yè)提供有效的競爭情報信息。[1]傳統(tǒng)的互聯(lián)網(wǎng)應(yīng)用技術(shù)大多是基于文檔內(nèi)容的,與經(jīng)典的信息檢索技術(shù)和數(shù)據(jù)庫技術(shù)有著密切的聯(lián)系。但是,互聯(lián)網(wǎng)中特有的許多問題,諸如超大規(guī)模的非結(jié)構(gòu)化文檔數(shù)量、良莠不齊的網(wǎng)頁質(zhì)量、包含在文檔中的大量多媒體信息,甚至相當(dāng)含糊或不規(guī)范的用戶查詢表示等,都使得經(jīng)典的信息檢索技術(shù)和數(shù)據(jù)庫技術(shù)在互聯(lián)網(wǎng)環(huán)境中很難有效地應(yīng)用。
然而,互聯(lián)網(wǎng)又包含了傳統(tǒng)數(shù)據(jù)環(huán)境所沒有的另一種豐富信息--超鏈接。創(chuàng)建和利用超鏈接不是一個無關(guān)的現(xiàn)象,而是暗示一種重要的社會反響。[2]他們可以被看作是對目標(biāo)網(wǎng)頁的認(rèn)可,尤其是創(chuàng)建者已經(jīng)設(shè)置的那些指向有用的或者相關(guān)資源的鏈接。所以,網(wǎng)頁間的超鏈接一方面引導(dǎo)網(wǎng)頁瀏覽的過程,另一方面也反映了網(wǎng)頁創(chuàng)建者的一種判斷。因此,充分利用互聯(lián)網(wǎng)的鏈接結(jié)構(gòu)信息對互聯(lián)網(wǎng)應(yīng)用技術(shù)進(jìn)行研究具有極為重要的意義。
目前來講,利用因特網(wǎng)去獲取商業(yè)信息的研究還主要集中在網(wǎng)絡(luò)內(nèi)容挖掘,而網(wǎng)絡(luò)鏈接還沒有被充分地運(yùn)用于這一目的。網(wǎng)絡(luò)計量學(xué)作為一個新興學(xué)科,可以用于挖掘鏈接(這些鏈接將網(wǎng)絡(luò)上的不同文檔連接在一起)中包含的信息,進(jìn)而運(yùn)用文獻(xiàn)計量技術(shù)定量地分析網(wǎng)絡(luò)。目前這一領(lǐng)域研究集中在高校和學(xué)術(shù)網(wǎng)絡(luò)空間,[3-5]然而,這一技術(shù)同樣也可應(yīng)用于主要的商業(yè)站點(diǎn)。WU等人提出指向商業(yè)網(wǎng)站的鏈接包含著有用的商業(yè)信息。[6]Vaughan證實鏈接到一個企業(yè)網(wǎng)站的鏈接數(shù)量和一個企業(yè)的經(jīng)營業(yè)績相關(guān),這種業(yè)績可以用總收入和利潤來衡量。[7]Kipp等人定性考察了鏈接到商業(yè)網(wǎng)站的目的,不但定量地證實了以上的研究結(jié)果,還指出大多數(shù)商業(yè)網(wǎng)站的鏈接由商業(yè)目的產(chǎn)生。[8]可見,將網(wǎng)絡(luò)鏈接應(yīng)用到企業(yè)的情報分析中,可以得到有價值的信息。
共鏈接作為一種網(wǎng)絡(luò)鏈接形式正在逐漸被人們認(rèn)識,Vaughan對企業(yè)之間的鏈接動機(jī)進(jìn)行了深入的分析,他發(fā)現(xiàn)所調(diào)查企業(yè)網(wǎng)站都不與其競爭對手的網(wǎng)站相鏈接,但是它們都有可能被第三方鏈入。也就是說,直接的鏈接關(guān)系并不能為企業(yè)競爭情報提供有用的信息,但是利用兩個企業(yè)網(wǎng)站的共鏈頻次卻可以對這兩個企業(yè)的相似性進(jìn)行度量,而相似的企業(yè)之間必然會存在某種競爭關(guān)系,從而就假定可以通過共鏈的分析方法來判斷企業(yè)之間的競爭關(guān)系。Vaughan利用上述假設(shè),用共鏈方法研究了電子行業(yè)(高科技企業(yè))中企業(yè)間的競爭關(guān)系,同時,作者也指出此方法應(yīng)該在其他行業(yè)中廣泛試用,以便觀察其普適性。[9]本文希望能夠利用共鏈方法對傳統(tǒng)行業(yè)中的飲料制造業(yè)企業(yè)間的競爭關(guān)系進(jìn)行研究,以對企業(yè)間的競爭對手有進(jìn)一步認(rèn)識。本研究按照以下標(biāo)準(zhǔn)選取了31家飲料制造業(yè)企業(yè)作為研究對象(見附錄):在國內(nèi)飲料制造業(yè)中營業(yè)收入排在前面的企業(yè)(數(shù)據(jù)來源于中國產(chǎn)業(yè)信息網(wǎng)和上證交易所)。企業(yè)取自于飲料制造業(yè)中不同的領(lǐng)域,比如含酒精類飲料制造企業(yè)、純酒精制造企業(yè)以及軟飲料制造企業(yè)(國家統(tǒng)計局分類標(biāo)準(zhǔn))。
●入鏈與出鏈:在網(wǎng)絡(luò)鏈接中有入鏈與出鏈之分,入鏈即是所有指向所要研究的網(wǎng)站的鏈接,出鏈則是所有同一個要研究的網(wǎng)頁中指向其他網(wǎng)頁的鏈接。[10,11]
●共鏈接(共鏈):分為共入鏈和共出鏈。所謂共入鏈即是如果網(wǎng)頁C與網(wǎng)頁D中都被B所鏈接(即B中同時存C、D的反向鏈接),則可稱C、D存在共入鏈。共出鏈即是網(wǎng)頁D中同時存在來自網(wǎng)頁B和網(wǎng)頁E中的鏈接,則稱B、E存在共出鏈。圖1顯示了網(wǎng)絡(luò)節(jié)點(diǎn)間不同的鏈接類型。[12]
圖1 網(wǎng)絡(luò)中不同的鏈接類型
表1說明了圖1中不同的鏈接類型。本文主要涉及入鏈和共入鏈,像很多關(guān)于鏈接的文章中提到的那樣,本文中對共入鏈與共鏈當(dāng)做同義詞而未作區(qū)分,以下的共入鏈均由共鏈代替。
表1 鏈接類型定義
通過搜索引擎的選取,檢索研究對象的入鏈和共鏈數(shù)據(jù),利用多維尺度分析法將標(biāo)準(zhǔn)化的多維數(shù)據(jù)投射為二維散點(diǎn)圖作進(jìn)一步分析。
3.1.1 選取搜索引擎
商業(yè)搜索引擎并不是為了學(xué)術(shù)目的而建立的,結(jié)果也并不如我們需求的那樣全面。[13]爬行的算法屬于商業(yè)秘密,對檢索信息排序的準(zhǔn)確標(biāo)準(zhǔn)也不為我們所知曉,檢索結(jié)果還會隨時間發(fā)生波動。盡管如此,商業(yè)搜索引擎對于某些網(wǎng)絡(luò)計量而言仍是唯一的和最好的信息來源。[14]本文對搜索引擎進(jìn)行了較為廣泛的調(diào)研,并重點(diǎn)對搜索引擎Google、百度和Yahoo進(jìn)行了比較,以選擇最適合本研究的搜索引擎。
本研究需要對網(wǎng)站內(nèi)部自身鏈接進(jìn)行剔除后才能得到準(zhǔn)確的外部入鏈的數(shù),這樣的結(jié)果才更準(zhǔn)確,[15]而Google不能很好地對外部入鏈進(jìn)行區(qū)分,百度相對于鏈接的檢索還有待加強(qiáng)。本文重點(diǎn)針對會涉及到的link以及domain兩個關(guān)鍵字,對Google、百度和Yahoo這三大搜索引擎的鏈接檢索特點(diǎn)進(jìn)行了對比,其結(jié)果見表2。從比較結(jié)果中筆者發(fā)現(xiàn),Yahoo很適合運(yùn)用于本研究。
3.1.2 檢索研究對象的外部入鏈和共鏈數(shù)
本研究需要得到外部入鏈和共鏈的數(shù)據(jù),所以需要對所研究的每個企業(yè)的網(wǎng)頁外部入鏈數(shù)和每一對企業(yè)的共鏈數(shù)進(jìn)行檢索。具體的檢索式在表3中顯示。注意:本文的檢索式中site關(guān)鍵字后面只用到了域名的一部分,這樣可以更好地排除企業(yè)內(nèi)部自身的入鏈,從而更準(zhǔn)確地得到相應(yīng)站點(diǎn)外部入鏈數(shù),[16,17]因為企業(yè)可能會使用一些與其網(wǎng)站相關(guān)的網(wǎng)址,例如:mail.companyX.com,而不是企業(yè)唯一的網(wǎng)址(www.companyX.com)。
表2 搜索引擎的比較
表3 共鏈、外部入鏈的檢索式
(1)數(shù)據(jù)獲取。為了避免數(shù)據(jù)的波動,在同一天(2010年3月17日)進(jìn)行了全部數(shù)據(jù)的采集,檢索了飲料制造業(yè)的31家企業(yè)的外部入鏈以及共鏈數(shù)。
(2)數(shù)據(jù)標(biāo)準(zhǔn)化處理。單純的共鏈數(shù)并不能準(zhǔn)確反映出企業(yè)之間的相似程度,比如兩企業(yè)的外部入鏈數(shù)都是10,那么其共鏈數(shù)是5就可以表示出他們具有很強(qiáng)的相似性,而如果兩企業(yè)的入鏈數(shù)都是100,那么即使他們共鏈數(shù)是10,相比之下也不能說明企業(yè)之間有很強(qiáng)的相似性。因此,本文用Small提出的Jaceard系數(shù)來標(biāo)準(zhǔn)化所得到的共鏈數(shù)。[18]
其中Rij為共鏈數(shù)的杰卡德標(biāo)準(zhǔn)化值,用來表示企業(yè)i與企業(yè)j之間的相似強(qiáng)度;Cij表示企業(yè)i與企業(yè)j之間的共鏈數(shù);Ni,Nj表示企業(yè)i,j各自的外部入鏈數(shù)(即是企業(yè)i,j的反向鏈接數(shù))。經(jīng)過這樣的處理后,Rij可以比Cij更好地表示出企業(yè)間的相似強(qiáng)度。
通過對附錄1中的31家飲料制造企業(yè)間共鏈數(shù)據(jù)進(jìn)行檢索和標(biāo)準(zhǔn)化,即可利用多維尺度分析法對所得到的標(biāo)準(zhǔn)化共鏈矩陣進(jìn)行分析。SPSS的多維尺度分析中存在Multidimensional Scaling(ALSCAL) 和Multidimensional Scaling(PROXSCAL) 兩種分析過程。其中PROXSCAL可以看成是ALSCAL過程的擴(kuò)展:
(1)ALSCAL提供了比較經(jīng)典的5個模型,PROXSCAL使用了 Theory Scaling System Group(DTSS) 的最優(yōu)化數(shù)據(jù)轉(zhuǎn)換方法,提供了4個更高級的模型。
(2)ALSCAL對不相似數(shù)據(jù)進(jìn)行分析,數(shù)值越大表示越不相似。而PROXSCAL既可以分析相似數(shù)據(jù),也可以分析不相似數(shù)據(jù)。
(3) PROXSCAL過程提供了更加豐富的模型診斷、設(shè)置和輸出。[19]
基于本文共鏈數(shù)據(jù)表示企業(yè)間相似程度的特性和PROXSCAL自身的優(yōu)點(diǎn),本文選用Multidimensional Scaling(PROXSCAL) 進(jìn)行分析。將31家企業(yè)的標(biāo)準(zhǔn)化共鏈數(shù)據(jù)導(dǎo)入SPSS[20]并運(yùn)行PROXSCAL,得到如圖2所示的二維散點(diǎn)圖。其中模型擬合優(yōu)度的情況顯示Stress值為0.15554,相應(yīng)的DAF指標(biāo)為0.84446,因此模型的擬合效果比較令人滿意。[21]
圖2 31家飲料制造企業(yè)共鏈分析結(jié)果的二維散點(diǎn)圖
圖2顯示了根據(jù)企業(yè)之間的共鏈數(shù)據(jù),利用MDS分析所得到的31家飲料制造企業(yè)在圖形中的相對位置。通過數(shù)據(jù)點(diǎn)之間的遠(yuǎn)近程度,可以判斷企業(yè)間的相似程度,進(jìn)而判斷企業(yè)間的主要競爭對手??梢钥吹斤嬃现圃鞓I(yè)的這些企業(yè)被清晰地聚類到各自不同的品類之中,展示了企業(yè)各自主要的競爭對手。
圖2中的左下部分主要是白酒制造企業(yè),可以發(fā)現(xiàn),白酒行業(yè)中茅臺和五糧液比較接近,它們也正是白酒行業(yè)的領(lǐng)軍企業(yè)。2009年五糧液公司實現(xiàn)銷售額110.65億元(人民幣),茅臺2009年實現(xiàn)營收96.70億元,在行業(yè)中占絕對霸主的地位的同時也存在著強(qiáng)競爭關(guān)系。其他的白酒企業(yè)與它們的距離偏遠(yuǎn),分布較為分散,如圖所示稻花香、杏花村、勁牌、瀘州老窖,其營業(yè)收入都在20-40億元之間,形成了白酒行業(yè)中的第二梯隊。注意到圖2中杏花村集團(tuán)既和同等級的白酒企業(yè)比較接近,又和同樣是保健酒企業(yè)--勁牌比較接近,這反映出杏花村集團(tuán)在“十五”期間傾力打造白酒基地和保健酒基地的戰(zhàn)略意圖,杏花村集團(tuán)也成為了同等級白酒與保健酒企業(yè)的有力競爭者。而像古井貢酒、水井坊和枝江則形成了白酒業(yè)中營業(yè)收入在10-20億之間的第三梯隊中的主要競爭者。劍南春作為一個2009年營業(yè)額在28億元的企業(yè)似乎其位置有些異常,顯得與軟飲料的維維企業(yè)距離很近,究其原因,可能是與2009年維維企業(yè)傳出入股劍南春傳聞有關(guān),造成這兩家企業(yè)被更多的企業(yè)同時關(guān)注,其共鏈的數(shù)據(jù)變得更多。最終,維維入主枝江酒業(yè),獲得其51%的股份。從3年前維維股份以8000萬元收購了雙溝酒業(yè)38.27%的股份開始涉足白酒行業(yè)到如今收購枝江酒業(yè)的成功,可以說,維維也在白酒行業(yè)占有一席之地。在圖2中,傳統(tǒng)認(rèn)為的維維豆奶制造企業(yè)卻和白酒類企業(yè)距離更近,需引起飲料制造業(yè)同行的注意,將其視為白酒企業(yè)中的競爭對手或潛在的競爭對手是有據(jù)可循的。
青島啤酒和燕京啤酒位于圖2的右上角,而其余啤酒企業(yè)分布在圖2的左下方位置。這正好印證了青島啤酒和燕京啤酒是行業(yè)內(nèi)普遍被看好的兩家龍頭企業(yè),屬于全國性品牌,在全國范圍內(nèi)展開競爭。而像華潤、哈爾濱、珠江啤酒充其量也都是地方性品牌,只能在其相應(yīng)的地域中充當(dāng)主要競爭者。
圖2最上面的3家企業(yè)張裕、王朝和長城聚在一起,它們的市場份額占據(jù)了葡萄酒市場的半壁江山,[22]印證了它們是葡萄酒市場的傳統(tǒng)三強(qiáng)。
南陽天冠是主要以食用酒精生產(chǎn)為主的企業(yè),與圖2中其他企業(yè)不存在明顯的競爭關(guān)系,在圖2中表現(xiàn)為孤立的散點(diǎn)。
圖2同樣較好地展示了軟飲料制造企業(yè)之間的主要競爭對手。杭州娃哈哈集團(tuán)公司與廣東樂百氏集團(tuán)公司位于圖2的最右側(cè),它們都是在上個世紀(jì)90年代高速成長而享有盛譽(yù)的國內(nèi)大型名牌企業(yè)。它們市場競爭的領(lǐng)域都集中在兩條路線上,即從1992年開始的乳酸奶市場(從單純的生產(chǎn)兒童類飲料產(chǎn)品擴(kuò)大到成人市場),到1996年又?jǐn)U大到瓶裝水市場。紅牛和健力寶在圖2中的右下角,這兩家企業(yè)則在功能型飲料中展開激烈的角逐。[23]同樣,我們還可以發(fā)現(xiàn)在中間偏上部分的銀鷺和安德利則主要在果汁飲料行業(yè)中有明顯的競爭。比較有爭議的就是可口可樂和百事可樂這兩家企業(yè)在圖2中的距離比較遠(yuǎn),且可口可樂距離其他不含汽的軟飲料都比較接近,而百事距離他們就相對遠(yuǎn)了很多。這可以從兩家企業(yè)存在戰(zhàn)略分化的跡象上加以解釋。可口可樂在華投資了全球最大的、設(shè)備最先進(jìn)的不含氣飲料的生產(chǎn)基地,輻射全國發(fā)展奶飲料和果汁飲料等不含汽飲料,企圖全面進(jìn)軍不含汽飲料市場,而百事可樂則繼續(xù)在含汽飲料市場擴(kuò)張,可見共鏈的方法對于競爭對手之間戰(zhàn)略意圖的變化也有一定的揭示作用。
通過以上的分析,我們發(fā)現(xiàn)利用共鏈分析方法得到的多維尺度圖像基本上反映了這31家飲料制造企業(yè)間的競爭關(guān)系,其中存在的異常點(diǎn)也可以從實際情況得到較好的解釋。
在選取適合的搜索引擎的基礎(chǔ)上,本文通過共鏈分析方法,利用PROXSCAL對31家飲料制造業(yè)企業(yè)進(jìn)行聚類,用二維散點(diǎn)圖標(biāo)示了各企業(yè)所處的位置,進(jìn)一步實證了共鏈方法可以應(yīng)用到傳統(tǒng)行業(yè)中企業(yè)間競爭對手的識別。[12]但該方法存在局限性,比如,在共鏈方法運(yùn)用中,共鏈的計數(shù)并未因網(wǎng)頁的不同而有所區(qū)別,但實際上,不同網(wǎng)站的重要程度是有差別的,是否可以通過有權(quán)重的共鏈計數(shù)達(dá)到更趨于合理的共鏈方法,例如可以利用Google所提供的網(wǎng)頁的PR值標(biāo)示網(wǎng)頁權(quán)重,再與共鏈方法相結(jié)合,可能會達(dá)到更合理的效果,希望在以后的研究中進(jìn)一步探索。
附錄31家飲料制造企業(yè)列表
[1] Porter ME.CompetitiveStrategy:Techniquesfor Analyz ingIndustriesand Competitors[M].FreePress(New York),1980:147.
[2] Turow J,Tsui L.The Hyperlinked Society:Questioning Connections in the Digital Age[M].The University of Michigan Press,2008:43.
[3] Thelwalll M,Wilkinson D.Finding similar academic web sites with links,bibliometric couplings and colinks[J].Information Processing and Management,2004,40(3):515-526.
[4] Bjorneborn L.Small-world link structures across an aca demic web space[D/OL].[2010-04-20].http∶//www.db.dk/lb/phd/phd-thesis.pdf.
[5] Eckmann J-P,Moses E.Curvatureof co-linksuncovers hidden thematic layers in the World Wide Web [J].PNAS,2002,99(9):5825-5829.
[6] Vaughan L,WUG.Links tocommercial web sites as a source of business information [J].Scientometrics,2004,60(3):487-496.
[7] Vaughan L.Web hyperlinks reflect business performance:a study of U.S.and chinese ITcompanies[J].Canadian Journal of Information and Library Science,2004,28(1):17-31.
[8] Vaughan L,etc.Whyare hyperlinks tobusiness websites created?A content analysis[J].Scientometrics,2006,67(2):291-300.
[9] Vaughan L,You J.Miningweb hyperlink data for business information∶the case of telecommunications equipment companies[C]//Proceedingsof the First IEEE International Conference on Signal-Image Technology and Internet-Based Systems.Cameroon:[s.n.],2005:190-195.
[10] Ingwersen P.The calculation of webimpactfactors[J].Journal of Documentation,1998,54(2):236-243.
[11] Thelwall M.Conceptualizing documentation on the web∶Anevaluationof differentheuristicbased modelsfor counting links between university web sites[J].Journal of the American Society for Information Science and Technology,2002,53(12):995-1005.
[12] Bjorneborn L,Ingwersen P.Toward a basic framework for webometrics[J].Journal of the American Society for Information Science and Technology,2004,55(14):1216-1227.
[13] Bar-Ilan J.The use of web search engines in informationscienceresearch[J].Annual Reviewof Information Scienceand Technology,2003:231-288.
[14] Thelwall M,etc.Webometrics[J].Annual Review of Information Science and Technology, 2005, 39:81-135.
[15] Ingwersen P.The calculation of web impact factors[J].Journal of Documentation,1998(54):236-243.
[16] Smith A,Thelwall M.Webimpactfactorsfor Australasian universities[J].Scientometrics,2002,54(3):363-380.
[17] Thelwall M.Extracting macroscopic information from weblinks[J].Journalof the American Societyfor Infor mation Science and Technology,2001,52(13):1157-1168.
[18] Small H.Co-citation in the scientific literature:A new mea-sure of the relationship between two socuments[J].Journal of the American Society for Information Science,1973,24(4):269.
[19]張文彤.SPSS統(tǒng)計分析教程 高級篇[M].北京:希望電子出版社,2008.
[20] Meulman J,Heiser W.SPSS Categories 11.0[M].Chicago:SPSSInc,2001.
[21] Mena J.Web Miningfor Profit∶E-Business Optimization[M].Boston:Digitalpress,2001.
[22]張婭琳.長城葡萄酒競爭營銷策略研究[D].北京:對外經(jīng)濟(jì)貿(mào)易大學(xué),2005.
[23]鮑捷.脈動品牌策略分析[D].成都:西南交通大學(xué),2005.