楊斯楠
摘要:網(wǎng)站是上市公司借助網(wǎng)絡實現(xiàn)與投資者溝通的重要手段,同時也是投資者獲取海量信息和直接與上市公司互動的有效途徑。上市公司應注重公司網(wǎng)站的建設、應用與探索,提高企業(yè)的信息化水平,讓公司將來在轉型與發(fā)展的道路中贏在起跑線上。利用鏈接分析法對上市公司潛力企業(yè)網(wǎng)站的影響力進行較專門系統(tǒng)的研究,通過描述性分析、相關性分析、主成分分析等數(shù)學統(tǒng)計方法對企業(yè)網(wǎng)站的網(wǎng)絡指標進行分析和評估,并通過kmeans算法將企業(yè)網(wǎng)站聚成3類。根據(jù)網(wǎng)站的影響力現(xiàn)狀,對網(wǎng)站建設策略提出相應的建議。研究結果表明,我國上市公司潛力企業(yè),對網(wǎng)站的網(wǎng)絡影響力重視不足,整體網(wǎng)絡影響力較弱,不利于互聯(lián)網(wǎng)時代的企業(yè)發(fā)展。
關鍵詞:鏈接分析;企業(yè)網(wǎng)站;絡影響力;上市公司
1概述
隨著互聯(lián)網(wǎng)技術應用的不斷發(fā)展與延伸,上市公司的互聯(lián)網(wǎng)意識在不斷提升,互聯(lián)網(wǎng)已經(jīng)成為上市公司思維轉化、戰(zhàn)略轉移的重要工具。據(jù)統(tǒng)計,2016年在2807家A股上市公司中,95.05%的上市公司有自己獨立的網(wǎng)站。移動互聯(lián)網(wǎng)時代,上市公司網(wǎng)站建設的定位更為明確、個性獨立,如今的網(wǎng)站定位基本可分為五大類:品牌形象、企業(yè)宣傳、電子商務運用、行業(yè)門戶、營銷展示。因此,上市公司應注重公司網(wǎng)站的建設、應用與探索,提高企業(yè)的信息化水平,讓公司將來在轉型與發(fā)展的道路中贏在起跑線上。
鏈接分析是借助搜索引擎和網(wǎng)絡數(shù)據(jù)庫,以網(wǎng)絡鏈接為研究對象,引入傳統(tǒng)引文分析法的基本原理和方法,并借助統(tǒng)計分析軟件等工具,揭示和分析網(wǎng)絡鏈接的屬性和特征的一種方法。基于網(wǎng)絡站點間鏈接正向肯定關系,分析網(wǎng)站自身信息組織的科學性和合理性以及對網(wǎng)站影響力進行間接評價,即網(wǎng)站的外部鏈接數(shù)量越多、網(wǎng)絡影響因子越大,該網(wǎng)站的信息越有價值,利用率越高,該網(wǎng)站產(chǎn)生的影響力愈大。評價網(wǎng)站影響力的方法主要分為主觀定性評價和客觀定量評價兩種。主觀定性評價涉及的主觀因素較多,根據(jù)不同的研究對象進行設計,尚未有準確有效的評價體系。而客觀定量評價,則以客觀、科學的實際數(shù)據(jù)為主要評價依據(jù),如鏈接分析法,在評價網(wǎng)站的影響力方面,具有較客觀、定量的特點。因此,本文選用鏈接分析法,以上市公司潛力企業(yè)網(wǎng)站為主要的研究對象,對其企業(yè)網(wǎng)站的影響力進行較專門系統(tǒng)的研究,使用描述性分析、相關性分析、主成分分析等數(shù)學統(tǒng)計方法對企業(yè)網(wǎng)站的網(wǎng)絡指標對其網(wǎng)站的影響力進行分析研究,并對網(wǎng)站建設策略提出相應的建議。
2研究設計
2.1研究樣本
本文以2017年3月15日福布斯網(wǎng)站發(fā)布的"2017年中國上市公司潛力企業(yè)榜”中的100家企業(yè)作為研究對象,利用百度搜索引擎檢索得到企業(yè)網(wǎng)站的URL。然后基于鏈接分析的方法,獲取企業(yè)網(wǎng)站的網(wǎng)絡指標,通過分析這些企業(yè)網(wǎng)站的網(wǎng)絡影響力,使用描述性分析、相關性分析、主成分分析等數(shù)學統(tǒng)計方法進行分析描述,進而評估最具潛力的上市公司群體的網(wǎng)站影響力情況。
2.2網(wǎng)絡指標選擇
本文考慮網(wǎng)絡鏈接數(shù)量、分布及應用等各方面,為了綜合分析網(wǎng)站的網(wǎng)絡影響力情況,最終選取了總頁面數(shù)、總鏈接數(shù)、內(nèi)鏈接數(shù)、外鏈接數(shù)、網(wǎng)絡影響因子(WIF,WebImpactFactor)、內(nèi)部網(wǎng)絡影響因子(WIFs,self-WIF)、外部網(wǎng)絡影響因子(WIFe,external-WIF)、Page Authority(PA)、MozRank、百度權重、出站鏈接數(shù)、站內(nèi)鏈接數(shù)等共12個指標。其中,PA,是著名的SEO(Search Engine Optimization)工具提供商SEOmoz開發(fā)的用以預測特定頁面在搜索引擎頁面中的排名的分值,包括網(wǎng)站鏈接數(shù)、MozRank等鏈接指標,使用機器學習模型和算法進行計算,可以反映出網(wǎng)站綜合的質(zhì)量。MozRank也是SEOmoz開發(fā)的用以量化鏈接流行度的指標,MozRank的取值范圍是0~10之間,可以反映特定網(wǎng)頁在互聯(lián)網(wǎng)中的重要性程度。
2.3數(shù)據(jù)獲取
目前通常使用的鏈接分析工具大致可以分為商業(yè)搜索引擎、自主開發(fā)的鏈接分析工具以及商業(yè)的SEO分析工具等。一些常用的搜索引擎,如AhaVista(Yahoo!)、Bing等,因過高的帶寬消耗以及其他技術上的局限被取消了鏈接搜索命令。而Google還保留對網(wǎng)站的網(wǎng)頁數(shù)量的檢索,通過使用Google支持的“site:”指令,可以獲得特定域名下的被搜索引擎數(shù)據(jù)庫索引的全部頁面數(shù)量,但是不能區(qū)分內(nèi)外鏈接。因此,本文選取Google搜索引擎作為獲取網(wǎng)站總頁面數(shù)指標的工具,使用鏈接分析工具Open Site Explorer獲取每個企業(yè)URL的總鏈接數(shù)、內(nèi)鏈接數(shù)、外鏈接數(shù),使用站長之家的站長工具獲取企業(yè)URL的百度權重、出站鏈接數(shù)和站內(nèi)鏈接數(shù),并計算各網(wǎng)站的網(wǎng)絡影響因子、內(nèi)部網(wǎng)絡影響因子和外部網(wǎng)絡影響因子。表1總結了本文中使用的網(wǎng)絡指標及其對應的獲取途徑。
對樣本中的100家企業(yè)的URL進行檢索,并通過鏈接分析工具獲取相應指標,其中高德紅外、中國派對文化、金雷風電、中國鋁罐四家企業(yè)URL在使用鏈接分析工具獲取指標時存在部分數(shù)據(jù)缺失,因此將這四個企業(yè)數(shù)據(jù)剔除,最終得到96個企業(yè)的網(wǎng)站鏈接數(shù)據(jù),部分數(shù)據(jù)如表2所示。
3結果分析
3.1數(shù)據(jù)描述性分析
樣本中100家企業(yè)超過半數(shù)分布在廣東、浙江和北京三地,醫(yī)藥行業(yè)占比超20%,其次是軟件行業(yè)。廣東省上榜企業(yè)最多,達23家,北京和浙江上榜企業(yè)數(shù)量排名第二,均達到15家。對96個企業(yè)網(wǎng)站的網(wǎng)絡指標進行散點繪圖,觀察各指標值的分布情況,如圖1所示。
計算樣本中的描述統(tǒng)計量,包括各指標的極小值、極大值、均值、標準差和方差,如表3所示。
通過分析圖1和表3的數(shù)據(jù)情況,可發(fā)現(xiàn):
1)樣本中的96家上市公司潛力企業(yè)網(wǎng)站的總頁面數(shù)量主要集中于0-2000范圍,平均值約為1,491.677,說明樣本中大部分的企業(yè)網(wǎng)站的總頁面數(shù)指標呈集中趨勢,其中總頁面數(shù)最高的是兄弟科技,達到29,900。
2)總鏈接數(shù)指標主要集中在0-3000范圍,但是分散程度遠高于總頁面數(shù),標準差達到12,515.911,總鏈接數(shù)最少的企業(yè)是中來股份,僅為1,最多的企業(yè)是聯(lián)眾,共有111,000鏈接量;內(nèi)鏈接數(shù)指標中,有54%的企業(yè)網(wǎng)站內(nèi)鏈接數(shù)為0,而外鏈接數(shù)指標中,只有1個企業(yè)網(wǎng)站的外鏈接數(shù)為0,從標準差來看,內(nèi)鏈接數(shù)的離散程度也遠高于外鏈接數(shù)。統(tǒng)計總鏈接數(shù)、外鏈接數(shù)和內(nèi)鏈接數(shù)之間的數(shù)量關系,可發(fā)現(xiàn)外鏈接數(shù)占總鏈接數(shù)比例大于50%的企業(yè)網(wǎng)站數(shù)量達到72,占樣本量的75%。說明樣本企業(yè)網(wǎng)站大部分不重視網(wǎng)站內(nèi)部層次構建,信息量不夠完備。
3)Page Authority由于取值有限,所以極差較小,數(shù)據(jù)主要集中于30-50,而該指標的上限是100,說明這些企業(yè)的網(wǎng)站在SEOmoz的算法下的權威性都較低。得分最高的是聯(lián)眾,PA值達到68分。
4)MozRank指標主要集中于4-7分,該指標的上限是10分,說明大部分企業(yè)在SEOmoz的排名機制下處于中間水平。其中中生聯(lián)合的MozRank最高為6.86。
5)百度權重指標僅為0、1、2的企業(yè)數(shù)量最多,共占樣本企業(yè)的90.63%。樣本企業(yè)中百度權重最高的企業(yè)是陌陌科技,指標為6。
6)出站鏈接指標,大部分企業(yè)網(wǎng)站指向外部其他網(wǎng)頁的超鏈接數(shù)小于10,東土科技的企業(yè)網(wǎng)站中出站鏈接數(shù)最高,為58。反映大部分企業(yè)都不注重友情鏈接等互鏈建設。
7)站內(nèi)鏈接于指標的離散情況相較出站鏈接指標要高,主要集中在0-50區(qū)間,少量企業(yè)網(wǎng)站的站內(nèi)鏈接數(shù)高于100,藍海華騰取得最大值為230。這說明相對一部分的企業(yè)網(wǎng)站是進行了信息組織和網(wǎng)站構建設計。
8)69.79%的企業(yè)網(wǎng)站的網(wǎng)絡影響因子指標低于1,88.54%的內(nèi)部網(wǎng)絡影響因子指標低于1,85.41%的外部網(wǎng)絡影響因子指標低于1。樣本企業(yè)整體的網(wǎng)絡影響力情況都一般。個別企業(yè)網(wǎng)站網(wǎng)絡影響因子指標和外部網(wǎng)絡影響因子指標很高,如東方網(wǎng)絡。
3.2網(wǎng)絡指標相關性分析
使用統(tǒng)計分析軟件SPSS計算各個網(wǎng)絡指標之間的Spearman相關系數(shù),進而觀察和分析網(wǎng)絡指標之間是否具有相關關系。Spearman相關系數(shù)r的取值在-1到1之間,若r<0,則說明兩者存在負相關關系,r>0則說明兩者存在正相關關系,r的絕對值越接近1,則兩個指標的相關性越高。各指標之間的Spearman相關系數(shù),如表4所示。
從表4可發(fā)現(xiàn),大部分的網(wǎng)絡指標之間的相關性不高。除去自連的配對以外,共60對關系,其中13對指標存在負相關的關系,負相關程度最高的是外部網(wǎng)絡影響因子和百度權重,表明相關性較弱。其余47對Spearman相關系數(shù)均大于0,呈現(xiàn)正相關關系。其中,外部網(wǎng)絡影響因子和網(wǎng)絡影響因子的關系最強,其后依次是內(nèi)鏈接數(shù)和總鏈接數(shù)、內(nèi)鏈接數(shù)和內(nèi)部網(wǎng)絡影響因子等。除此以外,相關程度一般的指標有外鏈接數(shù)和總鏈接數(shù)、PA和總鏈接數(shù),相關系數(shù)均為0.5,網(wǎng)絡指標PA和PageRank之間的相關系數(shù)為0.492,相關程度并不是特別高。然而,總鏈接數(shù)和網(wǎng)絡影響因子WIF之間的相關性只有0.382,相比起來,網(wǎng)絡影響因子與外鏈接數(shù)指標之間的相關性則更高,這說明樣本的96個上市公司潛力企業(yè)網(wǎng)站的總鏈接數(shù)量主要由外鏈接數(shù)構成。
3.3因子主成分分析
為了更好地分析研究樣本的各指標之間的關系,使用主成分分析的方法,通過正交變換將存在相關性的遍歷轉換為若干組不存在相關性的變量,達到降維的效果。通過統(tǒng)計分析軟件SPSS進行主成分分析,基于相關性矩陣的結果,最大收斂性迭代25次,輸出主成分分析結果以及對應的主成分載荷和因子得分。旋轉在第3次后收斂,各成分特征值的碎石圖如圖2所示。
從圖2可以看出成分的特征值貢獻,兩個主成分的方差值加起來已達到51.56%,后面的成分特征值貢獻越來越小且差值不大。因此選擇前兩個成分作為樣本的主成分。各主成分的載荷如表5所示。
通過主成分分析,可將原本的12個指標變量降維到2個主成分,并得到每個主成分對應的與原先變量的相關系數(shù),相關系數(shù)的絕對值越大,主成分對該變量的代表性越高。主成分載荷圖如圖3所示。
從圖3可以看出,在使用主成分解析各個變量時,在這個三維坐標空間中,站內(nèi)鏈接指標和出站鏈接指標比較接近,內(nèi)部網(wǎng)絡影響因子和外部網(wǎng)絡影響因子之間的相關性也很高。網(wǎng)絡影響因子、外部網(wǎng)絡影響因子、外鏈接數(shù)三個指標相關性較大,且與其他指標距離很遠,自成一團。其他網(wǎng)絡指標均較分散。
基于降維后的兩個新變量,對樣本數(shù)據(jù)使用kmeans算法進行聚類,設定聚類數(shù)k為5,聚類結果可視化如圖4所示。其中橫坐標代表主成分1,縱坐標代表主成分2,不同顏色代表聚類情況。
基于kmeans算法的聚類根據(jù)兩個主成分將96個企業(yè)網(wǎng)站聚成3類,其中第1類(藍色)有16個,第2類(綠色)有2個,第3類(紅色)有1個。使用差異比指標對聚類效果進行評估,計算得三個聚類組內(nèi)的距離平方和分別是25.96、8.60和0,組間距離的平方和占整體距離平方和的81.8%,說明組間分離度大,組內(nèi)凝聚力強,差異比大,聚類效果較好。
對聚類的群組進行分析,第1類企業(yè)包括93個企業(yè),這些企業(yè)網(wǎng)站整體水平類似;第2類企業(yè)包括東方網(wǎng)絡和贏合科技,這兩個企業(yè)的網(wǎng)站鏈接數(shù)和外鏈接數(shù)很高,平均總鏈接數(shù)為36561.5,平均外鏈接數(shù)為36297,但內(nèi)鏈接數(shù)占總鏈接數(shù)的比值很低,平均低于0.01%;聯(lián)眾則單獨劃分為第3類,從圖可看見,它與其他企業(yè)的距離相隔很遠,差異較大,其總頁面數(shù)、總鏈接數(shù)和內(nèi)鏈接數(shù)都非常高,遠遠超出其他企業(yè)的平均水平。
4研究結論
從整體來看,上市公司潛力企業(yè)的網(wǎng)站建設情況一般。在研究樣本中,同一網(wǎng)站在指標上的優(yōu)劣情況存在較大差異,存在某個指標特別好,而其他指標一般的情況。而不同的網(wǎng)站之間在不同的指標上具有各自的優(yōu)勢。這些都表明網(wǎng)站的網(wǎng)絡影響力未引起這些企業(yè)的管理者和網(wǎng)站建設者的重視,這可能是研究樣本的企業(yè)大部分屬于傳統(tǒng)制造業(yè)或醫(yī)學藥學類,只有少數(shù)來自互聯(lián)網(wǎng)行業(yè),例如聯(lián)眾、陌陌科技等??梢园l(fā)現(xiàn),提供互聯(lián)網(wǎng)產(chǎn)品或軟件服務的潛力企業(yè),網(wǎng)站的網(wǎng)絡影響力情況要整體較好。此外,由于企業(yè)網(wǎng)站承擔的功能及其定位不一樣,這也會導致企業(yè)管理者或網(wǎng)站建設者在對待網(wǎng)站的影響力方面的態(tài)度差異。按照企業(yè)的網(wǎng)站規(guī)模與功能實現(xiàn),可以將其劃分為三大類:信息展示型企業(yè)網(wǎng)站、網(wǎng)上直銷型企業(yè)網(wǎng)站和綜合型電子商務網(wǎng)站。信息展示型的企業(yè)網(wǎng)站只是將網(wǎng)站作為一種信息載體,用于企業(yè)信息發(fā)布與形象展示,這類企業(yè)網(wǎng)站無論是總頁面數(shù)還是鏈接數(shù)都較低,而站內(nèi)鏈接數(shù)量則主要依賴于網(wǎng)站內(nèi)部的信息組織優(yōu)劣,在樣本中大量的企業(yè)網(wǎng)站都屬于這一類型;網(wǎng)上直銷型企業(yè)網(wǎng)站,網(wǎng)站建設增加了在線接受訂單和支付的功能模塊;綜合型電子商務網(wǎng)站除了以上的信息發(fā)布和展示、在線下單和支付功能以外,還集成了包括供應鏈管理在內(nèi)的整個企業(yè)流程一體化的信息處理系統(tǒng)。一般來說,網(wǎng)上直銷型企業(yè)網(wǎng)站的網(wǎng)絡營銷力大于綜合型電子商務網(wǎng)站,信息展示型企業(yè)網(wǎng)站的網(wǎng)絡影響力相對最弱。