• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      網(wǎng)絡(luò)鏈接分析的研究現(xiàn)狀及其發(fā)展趨勢

      2018-10-30 11:09:24夏琦
      現(xiàn)代商貿(mào)工業(yè) 2018年26期
      關(guān)鍵詞:搜索引擎

      夏琦

      摘 要:計(jì)算機(jī)技術(shù)和互聯(lián)網(wǎng)的應(yīng)用對網(wǎng)絡(luò)鏈接提出了更高要求,即對客戶心理和客戶需求分析的重視程度的加強(qiáng)。網(wǎng)絡(luò)鏈接分析是當(dāng)代網(wǎng)絡(luò)計(jì)量學(xué)的前沿和熱點(diǎn)研究方向之一,以超鏈接和超文本技術(shù)為基礎(chǔ)。對網(wǎng)絡(luò)鏈接分析的相關(guān)概念進(jìn)行了闡述,并著重從搜索引擎、網(wǎng)頁分布以及網(wǎng)絡(luò)鏈接指標(biāo)三個(gè)方面進(jìn)行國內(nèi)外研究情況分析和探討,最后對該領(lǐng)域的發(fā)展趨勢進(jìn)行了簡單論述。

      關(guān)鍵詞:網(wǎng)絡(luò)鏈接分析;搜索引擎;網(wǎng)頁分布;網(wǎng)絡(luò)鏈接指標(biāo)

      中圖分類號:TB 文獻(xiàn)標(biāo)識(shí)碼:A doi:10.19311/j.cnki.1672-3198.2018.26.089

      1 引言

      隨著計(jì)算機(jī)的發(fā)展應(yīng)用和互聯(lián)網(wǎng)的普及,當(dāng)今社會(huì)正逐步走向信息化和網(wǎng)絡(luò)化。基于網(wǎng)絡(luò)化服務(wù)和技術(shù)產(chǎn)業(yè)日漸成熟,并得到廣大民眾的認(rèn)同和使用。早在20世紀(jì)80年代末,歐洲原子物理實(shí)驗(yàn)室(CERN)提出了WEB理念,從而實(shí)現(xiàn)了局部范圍內(nèi)的數(shù)據(jù)傳輸和共享。隨著超文本標(biāo)記語言的開發(fā)和利用,互聯(lián)網(wǎng)進(jìn)入了飛速發(fā)展的時(shí)期。隨著對客戶心理和客戶需求分析的重視程度的加強(qiáng),網(wǎng)絡(luò)鏈接分析以其時(shí)效性、準(zhǔn)確性日益成為現(xiàn)代網(wǎng)絡(luò)分析和信息情報(bào)獲取的重要手段和方法,并且正逐漸發(fā)展成為當(dāng)代網(wǎng)絡(luò)計(jì)量學(xué)領(lǐng)域的前沿問題和研究方向,即網(wǎng)絡(luò)鏈接分析研究應(yīng)運(yùn)而生。

      2 網(wǎng)絡(luò)鏈接分析的國內(nèi)外研究現(xiàn)狀

      2.1 網(wǎng)絡(luò)鏈接分析

      網(wǎng)絡(luò)鏈接分析可以最早來源于“鏈接”一詞。鏈接,簡而言之就是定義和說明兩個(gè)或更多事物之間的關(guān)聯(lián)和內(nèi)外在聯(lián)系。隨著計(jì)算機(jī)技術(shù)的出現(xiàn)和互聯(lián)網(wǎng)的發(fā)展,以計(jì)算機(jī)網(wǎng)絡(luò)作為信息共享平臺(tái)的網(wǎng)絡(luò)鏈接技術(shù)成為網(wǎng)絡(luò)信息傳播和更新的重要手段。在統(tǒng)一資源定位符(URL,Uniform Resource Location)的基礎(chǔ)上,網(wǎng)絡(luò)鏈接利用超鏈接和超文本技術(shù),完成同一網(wǎng)站內(nèi)部的不同網(wǎng)頁,不同網(wǎng)站,以及系統(tǒng)內(nèi)外部的鏈接。正是通過這種鏈接技術(shù)的發(fā)展,并將其輻射到整個(gè)互聯(lián)網(wǎng)網(wǎng)絡(luò),無數(shù)分布在世界各地的計(jì)算機(jī)才能聯(lián)系到一起,構(gòu)成網(wǎng)絡(luò)的一部分。越來越多的網(wǎng)絡(luò)服務(wù)商也關(guān)注到了網(wǎng)絡(luò)鏈接的相關(guān)分析,甚至在學(xué)界也引起了巨大的轟動(dòng)和討論。很多學(xué)者認(rèn)為,網(wǎng)絡(luò)鏈接分析的實(shí)質(zhì)就是傳統(tǒng)文獻(xiàn)計(jì)量學(xué)中的“引文分析法”,或者將其稱之為“網(wǎng)絡(luò)引文分析”。正如學(xué)者蘇芳荔所指出的那樣,“文獻(xiàn)引文呈現(xiàn)出主題集中,網(wǎng)絡(luò)鏈接則呈現(xiàn)出主題發(fā)散?!毕啾戎?,筆者更認(rèn)同其作為一種在網(wǎng)絡(luò)計(jì)量學(xué)范疇中的對網(wǎng)絡(luò)鏈接規(guī)律及其分布的研究方法。張洋教授和趙蓉英教授在《網(wǎng)絡(luò)鏈接分析的基本術(shù)語及其規(guī)范化》一文中將其定義為“一種以網(wǎng)絡(luò)連接為研究對象,根據(jù)引文分析法的基本原理和方法,對網(wǎng)絡(luò)連接的分布規(guī)律和網(wǎng)絡(luò)信息單元之間的鏈接規(guī)律進(jìn)行分析研究的網(wǎng)絡(luò)信息計(jì)量學(xué)的特征研究方法”。該定義的提出對于全面而準(zhǔn)確地描述網(wǎng)絡(luò)鏈接分析的特點(diǎn)和作用具有跨時(shí)代的意義。

      2.2 搜索引擎的相關(guān)研究

      搜索引擎是網(wǎng)絡(luò)重要的鏈接工具和導(dǎo)航工具,也是網(wǎng)絡(luò)計(jì)量學(xué)研究的基本數(shù)據(jù)采集工具,更在網(wǎng)絡(luò)鏈接中發(fā)揮著越來越重要的關(guān)鍵作用。它指利用一些方法和策略從互聯(lián)網(wǎng)采集信息,通過標(biāo)引各種不同網(wǎng)站,從而建立系統(tǒng)的資源檢索機(jī)制,對網(wǎng)絡(luò)資源進(jìn)行組織、整理和分配,為用戶提供信息檢索服務(wù)。國內(nèi)外目前搜索引擎用得比較多的是如Baidu、Google、Alltheweb等。AltaVista和Alltheweb作為著名的搜索引擎,不僅能對網(wǎng)頁進(jìn)行站內(nèi)外檢索,更能統(tǒng)計(jì)出總鏈數(shù)、外內(nèi)鏈數(shù)以及鏈接影響因子等指標(biāo),其適用性強(qiáng)、查準(zhǔn)率高。

      雖然搜索引擎的種類和形式越來越多,其檢索性能也越來越強(qiáng)大和完善,但系統(tǒng)的查全率、查準(zhǔn)率以及穩(wěn)定性等都不盡如人意,而且隨著網(wǎng)絡(luò)鏈接分析的深入研究,這些傳統(tǒng)的檢索工具亟待更新和擴(kuò)展。1997年12月,AltaVista、ExciteLycos、NorthernLight等搜索引擎開始投入使用,32 億個(gè)網(wǎng)頁得到成功檢索,但與此同時(shí)我們發(fā)現(xiàn)一個(gè)重大的問題,即“所有的網(wǎng)絡(luò)搜索引擎的查全率都不能保障100%準(zhǔn)確,對于單個(gè)搜索引擎而言,它們最多只能檢索到所有網(wǎng)頁總數(shù)的三分之一”。有很多因素限制了搜索引擎的查全率,包括使用不同的檢索詞和檢索策略等。在對搜索引擎進(jìn)行研究的過程中,學(xué)者著重關(guān)注了不同網(wǎng)頁和不同站點(diǎn)之間的鏈接,其中網(wǎng)絡(luò)鏈接的覆蓋面、權(quán)重性成為了研究的重點(diǎn)和方向。英國文獻(xiàn)學(xué)家Snyder、Rosenbaum和Ingwersen等人研究了一些網(wǎng)頁和站點(diǎn)之間的鏈接關(guān)系,提出應(yīng)對搜索引擎進(jìn)行聯(lián)合以促進(jìn)信息共享。通過對網(wǎng)頁賦予不同的權(quán)重,并以此對其影響力進(jìn)行排序,谷歌的創(chuàng)始人SergeyBrin和LarryPage為用戶篩選和了解當(dāng)前關(guān)鍵信息的相關(guān)情況提供了幫助。在比較國內(nèi)外各種搜索引擎的使用情況時(shí),吳茵茵指出,由于通過AltaVista檢索到的中文信息要遠(yuǎn)多于Alltheweb,所以它更適合在中國的網(wǎng)絡(luò)計(jì)量學(xué)中進(jìn)行應(yīng)用。而邱均平教授在《中國大學(xué)網(wǎng)站鏈接分析及網(wǎng)絡(luò)影響因子的討論》中的文獻(xiàn)檢索情況卻表明返回的數(shù)據(jù)比Alta Vista要多。

      以上研究的結(jié)論和成果有助于量化信息的研究和規(guī)范化處理。此外,通過對搜索引擎的覆蓋范圍進(jìn)行限定和研究,能夠最大化的利用具有實(shí)用性的信息,從而提高搜索引擎的檢準(zhǔn)率。

      3 網(wǎng)絡(luò)鏈接分析的發(fā)展趨勢

      目前,網(wǎng)絡(luò)鏈接無論從連接工具、分析方法以及相關(guān)分析指標(biāo)都去得了一系列不俗成果,但是還存在不少問題。首先,很多學(xué)者認(rèn)為鏈接分析法的局限性問題是網(wǎng)絡(luò)鏈接分析的最大問題。鏈接分析是基于網(wǎng)站被鏈接與網(wǎng)站質(zhì)量之間的正向聯(lián)系的假設(shè),然而網(wǎng)絡(luò)信息數(shù)量大、類型多樣、增長迅速,此外任何人可以不通過嚴(yán)格的審查就在互聯(lián)網(wǎng)上發(fā)布信息,因此鏈接分析的基本假設(shè)能否成立就備受質(zhì)疑。其次,網(wǎng)絡(luò)的被鏈接數(shù)量和訪問數(shù)量是不盡相同的,而且即便在某種程度上具有一致性,也是由商業(yè)推廣的廣告商、贊助商所決定的,因此這種評價(jià)體系本身就缺乏一定的客觀性和真實(shí)性,因?yàn)樗袝r(shí)很難代表用戶的真實(shí)想法。此外,鏈接量的計(jì)算也受網(wǎng)絡(luò)鏈接抽取難度所限。網(wǎng)上數(shù)據(jù)形式復(fù)雜,除了半結(jié)構(gòu)化的數(shù)據(jù),如網(wǎng)頁、文檔等,還有一些非結(jié)構(gòu)化數(shù)據(jù)的存在,如圖像、動(dòng)畫、聲頻、視頻等格式的文件。目前,現(xiàn)有的信息識(shí)別和處理技術(shù)很難分析和辨別出后者這些文件中的鏈接,此外由于受到不同的腳本語言種類、程序員個(gè)人設(shè)計(jì)偏好的影響,分析和抽取動(dòng)態(tài)網(wǎng)頁的鏈接也十分困難,從而導(dǎo)致鏈接量的統(tǒng)計(jì)不準(zhǔn)確。學(xué)者陳穎儀在《網(wǎng)站訪問量與鏈接量關(guān)系的實(shí)證研究—以我國電子商務(wù)網(wǎng)站為例》一文中提到:“Alexa 訪問量排名是綜合用戶鏈接數(shù)和頁面瀏覽數(shù)后在網(wǎng)站之間進(jìn)行比較排序的結(jié)果,因此是相對值,只依據(jù)排名在一定程度上可能會(huì)影響相關(guān)性分析得準(zhǔn)確性?!崩罱淌趯υ诰W(wǎng)站評價(jià)過程中利用網(wǎng)絡(luò)鏈接分析法的做法提出了三點(diǎn)建議:第一是鏈接的動(dòng)態(tài)平衡情況需要被考慮;第二是“第一假設(shè)前提”的成立受到了諸多因素的限制;第三是鏈接指標(biāo)值的獲取使得商業(yè)搜索引擎在工作中可能遇到一些困難。網(wǎng)絡(luò)鏈接分析及其應(yīng)用研究的瓶頸主要在以下兩方面:一方面,必須全面考慮各種載體的具體情況,從鏈接動(dòng)機(jī)和鏈接類型出發(fā)區(qū)分網(wǎng)頁的權(quán)重,對鏈接進(jìn)行詳細(xì)的分類統(tǒng)計(jì),把對測定結(jié)果的解釋和應(yīng)用建立在統(tǒng)計(jì)指標(biāo)發(fā)展變化的內(nèi)部機(jī)理分析的基礎(chǔ)之上。另一方面,在鏈接分析中引入數(shù)據(jù)挖掘、知識(shí)發(fā)現(xiàn)、XML和元數(shù)據(jù)等先進(jìn)方法和技術(shù),不斷改進(jìn)搜索引擎的限制性搜索與控制功能,研制專業(yè)鏈接分析工具。這些控制方法和手段能夠減少網(wǎng)絡(luò)鏈接分析本身缺陷的負(fù)面影響,從而為網(wǎng)絡(luò)鏈接分析在不同領(lǐng)域的應(yīng)用打下基礎(chǔ)。

      總體而言,國內(nèi)外網(wǎng)絡(luò)鏈接各方面的研究還不夠成熟,而我們對其整體研究的思路比較狹窄,并沒有完全擺脫傳統(tǒng)文獻(xiàn)計(jì)量學(xué)的影響和束縛。對此,著名信息計(jì)量學(xué)家邱均平教授對網(wǎng)絡(luò)鏈接分析進(jìn)行了全面而詳細(xì)的論述,即為了繼續(xù)深入探討網(wǎng)絡(luò)鏈接分析及其實(shí)際應(yīng)用,需要在以下方面做出改進(jìn):一是對網(wǎng)絡(luò)鏈接分析的對象和特征進(jìn)行基礎(chǔ)性的理論研究,明確其定義、內(nèi)涵和特點(diǎn);二是對網(wǎng)絡(luò)鏈接分析的方法進(jìn)行研究,主要方法包括內(nèi)容分析方法,引文分析方法等,這些方法可以被廣泛靈活地運(yùn)用于網(wǎng)絡(luò)鏈接分析;三是對網(wǎng)絡(luò)鏈接分析工具進(jìn)行開發(fā),合理開發(fā)出用于網(wǎng)絡(luò)鏈接研究的專用軟件,以提高研究結(jié)果的可靠性;四是積極探索網(wǎng)絡(luò)鏈接分析新的應(yīng)用領(lǐng)域,擺脫現(xiàn)有的思想束縛,使網(wǎng)絡(luò)鏈接分析的應(yīng)用領(lǐng)域拓展到行業(yè)實(shí)踐中去。

      參考文獻(xiàn)

      [1]蘇芳荔.文獻(xiàn)引文分析、網(wǎng)絡(luò)鏈接分析和網(wǎng)絡(luò)引文分析的比較[J].情報(bào)探索,2010,(1).

      [2]張洋,趙蓉英.網(wǎng)絡(luò)鏈接分析的基本術(shù)語及其規(guī)范化[J].圖書情報(bào)工作,2007,(9).

      [3]LAWRENCE,C L GILES.Searching the World Wide Web [J].Science,280:98- 100.

      [4]楊木容.搜索引擎在網(wǎng)絡(luò)鏈接分析中的應(yīng)用研究[J].圖書情報(bào)工作,2006,(11).

      [5]Ingwersen P.The Calculation of Web Impact Factors [J].Journal of Documentation,1998,54(2):236-243.

      [6]Brin S.,Page L..The anatomy of a large scale hypertextual Web Search engine.Proc.1988 WWW Conf,1988[EB/OL].http//google.stanford.edu/~backrub/google.html,Dec 10,2002.

      [7]吳茵茵.不同搜索引擎在網(wǎng)絡(luò)因子分析中的比較研究[J].情報(bào)科學(xué),2005,(3).

      [8]邱均平,陳景全,段宇峰.中國大學(xué)網(wǎng)站鏈接分析及網(wǎng)絡(luò)影響因子的討論[J].中國軟件科學(xué),2003,(6).

      [9]陳穎儀.網(wǎng)站訪問量與鏈接量關(guān)系的實(shí)證研究——以我國電子商務(wù)網(wǎng)站為例[J] .中山大學(xué)研究生學(xué)刊(社會(huì)科學(xué)版),2005,(4).

      [10]李江.鏈接指標(biāo)用于網(wǎng)站評價(jià)的缺陷分析[J].圖書館雜志,2008,(5).

      [11]張洋,邱均平,文庭孝.網(wǎng)絡(luò)鏈接分析研究進(jìn)展[J].圖書情報(bào)知識(shí),2004,(5).

      [12]趙蓉英,段宇峰,邱均平.網(wǎng)絡(luò)信息計(jì)量學(xué)研究(1)——網(wǎng)絡(luò)鏈接研究的現(xiàn)狀及趨勢[J].情報(bào)學(xué)報(bào),2005,(2).

      猜你喜歡
      搜索引擎
      Chrome 99 Canary恢復(fù)可移除預(yù)置搜索引擎選項(xiàng)
      網(wǎng)絡(luò)搜索引擎亟待規(guī)范
      Nutch搜索引擎在網(wǎng)絡(luò)輿情管控中的應(yīng)用
      基于Nutch的醫(yī)療搜索引擎的研究與開發(fā)
      廣告主與搜索引擎的雙向博弈分析
      基于Lucene搜索引擎的研究
      知識(shí)漫畫
      一種自反饋式元搜索系統(tǒng)的設(shè)計(jì)
      搜索引擎,不止有百度與谷歌
      搜索,也要“深搜熟濾”
      闵行区| 金寨县| 永泰县| 治多县| 城固县| 师宗县| 农安县| 巴林左旗| 连州市| 锡林郭勒盟| 噶尔县| 鄂托克前旗| 荔浦县| 东源县| 剑阁县| 论坛| 沭阳县| 重庆市| 广平县| 胶州市| 万州区| 华蓥市| 手机| 应用必备| 太原市| 南丹县| 三穗县| 甘孜县| 青冈县| 新沂市| 昌吉市| 沂源县| 新野县| 沿河| 邵阳县| 龙陵县| 汕尾市| 宜黄县| 手游| 绿春县| 灌南县|