閆機超
摘? 要: 隨著網(wǎng)絡(luò)信息量的增長,在給人們帶來豐富的共享資源的同時,也給人們查詢信息帶來了困難。在此背景下,以一些小型網(wǎng)站或企業(yè)集團內(nèi)部網(wǎng)絡(luò)搜索引擎存在的問題(搜索覆蓋率低、搜索速度慢)為對象,利用RFID技術(shù)對網(wǎng)絡(luò)搜索引擎進行自適應(yīng)優(yōu)化。優(yōu)化分為兩部分:對傳統(tǒng)搜索引擎進行分析,確定存在的問題以及原因;利用RFID技術(shù)實現(xiàn)搜索引擎優(yōu)化。結(jié)果表明,優(yōu)化后的網(wǎng)絡(luò)搜索引擎較優(yōu)化前,搜索覆蓋率提高、搜索速度加快,由此說明該研究能夠為提高信息查詢質(zhì)量提供一些借鑒和參考。
關(guān)鍵詞: 自適應(yīng)優(yōu)化; 搜索引擎分析; RFID技術(shù); 網(wǎng)絡(luò)信息查詢; 搜索引擎優(yōu)化; 性能測試
中圖分類號: TN711?34; TP315.61? ? ? ? ? ? ? ? ? 文獻標識碼: A? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2020)19?0062?03
Abstract: With the increase of network information content, it not only brings about abundant shared resources for the people, but also brings about difficulties to people′s information query. In this context, RFID technology is adopted to optimize the network search engine adaptively for solving the problems existing in some small websites or enterprise groups, such as low search coverage and slow search speed. The optimization is divided into two parts: the traditional search engine is analyzed to identify the existing problems and reasons; RFID technology is used to achieve search engine optimization. The simulation testing results show that the search coverage rate and search speed of the optimized web search engine are higher than those of? the unoptimizable one, which indicates that this study can provide a reference for improving the quality of information query.
Keywords: adaptive optimization; search engine analysis; RFID Technology; network information query; search engine optimization; performance testing
0? 引? 言
隨著信息技術(shù)與通信網(wǎng)絡(luò)的發(fā)展,信息交互在人們的日常工作、學(xué)習(xí)和生活中占據(jù)了重要地位。通過無線網(wǎng)絡(luò)人們可以突破時間、空間的限制,實時共享資源。經(jīng)調(diào)查分析,在2011年,我國網(wǎng)民的數(shù)量就達到了5億以上,且這一數(shù)字每年仍在以接近40%的速度在不斷上漲,預(yù)計到2020年,我國網(wǎng)民的數(shù)量將接近我國人口總量[1]。在此背景下,計算機網(wǎng)絡(luò)中網(wǎng)頁的數(shù)量也在不斷增大,這也就導(dǎo)致網(wǎng)絡(luò)中信息量以幾何形式呈現(xiàn)爆炸式的增長。為此,網(wǎng)絡(luò)為人們提供了所需的各類信息的同時,也給人們帶來了一大難題,那就是如何在海量的信息中快速且準確地找到自己所需要的信息變得越來越困難。1990年由Montreal的McGill University三名學(xué)生率先提出了Archie,它是第一個自動索引互聯(lián)網(wǎng)上匿名FTP網(wǎng)站文件的程序,但它還不是真正的搜索引擎[2]。隨后受其啟發(fā),不同的搜索引擎被發(fā)明出來,到目前為止,最常用的3個搜索引擎為百度、谷歌和雅虎,但是搜索引擎技術(shù)不僅局限于這些專門的搜索引擎網(wǎng)站,在一些小型網(wǎng)站或企業(yè)集團內(nèi)部中同樣需要適應(yīng)于自身的搜索引擎技術(shù)。然而,這些小型網(wǎng)站或企業(yè)集團內(nèi)部中搜索引擎技術(shù)并不是很成熟,主要體現(xiàn)在根據(jù)用戶指令從網(wǎng)絡(luò)中搜索信息時,搜索覆蓋率較低,導(dǎo)致檢測出的信息出現(xiàn)不全面或不準確的現(xiàn)象[3]。此外,信息檢索速度也是一大缺陷,影響了服務(wù)質(zhì)量。
根據(jù)上述情況,本文針對小型搜索引擎,利用RFID技術(shù)對其進行自適應(yīng)優(yōu)化,以期提高搜索覆蓋率以及搜索速度。最后經(jīng)測試,優(yōu)化后的網(wǎng)絡(luò)搜索引擎的搜索覆蓋率以及搜索速度較優(yōu)化前有了極大的提高,達到了研究的目的,改善了信息檢索質(zhì)量以及網(wǎng)絡(luò)服務(wù)質(zhì)量[4]。
1? RFID技術(shù)優(yōu)化網(wǎng)絡(luò)搜索引擎
搜索引擎優(yōu)化是指針對搜索引擎原理,使網(wǎng)站內(nèi)容更容易、更迅速地被檢索到,以便用戶查詢信息[5]。對于搜索引擎優(yōu)化主要有兩種方式,即搜索引擎定位和搜索引擎排名,從定位角度和排名角度對引擎進行優(yōu)化。以往搜索引擎優(yōu)化多是從排名的角度進行,很少從定位角度進行優(yōu)化,而從信息搜索過程上看,定位是排名的基礎(chǔ),只有準確定位出所需信息,才能更好地進行排名,因此本文從定位角度對搜索引擎進行優(yōu)化,即利用RFID技術(shù)提高搜索引擎搜索能力,研究過程[6]具體如圖1所示。
1.1? 網(wǎng)絡(luò)搜索引擎研究
搜索引擎定義:根據(jù)用戶輸出的指令要求,按照設(shè)置好的程序從特定的網(wǎng)絡(luò)上搜索相關(guān)信息,然后對其按照一定的先后順序進行排列處理,并將其結(jié)果呈現(xiàn)給用戶,以便實現(xiàn)用戶信息檢索的目的[7]。一個搜索引擎主要由四部分組成,如圖2所示。
圖2中搜索引擎各組成部分的功能如表1所示。
根據(jù)表1中的說明,可以將搜索引擎的工作歸納為三個環(huán)節(jié):從互聯(lián)網(wǎng)上抓取信息、建立索引數(shù)據(jù)庫以及搜索排序。以往搜索引擎優(yōu)化的主要作用在第三個環(huán)節(jié),用來提高排序功能,從而達到優(yōu)化的目的,對前兩個環(huán)節(jié)并沒有過多關(guān)注,導(dǎo)致信息搜索查全率和查準率并沒有提高多少,因為沒有從根本上解決問題。因此在本研究中應(yīng)用RFID技術(shù),在簡化信息搜集過程的同時,實現(xiàn)信息的查全和查準[10]。
1.2? 網(wǎng)絡(luò)搜索引擎優(yōu)化研究
根據(jù)上述網(wǎng)絡(luò)搜索引擎的研究以及存在問題,本節(jié)對其進行優(yōu)化研究。該研究主要內(nèi)容為通過RFID技術(shù)提高搜索引擎搜索功能,主要針對傳統(tǒng)搜索引擎的前兩個環(huán)節(jié)進行,具體包括RFID技術(shù)研究以及引擎優(yōu)化實現(xiàn)[11]。
1) RFID技術(shù)
RFID技術(shù)是一種非接觸式的自動識別通信技術(shù),通過無線電信號識別特定目標,并讀寫相關(guān)數(shù)據(jù),其基本組成如圖3所示[12]。
電子標簽又叫射頻卡或應(yīng)答器,主要負責(zé)儲存被識別物體的相關(guān)信息,相當于被識別物體的銘牌。電子標簽一般會被貼在被識別物體表面,很少會儲存在物體內(nèi)部,而其中所蘊含的信息需要下一元件——讀寫器進行讀取[13]。電子標簽組成結(jié)構(gòu)如圖4所示。
電子標簽的出現(xiàn),使得每個物品都具有了獨一無二的“身份證”,根據(jù)該身份證,從信息出現(xiàn)到被應(yīng)用都將變得“有跡可循”。
讀寫器也稱為閱讀器,是位于電子標簽與應(yīng)用系統(tǒng)之間的一種設(shè)備,主要負責(zé)利用射頻技術(shù)識別電子標簽內(nèi)的內(nèi)容并將需要儲存的信息寫入到電子標簽內(nèi),其組成結(jié)構(gòu)如圖5所示[14]。
數(shù)據(jù)處理系統(tǒng)位于閱讀器之后,主要負責(zé)信息的采集和處理。該系統(tǒng)主要包括中間件與應(yīng)用軟件系統(tǒng)兩部分,其中,中間件的作用是對閱讀器讀取到的電子標簽內(nèi)的內(nèi)容進行過濾、分類等處理;應(yīng)用軟件系統(tǒng)主要起到協(xié)調(diào)、控制作用。
2) 搜索引擎優(yōu)化實現(xiàn)
當蜘蛛程序在網(wǎng)絡(luò)上爬行并下載信息時,會在不斷的遍歷中,逐一給遍歷過的網(wǎng)頁一個URL,并放到一個隊列中去,直至所有網(wǎng)頁搜集完畢。之后,根據(jù)傳統(tǒng)搜索引擎步驟進行特征提取,建立文檔庫,而應(yīng)用RFID技術(shù)后,就無需再進行該步驟,這也是本次利用RFID技術(shù)優(yōu)化網(wǎng)絡(luò)搜索引擎的關(guān)鍵。蜘蛛程序在遍歷過程中直接生成電子標簽,貼在表面,在后續(xù)檢索時,直接就可以根據(jù)用戶指令,通過電子標簽檢索出相關(guān)信息,再進行排序就完成了整個信息搜索過程,具體如圖6所示[15]。
2? 搜索性能仿真測試
為驗證本次優(yōu)化后網(wǎng)絡(luò)搜索引擎的有效性,進行仿真測試。該仿真測試以新華網(wǎng)地方板塊為例,進行網(wǎng)頁爬行,以此分析搜索引擎的優(yōu)化結(jié)果。
網(wǎng)頁介紹:由于在該地方板塊中集中了目前各地方發(fā)展與建設(shè)情況的介紹,以此形成了一個龐大的網(wǎng)絡(luò)信息結(jié)構(gòu)。本次從中選取“養(yǎng)老問題”作為實驗查詢主題。在新華網(wǎng)這個龐大信息網(wǎng)絡(luò)中,一共搜索到關(guān)于“養(yǎng)老問題”主題的47 859張網(wǎng)頁,以此為基礎(chǔ)進行搜索。
測試指標:本次網(wǎng)絡(luò)搜索引擎優(yōu)化的目標是提高搜索覆蓋率以及搜索速度,因此本次實驗的測試指標就以上述兩個指標為搜索引擎性能測試標準,其公式如下:
1) 搜索覆蓋率
查全率[R]:檢出的相關(guān)文獻數(shù)量[A]與系統(tǒng)全部相關(guān)文獻量[C]的百分比。
查準率[P]:指檢出的相關(guān)文獻量[A]與檢出文獻總量[B]的比率。
2) 檢索速度
檢索速度指規(guī)定時間內(nèi)檢索出的相關(guān)網(wǎng)頁數(shù)量,單位為張/s。
測試平臺采用Microsoft Visual Basic 7.0進行測試,其結(jié)構(gòu)組成如圖7所示。
搜索引擎性能結(jié)果如表2所示。由表2可知,利用優(yōu)化后的搜索引擎搜索關(guān)于“養(yǎng)老問題”主題的相關(guān)網(wǎng)頁,得到查全率為96.57%、查準率為95.46%、搜索速度為10.36張/s。與優(yōu)化前的搜索引擎搜索結(jié)果對比,這一結(jié)果要更好,達到了本次研究的預(yù)期目標。
3? 結(jié)? 語
互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展極大地促進了信息資源共享的發(fā)展,但與此同時,人們要想從龐大的信息中獲取到自己想要的信息變得異常困難。為此,本文研究一種有效的搜索引擎具有重要的意義。在本研究中將RFID技術(shù)應(yīng)用其中,不但簡化了信息檢索步驟,提高了搜索速度,還增大了搜索覆蓋率,實現(xiàn)了更有效的信息檢索。
參考文獻
[1] 魏政磊,趙輝,韓邦杰,等.具有自適應(yīng)搜索策略的灰狼優(yōu)化算法[J].計算機科學(xué),2017,44(3):259?263.
[2] 袁志會.上市公司門戶網(wǎng)站搜索引擎優(yōu)化情況調(diào)查研究:以汽車制造業(yè)為例[J].現(xiàn)代商貿(mào)工業(yè),2017(7):65?66.
[3] 李德華,鞏宇,張自鋒,等.基于.net構(gòu)建海量非結(jié)構(gòu)文本與用戶行為協(xié)同的搜索引擎研究[J].軟件工程,2018,21(5):42?47.
[4] 李敏.基于搜索引擎優(yōu)化技術(shù)與模板引擎技術(shù)的網(wǎng)站優(yōu)化策略初探[J].通訊世界,2017(9):45?46.
[5] 馬原,沈煒,賈宇波.AngularJS框架的搜索引擎優(yōu)化策略與實現(xiàn)[J].工業(yè)控制計算機,2017,30(4):113?114.
[6] 孫新杰,潘水凡,李偉,等.大數(shù)據(jù)下校內(nèi)搜索引擎優(yōu)化研究:以六盤水師范學(xué)院為例[J].信息通信,2018(6):116?117.
[7] 黃元銓.基于搜索引擎排序算法的搜索引擎優(yōu)化方法探討[J].數(shù)字通信世界,2017(3):131?133.
[8] 劉曉敏,張艷麗,聶磊.物流管理網(wǎng)站的搜索引擎優(yōu)化策略研究[J].商場現(xiàn)代化,2017(13):39?41.
[9] 謝人強,葉福蘭.基于信息生態(tài)視角的網(wǎng)站搜索引擎優(yōu)化策略評價研究:以華為在線商城為例[J].科技促進發(fā)展,2017,13(7):516?522.
[10] 鄭燕娥,鄭志明.基于Heritrix與Solr的就業(yè)主題搜索引擎的研究與優(yōu)化[J].齊齊哈爾大學(xué)學(xué)報(自然科學(xué)版),2018,34(4):13?20.
[11] 劉麗媛.方便搜索引擎抓取內(nèi)容的SEO優(yōu)化如何做[J].計算機與網(wǎng)絡(luò),2017,43(24):46?47.
[12] 何競松,彭光強,李清,等.基于嵌入式單片機的移動網(wǎng)絡(luò)信息采集系統(tǒng)[J].電子設(shè)計工程,2018,26(23):182?185.
[13] 曹偉,江平宇,江開勇,等.基于RFID技術(shù)的離散制造車間實時數(shù)據(jù)采集與可視化監(jiān)控方法[J].計算機集成制造系統(tǒng),2017,23(2):273?284.
[14] 周先軍,曹基軍,周瑾,等.基于關(guān)鍵詞提煉的搜索引擎優(yōu)化方案[J].科技創(chuàng)新與應(yīng)用,2016(12):78?79.
[15] 葉偉洲,吳汝趁,蔡志崗.基于RFID技術(shù)的智能檔案管理研究[J].現(xiàn)代電子技術(shù),2017,40(6):109?113.