[摘要] 本文簡單介紹了專業(yè)搜索引擎,探討了專業(yè)搜索引擎和傳統(tǒng)搜索引擎的不同,闡明了其在信息資源中的重要性。
[關(guān)鍵詞] 專業(yè)搜索引擎 傳統(tǒng)搜索引擎
1990年以前,世界上沒有搜索引擎。伴隨著互聯(lián)網(wǎng)爆炸性的發(fā)展,面對海量的信息,許多人感嘆在互聯(lián)網(wǎng)上“只有想不到的,沒有找不到的”。目前, Intrenet 上綜合性的傳統(tǒng)搜索引擎發(fā)展日益成熟, 較好地滿足了廣大用戶的檢索需求。但網(wǎng)絡(luò)技術(shù)發(fā)展與網(wǎng)絡(luò)信息增長迅速, 網(wǎng)絡(luò)信息的用戶也越來越多, 相比之下,這些搜索引擎在索引數(shù)據(jù)庫的建設(shè)、信息的收集等方面存在很多不足, 導(dǎo)致了信息查準(zhǔn)率低、有用信息含量低、垃圾信息多等問題。傳統(tǒng)搜索引擎在滿足用戶的專業(yè)檢索需求時這些問題尤為突出, 這樣難以滿足專業(yè)人士的檢索需求, 2005年6月~7月清華大學(xué)圖書館進(jìn)行了“電子資源建設(shè)和使用讀者調(diào)查”, 發(fā)現(xiàn)78%的讀者認(rèn)為利用學(xué)術(shù)資源的重要途徑是搜索引擎, 讀者在遇到當(dāng)圖書館館藏不能滿足需求時, 讀者的主要解決辦法中有82.4%的讀者選擇用搜索引擎。因此, 應(yīng)開發(fā)搜索質(zhì)量更準(zhǔn)確、相關(guān)性更復(fù)雜的搜索引擎, 以追求在某一學(xué)科或某一行業(yè)領(lǐng)域有最佳的檢索效率及效果,各種專業(yè)搜索引擎隨之產(chǎn)生。
一、專業(yè)搜索引擎概述
專業(yè)搜索引擎是指應(yīng)用于搜索某一學(xué)科領(lǐng)域或某一類信息(如圖像、影像)的專業(yè)垂直搜索引擎,是搜索引擎的細(xì)分和延伸。是專為查詢某一學(xué)科或主題的信息而產(chǎn)生的查詢工具,是相對傳統(tǒng)搜索引擎的信息量大、查詢不準(zhǔn)確、深度不夠等提出來的新的搜索引擎服務(wù)模式。它是以構(gòu)筑某一專題或?qū)W科領(lǐng)域Internet網(wǎng)絡(luò)信息資源庫為目標(biāo),智能地在互聯(lián)網(wǎng)上搜集符合這一專題或領(lǐng)域需要的信息資源,能夠為包括學(xué)科信息門戶、專業(yè)信息機(jī)構(gòu)、特定行業(yè)領(lǐng)域、公司信息中心、行業(yè)專家等等在內(nèi)的信息用戶,提供整套的網(wǎng)絡(luò)信息資源開發(fā)方案的信息查詢與服務(wù)。因此也是當(dāng)前采集網(wǎng)絡(luò)信息資源的有力工具,是實現(xiàn)信息資源共享的必不可少的工具。
國內(nèi)外已有許多優(yōu)秀的專業(yè)搜索引擎。例如, WallStreet Research Network 是由美國WSRN 公司開發(fā)建立的經(jīng)濟(jì)與財經(jīng)類的專業(yè)搜索引擎,專門檢索經(jīng)濟(jì)研究、工商企業(yè)、市場新聞、共同基金、投資中介商和經(jīng)濟(jì)研究出版物等各類信息;皋陶搜索引擎是中國法律互聯(lián)網(wǎng)查詢程序,它收錄了大量的中文法律網(wǎng)站,內(nèi)容全面,分類科學(xué),其法律數(shù)據(jù)庫分為10個大類,上萬個細(xì)目,包括數(shù)千個法律相關(guān)網(wǎng)站,是目前互聯(lián)網(wǎng)上規(guī)模最大、最優(yōu)秀的中文專業(yè)搜索引擎。如果用戶想找電話、人名、電子郵件、地址等資料,就可以使用專用搜索引擎, 如全球華人尋人引擎(http:// www. look4.com)提供因特網(wǎng)上最強(qiáng)大的尋人功能,擁有100萬筆的中文姓名和e-mail 資料;若要檢索有關(guān)某個電影明星的信息, 那么http://us.imdb. com準(zhǔn)會提供很多這方面的信息,提供的信息量遠(yuǎn)遠(yuǎn)超過綜合大型搜索引擎;還有專門提供有關(guān)域名注冊信息、域名有效性測試等服務(wù)的域名搜索引擎、專門搜索網(wǎng)上免費(fèi)資料的搜索引擎、地圖搜索引擎、城市交通旅游電子地圖搜索引擎。
二、與傳統(tǒng)搜索引擎的區(qū)別
專業(yè)搜索引擎和傳統(tǒng)搜索引擎雖然都是幫助網(wǎng)絡(luò)用戶進(jìn)行網(wǎng)絡(luò)信息定位和查找的工具,但是二者在進(jìn)行信息服務(wù)的時候還是有很大的不同。
傳統(tǒng)的綜合搜索引擎提供整個互聯(lián)網(wǎng)上與用戶提問相關(guān)各種網(wǎng)頁信息,然后由用戶自己判斷結(jié)果中的信息哪些是相關(guān)的,哪些是不相關(guān)的。使用專業(yè)搜索引擎的用戶通常都有明確的信息需求,同時這種信息需求可以界定在某一個特定范圍內(nèi),并且滿足其信息需求的信息產(chǎn)品是特定形式的結(jié)構(gòu)化的信息,它提供的結(jié)果都是與用戶需求相關(guān)的,用戶不用自己再進(jìn)行分析和判斷。
從對關(guān)鍵字的選擇上可以看出兩者的差異:專業(yè)搜索引擎對用戶關(guān)鍵字的選擇要求很簡單,直接輸入要查找的產(chǎn)品名稱即可得到相關(guān)度很高的結(jié)果;而傳統(tǒng)搜索引擎則要求用戶對自己的信息需求很明確,并且完整、準(zhǔn)確的表達(dá)在搜索欄中,搜索引擎才能夠提供一定的相關(guān)信息,并且要求用戶自行對每一個信息的相關(guān)度進(jìn)行判斷。
傳統(tǒng)搜索引擎提供的搜索結(jié)果是網(wǎng)頁鏈接和關(guān)于該網(wǎng)頁的簡單描述,其中匹配的原則是網(wǎng)頁描述與關(guān)鍵字的相關(guān)度。而專業(yè)搜索引擎提供的搜索結(jié)果是結(jié)構(gòu)化的數(shù)據(jù),幾乎不需要用戶具體打開網(wǎng)頁就可以斷定是否是自己需要的結(jié)果。
通過傳統(tǒng)搜索引擎所查詢的結(jié)果往往是數(shù)量巨大的,結(jié)果覆蓋面比較廣。而專業(yè)搜索引擎因為檢索的網(wǎng)站數(shù)目有限,所以檢索結(jié)果的數(shù)量也維持在幾百個左右。但是,從查準(zhǔn)率的角度看,專業(yè)搜索引擎的準(zhǔn)確率很高,幾乎可以達(dá)到90%以上。因為這些特定的信息都是在特定的相關(guān)網(wǎng)站上查找的,所以可以保證它的準(zhǔn)確性。但是對于傳統(tǒng)搜索引擎而言,因為搜索引擎在廣泛的互聯(lián)網(wǎng)上查找,另外用戶也不可能準(zhǔn)確的表達(dá)信息需求,所以準(zhǔn)確率相對比較低。
綜上所述,專業(yè)搜索引擎這種高度目標(biāo)化、專業(yè)化的搜索引擎的優(yōu)勢在于,針對性強(qiáng),對特定范圍的網(wǎng)絡(luò)信息的覆蓋率相對較高,具有可靠的技術(shù)和信息資源保障,有明確的檢索目標(biāo)定位,有效地彌補(bǔ)了綜合性搜索引擎對專門領(lǐng)域及特定主題信息覆蓋率過低的問題。同時,能夠把具有相同興趣點(diǎn)的人們集中在一個“主題社區(qū)”內(nèi),不僅集中提供各種專業(yè)資源,而且給大家提供了一個相互交流、共享經(jīng)驗和教訓(xùn)、展望行業(yè)發(fā)展前景的機(jī)會和場合
參考文獻(xiàn):
[1]胡紅霞等:搜索引擎技術(shù)的現(xiàn)狀及發(fā)展趨勢.信息工程大學(xué)學(xué)報, 2001 (12)
[3]肖冬梅:垂直搜索引擎研究.圖書館學(xué)研究,2003.2