摘 要:互聯(lián)網(wǎng)的快速發(fā)展帶來了電子商務(wù)的應(yīng)用和普及。垂直搜索引擎憑借高效的“為客戶找客戶”的商機(jī)信息搜索機(jī)制在電子商務(wù)中有較成熟的利用,不僅滿足了電子商務(wù)企業(yè)精確搜索的需求,還提升了電子商務(wù)企業(yè)網(wǎng)絡(luò)營(yíng)銷的質(zhì)量,同時(shí)促進(jìn)了電子商務(wù)的發(fā)展。本文首先介紹了垂直搜索引擎的概念及其在電子商務(wù)中的應(yīng)用,然后分析設(shè)計(jì)了垂直電子商務(wù)平臺(tái)引擎系統(tǒng),并對(duì)系統(tǒng)進(jìn)行了測(cè)試。測(cè)試結(jié)果表明,本系統(tǒng)檢索的準(zhǔn)確率、召回率都大大高于通用搜索引擎,達(dá)到了預(yù)期的設(shè)計(jì)目的。
關(guān)鍵詞:電子商務(wù);垂直搜索引擎
中圖分類號(hào):TP393.092
1 垂直電子商務(wù)模式
1.1 電子商務(wù)模式
電子商務(wù)模式主要有B2C(Business to Customer)、B2B(Business to Business)、C2C(Customer to Customer)三種模式。B2C是指企業(yè)對(duì)消費(fèi)者的電子商務(wù)模式,是指通過信息網(wǎng)絡(luò)以電子數(shù)據(jù)信息流通的方式實(shí)現(xiàn)企業(yè)與消費(fèi)者之間的各種交易活動(dòng)。B2B表示企業(yè)與企業(yè)之間通過互聯(lián)網(wǎng)進(jìn)行產(chǎn)品、服務(wù)及信息的交換,按照交易對(duì)象發(fā)布信息來建立商家之間的橋梁。C2C表示顧客與顧客之間的電子商務(wù)模式,允許個(gè)人發(fā)布所要出售的物品公告,相比于另兩種電子商務(wù)模式,C2C發(fā)展最為迅速。
1.2 垂直搜索引擎
垂直搜索引擎的概念,是指針對(duì)某一特定領(lǐng)域或者有特定需求的人而構(gòu)建的搜索引擎,即專業(yè)搜索引擎或主題搜索引擎。與一般的通用搜索引擎相比較而言,垂直搜索引擎具有更專業(yè)化、特色化的特點(diǎn)。垂直搜索主要體現(xiàn)在定向的網(wǎng)絡(luò)自助程序、信息的抽取、頁(yè)面的排序技術(shù)、查詢結(jié)果頁(yè)面的呈現(xiàn)方式這幾個(gè)方面。
1.3 垂直搜索在B2B電子商務(wù)中的應(yīng)用
在我國(guó)B2B電子商務(wù)主要有行業(yè)垂直型電子商務(wù)模式和水平型的綜合類B2B電子商務(wù)模式。垂直電子商務(wù)模式是電子商務(wù)B2B模式的細(xì)化,它的特征主要體現(xiàn)在對(duì)特定領(lǐng)域、特定人群、特定需求的客戶提供一系列符合其特定需求的相關(guān)信息和服務(wù),在深度上下功夫,通過深耕細(xì)作,把行業(yè)做透、做深,專業(yè)化程度比較高。近年來信息化背景下的網(wǎng)絡(luò)應(yīng)用的快速發(fā)展促進(jìn)了電子商務(wù)的發(fā)展,使得垂直電子商務(wù)B2B發(fā)展模式引起了廣泛關(guān)注。而垂直搜索引擎憑借高效的“為客戶找客戶”的商機(jī)信息搜索機(jī)制,恰恰在B2B電子商務(wù)中得以發(fā)揮作用,滿足了中小企業(yè)精確搜索需求,提升了中小企業(yè)的網(wǎng)絡(luò)營(yíng)銷質(zhì)量,同時(shí)也促進(jìn)了電子商務(wù)的進(jìn)化。
2 垂直電子商務(wù)平臺(tái)引擎系統(tǒng)
2.1 系統(tǒng)功能需求分析
在搜索引擎技術(shù)日漸成熟的今天,人們?cè)絹碓诫x不開搜索引擎所帶來的快捷服務(wù),然而通用的搜索引擎在人們的需求前已經(jīng)愈顯疲憊,越來越不能滿足人們的特殊需求。為了更好地為人們的日常生活、學(xué)習(xí)、工作服務(wù),垂直搜索引擎應(yīng)運(yùn)而生。某產(chǎn)品琳瑯滿目,有不同品牌,同一品牌又有不同類別與不同型號(hào),這一產(chǎn)品的相關(guān)信息在互聯(lián)網(wǎng)上更是海量,這種情況下針對(duì)這一產(chǎn)品構(gòu)建一個(gè)垂直搜索引擎系統(tǒng),實(shí)現(xiàn)站內(nèi)搜索,具有重要意義。系統(tǒng)需要設(shè)計(jì)爬行策略,編寫爬蟲,對(duì)網(wǎng)頁(yè)源代碼進(jìn)行爬行,并進(jìn)行相關(guān)分析,分析主要利用正則表達(dá)式去匹配;所以部分通過Lucene進(jìn)行構(gòu)建,利用Lucene在全文檢索方面的優(yōu)勢(shì),提高系統(tǒng)性能;最終設(shè)計(jì)搜索返回界面,以清晰直觀的搜索結(jié)果返回給用戶,使用戶能夠快速查找到用戶最滿意的產(chǎn)品。
2.2 系統(tǒng)整體架構(gòu)
垂直電子商務(wù)平臺(tái)引擎主要的功能模塊有信息采集模塊、索引模塊、檢索模塊和用戶管理模塊。其中,網(wǎng)頁(yè)索引的建立和網(wǎng)頁(yè)檢索的處理是垂直搜索引擎的核心技術(shù)。這四個(gè)主要功能模塊結(jié)合其他網(wǎng)頁(yè)結(jié)構(gòu)化處理和信息檢索技術(shù)實(shí)現(xiàn)完善的搜索的引擎。垂直電子商務(wù)引擎系統(tǒng)采用多層設(shè)計(jì)架構(gòu),實(shí)現(xiàn)系統(tǒng)的靈活性和負(fù)載型的統(tǒng)一。
3 垂直電子商務(wù)平臺(tái)引擎系統(tǒng)設(shè)計(jì)
垂直電子商務(wù)平臺(tái)引擎系統(tǒng)的開發(fā)與實(shí)現(xiàn)。垂直電子商務(wù)平臺(tái)采用.net平臺(tái)開發(fā),數(shù)據(jù)庫(kù)采用sql server2005。本系統(tǒng)采用面向?qū)ο蟮姆椒ㄟM(jìn)行設(shè)計(jì)和處理,系統(tǒng)具有較高的可擴(kuò)展性和可維護(hù)性。
3.1 數(shù)據(jù)庫(kù)設(shè)計(jì)
設(shè)計(jì)和操作維護(hù)數(shù)據(jù)庫(kù)時(shí),要確保數(shù)據(jù)正確地分布到數(shù)據(jù)庫(kù)表中,規(guī)范化設(shè)計(jì)數(shù)據(jù)庫(kù)表。減少數(shù)據(jù)冗余可以節(jié)省物理空間,也有利于數(shù)據(jù)的維護(hù)和一致性檢查。
3.2 功能模塊的設(shè)計(jì)
系統(tǒng)主要模塊設(shè)計(jì)為信息采集模塊、檢索模塊、索引模塊和用戶管理模塊等功能模塊。
信息采集模塊:其功能是對(duì)HTML網(wǎng)頁(yè)進(jìn)行信息采集,從而收集并保存用戶需求的網(wǎng)頁(yè)信息。在設(shè)計(jì)信息采集模塊時(shí)首先要對(duì)用戶需要采集的網(wǎng)站定制采集規(guī)則,之后才能進(jìn)行信息采集。由于不同的網(wǎng)站頁(yè)面結(jié)構(gòu)不一致,同一網(wǎng)站的不同頁(yè)面之間結(jié)構(gòu)大致一致,所以只要為每一個(gè)網(wǎng)站定制采集規(guī)則。
索引模塊:這一模塊主要包括索引的建立與刪除。在上一模塊中采集的信息進(jìn)行內(nèi)容分析后為建立索引做好準(zhǔn)備。建立索引指將網(wǎng)頁(yè)文檔經(jīng)過去重、文檔重要排序之后建立索引。
檢索模塊:該模塊的功能是根據(jù)用戶提供的關(guān)鍵字來實(shí)現(xiàn)對(duì)索引的查找,查找后返回結(jié)果。檢索功能首先接收用戶輸入的關(guān)鍵字,對(duì)其進(jìn)行分析,然后在索引中進(jìn)行查找,并將相應(yīng)的查找結(jié)果返回給用戶,并向用戶輸出可視化的輸入輸出界面。搜索主要包含三部分,即初始化索引搜索、構(gòu)建查詢、搜索并返回結(jié)果。
用戶管理模塊:主要負(fù)責(zé)對(duì)用戶的賬號(hào)進(jìn)行管理。詳細(xì)內(nèi)容為:輸入用戶名與密碼,查詢匹配數(shù)據(jù)庫(kù),若用戶名與密碼正確則進(jìn)入采集后臺(tái),若用戶名與密碼不正確,則彈出登錄失敗錯(cuò)誤對(duì)話框。若該用戶屬于admin賬戶,則能夠操作后臺(tái)的任何模塊。若屬于user用戶,則只能操作采集模塊,包括信息的采集、刪除以及搜索;采集規(guī)則的定義、修改與刪除;分類的添加、刪除與修改。而不能操作索引的建立、刪除,以及賬戶的添加、刪除與修改。
4 系統(tǒng)測(cè)試
4.1 系統(tǒng)性能測(cè)試
系統(tǒng)功能測(cè)試主要測(cè)試系統(tǒng)的功能是否達(dá)到設(shè)計(jì)要求、系統(tǒng)的健壯程度和容錯(cuò)能力、系統(tǒng)的安全性。性能測(cè)試是網(wǎng)站的基本性能,主要測(cè)試網(wǎng)站的負(fù)載能力。主要通過白盒測(cè)試、頁(yè)面鏈接測(cè)試和安全性測(cè)試三個(gè)方面來進(jìn)行。
4.2 測(cè)試工具
測(cè)試工具選擇Microsoft Web Application Stress Tool(Web應(yīng)用負(fù)載測(cè)試工具),簡(jiǎn)稱WAS,是微軟發(fā)布的一個(gè)專門測(cè)試web負(fù)載能力的高級(jí)工具。它主要是通過使用簡(jiǎn)單的方法模擬大量用戶進(jìn)行訪問目標(biāo)網(wǎng)站。
4.3 測(cè)試步驟
第一步:創(chuàng)建測(cè)試腳本錄制;第二步:錄制測(cè)試腳本。創(chuàng)建好測(cè)試腳本后,WAS會(huì)自動(dòng)啟動(dòng)瀏覽器,進(jìn)行默認(rèn)的web負(fù)載測(cè)試,此時(shí),可關(guān)閉瀏覽器,并停止測(cè)試腳本錄制,進(jìn)行下一步的錄制配置;第三步:設(shè)置負(fù)載選項(xiàng),開始測(cè)試。
4.4 測(cè)試結(jié)果
本文采用白盒測(cè)試、鏈接測(cè)試、安全測(cè)試方法對(duì)系統(tǒng)的功能進(jìn)行了測(cè)試;通過第三方軟件Microsoft Web Application Stress Tool對(duì)系統(tǒng)性能進(jìn)行測(cè)試。兩種測(cè)試結(jié)果表明,系統(tǒng)達(dá)到設(shè)計(jì)要求,實(shí)現(xiàn)預(yù)期目的。
5 結(jié)語(yǔ)
本文首先介紹了垂直搜索引擎的概念及其在電子商務(wù)中的應(yīng)用,然后分析設(shè)計(jì)了垂直電子商務(wù)平臺(tái)引擎系統(tǒng),并對(duì)系統(tǒng)進(jìn)行了測(cè)試。衡量垂直搜索引擎的兩個(gè)最重要的標(biāo)準(zhǔn)是索引相關(guān)內(nèi)容比率和查準(zhǔn)率。在保證內(nèi)容全面的情況下,要盡量提高索引相關(guān)內(nèi)天的比率和關(guān)鍵詞的查準(zhǔn)率,這樣才能體現(xiàn)出垂直搜索精準(zhǔn)快的特點(diǎn),通過測(cè)試本系統(tǒng)檢索的準(zhǔn)確率、召回率都大大高于通用搜索引擎,達(dá)到了預(yù)期的設(shè)計(jì)目的。走專業(yè)化道路,對(duì)目標(biāo)市場(chǎng)細(xì)分,是未來企業(yè)發(fā)展的基本趨勢(shì),也是B2B電子商務(wù)發(fā)展的基本方向。本系統(tǒng)的局限性在于只能夠使用PC操作,隨著智能手機(jī)的用戶越來越多,移動(dòng)商務(wù)的需求也越來越強(qiáng)烈,垂直電子商務(wù)平臺(tái)的未來開發(fā)目標(biāo)應(yīng)是開發(fā)基于各種移動(dòng)設(shè)備的客戶端,從而實(shí)現(xiàn)移動(dòng)商務(wù)。
參考文獻(xiàn):
[1]林濤.垂直搜索的出路[J].中國(guó)企業(yè)家,2009(2):35-38.
[2]王寧寧.淺談CNNIC最新報(bào)告對(duì)垂直搜索引擎領(lǐng)域的啟示[J].圖書館理論與實(shí)踐,2009(1):64-66.
[3]李全喜,馬曉苗.電子商務(wù)模式及其發(fā)展趨勢(shì)研究[J].情報(bào)科學(xué),2005.
[4]劉娟,瞿彭志.行業(yè)垂直類B2B網(wǎng)站的專業(yè)性初探——以中國(guó)化工網(wǎng)和GlobalSpec為例進(jìn)行分析[J].當(dāng)代經(jīng)濟(jì),2009.