摘要:垂直搜索引擎能有效地提高針對專門主題信息搜索的準度和精度,建立網(wǎng)絡(luò)教育資源垂直搜索引擎,可以從互聯(lián)網(wǎng)中海量的信息中,獲得專門的網(wǎng)絡(luò)教育資源信息,并且還可以對這些信息進行結(jié)構(gòu)化處置,為廣大學生和教育工作者提供方便的獲取網(wǎng)絡(luò)教育資源的方式,因此本文研究網(wǎng)絡(luò)教育資源垂直搜索引擎,首先介紹了垂直搜索引擎的特點和結(jié)構(gòu),然后分析了網(wǎng)絡(luò)教育資源垂直搜索引擎的作用,最后提出了網(wǎng)絡(luò)教育資源垂直搜索引擎建設(shè)的關(guān)鍵,為垂直搜索引擎在網(wǎng)絡(luò)教育資源中應(yīng)用提供一定的指導(dǎo)。
關(guān)鍵詞:垂直搜索引擎;網(wǎng)絡(luò)教育資源;信息采集;網(wǎng)絡(luò)爬蟲
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2018)33-0169-02
隨著科技的進步和網(wǎng)絡(luò)技術(shù)的發(fā)展,互聯(lián)網(wǎng)上有越來越多的網(wǎng)絡(luò)教育資源,為豐富教學手段,提高教育質(zhì)量提供了有效的支撐。但是,目前互聯(lián)網(wǎng)上的網(wǎng)絡(luò)教育資源種類繁多,信息量巨大,如何在浩如煙海的網(wǎng)絡(luò)教育資源中準確地找到想要的資源的難度也日益加大,盡管搜索引擎能夠在一定程度上解決網(wǎng)絡(luò)教育資源信息搜索的部分問題,但是在信息的準確性和針對性上難以滿足需要,垂直搜索引擎的出現(xiàn)為解決專業(yè)領(lǐng)域的搜索提供了有效的途徑。建立網(wǎng)絡(luò)教育資源垂直搜索引擎,可以從互聯(lián)網(wǎng)中海量的信息中,獲得專門的網(wǎng)絡(luò)教育資源信息,并且還可以對這些信息進行結(jié)構(gòu)化處置,為廣大學生和教育工作者提供方便的獲取網(wǎng)絡(luò)教育資源的方式。
1 垂直搜索引擎介紹
垂直搜索引擎也被叫作主題搜索引擎或者專業(yè)搜索引擎,與普通的通用搜索引擎不同,它是專門針對某一特定領(lǐng)域或者主題提供搜索服務(wù)的,跟通用搜索引擎相比,垂直搜索引擎查詢的信息更加精準。般的垂直搜索引擎由信息采集模塊、信息分析模塊、信息索引模塊和信息查詢模塊四個部分組成。信息采集模塊負責在互聯(lián)網(wǎng)上查找網(wǎng)頁信息,信息分析模塊負責并對所采集的網(wǎng)頁內(nèi)容進行解析、過濾、分詞處理;信息索引模塊對采集到的信息分析之后進行倒排序的方式存放到索引數(shù)據(jù)庫中;用戶接口模塊根據(jù)用戶輸入的關(guān)鍵詞,從索引數(shù)據(jù)庫中找到相關(guān)的網(wǎng)頁,并根據(jù)相關(guān)度排序?qū)⒕W(wǎng)址和網(wǎng)頁摘要反饋給用戶。
1.1 信息采集模塊
信息采集模塊的功能是在互聯(lián)網(wǎng)上搜集主題相關(guān)的信息,它主要是通過網(wǎng)絡(luò)爬蟲來開展工作。網(wǎng)絡(luò)爬蟲是一個在互聯(lián)網(wǎng)自動下載網(wǎng)頁的程序,它的工作方式通常是從一個或者一組特定的初始URL開始,按照特定的規(guī)律從一個網(wǎng)頁爬行到另一個網(wǎng)頁,在爬行的過程中,通過相關(guān)的分析方法識別用于的網(wǎng)絡(luò)鏈接,將其放入待抓取URL隊列,過濾掉與主題不相關(guān)的網(wǎng)頁鏈接,然后再URL隊列中按照一定的策略選取下一步要抓取的網(wǎng)頁,重復(fù)上述過程,直到滿足特定的條件停止抓取。
1.2 信息的分析模塊
信息分析模塊是垂直搜索引擎的核心,通過它來判斷所爬取網(wǎng)頁的結(jié)構(gòu),判斷所爬取網(wǎng)頁的內(nèi)容與主題的相關(guān)性,提取網(wǎng)頁中的結(jié)構(gòu)化信息,它保證垂直搜索引擎搜索信息的準確性和專業(yè)性。信息分析模塊里設(shè)置相關(guān)的主題識別規(guī)則和主題分析算法,網(wǎng)絡(luò)爬蟲依據(jù)這些規(guī)則和算法,判斷所爬取的網(wǎng)頁與主題的相關(guān)性,根據(jù)判斷的結(jié)果,過濾掉與主題相關(guān)度小或者無關(guān)的網(wǎng)頁,將與主題相關(guān)的網(wǎng)頁保持在主題數(shù)據(jù)庫中。
1.3 信息索引模塊
信息索引模塊的主要功能是將信息采集模塊采集的網(wǎng)頁建立類似目錄的數(shù)據(jù)文件,并且將其保持在數(shù)據(jù)庫中,方便快速檢索。信息索引模塊涉及眾多復(fù)雜關(guān)鍵技術(shù),首先它將網(wǎng)頁中的信息抽取出來,通過分詞、研判、語義分析等手段將信息結(jié)構(gòu)化處理,然后按照一定的規(guī)則構(gòu)建索引,將信息合理排序,然后存入數(shù)據(jù)庫中。
1.4 用戶接口模塊
用戶接口模塊是垂直搜索引擎與用戶交互的模塊,它主要功能是提供界面接受用戶的查詢請求,并將查詢結(jié)果反饋給用戶。另外它也提供一些與主題或者業(yè)務(wù)相關(guān)的,方便用戶的其他服務(wù)功能。用戶接口模塊的工作方式是首先接受用戶查詢關(guān)鍵詞,然后將用戶查詢的關(guān)鍵詞進行分詞等處理,接著在索引數(shù)據(jù)庫中查詢與關(guān)鍵詞匹配的信息,并將這些信息按照一定的規(guī)則進行排序,最后將命中的記錄以超鏈接的方式反饋給用戶。
2 網(wǎng)絡(luò)教育資源垂直搜索的作用
隨著互聯(lián)網(wǎng)的發(fā)展和網(wǎng)絡(luò)教育的興起,為網(wǎng)絡(luò)教育資源垂直搜索引擎的建設(shè)提供了動力。網(wǎng)絡(luò)教育資源垂直搜索引擎,定向抽取互聯(lián)網(wǎng)絡(luò)的教育資源數(shù)據(jù),將互聯(lián)網(wǎng)中專門的教育資源信息進行整合,并且按照一定的形式呈現(xiàn)給用戶。與通用搜索引擎相比,由于網(wǎng)絡(luò)教育資源垂直搜索引擎,只采集和維護與教育資源相關(guān)的網(wǎng)頁,并且對網(wǎng)頁中的內(nèi)容進行挖掘和處理,因此與通用搜索引擎比起來,搜索結(jié)果更加全面,搜索分類更加精細,搜索內(nèi)容更加及時。垂直搜索引擎的專業(yè)性和精確性,應(yīng)用在網(wǎng)絡(luò)教育資源中,可以為教育領(lǐng)域的用戶提供精確的檢索服務(wù)。不斷有助于提高教學水平,也能夠增強教學質(zhì)量。
2.1 有助于提高教學水平
現(xiàn)代教育需要通過豐富的教學手段和教育資源來輔助教學,網(wǎng)絡(luò)教育資源為輔助教學提供巨大的便利,但是隨著互聯(lián)網(wǎng)的迅速發(fā)展,如何在海量的網(wǎng)絡(luò)信息資源中找到所需的教育資源,成為當前教育工作者頭疼的問題。垂直搜索引擎正式解決這一難點的有效途徑,通過垂直搜索引擎,建立起教育主題專業(yè)搜索工具,不斷能有效地搜索教育資源信息,還能將這些教育資源有條理的,結(jié)構(gòu)化地呈現(xiàn),方便教育工作者高效的搜索自己所需要的教育資源,為其構(gòu)建自己的教育資料庫,搭建教學環(huán)境,提供相關(guān)課程信息,豐富教學手段和方法,從而提高教學水平。
2.2 有利于加強教學質(zhì)量
豐富的網(wǎng)絡(luò)教育資源,同樣為學生提供了便利的學習環(huán)境和學習手段。網(wǎng)絡(luò)教育資源垂直搜索引擎,提高了網(wǎng)絡(luò)教育資源的利用效率,使學生根據(jù)自身的特點和需求,有目標的選擇學習資源,快速的搜索和得到自己需要的網(wǎng)絡(luò)教育資源,搭建自己的網(wǎng)絡(luò)學習環(huán)境,提高學習興趣,變被動學習為主動學習。另外垂直搜索引擎還能為學生提供教育主題相關(guān)的其他教學輔助功能,提供專業(yè)化、個性化的網(wǎng)絡(luò)課堂,成為教室之外的第二課堂,從而加強教學質(zhì)量。
3 網(wǎng)絡(luò)教育資源垂直搜索引擎建設(shè)的建議
由于垂直搜索引擎精確性、專業(yè)性的特點,有大量的理論工作者和實踐工作者將垂直搜索引擎應(yīng)用在教育資源領(lǐng)域,取得了豐碩的成果。為了垂直搜索引擎在網(wǎng)絡(luò)教育資源中展開更深入的應(yīng)用,獲得更好的應(yīng)用效果,結(jié)合現(xiàn)代教育的特點,在分析垂直搜索引擎在教育資源中應(yīng)用的現(xiàn)狀后,提出如下建議
3.1 需要強化信息分析
提供精準的專業(yè)的搜索結(jié)果一直是垂直搜索引擎的研究熱點,而信息分析能力是保證垂直搜索引擎搜索信息的準確性和專業(yè)性的關(guān)鍵,是垂直搜索引擎的關(guān)鍵,通過它來判斷所爬取網(wǎng)頁的結(jié)構(gòu),判斷所爬取網(wǎng)頁的內(nèi)容與主題的相關(guān)性,提取網(wǎng)頁中的結(jié)構(gòu)化信息,它保證垂直搜索引擎搜索信息的準確性和專業(yè)性。因此在網(wǎng)絡(luò)教育資源垂直搜索引擎的構(gòu)建中,需要強化信息分析能力,也就是對網(wǎng)頁內(nèi)容的精確分析能力。網(wǎng)頁內(nèi)容分析的關(guān)鍵是自然語言處理和語義分析,當前理論研究者和實踐工作者在自然語言處理,包括中文處理取得了巨大的進展,有許多值得參考和借鑒的分析手段和方法,需要將這些成果應(yīng)用到網(wǎng)絡(luò)教育資源垂直搜索引擎中,提高分析能力。
3.2 需要豐富個性化服務(wù)
不同的用戶由于受教育水平、學習工作環(huán)境等因素的不同而具有鮮明的個性,這就要求垂直搜索引擎能夠提供個性化服務(wù),使得查詢結(jié)果符合用戶的個性要求。因此,如何提高垂直搜索引擎檢索結(jié)果的精度并向用戶提供個性化服務(wù)已成為垂直搜索引擎技術(shù)的一個新的發(fā)展方向和研究熱點。垂直搜索引擎要能根據(jù)每個用戶的學習特點提供資源,要能建立用戶的興趣模型,確定用戶的興趣范圍,并能對興趣模型進行更新,做好用戶的向?qū)А?/p>
3.3 需要增強用戶交互
當前,普通搜索引擎紛紛通過提供內(nèi)容服務(wù),展開用戶調(diào)查等手段強化其與用戶的交換,許多成熟的垂直搜索引擎也紛紛嘗試豐富用戶交換的手段,比如提供在線交流,提供問題反饋等。教育本身就是一個需要交換的過程,網(wǎng)絡(luò)教育垂直搜索引擎更需要順應(yīng)這一趨勢,通過豐富的交互手段,增強與用戶交互,從而提高網(wǎng)絡(luò)教育資源垂直搜索引擎使用效率和效果。
4 總結(jié)與展望
本文研究網(wǎng)絡(luò)教育資源垂直搜索引擎,首先介紹了垂直搜索引擎的特點和結(jié)構(gòu),然后分析了網(wǎng)絡(luò)教育資源垂直搜索引擎的作用,最后提出了網(wǎng)絡(luò)教育資源垂直搜索引擎建設(shè)的關(guān)鍵,為垂直搜索引擎在網(wǎng)絡(luò)教育資源中應(yīng)用提供一定的借鑒和指導(dǎo)。在以后的研究中,將會具體實現(xiàn)網(wǎng)絡(luò)教育資源垂直搜索引擎,并且檢驗其效果。
參考文獻:
[1] 傅麗君,潘旭偉,李娜.集成自動分類的垂直搜索引擎及其應(yīng)用[J].情報雜志,2012,(12).
[2] 鄭凱明,李義杰.垂直搜索引擎及其應(yīng)用價值[J].信息技術(shù),2008,(4):45-47.
[3] 楊皖蘇,閆冬.垂直搜索引擎發(fā)展策略探討[J].商業(yè)時代,2009,(23):94-95.
[4] 劉暢.綜合搜索引擎與垂直搜索引擎的比較研究[J].情報科學,2007,(1):97-102.
[5] 劉媛媛.基于本體的教育資源檢索系統(tǒng)研究[J].電腦知識與技術(shù),2017,(35):1-2.
[6] 劉媛媛,楊曉雪.基于云計算的教學資源共享平臺的設(shè)計與應(yīng)用研究[J].科學與財富,2015,(8).
[7] 劉媛媛,魯立.基于云計算的教育信息資源共享平臺研究[J].科技資訊,2014,(24):25.
【通聯(lián)編輯:梁書】