【摘要】隨著數(shù)據(jù)庫(kù)技術(shù)廣泛應(yīng)用在人們生活與生產(chǎn)工作中,可以有效的存儲(chǔ)、查詢(xún)與優(yōu)化結(jié)構(gòu)化數(shù)據(jù),關(guān)系數(shù)據(jù)庫(kù)是目前數(shù)據(jù)庫(kù)的主要應(yīng)用形式,主要通過(guò)用戶(hù)對(duì)結(jié)構(gòu)化的查詢(xún)語(yǔ)言檢索方式有一定的數(shù)據(jù)庫(kù)模式知識(shí)與查詢(xún)語(yǔ)言的掌握,然后進(jìn)行語(yǔ)言?xún)?nèi)容的檢索,而當(dāng)前所應(yīng)用的另一種檢索方式——信息檢索,是通過(guò)輸入關(guān)鍵詞的方式進(jìn)行檢索,用戶(hù)只要輸入關(guān)鍵詞,然后按回車(chē)或是檢索網(wǎng)頁(yè)就會(huì)出現(xiàn)許多與關(guān)鍵詞有關(guān)的資料。本文主要研究的是基于關(guān)系數(shù)據(jù)庫(kù)的關(guān)鍵詞查詢(xún)方式,有利于用戶(hù)快速找到所需要的資料,從而可以有效提高檢索效率。
【關(guān)鍵詞】關(guān)系數(shù)據(jù)庫(kù);信息檢索;查詢(xún)
1.前言
隨著互聯(lián)網(wǎng)的不斷發(fā)展,越來(lái)越多的用戶(hù)需要訪問(wèn)網(wǎng)絡(luò)數(shù)據(jù)庫(kù),然而由于用戶(hù)不具備一定的數(shù)據(jù)庫(kù)模式知識(shí),或者不了解查詢(xún)語(yǔ)言檢索方式,加之關(guān)系數(shù)據(jù)庫(kù)存儲(chǔ)文本數(shù)據(jù)越來(lái)越多,許多企業(yè)與個(gè)人需要實(shí)現(xiàn)文體數(shù)據(jù)與網(wǎng)絡(luò)結(jié)構(gòu)化數(shù)據(jù)的有效連接,由此產(chǎn)生了關(guān)系數(shù)據(jù)庫(kù)的關(guān)鍵詞查詢(xún)[1]。
2.基于關(guān)系數(shù)據(jù)庫(kù)的關(guān)鍵詞查詢(xún)問(wèn)題的概述
2.1 關(guān)鍵詞查詢(xún)與結(jié)構(gòu)化查詢(xún)
2.1.1 關(guān)鍵詞查詢(xún)
關(guān)鍵詞查詢(xún)是互聯(lián)網(wǎng)中普遍使用的一種數(shù)據(jù)搜索方式,即對(duì)語(yǔ)言信息的檢索技術(shù),例如Google、360搜索、百度、有道等。使用關(guān)鍵詞查詢(xún)技術(shù)具有一定的靈活性,在企業(yè)中應(yīng)用較為廣泛,并已取得一定的成效。采用關(guān)鍵詞查詢(xún)技術(shù)原理是指有效利于HTML文檔之間的連接關(guān)系,實(shí)現(xiàn)從一個(gè)網(wǎng)頁(yè)到另一個(gè)網(wǎng)頁(yè)的有效連接,并將網(wǎng)頁(yè)數(shù)據(jù)放到本地系統(tǒng)中進(jìn)行檢索與分析。當(dāng)用戶(hù)應(yīng)用關(guān)鍵詞查詢(xún)時(shí),搜索引擎會(huì)把與關(guān)鍵詞有關(guān)的網(wǎng)頁(yè)按照一定的算法進(jìn)行排序,然后以檢索結(jié)果的形式返回給用戶(hù)。通常情況下搜索引擎查詢(xún)數(shù)據(jù)分析與待搜索的數(shù)據(jù)源兩部分。所謂數(shù)據(jù)分析也就是搜索部分,主要是根據(jù)用戶(hù)所提供的關(guān)鍵詞,檢索與之相關(guān)的網(wǎng)頁(yè)信息,并按照一定的算法將檢索結(jié)果返回給用戶(hù)。待搜索的數(shù)據(jù)源是指互聯(lián)網(wǎng)的所有信息,即是指用戶(hù)在網(wǎng)絡(luò)檢索信息的來(lái)源[2]。
2.1.2 結(jié)構(gòu)化查詢(xún)
在傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)檢索中,通常是采用SQL語(yǔ)句完成檢索查詢(xún),而SQL指的是關(guān)系代數(shù)與關(guān)系演算的一種結(jié)構(gòu)化查詢(xún)語(yǔ)言方式,可以確保用戶(hù)準(zhǔn)確獲得想要的數(shù)據(jù)信息。采用SQL檢索查詢(xún)方式不僅具有一定的數(shù)據(jù)查詢(xún)功能,還具有數(shù)據(jù)處理與數(shù)據(jù)的定義功能。
2.2 關(guān)系數(shù)據(jù)庫(kù)與關(guān)鍵詞查詢(xún)結(jié)合的必要性
對(duì)于企業(yè)關(guān)系數(shù)據(jù)庫(kù)的應(yīng)用,大多數(shù)都是文本文檔與結(jié)構(gòu)化數(shù)據(jù)同時(shí)應(yīng)用。因此,如何有效將兩種信息結(jié)合成為一個(gè)核心的課題。也可以說(shuō),文本文檔與結(jié)構(gòu)化數(shù)據(jù)的有機(jī)結(jié)合是許多企業(yè)共同的美好愿望,在一定程度上可以有效提高企業(yè)的效益。為了文本文檔與結(jié)構(gòu)化數(shù)據(jù)的有機(jī)結(jié)合,需要通過(guò)關(guān)系數(shù)據(jù)庫(kù)與關(guān)鍵詞查詢(xún)技術(shù)的融合來(lái)實(shí)現(xiàn)。
就當(dāng)前網(wǎng)絡(luò)搜索引擎發(fā)展的情況來(lái)說(shuō),許多搜索引擎可以提供半結(jié)構(gòu)化數(shù)據(jù)支持,例如XML。然而這些半結(jié)構(gòu)化數(shù)據(jù)支持在實(shí)際應(yīng)用中還存在著一些問(wèn)題:①半結(jié)構(gòu)化數(shù)據(jù)支持的搜索引擎一般不具有數(shù)據(jù)庫(kù)的查詢(xún)優(yōu)化作用;②半結(jié)構(gòu)化數(shù)據(jù)支持的搜索引擎只能提供有限的結(jié)構(gòu)化查詢(xún)能力,當(dāng)數(shù)據(jù)信息轉(zhuǎn)換成HTML文檔后將永久不變,當(dāng)數(shù)據(jù)更新時(shí)會(huì)生成新的相應(yīng)的HTML文檔,占有較大的數(shù)據(jù)存放空間,也容易造成關(guān)系數(shù)據(jù)的丟失。由此可以看出,關(guān)系數(shù)據(jù)庫(kù)查詢(xún)技術(shù)不支持文本文檔格式,而關(guān)鍵詞查詢(xún)技術(shù)則缺少結(jié)構(gòu)化查詢(xún)的有效優(yōu)化。因此,將關(guān)系數(shù)據(jù)庫(kù)查詢(xún)技術(shù)與關(guān)鍵詞查詢(xún)技術(shù)結(jié)合起來(lái),可以將兩者取長(zhǎng)補(bǔ)短,有利于實(shí)現(xiàn)關(guān)系數(shù)據(jù)庫(kù)的關(guān)鍵詞查詢(xún)技術(shù),可以有效提高關(guān)系數(shù)據(jù)庫(kù)的查詢(xún)技術(shù)的開(kāi)放性與靈活性[3]。
3.基于關(guān)系數(shù)據(jù)庫(kù)的關(guān)鍵詞查詢(xún)
基于關(guān)系數(shù)據(jù)庫(kù)的關(guān)鍵詞查詢(xún)主要有基于模式圖的方法與基于數(shù)據(jù)圖的方法兩大類(lèi)。在基于模式圖的方法中主要是利用數(shù)據(jù)庫(kù)模式圖獲得所要檢索結(jié)果,然后根據(jù)一定的算法進(jìn)行排序,將檢索結(jié)果轉(zhuǎn)換成SQL語(yǔ)句的形式,并在數(shù)據(jù)庫(kù)中執(zhí)行,使用戶(hù)得到所需的檢索結(jié)果。而在基于數(shù)據(jù)圖的方法中,關(guān)鍵詞查詢(xún)直接對(duì)數(shù)據(jù)庫(kù)中的元組進(jìn)行處理,然后將生成的元組連接樹(shù)結(jié)果返回給用戶(hù)。目前在許多關(guān)于關(guān)鍵詞檢索都采用基于數(shù)據(jù)圖的方式進(jìn)行檢索。
目前我國(guó)基于數(shù)據(jù)圖的關(guān)系數(shù)據(jù)庫(kù)的關(guān)鍵詞查詢(xún)方式主要存在著以下二個(gè)方面問(wèn)題:①采用數(shù)據(jù)圖的方式進(jìn)行檢索存在著重復(fù)性文檔格式,導(dǎo)致檢索效率下降。因此需要運(yùn)用試探法有效減少內(nèi)存使用的文檔格式,可以有效提高檢索效率;②是采用數(shù)據(jù)圖的方式進(jìn)行檢索需要占用較大的內(nèi)存空間[4]。
在基于關(guān)系數(shù)據(jù)庫(kù)的關(guān)鍵詞檢索中,可以有效的運(yùn)用數(shù)據(jù)庫(kù)的數(shù)據(jù)圖結(jié)構(gòu),將問(wèn)題的解空間以數(shù)據(jù)的形式定義,然后由數(shù)據(jù)庫(kù)的元組構(gòu)成解空間圖的結(jié)點(diǎn),元組間的主外鍵關(guān)系構(gòu)成圖中結(jié)點(diǎn)間的邊。然后采用試探法的優(yōu)化檢索方式深入優(yōu)化檢索解空間的問(wèn)題解,也就是與用戶(hù)所提供關(guān)鍵詞的相關(guān)查詢(xún)結(jié)果。采用試探法在檢索的過(guò)程,并不在用戶(hù)的計(jì)算機(jī)中保存全部的解空間,而是一邊生成解答樹(shù)中的結(jié)點(diǎn),一邊丟棄結(jié)點(diǎn),因此在檢索的過(guò)程中,計(jì)算機(jī)只保存了檢索開(kāi)始時(shí)的結(jié)點(diǎn)到當(dāng)前檢索結(jié)果的結(jié)點(diǎn),從而有效減少數(shù)據(jù)信息所占的內(nèi)存,提高檢索效率。
4.結(jié)語(yǔ)
關(guān)系數(shù)據(jù)庫(kù)的關(guān)鍵詞查詢(xún)技術(shù)是現(xiàn)代信息檢索與數(shù)據(jù)庫(kù)信息研究的熱點(diǎn)課題,可以有效解決用戶(hù)多個(gè)關(guān)鍵詞查詢(xún)的需求,有利于快速?gòu)木W(wǎng)絡(luò)數(shù)據(jù)庫(kù)中查詢(xún)出與關(guān)鍵詞相關(guān)的信息,目前,關(guān)系數(shù)據(jù)庫(kù)的關(guān)鍵詞查詢(xún)技術(shù)已得到廣泛的使用,并且可以有效提高用戶(hù)檢索效率,提高網(wǎng)絡(luò)數(shù)據(jù)庫(kù)信息的訪問(wèn)率[5]。
參考文獻(xiàn)
[1]郗君甫,劉國(guó)華,唐軍軍.基于本體的關(guān)系數(shù)據(jù)庫(kù)關(guān)鍵詞語(yǔ)義查詢(xún)擴(kuò)展方法[J].燕山大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2010,12(01):180-182.
[2]蔡宏艷,姚佳麗,王珊珊.DETECTOR:基于關(guān)系數(shù)據(jù)庫(kù)通用的在線關(guān)鍵詞查詢(xún)系統(tǒng)[J].計(jì)算機(jī)研究與發(fā)展,2009,16(03):137-139.
[3]張曉穎,李昕麗,王文娟.一種關(guān)系數(shù)據(jù)庫(kù)上的關(guān)鍵詞查詢(xún)排序方法[J].遼寧工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2013, 11(02):103-104.
[4]郗君甫,王海賓,文繼軍.基于關(guān)系數(shù)據(jù)庫(kù)關(guān)鍵詞的評(píng)分函數(shù)研究[J].邢臺(tái)職業(yè)技術(shù)學(xué)院學(xué)報(bào)(自然科學(xué)版),2011,33(20):157-158.
[5]王佳宜,楊路明,張華兵.基于關(guān)系數(shù)據(jù)庫(kù)的關(guān)鍵詞查找排序策略[J].計(jì)算機(jī)工程與設(shè)計(jì),2009,33(17):192-193.