◆王麗穎
(保利國(guó)防科技研究中心有限公司 北京 100088)
互聯(lián)網(wǎng)搜索引擎的特型展現(xiàn)技術(shù)
◆王麗穎
(保利國(guó)防科技研究中心有限公司 北京 100088)
互聯(lián)網(wǎng)搜索引擎一經(jīng)問(wèn)世便為人們的生活帶來(lái)了極大的便利,有效提高了信息搜索的效率與質(zhì)量,而特型展現(xiàn)技術(shù)的運(yùn)用,使得搜索引擎再次得到發(fā)展,為用戶(hù)帶來(lái)了更加優(yōu)質(zhì)的信息搜索體驗(yàn)。本文將就特型展現(xiàn)技術(shù)在互聯(lián)網(wǎng)搜索引擎中的運(yùn)用方式展開(kāi)全面論述,希望能夠?qū)π畔⑺阉饕娴陌l(fā)展提供一定助益。
信息資源;互聯(lián)網(wǎng);搜索引擎;特型展現(xiàn)技術(shù)
現(xiàn)代人們對(duì)于網(wǎng)頁(yè)信息搜索的要求正在逐步提升,要求信息搜索必須要達(dá)到一定的效率以及準(zhǔn)確度,信息服務(wù)要更加人性化、智能化。而特型展現(xiàn)技術(shù)的推出,改變了以往單一的信息搜索解答方式,不覺(jué)會(huì)得到更加豐富的信息收索結(jié)果,能夠滿足不同使用者的需求,同時(shí)信息形式更加多樣化,能夠成功激發(fā)出用戶(hù)的新需求,可以有效促進(jìn)互聯(lián)網(wǎng)的發(fā)展。
1.1 特型展現(xiàn)技術(shù)
特性展現(xiàn)起源于谷歌,指的是運(yùn)用信息圖譜形式來(lái)對(duì)用戶(hù)的搜索需求進(jìn)行滿足,會(huì)根據(jù)用戶(hù)提供的關(guān)鍵詞,提供出完整性的信息內(nèi)容{1}。這種技術(shù)在對(duì)信息內(nèi)容進(jìn)行展示時(shí),還會(huì)在相應(yīng)位置提供信息圖譜,像同領(lǐng)域人物、百科以及圖片等等,這樣不僅能夠滿足客戶(hù)的信息收索需求,同時(shí)還能為客戶(hù)提供更多信息選擇,服務(wù)更加人性化。這一技術(shù)的到來(lái),使搜索引擎迎來(lái)了新的時(shí)代,各大網(wǎng)頁(yè)都對(duì)推出了相應(yīng)的特型展現(xiàn)模式,該項(xiàng)技術(shù)的發(fā)展前景值得期待。
1.2 搜索引擎
所謂“搜索引擎”就是指,運(yùn)用互聯(lián)網(wǎng)進(jìn)行信息收集,并在整理之后提供給用戶(hù)進(jìn)行查詢(xún)的信息系統(tǒng)[2]。目前我們已經(jīng)進(jìn)入到了大數(shù)據(jù)時(shí)代,網(wǎng)絡(luò)信息內(nèi)容規(guī)模極大,如果直觀進(jìn)行信息提取難度較大。為了方便用戶(hù)進(jìn)行使用,互聯(lián)網(wǎng)網(wǎng)站會(huì)通過(guò)信息搜索的方式,來(lái)提升相關(guān)信息的提取效率。主要是因?yàn)樗阉饕鎸?shí)際就是一種網(wǎng)絡(luò)服務(wù)設(shè)備,主要分為查詢(xún)軟件、搜索軟件以及索引軟件三部分內(nèi)容,其索引數(shù)據(jù)庫(kù)規(guī)模極大,通過(guò)三種軟件的相互配合與使用,便能實(shí)現(xiàn)短時(shí)間內(nèi)對(duì)信息內(nèi)容的查詢(xún)工作。
通過(guò)對(duì)特型展現(xiàn)技術(shù)的分析可以發(fā)現(xiàn),該技術(shù)結(jié)構(gòu)主要分為功能層、資源層以及中間資源層與控制層四部分內(nèi)容[3]。而特型展現(xiàn)基礎(chǔ)與主要技術(shù)主要有知識(shí)生成、知識(shí)庫(kù)構(gòu)建以及語(yǔ)義分析技術(shù)等內(nèi)容,而按照互聯(lián)網(wǎng)環(huán)境特征而言,知識(shí)挖掘是以及網(wǎng)絡(luò)為基礎(chǔ)的數(shù)據(jù)提取方式。
就互聯(lián)網(wǎng)本質(zhì)而言,其可以被視綜合型功能信息庫(kù),會(huì)對(duì)信息實(shí)施過(guò)濾以及采集等處理之后,通過(guò)對(duì)文檔分類(lèi)技術(shù)的運(yùn)用,來(lái)對(duì)網(wǎng)頁(yè)頁(yè)面類(lèi)型進(jìn)行區(qū)分。且會(huì)就用戶(hù)視角,對(duì)用戶(hù)信息進(jìn)行后期追蹤,從而判斷出用戶(hù)的信息查詢(xún)喜好,從而建立起用戶(hù)專(zhuān)屬樣本模型,進(jìn)而向其提供更加合理的信息服務(wù)。同時(shí)特型展現(xiàn)技術(shù)會(huì)對(duì)數(shù)字信息進(jìn)行轉(zhuǎn)化,將其規(guī)劃到特定分類(lèi)體系之中,形成中間資源層,進(jìn)而妥善解決知識(shí)共享與知識(shí)融合存在的弊端,保證獨(dú)立本體之間能夠構(gòu)建起良好地關(guān)系表,實(shí)現(xiàn)共享與融合模式的切實(shí)落實(shí),促進(jìn)互聯(lián)網(wǎng)搜索引擎的發(fā)展。
3.1 建設(shè)知識(shí)庫(kù)
在進(jìn)行知識(shí)和建設(shè)時(shí),技術(shù)人員需要對(duì)五種知識(shí)庫(kù)進(jìn)行構(gòu)建:(1)屬性型。技術(shù)會(huì)按照實(shí)體、屬性以及相關(guān)附加信息的模式,進(jìn)行該類(lèi)型知識(shí)庫(kù)的建立,以便人們?cè)谶M(jìn)行信息搜索時(shí),能夠得到更加全面的內(nèi)容,像胡歌-職業(yè)-演員等等,會(huì)對(duì)資源信息進(jìn)行有效挖掘,庫(kù)中資源以半結(jié)構(gòu)化知識(shí)以及結(jié)構(gòu)化知識(shí)為主;(2)專(zhuān)有名詞型。庫(kù)中資源以應(yīng)用領(lǐng)域?qū)CY源、分類(lèi)以及熱度等專(zhuān)名信息為主;(3)上下層型。在該知識(shí)庫(kù)內(nèi),用信息儲(chǔ)存都有著一定的概念聯(lián)系,像植物-花卉-水仙等,是層次逐漸細(xì)化的概念組成方式,主要用于概念泛化以及推廣等方面;(4)標(biāo)簽型。顧名思義該知識(shí)庫(kù)就是對(duì)信息內(nèi)容進(jìn)行標(biāo)簽與分類(lèi),以便對(duì)其進(jìn)行后續(xù)信息的搜索與推送,像電影捉妖記的標(biāo)簽為電影、搞笑、奇幻等,會(huì)對(duì)實(shí)體描述進(jìn)行一定程度的補(bǔ)充;(5)相關(guān)型。該知識(shí)庫(kù)是運(yùn)用實(shí)體內(nèi)在聯(lián)系,像人物之間的關(guān)聯(lián),如鄧超與孫儷是夫妻關(guān)系等等,來(lái)對(duì)信息進(jìn)行組合。
3.2 知識(shí)挖掘技術(shù)
知識(shí)挖掘技術(shù)主要分為兩種,一種是知識(shí)資源整合技術(shù),而另一種是整合資源再挖掘技術(shù)。在進(jìn)行知識(shí)資源整合時(shí),該項(xiàng)技術(shù)會(huì)對(duì)用戶(hù)日志、百科知識(shí)以及領(lǐng)域知識(shí)與網(wǎng)頁(yè)資源進(jìn)行信息價(jià)值開(kāi)發(fā)與整理,并將結(jié)果整合成為實(shí)體信息數(shù)據(jù)庫(kù),這里的信息資源不僅儲(chǔ)存量較為豐富,而且能夠?qū)π畔㈥P(guān)聯(lián)屬性進(jìn)行精準(zhǔn)描述,信息處理更加智能。
在信息完成整合之后,為了實(shí)現(xiàn)資源價(jià)值的最大化,還會(huì)運(yùn)用資源挖掘技術(shù)對(duì)其內(nèi)在價(jià)值進(jìn)行開(kāi)發(fā)。像“三元組”挖掘技術(shù),可以自動(dòng)對(duì)相應(yīng)領(lǐng)域內(nèi)部的垂直站點(diǎn)半結(jié)構(gòu)以及結(jié)構(gòu)信息進(jìn)行開(kāi)發(fā)。知識(shí)挖掘過(guò)程實(shí)際就是通過(guò)人工資能學(xué)以及統(tǒng)計(jì)學(xué)對(duì)資源實(shí)施整合與相應(yīng)處理,主要會(huì)運(yùn)用時(shí)間序列分析、數(shù)理統(tǒng)計(jì)以及多元統(tǒng)計(jì)等方式來(lái)完成相應(yīng)的任務(wù)。而人工智能手段多以自動(dòng)機(jī)為主,會(huì)對(duì)人類(lèi)思維為模擬基礎(chǔ),對(duì)現(xiàn)實(shí)世界問(wèn)題進(jìn)行科學(xué)分析與處理,該項(xiàng)技術(shù)在知識(shí)挖掘運(yùn)用過(guò)程中,多以成熟性技術(shù)與算法為主,像模糊邏輯、人工神經(jīng)網(wǎng)絡(luò)以及規(guī)則推理等等。同時(shí)“專(zhuān)家系統(tǒng)技術(shù)”以及“運(yùn)籌學(xué)技術(shù)”等新型技術(shù)也應(yīng)用到了該項(xiàng)工作之中,為工作發(fā)展方向帶來(lái)了新的啟發(fā),信息資源挖掘水平勢(shì)必會(huì)得到不斷的提升。
3.3 語(yǔ)義分析技術(shù)
3.3.1 內(nèi)涵
與傳統(tǒng)只對(duì)關(guān)鍵詞進(jìn)行搜索的信息搜尋方式有所不同,語(yǔ)義分析技術(shù)的應(yīng)用會(huì)使信息搜索變得更加智能化,會(huì)對(duì)關(guān)鍵詞進(jìn)行更加深入的分析,并會(huì)對(duì)關(guān)鍵詞實(shí)體類(lèi)型進(jìn)行區(qū)別,同時(shí)會(huì)對(duì)實(shí)體屬性進(jìn)行研究,例如會(huì)按照植物、顏色以及生長(zhǎng)季節(jié)等內(nèi)容逐一進(jìn)行分析,內(nèi)容涉及更加全面,可以對(duì)關(guān)鍵詞進(jìn)行更加深層次的解讀。
3.3.2 技術(shù)組成
該項(xiàng)技術(shù)組成主要分為四個(gè)部分:第一,分析詞語(yǔ)相關(guān)性。
就是指對(duì)客戶(hù)關(guān)鍵詞進(jìn)行分析,已明確客戶(hù)真實(shí)需求,并對(duì)關(guān)鍵詞相關(guān)內(nèi)容進(jìn)行確定;第二,關(guān)聯(lián)性知識(shí)設(shè)計(jì)。在對(duì)知識(shí)點(diǎn)之間的關(guān)聯(lián)性進(jìn)行明確之后,該項(xiàng)技術(shù)會(huì)對(duì)知識(shí)相關(guān)內(nèi)容進(jìn)行推薦,例如在搜索張藝興母親時(shí),該項(xiàng)技術(shù)不僅會(huì)提供張藝興母親的信息,同時(shí)還會(huì)對(duì)他其他家庭成員內(nèi)容進(jìn)行計(jì)算,并做出同時(shí)進(jìn)行信息推出;第三,結(jié)果聚類(lèi)。該項(xiàng)技術(shù)會(huì)對(duì)檢索結(jié)果整理與統(tǒng)計(jì),并會(huì)對(duì)其實(shí)施聚類(lèi),會(huì)對(duì)每一類(lèi)的代表性語(yǔ)義進(jìn)行標(biāo)注,并會(huì)按照語(yǔ)義標(biāo)簽對(duì)搜索詞潛在需求進(jìn)行分析;第四,知識(shí)展現(xiàn)相關(guān)性。該項(xiàng)技術(shù)會(huì)對(duì)用戶(hù)需求進(jìn)行分析,并對(duì)檢出信息進(jìn)行適當(dāng)取舍與展現(xiàn),以確保能夠?qū)τ脩?hù)的信息搜索目標(biāo)進(jìn)行滿足,在實(shí)施分析過(guò)程中,會(huì)對(duì)用戶(hù)的實(shí)際性需求、潛在需求以及知識(shí)相關(guān)性需求等內(nèi)容進(jìn)行分析,從而在滿足用戶(hù)搜索目的的同時(shí)激發(fā)出用戶(hù)的新搜索意愿,進(jìn)而獲得更大的經(jīng)濟(jì)效益[4]。
通過(guò)本文對(duì)互聯(lián)網(wǎng)搜索引擎以及特型展現(xiàn)技術(shù)相關(guān)內(nèi)容的介紹,使我們對(duì)互聯(lián)網(wǎng)搜索中的特型展現(xiàn)技術(shù)有了更加深刻的了解。該項(xiàng)技術(shù)的到來(lái),不僅有效提高了信息搜索的效率以及速度,而且推送信息內(nèi)容更加豐富、多樣,這樣能夠在滿足用戶(hù)查詢(xún)需要的同時(shí),為其提供更多相關(guān)信息選項(xiàng),整體信息數(shù)據(jù)展現(xiàn)更加高效、準(zhǔn)確,能夠?qū)π畔⑺褜け倔w所關(guān)聯(lián)的內(nèi)容進(jìn)行更加全面的展現(xiàn),已經(jīng)成為了互聯(lián)網(wǎng)搜索引擎發(fā)展的最佳動(dòng)力。
[1]高云全,李小勇,方濱興.物聯(lián)網(wǎng)搜索技術(shù)綜述[J].通信學(xué)報(bào),2015.
[2]萬(wàn)飛,趙溪,梁循,潘登,倪志豪.基于移動(dòng)互聯(lián)網(wǎng)日志的搜索引擎用戶(hù)行為研究[J].中文信息學(xué)報(bào),2014.
[3]陳弄祺.國(guó)內(nèi)互聯(lián)網(wǎng)搜索引擎評(píng)價(jià)研究[J].統(tǒng)計(jì)與決策,2017.
[4]竇志成,文繼榮.大數(shù)據(jù)時(shí)代的互聯(lián)網(wǎng)分析引擎[J].大數(shù)據(jù),2015.
網(wǎng)絡(luò)安全技術(shù)與應(yīng)用2017年4期