2012年5月,谷歌公司通過(guò)其官方博客正式發(fā)布搜索頁(yè)面的新功能——知識(shí)圖譜(Mapping Knowledge Domain)。這可能是谷歌搜索引擎上線以來(lái)最大的一次改革。
什么是知識(shí)圖譜?
知識(shí)圖譜也被稱為科學(xué)知識(shí)圖譜,是顯示知識(shí)發(fā)展進(jìn)程與結(jié)構(gòu)關(guān)系的一系列不同的圖形,用可視化技術(shù)描述知識(shí)資源及其載體,挖掘、分析、構(gòu)建、繪制和顯示知識(shí)及它們之間的相互聯(lián)系。具體來(lái)說(shuō),知識(shí)圖譜是把應(yīng)用數(shù)學(xué)、圖形學(xué)、信息可視化技術(shù)、信息科學(xué)等學(xué)科的理論與計(jì)量學(xué)引文分析等方法結(jié)合,用可視化的圖譜形象地展示學(xué)科的核心結(jié)構(gòu)、發(fā)展歷史、前沿領(lǐng)域以及整體知識(shí)架構(gòu)的多學(xué)科融合的一種研究方法。它把復(fù)雜的知識(shí)領(lǐng)域通過(guò)數(shù)據(jù)挖掘、信息處理、知識(shí)計(jì)量和圖形繪制顯示出來(lái),揭示知識(shí)領(lǐng)域的動(dòng)態(tài)發(fā)展規(guī)律,為學(xué)科研究提供切實(shí)的、有價(jià)值的參考。
下面我們先來(lái)舉一個(gè)實(shí)例進(jìn)行說(shuō)明,比如我們?cè)诠雀杷阉骺蚶镙斎搿笆辍保酝荒茉谒阉鹘Y(jié)果頁(yè)面顯示10多個(gè)由標(biāo)題、鏈接以及與關(guān)鍵詞相關(guān)的簡(jiǎn)短內(nèi)文片段組成的搜索結(jié)果。雖然現(xiàn)在搜索頁(yè)面也會(huì)插入圖片等結(jié)果,不過(guò)搜索結(jié)果大體上依然通過(guò)文字簡(jiǎn)介的形式提供。
如果使用知識(shí)圖譜搜索則不同,當(dāng)我們輸入“十三陵”后,除了在搜索結(jié)果頁(yè)面顯示相關(guān)的文字信息外,在搜索頁(yè)面右欄還直觀地顯示出十三陵在地圖上的位置、來(lái)自維基百科的文字簡(jiǎn)介、建筑相關(guān)信息表(高度、開(kāi)放時(shí)間、設(shè)計(jì)師等)。頁(yè)面下方還有與十三陵相關(guān)的歷史古跡和旅游景點(diǎn),讓用戶可以全面了解十三陵。
再比如我們輸入“電腦”這個(gè)關(guān)鍵詞,谷歌除了在搜索結(jié)果頁(yè)面顯示電腦的相關(guān)信息,還會(huì)在頁(yè)面右側(cè)顯示我們所在城市的各個(gè)電腦賣場(chǎng)位置,給用戶購(gòu)買電腦提供方便。
從用戶角度來(lái)看,知識(shí)圖譜的好處顯而易見(jiàn)。我們能夠直接獲得搜索內(nèi)容的基本信息匯總,而不用根據(jù)文字片段和網(wǎng)站名稱判斷究竟哪個(gè)鏈接最有價(jià)值,然后再打開(kāi)新頁(yè)面人工過(guò)濾頁(yè)面內(nèi)的有價(jià)值信息。
知識(shí)圖譜的演變
知識(shí)圖譜是谷歌在2010年收購(gòu)了開(kāi)放式數(shù)據(jù)庫(kù)公司Metaweb后發(fā)展而來(lái)的。Metaweb當(dāng)時(shí)主要專注于將不同文字表述與同一個(gè)實(shí)體連接起來(lái),并探索這些實(shí)體的屬性(例如明星的年齡)以及彼此之間的聯(lián)系,最終提供一種新的搜索形式。雖然不能完全替代關(guān)鍵詞搜索,但Metaweb的索引、搜索方法在處理諸如“身高160厘米以下的女星”、“喬布斯愛(ài)看什么書(shū)”之類的搜索時(shí)更高效。Metaweb的主要信息來(lái)源是 Freebase(一個(gè)創(chuàng)作共享類網(wǎng)站,所有內(nèi)容都由用戶添加,采用創(chuàng)意共用許可證,可以自由引用),但谷歌知識(shí)圖譜的信息來(lái)源要寬廣得多,不僅包括 Freebase、維基百科等公共資源,也從其他網(wǎng)頁(yè)搜集整理了大量信息。谷歌目前已經(jīng)搜集了35 億條信息。
知識(shí)圖譜的搜索效果
了解了知識(shí)圖譜的相關(guān)知識(shí)后,我們?cè)賮?lái)看知識(shí)圖譜會(huì)帶來(lái)哪些搜索效果。
快速過(guò)濾出最想要的信息
當(dāng)用戶輸入一個(gè)模糊的關(guān)鍵詞,這樣的一個(gè)搜索請(qǐng)求可能會(huì)代表多重含義,知識(shí)圖譜能夠理解這其中的差別,并可以將搜索結(jié)果范圍縮小到用戶最想要的那種含義。
快速查看到最全面的摘要
有了知識(shí)圖譜,谷歌可以更好地理解用戶搜索的信息并總結(jié)出與搜索話題相關(guān)的內(nèi)容,為用戶找出更加準(zhǔn)確的信息,做出全面的總結(jié)并提供更有深度的相關(guān)信息。例如,當(dāng)用戶搜索“瑪麗·居里”時(shí),不僅可以看到居里夫人的生平信息,還能獲得關(guān)于其教育背景和科學(xué)發(fā)現(xiàn)方面的詳細(xì)介紹。此外,知識(shí)圖譜還會(huì)幫助用戶了解事物之間的關(guān)系。
讓搜索更有深度和廣度
由于知識(shí)圖譜構(gòu)建了一個(gè)與搜索結(jié)果相關(guān)的完整的知識(shí)體系,融合了很多學(xué)科,把與關(guān)鍵詞相關(guān)的知識(shí)體系系統(tǒng)化地展示給用戶。所以用戶往往會(huì)獲得意想不到的發(fā)現(xiàn)。在搜索中,用戶可能會(huì)了解到某個(gè)新的事實(shí)或新的聯(lián)系,促使其進(jìn)行一系列的全新搜索查詢。
總之,傳統(tǒng)的機(jī)械羅列信息的人工網(wǎng)站遲早會(huì)被技術(shù)進(jìn)步所淘汰,谷歌知識(shí)圖譜提供的簡(jiǎn)練歸納既會(huì)激發(fā)用戶興趣,又能為用戶提供更便捷、直觀、系統(tǒng)的搜索方式。美中不足的是,搜索引擎直接提供最終信息必然引來(lái)第三方網(wǎng)站的擔(dān)憂,那么第三方網(wǎng)站是否會(huì)受到影響只能等待時(shí)間的檢驗(yàn)。
【責(zé)任編輯】趙新宇