技術(shù)的改變比預(yù)測(cè)的更快,具備人工智能的搜索引擎在不久的將來變成現(xiàn)實(shí)。
有跡象表明,包括微軟、Google、IBM、雅虎等在內(nèi)的搜索巨頭已經(jīng)在研發(fā)自然語義搜索、人工智能搜索等第三代搜索技術(shù),而一些新興企業(yè)也試圖借搜索技術(shù)升級(jí)換代之機(jī)爭(zhēng)奪話語權(quán)。
回到未來,搜索引擎將像人一樣思考。隨著“語義學(xué)”網(wǎng)站的興起,基于人工智能的搜索引擎將理解用戶的問題,并且像個(gè)人助手一樣進(jìn)行反應(yīng)。用戶輸入問題,就能得到相關(guān)答案。
當(dāng)然人工智能搜索的功能不僅僅在于此。自然語言處理、對(duì)象識(shí)別、機(jī)器學(xué)習(xí)等人工智能領(lǐng)域的技術(shù)將再次開始“提高”Web搜索的智能。即根據(jù)用戶身份、用戶搜索記錄以及上下文語境、時(shí)間、地域等因素進(jìn)行判斷,以此來精確定位用戶的搜索意圖,進(jìn)而回答用戶提出的各類“非定制問題”,并返回多級(jí)的答案。在上述過程中,系統(tǒng)可以通過基于人工智能的自然語言分析和精確搜索意圖兩項(xiàng)核心算法,給出與第二代搜索迥然不同的搜索結(jié)果列表。
真正的智能,或者人工智能,我們的理解是有一定智力水平,可以處理“邏輯+知識(shí)”并能像人一樣深度思考問題的復(fù)雜系統(tǒng),是給系統(tǒng)設(shè)定的一套邏輯推理程序。這個(gè)邏輯程序既涉及語法,也涉及其復(fù)雜性遠(yuǎn)遠(yuǎn)超出語言范疇的邏輯處理。基于預(yù)設(shè)的復(fù)雜邏輯能力和可以不斷學(xué)習(xí)、記憶的知識(shí)處理能力,系統(tǒng)將獲得某種限度的深度思維能力。通過不斷對(duì)系統(tǒng)進(jìn)行細(xì)化,不斷添加更多的參數(shù),包括增加知識(shí)、邏輯以及每個(gè)環(huán)節(jié)的趨近度和精確度,人工設(shè)定諸如環(huán)境因素、語法、新詞匯、幽默思維、辯證思維等等,系統(tǒng)的邏輯推理能力和智能水平將逐漸趨近于人腦。
第一代搜索只是簡(jiǎn)單的網(wǎng)頁搜索,下一代網(wǎng)絡(luò)搜索應(yīng)該是將各種各樣的信息整合在一個(gè)界面上。這種多維信息的整合,一是與地域相關(guān),但又不受地域的限制;二是與時(shí)間相關(guān),同一關(guān)鍵詞在不同時(shí)間搜索,結(jié)果是不一樣的;三是把對(duì)電影、視頻等各種媒體的搜索都整合到網(wǎng)頁上。
目前,搜索引擎旨在為用戶在頁面的海洋中導(dǎo)航,可是現(xiàn)有的搜索引擎沒有一個(gè)可以完全有效地檢索這個(gè)世界上所有的網(wǎng)絡(luò)資源。輸入一項(xiàng)檢索請(qǐng)求的網(wǎng)絡(luò)用戶會(huì)被數(shù)以千計(jì)的回答弄得不知所措。對(duì)于搜索引擎而言,Web就是數(shù)以十億計(jì)網(wǎng)頁上大量單詞和連接單詞的超級(jí)鏈接。但是,搜索引擎并不“理解”這些單詞,它們僅僅是對(duì)在網(wǎng)頁上更重要或被其它更多的網(wǎng)頁鏈接的關(guān)鍵字進(jìn)行匹配。不僅如此,搜索引擎還無法理解人類語言的細(xì)微差別。
然而,即將發(fā)生的一個(gè)變化是,人類的表達(dá)將轉(zhuǎn)化為計(jì)算機(jī)容易理解的方式,使計(jì)算機(jī)能夠處理人類的表達(dá)需求。利用人工智能訓(xùn)練計(jì)算機(jī),不僅僅讀取網(wǎng)頁上的詞匯,而是使這些詞匯發(fā)生聯(lián)系、理解語言的意義。
搜索引擎中集成人工智能所需要的計(jì)算能力是極其昂貴的。但計(jì)算機(jī)、處理器、帶寬價(jià)格的持續(xù)下滑,使試驗(yàn)的機(jī)會(huì)正在逐步成熟。搜索還是一種利潤(rùn)豐厚的業(yè)務(wù),Google的年收入就達(dá)到了60億美元。人工智能搜索領(lǐng)域正在漸進(jìn)的發(fā)展。
人工智能(AI)注定要在網(wǎng)絡(luò)時(shí)代扮演重要的角色,這對(duì)用戶來說是一個(gè)巨大的誘惑和挑戰(zhàn)。Web對(duì)于根植于問題求解與知識(shí)處理的AI來說無疑是一個(gè)絕好的環(huán)境。AI可以在Internet中導(dǎo)引用戶,不僅在用戶進(jìn)行搜索、瀏覽時(shí)給予直接的支持,而且能夠提供具有獨(dú)立搜索功能的智能體的幕后支持。
前段時(shí)間,美國(guó)IBM Almaden研究中心舉行了一場(chǎng)名為“新AI:電腦應(yīng)用的新范例”的活動(dòng)。會(huì)上,華盛頓大學(xué)Turing中心主任Oren Etzioni更多的強(qiáng)調(diào)了智能網(wǎng)絡(luò)搜索?!拔覀儗⒃诮酉聛淼奈迥陼r(shí)間里看到基于像開放信息提取這樣的新一代的搜索系統(tǒng)。”他說。開放信息提取包括針對(duì)邏輯表達(dá)式的映射句子技巧,并且可以將任意句子應(yīng)用到網(wǎng)絡(luò)上。而開放信息提取的研究成果可能會(huì)最先在IBM提供的產(chǎn)品或服務(wù)里有所展現(xiàn)。
【責(zé)任編輯 李營(yíng)營(yíng)】