王祥麗
(1.隆昌市圖書館 四川隆昌 511083)
隨著大數(shù)據(jù)和人工智能時(shí)代的到來及發(fā)展,機(jī)器學(xué)習(xí)的研究重心已開始從感知領(lǐng)域轉(zhuǎn)移到認(rèn)知領(lǐng)域, 如何提升對(duì)大規(guī)模數(shù)據(jù)的認(rèn)知能力已成為智能科學(xué)與技術(shù)的一大研究熱點(diǎn)。開發(fā)具備感知、理解和行為能力的信息系統(tǒng)和應(yīng)用程序, 進(jìn)而實(shí)現(xiàn)對(duì)萬物世界的情景感知與智能計(jì)算,已成為IT 界乃至相關(guān)領(lǐng)域探索并已取得巨大進(jìn)展的一大新領(lǐng)域。 作為人工智能認(rèn)知計(jì)算技術(shù)代表的IBMWatson 技術(shù)平臺(tái),自推出以來就被世界所嘆為觀止,并被譽(yù)贊為“讓世界正變得更健康、更安全、更富創(chuàng)造力”。 從功能層面上講, 認(rèn)知系統(tǒng)具備人類的某些認(rèn)知能力, 能夠出色完成對(duì)數(shù)據(jù)的發(fā)現(xiàn)、理解、推理、決策等特定認(rèn)知任務(wù),主要由認(rèn)知計(jì)算來完成,而對(duì)數(shù)據(jù)的認(rèn)知價(jià)值也就決定了認(rèn)知計(jì)算將在當(dāng)前大數(shù)據(jù)與人工智能時(shí)代具有的光輝未來。 根據(jù)麥肯錫預(yù)測(cè),到2025 年,移動(dòng)互聯(lián)網(wǎng)、知識(shí)工作自動(dòng)化、物聯(lián)網(wǎng)、云、先進(jìn)機(jī)器人、自動(dòng)汽車這六大技術(shù)領(lǐng)域相關(guān)的產(chǎn)業(yè),經(jīng)濟(jì)規(guī)模將達(dá)到數(shù)以十萬億美元, 而這些產(chǎn)業(yè)都離不開認(rèn)知計(jì)算。 一直緊跟著技術(shù)而推動(dòng)學(xué)科及事業(yè)發(fā)展的圖書情報(bào)學(xué)界也看到了認(rèn)知計(jì)算的價(jià)值與潛力, 早在2002 年就提出了認(rèn)知情報(bào)學(xué)這一認(rèn)知計(jì)算與圖書情報(bào)學(xué)交叉結(jié)合的前沿領(lǐng)域。人工智能時(shí)代的到來,以及認(rèn)知計(jì)算在人機(jī)交互、 分析洞察和決策支持等領(lǐng)域的深度應(yīng)用, 都預(yù)示著認(rèn)知計(jì)算這一前沿技術(shù)將成為圖書情報(bào)學(xué)學(xué)術(shù)研究的下一個(gè)熱點(diǎn)。
認(rèn)知計(jì)算是代表一種建立在神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)之上的全新計(jì)算模式,集成了信息分析、自然語言處理和機(jī)器學(xué)習(xí)等創(chuàng)新技術(shù),德勤咨詢(Deloitte Consulting)首席分析師Paul Roma 指出,認(rèn)知計(jì)算能夠借助技術(shù)和算法自動(dòng)從數(shù)據(jù)中提取概念、 梳理關(guān)系和理解含義, 并獨(dú)立地從數(shù)據(jù)模式和先前經(jīng)驗(yàn)中進(jìn)行學(xué)習(xí),最終拓展人或機(jī)器可以自行完成的工作?;谶@一認(rèn)知,Roma 細(xì)分了認(rèn)知計(jì)算的三種主要應(yīng)用方式:
(1)認(rèn)知自動(dòng)化,借助于機(jī)器人或自動(dòng)化設(shè)施自動(dòng)執(zhí)行重復(fù)性任務(wù),從而提高效率、質(zhì)量和準(zhǔn)確性。
(2)認(rèn)知洞察力,可揭示隱藏在大數(shù)據(jù)中的數(shù)據(jù)模式和發(fā)展關(guān)系,從而找到新的創(chuàng)新與發(fā)展機(jī)遇。
(3)認(rèn)知參與,可通過大規(guī)模提供超個(gè)性化設(shè)置改善客戶關(guān)系、提升用戶體驗(yàn),進(jìn)而推動(dòng)客戶行為。
認(rèn)知計(jì)算是一個(gè)機(jī)器通過與人的自然語言交流及不斷學(xué)習(xí), 從而最終幫助人類從海量復(fù)雜的數(shù)據(jù)中發(fā)現(xiàn)更多規(guī)律或本質(zhì), 從而做出更為科學(xué)精準(zhǔn)決策的系統(tǒng)。 而人工智能則是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。 人工智能與認(rèn)知計(jì)算密不可分但又有所區(qū)別,事實(shí)上,兩者就像是兩個(gè)部分重疊的圓圈,彼此聯(lián)系又有所差異(見表1)。
總體來說, 人類追求人工智能的目標(biāo)是追求機(jī)器的類人邏輯和完美, 即一方面讓機(jī)器盡可能的具有人類的邏輯思維,直至完美,讓機(jī)器等于人類;另一方面讓機(jī)器盡可能只學(xué)習(xí)人類思維中的有益部分,從而形成更加完美的機(jī)器邏輯,讓機(jī)器大于等于人類。 認(rèn)知計(jì)算雖然借鑒了機(jī)器學(xué)習(xí)、 自然語言處理、語音/視覺識(shí)別、人機(jī)交互等人工智能技術(shù),卻追求機(jī)器在軟硬件設(shè)計(jì)上變得更具情感和影響力,以幫助人類進(jìn)行更加專業(yè)化的思考和科學(xué)決策。
大數(shù)據(jù)社會(huì)及人工智能時(shí)代的到來, 加速了社會(huì)對(duì)數(shù)據(jù)、信息的關(guān)注與挖掘,一方面?zhèn)鹘y(tǒng)的信息科學(xué)得到了極大的發(fā)展, 研究的內(nèi)涵與發(fā)展的邊際得到了極大的提升與擴(kuò)展; 另一方面, 由信息科學(xué)交叉、衍生發(fā)展而來的計(jì)算科學(xué)、數(shù)據(jù)科學(xué)、生物信息科學(xué)等也在技術(shù)、數(shù)據(jù)、應(yīng)用的多重驅(qū)動(dòng)下得到了飛躍發(fā)展。 圖書情報(bào)學(xué)作為一門兼具有信息科學(xué)與管理科學(xué)屬性的科學(xué), 自然離不開對(duì)信息、 技術(shù)的追隨, 也借大數(shù)據(jù)、 人工智能時(shí)代的發(fā)展而在數(shù)據(jù)挖掘、情感分析、用戶計(jì)算等領(lǐng)域有了巨大的發(fā)展,認(rèn)知計(jì)算也被圖書情報(bào)學(xué)界視為新的發(fā)展驅(qū)動(dòng), 并發(fā)展而成為認(rèn)知情報(bào)學(xué)這一交叉發(fā)展分支。 在圖書情報(bào)學(xué)特別是情報(bào)學(xué)界的探索下, 認(rèn)知計(jì)算對(duì)圖書情報(bào)學(xué)的發(fā)展影響、應(yīng)用場(chǎng)景等逐漸清晰。
龐娜在2018 年分析了認(rèn)知情報(bào)學(xué)對(duì)情報(bào)分析帶來的新機(jī)遇新場(chǎng)景, 認(rèn)為認(rèn)知情報(bào)學(xué)為情報(bào)分析帶來了豐富的解決方案、重新定義知識(shí)發(fā)現(xiàn)、全新的人機(jī)交互環(huán)境。毋庸置疑,這些影響也依然是認(rèn)知計(jì)算帶給圖書情報(bào)學(xué)的影響, 并在新的數(shù)據(jù)密集型科學(xué)研究環(huán)境下蘊(yùn)含了更為豐富的內(nèi)涵及內(nèi)容。
(1)豐富情報(bào)分析解決方案。大數(shù)據(jù)時(shí)代情報(bào)科學(xué)及情報(bào)工作對(duì)數(shù)據(jù)的分析和挖掘, 讓情報(bào)分析成為了情報(bào)學(xué)在大數(shù)據(jù)時(shí)代發(fā)展最為活躍的分支領(lǐng)域之一。 然而,情報(bào)學(xué)研究者和實(shí)踐者均為重視的大數(shù)據(jù)由于數(shù)據(jù)量之大、數(shù)據(jù)類型之廣、生產(chǎn)速度之快、數(shù)據(jù)質(zhì)量之痛,這就為情報(bào)人員對(duì)數(shù)據(jù)的利用和價(jià)值發(fā)現(xiàn)提出了挑戰(zhàn), 大量的數(shù)據(jù)特別是非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)并未得到充分應(yīng)用。 主要用來設(shè)計(jì)和分析大數(shù)據(jù)集的認(rèn)知計(jì)算, 則可以通過創(chuàng)建特定的應(yīng)用場(chǎng)景和不斷的人機(jī)互動(dòng)、人與環(huán)境互動(dòng),模擬人類的思維快速的對(duì)大數(shù)據(jù)集進(jìn)行學(xué)習(xí)、 推理和分析,以作出無偏倚的科學(xué)決策建議,最終對(duì)大數(shù)據(jù)的情報(bào)分析及應(yīng)用提供新的解決方案。 如依托認(rèn)知計(jì)算對(duì)海量文獻(xiàn)中的藥物、疾病、事件等實(shí)體進(jìn)行分析,自動(dòng)推理出實(shí)體間的關(guān)系及事件的發(fā)展規(guī)律。 諸如此類對(duì)海量文獻(xiàn)、音視頻、圖像、自媒體、富媒體等海量數(shù)據(jù)的處理, 都可為數(shù)字圖書館及情報(bào)服務(wù)機(jī)構(gòu)的資源建設(shè)及圖情事業(yè)發(fā)展轉(zhuǎn)型提供新的可能及思路。
表1 認(rèn)知計(jì)算與人工智能的差別[4]
(2)重新定義知識(shí)發(fā)現(xiàn)。 早在10 年前,我國(guó)情報(bào)學(xué)家冷伏海就指出在情報(bào)分析方面, 傳統(tǒng)的基于數(shù)據(jù)計(jì)算的數(shù)據(jù)挖掘技術(shù)正向基于內(nèi)容的知識(shí)發(fā)現(xiàn)技術(shù)發(fā)展。 隨后10 年的發(fā)展也證明了這一科學(xué)論斷的前瞻性與科學(xué)性,以Alma、Primo 等為代表的圖書館新一代知識(shí)服務(wù)系統(tǒng)得到了普及應(yīng)用, 面向各類知識(shí)內(nèi)容(領(lǐng)域、主題、學(xué)者、機(jī)構(gòu)、傳媒、資助等)做唯一標(biāo)識(shí)、粒度分析、關(guān)聯(lián)呈現(xiàn),得以實(shí)現(xiàn)從情報(bào)分析視角對(duì)隱含知識(shí)關(guān)聯(lián)做深入挖掘, 同時(shí)支撐客戶的學(xué)科評(píng)估、人才評(píng)估、研究方向分析、競(jìng)爭(zhēng)情報(bào)動(dòng)態(tài)連續(xù)追蹤等知識(shí)服務(wù)成為了圖書情報(bào)機(jī)構(gòu)近年來知識(shí)服務(wù)的增長(zhǎng)點(diǎn)。 但在基于內(nèi)容的知識(shí)發(fā)現(xiàn)實(shí)現(xiàn)過程中, 捕捉非結(jié)構(gòu)化數(shù)據(jù)中蘊(yùn)含的深層含義一直是一大難點(diǎn),自然語言處理面臨著多重困難。認(rèn)知計(jì)算由于借鑒了人的思維模型和過程, 可以通過對(duì)某個(gè)特定領(lǐng)域的語言、術(shù)語進(jìn)行人機(jī)交互、人與環(huán)境的互動(dòng)交互來分析和理解, 最后實(shí)現(xiàn)基于情報(bào)分析的自動(dòng)知識(shí)發(fā)現(xiàn)和含有細(xì)粒度實(shí)體的知識(shí)圖譜繪制。這對(duì)圖書情報(bào)機(jī)構(gòu)而言無疑是非常重要的, 因?yàn)槠洳坏軒椭鷪D書情報(bào)機(jī)構(gòu)實(shí)現(xiàn)對(duì)期刊論文、 論文實(shí)證數(shù)據(jù)、參考文獻(xiàn)、專利、實(shí)驗(yàn)標(biāo)本、作者、主題領(lǐng)域等細(xì)粒度知識(shí)的自動(dòng)發(fā)現(xiàn), 還可以對(duì)細(xì)粒度實(shí)體間關(guān)系的關(guān)聯(lián)及發(fā)現(xiàn)來對(duì)整個(gè)篇章知識(shí)結(jié)構(gòu)進(jìn)行知識(shí)發(fā)現(xiàn),幫助用戶迅速發(fā)現(xiàn)文章的研究目的、方法、手段、工具、結(jié)論等脈絡(luò),運(yùn)用關(guān)聯(lián)數(shù)據(jù)等技術(shù)幫助圖書情報(bào)機(jī)構(gòu)的用戶在數(shù)據(jù)密集型環(huán)境下高效地獲取及利用文獻(xiàn),加快知識(shí)服務(wù)的發(fā)展。
(3)新型的人機(jī)交互環(huán)境。數(shù)據(jù)密集型科研第四范式對(duì)圖書情報(bào)領(lǐng)域的技術(shù)應(yīng)用提供了更多可能與場(chǎng)景,借助于人機(jī)交互的情景感知如智能咨詢、機(jī)器問答等也便成了人們?cè)趶?fù)雜、混沌、不確定的現(xiàn)實(shí)世界中對(duì)海量、 異構(gòu)和難以理解的數(shù)據(jù)處理的幻想。追尋圖書情報(bào)學(xué)領(lǐng)域的人機(jī)交互歷史, 可以發(fā)現(xiàn)從較早信息檢索到近年來發(fā)展的視覺搜索, 都注重對(duì)用戶認(rèn)知的感知與理解, 人工智能助推的問答式服務(wù)、無人智能服務(wù)、在線智慧系統(tǒng)等也均提升了情報(bào)服務(wù)的人機(jī)交互水平, 并創(chuàng)新出了越來越多的服務(wù)應(yīng)用場(chǎng)景。認(rèn)知計(jì)算利用深刻的理解能力,可以輔助圖書情報(bào)機(jī)構(gòu)在為用戶進(jìn)行服務(wù)時(shí)提供更佳的解決方案,如既可將解決方案嵌入到用戶的搜索、瀏覽等行為中去,也可以在智能問答系統(tǒng)、導(dǎo)航機(jī)器人程序中提前植入,讓用戶與機(jī)器進(jìn)行深度的交互,并為用戶提供更加高效、合理的決策建議。
發(fā)展于20 世紀(jì)50 年代、主要包含計(jì)算機(jī)科學(xué)、心理學(xué)、教育學(xué)等多個(gè)學(xué)科知識(shí)的認(rèn)知科學(xué),在信息時(shí)代和大數(shù)據(jù)時(shí)代隨著對(duì)數(shù)據(jù)和信息的計(jì)算處理而發(fā)展形成了認(rèn)知計(jì)算這一技術(shù)綜合體。 目前學(xué)界對(duì)認(rèn)知計(jì)算的定義因不同的視角而存在差異, 但認(rèn)知計(jì)算具有的輔助、理解、決策、洞察與發(fā)現(xiàn)功能還是得到了公認(rèn)。 在圖書情報(bào)學(xué)領(lǐng)域,情報(bào)分析、資源組織等工作如信息組織、知識(shí)咨詢、智能檢索從一出現(xiàn)就以人的邏輯思維去探索對(duì)信息、 知識(shí)乃至數(shù)據(jù)的管理與應(yīng)用,可以說認(rèn)知計(jì)算早被引用到了圖書情報(bào)領(lǐng)域。 2002 年,正式提出了“認(rèn)知情報(bào)學(xué)”這一獨(dú)立概念的第一屆認(rèn)知情報(bào)學(xué)國(guó)際會(huì)議在美國(guó)召開,則標(biāo)志著認(rèn)知計(jì)算與圖書情報(bào)學(xué)真正走到了一起。
作為一個(gè)主要對(duì)計(jì)算機(jī)科學(xué)、情報(bào)學(xué)、認(rèn)知科學(xué)和智能科學(xué)進(jìn)行跨學(xué)科研究的多學(xué)科交叉研究領(lǐng)域,自認(rèn)知情報(bào)學(xué)提出以來便受到了圖書情報(bào)學(xué)界的關(guān)注。 認(rèn)知情報(bào)學(xué)國(guó)際會(huì)議自2002 年召開以來已召開了17 屆, 國(guó)際學(xué)者對(duì)認(rèn)知情報(bào)學(xué)的研究也從認(rèn)知情報(bào)學(xué)的基礎(chǔ)理論發(fā)展到了面向大數(shù)據(jù)應(yīng)用的語義化處理、自動(dòng)推理等領(lǐng)域。 在國(guó)內(nèi),索傳軍、冷伏海、龐娜、孫坦等學(xué)者也開展了認(rèn)知情報(bào)學(xué)研究。
在2017 年年初IBM 內(nèi)部分享的一份趨勢(shì)報(bào)告《AI/Cognitive Computing Trend Report,2017》中,IBM認(rèn)為, 我們已經(jīng)來到了認(rèn)知計(jì)算這一計(jì)算科學(xué)新紀(jì)元時(shí)代,認(rèn)知計(jì)算作為一個(gè)變革型的技術(shù),將助推機(jī)器與人類之間的互動(dòng)方式發(fā)生徹底轉(zhuǎn)變, 并顯著提高機(jī)器的價(jià)值。 有學(xué)者認(rèn)為認(rèn)知計(jì)算未來的主要應(yīng)用領(lǐng)域?yàn)檎Z言理解、互聯(lián)網(wǎng)搜索、認(rèn)知數(shù)據(jù)挖掘和人機(jī)交互。 很顯然,圖書情報(bào)學(xué)與這四個(gè)領(lǐng)域有著緊密的關(guān)系和聯(lián)系。從更寬泛的視角來看,認(rèn)知計(jì)算將對(duì)圖書情報(bào)學(xué)的科學(xué)理論、 應(yīng)用研究及未來發(fā)展產(chǎn)生重要的影響, 因此可以預(yù)計(jì)在數(shù)據(jù)密集型第四范式環(huán)境下, 認(rèn)知計(jì)算將為圖書情報(bào)學(xué)提供了從信息組織、數(shù)據(jù)挖掘到場(chǎng)景應(yīng)用的諸多研究、應(yīng)用增長(zhǎng)點(diǎn)。如在信息檢索、知識(shí)發(fā)現(xiàn)、信息組織等方面,借鑒于人類思維邏輯的認(rèn)知計(jì)算可以有效支持智能問答、無人服務(wù),并借助于對(duì)情景感知來獲取人類信息行為大數(shù)據(jù), 實(shí)現(xiàn)人機(jī)交互模式下用戶認(rèn)知意圖精準(zhǔn)刻畫和機(jī)器自動(dòng)問答, 覆蓋從信息采集、 意圖精煉、問題完善、語料獲取、深度洞察到探索式分析的認(rèn)知計(jì)算完整迭代過程。
基于上述認(rèn)識(shí)與分析, 筆者認(rèn)為認(rèn)知計(jì)算將繼續(xù)依賴其在感知、 理解和行動(dòng)三個(gè)方面具有的技術(shù)優(yōu)勢(shì), 在圖書情報(bào)學(xué)的知識(shí)表達(dá)等場(chǎng)景中得到應(yīng)用及研究,并提供新的或完善的已有的解決方案(具體見表2)。
認(rèn)知計(jì)算正成為新一代計(jì)算中不可獲取的一部分, 但由于整個(gè)社會(huì)及科技還處于計(jì)算新時(shí)代的前期, 大眾對(duì)認(rèn)知計(jì)算的理解及研究應(yīng)用尚不足以讓認(rèn)知科學(xué)得到足夠的價(jià)值與應(yīng)用展現(xiàn)。 認(rèn)知情報(bào)學(xué)作為認(rèn)知計(jì)算與圖書情報(bào)學(xué)的研究交叉領(lǐng)域,自21世紀(jì)初提出以來就引起了學(xué)者的關(guān)注, 但總體而言研究成果還不豐富, 研究?jī)?nèi)容也還不足以支撐與構(gòu)筑起這一交叉領(lǐng)域豐富的內(nèi)涵及外延。 本文在概述相關(guān)概念、研究進(jìn)展的基礎(chǔ)上,對(duì)認(rèn)知計(jì)算在圖書情報(bào)領(lǐng)域未來的研究及應(yīng)用場(chǎng)景進(jìn)行了探索。 在此需要強(qiáng)調(diào)的是,盡管認(rèn)知計(jì)算具有自我增值、協(xié)助用戶的能力, 以及由靜態(tài)系統(tǒng)轉(zhuǎn)向動(dòng)態(tài)系統(tǒng)的能力都在圖書情報(bào)領(lǐng)域具有相當(dāng)大的吸引力, 但圖書情報(bào)領(lǐng)域?qū)φJ(rèn)知計(jì)算的研究要以服務(wù)應(yīng)用為導(dǎo)向, 理解認(rèn)知計(jì)算即服務(wù)這一基本定位, 讓認(rèn)知計(jì)算推動(dòng)圖書情報(bào)學(xué)精細(xì)化、智能化、智慧化發(fā)展。
表2 認(rèn)知計(jì)算在圖書情報(bào)學(xué)的應(yīng)用/研究場(chǎng)景[14]