董 彥
(國(guó)家圖書館,北京 100081)
隨著《新一代人工智能發(fā)展規(guī)劃》的提出與實(shí)施,預(yù)示著人工智能技術(shù)已經(jīng)成為科技發(fā)展的重要戰(zhàn)略計(jì)劃,這將給圖書館行業(yè)帶來(lái)深刻的變化[1]。深入研究基于人工智能的圖書館知識(shí)服務(wù)創(chuàng)新問(wèn)題有著重要的實(shí)踐意義[2]?;谌斯ぶ悄艿闹腔蹐D書館將是未來(lái)圖書館的發(fā)展形態(tài),并且智慧圖書館的服務(wù)離不開互聯(lián)網(wǎng)、數(shù)據(jù)挖掘、模式識(shí)別、多媒體和數(shù)字化等多項(xiàng)技術(shù)的支持[3]。人工智能背景下的圖書館服務(wù),并不只是人工智能技術(shù)和圖書館服務(wù)之間的簡(jiǎn)單疊加,而是二者之間的深度融合與交互。建設(shè)智慧圖書館服務(wù)體系,深化圖書館知識(shí)服務(wù),是未來(lái)圖書館的發(fā)展方向[4]。
圖書館依靠人工智能技術(shù)強(qiáng)大的數(shù)據(jù)處理與分析功能,通過(guò)數(shù)據(jù)收集、知識(shí)發(fā)現(xiàn)、知識(shí)融合、深度推理,在信息資源和知識(shí)需求之間構(gòu)建出知識(shí)服務(wù)與應(yīng)用模式,通過(guò)傳感與認(rèn)知技術(shù),協(xié)助圖書館用戶更方便、快捷地完成知識(shí)獲取和應(yīng)用。
利用數(shù)字化和多媒體化工具,圖書館可以通過(guò)各種渠道收集文獻(xiàn)資源數(shù)據(jù)和用戶信息、行為以及社交數(shù)據(jù),形成多元異構(gòu)的大數(shù)據(jù),包含有結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)以及非結(jié)構(gòu)化數(shù)據(jù),在數(shù)據(jù)的類型上也包括文本、圖像、音頻以及視頻等多種數(shù)據(jù)形式。隨著人工智能應(yīng)用的深入,圖書館的數(shù)據(jù)來(lái)源將會(huì)越來(lái)越多樣化,除了鍵盤鼠標(biāo)等傳統(tǒng)輸入設(shè)備,數(shù)據(jù)的收集還可來(lái)自傳感器、可穿戴設(shè)備以及眼動(dòng)儀等高科技設(shè)備[5]。當(dāng)圖書館收集到海量數(shù)據(jù)之后,需要對(duì)數(shù)據(jù)進(jìn)行挖掘并發(fā)現(xiàn)蘊(yùn)含在數(shù)據(jù)中的學(xué)科、資源和用戶知識(shí)。在對(duì)文本數(shù)據(jù)的知識(shí)發(fā)現(xiàn)上,可采用人工智能中的自然語(yǔ)言處理技術(shù),通過(guò)對(duì)文本的理解和挖掘,采用關(guān)聯(lián)規(guī)則分析、偏差分析和聚類等方法,從數(shù)據(jù)中提取出知識(shí)元,以知識(shí)元為基礎(chǔ)構(gòu)建知識(shí)實(shí)體及其屬性,從而形成知識(shí)元數(shù)據(jù)庫(kù)。在知識(shí)元數(shù)據(jù)庫(kù)基礎(chǔ)上,很容易提取用戶行為、興趣偏好,以及理解文獻(xiàn)中的知識(shí)。
在知識(shí)發(fā)現(xiàn)的基礎(chǔ)上,基于知識(shí)推理和深度學(xué)習(xí),可以構(gòu)建出知識(shí)圖譜,實(shí)現(xiàn)對(duì)較復(fù)雜的數(shù)據(jù)語(yǔ)義深度推理和理解,是圖書館知識(shí)服務(wù)的有力支撐?;谥R(shí)圖譜的深度推理主要包括兩個(gè)主要方面,分別是符號(hào)推理和統(tǒng)計(jì)推理。其中,符號(hào)推理不需要用戶自定義推理過(guò)程,可直接發(fā)現(xiàn)不同知識(shí)元實(shí)體之間的語(yǔ)義關(guān)聯(lián)關(guān)系。統(tǒng)計(jì)推理則通過(guò)統(tǒng)計(jì)方法從知識(shí)圖譜中獲取隱藏在其中的隱含知識(shí)。深度學(xué)習(xí)的超強(qiáng)數(shù)據(jù)挖掘能力和圖書館積累的大數(shù)據(jù)和云計(jì)算平臺(tái),使得圖書館獲得了對(duì)知識(shí)圖譜深度推理的能力。深度推理將應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)以及循環(huán)神經(jīng)網(wǎng)絡(luò),從知識(shí)圖譜中挖掘出更有意義的內(nèi)容,包括在圖書館的專家問(wèn)答系統(tǒng)、知識(shí)推薦系統(tǒng)、資源搜索系統(tǒng)中,都將提供穩(wěn)定的知識(shí)挖掘和識(shí)別結(jié)果,為讀者提供專業(yè)的創(chuàng)新服務(wù)。
在知識(shí)圖譜及其深度推理的基礎(chǔ)上,還需要構(gòu)建知識(shí)的服務(wù)與應(yīng)用,分別包括知識(shí)挖掘結(jié)果的查找、推理、學(xué)習(xí)和計(jì)算。針對(duì)知識(shí)圖譜構(gòu)建的知識(shí)服務(wù),能夠?yàn)閳D書館用戶提供智能化、智慧化的多種知識(shí)服務(wù)。其中,通過(guò)對(duì)用戶行為、偏好和資源檢索的知識(shí)圖譜進(jìn)行深度推理,可以為不同的用戶構(gòu)建精準(zhǔn)的用戶畫像,在用戶畫像基礎(chǔ)上完成對(duì)用戶的個(gè)性化知識(shí)服務(wù)建設(shè)[6]。另外,基于圖書館的學(xué)科資源知識(shí)圖譜構(gòu)建的深度推理,可以為用戶提供某個(gè)學(xué)科的知識(shí)關(guān)聯(lián)、發(fā)展前景、研究熱點(diǎn),以及更為細(xì)致化的學(xué)科知識(shí)導(dǎo)航。最后,基于專家信息、交流信息等構(gòu)建的知識(shí)圖譜,結(jié)合自然語(yǔ)言處理技術(shù)可以構(gòu)建出自動(dòng)問(wèn)答系統(tǒng),通過(guò)自動(dòng)問(wèn)答系統(tǒng)能夠有效解決用戶的基礎(chǔ)需求,解放專家資源去完成更有深度的交互和問(wèn)答。同時(shí),自動(dòng)問(wèn)答系統(tǒng)可以方便、快捷地彌補(bǔ)學(xué)科中的短板,讓圖書管理員起到主導(dǎo)作用,為用戶提供更細(xì)致的知識(shí)問(wèn)答服務(wù)。
計(jì)算機(jī)網(wǎng)絡(luò)與智能技術(shù)促進(jìn)了知識(shí)獲取方式的長(zhǎng)足發(fā)展,同時(shí)也帶來(lái)了知識(shí)迷航的問(wèn)題。如今,海量的大數(shù)據(jù)涌入讀者的眼簾,容易使讀者產(chǎn)生疲勞,無(wú)法從大量數(shù)據(jù)中獲取自己所需要的數(shù)據(jù)。因此,圖書館知識(shí)服務(wù)創(chuàng)新首要解決的問(wèn)題便是知識(shí)導(dǎo)航與知識(shí)檢索,并且需要構(gòu)建出自助式的導(dǎo)航與檢索,提升獲取數(shù)據(jù)的效率,并減少不必要的消耗。為了構(gòu)建自助式導(dǎo)航,依托于學(xué)科之間的知識(shí)圖譜的可視化過(guò)程,可以形成知識(shí)與知識(shí)、知識(shí)與資源之間的關(guān)聯(lián)關(guān)系。由知識(shí)圖譜中推理出的資源關(guān)聯(lián)關(guān)系,可以導(dǎo)航出實(shí)體之間的動(dòng)態(tài)關(guān)聯(lián)。讀者通過(guò)自助的方式,即可方便地把握知識(shí)的發(fā)展過(guò)程,可以及時(shí)發(fā)現(xiàn)知識(shí)主體和學(xué)科熱點(diǎn),了解當(dāng)前的研究動(dòng)態(tài)和發(fā)展。
此外,依托于知識(shí)圖譜,將知識(shí)和資源關(guān)聯(lián)起來(lái),設(shè)計(jì)出智能知識(shí)檢索系統(tǒng),通過(guò)關(guān)鍵詞的搜索,該系統(tǒng)不但返回搜索關(guān)鍵詞的匹配結(jié)果,還能夠根據(jù)讀者的歷史檢索記錄以及資源檢索結(jié)果,為用戶建立符合其興趣的知識(shí)卡片,分別包括相應(yīng)作者的介紹、作品信息以及學(xué)術(shù)鏈接等。另外,資源之間的相關(guān)關(guān)系,可以通過(guò)知識(shí)圖譜與跨庫(kù)資源共同建設(shè),對(duì)讀者的知識(shí)檢索結(jié)果設(shè)計(jì)深度關(guān)聯(lián),提升資源的延展性。
圖書館面臨的用戶群體越來(lái)越年輕化,該群體更需要圖書館服務(wù)的場(chǎng)景化與個(gè)性化。其中,場(chǎng)景化不同于傳統(tǒng)的情景感知,需要將讀者的動(dòng)態(tài)化、多樣化場(chǎng)景結(jié)合起來(lái),更強(qiáng)調(diào)讀者與場(chǎng)景的交互?;谝苿?dòng)圖書館基礎(chǔ)設(shè)計(jì)個(gè)性化知識(shí)推薦,可采用機(jī)器學(xué)習(xí)與模式識(shí)別技術(shù),從不同讀者的終端上讀取行為數(shù)據(jù)、時(shí)間數(shù)據(jù)、定位數(shù)據(jù)等行為數(shù)據(jù)和傳感數(shù)據(jù),對(duì)讀者的閱讀地點(diǎn)、行為軌跡、行為模式進(jìn)行挖掘與分析,通過(guò)分析結(jié)果對(duì)場(chǎng)景建模,隨后采用Spark 內(nèi)存分析技術(shù),實(shí)時(shí)完成場(chǎng)景匹配。最后,對(duì)于匹配到的場(chǎng)景,實(shí)現(xiàn)場(chǎng)景知識(shí)推薦。場(chǎng)景知識(shí)推薦可以讓讀者獲取更真實(shí)的體驗(yàn),并增強(qiáng)讀者對(duì)于圖書館創(chuàng)新服務(wù)的需求。
其次,個(gè)性化服務(wù)也是年輕讀者的需求之一。個(gè)性化服務(wù)是主要以讀者為中心,設(shè)計(jì)出與個(gè)體相關(guān)度大的高質(zhì)量知識(shí)服務(wù)[7]。通過(guò)知識(shí)圖譜構(gòu)建的用戶畫像,精準(zhǔn)地給出了讀者的年齡、學(xué)歷、性別、興趣愛好分布,通過(guò)這些分布即可實(shí)現(xiàn)個(gè)性化知識(shí)推送服務(wù)。在推送形式上,可以傳統(tǒng)的郵件形式,也可以采用新興的微博、微信公眾號(hào)等形式,以滿足個(gè)性化的知識(shí)需求。
知識(shí)問(wèn)答與咨詢是圖書館創(chuàng)新服務(wù)不可或缺的一環(huán),經(jīng)典的知識(shí)問(wèn)答與咨詢由讀者采用自然語(yǔ)言輸入問(wèn)題,系統(tǒng)通過(guò)檢索和決策給出問(wèn)題的答案。圖書館則需要構(gòu)建自動(dòng)化的知識(shí)問(wèn)答系統(tǒng),該系統(tǒng)不但可以通過(guò)自然語(yǔ)言輸入,還可以通過(guò)語(yǔ)言、圖像、視頻等多種個(gè)性化輸入方式,在知識(shí)回答上也應(yīng)該采用各種不同的方式,結(jié)合讀者的使用場(chǎng)景,有針對(duì)性地給出知識(shí)回答。例如,當(dāng)讀者使用移動(dòng)設(shè)備時(shí),回答的方式就可采用圖文方式;而一旦讀者采用PC 終端,即可推送視頻回答方式。通過(guò)這種方式,不但能夠提升個(gè)性化的知識(shí)問(wèn)答服務(wù),還能夠培養(yǎng)讀者的使用習(xí)慣。
此外,自動(dòng)化的知識(shí)咨詢服務(wù),主要包括泛在知識(shí)環(huán)境、嵌入式用戶場(chǎng)景以及科研過(guò)程3個(gè)主要方面[8]。在自動(dòng)化的知識(shí)咨詢服務(wù)中,圖書館可以通過(guò)人工智能技術(shù),分析讀者的用戶精準(zhǔn)畫像,從用戶畫像中發(fā)現(xiàn)用戶的實(shí)際特征,然后通過(guò)實(shí)際特征對(duì)知識(shí)進(jìn)行深入挖掘,發(fā)現(xiàn)創(chuàng)新型知識(shí)與關(guān)聯(lián)規(guī)則,最后完成知識(shí)獲取、整合和應(yīng)用相結(jié)合的自動(dòng)化知識(shí)咨詢服務(wù),可用于學(xué)科創(chuàng)新以及科學(xué)前瞻。
圖書館從統(tǒng)籌規(guī)劃以及分類指導(dǎo)層面做好國(guó)家《新一代人工智能發(fā)展規(guī)劃》,積極推動(dòng)圖書館這一知識(shí)載體的戰(zhàn)略轉(zhuǎn)型以及服務(wù)創(chuàng)新。在統(tǒng)籌規(guī)劃中,各圖書館之間應(yīng)該構(gòu)建人工智能服務(wù)聯(lián)盟,促進(jìn)相互學(xué)習(xí)與合作。不同于其他技術(shù),人工智能技術(shù)需要建立在足夠的數(shù)據(jù)與計(jì)算資源之上,因此多個(gè)圖書館之間的合作,可以獲得更全面的數(shù)據(jù),從而形成更精準(zhǔn)的用戶畫像,且多個(gè)圖書館之間的計(jì)算資源共享,也能夠進(jìn)一步提升數(shù)據(jù)挖掘和深度推理的效率。
圖書館通過(guò)對(duì)管理、技術(shù)以及服務(wù)模式的改革,實(shí)現(xiàn)基于人工智能的圖書館管理、技術(shù)和服務(wù)模式的創(chuàng)新,盡量滿足不同個(gè)體的個(gè)性化需求。此外,還需要廣泛調(diào)研學(xué)科的發(fā)展前景,為不同學(xué)科制定科學(xué)的發(fā)展藍(lán)圖,通過(guò)明確的發(fā)展路線與方向,形成可持續(xù)發(fā)展的科學(xué)規(guī)劃。通過(guò)全面落實(shí)整體戰(zhàn)略布局,才能形成真正意義上的人工智能創(chuàng)新服務(wù),建設(shè)與數(shù)據(jù)挖掘和智能分析相關(guān)的配套設(shè)施以及整體規(guī)劃,發(fā)揮出人工智能在圖書館知識(shí)服務(wù)中的良好作用。
圖書館由傳統(tǒng)的紙質(zhì)書籍圖書館,發(fā)展到數(shù)字化多媒體圖書館,再到智能圖書館的進(jìn)程中,科技是驅(qū)動(dòng)圖書館發(fā)展和轉(zhuǎn)型的最重要條件。因此,圖書館在知識(shí)服務(wù)創(chuàng)新過(guò)程中,還需要突破關(guān)鍵的智能技術(shù)。在數(shù)字化、多媒體化、互聯(lián)網(wǎng)化圖書館基礎(chǔ)上,人工智能在數(shù)據(jù)挖掘和深度推理上的創(chuàng)新及其應(yīng)用,使得圖書館的發(fā)展翻開了全新的篇章。圖書館從跨結(jié)構(gòu)數(shù)據(jù)分析、混合群體智能增強(qiáng)技術(shù)、虛擬現(xiàn)實(shí)技術(shù)、增強(qiáng)現(xiàn)實(shí)技術(shù)以及智能硬件芯片等技術(shù)入手,與知識(shí)服務(wù)相結(jié)合,突破這些關(guān)鍵的智能技術(shù)應(yīng)用。
其中,跨媒體分析技術(shù)主要應(yīng)用在多類型數(shù)據(jù)的共同挖掘上,實(shí)際上由于圖書館需要接收不同終端的需求并完成不同媒介類型的回答,因此會(huì)產(chǎn)生結(jié)構(gòu)化、半結(jié)構(gòu)化以及非結(jié)構(gòu)化數(shù)據(jù)。然而,不同結(jié)構(gòu)的數(shù)據(jù)不能同時(shí)完成分析,因此需要采用跨結(jié)構(gòu)數(shù)據(jù)分析方法。此外,群體智能在模擬讀者群體中也能起到關(guān)鍵作用,通過(guò)分析和模擬讀者群體之間的相關(guān)關(guān)系,也可以進(jìn)一步提升圖書館的知識(shí)服務(wù)效能。虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)技術(shù)則是與圖書館物理場(chǎng)館相結(jié)合的技術(shù),建設(shè)真實(shí)感較強(qiáng)的圖書館場(chǎng)景,可以進(jìn)一步提升圖書館的智能服務(wù)。最后,圖書館中的人工智能技術(shù)需要強(qiáng)大的計(jì)算能力支撐,這也是圖書館需要開發(fā)和設(shè)計(jì)適合自身業(yè)務(wù)的智能硬件芯片的主要原因。
人工智能技術(shù)集合了多種不同技術(shù),因此在運(yùn)營(yíng)和管理上將會(huì)涉及復(fù)雜的系統(tǒng)工程。然而,當(dāng)前的大多數(shù)圖書館都采用外包的形式,通過(guò)第三方科技公司的開發(fā)、運(yùn)營(yíng)和管理,這種方式使得人工智能技術(shù)與圖書館相關(guān)業(yè)務(wù)結(jié)合不緊密,喪失了人工智能技術(shù)在圖書館知識(shí)服務(wù)中的創(chuàng)新作用。因此,為了提升人工智能技術(shù)的實(shí)際效用,圖書應(yīng)該組建專業(yè)服務(wù)團(tuán)隊(duì),并培養(yǎng)核心科技人才。在培養(yǎng)核心科技人才時(shí),一方面可以通過(guò)人力資源優(yōu)惠政策吸引高科技人才的加盟,負(fù)責(zé)人工智能的整體規(guī)劃服務(wù)管理,以及在服務(wù)器和終端上的技術(shù)維護(hù)和數(shù)據(jù)分析。核心科技人才可以通過(guò)講座、活動(dòng)等加強(qiáng)與圖書館管理人員之間的交流,加強(qiáng)科技與核心服務(wù)之間的結(jié)合,讓人工智能技術(shù)能夠切實(shí)地解決圖書館的相關(guān)問(wèn)題。
另外,圖書館不但需要培養(yǎng)自己的核心科技人才,還需要加強(qiáng)與科技機(jī)構(gòu)之間的合作,通過(guò)訪問(wèn)交流的方式,學(xué)習(xí)人工智能技術(shù)在圖書館應(yīng)用中的管理、運(yùn)維經(jīng)驗(yàn),這類交流人員可作為核心科技的輔助人才,協(xié)助引進(jìn)的人才,共同完成知識(shí)服務(wù)的創(chuàng)新。最后,圖書館還應(yīng)該基于核心科技人才構(gòu)建專家智庫(kù),并使專家智庫(kù)應(yīng)用于知識(shí)服務(wù)過(guò)程中,為圖書館的知識(shí)服務(wù)提供更科學(xué)、更優(yōu)化的解決方案。
一般來(lái)說(shuō),圖書館服務(wù)的考核主要包括智能交互系統(tǒng)、讀者群體、運(yùn)行和管理模式等方面的內(nèi)容。實(shí)際上,對(duì)于圖書館知識(shí)服務(wù)的考核,需要?jiǎng)澐譃椴煌A段。在人工智能服務(wù)的初期,應(yīng)該充分考慮人工智能技術(shù)的可持續(xù)發(fā)展,通過(guò)對(duì)各項(xiàng)服務(wù)進(jìn)行前期的小范圍調(diào)試與測(cè)試,收集讀者的反饋信息,充分考慮反饋信息之間的耦合性,提升服務(wù)器的穩(wěn)定性,改善服務(wù)邏輯中存在的問(wèn)題。在反饋與評(píng)估過(guò)程中主要指標(biāo)為服務(wù)效果和讀者滿意程度,服務(wù)效果包括服務(wù)的成本、質(zhì)量、收益和反饋等。讀者滿意程度則包括使用方式、科學(xué)背景、隱私保護(hù)以及興趣偏好等。圖書館可采用問(wèn)卷調(diào)查的形式完成,通過(guò)對(duì)兩個(gè)主要指標(biāo)建立考評(píng)制度和體系,形成評(píng)估報(bào)告,完善考核制度。
作為讀者方,在使用圖書館提供的人工智能知識(shí)服務(wù)中,由于人工智能的開放性,通常會(huì)造成個(gè)人隱私的安全問(wèn)題。因此,圖書館還應(yīng)該考慮信息安全問(wèn)題,尊重讀者的個(gè)人隱私信息,通過(guò)安全加密的手段,傳輸與用戶信息相關(guān)的知識(shí)圖譜與用戶畫像。在服務(wù)器與不同形式終端之間,應(yīng)該設(shè)計(jì)防火墻和入侵檢測(cè)系統(tǒng),并在系統(tǒng)中植入智能檢測(cè)和判斷,對(duì)高風(fēng)險(xiǎn)的個(gè)人隱私信息發(fā)出預(yù)警,保障讀者的所有信息都在低風(fēng)險(xiǎn)范圍內(nèi),建立可靠的安全制度。
人工智能背景下,實(shí)現(xiàn)圖書館知識(shí)服務(wù)創(chuàng)新的主要路徑是通過(guò)數(shù)據(jù)挖掘和模式分析方法,對(duì)海量的異構(gòu)數(shù)據(jù)進(jìn)行分析,形成多種類型的知識(shí)圖譜,并通過(guò)對(duì)知識(shí)圖譜的深度推理,建設(shè)智能導(dǎo)航、檢索、推薦、咨詢以及問(wèn)答系統(tǒng),讓讀者享受更方便、快捷的知識(shí)服務(wù)。同時(shí),人工智能帶來(lái)的信息安全問(wèn)題,尚待完善的考核制度問(wèn)題,以及核心科技人才培養(yǎng)等問(wèn)題,將是今后研究和探索的重點(diǎn)。