摘 要:本文以AI為起點(diǎn),探索人工智能在圖書館發(fā)展的方向,結(jié)合AI特點(diǎn),提出構(gòu)建數(shù)字圖書館面臨的幾大挑戰(zhàn):圖書數(shù)據(jù)源的生成與獲取、數(shù)字化圖書館的平臺(tái)搭建及疏通各地資源共享的問(wèn)題。嘗試探索以讀者為中心的數(shù)字圖書館的建設(shè)方向,分析數(shù)字圖書館如何利用AI思維高效服務(wù)讀者,建立以讀者個(gè)人畫像為基礎(chǔ)的的智慧圖書系統(tǒng);同時(shí)分析了數(shù)字圖書館的建立對(duì)人工智能發(fā)展的促進(jìn)作用。
關(guān)鍵詞:AI;大數(shù)據(jù);個(gè)人畫像;自然語(yǔ)言理解;知識(shí)圖譜
一、引言
隨著人工智能(Artificial Intelligence,AI)近幾年的興起,越來(lái)越多的人都在探索人工智能在各自行業(yè)的應(yīng)用。事實(shí)上,當(dāng)前情況下人工智能的實(shí)現(xiàn)只能在大數(shù)據(jù)量背景下的行業(yè)才具有現(xiàn)實(shí)意義。因?yàn)檠巯碌娜斯ぶ悄軙r(shí)代是以大數(shù)據(jù)為基礎(chǔ)的時(shí)代,沒有大數(shù)據(jù)的行業(yè),智能化的實(shí)現(xiàn)還不現(xiàn)實(shí),那么結(jié)合圖書館業(yè)務(wù),哪些方面具有大數(shù)據(jù)特征呢?
二、AI與圖書館
很顯然,書是圖書館的最重要價(jià)值,書越多、越珍貴稀有,圖書館的名氣越大,而書中海量的文字資源,就是圖書館的大數(shù)據(jù)。例如,四川省圖書館藏有書籍500余萬(wàn)冊(cè),其中古籍65萬(wàn)冊(cè)、民國(guó)文獻(xiàn)22萬(wàn)冊(cè),數(shù)字資源達(dá)150TB;若將整個(gè)四川的圖書資源匯總,這個(gè)數(shù)據(jù)將是更大的資源。
此外,圖書館服務(wù)的人員、每天全川各個(gè)圖書館借閱的人員,這之間流動(dòng)產(chǎn)生的數(shù)據(jù)也是很大的數(shù)據(jù)業(yè)務(wù),解決圖書館服務(wù)業(yè)務(wù)也是當(dāng)前面臨的難題。例如,四川省圖書館從業(yè)人員就達(dá)200多人,大多數(shù)服務(wù)人員都是在做簡(jiǎn)單機(jī)械的重復(fù)工作,解放這部分人力資源是改進(jìn)圖書館服務(wù)水平的關(guān)鍵。
人工智能的四個(gè)核心學(xué)科之一為,知識(shí)工程研究如何用機(jī)器代替人,即實(shí)現(xiàn)知識(shí)的表示、獲取、推理、決策,包括機(jī)器定理證明、專家系統(tǒng)、機(jī)器博弈、數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)、不確定性推理、領(lǐng)域知識(shí)庫(kù);還有數(shù)字圖書館、維基百科、知識(shí)圖譜等大型知識(shí)工程。
三、構(gòu)建數(shù)字圖書館面臨挑戰(zhàn)
當(dāng)前,各行各業(yè)都在構(gòu)建自己的數(shù)字資源,數(shù)據(jù)資源就是工業(yè)革命中的石油,有了它就具備豐富的財(cái)富資源。而當(dāng)前圖書館里的圖書,就是人類數(shù)字財(cái)富中最優(yōu)質(zhì)“石油”。因此快速搶先占領(lǐng)數(shù)字資源,就打下了豐富的財(cái)富基礎(chǔ)。圖書館應(yīng)充分利用現(xiàn)有的寶貴文字資源,盡快實(shí)現(xiàn)文字資源的數(shù)字化。當(dāng)前環(huán)境下,構(gòu)建數(shù)字化圖書館還面臨如下挑戰(zhàn)。
(一)數(shù)字資源的獲取與生成
首先是圖書館的藏書如何變換成數(shù)字資源,這需要投入大量人力物力去整合,但其投入產(chǎn)出比相當(dāng)?shù)拖?,也就是說(shuō),做這個(gè)事情當(dāng)前看不出多少實(shí)際效益。在當(dāng)前以經(jīng)濟(jì)利益為前提的條件下,吸引力不足,推動(dòng)力就弱,如何快速有效地將圖書資源轉(zhuǎn)化為電子資源是當(dāng)前面臨的問(wèn)題。關(guān)于此,應(yīng)該以政府推動(dòng)為主,以引入企業(yè)為鋪,盡快將圖書館向數(shù)字化推進(jìn)。
(二)圖書館IT平臺(tái)的搭建
當(dāng)前IT設(shè)備費(fèi)用相較以前已經(jīng)大大降低,但涉及到部署高效快速的硬件IT平臺(tái),前期投入的金額是巨大的。很多圖書館因?yàn)闊o(wú)法徹底進(jìn)行數(shù)字化改造,僅靠年復(fù)一年的少量投入,無(wú)法滿足圖書館數(shù)字化平臺(tái)的建設(shè)。因此,對(duì)于如何推動(dòng)圖書館IT化實(shí)施,需要相關(guān)主導(dǎo)單位拿出統(tǒng)一建設(shè)思路,做到資源不重復(fù)建設(shè),各圖書館協(xié)調(diào)發(fā)展。
(三)圖書館數(shù)字化平臺(tái)共享問(wèn)題
圖書館數(shù)字化的建立需要疏通各地圖書館,需要政府層面統(tǒng)一規(guī)劃共享,實(shí)現(xiàn)資源的共同建設(shè),共同享用,不是每個(gè)圖書館都需要建立一套資源雷同的IT資源平臺(tái),只有那些具備各自特性的圖書館才有建立的必要。構(gòu)建這理想化的全川數(shù)字化圖書館資源共享平臺(tái),涉及到諸多方面的制約,如縣區(qū)級(jí)圖書館與省級(jí)圖書館之間,公共圖書館與專業(yè)圖書館之間,服務(wù)用戶人群的差異,圖書服務(wù)的收入分配問(wèn)題等。
四、以讀者為中心的智能圖書館的建設(shè)指引
(一)當(dāng)前圖書館服務(wù)現(xiàn)狀
OCLC 2010年報(bào)告顯示出新信息環(huán)境下用戶對(duì)圖書館認(rèn)知和行為的變化,84%的用戶使用搜索引擎開始信息檢索,沒有人從圖書館網(wǎng)頁(yè)上開始信息的檢索。2014年北大圖書館的書籍借閱總數(shù)為62萬(wàn)本,是近10年的最低數(shù)量,與2006年的107萬(wàn)本相比,下降了42%。
從調(diào)查情況可以看出,當(dāng)前讀者已經(jīng)對(duì)圖書館的運(yùn)作模式逐漸失去信心,更多的人趨于使用方便快捷的電子閱覽方式。
(二)當(dāng)前圖書館業(yè)務(wù)發(fā)展方向探討
構(gòu)建以讀者服務(wù)為宗旨的圖書館發(fā)展新方向成了當(dāng)前的重要目標(biāo),圖書館要從傳統(tǒng)的在館內(nèi)服務(wù)方式,逐漸轉(zhuǎn)向館內(nèi)和館外兩手抓,以讀者自由選擇的方式。
在館內(nèi),需要不斷提升服務(wù)水平,以讀者的角度去考慮,并以如何盡快讓讀者獲取知識(shí),找到相關(guān)知識(shí)點(diǎn)為目標(biāo),加快構(gòu)建館內(nèi)圖書索引;同時(shí),建立圖書智能機(jī)器人,將館內(nèi)的圖書資源電子化,并能根據(jù)讀者的需求,迅速搜索出館藏內(nèi)相關(guān)的書籍信息供讀者選擇,還可結(jié)合館藏內(nèi)原有的書籍索引系統(tǒng),大大節(jié)約讀者尋找相關(guān)資料的時(shí)間,減少在館內(nèi)停留的時(shí)間。此外,充分利用館內(nèi)讀者信息,構(gòu)建讀者個(gè)人信息檔案,為提供個(gè)性化服務(wù)打好基礎(chǔ)。每個(gè)進(jìn)館內(nèi)的讀者,都是帶給圖書館巨大的數(shù)字資源,有了數(shù)據(jù)就有了一切,就像現(xiàn)代工業(yè)中的石油一樣,有了豐富的石油,就為現(xiàn)代工業(yè)的發(fā)展提供了強(qiáng)勁動(dòng)力。因此,圖書館建設(shè)者一定要轉(zhuǎn)變現(xiàn)有思維,要具有大數(shù)據(jù)、AI思維能力,充分挖掘在為讀者服務(wù)過(guò)程中的數(shù)字資源。
在館外,開發(fā)圖書館APP,讓讀者方便快捷地瀏覽館內(nèi)資源,同時(shí)可以開展付費(fèi)方式書籍的瀏覽,充分利用電子資源的便利性,在不影響用戶感知的情況下,引入廣告資源,降低讀者資費(fèi)。此外,結(jié)合個(gè)人畫像,對(duì)用戶的個(gè)性喜好進(jìn)行有針對(duì)性推送,充分服務(wù)讀者,留住讀者,圖書館的服務(wù)對(duì)象擴(kuò)大了,圖書館的業(yè)務(wù)能力也就得到增加。
今后圖書館的強(qiáng)大,不是館藏資源有多豐富,不是有多少讀者來(lái)館里訪問(wèn),而是實(shí)實(shí)在在服務(wù)的人員有多少。由于直接訪問(wèn)圖書館的讀者畢竟有距離的限制,而APP方式直接拉近讀者與圖書館的距離,所以圖書館的業(yè)務(wù)擴(kuò)展方向在于對(duì)館外讀者資源的爭(zhēng)奪,誰(shuí)獲取的用戶多,替用戶考慮得多,服務(wù)質(zhì)量高,留得住讀者,圖書館的實(shí)力就越強(qiáng)大。反之,圖書館無(wú)特色,服務(wù)質(zhì)量低下,終歸走向被淘汰兼并的邊緣。
筆者認(rèn)為,圖書館的發(fā)展方向應(yīng)該結(jié)合當(dāng)前AI思維,結(jié)合當(dāng)前人工智能化服務(wù),建立一個(gè)包含有基礎(chǔ)數(shù)據(jù)層、中間技術(shù)處理層、上層服務(wù)應(yīng)用層的下一代圖書館人工智能服務(wù)系統(tǒng),在提供圖書館所實(shí)現(xiàn)的文獻(xiàn)借閱、資源定制、學(xué)科咨詢、數(shù)據(jù)共享等基本的文獻(xiàn)服務(wù)、信息服務(wù)、知識(shí)服務(wù)的同時(shí),以“面向用戶為中心”的智慧化服務(wù)方向轉(zhuǎn)變,為讀者提供基于用戶信息行為數(shù)據(jù)挖掘分析的需求感知與傳遞、知識(shí)生成與發(fā)現(xiàn)、服務(wù)策略創(chuàng)建與調(diào)整、用戶反饋與優(yōu)化等服務(wù)產(chǎn)品。
五、圖書館在AI中扮演的重大歷史使命
眾所周知,世界各地圖書館中都藏有各種形形色色的圖書,這些圖書是人類幾千年歷史進(jìn)程中逐步產(chǎn)生出來(lái)的優(yōu)秀文字資源,他們是人類進(jìn)化的知識(shí)結(jié)晶,如何充分利用這些圖書資源來(lái)服務(wù)AI,來(lái)推動(dòng)AI發(fā)展,是當(dāng)前圖書館的一大歷史機(jī)遇。
我們都知道,AI中的一重大分支就是自然語(yǔ)言的理解,而當(dāng)前的自然語(yǔ)言處理方法都是基于統(tǒng)計(jì)的模型。在圖書館信息化過(guò)程中,將手握全球最優(yōu)質(zhì)語(yǔ)言的數(shù)字化資源。如何充分挖掘人類語(yǔ)言的理解規(guī)則,讓機(jī)器讀懂人類語(yǔ)言,是當(dāng)前AI的重要發(fā)展目標(biāo)。
圖書館在自然語(yǔ)言的處理中有著得天獨(dú)厚的優(yōu)勢(shì),就是圖書館里的文字都是優(yōu)秀文化資源,對(duì)語(yǔ)言的理解,語(yǔ)言的嚴(yán)謹(jǐn)度都不同于一般的人類口語(yǔ)交流中產(chǎn)生的言語(yǔ),因此圖書館應(yīng)在數(shù)字化基礎(chǔ)上積極探索機(jī)器如何理解自然語(yǔ)言,尋找讓數(shù)學(xué)的方法描述語(yǔ)言的規(guī)律,讓計(jì)算機(jī)處理自然語(yǔ)言。當(dāng)前,對(duì)自然語(yǔ)言處理這塊比較前沿的兩個(gè)方法是詞向量的研究和知識(shí)圖譜構(gòu)建。詞向量就是根據(jù)一個(gè)詞在一個(gè)統(tǒng)計(jì)范圍的語(yǔ)言內(nèi),如在1萬(wàn)篇不同文字內(nèi)容(這要根據(jù)當(dāng)前機(jī)器算法能處理的能力來(lái)做),對(duì)該詞(字)出現(xiàn)的前后關(guān)聯(lián)做一概率算法,來(lái)判定前后詞之間的出現(xiàn)概率,以便確定前后詞,這樣的推斷就是按照現(xiàn)有的文字資源來(lái)推斷當(dāng)前詞的伙伴關(guān)系,這種方式利用了人們學(xué)習(xí)語(yǔ)言的思維方式,從產(chǎn)生的語(yǔ)言文字中推斷相關(guān)語(yǔ)言。另外一種知識(shí)圖譜,需要挖掘當(dāng)前語(yǔ)言環(huán)境下各種背后邏輯,要構(gòu)建這個(gè)知識(shí)圖譜,需要分許許多多不同的細(xì)化場(chǎng)景,挖掘出這些細(xì)小場(chǎng)景后,需關(guān)聯(lián)更大范圍的場(chǎng)景,不斷擴(kuò)大知識(shí)延伸的范圍,構(gòu)建整個(gè)語(yǔ)言的知識(shí)圖譜,讓機(jī)器具備邏輯推理的基礎(chǔ),才真正有初步智能化的思維。
因此,圖書館應(yīng)該加大研發(fā)投入,讓圖書館的數(shù)字資源——這一人類進(jìn)化的知識(shí)結(jié)晶不要被埋沒。
基金項(xiàng)目:本篇論文是作者主持2018-2020年四川省文化和旅游廳圖書情報(bào)學(xué)與文獻(xiàn)學(xué)項(xiàng)目(川文旅辦發(fā)【2019】52號(hào))規(guī)劃課題“智能時(shí)代大數(shù)據(jù)與圖書館發(fā)展研究”課題的成果(項(xiàng)目編號(hào):WHTTSXM[2018]21)。
作者簡(jiǎn)介:柴琳(1980—),女,四川成都人,研究生,副研究館員,研究方向:圖書館學(xué)、情報(bào)學(xué)、文獻(xiàn)學(xué)。