王建新
(南京圖書館,江蘇 南京 210018)
1956年,約翰·麥卡錫(John McCarthy)在達特茅斯會議上首次提出“人工智能”(Artificial Intelligence)的概念[1]。人工智能作為計算機科學的一個分支,被人們稱為“現(xiàn)代技術(shù)的三大尖端之一”。美國國際斯坦福研究所人工智能研究中心主任尼爾遜將人工智能描述為“有關(guān)認知的課程”[2]。麻省理工學院的溫斯頓教授認為,人工智能是研究如何利用計算機執(zhí)行過去只有人類才能完成的任務(wù)[3]。雖然學者們對人工智能的定義各不相同,但他們的觀點都體現(xiàn)了人工智能學科研究的基本思路與內(nèi)涵,將人工智能科學歸納為研究人類智慧活動的基本規(guī)律。
人工智能時代,世界信息量快速增多,技術(shù)的進步逐步改變了用戶的信息行為和信息需求,圖書館用戶流失的問題日益凸顯。2017年的調(diào)查數(shù)據(jù)顯示,我國網(wǎng)民人數(shù)超過7.5億人,其中移動互聯(lián)網(wǎng)網(wǎng)民接近10億人[4],我國國民的閱讀量與微信讀書時長持續(xù)增加。相關(guān)調(diào)查數(shù)據(jù)顯示,人們偏好利用搜索引擎檢索閱讀資源,圖書館網(wǎng)站的利用率較低,紙質(zhì)圖書借閱量呈下降趨勢,用戶流失問題嚴重。
目前,信息服務(wù)領(lǐng)域的“信息孤島”問題仍然存在。雖然圖書館積極依托超星、CNKI、Elsevier、EBSCO等大型數(shù)據(jù)庫開展智慧化建設(shè),但由于各數(shù)據(jù)庫的資源操作模式、數(shù)據(jù)格式不同,圖書館在人工智能資源利用方面存在較多問題。EDS、Summon、Primo等國外的搜索引擎支持統(tǒng)一檢索,資料公開,但我國CNKI、超星、百度學術(shù)等數(shù)據(jù)庫的搜索引擎仍無法全面實現(xiàn)精準檢索和知識聯(lián)系。美國圖書館協(xié)會的相關(guān)報告提出,2010年至2016年,學校圖書館的數(shù)字內(nèi)容檢索成功率有所提高,但用戶體驗仍然不佳,說明學校圖書館在資源整合方面存在問題。
國外的Google、Bing、Yahoo,以及我國的百度、搜狗、360等搜索引擎大多以被動式檢索為主,用戶需主動輸入準確的關(guān)鍵字才能完成檢索,僅能提供鏈接,缺少與用戶的互動。目前,搜索引擎存在的主要問題為無法整合多維度的信息、難以處理詞語表達差異及難以實現(xiàn)個性化搜索等。為實現(xiàn)智能檢索,圖書館應對大規(guī)模結(jié)構(gòu)化數(shù)據(jù)進行快速檢索、整理,以感知網(wǎng)頁中的內(nèi)容及其含義,并將非結(jié)構(gòu)化的聲音、影像等信息轉(zhuǎn)化為計算機可識別的數(shù)據(jù)。
圖書館大多為社會公益性組織,運營資金主要依賴財政撥款。在不明確人工智能技術(shù)經(jīng)濟效益的前提下,圖書館應通過合資、自主開發(fā)或申請政府資助等方式解決技術(shù)資金問題,開展人工智能項目的研發(fā)工作。目前,僅有部分大型圖書館有機會獲得有關(guān)部門和機構(gòu)的科研資金支持,但仍難以滿足圖書館對人工智能技術(shù)的研究需求。因此,圖書館要想在人工智能領(lǐng)域?qū)崿F(xiàn)跨越式發(fā)展,就必須不斷尋找新的資金來源和合作途徑。
筆者構(gòu)建了一種基于人工智能技術(shù)的圖書館框架,該框架主要涵蓋基本硬件層、數(shù)據(jù)融合層、技術(shù)處理層、應用服務(wù)層等主要層級,綜合利用大數(shù)據(jù)分析、數(shù)據(jù)挖掘、圖像信息服務(wù)、機器學習、智能信息提取等人工智能技術(shù),實現(xiàn)多場景、多維度、多業(yè)務(wù)的圖書館智能服務(wù)規(guī)劃,以期為讀者提供智能圖書推薦、智能導航定位、智能參考咨詢、智能檢索及智能預約等智慧化服務(wù)。
3.2.1 基本硬件層?;居布雍w傳統(tǒng)的電腦控制系統(tǒng)、存儲器、計算設(shè)備等要件,以及互聯(lián)網(wǎng)、傳感器、信息處理等人工智能技術(shù)設(shè)施,可為智能圖書館平臺的大規(guī)模信息化建設(shè)提供軟硬件支持。
3.2.2 數(shù)據(jù)融合層。數(shù)據(jù)融合層一般分為資源信息池、讀者信息池和認知信息池三個部分。其中,資源信息池是圖書館底層的數(shù)據(jù)資源,認知信息池包括無線感應、視頻監(jiān)測、基于RFID技術(shù)的空間信息等要素,讀者信息池包含讀者的個人信息和行為信息。數(shù)據(jù)融合層可提供互聯(lián)網(wǎng)信息、資料庫信息、組織架構(gòu)信息、開放存儲信息、網(wǎng)絡(luò)資源信息等基礎(chǔ)數(shù)據(jù),這些信息部分來源于圖書館的資源管理數(shù)據(jù)體系,部分來源于互聯(lián)網(wǎng)、知識庫等[5]。
3.2.3 技術(shù)處理層。技術(shù)處理層是該總體框架的核心層,集成了統(tǒng)計分析、數(shù)據(jù)挖掘、機器學習、自然語言處理等功能,能夠?qū)崟r對讀者的行為進行感知研究,發(fā)掘業(yè)務(wù)需求[6]。技術(shù)處理層的關(guān)鍵技術(shù)包括統(tǒng)計分析與數(shù)據(jù)挖掘、聚類分析與預測、定量分析與定性分析等。
3.2.4 應用服務(wù)層。應用服務(wù)層為圖書館智能業(yè)務(wù)的最終表現(xiàn)形式,主要包括智能數(shù)據(jù)信息資源業(yè)務(wù)、智能信息內(nèi)容業(yè)務(wù)和智能信息需求業(yè)務(wù)三個部分,旨在準確掌握讀者的智能業(yè)務(wù)需求,開展有針對性的智能服務(wù),協(xié)助讀者收集、使用及共享信息數(shù)據(jù)。
圖書館要想科學、合理、有效地利用人工智能技術(shù),就要提升館員和讀者的技術(shù)素養(yǎng),不斷拓寬人工智能技術(shù)的利用渠道,解決運營過程中存在的技術(shù)問題。為此,圖書館可引導館員深入學習人工智能技術(shù),利用人工智能技術(shù)解決工作中的實際問題,提升他們的服務(wù)工作質(zhì)量;加大對館員的培訓力度,使館員完全掌握人工智能技術(shù)的利用方式,提升服務(wù)能力;開設(shè)以人工智能技術(shù)為主題的專業(yè)培養(yǎng)課程,并注重信息技術(shù)的創(chuàng)新性研究[7]。
大數(shù)據(jù)關(guān)乎所有公民的個人隱私安全,因此,圖書館必須建立規(guī)范的大數(shù)據(jù)應用標準,明確基于人工智能的數(shù)據(jù)分析及應用權(quán)限,防止相關(guān)問題和糾紛的產(chǎn)生。一方面,有關(guān)部門應在法治倫理層面規(guī)范和約束圖書館利用人工智能技術(shù)的行為;另一方面,圖書館應根據(jù)相關(guān)法律法規(guī)建立智能圖書館數(shù)據(jù)使用標準,科學、正確處理在利用人工智能技術(shù)過程中出現(xiàn)的各類問題,維護讀者和館員的正當權(quán)益。