[中圖分類號(hào)]G254.36 [文獻(xiàn)標(biāo)志碼]B
[文章編號(hào)]1005-6041(2025)02-0088-07
1引言
文獻(xiàn)是讀者獲取知識(shí)信息的重要來(lái)源,圖書(shū)館作為信息資源庫(kù),儲(chǔ)藏著海量的文獻(xiàn)。如何對(duì)這些文獻(xiàn)進(jìn)行精準(zhǔn)分類和高效管理,是圖書(shū)館學(xué)研究的重點(diǎn)課題之一。分類編目是實(shí)現(xiàn)海量文獻(xiàn)資源高效管理的基礎(chǔ)環(huán)節(jié),直接影響著讀者檢索與利用文獻(xiàn)資源的效率。傳統(tǒng)的人工分類編目工作存在著分類結(jié)果不準(zhǔn)確、編目效率低下的問(wèn)題,而人工智能技術(shù)的發(fā)展給圖書(shū)館自動(dòng)分類編目帶來(lái)新機(jī)遇,應(yīng)用人工智能中的深度學(xué)習(xí)、機(jī)器學(xué)習(xí)等技術(shù)可以實(shí)現(xiàn)對(duì)文獻(xiàn)更精準(zhǔn)、高效的分類編目,提升文獻(xiàn)檢索速度,降低圖書(shū)館運(yùn)營(yíng)管理成本。
2人工智能和自動(dòng)分類編目系統(tǒng)概述
2.1人工智能
人工智能(ArtificialIntelligence,AI)是模擬人類智能、思考能力并形成應(yīng)用系統(tǒng)的科學(xué)技術(shù)[1]人工智能需要多種技術(shù)支撐,包括機(jī)器學(xué)習(xí)、深度學(xué)習(xí),通過(guò)各類技術(shù)的集中應(yīng)用,建立模擬人類計(jì)算、分析、邏輯、認(rèn)知、理解、思考、創(chuàng)作等關(guān)鍵能力的智能系統(tǒng),輔助人類完成工作[2]
2.2自動(dòng)分類編目系統(tǒng)
圖書(shū)館自動(dòng)分類編目系統(tǒng)是應(yīng)用人工智能技術(shù)對(duì)館藏資源、科研數(shù)據(jù)等文獻(xiàn)資源,依據(jù)不同分類規(guī)則實(shí)現(xiàn)自動(dòng)分類和編目的系統(tǒng)。系統(tǒng)主要通過(guò)對(duì)文獻(xiàn)資源標(biāo)題、簡(jiǎn)介、內(nèi)容、關(guān)鍵詞等關(guān)鍵信息進(jìn)行分析,運(yùn)用機(jī)器學(xué)習(xí)算法,將文獻(xiàn)準(zhǔn)確歸入對(duì)應(yīng)的類別當(dāng)中,并生成規(guī)范的編目信息[3]。自動(dòng)分類編目系統(tǒng)主要具備以下功能:自動(dòng)分類功能,包括文本提取、智能化分類和動(dòng)態(tài)調(diào)整[4];自動(dòng)編目功能,包括信息提取、標(biāo)準(zhǔn)化處理和關(guān)聯(lián)建立[5];智能檢索功能,包括多維度檢索、模糊檢索、檢索結(jié)果排序和相關(guān)推薦[6];數(shù)據(jù)管理功能,主要包括圖書(shū)入庫(kù)管理、數(shù)據(jù)更新、數(shù)據(jù)備份與恢復(fù)、統(tǒng)計(jì)分析等[7]
3基于人工智能的圖書(shū)館自動(dòng)分類編目系統(tǒng)設(shè)計(jì)需求分析
基于人工智能的圖書(shū)館自動(dòng)分類編目系統(tǒng)需求包括功能需求、性能需求、安全需求、用戶體驗(yàn)需求(見(jiàn)表1)。
3.1功能需求
分類和編目功能是系統(tǒng)設(shè)計(jì)的核心,它基于機(jī)器學(xué)習(xí)算法、深度學(xué)習(xí)算法,能適應(yīng)圖書(shū)館復(fù)雜語(yǔ)言環(huán)境下海量文獻(xiàn)的自動(dòng)分類需要[4]。文獻(xiàn)分類須嚴(yán)格遵循通用的分類標(biāo)準(zhǔn)即《中國(guó)圖書(shū)館分類法》,同時(shí)要考慮到不同類型圖書(shū)館的分類需要,自動(dòng)調(diào)整分類標(biāo)準(zhǔn)[5]。系統(tǒng)的自動(dòng)編目功能也有著重要作用。從各類館藏資源的源數(shù)據(jù)中提取關(guān)鍵信息,深人分析文獻(xiàn)的前言、介紹、內(nèi)容、目錄、書(shū)名,從這些信息中挖掘文獻(xiàn)主題、關(guān)鍵詞和摘要等內(nèi)容,豐富編目信息。編目格式要規(guī)范統(tǒng)一,能夠?yàn)樽x者后續(xù)精準(zhǔn)檢索和管理提供支持。系統(tǒng)的智能檢索功能為用戶精準(zhǔn)快速查詢圖書(shū)文獻(xiàn)提供了便利。智能檢索功能要具備多種檢索方式,包括關(guān)鍵詞檢索、主題檢索、來(lái)源檢索、書(shū)名檢索、作者檢索、分類檢索等,要滿足不同類型用戶的檢索需求。自然語(yǔ)言處理技術(shù)的應(yīng)用使系統(tǒng)更容易理解用戶檢索意圖,為用戶提供適合的檢索方式,提高檢索的便利性、有效性。智能檢索提示功能則在用戶輸入信息不完整或模糊檢索時(shí)發(fā)揮作用,根據(jù)用戶提供的提示信息,幫助用戶快速查詢文獻(xiàn)。系統(tǒng)的個(gè)性化推薦功能可根據(jù)用戶的閱讀興趣、瀏覽習(xí)慣、行為偏好信息,為用戶量身定制檢索方案。個(gè)性化推薦算法經(jīng)過(guò)迭代優(yōu)化,能通過(guò)電子郵件、短信、微信等方式為用戶精準(zhǔn)推薦資源,讓用戶快速了解到感興趣的文獻(xiàn)。系統(tǒng)的數(shù)據(jù)管理功能可以集成化管理各類文獻(xiàn)資源,以及用戶在使用圖書(shū)館的過(guò)程中產(chǎn)生的基本信息。系統(tǒng)的數(shù)據(jù)備份和恢復(fù)功能確保了文獻(xiàn)資源與用戶數(shù)據(jù)的安全。即使出現(xiàn)數(shù)據(jù)泄露和存儲(chǔ)設(shè)備損壞的問(wèn)題,也能快速恢復(fù)數(shù)據(jù),保障用戶對(duì)系統(tǒng)的正常使用。
3.2性能需求
由于文獻(xiàn)分類編目結(jié)果直接影響著文獻(xiàn)存儲(chǔ)管理和用戶的檢索體驗(yàn),因此自動(dòng)分類編目系統(tǒng)可通過(guò)優(yōu)化計(jì)算機(jī)視覺(jué)算法和加大對(duì)精準(zhǔn)識(shí)別工具數(shù)據(jù)訓(xùn)練等方法確保文獻(xiàn)分類編目結(jié)果具備較高的準(zhǔn)確性。同時(shí),自動(dòng)分類編目系統(tǒng)還要保證高效性。系統(tǒng)要具備較快的反應(yīng)速度,能快速完成識(shí)別、分類、編目、入庫(kù)、精準(zhǔn)檢索等操作。對(duì)于海量的文獻(xiàn)資源,自動(dòng)分類編目系統(tǒng)可以利用分布式計(jì)算技術(shù),優(yōu)化數(shù)據(jù)庫(kù)結(jié)構(gòu),提高系統(tǒng)的反應(yīng)效率,對(duì)各類文獻(xiàn)實(shí)現(xiàn)高效處理和綜合管理。自動(dòng)分類編目系統(tǒng)需要在圖書(shū)館長(zhǎng)期運(yùn)行,代替圖書(shū)館員開(kāi)展分類和編目工作,因此,系統(tǒng)運(yùn)行過(guò)程中要保持良好的穩(wěn)定性,在長(zhǎng)期運(yùn)行過(guò)程中不出現(xiàn)重大故障甚至系統(tǒng)崩潰等問(wèn)題。當(dāng)故障出現(xiàn)時(shí)能夠通過(guò)備份快速恢復(fù),保障系統(tǒng)持續(xù)提供可靠的服務(wù)。為確保自動(dòng)分類編目系統(tǒng)的穩(wěn)定運(yùn)行,將系統(tǒng)運(yùn)行風(fēng)險(xiǎn)維持在可控范圍內(nèi),圖書(shū)館要建立系統(tǒng)運(yùn)行故障監(jiān)測(cè)和恢復(fù)機(jī)制,及時(shí)發(fā)現(xiàn)系統(tǒng)運(yùn)行過(guò)程問(wèn)題并予以解決。
3.3安全需求
數(shù)據(jù)安全是系統(tǒng)安全的重要內(nèi)容。對(duì)于圖書(shū)館而言,可通過(guò)數(shù)據(jù)加密技術(shù)對(duì)文獻(xiàn)資源加密存儲(chǔ),根據(jù)用戶需求建立嚴(yán)格的系統(tǒng)使用權(quán)限管理機(jī)制,定期掃描系統(tǒng)安全漏洞并予以及時(shí)修復(fù)。在系統(tǒng)運(yùn)行安全防護(hù)方面,可安裝網(wǎng)絡(luò)防火墻、數(shù)據(jù)隔絕服務(wù)器、多功能網(wǎng)閘防范網(wǎng)絡(luò)攻擊,同時(shí)建立完善的備份和恢復(fù)機(jī)制,保障系統(tǒng)在遭受黑客攻擊或病毒感染后能夠快速恢復(fù)[8]。每天實(shí)時(shí)對(duì)系統(tǒng)操作進(jìn)行日志記錄和風(fēng)險(xiǎn)評(píng)估,便于事后的審計(jì)與追蹤,最大限度防控系統(tǒng)的網(wǎng)絡(luò)安全風(fēng)險(xiǎn)。
3.4用戶體驗(yàn)需求
友好型界面是提升用戶體驗(yàn)的關(guān)鍵因素,自動(dòng)分類編目系統(tǒng)的操作界面需要考慮用戶習(xí)慣,做到簡(jiǎn)潔明了、方便用戶操作??梢钥紤]將直觀的圖形界面和簡(jiǎn)潔的操作流程融入交互界面設(shè)計(jì)[9]。系統(tǒng)操作界面要注重用戶體驗(yàn),設(shè)置用戶建議反饋端口,讓用戶在了解操作結(jié)果的同時(shí),能針對(duì)系統(tǒng)的操作提出建議反饋。同時(shí),系統(tǒng)要支持移動(dòng)終端使用,能讓用戶隨時(shí)隨地查詢文獻(xiàn)信息并進(jìn)行借閱操作。系統(tǒng)的移動(dòng)端操作界面要根據(jù)移動(dòng)設(shè)備性能和操作系統(tǒng)及時(shí)更新,優(yōu)化操作界面布局,提供便捷的操作方式。考慮到系統(tǒng)需要在圖書(shū)館不同設(shè)備終端進(jìn)行部署,并能為用戶提供良好的服務(wù)體驗(yàn),圖書(shū)館要為館員開(kāi)展系統(tǒng)操作培訓(xùn)和技術(shù)支持,方便為用戶提供在線解答和技術(shù)咨詢服務(wù)??煽紤]定期開(kāi)展培訓(xùn)活動(dòng)、設(shè)計(jì)培訓(xùn)課程、開(kāi)設(shè)系統(tǒng)操作講座、編制用戶手冊(cè)、錄制系統(tǒng)使用教程等方式提高圖書(shū)館員的操作能力。
4基于人工智能的圖書(shū)館自動(dòng)分類編目系統(tǒng)設(shè)計(jì)
基于人工智能的圖書(shū)館自動(dòng)分類編目系統(tǒng)由數(shù)據(jù)采集層、數(shù)據(jù)預(yù)處理層、特征提取層、分類編目層、用戶交互層等5個(gè)層面構(gòu)成(見(jiàn)圖1)。
4.1數(shù)據(jù)采集層
數(shù)據(jù)采集層主要實(shí)現(xiàn)對(duì)用戶數(shù)據(jù)、文獻(xiàn)信息的采集。該層主要包括API數(shù)據(jù)接口、傳感器、Python爬蟲(chóng)程序、3D掃描終端等部件。一方面,數(shù)據(jù)采集層需要通過(guò)穩(wěn)定安全的API數(shù)據(jù)接口與圖書(shū)館管理系統(tǒng)連接,依靠Python爬蟲(chóng)程序獲取題名、責(zé)任者、出版商、ISBN、圖書(shū)購(gòu)買歷史、版本等信息,還要通過(guò)數(shù)據(jù)采集器獲取用戶基本信息、借閱歷史、操作行為等對(duì)分類編目有輔助作用的數(shù)據(jù)。另一方面,要通過(guò)傳感器、高精度掃描儀、高清攝像頭獲取文獻(xiàn)封面圖像和文本信息。對(duì)于拍攝或掃描過(guò)程出現(xiàn)的圖像扭曲文字模糊等問(wèn)題,進(jìn)行圖像矯正和文字識(shí)別優(yōu)化。對(duì)于電子文獻(xiàn),要解析內(nèi)容簡(jiǎn)介、獲取目錄結(jié)構(gòu)、識(shí)別書(shū)簽信息、識(shí)別元數(shù)據(jù),為分類編目提供有效的數(shù)據(jù)信息支持。
4.2數(shù)據(jù)預(yù)處理層
數(shù)據(jù)處理層包括文本清洗模塊、數(shù)據(jù)標(biāo)準(zhǔn)化處理模塊。文本清洗模塊主要對(duì)獲取的文獻(xiàn)文本數(shù)據(jù)進(jìn)行精細(xì)化清洗,去除噪聲信息、特殊字符和無(wú)關(guān)的格式內(nèi)容,對(duì)文本中重復(fù)內(nèi)容、停用詞進(jìn)行處理,按照分類編目標(biāo)準(zhǔn)制訂停用詞表,對(duì)文本中的簡(jiǎn)寫、縮寫內(nèi)容進(jìn)行規(guī)范化處理。數(shù)據(jù)標(biāo)準(zhǔn)化處理模塊主要根據(jù)數(shù)據(jù)類型將不同格式數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一的數(shù)據(jù)格式,對(duì)于文本中的編碼進(jìn)行標(biāo)準(zhǔn)化處理,具備自動(dòng)檢測(cè)和編碼轉(zhuǎn)換能力,如實(shí)現(xiàn)UTF-8與GBK編碼之間的轉(zhuǎn)化,并對(duì)文本中出現(xiàn)的編碼錯(cuò)誤進(jìn)行標(biāo)記和修復(fù)。
4.3特征提取層
特征提取層包括文本特征提取模塊和圖像特征提取模塊。文本特征提取模塊是應(yīng)用自然語(yǔ)言處理技術(shù)中的BERT訓(xùn)練語(yǔ)言模型和傳統(tǒng)的詞向量模型(如Word2Vec、Glove等)將文本轉(zhuǎn)化為向量,并通過(guò)語(yǔ)義角色標(biāo)注、依存句法分析技術(shù)挖掘文本的語(yǔ)義信息。使用TF-IDF算法確定詞語(yǔ)重要性權(quán)重,根據(jù)用戶檢索習(xí)慣自適應(yīng)調(diào)整。圖像特征提取模塊可以應(yīng)用ResNet、Inception等卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型,從文獻(xiàn)封面提取顏色、紋理、圖案等有代表性的圖像視覺(jué)特征,也可以提取圖像中的物體形狀、圖形布局等信息,并且將圖像全局特征和局部特征相結(jié)合,提高文獻(xiàn)分類的準(zhǔn)確性。
4.4分類編目層
分類編目層主要包括分類模型和編目規(guī)則處理模塊。分類模型應(yīng)用決策樹(shù)的深度學(xué)習(xí)模型,采用集成學(xué)習(xí)法對(duì)文獻(xiàn)識(shí)別分類。在使用大規(guī)模已做好分類編目的文獻(xiàn)數(shù)據(jù)進(jìn)行模型訓(xùn)練時(shí),可通過(guò)分層抽樣的數(shù)據(jù)集劃分方法和早停法、學(xué)習(xí)率調(diào)度等訓(xùn)練策略進(jìn)行調(diào)整,避免過(guò)擬合和欠擬合。編目規(guī)則處理模塊是根據(jù)文獻(xiàn)分類結(jié)果和圖書(shū)館特定的編目規(guī)則生成索書(shū)號(hào)、館藏地等編目信息。在生成索書(shū)號(hào)時(shí),要考慮到圖書(shū)館內(nèi)部的書(shū)架布局、分類標(biāo)準(zhǔn)、館藏結(jié)構(gòu)和借閱頻率,使索書(shū)號(hào)具有擴(kuò)展性和邏輯性。館藏地分配要結(jié)合文獻(xiàn)流轉(zhuǎn)率、借閱頻率、館藏空間布局、文獻(xiàn)結(jié)構(gòu)、書(shū)目呈現(xiàn)方式及時(shí)調(diào)整,保障館藏圖書(shū)高效管理。
4.5用戶交互層
用戶交互層包括管理員界面和用戶檢索界面。管理員界面功能豐富,用于管理分類編目的全過(guò)程。該界面能查看文獻(xiàn)分類結(jié)果、手動(dòng)調(diào)整錯(cuò)誤分類、添加新的分類規(guī)則,并具備分類模型參數(shù)調(diào)整功能,還可以實(shí)時(shí)為管理員提供數(shù)據(jù)統(tǒng)計(jì)和分析服務(wù),呈現(xiàn)各類文獻(xiàn)分類占比、分類錯(cuò)誤率、文獻(xiàn)增長(zhǎng)趨勢(shì),為館藏結(jié)構(gòu)調(diào)整和管理決策提供支持。用戶檢索界面設(shè)計(jì)簡(jiǎn)潔、操作簡(jiǎn)單,為用戶提供書(shū)名、作者、關(guān)鍵詞、分類號(hào)等多種檢索方式。在檢索結(jié)果展示方面,既能夠展示文獻(xiàn)的基本編目信息和館藏資源狀態(tài),也能夠展示文獻(xiàn)的封面圖像、內(nèi)容簡(jiǎn)介、用戶評(píng)價(jià)分?jǐn)?shù)等,可以讓用戶便捷直觀地了解圖書(shū)文獻(xiàn)。界面還具備個(gè)性化推薦功能,根據(jù)用戶借閱歷史、檢索記錄為其推薦可能感興趣的圖書(shū),方便用戶選擇和閱讀。
5基于人工智能的圖書(shū)館自動(dòng)分類編目系統(tǒng)功能實(shí)現(xiàn)
5.1文獻(xiàn)信息采集功能實(shí)現(xiàn)
系統(tǒng)文獻(xiàn)信息采集功能的實(shí)現(xiàn)需要從實(shí)體文獻(xiàn)的視覺(jué)圖像信息精準(zhǔn)識(shí)別、圖書(shū)館管理系統(tǒng)電子圖書(shū)識(shí)別獲取兩方面著手。文獻(xiàn)信息采集模塊結(jié)構(gòu)如下(見(jiàn)圖2)。實(shí)體文獻(xiàn)視覺(jué)圖像信息識(shí)別可以采用搭配視覺(jué)圖像仿生芯片的3D掃描終端,這類終端搭載每秒超過(guò)30幀數(shù)據(jù)采集頻率的視覺(jué)采集器件,具有超過(guò)0.045毫米的掃描精度,基于標(biāo)志點(diǎn)的拼接定位具備超過(guò)0.3毫米的立體掃描精度,搭載的USB3.0數(shù)據(jù)接口能夠輸出可供直接3D打印的圖像數(shù)據(jù),可滿足大多數(shù)對(duì)實(shí)體文獻(xiàn)精準(zhǔn)識(shí)別的需求。
在數(shù)字文獻(xiàn)獲取方面,系統(tǒng)可選擇搭載IntelLoihi2仿生類腦芯片并支持HalaPoint系統(tǒng)運(yùn)行的服務(wù)終端,來(lái)運(yùn)行可編程和自適應(yīng)拓展的Python爬蟲(chóng)程序。將爬蟲(chóng)嵌入館藏?cái)?shù)據(jù)庫(kù)和文獻(xiàn)管理系統(tǒng),根據(jù)數(shù)字文獻(xiàn)的元數(shù)據(jù)和結(jié)構(gòu)特征識(shí)別獲取文獻(xiàn)資源。HalaPoint是英特爾推出的全球最大神經(jīng)擬態(tài)系統(tǒng),搭載1152個(gè)基于7納米制程的Loihi2處理器,支持11.5億個(gè)神經(jīng)元和1280億個(gè)突觸,具有運(yùn)行仿生脈沖神經(jīng)網(wǎng)絡(luò)的能力和超大規(guī)模數(shù)據(jù)集群運(yùn)算能力,支持多類型文獻(xiàn)數(shù)據(jù)的大規(guī)模并行運(yùn)算處理,可滿足圖書(shū)館EB級(jí)文獻(xiàn)圖像視覺(jué)信息和數(shù)字文獻(xiàn)數(shù)據(jù)并行處理存儲(chǔ)的需求。系統(tǒng)完成對(duì)以上數(shù)據(jù)信息的采集后,通過(guò)API接口共享到云服務(wù)器的SQL數(shù)據(jù)庫(kù),完成文獻(xiàn)分類編目的數(shù)據(jù)支持工作。
5.2文獻(xiàn)分類功能實(shí)現(xiàn)
自動(dòng)分類編目系統(tǒng)文獻(xiàn)分類功能可使用決策樹(shù)的深度學(xué)習(xí)分類模型實(shí)現(xiàn)文獻(xiàn)的精準(zhǔn)分類。例如,決策樹(shù)中的信息增益函數(shù)通過(guò)選擇文獻(xiàn)視覺(jué)圖像數(shù)據(jù)最佳屬性劃分?jǐn)?shù)據(jù)集,計(jì)算每個(gè)屬性帶來(lái)的信息增益實(shí)現(xiàn)分類。決策樹(shù)函數(shù)計(jì)算公式為:
其中 D 是文獻(xiàn)數(shù)據(jù)集(文獻(xiàn)視覺(jué)圖像數(shù)據(jù)集、數(shù)字文獻(xiàn)數(shù)據(jù)集), ∝ 是文獻(xiàn)數(shù)據(jù)集屬性,V是屬性α 的取值個(gè)數(shù), Dv 是屬性 α 取值為 ΔV 的樣本子集。通過(guò)不斷計(jì)算文獻(xiàn)信息增益建立決策樹(shù)節(jié)點(diǎn),實(shí)現(xiàn)對(duì)不同類型文獻(xiàn)的精準(zhǔn)識(shí)別和分類。
多層感知機(jī)(MLP)包含多類神經(jīng)元,常用
Sigmoid激活函數(shù)實(shí)現(xiàn)。Sigmoid激活函數(shù)公式:
該函數(shù)將數(shù)據(jù)輸入值映射在(0,1)區(qū)間,根據(jù)(2)獲得Sigmoid激活函數(shù)結(jié)果代人ReLU函數(shù):
f(x)=max(0,x)
計(jì)算輸入數(shù)據(jù)映射區(qū)間的最大值。通過(guò)(3)獲得的計(jì)算結(jié)果代人層層遞進(jìn)的神經(jīng)元網(wǎng)絡(luò),通過(guò)循環(huán)計(jì)算,確定映射數(shù)據(jù)最優(yōu)值,實(shí)現(xiàn)對(duì)文獻(xiàn)數(shù)據(jù)的精準(zhǔn)分類。
5.3文獻(xiàn)編目功能實(shí)現(xiàn)
系統(tǒng)文獻(xiàn)編自功能主要基于文獻(xiàn)分類結(jié)果將各類圖書(shū)文獻(xiàn)按照分類標(biāo)準(zhǔn)劃分為不同的館藏目錄。文獻(xiàn)編目流程如下(見(jiàn)圖3)。在編目過(guò)程中,系統(tǒng)會(huì)根據(jù)文獻(xiàn)分類結(jié)果形成文獻(xiàn)編目界面,編制文獻(xiàn)的分類目錄和分類號(hào),審查文獻(xiàn)信息內(nèi)容,判定是否重復(fù)。若在已編目錄中發(fā)現(xiàn)存在該文獻(xiàn),系統(tǒng)會(huì)根據(jù)分類結(jié)果在該文獻(xiàn)類別目錄中編制該文獻(xiàn)的單類目錄及自錄號(hào),生成該文獻(xiàn)新館藏信息后,更新數(shù)據(jù)庫(kù)中存儲(chǔ)該文獻(xiàn)的信息并用數(shù)字標(biāo)簽標(biāo)記,不斷重復(fù)上述過(guò)程,直到將所有文獻(xiàn)編目完成。
6系統(tǒng)性能測(cè)試與分析
為分析基于人工智能的圖書(shū)館自動(dòng)分類編目系統(tǒng)性能,以某??茖W(xué)院圖書(shū)館作為實(shí)驗(yàn)場(chǎng)所,將本文構(gòu)建的分類編目系統(tǒng)應(yīng)用到該圖書(shū)館的文獻(xiàn)分類編目工作中,以此來(lái)驗(yàn)證本系統(tǒng)的性能。
6.1系統(tǒng)性能分析
本文構(gòu)建的基于人工智能的圖書(shū)館自動(dòng)分類編自系統(tǒng)在文獻(xiàn)信息采集過(guò)程中對(duì)文獻(xiàn)位置識(shí)別的均方根誤差收斂情況如下(見(jiàn)圖4)。
基于人工智能技術(shù)識(shí)別文獻(xiàn)位置,在采集文獻(xiàn)數(shù)據(jù)過(guò)程中,經(jīng)過(guò)對(duì)系統(tǒng)的多次迭代測(cè)試后均方根誤差收斂到最小值,由此可以證明本文構(gòu)建的基于人工智能的自動(dòng)分類編目系統(tǒng)可以快速識(shí)別文獻(xiàn)位置,快速識(shí)別和采集文獻(xiàn)數(shù)據(jù),幫助圖書(shū)館提升文獻(xiàn)信息采集效率。
6.2系統(tǒng)應(yīng)用性分析
為了測(cè)試本文基于人工智能的圖書(shū)館自動(dòng)分類編目系統(tǒng)在實(shí)際應(yīng)用中的效果,將該專科學(xué)院圖書(shū)館2023年1月—4月和2024年1月—4月同周期相同種類圖書(shū)借閱量作為評(píng)價(jià)指標(biāo),對(duì)比采用本系統(tǒng)前后同期內(nèi)同種類文獻(xiàn)借閱量的變化趨勢(shì),結(jié)果
如下(見(jiàn)圖5)。
由圖5可知,該專科學(xué)院使用本系統(tǒng)后,在相同周期內(nèi)相同類型文獻(xiàn)的借閱量呈現(xiàn)顯著上升趨勢(shì),上升幅度較大。由此看來(lái),本文構(gòu)建的基于人工智能的自動(dòng)分類編目系統(tǒng)能幫助圖書(shū)館提升文獻(xiàn)借閱量,提高文獻(xiàn)資源利用率,促使用戶更高效精準(zhǔn)地查詢文獻(xiàn),更高效地學(xué)習(xí)知識(shí)。
7結(jié)語(yǔ)
本文設(shè)計(jì)的基于人工智能的圖書(shū)館自動(dòng)分類編目系統(tǒng),可利用人工智能技術(shù)采集文獻(xiàn)信息,依據(jù)文獻(xiàn)視覺(jué)圖像數(shù)據(jù)與數(shù)字文獻(xiàn)數(shù)據(jù)實(shí)現(xiàn)文獻(xiàn)自動(dòng)分類與編目。系統(tǒng)應(yīng)用性分析結(jié)果也能有效證明其應(yīng)用價(jià)值。該系統(tǒng)在圖書(shū)館中的應(yīng)用能較好地解決傳統(tǒng)分類編目方式存在的問(wèn)題,提高圖書(shū)館分類編目工作的質(zhì)量和效率。但是,在實(shí)際應(yīng)用過(guò)程中,需要根據(jù)圖書(shū)館業(yè)務(wù)發(fā)展和用戶反饋不斷優(yōu)化和升級(jí)迭代,使系統(tǒng)功能進(jìn)一步完善,形成智能化分類編目模式,減輕圖書(shū)館員的工作壓力。未來(lái),可以繼續(xù)探索將元宇宙、大數(shù)據(jù)算法、大語(yǔ)言模型融入圖書(shū)館文獻(xiàn)分類編目工作,幫助圖書(shū)館建立精準(zhǔn)高效的文獻(xiàn)資源建設(shè)體系,適應(yīng)快速變化的數(shù)智環(huán)境。
[參考文獻(xiàn)]
[1]李默,楊彬.從生成式人工智能到通用人工智能:賦能圖書(shū)館知識(shí)服務(wù)模式創(chuàng)新[J].農(nóng)業(yè)圖書(shū)情報(bào)學(xué)報(bào),2024,36(6) :50-61.
[2]孫昊琛.新一代人工智能技術(shù)支撐的智慧教室模型建構(gòu)研究[D].??冢汉D蠋煼洞髮W(xué),2022.
[3]熊易.人工智能機(jī)器人技術(shù)在圖書(shū)館的應(yīng)用研究[J].河南圖書(shū)館學(xué)刊,2022,42(4):68-69,72.
[4]孫德鵬.關(guān)于圖書(shū)采分編智能作業(yè)系統(tǒng)的若干思考:以廣東省立中山圖書(shū)館為例[J」.大學(xué)圖書(shū)情報(bào)學(xué)刊,2022,40(1):119-122,139.
[5]王維秋,劉春麗.人工智能環(huán)境下圖書(shū)館智能編目模式構(gòu)建研究[J].晉圖學(xué)刊,2021(3):10-18.
[6]王惠君,吳昊,潘詠怡,等.圖書(shū)采分編智能作業(yè)系統(tǒng)的研究與應(yīng)用[J].圖書(shū)館論壇,2021,41(1):58-63.
[7]郭利敏.基于卷積神經(jīng)網(wǎng)絡(luò)的文獻(xiàn)自動(dòng)分類研究[J].圖書(shū)與情報(bào),2017(6):96-103.
[8]韋莉軍.公共圖書(shū)館中文圖書(shū)分類標(biāo)引不一致問(wèn)題及解決對(duì)策[J].情報(bào)探索,2020(10):115-121.
[9]劉洋.圖書(shū)分類編目常見(jiàn)的問(wèn)題及處理[J].河南圖書(shū)館學(xué)刊,2019,39(12):115-116.
[收稿日期]2024-11-06
[作者簡(jiǎn)介]梅月(1989—),女,碩士,館員,揚(yáng)州市圖書(shū)館。