徐國蘭,朱和立,郭鳳嬌
(1.山東理工大學(xué)圖書館,山東 淄博 255000;2.齊魯師范學(xué)院圖書館,山東 濟(jì)南 250200;3.山東理工大學(xué)信息管理研究院,山東 淄博 255000)
在信息爆炸式增長時(shí)代,高校圖書館的傳統(tǒng)服務(wù)方式已經(jīng)無法滿足高校師生日益增長的信息需求。 近年來,基于人工智能的對話系統(tǒng)、智能推薦等技術(shù)在圖書館領(lǐng)域逐步落地,人工智能的發(fā)展促使人們對智慧圖書館服務(wù)寄予更高要求和期待。 2022 年11 月30 日,美國OpenAI 公司推出了一款基于人工智能的自然語言交互模型——ChatGPT,它能夠理解上下文語句含義、支持多種語言、提供個(gè)性化服務(wù),為用戶提供高質(zhì)量的信息檢索、智能問答、個(gè)性化推薦等服務(wù),可以廣泛地應(yīng)用于各行業(yè),提高用戶的生活、工作效率。 2023 年2 月7 日,微軟發(fā)布采用了ChatGPT 技術(shù)的新版Bing 搜索引擎。 此后,人工智能界以“天”為維度推出新技術(shù)、新產(chǎn)品。 3月14 日,OpenAI 推出GPT-4,成為目前最強(qiáng)的生成式AI 產(chǎn)品;3 月16 日,百度正式發(fā)布“文心一言”;4 月,阿里“通義千問”問世;5 月,谷歌發(fā)布其最新的大語言模型PaLM2,同時(shí)宣布接入Chrome 瀏覽器,等等。 各種大語言模型產(chǎn)品相繼推出,被應(yīng)用于各行各業(yè)。 以GPT-4 為代表的大語言模型技術(shù)創(chuàng)新為高校圖書館的信息服務(wù)帶來新的契機(jī)。 通過研究大語言模型技術(shù)在高校圖書館智慧服務(wù)中的應(yīng)用,可以挖掘這一技術(shù)在知識獲取、信息咨詢、個(gè)性化推薦等服務(wù)中的有效性和潛力,為高校圖書館實(shí)現(xiàn)個(gè)性化服務(wù)、提高工作效率、提升圖書館用戶滿意度提供實(shí)踐參考。 這也將有助于推動圖書館領(lǐng)域智慧服務(wù)的改革與創(chuàng)新,提升其在教育領(lǐng)域的現(xiàn)代化水平。
新一輪的人工智能革命已經(jīng)引起了圖書館界的密切關(guān)注,美國職業(yè)圖書館網(wǎng)站[1]、我國圖林網(wǎng)上社區(qū)圖人堂[2]就ChatGPT 對圖書館的影響開展了相關(guān)討論。 大語言模型技術(shù)對智慧圖書館影響的研究也陸續(xù)開展。 段薈等人通過訪談信息資源管理領(lǐng)域科研人員對ChatGPT 的態(tài)度與認(rèn)知,發(fā)現(xiàn)科研人員對ChatGPT 技術(shù)理念和價(jià)值有著積極的態(tài)度和較高的認(rèn)可度,并從數(shù)據(jù)管理、人工智能素養(yǎng)、信息資源管理學(xué)科體系等方面提出應(yīng)對策略,以消除ChatGPT 為代表的人工智能生成技術(shù)帶來的負(fù)面影響[3]。 張智雄等人通過對ChatGPT 核心技術(shù)創(chuàng)新態(tài)勢的分析,從圖書館管理、檢索、推薦、問答等方面探索智慧圖書館的應(yīng)用[4]。 張曉林提出應(yīng)利用Chat-GPT 技術(shù)重塑感知型知識服務(wù)能力,構(gòu)建決策性知識服務(wù)能力,以及以知識服務(wù)支持AI 賦能科學(xué)研究[5]。 郭亞軍等人從內(nèi)容生產(chǎn)方式角度分析了ChatGPT 在語言翻譯、場景轉(zhuǎn)移、信息傳播和任務(wù)處理四個(gè)方面的應(yīng)用,并構(gòu)建了圖書館服務(wù)應(yīng)用場景框架圖[6]。 宋小康等人則重點(diǎn)分析了AI 賦能的替代信息搜索的內(nèi)涵和特征,基于社會技術(shù)系統(tǒng)范式從技術(shù)、信息、用戶和社會文化四個(gè)層面探討構(gòu)建了AI 賦能的替代信息搜索理論框架[7]。 趙楊等人以武漢大學(xué)圖書館機(jī)器人智能問答服務(wù)為實(shí)證對象,應(yīng)用注意力機(jī)制和LSTM 算法構(gòu)建了多模態(tài)情感分析模型,用以揭示影響用戶情感體驗(yàn)的關(guān)鍵因素,為圖書館智能服務(wù)的情感化設(shè)計(jì)和優(yōu)化提供依據(jù)[8]。 潘家芳構(gòu)建了人機(jī)智能協(xié)同的圖書館精準(zhǔn)服務(wù)模型,通過機(jī)器與專家的協(xié)同決策形成問題確定、服務(wù)映射、服務(wù)實(shí)施、效果檢驗(yàn)閉環(huán)來實(shí)現(xiàn)圖書館精準(zhǔn)服務(wù)[9]。
當(dāng)前,圖書情報(bào)界關(guān)于大語言模型技術(shù)對智慧圖書館的影響和應(yīng)用研究還處于初步探索階段,且主要集中在以ChatGPT 為代表的相關(guān)技術(shù)給智慧圖書館帶來的挑戰(zhàn)與啟示的探討,尚缺乏對大語言模型技術(shù)在智慧圖書館的應(yīng)用場景的系統(tǒng)研究。 鑒于此,本文以GPT-4 為例,分析大語言模型技術(shù)的關(guān)鍵技術(shù),對大語言模型技術(shù)在知識庫構(gòu)建、信息檢索、個(gè)性化推薦、科研支持等服務(wù)方面的運(yùn)用進(jìn)行深入探討,以為我國高校圖書館發(fā)展智慧服務(wù)提供相關(guān)支持和借鑒。
GPT-4 是基于Transformer 結(jié)構(gòu)的強(qiáng)大的自然語言處理(NLP)模型,通過自回歸訓(xùn)練方法進(jìn)行預(yù)訓(xùn)練,是一種用于NLP 模型的預(yù)訓(xùn)練方法,能夠使模型在各種NLP 任務(wù)上都有出色的表現(xiàn)。 本文則以GPT-4(Generative Pre-trained Transformer 4)為例說明大語言模型所依賴的關(guān)鍵技術(shù)。
GPT-4 使用Transformer 架構(gòu)作為基礎(chǔ)模型[10]。 通過計(jì)算不同語義之間的關(guān)聯(lián)度來生成具有最高概率的語義反饋。 Transformer 采用多頭注意力進(jìn)行快速并行計(jì)算,其最大的優(yōu)勢是可以捕捉輸入序列中遠(yuǎn)距離依賴關(guān)系。 由于消除了循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)或長短時(shí)記憶網(wǎng)絡(luò)(LSTM)中的循環(huán)序列操作,使其并行性和訓(xùn)練速度有了大幅度提高。 多頭自注意力機(jī)制模塊是Transformer 的核心組件,多頭機(jī)制不是只計(jì)算一次注意力,而是并行運(yùn)行縮放點(diǎn)積注意力算法。 隨著Transformer 技術(shù)的不斷發(fā)展,Transformer 還被應(yīng)用在計(jì)算機(jī)視覺領(lǐng)域,形成了Vision Transformer(ViT)技術(shù)。
GPT-4 模型采用自回歸訓(xùn)練方法進(jìn)行預(yù)訓(xùn)練,通過捕捉和建模序列數(shù)據(jù)中的依賴關(guān)系來預(yù)測下一個(gè)詞。 與掩碼語言模型(MLM)略有不同,自回歸訓(xùn)練更關(guān)注文本中詞之間的順序依賴性。 自回歸訓(xùn)練方法在NLP 領(lǐng)域具有較廣泛應(yīng)用。 模型的基本假設(shè)是每個(gè)詞的出現(xiàn)都受到之前詞的影響。 因此,通過學(xué)習(xí)文本序列中的依賴關(guān)系,自回歸模型可以更好地捕捉句子中的連貫性、語法結(jié)構(gòu)以及語義信息。 GPT-4 采用自回歸訓(xùn)練方法進(jìn)行預(yù)訓(xùn)練,使其在各種NLP 任務(wù)上具有很高的泛化能力。
以GPT 系列為例,每一代模型在網(wǎng)絡(luò)規(guī)模、計(jì)算能力、Transformer 層數(shù)和參數(shù)數(shù)量上都有所提高,使得能夠處理更為復(fù)雜的文本序列,提升性能和泛化能力。 為提高計(jì)算效率,GPT-4 以并行方式處理大規(guī)模數(shù)據(jù)集,并且對硬件資源(如GPU、TPU 等)進(jìn)行優(yōu)化。 這使得模型能夠在處理海量文本數(shù)據(jù)和復(fù)雜任務(wù)時(shí)保持高速性能。
傳統(tǒng)圖書館服務(wù)在提供的服務(wù)內(nèi)容和服務(wù)方式上較為有限,并且在服務(wù)手段上主要依賴人工服務(wù)和一些輔助性的自動化設(shè)備。 人工智能和大語言模型技術(shù)的發(fā)展應(yīng)用對高校圖書館服務(wù)內(nèi)容和方式都產(chǎn)生了很大影響。 大語言模型技術(shù)是自然語言處理領(lǐng)域的一種新技術(shù),使用大規(guī)模語料庫進(jìn)行訓(xùn)練,能夠幫助圖書館實(shí)現(xiàn)智慧化服務(wù),使圖書館服務(wù)從信息到知識、從被動到互動、從單一到多元逐漸推進(jìn)。 圖書館服務(wù)變得更加便捷高效、個(gè)性化和多樣化,從而實(shí)現(xiàn)高校圖書館服務(wù)的轉(zhuǎn)型和創(chuàng)新。
圖書館服務(wù)的技術(shù)從Web1.0 到Web2.0,逐步向Web3.0 發(fā)展,目前處在Web2.0 和Web3.0之間的發(fā)展?fàn)顟B(tài)。 圖書館服務(wù)從單向傳播式到雙向交互式,逐漸向用戶參與式擴(kuò)展的趨勢發(fā)展,推動圖書館發(fā)展為用戶互動、分享并參與建設(shè)的智慧圖書館。 在圖書館服務(wù)技術(shù)的發(fā)展過程中,圖書館資源也從由專業(yè)從業(yè)人員創(chuàng)作、編輯、發(fā)行的紙質(zhì)文獻(xiàn)、音頻、視頻等內(nèi)容,發(fā)展到由網(wǎng)絡(luò)資源創(chuàng)作與組織方式產(chǎn)生的數(shù)字資源。目前正逐步發(fā)展到由人工智能生成的多樣化資源,這時(shí)候圖書館資源不僅有數(shù)字資源,還包括數(shù)字藏品、3D 立體模型等[11]。 GPT-4 人機(jī)交互的出現(xiàn)加速了這一演化進(jìn)程。 GPT-4 類大語言模型具有顛覆性的多源多模態(tài)信息聚合和生成能力,能夠覆蓋海量知識資源和具備全域數(shù)據(jù)融合和推理能力的信息源,推動了信息資源建設(shè)。此外,ChatGPT 類大模型還提供了強(qiáng)大的數(shù)據(jù)關(guān)聯(lián)、任務(wù)解決和內(nèi)容生成能力,推動了人類生成內(nèi)容和AI 生成內(nèi)容共生的新型信息環(huán)境的形成[12]。
技術(shù)的變革使得圖書館的服務(wù)方式也在不斷改變,從傳統(tǒng)圖書館以“資源”為中心,進(jìn)化為依托Web2.0 技術(shù)的“用戶”服務(wù),在Web3.0 時(shí)代,圖書館的服務(wù)模式是以用戶、資源、空間三元融合交互的智慧化服務(wù)。 大語言模型技術(shù)有助于圖書館服務(wù)方式的集成化。 傳統(tǒng)圖書館的借閱模式是讀者需要來到圖書館內(nèi),才能借閱到需要的書籍或資料。 而大語言模型技術(shù)的出現(xiàn),無須實(shí)體館藏,讀者只需要在網(wǎng)上輸入需要查詢的內(nèi)容,大語言模型就可以通過自然語言理解、知識圖譜等多種技術(shù),為讀者提供需要的答案或相關(guān)資料。 傳統(tǒng)圖書館通過圖書分類、目錄等方式為讀者提供信息服務(wù),而大語言模型技術(shù)的應(yīng)用,使得圖書館的信息更加直觀,易于理解。GPT-4 技術(shù)還可以通過對讀者的行為、興趣等方面的分析,提供個(gè)性化的信息服務(wù)。 例如通過分析讀者的借閱歷史,大語言模型可以向讀者推薦他們可能感興趣的書籍或資料。 而傳統(tǒng)圖書館則難以實(shí)現(xiàn)這種個(gè)性化推薦,因?yàn)樗鼈儫o法跟蹤讀者的閱讀習(xí)慣和興趣。 另外,傳統(tǒng)圖書館只提供圖書借閱及查閱服務(wù),難以引導(dǎo)讀者進(jìn)入到一個(gè)開放式的學(xué)習(xí)環(huán)境,而大語言模型技術(shù)通過提供互動式、智能化的學(xué)習(xí)環(huán)境,可以促進(jìn)讀者之間的交流、共享,提高學(xué)習(xí)效率。
以GPT-4 為代表的大語言模型技術(shù)的出現(xiàn)為傳統(tǒng)圖書館工作提供了新思路和方法,可以更加全面、高效地為讀者提供信息服務(wù),同時(shí)也能促進(jìn)圖書館及相關(guān)服務(wù)的數(shù)字化轉(zhuǎn)型。
《國際圖聯(lián)趨勢報(bào)告2021 新進(jìn)展》提出,年輕一代圖書館用戶希望得到最新技術(shù)和服務(wù),如果圖書館無法滿足他們的期望,那他們很有可能會棄之而去其他類型的資源[13]。 因此,提高圖書館服務(wù)的智慧化程度是留住圖書館用戶的必要選擇。 大語言模型技術(shù)與高校圖書館的智慧服務(wù)具有很高的契合度,我們可以利用大語言模型技術(shù)構(gòu)建高校圖書館智慧服務(wù)系統(tǒng),促進(jìn)圖書館的服務(wù)轉(zhuǎn)型,運(yùn)用自然語言處理和深度學(xué)習(xí)算法,為用戶提供高效、準(zhǔn)確的智慧化服務(wù)。 我們構(gòu)建的高校圖書館智慧服務(wù)系統(tǒng)框架如圖1所示。
圖1 基于大語言模型技術(shù)的高校圖書館智慧服務(wù)系統(tǒng)
圖書館資源是圖書館提供服務(wù)的物質(zhì)基礎(chǔ),知識庫是智慧圖書館的重要組成部分。 基于大語言模型技術(shù)構(gòu)建出實(shí)時(shí)更新的知識庫可以對資源內(nèi)容進(jìn)行有效組織和管理,形成完善的知識結(jié)構(gòu),實(shí)現(xiàn)智慧化、個(gè)性化的用戶檢索需求。
1.知識庫構(gòu)建
知識庫的構(gòu)建需要通過數(shù)據(jù)采集、整合、元數(shù)據(jù)標(biāo)注和構(gòu)建知識圖譜等流程來完成。 圖書、期刊、論文、報(bào)告、會議記錄、多媒體等信息資源是構(gòu)建知識庫的基礎(chǔ)。 這些資源既可以從圖書館自身館藏獲取,也可以通過與其他圖書館、數(shù)據(jù)庫、出版商合作采集。 將采集到的信息資源進(jìn)行整合,消除重復(fù)內(nèi)容,形成完整的知識體系。還可以引入外部引用和鏈接,實(shí)現(xiàn)信息資源之間的關(guān)聯(lián)。 根據(jù)行業(yè)數(shù)據(jù)標(biāo)準(zhǔn)和分類體系(如MARC、Dublin Core、SKOS 等)對信息資源進(jìn)行詳細(xì)描述、分類和標(biāo)注。 為每個(gè)資源分配唯一的標(biāo)識符,記錄資源的作者、出版時(shí)間、主題等元數(shù)據(jù)信息。 通過機(jī)器學(xué)習(xí)和自然語言處理技術(shù)構(gòu)建知識圖譜,實(shí)現(xiàn)概念、事實(shí)、實(shí)體之間的關(guān)系挖掘和表達(dá),幫助用戶快速了解某一主題的基本知識結(jié)構(gòu),提高檢索效率;同時(shí),知識庫需具備社交互動功能,通過為用戶提供在線討論、評論、問答等社交互動功能,促進(jìn)知識庫內(nèi)容的傳播和分享,使知識庫不斷豐富和完善。
2.知識庫實(shí)時(shí)更新
大語言模型技術(shù)可以實(shí)現(xiàn)知識庫的實(shí)時(shí)更新與擴(kuò)展,確保用戶能夠查詢到最新資源,及時(shí)滿足讀者不斷變化的知識需求。 系統(tǒng)實(shí)時(shí)準(zhǔn)確挖掘與高校圖書館相關(guān)的各類數(shù)據(jù)源,包括圖書、期刊、論文、行業(yè)動態(tài)、網(wǎng)絡(luò)資源等,這些數(shù)據(jù)源是知識更新和擴(kuò)展的基礎(chǔ)。 從各類數(shù)據(jù)源中提取的資料需要經(jīng)過清洗、去重、分詞等預(yù)處理,再通過自然語言處理技術(shù)提取關(guān)鍵詞、主題、分類等信息,便于后續(xù)的分析和知識融合。 完成對新收集數(shù)據(jù)的處理和分析后,將其與原有的圖書館知識庫進(jìn)行融合。 系統(tǒng)需要找出新舊知識之間的聯(lián)系,避免冗余,并及時(shí)更新原有知識庫。大語言模型需要通過持續(xù)學(xué)習(xí)的方式,自動獲取和駕馭新知識,包括對新數(shù)據(jù)進(jìn)行訓(xùn)練,不斷調(diào)整和優(yōu)化模型,以便更好地理解新知識和處理用戶請求,同時(shí)還要收集用戶反饋,幫助優(yōu)化模型效果。
信息檢索是圖書館的關(guān)鍵服務(wù)之一。 傳統(tǒng)的關(guān)鍵詞搜索對于某些用戶可能太過復(fù)雜或不直觀,而且篩選分析海量的檢索結(jié)果對于用戶來說也是一件費(fèi)時(shí)費(fèi)力的事情。 大語言模型本身是一個(gè)知識庫和搜索引擎的結(jié)合體,將GPT-4技術(shù)融合進(jìn)圖書館檢索系統(tǒng),通過對圖書館知識庫系統(tǒng)的資源進(jìn)行檢索,自動生成檢索結(jié)果。 檢索系統(tǒng)支持用戶自然語言檢索、多模態(tài)檢索,以對話聊天框形式呈現(xiàn)。 檢索系統(tǒng)以上文圖1 所構(gòu)建的實(shí)時(shí)更新知識庫為基礎(chǔ),為大語言模型預(yù)訓(xùn)練提供所需要語料集,保證圖書館檢索系統(tǒng)提供檢索服務(wù)的專業(yè)性、真實(shí)性和時(shí)效性。
相較于傳統(tǒng)檢索系統(tǒng),聊天式檢索系統(tǒng)能理解自然語言輸入。 當(dāng)用戶以自然語言進(jìn)行查詢時(shí),大語言模型使用NLP 技術(shù)對輸入內(nèi)容進(jìn)行分析,捕捉關(guān)鍵詞、實(shí)體、概念和關(guān)系,然后將識別到的關(guān)鍵信息與知識庫進(jìn)行匹配,檢索出與之相關(guān)的資源,進(jìn)而根據(jù)一定的標(biāo)準(zhǔn)(如資源的相關(guān)度、熱門程度、引用次數(shù)等)對搜索結(jié)果進(jìn)行排序。 最終,大語言模型將從檢索結(jié)果中提取關(guān)鍵數(shù)據(jù),以自然語言生成(NLG)技術(shù)向用戶呈現(xiàn)一段友好的回復(fù)。 在聊天式檢索方式下,用戶無須具備專業(yè)背景知識,只需用自然語言描述需求,便可快速、準(zhǔn)確地獲得所需信息。 這不僅提高了檢索效率和準(zhǔn)確率,也極大改善了用戶的檢索體驗(yàn)。
以用戶為中心提供精準(zhǔn)個(gè)性化服務(wù)內(nèi)容,將是圖書館強(qiáng)化知識服務(wù)主體地位的有效途徑,以用戶為中心也是智慧圖書館的發(fā)展理念[11]。 基于對用戶的歷史借閱記錄、研究領(lǐng)域和興趣愛好,大語言模型可以幫助提供個(gè)性化的資源推薦,確保用戶能獲取最相關(guān)的圖書、期刊、論文等相關(guān)信息。
大語言模型通過用戶畫像構(gòu)建、資源元數(shù)據(jù)分析、推薦算法、生成推薦列表、展示推薦結(jié)果及評估反饋等流程實(shí)現(xiàn)高校圖書館智慧服務(wù)的個(gè)性化推薦功能。 首先,大語言模型通過分析用戶的借閱歷史、搜索記錄、在線行為等數(shù)據(jù),為每個(gè)用戶創(chuàng)建一個(gè)詳細(xì)的畫像,包括興趣愛好、專業(yè)領(lǐng)域、閱讀習(xí)慣等信息。 其次,大語言模型對圖書館資源進(jìn)行元數(shù)據(jù)分析,為每個(gè)資源分配相應(yīng)的標(biāo)簽、分類和關(guān)鍵詞,以此幫助系統(tǒng)更準(zhǔn)確地找到與用戶畫像匹配的資源內(nèi)容。 最后,大語言模型根據(jù)用戶畫像和資源元數(shù)據(jù)分析的結(jié)果,利用推薦算法匹配用戶興趣點(diǎn)和相關(guān)資源。 推薦算法可以采用協(xié)同過濾、矩陣分解等算法,或綜合多種算法形成混合推薦。 根據(jù)推薦算法的結(jié)果,生成個(gè)性化的推薦資源清單,并將推薦資源以清單或摘要的形式展示給用戶;同時(shí),收集用戶對推薦結(jié)果的反饋(如點(diǎn)擊、收藏、評分等),用以不斷優(yōu)化算法和提高推薦精度。
個(gè)性化推薦有助于引導(dǎo)用戶發(fā)現(xiàn)與其需求、興趣相符的資源,提高閱讀和學(xué)習(xí)效率;同時(shí),這種推薦方式還能增加圖書館資源的使用率,讓更多優(yōu)質(zhì)資源得到充分利用。
圖書館的“智慧”不能僅局限于技術(shù)的智慧,而應(yīng)將重心放在提供智慧化的“知識服務(wù)”[14]。 大語言模型基于Transformer,通過生成式預(yù)訓(xùn)練,具有語言生成能力,能夠遵循提示詞生成補(bǔ)全提示詞的句子;上下文學(xué)習(xí)能力,能夠遵循給定任務(wù)的示例,為新的測試用例生成解決方案;世界知識獲取能力[15]。 利用這些能力,GPT-4 技術(shù)能在學(xué)術(shù)研究過程中,尤其是在文獻(xiàn)整理與篩選、跨學(xué)科資源整合、研究趨勢分析與預(yù)測、編寫輔助等文獻(xiàn)處理方面,發(fā)揮重要的科研輔助作用,可以將科研人員從海量文獻(xiàn)中解放出來,提高研究者的工作效率和研究能力,促進(jìn)研究領(lǐng)域不斷發(fā)展與創(chuàng)新。
1.文獻(xiàn)檢索與篩選。 大語言模型可以根據(jù)研究人員的關(guān)鍵詞、主題或問題,從圖書館知識庫中檢索出相關(guān)文獻(xiàn),包括圖書、期刊論文、會議論文等。 還能根據(jù)摘要或全文內(nèi)容對文獻(xiàn)進(jìn)行評估,篩選出最相關(guān)的資源,包含最新研究論文、頂級會議收錄論文等并提交給研究人員。
2.跨學(xué)科資源整合。 GPT-4 可以實(shí)現(xiàn)跨學(xué)科資源的整合,幫助研究者發(fā)掘不同學(xué)科之間的潛在聯(lián)系,激發(fā)創(chuàng)新思路。 例如研究人員想通過計(jì)算機(jī)模擬技術(shù)預(yù)測蛋白質(zhì)結(jié)構(gòu),大語言模型可以從計(jì)算機(jī)科學(xué)、生物學(xué)等多個(gè)領(lǐng)域推薦合適的資源,輔助研究者整合不同學(xué)科的信息。
3.研究趨勢分析與預(yù)測。 大語言模型可以從大量文獻(xiàn)資料中分析某一領(lǐng)域的研究現(xiàn)狀、趨勢以及未來發(fā)展方向,以幫助研究者了解研究熱點(diǎn)并作出有針對性的研究計(jì)劃。
4.編寫輔助。 大語言模型可以通過語言生成能力為研究者在論文寫作階段提供支持,比如生成摘要、參考文獻(xiàn)格式化、論文潤色等,提高研究者的工作效率。
GPT-4 類大語言模型技術(shù)可以應(yīng)用在智能化的閱讀輔助上,它可以自動將文獻(xiàn)內(nèi)容進(jìn)行提煉和總結(jié),生成摘要或者關(guān)鍵詞標(biāo)簽,幫助用戶更快地理解文獻(xiàn)內(nèi)容;同時(shí),大語言模型技術(shù)可以利用自然語言生成技術(shù),將摘要內(nèi)容進(jìn)行自然語言轉(zhuǎn)換,讓讀者有一種面對書本的暢快感,縮短閱讀時(shí)間,同時(shí)提高理解程度。
大語言模型可用于創(chuàng)建智能問答系統(tǒng),教師、學(xué)生和其他用戶通過問答系統(tǒng)能夠快速獲取關(guān)于圖書館資源、服務(wù)、設(shè)施或規(guī)章制度的信息。大語言模型利用自然語言處理來理解問題,并與內(nèi)部知識庫或數(shù)據(jù)庫進(jìn)行匹配,以實(shí)現(xiàn)智能問答服務(wù)。 這種服務(wù)能夠有效地解決高校圖書館中常見的問題,包括但不限于圖書館設(shè)施、借閱規(guī)定、活動安排等各種信息。 通過智能問答系統(tǒng),用戶可以即時(shí)獲取所需信息,大大提高咨詢效率;同時(shí),這也降低了圖書館工作人員的負(fù)擔(dān),讓他們能夠更好地專注于其他需要專業(yè)處理的任務(wù)。
目前國內(nèi)已有圖書館把大語言模型應(yīng)用于智慧問答。 2023 年5 月28 日,廣州越秀圖書館AI 機(jī)器人亮相,這是全國首款基于大語言模型的圖書館AI 機(jī)器人,該機(jī)器人可為讀者提供AI寫詩、詩詞問題解答等服務(wù)[16]。
以GPT-4 為代表的大語言模型技術(shù)通過自然語言理解和生成,為高校圖書館智慧服務(wù)提供技術(shù)支持,將大語言模型技術(shù)應(yīng)用在圖書館的各個(gè)環(huán)節(jié),可以讓用戶獲得更加智能化、個(gè)性化的服務(wù),提升用戶和圖書館交流互動的體驗(yàn),提高圖書館服務(wù)質(zhì)量和服務(wù)效率。
今后我們會繼續(xù)探索基于GPT-4 類大語言模型的尋求問答機(jī)制,將大語言模型技術(shù)與創(chuàng)新的硬件設(shè)備相結(jié)合,進(jìn)一步提升高校圖書館智慧服務(wù)水平;同時(shí)圖書館應(yīng)在大語言模型技術(shù)的推廣和應(yīng)用中加強(qiáng)對人機(jī)交互、隱私保護(hù)、數(shù)據(jù)安全等方面的關(guān)注和探索。 在未來,隨著大語言模型技術(shù)的不斷發(fā)展和拓展,大語言模型的對話交互能力,自動問答機(jī)器人的智能化程度將會不斷提高,其在高校圖書館智慧服務(wù)中的應(yīng)用也將不斷創(chuàng)新和完善。