大數據與人工智能技術的迅速發(fā)展,為圖書情報學的理論與實踐創(chuàng)新注人了強勁動力,推動醫(yī)學圖書館從傳統(tǒng)文獻管理向智能化、數據驅動的知識服務轉型。不僅有助于提升醫(yī)學科研和臨床決策的效率,還能有效促進多學科交叉融合,為健康信息服務模式創(chuàng)新提供了新的機遇。當前,國內外在醫(yī)學信息學、健康信息學以及圖書情報學的交叉領域展開了大量探索1。國外學者主要關注健康數據挖掘、弱勢群體健康信息服務等主題,而國內研究則聚焦在醫(yī)院圖書館的角色優(yōu)化、碎片化閱讀行為分析以及跨學科資源整合等方向。對此,有必要進一步梳理大數據與AI在醫(yī)學圖書情報領域的應用現狀與趨勢,為推動我國醫(yī)學圖書情報服務的智能化升級和高質量發(fā)展提供參考。
1大數據與AI在醫(yī)學圖書情報服務中的主要應用
1.1知識圖譜驅動的醫(yī)學圖書情報智能檢索
在醫(yī)學圖書情報領域,知識圖譜廣泛應用于醫(yī)學文獻的智能檢索、科研數據分析和臨床決策支持等方面,能夠極大地提升信息的檢索效率和服務質量。通過將醫(yī)學術語、疾病、藥物、治療方法等醫(yī)學實體之間的關系進行系統(tǒng)化整合,知識圖譜不僅有助于解決傳統(tǒng)檢索方式中信息碎片化的問題,還能通過語義分析深化醫(yī)學信息檢索的深度。大數據與人工智能技術的結合,尤其是深度學習和自然語言處理的應用,進一步增強了知識圖譜在醫(yī)學圖書情報服務中的作用。大數據提供了龐大的醫(yī)學數據支持,知識圖譜則通過對這些數據進行結構化和語義化處理,幫助用戶精準定位信息2。AI技術,尤其是機器學習與深度學習,能夠從海量數據中識別出潛在的關系和模式,并實時更新圖譜中的信息,從而提高檢索和推薦的精準度和智能化水平。PubMed通過構建醫(yī)學主題詞(MeSH)知識圖譜,結合大數據分析和AI技術,能夠根據疾病、治療方法等醫(yī)學實體之間的復雜關系,自動化地推薦相關文獻,提高檢索效率。同樣,國內如知網等平臺也采用知識圖譜技術,通過整合醫(yī)學資源并利用大數據挖掘,提升了學術資源的關聯性和檢索效率,從而為科研人員和臨床醫(yī)生提供更加高效和精準的情報服務[3]。
1.2健康數據挖掘助力醫(yī)學圖書情報個性化服務
近年來,國家陸續(xù)出臺《關于促進和規(guī)范健康醫(yī)療大數據應用發(fā)展的指導意見》《國家健康醫(yī)療大數據標準、安全和服務管理辦法(試行)》等一系列政策法規(guī),從頂層設計到具體實施進行了全面布局、規(guī)范與引導,推動健康醫(yī)療大數據技術向好發(fā)展,同時為健康醫(yī)療大數據的應用營造了良好的政策環(huán)境,健康數據挖掘在醫(yī)學圖書情報服務中的應用日益廣泛,特別是在實現個性化服務方面展現了巨大潛力。通過對用戶行為、健康數據及科研需求的深度分析,數據挖掘技術為醫(yī)學圖書情報服務提供了精準的量身定制方案。能夠根據用戶的需求和偏好,智能化地推送相關文獻、健康信息及科研資源,從而大幅提升用戶體驗和服務效率4。例如,華中科技大學同濟醫(yī)學院附屬同濟醫(yī)院圖書館借助大數據技術,通過用戶需求調查和用戶空間行為分析確定醫(yī)院圖書館空間再造重點并篩選核心用戶,并通過小組訪談的文本分析,實現用戶參與空間再造過程。而在2024年3月,北京國際大數據交易所正式發(fā)布了首批100個人工智能大模型高質量訓練數據集,其中涉及醫(yī)療健康、醫(yī)藥研發(fā)場景的約20個數據集,也充分展示了大數據和AI技術在醫(yī)學圖書情報領域的發(fā)展?jié)摿Α?/p>
1.3數據分析賦能醫(yī)學科研與圖書情報決策支持
隨著數據分析技術的不斷進步,醫(yī)學科研與圖書情報決策支持的智能化水平得到了顯著提高。通過大數據和人工智能(AI)的深度應用,醫(yī)學圖書情報服務不僅能夠為科研人員提供精準的文獻資源,還能夠為臨床決策提供數據支持,助力醫(yī)學領域的創(chuàng)新與發(fā)展。以中山醫(yī)院聯合復旦大學類腦研究團隊等自主研發(fā)的人工智能醫(yī)生為例,該系統(tǒng)能夠通過自動化獲取患者行走時的步態(tài)特征、面部表情、語音和言語復述情況,分析患者的腦功能狀況。通過數據分析與深度學習算法,該系統(tǒng)可以判斷是否存在腦功能障礙,并對影像學結果進行智能化判讀,診斷的特異性已達到 95% 。不僅提升了醫(yī)學診斷的效率與精準度,還為醫(yī)學圖書情報服務提供了新的數據支持模式,幫助醫(yī)生快速獲取相關病例資料和研究成果,進一步促進精準醫(yī)療的發(fā)展。在國外,英國國家衛(wèi)生服務系統(tǒng)(NHS)、美國“健康信息交換(HIE)”系統(tǒng)和澳大利亞電子的健康記錄(eHealth)系統(tǒng)都分別管理著大量的病歷檔案。上述系統(tǒng)廣泛應用大數據與人工智能(AI)技術,通過對患者數據的深度分析與共享,顯著提高了臨床決策支持的質量與效率。
2醫(yī)學圖書情報服務的現實困境
2.1醫(yī)學圖書情報數據管理有待優(yōu)化
醫(yī)學圖書情報服務的數據管理能力尚未與日益增長的數據量相匹配,成為制約其智能化發(fā)展的主要瓶頸。目前,盡管國內醫(yī)學圖書館在數字化轉型中已逐步整合文本數據、文獻資源以及一些開放數據庫,但對于科研活動中產生的大量實驗數據、統(tǒng)計數據以及科研人員的研究數據,仍未建立系統(tǒng)的管理機制。相比國外,許多數字圖書館已經建立了完善的科研數據管理體系,涵蓋了從實驗數據到學術成果的全生命周期管理。在國內,醫(yī)學圖書情報服務平臺仍然缺乏有效的科研數據集的建設,導致科研數據無法被充分利用。雖然數字圖書館平臺積累了大量的用戶行為數據,包含了豐富的用戶偏好和需求信息。但由于數據挖掘技術的滯后,寶貴的過程性數據并未被充分分析與利用,未能用于構建精準服務或個性化推薦體系。大量未被利用的用戶日志數據沉淀在平臺,錯失了通過智能推薦優(yōu)化服務、提升用戶體驗的機會,導致平臺在數據的增值和轉化方面未能實現應有的“數據紅利”。
2.2醫(yī)學圖書情報資源可視化程度較低
當前,醫(yī)學圖書情報服務的可視化技術仍處于初級階段,遠未滿足現代科研的需求。盡管現有的數字圖書館擁有基本的主題分析、趨勢統(tǒng)計和作者/機構聚類等可視化功能,但在處理復雜的數據關系時還缺乏足夠的深度和交互性。知識圖譜的呈現通常是靜態(tài)的,且數據分類模糊,缺乏足夠的層次感和細節(jié),用戶在學術分析時無法充分挖掘數據的潛在價值。尤其是在醫(yī)學圖書情報領域,數據不僅包含文字、圖像,還包括臨床記錄和醫(yī)學圖像等多維度信息,如何將這些復雜的高維數據有效呈現,并幫助用戶從中提取有價值的結論,成為目前技術的瓶頸。隨著大數據時代的到來,數據呈現出高維、多源、動態(tài)演化的特點。如何將這些高維數據有效地降維并呈現出清晰、精確的可視化結果,依然是一個亟待解決的問題。
2.3醫(yī)學圖書情報服務智能化水平不高
盡管大數據和人工智能技術在醫(yī)學圖書情報服務中具有巨大的應用潛力,但其智能化水平仍處于初步階段,尚未實現真正的智能決策和語義推理。目前,許多數字圖書館的知識發(fā)現服務仍以基礎文獻檢索為主,缺乏智能推理、個性化推薦等高階功能。例如,當前的檢索系統(tǒng)無法對復雜的查詢請求進行語義理解和推理處理,尤其是在面對多義詞、模糊表達時,系統(tǒng)的準確度和相關性大大下降。雖然部分平臺引入自然語言處理技術,但在理解用戶意圖和提供精準檢索結果方面仍存在較大差距,未能真正實現智能化服務,導致智能化服務的發(fā)展面臨訓練數據集匱乏的瓶頸。醫(yī)學圖書情報服務所需的高質量、標注精確的語料庫尚不完善,尤其是醫(yī)學領域的專業(yè)數據和案例數據較為稀缺,導致人工智能模型在處理醫(yī)學信息時效果不佳。
3大數據與人工智能賦能醫(yī)學圖書情報服務的創(chuàng)新路徑
3.1進一步優(yōu)化和完善醫(yī)學圖書情報數據
3.1.1開發(fā)智能化數據處理和挖掘技術。醫(yī)學圖書情報平臺應重視智能化數據的開發(fā)與處理,尤其是在數據類型的多樣化背景下,通過大數據技術對不同類型的醫(yī)學數據進行高效整合。在操作層面,需要建立一個統(tǒng)一的數據標準和格式,將醫(yī)學文獻、病例、影像、聲音等多種數據類型進行統(tǒng)一描述與索引,為深層次的語義檢索提供支撐。為了提高數據的智能化,平臺可以采用先進的預處理方法,如時間切片、數據簡化、模糊匹配、碎片化處理等技術,通過數據清洗、去重和去噪來獲取高質量的智能數據。通過數據挖掘和分析,平臺能夠發(fā)現數據間的潛在關聯,從而為用戶提供更加精準和個性化的服務。
3.1.2加強數據融合與多維度分析。除了整合傳統(tǒng)的醫(yī)學文獻資源外,數字圖書館平臺還應積極推動不同數據源的融合,包括用戶行為數據、專家數據以及外部科研資源的整合。通過構建全面的用戶數據畫像,平臺能夠實時捕捉用戶的行為特征與科研需求,并通過機器學習技術對用戶偏好進行智能化預測。以用戶行為數據為基礎,平臺能夠提供個性化的文獻推薦和研究資源推送,增強內容的相關性和推薦的精準性。此外,平臺還應強化外部數據的采集與整合,構建多維度的數據集,形成科研人員和臨床醫(yī)生所需的全面信息支持,優(yōu)化館藏資源配置,提高館藏資源的利用率,減少不必要的重復投人。
3.1.3促進數據云平臺的構建與合作。隨著數據量的不斷增長,傳統(tǒng)的本地計算和存儲方式已難以滿足大規(guī)模數據處理的需求。因此,醫(yī)學圖書情報服務平臺應積極推動數據云平臺的構建,借助云計算技術,突破本地存儲的瓶頸,實現大規(guī)模數據集的存儲與分析。平臺可以通過與云服務提供商合作,利用高性能計算資源實現對大數據的實時處理與深度分析,進一步提升數據處理速度和效率。同時,平臺還應與科研機構和數據提供方進行合作,整合科學數據資源,推動數據共享和協同創(chuàng)新,為醫(yī)學圖書情報服務的精準化和智能化提供強有力的數據支持。
3.2加強醫(yī)學圖書情報可視化設計
3.2.1自適應數據降維優(yōu)化。由于醫(yī)學圖書情報數據往往呈現出高維、非線性和多源異構的特點,傳統(tǒng)的可視化方式難以有效呈現這些復雜數據。因此,應采用自適應數據降維技術來優(yōu)化可視化效果。首先,針對數據維度較高的情形,應采用線性降維方法(如主成分分析),有效地將多維數據簡化為低維數據,便于用戶理解與分析。對于復雜的非線性數據,尤其是屬性間高度相關的數據,則應使用非線性降維方法,通過數據間的語義關系篩選,進行更加精確的降維處理。
3.2.2動態(tài)實時渲染與交互優(yōu)化。大數據環(huán)境下,用戶對于可視化分析的需求不再局限于靜態(tài)展示,而是期望通過動態(tài)實時渲染和交互式可視化獲取更多的信息。為此,應引人三維實時渲染技術,以支持多維數據的即時動態(tài)展示。通過圖形元素、顏色、紋理和符號的結合,將海量醫(yī)學數據轉化為易于理解的圖形表示。用戶可以通過交互式操作,如動態(tài)查詢、縮放、旋轉等,實時調整視圖,觀察不同數據維度間的關聯性。此外,平臺應根據用戶需求,提供多種視角的動態(tài)投影和實時更新功能,使用戶能夠從不同的角度深入分析數據,挖掘潛在的信息價值。
3.3提高醫(yī)學圖書情報智能化水平
依據醫(yī)學領域的需求,構建基于本體技術的語義化知識庫,整合醫(yī)學文獻、臨床數據、實驗結果等多種信息資源,如基于領域本體的蒙醫(yī)藥學知識庫等。通過智能檢索與語義推理,實現更精準的知識推薦和信息檢索,從而促進醫(yī)學科研和臨床決策的智能化。
3.3.1構建智能化系統(tǒng)自主控制模型。為了提升智能化系統(tǒng)的運行效率,需要建立完整的智能化控制模型,涵蓋數據采集、分析、反饋等環(huán)節(jié)。平臺應借鑒工業(yè)自動化控制系統(tǒng)的設計思路,構建全流程的數據反饋機制,實現智能化系統(tǒng)的自主運行。通過系統(tǒng)學習與自我調整,平臺能夠根據用戶需求和反饋不斷優(yōu)化服務,提高系統(tǒng)的智能化水平。
3.3.2拓展智能化服務手段。隨著大數據和人工智能技術的不斷發(fā)展,圖書館、檔案館應積極拓展智能化服務的應用手段。首先,可以引入智能問答式檢索服務,大大簡化用戶與平臺的互動流程,提高用戶獲取信息的效率。其次,引入智能輔助寫作服務。為醫(yī)學科研人員提供更加智能化的創(chuàng)作支持。例如,平臺可以提供自動摘要、引文推薦、問題方法建議等功能,幫助科研人員高效撰寫論文和報告,提升科研生產力。
大數據與人工智能技術為醫(yī)學圖書情報服務的創(chuàng)新發(fā)展提供了前所未有的動力和機遇,未來的醫(yī)學圖書情報服務將能更好地支持科研人員和臨床醫(yī)生,實現更加精準和高效的決策支持,智能化技術的應用將有力推動醫(yī)學領域的創(chuàng)新發(fā)展,提升全球健康信息服務的質量,為醫(yī)療健康事業(yè)的發(fā)展貢獻更多的智慧與力量。
參考文獻
[1]張文龍,徐冬,周浩泉.臨床科研數據平臺的建設與應用[J].中國數字醫(yī)學,2024,19(11):34-39.
[2]覃振明.基于REDCap的醫(yī)學科研數據管理平臺建立及應用研究[J].科技傳播,2024,16(21):5-9.DOI:10.16607/j.cnki.1674—6708.2024.21.007.
[3]張敬晨,孫婧雯,羅葳,等.生物醫(yī)學領域科學數據匯交管理中的挑戰(zhàn)與啟示[J].醫(yī)學信息學雜志,2024,45(10):22-27.
[4]汪佳琪,李忠民.2018-2022年國外圖書情報領域健康醫(yī)療研究主題識別及分析[J/OL].晉圖學刊,1-23[2024-12-03].
http://kns.cnki.net/kcms/detail/14.1022. G2.20231228.1027.002.html.
作者簡介:齊燕(1972—),大學學歷,山東省公共衛(wèi)生臨床中心館員,研究方向:圖書管理相關專業(yè)。