摘要:[目的/意義]探索科研知識服務(wù)體系如何借助智能體從被動支撐向主動服務(wù)轉(zhuǎn)型,對推動科研創(chuàng)新與知識服務(wù)的深度融合具有重要意義。[方法/過程]本文立足于智能體的運行邏輯,以“場景驅(qū)動—能力轉(zhuǎn)化—賦能服務(wù)”為研究維度,系統(tǒng)解構(gòu)了智能體適用于解決的科學(xué)研究問題場景和實現(xiàn)方式,并提煉出其共性關(guān)鍵能力;同時結(jié)合科研知識服務(wù)的現(xiàn)有能力,進一步分析該技術(shù)助力知識服務(wù)嵌入式融入科研創(chuàng)新的應(yīng)用潛力及發(fā)展路徑。[結(jié)果/結(jié)論]智能體有潛力將知識對象結(jié)構(gòu)化、語義化和關(guān)聯(lián)化,并進一步轉(zhuǎn)化為可交互、可計算的知識服務(wù),從而顯著提升知識服務(wù)的智能化水平。智能體賦能知識服務(wù)的路徑包括優(yōu)化知識獲取與整合流程、強化場景決策模擬、促進創(chuàng)新知識發(fā)現(xiàn)和開發(fā)應(yīng)用標準化科學(xué)工具箱。
關(guān)鍵詞:智能體" " 大語言模型" " AI4S" " 科研知識服務(wù)" " AI賦能
分類號:G251;TP393
DOI: 10.19318/j.cnki.issn.2096-1634.2025.01.01
科研知識服務(wù),是指為科研人員、學(xué)術(shù)機構(gòu)和企業(yè)研發(fā)團隊等提供與科學(xué)研究相關(guān)的知識、數(shù)據(jù)、工具和解決方案的服務(wù)。當(dāng)前,科研知識服務(wù)正經(jīng)歷從“資源供給”到“場景賦能”的范式重構(gòu),服務(wù)模式從“在預(yù)設(shè)的場景中提供靜態(tài)知識資源”向“在具體科研場景中動態(tài)解決研究問題”演進,服務(wù)理念從“能提供什么”向用戶導(dǎo)向式的“如何深度嵌入問題場景”轉(zhuǎn)變,服務(wù)載體從相對固化的知識資源系統(tǒng)向具有場景感知能力的嵌入式知識工具升級。這與智能體[1]的應(yīng)用形成強烈共振。
在科學(xué)研究領(lǐng)域,智能體通過增強科學(xué)推理、知識發(fā)現(xiàn)和問題求解能力,顯著提升了科學(xué)研究的效率。諸多研究成果顯示,智能體代表了人工智能輔助科學(xué)研究的又一次突破。以偏振光通過不同角度偏振片后光強變化為例[2],即便是最先進的大語言模型(large language model,LLM)(如GPT-4)在TheoremQA[3]和SciBench[2]等科學(xué)推理基準測試中的準確率僅為50%和35%。而智能體則通過調(diào)用現(xiàn)有科學(xué)計算軟件(如Matlab、WolframAlpha等)中完備的函數(shù)工具庫,能夠以更高的精度和效率解決類似復(fù)雜問題。
在科研知識服務(wù)領(lǐng)域,智能體通過增強知識組織、語義關(guān)聯(lián)與智能交互能力,進一步推動了知識服務(wù)模式的智能化水平。已有多家文獻服務(wù)商開發(fā)智能文獻交互工具,包括Consensus、SciSpace、Elicit等;在開源社區(qū)中,也涌現(xiàn)了眾多構(gòu)建智能體工具,如AutoGen、LangGraph、CrewAI,以及低代碼工具,如Dify、FastGPT、Coze等。這些工具使智能體有潛力將知識對象進一步結(jié)構(gòu)化、語義化和關(guān)聯(lián)化,轉(zhuǎn)化成可交互、可計算的知識智能體[4],大幅提升知識服務(wù)效能。
本文從“場景驅(qū)動”“能力轉(zhuǎn)化”“賦能服務(wù)”三個維度,系統(tǒng)探索科研知識服務(wù)體系如何從被動支撐向主動賦能轉(zhuǎn)型的創(chuàng)新路徑。具體而言,在場景維度上,聚焦智能體在科學(xué)研究中的典型應(yīng)用場景,深入剖析其賦能科研全流程的核心支撐能力;在能力維度上,結(jié)合智能體的技術(shù)架構(gòu)和功能要素,凝煉并泛化智能體獨特的關(guān)鍵能力特征,為構(gòu)建智能化知識服務(wù)體系提供能力圖譜;在服務(wù)維度上,重點探討如何依托智能體的能力優(yōu)勢,實現(xiàn)科研知識服務(wù)的精準化供給和智能化適配。
1" 智能體的內(nèi)涵解析
本文首先對智能體的內(nèi)涵定義、構(gòu)成要素和組織模式進行概述,以便更清晰地理解其在科學(xué)研究場景中的賦能類型,為賦能科研知識服務(wù)的創(chuàng)新場景提供技術(shù)支撐。
1.1" 智能體定義
智能體(agent)在人工智能和計算機科學(xué)領(lǐng)域中,是指一種能夠感知環(huán)境、自主決策并采取行動以實現(xiàn)特定目標的系統(tǒng)或?qū)嶓w[5]。在技術(shù)演進過程中,早期智能體[6]受限于數(shù)據(jù)和和算力,難以實現(xiàn)類人智能。然而,以ChatGPT為代表的LLM誕生后,基于LLM的智能體通過將大模型作為核心組件,結(jié)合多模態(tài)感知能力與外部工具調(diào)用機制,顯著提升了其環(huán)境感知和行動決策的能力,實現(xiàn)了從“靜態(tài)執(zhí)行者”向“動態(tài)決策者”的躍升。這一突破得到了學(xué)界的廣泛認可。吳恩達(Andrew Ng)[7]特別指出,基于LLM智能體的核心優(yōu)勢在于其能夠?qū)?fù)雜任務(wù)分解為可操作的子任務(wù)序列,并通過“感知—決策—執(zhí)行—評估”循環(huán)迭代的方式逐步優(yōu)化解決方案,這種工作模式更接近于人類解決問題的思維模式。
智能體則是智能體技術(shù)在科學(xué)研究領(lǐng)域的應(yīng)用與突破,其設(shè)計目標并非創(chuàng)建一個全知全能的跨領(lǐng)域問題解決者,而是構(gòu)建一個能夠訪問特定領(lǐng)域工具集的、具有自主思考能力的科研助手。通過使LLM掌握可重用、可擴展的工具包[8],結(jié)合領(lǐng)域?qū)I(yè)知識與工具操作能力,智能體能夠靈活適應(yīng)不同領(lǐng)域的特定需求,為科研人員提供精準推理與決策支持。
1.2" 智能體構(gòu)成要素
智能體通常包括5個基本模塊:LLM、記憶、規(guī)劃、行動以及外部感知模塊[9-10],如圖1所示。其中,LLM憑借其卓越的知識獲取、指令理解、推理規(guī)劃、交互、多模態(tài)感知等能力,成為最適合智能體的“大腦”。為確保LLM能夠充分發(fā)揮其決策優(yōu)勢,需要預(yù)先注入特定任務(wù)背景信息,包括參與者的群體特征、環(huán)境參數(shù)等關(guān)鍵要素。這些信息為LLM提供了必要的語境支持,使其能夠更精準地構(gòu)建場景化模型,據(jù)此制定全局任務(wù)規(guī)劃方案。
1.2.1" 規(guī)劃模塊" " 該模塊相當(dāng)于為智能體“大腦”拓展了推理能力,負責(zé)解析科研任務(wù),制定行動計劃。通常包含子目標任務(wù)分解技術(shù)[11]、基于思維鏈[12](chain of thought)的動態(tài)策略優(yōu)化、單/多路徑推理、外部推理方法等策略,并可以針對不同任務(wù)需求動態(tài)調(diào)整。
1.2.2" 行動模塊" " 該模塊相當(dāng)于將智能體的行動空間從虛擬環(huán)境擴展至物理環(huán)境,通過與外部環(huán)境的互動獲取反饋。這里的響應(yīng)動作既可以是物理動作,如機器人移動其手臂;也可以是虛擬動作,如發(fā)送信息。更重要的是,該模塊集成了實時環(huán)境狀態(tài)評估機制,并采用ReAct(reasoning and acting)[13]等先進推理框架,通過“感知—推理—執(zhí)行—優(yōu)化”的迭代過程,持續(xù)改進行動策略,實現(xiàn)智能體與環(huán)境的自適應(yīng)協(xié)同。
1.2.3" 外部感知模塊" " 該模塊相當(dāng)于為智能體拓展感知能力,負責(zé)接收外部環(huán)境信息。由于大模型一旦完成預(yù)訓(xùn)練,其內(nèi)部能力和知識邊界就基本固定下來,并且難以拓展,因此,與外部世界互動、感知、交互的工具顯得尤其重要;同時,還需要借助數(shù)據(jù)對齊、多源信息融合,以確保分析數(shù)據(jù)足以準確支撐后續(xù)任務(wù)。
1.2.4" 記憶模塊" "該模塊為智能體“大腦”拓展記憶能力,包含短期記憶和長期記憶兩部分。短期記憶與上下文的歷史交互數(shù)據(jù)有關(guān),屬于提示工程的一部分;而長期記憶涉及科技文獻信息等外掛知識庫的長期保留和檢索,通常利用外部向量存儲和快速檢索。
1.3" 多智能體的組織模式
受自然界中群體活動(如蜂群行為)的啟發(fā),多智能體系統(tǒng)通過專業(yè)化設(shè)計——“讓每個智能體專注于特定任務(wù)”,并設(shè)定統(tǒng)一的科學(xué)目標——“將所有智能體協(xié)調(diào)統(tǒng)一為有機整體”,共同推動科學(xué)研究任務(wù)的突破。
根據(jù)已有的多智能體通信范式和多智能體內(nèi)部規(guī)劃模塊[14-15],本文總結(jié)分析了4種基于LLM的多智能體通信架構(gòu)。這些架構(gòu)涵蓋了數(shù)據(jù)共享、任務(wù)狀態(tài)更新和決策反饋關(guān)鍵機制,確保信息高效流轉(zhuǎn),使每個智能體能夠快速響應(yīng)研究變化和需求,實現(xiàn)有效的智能體協(xié)作,如圖2所示。
(1)分層化
高層次的智能體負責(zé)研究決策制定、科學(xué)目標設(shè)定和協(xié)調(diào)整體研究,而低層次的智能體則執(zhí)行具體的科學(xué)研究任務(wù),如實驗數(shù)據(jù)收集、分析和處理。智能體主要在其層內(nèi)或相鄰層進行交互,不可越層。
(2)中心化
由一個或者一組智能體協(xié)調(diào)整個系統(tǒng)的通信,其他智能體與中心智能體進行點對點通信。
(3)去中心化
智能體直接與其他智能體進行點對點通信。
(4)共享消息池
智能體之間通過一個共享的消息池通信,可以進行消息發(fā)布或者從消息池訂閱所需消息。
2" 科研場景的智能賦能:智能體的應(yīng)用
通過對arXiv[16]平臺上2021—2024年間智能體主題下相關(guān)文獻的系統(tǒng)性分析,本文對智能體在科學(xué)研究場景中的應(yīng)用現(xiàn)狀進行了梳理與歸納,以期為探索其在科研知識服務(wù)領(lǐng)域的能力拓展路徑與場景創(chuàng)新提供參考依據(jù)。
現(xiàn)存的智能體主要賦能4類科學(xué)研究場景:科技信息檢索增強、科學(xué)決策仿真模擬、科研知識推理發(fā)現(xiàn)和科學(xué)實驗規(guī)劃執(zhí)行,如圖3所示。其中,科技信息檢索增強功能,是指基于海量文獻數(shù)據(jù)庫的高效問答、自動化文獻綜述等;科學(xué)決策仿真模擬功能,主要適用于社會計算領(lǐng)域,如政策制定模擬、疾病傳播模擬等;科研知識推理發(fā)現(xiàn)功能,主要適用于理論計算領(lǐng)域,如自動發(fā)現(xiàn)科學(xué)假設(shè)、單細胞測序數(shù)據(jù)的分析等;科學(xué)實驗規(guī)劃執(zhí)行功能,則主要適用于與物理世界的交互,如連接外部云平臺工具后自動實現(xiàn)化學(xué)合成等。
2.1" 科技信息檢索增強
傳統(tǒng)學(xué)術(shù)搜索引擎(如Google Scholar、Semantic Scholar等)主要采用基于關(guān)鍵詞或主題詞的目標導(dǎo)向檢索模式,要求用戶明確輸入檢索信息。然而,智能體賦能的新興學(xué)術(shù)搜索引擎實現(xiàn)了從目標檢索向探索性發(fā)現(xiàn)的范式轉(zhuǎn)變:通過智能語義理解、知識圖譜關(guān)聯(lián)和用戶意圖挖掘等技術(shù),主動感知研究人員的潛在需求,輔助其探索和發(fā)現(xiàn)新興研究領(lǐng)域。
這一技術(shù)革新在OpenAI發(fā)布智能體Deep Research后得到顯著加速。盡管Deep Research作為閉源項目限制了直接應(yīng)用,其創(chuàng)新理念卻激發(fā)了科研社區(qū)的開源復(fù)現(xiàn)熱潮。多個研究團隊相繼推出了Open Deep Research、OpenDeepResearcher、node-DeepResearch等開源項目,成為新一代科研探索的智能工具。表1總結(jié)了智能體支持下的新興學(xué)術(shù)搜索引擎在功能創(chuàng)新方面的性能表現(xiàn)。
2.2" 科學(xué)決策仿真模擬
“科學(xué)決策仿真模擬”功能角色下,智能體主要用于解決社會與經(jīng)濟領(lǐng)域的仿真問題。研究者通過構(gòu)建閉環(huán)多智能體虛擬系統(tǒng),并基于真實規(guī)則為智能體設(shè)定決策邏輯,分析其互動與行為優(yōu)化仿真模型,從而探索現(xiàn)實決策機制及系統(tǒng)復(fù)雜性。
雖然模擬結(jié)果需驗證,但作為研究的先行步驟,智能體已能幫助研究者在實驗前探索參數(shù)空間,評估參數(shù)變化的影響。總的來說,智能體的決策模擬功能結(jié)合LLM的模擬能力和現(xiàn)實世界的復(fù)雜性,為計算社會學(xué)提供高效、低成本的研究工具,成為探索人類行為與經(jīng)濟理論的有力手段。典型案例如表2所示。
2.3" 科研知識推理發(fā)現(xiàn)
“科研知識推理發(fā)現(xiàn)”功能角色下,智能體主要用來解決自然科學(xué)領(lǐng)域中的邏輯推理問題。有研究顯示,LLM生成的假設(shè)比人類專家撰寫的更新穎[29]。借助多智能體間的交互推理過程,智能體可以迭代優(yōu)化和自我評估所提出研究假設(shè)的可行性和科學(xué)性,有望成為人類科學(xué)家的“副駕駛”。
依托強大的數(shù)據(jù)處理和模式識別能力,智能體可結(jié)合外部知識庫快速分析海量科學(xué)文獻與數(shù)據(jù),識別潛在研究問題,輔助科學(xué)家提出具有創(chuàng)新性和新穎性的科研假設(shè)。不同智能體在知識輸入源、角色分工及反饋優(yōu)化方式上存在差異,典型應(yīng)用如表3所示。
2.4" 科學(xué)實驗規(guī)劃執(zhí)行
與前三種應(yīng)用類型相比,“科學(xué)實驗規(guī)劃執(zhí)行”功能下的智能體側(cè)重于通過物理接口連接虛擬環(huán)境與物理實驗室,根據(jù)科研需求自主選擇工具、規(guī)劃實驗方案并執(zhí)行實驗流程,大幅提升研究效率與質(zhì)量。典型案例見表4。
此外,各領(lǐng)域智能體雖然功能不同,但均遵循“人在回路”原則,確保人在智能體建議與操作中發(fā)揮關(guān)鍵作用。這一原則不僅提升了實驗的安全性與可靠性,還確保AI行為符合倫理與安全標準[39]。
3" 智能體賦能科研知識服務(wù)的路徑
智能體在上述4類科研場景中的創(chuàng)新應(yīng)用,本質(zhì)上依托于其獨特的模塊化能力體系。基于感知、推理、決策和工具等技術(shù)架構(gòu),智能體實現(xiàn)了將技術(shù)勢能向場景創(chuàng)新動能轉(zhuǎn)化,進一步推動科研知識服務(wù)的智能化轉(zhuǎn)型。升級后的科研知識服務(wù)通過優(yōu)化科研場景中的數(shù)據(jù)獲取效率、工具使用范圍及資源配置機制等,提升科研效能,最終構(gòu)建“場景驅(qū)動—能力轉(zhuǎn)化—服務(wù)賦能”的演進模式(圖4)。這一演進模式不僅體現(xiàn)了智能體的場景驅(qū)動與知識服務(wù)的雙重賦能,更推動了知識服務(wù)向科學(xué)研究場景的深度嵌入。基于此,本文從技術(shù)解析與實踐應(yīng)用兩個層面展開。在技術(shù)解析方面,通過解構(gòu)智能體的模塊化架構(gòu),闡明驅(qū)動科研變革的核心能力要素;在實踐應(yīng)用方面,建立能力與場景的協(xié)同映射機制,提出知識服務(wù)智能化轉(zhuǎn)型的實施路徑。
3.1" 智能體的核心能力解構(gòu)
針對科研智能體賦能科學(xué)研究的應(yīng)用場景,結(jié)合智能體本身的模塊構(gòu)成,本文進一步解構(gòu)所需的能力模塊,發(fā)現(xiàn)不同場景中智能體核心能力需求各有側(cè)重,且每種服務(wù)場景需以不同形式能力組合滿足需求,主要包括4種共性能力:場景建模能力、數(shù)據(jù)增強能力、學(xué)習(xí)記憶能力和工具調(diào)用能力。
3.1.1" 場景建模能力" " 智能體解決復(fù)雜問題首要的優(yōu)勢是場景建模能力——智能體畫像。智能體畫像是場景建模的基礎(chǔ),即賦予智能體角色、特征、行動和技能的過程(如規(guī)劃者、執(zhí)行者等),精準感知任務(wù)要求,并將其分解為子任務(wù)的過程。畫像生成方式主要有3種:預(yù)定義、模型生成和數(shù)據(jù)驅(qū)動生成(表5)。
在定義智能體畫像后,多智能體間的交互邏輯也是科研任務(wù)場景建模的重要組成部分。當(dāng)前,大模型在任務(wù)規(guī)劃中的實現(xiàn)方式主要分為兩類:LLM作為規(guī)劃器(LLM as Planner)[43]和LLM輔助的規(guī)劃器(LLM-assisted Planner)[44],如表6所示。前者將LLM作為規(guī)劃器,利用其常識理解與推理能力直接生成規(guī)劃;后者則將LLM作為輔助工具,結(jié)合外部規(guī)劃工具完成科研任務(wù)求解。
3.1.2" 數(shù)據(jù)增強能力" "智能體的數(shù)據(jù)增強能力主要體現(xiàn)在兩個方面:一方面,借助動態(tài)檢索策略,自主決策是否發(fā)起新一輪檢索,從而不斷優(yōu)化信息源的質(zhì)量與覆蓋范圍;另一方面,借助數(shù)據(jù)增強技術(shù),生成多樣化的指令數(shù)據(jù)以豐富數(shù)據(jù)源的多樣性,為更高質(zhì)量的知識生成與應(yīng)用提供支持。具體闡述如表7所示。
3.1.3" 學(xué)習(xí)記憶能力" " 通過在多樣化數(shù)據(jù)集上的廣泛預(yù)訓(xùn)練,智能體具備一定的基礎(chǔ)“記憶”,并通過整合外部記憶系統(tǒng),在特定情境中進一步學(xué)習(xí)。這種結(jié)合內(nèi)部知識與適應(yīng)性學(xué)習(xí)的機制,使其成為處理多樣科研任務(wù)的強大工具。其記憶機制的闡述如表8所示。
3.1.4" 工具調(diào)用能力" " 工具調(diào)用能力是智能體的核心技能之一。這些工具包括應(yīng)用程序、數(shù)據(jù)庫、機器學(xué)習(xí)模型或其他智能體等,為智能體提供額外的數(shù)據(jù)、計算能力、專業(yè)知識或其他資源,使其能夠執(zhí)行復(fù)雜任務(wù)、適應(yīng)環(huán)境變化,并高效解決問題。表9總結(jié)了智能體工具調(diào)用策略。
3.2" 智能體對科研知識服務(wù)的賦能
為精準對應(yīng)并深度耦合上述科學(xué)研究場景,基于上述智能體核心能力的剖析,本文提出智能體在賦能科研知識服務(wù)方面的4個場景化路徑:在“科技信息檢索增強”場景中,優(yōu)化知識獲取整合;在“科學(xué)決策仿真模擬”場景中,構(gòu)建決策空間模擬智能體,支持情境決策模擬;在“科研知識推理發(fā)現(xiàn)”場景中,促進關(guān)聯(lián)知識發(fā)現(xiàn);在“科學(xué)實驗規(guī)劃執(zhí)行”場景中,復(fù)現(xiàn)集成標準化的科學(xué)工具箱。由此,有望推動科研知識服務(wù)向“知識梳理者”“決策參與者”“創(chuàng)新推動者”和“工具集成者”等角色的轉(zhuǎn)型升級。
3.2.1" 優(yōu)化知識獲取整合" " “科技信息檢索增強”場景下,智能體賦能知識服務(wù)的首要機遇在于優(yōu)化知識的獲取與整合,推動其從單純的“信息提供者”向高效的“知識梳理者”轉(zhuǎn)型。具體體現(xiàn)在以下三方面。
(1)借助知識的動態(tài)檢索更新自動生成報告綜述
智能體通過接入實時更新的學(xué)術(shù)資源庫或在線文獻平臺,如Semantic Scholar、Google Scholar、Scite.AI、Elicit、Consensus和SciSpace等,可有效提升LLM問答的可信度和學(xué)術(shù)精準性,以及精準支持前沿科技追蹤和自動化文獻綜述;同時,基于RAG[48]及其變體,如GraphRAG[49]、KG-RAG[50]、HybridRAG[51]等,融合語義檢索與循證分析,從海量文檔中提煉核心信息,實現(xiàn)動態(tài)知識庫的持續(xù)迭代與優(yōu)化。例如,在金融領(lǐng)域,F(xiàn)inRobot[52]通過自動爬取公司年報及社交媒體數(shù)據(jù),抽取其中蘊含的公司基本面數(shù)據(jù)和市場情緒,自動生成投資研報建議,大大提升投資決策準確性等。這一能力大幅降低了知識服務(wù)對人工篩選和手動整合的依賴。
(2)多模態(tài)數(shù)據(jù)關(guān)聯(lián)與整合
智能體通過整合文本、圖像、表格等多模態(tài)數(shù)據(jù),打破單一數(shù)據(jù)形式的局限,大幅提升知識檢索、分析和生成的精準性與效率。例如,TableGPT2[53]可將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為SQL(Structured Query Language)等結(jié)構(gòu)化表格數(shù)據(jù),并結(jié)合LLM實現(xiàn)交互式查詢和智能分析,顯著應(yīng)用于醫(yī)療領(lǐng)域中電子病歷、醫(yī)學(xué)影像及實驗數(shù)據(jù)整合任務(wù)中。
(3)用戶隱形需求挖掘
面對復(fù)雜且多樣化的用戶需求,智能體通過將需求任務(wù)分解為若干子任務(wù),并結(jié)合實時動態(tài)反饋機制優(yōu)化策略,將隱性需求轉(zhuǎn)化為明確解決方案。這一過程不僅精準定位用戶需求,還推動知識服務(wù)從單純的信息傳遞向主動知識構(gòu)建轉(zhuǎn)型,大幅提升了知識服務(wù)的智能化深度。例如,上海圖書館[54]介紹了將智能體應(yīng)用于“值班助手”場景中的探索,以高效理解用戶需求。
3.2.2" 支持情境決策模擬" " 受“科學(xué)決策仿真模擬”功能角色的啟發(fā),智能體賦能知識服務(wù)的核心方式之一是構(gòu)建決策空間模擬智能體。通過結(jié)合社會現(xiàn)實規(guī)則與數(shù)據(jù),可在虛擬環(huán)境中重現(xiàn)復(fù)雜決策場景,推動知識服務(wù)從“信息提供者”轉(zhuǎn)型為“決策輔助者”,提升決策的科學(xué)性。具體體現(xiàn)在以下三方面。
(1)公共政策推演
在政策制定方面,智能體通過建模社會環(huán)境,推演外部變量(如疫情傳播或資源供需變化)波動下政策實施的多維可能性,為政策制定者和公共管理者提供因果分析與決策支持。例如,借助多智能體間的多維討論來識別假新聞[55];評估某政策對特定區(qū)域或人群的短期影響與長期效應(yīng),優(yōu)化社會治理;通過復(fù)雜建模,如國際歷史沖突模擬[27]、疫情傳播模型[56],揭示關(guān)鍵行為模式及潛在趨勢,為戰(zhàn)略規(guī)劃提供科學(xué)依據(jù)。
(2)競爭策略模擬
在競爭管理方面,智能體可以結(jié)合背景數(shù)據(jù)建立用戶行為等,模擬方案或產(chǎn)品發(fā)布后的潛在結(jié)果,預(yù)測用戶行為反應(yīng)帶來的市場格局變動,以及競爭對手的策略選擇等。例如,在市場競爭場景中,可模擬新產(chǎn)品上市后的市場表現(xiàn),評估市場份額變化和價格調(diào)整的影響[23];在供應(yīng)鏈分析中,可預(yù)測關(guān)鍵節(jié)點的動態(tài)變化,并揭示潛在合作與對抗路徑[57]。
(3)決策資源配置
在資源管理方面,智能體通過模擬多智能體協(xié)作,實現(xiàn)資源配置的精準化和智能化。例如,在科研合作中,智能體可模擬科學(xué)家在不同背景和資源限制下的協(xié)作模式,優(yōu)化任務(wù)分配和研究路徑,揭示最佳合作策略[28];在公共資源(如醫(yī)療資源)管理中,智能體可模擬資源供需動態(tài),預(yù)測潛在瓶頸,并提出優(yōu)先級分配方案。
3.2.3" 促進關(guān)聯(lián)知識發(fā)現(xiàn)" " 與“科研知識推理發(fā)現(xiàn)”功能對應(yīng),智能體可通過跨領(lǐng)域知識關(guān)聯(lián)、智能化團隊協(xié)作支持以及科研結(jié)論不一致識別,推動知識服務(wù)者從“信息整合者”轉(zhuǎn)變?yōu)椤皠?chuàng)新推動者”,幫助研究者快速發(fā)掘新領(lǐng)域、新方向。具體實現(xiàn)包括以下四方面。
(1)跨領(lǐng)域知識關(guān)聯(lián)
智能體通過知識圖譜和GraphRAG等技術(shù),將不同學(xué)科領(lǐng)域的概念、理論和數(shù)據(jù)進行語義關(guān)聯(lián),有助于研究者發(fā)現(xiàn)學(xué)科交叉點,由此激發(fā)潛在的創(chuàng)新點。例如,將材料科學(xué)的最新研究進展與生物醫(yī)學(xué)領(lǐng)域的需求相結(jié)合,探索新型生物材料的研發(fā)[58]。
(2)跨領(lǐng)域團隊協(xié)作
智能體能夠作為跨學(xué)科團隊的“知識翻譯官”,將不同領(lǐng)域的專業(yè)術(shù)語和復(fù)雜理論轉(zhuǎn)化為通用語言,降低團隊內(nèi)部的溝通成本。例如,基于VirSci[28]和MOOSE框架[31]等技術(shù),智能體能夠動態(tài)更新團隊所需的相關(guān)領(lǐng)域知識,通過模擬討論或引導(dǎo)對話啟發(fā)團隊成員生成更具創(chuàng)新性的科研假設(shè);此外,還能利用引文網(wǎng)絡(luò)和實體共現(xiàn)網(wǎng)絡(luò),實時提供背景知識支持,確保科研假設(shè)的科學(xué)性。
(3)科研結(jié)論不一致性識別
科學(xué)研究的核心在于假設(shè)的可驗證性和可證偽性。智能體通過分析和對比大量相關(guān)文獻中的多樣化研究結(jié)論,揭示其背后的數(shù)據(jù)條件和邏輯假設(shè)。例如,在研究政策對經(jīng)濟的影響時,不同文獻可能得出相反結(jié)論,智能體可以通過整合數(shù)據(jù)和模擬推理深入驗證這些研究結(jié)果[22]。
(4)高質(zhì)量文本推理數(shù)據(jù)集構(gòu)建
通過自動從海量文獻、博客、專利數(shù)據(jù)庫等多源異構(gòu)數(shù)據(jù)中提取、整合信息,智能體可輔助構(gòu)建高質(zhì)量的自然語言推理(natural language inference,NLI)數(shù)據(jù)集和形式化數(shù)學(xué)定理數(shù)據(jù)庫,從而提高科研假設(shè)的可信度和科學(xué)推理的自動化水平。例如,SciFact數(shù)據(jù)集[59]專注于科學(xué)文獻事實驗證,智能體可以基于該數(shù)據(jù)集學(xué)習(xí)如何從科研論文中提取論證關(guān)系,輔助學(xué)者驗證研究結(jié)論的可靠性,推動自動化科研助理的發(fā)展。
3.2.4" 集成科學(xué)工具接口" " 受“科學(xué)實驗規(guī)劃與執(zhí)行”功能的啟發(fā),智能體可以幫助知識服務(wù)人員推動科研工具接口的標準化。一方面,智能體對多樣化工具接口的調(diào)用需求,為構(gòu)建標準化科學(xué)工具箱提供契機;另一方面,得益于其在復(fù)現(xiàn)科技文獻實現(xiàn)工具方面的優(yōu)勢,復(fù)現(xiàn)成功的模型方法可以進一步系統(tǒng)化地集成在科學(xué)工具箱中,以提升知識服務(wù)能力范圍。兩者共同加速知識服務(wù)業(yè)從“實驗輔助者”向“標準化工具推動者”[60]的轉(zhuǎn)型升級。
(1)科學(xué)工具的標準化封裝
相比于LLM,智能體的核心優(yōu)勢之一在于直接調(diào)用學(xué)科領(lǐng)域工具的能力[61],加速測試科學(xué)假設(shè)、實驗設(shè)計和數(shù)據(jù)分析過程。例如,ChemCrow[40]集成了化學(xué)信息學(xué)工具包RDKit,能夠更高效地進行化合物篩選、結(jié)構(gòu)分析和反應(yīng)預(yù)測等復(fù)雜化學(xué)計算;CoScientist則整合任務(wù)規(guī)劃、代碼執(zhí)行和設(shè)備控制模塊,構(gòu)建集中化的任務(wù)規(guī)劃能力。然而,大量工具代碼仍分散于各個平臺,智能體框架難以直接調(diào)用,這為知識服務(wù)的創(chuàng)新發(fā)展提供了契機。通過標準化封裝不同領(lǐng)域的工具代碼并將其集成為“科學(xué)工具箱”,可顯著提升科研效率,促進跨學(xué)科協(xié)作與創(chuàng)新[62]。
(2)科研工具的復(fù)現(xiàn)與集成
智能體憑借其在文獻數(shù)據(jù)解析[63]、實驗條件模擬和工具接口整合上的能力,在科研文獻復(fù)現(xiàn)和可信度[64]分析方面具有顯著優(yōu)勢。對于不可復(fù)現(xiàn)的工具或模型,智能體可多維度分析定位復(fù)現(xiàn)失敗的原因,提出修復(fù)建議,為方法優(yōu)化和擴展提供參考;對于可復(fù)現(xiàn)的工具或模型,智能體可將其自動封裝為標準化接口,以便后續(xù)研究調(diào)用。
國家自然科學(xué)基金委員會2025年1月發(fā)布的《關(guān)于發(fā)布可解釋、可通用的下一代人工智能方法重大研究計劃2025年度項目指南的通告》中[65]明確指出:“要建設(shè)開源科學(xué)數(shù)據(jù)庫、知識庫、物理模型庫和算法庫,推動人工智能新方法在解決科學(xué)領(lǐng)域復(fù)雜問題上的示范性應(yīng)用?!边@一政策導(dǎo)向不僅為科研知識服務(wù)推動工具標準化封裝提供了戰(zhàn)略指引,也充分印證了提升科研工具復(fù)現(xiàn)性對構(gòu)建智慧化科研生態(tài)的重要意義。
4" 智能體賦能科研知識服務(wù)的問題與挑戰(zhàn)
4.1" 技術(shù)層面挑戰(zhàn)
智能體在應(yīng)用于知識服務(wù)場景中時,主要面臨以下挑戰(zhàn):一是,智能體本身推理與規(guī)劃能力的局限性,影響其在復(fù)雜科研任務(wù)中的表現(xiàn);二是,與知識服務(wù)場景的領(lǐng)域適配性問題,影響其應(yīng)用的穩(wěn)定性。
4.1.1" 科研推理與規(guī)劃挑戰(zhàn)
(1)邏輯推理能力不足,帶來可信性問題
智能體的核心模型LLM在科學(xué)推理任務(wù)中容易產(chǎn)生解碼幻覺問題,影響其在復(fù)雜科學(xué)問題解決和創(chuàng)新理論提出場景中的推理可信性。尤其是在高度專業(yè)化領(lǐng)域(如生物技術(shù)和核工程),由于訓(xùn)練數(shù)據(jù)集的局限性,智能體存在知識儲備不足的問題,無法精準推演復(fù)雜、精密的科學(xué)問題。例如,在核反應(yīng)堆設(shè)計中,無法全面考慮輻射泄漏或熔毀風(fēng)險;在化合物合成中,可能低估毒性或環(huán)境影響[1]。
(2)路徑規(guī)劃合理性不足,引發(fā)鏈條反應(yīng)
智能體通過路徑規(guī)劃,將科研任務(wù)分解為可管理的子任務(wù),支持科學(xué)發(fā)現(xiàn)和實驗設(shè)計,但不合理的任務(wù)拆解可能導(dǎo)致鏈條反應(yīng),引發(fā)連鎖問題。
①協(xié)同工作障礙。在多智能體系統(tǒng)中,智能體間的頻繁交互在一定程度上會放大LLM生成的微小錯誤,導(dǎo)致信息累積和放大,降低系統(tǒng)協(xié)同效率與準確性。這一障礙尤其容易發(fā)生在外部工具適配環(huán)節(jié)。
②應(yīng)用穩(wěn)定性風(fēng)險?;贚LM構(gòu)建的科學(xué)應(yīng)用可能因為模型輸出的不一致性和格式差異而變得不穩(wěn)定,增加了研究過程中技術(shù)故障的風(fēng)險,可能導(dǎo)致研究中斷或數(shù)據(jù)丟失。
③缺乏對長期規(guī)劃的感知。智能體可能難以充分理解與特定科學(xué)任務(wù)相關(guān)的長期潛在風(fēng)險,無法有效評估行動的長期后果和影響。例如,在藥物研發(fā)過程中,模型可能低估長期副作用或環(huán)境影響,影響藥物安全性評估。
4.1.2" 知識服務(wù)場景下的適配性挑戰(zhàn)" " 智能體在具體應(yīng)用于知識服務(wù)場景時,還需要解決現(xiàn)有知識服務(wù)能力基礎(chǔ)與智能體能力之間的匹配問題。
(1)領(lǐng)域知識動態(tài)更新的局限性
科學(xué)研究是動態(tài)發(fā)展的,相應(yīng)地,科研知識服務(wù)場景需要實時應(yīng)對快速變化的領(lǐng)域發(fā)展。然而,許多重要的科研數(shù)據(jù),如實驗過程數(shù)據(jù)、臨床試驗結(jié)果、衛(wèi)星數(shù)據(jù)(Starlink數(shù)據(jù))等,是私有、閉源的,由此,智能體可能因局限于可獲取的知識數(shù)據(jù)源而無法及時捕捉這些更新,從而降低服務(wù)的深度和可靠性。
(2)跨學(xué)科任務(wù)規(guī)劃不足
科學(xué)研究的創(chuàng)新突破往往依賴跨學(xué)科知識的融合與協(xié)同,這要求知識服務(wù)場景通常涉及多學(xué)科、多領(lǐng)域的交叉任務(wù)。然而,智能體缺乏整合多學(xué)科知識的高效機制。比如,不同學(xué)科領(lǐng)域的研究范式和數(shù)據(jù)標準存在差異,使其難以全面理解不同學(xué)科之間的復(fù)雜交互關(guān)系,難以保證任務(wù)規(guī)劃的連貫性和解決方案的全面性。
(3)知識服務(wù)工具的生態(tài)體系不完善
知識服務(wù)需要高效調(diào)用多種工具與平臺,但當(dāng)前許多領(lǐng)域工具尚未實現(xiàn)標準化,導(dǎo)致智能體在調(diào)用時存在工具匱乏、技術(shù)兼容性不足、穩(wěn)定性不佳等問題。
4.2" 社會與倫理挑戰(zhàn)
智能體在賦能知識服務(wù)的同時,也帶來了諸多社會與倫理層面的挑戰(zhàn),主要體現(xiàn)在隱私保護、價值觀一致性、人類主體性削弱以及知識公平性等方面。
4.2.1" 隱私保護問題
(1)科研數(shù)據(jù)泄漏風(fēng)險
智能體在被應(yīng)用過程中,可以廣泛訪問和存儲大量科研數(shù)據(jù),使研究人員面臨信息泄露的重大風(fēng)險。例如,智能體可能在無意間記憶并泄露敏感實驗數(shù)據(jù)、專利申請材料或尚未公開的研究成果,導(dǎo)致知識產(chǎn)權(quán)流失,影響學(xué)術(shù)競爭力。尤其是在生物醫(yī)藥、材料科學(xué)等領(lǐng)域,許多前沿研究涉及企業(yè)機密或國家安全信息,一旦被惡意利用,可能對相關(guān)機構(gòu)或國家造成嚴重損失。因此,需研發(fā)嚴格的數(shù)據(jù)訪問控制和加密技術(shù),以確保敏感科研數(shù)據(jù)不被濫用。
(2)軟件與硬件安全漏洞
DeepSeek的案例顯示,遠程訪問型智能體容易受到網(wǎng)絡(luò)攻擊、未經(jīng)授權(quán)的數(shù)據(jù)訪問和隱私泄露等安全威脅,甚至可能被操縱輸出不安全或錯誤的科研建議。相比之下,本地部署的開源智能體由于數(shù)據(jù)存儲和計算均在本地環(huán)境中運行,能夠有效降低外部攻擊風(fēng)險,增強數(shù)據(jù)隱私保護。為確保智能體的安全性,需建立嚴格的訪問控制機制、數(shù)據(jù)加密策略和異常檢測系統(tǒng);同時,針對遠程訪問型智能體,加強安全協(xié)議與防御措施,以防止未經(jīng)授權(quán)的調(diào)用和數(shù)據(jù)篡改,從而提升智能體的可靠性和安全性。
4.2.2" 價值觀一致性問題" " 在處理復(fù)雜或涉及道德判斷的情況時,智能體需要與人類價值觀和科學(xué)倫理保持一致,但其訓(xùn)練過程極其依賴歷史數(shù)據(jù),可能導(dǎo)致知識推薦偏向或倫理爭議。
(1)智能體的偏見問題
科學(xué)研究本應(yīng)遵循客觀、公正的原則,但如果智能體的訓(xùn)練數(shù)據(jù)來源存在地域、文化或?qū)W術(shù)流派偏向,這可能導(dǎo)致其在知識推薦、假設(shè)推理等方面傾向于某種特定立場。例如,在醫(yī)學(xué)研究中,如果智能體的訓(xùn)練數(shù)據(jù)主要基于歐美國家的臨床試驗,那么其建議的治療方案可能不適用于發(fā)展中國家的患者。
(2)道德決策的復(fù)雜性
科學(xué)研究并非僅涉及客觀事實,還可能涉及倫理和道德決策。例如,在基因編輯、生物武器等敏感領(lǐng)域,智能體是否應(yīng)當(dāng)建議某些實驗操作,存在較大的倫理爭議。如果智能體依據(jù)某些研究論文,推薦未經(jīng)充分倫理審查的實驗方案,如未經(jīng)過嚴格生態(tài)評估的轉(zhuǎn)基因作物研究,那么這可能引發(fā)倫理爭議。
4.2.3" 人類主體性削弱問題" " 隨著智能體在科研中的廣泛應(yīng)用,研究人員對其依賴程度加深,這可能導(dǎo)致科研人員認知能力衰退、科研主動性降低、學(xué)術(shù)訓(xùn)練弱化以及研究成果趨同化等一系列問題。
(1)研究人員的認知衰退
科學(xué)研究本質(zhì)上依賴批判性思維、邏輯推理和創(chuàng)造性探索,而智能體的核心能力在于基于已有數(shù)據(jù)提供最優(yōu)解或預(yù)測結(jié)果。研究人員過度依賴智能體進行科研決策,可能造成自主思考能力的削弱,甚至引發(fā)認知能力的退化以及影響下一代科研人員的學(xué)術(shù)訓(xùn)練。因此,科研人員在使用智能體時需保持批判性思維,以確保智能體是研究的輔助工具,而非主導(dǎo)者。
(2)研究成果的趨同化
智能體通過學(xué)習(xí)現(xiàn)有的研究成果、理論框架和實驗數(shù)據(jù)進行推理,而其生成的科研假設(shè)和實驗方案往往是基于已知知識的優(yōu)化,而非真正的創(chuàng)新。這意味著如果研究人員始終依賴智能體提供的建議,其研究方向可能趨于同質(zhì)化,導(dǎo)致學(xué)術(shù)界缺乏突破性的研究。建議開發(fā)探索性智能體,引入變異搜索、啟發(fā)式生成和非結(jié)構(gòu)化數(shù)據(jù)挖掘等技術(shù),使智能體能主動探索新的科研方向。
4.2.4" 知識公平性問題" " 目前,高性能智能體的研發(fā)和運行依賴龐大的計算資源和數(shù)據(jù)集,這使其研發(fā)和應(yīng)用主要集中在大型科技公司(如OpenAI、DeepMind)或科研機構(gòu)(如麻省理工學(xué)院、斯坦福大學(xué)),而中小型機構(gòu)或發(fā)展中國家的研究者往往難以獲得相同的資源。這種資源和技術(shù)的不均衡可能進一步加劇全球科研的不平等,使學(xué)術(shù)創(chuàng)新的機會更加集中于少數(shù)科技強國和企業(yè)。因此,需要繼續(xù)推動智能體技術(shù)的開源化,鼓勵更多研究機構(gòu)和開源社區(qū)共同開發(fā)低成本、高效能的智能體模型,降低使用門檻;同時,發(fā)展云計算資源共享計劃,以確保不同地區(qū)的研究機構(gòu)都能公平使用智能體。
5" 總結(jié)與展望
當(dāng)前,科研知識服務(wù)正經(jīng)歷從“資源供給”到“場景賦能”的范式重構(gòu)。智能體憑借“感知—決策—執(zhí)行—評估”循環(huán)的工作模式,為科研知識服務(wù)的智能化升級帶來新機遇。
本文從智能體的運行邏輯出發(fā),從“場景驅(qū)動”“能力轉(zhuǎn)化”“賦能服務(wù)”三個維度,系統(tǒng)探索了智能體技術(shù)輔助“科研知識服務(wù)嵌入科研創(chuàng)新場景”的機遇所在。智能體賦能科研知識服務(wù)包括4個應(yīng)用場景,即科技信息檢索增強、科學(xué)決策仿真模擬、科研知識推理發(fā)現(xiàn)和科學(xué)實驗規(guī)劃執(zhí)行;其共性關(guān)鍵能力是場景建模能力、數(shù)據(jù)增強能力、學(xué)習(xí)記憶能力和外部工具調(diào)用能力。智能體的場景化賦能路徑包括:優(yōu)化知識獲取整合、構(gòu)建決策空間模擬智能體、關(guān)聯(lián)知識發(fā)現(xiàn)和標準化科學(xué)工具箱。在實際應(yīng)用中,智能體賦能面臨的多重技術(shù)挑戰(zhàn),包括其自身局限性、與知識服務(wù)場景的適配性問題,以及數(shù)據(jù)安全、倫理風(fēng)險和知識公平性等問題。本文旨在為科研知識服務(wù)體系如何從被動支撐向主動賦能轉(zhuǎn)型提供探索路徑,以應(yīng)對新技術(shù)賦予的新要求。
參考文獻:
[1] TANG X R, JIN Q, ZHU K L, et al. Prioritizing safeguarding over autonomy: Risks of LLM agents for science[J/OL]. arXiv, 2024[2024-11-15]. https://arxiv.org/abs/2402.04247.
[2] MA Y B, GOU Z B, HAO J H, et al. SciAgent: Tool-augmented language models for scientific reasoning[C]// Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing. Stroudsburg: Association for Computational Linguistics," 2024: 15701-15736.
[3] PARK J S, O’BRIEN J, CAI C J, et al. Generative agents: Interactive simulacra of human behavior[C]// Proceedings of the 36th Annual ACM Symposium on User Interface Software and Technology. New York: ACM, 2023: Article No.2.
[4] 張曉林, 梁娜. 知識的智慧化、智慧的場景化、智能的泛在化: 探索智慧知識服務(wù)的邏輯框架[J]. 中國圖書館學(xué)報, 2023, 49(3): 4-18.
[5] IGNISE A, VAHI Y. Introduction to agents[J]. J Sen Net Data Comm, 2024, 4(2): 1-7.
[6] XI Z H, CHEN W X, GUO X, et al. The rise and potential of large language model based agents: A survey[J]. Science China Information Sciences, 2025, 68(2): Article No.121101.
[7] NG A. Andrew Ng on AI agentic workflows and their potential for driving AI progress[EB/OL]. (2024-06-11)[2025-02-15]. https://www.youtube.com/watch?v=q1XFm21I-VQ.
[8] WANG B S, ZHANG X, LI S Y, et al. The practice of enhancing learning and scientific innovative abilities using LLM-based AI tools[C]// Proceedings of the 6th International Conference on Computer Science and Technologies in Education (CSTE). Piscataway: IEEE, 2024: 166-170.
[9] WANG L, MA C, FENG X Y, et al. A survey on large language model based autonomous agents[J]. Frontiers of Computer Science, 2024, 18(6): 186345.
[10] WENG L L. LLM powered autonomous agents[EB/OL]. (2023-06-23)[2025-01-06]. https://lilianweng.github.io/posts/2023-06-23-agent/.
[11] KHOT T, TRIVEDI H, FINLAYSON M, et al. Decomposed prompting: A modular approach for solving complex tasks[J/OL]. arXiv, 2022[2024-11-15]. https://arxiv.org/abs/2210.02406.
[12] WEI J, WANG X Z, SCHUURMANS D, et al. Chain-of-thought prompting elicits reasoning in large language models[C]// Proceedings of the 36th International Conference on Neural Information Processing Systems. New York: ACM, 2022: 24824-24837.
[13] YAO S Y, ZHAO J, YU D, et al. ReAct: Synergizing reasoning and acting in language models[J/OL]. arXiv, 2022[2024-11-15]. https://arxiv.org/abs/2210.03629.
[14] GUO T C, CHEN X Y, WANG Y Q, et al. Large language model based multi-agents: A survey of progress and challenges[C]// Proceedings of the Thirty-Third International Joint Conference on Artificial Intelligence. New York: ACM, 2024: 8048-8057.
[15] CHENG Y H, ZHANG C Y, ZHANG Z W, et al. Exploring large language model based intelligent agents: Definitions, methods, and prospects[J/OL]. arXiv, 2024[2024-11-15]. https://arxiv.org/abs/2401.03428.
[16] ArXiv e-Print archive [EB/OL]. (1991-08-14)[2025-02-15]. https://arxiv.org/.
[17] Consensus[EB/OL]. (2021-01-12)[2025-01-06]. https://consensus.app/.
[18] TYPESET. SciSpace[EB/OL]. (2015-10-01)[2025-01-06]. https://typeset.io/zh.
[19] CHEN Z H, LIU K K, WANG Q C, et al. MindSearch: Mimicking human minds elicits deep AI searcher[J/OL]. arXiv, 2024[2024-11-15]. https://arxiv.org/abs/2407.20183.
[20] SAMI A M, RASHEED Z, KEMELL K K, et al. System for systematic literature review using multiple AI agents: Concept and an empirical evaluation[J/OL]. arXiv, 2024[2024-11-15]. https://arxiv.org/abs/2403.08399.
[21] MainFunc. Genspark[EB/OL]. (2024-06-01)[2025-01-06]. https://www.genspark.ai/?ref.
[22] GLOBE. GLOBE explorer[EB/OL]. (2024-12-22)[2025-01-06]. https://explorer.globe.engineer/.
[23] SKARLINSKI M D, COX S, LAURENT J M, et al. Language agents achieve superhuman synthesis of scientific knowledge[J/OL]. arXiv, 2024[2024-11-15]. https://arxiv.org/abs/2409.13740.
[24] MOORE G H. The National Bureau of Economic Research[J]. The American Statistician, 2012, 4(3): 13-15.
[25] ZHAO Q L, WANG J D, ZHANG Y X, et al. CompeteAI: Understanding the competition behaviors in large language model-based agents[J/OL]. arXiv, 2023[2024-11-15]. https://arxiv.org/abs/2310.17512.
[26] WILLIAMS R, HOSSEINICHIMEH N, MAJUMDAR A, et al. Epidemic modeling with generative agents[J/OL]. arXiv, 2023[2024-11-15]. https://arxiv.org/abs/2307.04986.
[27] XIAO B S, YIN Z Y, SHAN Z X. Simulating public administration crisis: A novel generative agent-based simulation system to lower technology barriers in social science research[J/OL]. arXiv, 2023[2024-11-15]. https://arxiv.org/abs/2311.06957.
[28] HUA W Y, FAN L Z, LI L Y, et al. War and peace (waragent): Large language model-based multi-agent simulation of world wars[J/OL]. arXiv, 2023[2024-11-15]. https://arxiv.org/abs/2311.17227.
[29] SU H Y, CHEN R Q, TANG S X, et al. Two heads are better than one: A multi-agent system has the potential to improve scientific idea generation[J/OL]. arXiv, 2024[2024-11-15]. https://arxiv.org/abs/2410.09403.
[30] SI C L, YANG D Y, HASHIMOTO T. Can LLMs generate novel research ideas? A large-scale human study with 100+ NLP researchers[J/OL]. arXiv, 2024[2024-11-15]. https://arxiv.org/abs/2409.04109.
[31] LU C, LU C, LANGE R T, et al. The AI scientist: Towards fully automated open-ended scientific discovery[J/OL]. arXiv, 2024[2024-11-15]. https://arxiv.org/abs/2408.06292.
[32] YANG Z, DU X, LI J, et al. Large language models for automated open-domain scientific hypotheses discovery[C]//Findings of the Association for Computational Linguistics ACL 2024. Stroudsburg: ACL, 2024: 13545-13565.
[33] BAEK J, JAUHAR S K, CUCERZAN S, et al. ResearchAgent: Iterative research idea generation over scientific literature with large language models[J/OL]. arXiv, 2024[2024-11-15]. https://arxiv.org/abs/2404.07738.
[34] LI L, XU W W, GUO J Y, et al. Chain of ideas: Revolutionizing research via novel idea development with LLM agents[J/OL]. arXiv, 2024[2024-11-15]. https://arxiv.org/abs/2410.13185.
[35] GHAFAROLLAHI A, BUEHLER M J. SciAgents: Automating scientific discovery through multi-agent intelligent graph reasoning[J/OL]. arXiv, 2024[2024-11-15]. https://arxiv.org/abs/2409.05556.
[36] BUEHLER M J. Accelerating scientific discovery with generative knowledge extraction, graph-based representation, and multimodal intelligent graph reasoning[J]. Machine Learning: Science and Technology, 2024, 5(3): 035083.
[37] XIAO Y H, LIU J Y, ZHENG Y, et al. CellAgent: An LLM-driven multi-agent framework for automated single-cell data analysis[J/OL]. arXiv, 2024[2024-11-15]. https://arxiv.org/abs/2407.09811.
[38] GHAFAROLLAHI A, BUEHLER M J. ProtAgents: Protein discovery via large language model multi-agent collaborations combining physics and machine learning[J]. Digital Discovery, 2024, 3(7): 1389-1409.
[39] HUANG H Z, SHI X G, LEI H Y, et al. ProtChat: An AI multi-agent for automated protein analysis leveraging GPT-4 and protein language model[J]. Journal of Chemical Information and Modeling, 2025, 65(1): 62-70.
[40] RAMOS M C, COLLISON C J, WHITE A D. A review of large language models and autonomous agents in chemistry[J]. Chemical Science, 2025, 16(6): 2514-2572.
[41] BRAN A M, COX S, SCHILTER O, et al. Augmenting large language models with chemistry tools[J]. Nature Machine Intelligence, 2024, 6(5): 525-535.
[42] HUANG K X, QU Y H, COUSINS H, et al. CRISPR-GPT: An LLM agent for automated design of gene-editing experiments[J/OL]. arXiv, 2024[2024-11-15]. https://arxiv.org/abs/2404.18021.
[43] 百度智能云. 秒噠[EB/OL]. (2025-01-01) [2025-01-06]. https://cloud.baidu.com/product/AMIS/miaoda.html.
[44] SONG C H, WU J M, WASHINGTON C, et al. LLM-planner: Few-shot grounded planning for embodied agents with large language models[C]// Proceedings of the 19th IEEE/CVF International Conference on Computer Vision. Piscataway: IEEE, 2023: 2986-2997.
[45] LIN B Y, FU Y, YANG K, et al. Swiftsage: A generative agent with fast and slow thinking for complex interactive tasks[J/OL]. arXiv, 2023[2024-11-15]. https://arxiv.org/pdf/2305.17390.
[46] SHEN Y, SONG K, TAN X, et al. Hugginggpt: Solving ai tasks with chatgpt and its friends in hugging face[J/OL]. arXiv, 2024[2024-11-15]. https://arxiv.org/pdf/2303.17580.
[47] SILVER T, DAN S, SRINIVAS K, et al. Generalized planning in PDDL domains with pretrained large language models[C]// Proceedings of the Thirty-Eighth AAAI Conference on Artificial Intelligence. New York: ACM, 2024: 20256-20264.
[48] MITRA A, DEL CORRO L, ZHENG G Q, et al. AgentInstruct: Toward generative teaching with agentic flows[J/OL]. arXiv, 2024[2024-11-15]. https://arxiv.org/abs/2407.03502.
[49] GAO Y F, XIONG Y, GAO X Y, et al. Retrieval-augmented generation for large language models: A survey[J/OL]. arXiv, 2023[2024-11-15]. https://arxiv.org/abs/2312.10997.
[50] EDGE D, TRINH H, CHENG N, et al. From local to global: A graph rag approach to query-focused summarization[J/OL]. arXiv, 2024[2024-11-15]. https://arxiv.org/abs/2404.16130.
[51] SANMARTIN D. KG-RAG: Bridging the gap between knowledge and creativity[J/OL]. arXiv, 2024[2024-11-15]. https://arxiv.org/abs/2405.12035.
[52] SARMAH B, MEHTA D, HALL B, et al. HybridRAG: Integrating knowledge graphs and vector retrieval augmented generation for efficient information extraction[C]// Proceedings of the 5th ACM International Conference on AI in Finance. New York: ACM, 2024: 608-616.
[53] 韓雪雯, 車尚錕, 楊夢晴, 等. 多模態(tài)數(shù)據(jù)驅(qū)動的AI智能體模式設(shè)計[J]. 圖書情報工作, 2024, 68(24): 27-37.
[54] SU A F, WANG A W, YE C, et al. Tablegpt2: A large multimodal model with tabular data integration[J/OL]. arXiv, 2024[2024-11-15]. https://arxiv.org/abs/2411.02059.
[55] 蔡丹丹, 王詩卉. 智能體技術(shù)進展及其在圖書館領(lǐng)域的應(yīng)用[J]. 信息與管理研究, 2024, 9(6): 24-33.
[56] 許旻辰, 屈丹, 司念文, 等. 多維度多智能體分組討論的虛假新聞檢測方法[J]. 計算機工程與應(yīng)用, 2025: 1-16.
[57] GUO X D, CHEN P Y, LIANG S H, et al. PaCAR: COVID-19 pandemic control decision making via large-scale agent-based modeling and deep reinforcement learning[J]. Medical Decision Making, 2022, 42(8): 1064-1077.
[58] GAO S, WEN Y T, ZHU M H, et al. Simulating financial market via large language model based agents[J/OL]. arXiv, 2024[2024-11-15]. https://arxiv.org/abs/2406.19966.
[59] TIAN Y J, SONG H, WANG Z C, et al. Graph neural prompting with large language models[C]// Proceedings of the AAAI Conference on Artificial Intelligence. 2024: 19080-19088.
[60] WADDEN D, LIN S C, LO K, et al. Fact or fiction: Verifying scientific claims[C]//Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP). Stroudsburg: ACL, 2020: 7534-7550.
[61] 劉細文, 郭世杰. 情報認知模型庫構(gòu)建研究[J]. 農(nóng)業(yè)圖書情報學(xué)報, 2021, 33(1): 32-40.
[62] LI B X, YAN T K, PAN Y T, et al. MMedAgent: Learning to use medical tools with multi-modal agent[C]// Findings of the Association for Computational Linguistics: EMNLP 2024. Stroudsburg: ACL, 2024: 8745-8760.
[63] 劉細文, 付蕓, 孫蒙鴿. 驅(qū)動情報工作范式變革的情報智能體技術(shù)解構(gòu)[J]. 圖書情報工作, 2025, 69(1): 4-15.
[64] FOPPIANO L, LAMBARD G, AMAGASA T, et al. Mining experimental data from materials science literature with large language models: An evaluation study[J]. Science and Technology of Advanced Materials: Methods, 2024, 4(1): 2356506.
[65] BERSENEV D, YACHIE-KINOSHITA A, PALANIAPPAN S K. Replicating a high-impact scientific publication using systems of large language models[EB/OL]. (2024-04-12)[2025-02-01]. https://www.biorxiv.org/content/biorxiv/early/2024/04/12/2024.04.08.588614.1.full.pdf.
[66] 國家自然科學(xué)基金委員會. 關(guān)于發(fā)布可解釋、可通用的下一代人工智能方法重大研究計劃2025年度項目指南的通告[EB/OL]. (2025-01-26)[2025-01-26]. https://www.nsfc.gov.cn/publish/portal0/tab442/info94367.htm.
作者貢獻說明:
孫蒙鴿:收集數(shù)據(jù),設(shè)計并執(zhí)行研究方案,撰寫修改論文;
付" 蕓:設(shè)計研究方案,討論和修改論文;
劉細文:提出研究選題,討論研究方案,修改論文并定稿。
Pathways of Empowering Scientific Knowledge Services with Agents
Sun Mengge1,2" Fu Yun1" Liu Xiwen1,2
1 National Science Library, Chinese Academy of Sciences, Beijing 100190
2 Department of Information Resources Management, School of Economics and Management, University of
Chinese Academy of Sciences, Beijing 100190
Abstract: [Purpose/Significance] Intelligent agents have the potential to significantly enhance the efficiency and depth of scientific research, demonstrating immense promise in empowering research knowledge services. This paper explores the transformation of research knowledge service systems from passive support to proactive service through the three-dimensional framework of “Scenario-Driven-Capability Transformation-Service Empowerment.” [Method/Process] Grounded in the operational logic of intelligent agents, this study systematically deconstructs the research problem scenarios where intelligent agents are applicable and their implementation approaches, extracting their common core capabilities. By integrating these capabilities with the existing functions of research knowledge services, the paper further examines the potential of intelligent agents in embedding and integrating knowledge services into scientific innovation, along with their developmental pathways. [Result/Conclusion] Intelligent agents have the potential to structuralize, semanticize, and interlink knowledge objects, further transforming them into interactive and computable knowledge services, thereby significantly enhancing the intelligence level of knowledge services. The pathways for intelligent agents to empower knowledge services include: Optimizing knowledge acquisition and integration processes, enhancing scenario-based decision simulations, facilitating innovative knowledge discovery, and standardizing scientific toolkits.
Keywords:" agents" " large language model(LLM)" " AI4S" "research knowledge service" "AI empowering
收稿日期:2025-01-08" " " 修回日期:2025-02-13
*本文系國家自然科學(xué)基金重點項目“數(shù)智賦能的科技信息資源與知識管理理論變革(項目編號:72234005)”的研究成果之一。
作者簡介:孫蒙鴿,中國科學(xué)院文獻情報中心博士研究生,E-mail:sunmengge@mail.las.ac.cn;付蕓,中國科學(xué)院文獻情報中心館員,博士,E-mail:fuy@mail.las.ac.cn;劉細文,通信作者,中國科學(xué)院文獻情報中心主任,研究員,博士生導(dǎo)師,博士,E-mail:liuxw@mail.las.ac.cn。