摘要:隨著人工智能技術的快速發(fā)展,大語言模型(LLMs) 在教育領域的應用日益廣泛。該研究著眼于探索大語言模型在中醫(yī)藥研究生科研能力提升中的作用與應用策略,全面審視了中醫(yī)藥研究生在科研能力方面的現(xiàn)狀,并據(jù)此提出了一系列創(chuàng)新策略,包括運用大語言模型優(yōu)化知識檢索、輔助實驗設計、增強數(shù)據(jù)分析能力以及提升論文撰寫質(zhì)量。大語言模型的引入顯著提高中醫(yī)藥研究生的科研能力,同時為其現(xiàn)代化進程提供強有力的技術支撐。
關鍵詞:大語言模型;中醫(yī)藥;研究生;科研能力;教育技術;自然語言處理
中圖分類號:TP391" " " 文獻標識碼:A
文章編號:1009-3044(2025)19-0115-03
開放科學(資源服務) 標識碼(OSID)
0 引言
中醫(yī)藥作為中國傳統(tǒng)文化瑰寶,擁有獨特理論體系和豐富臨床經(jīng)驗,對全球健康事業(yè)影響深遠[1]?,F(xiàn)代醫(yī)學快速發(fā)展,中醫(yī)藥傳承與發(fā)展面臨挑戰(zhàn)。研究生教育是培養(yǎng)中醫(yī)藥科研人才的關鍵階段,其科研能力直接關系學科創(chuàng)新與進步[2]。為滿足現(xiàn)代科研需求,中醫(yī)藥學科亟須與現(xiàn)代科技融合,推動現(xiàn)代化和國際化[3]。因此,提升中醫(yī)藥研究生科研能力是亟待解決的問題。
人工智能技術是模擬和擴展人類智能的先進手段,已成為推動社會進步的重要力量。在中醫(yī)藥領域,人工智能技術的應用已經(jīng)滲透到中醫(yī)診斷、健康管理、名老中醫(yī)經(jīng)驗傳承、藥物配方創(chuàng)新等多個方面[4-5]。我們曾使用卷積神經(jīng)網(wǎng)絡進行乳腺癌預測[6],基于視覺變壓器適配器的雙曲嵌入實現(xiàn)糖尿病視網(wǎng)膜病變的多病變分割[7]。近年來,以生成式人工智能(AIGC) 為代表的新一代人工智能技術,極大地促進了人機交互的發(fā)展。在這一領域,大語言模型(LLMs) 以其在自然語言處理任務上的顯著成果和出色的知識涌現(xiàn)能力,成為研究的熱點。
教育領域,大語言模型在輔助教學、個性化學習資源、優(yōu)化學習路徑等方面潛力巨大[8-9]。將大語言模型應用于中醫(yī)藥研究生教育,有望通過智能化手段提升科研能力,推動學科現(xiàn)代化。例如,中國科學院文獻情報中心與科大訊飛股份有限公司聯(lián)合研發(fā)的科技文獻大模型-星火科研助手,就是一個成功案例。該模型基于豐富的科技文獻資源,提供成果調(diào)研、論文研讀和學術寫作等科研助手功能,為科研工作者提供了一個高效、精準的科技文獻服務平臺,極大地助力了科研工作的開展[10-11]。
盡管大語言模型在研究生科研能力提升方面有成效,但在中醫(yī)藥專業(yè)仍面臨挑戰(zhàn)。首先,提示詞(Prompt) 設計不合理是突出問題。提示詞直接影響大語言模型對問題的理解和回答的準確性。中醫(yī)藥研究生調(diào)研古典書籍時,合理提示詞可獲得更清晰的回答。然而,不熟悉人工智能的研究生難以設計有效提示詞,可能無法充分利用大模型潛力。其次,數(shù)據(jù)整理和分析能力欠缺是重要問題。中醫(yī)藥研究生可能缺乏數(shù)據(jù)清洗、預處理和分析技能,而這些技能對利用大語言模型至關重要。
本文旨在探討大語言模型在中醫(yī)藥研究生科研能力培養(yǎng)中的應用潛力,分析其在文獻檢索、實驗設計、數(shù)據(jù)分析和論文寫作中的作用,為中醫(yī)藥教育和科研提供新思路。具體策略如圖1所示。
1 中醫(yī)藥研究生科研能力現(xiàn)狀
1.1 文獻檢索效率的挑戰(zhàn)
中醫(yī)藥研究生科研工作首先面臨知識檢索難題。中醫(yī)藥古典文獻(如《黃帝內(nèi)經(jīng)》《傷寒雜病論》) 蘊含豐富理論和實踐,但古文晦澀和非標準化數(shù)據(jù)結構給信息檢索帶來障礙。學生需投入大量時間閱讀理解古籍,且缺乏高效檢索工具,難以快速定位信息。這一現(xiàn)狀嚴重制約了中醫(yī)藥研究生科研工作的效率和深度。
1.2 實驗設計能力的不足
實驗設計是科研核心,但其復雜性對中醫(yī)藥研究生是挑戰(zhàn)。由于基礎理論不扎實和復雜知識整合能力缺乏,研究生面對新方向時難以有效實驗設計。此外,團隊合作中發(fā)散思維和創(chuàng)新意識不足,限制了提出創(chuàng)新問題和設計思路的能力。
1.3 數(shù)據(jù)分析能力的薄弱
臨床研究中,數(shù)據(jù)分析至關重要。中醫(yī)藥研究生統(tǒng)計學和數(shù)據(jù)科學基礎薄弱,面對復雜數(shù)據(jù)分析任務可能力不從心。此不足影響數(shù)據(jù)有效解讀,制約數(shù)據(jù)標準化能力,以及利用大語言模型提升分析效率的潛力。
1.4 論文撰寫能力的待提升
論文撰寫是科研成果傳播關鍵,但中醫(yī)藥研究生面臨挑戰(zhàn)。英語水平不足、論述不深入、框架條理欠缺,影響準確表達研究思路和結果。這些問題降低論文質(zhì)量,影響發(fā)表機會。研究生對英文寫作的畏難情緒,降低了寫作積極性。
中醫(yī)藥研究生在科研能力上的現(xiàn)狀亟須改進。提升文獻檢索效率、加強實驗設計能力、強化數(shù)據(jù)分析技能以及提高論文撰寫水平,是當前教育和科研工作中需要重點關注和解決的問題。通過這些方面的提升,可以有效地增強中醫(yī)藥研究生的科研能力,進而推動中醫(yī)藥學科的發(fā)展和創(chuàng)新。
2 大語言模型提升中醫(yī)藥研究生科研能力策略
近年來,大語言模型的快速發(fā)展正在重塑研究生教育和科研的各個方面。目前常見的大語言模型如表1所示。大語言模型通過深度學習和數(shù)據(jù)訓練,能夠執(zhí)行復雜的語言任務,在理解和生成自然語言方面展現(xiàn)出了前所未有的能力。當前的教育和科研背景下,大語言模型在中醫(yī)藥研究生科研能力提升上扮演著越來越重要的角色。本文主要闡述大語言模型在優(yōu)化文獻檢索、輔助實驗設計、提升數(shù)據(jù)分析能力和優(yōu)化論文撰寫這四個方面的策略。
2.1 利用大語言模型優(yōu)化知識檢索
快速提取中醫(yī)藥文本信息是提升研究生科研能力的關鍵。利用檢索增強生成(RAG) 技術,從海量文獻中精準提取信息并生成回答,有助于發(fā)現(xiàn)中醫(yī)藥隱性知識。提示詞設計對提升大模型處理復雜任務的準確性和效率至關重要。提示詞通常由指令和輸入數(shù)據(jù)組成,指令應明確、清晰,上下文內(nèi)容越精確,生成效果越好。如圖2所示,提示詞優(yōu)化通過增設背景提示、角色設定、示例引導及輸出規(guī)范等策略,有效提升了大模型輸出效果。
因此,本文將研究開發(fā)適用于中醫(yī)藥領域的提示詞庫,深入分析專業(yè)術語和研究問題,確保準確性和實用性。首先,通過文獻綜述和需求分析,了解中醫(yī)藥研究生使用大語言模型的具體需求和問題,為提示詞庫開發(fā)和培訓課程設計提供指導。其次,基于文獻綜述和需求分析設計初步提示詞庫。再次,通過互動和反饋,優(yōu)化調(diào)整提示詞庫,確保有效性和適用性。最后,通過工作坊和在線教程,教育研究生設計和使用有效提示詞,提高與大模型科研助手互動效率。此外,通過構建包含中醫(yī)典籍、古籍和文獻的核心數(shù)據(jù)基礎(需引用數(shù)據(jù)來源) ,大語言模型可實現(xiàn)中醫(yī)藥領域知識智能問答。
2.2 利用大語言模型輔助實驗設計
大語言模型可模擬專家思維,提供實驗設計參考和建議。如圖3所示,用戶輸入提示詞,大語言模型(如Kimi) 分析歷史數(shù)據(jù)和文獻,自動生成初步實驗方案,包括目的、方法、材料和預期結果。研究生可根據(jù)建議,結合自身情況優(yōu)化實驗設計。此外,中醫(yī)藥LLM中,混合專家系統(tǒng)(MoE) 整合規(guī)則推理、神經(jīng)網(wǎng)絡、機器學習和模糊邏輯等技術,形成處理復雜和不確定問題的系統(tǒng)。MoE可處理診斷和治療中的不確定性,吸納新臨床結果和反饋,優(yōu)化更新治療策略。
2.3 利用大語言模型提升數(shù)據(jù)分析能力
通過開設數(shù)據(jù)科學基礎課程(結合大語言模型應用) ,采用理論與實踐結合的教學方法(如講座、實踐、案例研究) ,提升研究生數(shù)據(jù)技能。課程內(nèi)容根據(jù)中醫(yī)藥領域需求定制。利用大語言模型整合統(tǒng)計和數(shù)據(jù)分析工具,提供智能化分析服務。通過自然語言指令(舉例) ,研究生可進行數(shù)據(jù)清洗、統(tǒng)計分析和結果解釋。大語言模型自動化處理分析大量數(shù)據(jù),減少數(shù)據(jù)整理工作量,使研究生專注于創(chuàng)新和深入分析。大語言模型可作為輔助決策工具,推薦統(tǒng)計方法和模型,提高數(shù)據(jù)分析準確性和效率。大語言模型可整合數(shù)據(jù)挖掘技術,從大量中醫(yī)藥數(shù)據(jù)中提取信息。例如,使用聚類分析、因子分析、關聯(lián)規(guī)則等方法發(fā)現(xiàn)方劑配伍規(guī)律和癥狀分析。
2.4 利用大語言模型優(yōu)化論文撰寫
大語言模型可輔助研究生撰寫高質(zhì)量學術論文。通過自然語言生成技術,模型可生成論文各部分(如摘要、引言、方法、結果和討論) 研究生可在此基礎上修改完善,提高論文質(zhì)量和發(fā)表可能性。大語言模型可通過語言校對和潤色,改進論文語言和表達。
3 結論
本研究探討了大語言模型在中醫(yī)藥研究生科研能力提升中的作用和潛力。分析發(fā)現(xiàn),大語言模型在文獻檢索優(yōu)化、實驗設計輔助、數(shù)據(jù)分析能力增強、論文撰寫優(yōu)化等方面為中醫(yī)藥研究生提供助力。
總之,大語言模型在中醫(yī)藥研究生科研能力提升上價值顯著,為學科發(fā)展和現(xiàn)代化注入活力。未來,隨著人工智能技術進步,大語言模型在中醫(yī)藥教育和科研領域前景廣闊,期待其推動學科創(chuàng)新,培養(yǎng)更多具備現(xiàn)代科研能力的中醫(yī)藥人才。同時,大語言模型的應用還面臨著一些挑戰(zhàn),如模型的準確性、數(shù)據(jù)的安全性和倫理問題等。因此,未來的研究需要在確保技術可靠性和安全性的基礎上,進一步探索大語言模型在中醫(yī)藥領域的深度應用。同時,我們也需要加強跨學科的合作,整合資源,共同推動大語言模型在中醫(yī)藥教育和科研中的健康發(fā)展。
參考文獻:
[1] 張伯禮.加強中醫(yī)藥臨床基礎研究 推動中醫(yī)藥科技創(chuàng)新發(fā)展[J].中國科學基金,2024,38(3):377.
[2] 鄧穎,胡淑娟,彭清華.湖南中醫(yī)藥大學學位與研究生教育的探索與實踐[J].湖南中醫(yī)藥大學學報,2024,44(10):1739-1744.
[3] 李玲,張彤. 現(xiàn)代科技賦能中藥全產(chǎn)業(yè)鏈的傳承與創(chuàng)新[J].中成藥,2024,46(10):3540-3544.
[4] 江如藍,雷結語,陳文禮,等.基于人工智能感官技術的中藥質(zhì)量控制方法研究進展[J].藥學前沿,2024,28(11):550-556.
[5] 楊青,黃壯壯,許剛,等.人工智能在中藥研究中的應用進展[J].中成藥,2024,46(10):3529-3532.
[6] XU H Q,SHAO X,HUI S J,et al.Supervised breast cancer prediction using integrated dimensionality reduction convolutional neural network[J].PLoS One,2023,18(5):e0282350.
[7] WANG Z J,LU H M,YAN H X,et al.Vison transformer adapter-based hyperbolic embeddings for multi-lesion segmentation in diabetic retinopathy[J].Scientific Reports,2023,13(1):11178.
[8] 康來,謝毓湘,郭金林,等.大語言模型時代工科實踐教學的機遇、挑戰(zhàn)與應對初探[J].大學教育,2024(22):11-16.
[9] 劉明,楊閩,吳忠明,等.教育大模型智能體的開發(fā)、應用現(xiàn)狀與未來展望[J].現(xiàn)代教育技術,2024,34(11):5-14.
[10] 劉慶峰.星火大模型技術最新進展及產(chǎn)業(yè)應用[J].中國經(jīng)濟報告,2024(4):131-133.
[11] 徐文博,周曉平.類ChatGPT大語言模型在護理課程考核中的應用探索:基于ChatGPT、文心一言、訊飛星火測試[J].中國醫(yī)學教育技術,2024,38 (5):567-571.
【通聯(lián)編輯:李雅琪】