【摘要】 基層醫(yī)療系統(tǒng)是實現(xiàn)健康公平的關(guān)鍵。我國面臨醫(yī)療資源分布不平衡、基層醫(yī)生數(shù)量短缺以及慢性病防治形勢不容樂觀的嚴峻挑戰(zhàn)。人工智能大語言模型在醫(yī)療系統(tǒng)中發(fā)揮出了強大優(yōu)勢,本文深入探討了大模型在基層醫(yī)療系統(tǒng)中的應(yīng)用及其面臨的挑戰(zhàn),提出應(yīng)進一步深化大模型的應(yīng)用,以輔助基層醫(yī)生常見病診療,推動智能化健康教育和慢性病管理,托底“老少邊窮”地區(qū)基層衛(wèi)生服務(wù),激發(fā)全科醫(yī)學(xué)的飛躍性發(fā)展,并推進大模型在全科診療與基層衛(wèi)生服務(wù)中的產(chǎn)業(yè)化,為健康中國建設(shè)提供重要支撐。
【關(guān)鍵詞】 大語言模型;全科醫(yī)學(xué);基層醫(yī)療衛(wèi)生服務(wù);健康公平;健康教育;慢性病管理
【中圖分類號】 R-05 【文獻標(biāo)識碼】 A DOI:10.12114/j.issn.1007-9572.2024.0277
The Application of Large Language Models in Primary Healthcare Services and the Challenges
YAN Wenxin1,HU Jian1,ZENG Huatang2,LIU Min3*,LIANG Wannian1,4*
1.Vanke School of Public Health,Tsinghua University,Beijing 100084,China
2.Shenzhen Health Development Research and Data Management Center,Shenzhen 518028,China
3.School of Public Health,Peking University,Beijing 100191,China
4.Institute for Healthy China,Tsinghua University,Beijing 100084,China
*Corresponding authors:LIU Min,Professor/Doctoral supervisor;E-mail:liumin@bjmu.edu.cn
LIANG Wannian,Professor/Doctoral supervisor;E-mail:liangwn@tsinghua.edu.cn
YAN Wenxin and HU Jian are Co-first Authors
【Abstract】 The primary healthcare system is key to achieving a health equity. In China,great obstacles are challenged by imbalanced medical resources,shortage of primary healthcare providers,and the prevention and treatment of chronic diseases. Artificial intelligence large language models have demonstrated strong advantages in the medical system. This article deeply explored the application of large language models in the primary healthcare system and the challenges. The large language models are expected to assist the diagnosis and treatment of common diseases in grassroot medical institutions,promote intelligent health education and chronic disease management,underpin primary health services in the undeveloped and remote areas,stimulate the leapfrog development of general medicine,and accelerate the industrialization of large language models in general diagnosis and treatment and primary health services,thus providing important support for the construction of healthy China.
【Key words】 Large language model;General practice;Primary healthcare services;Health equity;Health education;Chronic disease management
面對醫(yī)療資源分布不均衡、基層醫(yī)生數(shù)量短缺以及人群慢性病防治不容樂觀的嚴峻形勢,人工智能技術(shù)特別是大語言模型(large languange model,LLM)的發(fā)展能夠為我國基層醫(yī)療衛(wèi)生服務(wù)提供創(chuàng)新性的解決方案。在國家戰(zhàn)略的支持與生物數(shù)據(jù)體系建設(shè)的基礎(chǔ)上,我國在開發(fā)和實施醫(yī)療人工智能技術(shù)方面正在取得快速進展[1]。2024-06-06,國務(wù)院辦公廳在《深化醫(yī)藥衛(wèi)生體制改革2024年重點工作任務(wù)》[2]中強調(diào),要加強基層醫(yī)療衛(wèi)生服務(wù)能力建設(shè),特別指出了改善基層醫(yī)療衛(wèi)生機構(gòu)基礎(chǔ)設(shè)施條件,推廣智慧醫(yī)療輔助信息系統(tǒng),這意味著LLM等智能手段的應(yīng)用對于我國當(dāng)下基層衛(wèi)生服務(wù)的現(xiàn)代化發(fā)展具有創(chuàng)造性意義。
1 LLM在醫(yī)學(xué)領(lǐng)域的發(fā)展與應(yīng)用
LLM是擁有數(shù)十億甚至數(shù)百億參數(shù)的復(fù)雜機器學(xué)習(xí)模型,能夠處理海量數(shù)據(jù),執(zhí)行自然語言處理、計算機視覺、語音識別等復(fù)雜任務(wù)。訓(xùn)練此類模型需要大量數(shù)據(jù)以避免過擬合,并依賴高性能計算設(shè)備或云計算資源。
自2022年11月對話生成預(yù)訓(xùn)練轉(zhuǎn)換器(Chat Generative Pre-trained Transformer,ChatGPT)發(fā)布以來,LLM技術(shù)在醫(yī)療健康領(lǐng)域引起了廣泛關(guān)注。通用醫(yī)療人工智能(Generalist Medical Artificial Intelligence,GMAI)迅速發(fā)展,展現(xiàn)出巨大的潛力和變革性影響。LLM通過擴大模型規(guī)模實現(xiàn)了新的突破,例如GPT-3和Med-PaLM-2等模型在美國醫(yī)療執(zhí)照考試(United States Medical Licensing Examination,USMLE)中表現(xiàn)出色,其中Med-PaLM-2的準確率達86.5%[3]。微軟公司開發(fā)的新型大型語言模型LLaVA-Med,經(jīng)過大規(guī)模生物醫(yī)學(xué)圖像和文本數(shù)據(jù)集的訓(xùn)練,能夠處理多模態(tài)醫(yī)療信息,分析CT和X光片等醫(yī)學(xué)影像,并據(jù)此推斷患者潛在的病理情況,生成相關(guān)的問答內(nèi)容[4]。研究者評估了LLM在醫(yī)療保健應(yīng)用中的潛力,包括提升醫(yī)療咨詢系統(tǒng)的效率、自動生成多模態(tài)醫(yī)療報告以及在醫(yī)療問答(QA)和對話系統(tǒng)中的應(yīng)用[5]。通過利用生成對抗網(wǎng)絡(luò)(Generative Adversarial Networks,GANs)、變分自編碼器(VAEs)、擴散模型(DMs)和LLM等技術(shù),研究人員可以整合多種類型的醫(yī)療數(shù)據(jù)(如影像、文本、音頻、時間序列等)。在LLM安全性方面,生成式大模型面臨著包括模型竊取、數(shù)據(jù)竊取、對抗攻擊、后門攻擊、Prompt攻擊和數(shù)據(jù)投毒等多方面威脅[6]。
通用醫(yī)療人工智能大模型具有較好的文本信息處理和多模態(tài)信息融合能力。與以往局限于狹窄醫(yī)療保健問題的人工智能模型相比,GMAI的優(yōu)勢非常顯著[5],包括以下5點。(1)處理數(shù)據(jù)的復(fù)雜性:醫(yī)療健康數(shù)據(jù)復(fù)雜,包括圖像、文本、數(shù)值等多種類型,且涉及各種醫(yī)療術(shù)語與復(fù)雜的病情描述。(2)泛化能力:不同于專為特定任務(wù)訓(xùn)練的模型,GMAI作為通用模型,理論上可以適應(yīng)各種不同的醫(yī)療任務(wù),如疾病檢測、預(yù)后評估、患者風(fēng)險預(yù)測等。(3)高精度:GMAI在解決影像識別、基因序列分析和疾病預(yù)測等復(fù)雜醫(yī)學(xué)問題時,能夠?qū)崿F(xiàn)高度精確的判斷。例如,在處理如磁共振成像(MRI)和CT等醫(yī)學(xué)圖像時,GMAI展現(xiàn)出卓越的圖像識別能力。(4)實時性:GMAI可以對持續(xù)產(chǎn)生的新數(shù)據(jù)進行實時分析和預(yù)測,對于臨床決策支持系統(tǒng)而言尤其重要。(5)個性化:LLM能夠從大量的患者數(shù)據(jù)中學(xué)習(xí),并為每個患者提供個性化的醫(yī)療建議,使醫(yī)療服務(wù)能更好地照顧到每個患者的特殊需求。
2 我國基層醫(yī)療衛(wèi)生服務(wù)現(xiàn)狀與挑戰(zhàn)
基層醫(yī)療衛(wèi)生機構(gòu)作為我國分布最廣、服務(wù)人群最多的衛(wèi)生健康機構(gòu),承擔(dān)著基本公共衛(wèi)生、基本醫(yī)療服務(wù)、常態(tài)化疫情防控等諸多重要使命,承擔(dān)著全國一半以上的診療量,是構(gòu)建分級診療制度的執(zhí)行者,更是老百姓健康的“守門人”。然而在科室結(jié)構(gòu)方面,基層醫(yī)療機構(gòu)常給患者留下??圃\療能力弱、精準確定病種難的印象,尤其是對于“一老一小”群體,專科診療能力亟待提升。要讓群眾更方便、安全地在基層看病,必須要提高基層的醫(yī)療衛(wèi)生服務(wù)技術(shù)能力[7]。
基層醫(yī)療在處理合并癥和減少健康不公平等方面至關(guān)重要。我國當(dāng)前仍存在全科醫(yī)生數(shù)量少及基層醫(yī)療機構(gòu)器械配備不全[8]、門診量低、重復(fù)就診等問題。門診量低是全國各地分級診療制度實施過程中普遍面臨的問題,不僅不利于基層醫(yī)療機構(gòu)的發(fā)展和三級醫(yī)院的專家前來坐診,還會形成馬太效應(yīng)引發(fā)患者的不信任[8]?;鶎俞t(yī)療機構(gòu)還面臨醫(yī)護人員短缺、教育程度低、臨床經(jīng)驗有限、技術(shù)水平和服務(wù)能力有待提升及全科醫(yī)生知識更新不及時等問題[9]。目前,我國合格的全科醫(yī)生嚴重不足,無法在基層醫(yī)療機構(gòu)滿足人民群眾的衛(wèi)生服務(wù)需求?;鶎俞t(yī)療機構(gòu)在開展慢性病管理工作方面也同樣面臨著經(jīng)費不足、專項經(jīng)費配置不足等資金管理問題,成為阻礙各地深入開展慢性病管理工作的重要原因。
當(dāng)前,我國慢性病患病率仍逐年上升,防治形勢日益嚴峻[10]。高血壓、糖尿病、惡性腫瘤等慢性病成為導(dǎo)致我國人口死亡率升高的主要因素之一,給人民健康和社會發(fā)展造成了巨大的負擔(dān),亦給基層醫(yī)護人員帶來巨大壓力?;鶎勇圆」芾韺τ跍p輕患者醫(yī)療負擔(dān)至關(guān)重要[11],據(jù)統(tǒng)計,80%~90%的患者健康問題可由社區(qū)衛(wèi)生服務(wù)工作人員協(xié)助解決[12],而80%的冠心病、90%的2型糖尿病、1/3的癌癥又可以通過控?zé)熛蘧?、健康飲食、維持正常體重等措施來預(yù)防[10]。2023年1—11月,全國總診療量為64.1億人次,其中,基層醫(yī)療衛(wèi)生機構(gòu)診療量為22.4億人次,占總診療量的34.9%[13]。這表明我國分級診療總體效果尚不明顯,全科醫(yī)學(xué)的高質(zhì)量發(fā)展還有很長的路要走[14]?;颊咝枨蟮脑黾?、慢性病和資源限制給醫(yī)療保健系統(tǒng)帶來了壓力。與此同時,數(shù)字醫(yī)療技術(shù)的使用也在增加,所有醫(yī)療保健環(huán)境中的數(shù)據(jù)都在擴大。如果數(shù)字醫(yī)療技術(shù)得到適當(dāng)利用,基層醫(yī)療衛(wèi)生人員可以專注于疾病的原因,并跟蹤預(yù)防措施和干預(yù)措施的效果。
3 人工智能LLM在基層醫(yī)療衛(wèi)生服務(wù)中的應(yīng)用與發(fā)展前景
3.1 輔助常見病的診療,提高全科醫(yī)生診療能力和工作效率
全科醫(yī)學(xué)具有衛(wèi)生健康領(lǐng)域交叉學(xué)科特點,其踐行的醫(yī)療服務(wù)模式和服務(wù)內(nèi)容需要不斷地適應(yīng)和滿足人民群眾日益增長的醫(yī)療衛(wèi)生服務(wù)需求[15],需要不斷地積累經(jīng)驗和推廣全科醫(yī)療適宜技術(shù)[14-15]。LLM能夠幫助基層全科醫(yī)生節(jié)省非臨床工作時間,自動執(zhí)行常規(guī)和重復(fù)的醫(yī)療任務(wù),從醫(yī)療數(shù)據(jù)輸入到高效搜索和匯總醫(yī)療信息,生成全面的摘要,涵蓋患者的病史、潛在診斷和可用的治療方案[16-17],還能模擬臨床情景,為醫(yī)護人員提供實戰(zhàn)培訓(xùn)和技能,提升臨床診治能力[18-19]。國內(nèi)多家公司利用LLM開發(fā)醫(yī)療人工智能系統(tǒng),醫(yī)渡科技人工智能平臺旨在幫助中國醫(yī)院在醫(yī)學(xué)研究、醫(yī)療管理、藥物研究和臨床決策支持方面更有效地運作[20]。百度的PaddlePaddle(飛槳)人工智能平臺被用于從診斷到預(yù)測的醫(yī)療應(yīng)用[21]。阿里巴巴開發(fā)的ET醫(yī)療大腦人工智能平臺能夠整合醫(yī)院后勤與和協(xié)助診斷,通過整合患者電子健康記錄和患者圖像中的數(shù)據(jù),為患者提供更好的治療決策[21]。騰訊實驗室的人工智能產(chǎn)品用于整合電子病歷和疾病風(fēng)險預(yù)測,并自動分析CT和PET掃描等醫(yī)學(xué)影像,以幫助醫(yī)生進行診斷[21]。
社區(qū)和農(nóng)村是醫(yī)療衛(wèi)生服務(wù)的“最后一公里”[22],通過推出符合基層醫(yī)生需求的輔助診斷系統(tǒng),可以打通壁壘,消除差距,全面強化社區(qū)和鄉(xiāng)村全科醫(yī)生的??萍寄埽瑤椭鶎俞t(yī)生提升問診、診斷、用藥等全系列能力,從而應(yīng)對人員短缺和知識更新不足的挑戰(zhàn),提高診斷準確率,減少誤診和漏診,實現(xiàn)“AI+專家”雙重把關(guān),提高診斷效率及準確率,達到“讓AI輔助看病,讓醫(yī)生專注看人”的目標(biāo)[23],優(yōu)化治療方案,增強對慢性病、兒科疾病、腫瘤等的治療能力,提升治療效果,并告訴基層醫(yī)生什么時候該轉(zhuǎn)診、轉(zhuǎn)去哪里,提供最高效、最科學(xué)的決策。
3.2 智能化健康教育,為患者提供科學(xué)知識和心理咨詢
LLM和信息技術(shù)的發(fā)展,使得聊天機器人和移動應(yīng)用程序等可以支持大規(guī)模的公共衛(wèi)生監(jiān)測和干預(yù)。人工智能和自然語言處理(NLP)技術(shù)的進步為支持人口層面的健康教育開辟了一條具有前景的路徑。特別是聊天機器人被認為是擴展能力的有效工具,因其可以圍繞健康提供信息為用戶提供情感支持[24]。LLM能夠容納海量醫(yī)學(xué)知識,并通過收集用戶的數(shù)據(jù)(如年齡、性別、健康狀況等),以易懂的方式給用戶解釋,為用戶提供個性化的健康建議。在疾病預(yù)防方面,LLM可以通過疾病風(fēng)險預(yù)測來感知和評估用戶疾病發(fā)生風(fēng)險,向用戶發(fā)布預(yù)警,指導(dǎo)其及時采取預(yù)防措施。在心理健康層面上,LLM在開放主題中進行自由形式的對話,其首要目標(biāo)是提供同理心。這樣的系統(tǒng)有利于公共衛(wèi)生干預(yù),為有不同健康經(jīng)歷的人群提供同理心互動,并接觸到更廣泛的缺乏服務(wù)的人群。同時,LLM能夠為用戶提供心理咨詢服務(wù),幫助用戶管理壓力,提高生活質(zhì)量。人工智能不是簡單的自動化任務(wù),而是開發(fā)可以在醫(yī)療保健環(huán)境中增強患者護理的技術(shù)。患者能夠用日常語言來描述所需的內(nèi)容,讓通用醫(yī)學(xué)人工智能模型適應(yīng)新任務(wù),而無須重新訓(xùn)練多模態(tài)大模型或訓(xùn)練多模態(tài)大模型接受不同類型的非結(jié)構(gòu)化數(shù)據(jù)來生成回應(yīng)[16]。
3.3 數(shù)智化健康管理,為居民提供全周期的精準個性化慢性病管理
在技術(shù)革新方面,醫(yī)療大模型賦能慢性病防控進入了新階段;在場景應(yīng)用方面,慢性病“預(yù)防-診斷-治療”持續(xù)取得新進展,出現(xiàn)了更加主動的預(yù)防模式、更加精準的診斷方法、更加多樣的治療手段;并提出慢性病防控的未來發(fā)展趨勢為“精準化”“個體化”“數(shù)智化”“一體化”[10]。LLM利用患者的醫(yī)療記錄和當(dāng)前狀況,為患者提供個性化護理建議并為患者量身定制護理計劃[25]。LLM協(xié)助全科醫(yī)生管理和準確給藥,并及時提醒醫(yī)生和患者。LLM能夠?qū)崿F(xiàn)遠程監(jiān)測患者健康,分析生理參數(shù)、設(shè)備數(shù)據(jù)和健康記錄,幫助醫(yī)生管理疾病,減少住院和急診;通過遠程醫(yī)療建議和護理指導(dǎo),改善遠程護理體驗。谷歌團隊基于Gemini可穿戴健康監(jiān)測設(shè)備數(shù)據(jù),開發(fā)了個人健康大模型 (PH-LLM)[26]和個人健康洞察智能助手(PHIA)[27],心理健康應(yīng)用Woebot Health將LLM無縫集成到現(xiàn)有的人工智能產(chǎn)品中,充分發(fā)揮LLM在精準化行為健康管理方面的潛力[28]。數(shù)字健康技術(shù)(Digital Health Technologies,DHTs)利用人工智能監(jiān)測患者癲癇發(fā)作、糖尿病、心血管疾病臨床管理,減輕患者和基層醫(yī)療人員的負擔(dān),減少獲得護理的結(jié)構(gòu)性不平等[29]。同時,老年人需要擺脫孤獨和情感負擔(dān)。LLM通過監(jiān)測居民健康,發(fā)現(xiàn)異常值后致電詢問居民的健康需求,如詢問“為什么昨晚睡不好,有遇到什么問題嗎?”“我上次建議采取更多措施,您試過了嗎?感覺如何?”這些LLM能力的實現(xiàn),對于實現(xiàn)以人為本的基層衛(wèi)生服務(wù)至關(guān)重要[30]。
3.4 智能化管理醫(yī)療衛(wèi)生服務(wù),推動基層醫(yī)療衛(wèi)生服務(wù)體系的現(xiàn)代化建設(shè)
LLM還要在全科醫(yī)學(xué)領(lǐng)域發(fā)揮出防治結(jié)合的核心競爭力[15],醫(yī)院智能隨訪系統(tǒng)基于人工智能語音、自然語言理解等技術(shù),實現(xiàn)批量外呼、人機交互、自動統(tǒng)計等功能,助力醫(yī)院完成滿意度調(diào)查、健康宣教、科室隨訪、科研隨訪、危急值提醒等全方位隨訪工作,降低醫(yī)院隨訪成本,提高醫(yī)務(wù)人員工作效率。通過協(xié)同各地資源,實現(xiàn)同等水平的高質(zhì)量服務(wù),利用遠端交互和高水平醫(yī)療資源對LLM終端進行質(zhì)量把控,給出及時反饋。此外,通過患者端健康囑托系統(tǒng),提供日常健康指導(dǎo),監(jiān)測患者用藥反應(yīng),提示潛在風(fēng)險。
對于我國其他基本公共衛(wèi)生服務(wù)項目,LLM同樣具有相應(yīng)的應(yīng)用場景,如評估每位孕產(chǎn)婦面臨的風(fēng)險等級,應(yīng)用孕產(chǎn)婦風(fēng)險預(yù)警模型,顯著提升孕期管理效率和質(zhì)量,包括孕產(chǎn)婦健康監(jiān)測、早產(chǎn)和流產(chǎn)風(fēng)險、妊娠糖尿病、妊娠期貧血和產(chǎn)后抑郁癥等預(yù)測,新生兒疼痛評估、敗血癥預(yù)測等[31],在很大程度上降低孕產(chǎn)婦和新生兒死亡率;面對0~6歲兒童的智能化健康管理,高效精準完成計劃免疫工作等。對于健康居民,LLM的介入將有助于及時發(fā)現(xiàn)家庭醫(yī)生簽約服務(wù)需求,落實居民健康風(fēng)險管理。通過節(jié)約人工成本,更有望進一步提高全民基本公共衛(wèi)生服務(wù)補助,升級服務(wù)包,提高服務(wù) 質(zhì)量。
借助LLM工具,期待基層醫(yī)療的診療決策過程變得更加科學(xué)和系統(tǒng)化,能解決更多常見病之外的問題,為大型醫(yī)院減輕負擔(dān),保障患者在各級醫(yī)院都能得到更高標(biāo)準的醫(yī)療關(guān)懷[32]。我國的分級診療制度建設(shè)以“健康需求”為基礎(chǔ),目標(biāo)是實現(xiàn)“協(xié)同治理”[33]。當(dāng)前分級診療的工作重點是引導(dǎo)群眾轉(zhuǎn)變就醫(yī)觀念和就醫(yī)習(xí)慣,全面了解基層醫(yī)療機構(gòu)的功能,避免患者盲目涌向大醫(yī)院[8]。LLM的出現(xiàn)及其應(yīng)用前景將極大地推動分級診療政策的實施,通過提高基層醫(yī)療服務(wù)質(zhì)量、服務(wù)覆蓋面、服務(wù)時效性及服務(wù)性價比,建立患者對基層醫(yī)療機構(gòu)的信任與依賴。此外,還要發(fā)揮醫(yī)療共同體的作用,通過上級醫(yī)院的力量,助力LLM在基層醫(yī)療衛(wèi)生機構(gòu)的精確化使用與質(zhì)量保障,迅速提升基層全科醫(yī)生的業(yè)務(wù)能力,使其從容應(yīng)對常見病及慢性病,培訓(xùn)正確分析檢測報告的能力,這是吸引患者前來就診、履行分級診療的關(guān)鍵[8]。同時,在實行上級醫(yī)院托管基層醫(yī)療機構(gòu)的藥物時,LLM將實時預(yù)測各類藥物的供需情況,使藥房間的相互調(diào)劑及同城藥物集中配送等環(huán)節(jié)更加高效精準。統(tǒng)籌調(diào)配醫(yī)療資源、提高供需匹配效率、規(guī)范患者就診秩序、促進疾病醫(yī)療服務(wù)均等可及,對于推進國家治理體系與治理能力現(xiàn)代化具有重要意義。
3.5 托底“老少邊窮”地區(qū)基層衛(wèi)生服務(wù),實現(xiàn)跨越式發(fā)展
2020年7月,國家衛(wèi)生健康委員會醫(yī)政醫(yī)管司在《lt;醫(yī)療聯(lián)合體管理辦法(試行)gt;解讀》中強調(diào)[34],要結(jié)合區(qū)域全民健康信息平臺建設(shè),以委屬(管)醫(yī)院、高校附屬醫(yī)院、省直屬醫(yī)院和婦幼保健院等為主要牽頭單位,重點發(fā)展面向邊遠、貧困地區(qū)的遠程醫(yī)療協(xié)作網(wǎng),完善省-地市-縣-鄉(xiāng)-村五級遠程醫(yī)療服務(wù)網(wǎng)絡(luò)?!袄仙龠吀F”地區(qū)醫(yī)療衛(wèi)生事業(yè)的發(fā)展與其他地區(qū)仍然存在差距[35],醫(yī)療衛(wèi)生經(jīng)費投入不足、醫(yī)療衛(wèi)生設(shè)施設(shè)備不健全、人才技術(shù)缺乏等成為長期制約民族地區(qū)醫(yī)療衛(wèi)生事業(yè)發(fā)展的幾大因素。與此同時,人口老齡化,疾病譜從傳染病轉(zhuǎn)向慢性病,醫(yī)療衛(wèi)生服務(wù)在城鄉(xiāng)之間、區(qū)域之間發(fā)展不平衡等問題不斷凸顯[36]。LLM技術(shù)將很大程度解決基層醫(yī)生經(jīng)驗不足的問題,改善人員短缺問題。通過全面掌握當(dāng)?shù)鼐用窠】禒顩r,智能調(diào)整藥品儲備與配送,進一步解決缺醫(yī)少藥難題。進一步擴大遠程醫(yī)療技術(shù)的普及和使用范圍、使用頻率,為偏遠貧困地區(qū)的居民提供全時段、高質(zhì)量的便捷醫(yī)療保障[37]。在國家大力推動下,啟動實施大學(xué)生鄉(xiāng)村醫(yī)生專項計劃,歷史性實現(xiàn)了編制資源向鄉(xiāng)村醫(yī)生開放[2],年輕的血液與LLM技術(shù)相結(jié)合,將為該地區(qū)的基層衛(wèi)生服務(wù)帶來巨大變革。
4 LLM應(yīng)用中的倫理與責(zé)任問題
將人工智能應(yīng)用于衛(wèi)生和其他領(lǐng)域的主要倫理原則旨在指導(dǎo)開發(fā)者、用戶和監(jiān)管機構(gòu)改進和監(jiān)督此類技術(shù)的設(shè)計和使用。人的尊嚴和人的內(nèi)在價值是所有其他倫理原則所依據(jù)的核心價值。倫理原則對于所有利益相關(guān)方,包括臨床醫(yī)生、系統(tǒng)開發(fā)人員、衛(wèi)生系統(tǒng)管理者與決策者、地方和國家行政部門都很重要,應(yīng)鼓勵和協(xié)助行政部門和公共部門機構(gòu)通過立法和監(jiān)管跟上人工智能技術(shù)的快速發(fā)展,并應(yīng)使醫(yī)療專業(yè)人員能夠適當(dāng)?shù)厥褂萌斯ぶ悄芗夹g(shù)。倫理原則也應(yīng)嵌入人工智能的專業(yè)和技術(shù)標(biāo)準[38]。
從法律角度來看,人工智能缺乏人類的法律地位,使用LLM的醫(yī)務(wù)人員和醫(yī)院需要接受培訓(xùn),因此對其使用負有最終責(zé)任[39],然而在患者受到傷害的情況下確定法律責(zé)任是復(fù)雜的問題,患者、醫(yī)院和醫(yī)生、LLM三者間責(zé)任非常模糊,需要明確的法規(guī)和法律限制來適當(dāng)分配責(zé)任和保護用戶[40-41]。有些LLM提供誤導(dǎo)性或潛在危險的建議,這凸顯了在臨床環(huán)境中謹慎采用的必要性;盡管如此,LLM仍有望為醫(yī)療保健帶來變革[42]。如果規(guī)定因醫(yī)療保健提供者依賴人工智能技術(shù)的結(jié)論被證明是錯誤的而對其進行處罰,那么其可能僅使用該技術(shù)來確認自己的判斷,雖然這可能使其免于承擔(dān)責(zé)任,但會阻礙人工智能最大潛力的開發(fā)利用,LLM應(yīng)該用來增強而不僅是驗證人類的判斷[43]。如果醫(yī)生不因為依賴LLM技術(shù)而受到懲罰,即使LLM建議與自己的臨床判斷背道而馳,醫(yī)生可能會被鼓勵更廣泛地使用這些技術(shù)來改善患者護理,或者至少可以考慮使用LLM來挑戰(zhàn)自己的假設(shè)和結(jié)論[43]。故在LLM得到完全發(fā)展的情況下,明確責(zé)任歸屬能全面地發(fā)揮其價值。對于隱私和監(jiān)管問題,LLM仍存在損害患者隱私的固有風(fēng)險,人工智能的監(jiān)管體系仍在完善,更嚴格的監(jiān)管機制仍有待開發(fā)[40]。
5 LLM在基層醫(yī)療衛(wèi)生服務(wù)中的挑戰(zhàn)與展望
隨著技術(shù)的高速發(fā)展與迭代,LLM在基層醫(yī)療衛(wèi)生服務(wù)領(lǐng)域的應(yīng)用更加深入,為解決當(dāng)下重點、難點問題提供了可能性。但目前LLM在基層醫(yī)療衛(wèi)生服務(wù)的應(yīng)用中也面臨著以下挑戰(zhàn):
首先,缺乏復(fù)合型人才。LLM在基層醫(yī)療衛(wèi)生系統(tǒng)中的發(fā)展需要更多生物醫(yī)學(xué)工程人才、醫(yī)工交叉人才參與研究與開發(fā),才能充分挖掘LLM的應(yīng)用潛能,并將其有效地集成到醫(yī)療工作當(dāng)中,滿足基層醫(yī)療系統(tǒng)需求。
其次,模型精度問題。LLM依靠選定的數(shù)據(jù)集進行訓(xùn)練與分析,數(shù)據(jù)集的建立由研究人員選定與編制。要保證高質(zhì)量的訓(xùn)練數(shù)據(jù)、適合的模型設(shè)計和選擇、持續(xù)的模型優(yōu)化和驗證以及專業(yè)的臨床理解,數(shù)據(jù)的代表性、數(shù)據(jù)質(zhì)量以及泛化能力需要經(jīng)過驗證。
再次,LLM可以在醫(yī)療決策中幫助患者追求治療效益最大化,但易忽略患者對人文關(guān)懷的需求[44],且在模型的創(chuàng)建和使用中會體現(xiàn)出與人類價值觀的不一
致[45]。LLM技術(shù)的發(fā)展與試用不可使基層醫(yī)務(wù)人員放松職責(zé),醫(yī)務(wù)人員也不可完全依賴LLM技術(shù)而忽略其局限性。要把握人工智能輸出結(jié)果的優(yōu)點與局限性,配套投資支持用于教育醫(yī)生如何正確處理來自LLM設(shè)備的數(shù)據(jù)[29]。
最后,居民對智能設(shè)備的接受程度存在差異?;颊邔τ谛滦头?wù)模式的接受程度受年齡、性別、地區(qū)以及對慢性病知識了解程度等因素的影響[46]。人機交互的模式要更便利地服務(wù)老年患者。LLM智能終端要能夠準確理解用戶的指令并順利執(zhí)行,包括老年患者可能存在的方言、口齒不清等問題,避免產(chǎn)生歧義,導(dǎo)致錯誤診斷和建議。
6 結(jié)論
人工智能和LLM技術(shù)在我國基層醫(yī)療衛(wèi)生服務(wù)中有很好的應(yīng)用前景。當(dāng)下要抓住機遇,開展“LLM+健康中國”建設(shè),深化醫(yī)療大模型研發(fā)和應(yīng)用,推動慢性病防控數(shù)智化,激發(fā)全科醫(yī)學(xué)的飛躍性發(fā)展,推進LLM在全科診療與基層衛(wèi)生服務(wù)中的產(chǎn)業(yè)化,為醫(yī)療衛(wèi)生服務(wù)的“最后一公里”與基本公共衛(wèi)生服務(wù)帶來歷史性變革,彌補衛(wèi)生人力短缺與配置不公平問題,為實現(xiàn)健康公平提供跨越式的手段,助力健康中國藍圖的早日實現(xiàn)。
作者貢獻:閆溫馨、胡健負責(zé)查閱文獻、論文撰寫與修改;曾華堂負責(zé)論文修改;劉民、梁萬年負責(zé)質(zhì)量控制、論文指導(dǎo)與審校,對文章整體負責(zé)。
本文無利益沖突。
參考文獻
國家數(shù)據(jù)局.專家解讀 | 發(fā)揮“數(shù)據(jù)要素×”效應(yīng) 構(gòu)建以數(shù)據(jù)為關(guān)鍵要素的數(shù)字經(jīng)濟[EB/OL]. (2024-06-07)[2024-06-21]. https://www.ndrc.gov.cn/xwdt/ztzl/szjj/zcjd/202406/t20240607_1386751.html.
國務(wù)院辦公廳.國務(wù)院辦公廳關(guān)于印發(fā)《深化醫(yī)藥衛(wèi)生體制改革2024年重點工作任務(wù)》的通知[EB/OL]. (2024-06-07)[2024-06-21]. https://www.gov.cn/zhengce/content/202406/content_6955904.htm.
SINGHAL K,TU T,GOTTWEIS J,et al. Towards expert-level medical question answering with large language models[EB/OL].(2023-05-16) [2024-06-21]. http://arxiv.org/abs/2305.09617.
LI C Y,WONG C,ZHANG S,et al. LLaVA-med:training a large language-and-vision assistant for biomedicine in one day[EB/OL]. (2023-06-01) [2024-06-21]. http://arxiv.org/abs/2306.00890.
HE K,MAO R,LIN Q K,et al. A survey of large language models for healthcare:from data, technology,and applications to accountability and ethics[EB/OL]. (2023-10-09) [2024-06-21]." http://arxiv.org/abs/2310.05694.
劉學(xué)博,戶保田,陳科海,等. 大模型關(guān)鍵技術(shù)與未來發(fā)展方向——從ChatGPT談起[J]. 中國科學(xué)基金,2023,37(5):758-766. DOI:10.16262/j.cnki.1000-8217.20231026.004.
中華人民共和國國家衛(wèi)生健康委員會.國家衛(wèi)生健康委員會2024年6月18日新聞發(fā)布會文字實錄[EB/OL].(2024-06-18)[2024-06-21]. http://www.nhc.gov.cn/xcs/s3574/202406/22afc864fc484386b4ab047c7e68f144.shtml.
高和榮. 健康治理與中國分級診療制度[J]. 公共管理學(xué)報,2017,14(2):139-144.
施建華,顧慧寧,錢夢岑,等. 基層醫(yī)療衛(wèi)生機構(gòu)公共衛(wèi)生服務(wù)工作量趨勢變化與分析[J]. 中國全科醫(yī)學(xué),2020,23(34):4291-4297. DOI:10.12114/j.issn.1007-9572.2020.00.480.
袁天蔚,阮梅花,朱成姝,等. 2023年慢性病防控領(lǐng)域發(fā)展態(tài)勢[J]. 生命科學(xué),2024,36(1):30-38. DOI:10.13376/j.cbls/2024005.
吳卓存,張重陽,胡紅濮,等. 基于數(shù)據(jù)整合模式的基層醫(yī)療衛(wèi)生機構(gòu)智能報表填寫模型構(gòu)建路徑研究[J]. 醫(yī)學(xué)信息學(xué)雜志,2024,45(5):32-39.
億歐智庫. 2020中國服務(wù)機器人產(chǎn)業(yè)發(fā)展研究報告解析[J]. 機器人產(chǎn)業(yè),2020(4):83-100. DOI:10.3969/j.issn.2096-0182.2020.04.017.
中華人民共和國國家衛(wèi)生健康委員會. 2023年1-11月全國醫(yī)療服務(wù)情況[EB/OL]. (2024-06-11)[2024-06-21]. http://www.nhc.gov.cn/mohwsbwstjxxzx/s7967/202405/55c7779da4734fc5a60d3cffae1822ef.shtml.
梁萬年,劉玨. 構(gòu)建中國全科醫(yī)生學(xué)術(shù)共同體,促進全科醫(yī)學(xué)學(xué)科高質(zhì)量發(fā)展[J]. 中國全科醫(yī)學(xué),2024,27(25):前插. DOI:10.12114/j.issn.1007-9572.2024.A0018.
梁萬年. 科學(xué)研究是我國全科醫(yī)學(xué)發(fā)展的應(yīng)有之義和當(dāng)務(wù)之急[J]. 中國全科醫(yī)學(xué),2024,27(1):前插.
王玥,宋雅鑫,王藝霏,等. 衛(wèi)生領(lǐng)域人工智能的倫理與治理:多模態(tài)大模型指南[J]. 中國醫(yī)學(xué)倫理學(xué),2024:1-58.
ANDREW A. Potential applications and implications of large language models in primary care[J]. Fam Med Community Health,2024,12(suppl 1):e002602.
MENG X B,YAN X Y,ZHANG K,et al. The application of large language models in medicine: a scoping review[J]. iScience,2024,27(5):109713. DOI:10.1016/j.isci.2024.109713.
CASCELLA M,MONTOMOLI J,BELLINI V,et al. Evaluating the feasibility of ChatGPT in healthcare: an analysis of multiple clinical and research scenarios[J]. J Med Syst,2023,47(1):33. DOI:10.1007/s10916-023-01925-4.
Nature Advertisement. Nature. Spearheading a new age of medical intelligence[EB/OL]. (2024-07-02)[2024-08-02]. https://www.nature.com/articles/d42473-021-00188-2.
SCHUERGER C,VENKATRAM V,QUINN K. China and medical AI[J]. Center for Security and Emerging Technology,2024.
張宗久,焦雅輝,高光明. 醫(yī)療服務(wù)的最后一公里:基層衛(wèi)生健康體系現(xiàn)狀與發(fā)展策略[M]. 北京:清華大學(xué)出版社,2022.
TOPOL E. Deep medicine :how artificial intelligence can make healthcare human again[M]. New York:Basic Books,2019.
JO E,EPSTEIN D A,JUNG H,et al. Understanding the benefits and challenges of deploying conversational AI leveraging large language models for public health intervention[C]//Proceedings of the 2023 CHI Conference on Human Factors in Computing Systems. Hamburg Germany. ACM,2023. DOI:10.1145/3544548.3581503.
SPINEWINE A,EVRARD P,HUGHES C. Interventions to optimize medication use in nursing homes:a narrative review[J]. Eur Geriatr Med,2021,12(3):551-567. DOI:10.1007/s41999-021-00477-5.
COSENTINO J,BELYAEVA A,LIU X,et al. Towards a personal health large language model[EB/OL]. (2024-06-10)[2024-08-02]. http://arxiv.org/abs/2406.06474.
MERRILL M A,PARUCHURI A,REZAEI N,et al. Transforming Wearable Data into Health Insights using Large Language Model Agents[EB/OL]. (2024-06-10)[2024-08-02]. http://arxiv.org/abs/2406.06464.
SACKETT C,HARPER D,PAVEZ A. Do we dare use generative AI for mental health?[J]. IEEE Spectr,2024,61(6):42-47. DOI:10.1109/MSPEC.2024.10551790.
GINSBURG G S,PICARD R W,F(xiàn)RIEND S H. Key issues as wearable digital health technologies enter clinical care[J]. N Engl J Med,2024,390(12):1118-1127.
閆溫馨,劉玨. 中文版以人為本的基層衛(wèi)生服務(wù)量表的信效度驗證[J]. 中國全科醫(yī)學(xué),2022,25(25):3135-3142.
KHAN M,KHURSHID M,VATSA M,et al. On AI approaches for promoting maternal and neonatal health in low resource settings: a review[J]. Front Public Health,2022,10:880034.
YUAN M Z,BAO P,YUAN J J,et al. Large language models illuminate a progressive pathway to artificial intelligent healthcare assistant[J]. Med Plus,2024,1(2):100030.
傅利平,王奕輝,徐小鳳,等. 健康需求與協(xié)同治理:分級診療制度建設(shè)實踐邏輯——基于公共價值視角的扎根理論分析[J]. 公共管理學(xué)報,2024,21(3):111-123. DOI:10.16149/j.cnki.23-1523.20240604.001.
醫(yī)政醫(yī)管局.《醫(yī)療聯(lián)合體管理辦法(試行)》解讀" " " " " " " " " " [EB/OL]. (2024-06-06)[2024-08-02]. http://www.nhc.gov.cn/yzygj/s3594r/202007/0f58f93e3f5a4a26ab9079f78bf2dca5.shtml.
王延中,方勇, 丁賽,等. 中國民族發(fā)展報告(2020)[M]. 北京: 社會科學(xué)文獻出版社,2020.
方靜文. 援助、互助與共融:1949年以來民族地區(qū)醫(yī)療衛(wèi)生事業(yè)的發(fā)展[J]. 北方民族大學(xué)學(xué)報,2021(2):80-88.
EISENSTEIN E,KOPACEK C,CAVALCANTE S S,et al. Telemedicine:a bridge over knowledge gaps in healthcare[J]. Curr Pediatr Rep,2020,8(3):93-98.
Ethics and governance of artificial intelligence for health:WHO guidance[M]. Geneva:World Health Organization,2021.
ZHANG J,ZHANG Z M. Ethics and governance of trustworthy medical artificial intelligence[J]. BMC Med Inform Decis Mak,2023,23(1):7. DOI:10.1186/s12911-023-02103-9.
GOODMAN R S,PATRINELY J R,OSTERMAN T,et al. On the cusp: considering the impact of artificial intelligence language models in healthcare[J]. Med,2023,4(3):139-140.
WANG C Y,LIU S R,YANG H,et al. Ethical considerations of using ChatGPT in health care[J]. J Med Internet Res,2023,25:e48009. DOI:10.2196/48009.
SHAH N H,ENTWISTLE D,PFEFFER M A. Creation and adoption of large language models in medicine[J]. JAMA,2023,330(9):866-869. DOI:10.1001/jama.2023.14217.
PRICE W N 2nd,GERKE S,COHEN I G. Potential liability for physicians using artificial intelligence[J]. JAMA,2019,322(18):1765-1766. DOI:10.1001/jama.2019.15064.
PLOUG T,HOLM S. The right to refuse diagnostics and treatment planning by artificial intelligence[J]. Med Health Care Philos,2020,23(1):107-114. DOI:10.1007/s11019-019-09912-8.
YU K H,HEALEY E,LEONG T Y,et al. Medical artificial intelligence and human values[J]. N Engl J Med,2024,390(20):1895-1904. DOI:10.1056/NEJMra2214183.
沈勤,徐越. 老年人參與“互聯(lián)網(wǎng)+慢性病管理”意愿影響因素分析——基于Anderson健康行為模型的實證研究[J]. 衛(wèi)生經(jīng)濟研究,2020,37(1):45-48. DOI:10.14055/j.cnki.33-1056/f.2020.01.014.
(收稿日期:2024-08-02;修回日期:2024-09-03)
(本文編輯:李婷婷)