馬武仁 弓孟春 戴 輝 黃 婧 王斌斌 史文釗
(1神州醫(yī)療科技股份有限公司 北京 100080 2南方醫(yī)科大學(xué)衛(wèi)生與健康管理研究所 廣州 510515 3 南方醫(yī)科大學(xué)南方醫(yī)院贛州醫(yī)院 贛州 341099 4空軍軍醫(yī)大學(xué)唐都醫(yī)院 西安 710038 5 南方醫(yī)科大學(xué)南方醫(yī)院 廣州 510515)
大語(yǔ)言模型(large language models,LLMs)是由具有大量參數(shù)(通常為數(shù)十億或更多權(quán)重)的神經(jīng)網(wǎng)絡(luò)組成的語(yǔ)言模型,由多層神經(jīng)元組成,第1層將一系列單詞作為輸入,每個(gè)后續(xù)層處理前一層輸出。最后一層輸出是模型對(duì)輸入最可能的含義或解釋的預(yù)測(cè)。LLMs使用自監(jiān)督學(xué)習(xí)對(duì)大量未標(biāo)記文本進(jìn)行訓(xùn)練,可以根據(jù)從海量數(shù)據(jù)集中吸收的知識(shí),高準(zhǔn)確度識(shí)別、總結(jié)、翻譯、預(yù)測(cè)和生成文本及其他內(nèi)容。LLMs在2018年左右出現(xiàn),并在各種任務(wù)中表現(xiàn)出色[1]。在人工智能(artificial intelligence,AI)越來(lái)越多地應(yīng)用于臨床診療的時(shí)代背景下,總結(jié)闡釋LLMs在臨床中的應(yīng)用及其對(duì)醫(yī)患雙方的影響極為必要。
聊天生成預(yù)訓(xùn)練轉(zhuǎn)換器(chat generative pre-trained transformer,ChatGPT)是美國(guó)開(kāi)放人工智能(OpenAI)實(shí)驗(yàn)室于2022年11月30日發(fā)布的一種AI技術(shù)驅(qū)動(dòng)的聊天機(jī)器人模型,通過(guò)使用生成式預(yù)訓(xùn)練轉(zhuǎn)換器3.5(generative pre-trained transformer-3.5,GPT-3.5)模型提供流暢、自然的與人類幾乎沒(méi)有差異的響應(yīng)[2]。
ChatGPT取得如此效果,核心原因之一是其基于大規(guī)模生成式預(yù)訓(xùn)練模型GPT-3.5構(gòu)建,這是當(dāng)前自然語(yǔ)言理解領(lǐng)域最好的文本生成模型(GPT-3.5比GPT-3使用更多數(shù)據(jù)和更大模型,具有更好效果)。GPT系列模型的核心是轉(zhuǎn)換器模型,即一種用于序列到序列學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。轉(zhuǎn)換器中引入多頭自注意力機(jī)制,通過(guò)計(jì)算輸入序列中各位置之間的相對(duì)關(guān)系,實(shí)現(xiàn)序列中不同位置的信息交互。多個(gè)注意力頭分別關(guān)注句子中多個(gè)方面重點(diǎn),而且通過(guò)增加網(wǎng)絡(luò)層次,能夠提取更高級(jí)且抽象的語(yǔ)義信息,因而獲得更強(qiáng)的理解能力?;谵D(zhuǎn)換器的語(yǔ)言模型除具有強(qiáng)大的語(yǔ)義提取能力外,還能進(jìn)行無(wú)監(jiān)督學(xué)習(xí),具有良好的場(chǎng)景遷移能力。
賦能ChatGPT的另一大關(guān)鍵技術(shù)是人類反饋的強(qiáng)化學(xué)習(xí)技術(shù)(reinforcement learning from human feedback,RLHF)[3]。由于OpenAI沒(méi)有公開(kāi)發(fā)表的ChatGPT論文,也沒(méi)有公開(kāi)代碼[4],外界普遍認(rèn)為其與之前公開(kāi)發(fā)表的指令生成預(yù)訓(xùn)練轉(zhuǎn)換器(instruct generative pre-trained transformer,InstructGPT)中披露的技術(shù)最為相近[5]。InstructGPT的技術(shù)步驟如下[6]:第1步,收集用戶對(duì)同一問(wèn)題不同答案的偏好;第2步,利用第1步的偏好數(shù)據(jù)重新訓(xùn)練,基于監(jiān)督信息精調(diào)GPT模型;第3步,根據(jù)用戶對(duì)不同答案的偏好訓(xùn)練打分函數(shù),對(duì)ChatGPT的答案打分,分?jǐn)?shù)高低體現(xiàn)出用戶對(duì)不同答案偏好程度的高低;第4步,利用打分函數(shù)作為反饋對(duì)學(xué)習(xí)模型進(jìn)行訓(xùn)練強(qiáng)化,使ChatGPT最終輸出用戶更偏好和喜歡的答案。通過(guò)上述步驟,ChatGPT針對(duì)用戶輸入,能夠輸出用戶友好的答案。
上下文學(xué)習(xí)[7]是目前大語(yǔ)言模型都在全力攻克的重點(diǎn),對(duì)ChatGPT沒(méi)有處理過(guò)的新任務(wù),只需設(shè)計(jì)任務(wù)的語(yǔ)言描述,并給出幾個(gè)任務(wù)實(shí)例輸入模型,即可讓模型從給定的情景中學(xué)習(xí)新任務(wù)并給出滿意回答。這種訓(xùn)練方式還能夠有效提升模型小樣本學(xué)習(xí)能力。ChatGPT還可以利用思維鏈(chain-of-thought,CoT)進(jìn)行復(fù)雜推理[8]。對(duì)于一些邏輯較復(fù)雜的問(wèn)題,直接向ChatGPT模型提問(wèn)可能不會(huì)得到準(zhǔn)確回答,但如果通過(guò)提示的方式在輸入中給出有邏輯的解題步驟(即將復(fù)雜問(wèn)題拆解為多個(gè)子問(wèn)題)的示例后再提出問(wèn)題,則能給出正確回答。
目前已公開(kāi)發(fā)布的重要LLMs參數(shù)數(shù)量差異極大,但在醫(yī)學(xué)任務(wù)上測(cè)試(以PubMedQA數(shù)據(jù)集為例)普遍取得了不錯(cuò)的成績(jī)[3,9]。指令提示微調(diào)以及增大模型參數(shù)量能夠顯著提升LLMs的理解力、知識(shí)召回和推理能力,提示LLMs在臨床領(lǐng)域具備發(fā)揮關(guān)鍵作用的潛力[10]。
ChatGPT可以與患者進(jìn)行對(duì)話,詢問(wèn)關(guān)于癥狀、疼痛程度、病史等方面的問(wèn)題,比人類更快地從多個(gè)來(lái)源收集、分類和整合臨床信息[11],醫(yī)生可以更全面地了解患者情況,為之后的診斷和治療提供基礎(chǔ)。ChatGPT還可以提供最新的研究、臨床指南或醫(yī)學(xué)文獻(xiàn)摘要,幫助醫(yī)生作出準(zhǔn)確評(píng)估。
臨床文本構(gòu)成占據(jù)醫(yī)生工作很大一部分比例,醫(yī)生可能需要花費(fèi)多達(dá)35%的工作時(shí)間撰寫(xiě)和查看患者診療記錄[12]。臨床文本撰寫(xiě)與醫(yī)生的過(guò)度疲勞[13]、認(rèn)知負(fù)荷增加[14]、焦慮[15]等不良狀態(tài)相關(guān)。實(shí)現(xiàn)撰寫(xiě)自動(dòng)化將極大降低醫(yī)生負(fù)擔(dān)。結(jié)合語(yǔ)音識(shí)別技術(shù),ChatGPT有潛力實(shí)現(xiàn)診療全過(guò)程所需所有臨床文本的自動(dòng)化生成[16-17]。
有研究表明,通過(guò)傳統(tǒng)方式撰寫(xiě)的出院小結(jié)往往會(huì)遺漏細(xì)節(jié)[18],ChatGPT有望改變這一現(xiàn)狀[19]。ChatGPT允許醫(yī)生輸入任務(wù)簡(jiǎn)要說(shuō)明、概念詳細(xì)說(shuō)明和指導(dǎo)解釋,可在數(shù)秒內(nèi)輸出一份正式的出院小結(jié)。這一過(guò)程的自動(dòng)化可以減輕初級(jí)醫(yī)生的工作負(fù)擔(dān),使其有更多時(shí)間照護(hù)患者。
ChatGPT可以基于循證醫(yī)學(xué)的患者/問(wèn)題、干預(yù)措施、比較措施和結(jié)局(patient/problem,intervention,comparison,and outcome,PICO)輔助臨床決策[20]。ChatGPT可以獲得患者醫(yī)療記錄和病歷數(shù)據(jù)并據(jù)此進(jìn)行分析。醫(yī)生將病例關(guān)鍵信息輸入ChatGPT,如實(shí)驗(yàn)室檢查結(jié)果、影像學(xué)報(bào)告和病理學(xué)結(jié)果。ChatGPT可以幫助解釋數(shù)據(jù)[21-23],并提供可能的診斷和進(jìn)一步檢查建議[24]。已有研究[25]表明ChatGPT可用于分析可能會(huì)在阿爾茨海默病早期階段發(fā)生變化的言語(yǔ)和寫(xiě)作的語(yǔ)言模式,基于此有可能實(shí)現(xiàn)癡呆癥的早期診斷。Rao A S等[26]通過(guò)為乳腺癌篩查和乳房疼痛確定適當(dāng)?shù)挠跋駥W(xué)檢查項(xiàng)目,評(píng)估ChatGPT在放射學(xué)臨床決策支持方面的能力,結(jié)果表明使用ChatGPT進(jìn)行影像學(xué)決策具有可行性,有可能改善臨床工作流程,有助于更準(zhǔn)確使用影像學(xué)服務(wù)。
這個(gè)國(guó)家的命運(yùn)與其說(shuō)掌握在當(dāng)權(quán)者手中,不如說(shuō)掌握在母親手中?!凹彝ナ莾和邮芙逃闹饕獔?chǎng)所。兒童的社交生活技能和禮儀知識(shí)始于家庭,因此家庭教育至關(guān)重要。父母是孩子的第一任老師,也是孩子的鏡子。因此,孩子們應(yīng)該發(fā)揮榜樣作用,營(yíng)造良好的禮儀氛圍,糾正他們的生活方式,關(guān)注他們自己的形象,練習(xí)禮儀規(guī)范。父母從小就教他們的孩子禮儀知識(shí),教他們禮貌和理解禮儀,禮貌待人,謙虛和禮讓,養(yǎng)成良好的禮儀習(xí)慣。一個(gè)孩子在家庭環(huán)境中接受了良好的禮儀教育,肯定會(huì)對(duì)他未來(lái)的性格和修養(yǎng)產(chǎn)生積極的影響,所以家庭禮儀教育不容忽視。
基于診斷結(jié)果,ChatGPT可以提供特定治療藥物信息,包括適應(yīng)癥、劑量、不良反應(yīng)、藥物相互作用以及藥物數(shù)據(jù)庫(kù)和藥物指南,幫助醫(yī)生選擇治療藥物[27]。ChatGPT可以提供常見(jiàn)治療選項(xiàng)供醫(yī)生選擇[28],并解釋每種干預(yù)措施的作用、機(jī)制、安全性和效果。此外還可以提供特定疾病預(yù)后的信息和統(tǒng)計(jì)數(shù)據(jù)(如治愈率、生存率、并發(fā)癥風(fēng)險(xiǎn))等信息,幫助醫(yī)生與患者共同評(píng)估治療方案預(yù)期效果。醫(yī)生可以與ChatGPT討論不同治療方案,包括藥物治療、手術(shù)干預(yù)[29]、放療[30]、化療[31]等,ChatGPT提供不同治療方案的優(yōu)勢(shì)、風(fēng)險(xiǎn)和效果評(píng)估,幫助醫(yī)生與患者共同決定最優(yōu)方案[32]。
ChatGPT在臨床中的另一個(gè)潛在用途是為患者制定個(gè)性化治療方案[33]。ChatGPT可為患者創(chuàng)建虛擬助手,根據(jù)患者病史、當(dāng)前癥狀和其他相關(guān)因素提供個(gè)性化建議。例如,虛擬助手可以為普通感冒或流感患者推薦非處方藥或家庭療法?;颊呖梢酝ㄟ^(guò)各種平臺(tái)訪問(wèn)虛擬助手,如網(wǎng)站、移動(dòng)應(yīng)用程序、語(yǔ)音助手等。這對(duì)居住在偏遠(yuǎn)地區(qū)或醫(yī)療資源不發(fā)達(dá)地區(qū)的患者尤其有幫助,其無(wú)須去醫(yī)院就診即可獲得個(gè)性化診療建議。
通過(guò)分析患者相關(guān)診療數(shù)據(jù),基于ChatGPT的系統(tǒng)可以生成滿足患者特定需求和偏好的個(gè)性化治療方案。這對(duì)需要特殊護(hù)理的復(fù)雜或罕見(jiàn)疾病患者尤其有幫助。例如,ChatGPT系統(tǒng)可根據(jù)患者病史和其他因素推薦最有可能對(duì)其有效的藥物或療法的特定組合。這可以幫助降低不良反應(yīng)或其他并發(fā)癥風(fēng)險(xiǎn),并確保患者得到最適合的護(hù)理。
患者可能有關(guān)于病情、治療方法、藥物副作用等方面的疑問(wèn),ChatGPT可以回答這些問(wèn)題[32],解釋對(duì)患者來(lái)說(shuō)晦澀難懂的醫(yī)學(xué)術(shù)語(yǔ)含義,使其更容易理解醫(yī)生的診斷和建議[34]。醫(yī)生在診療過(guò)程中可能無(wú)法詳細(xì)解釋所有細(xì)節(jié),ChatGPT可以提供補(bǔ)充信息,例如疾病常見(jiàn)癥狀、治療備選方案等,以幫助患者作出更加知情的決策。ChatGPT還可以向患者提供健康教育[35]和康復(fù)指導(dǎo)[29],幫助患者更好地管理康復(fù)過(guò)程,加速康復(fù)進(jìn)程。醫(yī)患共同決策對(duì)患者滿意度和治療結(jié)果非常重要,ChatGPT可以提供有關(guān)治療選項(xiàng)、風(fēng)險(xiǎn)和益處的信息,幫助患者更好地參與決策過(guò)程[36]。
患者在疾病治療過(guò)程中可能會(huì)感到焦慮、恐懼或沮喪[37],ChatGPT可以提供情感支持,傾聽(tīng)患者情緒,并提供鼓勵(lì)和安慰[38]。提供關(guān)于不同類型的心理疾病(如抑郁癥、焦慮癥等)的疏導(dǎo),分享情緒調(diào)節(jié)和應(yīng)對(duì)策略[39],幫助患者和家屬應(yīng)對(duì)焦慮、抑郁、情緒波動(dòng)等困擾。還可以提供關(guān)于心理治療和咨詢資源的信息,幫助患者和家屬找到適合的支持和治療。
3.5.1 醫(yī)學(xué)文獻(xiàn)自動(dòng)化閱讀與知識(shí)提取 ChatGPT可以實(shí)現(xiàn)醫(yī)學(xué)文獻(xiàn)自動(dòng)化閱讀與知識(shí)提取[40],讀取醫(yī)學(xué)文獻(xiàn)生成簡(jiǎn)潔的摘要,概括文獻(xiàn)主要內(nèi)容,幫助研究人員快速了解文獻(xiàn)要點(diǎn),節(jié)省閱讀時(shí)間。ChatGPT可以根據(jù)用戶提出的問(wèn)題,從醫(yī)學(xué)文獻(xiàn)中提取相關(guān)知識(shí),并給出答案[41],幫助研究人員和臨床醫(yī)生快速查找和利用醫(yī)學(xué)文獻(xiàn)中的知識(shí)[42]。
3.5.2 構(gòu)建知識(shí)圖譜或網(wǎng)絡(luò) ChatGPT可以分析醫(yī)學(xué)文獻(xiàn)中的實(shí)體及其關(guān)系,構(gòu)建知識(shí)圖譜或網(wǎng)絡(luò)[43]。這種網(wǎng)絡(luò)分析可以揭示不同實(shí)體之間的相互作用和關(guān)聯(lián),幫助研究人員發(fā)現(xiàn)新的關(guān)聯(lián)和趨勢(shì)。作為交互式文獻(xiàn)檢索工具,根據(jù)用戶提供的查詢條件,快速檢索并篩選出相關(guān)醫(yī)學(xué)文獻(xiàn),幫助研究人員快速找到感興趣的文獻(xiàn),減少信息過(guò)載[44]。
3.5.3 其他輔助應(yīng)用 ChatGPT可以輔助研究人員制定實(shí)驗(yàn)設(shè)計(jì)和數(shù)據(jù)分析方法[45],提供關(guān)于實(shí)驗(yàn)設(shè)計(jì)、樣本量計(jì)算、統(tǒng)計(jì)方法等方面的建議,幫助研究人員制定合理的實(shí)驗(yàn)方案和數(shù)據(jù)分析策略。幫助解釋和解讀實(shí)驗(yàn)結(jié)果,討論數(shù)據(jù)的可靠性、顯著性和實(shí)際意義,并提供數(shù)據(jù)可視化建議[46]。還可以在科研論文撰寫(xiě)過(guò)程中提供多方面輔助[47],例如提供思路和靈感、優(yōu)化結(jié)構(gòu)和邏輯、提供語(yǔ)言和表達(dá)建議、輔助文獻(xiàn)引用和參考文獻(xiàn)、檢查和改進(jìn)論文質(zhì)量等。
AI技術(shù)能夠極大推動(dòng)醫(yī)學(xué)教育創(chuàng)新[51],結(jié)合ChatGPT和元宇宙、虛擬現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)等技術(shù)[52],創(chuàng)造沉浸式醫(yī)學(xué)教育體驗(yàn)。學(xué)生可以通過(guò)虛擬場(chǎng)景模擬實(shí)際醫(yī)學(xué)操作和病例處理,與虛擬患者[53]進(jìn)行交互,進(jìn)行實(shí)時(shí)醫(yī)學(xué)實(shí)踐訓(xùn)練和決策演練。ChatGPT在這一過(guò)程中作為學(xué)生的虛擬導(dǎo)師[54],提供指導(dǎo)、反饋和疑問(wèn)解答,提升學(xué)生的學(xué)習(xí)效果和實(shí)踐能力。
3.7.1 自動(dòng)化分析和調(diào)配醫(yī)院資源 ChatGPT通過(guò)自動(dòng)化分析和調(diào)配醫(yī)院資源,實(shí)現(xiàn)醫(yī)療資源合理配置和優(yōu)化利用[55]。幫助醫(yī)院預(yù)測(cè)患者流量、診斷和治療需求以及人員和設(shè)備需求。通過(guò)預(yù)測(cè)和優(yōu)化,提高工作效率、減少等候時(shí)間,并優(yōu)化醫(yī)療服務(wù)質(zhì)量和成本效益。
3.7.2 傳染病監(jiān)測(cè)和預(yù)測(cè) 通過(guò)對(duì)大數(shù)據(jù)自動(dòng)化分析和處理,ChatGPT可以輔助進(jìn)行傳染病監(jiān)測(cè)和預(yù)測(cè)[56],幫助監(jiān)測(cè)疾病傳播趨勢(shì)、風(fēng)險(xiǎn)區(qū)域,并提供科學(xué)依據(jù)用于傳染病防控決策。挖掘數(shù)據(jù)中的關(guān)聯(lián)性和規(guī)律性,輔助制定具有針對(duì)性的干預(yù)措施,預(yù)測(cè)發(fā)展趨勢(shì),并優(yōu)化資源分配[57]。
3.7.3 跟蹤和改善醫(yī)療質(zhì)量 基于醫(yī)療質(zhì)量監(jiān)測(cè)和管理,ChatGPT可以提高醫(yī)療服務(wù)質(zhì)量和安全性[32]。分析醫(yī)療數(shù)據(jù),識(shí)別潛在的質(zhì)量問(wèn)題和風(fēng)險(xiǎn)因素,并提供決策支持用于改進(jìn)醫(yī)療流程和標(biāo)準(zhǔn)。通過(guò)自動(dòng)化質(zhì)量監(jiān)測(cè)和反饋,幫助醫(yī)院和衛(wèi)生系統(tǒng)實(shí)時(shí)跟蹤和改善醫(yī)療質(zhì)量,提高患者滿意度和疾病預(yù)后。
3.7.4 監(jiān)測(cè)和管理醫(yī)?;鹗褂们闆r 通過(guò)監(jiān)測(cè)和管理醫(yī)?;鹗褂们闆r,為醫(yī)保政策制定提供科學(xué)依據(jù),通過(guò)分析醫(yī)療數(shù)據(jù)和費(fèi)用數(shù)據(jù),識(shí)別異常和風(fēng)險(xiǎn),幫助發(fā)現(xiàn)醫(yī)療資源的浪費(fèi)和濫用情況[58]。通過(guò)自動(dòng)化監(jiān)測(cè)和管理,幫助控制醫(yī)療費(fèi)用、優(yōu)化醫(yī)療服務(wù)的效益,并支持醫(yī)保政策制定和執(zhí)行。
AI模型需要大樣本訓(xùn)練以提高模型性能[59],其取得巨大成就的領(lǐng)域往往是那些擁有大量數(shù)據(jù)集且可以應(yīng)用更復(fù)雜、更精確算法的領(lǐng)域[60]。但是臨床數(shù)據(jù)收集過(guò)程涉及多個(gè)參與方,數(shù)據(jù)質(zhì)量可能存在差異[61]。醫(yī)生記錄方式、術(shù)語(yǔ)使用和數(shù)據(jù)錄入的準(zhǔn)確性都可能不同,導(dǎo)致數(shù)據(jù)質(zhì)量的不一致性。這可能會(huì)進(jìn)一步導(dǎo)致模型在某些數(shù)據(jù)上表現(xiàn)不佳,或者無(wú)法準(zhǔn)確預(yù)測(cè)某些結(jié)果。不同醫(yī)療機(jī)構(gòu)的數(shù)據(jù)標(biāo)準(zhǔn)和結(jié)構(gòu)存在差異,臨床數(shù)據(jù)標(biāo)準(zhǔn)化程度較低,導(dǎo)致數(shù)據(jù)整合復(fù)雜,限制LLMs在不同數(shù)據(jù)集之間遷移和應(yīng)用。醫(yī)療數(shù)據(jù)包含大量敏感信息,如患者病史和治療方案等,一旦泄露會(huì)給患者精神和心理等造成極大損害[62]。患者知情同意同樣值得關(guān)注,醫(yī)療機(jī)構(gòu)有可能在未獲得患者知情同意的情況下將患者數(shù)據(jù)大規(guī)模用于AI模型訓(xùn)練[63]。因此在醫(yī)療機(jī)構(gòu)層面,數(shù)據(jù)共享受到許多因素限制,其中包括隱私和安全考慮、法律和法規(guī)要求以及醫(yī)療機(jī)構(gòu)間的競(jìng)爭(zhēng)和合規(guī)性問(wèn)題,導(dǎo)致跨機(jī)構(gòu)數(shù)據(jù)共享難以實(shí)現(xiàn)[62]。AI模型更新迭代獲得性能提升往往需要獲得數(shù)據(jù)持續(xù)使用權(quán)限,增加了數(shù)據(jù)可及性的實(shí)現(xiàn)難度。
在臨床應(yīng)用中,LLMs的精度和準(zhǔn)確性對(duì)醫(yī)生和患者至關(guān)重要。然而,LLMs訓(xùn)練數(shù)據(jù)可能存在偏見(jiàn),會(huì)在生成結(jié)果時(shí)產(chǎn)生不準(zhǔn)確或有偏倚的信息。這可能源于數(shù)據(jù)收集過(guò)程中的樣本偏差、注釋錯(cuò)誤或模型在訓(xùn)練過(guò)程中學(xué)到的偏見(jiàn)。在臨床醫(yī)學(xué)中,這種偏見(jiàn)可能導(dǎo)致生成的建議或決策具有潛在風(fēng)險(xiǎn)或不準(zhǔn)確性。AI模型過(guò)擬合[64]同樣導(dǎo)致模型在訓(xùn)練時(shí)取得優(yōu)異性能,但在外部應(yīng)用時(shí)的預(yù)測(cè)結(jié)果差強(qiáng)人意。在醫(yī)療保健領(lǐng)域,模型解釋性非常重要。醫(yī)生和患者需要理解模型的推理過(guò)程和生成結(jié)果的依據(jù)。LLMs被認(rèn)為是黑盒模型,難以解釋其生成結(jié)果的邏輯和依據(jù)[65],這降低了模型生成結(jié)果信任度,并影響其在實(shí)際應(yīng)用中的可靠性和可接受性。
醫(yī)療領(lǐng)域具有高度復(fù)雜性和專業(yè)性,需要深入的醫(yī)學(xué)知識(shí)和專業(yè)判斷。大語(yǔ)言模型可能在通用的語(yǔ)言理解能力方面表現(xiàn)出色,但對(duì)醫(yī)學(xué)領(lǐng)域特定知識(shí)和專業(yè)性的理解仍然有限。這使大語(yǔ)言模型應(yīng)用于醫(yī)療場(chǎng)景中的決策支持和臨床指導(dǎo)變得困難。LLMs輔助診療目的在于提升醫(yī)生工作效率和質(zhì)量,如何將LLMs整合至醫(yī)生工作流程中也是一大難點(diǎn),成功案例較匱乏,更多的AI模型還處于實(shí)驗(yàn)階段[66]。在醫(yī)療實(shí)踐中,決策和行動(dòng)往往需要考慮多個(gè)因素,包括患者的個(gè)體差異、病情復(fù)雜性、實(shí)際可行性等,LLMs在評(píng)估實(shí)際需求和可行性方面可能面臨挑戰(zhàn)。
在臨床醫(yī)學(xué)中,公平性是一個(gè)重要的倫理原則,需要確保決策不會(huì)對(duì)某些人群造成不平等對(duì)待。因此,需要審查和糾正模型中的偏見(jiàn),并確保其輸出對(duì)所有患者都是公平和可信的。臨床醫(yī)學(xué)注重個(gè)性化治療和關(guān)懷,需要考慮患者的特定情況、價(jià)值觀和偏好。在使用大語(yǔ)言模型時(shí),應(yīng)注意避免將模型的推薦視為絕對(duì)標(biāo)準(zhǔn),將其作為輔助工具,結(jié)合醫(yī)生專業(yè)判斷和患者個(gè)體情況進(jìn)行決策。在醫(yī)療領(lǐng)域,錯(cuò)誤決策可能導(dǎo)致嚴(yán)重后果,一旦發(fā)生必須追責(zé)。AI的黑箱問(wèn)題導(dǎo)致無(wú)法找出錯(cuò)誤預(yù)測(cè)或建議來(lái)源。LLMs應(yīng)用帶來(lái)責(zé)任和追溯性問(wèn)題。當(dāng)模型產(chǎn)生錯(cuò)誤建議或決策時(shí),如何確定責(zé)任和進(jìn)行糾正是尚待解決的問(wèn)題。醫(yī)療機(jī)構(gòu)和開(kāi)發(fā)者應(yīng)建立機(jī)制,監(jiān)測(cè)模型性能和安全性,并及時(shí)糾正和更新模型,以減少潛在風(fēng)險(xiǎn)和倫理問(wèn)題。目前缺乏AI用于醫(yī)療領(lǐng)域所產(chǎn)生倫理問(wèn)題的行業(yè)性指南,缺乏統(tǒng)一標(biāo)準(zhǔn)規(guī)范AI使用。美國(guó)食品藥品監(jiān)督管理局已經(jīng)開(kāi)始嘗試建立評(píng)價(jià)AI安全性和有效性的指南[67],英國(guó)國(guó)家醫(yī)療服務(wù)體系開(kāi)始建立一系列指南用以評(píng)價(jià)AI驅(qū)動(dòng)的技術(shù)產(chǎn)品有效性[68],這也從側(cè)面印證了AI應(yīng)用的倫理困境。
從長(zhǎng)期來(lái)看,LLMs將醫(yī)生和其他醫(yī)療從業(yè)人員從撰寫(xiě)報(bào)告和執(zhí)行繁瑣行政任務(wù)中解脫出來(lái),更多地投入到臨床工作中。為醫(yī)學(xué)生和醫(yī)生提供基于語(yǔ)言交互的教育和培訓(xùn),幫助醫(yī)學(xué)生更好地掌握醫(yī)學(xué)知識(shí)和技能。ChatGPT等LLMs可以協(xié)助醫(yī)生快速和準(zhǔn)確地診斷病情、制定治療方案,從而提供高質(zhì)量醫(yī)療保健,減少患者因?yàn)槎啻尉歪t(yī)而產(chǎn)生的費(fèi)用。LLMs技術(shù)可以預(yù)測(cè)患者可能面臨的潛在疾病風(fēng)險(xiǎn)。應(yīng)用LLMs技術(shù),通過(guò)對(duì)大量數(shù)據(jù)的學(xué)習(xí)和模式識(shí)別,幫助醫(yī)生和患者及早發(fā)現(xiàn)潛在的健康問(wèn)題。根據(jù)患者個(gè)性化特征和病情特點(diǎn),提供具有針對(duì)性的治療方案,同時(shí)AI還可以對(duì)患者健康狀況進(jìn)行追蹤和預(yù)測(cè),從而避免不必要的復(fù)診和住院。LLMs可被用于醫(yī)療水平欠發(fā)達(dá)地區(qū),幫助提高醫(yī)生及其助手的能力,協(xié)助分診,促進(jìn)遠(yuǎn)程診療。通過(guò)在互聯(lián)網(wǎng)上提供在線診療和遠(yuǎn)程醫(yī)療服務(wù),LLMs可以幫助縮小城鄉(xiāng)醫(yī)療差距,為更廣大人群提供更好的醫(yī)療體驗(yàn)。
LLMs在醫(yī)學(xué)大數(shù)據(jù)挖掘方面的應(yīng)用潛能廣泛而多樣,可以處理臨床病理數(shù)據(jù),幫助解讀組織切片圖像和病理報(bào)告,輔助病理學(xué)家進(jìn)行疾病分類和預(yù)后評(píng)估。在基因組學(xué)數(shù)據(jù)方面,LLMs可以輔助分析基因表達(dá)和突變數(shù)據(jù),幫助發(fā)現(xiàn)新疾病相關(guān)基因和生物標(biāo)志物,并揭示基因調(diào)控網(wǎng)絡(luò)。對(duì)轉(zhuǎn)錄組學(xué)數(shù)據(jù)的輔助分析可以揭示差異表達(dá)基因和通路,預(yù)測(cè)藥物效應(yīng)和治療反應(yīng)。在蛋白組學(xué)數(shù)據(jù)方面,LLMs可以幫助識(shí)別蛋白標(biāo)志物和相互作用,揭示疾病機(jī)制。此外,LLMs還能幫助處理代謝組學(xué)數(shù)據(jù)和醫(yī)學(xué)影像數(shù)據(jù),幫助研究人員從代謝通路和影像特征中有所發(fā)現(xiàn),并提供個(gè)性化醫(yī)療支持。LLMs技術(shù)可以幫助加速醫(yī)學(xué)研究進(jìn)程,例如在疾病預(yù)測(cè)、藥物開(kāi)發(fā)和治療方案制定等方面。LLMs可在大規(guī)?;衔飻?shù)據(jù)庫(kù)中進(jìn)行搜索和篩選,根據(jù)已知藥物性質(zhì)和目標(biāo)疾病信息,提供潛在藥物候選物,或者生成新的分子結(jié)構(gòu),預(yù)測(cè)其藥理學(xué)性質(zhì),并評(píng)估其在特定疾病治療中的潛在效果。這將有助于更快地發(fā)現(xiàn)新的治療方法,為患者提供更好的治療選擇。
以GPT-4、MidJournal等為代表的新一代AI模型,未來(lái)有望將醫(yī)學(xué)圖像分析和醫(yī)學(xué)視頻分析推向新高度。這些模型將結(jié)合深度學(xué)習(xí)、計(jì)算機(jī)視覺(jué)和醫(yī)學(xué)知識(shí),實(shí)現(xiàn)對(duì)超聲、核磁共振、計(jì)算機(jī)斷層掃描、病理圖像和核醫(yī)學(xué)影像等醫(yī)學(xué)圖像的自動(dòng)解讀和分析。進(jìn)而自動(dòng)檢測(cè)異常區(qū)域、提取特征,并與大量醫(yī)學(xué)數(shù)據(jù)庫(kù)進(jìn)行比對(duì),提供更準(zhǔn)確的疾病診斷和治療建議。幫助醫(yī)生更準(zhǔn)確地定位病變、評(píng)估病情嚴(yán)重程度,并在早期發(fā)現(xiàn)疾病跡象,提供更早、更精準(zhǔn)的診斷結(jié)果。提高疾病的治療效果和預(yù)后,并為患者提供更個(gè)性化的醫(yī)療服務(wù)。同時(shí),結(jié)合醫(yī)學(xué)視頻分析,新一代AI模型可以幫助醫(yī)生解讀手術(shù)過(guò)程、手術(shù)視頻、診療操作視頻等,識(shí)別關(guān)鍵步驟、評(píng)估手術(shù)操作的準(zhǔn)確性,并提供實(shí)時(shí)建議和反饋。從而提高手術(shù)的安全性、準(zhǔn)確性和效果,為醫(yī)生提供更可靠的診療輔助工具,使醫(yī)療質(zhì)量和手術(shù)結(jié)果得到進(jìn)一步提升。LLMs等AI模型具有全面的圖像和視頻分析能力,其應(yīng)用將推動(dòng)臨床醫(yī)學(xué)診療模式和醫(yī)療生態(tài)圈產(chǎn)生全面變革。此類模型有潛力加速醫(yī)學(xué)診斷和治療過(guò)程,提高醫(yī)療資源利用效率,并促進(jìn)個(gè)性化醫(yī)療發(fā)展。醫(yī)生可以更專注于更復(fù)雜的病例和治療策略決策,通過(guò)應(yīng)用LLMs可提供更準(zhǔn)確、個(gè)性化的醫(yī)療建議,并為患者提供更全面的關(guān)懷和治療方案。
以ChatGPT為代表的LLMs在臨床診療、隨訪、護(hù)理、醫(yī)學(xué)教育、醫(yī)院管理等諸多健康相關(guān)領(lǐng)域具有應(yīng)用潛能,具有重塑醫(yī)療衛(wèi)生行業(yè)服務(wù)模式的能力。雖然面臨技術(shù)、倫理、法律和社會(huì)問(wèn)題等諸多難題,但ChatGPT的問(wèn)世已經(jīng)開(kāi)啟醫(yī)療領(lǐng)域重大變革,唯有緊隨技術(shù)發(fā)展趨勢(shì),方能乘勢(shì)而上,有所成就。