吳傅蕾 黃青梅 楊瑒 蔡婷婷 袁長(zhǎng)蓉
(1.復(fù)旦大學(xué)附屬腫瘤醫(yī)院,上海 200032;2.復(fù)旦大學(xué)護(hù)理學(xué)院,上海 200032)
患者報(bào)告結(jié)局(Patient-reported outcomes,PROs)已被證實(shí)是反映和促進(jìn)患者真實(shí)體驗(yàn)的可靠來(lái)源和有效手段,是指沒(méi)有經(jīng)過(guò)醫(yī)生或他人的解釋,直接來(lái)自患者的關(guān)于患者自身健康狀態(tài)的信息[1]?;谝欢ɡ碚摶A(chǔ)構(gòu)建并經(jīng)過(guò)測(cè)量學(xué)檢驗(yàn)的患者報(bào)告結(jié)局測(cè)量工具(Patient-reported outcomes measures,PROMs)是健康領(lǐng)域研究和臨床實(shí)踐獲取真實(shí)、全面、可靠、規(guī)范的PROs數(shù)據(jù)的關(guān)鍵。隨著現(xiàn)代測(cè)量學(xué)的快速發(fā)展,項(xiàng)目反應(yīng)理論(Item response theory,IRT)因其可克服傳統(tǒng)測(cè)量工具測(cè)量靜態(tài)性、樣本依賴性等的優(yōu)勢(shì)[2],在PROMs研究中的應(yīng)用日漸廣泛。護(hù)理領(lǐng)域的研究者和臨床工作者有必要深入了解IRT相關(guān)理念和應(yīng)用,以促進(jìn)未來(lái)PROs領(lǐng)域的理論和實(shí)踐研究?;诖耍疚慕榻BIRT的基本概念和特點(diǎn),總結(jié)其在PROMs研究中的應(yīng)用,并提出IRT應(yīng)用于PROMs研究的展望,以期為未來(lái)PROMs相關(guān)研究和應(yīng)用提供理論依據(jù)和實(shí)踐參考。
1.1項(xiàng)目反應(yīng)理論的相關(guān)概念 IRT是由一系列數(shù)學(xué)模型組成的統(tǒng)計(jì)理論,模型表達(dá)被試對(duì)某一量表?xiàng)l目進(jìn)行特定響應(yīng)的概率,是被試的潛在特質(zhì)(latent trait)和條目的特征參數(shù)的函數(shù)[3]。通俗地說(shuō),IRT把表現(xiàn)在個(gè)體身上所特有的相對(duì)穩(wěn)定的行為方式稱為潛在特質(zhì)(記作θ),它無(wú)法被直接被觀察和測(cè)量,但可通過(guò)由專業(yè)研究者構(gòu)建的一系列與這一特質(zhì)相關(guān)的條目間接反映[3]。被試的潛在特質(zhì)與其對(duì)某一特定條目的響應(yīng)存在某種函數(shù)關(guān)系,IRT即是明確這一函數(shù)關(guān)系。在數(shù)學(xué)上這一函數(shù)關(guān)系稱作項(xiàng)目反應(yīng)函數(shù)(Item response function),其圖像表達(dá)為項(xiàng)目特征曲線(Item characteristic curve,ICC)[4]。ICC通常呈“S”型,可直觀體現(xiàn)個(gè)體對(duì)某一選項(xiàng)的應(yīng)答概率隨個(gè)體潛在特質(zhì)水平變化而變化。以一個(gè)應(yīng)答選項(xiàng)為“否”和“是”的量表?xiàng)l目為例,如條目“我不在乎我怎么了”用以調(diào)查患者的抑郁水平,此時(shí)抑郁水平即為潛在特質(zhì)。當(dāng)患者的抑郁水平越高,則回答“是”的概率越高;反之則回答“否”的概率越高。見(jiàn)圖1。
圖1 ICC圖示
1.2項(xiàng)目反應(yīng)理論模型的假設(shè) IRT的一系列數(shù)學(xué)模型對(duì)條目存在多種假設(shè)。單維性(Unidimensionality)是其中一個(gè)常見(jiàn)假設(shè),是指某一量表中的條目?jī)H測(cè)量一個(gè)潛在特質(zhì)[3]。然而在真實(shí)世界研究中,這一假設(shè)往往難以滿足。如上文中的條目“我不在乎我怎么了”,若需完全滿足單維性假設(shè),則需滿足被試在選擇選項(xiàng)“是”和“否”時(shí)是完全由其抑郁水平驅(qū)動(dòng)的;然而焦慮和抑郁常相互影響,被試對(duì)這一條目的應(yīng)答也可能跟被試的焦慮水平有關(guān)。因此,有統(tǒng)計(jì)學(xué)家提出,條目在一定程度上滿足單維性即可接受[5],其檢驗(yàn)可采用驗(yàn)證性因子分析(Confirmatory factor analysis,CFA)、McDonald雙因素模型(McDonald′s bi-factor model)等[5-6]。局部獨(dú)立性(Local independence,LI)是IRT模型的另一重要假設(shè),即當(dāng)被試的潛在特質(zhì)是穩(wěn)定的,則其對(duì)條目的應(yīng)答之間不存在相關(guān)[7],否則將會(huì)影響IRT的參數(shù)估計(jì),從而影響量表的構(gòu)建。局部獨(dú)立性可通過(guò)CFA的殘差相關(guān)矩陣或結(jié)構(gòu)方程模型(Structural equation model,SEM)的修正指數(shù)(Modification indices,MIs)檢驗(yàn)[7-8]。此外,在應(yīng)用IRT模型前,還需進(jìn)行單調(diào)性(Monotonicity)假設(shè)的檢驗(yàn)。單調(diào)性意味著隨著被試健康水平的提高,選擇條目中表明健康狀況較好選項(xiàng)的可能性也相應(yīng)增加[9]。這一點(diǎn)在應(yīng)答選項(xiàng)為等級(jí)選項(xiàng)(如Likert 5級(jí)選項(xiàng))的條目中尤其重要。
1.3項(xiàng)目反應(yīng)理論的特點(diǎn)和優(yōu)勢(shì) 隨著健康結(jié)局相關(guān)研究以及臨床實(shí)踐中對(duì)反映患者自身感受的可靠測(cè)量工具的需求迫切增長(zhǎng),臨床工作者和研究者需要更好的測(cè)量工具,以突破經(jīng)典測(cè)量理論(Classic test theory,CTT)的局限。不同于CTT模型更多地關(guān)注整個(gè)量表或測(cè)試層面,IRT如其名,關(guān)注的是個(gè)體在條目水平的應(yīng)答。也就是說(shuō),IRT通過(guò)個(gè)體對(duì)條目的應(yīng)答估計(jì)其潛在特質(zhì)的水平,而不是條目回答的正確數(shù)或條目總得分。IRT模型的另一大特點(diǎn)是信息函數(shù)(Information function),用于指示對(duì)于測(cè)量的某一潛在特質(zhì),哪一個(gè)條目或量表在區(qū)分不同水平的個(gè)體上最顯著,信息量越大,則其精確度越高[3]。從概念上來(lái)說(shuō),可以將信息函數(shù)視作CTT中的信度(Reliability),但不同于經(jīng)典信度為一個(gè)單一的數(shù)值,信息函數(shù)可顯示某一條目或量表的信度在測(cè)量不同特質(zhì)水平的被試時(shí)的變化。
基于上述特點(diǎn),IRT作為現(xiàn)代測(cè)量理論與CTT相比具備一系列優(yōu)勢(shì):(1)IRT可提供針對(duì)每一個(gè)條目的更深度的分析。(2)IRT可通過(guò)減少問(wèn)卷所需條目數(shù)以促進(jìn)開(kāi)發(fā)更高效的PROMs,并提供可比較的測(cè)量精度和信度。(3)IRT可以通過(guò)項(xiàng)目功能差異(Differential Item functioning,DIF)分析,以發(fā)現(xiàn)條目和量表在不同亞組人群中的表現(xiàn)。(4)基于IRT研發(fā)的量表允許將該量表的得分與其他量表相比較,即不同測(cè)量工具之間的得分存在可比性。(5)IRT可用于研發(fā)對(duì)每一個(gè)體“量身”定制問(wèn)卷的計(jì)算機(jī)自適應(yīng)測(cè)試(Computer adaptive tests,CATs)[10]。
1.4常用的項(xiàng)目反應(yīng)理論模型 不同的條目應(yīng)答模式,如二分類應(yīng)答(是或否、正確或錯(cuò)誤)、等級(jí)應(yīng)答(Likert型),IRT模型在ICC函數(shù)形式上有所不同。此外,根據(jù)測(cè)量的維度,即當(dāng)量表用于測(cè)量單個(gè)領(lǐng)域(Domain)、結(jié)構(gòu)(Construct)或特質(zhì)時(shí),或量表用于同時(shí)測(cè)量多個(gè)相關(guān)的領(lǐng)域,應(yīng)相應(yīng)地選擇單維IRT模型(Unidimensional IRT model,UIRT)或多維IRT模型(Multi-dimensional IRT model,MIRT)[3, 11]。也就是說(shuō),IRT模型的選擇取決于條目的應(yīng)答模式和測(cè)量的維度。IRT模型的計(jì)算極其復(fù)雜,必須借助計(jì)算機(jī)軟件才能實(shí)現(xiàn),常用的軟件包括MULTILOG、BILOG、RASCAl等,也可通過(guò)SAS統(tǒng)計(jì)軟件編程實(shí)現(xiàn)。
由于對(duì)模型的介紹涉及到一系列復(fù)雜的數(shù)學(xué)公式,本文僅對(duì)模型及其適用情境做簡(jiǎn)要描述。在單維IRT模型中,針對(duì)二分類的應(yīng)答模式,常用的模型包括單參數(shù)Logistic模型(One parameter logistic model,1-PLM)和兩參數(shù)Logistic模型(2-PLM),其區(qū)別如字面之意,在于估計(jì)的參數(shù)個(gè)數(shù)。1-PLM和2-PLM均估計(jì)條目的難度系數(shù)(Difficulty,常記作b),2-PLM在此基礎(chǔ)上還會(huì)估計(jì)區(qū)分度(Discrimination,常記作a)[3,10-11]。如圖1所示,難度系數(shù)是ICC的拐點(diǎn)在橫坐標(biāo)的投影,當(dāng)被試的潛在特質(zhì)水平(θ),在本例中即抑郁水平低于b,則其在該條目上回答“否”的概率越高,反之則回答“是”的概率越高。ICC拐點(diǎn)的斜率為區(qū)分度,數(shù)值越大則區(qū)分度越高[3]。針對(duì)多分類的應(yīng)答模式,常用的模型包括評(píng)分量表模型(Rating scale model,RSM)、等級(jí)反應(yīng)模型(Graded response model,GRM)和名義反應(yīng)模型(Nominal response model,NRM)等。RSM的條目區(qū)分度參數(shù)一致,條目應(yīng)答的設(shè)置是等距的;GRM適用于有序的應(yīng)答模式,如完全不同意到完全同意的5級(jí)應(yīng)答,并為每一條目估計(jì)不同的區(qū)分度參數(shù);NRM不要求條目的應(yīng)答選項(xiàng)是順序的,同樣為每一條目估計(jì)區(qū)分度參數(shù)[3]。在MIRT模型中,根據(jù)被試在完成測(cè)量時(shí),多種潛在特質(zhì)是如何相互作用的,可分為補(bǔ)償性模型,如多成分潛在特質(zhì)模型(Multicomponent latent trait model,MLTM)和非補(bǔ)償性模型,如Reckase的多維Logistic模型[12-13]。
2.1用于測(cè)量工具評(píng)價(jià)和優(yōu)化 IRT可通過(guò)條目水平的測(cè)量性能分析為測(cè)量工具的評(píng)價(jià)和優(yōu)化提供不同于CTT的視角和策略,因此越來(lái)越多的學(xué)者應(yīng)用CTT和IRT相結(jié)合的方法進(jìn)行測(cè)量工具的評(píng)價(jià)和優(yōu)化。常見(jiàn)的結(jié)合方法有:(1)先基于CTT進(jìn)行初步條目篩選和信效度評(píng)價(jià),后基于IRT進(jìn)一步評(píng)價(jià)每個(gè)條目的測(cè)量學(xué)性能并進(jìn)行優(yōu)化。如龐海玉等[14]編制老年醫(yī)學(xué)知信行量表用于評(píng)估醫(yī)學(xué)生對(duì)老年醫(yī)學(xué)知識(shí)的掌握及實(shí)踐情況,并通過(guò)基于CTT的條目篩選保留條目34項(xiàng),后為進(jìn)一步優(yōu)化量表采用IRT進(jìn)行條目分析與評(píng)價(jià),結(jié)果顯示有11項(xiàng)條目在區(qū)分度參數(shù)和難度系數(shù)參數(shù)上不達(dá)標(biāo),需進(jìn)一步修訂。(2)同時(shí)采用CTT和IRT評(píng)價(jià)量表和條目,并基于兩者結(jié)果進(jìn)行綜合的條目篩選和優(yōu)化。兩者的評(píng)價(jià)結(jié)果一致則更強(qiáng)有力地證實(shí)了條目的高質(zhì)量,不一致則提示研究者從不同的角度考慮條目的取舍問(wèn)題。如薛紅紅等[15]采用CTT中的變異度法、相關(guān)系數(shù)法、因子分析法和克朗巴赫系數(shù)法,以及IRT中的GRM進(jìn)行老年COPD患者多維健康測(cè)定量表的條目分析,結(jié)果顯示部分條目在兩種測(cè)量理論下的表現(xiàn)不一致,需要結(jié)合統(tǒng)計(jì)學(xué)指標(biāo)和專家意見(jiàn)進(jìn)一步修訂。需要指出的是,盡管IRT應(yīng)用于測(cè)量工具評(píng)價(jià)和優(yōu)化中的優(yōu)勢(shì)已日益引起國(guó)內(nèi)學(xué)者的重視,然而在應(yīng)用時(shí)對(duì)IRT基本假設(shè),尤其是對(duì)局部獨(dú)立性假設(shè),以及對(duì)樣本量要求仍不夠重視,王偉梁等[16]通過(guò)對(duì)已發(fā)表文獻(xiàn)的分析同樣指出了這一點(diǎn),提示后續(xù)研究者在進(jìn)行IRT應(yīng)用前需呈現(xiàn)IRT模型前提假設(shè)的驗(yàn)證結(jié)果以及樣本量測(cè)算依據(jù)。
2.2用于測(cè)量工具的測(cè)量等價(jià)性分析 測(cè)量等價(jià)性(Measurement invariance,MI)是指當(dāng)觀測(cè)變量和潛在特質(zhì)之間的關(guān)系在不同組間等同,是量表的一種基本特征[17],是進(jìn)行組間(如不同年齡段、不同性別和不同文化背景的亞組人群間)比較或不同測(cè)試方法的數(shù)據(jù)合并(如電子問(wèn)卷和紙質(zhì)問(wèn)卷合并)的前提[18]。即是條目對(duì)不同組別的測(cè)量對(duì)象來(lái)說(shuō),其意義和功能是否等同。IRT采用DIF表達(dá)MI,即當(dāng)某一條目在同一潛在特質(zhì)水平但來(lái)自不同組別的被試中表現(xiàn)不一致,則該條目存在DIF。盡管目前較多學(xué)者仍采用結(jié)構(gòu)方程模型框架下的多組驗(yàn)證性因子分析(Multi-group confirmatory factor analysis,MCFA)進(jìn)行MI檢驗(yàn)[18],但研究[19]顯示,MCFA在檢驗(yàn)難度參數(shù)等價(jià)性上劣于基于IRT的DIF分析,且犯I類錯(cuò)誤的概率更大;在多維測(cè)驗(yàn)情境下,基于IRT的方法檢驗(yàn)力更強(qiáng)[20]。然而多數(shù)DIF檢驗(yàn)要求大樣本,這一點(diǎn)在患者報(bào)告健康結(jié)局工具領(lǐng)域往往較難滿足,Lai等[21]針對(duì)小樣本,如<200的樣本的DIF檢驗(yàn)推薦了若干方法。
2.3用于實(shí)現(xiàn)不同測(cè)量工具間的可比性 在PROs的測(cè)量領(lǐng)域,針對(duì)同一PROs存在多種不同的測(cè)量工具,其在條目數(shù)量,內(nèi)容以及應(yīng)答設(shè)置中均有所不同。因此,不像某些客觀指標(biāo)(如體溫、血壓等)來(lái)自不同臨床試驗(yàn)的數(shù)據(jù)可用于合并或比較,若采用了不同的測(cè)量工具,PROs是不可比的。合適的IRT模型則可以解決這一問(wèn)題,通過(guò)模型校準(zhǔn)后的項(xiàng)目可鏈接在同一度量標(biāo)準(zhǔn)(Metric)上,以查找轉(zhuǎn)換表的形式獲得標(biāo)準(zhǔn)分,從而比較不同測(cè)量工具間的得分[22]。如疲乏是常見(jiàn)的PROs內(nèi)容之一,其常用測(cè)量工具有慢性病治療功能評(píng)估-疲乏(Function assessment of chronic disease therapy-fatigue,F(xiàn)ACT-F),醫(yī)療結(jié)局研究36條目簡(jiǎn)表(Medical outcomes study short form-36,MOS-SF36)中的疲乏條目,以及患者報(bào)告結(jié)局測(cè)量信息系統(tǒng)(Patient-reported outcome measurement information system,PROMIS)中的疲乏簡(jiǎn)表。Lai等[23]采用Stocking-lord法和固定參數(shù)校準(zhǔn)法分別將FACT-F和MOS-SF36疲乏條目與PROMIS疲乏簡(jiǎn)表鏈接,將其度量標(biāo)準(zhǔn)轉(zhuǎn)化為與PROMIS疲乏簡(jiǎn)表一致的T-score,即一種以50為均分,10為標(biāo)準(zhǔn)差的標(biāo)準(zhǔn)分(美國(guó)人群的平均水平,因此得分>50為高于平均水平,反之則低于平均水平),從而使得不同量表的疲乏得分可比,并促進(jìn)對(duì)疲乏得分的臨床解讀。
2.4用于CATs的構(gòu)建 CATs以IRT為基礎(chǔ),可根據(jù)被試者對(duì)上一題的應(yīng)答主動(dòng)適應(yīng)其能力水平,在條目池中針對(duì)性地選擇合適的條目,從而在有限的條目數(shù)內(nèi)精確地估計(jì)被試的潛在特質(zhì)水平[24]。CATs技術(shù)此前多用于語(yǔ)言水平測(cè)驗(yàn)、入職測(cè)評(píng)等教育考試領(lǐng)域,如TOFEL考試等。鑒于其“因人施測(cè)”的巨大優(yōu)勢(shì),醫(yī)護(hù)領(lǐng)域近年來(lái)也出現(xiàn)了眾多采用CATs技術(shù)測(cè)量生理功能、心理健康、生活質(zhì)量等患者報(bào)告結(jié)局的嘗試和應(yīng)用,以更快速、更精確地收集患者數(shù)據(jù)。以PROMIS為例,其第二階段的研發(fā)重心即聚焦在PROMIS-CATs的研制,目前已有超過(guò)20個(gè)PROs可應(yīng)用CATs施測(cè)[25]。這樣一來(lái),每個(gè)健康結(jié)局僅需4~12個(gè)條目即可完成測(cè)量,極大降低了被試的測(cè)量負(fù)擔(dān)。且有研究[26]顯示,基于CATs的得分更加接近患者真實(shí)情況,差異有統(tǒng)計(jì)學(xué)意義。因此,研究者推薦在臨床和研究情境下大力發(fā)展基于CATs的健康結(jié)局評(píng)估策略。
3.1多維項(xiàng)目反應(yīng)理論的發(fā)展促進(jìn)真實(shí)世界的患者報(bào)告結(jié)局研究 如上所述,健康結(jié)局往往是多維的,即使是某個(gè)單一的癥狀(如疼痛)也涉及到生理、認(rèn)知以及情感等多個(gè)要素,導(dǎo)致PROs工具往往難以嚴(yán)格地滿足單維性假設(shè)。事實(shí)上,用單維的測(cè)量學(xué)去解釋多維的真實(shí)世界研究本身即存在不合理性,這也是IRT在過(guò)去被詬病的原因之一。幸運(yùn)的是,隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,IRT的理論和實(shí)踐逐漸由注重UIRT向UIRT和MIRT并重轉(zhuǎn)變[13],這與健康領(lǐng)域PROs測(cè)量的特點(diǎn)和需求尤為契合。MIRT認(rèn)為,測(cè)量數(shù)據(jù)呈現(xiàn)的多維性與被試在應(yīng)答時(shí)涉及的多種潛在特質(zhì)相符;也就是說(shuō),MIRT建立了被試對(duì)條目某一選項(xiàng)的應(yīng)答概率與多個(gè)潛在特質(zhì)和項(xiàng)目參數(shù)之間的空間函數(shù)[13,27]。MIRT可用于對(duì)測(cè)量工具的維度分析、對(duì)條目的合適性分析、精簡(jiǎn)測(cè)量條目、估計(jì)被試多維潛在特質(zhì)等[13],然而由于概念抽象、運(yùn)算量巨大、結(jié)果解讀復(fù)雜,其在PROs工具相關(guān)研究中的實(shí)際應(yīng)用仍較少見(jiàn)。后續(xù)研究者可與數(shù)據(jù)科學(xué)家密切合作,也可參考已有的程序語(yǔ)言包嘗試相關(guān)應(yīng)用[13,28]。
3.2基于IRT的計(jì)算機(jī)自適應(yīng)測(cè)試技術(shù)促進(jìn)精準(zhǔn)測(cè)量 CATs被視作包括MIRT和認(rèn)知診斷在內(nèi)的現(xiàn)代測(cè)量學(xué)三大發(fā)展方向之一,其在PROs測(cè)量領(lǐng)域的應(yīng)用可有效提高患者多種健康結(jié)局的評(píng)估和評(píng)價(jià)效率和精準(zhǔn)性,減輕患者應(yīng)答負(fù)擔(dān)。已有研究者對(duì)此進(jìn)行了初步嘗試,如卞薇等[29]設(shè)計(jì)開(kāi)發(fā)了“成人斜視患者報(bào)告結(jié)局測(cè)評(píng)系統(tǒng)”用于斜視患者的癥狀、日常生活功能等內(nèi)容的臨床評(píng)估,是國(guó)內(nèi)PROs領(lǐng)域較早實(shí)現(xiàn)CATs應(yīng)用的報(bào)道,然而未見(jiàn)其對(duì)CATs開(kāi)發(fā)流程、模型選擇、參數(shù)估計(jì)等的具體描述。CATs的成熟應(yīng)用多見(jiàn)于教育考試領(lǐng)域,然而醫(yī)學(xué)結(jié)局評(píng)估與考試存在顯著差異,在條目選擇標(biāo)準(zhǔn)、測(cè)試終止標(biāo)準(zhǔn)等指標(biāo)上也應(yīng)有所區(qū)別。健康結(jié)局領(lǐng)域的研究者有必要構(gòu)建一套適用于醫(yī)學(xué)測(cè)量的CATs開(kāi)發(fā)流程和評(píng)價(jià)體系。另一方面,為切實(shí)促進(jìn)基于CATs的臨床PROs評(píng)估和評(píng)價(jià),亟需探索CATs與臨床現(xiàn)有護(hù)理評(píng)估的結(jié)合路徑,包括測(cè)量流程、數(shù)據(jù)管理、結(jié)果解讀等。國(guó)外已有機(jī)構(gòu)將PROMIS-CATs嵌入醫(yī)院信息系統(tǒng)用于患者的健康結(jié)局監(jiān)測(cè)[30],國(guó)內(nèi)亦有與平板電腦或移動(dòng)手機(jī)應(yīng)用程序相結(jié)合的嘗試[31],患者在醫(yī)院或者家里即可利用電子界面完成測(cè)評(píng)并獲取反饋,使對(duì)患者PROs的動(dòng)態(tài)、實(shí)時(shí)評(píng)估和即時(shí)反饋成為可能。然而PROs數(shù)據(jù)與臨床患者數(shù)據(jù)的融合、在臨床實(shí)踐中的角色和作用方式仍有待進(jìn)一步探索。研究者可以此為參考,探索符合我國(guó)國(guó)情的PROs臨床應(yīng)用策略。
隨著“以患者為中心”理念的不斷深入,患者體驗(yàn)的提升成為政策制定者和健康領(lǐng)域工作者關(guān)注的重點(diǎn)之一。作為患者體驗(yàn)的可靠來(lái)源,基于現(xiàn)代測(cè)量學(xué)理論的PROs工具及其研究和應(yīng)用也必將成為熱點(diǎn)。健康照護(hù)者有必要在了解相關(guān)的基本測(cè)量學(xué)理論基礎(chǔ)上,以國(guó)內(nèi)外已有的理論和實(shí)踐為參考,積極尋求與統(tǒng)計(jì)學(xué)家、心理學(xué)家、算法工程師等多學(xué)科團(tuán)隊(duì)的密切合作,促進(jìn)基于IRT的PROs的研究和臨床實(shí)踐,并提升照護(hù)質(zhì)量與患者體驗(yàn)。