朱政 余駿雯 楊中方 胡天天 金依霖 何加敏
(1.復旦大學護理學院,上海 200032;2.上海市循證護理中心,上海 200032;3.紐約大學護理學院,紐約 10010)
隨著信息技術和大數據分析技術的不斷發(fā)展,以及真實世界復雜科學研究理念的變革,癥狀網絡的概念逐漸突破了以往的研究范式,即聚焦于單個癥狀并必須控制其他變量。自從2015年Fried等[1]學者在1篇評論文章中首次提出“癥狀網絡”的概念以來,該方法已經在精神病理學、慢性病癥狀管理、腫瘤長期隨訪和患者自我管理中得到應用[2-4]。癥狀網絡不僅提供了癥狀的發(fā)生率和嚴重程度指標,還能通過節(jié)點指標和網絡指標來反映癥狀在網絡中的關鍵作用。這種方法在某種意義上拓寬了臨床醫(yī)務人員對癥狀測量維度的認知,從表觀機制層面分析癥狀共生問題。自從2021年復旦大學團隊在中文護理期刊發(fā)表了第一篇關于癥狀網絡的研究[5]以來,該方法已成為護理領域研究復雜問題的一種必要分析技術。根據癥狀數據的類型,癥狀網絡可以分為3類:同期網絡,基于橫斷面癥狀數據;時態(tài)/個體化網絡,基于單個個體癥狀數據;動態(tài)網絡(dynamic network),基于重復測量的群體面板癥狀數據。其中,同期網絡是最常見的類型。本文將從癥狀同期網絡的定義、常用網絡特異性指標以及R軟件的實現等方面進行介紹,旨在為推廣和規(guī)范癥狀組學領域的研究提供借鑒和參考。
1.1同期網絡的定義 同期網絡是指在同一測量時間點上,同一患者群體所表現出的癥狀所構成的網絡。同期網絡是基于橫斷面數據構建的。該網絡的構建可以為研究者提供無法解釋的癥狀發(fā)生率和嚴重程度等信息,有助于臨床實踐者更好地識別某一疾病人群中癥狀發(fā)生的機制和精準干預的靶點。同期網絡可以幫助研究者理清復雜情境下的共病和多因多果的癥狀問題,并對挖掘疾病的特異性靶點起到良好的作用。例如有學者[3]使用來自SCANS數據庫的1 065例癌癥生存者的橫斷面數據,對與癌癥長期生存有關的13個癥狀進行了分析,結果發(fā)現盡管“疲乏”的發(fā)生率和嚴重程度較高,但它并不是在長期生存中具有核心作用的癥狀。然而,同期網絡僅基于橫斷面數據,無法建立真正的因果關系。在進行癥狀的因果推斷時,需要結合相應的理論加以解釋。
1.2同期網絡中常用的網絡特異性指標 同期網絡的特異性指標可以分為節(jié)點指標、網絡指標、網絡擬合指標和差異性檢驗指標4類。在本期??械摹鞍Y狀網絡的特異性指標”一文中已經詳細介紹了各類網絡特異性指標的定義和臨床意義,在本文中,僅總結了同期網絡中常用特異性指標的類型和種類,見表1。
表1 同期網絡中常用的網絡特異性指標一覽
不同網絡類型需要采用不同的分析方法。如動態(tài)網絡可以采用交叉滯后面板網絡模型或時變向量自回歸模型進行分析。本文將重點介紹同期網絡的基礎分析內容,并介紹如何使用R軟件進行實現。常用癥狀網絡分析方法,見表2。
表2 常用癥狀網絡分析方法一覽
2.1數據準備和清理 癥狀網絡分析的數據準備和清理需要注意以下幾點問題。(1)癥狀數據收集:收集患者自我報告或專業(yè)人員記錄的癥狀信息。數據收集方式可以包括面對面訪談、問卷調查、電子醫(yī)療記錄或移動應用等多種形式。(2)癥狀數據編碼:對癥狀信息進行編碼,將其轉化為數值型數據,以便進行網絡分析。(3)癥狀數據轉化:將癥狀數據轉化為構建癥狀網絡所需的形式,可以提取需要的變量并保存為CSV格式。(4)癥狀數據整理:由于網絡分析不允許存在缺失值,因此需要對收集到的癥狀數據進行整理,包括去除無效數據或處理缺失數據等操作。(5)設置癥狀發(fā)生率閾值:有些癥狀的發(fā)生率較低,在總樣本中只出現1~5次,這可能導致網絡分析時出現錯誤。建議剔除此類癥狀。
完成數據整理后,需要進行以下步驟:設置工作目錄、讀取數據,并導入qgraph命令包。qgraph是一個R語言的命令包,主要用于構建同期癥狀網絡圖模型。該包的主要功能是利用圖形和統計方法來可視化網絡數據,以幫助研究者更好地理解網絡結構和關系。讀取方式,見框1,掃二維碼獲取框1。
2.2命名和定義群組 如果需要研究多個癥狀群之間的關系,并且涉及到多個癥狀,就需要對這些癥狀進行命名和分類。如果使用了標準化量表,可以根據原量表的維度直接進行分類。但如果原量表沒有明確的維度區(qū)分,建議先進行因子分析或主成分分析來探索癥狀群。
2.3可視化 使用qgraph命令包可以將癥狀網絡進行可視化。在示例代碼(框1)中,cor(myData)表示癥狀網絡的數據來源,需要使用cor命令來構建相關系數矩陣。layout參數用于指定網絡的布局方式,可以選擇spring(彈簧布局)或circle(圓形布局)。labels參數用于指定節(jié)點的標簽,groups參數用于表示節(jié)點的分組信息。label.scale參數控制節(jié)點標簽的大小是否隨節(jié)點大小的變化而變化,label.cex參數表示標簽的大小尺寸,node.width參數表示節(jié)點的大小,color參數表示不同群組的顏色。qgraph包含許多其他參數和選項,可參考qgraph命令包的說明文檔[8]。癥狀網絡分析可視化結果示例,見圖1。
圖1 癥狀網絡分析可視化結果示例
2.4中心化指標分析 在癥狀網絡中,中心性指標是用來描述節(jié)點在網絡中核心地位的重要指標,主要包括強度中心性、緊密中心性和中介中心性。這些指標可以用來確定核心癥狀(節(jié)點),成為臨床癥狀管理和干預的重點。通過針對核心癥狀進行干預,可以使原本與該節(jié)點有關聯的其他節(jié)點失去“靶點”的效果,并將干預作用傳播到核心癥狀周圍的節(jié)點,從而最終導致其他癥狀的緩解或消失。使用Centrality命令可以獲取網絡中心性指標的數值。其中,強度中心性(Strength)是最具有說服力的指標,數值越大表示該癥狀在機制上是最核心的癥狀。在癥狀網絡中,采用spring布局時,核心癥狀通常位于圖形的中央位置。中心化指標分析結果示例,見圖2。
圖2 中心化指標分析結果示例
2.5橋梁分析 如果癥狀在多個癥狀群之間起到橋梁的作用,可以探索橋梁癥狀。使用Bridge命令可以獲取癥狀的橋梁中心性指標,其中橋梁強度中心性是最具有說服力的指標。該指標的數值越大,代表該癥狀在機制層面上可能是連接2個癥狀群的關鍵癥狀。橋梁中心性指標需要結合癥狀網絡進行解釋,以明確具體連接哪2個癥狀群之間的橋梁。
2.6邊緣精確性和節(jié)點穩(wěn)定性分析 網絡分析的邊緣精確性和節(jié)點穩(wěn)定性分析是通過對原始數據進行重復抽樣來評估網絡結果的可信程度的一種方法。這種方法可以在不同的數據集上評估網絡結果的一致性,并確定結果的穩(wěn)健性和可靠性。常用的分析方法之一是基于自助重采樣(bootstrapping)技術,它通過多次隨機抽樣生成多個數據集,并在每個數據集上重新計算網絡指標。然后,通過計算這些指標的平均值、標準誤差、置信區(qū)間等統計指標來評估網絡指標的精確性和穩(wěn)定性。具體的分析代碼可以參考框1中的示例。
在解讀邊緣精確性分析結果時,常需要考慮2個方面。(1)關注網絡指標的平均值和標準誤差。網絡指標的平均值可以反映網絡的整體水平,而標準誤差則反映了指標估計的精度。(2)要考慮網絡指標的置信區(qū)間,即指標值的95%置信區(qū)間(CIs)。置信區(qū)間可以反映指標的精確性。如果多次抽樣得到的網絡指標在不同數據集上變化較小,那么置信區(qū)間將較窄;反之,如果變化較大,則置信區(qū)間較寬。精確性檢驗結果示例,見圖3。
圖3 精確性檢驗結果示例
節(jié)點穩(wěn)定性分析是評估網絡中測量結果(例如中心性指標)可靠性和準確性的過程。常用的節(jié)點穩(wěn)定性分析方法包括重復計算和重復抽樣。重復計算是指在相同的網絡結構和節(jié)點屬性條件下,多次計算網絡指標以評估其穩(wěn)定性和一致性。如可以使用不同的隨機數種子生成多個相同的網絡,并計算中心性指標,然后對結果進行比較。如果結果一致,說明該指標的計算較為穩(wěn)定和可靠。具體的穩(wěn)定性分析代碼可參考框1。對于節(jié)點穩(wěn)定性分析的結果解讀,通常需要計算統計指標(如標準誤、置信區(qū)間和偏差)并繪制直方圖和箱線圖。標準誤越小、置信區(qū)間越窄,表示網絡指標的計算越穩(wěn)定。直方圖和箱線圖可展示網絡指標的分布情況,有助于確定異常值和數據的偏斜程度。通常情況下,指標數值>0.25被認為可接受,數值>0.5表示穩(wěn)定性較好。節(jié)點穩(wěn)定性檢驗結果,見圖4。
圖4 節(jié)點穩(wěn)定性檢驗結果
3.1常見問題解析:同期網絡的最小樣本量估算 確定網絡分析中的最小樣本量主要取決于研究問題和網絡特性,例如網絡的大小和復雜性。并沒有一種通用的方法可以直接確定最小樣本量,因此最小樣本量的確定通常依賴于以下幾個因素。(1)研究設計:如果研究設計需要比較不同網絡之間的差異,可能需要更大的樣本量以確保亞組之間的統計效能。根據研究設計和假設檢驗的需求,樣本量的要求會有所不同。(2)網絡的復雜性:對于更大、更復雜的網絡,通常需要更大的樣本量以捕捉網絡的細節(jié)和變異。相反,對于小型、簡單的網絡,可能需要較小的樣本量。最小樣本量通常需要大于節(jié)點數的20倍或250~350例以上[10]。可以通過R軟件的netPower計算統計效能[11]。(3)分析方法:不同的網絡分析方法對樣本量的要求也有所不同。一些方法可能需要大量的數據才能得出可靠的結果,而其他方法可能對數據的數量要求較低。(4)研究目標:如果研究關注網絡的全局屬性,通常需要更大的樣本量來確保對整個網絡進行準確的推斷。但如果只對網絡中的特定部分感興趣,可能可以使用較小的樣本量。(5)節(jié)點中心性的穩(wěn)定性:如果網絡的節(jié)點中心性穩(wěn)定性較好,通常可以使用較小的樣本量。節(jié)點中心性穩(wěn)定性指標一般要求>0.25才可接受[12]。(6)邊緣權重的精確性:如果網絡中邊緣權重的估計比較準確,那么置信區(qū)間將較窄,反之則較寬。邊緣權重的精確性會影響對網絡結構的準確度。一般來說,樣本量的確定需要通過統計效能分析或模擬研究來進行。這需要與有經驗的網絡分析專家合作來確定合適的樣本量。
3.2常見問題解析:檢驗混雜因素對結果的影響 網絡分析中控制混雜因素的影響的方法有多種[13-15],包括(1)控制變量層次建模法:該方法通過將可能影響結果的混雜因素和協變量引入模型中進行控制,以消除這些因素對結果的影響,并檢驗是否存在混雜因素對模型結論造成影響。通過引入相關變量來控制混雜因素,可以減少其對網絡分析結果的干擾。(2)亞組分析:在網絡分析中進行亞組分析,例如將參與者按照某個特征(如性別)進行分類,然后對每個亞組分別進行網絡分析。這樣可以檢驗混雜因素是否是導致模型結果異質性的重要因素。通過比較亞組之間的網絡特性差異,可以評估混雜因素對網絡分析結果的影響。(3)基于匹配的方法:這種方法通過將不同群組中的參與者進行匹配,使得群組之間的混雜因素和協變量得到控制,從而減少其對網絡分析結果的影響。匹配可以基于一些特征或變量,使得匹配后的群組在混雜因素上更加相似,從而消除混雜因素的影響。
本文介紹了癥狀同期網絡分析方法的基本概念和常用網絡特異性指標,以及如何使用R軟件來實現。癥狀同期網絡分析方法的目的是幫助醫(yī)護人員更好地理解癥狀共生的機制,確定癥狀管理的重點,制定個體化的方案,并促進精準護理的發(fā)展。我們希望本文能對初學者了解癥狀網絡分析方法有所幫助,并為該領域的研究者提供一定的參考價值。