徐 萌 張思文 肖 文
(遼寧中醫(yī)藥大學(xué)經(jīng)濟管理學(xué)院,遼寧 沈陽 110847)
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展和信息化的普及,越來越多的用戶傾向于通過網(wǎng)絡(luò)平臺分享觀點和交流經(jīng)驗,學(xué)者研究發(fā)現(xiàn)對在線數(shù)據(jù)的挖掘能夠為企業(yè)和用戶提供直接的參考。在醫(yī)療健康領(lǐng)域,《國務(wù)院關(guān)于積極推進“互聯(lián)網(wǎng)+”行動的指導(dǎo)意見》和《關(guān)于促進“互聯(lián)網(wǎng)+醫(yī)療健康”發(fā)展意見》等政策頒布的推動下,“互聯(lián)網(wǎng)+醫(yī)療”的就診模式被廣泛應(yīng)用,在線健康社區(qū)就是其中一種。作為醫(yī)生和患者高效溝通的媒介,在線健康社區(qū)為患者提供就診服務(wù)和健康咨詢的同時,也支持患者進行信息和診療經(jīng)驗的共享,由此,產(chǎn)生了大量的在線醫(yī)評信息。在線醫(yī)評對提高在線健康社區(qū)醫(yī)療服務(wù)質(zhì)量、患者就診體驗和疾病治療效率具有重要作用,所以,如何從海量的在線醫(yī)評中挖掘高質(zhì)量信息成為當(dāng)前學(xué)者研究的熱點。
鑒于此,本文選取“好大夫”在線健康社區(qū)中的患者在線評論作為數(shù)據(jù)來源,運用主題圖譜和情感分析的方法,依據(jù)詞頻-云圖和主題圖譜從在線醫(yī)評中挖掘患者關(guān)注主題,借助情感量化結(jié)果探討患者就診過程的滿意度,從而為在線健康社區(qū)平臺的建設(shè)、醫(yī)生和醫(yī)療服務(wù)質(zhì)量的提高等提供一定的實踐指導(dǎo)作用。
目前,國內(nèi)現(xiàn)有的在線健康社區(qū)研究尚處于探索階段,主要集中在患者擇醫(yī)行為、使用意愿和滿意度的影響因素上。易夢馨等基于文本圖片多源信息,構(gòu)建回歸分析模型,探討影響患者在線擇醫(yī)行為的因素有聲譽可信度、能力可信度和面孔可信度;郭宇等利用元分析方法指出感知有用性、情感信任、感知風(fēng)險等33個因素影響用戶在線醫(yī)療社區(qū)使用意愿;王若佳等基于扎根理論提出在線問診用戶滿意度受環(huán)境、平臺、醫(yī)生和用戶因素的影響;徐孝婷等借助線性回歸模型得出醫(yī)生的口碑包括療效、態(tài)度、感謝信、評論數(shù)和情感傾向等指標(biāo),會正向影響患者的選擇??梢姡m然已有少數(shù)研究基于患者在線評論進行探討,但主要借助理論模型和問卷調(diào)查展開,具有一定的主觀性,很少有研究借助主題聚類-圖譜可視化和情感分析進行主題挖掘。
主題圖譜源于知識圖譜用于聚焦主題及其之間的邏輯關(guān)系,并構(gòu)成相應(yīng)的語義網(wǎng)絡(luò)圖。國內(nèi)學(xué)者主要針對網(wǎng)絡(luò)輿情、文獻統(tǒng)計、在線評論等文本信息構(gòu)建主題圖譜。陳健瑤等基于主題圖譜從用戶、賬戶、內(nèi)容三個維度展示網(wǎng)絡(luò)輿情特征的演化規(guī)律;李新根等借助文獻計量法和主題共現(xiàn)的可視化,分析國內(nèi)數(shù)字化治理研究的主題與演進趨勢;祝琳琳等基于在線評論構(gòu)建主題圖譜,展示主題之間的層次和共現(xiàn)關(guān)系以及主題的情感強度??梢?,主題圖譜應(yīng)用于各研究領(lǐng)域,但基于患者在線評論構(gòu)建主題圖譜挖掘主題的研究較少,將主題圖譜與情感分析融合的研究更是有限。因此,本文應(yīng)用主題圖譜工具,對在線健康社區(qū)的患者在線評論進行分析,以了解患者對在線問診過程關(guān)注的內(nèi)容和情感傾向。
本文嘗試針對在線健康社區(qū)平臺的患者評論數(shù)據(jù),利用詞頻分析、共現(xiàn)網(wǎng)絡(luò)和情感分析方法,對患者在線就診關(guān)注主題和情感傾向進行分析,研究框架如圖1所示。
圖1 患者在線評論主題挖掘及情感傾向分析框架
Step1:數(shù)據(jù)采集與預(yù)處理。選取適用的網(wǎng)站及疾病類型作為數(shù)據(jù)來源進行爬取,對在線評論進行過濾、分詞和去停詞的預(yù)處理,獲取詞匯數(shù)據(jù)庫。
Step2:在線評論主題挖掘。提取在線評論高頻詞,通過高頻詞間內(nèi)在聯(lián)系挖掘主題,依據(jù)評論集中是否包含相同高頻詞來構(gòu)建共現(xiàn)關(guān)系,形成節(jié)點為相同關(guān)鍵詞,邊為在線評論的共現(xiàn)網(wǎng)絡(luò)。
Step3:在線評論情感傾向分析。計算每條評論的情感得分,按照分數(shù)將評論分為好、中、差三個檔,并對好評和差評細分為輕度、中度和高度三個區(qū)間。
好大夫在線健康社區(qū)是中國領(lǐng)先的互聯(lián)網(wǎng)醫(yī)療平臺,該平臺以查詢醫(yī)院/醫(yī)生信息、多形式問診和疾病知識科普等內(nèi)容為主要功能,用戶可以根據(jù)就診體驗在平臺上分享經(jīng)驗,評價醫(yī)院或醫(yī)生。由于好大夫在線具有15年的成熟運營經(jīng)驗,在多個領(lǐng)域取得顯著成果,擁有數(shù)量眾多的優(yōu)質(zhì)醫(yī)生群體,故選其為本文的數(shù)據(jù)來源。
根據(jù)近幾年《中國衛(wèi)生和計劃生育統(tǒng)計年鑒》中的發(fā)病率數(shù)據(jù),選取5種高風(fēng)險疾病和5種低風(fēng)險疾病進行數(shù)據(jù)篩選,即高風(fēng)險疾病:糖尿病、冠心病、肺癌、乳腺癌、腦梗塞;低風(fēng)險疾?。焊哐獕?、胃炎、類風(fēng)濕性關(guān)節(jié)炎、抑郁癥、月經(jīng)失調(diào)。利用八爪魚采集器抓取2022年5月前好大夫在線平臺上這10種疾病的前10名醫(yī)生的患者就診反饋數(shù)據(jù),共獲取28975條評論,去除無效及重復(fù)數(shù)據(jù),得到27995條有效評論。
為了更好地分析在線健康社區(qū)用戶就診的滿意度,進一步規(guī)范初始語料庫,使用R語言對采集到的反饋數(shù)據(jù)進行以下預(yù)處理:(1)過濾在線評論中包含的大量標(biāo)點符號、表情、英語單詞等低代表性信息;(2)對在線評論文本進行分詞處理;(3)去除文本中出現(xiàn)頻率高但無實際意義的詞,如介詞、代詞、停用詞等。
2.3.1 詞頻統(tǒng)計
為直觀地反映在線問診用戶所關(guān)注的焦點和主題,利用R語言進行詞頻統(tǒng)計并繪制前500個詞語的詞云圖實現(xiàn)特征的可視化,如圖2所示。圖中字體越大,說明出現(xiàn)的頻次越高,結(jié)合表1中排名前30的高頻詞,可以發(fā)現(xiàn)除了“醫(yī)生”“主任”“大夫”等專有名詞外,主要包括“耐心”“醫(yī)術(shù)”“態(tài)度”“治療”“病情”“精湛”“醫(yī)德”等高頻詞。初步提煉在線健康社區(qū)患者評論的關(guān)注點,主要集中于服務(wù)態(tài)度、醫(yī)術(shù)水平、就醫(yī)體驗、醫(yī)德醫(yī)風(fēng)等方面,可以作為后續(xù)患者滿意度因素歸納及判定的研究基礎(chǔ)。
圖2 高頻詞詞云
表1 TOP30高頻詞
2.3.2 患者在線評論主題圖譜
為更精準地提煉患者在線評論主題,在詞頻分析的基礎(chǔ)上,使用VOS Viewer軟件對評論文本構(gòu)建特征詞主題圖譜,設(shè)置頻次閾值為150,聚類分辨率和最小聚類項數(shù)為1,結(jié)果如圖3所示。圖譜中不同顏色的節(jié)點集合代表不同的聚類簇;節(jié)點代表特征詞,節(jié)點越大代表在評論中共同出現(xiàn)的次數(shù)越多。
圖3 患者在線評論主題圖譜
由圖可見,圖譜中主要形成5種顏色的聚類簇,其中,紅色節(jié)點可以概括為就醫(yī)體驗主題,主要包括與問診相關(guān)的“網(wǎng)上”“門診”“就診”“預(yù)約”,與治療相關(guān)的“治療”“手術(shù)”“檢查”“用藥”,以及與療效相關(guān)的“恢復(fù)”“效果”“好轉(zhuǎn)”“改善”等特征詞。黃色節(jié)點可以歸納為解釋清晰度主題,包括“耐心”“病情”“詳細”“解答”等特征詞。綠色節(jié)點包括“病人”“看病”“照顧”“情緒”“安慰”等與醫(yī)生人文關(guān)懷主題相關(guān)的詞匯。藍色節(jié)點以“醫(yī)生”為中心,分散為兩部分,分別是以服務(wù)態(tài)度為主題的“態(tài)度”“服務(wù)”“熱情”“負責(zé)”“和藹可親”等詞匯,和以醫(yī)術(shù)水平為主題的“醫(yī)術(shù)”“精湛”“高超”“技術(shù)”等詞匯。最后,節(jié)點最少、分散最廣的紫色聚類簇主要包括“感謝”“感激”等與患者滿意度相關(guān)的詞匯。
綜合主題圖譜的顏色分類和特征關(guān)聯(lián)分析可見,患者對在線健康社區(qū)的關(guān)注反映了患者滿意度對應(yīng)的影響因素,除了與情感傾向相關(guān)的聚類主題,大致可以歸納為5個方面。進一步結(jié)合聚類簇中節(jié)點間的關(guān)聯(lián)度、節(jié)點的數(shù)量和大小,可以發(fā)現(xiàn),按照患者滿意度因素的重視程度,這5個主題依次是就醫(yī)體驗、醫(yī)術(shù)水平、服務(wù)態(tài)度、解釋清晰度和人文關(guān)懷。
2.3.3 患者在線評論情感傾向分析
運用ROST CM6軟件中的“情感分析”功能計算27995條患者在線評論的情感得分,根據(jù)量化結(jié)果將情感傾向設(shè)置為好評、中評和差評3個程度,并統(tǒng)計出各情感傾向所占的比例,如表2所示。
表2 各情感傾向所占比例
從表2可見,患者對在線健康社區(qū)的總體滿意度良好。78.54%的評論對就診過程給出了好評,好評率較高,有7.08%的評論持中立態(tài)度,另有14.38%的評論表示了不滿,給出了差評。分析評論情感得分,發(fā)現(xiàn)分數(shù)由-100~+243不等,故考慮對情感傾向進一步細化,將好評和差評的情感得分劃分為3個區(qū)間:絕對值0-10分的為輕度情感傾向,絕對值11-20分的為中度情感傾向,絕對值20分以上的為高度情感傾向,統(tǒng)計結(jié)果如表3所示。
表3 細分情感傾向所占比例(好評和差評數(shù)據(jù))
由表3可見,對于占比較高的好評數(shù)據(jù),其細分情感傾向比較均衡,比例在33.33%上下浮動,充分說明患者對在線健康社區(qū)的就診過程滿意度很高,但大多的好評傾向不是太強烈,所以對于在線健康社區(qū)來說,仍有很大的進步空間。在差評數(shù)據(jù)中,輕度情感傾向占比最高,達79.31%,中度和高度情感傾向的評論所占比例較小,分別為17.88%和2.81%,可以反映出雖然有一定數(shù)量的差評,但是總體程度為輕度,這就要求在線健康社區(qū)需要及時關(guān)注患者就診反饋,實時做出響應(yīng),提高服務(wù)態(tài)度、醫(yī)生技術(shù)水平、人文關(guān)懷和就診體驗滿意度等??傊颊邔υ诰€健康社區(qū)的就診體驗是滿意度較高的,但依據(jù)具體的數(shù)值分析,保持時刻關(guān)注是有必要的。
本文運用主題圖譜和情感分析方法,采集在線健康社區(qū)內(nèi)10種疾病的患者評論文本,挖掘患者在線醫(yī)評的主題和情感傾向,得到以下研究結(jié)論:
(1)基于高頻詞統(tǒng)計和詞云分析,初步判斷患者在線醫(yī)評的關(guān)注熱點集中于服務(wù)態(tài)度、醫(yī)術(shù)水平、就醫(yī)體驗、醫(yī)德醫(yī)風(fēng)等方面,患者對在線健康社區(qū)的就診過程較為滿意。
(2)依據(jù)共現(xiàn)網(wǎng)絡(luò)和主題圖譜方法,深入挖掘患者在線評論主題。研究表明,在線健康社區(qū)患者評論主題按照關(guān)注程度依次是就醫(yī)體驗、醫(yī)術(shù)水平、服務(wù)態(tài)度、解釋清晰度和人文關(guān)懷五個方面,其中就醫(yī)體驗包括從問診到治療和療效的關(guān)注??梢娀颊哧P(guān)注更多的是醫(yī)生的專業(yè)素養(yǎng),即就醫(yī)體驗和醫(yī)術(shù)水平,其次是用戶感知因素,即服務(wù)態(tài)度、解釋清晰度和人文關(guān)懷。
(3)通過情感計算發(fā)現(xiàn)評論中情感傾向為好評的占78.54%,中評占7.08%,差評占14.38%,充分表明患者對在線健康社區(qū)的總體滿意度較高。進一步細分好評和差評數(shù)據(jù)為輕、中、高三個程度,得出好評數(shù)據(jù)中各比例浮動于33.33%上下,還未形成較高的滿意度;在差評數(shù)據(jù)中,輕度占比79.31%,中度和高度占比分別為17.88%和2.81%,可見多數(shù)患者的不滿情緒程度為輕度。
本文具有一定的理論和實踐意義。在理論層面上,基于主題圖譜和情感分析的方法,對患者在線評論進行文本挖掘,較之以往的理論模型和問卷式研究方法,提供了新的研究視角,并且對于該類數(shù)據(jù)的主題挖掘具有非常好的適用性,可以更直觀、有效地揭示在線健康社區(qū)內(nèi)患者關(guān)注內(nèi)容。在實踐層面上,通過在線評論可以快速挖掘患者關(guān)注內(nèi)容和情感傾向,有助于平臺、醫(yī)院及醫(yī)生針對性地改善和提高醫(yī)療服務(wù),以促進在線健康社區(qū)的發(fā)展。
基于上述患者在線醫(yī)評數(shù)據(jù)的主題挖掘和情感計算,為促進互聯(lián)網(wǎng)醫(yī)療的可持續(xù)發(fā)展,本文對醫(yī)生和在線健康社區(qū)平臺提出以下建議:
(1)對于醫(yī)生來講,精進醫(yī)術(shù),提高醫(yī)德。首先,醫(yī)生的醫(yī)術(shù)是滿足患者就醫(yī)需求、治療疾病和提供健康服務(wù)的基礎(chǔ),醫(yī)生應(yīng)該將提高專業(yè)素養(yǎng)以消除患者病癥作為核心任務(wù),即使在隔空就醫(yī)形式下,也可以準確判斷患者病癥,提出可靠的治療方案。其次,醫(yī)生的醫(yī)德、服務(wù)態(tài)度和對患者的人文關(guān)懷,可以幫助患者舒緩情緒并有效提升患者的信任度。醫(yī)生在接診時應(yīng)保持同理心和耐心與患者進行溝通,提高疾病解釋的清晰度,為患者有效地答疑解惑;面對患者就診后的在線點評,及時關(guān)注評論內(nèi)容并與其互動,針對性地做出醫(yī)療服務(wù)調(diào)整。
(2)對于在線健康社區(qū)來講,鼓勵患者進行在線點評的共享行為,并整理評論信息,為平臺、醫(yī)生和潛在患者提供參考。以好大夫在線平臺為例,患者對醫(yī)生的評價以滿意為主,難以幫助用戶進行差異化選擇,故平臺可以根據(jù)患者評論中的關(guān)注點優(yōu)化評價體系。評論數(shù)據(jù)中包含患者的健康需求和就醫(yī)體驗,平臺對其進行整合和挖掘,反饋給醫(yī)生以完善和提供更精準的醫(yī)療服務(wù),并將高價值的共享信息提供給潛在用戶,吸引更多的用戶參與到互動中,促進在線健康社區(qū)的發(fā)展。
此外,本文也存在一定的局限性:一是本文數(shù)據(jù)樣本僅來源于“好大夫”網(wǎng)站,未能融合在線健康社區(qū)內(nèi)的多個平臺數(shù)據(jù)進行實證分析。二是鑒于情感分析的滿意度較高,并未對各主題的情感傾向進行分析。因此,在未來研究中,可以選擇多個在線醫(yī)療社區(qū)平臺、多種數(shù)據(jù)進行主題挖掘、情感分析以及對比分析,并從情感分析的角度對各個主題內(nèi)的數(shù)據(jù)進行情感分析和滿意度研究。