王妞妞,熊回香,劉 櫻
在線問(wèn)診是互聯(lián)網(wǎng)醫(yī)療的一種常見(jiàn)服務(wù)模式。近年來(lái),國(guó)內(nèi)外涌現(xiàn)出一大批在線問(wèn)診平臺(tái),如國(guó)內(nèi)的“好大夫在線”“春雨醫(yī)生”“快速問(wèn)醫(yī)生”等平臺(tái),國(guó)外的Health Tap、American well 和Doctor demand 等平臺(tái)。這些在線問(wèn)診平臺(tái)減少了患者線下就診帶來(lái)的時(shí)間和空間的不便,一定程度上承擔(dān)起公共衛(wèi)生安全知識(shí)的宣傳普及和常見(jiàn)疾病的預(yù)防、科普、診斷等職能。隨著智慧醫(yī)療行業(yè)人工智能、物聯(lián)網(wǎng)等技術(shù)的持續(xù)融合發(fā)展,在線問(wèn)診平臺(tái)在滿足患者日常健康需求方面將發(fā)揮越來(lái)越重要的作用。在線問(wèn)診平臺(tái)提供了醫(yī)患交互接口,并展示了多項(xiàng)醫(yī)生信息供患者決策,有在線健康咨詢需求的患者可以通過(guò)問(wèn)答形式在平臺(tái)上向醫(yī)生描述自身疾病情況,醫(yī)生上線后針對(duì)患者咨詢問(wèn)題給出相應(yīng)診斷和建議,同時(shí)患者也可以通過(guò)瀏覽與自身疾病相似的患者的問(wèn)診過(guò)程為個(gè)人健康問(wèn)題尋找答案。然而,隨著在線問(wèn)診平臺(tái)中醫(yī)生和患者規(guī)模的不斷擴(kuò)大,平臺(tái)產(chǎn)生了海量的相關(guān)信息,患者難以從中識(shí)別并選擇符合自身需求的醫(yī)生。與此同時(shí),多數(shù)在線問(wèn)診平臺(tái)往往通過(guò)醫(yī)生的專業(yè)職稱或臨床經(jīng)驗(yàn)等單一顯性指標(biāo)向患者推薦問(wèn)診醫(yī)生,未充分挖掘利用在線問(wèn)診平臺(tái)數(shù)據(jù),不能充分評(píng)估醫(yī)生的專業(yè)程度和在線活躍程度[1],患者的問(wèn)診需求難以得到精確滿足,很多患者的咨詢也不能得到及時(shí)回復(fù),降低了患者問(wèn)診滿意度,因此,為了向有健康咨詢需求的患者推薦高專業(yè)度和高活躍度的醫(yī)生,本文提出了融合Word2Vec 和層次分析法的醫(yī)生推薦模型,以期滿足患者需求并為完善在線問(wèn)診平臺(tái)的功能提供有益探索。
目前,已有學(xué)者根據(jù)患者和醫(yī)生特征將推薦技術(shù)應(yīng)用于醫(yī)生推薦研究。如有學(xué)者通過(guò)計(jì)算患者咨詢文本與醫(yī)生特征的相似度,為患者推薦醫(yī)生[2];有學(xué)者利用潛在狄利克雷分配(latent Dirichlet allocation,LDA)主題模型和K-means 算法對(duì)醫(yī)生專業(yè)背景進(jìn)行聚類,通過(guò)將患者咨詢內(nèi)容和醫(yī)生專業(yè)背景信息進(jìn)行相似度比較,向患者推薦專業(yè)匹配較高的醫(yī)生類別和醫(yī)生對(duì)象[3];有學(xué)者基于醫(yī)患交互數(shù)據(jù)和醫(yī)生積累的臨床經(jīng)驗(yàn),利用Word2Vec模型和余弦相似度,生成融合相似患者和相似醫(yī)生的醫(yī)生推薦集[4];有學(xué)者通過(guò)計(jì)算疾病相似性和醫(yī)生專業(yè)相似性,尋找隱含的相似疾病和相似醫(yī)生,并提出一種改進(jìn)的矩陣分解方法以提升醫(yī)生推薦的有效性[5];有學(xué)者運(yùn)用labeled-LDA 模型得到概率分布,計(jì)算患者健康問(wèn)題信息與醫(yī)生專長(zhǎng)信息的相似度,為患者推薦匹配度高的醫(yī)生[6];有學(xué)者根據(jù)患者信息和醫(yī)生在社交網(wǎng)絡(luò)中的權(quán)威度進(jìn)行醫(yī)生推薦[7];有學(xué)者通過(guò)挖掘海量咨詢文本,設(shè)計(jì)了基于聚類的協(xié)同過(guò)濾算法,并考慮了醫(yī)生的活躍度,根據(jù)相似病例向患者推薦適合解決這類病例且在線活躍度高的醫(yī)生[8];有學(xué)者運(yùn)用層次分析法(analytic hierarchy process,AHP)建立醫(yī)生患者特征模型,通過(guò)將患者模型與醫(yī)生模型進(jìn)行匹配,從而實(shí)現(xiàn)醫(yī)生推薦[9];有學(xué)者使用層次分析法,以預(yù)約績(jī)效和出診績(jī)效為指標(biāo)建立了醫(yī)生績(jī)效模型,結(jié)合協(xié)同過(guò)濾的思想,提出了一種基于組合模型的醫(yī)生推薦算法,該算法能夠較好滿足患者預(yù)約需求[10];有學(xué)者結(jié)合相似患者、相似醫(yī)生及醫(yī)生績(jī)效3 種條件,深入挖掘醫(yī)患特征,構(gòu)建醫(yī)生推薦模型,并通過(guò)試驗(yàn)證明了該模型具有良好的推薦效果[11]。
當(dāng)前的研究結(jié)果顯示,基于深度學(xué)習(xí)的文本特征提取是充分表達(dá)用戶偏好的關(guān)鍵,Word2Vec 模型將文本用詞以向量的方式表示,通過(guò)向量空間的相似度衡量文本相似度,克服了詞袋表示的不足,能夠挖掘詞與詞之間的關(guān)聯(lián)屬性,從而使語(yǔ)義信息更豐富,可用于醫(yī)患問(wèn)診文本的挖掘[12]。而基于相似患者及醫(yī)生績(jī)效評(píng)價(jià)體系的醫(yī)生推薦雖具備良好的推薦效果,但多數(shù)關(guān)于在線醫(yī)生推薦的研究未充分評(píng)估在線醫(yī)生的專業(yè)度和活躍度,僅依賴醫(yī)生的專業(yè)水平或權(quán)威程度進(jìn)行推薦,忽略了醫(yī)生的其他專業(yè)度指標(biāo)及在線響應(yīng)度,往往容易導(dǎo)致最終推薦結(jié)果不能滿足患者咨詢的及時(shí)性需求。因此,在建立醫(yī)生推薦體系時(shí),有必要從患者決策偏好出發(fā),深入挖掘相似醫(yī)生及醫(yī)生的專業(yè)度指標(biāo)和活躍度指標(biāo)。目前尚未有融合Word2Vec 模型和層次分析法的醫(yī)生推薦研究?;诖耍疚臄M通過(guò)Word2Vec 模型深入挖掘患者咨詢文本及已有醫(yī)患就診映射關(guān)系,得到相似患者的醫(yī)生推薦序列;然后根據(jù)醫(yī)生的專業(yè)度指標(biāo)和活躍度指標(biāo)構(gòu)建層次分析法模型,充分表征患者決策多維屬性,實(shí)現(xiàn)更符合患者偏好的醫(yī)生推薦,從而向有健康咨詢需求的患者推薦高專業(yè)度和高活躍度的在線醫(yī)生,提高在線問(wèn)診平臺(tái)服務(wù)質(zhì)量。
“好大夫在線”平臺(tái)創(chuàng)立于2006 年,是國(guó)內(nèi)領(lǐng)先的在線問(wèn)診平臺(tái)之一。截至2021 年7 月,“好大夫在線”平臺(tái)已累計(jì)服務(wù)超過(guò)7 200 萬(wàn)名患者[13]。該平臺(tái)于2020 年10 月份在患者咨詢界面加入“相關(guān)文章”和“相關(guān)問(wèn)診”推薦模塊,后改為“相關(guān)推薦”模塊,便于用戶找到相似患者,也起到了醫(yī)生推薦的作用,但仍然存在相關(guān)問(wèn)診文本相似度不高、相關(guān)醫(yī)生擅長(zhǎng)科目不同、推薦醫(yī)生活躍度不高和推薦結(jié)果中含有無(wú)診療經(jīng)驗(yàn)醫(yī)生的問(wèn)題。因此,基于該平臺(tái)服務(wù)水平,本著為該網(wǎng)站的進(jìn)一步優(yōu)化提供可行建議的目的,本文選擇“好大夫在線”平臺(tái)作為實(shí)證對(duì)象,驗(yàn)證本文提出的模型的適用性和可靠性。
從“好大夫在線”平臺(tái)上的“按疾病”查找導(dǎo)航模塊采集數(shù)據(jù),選擇“神經(jīng)內(nèi)科常見(jiàn)疾病”中的“頭暈”作為實(shí)證研究對(duì)象。為了保證在線醫(yī)生的活躍度,本文利用Python 網(wǎng)絡(luò)爬蟲(chóng)獲取“推薦醫(yī)生”界面的醫(yī)生自2020 年9 月1 日至11 月7 日的全部問(wèn)診數(shù)據(jù)記錄[14],共采集到249 名醫(yī)生的基本信息數(shù)據(jù)和37 276 條患者相關(guān)數(shù)據(jù)(表1、表2),這部分?jǐn)?shù)據(jù)是對(duì)海量醫(yī)患信息的初步篩選,有利于精確定位符合用戶偏好的高活躍度醫(yī)生。其中與醫(yī)生相關(guān)的數(shù)據(jù)項(xiàng)包括醫(yī)生姓名、醫(yī)生職稱、綜合推薦熱度、在線服務(wù)滿意度、在線問(wèn)診量、科普文章數(shù)量、感謝信數(shù)量、心意禮物數(shù)及上次在線時(shí)間;患者相關(guān)的數(shù)據(jù)包括在線咨詢文本(包括患者疾病描述、疾病、醫(yī)患對(duì)話數(shù)、問(wèn)診日期)和患者其他特征(患病時(shí)長(zhǎng)、懷孕情況、過(guò)敏史)。需要說(shuō)明的是,患者在“好大夫在線”平臺(tái)咨詢時(shí),需提供其疾病描述和疾病名稱,如果不確定疾病名稱,則需要提供2~20 字以內(nèi)的主要疾病癥狀,實(shí)際上是一種短文本類型的疾病描述。本文按照該網(wǎng)站規(guī)定,將疾病名稱和主要疾病癥狀統(tǒng)稱為“疾病”。此外,為了保障醫(yī)生、患者的隱私及權(quán)益,本文在推薦過(guò)程中用醫(yī)生編號(hào)和患者編號(hào)代替姓名數(shù)據(jù)項(xiàng)。
表1 部分醫(yī)生基本信息數(shù)據(jù)集
表2 部分患者咨詢文本及基本信息數(shù)據(jù)集
為便于數(shù)據(jù)分析,提高醫(yī)生推薦質(zhì)量,需進(jìn)行必要的數(shù)據(jù)預(yù)處理工作。因此,本文在將表1 數(shù)據(jù)中的重復(fù)值剔除后,將醫(yī)患對(duì)話數(shù)少于2、醫(yī)生被咨詢文本少于5、無(wú)法獲取臨床經(jīng)驗(yàn)、上次在線時(shí)間為1 個(gè)月之前的醫(yī)生全部剔除,并清理無(wú)實(shí)際意義的咨詢文本數(shù)據(jù)記錄,如“今天己復(fù)診”“今天去您那看病”“因我打字太慢,我把病情概述和檢查結(jié)果及目前用藥都拍照上傳給您了……不好意思給您添麻煩了”等文本。預(yù)處理后篩選得到141條醫(yī)生記錄,以及21 291 條患者咨詢文本。
為構(gòu)建醫(yī)生診斷能力層次分析法模型,需要對(duì)醫(yī)生基本數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。首先,按照公式(1)對(duì)綜合推薦度、在線滿意度、總患者數(shù)、總文章數(shù)、感謝信數(shù)、心意禮物數(shù)等做歸一化處理,將上述數(shù)據(jù)映射為(0,1)區(qū)間的小數(shù),避免不同數(shù)量級(jí)對(duì)最終結(jié)果的影響;其次,將醫(yī)生職稱從高到低排序,轉(zhuǎn)化為數(shù)字表示,將主任醫(yī)師標(biāo)記為1,副主任醫(yī)師標(biāo)記為0.5,主治醫(yī)生標(biāo)記為0.35;最后,標(biāo)識(shí)醫(yī)生最后在線時(shí)間,按照上次上線時(shí)間從近到遠(yuǎn)活躍度水平依次遞減的順序,將在線時(shí)間為今天標(biāo)記為1、1 天前標(biāo)記為0.8、2 天前標(biāo)記為0.6、3 天前標(biāo)記為0.4、4 天前標(biāo)記為0.2,其他時(shí)間均標(biāo)記為0.1。最終處理后的醫(yī)生基本數(shù)據(jù)如表3 所示,患者基本數(shù)據(jù)如表4 所示。
表3 預(yù)處理后醫(yī)生基本數(shù)據(jù)表示
表4 預(yù)處理后患者基本數(shù)據(jù)表示
續(xù)表4
本文融合Word2Vec 和層次分析法構(gòu)建醫(yī)生推薦模型,主要分為基于Word2Vec 的醫(yī)生推薦、基于層次分析法的醫(yī)生推薦、融合Word2Vec 和層次分析法的醫(yī)生推薦3 部分。具體模型如圖1所示。
圖1 融合Word2Vec 和層次分析法的醫(yī)生推薦框架
基于Word2Vec 的醫(yī)生推薦。對(duì)從在線問(wèn)診平臺(tái)上獲取到的患者咨詢文本數(shù)據(jù)(包括疾病描述和疾病2 個(gè)數(shù)據(jù)項(xiàng))進(jìn)行篩選剔除、分詞、去停用詞等預(yù)處理操作,借助Word2Vec 模型將咨詢文本轉(zhuǎn)化為詞向量,通過(guò)計(jì)算詞向量之間的余弦相似度,得到與目標(biāo)患者咨詢文本相似度較高的患者集合A。然后根據(jù)患者的患病、是否懷孕等特征,篩除集合A 中的部分患者,得到相似患者集合B。依據(jù)患者和醫(yī)生的實(shí)際問(wèn)診關(guān)系,得到醫(yī)生候選集C。
基于層次分析法的醫(yī)生推薦。將從在線問(wèn)診平臺(tái)上獲取的醫(yī)生基本數(shù)據(jù)項(xiàng)分為專業(yè)度指標(biāo)和活躍度指標(biāo),構(gòu)建層次分析法評(píng)價(jià)模型,得到每位醫(yī)生的診斷水平評(píng)分,按照評(píng)分從高至低排序,輸出醫(yī)生推薦序列D。
融合Word2Vec 和層次分析法的醫(yī)生推薦序列,綜合上述2 項(xiàng)醫(yī)生排名,得到最終醫(yī)生推薦集合E,供目標(biāo)患者參考。
Word2Vec 是Tomas Mikolov 團(tuán)隊(duì)在2013 年提出的用于快速有效地訓(xùn)練詞向量的模型[15]。Word2Vec 能夠從海量的文檔數(shù)據(jù)中學(xué)習(xí)出高質(zhì)量的詞向量,該詞向量在語(yǔ)義和句法上都有很好的表現(xiàn),因此該模型已被廣泛應(yīng)用于自然語(yǔ)言處理的各種任務(wù)中。本文基于Word2Vec 進(jìn)行患者咨詢文本相似度計(jì)算,將患者咨詢文本轉(zhuǎn)化為向量形式,通過(guò)計(jì)算空間中向量的相似度來(lái)表示文本語(yǔ)義上的相似度。當(dāng)前主要有Continuous Bag-of-Word(CBOW)和Skip-gram 2 種訓(xùn)練模型,其中CBOW 模型根據(jù)中心詞周圍的詞來(lái)預(yù)測(cè)中心詞,Skip-gram 模型則根據(jù)中心詞來(lái)預(yù)測(cè)周圍詞。在Skip-gram 模型中,每個(gè)詞均受到周圍詞的影響,每個(gè)詞作為中心詞時(shí)都需要進(jìn)行多次的預(yù)測(cè)、調(diào)整,這種多次調(diào)整會(huì)使詞向量更加準(zhǔn)確。因此,本文選擇以Skip-gram 模型作為訓(xùn)練模型,將初始患者咨詢文本集合(37 276條患者咨詢文本記錄)作為訓(xùn)練語(yǔ)料,預(yù)處理后的咨詢文本集合(21 291 條患者咨詢文本記錄)作為測(cè)試語(yǔ)料。用戶在“好大夫在線”平臺(tái)問(wèn)診時(shí),需提供其疾病名稱及疾病描述,本文將這2 類數(shù)據(jù)統(tǒng)稱為“患者咨詢文本”。為更精確地衡量患者相似水平,本文綜合考慮疾病描述和疾病2 類數(shù)據(jù)相似度,并賦予相應(yīng)權(quán)重得到最終相似度。根據(jù)2 類數(shù)據(jù)的實(shí)際文本長(zhǎng)度,設(shè)置疾病描述詞向量維數(shù)為100,疾病詞向量維數(shù)為10,得到患者疾病描述向量表示和疾病向量表示(表5、表6)。
表5 患者疾病描述向量表示
表6 患者疾病向量表示
根據(jù)表5 和表6 中的向量表示,計(jì)算向量之間的余弦相似度,得到患者咨詢文本的相似度。本文認(rèn)為患者會(huì)將更多的患病信息表述在疾病描述中,同時(shí)根據(jù)實(shí)際測(cè)試,當(dāng)為疾病描述相似度和疾病相似度分別賦予0.7 和0.3 的權(quán)值時(shí),得到的患者病情相似度更為精確,其結(jié)果如表7 所示。
表7 患者病情相似度
為直觀顯示本模型的推薦過(guò)程,又不失一般性,本文隨機(jī)選擇第5609 號(hào)患者作為目標(biāo)患者,該患者的疾病描述為“近半個(gè)月來(lái)總是感覺(jué)頭暈,早上起來(lái)好點(diǎn),越到后面感覺(jué)越明顯,頭暈的感覺(jué)不是天旋地轉(zhuǎn)的那種暈,就是走路不穩(wěn)、老想摔倒的感覺(jué)?!逼浼膊?yīng)為“雙側(cè)額葉及左側(cè)頂葉缺血灶、頭暈、手麻”。現(xiàn)根據(jù)前文所述的患者疾病相似度計(jì)算方法,尋找與該患者相似的其他患者,根據(jù)已有的醫(yī)患問(wèn)診關(guān)系,向該患者推薦可接診醫(yī)生。多次試驗(yàn)測(cè)試發(fā)現(xiàn),當(dāng)設(shè)置相似度閾值μ=0.76時(shí),既確保了患者之間較高的相似性又保證了相似患者的數(shù)量在可接受范圍內(nèi)。依據(jù)設(shè)定閾值得到相似患者集合A,總計(jì)3 723 名患者(表8)。
表8 與第5609 號(hào)患者相似的患者集合A
同時(shí)考慮第5609 號(hào)患者患病時(shí)長(zhǎng)為“半年內(nèi)”,“未懷孕”且無(wú)“過(guò)敏”和他病史,針對(duì)上述特征,篩除患病時(shí)長(zhǎng)“大于半年”,“懷孕”及有過(guò)敏史患者,得到相似患者集合B,總計(jì)1 601名相似患者(表9)。
表9 與第5609 號(hào)患者相似的患者集合B
根據(jù)相似患者集合B 與醫(yī)生的實(shí)際問(wèn)診關(guān)系,找到集合B 中患者問(wèn)診過(guò)的醫(yī)生,然后將患者按照為其問(wèn)診過(guò)的醫(yī)生姓名分類,計(jì)算出每位醫(yī)生類別下診斷過(guò)的相似患者的相似度均值,作為這些患者與第5609 號(hào)患者的病情相似度,按照相似度遞減順序排列生成共含有111 名醫(yī)生的醫(yī)生推薦序列C(表10)。如隨機(jī)抽取相似患者集合B 中第17704 號(hào)患者,該患者實(shí)際咨詢過(guò)的是編號(hào)為84的醫(yī)生(即“醫(yī)生84”),同時(shí)編號(hào)集合{17708、17710、17716、17720、17724、17725}中的患者也咨詢過(guò)“醫(yī)生84”,則將{17704、17708、17710、17716、17720、17724、17725}集合的患者以醫(yī)生姓名劃分,歸為一類,將這些患者與第5609 號(hào)患者的咨詢文本相似度均值0.873 作為該類患者與5609 號(hào)患者的相似度。
表10 第5609 號(hào)患者的醫(yī)生推薦序列C
層次分析法是由美國(guó)運(yùn)籌學(xué)家 Thomas L.Saaty 于20 世紀(jì)70 年代初應(yīng)用網(wǎng)絡(luò)系統(tǒng)理論和多目標(biāo)綜合評(píng)價(jià)方法提出的一種定性與定量相結(jié)合的、系統(tǒng)化、層次化的分析方法[16]。該方法將與決策有關(guān)的元素分解成目標(biāo)、準(zhǔn)則、方案等層次,在此基礎(chǔ)上進(jìn)行定性和定量分析,具有系統(tǒng)、靈活、簡(jiǎn)潔的優(yōu)點(diǎn),適用于具有分層交錯(cuò)評(píng)價(jià)指標(biāo)的目標(biāo)系統(tǒng)[17],現(xiàn)已在資源分配、選優(yōu)排序、績(jī)效考核等領(lǐng)域廣泛應(yīng)用。本文借助層次分析法建立醫(yī)生診斷能力評(píng)分體系,旨在綜合考量醫(yī)生的專業(yè)指標(biāo)和活躍程度,為患者提供更可靠的推薦服務(wù)。具體步驟如下。
步驟1:建立遞階層次結(jié)構(gòu)模型。建立評(píng)價(jià)體系前,需將全部指標(biāo)條理化、層次化,構(gòu)造出一個(gè)有層次的結(jié)構(gòu)模型(圖2),這些層次可以分為最高層(目標(biāo)層)、中間層(準(zhǔn)則層)、底層(方案層)。本文將醫(yī)生診斷能力評(píng)分體系構(gòu)建作為目標(biāo)層,以專業(yè)度指標(biāo)和活躍度指標(biāo)2 項(xiàng)準(zhǔn)則為中間層。本文在專業(yè)度指標(biāo)下設(shè)置了醫(yī)生職稱、患者數(shù)、心意禮物數(shù)、感謝信數(shù)、綜合推薦熱度和滿意度6 個(gè)指標(biāo),在活躍度指標(biāo)下設(shè)置了綜合推薦熱度、滿意度、科普文章數(shù)量和上次在線時(shí)間4 個(gè)指標(biāo),符合基本認(rèn)知。
圖2 醫(yī)生診斷能力評(píng)分體系遞階層次結(jié)構(gòu)模型
步驟2:構(gòu)建各層次中的所有判斷矩陣。根據(jù)步驟1 中構(gòu)建的遞階層次結(jié)構(gòu),將同一層內(nèi)各個(gè)指標(biāo)進(jìn)行兩兩重要性對(duì)比,得到準(zhǔn)則層的判斷矩陣Z,以及方案層的判斷矩陣F1、F2,F(xiàn)1代表專業(yè)度指標(biāo)這一準(zhǔn)則下6 個(gè)方案的重要程度判斷矩陣,F(xiàn)2代表活躍度指標(biāo)這一準(zhǔn)則下4 個(gè)方案的重要程度判斷矩陣。判斷矩陣中第i行j列的元素aij代表第i行表示的指標(biāo)重要程度與第j列表示的指標(biāo)重要程度的比值。通常情況下我們選擇表11 所示的標(biāo)度進(jìn)行度量。為保證判斷矩陣的可信度,本文前期調(diào)研了一定數(shù)量的“好大夫在線”平臺(tái)用戶,收集了用這些用戶構(gòu)建的3 個(gè)判斷矩陣,并對(duì)各分量求均值,得到最終的判斷矩陣Z、F1、F2。其中,矩陣Z中數(shù)值1.433 代表調(diào)研用戶認(rèn)為在選擇在線醫(yī)生時(shí),專業(yè)度指標(biāo)的重要程度是活躍度指標(biāo)重要程度的1.433 倍,其他元素同理。
表11 判斷矩陣標(biāo)度定義
表12 平均隨機(jī)一致性指標(biāo)
步驟4:各指標(biāo)權(quán)重計(jì)算。層次分析法中權(quán)重的計(jì)算有幾何平均法、算術(shù)平均法、特征向量法和最小二乘法4 種。在本步驟中利用算術(shù)平均法依次計(jì)算出各指標(biāo)的權(quán)重(表13 至表16)。
表13 目標(biāo)層醫(yī)生診斷能力評(píng)價(jià)體系判斷矩陣及各指標(biāo)的權(quán)重
表14 準(zhǔn)則層專業(yè)度指標(biāo)判斷矩陣及各指標(biāo)的權(quán)重
表15 準(zhǔn)則層活躍度指標(biāo)判斷矩陣及各指標(biāo)的權(quán)重
表16 方案層各指標(biāo)的最終權(quán)重
利用方案層各指標(biāo)對(duì)醫(yī)生診斷能力的權(quán)重(表16)對(duì)表3 中的各項(xiàng)數(shù)據(jù)進(jìn)行賦權(quán),得到醫(yī)生診斷能力評(píng)分結(jié)果及排序(表17),即“醫(yī)生推薦序列D”。
表17 醫(yī)生診斷能力評(píng)分結(jié)果及醫(yī)生推薦序列D
利用Word2Vec 計(jì)算出患者相似度,生成醫(yī)生推薦序列C;通過(guò)層次分析法,綜合考慮醫(yī)生的專業(yè)度指標(biāo)和活躍度指標(biāo),得到醫(yī)生推薦序列D。對(duì)醫(yī)生推薦序列C 和醫(yī)生推薦序列D 中同一醫(yī)生的排名進(jìn)行相加,按照排名之和輸出醫(yī)生推薦序列E(表18),按照最終排名輸出前10 名醫(yī)生作為向第5609 號(hào)患者推薦的醫(yī)生集合。
表18 醫(yī)生推薦序列E
假定第5609 號(hào)患者尚未就診,根據(jù)咨詢文本和醫(yī)生診斷能力評(píng)分體系向該患者推薦的醫(yī)生集合為{118,29,131,18,78,108,81,129,117,104}。醫(yī)患實(shí)際問(wèn)診結(jié)果顯示,為其接診的是編號(hào)為78 的醫(yī)生,在推薦集合內(nèi),說(shuō)明該推薦結(jié)果可以很好地滿足患者需求。本文將疾病名稱作為醫(yī)生的特征表示,計(jì)算醫(yī)生之間的臨床相似度,再抽取上述集合中醫(yī)生之間的相似度(表19)。結(jié)果顯示,該推薦集中的醫(yī)生普遍具備較高的專業(yè)水平相似度,能夠較好地滿足患者的診斷需要,并且所推薦醫(yī)生的活躍程度都很高,能夠及時(shí)響應(yīng)患者的咨詢需求。
表19 推薦醫(yī)生的臨床經(jīng)驗(yàn)相似度
續(xù)表19
為證明該推薦模型的普適性,本文隨機(jī)生成20 位患者編號(hào)集合{14801,10598,1742,10618,15363,10557,13266,7083,12578,2644,6952,16041,3054,5776,17403,1846,4819,2854,5900,2165}作為測(cè)試集。將測(cè)試集分成2 組進(jìn)行試驗(yàn)。第一組,根據(jù)相似患者的疾病描述和疾病相似度,得到相似度較高的前10 名醫(yī)生,若該患者實(shí)際就診的醫(yī)生F 在推薦列表里,并滿足其他推薦醫(yī)生與實(shí)際就診醫(yī)生F 的臨床經(jīng)驗(yàn)相似度高于0.9 這一條件,且保證推薦醫(yī)生最近在線時(shí)間為今天,則說(shuō)明推薦成功,滿足上述條件的醫(yī)生數(shù)量記做實(shí)際有效推薦數(shù)量;若不滿足上述條件,則說(shuō)明推薦失敗。第二組,按照本文所提融合Word2Vec和層次分析法的醫(yī)生推薦模型,依次完成推薦,最終推薦結(jié)果若滿足第一組試驗(yàn)中推薦成功的標(biāo)準(zhǔn),則代表推薦成功,反之則代表推薦失敗。計(jì)算出每組試驗(yàn)的有效推薦比例,記為本次試驗(yàn)準(zhǔn)確率(圖3)。從圖3 可以看出,融合Word2Vec和層次分析法的醫(yī)生推薦模型優(yōu)于只考慮相似度的推薦方式。
圖3 兩組試驗(yàn)的準(zhǔn)確率測(cè)試結(jié)果
近年來(lái),我國(guó)積極推進(jìn)的“健康中國(guó)”戰(zhàn)略及醫(yī)療服務(wù)供給側(cè)改革已取得一定成效,但仍存在醫(yī)患交流時(shí)效低下、醫(yī)療資源分配不均和就醫(yī)流程繁瑣等問(wèn)題,在線問(wèn)診平臺(tái)的出現(xiàn)為解決上述困境開(kāi)辟了一種新思路[18]。對(duì)用戶來(lái)說(shuō),從在線問(wèn)診平臺(tái)尋求合適的醫(yī)生是他們最關(guān)注的問(wèn)題,醫(yī)生的專業(yè)度和活躍度通過(guò)影響用戶的“感知成本”和“感知信任”成為導(dǎo)致用戶發(fā)表負(fù)面評(píng)論的關(guān)鍵因素[19]。本文從當(dāng)前“好大夫在線”平臺(tái)相關(guān)問(wèn)診推薦模塊存在的“推薦問(wèn)診文本相似度較低”“推薦醫(yī)生活躍度不高”等問(wèn)題入手,提出了融合Word2Vec 和層次分析法的醫(yī)生推薦模型。利用網(wǎng)絡(luò)爬蟲(chóng)技術(shù)抓取醫(yī)生、患者的多重特征,綜合考慮文本、數(shù)值類型,進(jìn)行實(shí)證研究,結(jié)果顯示該模型綜合考慮了醫(yī)生的專業(yè)程度和活躍程度,可以更加有效地評(píng)估醫(yī)生能力,具備較好的推薦效果,可以作為該網(wǎng)站下一步優(yōu)化完善的可行思路。此外,融合Word2Vec 和層次分析法的醫(yī)生推薦模型也可進(jìn)一步適用于其他如“春雨醫(yī)生”等在線問(wèn)診平臺(tái),這些問(wèn)診平臺(tái)都包含醫(yī)患問(wèn)診文本及醫(yī)生專業(yè)度和活躍度信息,同樣適用于該模型的推薦體系。但本文也存在一定不足,在構(gòu)建層次分析法模型時(shí),調(diào)研用戶量不夠大,今后可考慮進(jìn)一步擴(kuò)大調(diào)研范圍,完善優(yōu)化判斷矩陣構(gòu)建過(guò)程,優(yōu)化推薦模型。