摘 要:為響應(yīng)“健康中國(guó)”建設(shè)號(hào)召,文章以專利數(shù)據(jù)為依據(jù)揭示我國(guó)智慧健康服務(wù)領(lǐng)域當(dāng)前的研究熱點(diǎn),探索智慧健康服務(wù)領(lǐng)域發(fā)展趨勢(shì)。以Innojoy專利數(shù)據(jù)庫(kù)中的智慧健康相關(guān)數(shù)據(jù)為數(shù)據(jù)來源,通過LDA模型對(duì)原始語(yǔ)料進(jìn)行主題識(shí)別提取,運(yùn)用主題強(qiáng)度計(jì)算公式得出熱點(diǎn)主題進(jìn)行分析。智慧健康服務(wù)處于發(fā)展的平穩(wěn)時(shí)期,并向著多技術(shù)融合、多部門聯(lián)合的方向發(fā)展,現(xiàn)階段共有智慧醫(yī)療大數(shù)據(jù)服務(wù)平臺(tái)、智慧健康信息服務(wù)平臺(tái)、智慧醫(yī)療設(shè)備、智慧醫(yī)療文本處理系統(tǒng)四大研究熱點(diǎn)。今后智慧健康服務(wù)的發(fā)展應(yīng)以用戶為中心,提供供需適配的服務(wù),且需不斷完善相關(guān)法律法規(guī)以創(chuàng)造一個(gè)規(guī)范有序的發(fā)展環(huán)境。
關(guān)鍵詞:專利數(shù)據(jù);數(shù)據(jù)挖掘;LDA主題模型;智慧健康服務(wù)
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2024)08-0161-06
DOI:10.19850/j.cnki.2096-4706.2024.08.035
0 引 言
自《“健康中國(guó)2030”規(guī)劃綱要》發(fā)布,至黨的十九大對(duì)“健康中國(guó)戰(zhàn)略”作出全面部署,以習(xí)近平同志為中心的黨中央堅(jiān)持把保障人民健康放在優(yōu)先發(fā)展的戰(zhàn)略位置,從源頭維護(hù)人民群眾的生命健康?!丁敖】抵袊?guó)2030”規(guī)劃綱要》中指出“要推動(dòng)‘互聯(lián)網(wǎng)+健康醫(yī)療’服務(wù)、加強(qiáng)健康醫(yī)療大數(shù)據(jù)應(yīng)用體系建設(shè)從而推進(jìn)醫(yī)療健康大數(shù)據(jù)開放共享、深度挖掘和廣泛應(yīng)用”[1]。隨著人工智能技術(shù)、大數(shù)據(jù)分析技術(shù)、機(jī)器學(xué)習(xí)等技術(shù)的不斷發(fā)展進(jìn)步,中國(guó)迎來了數(shù)智化轉(zhuǎn)型的新路徑、新挑戰(zhàn)。充分融合當(dāng)前5G、大數(shù)據(jù)、區(qū)塊鏈等技術(shù),建立集成共享、業(yè)務(wù)協(xié)同的健康信息服務(wù)平臺(tái),實(shí)現(xiàn)從醫(yī)療健康服務(wù)到智慧健康服務(wù)的轉(zhuǎn)型,為國(guó)民帶來便利的同時(shí)滿足國(guó)民個(gè)性化的健康服務(wù)需求。新興技術(shù)的應(yīng)用給予了智慧健康服務(wù)更豐富的服務(wù)場(chǎng)景,與此同時(shí)也給智慧健康服務(wù)提出了更高的要求,如何在快速更新迭代的技術(shù)中找尋關(guān)鍵技術(shù)以及創(chuàng)新技術(shù)是當(dāng)前智慧健康服務(wù)面臨的一個(gè)重點(diǎn)難題。專利是技術(shù)情報(bào)較有效的載體和來源之一,通過對(duì)專利信息的計(jì)量,能夠識(shí)別技術(shù)領(lǐng)域發(fā)展?fàn)顩r,探查競(jìng)爭(zhēng)對(duì)手及其技術(shù)創(chuàng)新活動(dòng)和能力,并判斷技術(shù)競(jìng)爭(zhēng)態(tài)勢(shì)[2]。因此本文將基于專利數(shù)據(jù)庫(kù)中的專利數(shù)據(jù),應(yīng)用LDA主題模型對(duì)其中智慧健康服務(wù)專利進(jìn)行主題識(shí)別并分析當(dāng)前的技術(shù)熱點(diǎn),了解智慧健康服務(wù)發(fā)展現(xiàn)狀,結(jié)合當(dāng)前政策信息提出建議供參考。
1 相關(guān)研究
1.1 專利數(shù)據(jù)挖掘
專利挖掘是在技術(shù)研發(fā)中,對(duì)所取得的技術(shù)成果從技術(shù)和法律層面進(jìn)行剖析、整理、分析和篩選,從而確定用以申請(qǐng)專利的技術(shù)創(chuàng)新點(diǎn)和技術(shù)方案[3]。當(dāng)前專利挖掘的應(yīng)用主要分為5個(gè)方面,即專利知識(shí)表示、專利相似度計(jì)算、專利聚類、技術(shù)主題識(shí)別以及鏈路預(yù)測(cè)[4]。在專利知識(shí)表示方面,學(xué)者通常采用自然語(yǔ)言處理技術(shù)對(duì)專利文本內(nèi)的知識(shí)進(jìn)行編碼識(shí)別,如Word2Vec [5]、Sentence-BERT [6]、Context-LDA [7]算法等。專利相似度的計(jì)算則主要通過余弦相似度計(jì)算,如向姝璇通過結(jié)合專利IPC分類相似度計(jì)算以及對(duì)獨(dú)立權(quán)利要求相似度計(jì)算對(duì)我國(guó)5G領(lǐng)域企業(yè)現(xiàn)有或潛在的競(jìng)爭(zhēng)對(duì)手進(jìn)行挖掘發(fā)現(xiàn)[8],李家全等人利用知識(shí)圖譜的方法計(jì)算專利文本之間的相似度來判斷專利是否侵權(quán)[9]。專利聚類以及專利主題識(shí)別則分別幫我們解決了如何識(shí)別關(guān)鍵技術(shù)集群、如何識(shí)別熱門核心技術(shù)主題的問題,以輔助我們掌握專利技術(shù)發(fā)展的態(tài)勢(shì)。專利聚類以及專利主題識(shí)別常用的方法有LDA算法[10]、深度文本聚類模型[11]、決策樹[12]等。專利鏈路預(yù)測(cè)則通過當(dāng)前技術(shù)的關(guān)聯(lián)關(guān)系來預(yù)測(cè)網(wǎng)絡(luò)中尚未連接的兩個(gè)技術(shù)節(jié)點(diǎn)之間產(chǎn)生鏈接的可能性[13]。
1.2 智慧健康服務(wù)
智慧健康服務(wù)從傳統(tǒng)的健康服務(wù)演變而來,其強(qiáng)調(diào)的是數(shù)智時(shí)代中物聯(lián)網(wǎng)技術(shù)、人工智能技術(shù)、云計(jì)算技術(shù)等新興技術(shù)在健康服務(wù)中的應(yīng)用。馬費(fèi)成教授指出智慧健康是一門交叉學(xué)科,涵蓋較多領(lǐng)域,包括“互聯(lián)網(wǎng)醫(yī)療”“移動(dòng)健康”“智慧醫(yī)療”等概念,其核心都是利用現(xiàn)代化信息技術(shù)和智能技術(shù),對(duì)傳統(tǒng)醫(yī)療健康管理模式進(jìn)行改進(jìn)[14]。目前國(guó)內(nèi)學(xué)者對(duì)于智慧健康服務(wù)的研究主要集中于健康大數(shù)據(jù)研究、智慧健康服務(wù)平臺(tái)的建設(shè)、智慧健康服務(wù)影響因素研究。隨著在線健康社區(qū)、電子健康檔案、遠(yuǎn)程服務(wù)等方式被人們所接受,個(gè)人健康數(shù)據(jù)的存儲(chǔ)和分析成為研究的熱點(diǎn)之一,如利用醫(yī)療大數(shù)據(jù)構(gòu)建人機(jī)協(xié)同醫(yī)療案例庫(kù)[15]、利用大數(shù)據(jù)對(duì)高血壓癥候進(jìn)行分析[16]。智慧健康服務(wù)平臺(tái)的建設(shè)則是以健康大數(shù)據(jù)為基礎(chǔ)建立智能服務(wù)平臺(tái)為服務(wù)對(duì)象提供一個(gè)便利的應(yīng)用平臺(tái),如夏思洋等學(xué)者以多源數(shù)據(jù)融合技術(shù)為基礎(chǔ)構(gòu)建了面向老年人的智慧健康信息服務(wù)系統(tǒng)[17],初佃輝等學(xué)者研發(fā)開放式智能服務(wù)平臺(tái)架構(gòu)實(shí)現(xiàn)醫(yī)療健康與養(yǎng)老服務(wù)的深度融合[18]。智慧健康服務(wù)影響因素研究以被服務(wù)對(duì)象的需求為導(dǎo)向探究影響智慧健康服務(wù)能否被接受的主要因素。
通過上述梳理可發(fā)現(xiàn),當(dāng)前國(guó)內(nèi)學(xué)者將專利挖掘應(yīng)用于多領(lǐng)域的技術(shù)主題識(shí)別中,但是僅有較少的學(xué)者以專利挖掘?yàn)榛A(chǔ)研究智慧健康服務(wù)領(lǐng)域的相關(guān)技術(shù)。因此本文將以專利數(shù)據(jù)庫(kù)中的專利文本數(shù)據(jù)為基礎(chǔ),運(yùn)用LDA主題模型識(shí)別專利數(shù)據(jù)中的技術(shù)主題并提取該領(lǐng)域的熱點(diǎn)研究主題進(jìn)行分析,以掌握當(dāng)前智慧健康服務(wù)領(lǐng)域的研究熱點(diǎn)、發(fā)展現(xiàn)狀,探尋未來研究導(dǎo)向。
2 研究思路及研究方法
2.1 研究思路
本文擬從Innojoy專利數(shù)據(jù)庫(kù)檢索得到相關(guān)智慧健康服務(wù)相關(guān)專利發(fā)明數(shù)據(jù),導(dǎo)出專利所對(duì)應(yīng)的分類號(hào)、摘要、時(shí)間等信息,對(duì)所得的相關(guān)專利文本進(jìn)行切分詞、去除停用詞等文本與處理得到原始語(yǔ)料。通過LDA模型對(duì)原始語(yǔ)料進(jìn)行主題識(shí)別提取,并運(yùn)用困惑度指標(biāo)來確定最優(yōu)主題數(shù),根據(jù)提取的主題詞對(duì)各主題進(jìn)行標(biāo)識(shí),最后對(duì)主題強(qiáng)度進(jìn)行計(jì)算得到智慧健康服務(wù)領(lǐng)域熱點(diǎn)主題進(jìn)行分析。
2.2 LDA主題模型
LDA模型是一種無監(jiān)督學(xué)習(xí)技術(shù),通過吉布斯采樣算法識(shí)別分析非結(jié)構(gòu)化文本數(shù)據(jù)中的詞語(yǔ)信息對(duì)一系列文檔中的主題進(jìn)行抽象和聚類,是當(dāng)前文本主題挖掘最常用的方法。LDA模型主要包含特征詞、主題、文檔三層結(jié)構(gòu),模型假設(shè)每一文檔均由一定數(shù)量的隱含主題構(gòu)成,每一主題又由一定數(shù)量的特征詞構(gòu)成,并根據(jù)主題對(duì)文檔的支持權(quán)重、特征詞對(duì)主題的選擇概率來判斷三者之間的關(guān)聯(lián)程度。LDA模型示例圖如圖1所示,其中D是文檔集合。首先從狄利克雷分布α中選取生成文檔d的主題分布θ,再?gòu)闹黝}分布θ中選取生成文檔d第n個(gè)詞的主題Z,接著從狄利克雷分布β中選取生成主題Z的詞語(yǔ)分布φ,再?gòu)脑~語(yǔ)分布φ中生成詞語(yǔ)W。重復(fù)以上過程至得到文檔D中每一個(gè)特征詞為止。
LDA模型主題的最佳個(gè)數(shù)本文將采用困惑度(Perplexity)來進(jìn)行確定。困惑度通常用于衡量主題模型在新文本數(shù)據(jù)上的擬合程度,是當(dāng)前公認(rèn)判斷最優(yōu)主題數(shù)的重要指標(biāo),其計(jì)算式如下:
其中D是測(cè)試文檔集合,N是測(cè)試文檔數(shù)量,Nd是第d個(gè)文檔中單詞的數(shù)量,Wd是第d個(gè)文檔中的單詞序列,p(Wd)是模型對(duì)文檔Wd的似然概率。困惑度越小則代表模型對(duì)樣本文檔集的分類效果越好,反之困惑度越大則模型效果越差。
主題強(qiáng)度通常情況下由一定時(shí)間范圍內(nèi)與主題相關(guān)的文檔數(shù)量來表示,主題強(qiáng)度越大則代表當(dāng)前對(duì)于該主題的關(guān)注度越高,其熱度也越高,因此通過對(duì)主題強(qiáng)度的計(jì)算可得出在特定時(shí)間內(nèi)的熱點(diǎn)主題,其計(jì)算式如下:
其中θ是第d個(gè)文檔中第z個(gè)主題的比例,Dt是時(shí)間段t內(nèi)的文檔數(shù)目,主題閾值計(jì)算式如下:
3 實(shí)證研究
3.1 數(shù)據(jù)來源
本文以Innojoy專利數(shù)據(jù)庫(kù)中的專利數(shù)據(jù)作為數(shù)據(jù)來源,Innojoy專利數(shù)據(jù)庫(kù)是集專利文獻(xiàn)技術(shù)信息、法律信息和市場(chǎng)分布信息為一體的專利綜合應(yīng)用平臺(tái)。平臺(tái)中收錄一百多個(gè)國(guó)家地區(qū)的專利數(shù)據(jù),具有多字段檢索、同組追蹤、數(shù)據(jù)分析等優(yōu)勢(shì)。綜合參考其他學(xué)者的檢索關(guān)鍵詞得到智慧健康服務(wù)領(lǐng)域?qū)@麢z索式:TS =智慧健康or智慧醫(yī)療or移動(dòng)健康,檢索范圍為中國(guó),共得到3 892條專利數(shù)據(jù),經(jīng)過同族合并以及無關(guān)專利篩除后導(dǎo)出3 872條數(shù)據(jù)。
基于檢索到專利技術(shù)年度公開的數(shù)量繪制如圖2所示的專利年度公開量分布圖。從圖中可發(fā)現(xiàn)智慧健康服務(wù)領(lǐng)域?qū)@夹g(shù)的發(fā)展可分為三個(gè)階段。首先,自2007年智慧健康服務(wù)專利出現(xiàn)以來至2012年為專利發(fā)展的初期;2013年至2020年為智慧健康服務(wù)專利發(fā)展的上升階段,隨著各類健康政策的提出與實(shí)施,國(guó)家對(duì)國(guó)民健康狀況的重視程度逐漸提升,結(jié)合IBM公司提出的“智慧地球”理念,更多學(xué)者、技術(shù)人員將目光轉(zhuǎn)向智慧健康領(lǐng)域,使得智慧健康成為研究熱點(diǎn),相關(guān)成果井噴式產(chǎn)出;2021年至2023年為智慧健康服務(wù)專利發(fā)展的平穩(wěn)時(shí)期,國(guó)民健康狀況依舊是當(dāng)前國(guó)家、人民關(guān)注的熱點(diǎn),因此智慧健康領(lǐng)域的專利數(shù)量仍較大,但是相比于上升階段其專利年度公開量較平均,發(fā)展較平穩(wěn)。
3.2 模型識(shí)別結(jié)果
本文采用困惑度指標(biāo)來確定最優(yōu)主題數(shù),利用Python對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行困惑度計(jì)算并得到如圖3所示的不同主題數(shù)量下困惑度的變化情況。從圖中可看出當(dāng)主題數(shù)目達(dá)到8以后模型困惑度下降幅度明顯減小且趨于穩(wěn)定,初步確定LDA模型的最優(yōu)主題數(shù)為8。選取主題數(shù)目8,利用pyLDAvis對(duì)詞與主題關(guān)系進(jìn)行可視化展示,如圖4所示,可以看出主題數(shù)目為8時(shí),各主題之間重合較少,區(qū)分度明顯,因此確定最優(yōu)主題數(shù)目為8。
確定主題數(shù)目為8后利用LDA主題模型方法得到如表1所示的8大類主題,并提取了各主題下前25的高頻關(guān)鍵詞。結(jié)合高頻關(guān)鍵詞與智慧健康服務(wù)專利文本將八大類主題歸納為:智慧醫(yī)療調(diào)度技術(shù)、智慧藥品管理技術(shù)、智慧醫(yī)療大數(shù)據(jù)服務(wù)平臺(tái)、智慧監(jiān)測(cè)技術(shù)、智慧檢測(cè)技術(shù)、智慧健康信息服務(wù)平臺(tái)、智慧醫(yī)療設(shè)備、智慧醫(yī)療文本處理系統(tǒng)。
基于LDA模型運(yùn)行所得的文檔-主題分布概率可獲得每個(gè)樣本文檔屬于八個(gè)不同主題的概率,結(jié)合主題強(qiáng)度計(jì)算公式得到各個(gè)主題的強(qiáng)度,將其與主題閾值進(jìn)行比較得到如圖5所示的主題強(qiáng)度圖。
3.3 熱點(diǎn)主題分析
主題強(qiáng)度大于主題閾值即為熱點(diǎn)主題,由此從圖5可得到四個(gè)智慧健康服務(wù)專利領(lǐng)域熱點(diǎn)主題,分別為主題2智慧醫(yī)療大數(shù)據(jù)服務(wù)平臺(tái)、主題5智慧健康信息服務(wù)平臺(tái)、主題6智慧醫(yī)療設(shè)備、主題7智慧醫(yī)療文本處理系統(tǒng)。結(jié)合熱點(diǎn)主題下的專利文獻(xiàn)以及相關(guān)參考文獻(xiàn),對(duì)熱點(diǎn)主題進(jìn)行分析。
3.3.1 智慧醫(yī)療大數(shù)據(jù)服務(wù)平臺(tái)
醫(yī)療大數(shù)據(jù)是涉及與自然人醫(yī)療健康相關(guān)的多種數(shù)據(jù),在數(shù)智化的大背景下包含互聯(lián)網(wǎng)+醫(yī)療健康、物聯(lián)網(wǎng)+醫(yī)療健康和人工智能+醫(yī)療健康等新興領(lǐng)域所產(chǎn)生的與健康領(lǐng)域相關(guān)的數(shù)據(jù)[19]。智慧醫(yī)療數(shù)據(jù)大平臺(tái)的建立對(duì)于用戶、健康服務(wù)提供相關(guān)機(jī)構(gòu)均有利。首先,用戶可以通過可佩戴的便攜裝置,如心率環(huán)、計(jì)步器等,快速直接地從自身健康數(shù)據(jù)中知曉當(dāng)前健康狀況,并以此為依據(jù)合理調(diào)整飲食作息以保護(hù)自己身體健康,維持一個(gè)良好的身體狀況。其次,對(duì)于如醫(yī)療機(jī)構(gòu)、研發(fā)機(jī)構(gòu)等相關(guān)服務(wù)提供者,通過大數(shù)據(jù)服務(wù)平臺(tái)中共享的多樣化健康數(shù)據(jù)了解當(dāng)前特定區(qū)域內(nèi)甚至國(guó)家范圍內(nèi)居民的健康狀況,以此來做出及時(shí)、精準(zhǔn)的決策,從而為國(guó)民健康保駕護(hù)航。然而醫(yī)療大數(shù)據(jù)除了具有海量、異構(gòu)性、多源性等大數(shù)據(jù)所具有的特點(diǎn)之外,還有隱私性、專業(yè)性的特點(diǎn),這都對(duì)醫(yī)療大數(shù)據(jù)平臺(tái)的構(gòu)建提出了較高的要求。智慧醫(yī)療大數(shù)據(jù)平臺(tái)的建設(shè)需要多部門聯(lián)合,需要信息技術(shù)機(jī)構(gòu)來構(gòu)建平臺(tái)并維護(hù)平臺(tái)的運(yùn)行,需要醫(yī)療機(jī)構(gòu)提供相關(guān)專業(yè)知識(shí)的指導(dǎo),需要平臺(tái)用戶共享健康數(shù)據(jù)。如何聯(lián)合多部門綜合利用新興技術(shù)、法律、政策文本加強(qiáng)對(duì)智慧醫(yī)療大數(shù)據(jù)平臺(tái)的宣傳以及建設(shè)完善,使健康大數(shù)據(jù)真正成為保護(hù)國(guó)民健康的資源是今后醫(yī)療大數(shù)據(jù)平臺(tái)發(fā)展的方向與重點(diǎn)。
3.3.2 智慧健康信息服務(wù)平臺(tái)
隨著國(guó)民對(duì)自身健康狀況重視度的不斷提升,其對(duì)健康信息的需求也逐漸加強(qiáng),為滿足國(guó)民需求,健康信息服務(wù)平臺(tái)隨之產(chǎn)生。健康信息服務(wù)平臺(tái)是一個(gè)集健康管理、疾病預(yù)防、健康教育、醫(yī)療服務(wù)功能為一體的綜合性服務(wù)平臺(tái),智慧健康信息服務(wù)平臺(tái)則是在健康信息平臺(tái)的基礎(chǔ)上融入前沿技術(shù),如云計(jì)算、人工智能、5G等,致力于為國(guó)民提供個(gè)性化、專業(yè)的健康服務(wù),其中在線健康服務(wù)平臺(tái),如好大夫在線、丁香園等,是當(dāng)前人們常用的具有代表性的智慧健康信息服務(wù)平臺(tái)之一。融合多種新興技術(shù)構(gòu)建一個(gè)真正智慧的健康信息服務(wù)平臺(tái)是當(dāng)前研究的熱點(diǎn)。夏思洋等學(xué)者融合利用區(qū)塊鏈、云計(jì)算等智能技術(shù)構(gòu)建了基于多源數(shù)據(jù)的智慧健康信息服務(wù)系統(tǒng)框架,旨在為老年人提供更加智慧化的健康服務(wù)[17];高靖超等學(xué)者結(jié)合用戶畫像、聚類分析、情感分析等多種深度學(xué)習(xí)算法,探究在線醫(yī)療社區(qū)健康焦慮用戶情感及其他特征表現(xiàn),為健康服務(wù)平臺(tái)提供較全面的用戶畫像標(biāo)簽類型解釋,為其管理提供指導(dǎo)意見[20]。然而信息真?zhèn)坞y辨、服務(wù)質(zhì)量參差不齊是當(dāng)前平臺(tái)中仍存在并將長(zhǎng)期存在的問題,如何融合多元技術(shù)構(gòu)建一個(gè)高質(zhì)量、可靠的智慧健康信息服務(wù)平臺(tái)、推進(jìn)線上線下服務(wù)共同發(fā)展是其今后發(fā)展的重點(diǎn)。
3.3.3 智慧醫(yī)療設(shè)備
智慧醫(yī)療設(shè)備是將智能傳感器、大數(shù)據(jù)、云計(jì)算等新興技術(shù)與傳統(tǒng)醫(yī)療設(shè)備相結(jié)合,主要用于監(jiān)測(cè)、診斷、分析患者病情的設(shè)備,如可穿戴康復(fù)設(shè)備、細(xì)胞形態(tài)學(xué)識(shí)別裝置、遠(yuǎn)程手術(shù)機(jī)器人等。智慧醫(yī)療設(shè)備突破了時(shí)空限制能為患者提供更加精準(zhǔn)、全面的服務(wù),如AI智能機(jī)器人的出現(xiàn)能幫助醫(yī)生對(duì)患者病況進(jìn)行更加準(zhǔn)確、高效的判斷。通過智能手環(huán)等可佩戴設(shè)備監(jiān)測(cè)用戶心率、血壓、血氧等指標(biāo),及時(shí)發(fā)現(xiàn)其存在的健康問題進(jìn)而來預(yù)防疾病的發(fā)生。與此同時(shí)智慧醫(yī)療設(shè)備產(chǎn)生收集的健康數(shù)據(jù)能夠?yàn)獒t(yī)療大數(shù)據(jù)平臺(tái)提供其所需數(shù)據(jù),不僅能監(jiān)測(cè)分析設(shè)備數(shù)據(jù)、優(yōu)化設(shè)備使用效果,還能監(jiān)測(cè)分析用戶健康數(shù)據(jù)為其提供個(gè)性化的服務(wù)。順應(yīng)國(guó)家“十四五規(guī)劃”中構(gòu)建基于5G的應(yīng)用場(chǎng)景和產(chǎn)業(yè)生態(tài),在智慧醫(yī)療領(lǐng)域展開試點(diǎn)示范的要求,賦能智慧醫(yī)療設(shè)備建立從預(yù)防到篩查到診斷再到護(hù)理的全過程醫(yī)療生態(tài)系統(tǒng)是當(dāng)前發(fā)展的重要方向。然而醫(yī)療設(shè)備資源在地區(qū)間分布不均衡仍是當(dāng)前存在的問題,如何真正做到醫(yī)療設(shè)備資源下沉,使不同地區(qū)人民都能平等享受智慧醫(yī)療設(shè)備是當(dāng)前急需解決的問題之一。
3.3.4 智慧醫(yī)療文本處理系統(tǒng)
醫(yī)療文本包括患者電子病歷、診斷報(bào)告等,不同于其他類型的文本,醫(yī)療文本中包含大量具有特殊含義的醫(yī)療命名實(shí)體(例如疾病、癥狀、身體部位等),且醫(yī)療文本通常以非結(jié)構(gòu)化的形式出現(xiàn)[21],對(duì)其進(jìn)行識(shí)別處理產(chǎn)生了一定的困難。然而醫(yī)療文本作為醫(yī)療大數(shù)據(jù)平臺(tái)的數(shù)據(jù)來源,在較多領(lǐng)域中都起著不可或缺的作用,如通過對(duì)同一患者不同時(shí)間段病歷的識(shí)別分析可以知曉其既往病史、家族病史等為醫(yī)生提供決策支持、對(duì)特定時(shí)間段內(nèi)患者病因識(shí)別可以判斷傳染病暴發(fā)跡象,提前進(jìn)行防控。醫(yī)療領(lǐng)域的命名實(shí)體識(shí)別方法經(jīng)歷了從基于規(guī)則的方法到基于傳統(tǒng)機(jī)器學(xué)習(xí)的方法再到現(xiàn)在基于深度學(xué)習(xí)的方法的轉(zhuǎn)變[22]。機(jī)器深度學(xué)習(xí)技術(shù)的不斷發(fā)展完善從一定程度上解決了醫(yī)療文本識(shí)別困難的問題,成為當(dāng)前學(xué)術(shù)界研究的熱點(diǎn)。許浪等學(xué)者利用BERT訓(xùn)練詞向量結(jié)合CNN和BiLSTM構(gòu)建了醫(yī)學(xué)文本分類模型,完善了傳統(tǒng)分析忽略上下文關(guān)系的不足,提高了醫(yī)療文本分類的準(zhǔn)確率[23]。林令德等學(xué)者提出預(yù)訓(xùn)練模型多層動(dòng)態(tài)融合方法對(duì)醫(yī)療文本中的醫(yī)療實(shí)體進(jìn)行準(zhǔn)確識(shí)別,并從中獲取有價(jià)值的信息,為健康服務(wù)相關(guān)人員提供決策支持[24]。
4 結(jié) 論
本研究利用LDA主題識(shí)別模型對(duì)智慧健康服務(wù)領(lǐng)域?qū)@麛?shù)據(jù)進(jìn)行挖掘識(shí)別,探究了智慧健康服務(wù)領(lǐng)域當(dāng)前的研究熱點(diǎn)及其發(fā)展趨勢(shì)。研究得出智慧醫(yī)療大數(shù)據(jù)服務(wù)平臺(tái)、智慧健康信息服務(wù)平臺(tái)、智慧醫(yī)療設(shè)備、智慧醫(yī)療文本處理系統(tǒng)四大類主題為當(dāng)前該領(lǐng)域研究熱點(diǎn),且正在向著多技術(shù)融合、多部門聯(lián)合的方向發(fā)展。但是當(dāng)前較多智慧健康服務(wù)領(lǐng)域的發(fā)展仍局限于相關(guān)機(jī)構(gòu)本身,存在忽視用戶真正需求的問題,相關(guān)法律法規(guī)依然存在欠缺。未來的發(fā)展需深入用戶群體,以用戶為中心,綜合利用當(dāng)前前沿技術(shù)深入挖掘用戶需求以提供與其需求相適配的健康服務(wù)。此外,參考國(guó)內(nèi)外相關(guān)案例結(jié)合國(guó)內(nèi)智慧健康領(lǐng)域背景構(gòu)建完善的法律框架體系,為智慧健康服務(wù)的發(fā)展提供規(guī)范有序的環(huán)境。
參考文獻(xiàn):
[1] 中國(guó)政府網(wǎng).“健康中國(guó)2030”規(guī)劃綱要 [EB/OL].(2016-10-28)[2023-11-24].https://www.sport.gov.cn/n10503/c772727/content.html.
[2] 崔遵康,李丹陽(yáng),徐小婷,等.糧食作物生物育種技術(shù)全球創(chuàng)新布局與競(jìng)爭(zhēng)態(tài)勢(shì)研究——基于核心專利數(shù)據(jù)挖掘的視角 [J].中國(guó)農(nóng)業(yè)科技導(dǎo)報(bào),2022,24(5):1-14.
[3] 陳亮,陳利利,許海云,等.國(guó)內(nèi)外專利挖掘研究進(jìn)展與前瞻 [J].圖書情報(bào)工作,2024,68(2):110-133.
[4] 韋婷婷,馮丹鈺,宋世領(lǐng),等.技術(shù)機(jī)會(huì)發(fā)現(xiàn)領(lǐng)域?qū)@诰蚍椒ㄑ芯渴鲈u(píng) [J].情報(bào)學(xué)報(bào),2023,42(10):1238-1250.
[5] 張鈺玲,彭麗徽,張艷豐,等.基于專利數(shù)據(jù)挖掘的我國(guó)智慧應(yīng)急關(guān)聯(lián)技術(shù)識(shí)別與發(fā)展趨勢(shì)研究 [J].情報(bào)科學(xué),2023,41(8):139-146.
[6] 阮光冊(cè),周萌葳.基于Sentence-BERT的專利技術(shù)主題聚類研究——以人工智能領(lǐng)域?yàn)槔?[J].情報(bào)雜志,2024,43(2):110-117.
[7] 伊惠芳,劉細(xì)文.一種專利技術(shù)主題分析的IPC語(yǔ)境增強(qiáng)Context-LDA模型研究 [J].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2021,5(4):25-36.
[8] 向姝璇,李睿.基于專利文獻(xiàn)整體相似度計(jì)算的競(jìng)爭(zhēng)對(duì)手發(fā)現(xiàn)——以5G領(lǐng)域?yàn)槔?[J].情報(bào)理論與實(shí)踐,2021,44(5):100-105.
[9] 李家全,李寶安,游新冬,等.基于專利知識(shí)圖譜的專利術(shù)語(yǔ)相似度計(jì)算研究 [J].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2020,4(10):104-112.
[10] 孫瑞英,陳宜泓.基于LDA主題模型的國(guó)內(nèi)智慧閱讀研究熱點(diǎn)及發(fā)展導(dǎo)向研判 [J].圖書館建設(shè),2023(3):82-93+103.
[11] 謝士堯,王小梅.基于深度文本聚類的論文與專利數(shù)據(jù)融合方法研究 [J/OL].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn):1-17(2023-09-28).http://kns.cnki.net/kcms/detail/10.1478.g2.20230927.0845.002.html.
[12] 陳浩,張夢(mèng)毅,程秀峰.融合主題模型與決策樹的跨地區(qū)專利合作關(guān)系發(fā)現(xiàn)與推薦——以廣東省和武漢市高校專利庫(kù)為例 [J].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2021,5(10):37-50.
[13] YOON B ,MAGEE C L. Exploring Technology Opportunities by Visualizing Patent Information Based on Generative Topographic Mapping and Link Prediction [J].Technological Forecasting and Social Change,2018,132(7):105-117.
[14] 馬費(fèi)成,周利琴.面向智慧健康的知識(shí)管理與服務(wù) [J].中國(guó)圖書館學(xué)報(bào),2018,44(5):4-19.
[15] 顧天陽(yáng),趙旺,曹林.跨組織醫(yī)療健康大數(shù)據(jù)聚合與案例知識(shí)推理方法研究 [J].情報(bào)科學(xué),2022,40(3):40-44.
[16] 馬金輝,王志飛,謝雁鳴,等.基于大型電子醫(yī)療數(shù)據(jù)的高血壓中醫(yī)證候分析 [J].中國(guó)中醫(yī)基礎(chǔ)醫(yī)學(xué)雜志,2014,20(9):1236-1238.
[17] 夏思洋,朱學(xué)芳.面向老年人的智慧健康信息服務(wù)系統(tǒng)研究——基于多源數(shù)據(jù)融合技術(shù) [J/OL].情報(bào)科學(xué),2023:1-14(2023-09-18).http://kns.cnki.net/kcms/detail/22.1264.G2.20230915.1530.027.html.
[18] 初佃輝,吳軍,劉志中,等.智能化醫(yī)養(yǎng)融合服務(wù)平臺(tái)關(guān)鍵技術(shù)及應(yīng)用研究 [J].智能系統(tǒng)學(xué)報(bào),2021,16(5):972-988.
[19] 李岳峰,胡建平,張學(xué)高.中國(guó)健康醫(yī)療大數(shù)據(jù)資源目錄體系與技術(shù)架構(gòu)研究 [J].中國(guó)衛(wèi)生信息管理雜志,2019,16(3):249-256.
[20] 高靖超,彭麗徽,張艷豐,等.在線醫(yī)療社區(qū)健康焦慮用戶畫像模型構(gòu)建及實(shí)證研究 [J].圖書情報(bào)工作,2023,67(16):124-134.
[21] 閆璟輝,宗成慶,徐金安.中文醫(yī)療文本中的嵌套實(shí)體識(shí)別方法 [J/OL].軟件學(xué)報(bào),2023:1-13(2023-08-28).https://doi.org/10.13328/j.cnki.jos.006927.
[22] 楊波,孫曉虎,黨佳怡,等.面向醫(yī)療問答系統(tǒng)的大語(yǔ)言模型命名實(shí)體識(shí)別方法 [J].計(jì)算機(jī)科學(xué)與探索,2023,17(10):2389-2402.
[23] 許浪,李代偉,張海清,等.基于神經(jīng)網(wǎng)絡(luò)的醫(yī)療文本分類研究 [J].計(jì)算機(jī)工程與科學(xué),2023,45(6):1116-1122.
[24] 林令德,劉納,徐貞順,等.基于多層動(dòng)態(tài)融合的中文醫(yī)療命名實(shí)體識(shí)別 [J/OL].計(jì)算機(jī)工程與應(yīng)用,2023:1-13(2023-08-25).http://kns.cnki.net/kcms/detail/11.2127.TP.20230825.1143.006.html.
作者簡(jiǎn)介:陳天怡(1998—),女,漢族,浙江寧波人,碩士研究生在讀,研究方向:健康信息。
收稿日期:2024-01-26
Research on the Development Trend of Chinese Intelligent Health Services
Based on Patent Data Mining
CHEN Tianyi
(School of Public Administration, Xiangtan University, Xiangtan 411105, China)
Abstract: In order to respond to the call for the construction of “Healthy China”, this paper reveals the current research hotspots in the field of intelligent health services in China based on patent data, and explores the development trend of intelligent health services field. The intelligent health related data in Innojoy patent database is taken as the data source, and the original corpus is extracted for topic recognition by LDA model. It applies the topic intensity formula to derive hot topics and analyzes them. The intelligent health services is at a plateau of development, and is moving towards multi-technology convergence and multi-sectoral integration. The intelligent medical Big Data service platform, intelligent health information service platform, intelligent medical equipment, and intelligent medical text processing system are the four research hotspots at present. The development of intelligent health services should be user-centered, providing services that match supply and demand, and it also need to continuously improve relevant laws and regulations to create a standardized and orderly development environment.
Keywords: patent data; data mining; LDA topic model; intelligent health services