,
知識經(jīng)濟時代,越來越多的企業(yè)都希望從專利分析和挖掘中得到相關(guān)技術(shù)知識,促進企業(yè)的研發(fā)和專利戰(zhàn)略的構(gòu)建。如何快速識別醫(yī)學(xué)研究前沿并預(yù)測其發(fā)展趨勢,以避免技術(shù)突襲,為相關(guān)機構(gòu)科技政策和決策的制定提供參考,值得我們深入思考。
近年來,國家重點建設(shè)以居民電子健康檔案(electronic health record,EHR)為核心的區(qū)域衛(wèi)生信息平臺和以電子病歷為基礎(chǔ)的醫(yī)院信息平臺。無論是貫徹惠及全民的醫(yī)改精神,還是醫(yī)療衛(wèi)生機構(gòu)自身信息化深入發(fā)展的要求,電子健康檔案是未來的工作重點。電子健康檔案可以改善醫(yī)患之間的信息不對稱,逐步建立以用戶需求為導(dǎo)向的衛(wèi)生服務(wù)機制。我國的EHR正處于起步階段,需要對 EHR 以及相關(guān)領(lǐng)域開展大量的探索研究,逐步與國際接軌,不斷提高我國衛(wèi)生信息化建設(shè)水平,促進衛(wèi)生事業(yè)的不斷發(fā)展。因此,探測電子健康檔案領(lǐng)域的技術(shù)前沿,能夠為科研學(xué)者指明有價值的研究方向。
在探測電子健康檔案領(lǐng)域技術(shù)前沿方面,1959年美國的林茨首先提出了技術(shù)預(yù)測的概念[1]。致力于發(fā)現(xiàn)新興技術(shù)的研發(fā)管理者和政策制定者,需要理解科學(xué)與技術(shù)是怎樣相聯(lián)系的。雖然知識的轉(zhuǎn)移是非線性的[2],但技術(shù)發(fā)明和科研產(chǎn)出依然有著強烈的聯(lián)系[3]。Mansfield 認為10%的新產(chǎn)品如果近期沒有學(xué)術(shù)研究的過程是不能被研發(fā)的[4]。此外,隨著創(chuàng)新圈的縮短,技術(shù)和基礎(chǔ)科學(xué)的聯(lián)系也在增加[5-6]。近年來國內(nèi)外學(xué)者通過科技文獻與專利的對比分析探索了科學(xué)與技術(shù)間的關(guān)聯(lián),但對技術(shù)前沿的探測較少。
1985年,美國的專利分析家Narin等人分別以美國生物醫(yī)藥雜志及美國專利數(shù)據(jù)庫中的論文與專利為研究對象,分析論文與專利間的引用關(guān)系,試圖揭示生物科學(xué)領(lǐng)域中的科學(xué)與技術(shù)的關(guān)聯(lián)[7]。Meyer[8]和Glanzel[9]等人分別于2001年和2003年從不同角度探索了科學(xué)文獻與專利技術(shù)二者間的關(guān)聯(lián),并指出可利用兩種數(shù)據(jù)源進行深入的分析與研究。2007年荷蘭阿姆斯特丹大學(xué)的Leydesdorff利用學(xué)術(shù)論文數(shù)據(jù)、專利數(shù)據(jù)與企業(yè)分類數(shù)據(jù)作為測度指標(biāo),提出了企業(yè)-大學(xué)-政府之間的三螺旋關(guān)系,即“產(chǎn)學(xué)官三螺旋管理”理論,指出了科學(xué)與技術(shù)之間存在著密不可分的內(nèi)在聯(lián)系,在科技創(chuàng)新的動態(tài)進程中不斷重組、轉(zhuǎn)型和流動[10]。2011年,Shibata通過專利與科學(xué)文獻的對比探測了太陽能電池領(lǐng)域的技術(shù)前沿[11]。
國內(nèi)學(xué)者近幾年也試圖通過對比科技論文與專利數(shù)據(jù)來探索科學(xué)研究與技術(shù)創(chuàng)新間的互動規(guī)律。2009年,卞志昕[12]進行了專利情報與學(xué)術(shù)文獻的對比分析研究,發(fā)現(xiàn)產(chǎn)業(yè)界公司與學(xué)術(shù)界研究機構(gòu)在研究方向上存在共通性與差異性 。2011年,殷媛媛[13]等人利用文本挖掘軟件,從時間趨勢、競爭趨勢和技術(shù)趨勢3個角度探索了科學(xué)研究與技術(shù)創(chuàng)新的互動規(guī)律及其發(fā)展趨勢。
2010年,日本東京大學(xué)Shibata基于學(xué)術(shù)論文和專利提出用4種類型代表科學(xué)和技術(shù)的關(guān)系[14]。如圖1所示,X區(qū)域是指文獻和專利都涉及的領(lǐng)域,文獻和專利之間相互影響,其整合強度取決于其關(guān)聯(lián)程度,該區(qū)域代表的是較成熟的技術(shù)領(lǐng)域;Y區(qū)域有文獻卻沒有專利,說明該區(qū)域目前正處于基礎(chǔ)研究階段,是未來的技術(shù)發(fā)展趨勢;Z區(qū)域與Y區(qū)域相反,無科技文獻而有專利,反映出技術(shù)過度應(yīng)用的領(lǐng)域,缺乏相應(yīng)的研究基礎(chǔ);W區(qū)域沒有文獻和專利說明,該區(qū)域是科學(xué)家還沒有關(guān)注的領(lǐng)域。在(b)部分中,上層為專利層,下層為文獻層,研究內(nèi)容相近的主題以虛線相連。其中Y區(qū)域有對應(yīng)的文獻存在而沒有相應(yīng)的專利成果,Z區(qū)域有專利卻沒有相應(yīng)的研究基礎(chǔ)。因此,探索科技文獻和專利之間的相關(guān)關(guān)系,對于探測技術(shù)的研究趨勢有著重要的指示作用。
圖1 文獻與專利關(guān)系圖
本文通過文獻與專利的對比探測電子健康檔案領(lǐng)域的技術(shù)前沿。首先選取中國知網(wǎng)作為數(shù)據(jù)源,獲取文獻和專利數(shù)據(jù);其次提取文獻關(guān)鍵詞作為文獻標(biāo)識,通過對專利標(biāo)題進行分詞處理,以標(biāo)題詞作為專利標(biāo)識,并對文獻關(guān)鍵詞與專利標(biāo)題詞進行聚類分析;最后對比文獻與專利聚類得到的類簇,分析電子健康檔案領(lǐng)域的技術(shù)前沿。
2015年11月20日以中國知網(wǎng)核心期刊數(shù)據(jù)庫為數(shù)據(jù)源,檢索時間段為2000年以后,以“電子病歷”或“電子健康檔案”為主題詞進行檢索,共獲得文獻774篇;以中國知網(wǎng)中國專利全文數(shù)據(jù)庫為數(shù)據(jù)源,在標(biāo)題、關(guān)鍵詞和摘要中檢索“電子病歷”或“電子健康檔案”,獲得380條數(shù)據(jù)。
2000年后文獻量呈逐年上升的趨勢(圖2),并在2012年達到高峰;專利則從2002年開始出現(xiàn),并在2011年明顯增加,在2013年和2014年達到高峰。由此可見,專利與文獻的數(shù)量趨勢大致相同,但專利較文獻滯后大約2、3年,說明文獻對于專利技術(shù)的發(fā)展方向具有一定的指示作用。
圖2 文獻和專利發(fā)表的時間分布
分別對2000年后發(fā)表的電子健康檔案領(lǐng)域的中文文獻與專利進行聚類分析,其類簇成員數(shù)與主題內(nèi)容詳見表1。表1中“Z”字頭是專利類簇,“W”字頭為文獻類簇。
表1 專利與文獻類簇信息
Z2與W3、W8為醫(yī)院信息化管理、醫(yī)院信息管理系統(tǒng)方向的研究,文獻與專利方面均有涉及,是較為成熟的研究方向。Z3與W1、W2是電子病歷管理、電子病歷系統(tǒng)技術(shù)研究,現(xiàn)有專利主要是針對電子病歷錄入技術(shù)。W4、W5、W6、W7并沒有與之對應(yīng)的專利研究,說明其很有可能是新興的技術(shù)前沿。
W4與W6是社區(qū)衛(wèi)生服務(wù)與社區(qū)健康管理?;诮】禉n案的社區(qū)衛(wèi)生信息平臺是在整合醫(yī)療衛(wèi)生業(yè)務(wù)應(yīng)用系統(tǒng)的基礎(chǔ)上,形成互聯(lián)互通的醫(yī)療衛(wèi)生業(yè)務(wù)協(xié)作網(wǎng)絡(luò)。社區(qū)電子健康檔案并不是簡單地將居民健康信息呈現(xiàn)于電腦上,而是更注重于信息的可傳輸性、時效性、安全性、共享性和便捷性。利用信息化手段能使居民及時獲得良好的健康服務(wù),提高社區(qū)衛(wèi)生服務(wù)水平。目前健康檔案普遍存在著內(nèi)容不一致、結(jié)構(gòu)不合理、指標(biāo)不規(guī)范、格式不一致等問題,而居民流動導(dǎo)致各個社區(qū)衛(wèi)生服務(wù)中心之間的信息無法實現(xiàn)共享,造成信息資源的浪費。要實現(xiàn)信息共享,首先必須建立和制定社區(qū)衛(wèi)生信息系統(tǒng)中數(shù)據(jù)采集、傳輸、利用、反饋和分析等一系列技術(shù)標(biāo)準(zhǔn)和規(guī)范,其次,要建設(shè)社區(qū)衛(wèi)生信息數(shù)據(jù)集標(biāo)準(zhǔn)和功能規(guī)范,才能保證健康檔案信息的內(nèi)容完整、格式規(guī)范、功能全面、傳輸流暢、反饋及時。
W5是遠程醫(yī)療。提高基層醫(yī)療水平是國家建設(shè)衛(wèi)生信息化管理的重要目標(biāo),遠程醫(yī)療將成為技術(shù)推手。部屬醫(yī)院及各省三甲醫(yī)院應(yīng)通過信息技術(shù)開展遠程醫(yī)療,為醫(yī)療條件相對較差的地區(qū)服務(wù)。遠程醫(yī)療的互聯(lián)技術(shù)與執(zhí)行標(biāo)準(zhǔn)是專利技術(shù)的研究趨勢。
W7是HL7、XML。HL7標(biāo)準(zhǔn)是專門用于醫(yī)療衛(wèi)生機構(gòu)及醫(yī)用儀器、設(shè)備數(shù)據(jù)信息傳輸?shù)臉?biāo)準(zhǔn)[15]。HL7最新的版本是3.0,在國際上還有很多爭論,一方面是因為新版本的應(yīng)用還需要一段適應(yīng)期,另一方面是因為3.0版本緊跟IT技術(shù)發(fā)展的結(jié)構(gòu)本身在標(biāo)準(zhǔn)中沒有完整的介紹。然而3.0版本作為一個面向未來的版本,融合了當(dāng)前許多流行的概念和技術(shù),具有很強的生命力和研究價值,是今后發(fā)展的方向。擴展修飾語言(extensible markup language,XML)是一種簡單的數(shù)據(jù)存儲語言,可以定義描述對象結(jié)構(gòu)的元語言,使系統(tǒng)之間交互的數(shù)據(jù)信息可以相互理解?;赬ML電子病歷的存儲是整個電子病歷系統(tǒng)的基礎(chǔ)。
圖3、圖4為專利共詞網(wǎng)絡(luò)圖和文獻共詞網(wǎng)絡(luò)圖。圖中節(jié)點是文獻的關(guān)鍵詞或?qū)@麡?biāo)題的切詞,代表某個研究方向,節(jié)點間的聯(lián)系代表他們之間存在共同研究,節(jié)點的大小取決于研究數(shù)量的多少。電子健康檔案領(lǐng)域的文獻研究明顯較專利研究豐富,且研究節(jié)點的內(nèi)容更加具體,更能夠代表某個研究方向。相比之下,專利共詞網(wǎng)絡(luò)中多個節(jié)點才能表示出一個研究方向。原因在于文獻網(wǎng)絡(luò)中的節(jié)點是關(guān)鍵詞,專利網(wǎng)絡(luò)中的節(jié)點是標(biāo)題詞切詞。對于專業(yè)詞匯的分詞,現(xiàn)有的分詞軟件切詞效果并不理想,因此本文采用人工分詞的方法。
圖3 專利共詞網(wǎng)絡(luò)圖
圖4 文獻共詞網(wǎng)絡(luò)圖
當(dāng)前,建設(shè)共享的電子健康檔案工作已成為我國醫(yī)療領(lǐng)域的首要任務(wù)。本文通過分析電子健康病歷領(lǐng)域的文獻與專利情況,以期發(fā)現(xiàn)該領(lǐng)域的技術(shù)前沿。
Shibata提出基于學(xué)術(shù)論文和專利用4種類型代表科學(xué)和技術(shù)的關(guān)系,認為Y區(qū)域有論文卻沒有專利出現(xiàn),說明該區(qū)域為基礎(chǔ)研究,是未來新興的技術(shù)趨勢。因此,借鑒其研究方法,對電子健康檔案領(lǐng)域的科技文獻和專利進行對比分析,可以探測該領(lǐng)域的研究前沿。
本文選取中國知網(wǎng)核心期刊數(shù)據(jù)庫和中國知網(wǎng)中國專利全文數(shù)據(jù)庫收錄的文獻與專利,通過對文獻關(guān)鍵詞與專利標(biāo)題切詞分別進行共詞聚類分析,對比類簇結(jié)果,挖掘有文獻研究卻少有專利存在的研究方向,并以此確定電子健康檔案領(lǐng)域的研究前沿。經(jīng)分析發(fā)現(xiàn),社區(qū)衛(wèi)生服務(wù)與社區(qū)健康管理、遠程醫(yī)療實現(xiàn)技術(shù)、HL7、XML是較有前景的電子健康檔案技術(shù)方向。
在社區(qū)衛(wèi)生服務(wù)與健康管理方面,制定社區(qū)衛(wèi)生信息系統(tǒng)中數(shù)據(jù)采集、傳輸、利用、反饋和分析等一系列技術(shù)標(biāo)準(zhǔn)和規(guī)范,建設(shè)社區(qū)衛(wèi)生信息數(shù)據(jù)集標(biāo)準(zhǔn)和功能規(guī)范各個環(huán)節(jié)都需要技術(shù)支持。
遠程醫(yī)療的互聯(lián)技術(shù)與執(zhí)行標(biāo)準(zhǔn)是專利技術(shù)的研究趨勢。HL7融合了當(dāng)前流行的概念和技術(shù),具有很強的生命力和研究價值?;赬ML電子病歷的存儲是整個電子病歷系統(tǒng)的基礎(chǔ)。
本文在數(shù)據(jù)采集方面僅選取中國知網(wǎng)的數(shù)據(jù),并且通過主題、標(biāo)題、關(guān)鍵詞、摘要方式進行搜索,不能保證數(shù)據(jù)的查全率。
在文獻與專利的聚類分析過程中,選擇關(guān)鍵詞及標(biāo)題切詞代替文獻或?qū)@难芯糠较颍嬖谝欢ǖ钠?。在以后的研究中,我們將豐富數(shù)據(jù)來源,并采取更全面的數(shù)據(jù)抽取方法表示文獻與專利的研究主題,以期達到更好的挖掘效果。