北京安慧音通科技有限責(zé)任公司 馬多佳 劉孟美
解放軍總醫(yī)院 王 旸 栗小艷
數(shù)字化醫(yī)院已經(jīng)成為世界上先進(jìn)醫(yī)院的重要組成部分[1,2,3,4,5],是信息技術(shù)迅速發(fā)展對(duì)醫(yī)院醫(yī)療和管理工作全方位滲透而提出的新概念。以現(xiàn)有信息技術(shù)為基礎(chǔ),提高醫(yī)療信息的高度共享,實(shí)現(xiàn)全方位的人機(jī)交互,提高醫(yī)療效率、醫(yī)療質(zhì)量和管理水平是當(dāng)今醫(yī)療技術(shù)的前進(jìn)方向之一。
語(yǔ)音作為人類最重要、最有效、最常用和最方便的交換信息的形式,讓計(jì)算機(jī)能夠聽懂人類的語(yǔ)言,是人類自計(jì)算機(jī)誕生以來(lái)夢(mèng)寐以求的想法。語(yǔ)音識(shí)別技術(shù)作為該系統(tǒng)實(shí)現(xiàn)的核心技術(shù),貫穿于整個(gè)系統(tǒng)的操作過(guò)程,選用語(yǔ)音增強(qiáng)技術(shù)、端點(diǎn)檢測(cè)技術(shù)作為語(yǔ)音識(shí)別的前端處理技術(shù),基于數(shù)據(jù)驅(qū)動(dòng)的特征提取技術(shù)和基于子空間的建模方法,實(shí)現(xiàn)其孤立詞識(shí)別,其識(shí)別率高達(dá)95%,在漢語(yǔ)普通話孤立詞識(shí)別上為國(guó)際領(lǐng)先水平。
由于國(guó)內(nèi)還沒(méi)有相關(guān)產(chǎn)品,醫(yī)院采用一臺(tái)超聲診斷儀配一名錄入員人工輸入超聲檢查報(bào)告的方法,存儲(chǔ)超聲圖像,運(yùn)用電子病歷管理病人檢查結(jié)果。該設(shè)計(jì)結(jié)合超聲診斷學(xué)知識(shí)、多媒體技術(shù)、數(shù)據(jù)庫(kù)知識(shí)、計(jì)算機(jī)技術(shù)、語(yǔ)音識(shí)別技術(shù)等多;學(xué)科跨領(lǐng)域?qū)崿F(xiàn)超聲檢查報(bào)告的語(yǔ)音錄入,無(wú)需配備錄入員。通過(guò)多位有經(jīng)驗(yàn)的超聲檢查醫(yī)師對(duì)超聲檢查的超聲描述及超聲結(jié)論等信息整理總結(jié)并參考相關(guān)書籍[6],經(jīng)過(guò)一定的積累設(shè)計(jì)出一套適用于大多數(shù)疾病描述情況的模板。本模板靈活度高,集多位權(quán)威醫(yī)生的經(jīng)驗(yàn)積累,規(guī)范度高,涵蓋范圍廣,提
高了超聲檢查報(bào)告的質(zhì)量。考慮超聲檢查醫(yī)生的工作方式及檢查流程,選用分布式的系統(tǒng)架構(gòu)提供了高效的執(zhí)行效率和簡(jiǎn)便易用的操作方法。實(shí)現(xiàn)同數(shù)字醫(yī)院應(yīng)用系統(tǒng)的整合工作,使智能語(yǔ)音處理技術(shù)適配于目前的HIS(Hospital Information System,醫(yī)院信息系統(tǒng))。
語(yǔ)音識(shí)別技術(shù)正直接與醫(yī)療衛(wèi)生、辦公、交通、金融、公安、商業(yè)、旅游等行業(yè)的語(yǔ)音咨詢與管理,工業(yè)生產(chǎn)部門的語(yǔ)音控制,電信的自動(dòng)撥號(hào)系統(tǒng)、輔助控制和查詢以及福利事業(yè)的生活支援系統(tǒng)各種實(shí)際應(yīng)用領(lǐng)域相接軌,并終將成為既觸摸屏之后新一代操作系統(tǒng)和應(yīng)用程序的操作方式。
作為整個(gè)系統(tǒng)的核心技術(shù),語(yǔ)音識(shí)別技術(shù)貫穿系統(tǒng)的整個(gè)工作過(guò)程。本系統(tǒng)的語(yǔ)音識(shí)別技術(shù)由三部分組成:穩(wěn)健的前端處理系統(tǒng)、基于數(shù)據(jù)驅(qū)動(dòng)的特征提取技術(shù)和基于子空間的建模方法。
穩(wěn)健的前端處理系統(tǒng)包括解碼器、語(yǔ)音增強(qiáng)模塊和端點(diǎn)檢測(cè)模塊。解碼器對(duì)常見的語(yǔ)音格式如WAV、MP3、WMA、OGG、APE等構(gòu)建對(duì)應(yīng)的解碼器,轉(zhuǎn)變成下一步計(jì)算機(jī)能夠識(shí)別的文件格式。考慮到超聲檢查報(bào)告語(yǔ)音錄入系統(tǒng)的工作環(huán)境為封閉帶混響和噪聲的情況,選用語(yǔ)音增強(qiáng)模塊用于抑制語(yǔ)音噪聲和混響,提升語(yǔ)音有用信息的可懂度,選用頻域維納濾波算法[7,8]完成,該算法適用于環(huán)境噪聲較大的情況,較大程度上去除了噪聲信號(hào),并增強(qiáng)了有用信號(hào)。端點(diǎn)檢測(cè)作為語(yǔ)音識(shí)別的必要環(huán)節(jié),用于區(qū)分語(yǔ)音信號(hào)和非語(yǔ)音信號(hào),選用一種基于倒譜距離語(yǔ)音端點(diǎn)檢測(cè)的改進(jìn)算法[9,10],其抗噪性好,具有良好的魯棒性,標(biāo)記出語(yǔ)音和非語(yǔ)音的時(shí)間索引,以便對(duì)語(yǔ)音信號(hào)進(jìn)行識(shí)別,且該處理會(huì)提高語(yǔ)音識(shí)別的識(shí)別率。
語(yǔ)音識(shí)別的本質(zhì)是統(tǒng)計(jì)模式識(shí)別,統(tǒng)計(jì)模式識(shí)別分為特征提取、模式匹配和參考模式庫(kù)等三個(gè)基本單元。語(yǔ)音識(shí)別研究的一個(gè)重要進(jìn)展,就是算法從模式匹配技術(shù)轉(zhuǎn)向基于統(tǒng)計(jì)模型的技術(shù)。傳統(tǒng)的特征提取方法有線性預(yù)測(cè)倒譜系數(shù)和感知線性預(yù)測(cè)等。但是傳統(tǒng)的特征提取方法往往是基于某種生理發(fā)聲模型,或者人耳的聽感知模型,并且這種生理模型的建模方法取得了很大的成功,并主導(dǎo)了語(yǔ)音識(shí)別方法近半個(gè)世紀(jì),但對(duì)實(shí)際應(yīng)用還需不斷改進(jìn)?;跀?shù)據(jù)驅(qū)動(dòng)的特征提取技術(shù)作為正在發(fā)展的前沿技術(shù),其提取有用信息的思路與數(shù)據(jù)密切相關(guān),根據(jù)識(shí)別任務(wù),構(gòu)建基于子空間的隱馬爾可夫模型??紤]到子空間模型可分為對(duì)識(shí)別有益的子空間和對(duì)識(shí)別無(wú)益的子空間,前者稱為語(yǔ)音內(nèi)容子空間,后者稱為無(wú)用分量子空間或信道子空間,通過(guò)類似于主成分分析法,分離出信道子空間的基,并對(duì)特征進(jìn)行變換,去除特征在信道子空間的部分,從而使特征更有利于孤立詞識(shí)別系統(tǒng)。該方法是讓數(shù)據(jù)自我反應(yīng)特點(diǎn),通過(guò)數(shù)據(jù)的自我表述,能更加突出目標(biāo)方法,達(dá)到提高識(shí)別率的目的,以適用很多人普通話不標(biāo)準(zhǔn)的情況。
建模方法是語(yǔ)音識(shí)別系統(tǒng)性能決定性因素。建模技術(shù)發(fā)展迅速,在孤立詞方面,從早期的動(dòng)態(tài)時(shí)間規(guī)整等技術(shù),到上世紀(jì)廣為流行的隱馬爾可夫模型、人工神經(jīng)元網(wǎng)絡(luò),以及在隱馬爾可夫模型上鑒別式的訓(xùn)練方法。這些技術(shù)極大提高了語(yǔ)音識(shí)別技術(shù)的頑健性,提高了識(shí)別的準(zhǔn)確率。近年來(lái)逐漸興起的子空間建模技術(shù)將孤立詞識(shí)別推向了實(shí)用化階段,本系統(tǒng)選用基于子空間的建模方法,該算法采用聲韻母模型,將事先訓(xùn)練好的基元單元按照聲韻母拼接得到整體模型,在實(shí)際應(yīng)用過(guò)程中構(gòu)建的孤立詞識(shí)別系統(tǒng),通過(guò)修改詞表就能用于完成識(shí)別任務(wù)。聲韻母模型分為單音子模型、雙音子模型和三音子模型,考慮到前后項(xiàng)信息,選用性能最優(yōu)的三音子模型作為聲韻母模型建模的基本模型,三音子模型考慮上下文信息標(biāo)注,并根據(jù)標(biāo)注信息構(gòu)建決策樹,根據(jù)決策樹構(gòu)建三音子模型,最終得到共享的高斯混合模型集。
系統(tǒng)的工作流程如圖1所示,首先系統(tǒng)會(huì)自動(dòng)同步醫(yī)院的數(shù)據(jù)庫(kù)系統(tǒng),調(diào)入相關(guān)診室的檢查醫(yī)生的相關(guān)信息和分配到該診室的病人基本信息;然后醫(yī)生根據(jù)檢查部位通過(guò)麥克風(fēng)語(yǔ)音輸入完成超聲檢查病例模板的選擇,通過(guò)語(yǔ)音的方式對(duì)超聲診斷儀上顯示的超聲診斷情況進(jìn)行描述并語(yǔ)音方式給出相應(yīng)的超聲診斷結(jié)論,這些語(yǔ)音會(huì)自動(dòng)轉(zhuǎn)換成文字形式顯示到系統(tǒng)界面,語(yǔ)音控制采集超聲圖片,也可以通過(guò)語(yǔ)音對(duì)得到的超聲描述和超聲結(jié)論進(jìn)行修改、確認(rèn),若病人多個(gè)部位都需做超聲檢查,以上步驟重復(fù)操作即可;最后語(yǔ)音控制自動(dòng)生成超聲檢查報(bào)告單,該報(bào)告單會(huì)通過(guò)打印機(jī)自動(dòng)打印,醫(yī)生檢查報(bào)告單的內(nèi)容,確認(rèn)沒(méi)有問(wèn)題簽字,超聲檢查結(jié)束。
圖1 系統(tǒng)使用流程圖
對(duì)于多次就診的病人,每次就診信息都會(huì)記錄到該系統(tǒng),當(dāng)醫(yī)生想了解該病人的病史時(shí)通過(guò)該系統(tǒng)調(diào)用即可,也可以鏈接到醫(yī)院總數(shù)據(jù)庫(kù),在不同的診室或者檢查中心都可以隨時(shí)調(diào)用,為醫(yī)生和病人節(jié)省了時(shí)間,提高了問(wèn)診質(zhì)量和速率。
超聲檢查報(bào)告語(yǔ)音錄入系統(tǒng)分為三個(gè)功能模塊:超聲檢查報(bào)告語(yǔ)音錄入模塊、超聲描述模板數(shù)據(jù)維護(hù)模塊和超聲檢查監(jiān)視模塊。
針對(duì)超聲檢查人員配備不合理,超聲診斷報(bào)告描述規(guī)范度低等問(wèn)題,對(duì)超聲檢查的工作流程及相關(guān)醫(yī)學(xué)知識(shí)進(jìn)行了總結(jié)設(shè)計(jì)出該系統(tǒng)。區(qū)別于現(xiàn)有超聲檢查系統(tǒng),該系統(tǒng)省去了超聲檢查錄入員的工作,檢查醫(yī)生可以通過(guò)語(yǔ)音輸入轉(zhuǎn)換成文字輸入的方式控制報(bào)告單的錄入,語(yǔ)音控制報(bào)告單錄入中超聲病例模板的選擇,并且自動(dòng)打印超聲報(bào)告單,也可以通過(guò)鍵盤鼠標(biāo)等外設(shè)控制整個(gè)超聲檢查報(bào)告單的生成過(guò)程,操作簡(jiǎn)便易學(xué)。同時(shí)該系統(tǒng)也為醫(yī)生根據(jù)習(xí)慣自定義添加、修改、刪除模板功能。該系統(tǒng)與醫(yī)院的數(shù)據(jù)庫(kù)相連,可以與醫(yī)院系統(tǒng)同步,保證醫(yī)院工作流程的順利進(jìn)行。此外該系統(tǒng)還會(huì)對(duì)整個(gè)診斷過(guò)程進(jìn)行錄音,提高超聲科日常工作中的抗風(fēng)險(xiǎn)能力。圖2所示為超聲檢查語(yǔ)音錄入系統(tǒng)構(gòu)成。
圖2 超聲檢查報(bào)告語(yǔ)音錄入系統(tǒng)結(jié)構(gòu)圖
超聲檢查報(bào)告語(yǔ)音錄入模塊與醫(yī)院現(xiàn)有數(shù)據(jù)庫(kù)相連,自動(dòng)導(dǎo)入被檢查病人及檢查醫(yī)生的相關(guān)信息,進(jìn)入檢查界面。醫(yī)生根據(jù)系統(tǒng)提示語(yǔ)音輸入選擇相關(guān)疾病模板,語(yǔ)音輸入相關(guān)檢查的超聲描述及超聲結(jié)論,醫(yī)生也可以根據(jù)需要對(duì)超聲描述和超聲結(jié)論進(jìn)行修改,對(duì)超聲圖片進(jìn)行采集,最終語(yǔ)音控制打印超聲檢查報(bào)告。該模塊提供歷史記錄查詢,對(duì)于使用該系統(tǒng)檢查過(guò)的病人能夠查詢?cè)摬∪说囊酝∈芳捌渲委熐闆r,醫(yī)生可以根據(jù)相關(guān)信息更為快速、準(zhǔn)確的做出超聲診斷,也可以與其他相似病人的超聲描述做參考,更為準(zhǔn)確的生成超聲檢查報(bào)告。
該模塊用于超聲檢查工作之前,用鼠標(biāo)、鍵盤等輸入控制??偨Y(jié)多位經(jīng)驗(yàn)豐富的超聲科醫(yī)師出具的檢查報(bào)告,根據(jù)超聲報(bào)告單中的描述找到不同病理描述之間的聯(lián)系,總結(jié)出了規(guī)律。超聲診斷描述按每個(gè)疾病特點(diǎn)拆分成屬性,參考相關(guān)書籍及多位醫(yī)生的經(jīng)驗(yàn),在報(bào)告書寫規(guī)范的基礎(chǔ)上設(shè)置成醫(yī)生習(xí)慣的順序,并對(duì)每一個(gè)屬性盡可能設(shè)置所有可能的值,這些模板就可以涵蓋大多數(shù)病人的診斷描述。根據(jù)具體格式要求,可以批量導(dǎo)入病例模板也可以逐個(gè)導(dǎo)入,既可以對(duì)現(xiàn)有模板進(jìn)行修改也可以新建模板、刪除模板。
超聲檢查監(jiān)視模塊可以監(jiān)視記錄下醫(yī)生所有的語(yǔ)音錄入信息及醫(yī)生對(duì)該系統(tǒng)的整個(gè)操作過(guò)程。方便醫(yī)生查詢以往的檢查情況,督促醫(yī)生超聲檢查中規(guī)范化操作,也為日后可能出現(xiàn)的醫(yī)患糾紛提供相關(guān)證據(jù)。
本系統(tǒng)解決了超聲科檢查效率低,人員配備不合理,超聲診斷描述規(guī)范度低,誤診率較高等問(wèn)題。系統(tǒng)利用語(yǔ)音方式選用麥克風(fēng)進(jìn)行語(yǔ)音錄入、命令控制和信息查詢,是人機(jī)交互最自然、最方便的方式,使該系統(tǒng)能夠滿足醫(yī)院中心報(bào)告廳的需求,有利于“三級(jí)檢診制度”的落實(shí),提高生產(chǎn)效率,降低誤診率,使得病例報(bào)告系統(tǒng)更加準(zhǔn)確、高效和快捷。
本系統(tǒng)提供語(yǔ)音輸入和鍵盤鼠標(biāo)等外部設(shè)備兩種方式控制系統(tǒng)工作,操作簡(jiǎn)單易學(xué),方便醫(yī)生的使用;替代了每次超聲檢查時(shí)錄入員的工作,節(jié)省了醫(yī)院開支,避免出現(xiàn)錄入人員工作不熟練影響超聲檢查效率;對(duì)整個(gè)診斷過(guò)程進(jìn)行監(jiān)視記錄,督促醫(yī)生規(guī)范化操作,為部分醫(yī)療糾紛案提供了相關(guān)證據(jù),提高超聲科日常工作抗風(fēng)險(xiǎn)能力;醫(yī)生用語(yǔ)音的方式控制整個(gè)超聲檢查的錄入過(guò)程,自動(dòng)生成報(bào)告,無(wú)需醫(yī)生手動(dòng)操作;對(duì)大量的醫(yī)學(xué)數(shù)據(jù)進(jìn)行整理,為以后病人就診提供相關(guān)依據(jù);記錄每個(gè)病人利用本系統(tǒng)每次就診的情況,提高醫(yī)生診斷的準(zhǔn)確率;醫(yī)生參考權(quán)威書籍并根據(jù)相關(guān)經(jīng)驗(yàn)整理了超聲描述相關(guān)模板,對(duì)現(xiàn)有的診斷模式進(jìn)行了規(guī)范,結(jié)構(gòu)更為清晰。
目前該系統(tǒng)已經(jīng)在某醫(yī)院試用,實(shí)踐證明該系統(tǒng)確實(shí)提高了醫(yī)生的工作效率??紤]信息技術(shù)和醫(yī)療技術(shù)都在不斷進(jìn)步,還需繼續(xù)研究語(yǔ)音識(shí)別技術(shù)和豐富超聲檢查描述模板。語(yǔ)音識(shí)別方面需考慮復(fù)雜的工作環(huán)境,醫(yī)生普通話的標(biāo)準(zhǔn)程度,改進(jìn)語(yǔ)音增強(qiáng)、端點(diǎn)檢測(cè)、語(yǔ)音識(shí)別等技術(shù),研發(fā)出適用范圍更廣的語(yǔ)音識(shí)別系統(tǒng);隨著病人的增多,各種稀有病情會(huì)越來(lái)越多,病例模板還需不斷完善改進(jìn),以適用更多的情況。
醫(yī)院廣泛應(yīng)用該系統(tǒng)后,還可以繼續(xù)豐富該系統(tǒng),使其擴(kuò)展應(yīng)用到醫(yī)院的放射科、病理、心臟介入科、血管介入等醫(yī)療系統(tǒng),為醫(yī)院的數(shù)字化服務(wù)。
[1]GEN ELECTRIC.Voice activated diagnostic imaging control system.America.US7016469B2[P].2006.
[2]GE MED SYS GLOBAL TECH CO LLC.Remote control of a medical device using speech recognition and foot controls.America.US7127401B2[P].2006.
[3]CHEETAH OMNI LLC.System and method for voice control of medical devices.America.US8098423B2[P].2012.
[4]GEN ELECTRIC.Methods and system to generate data associated with a medical report using voice inputs.America.US8312057B2[P].2012.
[5]錢蘊(yùn)秋.超聲診斷學(xué)[M].第四軍醫(yī)大學(xué)出版社,2008.
[6]張亮,龔衛(wèi)國(guó).一種改進(jìn)的維納濾波語(yǔ)音增強(qiáng)算法[J].計(jì)算機(jī)工程與應(yīng)用,2010,46(26).
[7]白文雅,黃健群,陳智伶.基于維納濾波語(yǔ)音增強(qiáng)算法的改進(jìn)實(shí)現(xiàn)[J].電聲技術(shù),2007,31(1):44-46.
[8]葉蕾,孫林慧,楊震.基于壓縮感知觀測(cè)序列倒譜距離的語(yǔ)音端點(diǎn)檢測(cè)算法[J].信號(hào)處理,2011,27(001):67-72.
[9]羅元,黃璜,張毅等.一種新的語(yǔ)音端點(diǎn)檢測(cè)方法及在智能輪椅人機(jī)交互中的應(yīng)用[J].重慶郵電大學(xué)學(xué)報(bào):自然科學(xué)版,2011,23(4):487-491.