郭宇峰,毛一薦,馬成群,周晟汀,韓錦川,王子洪,郭海濤
陸軍軍醫(yī)大學(xué)第一附屬醫(yī)院 醫(yī)學(xué)工程科,重慶 400038
自新型冠狀病毒肺炎暴發(fā)以來,患病人數(shù)不斷增多,醫(yī)護(hù)工作量不斷增大[1-2]。而與患病人數(shù)激增的嚴(yán)峻形勢相比,卻是醫(yī)護(hù)資源比較匱乏的現(xiàn)狀,醫(yī)護(hù)資源的配置不足嚴(yán)重影響著病人的基礎(chǔ)生命支持[3]。在患者護(hù)理和診療工作中,監(jiān)護(hù)儀又作為實(shí)時(shí)監(jiān)測病人生命體征的重要醫(yī)療設(shè)備,對診斷和治療疾病有著極其重要的意義[4-6],被廣泛應(yīng)用于監(jiān)護(hù)病房和急救轉(zhuǎn)運(yùn)車內(nèi)。然而,在當(dāng)前監(jiān)護(hù)系統(tǒng)的操控方式下,采集測量患者生命體征數(shù)據(jù)時(shí),需要醫(yī)護(hù)人員采用手工操作方式實(shí)現(xiàn)數(shù)據(jù)采集的啟動(dòng)和關(guān)閉、報(bào)警設(shè)置等;但醫(yī)護(hù)人員在日常工作中眼睛和手常被其它操作占用,再去操控監(jiān)護(hù)儀有諸多不便,不僅耗費(fèi)時(shí)間,而且存在接觸感染的風(fēng)險(xiǎn),特別是在傳染病隔離病房和轉(zhuǎn)運(yùn)車內(nèi)。為充分合理的發(fā)揮醫(yī)護(hù)資源效用,避免接觸感染、保障醫(yī)護(hù)工作者健康安全,有必要利用智能化技術(shù)來優(yōu)化監(jiān)護(hù)儀操控方式,盡量減輕醫(yī)務(wù)人員在監(jiān)護(hù)工作中用于參數(shù)采集的工作量,將釋放出的工作量投入其他的醫(yī)療服務(wù)中。
語音識別控制技術(shù)作為智能控制研究領(lǐng)域的一個(gè)重要分支,能夠?yàn)橹悄茚t(yī)療儀器提供了更為直接、方便的人機(jī)接口[7]。基于語音控制技術(shù)的醫(yī)療設(shè)備,通過非接觸式語音操控方式,具有便利性、實(shí)用性和人性化的特點(diǎn),存在廣闊的應(yīng)用價(jià)值[8-10]。本研究結(jié)合語音控制技術(shù)的優(yōu)點(diǎn)以及當(dāng)前臨床監(jiān)護(hù)系統(tǒng)人機(jī)交互存在的問題,將該技術(shù)應(yīng)用于臨床監(jiān)護(hù)控制中,作為醫(yī)護(hù)人員“手”的擴(kuò)展,具有以下優(yōu)點(diǎn):① 非接觸式操控監(jiān)護(hù)儀,醫(yī)護(hù)人員無需手工操作機(jī)器,在特殊環(huán)境下盡可能避免接觸感染;② 操控方式更加便捷、高效,醫(yī)護(hù)工作者僅需說出語音命令即可完成參數(shù)采集與設(shè)置工作,而不必放下當(dāng)前手中工作去監(jiān)護(hù)儀旁操控機(jī)器。
智能語音控制系統(tǒng)作為醫(yī)護(hù)人員“手”的擴(kuò)展,它需具備語音識別與操作控制功能。文中設(shè)計(jì)的語音控制系統(tǒng)總體結(jié)構(gòu)框圖(圖1),主要由語音輸入模塊、識別模塊、主控制器模塊和控制模塊幾部分組成。
圖1 語音控制系統(tǒng)結(jié)構(gòu)框圖
在系統(tǒng)工作時(shí),醫(yī)護(hù)人員說出監(jiān)護(hù)儀語音操控指令,并由語音輸入模塊采集該操控語音將其傳給語音識別模塊;語音識別模塊對采集信息進(jìn)行分析識別,并將識別結(jié)果傳給主控模塊;此時(shí)主控模塊通過分析識別結(jié)果后,利用控制模塊控制監(jiān)護(hù)系統(tǒng)執(zhí)行相關(guān)操作。其中上位機(jī)可通過主控制器對識別模塊內(nèi)的關(guān)鍵詞列表進(jìn)行更新維護(hù),將醫(yī)護(hù)人員習(xí)慣用語添加到識別模塊內(nèi)部。
1.2.1 識別模塊
語音識別模塊是本系統(tǒng)的核心模塊,為了使系統(tǒng)能夠識別醫(yī)護(hù)人員發(fā)出的語音控制指令,本文選用ICRoute公司設(shè)計(jì)生產(chǎn)的語音識別專用芯片LD3320進(jìn)行語音識別。該芯片集成了語音識別處理器和一些外部電路,包括AD/DA轉(zhuǎn)換器、語音輸入輸出接口等,能夠方便進(jìn)行應(yīng)用開發(fā)[11-12]。系統(tǒng)電路參考ICRoute發(fā)布的LD3320數(shù)據(jù)手冊和開發(fā)手冊,采用并行方式與外部主控制器連接通訊,包含八根數(shù)據(jù)線(P0-P7)、四個(gè)控制信號以及一個(gè)中斷返回信號INTB;并通過語音輸入接口(MICN-P引腳)與麥克風(fēng)電路連接獲取外界語音控制指令;同時(shí)為滿足3.3 V供電需求,采用AMS1117穩(wěn)壓器將5 V電源轉(zhuǎn)換為3.3 V電壓為其供電(圖2)。
圖2 識別模塊外圍電路
1.2.2 主控制器模塊
主控制器電路能夠?qū)崿F(xiàn)與上位機(jī)以及語音芯片的交互通訊,并通過接收分析語音識別模塊傳輸過來的識別結(jié)果,將與識別結(jié)果相對應(yīng)的控制指令發(fā)送給控制模塊,操控控制模塊動(dòng)作。文中選用STC10L08XE單片機(jī)作為系統(tǒng)主控制器,供電電壓同樣為3.3 V,內(nèi)部Flash程序存儲(chǔ)器為8 k,SRAM為512 k,與傳統(tǒng)51單片機(jī)相比,運(yùn)行速度快,抗干擾能力強(qiáng),功能較全面[13]。系統(tǒng)晶振選用22.1184 MHz,工作時(shí)主控芯片STC10L08XE通過并行總線(P0.1~0.7)對語音芯片讀寫操作,獲取識別結(jié)果并通過P1.0~P1.3引腳驅(qū)動(dòng)控制模塊運(yùn)作。
1.2.3 控制模塊
控制模塊接收主控制器發(fā)來的控制指令,控制對應(yīng)繼電器的開、關(guān),實(shí)現(xiàn)對監(jiān)護(hù)儀不同的操作控制。模塊選用常見的SRD-05VDC-SL-C繼電器,并通過USB接口為其提供5 V驅(qū)動(dòng)電壓,工作時(shí)利用主控制器發(fā)出的控制信號與開關(guān)三極管SS8050對繼電器兩端電壓進(jìn)行控制,實(shí)現(xiàn)繼電器通斷功能,電路原理圖見圖3。本文系統(tǒng)選用四路相同的繼電器控制電路,實(shí)現(xiàn)監(jiān)護(hù)儀不同操作的控制。
圖3 控制模塊電路
1.2.4 語音輸入模塊
該模塊主要用于采集醫(yī)護(hù)人員發(fā)出的操作指令,并傳遞給語音識別模塊。文中采用駐極體麥克風(fēng)(咪頭)完成語音信息采集,其具有體積小、結(jié)構(gòu)簡單,價(jià)格低、電聲性能好等優(yōu)勢,應(yīng)用時(shí)只需添加部分外圍電路即可實(shí)現(xiàn)語音輸入。
文中設(shè)計(jì)的監(jiān)護(hù)儀語音控制系統(tǒng),主要實(shí)現(xiàn)語音信號的自動(dòng)識別以及智能控制功能,系統(tǒng)軟件整體工作框圖如圖4所示,其中語音識別程序和繼電器驅(qū)動(dòng)程序?yàn)檐浖诵膬?nèi)容。工作時(shí)系統(tǒng)通過并行接口初始化語音識別芯片LD3320,使語音識別芯片進(jìn)入循環(huán)識別模式,系統(tǒng)處理器反復(fù)啟動(dòng)語音識別程序,持續(xù)監(jiān)測語音信號;當(dāng)麥克風(fēng)監(jiān)測到語音信號且被判斷為有效識別結(jié)果時(shí),即為正確語音操控指令時(shí),則調(diào)用與識別結(jié)果對應(yīng)的繼電器驅(qū)動(dòng)程序,發(fā)出控制信號驅(qū)動(dòng)不同控制電路操控監(jiān)護(hù)儀工作;若為無效識別結(jié)果,即語音信號不屬于有效操作指令時(shí),則進(jìn)入下一次識別過程;在每一次語音識別控制流程結(jié)束后,系統(tǒng)將自動(dòng)進(jìn)入下一次識別過程。
圖4 系統(tǒng)軟件工作框圖
1.3.1 語音識別功能設(shè)計(jì)
系統(tǒng)為實(shí)現(xiàn)對多條不同語音操控指令進(jìn)行正確識別,首先需運(yùn)行語音芯片初始化程序,調(diào)用關(guān)鍵詞列表更新函數(shù),并將應(yīng)用中實(shí)際所需多條關(guān)鍵詞語存到LD3320芯片中,此時(shí)芯片啟動(dòng)一次內(nèi)部ASR(Automatic Speech Recognition)語音識別流程;ASR流程啟動(dòng)成功后,持續(xù)等待中斷響應(yīng)。一旦檢測到外界語音信號時(shí),進(jìn)入中斷處理函數(shù),并讀取BA寄存器的值分析識別情況,產(chǎn)生對應(yīng)的識別狀態(tài)(成功/失?。┓到o主程序,完成一次識別,后續(xù)由主控制程序根據(jù)識別狀態(tài)作出不同處理,見圖5。其中LD3320芯片可支持自由編輯50條關(guān)鍵詞條,在同一時(shí)刻,最多在50條關(guān)鍵詞語中進(jìn)行識別[14]。另外,考慮到系統(tǒng)復(fù)雜的運(yùn)行環(huán)境,為兼顧啟動(dòng)識別靈敏度和對遠(yuǎn)處干擾語音不能太敏感,在醫(yī)院人員嘈雜的情況下麥克風(fēng)增益寄存器(0X55)設(shè)定值為43H[15]。
圖5 語音識別程序工作流程
1.3.2 繼電器驅(qū)動(dòng)功能設(shè)計(jì)
為實(shí)現(xiàn)智能控制功能,驅(qū)動(dòng)不同繼電器根據(jù)醫(yī)護(hù)人員的不同操控指令動(dòng)作,主程序在獲取到語音識別成功的狀態(tài)后,立即從C5寄存器內(nèi)提取識別結(jié)果;同時(shí)根據(jù)識別結(jié)果選擇對應(yīng)的控制引腳進(jìn)行高低電平控制,實(shí)現(xiàn)多路繼電器的操控。其中,考慮到監(jiān)護(hù)儀按鍵多為點(diǎn)觸控制,在對控制引腳電平控制時(shí),一般會(huì)設(shè)置0.5 s的延時(shí),即將控制引腳先設(shè)置為高電平,延時(shí)0.5 s后再重置為低電平,而對于關(guān)機(jī)操作延時(shí)會(huì)設(shè)置為5 s。
在系統(tǒng)軟硬件基礎(chǔ)上搭建監(jiān)護(hù)儀語音交互控制系統(tǒng),系統(tǒng)實(shí)物圖如圖6a所示。應(yīng)用時(shí),通過上位機(jī)將系統(tǒng)程序下載完成,并將控制模塊的四路繼電器分別與監(jiān)護(hù)儀按鍵并聯(lián);連接線路后,給系統(tǒng)上電,在系統(tǒng)初始化完畢后即可用于語音控制,如圖6b所示,此時(shí)醫(yī)護(hù)人員若說出“測血壓”語音指令,監(jiān)護(hù)儀則會(huì)執(zhí)行對應(yīng)操作,測出相應(yīng)的血壓值。
圖6 監(jiān)護(hù)儀語音控制系統(tǒng)實(shí)物圖
但是,由于系統(tǒng)是基于非特定語音識別技術(shù),即對任何人的聲音都可以進(jìn)行識別和判斷,其匹配原理以無聲調(diào)的拼音進(jìn)行匹配識別。在實(shí)際應(yīng)用中發(fā)現(xiàn)如下問題:有時(shí)在無語音操控時(shí),該模塊響應(yīng)了;并非有效語音操作時(shí),即發(fā)出并非指定的控制語音,該模塊響應(yīng)了。為提高語音模塊識別效果和用戶體驗(yàn)感,系統(tǒng)采取如下方法:① 語音識別中采用口令模式,即我們給模塊定義一個(gè)觸發(fā)口令,每次只有先喊出觸發(fā)口令后才能進(jìn)行和它對話,對于觸發(fā)口令可選擇一些日常不常聽到的詞語,例如本系統(tǒng)中將“監(jiān)護(hù)助手”作為觸發(fā)口令;② 增添“垃圾關(guān)鍵詞語”,即添加一些其他的任意詞匯到識別列表,用來吸收錯(cuò)誤識別,從而降低誤識別率。這些垃圾關(guān)鍵詞可以說一些應(yīng)用場景中常見的詞匯,特別是一些與應(yīng)用所需關(guān)鍵詞語音相似的詞匯。系統(tǒng)對這些詞語識別后不做任何操作,這樣當(dāng)它識別后不起任何作用,可用來避免錯(cuò)誤識別。
為了測試語音控制系統(tǒng)的功能,本文設(shè)計(jì)了相應(yīng)的語音控制實(shí)驗(yàn)。實(shí)驗(yàn)中,選取了4名受試者(其中3名男性、1名女性)分別使用本系統(tǒng)完成監(jiān)護(hù)儀的語音控制。同時(shí),考慮到系統(tǒng)的軟硬件條件以及醫(yī)護(hù)人員對監(jiān)護(hù)儀的常用操作內(nèi)容,本文選用如下語音命令來操控監(jiān)護(hù)儀,包括開機(jī)、測血壓、關(guān)閉報(bào)警、打印記錄、關(guān)機(jī)共5種命令。實(shí)驗(yàn)時(shí),4名受試者分別對上述5種命令各進(jìn)行50次實(shí)驗(yàn),語音命令為普通話,受試者與監(jiān)護(hù)儀間隔3 m左右,記錄每人每種語音控制的成功次數(shù),并計(jì)算成功率,實(shí)驗(yàn)結(jié)果如表1所示。
表1 語音控制實(shí)驗(yàn)數(shù)據(jù)
實(shí)驗(yàn)結(jié)果表明,對于所有受試者的5種語音命令,其語音識別控制平均成功率為92.4%,其中最低識別控制成功率也有86%;受試者2的普遍成功率要低些,可能與該受試者方言口音較重有關(guān)。通過該實(shí)驗(yàn),發(fā)現(xiàn)受試者通過該系統(tǒng)語音操控監(jiān)護(hù)儀有較高的成功率,可見該系統(tǒng)用于醫(yī)護(hù)人員語音操控監(jiān)護(hù)儀是可行的。
在傳統(tǒng)監(jiān)護(hù)儀操控模式下,醫(yī)護(hù)人員需要放下手中工作再去操控床旁監(jiān)護(hù)儀,如開關(guān)機(jī)、報(bào)警設(shè)置、測量血壓等,一般至少需要花費(fèi)20 s以上時(shí)間,倘若還需要手消毒后再去操控機(jī)器,可能需要幾分鐘;并且因操控監(jiān)護(hù)儀而中斷手中工作,不可避免的會(huì)對工作進(jìn)度有影響。而在語音操控方式下,測試發(fā)現(xiàn)完成上述五種監(jiān)護(hù)儀操控,平均每種操控所花時(shí)間不會(huì)超過8 s,并且通過語音操控方式醫(yī)護(hù)人員不必去中斷現(xiàn)有工作即可完成監(jiān)護(hù)儀操作,且不存在接觸感染的風(fēng)險(xiǎn)。由此可見,通過該系統(tǒng)能夠?yàn)獒t(yī)護(hù)人員提供一種更加便捷、高效的監(jiān)護(hù)儀操控方式,并避免接觸感染。
當(dāng)前,智能語音識別技術(shù)發(fā)展突飛猛進(jìn),智能語音識別技術(shù)與醫(yī)療場景的結(jié)合應(yīng)用在提升臨床工作降本增效能力等方面表現(xiàn)出巨大的潛力;但是大多集中在語音電子病歷錄入、語音問診機(jī)器人等方面[16-17],例如云知聲提出的語音電子病歷,科大訊飛開發(fā)的智能問診系統(tǒng)等。在醫(yī)療設(shè)備的語音交互控制方面的應(yīng)用研究并不多見,少數(shù)在康復(fù)訓(xùn)練系統(tǒng)[18]、假肢運(yùn)動(dòng)[19]等方面開展了相關(guān)的研究,而在臨床監(jiān)護(hù)儀操控方面的應(yīng)用研究寥寥無幾。本文根據(jù)臨床監(jiān)護(hù)儀操控的實(shí)際需求,創(chuàng)新性的將語音識別技術(shù)應(yīng)用在監(jiān)護(hù)儀操控方面,設(shè)計(jì)了監(jiān)護(hù)儀智能語音操控系統(tǒng)。測試結(jié)果也表明將語音識別技術(shù)應(yīng)用于監(jiān)護(hù)儀操控方面是可行的,本技術(shù)在優(yōu)化監(jiān)護(hù)儀日常操控方式上有積極意義,能夠一定程度上提高醫(yī)護(hù)操控效率和避免接觸感染。
本文針對當(dāng)前監(jiān)護(hù)儀日常操作中遇到的一些問題,提出并設(shè)計(jì)了一種基于語音控制技術(shù)的監(jiān)護(hù)儀操控系統(tǒng)。通過該系統(tǒng),醫(yī)護(hù)人員可以方便的通過語音指令方式控制監(jiān)護(hù)儀按期望方式運(yùn)作。較傳統(tǒng)監(jiān)護(hù)儀操控方式相比,不僅能夠有效提高操控效率,節(jié)約時(shí)間;同時(shí)醫(yī)護(hù)人員也不必去經(jīng)常接觸監(jiān)護(hù)儀,能夠較好地避免接觸感染,特別是傳染隔離區(qū)內(nèi)有較大應(yīng)用價(jià)值。本文對語音控制技術(shù)在監(jiān)護(hù)儀中應(yīng)用進(jìn)行了初步研究,驗(yàn)證了該技術(shù)的可行性,但是仍然存在一些不足之處,之后會(huì)在下面幾個(gè)方面開展進(jìn)一步的工作:① 結(jié)合醫(yī)院和急救車的特殊外界聲音環(huán)境,在當(dāng)前基礎(chǔ)上優(yōu)化語音識別的算法,進(jìn)一步提高識別準(zhǔn)確率;② 開展基于特定語音識別的研究,讓系統(tǒng)僅能識別指定用戶的聲音,避免其他非相關(guān)人員的誤操作;③ 豐富語音控制功能范圍,使得醫(yī)護(hù)人員可通過語音模塊直接對監(jiān)護(hù)儀參數(shù)進(jìn)行設(shè)置、調(diào)用生命體征數(shù)據(jù)趨勢圖等。