摘要:將計(jì)算機(jī)語(yǔ)音合成技術(shù)應(yīng)用到計(jì)算機(jī)輔助教學(xué)CAI中,對(duì)教學(xué)能提供較大幫助??梢岳脤?zhuān)門(mén)的語(yǔ)音合成軟件TTS App進(jìn)行語(yǔ)音合成,也可以利用Microsoft Office XP中的Excel提供的語(yǔ)音合成功能,通過(guò)設(shè)置,在Word和PowerPoint中實(shí)現(xiàn)語(yǔ)音合成。
關(guān)鍵詞:語(yǔ)音合成;CAI;TTS App;Office XP
引言
計(jì)算機(jī)語(yǔ)音合成即TTS(Text to Speech),指計(jì)算機(jī)將隨機(jī)產(chǎn)生的、或外部輸入的文字信息轉(zhuǎn)變?yōu)槿丝梢月?tīng)懂的、較流利的口語(yǔ)輸出。語(yǔ)音合成是計(jì)算機(jī)應(yīng)用的重要領(lǐng)域,其研究涉及到計(jì)算機(jī)科學(xué)、語(yǔ)言學(xué)、語(yǔ)音學(xué)、人工智能、心理學(xué)等多種學(xué)科。
實(shí)現(xiàn)計(jì)算機(jī)語(yǔ)音輸出一般有兩種方法:一種是錄音/重放,另一種是文字—語(yǔ)音轉(zhuǎn)換。錄音/重放方法是原語(yǔ)音的重現(xiàn),可獲得高質(zhì)量的聲音,但它不能滿(mǎn)足實(shí)時(shí)修改發(fā)音內(nèi)容的需要,而且所需的存儲(chǔ)容量會(huì)隨發(fā)音時(shí)間而線(xiàn)性增長(zhǎng)。文字—語(yǔ)音轉(zhuǎn)換方法可以根據(jù)給定文字即時(shí)發(fā)出語(yǔ)音,文語(yǔ)轉(zhuǎn)換的參數(shù)庫(kù)不會(huì)隨發(fā)音時(shí)間增長(zhǎng)而加大,但是要尋找合適的參數(shù)和生成算法,并合成極似人類(lèi)發(fā)音的、自然流暢的語(yǔ)音難度非常大。
一般來(lái)說(shuō),錄音/重放技術(shù)常應(yīng)用于一些不需要語(yǔ)言理解和隨時(shí)更新的系統(tǒng)中,如航班信息發(fā)布、語(yǔ)音報(bào)時(shí)、汽車(chē)報(bào)站、電話(huà)語(yǔ)音服務(wù)等系統(tǒng)。而文字—語(yǔ)音轉(zhuǎn)換系統(tǒng)是基于語(yǔ)音合成技術(shù)實(shí)現(xiàn)的文字到語(yǔ)音的即時(shí)轉(zhuǎn)換,能適應(yīng)各種需求,應(yīng)用領(lǐng)域極為廣泛。
1 計(jì)算機(jī)輔助教學(xué)CAI中的語(yǔ)音合成
隨著現(xiàn)代教育技術(shù)水平的提高,以及各院校多媒體教學(xué)設(shè)備的更新,許多教師都采用了CAI技術(shù)和多媒體教學(xué)手段,其中不可避免地要碰到輸出語(yǔ)音的問(wèn)題,比如在利用PowerPoint電子演示文稿軟件放映幻燈片時(shí),有時(shí)就需要輸出語(yǔ)音。利用PowerPoint自帶的“錄制旁白”的方法,將教師的語(yǔ)音保存在計(jì)算機(jī)中,放映時(shí)同步播出,這樣做雖然語(yǔ)音質(zhì)量較好,但是一則錄制旁白比較麻煩,花費(fèi)時(shí)間較長(zhǎng),對(duì)錄音時(shí)的環(huán)境要求較高,二則需要較大的存儲(chǔ)空間,不利于課件的轉(zhuǎn)送,三是內(nèi)容不能更新。另外,有些課程,如《計(jì)算機(jī)專(zhuān)業(yè)英語(yǔ)》,其中許多內(nèi)容并沒(méi)有配備相應(yīng)語(yǔ)音文件,單獨(dú)找外教錄制也很麻煩。
因而,將計(jì)算機(jī)語(yǔ)音合成技術(shù)應(yīng)用到多媒體教學(xué)中,讓計(jì)算機(jī)自己按照教師的要求即時(shí)“讀”出語(yǔ)音,是非常有意義的。
2 語(yǔ)音合成應(yīng)用于CAI中的實(shí)現(xiàn)技術(shù)
要在CAI中實(shí)現(xiàn)語(yǔ)音合成,可以采取直接調(diào)用TTS軟件合成語(yǔ)音的方法,也可以在CAI課件中嵌入語(yǔ)音。TTS軟件可以將輸入文本后直接轉(zhuǎn)換成語(yǔ)音輸出,而且可以控制語(yǔ)音的語(yǔ)速、音量、暫停、繼續(xù)播放等,操作簡(jiǎn)便。在課件中嵌入語(yǔ)音,可以利用Microsoft Office XP自帶的語(yǔ)音合成引擎,經(jīng)過(guò)簡(jiǎn)單設(shè)置后實(shí)現(xiàn)指定內(nèi)容的語(yǔ)音輸出。
2.1 利用TTS軟件直接輸出語(yǔ)音
自20世紀(jì)60年代首個(gè)英語(yǔ)TTS系統(tǒng)研制成功以來(lái),迄今世界上已推出多種語(yǔ)言的TTS系統(tǒng)。近年來(lái)我國(guó)也研制出許多優(yōu)秀的漢語(yǔ)TTS軟件,都較好地實(shí)現(xiàn)了輸入語(yǔ)篇后立時(shí)轉(zhuǎn)換成語(yǔ)音的任務(wù),而且這些系統(tǒng)合成的漢語(yǔ)語(yǔ)音的可懂度、清晰度都達(dá)到了較高的水平。
在這樣的軟件環(huán)境下,教師可以直接利用現(xiàn)成的TTS軟件實(shí)現(xiàn)語(yǔ)音輸出。這里以Microsoft Speech SDK中的TTs App軟件的操作為例作一介紹。
首先在網(wǎng)絡(luò)瀏覽器IE的地址欄中輸入網(wǎng)址:http://www.microsofl.corn/downloads/details.a(chǎn)spx?Familyld=5E86EC97-40A7-453F-BOEE-658317184530displaylang=en 在該Microsoft Speech SDK 5.1下載頁(yè)面上找到“Files inThis Download\"部分,如圖1所示。這部分包括了幾個(gè)獨(dú)立的供下載的文件。其中SpeechSDK51.exe文件提供了英語(yǔ)語(yǔ)音引擎,SpeechSDK51LangPack.exe文件提供了漢語(yǔ)語(yǔ)音引擎。
下載完成后,首先雙擊運(yùn)行SpeechSDK51.exe進(jìn)行解壓,解壓完成后雙擊運(yùn)行解壓出的Setup.exe安裝文件,按照安裝向?qū)崾景惭bMicrosoft Speech SDK 5.1。該文件安裝完成后,再雙擊SpeechSDK51LangPack.exe自解壓文件,解壓后將在當(dāng)前目錄下生成一個(gè)名為L(zhǎng)angPack的文件夾,在該文件夾中找到Setup.exe安裝文件,雙擊運(yùn)行,按照安裝向?qū)У奶崾具M(jìn)行“Complete”安全安裝。
安裝完成后,在[開(kāi)始]菜單的[所有程序]下會(huì)發(fā)現(xiàn)一個(gè)[Microsoft Speech SDK 5.1]程序組圖標(biāo),在其下級(jí)菜單中找到[Tool]菜單頃,其中有—個(gè)[TTs App]命令,單擊,即可運(yùn)行該軟件。
在“Enter text you wish spoken here.(在此輸入你想朗讀的文本)”文本輸入框中,輸入需要語(yǔ)音輸出的文本內(nèi)容,單擊右邊的“Speak”按鈕,就可以聽(tīng)到計(jì)算機(jī)合成的語(yǔ)音輸出了。
用戶(hù)可以通過(guò)“Voice”下拉式列表框來(lái)選擇英文語(yǔ)音發(fā)音(分男女聲)或中文語(yǔ)音發(fā)音(男聲),并可通過(guò)“Rate”滑尺來(lái)選擇語(yǔ)音的音速,通過(guò)“Volume”來(lái)調(diào)節(jié)語(yǔ)音的音量高低,通過(guò)“Format”下拉式列表框來(lái)選擇聲音的格式。另外還可以通過(guò)右側(cè)的“Pause”、“Speak”按鈕來(lái)控制輸出語(yǔ)音的輸出和繼續(xù)播放等。
利用Microsoft Speech SDK這個(gè)TTS軟件來(lái)進(jìn)行計(jì)算機(jī)語(yǔ)音合成,因?yàn)樾枰诮處煓C(jī)上下載相應(yīng)的軟件并進(jìn)行安裝,另外輸入的文本篇幅受限小且不能保存,所以使用上有局限性。
2.2 在Microsoft Office XP中實(shí)現(xiàn)語(yǔ)音輸出
現(xiàn)在多數(shù)教師所用的計(jì)算機(jī)都安裝了Microsoft OfficeXP辦公軟件。Microsoft Office XP比起Microsoft Office以前的版本來(lái)說(shuō),增加了許多新功能,其中包括語(yǔ)音合成功能。
2.2.1 Excel語(yǔ)音合成功能介紹
啟動(dòng)Excel(本文中所提到的Word、Excel和PowerPoint指的都是Microsoft Office XP中的成員),單擊[工具]菜單下的[語(yǔ)音]菜單項(xiàng),在下級(jí)菜單中選中[顯示“文本到語(yǔ)音”工具欄]復(fù)選項(xiàng),即出現(xiàn)“文本到語(yǔ)音”工具欄。
“文本到語(yǔ)音”32具欄中的按鈕從左到右依次為“朗讀單元格”、“停止朗讀”、“按行”、“按列”和“按回車(chē)鍵開(kāi)始朗讀”。
當(dāng)用戶(hù)在單元格中輸入要合成語(yǔ)音輸出的文本內(nèi)容后,選中單元格,單擊“文本到語(yǔ)音”工具欄中的“朗讀單元格”按鈕,就可以聽(tīng)到計(jì)算機(jī)合成的語(yǔ)音輸出了。
這里需要說(shuō)明的是,通過(guò)選擇“控制面板”下的“聲音、語(yǔ)音和音頻設(shè)備”項(xiàng)目,選擇其中的“語(yǔ)音”圖標(biāo),在彈出的“語(yǔ)音屬性”對(duì)話(huà)框中有一“語(yǔ)音選擇”下拉式列表框,如圖2所示,通過(guò)選擇“Microsoft Sam”(英文男聲朗讀)或“Microsoft SimplifiedChinese”(簡(jiǎn)體中文男聲朗讀),可以分別實(shí)現(xiàn)英文語(yǔ)音輸出和中文語(yǔ)音輸出。此外,還可以對(duì)輸出語(yǔ)音的速度進(jìn)行調(diào)整。
2.2.2在Word中實(shí)觀語(yǔ)音合成
啟動(dòng)Word,單擊[工具]菜單下的[宏],在彈出的下級(jí)菜單中選擇[宏…]菜單項(xiàng)。在彈出的“宏”對(duì)話(huà)框中的“宏名”文本輸入框中輸入宏的名稱(chēng),例如“WordTTS”,單擊“創(chuàng)建”按鈕。在彈出的Microsoft Visual Basic中的代碼輸入窗口中,輸入以下代碼:
Sub WordTTS
Call Excel.Application.Speech.Speak(Selection)
End Sub
輸入完成后,再單擊[工具]菜單下的[引用]菜單項(xiàng),在彈出的“引用”對(duì)話(huà)框中的“可使用的引用”列表框中,找到并選中“Microsoft Excel 10.0 Object Library”復(fù)選框,單擊“確定”按鈕,并保存,關(guān)閉Microsoft Visual Basic窗口,回到Word編輯窗口。
在Word的文檔中輸入文字,例如:
“How to select a personal computer system?1 will tell you
something about that.”
隨后選中這段文字,再單擊[工具]菜單中的[宏],選擇[宏]菜單項(xiàng),在彈出的“宏”對(duì)話(huà)框中選中“WordTTS”宏名,單擊“運(yùn)行”按鈕,就可以聽(tīng)到計(jì)算機(jī)讀出的語(yǔ)音了。
這樣,當(dāng)我們需要在Word中進(jìn)行語(yǔ)音合成時(shí),只要選定需要輸出語(yǔ)音的文本內(nèi)容,再運(yùn)行剛才的宏WordTTS,就可以隨時(shí)得到合成語(yǔ)音了。
2.2.3在PowerPoint中實(shí)現(xiàn)話(huà)音合成
在Word中我們實(shí)現(xiàn)了利用計(jì)算機(jī)語(yǔ)音合成來(lái)進(jìn)行CAI的語(yǔ)音輸出。但是在實(shí)際教學(xué)中,大多數(shù)教師在教學(xué)過(guò)程中使用了Microsoft Office XP中的PowerPoint電子演示文稿軟件來(lái)制作多媒體課件。我們也可以利用Microsoft Office XP的語(yǔ)音合成功能實(shí)現(xiàn)PowerPoint電子演示文稿中的語(yǔ)音輸出,使語(yǔ)音合成功能更具實(shí)用性。
首先啟動(dòng)PowerPoint,在出現(xiàn)的新建演示文稿的第—張幻燈片中,單擊標(biāo)題文本框(也即第—個(gè)文本框),輸入—段文字,例如:
“How to select a personal computer system?I will tell you
something about that.”
單擊[32具]菜單下的[宏],在彈出的下級(jí)菜單中選擇[宏…]菜單項(xiàng)。在彈出的“宏”對(duì)話(huà)框中的“宏名”文本輸入框中輸入宏的名稱(chēng),例如“PPTTTS”,單擊“創(chuàng)建”按鈕。在彈出的Microsoft Visual Basic編輯器中,單擊[工具]菜單下的[引用]菜單項(xiàng),在彈出的“引用”對(duì)話(huà)框中的“可使用的引用”列表框中,找到并選中“Microsoft Excel 10.0 Object Library\"復(fù)選框,單擊“確定”按鈕。接著,在代碼輸入窗口中,輸入以下代碼:
單擊[幻燈片放映]菜單中的[動(dòng)作按鈕]菜單項(xiàng),在列出的十二種動(dòng)作按鈕中任選一種動(dòng)作按鈕。雙擊幻燈片的右下角,將動(dòng)作按鈕插入到幻燈片中。在隨即彈出的“動(dòng)作設(shè)置”對(duì)話(huà)框中,選擇“單擊鼠標(biāo)”選項(xiàng)卡,將“單擊鼠標(biāo)時(shí)的動(dòng)作”設(shè)為“運(yùn)行宏”,并在“運(yùn)行宏”下方的下拉式列表框中選定剛才所創(chuàng)建的\"PPTTTS\"宏名,單擊“確定”按鈕。這樣在幻燈片中就出現(xiàn)了一個(gè)動(dòng)作按鈕,如圖3所示。
最后,單擊[幻燈片放映]菜單下的[觀看放映],進(jìn)入幻燈片放映的界面中,再單擊動(dòng)作按鈕,就可以聽(tīng)到對(duì)這第一張幻燈片的第一個(gè)文本框中的內(nèi)容的語(yǔ)音朗讀了。
該過(guò)程的代碼中的\"Call Excel.Application.Speech.Speak.(PowerPoint.ActivePresentation.Slides(1).Shapes(1).TextFrame.TextRange.Text)\"語(yǔ)句,是對(duì)PowerPoint當(dāng)前電子演示文稿中的第1張幻燈片的第1個(gè)對(duì)象文本框中的文本內(nèi)容進(jìn)行語(yǔ)音輸出。當(dāng)用戶(hù)插入新的幻燈片時(shí),只需對(duì)相應(yīng)的代碼加以修改即可。
3 結(jié)束語(yǔ)
計(jì)算機(jī)語(yǔ)音合成在計(jì)算機(jī)輔助教學(xué)CAI中具有很大的作用。教師可以通過(guò)專(zhuān)門(mén)的TTS軟件實(shí)現(xiàn)語(yǔ)音輸出,也可以在Microsoft Office XP中實(shí)現(xiàn)語(yǔ)音輸出。利用本文中所述方法,教師只需通過(guò)簡(jiǎn)單的語(yǔ)句設(shè)置和操作,即可完成CAI課件中的語(yǔ)音合成。
但是不管用何種方法實(shí)現(xiàn)語(yǔ)音輸出,都存在計(jì)算機(jī)合成語(yǔ)音的質(zhì)量問(wèn)題。合成語(yǔ)音的質(zhì)量取決于語(yǔ)音合成引擎的質(zhì)量。計(jì)算機(jī)語(yǔ)音合成的質(zhì)量不夠高、自然度和流暢度不夠好等,是語(yǔ)音合成研究領(lǐng)域仍在努力攻克的難題。隨著計(jì)算機(jī)語(yǔ)音合成技術(shù)的發(fā)展,合成語(yǔ)音的質(zhì)量、自然度和情感表現(xiàn)力將會(huì)不斷地提高。相信在不久的將來(lái),合成語(yǔ)音能像人類(lèi)發(fā)音一樣自然流暢。