宋奇
在刷短視頻時(shí),許多網(wǎng)友可以聽(tīng)出有很多短視頻里的語(yǔ)音描述都是利用軟件合成的。這種合成的語(yǔ)音剛開(kāi)始的時(shí)候一聽(tīng)就知道是機(jī)器人發(fā)音,現(xiàn)在則越來(lái)越像真人敘述了,科技的進(jìn)步真是日新月異。那么,怎么樣把文字生成語(yǔ)音呢?這里就來(lái)介紹幾種文本(文字)轉(zhuǎn)語(yǔ)音工具。
Azure是一款來(lái)自微軟的文本轉(zhuǎn)語(yǔ)音網(wǎng)頁(yè)版工具,在首屏可以看見(jiàn)Azure的簡(jiǎn)介,但是別急著注冊(cè),因?yàn)樗F(xiàn)在無(wú)需注冊(cè)即可使用。把網(wǎng)頁(yè)往下拉,就可以看到一個(gè)演示網(wǎng)頁(yè)版工具,用它就能輕松實(shí)現(xiàn)文本轉(zhuǎn)語(yǔ)音操作。只需要在文本輸入框區(qū)域輸入或粘貼文字內(nèi)容,接著在旁邊的選項(xiàng)欄中選擇好需要的語(yǔ)言、語(yǔ)音、說(shuō)話風(fēng)格、語(yǔ)速和語(yǔ)調(diào)等參數(shù),然后點(diǎn)擊播放即可完成文本轉(zhuǎn)語(yǔ)音的操作。
使用微軟文本轉(zhuǎn)語(yǔ)音工具轉(zhuǎn)換出來(lái)的語(yǔ)音比較貼近真人,略有感情發(fā)音比較自然,不會(huì)讓人一下就聽(tīng)出是機(jī)器聲。
Azure的文本轉(zhuǎn)語(yǔ)音功能已完全升級(jí)到神經(jīng)算法文本轉(zhuǎn)語(yǔ)音引擎。此引擎使用深度神經(jīng)網(wǎng)絡(luò),使計(jì)算機(jī)的聲音與人類錄音幾乎無(wú)法區(qū)分,通過(guò)清晰的發(fā)音,用戶在與AI系統(tǒng)交互時(shí)可以顯著減輕聽(tīng)力疲勞。
微軟免費(fèi)試用的文本轉(zhuǎn)語(yǔ)音工具雖好,但是卻只能在線生成語(yǔ)音,而且生成的語(yǔ)音無(wú)法下載,這時(shí)候可以使用另一款免費(fèi)的微軟文字轉(zhuǎn)語(yǔ)音小工具,這個(gè)工具調(diào)用的也是微軟文本轉(zhuǎn)語(yǔ)音的功能,只不過(guò)通過(guò)這個(gè)小工具,用戶可以把生成的語(yǔ)音以MP3文件形式保存下來(lái)。
在這個(gè)小工具中輸入或粘貼文字,然后點(diǎn)擊試聽(tīng)或者合成,該工具就會(huì)在該軟件所在目錄下生產(chǎn)一個(gè)“語(yǔ)音.mp3”文件,該文件就是文本轉(zhuǎn)語(yǔ)音后的音頻文件。
另外,在Word中,也有著一個(gè)簡(jiǎn)單的文字轉(zhuǎn)語(yǔ)音小功能。在Word中轉(zhuǎn)到審閱功能欄,然后選擇“大聲朗讀”,就會(huì)自動(dòng)將該文檔里的文字轉(zhuǎn)換為語(yǔ)音朗讀出來(lái),不過(guò)該功能比較簡(jiǎn)單,只有朗讀速度和2種語(yǔ)音可供選擇。
在抖音中也帶有一個(gè)文本轉(zhuǎn)語(yǔ)音工具。用戶在發(fā)表視頻的時(shí)候,在視頻編輯頁(yè)面中選擇添加文字,輸入文字時(shí)可以看到上邊一欄功能選擇中有個(gè)“文本朗讀”按鈕,點(diǎn)擊后就可以把輸入的文字轉(zhuǎn)換為語(yǔ)音朗讀出來(lái)。