王小平
【摘要】近些年來,隨著科學(xué)技術(shù)水平的不斷提升,人工智能技術(shù)的應(yīng)用越來越廣泛,在廣電媒體中,人工智能語音技術(shù)能夠發(fā)揮非常重要的價值,其能夠有效改善傳統(tǒng)音頻工作效率和工作質(zhì)量,優(yōu)化唱詞系統(tǒng)、播報系統(tǒng)和檢索系統(tǒng)等等,從而為廣大人民群眾提供更好的服務(wù)質(zhì)量,本文就廣電媒體中人工智能語音技術(shù)的應(yīng)用進行了探討和研究,希望能夠為相關(guān)的技術(shù)工作者提供一定的幫助和支持。
【關(guān)鍵詞】廣電媒體;人工智能;語音技術(shù);開展應(yīng)用;探討研究
中圖分類號:TN92? ? ? ? ? ? ? ? ? ? ?文獻標(biāo)識碼:A? ? ? ? ? ? ? ? ? ? ?DOI:10.12246/j.issn.1673-0348.2021.07..034
1. 人工智能環(huán)境下廣電媒體的重新定義
在廣電媒體工作開展過程中,人工智能技術(shù)能夠發(fā)揮極大的輔助性作用,其可以極大地降低工作人員的工作復(fù)雜性,減輕工作壓力,減少人為操作產(chǎn)生的失誤,提高工作效率,從根本角度改變節(jié)目的制作過程。利用智能化手段,工作人員可以對內(nèi)容加以處理,實現(xiàn)智能文稿、唱詞系統(tǒng)、虛擬播報系統(tǒng)檢索系統(tǒng)等等。除此之外,廣電媒體從業(yè)者需要借助于相應(yīng)的平臺以及軟件,優(yōu)化工作流程,提升工作效率。
廣電傳媒集團的相關(guān)工作人員必須要不斷更新工作思路,轉(zhuǎn)變工作方法,要從傳統(tǒng)的理念中跳出來,善于運用人工智能,通過一系列的信息化學(xué)習(xí),全方位了解智能語音技術(shù),例如,書本內(nèi)容的音頻化和收聽便捷化已經(jīng)成為了未來的必然發(fā)展趨勢,在當(dāng)今時代,人人都有手機,廣播的移動性和伴隨性將是未來最為重要的特點。當(dāng)今時代人們的生活節(jié)奏越來越快,碎片化時間逐漸增多,完整性時間變少,因此,這種時間分布方面的不規(guī)律也影響著廣播電視工作的未來發(fā)展方向。很多人習(xí)慣在聆聽的過程中觀看文字內(nèi)容,或者通過特殊的語言輸入來搜索信息,這都是傳統(tǒng)的廣播播報工作中所無法提供的服務(wù),借助于新時代的人工智能技術(shù),傳媒集團與廣大受眾之間的聯(lián)系能夠更加緊密,從而讓媒體從業(yè)者能夠?qū)崟r了解受眾們的想法和需求,對工作加以改進,讓媒體工作更加具有針對性。
2. 智能語音技術(shù)分類
首先是語音識別技術(shù)。語音識別技術(shù)是人工智能語音技術(shù)中最為重要的類型之一,借助于人工智能算法,機器可以將識別到的音波振動轉(zhuǎn)換成為相應(yīng)的文字并且加以錄入。語音識別技術(shù)的重點內(nèi)容在于檢查音頻的端點,確保系統(tǒng)能夠準(zhǔn)確識別語言環(huán)境,并且對說話人進行精準(zhǔn)的識別。在系統(tǒng)輸入的過程中,根據(jù)用戶習(xí)慣和用戶自定義語句內(nèi)容,對輸入的精準(zhǔn)性對輸入依據(jù)加以優(yōu)化,從而提高輸入的精準(zhǔn)度。其次,語音轉(zhuǎn)寫技術(shù)是一項重要的應(yīng)用方向,其核心目的在于將語音信號轉(zhuǎn)為文字內(nèi)容,并且借助于人工智能技術(shù)對語音進行修正,結(jié)合上下文的相關(guān)語義和語氣等,將分散的內(nèi)容集中成為整體的段落,對句子加以分析,在這個過程中,要避免背景噪音對于語音輸入的影響,提高輸入精準(zhǔn)度。最后是語音合成技術(shù),語音合成技術(shù)是指把前期收集到的信息以文字的形式輸出,借助于計算機軟件和相應(yīng)的優(yōu)化算法,我們能夠為客戶呈現(xiàn)出文本,并且實現(xiàn)基于文本的一系列操作,包括文本閱讀,語音播放等等。
作為人工智能語音中最為關(guān)鍵性的環(huán)節(jié),語音識別以語音作為最主要的研究對象,通過相應(yīng)的計算機技術(shù),讓機器理解人類口述的語言。語音識別涉及到非常多的技術(shù),屬于新時代的交叉型學(xué)科,其本質(zhì)上屬于模式識別工作方法,需要提取語音特征,并且依據(jù)云端數(shù)據(jù)庫以及預(yù)先設(shè)定的模式加以匹配,從而得到最優(yōu)解作為輸出內(nèi)容。訓(xùn)練和識別是語音技術(shù)中最為重要的兩方面內(nèi)容,訓(xùn)練可以在離線完成,識別只能夠在線完成,兩者相輔相成,互為補充,共同構(gòu)成一個有機整體。
3. 人工智能語音識別技術(shù)的架構(gòu)
首先是系統(tǒng)架構(gòu)。為了更好地促進人工智能語音技術(shù)在廣電媒體中的運用,我們必須要對其技術(shù)架構(gòu)進行深刻的研究,大體上而言,其主要可以包含五個部分,首先,基礎(chǔ)支撐層的核心作用在于構(gòu)建信息采集語音識別的基礎(chǔ)算法和框架,實現(xiàn)對于平臺內(nèi)部各個資源的存儲與優(yōu)化。核心能力層主要作用在于為廣電媒體的市場應(yīng)用提供語音識別等服務(wù),屬于最為重要的工作內(nèi)容。應(yīng)用服務(wù)層的作用在于把客戶的實際發(fā)音與智能技術(shù)綜合聯(lián)系到一起,并且提供更加具有個性化和針對性的服務(wù)。應(yīng)用接入層主要作用在于對前端的信息進行綜合調(diào)控和利用。最后,服務(wù)應(yīng)用平臺的功能是將前期處理得到的信息以文稿唱詞、虛擬播報、內(nèi)容撰寫等形式呈現(xiàn)出來。
其次是軟件架構(gòu)。在人工智能語音技術(shù)應(yīng)用到廣電媒體工作的過程中,軟件架構(gòu)是一項非常重要的內(nèi)容,架構(gòu)的適用性必須要很強,能夠從一個平臺移植到另一個平臺。目前,最為常用的是J2EE組成的Java規(guī)范架構(gòu),大量的研究實踐表明,此架構(gòu)能夠很好的適用于人工智能語音技術(shù)的開發(fā),并且對各個服務(wù)器具有良好的兼容性,能夠?qū)崿F(xiàn)高效靈活的拓展。其次,架構(gòu)必須能夠提供高效的交互界面,方便業(yè)務(wù)人員使用,方便管理員實時進行監(jiān)控和查看。最后是GSON設(shè)計的數(shù)據(jù)交換格式,其適用性較強,能夠?qū)崿F(xiàn)跨平臺移植和應(yīng)用,方便軟件工程師進行編譯。
4. 人工智能在廣播領(lǐng)域的應(yīng)用方式探索
首先內(nèi)容層面。隨著時代的不斷發(fā)展,互聯(lián)網(wǎng)信息技術(shù)已經(jīng)深入應(yīng)用到了各個階層,其中,人工智能技術(shù)占據(jù)了非常重要的位置,在大數(shù)據(jù)時代,利用人工智能語音技術(shù)對廣播傳播內(nèi)容加以優(yōu)化,有助于行業(yè)的拓展延伸,另外,這也能夠提高廣播行業(yè)用戶群體擴大用戶范圍,讓人們能夠以更高的效率獲取信息,利用信息。例如,人工智能語音技術(shù)能夠在交通廣播中發(fā)揮重要價值,司機在開車的時候,既需要保障人身安全,又需要隨時的獲取一些路況信息,此時,通過應(yīng)用人工智能語音技術(shù),能夠為廣大司機提供一個更加便捷的人機交互環(huán)境,及時向司機們傳遞當(dāng)前的交通路況、交通攝像頭狀況、擁堵問題以及接單區(qū)域等等,從而讓司機根據(jù)以上信息,優(yōu)化行車路徑,在保證安全提高效率的同時,能夠加強和提高接單率,提升經(jīng)濟收益。另外,在人工智能的具體應(yīng)用方面,電臺設(shè)計人員可以對人工智能形象進行一些優(yōu)化設(shè)計,并且投放廣告,讓人民群眾在心中建立起對于人工智能的美好印象,加快人工智能的滲透。其次是形式層面,為了促進廣電媒體行業(yè)的有序發(fā)展,我們必須要加強對于刑事方面的探究,要注重用戶與平臺之間的雙向溝通與交流,及時了解用戶的想法和訴求,從而優(yōu)化用戶的體驗過程。
人工智能語音識別技術(shù)的具體應(yīng)用可以包含以下幾個方面:融媒體會議系統(tǒng),隨著廣電媒體行業(yè)的不斷發(fā)展,人工智能語音技術(shù)的應(yīng)用也越來越廣泛,在這個過程中,融媒體會議系統(tǒng)得到了廣大媒體從業(yè)人員的重視,其能夠有效實現(xiàn)人機交互,提高工作人員的工作效率,讓用戶能夠更加清晰的了解到重點內(nèi)容,同時,通過設(shè)置相應(yīng)的傳感器,能夠采集音頻信號,將音頻內(nèi)容更加精確的轉(zhuǎn)化成為文字,方便會議的記錄以及后續(xù)的討論等等。
第三是虛擬播報系統(tǒng)。虛擬播報系統(tǒng)對于廣電媒體產(chǎn)業(yè)而言有極大的幫助性作用,通過設(shè)置虛擬主持人,我們能夠?qū)崿F(xiàn)人工配音方面的解放,讓工作人員轉(zhuǎn)到幕后進行工作,從而實現(xiàn)臺前的自動播報,極大地提高播報系統(tǒng)的智能化和自動化,減輕了工作人員的壓力。另外,通過對人工智能技術(shù)的應(yīng)用加以深度優(yōu)化,能夠有效調(diào)節(jié)播報聲音的響亮程度、清晰程度、發(fā)聲速度,也能夠做到重復(fù)播報、循環(huán)播報等等,因此,企業(yè)應(yīng)當(dāng)加強對于員工人工智能技術(shù)的培訓(xùn),提高其多媒體信息技術(shù)掌控能力,加強對于虛擬機器人的有效操控,從而讓節(jié)目變得更加吸引人,提高受眾數(shù)量。
最后,實現(xiàn)語音和文字的轉(zhuǎn)化。隨著我國經(jīng)濟的迅速發(fā)展,我國科研事業(yè)也取得了一系列進步,人工智能技術(shù)的應(yīng)用有效改善了廣電傳媒工作的質(zhì)量。在具體的應(yīng)用過程中,其能夠?qū)崿F(xiàn)語音和文字之間的相互轉(zhuǎn)換,為了提高這種轉(zhuǎn)換的準(zhǔn)確性,企業(yè)需要對工作人員進行系統(tǒng)性的普通話培訓(xùn)??萍嫉陌l(fā)展讓傳統(tǒng)的廣電媒體行業(yè)迎來了一系列變革,在早些時候,人們獲取信息的主要方式為聲音,但是,聲音的傳輸并不穩(wěn)定,容易受到干擾。隨著時代的不斷進步,我們可以應(yīng)用人工智能技術(shù)將聲音轉(zhuǎn)化為多種類型的形式,包括文字、圖片、視頻等等,從而有效保存原始文件,并且優(yōu)化會議進程。
4. 結(jié)語
總而言之,隨著科學(xué)技術(shù)水平的不斷增長,人工智能語音技術(shù)的應(yīng)用也愈加成熟,其對于廣電媒體而且具有關(guān)鍵性價值,相關(guān)的工程技術(shù)人員必須要不斷革新工作思路,改善工作方法,加強人工智能與廣播電臺的有效融合,要有意識地在電視和廣播節(jié)目中應(yīng)用人工智能語音技術(shù),促進廣播電視行業(yè)的多元化發(fā)展,從而實現(xiàn)我國傳媒行業(yè)的升級與變革。
參考文獻:
[1]趙睿,喻國明.5G大視頻時代廣電媒體未來發(fā)展的行動路線圖[J].新聞界,2020(01):52-58.
[2]王丹.“AI合成主播”的發(fā)展與雙效推進策略[J].傳媒,2019(23):50-52.
[3]段鵬.智能化演進:廣電媒體深度融合歷史機遇與發(fā)展策略[J].編輯之友,2020(03):5-10.
[4]馬曉梅.人工智能對廣播媒體的“再造”[J].新媒體研究,2018,4(24):42-43.
[5]蔡宏伍.人工智能熱潮下廣電媒體創(chuàng)新發(fā)展策略及路徑[J].電視研究,2019(06):76-78.
[6]謝鐘揚.廣電媒體中的人工智能語音技術(shù)運用[J].電腦知識與技術(shù),2019,15(22):217-218.