韓云鵑
(中國(guó)廣播電視總臺(tái),北京 100000)
現(xiàn)階段全球科學(xué)技術(shù)正面臨著全新的發(fā)展趨勢(shì),也使眾多產(chǎn)業(yè)發(fā)生了重大的變革,跨專(zhuān)業(yè)、跨領(lǐng)域等綜合性創(chuàng)新發(fā)展,成為未來(lái)發(fā)展的重要研究?jī)?nèi)容和發(fā)展趨勢(shì)。其中,在廣播電視的創(chuàng)新性發(fā)展模式構(gòu)建中,就可以充分利用5G技術(shù)、AI技術(shù),實(shí)現(xiàn)超高清視頻節(jié)目的制作,以此滿足社會(huì)上對(duì)于電視媒體的發(fā)展需求。
進(jìn)入新時(shí)代,為了實(shí)現(xiàn)智慧廣電的系統(tǒng)構(gòu)建,往往需要面臨著諸多方面的問(wèn)題,首先就是人才的供給不足。技術(shù)團(tuán)隊(duì)當(dāng)中,很少有可以充分利用5G技術(shù)、AI技術(shù)的人才,從而就會(huì)在未來(lái)的發(fā)展中,造成嚴(yán)重的阻礙。在進(jìn)行智慧廣電構(gòu)建的過(guò)程中,需要在眾多產(chǎn)品的基礎(chǔ)上,對(duì)多種技術(shù)進(jìn)行結(jié)合以及創(chuàng)新。當(dāng)下電視行業(yè)當(dāng)中需要更多技術(shù)型、復(fù)合型人才,這樣才可以推動(dòng)電視媒體行業(yè)的進(jìn)步。
伴隨著信息技術(shù)的高速發(fā)展,使得人們?cè)谶M(jìn)行智慧廣電媒體的信息傳播中,面臨著全新的要求,要在未來(lái)的信息傳播過(guò)程中,積極使用更多先進(jìn)的傳播技術(shù),實(shí)現(xiàn)多樣化的傳播途徑探索。但是,在實(shí)際的傳播過(guò)程中,技術(shù)的復(fù)雜程度較高,并且很多都脫離了傳統(tǒng)的內(nèi)容監(jiān)管能力范疇,在這樣缺乏行業(yè)規(guī)范的情況下,就會(huì)導(dǎo)致無(wú)法對(duì)其平臺(tái)進(jìn)行規(guī)劃化的統(tǒng)一管理,進(jìn)而造成一些不良內(nèi)容的輸出,以此嚴(yán)重的阻礙廣電未來(lái)的發(fā)展與進(jìn)步。
為了保障讓一些傳統(tǒng)的廣播電視用戶,可以在當(dāng)下全新的媒體環(huán)境中,可以及時(shí)的獲取到自己需要的信息數(shù)據(jù)源,就成為了當(dāng)下技術(shù)發(fā)展的主要內(nèi)容,同時(shí)也是發(fā)展的困難點(diǎn)。在這樣的發(fā)展階段中,用戶進(jìn)行硬件方面的升級(jí),以及軟件環(huán)境的構(gòu)建中,往往都會(huì)消耗大量的資源,因此就需要充分的保障用戶不會(huì)出現(xiàn)流失,實(shí)現(xiàn)更加周密的部署以及安排。
在過(guò)去的傳統(tǒng)形式下的節(jié)目字幕制作中,往往效率比較低下,這是由于整體的制作流程較多,同時(shí)制作的勞動(dòng)強(qiáng)度也比較高。在這樣的模式下,需要投入大量的時(shí)間精力與勞動(dòng)精力。在現(xiàn)階段的AI語(yǔ)音技術(shù)的人機(jī)耦合字幕制作流程中,可以很好的在字幕制作中,與配音進(jìn)行同時(shí)進(jìn)行,這樣就可以極大的降低人力與物力的投入量[1]。并且,相對(duì)的也保障了在字幕制作中的精準(zhǔn)度。這樣的模式下,其字幕的制作流程較為簡(jiǎn)單,并且配音中的發(fā)音,也相對(duì)比較流暢,同時(shí)涵蓋了整個(gè)節(jié)目字幕的制作。
當(dāng)下節(jié)目制作過(guò)程中所采用的ASR技術(shù),就是一種在實(shí)際的制作過(guò)程中,可以將人聲轉(zhuǎn)變成語(yǔ)言文本,這樣的語(yǔ)音轉(zhuǎn)寫(xiě)功能,是一種十分重要的技術(shù),可以很好的將連續(xù)的語(yǔ)言轉(zhuǎn)變成大量的文本[2]。伴隨著現(xiàn)階段信息技術(shù)的發(fā)展,使得在社會(huì)當(dāng)中出現(xiàn)了海量數(shù)據(jù)信息,同時(shí)加上計(jì)算機(jī)技術(shù)的發(fā)展,也讓其ASR技術(shù)得到了全面的發(fā)展,例如可以將其與RNN、CNN以及DNN技術(shù)進(jìn)行結(jié)合,使得降低ASR技術(shù)的門(mén)檻。
AI語(yǔ)音合成技術(shù),可以在實(shí)際的使用中,也能夠?qū)⒁恍┪淖中畔ⅲD(zhuǎn)變成語(yǔ)音的形式朗讀出來(lái),為儀器配備了發(fā)聲的設(shè)備。在語(yǔ)言合成系統(tǒng)的構(gòu)建中,往往分為前端與后端這兩個(gè)不同的模塊。其中前端模塊在使用的過(guò)程中,主要是為了能夠?qū)ζ湮谋镜恼Z(yǔ)言學(xué)信息進(jìn)行傳輸,同時(shí)也可以將信息傳輸?shù)胶蠖水?dāng)中,對(duì)其語(yǔ)音進(jìn)行語(yǔ)音的合成。對(duì)于用戶而言,就需要在實(shí)際的處理中,可以對(duì)文字稿提交到合成系統(tǒng)當(dāng)中,系統(tǒng)則會(huì)對(duì)音頻進(jìn)行全面的采集與分析,同時(shí)對(duì)其語(yǔ)速進(jìn)行針對(duì)性的調(diào)整,智能識(shí)別各種數(shù)字讀法與設(shè)置,并將語(yǔ)法層次的信息,全面的傳輸?shù)胶蠖?,這樣在后端對(duì)其進(jìn)行詳細(xì)的分析處理之后例如進(jìn)行韻律的分析百年可以實(shí)現(xiàn)對(duì)語(yǔ)音的長(zhǎng)短、高低的分析[3]。之后,在對(duì)其信息進(jìn)行處理的過(guò)程中,也可以在信息的處理中,實(shí)現(xiàn)針對(duì)性的調(diào)整與評(píng)估,以此可以獲得到最終的音頻信息。
在節(jié)目的制作過(guò)程中,到了節(jié)目的審核階段,傳統(tǒng)的節(jié)目制作標(biāo)準(zhǔn)需要人工的方式進(jìn)行審核。但是,這樣的人為操作模式會(huì)導(dǎo)致每天審核的節(jié)目數(shù)量十分有限,無(wú)法與機(jī)器的審核速度相比較。其次,人工的審核過(guò)程中,對(duì)于一些敏感人物、敏感標(biāo)志以及一些錯(cuò)誤率較高的處理上,始終無(wú)法得到有效的改善。因此,在當(dāng)下5G、4K的節(jié)目制作過(guò)程中,就需要利用人工智能的技術(shù)理念,進(jìn)一步的提升審核的效果。
傳統(tǒng)形式下的視頻資產(chǎn)存儲(chǔ)管理,基本都是基于人工編目的方式而進(jìn)行,而這樣的編目方式存在一定缺陷,具體體現(xiàn)錯(cuò)誤率方面。同時(shí),在編目過(guò)程中,始終無(wú)法實(shí)現(xiàn)對(duì)一些價(jià)值較高的內(nèi)容進(jìn)行標(biāo)注。例如,在一些重要的人物、場(chǎng)景以及動(dòng)作當(dāng)中,其讓AI技術(shù)就可以實(shí)現(xiàn)高效率的分析與研究,并利用AI圖像文字特征的提取方式,能夠進(jìn)一步的提升節(jié)目?jī)?nèi)容的審核流程,同時(shí)對(duì)其內(nèi)容進(jìn)行自動(dòng)化的編目,這樣就可以極大的縮短工作量,提升節(jié)目的審核效率。
當(dāng)下的GPU算力不斷提升,特別是在大數(shù)據(jù)技術(shù)的加持下,使得AI與深度學(xué)習(xí)技術(shù),可以在視頻的分類(lèi)、人臉識(shí)別以及多模態(tài)融合的過(guò)程中,都得到了較為廣泛地應(yīng)用。例如,在使用AI技術(shù)的過(guò)程中,可以很好的對(duì)融合文本、圖片等信息的分類(lèi)與整理,并通過(guò)構(gòu)建出的模型指標(biāo)、實(shí)現(xiàn)跨模態(tài)的視頻處理。
智慧家庭媒體,屬于未來(lái)我國(guó)媒體行業(yè)發(fā)展的主要方向。我國(guó)當(dāng)下5G技術(shù)發(fā)展迅速,加上在4K超高清技術(shù)的發(fā)展背景下,有關(guān)人員就可以制定出一套符合我國(guó)現(xiàn)階段國(guó)民需求的發(fā)展方向。同時(shí),加上AI技術(shù)的發(fā)展,使得更加可以在智慧廣電的建設(shè)中,可以發(fā)揮出更高的價(jià)值。首先,在某地區(qū)的廣播電視平臺(tái)的構(gòu)建中,就利用AI技術(shù),實(shí)現(xiàn)了多元化的建設(shè)。例如,在實(shí)際的使用過(guò)程中,可以工作人員基于藍(lán)牙語(yǔ)言,對(duì)其平臺(tái)進(jìn)行操作,同時(shí)在廠內(nèi)的拾音功能的智慧機(jī)頂盒,就是整個(gè)系統(tǒng)發(fā)揮出AI技術(shù)的重要裝置。其次,在用戶的操作中,也可以利用遙控器、麥克風(fēng)等,進(jìn)行針對(duì)性的控制。伴隨著AI技術(shù)的發(fā)展,也漸漸取消了這種操作模式,而是利用人機(jī)交互系統(tǒng),可以為用戶在實(shí)際的觀看過(guò)程中,提供更加全面具體的信息內(nèi)容,同時(shí)保障實(shí)現(xiàn)4K分辨率的操作,更加提升用戶的觀看體驗(yàn)。
在全面建設(shè)的5G網(wǎng)絡(luò)技術(shù)之后,使得可以有效的將其與互聯(lián)網(wǎng)信息技術(shù)進(jìn)行融合發(fā)展,因此為我國(guó)的智慧廣電系統(tǒng)建設(shè)打下良好的基礎(chǔ)。在實(shí)際的建設(shè)中,可以有效的將網(wǎng)絡(luò)搭建到云端,以此讓多個(gè)不同的模塊接入,這樣就可以實(shí)現(xiàn)良好的系統(tǒng)構(gòu)建。在實(shí)際的運(yùn)行過(guò)程中,物聯(lián)網(wǎng)以及5G結(jié)構(gòu)是整個(gè)系統(tǒng)的核心組成,可以將信息傳輸?shù)皆贫水?dāng)中,大大降低存儲(chǔ)量的局限性,同時(shí)也極大的保障傳輸過(guò)程中的通暢性與靈敏性。伴隨著5G技術(shù)的發(fā)展與完善,使得這樣的技術(shù)發(fā)展中,可以創(chuàng)造出更多的發(fā)展空間,形成智慧廣電網(wǎng)絡(luò)的整體架構(gòu),滿足當(dāng)下電視媒體的發(fā)展需求,同時(shí)推動(dòng)電視媒體朝向超高清視頻傳播的順利轉(zhuǎn)型。
在未來(lái)的發(fā)展中,需要有效地利用5G、4K以及AI技術(shù),進(jìn)行全面的發(fā)展與建設(shè),并保障在未來(lái)的發(fā)展中,也能夠充分發(fā)揮出自身的技術(shù)性優(yōu)勢(shì),為人們提供質(zhì)量更高的電視媒體節(jié)目,提升市場(chǎng)競(jìng)爭(zhēng)力。