[摘要]現(xiàn)今,人工智能技術(shù)與有聲出版不斷融合發(fā)展。智能語(yǔ)音合成技術(shù)在有聲出版中的應(yīng)用日益加深,扮演生成式人工智能的內(nèi)容生產(chǎn)角色,呈現(xiàn)一種基于熟人聲音傳播的“聲音超市”,同時(shí)在重塑有聲出版產(chǎn)業(yè)鏈,推動(dòng)有聲出版在智媒時(shí)代朝著更加智能化、專(zhuān)業(yè)化的方向發(fā)展。但智能合成聲音在有聲出版中存在生成內(nèi)容的有限性、缺少伴隨性以及難以規(guī)避隱形版權(quán)問(wèn)題等困境。面對(duì)有聲出版的創(chuàng)新發(fā)展,學(xué)術(shù)界需要對(duì)人工智能聲音進(jìn)行辯證思考,從而推動(dòng)有聲出版的高質(zhì)量發(fā)展以及深度融合。
[關(guān)鍵詞]智能合成聲音;有聲出版;生產(chǎn)實(shí)踐
有聲出版是以聲音為主要表達(dá)符號(hào),基于聽(tīng)覺(jué)認(rèn)知規(guī)律,用有聲語(yǔ)言創(chuàng)作、傳播知識(shí)性音頻內(nèi)容產(chǎn)品的出版類(lèi)型[1]。隨著人工智能時(shí)代的不斷發(fā)展,基于智能語(yǔ)音合成技術(shù)(Text To Speech)的智能合成聲音被應(yīng)用于有聲讀物的出版中,通過(guò)模擬人聲進(jìn)行讀物播報(bào),進(jìn)一步發(fā)揮聲音在有聲讀物中的知識(shí)價(jià)值、文化價(jià)值及伴隨價(jià)值等。在聽(tīng)覺(jué)回歸的時(shí)代下,深入剖析智能合成聲音在有聲出版中的生產(chǎn)實(shí)踐及發(fā)展路徑,有助于挖掘智能合成聲音所含的聽(tīng)覺(jué)價(jià)值,推動(dòng)有聲出版朝著更智能化、專(zhuān)業(yè)化的方向發(fā)展。筆者通過(guò)綜合平臺(tái)影響力、智能語(yǔ)音合成技術(shù)運(yùn)用程度、真人聲與AI人聲對(duì)比等進(jìn)行目的性抽樣,選取喜馬拉雅FM平臺(tái)真人聲@單田芳評(píng)書(shū)、@喜道公子,智能合成聲音@喜小道_喜道公子AI、@單田芳聲音重現(xiàn)四個(gè)賬號(hào)(具體數(shù)據(jù)如表1所示)進(jìn)行案例對(duì)比分析,探究智能合成聲音運(yùn)用到有聲出版生產(chǎn)實(shí)踐的策略,以及其未來(lái)發(fā)展路徑。
一、聲聲相傳:智能合成聲音與有聲出版
從早期口頭朗誦、印刷書(shū)到磁帶、CD再到現(xiàn)在的移動(dòng)數(shù)字音頻平臺(tái),有聲讀物作為一種融合產(chǎn)物經(jīng)歷新舊媒介的競(jìng)合與迭代[2]。國(guó)外數(shù)字有聲書(shū)的正式誕生是1997年美國(guó)Audible網(wǎng)站推出世界第一款便攜數(shù)字音頻播放器,而我國(guó)有聲出版業(yè)主要開(kāi)始于改革開(kāi)放時(shí)期音像出版物盛行。目前,以喜馬拉雅FM、荔枝FM等聚合類(lèi)音頻客戶(hù)端為代表的有聲平臺(tái)正不斷壯大有聲出版領(lǐng)域,而智能合成聲音的加入為有聲出版的發(fā)展提供新的活力。
當(dāng)前,基于各大平臺(tái)的有聲朗讀主要分為兩種:人工朗讀和機(jī)器朗讀。人工智能合成聲音是機(jī)器朗讀的進(jìn)一步升級(jí),通過(guò)已有的語(yǔ)言訓(xùn)練模型無(wú)限接近人聲,如喜馬拉雅FM中的@喜小道_喜道公子AI,基于真人賬號(hào)@喜道公子的聲音合成,已發(fā)出4萬(wàn)多個(gè)作品,并擁有達(dá)9萬(wàn)的粉絲量。人工智能合成聲音不僅助推有聲出版的流量變現(xiàn),而且進(jìn)一步反哺有聲出版的成本支配以及產(chǎn)業(yè)鏈的衍生發(fā)展。有聲出版已從過(guò)去紙質(zhì)書(shū)籍的外圍副產(chǎn)品轉(zhuǎn)變?yōu)榛谌斯ぶ悄芎统两郊夹g(shù)的閱讀新形式[3]。除了提供智能朗讀,語(yǔ)音喚起功能也正賦能有聲出版的智能發(fā)展,通過(guò)智能語(yǔ)音交互功能,用戶(hù)可以即時(shí)地獲取相關(guān)收聽(tīng)內(nèi)容,在平臺(tái)抑或智能音響等提供的聲覺(jué)空間中滿(mǎn)足情感需求。發(fā)展至今,有聲讀物在人工智能技術(shù)的支持下,更多的是以一種超媒介的形式存在,通過(guò)“補(bǔ)償”重新發(fā)揮聽(tīng)覺(jué)的價(jià)值,在視覺(jué)中心主義下,以一種“人機(jī)共聲”的方式為有聲出版謀求融合創(chuàng)新的發(fā)展之道。
二、智聲入耳:智能合成聲音在有聲出版中的生產(chǎn)實(shí)踐
智能語(yǔ)音合成技術(shù)讓聲音不再單調(diào),也讓有聲出版的創(chuàng)新發(fā)展有了更多的可能性。不同于視覺(jué)所具有的方向性、距離感、客觀(guān)性、外部性,聽(tīng)覺(jué)提供了更為沉浸、更具主體感受的傳播體驗(yàn),給予聽(tīng)者涉身的經(jīng)驗(yàn)和情感察覺(jué)[4]。從內(nèi)容生產(chǎn)的類(lèi)型到傳播方式再到產(chǎn)業(yè)鏈生產(chǎn)等,智能合成聲音在有聲出版中都有別于傳統(tǒng)有聲出版流程的繁雜。在智能媒介環(huán)境下,智能語(yǔ)音合成技術(shù)為有聲出版構(gòu)建了新的智能場(chǎng)景,在高速流動(dòng)的聲音景觀(guān)中重塑有聲出版的生產(chǎn)實(shí)踐。
(一)生成式人工智能的內(nèi)容生產(chǎn)
生成式人工智能(Artificial Intelligence Gen-erated Content,AIGC)指利用人工智能技術(shù)生成內(nèi)容的新型生產(chǎn)方式,其技術(shù)主要包括機(jī)器學(xué)習(xí)、自然語(yǔ)言處理等,通過(guò)學(xué)習(xí)大量已有的文本、音頻,進(jìn)而生成新的內(nèi)容,其所生成的內(nèi)容與人類(lèi)創(chuàng)作的內(nèi)容極為相似[5],同時(shí)可以借助已有的語(yǔ)料庫(kù)與數(shù)據(jù)模型等對(duì)已有文本進(jìn)行有聲化朗讀。
智能語(yǔ)音合成技術(shù)在有聲出版的實(shí)踐運(yùn)用中,從簡(jiǎn)單地將文本轉(zhuǎn)換為語(yǔ)音內(nèi)容到自動(dòng)生成語(yǔ)音內(nèi)容,增強(qiáng)了有聲讀物產(chǎn)品的多樣性、豐富性[6]。當(dāng)前,AIGC的內(nèi)容生產(chǎn)主要體現(xiàn)在在線(xiàn)數(shù)字出版,針對(duì)一些已有的評(píng)書(shū)、小說(shuō)等進(jìn)行自動(dòng)化轉(zhuǎn)換。AIGC的內(nèi)容生產(chǎn)節(jié)省了前期配音、后期剪輯的漫長(zhǎng)過(guò)程,其超強(qiáng)的流動(dòng)性大大提高了內(nèi)容文本的轉(zhuǎn)換率。例如,喜馬拉雅FM平臺(tái)利用智能語(yǔ)音合成技術(shù)和特定的音韻模塊,將評(píng)書(shū)演員單田芳的智能合成聲音應(yīng)用到不同風(fēng)格的圖書(shū)中。當(dāng)前,喜馬拉雅FM的@單田芳聲音重現(xiàn)賬號(hào)擁有38萬(wàn)粉絲,已發(fā)布2萬(wàn)多個(gè)作品,該賬號(hào)借助AI語(yǔ)音,讓評(píng)書(shū)大勢(shì)單田芳的聲音重現(xiàn),在獨(dú)特的場(chǎng)景中呈現(xiàn)“書(shū)接上回”。AICG的內(nèi)容生產(chǎn)模式大大豐富了有聲出版的內(nèi)容類(lèi)型,人工智能技術(shù)在有聲出版中的實(shí)踐應(yīng)用正推動(dòng)內(nèi)容生產(chǎn)角色的多元轉(zhuǎn)化。
(二)呈現(xiàn)基于熟人聲音傳播的“聲音超市”
基于聲紋合成的智能語(yǔ)音合成技術(shù)的發(fā)展,聲音與其固定的發(fā)生空間和場(chǎng)所分離,這使得滿(mǎn)足用戶(hù)個(gè)性化需求的聲音出現(xiàn)多種選擇,“聲音超市”也因此生成。不管是對(duì)單田芳的聲音重現(xiàn),還是基于喜馬拉雅簽約主播喜道公子的聲音技術(shù)合成,兩者都有固定的音源。聽(tīng)覺(jué)—發(fā)音的循環(huán)原理指出:人只能發(fā)出他所能聽(tīng)見(jiàn)的聲音[7]。在有聲作品的呈現(xiàn)中,用戶(hù)在聽(tīng)到熟悉的聲音可以進(jìn)一步激發(fā)其發(fā)音意愿,這也使得用戶(hù)傾聽(tīng)甚至產(chǎn)生認(rèn)同感從而進(jìn)行分享的行為成為可能。
具有高度擬人化、人格化的智能合成聲音也可以在同一部有聲作品中實(shí)現(xiàn)互動(dòng)式的有聲播放。在這樣的互動(dòng)與分享過(guò)程中,用戶(hù)通過(guò)對(duì)話(huà)完成故事情節(jié)的描繪與敘事場(chǎng)景的構(gòu)建。@喜小道_喜道公子AI首次推出《深空彼岸》的AI真人互動(dòng)有聲劇,由AI完成大部分旁白,真人對(duì)其中部分對(duì)話(huà)進(jìn)行錄音,完成小說(shuō)的互動(dòng)播報(bào)。目前,該作品共有227.1萬(wàn)的播放量,266條評(píng)論,盡管相較于真人聲音,AI語(yǔ)音仍較生硬,但是首部AI真人互動(dòng)有聲劇讓聲音空間增添了生活氣息或文學(xué)內(nèi)涵,彌補(bǔ)了AI聲音生硬等不足。智能合成聲音通過(guò)構(gòu)建聲場(chǎng),再次復(fù)現(xiàn)原生口語(yǔ)文化時(shí)代互動(dòng)的場(chǎng)景。這樣的有聲出版場(chǎng)景既是高度流動(dòng)的,也是隨時(shí)定格的,在收聽(tīng)中,用戶(hù)會(huì)根據(jù)對(duì)真人聲音播報(bào)的情感需求轉(zhuǎn)移到由智能合成聲音組成的有聲讀物上。
(三)重塑出版產(chǎn)業(yè)鏈的可能性
AIGC的內(nèi)容生產(chǎn)模式正在進(jìn)一步影響出版產(chǎn)業(yè)鏈的運(yùn)作,智能語(yǔ)音合成技術(shù)增強(qiáng)了出版產(chǎn)業(yè)鏈的流動(dòng)性。有聲出版物的更新周期較長(zhǎng),其編輯需要經(jīng)過(guò)文本選擇、后期配音及剪輯等全流程才能完成,同時(shí)需要接受出版審查規(guī)范等,成本高且流程煩瑣?;谌斯ぶ悄芗夹g(shù)的智能合成聲音等功能可以簡(jiǎn)化有聲出版的流程,大幅度削減出版成本。結(jié)合有聲出版中涉及的主體與環(huán)節(jié)可發(fā)現(xiàn),其產(chǎn)業(yè)鏈主要由內(nèi)容提供方、音頻制作方、傳播渠道方與用戶(hù)構(gòu)成[8]。在喜馬拉雅FM平臺(tái),AI主播的作品生成數(shù)量均達(dá)到萬(wàn)級(jí)別,如@喜小道_喜道公子AI作品數(shù)量達(dá)4.7萬(wàn)個(gè)。相比于傳統(tǒng)的有聲出版模式,基于智能語(yǔ)音合成技術(shù)的在線(xiàn)有聲出版可實(shí)現(xiàn)生產(chǎn)、分發(fā)一體化。智能語(yǔ)音合成技術(shù)是聲音在有聲出版運(yùn)用中的一種再媒介化,擁有讓“逝去”或“遠(yuǎn)處”的聲音“復(fù)活”的魔力,可激起用戶(hù)的好奇心以及滿(mǎn)足其情感需求,并強(qiáng)化產(chǎn)業(yè)鏈之間的整體聯(lián)動(dòng)性,進(jìn)一步加快產(chǎn)業(yè)鏈內(nèi)外的雙向流動(dòng),為人工智能時(shí)代下重塑出版產(chǎn)業(yè)鏈提供更多可能性。
三、以聲助力:智能合成聲音在有聲出版中的應(yīng)用困境
人工智能技術(shù)賦能有聲出版的發(fā)展,加快有聲出版產(chǎn)業(yè)鏈的流動(dòng)。但目前智能合成聲音仍然無(wú)法解決固有的機(jī)器性、內(nèi)容生產(chǎn)創(chuàng)作的有限性、聲音所缺少的伴隨性,以及隱形版權(quán)爭(zhēng)議等問(wèn)題。
(一)智能合成聲音生成內(nèi)容的有限性
相較于紙質(zhì)出版物或電子閱讀,有聲出版物本身已將文本內(nèi)容扁平化,多是對(duì)既有文本進(jìn)行“二次創(chuàng)作”。有聲出版平臺(tái)的內(nèi)容生產(chǎn)過(guò)程是一個(gè)二次選擇的過(guò)程。二次選擇,也被稱(chēng)為二次出版,即在文本內(nèi)容的基礎(chǔ)上再制作成音頻產(chǎn)品。但是受限于文本內(nèi)容、制作成本以及模擬合成聲音,并非所有文本內(nèi)容都能進(jìn)行AI聲音的轉(zhuǎn)化,同時(shí)智能合成聲音轉(zhuǎn)化多是對(duì)照文本進(jìn)行直接輸出,缺少由人工朗讀所需要考慮的文字語(yǔ)音加工改造等要素,也難以考慮朗讀時(shí)所要包含的人文內(nèi)涵、文化價(jià)值、藝術(shù)價(jià)值和美學(xué)價(jià)值等[10],導(dǎo)致最終呈現(xiàn)的有聲作品過(guò)于有限。相較評(píng)書(shū)演員單田芳的聲音,@單田芳聲音重現(xiàn)的聲音還是難以準(zhǔn)確達(dá)到人聲中的抑揚(yáng)頓挫的效果,這也導(dǎo)致該賬號(hào)不僅在二次創(chuàng)作中呈現(xiàn)內(nèi)容的扁平化,而且在后續(xù)的多次延伸中難以豐富內(nèi)容的層次和敘事表達(dá)。盡管目前AIGC的聲音轉(zhuǎn)換模式角色不斷豐富,但這種非人類(lèi)的生產(chǎn)模式容易使用戶(hù)在自我聯(lián)想的情景化過(guò)程中形成對(duì)原著本義的差異理解甚至誤讀。
(二)智能合成聲音缺少伴隨性,難以留住用戶(hù)
盡管智能合成聲音在成本和生產(chǎn)速度上優(yōu)先于人工配音,但是在聲音的強(qiáng)伴隨性以及情感感染上仍有所缺失,聲音的出版價(jià)值如文化價(jià)值、情感態(tài)度價(jià)值、伴隨價(jià)值等難以發(fā)揮。有聲出版物如睡前音頻讀物、相聲段子等可以幫助用戶(hù)紓解郁悶,提供一種有溫度的陪伴[11]。聲音的伴隨性恰恰滿(mǎn)足了用戶(hù)對(duì)高效率的追求,但是經(jīng)過(guò)智能合成語(yǔ)音轉(zhuǎn)換后的語(yǔ)調(diào)、音速以及所傳達(dá)的二次情感正在消磨聲音的伴隨性。
聲音的文化價(jià)值多是在內(nèi)容轉(zhuǎn)換上呈現(xiàn),而情感態(tài)度價(jià)值與伴隨價(jià)值的衡量多是從用戶(hù)感知行為出發(fā)。@喜小道_喜道公子AI對(duì)小說(shuō)《囚龍霸天訣》進(jìn)行AI聲音轉(zhuǎn)換,盡管擁有3040.2萬(wàn)的收聽(tīng)量,但僅獲得158條評(píng)論。相比于真人@喜道公子的多部作品,@喜小道_喜道公子AI的用戶(hù)黏性較低,用戶(hù)對(duì)喜小道的喜愛(ài)多限于對(duì)真人主播的情感遷移以及文本本身的影響力。再者,從聲音的伴隨價(jià)值來(lái)看,不僅在于語(yǔ)音、語(yǔ)速以及語(yǔ)言包含的情感,還包括聲音所在的聲場(chǎng)和空間,AI合成的有聲出版多只有生硬人聲,缺少背景音樂(lè)的加持,整體合成聲音較為干澀,用戶(hù)的沉浸式體驗(yàn)感較差,這難以激發(fā)用戶(hù)的后續(xù)情感價(jià)值。
(三)智能合成聲音難以規(guī)避隱形版權(quán)問(wèn)題
有聲出版的版權(quán)問(wèn)題一直亟待解決,智能合成聲音的多角色以及合成模型更難以規(guī)避隱形版權(quán)問(wèn)題。智能合成聲音的快速流動(dòng)帶來(lái)版權(quán)的問(wèn)題,想要加快智能合成聲音在有聲出版中的融合發(fā)展,明晰版權(quán)歸屬是必須的。智能語(yǔ)音合成技術(shù)逐漸成熟,但是相關(guān)法律中對(duì)聲音生產(chǎn)的主體仍限定于自然人,基于該技術(shù)合成的聲音作品面臨授權(quán)主體模糊、侵權(quán)責(zé)任劃分困難等困境[12]。目前,智能合成聲音有聲出版物的法律性質(zhì)尚不明確,AI生成的有聲書(shū)屬于何種類(lèi)型?是否受到著作權(quán)的保護(hù)?聲音是否受到人格權(quán)的影響?基于智能語(yǔ)音合成技術(shù)的AI聲音多具有擬人化的性質(zhì),根據(jù)知名主播等進(jìn)行聲音重現(xiàn),不管是評(píng)書(shū)演員單田芳,還是喜馬拉雅FM平臺(tái)簽約主播喜道公子,都經(jīng)過(guò)真人的聲音模擬合成,由于國(guó)內(nèi)沒(méi)有單獨(dú)“聲音權(quán)”的規(guī)定,因此智能合成聲音的版權(quán)更多需要考慮是否有“人格權(quán)”的隱患。重視智能合成聲音在有聲出版的版權(quán)問(wèn)題,有助于進(jìn)一步規(guī)避有聲出版產(chǎn)業(yè)鏈中出現(xiàn)的版權(quán)問(wèn)題。
四、聲聲相融:智能合成聲音在有聲出版中的發(fā)展路徑
收聽(tīng)有聲讀物已成為當(dāng)下聽(tīng)覺(jué)文化的主流形式之一,隨著人工智能、語(yǔ)音交互等智能技術(shù)的發(fā)展以及移動(dòng)設(shè)備和智能播放器等傳播載體的變遷,有聲讀物更富交互性和沉浸感[13]。將智能合成聲音廣泛運(yùn)用到有聲出版的產(chǎn)業(yè)鏈中,進(jìn)行普及化生產(chǎn),有助于在人機(jī)協(xié)同下推進(jìn)“人機(jī)共聲”,推動(dòng)有聲出版的高質(zhì)量發(fā)展。
(一)基于文化價(jià)值豐富內(nèi)容生產(chǎn)
有聲出版受文化邏輯與技術(shù)邏輯的雙重支配。基于智能語(yǔ)音合成技術(shù)的有聲出版可以充分發(fā)揮聲音的文化價(jià)值,進(jìn)一步彌補(bǔ)文本內(nèi)容二次轉(zhuǎn)化的扁平化及有限性。文化遺產(chǎn)、方言文化以及歷史文化的有聲化生產(chǎn),借助技術(shù)重現(xiàn)過(guò)去的瑰寶可以最大限度地發(fā)揮智能合成聲音的價(jià)值。許多文化遺產(chǎn)或方言文化是通過(guò)口口相傳的方式傳承下來(lái)的,而這些傳統(tǒng)文化知識(shí)的有聲化可以為其保護(hù)和傳承提供更好的途徑。數(shù)字出版融入文化數(shù)字化已成為國(guó)家發(fā)展的重要戰(zhàn)略,將數(shù)字出版與文化數(shù)字相結(jié)合,可推動(dòng)數(shù)字出版內(nèi)容與服務(wù)創(chuàng)新升級(jí),有助于探索有聲出版的數(shù)字文化新模式[14]?,F(xiàn)今,僅依靠智能合成聲音推動(dòng)有聲出版朝著智能化出版發(fā)展仍遠(yuǎn)遠(yuǎn)不夠,在人機(jī)協(xié)同的智能理念下,將真人主播與智能主播相結(jié)合進(jìn)行相互演繹,有助于進(jìn)一步擴(kuò)大聲音的傳播范圍。真人主播與智能主播相互補(bǔ)充,一方面可以憑借真人主播的專(zhuān)業(yè)度打造精品付費(fèi)內(nèi)容;另一方面通過(guò)智能主播擴(kuò)大其他內(nèi)容的傳播范圍,在內(nèi)容質(zhì)量與內(nèi)容生產(chǎn)速度的相互補(bǔ)充中豐富有聲出版在智能合成聲音下的內(nèi)容生產(chǎn)。
(二)利用場(chǎng)景再現(xiàn)增強(qiáng)聲音的伴隨性
聽(tīng)覺(jué)空間不僅有聲音,還具備社會(huì)屬性,聲音應(yīng)當(dāng)參與廣義的文化和社會(huì)空間的再生產(chǎn)[15]?;谄脚_(tái)不斷的發(fā)展,有聲出版不再僅靠“內(nèi)容為王”取勝,而是打通社群化運(yùn)營(yíng)的場(chǎng)景聯(lián)通,實(shí)現(xiàn)場(chǎng)景再現(xiàn)。除了考慮物理空間的跨越時(shí)間與位置,有聲出版還需要融入用戶(hù)的生活空間,將用戶(hù)的社交意愿、生活習(xí)慣、喜愛(ài)程度等結(jié)合有聲書(shū)的文本內(nèi)容進(jìn)行社群營(yíng)銷(xiāo),以培養(yǎng)用戶(hù)更深層次的閱讀行為習(xí)慣,增強(qiáng)用戶(hù)黏性。在基于智能語(yǔ)音合成技術(shù)的有聲作品中,為了吸引用戶(hù)往往采取部分音頻內(nèi)容免費(fèi)收聽(tīng)的機(jī)制。在@喜小道_喜道公子AI的有聲作品中,《囚龍霸天訣》免費(fèi)有聲化小說(shuō)的播放量超3000萬(wàn),相比真人主播@喜道公子的部分作品,AI有聲作品的播放量較高,這也意味著應(yīng)用一定的內(nèi)容營(yíng)銷(xiāo)策略可以激發(fā)用戶(hù)的好奇心,增加有聲作品的點(diǎn)擊播放量。盡管智能合成聲音在播放語(yǔ)音情感中有一定缺失,但通過(guò)社區(qū)運(yùn)營(yíng)以及后期的數(shù)字營(yíng)銷(xiāo),實(shí)現(xiàn)用戶(hù)的場(chǎng)景再現(xiàn),可以有效地補(bǔ)充情感空缺,形成語(yǔ)音社交氛圍,提升用戶(hù)對(duì)智能有聲讀物的接受度與包容度。
(三)明晰智能合成聲音的有聲出版權(quán)責(zé)劃分
隨著智能語(yǔ)音合成技術(shù)的深入發(fā)展,有聲書(shū)的制作成本將有所降低,面對(duì)市場(chǎng)化的擴(kuò)大,有聲出版平臺(tái)明晰智能合成聲音的有聲出版權(quán)責(zé)劃分有助于更好地?cái)U(kuò)大應(yīng)用范圍,防止后續(xù)有聲出版產(chǎn)業(yè)鏈中出現(xiàn)版權(quán)糾紛等問(wèn)題。有聲出版平臺(tái)要明確智能合成有聲書(shū)的著作權(quán)定位,完善有聲書(shū)出版中的著作權(quán)許可機(jī)制,盡可能基于聲音授權(quán)選取更豐富的語(yǔ)料庫(kù)進(jìn)行文本有聲化。除了制度層面的法律完善,有聲出版平臺(tái)還要借助技術(shù)支持對(duì)智能合成聲音進(jìn)行溯源,通過(guò)使用數(shù)字加密技術(shù)進(jìn)一步提升版權(quán)保護(hù)的效能,通過(guò)利用區(qū)塊鏈技術(shù)明確版權(quán)的歸屬和保護(hù),提升版權(quán)管理的透明度和可信度。在有聲出版的產(chǎn)業(yè)鏈中,將區(qū)塊鏈技術(shù)應(yīng)用到智能合成聲音中,能有效地溯源有聲讀物及智能合成聲音的具體流向與源頭,為后續(xù)有聲出版的營(yíng)銷(xiāo)等提供可靠的數(shù)據(jù)支持,并有效地保護(hù)原作者的作品,減少有聲讀物高速流動(dòng)帶來(lái)的內(nèi)容泛濫和版權(quán)糾紛問(wèn)題。
五、結(jié)語(yǔ)
隨著人工智能技術(shù)的發(fā)展,有聲讀物不再是簡(jiǎn)單地將文字內(nèi)容轉(zhuǎn)化為音頻,而是以平臺(tái)為依托進(jìn)行原創(chuàng)音頻內(nèi)容生產(chǎn),對(duì)既有文本進(jìn)行智能合成聲音的二次轉(zhuǎn)化,豐富有聲讀物樣態(tài)。有聲出版平臺(tái)將智能語(yǔ)音合成技術(shù)運(yùn)用到有聲出版中,是在人機(jī)協(xié)同理念下推動(dòng)有聲出版的產(chǎn)業(yè)鏈更迭,朝著高質(zhì)量方向發(fā)展融合的重要手段。但有聲出版中早已存在版權(quán)問(wèn)題,智能合成聲音中更有不可規(guī)避的內(nèi)容泛濫及版權(quán)糾紛等問(wèn)題。在有聲讀物的傳播過(guò)程中,有聲平臺(tái)明確其出版權(quán)責(zé)劃分,做到句句皆有源頭可查,才能推動(dòng)有聲書(shū)產(chǎn)業(yè)的健康有序發(fā)展,也才能推動(dòng)有聲出版朝更加智能化、耦合化的方向發(fā)展。
[參考文獻(xiàn)]
[1]李舒,張寅.移動(dòng)互聯(lián)背景下有聲出版的特點(diǎn)、難點(diǎn)與突破點(diǎn)[J].出版廣角,2021(20):44-47.
[2]屈高翔,梅雨濃.迭代、再造與想象:有聲讀物再媒介化邏輯與未來(lái)場(chǎng)景[J].中國(guó)出版,2022(14):36-40.
[3]沈悅,金圣鈞.智媒時(shí)代有聲出版的作用機(jī)理及優(yōu)化路徑[J].中國(guó)編輯,2022(11):86-91.
[4]李武,謝澤杭,楊飛.AI有聲書(shū):價(jià)值優(yōu)勢(shì)與未來(lái)進(jìn)路[J].科技與出版,2023(06):41-47.
[5]王峻峰.人工智能生成內(nèi)容(AIGC)及其在圖書(shū)出版中的應(yīng)用探討[J].傳播與版權(quán),2023(10):48-51.
[6]趙禮壽,馬麗娜,楊佚琳.我國(guó)有聲讀物出版產(chǎn)業(yè)發(fā)展模式創(chuàng)新研究[J].出版廣角,2022(21):71-75.
[7]希翁.聲音[M].張艾弓,譯.北京:北京大學(xué)出版社,2013.
[8]李芳馨.再現(xiàn)、表現(xiàn)與實(shí)現(xiàn):有聲出版發(fā)展中的技術(shù)賦能[J].科技與出版,2020(07):61-67.
[9]劉宏,滕程.口語(yǔ)傳播視角下有聲出版的知識(shí)傳播探析[J].出版發(fā)行研究,2020(08):33-38.
[10]張頌.朗讀美學(xué)[M].北京:中國(guó)傳媒大學(xué)出版社,2009.
[11]彭穎,龔華靜.有聲出版:讓聲音從“幕后”走向“臺(tái)前”[J].科技與出版,2021(04):52-56.
[12]郝明英.人工智能語(yǔ)音合成有聲書(shū)著作權(quán)保護(hù)研究[J].中國(guó)出版,2023(01):55-59.
[13]何珊.互動(dòng)有聲讀物中的數(shù)字?jǐn)⑹卵芯浚跩].出版科學(xué),2023(02):89-96.
[14]謝亞可.數(shù)字出版融入文化數(shù)字化戰(zhàn)略的現(xiàn)實(shí)意義與實(shí)踐進(jìn)路[J].出版發(fā)行研究,2023(01):8-14.
[15]陳虹,楊啟飛.重塑聽(tīng)覺(jué)空間:智能時(shí)代廣播媒體的深度融合創(chuàng)新[J].編輯之友,2021(08):6-11.
[作者簡(jiǎn)介]董海潤(rùn)(2000—),女,山東臨沂人,重慶師范大學(xué)新聞與傳媒學(xué)院碩士研究生。