印堯 殷子玉
編者按:信息技術和互聯(lián)網(wǎng)基礎設施的完善極大程度上推動了信息社會生產生活方式的變革,智能設備與信息網(wǎng)絡的高度互聯(lián)介入社會日常生活場景的建構,智能化的生活成為今天全新的生活方式和樣態(tài)。智能音箱作為一種基于數(shù)字網(wǎng)絡技術基礎發(fā)展并興起的智能產品,在生活場景中扮演著信息生產、傳輸和播報的多重角色,這篇文章從智能音箱的主體性出發(fā),探究智能音箱的信息產生結構和對家庭生活互動場景的建構邏輯,是對智能音箱如何參與信息生產的重新審視。
從媒介技術發(fā)展史的角度來看,技術在推動傳播方式變革與社會傳播結構的進程中具有基礎性甚至決定性的重要作用。隨著人工智能技術的發(fā)展,其對社會各個行業(yè)的影響也日漸凸顯,媒體與互聯(lián)網(wǎng)的融合發(fā)展,正從過往的門戶媒體時代、現(xiàn)在的社交媒體時代,走向未來的智能場景時代[1]。從信息傳輸技術的演變到信息表達方式的多元進而到信息生產主體的泛化與媒體邊界的模糊化的發(fā)展歷程恰恰是智能媒體發(fā)展的歷程,以語音識別和智能語音交互為技術基礎的智能音箱伴隨著人工智能技術的發(fā)展完善而成為構建智能家庭生活場景中的重要部分。據(jù)有關報告顯示,至少有一個智能音箱的美國成年人在2019年1月至2020年間增長了32%,在2020年初,超過三分之一的美國成年人在家里有一個智能音箱,其中約有50%的人說他們每天都在使用這些設備,這就是說,近9000萬擁有設備的美國成年人中,日活躍用戶達4500萬,月活躍用戶超過7000萬[2]。2014年11月,亞馬遜公司上線的搭載智能助手Alexa的智能音箱——Amazon Echo開啟了智能音箱市場,與傳統(tǒng)普通藍牙音箱的不同之處在于其人工智能大腦Alexa,用戶可與Echo實現(xiàn)語言交互,用戶發(fā)出的語言指令由Alexa處理后實現(xiàn)。利用亞馬遜自身完整的電子商務體系,Echo實現(xiàn)了與自身品牌產品的資源互動和共享,在內容和渠道上實現(xiàn)了平臺共享和轉化。隨后,谷歌、蘋果、搜諾思等品牌紛紛布局智能音箱市場,Bose、JBL等傳統(tǒng)音頻公司也紛紛加入這一市場的競爭。在中國,阿里巴巴、小米、百度、華為等互聯(lián)網(wǎng)企業(yè)也紛紛推出自身品牌的智能音箱產品,并將各品牌的智能家居品牌實現(xiàn)互聯(lián),致力于打造完整的智能家居生態(tài)。以新媒體終端普及為基礎,人工智能和算法技術的快速發(fā)展徹底顛覆了傳統(tǒng)的信息生產和分發(fā)方式,多平臺多渠道的媒介環(huán)境重構了信息傳播環(huán)境。智能傳播時代,算法深度嵌入社會生活,在信息生產分發(fā)及社會治理中扮演關鍵的角色[3]。智能算法與語音交互等技術的發(fā)展變革進一步表明了信息參與中主體的地位與重要作用,人機交互、人機協(xié)同等信息參與和結構進一步建構了各種傳播的場景生成。
場景建構:基于語音交互的智慧入口
“場景”這一概念最初來源于電影領域,其元意義是指在特定時間、空間內發(fā)生的行動,或者因人物關系構成的具體畫面,是通過人物行動來表現(xiàn)劇情的一個個特定過程。最早把“場景”一詞用于傳播領域的是羅伯特·斯考伯和謝爾·伊斯雷爾關于技術與傳播結構的相關研究,他們認為場景傳播的到來依托技術的支撐,即“場景五力”,分別是移動設備、社交媒體、大數(shù)據(jù)、傳感器和定位系統(tǒng)。以這一經典的傳播學理論為基本邏輯對人類使用媒介的行為進行考量,不難發(fā)現(xiàn),媒介在滿足用戶信息需求的過程中主要包含兩個方面:其一是該媒介所能提供的信息本身,包括信息內容的質量、信息來源等,其二是媒介使用的便利性,即獲取和使用媒介工具的便利性。隨著新媒體尤其是智能媒體在日常生活中的廣泛應用,信息生產平臺、傳播渠道、分發(fā)方式前所未有地深入日常生活,極大豐富生活信息生活和滿足受眾多樣化的需求的同時也帶來了信息焦慮問題。早在1989年,沃爾曼就在《Information Anxiety》一書中提出了“信息焦慮”的概念,他認為,信息鴻溝是引發(fā)信息焦慮的直接原因,這道鴻溝介于人們實際的認知和人們認為應該掌握的認知之間。信息焦慮是數(shù)據(jù)和知識之間的黑洞,當信息無法滿足人們的需求時,就產生了信息焦慮的黑洞[4]。隨著社交媒體為代表的新媒體信息平臺的出現(xiàn)和普及,信息焦慮的內涵也日益豐富,相關研究指出,移動社交媒體環(huán)境下用戶的信息焦慮包括信息尋求焦慮(Information Seeking Anxiety)、信息錯失焦慮(Fear of Missing Out)、信息安全焦慮(Information Security Anxiety)、信息過載焦慮(Information Overload Anxiety)、信息儲存焦慮(Information Storage Anxiety)[5]。海量復雜的信息內容一方面極大地豐富了人們的信息生活,另一方面也模糊了公私生活的邊界,對人們日常生活產生影響。
場景傳播強調特定情境下借由技術實現(xiàn)的精細化、適配化、個性化的精準傳播服務,移動媒體的大面積普及和廣泛運用使得傳播結構中的場景生成形式更加多樣、生成的渠道更加多元,充分滿足了傳播主體與受眾在信息消費、信息體驗等層次的多樣化需求,同時借助先進的傳播設備和智能技術裝置實現(xiàn)傳播結構中的多重感官體驗,進一步提升了傳播效果。智能音箱建構了一種基于語音交互的信息場景,用戶可以以最輕松便捷的方式實現(xiàn)對信息的搜索。在用戶與智能音箱語音對話的過程中生產用戶需要的個性化信息,直接精準的信息傳播很大程度上減少了由于信息選擇等問題給受眾帶來的焦慮感。在智能音箱使用的空間位置上,臥室成為用戶使用智能音箱最頻繁的場所之一。日常鬧鐘、智能家居控制、有聲讀物以及新聞簡報等內容則是用戶對智能音箱使用最多的功能。智能音箱進一步建構了私人空間和簡單便捷、用戶主導的信息環(huán)境。移動設備高度普及的當下,以移動設備為基礎建立的網(wǎng)絡交往空間成為現(xiàn)實社會的網(wǎng)絡化延伸,個性化的場景生態(tài)是以人為邏輯、以體驗為核心、以連接為中心、以社群為最大公約數(shù)的商業(yè)環(huán)境[6]。信息內容的豐富性和獲取信息的便利性將受眾與信息搜尋之間相互解脫,音頻內容的呈現(xiàn)釋放了受眾對信息的解讀,加之空間場所的休閑屬性完整地建構了一種輕松的信息環(huán)境。從人的感知層面來說,智能音箱不僅是實體的媒介物,更是無形的聲場。在由智能音箱營造的聲覺空間中,統(tǒng)一的空間感與線性的時間感得以交匯,這有助于用戶形成對新聞內容的臨場感知體驗[7]。
算法推薦:私人定制的個人信息行為
技術更迭帶來信息傳輸渠道、信息接收方式、信息解讀邏輯等多層次、全方位、高維度的升級,尤其以人工智能、算法技術等為代表的新技術的廣泛運用推動了智能服務的升級。正在到來的人工智能時代,在促成人的“賽博格”化的同時,也會使得人-機關系成為未來重要的傳播關系。根據(jù)《2020-2021年中國智能媒體發(fā)展報告》相關數(shù)據(jù)顯示,2020年國家層面出臺“新基建”、媒體深度融合等重要政策,從國家戰(zhàn)略高度為媒體智能化指明方向。各大部委層面,科技部、工業(yè)和信息化部、網(wǎng)信辦、廣電總局、文化和旅游部等出臺人工智能發(fā)展利好政策,為“智媒+行業(yè)”強力“出圈”提供政策支撐。地方層面,多省市出臺相關政策,推進智媒技術研發(fā)、人才培養(yǎng)、環(huán)境建設、應用市場等區(qū)域布局。2020年人工智能通用技術能力持續(xù)提升,物聯(lián)智能視覺、腦機接口、復雜場景下智能語音處理技術等取得亮眼進展。后疫情時期,傳播環(huán)境移動化、泛媒化、視頻化、平臺化態(tài)勢給智媒發(fā)展提出新挑戰(zhàn),AI中臺化、入口場景化與內容安全2.0加速發(fā)展,進一步激發(fā)了智媒應用的深度與廣度。2020年我國智媒投資熱點集中于人工智能技術與傳媒領域的深度融合及交叉賦能領域,AI+音視頻/游戲/VR AR/直播/大數(shù)據(jù)等成為融資大熱門[8]。傳感器成為連接社會、個體和信息的重要技術中介,傳感器是一種收集特定數(shù)據(jù)信息的監(jiān)測裝置,能感受到被監(jiān)測對象的信息,繼而轉換為電信號或其他形式予以輸出,以完成信息的記錄、傳輸、存儲、顯示和控制。信息嵌入于音箱內部的智能芯片是其與傳統(tǒng)藍牙音箱最為顯著的區(qū)別,也正因此,智能音箱以互聯(lián)網(wǎng)為基礎實現(xiàn)了智能與用戶之間的語音交互。麥克風陣列廣泛應用于智能音箱的語音交互設計中,這一技術對采集的不同空間方向的聲音信號進行空時處理,實現(xiàn)噪聲抑制、混響去除、人聲干擾抑制、聲源定位測向、聲源跟蹤、陣列增益等功能,進而提高語音信號處理質量,以提高真實環(huán)境下的語音識別率。如果把語音識別看成一個接收信息、解析信息、做出反饋的過程的話,麥克風陣列解決的是聽不聽得到、多遠距離屬于合理范圍、不受噪音影響的問題。通過電掃陣列等空間定位技術可以獲取聲源的有效位置,通過獲取精準的聲源位置信息,讓用戶的語音更加智能,通過算法獲取高品質的語音信號質量。麥克風陣列可以自動檢測聲源位置,跟蹤說話人,同時可以獲取多聲源和跟蹤移動聲源的優(yōu)勢,智能設備會對用戶的位置方向進行語音增強。陣列麥克風增加了空域處理,對多信號空時頻三維的處理彌補單信號在噪聲抑制、回聲抑制、混響抑制、聲源定位、語音分離方面的不足,讓智能設備在復雜的環(huán)境中都可以獲取高質量的語音信號,提供更好的智能語音體驗[9]。
語音交互技術實現(xiàn)了自然語音到智能控制指令的技術轉化,是智能音箱使用便利的技術條件,而其內部的信息提供機制則進一步強化了用戶黏性。用戶通過客戶端連接網(wǎng)絡后開始使用,智能音箱開始提供基于網(wǎng)絡技術基礎的LBS(location based service)服務,用戶首次智能設備時還可以在App頁面首頁進行偏好設置,在使用智能音箱的過程中通過分析用戶對音樂、有聲讀物、新聞等不同內容的收聽習慣以及用戶收藏、訂閱等進行智能算法分析,進而提供更加精準的智能推薦。據(jù)相關報告顯示,智能音箱對用戶的語言識別能力是影響用戶使用質量的最大因素,其次是音質和數(shù)據(jù)的精準和私有[2],隨著技術的日臻成熟,算法識別與推薦的精準性正日益提升,用戶以語音交互的新體驗獲取信息,在居家環(huán)境中解放了用戶與媒介終端之間的使用關系。另一方面也有效地緩解了數(shù)字化時代數(shù)字文本與影像交織帶來的信息過載問題,此外,智能音箱設備在信息內容和呈現(xiàn)方式上也與其他類型的媒介產品有所區(qū)別,除了提供各類信息內容之外,智能音箱還可以實現(xiàn)用戶與設備之間的對話、交流、知識對話乃至互懟等情感表達,在此過程中,智能音箱突破了單一的媒介實體和內容供給平臺的單一屬性,情感化的交互關系進一步建構了一種輕松和更具代入感的信息消費場景。
信息互聯(lián):人機互動下的具身參與
技術與身體的融合促使我們開始重新思考“身體”在傳播中的作用,將身體置于何處成為今天智能傳播研究一個無法回避的問題。如果以身體-技術關系(body-technology relations)為參照點,在知覺現(xiàn)象學與具身認知心理學的視域下,智能傳播便清晰地形成具身(embodiment)維度,技術具身成為智能傳播的重要問題[10]。從大眾傳播時代麥克盧漢的媒介延伸觀到智能媒體傳播時代的具身傳播觀念,把身體作為傳播結構中的一種隱喻,人與媒介之間的關聯(lián)和角色的變化與傳播技術和信息生產智能化進程息息相關。在論及傳播結構中的身體觀念時,彼得斯明確指出,無論身體在傳播結構中和傳播過程中的地位如何變化,我們關于技術將如何影響人類的焦慮會一直存在[11]。隨著智能化、數(shù)字化進程的不斷加深,人機交互成為智能媒體的信息生產、傳播和作用等環(huán)節(jié)的新方式。智能技術一方面通過大數(shù)據(jù)、精準算法等便利了用戶在信息獲取和信息解讀等過程中的作用,另一方面也將人的主體性納入信息的生產邏輯和消費場景之中。一方面,身體介入世界的方式限制了我們對于媒介技術之于身體關系的想象,避開身體以實現(xiàn)徹底離身成為一個永恒的夢想,身體的在場與實踐宣告徹底離身的心智似乎不可能通過技術來實現(xiàn),因為每當技術想要完全突破身體的藩籬時,由身體意識所催生的焦慮感就會產生;另一方面,也正是因為身體介入世界的方式決定了我們可以經由媒介技術獲得近乎離身的感受[12],虛擬現(xiàn)實技術的應用在很大程度上實現(xiàn)了離身參與和具身體驗的雙重協(xié)調。
在以智能音箱為中介的智能設備群中,無線網(wǎng)絡成為連接各設備環(huán)節(jié)的紐帶,單一的信息生產或內容聯(lián)動的環(huán)節(jié),智能音箱成為信息的智能命令和信息的入口。智能音箱的手機App實現(xiàn)了硬件設備與手機軟件之間的關聯(lián),由手機軟件進行聯(lián)網(wǎng)和功能訂閱,同時基于共享無線網(wǎng)絡與其他智能設備實現(xiàn)互聯(lián)和信息共享。用戶在智能家居的體驗中通過智能音箱的交互式語音入口將命令傳輸至各智能設備的云端處理。在這種交互式的使用場景中,語音交互技術一方面解放了作為內容傳播主體的用戶的雙手,但同時又以對話的形式將用戶與設備之間建立中一種更加自然、平等的信息交互關系。隨著5G和人工智能技術、物聯(lián)網(wǎng)技術的日趨成熟和普及,越來越多的應用場景將在智能終端和傳感器中產生。根據(jù)金山云聯(lián)合艾瑞咨詢發(fā)布的《中國智能物聯(lián)網(wǎng)(AloT)白皮書》顯示:預計到2025年,我國物聯(lián)網(wǎng)連接數(shù)將接近200億個,萬物喚醒、海量連接將推動各行各業(yè)走上智能道路[13]。在此趨勢下,以智能音箱為代表的智能語音交互平臺將越來越成為物聯(lián)網(wǎng)控制的重要端口。
結語
技術的演進始終是推動社會傳播方式變革的基礎性動因之一,物質的媒介化和媒介的物質化成為新技術引領下傳播結構變革的一體兩面。智能媒體時代,人與技術的主體性互動不斷強化,智能傳播時代的人機具身互動實則為身體、媒介及環(huán)境的互動融合,其中媒介的具身性展演若隱若現(xiàn),而身體圖式發(fā)生技術內卷化,因此傳播主體從觀察者轉變?yōu)閰⑴c者或體驗者。不斷更新升級的新技術毫無疑問將在傳播方式、傳播載體、用戶體驗等方方面面產生重要的變革和影響,社會信息傳播的效率和質量也將在此基礎上得以提升。智能音箱的語音交互技術在很大程度上成為技術解放傳播者和受眾身體限制的重要體現(xiàn),但在另一方面,技術將人的身體和感官體驗納入信息傳播的技術結構之中,MR、3D裸眼視覺藝術呈現(xiàn)等技術的廣泛應用也帶來人工智能倫理等技術與情感之爭。
參考文獻:
[1]胡正榮.智能化:未來媒體的發(fā)展方向[J].現(xiàn)代傳播(中國傳媒大學學報),2017,39(06):1-4.
[2]Voicebot.ai.Smart Speaker Consumer Adoption Report April 2020[EB/OL].https://research.voicebot.ai/report-list/smart-speaker-consumer-adoption-report-2020/,2020-4.
[3]師文,陳昌鳳.信息個人化與作為傳播者的智能實體——2020年智能傳播研究綜述[J].新聞記者,2021(01):90-96.
[4]Wurman R S.Information anxiety[M].New York:Doubleday,1989.
[5]李柯.移動社交媒體環(huán)境下用戶信息焦慮研究[D].鄭州大學,2020.
[6]吳聲.場景革命[M].北京:機械工業(yè)出版社,2015.
[7]盧維林,宮承波.智能音箱中的新聞生產與呈現(xiàn)邏輯[J].青年記者,2020(13):50-51.
[8]中國傳媒大學新媒體研究院,新浪AI媒體研究院.2020-2021中國智能媒體發(fā)展報告[EB/OL].http://www.cuc.edu.cn/2021/0324/c1382a179108/page.htm,2021-03-25.
[9]數(shù)智網(wǎng),智能音箱大火的背后推手——麥克風陣列技術解析[EB/OL].https://www.sohu.com/a/168568168_302002,2017-8-31.
[10]別君華.人機共生:智能傳播的技術具身[J].青年記者,2021(05):9-11.
[11]約翰·杜翰姆·彼得斯.對空言說:傳播的觀念史[M].鄧建國,譯.上海:上海譯文出版社,2016.
[12]劉海龍,束開榮.具身性與傳播研究的身體觀念——知覺現(xiàn)象學與認知科學的視角[J].蘭州大學學報(社會科學版),2019,47(02):80-89.
[13]艾瑞網(wǎng).2020年中國智能物聯(lián)網(wǎng)(AIoT)白皮書[EB/OL].http://report.iresearch.cn/report/202002/3529.shtml,2020-2-27.
本文受到廣州軟件學院2020年度科學研究項目(ky202040)支持。