文/周 易
所謂人工智能是指研究、開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué),誕生于1956年夏天,由約翰·麥卡錫(John McCarthy)為其命名。2017年,在《政府工作報告》中人工智能已經(jīng)上升至國家戰(zhàn)略高度。
近幾年,人工智能與大數(shù)據(jù)技術(shù)進入新聞生產(chǎn)領(lǐng)域,在國內(nèi),騰訊財經(jīng)最早在2015年9月用機器人Dream writer發(fā)布了一篇關(guān)于當(dāng)年8月份CPI的稿件,題名為《8月CPI同比上漲2.0% 創(chuàng)12月新高》。2015年11月18日,新華社的“快筆小新”也開始被用于新聞寫作過程中,“快筆小新”操作簡單快捷,輸入一個股票代碼,再點一點鼠標(biāo),就能產(chǎn)生一篇財報分析。今日頭條則借著2016年里約奧運的契機,推出了自己的“xiaoming bot”,可以在數(shù)據(jù)庫更新的兩秒之內(nèi)生成新聞稿并發(fā)布,而且能夠根據(jù)賽前預(yù)測和實際賽果的差異調(diào)整新聞生成的語氣。2017年12月26日,新華社的媒體人工智能平臺“媒體大腦”正式發(fā)布,為媒體提供包括線索、策劃、采訪、生產(chǎn)、分發(fā)、反饋等在內(nèi)的全新聞鏈路的服務(wù),成為傳統(tǒng)媒體運用新技術(shù)的標(biāo)桿。
從人工智能的技術(shù)發(fā)展階段來看,可將人工智能分為計算智能、感知智能和認(rèn)知智能三個階段。計算智能是指機器能運用神經(jīng)網(wǎng)絡(luò)和遺傳算法等機理像人類一樣計算、存儲和傳遞信息;感知智能則指機器能夠通過視覺和聽覺兩大信息攝入系統(tǒng)獲取信息并作出判斷、采取必要行動;認(rèn)知智能在計算智能和感知智能的基礎(chǔ)上取得更為長足的進步,機器能夠像人一樣獨立思考,主動采取行動。人工智能與新聞生產(chǎn)鏈條的結(jié)合也因此呈現(xiàn)階梯分布:計算智能,在新聞生產(chǎn)中依舊是“人工為主,機器為輔”,人工智能主要用于輔助記者儲存和快速處理海量數(shù)據(jù);感知智能,新聞生產(chǎn)過程中“看”和“聽”的工作由機器替代記者完成;而進入認(rèn)知智能階段,自動化的新聞編輯部將從夢想變?yōu)楝F(xiàn)實,機器代替或全面輔助人類。
國內(nèi)人工智能在新聞行業(yè)的應(yīng)用大部分還停留在“計算智能”的階段,并呈現(xiàn)向“感知智能”發(fā)展的趨勢,自動化新聞主要體現(xiàn)在新聞線索搜尋、策劃和撰寫階段。但是無論是在國外的實踐還是國內(nèi)業(yè)界的規(guī)劃中,以互聯(lián)網(wǎng)為代表的新傳播革命正在重構(gòu)我們的社會關(guān)系和社會形態(tài),為新聞傳播媒介的發(fā)展與創(chuàng)新提出了一系列全新的要求,開啟從信息搜集到信息生產(chǎn)到信息分發(fā)和反饋收集的全新的新聞鏈路運作范式成為當(dāng)下傳媒發(fā)展的當(dāng)務(wù)之急。
新聞信源規(guī)?;杉o論是何種形式的自動化機器人新聞生產(chǎn),第一步都是讀入大量結(jié)構(gòu)化和標(biāo)準(zhǔn)化數(shù)據(jù)。智媒化數(shù)據(jù)采集的三大特征表現(xiàn)在數(shù)據(jù)來源的多樣化,數(shù)據(jù)獲取的規(guī)模化和數(shù)據(jù)處理的高效性上。包含傳統(tǒng)的攝像頭、無人機、行車記錄儀等智能采集設(shè)備,這些傳感器的使用不僅能擴寬數(shù)據(jù)來源,而且采集的信息也更加多維。作為一種監(jiān)測裝置,傳感器是一種收集數(shù)據(jù)信息的方式。它通過感受到被監(jiān)測對象的信息,將其按一定規(guī)律變換成為電信號或其他形式進行輸出,來實現(xiàn)對信息的記錄、傳輸、存儲、顯示和控制等??纱┐髟O(shè)備、智能手機、攝像頭、行車記錄儀、無人機、電子芯片、遙感衛(wèi)星等傳感器是人的感官延伸,充當(dāng)了記者的“眼睛”和“耳朵”,任何帶有智能傳感器或處理器的物體,都可能成為信息的采集者、中介者甚至發(fā)布者,實時監(jiān)測新聞事件,每天都能實時智能生成規(guī)模級的新聞線索和新聞素材。相比人工采集,通過傳感器進行聲音、圖像資源的采集能夠顯著提高新聞生產(chǎn)的效率,例如,專業(yè)級錄音應(yīng)用實現(xiàn)了將錄音內(nèi)容自動轉(zhuǎn)寫為文字的功能,并無縫銜接移動端和PC端。
新聞內(nèi)容自動化生產(chǎn)。MGC(Machine Generated Content)新聞,即運用人工智能技術(shù)生產(chǎn)新聞,從關(guān)鍵技術(shù)領(lǐng)域而言,其是整合了數(shù)據(jù)庫知識發(fā)現(xiàn)(KDD)以及自然語言處理(NLP)兩個領(lǐng)域,由機器智能生產(chǎn)的新聞。通過傳感器獲得海量數(shù)據(jù)信息,與儲備數(shù)據(jù)進行關(guān)聯(lián)分析,尋找新聞角度,還可以定制語言風(fēng)格,智能生產(chǎn)新聞稿,視頻編輯、語音合成、數(shù)據(jù)可視化等技術(shù),實現(xiàn)了真正的媒介融合。富媒體應(yīng)用在對話式新聞上,新聞會話機器人基于對大數(shù)據(jù)的學(xué)習(xí),不僅能將文字轉(zhuǎn)化成音頻通過智能家電觸及用戶,甚至和用戶就新聞進行互動,進一步延伸新聞內(nèi)容的傳播路徑。最后是對新聞內(nèi)容的“潤色”階段。一方面,確保新聞的真實性,通過基于精準(zhǔn)的人臉識別系統(tǒng)可以從源頭上減少虛假新聞的發(fā)布。另一方面,增強稿件的“溫度”和“深度”,讓新聞變得更具可讀性和吸引力。
新聞內(nèi)容個性化分發(fā)與反饋。新聞生產(chǎn)的一個重要目的就是觸達用戶,因此內(nèi)容的分發(fā)起著舉足輕重的作用。進行內(nèi)容分發(fā)的基礎(chǔ)是詳盡的用戶畫像,針對不同讀者的閱讀心理偏好和行動習(xí)慣等精準(zhǔn)的信息,依托新聞分發(fā)渠道,通過大數(shù)據(jù)在智能硬件等設(shè)備上,為讀者個性化定制新聞資訊。
宏觀上,網(wǎng)絡(luò)上的海量新聞種類繁多,通過人工算法實現(xiàn)個性化推送,根據(jù)用戶的閱讀習(xí)慣、閱讀時長等各種數(shù)據(jù)分析受眾喜好,機器做標(biāo)簽提取、聚合等分析,將讀者分為不同類型,分類推送內(nèi)容。微觀上,人工智能的個性化推送甚至可以精確到語言風(fēng)格的偏好,利用人工智能技術(shù)完成對各種語料庫語言風(fēng)格的智能學(xué)習(xí),為不同群體傳送不同風(fēng)格的新聞報道。通過語言風(fēng)格的差異化處理,同一條新聞可以同時匹配不同用戶群體的語言風(fēng)格和閱讀習(xí)慣,不僅大大提高了新聞生產(chǎn)的實用性和可讀性,還完成了個性化新聞的量產(chǎn)。比如,運用智能新聞為某一政策的支持者和反對者提供不同的新聞內(nèi)容。一方面人工智能介入下的機器分發(fā)可以充分考慮“長尾需求”。傳統(tǒng)新聞內(nèi)容往往集中于關(guān)乎大多數(shù)人權(quán)益的重要熱門事件,而人工智能分發(fā)覆蓋面更廣,涉及個人生活、個人興趣相關(guān)的長尾新聞報道。另一方面可以協(xié)助編輯跳離局限的視野,算法排序的核心是根據(jù)用戶、內(nèi)容、上下文信息決定實時計算每個內(nèi)容的得分,按照得分進行排序。由于考慮到了用戶的信息,排序結(jié)果是個性化的。另外,模型的更新也是實時的,能夠充分的利用已有數(shù)據(jù),指導(dǎo)下次分發(fā),最大化地優(yōu)化分發(fā)效率。
超精細化的個性化分發(fā)雖然能夠更好地滿足讀者的需求,但是也存在“信息繭房”的危險,在這種情況下,讀者的反饋就變得尤為重要,無論人工智能怎么發(fā)展,人都應(yīng)該是核心,是規(guī)則的制定者,人工智能技術(shù)支持新聞報道根據(jù)讀者的反饋隨時對個人的定制內(nèi)容做出調(diào)整。
人工智能+新聞的優(yōu)勢分析。人工智能應(yīng)用在新聞行業(yè)可以將人、物、視頻、文本等所有的信息都串聯(lián)在一起,打造一個“智媒平臺”。首先,自動化新聞的優(yōu)勢體現(xiàn)在新聞生產(chǎn)的數(shù)量、質(zhì)量和速度上。自動化新聞拓寬了新聞報道的范圍,提高了稿件的質(zhì)量。只要保證數(shù)據(jù)正確,算法科學(xué)且正常運行,自動化新聞的生產(chǎn)能降低人工疏忽帶來的信息錯誤率,小至拼寫錯誤、語法錯誤、計算錯誤、大至要素缺失和邏輯,能大大降低因為人工疏忽造成的錯誤。
不僅如此,由大眾化的信息生產(chǎn)轉(zhuǎn)向有效地生產(chǎn)和推送個性化信息產(chǎn)品。一方面,在未來的新聞生產(chǎn)流程中,機器人自動化寫作與預(yù)注冊文本和數(shù)據(jù)庫有著密切關(guān)系。伴隨著機器學(xué)習(xí),自然語言處理和生成技術(shù)日趨成熟,文本資料和數(shù)據(jù)庫日益豐富,人工智能可以幫助我們挖掘選題拓展報道的廣度、深度,提煉規(guī)律,預(yù)判內(nèi)容的傳播效果,反過來指導(dǎo)我們寫作的起點。另一方面,讀者的長尾需求得到重視,傳統(tǒng)新聞編輯部的內(nèi)容生產(chǎn)力與新聞記者的數(shù)量息息相關(guān)。而借助人工智能,媒體可以通過數(shù)據(jù)的存儲和挖掘使得有限的記者和編輯也可以制作出大量內(nèi)容,以前因為人力不足或“關(guān)注度不夠”而被迫拋棄的新聞資訊,現(xiàn)在可能正被機器人生產(chǎn),讀者的選擇因此變得更多,對有關(guān)社區(qū)體育、地方工會活動、民生等區(qū)域性新聞給予更多關(guān)注,新聞最終可以回歸社區(qū),回歸到個人。
此外,人工智能預(yù)設(shè)框架下為UGC的有序化內(nèi)容生產(chǎn)提供了可能。當(dāng)下基于發(fā)達的社交媒體,各式自媒體蓬勃發(fā)展,生產(chǎn)的信息早已成為新聞媒體不可或缺的信源,但是信息的良莠不齊也成為擾亂輿論場的一大問題。人工智能的基礎(chǔ)是數(shù)據(jù)庫的建立,當(dāng)前媒體數(shù)據(jù)主要來源于記者或數(shù)據(jù)分析師、第三方數(shù)據(jù)公司和用戶。人工智能的發(fā)展為UGC內(nèi)容提供了新的發(fā)展機遇,相較以往松散混亂的內(nèi)容,人工智能提供的模型和框架為有序的內(nèi)容生產(chǎn)提供了可能。
最后,人工智能時代下的全新聞鏈路運作范式新聞生產(chǎn)的核心生產(chǎn)力被顛覆,機器人在撰寫常規(guī)報道等具有強規(guī)律性和框架性的報道時,在速度和準(zhǔn)確度上具有人類記者無法匹敵的優(yōu)越性,甚至可以脫離人類主觀的干擾做到真實客觀,記者的優(yōu)勢表現(xiàn)在對于深度文章撰寫和創(chuàng)造性思考上。大部分的新聞都可以通過自動化生產(chǎn)生成,實則將新聞工作者從簡單重復(fù)的工作中解脫,也對新聞工作中提出了更高的要求,轉(zhuǎn)變工作重心,由即時消息生產(chǎn)轉(zhuǎn)向創(chuàng)意化的數(shù)字新聞生產(chǎn);由傳統(tǒng)以文本為主導(dǎo)的內(nèi)容生產(chǎn)轉(zhuǎn)向以影像為主的視覺內(nèi)容生產(chǎn);最終發(fā)揮人類的思考力,強化以人物、歷史為主的深度報道內(nèi)容。
人工智能+新聞的局限性分析。
人工智能技術(shù)的發(fā)展首要解決的是新聞生產(chǎn)的效率問題,新聞生產(chǎn)速度加快,總量成量級增長,新聞可以借助人工智能實現(xiàn)自動創(chuàng)建,那么假新聞同樣也可以被自動創(chuàng)建。2015年8月底,F(xiàn)ace book解雇數(shù)十名新聞編輯,熱門話題的編輯、推薦和排名都由機器算法控制以保持“客觀公正”。然而,幾天后一篇關(guān)于新聞主播Megyn Kelly因為力挺希拉里被??怂固叱龉镜募傩侣劚豁?shù)紽ace book熱門話題榜的首位。一般來說,人們認(rèn)為人工寫作在內(nèi)容的清晰易讀上具有優(yōu)勢,但在可信度、信息量和客觀性方面比不上撰稿軟件(Cler wall,2014)。但是實際上,算法也是由人類創(chuàng)作的成果,算法的輸出結(jié)果中包含了設(shè)計者的意圖和傳播介質(zhì)等不同方面的因素,并且算法運行過程中也存在失誤,有必要建立算法問責(zé)制,避免算法“黑箱”,提高算法和機器意圖的透明度。
同時,提升人工智能數(shù)據(jù)分析的精確性及其對于情景的反映能力。人工智能雖提供了美好的媒介生活愿景,但也存在不少困境。以傳感器為技術(shù)基礎(chǔ)的新聞呈現(xiàn)無終態(tài)的特征,現(xiàn)有條件下,新聞?wù)鎸嵲絹碓奖憩F(xiàn)為一種過程真實,人類去辨別真?zhèn)?,透過現(xiàn)象看到本質(zhì)都頗為吃力,機器無法看到表面事實背后錯綜復(fù)雜的利益鏈條,無法形成基于多重事實的價值判斷。盡管人工智能研究者嘗試在計算機系統(tǒng)當(dāng)中模擬人類解決問題、進行決策的能力,但是很多情景中的決策制定與推理過程中只有局部性的、可信度有待考慮的信息,甚至信息源的信息還相互沖突。如何表達這種不確定性信息、將各種不確定的局部信息相互組合,最終使用這些信息實現(xiàn)有效推理是提供專業(yè)可靠的新聞報道的前提。
人工智能影響的新聞業(yè)帶來了版權(quán)和隱私兩個方面的問題。許多自動化新聞程序都需要通過某種電子表格式的設(shè)置來組織、整理數(shù)據(jù)集,從而將未加工的信息轉(zhuǎn)化為系統(tǒng)化、有條理的新聞故事。而法律對于這種算法程序是否能夠納入版權(quán)保護,仍然存在相互沖突的觀點。并且,信息的獲取依存于無處不在的傳感器,深入人們生活的傳感器必不可少會侵犯個人隱私,如何重新界定隱私并限制侵權(quán)行為,人工智能在大眾媒介與隱私法領(lǐng)域亟需論證。
最后,技術(shù)公司與金融資本夾擊專業(yè)新聞生產(chǎn)?!岸问圪u”模式風(fēng)行后,資本對新聞專業(yè)性的影響一直備受到關(guān)注,在當(dāng)下新的盈利模式還沒形成和人工智能發(fā)展對資本高度依賴的情況下,金融資本必然會影響新聞生產(chǎn)。與此同時,當(dāng)人工智能成為生產(chǎn)力時,數(shù)據(jù)就成了重要的生產(chǎn)要素,掌握數(shù)據(jù)的主體,就掌握了核心生產(chǎn)要素,掌握大量數(shù)據(jù)的科技公司則會擁有足以形成壁壘的天然優(yōu)勢。新聞媒體如何作為中立、第三方的力量,繼續(xù)充當(dāng)強大的“第四權(quán)力”,成為社會有力的守望者是人工智能時代下必須要面對的問題。
在物聯(lián)網(wǎng)和互聯(lián)網(wǎng)交織的環(huán)境下,人工智能對新聞業(yè)的數(shù)據(jù)分析、內(nèi)容生成和個性化分發(fā)會發(fā)揮更大的作用,進而對整個新聞業(yè)態(tài)產(chǎn)生更具深度的變革和挑戰(zhàn)。整個新聞生產(chǎn)鏈條效率大大提高,讀者的個性化需求也前所未有得到重視,“人機協(xié)同”也將最大程度激發(fā)新聞工作者的創(chuàng)造力和活力。但是也給新聞業(yè)態(tài)帶來了重重挑戰(zhàn),宏觀層面我們需要重新評價新聞內(nèi)容對用戶的價值,在個性化和公共性中尋找一個平衡點,在高效率和高專業(yè)度上做到均衡,微觀上如何提升人工智能在大跨度的復(fù)雜變量的處理和判斷方面、在微妙情感關(guān)系的處理和表達方面,尤其是在價值規(guī)則的制定和參照框架的選擇方面的能力,實現(xiàn)不同資源的調(diào)度和“混搭”也是目前新聞要面對的問題。面對技術(shù)浪潮下的種種焦慮,歸根結(jié)底,人的發(fā)展才是技術(shù)發(fā)展的本質(zhì),人工智能研究的原點是人腦,是人類對于自己大腦的理解的反映,人類才是最終規(guī)則的制定者,而智能媒體平臺的存在也需要新聞信息為用戶而生,越來越懂用戶所想與所需。