方世彤
英國志奮領(lǐng)學(xué)者,Stirling大學(xué)傳媒管理碩士,長期致力于電視傳媒的發(fā)展研究和咨詢顧問工作。
隨著工作場所中實時流式傳輸和點播視頻的使用不斷增長,添加AI有望成倍增加視頻的使用以促進廣電工作方式以及員工溝通與協(xié)作方面所帶來的價值
人工智能(AI)允許計算機模仿人類能力,自動化的過程是指創(chuàng)建能夠執(zhí)行基于流程的任務(wù)而無須人工干預(yù)。在當下,AI的最常見形式是機器學(xué)習(xí),將大量數(shù)據(jù)“饋送”到算法中以進行訓(xùn)練,一旦訓(xùn)練完成,該算法便能在無輔助的后續(xù)數(shù)據(jù)饋送中對項目進行分類??苹秒娪啊稒C器人瓦力》中,主角機器人瓦力的知識就是通過看錄像帶獲得的,他把一盤盤的錄像帶吞吐腹中,人類上百年歷史的影像給了瓦力足夠的知識去追另一個機器人女孩。
然而,機器學(xué)習(xí)的一個主要缺點是要依賴擁有大量準確數(shù)據(jù)的樣本。因此,輸入數(shù)據(jù)來源的質(zhì)量高低,限制著機器學(xué)習(xí)應(yīng)用的成效。當我們提供足夠好的數(shù)據(jù)樣本時,機器也會學(xué)習(xí)得聰明些,不然人工智能就會變成人工愚蠢。
AI應(yīng)用于視頻最相關(guān)的人工智能學(xué)科是“計算機視覺”Computer Vision。“計算機視覺”是使用人工智能解釋圖像或視頻的視覺元素。計算機視覺可以使用機器學(xué)習(xí)或深度學(xué)習(xí)技術(shù)來實現(xiàn)此目標,是諸如面部識別和自動車輛無人駕駛等新興技術(shù)應(yīng)用的基礎(chǔ)。事實證明,教計算機像人類一樣處理視覺數(shù)據(jù)比將算法簡單地連接到相機要困難得多。挑戰(zhàn)主要來自于對人類視覺如何復(fù)制現(xiàn)實的基本理解,就好比我們看到樹葉發(fā)黃,會想到秋天來了天氣變冷了,甚至?xí)行┰娙说那榫w出來??墒菣C器人識別樹葉發(fā)黃就是發(fā)黃了,它是不會有太多情感上的聯(lián)想的,也不會把樹葉發(fā)黃的事情理解為秋天的到來,更不會生發(fā)出豐收抑或愁緒的情感。
正因為計算機視覺目前缺少情緒管理,我們還是比較難在人文創(chuàng)作或者視頻創(chuàng)作上應(yīng)用這項技術(shù)。科學(xué)家們一直試圖實現(xiàn)AI人文理解上的突破。十年前我在英國學(xué)習(xí)時的室友就是將計算機視覺應(yīng)用到宗教研究的博士后,他的課題是讓計算機閱讀學(xué)習(xí)歐洲各大教堂的宗教名畫,讓計算機能夠刻畫出上帝的真正形象(聽上去很不靠譜的感覺,但這真是人工智能的博士后研究項目)。而央視這次國慶閱兵也推出了AI剪輯,相關(guān)人士介紹該剪輯就是讓機器學(xué)習(xí)前幾次閱兵的鏡頭剪輯規(guī)律,讓機器自動剪片,大大節(jié)省了人力。
我們需要了解視頻AI的基石有哪些,能在多大程度上影響廣電業(yè)的發(fā)展和視頻技術(shù)的成長。很多時候我們把視頻當成活動的照片,畢竟我們定義視頻也是每秒多少張圖片的連續(xù)動畫。但除去影像,語音其實是視頻的重要組成部分,人工智能可以通過多種方式幫助解釋、演繹語音: 人工智能早期的例子之一是機器轉(zhuǎn)錄,其中的算法能夠?qū)⒄Z音數(shù)據(jù)解釋轉(zhuǎn)換為文本記錄。這項技術(shù)現(xiàn)在很普遍,甚至已經(jīng)在我們的智能手機中大量使用,更由于深度學(xué)習(xí)新技術(shù)的出現(xiàn),正在實現(xiàn)復(fù)興。我一好友在一家得到文化基金投資的創(chuàng)業(yè)公司工作,他們的產(chǎn)品就是利用人工智能轉(zhuǎn)錄技術(shù)將記者外采的視頻語音轉(zhuǎn)化成文字稿,提供給后期編輯撰稿使用。
口語單詞被消化成文本數(shù)據(jù)后,便會解鎖其他功能,例如翻譯成其他語言。谷歌是人工智能領(lǐng)域的先驅(qū)之一,其于2006年首次使用聯(lián)合國和歐洲議會的筆錄作為基礎(chǔ)語言數(shù)據(jù),啟動了機器翻譯服務(wù),當下谷歌支持100多種語言,每天服務(wù)5億人。我周邊很多視頻制作者們都在使用一個人工智能平臺,它能輕松地對視頻里的語言進行識別翻譯,所以很多朋友用它并非是翻譯視頻,而是制作母語視頻字幕。
現(xiàn)在的虛擬主持人已經(jīng)在應(yīng)用一些人工智能技術(shù),可以想象未來這些主持人說的也不一定是我們的母語,很可能是說外語的主持人。
人工智能的應(yīng)用正變得越來越普遍,人工智能無疑可為廣電制作帶來價值。隨著工作場所中實時流式傳輸和點播視頻的使用不斷增長,添加AI有望成倍增加視頻的使用以促進廣電工作方式以及員工溝通與協(xié)作方面所帶來的價值。