王素芳,吳 晨,陳志成
(1.焦作師范高等專(zhuān)科學(xué)校 信息工程學(xué)院, 河南 焦作 454000;2.北京工商大學(xué) 計(jì)算機(jī)與信息工程學(xué)院, 北京 100048:3.北京格分維科技有限公司, 北京 100070)
隨著計(jì)算機(jī)技術(shù)的發(fā)展,人工智能應(yīng)用正在不知不覺(jué)融入到我們的日常生活中,通過(guò)手機(jī)語(yǔ)音助手一句“HI,Siri”或者“小愛(ài)同學(xué)”,手機(jī)就能聽(tīng)懂你的指令,幫助你來(lái)完成原本要靠點(diǎn)擊才能完成的任務(wù)。又如,智能音響設(shè)備、智能車(chē)載設(shè)備、智能家具設(shè)備、商場(chǎng)導(dǎo)購(gòu)機(jī)器人、會(huì)上下樓的送菜機(jī)器人、送快遞智能車(chē)、無(wú)人駕駛車(chē)輛。人工智能技術(shù)利用大數(shù)據(jù)、計(jì)算機(jī)科學(xué)技術(shù)幫助用戶(hù)完成繁瑣或者是人類(lèi)無(wú)法完成的任務(wù)。
電視節(jié)目主持人是一個(gè)需要大量記錄對(duì)話(huà)內(nèi)容的職業(yè),其主要職責(zé)是組織串聯(lián)節(jié)目中的每個(gè)環(huán)節(jié),稱(chēng)為串場(chǎng)。同時(shí)還要面對(duì)節(jié)目演播現(xiàn)場(chǎng)臨時(shí)出現(xiàn)的各種問(wèn)題,節(jié)目嘉賓提出的問(wèn)題,壓力巨大。智能機(jī)器人則不會(huì)出現(xiàn)這樣的壓力,并且可以利用計(jì)算機(jī)強(qiáng)大的記憶能力和強(qiáng)大的互聯(lián)網(wǎng)絡(luò)資源,能夠快速檢索出各類(lèi)知識(shí)內(nèi)容解答現(xiàn)場(chǎng)提問(wèn)。因此智能機(jī)器人非常適合作為輔助主持人加以利用。
目前已有一些電視節(jié)目中采用機(jī)器人做些輔助主持和分析。公認(rèn)的世界上首位節(jié)目虛擬主持人是2001年的Ananova[1],誕生在英國(guó)。之后,美國(guó)、日本、韓國(guó)也紛紛推出了虛擬主持機(jī)器人。2017年,微軟“小冰”以無(wú)形象的方式登陸天津衛(wèi)視《非你莫屬》節(jié)目,是此前國(guó)內(nèi)有代表性的一次嘗試[2]。2018年以來(lái),人工智能技術(shù)越來(lái)越多地被應(yīng)用到電視節(jié)目中[3],出現(xiàn)了“人工智能主播”[4],虛擬智能機(jī)器人可以參與交流互動(dòng)和提供問(wèn)答咨詢(xún)[5]。這些新技術(shù)的應(yīng)用給電視節(jié)目主持帶來(lái)了新的人機(jī)交互視角[6],增加了節(jié)目亮點(diǎn),促進(jìn)了新技術(shù)和新媒體的融合發(fā)展。
本文介紹的是基于中央電視臺(tái)創(chuàng)業(yè)投資欄目的需求而設(shè)計(jì)開(kāi)發(fā)的一款人工智能虛擬輔助主持機(jī)器人——小創(chuàng)哥。小創(chuàng)哥是以卡通形象登上電視熒屏,在智能對(duì)話(huà)的同時(shí)能夠做出相應(yīng)機(jī)器人動(dòng)作。其在節(jié)目中的用途主要包括兩方面:一是與真主持人搭檔,輔助現(xiàn)場(chǎng)主持,增加智能交互;二是通過(guò)數(shù)據(jù)分析,合理推薦投資項(xiàng)目和投資人。
知識(shí)問(wèn)答系統(tǒng)是自然語(yǔ)言處理領(lǐng)域重要的研究方向之一,其目的是讓機(jī)器能夠像人一樣交流思考并解答問(wèn)題。1950年英國(guó)著名數(shù)學(xué)家圖靈在《Mind》上發(fā)表論文《計(jì)算機(jī)器與智能》,提出機(jī)器智能概念和機(jī)器智能測(cè)試實(shí)驗(yàn)方法“圖靈測(cè)試”[7]。此后,西方國(guó)家出現(xiàn)了一批面向?qū)I(yè)領(lǐng)域的問(wèn)答系統(tǒng),例如,面向精神疾病的ELIZA[8],面向美國(guó)籃球聯(lián)賽的Baseball問(wèn)答系統(tǒng)[9]。20世紀(jì)90年代由麻省理工學(xué)院開(kāi)發(fā)出的START問(wèn)答系統(tǒng)是世界上第一個(gè)開(kāi)放領(lǐng)域問(wèn)答系統(tǒng)[10]。進(jìn)入21世紀(jì),IBM的問(wèn)答系統(tǒng)Watson、蘋(píng)果的Siri出現(xiàn)后,問(wèn)答系統(tǒng)應(yīng)用開(kāi)啟了爆發(fā)式增長(zhǎng),其中主要有基于知識(shí)庫(kù)的問(wèn)答系統(tǒng)、基于社區(qū)的問(wèn)答系統(tǒng)和基于Web的問(wèn)答系統(tǒng)。
基于知識(shí)庫(kù)的問(wèn)答系統(tǒng)[11],以知識(shí)庫(kù)中的內(nèi)容作為知識(shí)來(lái)源,知識(shí)主要以三元組“實(shí)體,關(guān)系,實(shí)體”或“實(shí)體,屬性,屬性值”的方式存儲(chǔ)在知識(shí)圖譜或結(jié)構(gòu)文檔中。如何構(gòu)建知識(shí)圖譜和如何查詢(xún)知識(shí)圖譜是其中2個(gè)重要研究方向?;谏鐓^(qū)的問(wèn)答系統(tǒng)[12],以問(wèn)答社區(qū)為知識(shí)來(lái)源,主要研究?jī)?nèi)容為問(wèn)題分類(lèi)、問(wèn)句匹配以及答案篩選。問(wèn)題分類(lèi)目的是縮小問(wèn)題搜索范圍,提高答案獲取精度。問(wèn)句匹配是通過(guò)實(shí)際問(wèn)題文本與問(wèn)答對(duì)問(wèn)題文本進(jìn)行比較,又分為文本相似度比較和語(yǔ)義相似度比較,找尋相似問(wèn)題進(jìn)而得到答案。答案篩選是從多個(gè)答案中選出最佳答案?;赪eb的問(wèn)答系統(tǒng)[13],以互聯(lián)網(wǎng)作為知識(shí)來(lái)源,利用搜索引擎搜索網(wǎng)頁(yè)中包含的問(wèn)題答案。優(yōu)點(diǎn)是不需要提前創(chuàng)建準(zhǔn)備知識(shí)數(shù)據(jù),能夠隨時(shí)獲得最新的知識(shí)內(nèi)容。缺點(diǎn)是網(wǎng)頁(yè)搜索答案不夠精準(zhǔn),相對(duì)于知識(shí)庫(kù)或社區(qū)問(wèn)答系統(tǒng)來(lái)說(shuō)難以保證問(wèn)答效果,需要的研究?jī)?nèi)容包括問(wèn)題關(guān)鍵詞提取、問(wèn)題重寫(xiě)、閱讀理解、命名實(shí)體識(shí)別。
本文綜合考慮不同答案來(lái)源的問(wèn)答系統(tǒng)的優(yōu)缺點(diǎn),構(gòu)建了適用于電視節(jié)目錄制場(chǎng)景的輔助節(jié)目主持機(jī)器人問(wèn)答系統(tǒng)。
推薦系統(tǒng)是數(shù)據(jù)挖掘研究領(lǐng)域的一個(gè)應(yīng)用研究方向。傳統(tǒng)的推薦算法分為5類(lèi):基于內(nèi)容的推薦算法、基于協(xié)同過(guò)濾的推薦算法、基于知識(shí)的推薦算法、基于關(guān)聯(lián)規(guī)則的推薦算法以及混合推薦算法。
基于內(nèi)容的推薦算法[14],是根據(jù)用戶(hù)之前對(duì)項(xiàng)目的評(píng)分,學(xué)習(xí)用戶(hù)的偏好,推薦與用戶(hù)偏好相似的內(nèi)容給用戶(hù)。優(yōu)點(diǎn)是不需要用戶(hù)歷史數(shù)據(jù),不存在新內(nèi)容冷啟動(dòng)問(wèn)題,缺點(diǎn)是存在新用戶(hù)冷啟動(dòng)問(wèn)題,推薦結(jié)果多樣性差。
基于協(xié)同過(guò)濾的推薦算法[15],分為用戶(hù)協(xié)同過(guò)濾算法和項(xiàng)目協(xié)同過(guò)濾算法。通過(guò)相似用戶(hù)對(duì)內(nèi)容的興趣也相似的前提條件作為基礎(chǔ),前者向相似用戶(hù)推薦相同內(nèi)容,后者向同一用戶(hù)推薦相似內(nèi)容。優(yōu)點(diǎn)是推薦具有多樣性,會(huì)推薦用戶(hù)未知的新內(nèi)容給用戶(hù),可用于多媒體領(lǐng)域,缺點(diǎn)是存在新用戶(hù)和新內(nèi)容冷啟動(dòng)問(wèn)題,對(duì)于用戶(hù)評(píng)分?jǐn)?shù)據(jù)有強(qiáng)依賴(lài)性。
基于知識(shí)的推薦算法[16],是通過(guò)用戶(hù)給出的需求,將需求轉(zhuǎn)化為規(guī)則,并根據(jù)規(guī)則推薦相應(yīng)的內(nèi)容,優(yōu)點(diǎn)是沒(méi)有新用戶(hù)和新內(nèi)容冷啟動(dòng)問(wèn)題,推薦結(jié)果具有可解釋性,缺點(diǎn)是需要構(gòu)建知識(shí)庫(kù),算法可擴(kuò)展性差。
基于關(guān)聯(lián)規(guī)則的推薦算法[17],如果用戶(hù)對(duì)某個(gè)內(nèi)容感興趣,則該用戶(hù)可能對(duì)與該內(nèi)容相關(guān)的其他內(nèi)容感興趣,將相關(guān)內(nèi)容推薦給用戶(hù)。優(yōu)點(diǎn)是易發(fā)現(xiàn)新的內(nèi)容興趣點(diǎn),不需要領(lǐng)域知識(shí),缺點(diǎn)是個(gè)性化程度低,關(guān)聯(lián)規(guī)則提取復(fù)雜。
混合推薦算法,是利用上述推薦算法其中的2種或多種算法組合,生成更優(yōu)推薦結(jié)果。
本節(jié)目主持機(jī)器人的系統(tǒng)設(shè)計(jì)主要包含:總體網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)、交互控制流程設(shè)計(jì)、知識(shí)庫(kù)系統(tǒng)設(shè)計(jì)。系統(tǒng)采用JAVA web 技術(shù)實(shí)現(xiàn),方便進(jìn)行后臺(tái)數(shù)據(jù)的更新管理工作以及各功能模塊調(diào)用。
根據(jù)節(jié)目錄制現(xiàn)場(chǎng)的網(wǎng)絡(luò)環(huán)境要求,在原有的網(wǎng)絡(luò)系統(tǒng)中,增加主持機(jī)器人的網(wǎng)絡(luò)系統(tǒng),具體如圖1所示,各部分之間的交互序列如圖2所示。
圖1 節(jié)目主持機(jī)器人網(wǎng)絡(luò)架構(gòu)
圖2 節(jié)目主持機(jī)器人交互序列
主要包含如下4個(gè)部分:
1) 人工智能算法服務(wù)器,其中安裝了人工智能語(yǔ)音識(shí)別、人臉識(shí)別、命名識(shí)別、知識(shí)庫(kù)系統(tǒng)等;
2) 機(jī)器人主控系統(tǒng),分別與服務(wù)器和導(dǎo)播指揮系統(tǒng)相連,根據(jù)節(jié)目現(xiàn)場(chǎng)情況實(shí)時(shí)進(jìn)行數(shù)據(jù)分析;
3) 導(dǎo)播間的指揮命令信息采集系統(tǒng),根據(jù)導(dǎo)播指揮信息對(duì)機(jī)器人下達(dá)動(dòng)作命令;
4) 現(xiàn)場(chǎng)人機(jī)交互系統(tǒng),根據(jù)現(xiàn)場(chǎng)主持人、投資人、創(chuàng)業(yè)者之間的對(duì)話(huà)交流情況,進(jìn)行實(shí)時(shí)信息獲取,經(jīng)過(guò)分析后給出相應(yīng)回復(fù)和進(jìn)行互動(dòng)。
分析該投資節(jié)目的“角色”,主要包含:主持人、創(chuàng)業(yè)者、投資人三類(lèi)。根據(jù)這些角色建立相應(yīng)的知識(shí)庫(kù),如表1所示。
表1 節(jié)目主持機(jī)器人知識(shí)庫(kù)系統(tǒng)
節(jié)目主持機(jī)器人系統(tǒng)中運(yùn)用了多項(xiàng)自然語(yǔ)言處理技術(shù),深入理解分析語(yǔ)音識(shí)別結(jié)果文本,首先利用文本糾錯(cuò)技術(shù)對(duì)語(yǔ)音識(shí)別中識(shí)別錯(cuò)誤的詞語(yǔ)進(jìn)行自動(dòng)糾正,并利用分詞、詞性標(biāo)注、命名實(shí)體識(shí)別、依存句法對(duì)文本進(jìn)行初步分析。之后進(jìn)行文本語(yǔ)義理解,明確對(duì)話(huà)意圖。當(dāng)對(duì)話(huà)意圖識(shí)別為回答問(wèn)題時(shí),系統(tǒng)按照問(wèn)題類(lèi)型檢索知識(shí)庫(kù)、知識(shí)圖譜或者互聯(lián)網(wǎng)絡(luò)獲取對(duì)應(yīng)答案或知識(shí),之后進(jìn)行答案梳理,在候選答案中選擇最優(yōu)答案進(jìn)行語(yǔ)音合成返回到節(jié)目現(xiàn)場(chǎng)。此外,虛擬機(jī)器人還可以像主持人一樣向創(chuàng)業(yè)者提出問(wèn)題,這些問(wèn)題在節(jié)目播出前預(yù)先輸入到系統(tǒng)中,當(dāng)系統(tǒng)對(duì)話(huà)意圖識(shí)別為需要進(jìn)行提問(wèn)時(shí),機(jī)器人會(huì)自動(dòng)出現(xiàn)在屏幕上并提出問(wèn)題請(qǐng)創(chuàng)業(yè)者或投資人進(jìn)行回答。
基于自然語(yǔ)言處理的機(jī)器人問(wèn)答系統(tǒng)架構(gòu)如圖3所示,其中主要用到文本糾錯(cuò)、詞法分析、命名識(shí)別、問(wèn)答檢索等技術(shù)。
圖3 機(jī)器人問(wèn)答系統(tǒng)架構(gòu)圖
1) 文本糾錯(cuò):語(yǔ)音識(shí)別后文本糾錯(cuò)[18]是問(wèn)答意圖正確識(shí)別的重要保障,語(yǔ)音識(shí)別的錯(cuò)誤將導(dǎo)致后續(xù)步驟的錯(cuò)誤。通過(guò)大量系統(tǒng)測(cè)試后總結(jié)發(fā)現(xiàn),語(yǔ)音識(shí)別中出錯(cuò)的情況主要是同音詞錯(cuò)誤和因口音問(wèn)題導(dǎo)致的近似音識(shí)別錯(cuò)誤。在錯(cuò)誤中,以人名、機(jī)構(gòu)名命名實(shí)體為主。系統(tǒng)通過(guò)規(guī)則模板以及深度學(xué)習(xí)技術(shù)進(jìn)行了針對(duì)性錯(cuò)誤檢測(cè)及錯(cuò)誤糾正。
2) 詞法分析:主要包括中文分詞、詞性標(biāo)注、命名實(shí)體識(shí)別、依存句法分析。中文在詞與詞之間不存在英文中的空格分隔,使得中文語(yǔ)義分析上受到詞邊界錯(cuò)誤影響。分詞技術(shù)能使中文語(yǔ)句具有語(yǔ)義合理性詞匯序列。詞性標(biāo)注,是為每個(gè)分詞后的詞語(yǔ)標(biāo)注唯一詞性,有助于后續(xù)依存句法分析。命名實(shí)體識(shí)別,專(zhuān)門(mén)識(shí)別語(yǔ)句中具有特定含義的實(shí)體,這些實(shí)體經(jīng)常是問(wèn)答中的關(guān)鍵性信息。依存句法主要是實(shí)現(xiàn)語(yǔ)句中詞與詞之間相互關(guān)系的識(shí)別,如主謂關(guān)系、動(dòng)賓關(guān)系、定中關(guān)系。通過(guò)句法分析,可以抽取句子其中的語(yǔ)義主干,幫助智能機(jī)器人系統(tǒng)實(shí)現(xiàn)對(duì)對(duì)話(huà)意圖的精準(zhǔn)理解。
3) 命名識(shí)別:命名識(shí)別屬于自然語(yǔ)言處理領(lǐng)域詞法分析中的一部分,主要解決機(jī)器人系統(tǒng)未注冊(cè)的名詞識(shí)別問(wèn)題,主要包括人名、地名、機(jī)構(gòu)名或是專(zhuān)業(yè)領(lǐng)域名詞,這些詞匯在通用語(yǔ)料中出現(xiàn)次數(shù)少,但是對(duì)于問(wèn)答、信息檢索任務(wù)卻是關(guān)鍵。該項(xiàng)技術(shù)應(yīng)用在節(jié)目主持機(jī)器人系統(tǒng)中[19],通過(guò)網(wǎng)絡(luò)爬蟲(chóng)技術(shù)獲取了49 270個(gè)投資領(lǐng)域新聞標(biāo)題,并利用領(lǐng)域詞典進(jìn)行了初次標(biāo)注,對(duì)嚴(yán)重標(biāo)注錯(cuò)誤進(jìn)行了人工校正,實(shí)現(xiàn)了機(jī)器人系統(tǒng)自動(dòng)識(shí)別交流問(wèn)題中的命名實(shí)體,最后生成相應(yīng)的知識(shí)圖譜。
圖4為以某投資工場(chǎng)為例生成的知識(shí)圖譜,從投資領(lǐng)域、管理團(tuán)隊(duì)、投資年份、投資企業(yè)數(shù)量、企業(yè)創(chuàng)立日期、投資企業(yè)所在城市等維度全面展示了該投資工場(chǎng)的情況。
圖4 投資工場(chǎng)知識(shí)圖譜
4) 問(wèn)答檢索:當(dāng)對(duì)話(huà)意圖識(shí)別為回答問(wèn)題時(shí),系統(tǒng)將依據(jù)問(wèn)題類(lèi)型的不同,進(jìn)行知識(shí)庫(kù)或知識(shí)圖譜搜索,系統(tǒng)設(shè)定高閾值來(lái)保證回答的準(zhǔn)確率,知識(shí)庫(kù)中的結(jié)果將直接返回,知識(shí)圖譜中的結(jié)果將按不同內(nèi)容對(duì)答案進(jìn)行模板封裝然后返回,如果知識(shí)庫(kù)和知識(shí)圖譜中都搜索不到結(jié)果,系統(tǒng)將利用搜索引擎,在互聯(lián)網(wǎng)中搜索相應(yīng)答案,如果存在結(jié)構(gòu)化答案,系統(tǒng)優(yōu)先選擇結(jié)構(gòu)化答案,如果不存在結(jié)構(gòu)化答案,系統(tǒng)將大量爬取相關(guān)搜索結(jié)果,利用閱讀理解的深度學(xué)習(xí)方法,從中總結(jié)抽取正確答案。在之前的節(jié)目錄制中,我們構(gòu)建的知識(shí)庫(kù)及知識(shí)圖譜成功完成了絕大部分問(wèn)題的回答,只有極少數(shù)問(wèn)題應(yīng)用到了網(wǎng)絡(luò)搜索步驟,系統(tǒng)應(yīng)用效果良好。
在某期節(jié)目中,主持人與機(jī)器人之間的實(shí)際互動(dòng)示例如下:
主持人:“小創(chuàng)哥”。
機(jī)器人:大家好,我來(lái)了。
主持人:你看到剛才那個(gè)水下機(jī)器人了嗎?是你厲害還是剛才的水下機(jī)器人厲害?
機(jī)器人:我太難了!同是機(jī)器人,相煎何太急。我會(huì)說(shuō)話(huà)但不會(huì)游泳,它能游泳但不會(huì)說(shuō)話(huà),所以我總結(jié)一下,我們倆在不同領(lǐng)域,都各有作為。
主持人:還是你比較厲害,好,謝謝“小創(chuàng)哥”。
機(jī)器人:告辭。
通過(guò)對(duì)節(jié)目組給出的節(jié)目資料進(jìn)行數(shù)據(jù)挖掘與分析總結(jié),對(duì)最終成功簽約影響較大的因素主要有3個(gè),分別是:
1) 投資人本人關(guān)注投資領(lǐng)域與創(chuàng)業(yè)者創(chuàng)業(yè)領(lǐng)域是否匹配;
2) 投資人本次出資金額的多少與創(chuàng)業(yè)項(xiàng)目所需資金是否匹配;
3) 投資人與創(chuàng)業(yè)者現(xiàn)場(chǎng)交流互動(dòng)情況。
對(duì)這3個(gè)因素進(jìn)行分析,建立了“智能投顧算法模型”,在節(jié)目錄制過(guò)程中,現(xiàn)場(chǎng)實(shí)時(shí)計(jì)算投資人與創(chuàng)業(yè)項(xiàng)目的匹配程度,當(dāng)創(chuàng)業(yè)者咨詢(xún)時(shí),給出創(chuàng)業(yè)者選擇投資人的建議。
根據(jù)分析多期創(chuàng)業(yè)投資節(jié)目情況,建立了投顧推薦模型,其計(jì)算公式分為4個(gè)部分,最后將4個(gè)部分得分依照權(quán)值相加得到最終得分,這一組5個(gè)公式共同組成投資推薦算法模型。
(1)
(2)
(3)
(4)
si=αxi+βyi+δzi+mi
(5)
以上算法闡述如步驟1—步驟6:
步驟1首先計(jì)算投資人關(guān)注領(lǐng)域與創(chuàng)業(yè)者創(chuàng)業(yè)領(lǐng)域契合度xi,計(jì)算公式如式(6)所示。
(6)
其中:ε為創(chuàng)投領(lǐng)域契合度最低限度值,γ為單領(lǐng)域匹配加分,ni為第i位投資人關(guān)注領(lǐng)域與創(chuàng)業(yè)者創(chuàng)業(yè)項(xiàng)目所屬領(lǐng)域相關(guān)個(gè)數(shù)。
步驟2計(jì)算投資人意愿出資金額與創(chuàng)業(yè)者融資需求匹配度yi,計(jì)算公式如式(7)所示。
(7)
其中:gi為第i位投資人意愿出資金額,e為創(chuàng)業(yè)者融資需求。
步驟3計(jì)算投資人與創(chuàng)業(yè)者現(xiàn)場(chǎng)交流匹配分?jǐn)?shù)zi,計(jì)算公式如式(8)所示。
(8)
其中:di為第i位投資人與創(chuàng)業(yè)者交流次數(shù),max(d)為現(xiàn)場(chǎng)全部投資人中與創(chuàng)業(yè)者交流次數(shù)最多的投資人交流次數(shù),η為交流基礎(chǔ)次數(shù)。
步驟4計(jì)算投資人出資金額高于創(chuàng)業(yè)者融資需求時(shí)的附加分?jǐn)?shù)mi,計(jì)算公式如式(9)所示。
(9)
其中:γ為單領(lǐng)域匹配加分,e為創(chuàng)業(yè)者融資需求,gi為第i位投資人意愿出資金額。
步驟5將式(6)—(9)的計(jì)算結(jié)果依照投資因素占比重要性加權(quán)求和,得到最終匹配分?jǐn)?shù)Si,匹配分?jǐn)?shù)最高的投資人,是系統(tǒng)所推薦選擇的投資人,計(jì)算公式如式(10)所示。
si=αxi+βyi+δzi+mi
(10)
其中:xi、yi、zi、mi分別如前述含義,α、β、δ分別為各關(guān)注項(xiàng)的權(quán)值系數(shù),根據(jù)以往統(tǒng)計(jì)分析結(jié)果,一般設(shè)定α=0.2、β=0.5、δ=0.3,根據(jù)不同項(xiàng)目類(lèi)型有所適當(dāng)調(diào)整。
步驟6對(duì)步驟5所得匹配度分?jǐn)?shù)Si進(jìn)行最終合理性校驗(yàn),如果在該項(xiàng)目創(chuàng)業(yè)者和投資人所屬的范圍之內(nèi),則最終確定該結(jié)果為推薦值,如出現(xiàn)偏差超出期望值范圍,則調(diào)整前面步驟的相應(yīng)系數(shù),重新計(jì)算Si結(jié)果,直至最后選擇推薦出相對(duì)更為合理的投資人為主。
另外也有個(gè)別異常情況,比如全體投資人都放棄投資,全部滅燈,則該項(xiàng)目最終投資失敗,這種情況下,機(jī)器人推薦系統(tǒng)也同樣可以給出投資匹配度,只是分?jǐn)?shù)極低,當(dāng)匹配度低于0.5時(shí),系統(tǒng)不建議選擇投資人。
據(jù)不完全統(tǒng)計(jì),有643位來(lái)自不同領(lǐng)域的創(chuàng)業(yè)者通過(guò)層層選拔登上了央視創(chuàng)業(yè)節(jié)目舞臺(tái),對(duì)這643位創(chuàng)業(yè)者的創(chuàng)業(yè)領(lǐng)域進(jìn)行統(tǒng)計(jì),創(chuàng)業(yè)項(xiàng)目最多的8個(gè)領(lǐng)域分別是互聯(lián)網(wǎng)373項(xiàng),軟件應(yīng)用251項(xiàng),生活服務(wù)182項(xiàng),智能制造132項(xiàng),教育89項(xiàng),醫(yī)療衛(wèi)生74項(xiàng),文化創(chuàng)意73項(xiàng),新材料65項(xiàng),如表2所示。圖5是通過(guò)643位創(chuàng)業(yè)者項(xiàng)目介紹詞生成的詞云,通過(guò)詞云也可以看到平臺(tái)、服務(wù)、技術(shù)、智能等關(guān)鍵詞的出現(xiàn)頻率較大。
表2 項(xiàng)目領(lǐng)域占比
圖5 項(xiàng)目領(lǐng)域詞云圖
系統(tǒng)定期更新投資人信息知識(shí)圖譜,獲取現(xiàn)場(chǎng)各位投資人的投資關(guān)注領(lǐng)域信息,并通過(guò)創(chuàng)業(yè)者項(xiàng)目的介紹詞,利用提前訓(xùn)練好的分類(lèi)模型自動(dòng)對(duì)創(chuàng)業(yè)者的創(chuàng)業(yè)領(lǐng)域進(jìn)行識(shí)別。如果創(chuàng)業(yè)者的創(chuàng)業(yè)領(lǐng)域與投資人關(guān)注領(lǐng)域中的其中一個(gè)或多個(gè)相同或相關(guān),系統(tǒng)給出較高分值。如果領(lǐng)域不相關(guān),或者投資人很少或沒(méi)有投資過(guò)創(chuàng)業(yè)者所在的創(chuàng)業(yè)領(lǐng)域時(shí),系統(tǒng)給出較低分值,但不是零,因?yàn)橥顿Y者很可能在這期節(jié)目中看好這個(gè)項(xiàng)目而投資。
通過(guò)對(duì)節(jié)目資料進(jìn)行梳理統(tǒng)計(jì),往期創(chuàng)業(yè)者融資需求從200萬(wàn)~3 000萬(wàn)不等,相比創(chuàng)業(yè)者的融資需求,投資人給出的出資金額相對(duì)較低,最少只有50萬(wàn)元,在簽約成功的項(xiàng)目中最終價(jià)格50萬(wàn)~200萬(wàn)(不含)占比3.07%,200萬(wàn)~600萬(wàn)(不含)占比38.51%,600萬(wàn)~1 000萬(wàn)(不含)占比52.48%,1 000萬(wàn)及以上占比5.94%。
融資失敗很大原因在于投資人出資金額和創(chuàng)業(yè)者融資需求相差過(guò)大,出資金額對(duì)能否成功簽約影響較大。在節(jié)目演播現(xiàn)場(chǎng),實(shí)時(shí)獲得投資人出價(jià)信息,并對(duì)比創(chuàng)業(yè)者的融資需求,金額不足時(shí)系統(tǒng)按比例計(jì)算分值,出價(jià)超出融資需求時(shí)系統(tǒng)在計(jì)算總分時(shí)會(huì)給予投資人計(jì)算加分。
系統(tǒng)利用語(yǔ)音識(shí)別和人臉識(shí)別技術(shù),識(shí)別分析投資人的發(fā)言交流和面部表情情況,得出每位投資人在面對(duì)創(chuàng)業(yè)者時(shí)的互動(dòng)次數(shù)多少,分析其投資意愿程度大小。投資人發(fā)言和與創(chuàng)業(yè)者之間互動(dòng)的次數(shù)多少,反應(yīng)了投資人對(duì)這個(gè)項(xiàng)目的關(guān)注程度。越是對(duì)項(xiàng)目感興趣的投資人,越會(huì)更多詢(xún)問(wèn)創(chuàng)業(yè)者項(xiàng)目信息,以便挖掘項(xiàng)目發(fā)展?jié)摿Α?/p>
從央視創(chuàng)業(yè)投資節(jié)目2019年8月改版以來(lái),虛擬主持機(jī)器人(小創(chuàng)哥)已經(jīng)參與了24期節(jié)目的錄制。沒(méi)有出現(xiàn)因?yàn)闄C(jī)器人的問(wèn)題而影響節(jié)目錄制的情況發(fā)生。在保證主持互動(dòng)中問(wèn)題回答準(zhǔn)確率的同時(shí),小創(chuàng)哥的回復(fù)速度也隨著系統(tǒng)的不斷優(yōu)化逐漸改善,實(shí)際應(yīng)用案例分析如下。
在創(chuàng)業(yè)節(jié)目錄制現(xiàn)場(chǎng)中,“智能投顧算法”將根據(jù)項(xiàng)目領(lǐng)域、投資金額、現(xiàn)場(chǎng)交流情況進(jìn)行“投資匹配度”計(jì)算,給創(chuàng)業(yè)者提供選擇合理投資人的建議。表3為某期投資人推薦系統(tǒng)計(jì)算結(jié)果。
表3中,第一列為在場(chǎng)的8位投資人姓名,第二列為8位投資人與創(chuàng)業(yè)者項(xiàng)目領(lǐng)域匹配得分,第三列為投資人出資金額匹配得分,其中0.00分表示投資人未出價(jià),第四列為節(jié)目現(xiàn)場(chǎng)創(chuàng)投雙方交流情況匹配得分,最后一列為綜合匹配得分。
表3 投資人推薦系統(tǒng)計(jì)算結(jié)果
由表的最后一列可以看到,最終系統(tǒng)既沒(méi)有推薦選擇領(lǐng)域匹配度最高的6號(hào)和7號(hào)投資人,也沒(méi)有推薦出資金額匹配度最高的8投資人,以及交流匹配度最高的4號(hào)投資人,而是綜合了三項(xiàng)因素選擇了1號(hào)投資人,這期創(chuàng)業(yè)者最終聽(tīng)從了小創(chuàng)哥的建議選擇1號(hào)投資人作為自己的創(chuàng)業(yè)投資人。
電視節(jié)目實(shí)際播出效果如圖6所示。當(dāng)主持人或創(chuàng)業(yè)者咨詢(xún)機(jī)器人時(shí),小創(chuàng)哥將在大屏幕上播報(bào)推薦結(jié)果:“通過(guò)人工智能計(jì)算,小創(chuàng)哥推薦的這位投資人,他的投資領(lǐng)域匹配度是0.87,現(xiàn)場(chǎng)交流匹配度是0.75,投資金額匹配度是0.83,綜合匹配度是0.83,投資人匹配度最高的是1號(hào)投資人”。
圖6 電視節(jié)目播出效果圖
針對(duì)投資人推薦系統(tǒng),統(tǒng)計(jì)在24期節(jié)目共73個(gè)創(chuàng)業(yè)項(xiàng)目中,有40位創(chuàng)業(yè)者主動(dòng)希望聽(tīng)取小創(chuàng)哥給出的建議,另有6位創(chuàng)業(yè)者在主持人的建議下咨詢(xún)了小創(chuàng)哥的意見(jiàn)。在46次投資推薦應(yīng)用中,有6次小創(chuàng)哥給出的投資人選擇建議不是節(jié)目現(xiàn)場(chǎng)出價(jià)最高的投資人,在這6次中有5次創(chuàng)業(yè)者聽(tīng)從了小創(chuàng)哥的建議,并且小創(chuàng)哥的分析多次得到了不同創(chuàng)業(yè)導(dǎo)師的肯定,說(shuō)明了小創(chuàng)哥推薦的合理性,推薦采納率為97.83%(45/46)。
對(duì)于其中1次創(chuàng)業(yè)者沒(méi)有選擇小創(chuàng)哥推薦的投資人,咨詢(xún)其原因主要是考慮“所選擇的投資人所在地域能夠提供更大的市場(chǎng)資源,能夠快速幫助項(xiàng)目產(chǎn)生銷(xiāo)售額”,從這個(gè)意義上講,在推薦模型中還可以進(jìn)一步考慮“地域、市場(chǎng)”維度,今后可以進(jìn)一步改進(jìn)完善。
介紹了人工智能虛擬輔助主持機(jī)器人的實(shí)現(xiàn)方法,通過(guò)在央視節(jié)目中的成功應(yīng)用證明了方法的有效性。人工智能和機(jī)器人技術(shù)正在各行各業(yè)中普及應(yīng)用,電視節(jié)目也不例外。本文設(shè)計(jì)并實(shí)現(xiàn)了虛擬智能主持機(jī)器人系統(tǒng),建立了智能投顧算法模型,實(shí)現(xiàn)了節(jié)目主持過(guò)程中的智能問(wèn)答與投資推薦功能,是人工智能機(jī)器人技術(shù)在電視節(jié)目中的創(chuàng)新應(yīng)用,對(duì)促進(jìn)影視傳媒行業(yè)的智能化發(fā)展具有重要意義。