張肇聿,王一琳,李 志
(北京海鷹科技情報(bào)研究所,北京 100074)
2019年1月,權(quán)威市場(chǎng)研究機(jī)構(gòu)CB-Insights公司發(fā)布了一項(xiàng)報(bào)告[1],預(yù)測(cè)了未來人工智能領(lǐng)域擁有極大發(fā)展前景的25個(gè)應(yīng)用方向。這份報(bào)告是在分析了機(jī)構(gòu)內(nèi)部豐富的行業(yè)數(shù)據(jù)庫后得出的,然后將這25個(gè)人工智能應(yīng)用場(chǎng)景根據(jù)市場(chǎng)活力水平和行業(yè)認(rèn)可程度兩個(gè)方面進(jìn)行歸類。
市場(chǎng)活力水平參考了市場(chǎng)規(guī)模、投資者和資本的數(shù)量與質(zhì)量、研發(fā)投入、收益情況、競(jìng)爭(zhēng)壓力和市場(chǎng)交易的質(zhì)量。行業(yè)認(rèn)可程度則是依據(jù)媒體關(guān)注度、客戶采信情況和初創(chuàng)企業(yè)的發(fā)展勢(shì)頭。以這兩項(xiàng)參考依據(jù)為橫縱坐標(biāo),可得坐標(biāo)圖如圖1所示,其中人工智能發(fā)展趨勢(shì)被分為四種類型:
(1)確定前景:該行業(yè)擁有穩(wěn)定的需求,行業(yè)內(nèi)的市場(chǎng)和客戶對(duì)這一方向的投資和應(yīng)用是持續(xù)增加的;
(2)早期前景:這一方向的應(yīng)用仍處于早期論證中,產(chǎn)品尚未被廣泛使用,但是在科研機(jī)構(gòu)和媒體中已經(jīng)形成一定成果;
(3)預(yù)期前景:此方向的產(chǎn)品與應(yīng)用已經(jīng)獲得了廣泛的投資,這一概念也被早期使用者所接受,預(yù)期未來會(huì)獲得快速發(fā)展;
(4)短暫前景:該方向有一定趨勢(shì),但是市場(chǎng)存在很強(qiáng)的不確定性,隨著人們對(duì)該領(lǐng)域的關(guān)注度增加,有可能獲得更多的機(jī)會(huì)和市場(chǎng)。
圖1 四種行業(yè)發(fā)展特征Fig.1 Four characteristics of trend development
(1)開源框架。由于開源軟件的存在,進(jìn)入人工智能行業(yè)的門檻比以往任何時(shí)候都要低。開源框架對(duì)于人工智能領(lǐng)域的發(fā)展是雙向的。首先,它使所有人都可以訪問該人工智能開源框架。反過來,許多科技公司也從加速人工智能研究發(fā)展的論壇或開發(fā)者中受益。例如,Google于2015年開放了它的TensorFlow機(jī)器學(xué)習(xí)數(shù)據(jù)庫,在GitHub(一個(gè)用戶可以協(xié)作開發(fā)的平臺(tái))上,每月有數(shù)百名用戶參與關(guān)于TensorFlow的討論、研究與開發(fā)。包括可口可樂、eBay和Airbnb等知名公司都在使用TensorFlow的開源數(shù)據(jù)庫作為他們的人工智能開發(fā)框架。
(2)終端人工智能。實(shí)時(shí)決策的需求將人工智能推向了終端領(lǐng)域。終端人工智能旨在能夠在終端設(shè)備(如智能手機(jī)、汽車或穿戴設(shè)備)上運(yùn)行人工智能算法,而不是借助與中央云或服務(wù)器的通信,從而使設(shè)備能夠在本地處理信息并對(duì)情況做出更快的響應(yīng)。例如在無人駕駛領(lǐng)域,自主車輛必須實(shí)時(shí)響應(yīng)道路上發(fā)生的情況,并且可能在沒有互聯(lián)網(wǎng)連接的區(qū)域工作。在這種環(huán)境中,決策時(shí)間是極為重要的,任何短時(shí)間的延遲都可能導(dǎo)致致命的問題。
(3)人臉識(shí)別。從解鎖手機(jī)到航班登機(jī),人臉識(shí)別已逐漸成為主流應(yīng)用。卡內(nèi)基梅隆大學(xué)最近獲得了一項(xiàng)關(guān)于“幻覺面部特征”的專利,這是一種幫助執(zhí)法機(jī)構(gòu)識(shí)別蒙面嫌疑人的方法,即使只捕獲了面部的眼周區(qū)域就可以重建一張完整的臉。然后可以使用面部識(shí)別將“幻覺臉”與實(shí)際臉的圖像進(jìn)行比較,以找到相關(guān)性強(qiáng)的臉。為提高面部識(shí)別的準(zhǔn)確性,亞馬遜探索了額外的驗(yàn)證方式,包括要求用戶執(zhí)行某些動(dòng)作,如微笑、眨眼或傾斜頭部。然后將這些操作與紅外圖像信息、熱成像數(shù)據(jù)或其他此類信息結(jié)合起來,以獲得更可靠的身份驗(yàn)證。
(4)醫(yī)學(xué)影像與診斷。2018年4月,美國(guó)食品藥品監(jiān)督管理局(FDA)批準(zhǔn)了一項(xiàng)代號(hào)為IDx-DR的醫(yī)療相關(guān)人工智能軟件,該系統(tǒng)能在87.4%的時(shí)間內(nèi)正確識(shí)別出“輕度以上糖尿病性視網(wǎng)膜病變”患者,并在89.5%的時(shí)間內(nèi)識(shí)別出沒有這一疾病的人群。除此之外,F(xiàn)DA近期為醫(yī)用人工智能應(yīng)用提供了快速監(jiān)管審批的服務(wù),批準(zhǔn)了許多擁有龐大客戶群體的醫(yī)療項(xiàng)目,如用于CT掃描檢測(cè)中風(fēng)的Viz LVO和發(fā)現(xiàn)肝肺損傷的Arterys套件??焖俦O(jiān)管審批為80多家人工智能成像和診斷公司開辟了新的商業(yè)途徑,這些公司自2014年以來已籌集了股權(quán)融資,共有149宗交易。
(5)預(yù)測(cè)性維護(hù)。預(yù)測(cè)性維護(hù)技術(shù)的應(yīng)用幫助制造廠商、設(shè)備保險(xiǎn)公司和客戶在設(shè)備維修和故障識(shí)別中節(jié)約了可觀的資金和精力。大數(shù)據(jù)表明,意外的設(shè)備故障是導(dǎo)致工廠生產(chǎn)停機(jī)的主要原因之一,而且計(jì)劃外停機(jī)平均使公司損失25萬美元/小時(shí)。在預(yù)測(cè)性維護(hù)中,傳感器和智能攝像頭從機(jī)器收集連續(xù)的數(shù)據(jù)流,如溫度和壓力,而這些實(shí)時(shí)數(shù)據(jù)為機(jī)器學(xué)習(xí)算法的迭代和更新提供了豐富的數(shù)據(jù)支持。隨著時(shí)間的推移,這些算法可以在故障發(fā)生之前對(duì)其進(jìn)行預(yù)測(cè)。
(6)電子商務(wù)搜索系統(tǒng)。對(duì)搜索詞的上下文理解正逐漸完成實(shí)驗(yàn)階段,但距離廣泛應(yīng)用還有很長(zhǎng)的路要走。目前為止,零售商仍然沒有十分重視與人工智能相關(guān)的盈利策略,許多零售公司還沒有擴(kuò)展或優(yōu)化其電子商務(wù)運(yùn)營(yíng)。最近,網(wǎng)絡(luò)零售平臺(tái)eBay開始強(qiáng)制要求賣家完善產(chǎn)品描述,并使用機(jī)器學(xué)習(xí)來處理這些數(shù)據(jù),以在目錄中找到類似的產(chǎn)品。除此之外,圖片搜索初創(chuàng)公司Visenze與優(yōu)衣庫、Myntra和日本電子商務(wù)巨頭Rakuten等客戶合作。Visenze允許店內(nèi)客戶在商店里對(duì)他們喜歡的東西拍照,然后上傳圖片,在網(wǎng)上找到確切的產(chǎn)品。
圖2 TensorFlow平臺(tái)評(píng)論數(shù)量Fig.2 Contributions to TensorFlow
圖3 中國(guó)人臉識(shí)別技術(shù)在媒體中引用次數(shù)Fig.3 China’s facial recognition trends up in the news mentions
(1)膠囊網(wǎng)絡(luò)。谷歌深度學(xué)習(xí)領(lǐng)域研究員Hinton在2011年的一篇論文中提出了一個(gè)新概念:膠囊網(wǎng)絡(luò)[2]。他認(rèn)為目前識(shí)別圖像的方法表現(xiàn)不佳,包括當(dāng)今深度學(xué)習(xí)中最流行的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)之一,即卷積神經(jīng)網(wǎng)絡(luò)(CNN),在圖像識(shí)別的應(yīng)用上依然存在許多問題。Hinton在2018年發(fā)表的論文中,討論了一種名為膠囊網(wǎng)絡(luò)(Capsenet Networks)的替代概念[3],這種新的體系結(jié)構(gòu)有望在多個(gè)方面超越CNN。
(2)新一代假肢。通過結(jié)合機(jī)器學(xué)習(xí)、生物學(xué)和物理學(xué)等技術(shù),有望解決假肢使用中最困難的靈巧性問題。從2006年以來,美國(guó)國(guó)防部預(yù)先研究計(jì)劃局(DARPA)已經(jīng)花費(fèi)了數(shù)百萬美元在高級(jí)假肢項(xiàng)目上,由約翰霍普金斯大學(xué)牽頭,旨在幫助受傷的退伍軍人。在加入了機(jī)器學(xué)習(xí)算法后,從正常人的自主運(yùn)動(dòng)中解碼大腦和肌肉信號(hào),方便其轉(zhuǎn)化為機(jī)器人控制。在2018年,科學(xué)界研究的重點(diǎn)是使用強(qiáng)化學(xué)習(xí)來預(yù)測(cè)假肢的性能,研究人員使用一個(gè)名為Opensim的開源軟件來模擬人的運(yùn)動(dòng)。
(3)臨床試驗(yàn)志愿者。臨床試驗(yàn)中最大的難題之一是招募合適的志愿者。對(duì)臨床研究團(tuán)隊(duì)和志愿者來說,將特定的試驗(yàn)與匹配的患者進(jìn)行關(guān)聯(lián)是一個(gè)耗時(shí)且具有挑戰(zhàn)性的過程。理想的解決方案是通過人工智能軟件,從患者的醫(yī)療記錄中提取相關(guān)信息,與正在進(jìn)行的試驗(yàn)比較,并進(jìn)行詳細(xì)的匹配研究。自2015年以來,蘋果公司推出了兩個(gè)開源框架:ResearchKit和CareKit,以幫助臨床試驗(yàn)團(tuán)隊(duì)招募志愿者并遠(yuǎn)程實(shí)時(shí)監(jiān)控他們的健康情況。這些框架允許研究人員和開發(fā)人員創(chuàng)建醫(yī)療應(yīng)用程序來監(jiān)控患者特定的醫(yī)學(xué)指標(biāo),從而消除醫(yī)療的地理障礙。
(4)生成對(duì)抗網(wǎng)絡(luò)。生成對(duì)抗網(wǎng)絡(luò)(GANs)是谷歌的研究人員于2014年提出的概念[4],這項(xiàng)技術(shù)的基本觀點(diǎn)是利用了人工智能對(duì)抗人工智能所產(chǎn)生的結(jié)果。例如有兩個(gè)神經(jīng)網(wǎng)絡(luò):其中一個(gè)作為生成器生成一個(gè)假圖像,另外一個(gè)作為鑒別器,它將結(jié)果與真實(shí)世界的圖像進(jìn)行比較,并向生成器反饋與真實(shí)圖像的相似程度。這就形成了兩個(gè)神經(jīng)網(wǎng)絡(luò)和一個(gè)持續(xù)的反饋回路,這一過程試圖讓生成器和鑒別器彼此變得更聰明。
(5)聯(lián)盟學(xué)習(xí)。聯(lián)盟學(xué)習(xí)作為一種新開發(fā)的人工智能算法主要用于保護(hù)隱私,同時(shí)用敏感的用戶數(shù)據(jù)訓(xùn)練學(xué)習(xí)算法[5]。以移動(dòng)端設(shè)備的應(yīng)用為例,用戶的手機(jī)會(huì)根據(jù)本地的數(shù)據(jù)對(duì)模型進(jìn)行迭代和更新。這一過程中,只有更新框架被發(fā)送回云端,以改善使用環(huán)境的全局狀態(tài),而具體的隱私數(shù)據(jù)并不會(huì)被導(dǎo)出。谷歌支持的人工智能初創(chuàng)公司Owkin正在使用保護(hù)敏感用戶數(shù)據(jù)的聯(lián)盟學(xué)習(xí)方法,該系統(tǒng)允許不同的癌癥治療中心在詳細(xì)的病人隱私數(shù)據(jù)被隱藏的情況下依然能夠進(jìn)行協(xié)作。
(6)醫(yī)療生物特征識(shí)別。利用神經(jīng)網(wǎng)絡(luò),研究人員和醫(yī)療人員開始研究和測(cè)量以前難以量化的醫(yī)療生物特征。2019年,谷歌公司的研究人員根據(jù)視網(wǎng)膜、聲音等生物特征和心血管疾病的相關(guān)性,并對(duì)被測(cè)者的年齡、性別和吸煙等影響因素進(jìn)行精確量化,通過對(duì)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,能夠?qū)π难芗膊〉娘L(fēng)險(xiǎn)性進(jìn)行評(píng)估。與此同時(shí),許多公司和組織機(jī)構(gòu)正著手于更新人工智能算法,可實(shí)現(xiàn)對(duì)冠狀動(dòng)脈疾病、糖尿病、動(dòng)脈硬度和血壓的監(jiān)測(cè)與監(jiān)控。
(7)自動(dòng)索賠系統(tǒng)。保險(xiǎn)公司和初創(chuàng)企業(yè)逐步開始研發(fā)和使用基于人工智能算法的自動(dòng)索賠系統(tǒng),用來計(jì)算車主的風(fēng)險(xiǎn)評(píng)分,分析事故現(xiàn)場(chǎng)的圖像,并監(jiān)控駕駛員的行為。阿里巴巴旗下的螞蟻金融在其事故處理系統(tǒng)中使用深度學(xué)習(xí)算法進(jìn)行圖像處理,車主或司機(jī)可以把車輛受損信息的圖片發(fā)送到系統(tǒng)中,然后神經(jīng)網(wǎng)絡(luò)分析圖像并自動(dòng)進(jìn)行損傷評(píng)估,并將其發(fā)送給汽車保險(xiǎn)公司。除此之外阿里巴巴還推出了一種叫做“汽車保險(xiǎn)積分”的方法,利用機(jī)器學(xué)習(xí),根據(jù)信用記錄、消費(fèi)習(xí)慣和駕駛習(xí)慣等因素來計(jì)算車主的風(fēng)險(xiǎn)評(píng)分。
(8)防偽。隨著電子商務(wù)的蓬勃發(fā)展,假貨越來越難被發(fā)現(xiàn),為了應(yīng)對(duì)這種情況,品牌廠家和零售商開始嘗試?yán)萌斯ぶ悄軄肀鎰e產(chǎn)品真?zhèn)巍T旒僬咄褂门c原始品牌非常相似的關(guān)鍵詞和圖像,不僅在假冒網(wǎng)站上銷售假冒商品,也在合法市場(chǎng)或平臺(tái)上銷售假冒商品,還通過社交媒體促銷假冒商品。阿里巴巴報(bào)告稱,他們正在利用深度學(xué)習(xí)不斷監(jiān)測(cè)其平臺(tái)的知識(shí)產(chǎn)權(quán)侵權(quán)行為。它使用圖像識(shí)別來嘗試判別商品圖像中的字符,再加上相關(guān)的語義識(shí)別,從而完成防偽監(jiān)視。
圖4 基于生成對(duì)抗網(wǎng)絡(luò)的人臉替換Fig.4 Face to face transition based on GANs
除以上幾項(xiàng)應(yīng)用方向外,基于人工智能算法的無人零售、自動(dòng)化后臺(tái)、同聲翻譯和數(shù)據(jù)合成訓(xùn)練也都是符合早期前景特征的應(yīng)用方向。在結(jié)合了更為智能的算法后,整個(gè)行業(yè)可能會(huì)出現(xiàn)顛覆性的變化。
(1)強(qiáng)化學(xué)習(xí)。自從谷歌公司開發(fā)的AlphaGo在圍棋比賽中擊敗世界排名第一的中國(guó)選手后,在經(jīng)過了海量的數(shù)據(jù)學(xué)習(xí)后,它所應(yīng)用的強(qiáng)化學(xué)習(xí)算法引起了廣泛的關(guān)注,并在游戲和機(jī)器人仿真中得到了極大的發(fā)展。簡(jiǎn)單來說,強(qiáng)化學(xué)習(xí)算法的基本原理是為了達(dá)到目標(biāo)的最大化回報(bào),系統(tǒng)所需要采取的行為的集合[6]。最近,加州大學(xué)伯克利分校的研究人員利用計(jì)算機(jī)視覺和強(qiáng)化學(xué)習(xí)從YouTube視頻中學(xué)習(xí)人體動(dòng)作和姿勢(shì),使計(jì)算機(jī)模擬的角色能夠復(fù)制和識(shí)別視頻中的動(dòng)作,而無需手動(dòng)標(biāo)注姿勢(shì)。
圖5 美國(guó)關(guān)于強(qiáng)化學(xué)習(xí)的專利申請(qǐng)數(shù)量Fig.5 US patent applications for reinforcement learning
(2)網(wǎng)絡(luò)優(yōu)化。從促進(jìn)頻譜共享到監(jiān)控資產(chǎn),再到提出天線的優(yōu)化設(shè)計(jì),人工智能正在開始改變電信技術(shù)。電信網(wǎng)絡(luò)優(yōu)化是用于改善延遲、帶寬和設(shè)計(jì)架構(gòu)的一項(xiàng)新興技術(shù)。對(duì)于通信服務(wù)提供商而言,優(yōu)化意味著更好的客戶體驗(yàn)。除了帶寬限制外,電信業(yè)面臨的最大挑戰(zhàn)之一是網(wǎng)絡(luò)延遲。最近,蘋果公司獲得了一項(xiàng)專利,利用機(jī)器學(xué)習(xí)來形成預(yù)測(cè)網(wǎng)絡(luò),用來預(yù)估無線設(shè)備可能會(huì)采取的操作,并提前下載數(shù)據(jù)包以減少延遲。
(3)自動(dòng)駕駛。盡管自動(dòng)駕駛車輛有著巨大的市場(chǎng)機(jī)遇,但實(shí)現(xiàn)完全無人自主的時(shí)間表仍然不可預(yù)估。2017年4月,百度宣布推出了一個(gè)關(guān)于自主駕駛解決方案的開放平臺(tái):阿波羅(Apollo),這一技術(shù)平臺(tái)吸引了來自全球各地的合作伙伴。與其他開放源代碼的平臺(tái)一樣,其理念是通過開放人工智能和自動(dòng)駕駛的研究,使之能夠受益于科研生態(tài)系統(tǒng)中其他參與者的研究成果。讓每個(gè)人都可以使用源代碼,使公司和研究團(tuán)隊(duì)可以在現(xiàn)有研究的基礎(chǔ)上進(jìn)行構(gòu)建,而不是從頭開始。
圖6 媒體關(guān)于自動(dòng)投遞的提及次數(shù)Fig.6 Number of news mentions for‘a(chǎn)utonomous delivery’
(4)農(nóng)作物監(jiān)測(cè)。新型農(nóng)業(yè)正在開展三種類型的作物監(jiān)測(cè):地面、空中和立體地理空間。植保無人機(jī)作為農(nóng)作物監(jiān)測(cè)的主要應(yīng)用產(chǎn)品,預(yù)計(jì)2021年全球精準(zhǔn)農(nóng)業(yè)無人機(jī)市場(chǎng)將達(dá)到29億美元。無人機(jī)可以為農(nóng)民繪制農(nóng)田地圖,利用熱成像監(jiān)測(cè)水分含量,還可以識(shí)別蟲害作物和噴灑殺蟲劑。有許多初創(chuàng)公司正致力于利用人工智能算法,為第三方無人機(jī)捕獲的數(shù)據(jù)做出精準(zhǔn)的分析和判斷?;谌斯ぶ悄芩惴ǖ能浖脚_(tái)與無人機(jī)搭載平臺(tái)的結(jié)合正在逐漸成為農(nóng)作物監(jiān)測(cè)發(fā)展的主流。
(1)網(wǎng)絡(luò)漏洞搜索。隨著網(wǎng)絡(luò)技術(shù)的快速迭代,對(duì)網(wǎng)絡(luò)攻擊的反應(yīng)速度與操作水平已經(jīng)明顯不足,利用機(jī)器學(xué)習(xí)主動(dòng)搜索威脅的技術(shù)正在網(wǎng)絡(luò)安全中獲得優(yōu)勢(shì)。威脅搜索是一種主動(dòng)尋找惡意活動(dòng)的行為,而不是僅僅對(duì)警報(bào)或發(fā)生后的漏洞作出反應(yīng)。根據(jù)全球公共數(shù)據(jù)泄露數(shù)據(jù)庫中的泄露水平指數(shù),18年上半年全球共有45億條數(shù)據(jù)記錄遭到泄露。與人工智能所參與的其他工業(yè)應(yīng)用不同,網(wǎng)絡(luò)防御是黑客和安全人員之間的一種矛和盾的關(guān)系,兩者都利用機(jī)器學(xué)習(xí)的進(jìn)步來提高自身的技術(shù)水平并保持領(lǐng)先。
(2)智能語聊。對(duì)于許多企業(yè)的應(yīng)用場(chǎng)景來說,聊天機(jī)器人已經(jīng)成為人工智能的代名詞。最近,谷歌開發(fā)了一項(xiàng)人工智能對(duì)話功能,它可以代替用戶進(jìn)行電話呼叫和預(yù)訂,并且可以像真實(shí)的人一樣聊天。在某些應(yīng)用程序中,基于語音和文本的智能語聊系統(tǒng)所表達(dá)的信息比其他應(yīng)用程序更可靠。聊天機(jī)器人最廣泛的應(yīng)用之一是客戶服務(wù),機(jī)器人程序構(gòu)成與用戶交互的最外端接觸層,并根據(jù)復(fù)雜程度將查詢結(jié)果傳遞給人類[7]。
(3)藥物研發(fā)。隨著人工智能生物技術(shù)初創(chuàng)企業(yè)的興起,傳統(tǒng)制藥公司正在尋求人工智能系統(tǒng)為長(zhǎng)周期的藥物研發(fā)過程提供創(chuàng)新解決方案。2018年5月,輝瑞與Xtalpi公司建立了戰(zhàn)略合作伙伴關(guān)系,以預(yù)測(cè)小分子的藥物特性,并開發(fā)基于計(jì)算的合理藥物設(shè)計(jì)。但輝瑞并不是唯一一家與人工智能算法結(jié)合的藥物公司。諾華、賽諾菲、葛蘭素史克、安進(jìn)和默克等頂級(jí)制藥公司最近幾個(gè)月都宣布與人工智能公司建立合作關(guān)系,研發(fā)用于腫瘤和心臟病等一系列疾病的新藥。
CB-Insights公司發(fā)布的這篇關(guān)于人工智能發(fā)展前景的報(bào)告,不僅很好的總結(jié)了最近幾年十分熱門的人工智能應(yīng)用,還依據(jù)發(fā)展趨勢(shì)和特點(diǎn)對(duì)它們進(jìn)行了劃分。無論是科研學(xué)術(shù)還是投資應(yīng)用,這些應(yīng)用的解讀都具有一定的參考價(jià)值。隨著人工智能算法和相關(guān)應(yīng)用系統(tǒng)的不斷研發(fā)與更新,越來越多的行業(yè)會(huì)以更深更廣的方式進(jìn)行結(jié)合,并且為人類生產(chǎn)生活帶來巨大的變革。