深度學(xué)習(xí)主導(dǎo)的新一代人工智能已成為技術(shù)與產(chǎn)業(yè)的通用賦能工具和科學(xué)研究的第四范式,正在變革技術(shù)、賦能產(chǎn)品、滲透產(chǎn)業(yè)、重塑社會、加速智能經(jīng)濟的發(fā)展與智能社會的結(jié)構(gòu)性變革。清華大學(xué)智能技術(shù)與系統(tǒng)國家重點實驗室教授鄧志東表示,人工智能在具體落地應(yīng)用過程中仍面臨一些挑戰(zhàn)。
3月21日,己亥年人工智能春季創(chuàng)新大會在北京國賓酒店隆重召開,大會由人工智能產(chǎn)業(yè)創(chuàng)新聯(lián)盟和賽迪傳媒共同主辦。會上,政府領(lǐng)導(dǎo)、企業(yè)領(lǐng)袖以及人工智能領(lǐng)域的資深專家悉數(shù)到場,圍繞人工智能與實體經(jīng)濟深度融合展開了全面、細致的交流與研討,各種創(chuàng)新觀點融合交匯,為人工智能的創(chuàng)新應(yīng)用提供了新思路、新路徑。
聯(lián)盟專家委主任委員、清華大學(xué)智能技術(shù)與系統(tǒng)國家重點實驗室教授鄧志東分享了關(guān)于人工智能落地應(yīng)用的深層次思考。他指出,人工智能在工業(yè)、零售、醫(yī)療、客服等領(lǐng)域都實現(xiàn)了創(chuàng)新應(yīng)用,與此同時,人工智能在實踐過程中仍面臨一些挑戰(zhàn)。
大數(shù)據(jù)人工智能創(chuàng)新實踐面臨的挑戰(zhàn)
自2013年以來,大數(shù)據(jù)和大計算驅(qū)動的深度學(xué)習(xí)已成為計算機視覺、語音識別與真實感合成、自然語言處理、大數(shù)據(jù)分析等的主流方法。數(shù)據(jù)驅(qū)動方法已被視為繼實驗科學(xué)、理論模型、模擬仿真之后的第四科學(xué)研究范式。正如同網(wǎng)絡(luò)技術(shù)一樣,已逐漸變革為一種通用賦能工具,目前已遠遠超越計算機科學(xué)與技術(shù)本身的范疇。
以深度卷積神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的新一代人工智能,能夠獲得更加接近于人類水平的視聽覺感知能力和對文本自然語言的模式分類能力,帶來了超越人類的棋類動態(tài)博弈能力。近年來,超人類水平的AlphaGo,引起了社會的強烈關(guān)注。特別是AlphaZero,帶來了無需大數(shù)據(jù)且可從零開始進行自主學(xué)習(xí)的棋類通用人工智能。
對抗性神經(jīng)網(wǎng)絡(luò)的最新進展,帶來了超真實感的想象能力,兩個深度卷積神經(jīng)網(wǎng)絡(luò)通過相互對抗來生成超分辨率具真實感的原創(chuàng)圖像、聲音、3D物體或自然時序數(shù)據(jù),這對半監(jiān)督、無監(jiān)督學(xué)習(xí)方法的研究,是一個非常重要的進展。2018年《麻省理工科技評論》把對抗性神經(jīng)網(wǎng)絡(luò)列為全球十大突破性技術(shù)之一。特別地,基于深度神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測、定位、分割(如語義分割、實例分割與全景分割),自2014年R-CNN問世以來,已取得了非常大的進展。目前的研究重點已超越了簡單的分類識別任務(wù),開始進一步研究動作與行為意圖的檢測與識別。例如,研究基于視覺深度神經(jīng)網(wǎng)絡(luò)的表情、手勢、動作識別與行為意圖預(yù)測等,這些都為人工智能的產(chǎn)業(yè)滲透帶來了更多新的方向。目前,一些典型的人工智能產(chǎn)業(yè)應(yīng)用與創(chuàng)新實踐包括:AI刷臉支付、AI無人零售、AI攝像頭、AI音箱、AI視頻換臉 (虛擬主持人)、 AI速記員、 AI實時翻譯耳機、AI手持翻譯機、AI語音助手、AI電話客服、AI醫(yī)學(xué)影像診斷、AI-IoT等。
人工智能還賦能自動駕駛的主要細分領(lǐng)域,包括自動駕駛的環(huán)境感知與建模、自主導(dǎo)航、決策規(guī)劃、控制與人機交互(如智能駕駛艙)等。在這個熱點產(chǎn)業(yè)方向,谷歌已于2018年12月5日正式推出了新的商業(yè)自動叫車運營品牌Waymo One,率先在美國鳳凰城地區(qū)開啟了全球首個付費自動駕駛出租車小規(guī)模商業(yè)化服務(wù)。人工智能也賦能于智能機器人產(chǎn)業(yè),無論是工業(yè)機器人,還是服務(wù)機器人與特種機器人,人工智能相當(dāng)于模擬機器人的大腦。機器人產(chǎn)業(yè)本身要模擬人的手和腿,手要靈巧地操作,腿要靈活地移動。當(dāng)然,最重要的就是模擬人的大腦,靠人工智能來賦予機器人感知與認知能力。
基于深度學(xué)習(xí)的計算機視聽覺感知方法,需要海量大數(shù)據(jù)的驅(qū)動,目前也缺乏認知水平的理解能力。需要解決的是,如何提供基于小樣本的“數(shù)據(jù)感知+認知理解”能力?此外,在落地應(yīng)用中,考慮到在開放環(huán)境下實際上是不存在完備大數(shù)據(jù)的,因此對于各種實際應(yīng)用場景,大數(shù)據(jù)人工智能均只能獲得較接近于人類水平的視聽覺等感知能力,這與各種基于公開評測數(shù)據(jù)集得到的性能極限指標(biāo),是完全不同的??傊?,就目前的深度學(xué)習(xí)算法來說,不僅缺乏人類舉一反三的小樣本學(xué)習(xí)能力和對目標(biāo)的認知理解能力,而且不能有效利用常識與記憶,也不能進行基于知識的因果推理。
鄧志東認為,中國人工智能創(chuàng)新實踐面臨相關(guān)挑戰(zhàn),一是我國人工智能技術(shù)的原始創(chuàng)新能力不足,基礎(chǔ)算法、高端人工智能芯片主要還是以跟蹤西方國家為主;二是投資界過于追求短線逐利;三是體制機制障礙,國有巨頭型企業(yè)前瞻性戰(zhàn)略布局不多,投入力度小,民營科技巨頭在扛大旗;四是人工智能落地應(yīng)用面臨著諸多困難;五是缺乏高端的基礎(chǔ)性研究人才,特別是創(chuàng)新能力強的人才,另外我們還需要大量的人工智能工程開發(fā)人員。
同時,他還指出,大數(shù)據(jù)人工智能的發(fā)展,也會帶來法律、倫理、隱私安全和失業(yè)等方面的挑戰(zhàn)。但對人類而言,目前的大數(shù)據(jù)人工智能總體是賦能而有益的。認知智能與通用人工智能的發(fā)展,則將對技術(shù)與產(chǎn)業(yè)的發(fā)展帶來真正的變革,但也有可能威脅到人類自身的安全;有必要進行未雨綢繆的研究,預(yù)做準(zhǔn)備以進行規(guī)范制約。
我國在2017年發(fā)布了《新一代人工智能發(fā)展規(guī)劃》,把人工智能的發(fā)展升級為國家戰(zhàn)略,提出了三步走的戰(zhàn)略目標(biāo)。第三步是到2030年,中國人工智能理論、技術(shù)與應(yīng)用總體達到世界領(lǐng)先水平,成為世界主要人工智能創(chuàng)新中心。鄧志東認為,成為世界主要的人工智能創(chuàng)新中心這個目標(biāo)非常具有挑戰(zhàn)性,目前僅有10年多一點的時間了。
黨的十九大報告提出,推動互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能和實體經(jīng)濟深度融合,培育新的經(jīng)濟增長點,形成新的轉(zhuǎn)換動能。人工智能從2017年開始,已經(jīng)連續(xù)三年寫入了政府工作報告。在2019年政府工作報告中,人工智能升級為拓展“智能+”,指出要“深化大數(shù)據(jù)、人工智能等研發(fā)應(yīng)用”,賦能傳統(tǒng)制造業(yè)轉(zhuǎn)型升級。力爭通過新一輪科技革命,加速培育我國新興產(chǎn)業(yè)集群,壯大數(shù)字與智能經(jīng)濟,推動產(chǎn)業(yè)結(jié)構(gòu)變革。3月19日召開的中央全面深化改革委員會第七次會議,審議通過了《關(guān)于促進人工智能和實體經(jīng)濟深度融合的指導(dǎo)意見》,強調(diào)必須以市場需求為導(dǎo)向,以產(chǎn)業(yè)應(yīng)用為目標(biāo),構(gòu)建數(shù)據(jù)驅(qū)動、人機協(xié)同、跨界融合、共創(chuàng)分享的智能經(jīng)濟新形態(tài)。
在國家發(fā)展戰(zhàn)略與產(chǎn)業(yè)政策的推動下,我們看到新一代人工智能的應(yīng)用場景其實是非常豐富的,比如AI-IoT, 5G, VR/AR,智能零售,智能安防,智能手機,智能家電,智能家居,智慧城市,智能制造(例如,零部件的外觀質(zhì)量檢查),自動駕駛,智能機器人,無人機等,而且還正在滲透更多的垂直應(yīng)用領(lǐng)域。大數(shù)據(jù)人工智能將無處不在,可望替換更多依賴人類視聽覺功能的服務(wù)性工種和更多需要環(huán)境適應(yīng)性及自主性的復(fù)雜體力勞動。
人工智能與實體經(jīng)濟怎樣實現(xiàn)融合?鄧志東認為,細分迭代是“智能+”落地的關(guān)鍵,我國要率先努力形成世界領(lǐng)先的人工智能產(chǎn)業(yè)生態(tài)。隨著人工智能的產(chǎn)業(yè)滲透不斷加快,“智能+”產(chǎn)品的開發(fā)與產(chǎn)業(yè)發(fā)展正處于艱難的深耕期,與實體經(jīng)濟的深度融合方興未艾。但人工智能的應(yīng)用場景要細分,要專注于細分場景的大數(shù)據(jù)實踐,有定力、有耐性地積累海量的標(biāo)簽大數(shù)據(jù)。另外我們還需要在應(yīng)用實踐中不斷地進行數(shù)據(jù)、性能和體驗的迭代學(xué)習(xí)。同時也需要大計算能力等人工智能公共基礎(chǔ)設(shè)施的有力支撐??傊斯ぶ悄艿陌l(fā)展最終要能給企業(yè)和社會創(chuàng)造價值。
“智能+”是一條條“細線”上的人工智能創(chuàng)新應(yīng)用實踐。目前的大數(shù)據(jù)人工智能創(chuàng)新應(yīng)用產(chǎn)品,需要細分到特定的應(yīng)用場景,進行有耐性的打磨。要敢于大膽地推廣應(yīng)用人工智能產(chǎn)品,新一代人工智能技術(shù)具有數(shù)據(jù)學(xué)習(xí)能力,用戶體驗可以在應(yīng)用實踐中不斷地進行迭代升級,這一點尤其重要。歸結(jié)起來,只要把每條“細線”上的人工智能落地應(yīng)用都做到接近于人類水平,涓涓細流匯聚起來,就能大幅度地提高傳統(tǒng)制造業(yè)的智能化水平。
人工智能創(chuàng)新應(yīng)用的路徑與模式
從“互聯(lián)網(wǎng)+”到“智能+”,以市場需求為導(dǎo)向,以產(chǎn)業(yè)應(yīng)用為目標(biāo),通過數(shù)據(jù)驅(qū)動和跨界融合,推動“智能+實體經(jīng)濟”的深度融合,助力傳統(tǒng)制造業(yè)的轉(zhuǎn)型升級以及數(shù)字經(jīng)濟、智能經(jīng)濟的發(fā)展。應(yīng)以應(yīng)用場景、大數(shù)據(jù)、人工智能算法和計算能力四大維度,打通產(chǎn)業(yè)鏈條,推動人工智能的創(chuàng)新實踐和應(yīng)用落地。一句話就是“大數(shù)據(jù)是基礎(chǔ),算法是核心,芯片是高地,人才是關(guān)鍵,但選定垂直細分領(lǐng)域最重要”。
怎么選定特定的應(yīng)用場景?人工智能的落地應(yīng)用,不可能是通用寬泛的,而是要選定一個特定的細分問題入手,一點一滴地開始。實際上,并非所有場景的問題都能由人工智能解決。選擇的原則之一就是,能處理的特定應(yīng)用場景具有較好的數(shù)字化、網(wǎng)絡(luò)化基礎(chǔ),能夠源源不斷地產(chǎn)生大數(shù)據(jù)。我們要特別優(yōu)選信息化基礎(chǔ)比較好的行業(yè)或細分應(yīng)用領(lǐng)域。
在各個垂直領(lǐng)域或行業(yè),關(guān)鍵是對垂直領(lǐng)域進行細分再細分。例如,可以優(yōu)選那些生產(chǎn)環(huán)境惡劣、產(chǎn)業(yè)價值高或人員稀缺的細分場景。由于目前人工智能的技術(shù)突破主要在感知智能領(lǐng)域,所以在各種需要高級熟練工人使用“眼睛”“耳朵”等感知直覺完成的工作上,若人工智能通過自動學(xué)習(xí)能夠達到熟練師傅“聽故障”和“看瑕疵”的水平,這樣就可以做到對人工的替代。
大數(shù)據(jù)是基礎(chǔ)?!爸悄?”從某種意義上就是“大數(shù)據(jù)+”,因為目前的人工智能就是所謂的“人工+智能”,本質(zhì)上是把人的經(jīng)驗或直覺判斷通過標(biāo)簽的形式轉(zhuǎn)移給機器,然后賦予機器所謂的視聽覺“感知智能”。前面已說過,應(yīng)用落地時的開放環(huán)境下并不存在完備大數(shù)據(jù),而且還有數(shù)據(jù)與性能的所謂“長尾效應(yīng)”,也就是“行百里者半于九十”,因此我們不僅必須盡可能多地積累和運用標(biāo)簽大數(shù)據(jù),而且越到后面越困難,就越需要堅持。這也說明,在產(chǎn)業(yè)應(yīng)用中亟須發(fā)展基于小樣本的深度學(xué)習(xí)方法。此外,利用“人工”對數(shù)據(jù)進行清洗和做標(biāo)簽,包括對標(biāo)簽的質(zhì)量審核等,催生了“標(biāo)簽工”這一新的工種。在應(yīng)用實踐中,需要建立一支工程團隊,投入大量人力物力去做數(shù)據(jù)積累和數(shù)據(jù)標(biāo)簽,特別是建立高質(zhì)量的標(biāo)簽大數(shù)據(jù)?;旧?0%以上的人力、物力,都要投入到特定的細分問題上,去深耕應(yīng)用場景和數(shù)據(jù)。按照現(xiàn)階段的算法水平,還不存在一個高大上的萬能方法,可以“輕松”地解決所有場景的人工智能應(yīng)用。我們應(yīng)以工匠精神深耕制造企業(yè)中的細分場景與大數(shù)據(jù)應(yīng)用。通過“智能+”打磨人工智能產(chǎn)品,助推與傳統(tǒng)制造業(yè)的深度融合及品質(zhì)革命實踐。以數(shù)據(jù)驅(qū)動、人機協(xié)同,通過“智能+XXX”的跨界融合,加速從基礎(chǔ)層、核心技術(shù)層、開放平臺層到應(yīng)用層的人工智能產(chǎn)業(yè)生態(tài)建設(shè),以我國人工智能產(chǎn)業(yè)和智能經(jīng)濟社會的快速發(fā)展,牽引驅(qū)動人工智能基礎(chǔ)研究與前沿技術(shù)的全面進步。
算法是核心?;谏疃葘W(xué)習(xí)的計算機視覺、機器語音、真實感數(shù)據(jù)生成、詞嵌入向量等,作為人工智能算法的主要支撐,已成為“人工智能+”或“+人工智能”的產(chǎn)業(yè)核心共性技術(shù),賦能產(chǎn)品、流程與服務(wù)體驗。在探索下一代人工智能核心算法方面,亟須發(fā)展具有類似于人類舉一反三小樣本學(xué)習(xí)能力的人工智能算法,具體途徑包括與知識圖譜結(jié)合起來,尤其是與具有學(xué)習(xí)能力的知識圖譜相結(jié)合。另外還須發(fā)展具有認知理解能力,具有記憶、常識和推理能力的人工智能新算法。比如發(fā)展圖卷積神經(jīng)網(wǎng)絡(luò),以“深度學(xué)習(xí)+無監(jiān)督”的方式進行實體識別,結(jié)合概率圖模型(知識圖譜)抽象、延伸概念,賦以其內(nèi)涵與外延,以實現(xiàn)對場景或目標(biāo)的認知水平的理解。
芯片是高地。目前的人工智能芯片主要包括通用人工智能芯片,專用人工智能芯片和類腦芯片。普遍認為,工業(yè)互聯(lián)網(wǎng)、工業(yè)物聯(lián)網(wǎng)、5G通信、云平臺和數(shù)據(jù)中心等,共同構(gòu)成了大數(shù)據(jù)人工智能產(chǎn)業(yè)應(yīng)用的硬件基礎(chǔ)設(shè)施。
人才是關(guān)鍵。人工智能基礎(chǔ)算法的創(chuàng)新,核心關(guān)鍵技術(shù)的突破,通用人工智能芯片和類腦芯片等高端人工智能芯片產(chǎn)品的研發(fā),對具有原始創(chuàng)新能力的高端人才提出了迫切的需求。隨著人工智能產(chǎn)業(yè)的迅猛發(fā)展,特別是人工智能對各個產(chǎn)業(yè)的滲透不斷加快,人工智能工程技術(shù)開發(fā)人才的存量和增量存在嚴重不足,需求與供給的矛盾日益突出,因此必須加快我國人工智能人才高地的建設(shè)。
總之,深度學(xué)習(xí)主導(dǎo)的新一代人工智能已成為技術(shù)與產(chǎn)業(yè)的通用賦能工具和科學(xué)研究的第四范式,正在變革技術(shù),賦能產(chǎn)品,滲透產(chǎn)業(yè),重塑社會,加速智能經(jīng)濟的發(fā)展與智能社會的結(jié)構(gòu)性變革。深度學(xué)習(xí)方法應(yīng)用創(chuàng)新實踐面臨的重大挑戰(zhàn),不僅包括缺乏人類舉一反三的小樣本學(xué)習(xí)能力和認知水平的理解能力,而且不能有效利用常識與記憶,也不能進行基于知識的因果推理。人工智能的產(chǎn)品開發(fā)與產(chǎn)業(yè)發(fā)展正處于爆發(fā)期,與實體經(jīng)濟的深度融合方興未艾。“智能+”落地,關(guān)鍵是應(yīng)用場景的細分與實踐過程的迭代。需要特別專注于細分場景的大數(shù)據(jù)實踐,特別是數(shù)據(jù)、產(chǎn)品與性能在創(chuàng)新應(yīng)用中的迭代。只有應(yīng)用落地與用戶體驗做好了,給企業(yè)和社會帶來了價值,才能構(gòu)成正反饋迭代,人工智能技術(shù)與產(chǎn)業(yè)才能得到進一步的蓬勃發(fā)展。從“互聯(lián)網(wǎng)+”到“人工智能+”,真正以市場需求為導(dǎo)向,以產(chǎn)業(yè)應(yīng)用為目標(biāo),通過數(shù)據(jù)驅(qū)動和跨界融合,推動“智能+實體經(jīng)濟”的深度融合,促進傳統(tǒng)產(chǎn)業(yè)的轉(zhuǎn)型升級與數(shù)字經(jīng)濟、智能經(jīng)濟的協(xié)同發(fā)展。
(以上內(nèi)容來自清華大學(xué)智能技術(shù)與系統(tǒng)國家重點實驗室教授鄧志東在已亥年人工智能春季創(chuàng)新大會上的演講,經(jīng)整理編輯。)