簡而言之,人工智能就要是讓機器能像人那樣理解、思考和學習,即用計算機模擬人的智能。
當前,人們對于人工智能也許并不陌生,因為從幾年前開始,相關新聞就時常見諸報端:AlphaGo在圍棋比賽中戰(zhàn)勝人類冠軍李世石和柯潔、無人駕駛汽車獲發(fā)測試牌照即將上路、越來越多高校成立人工智能學院和研究院……
簡而言之,人工智能就是讓機器能像人那樣理解、思考和學習,即用計算機模擬人的智能。它涵蓋認知與推理(包含各種物理和社會常識)、計算機視覺、自然語言理解與交流(包含聽覺)、機器學習等廣泛的學科領域。因此可以說,視聽覺信息的認知計算是人工智能重要研究內容,理解人類視聽覺認知并建立可計算視聽覺認知模型對人工智能的核心算法具有重大的啟示意義。
來自上世紀的設想
但如果將時間回撥至二十年前,公眾對人工智能的認識既沒有如此深刻,也不像如今這樣對它抱有那么大的期待。甚至在上世紀九十年代初,面對全球范圍內現(xiàn)代PC的出現(xiàn)和普及,人工智能由于發(fā)展不及預期導致資金困難等難題,經歷了一場寒冬。不過,這個在當時看似“無人問津”的領域引起了中國工程院院士、西安交通大學教授鄭南寧的注意。
“為什么人工智能會遭遇寒冬?我們面臨的挑戰(zhàn)是什么?”上世紀90年代初,中國工程院院士、西安交通大學教授鄭南寧就對這個問題進行了深入思考。
“1999年,‘視聽覺信息的認知計算重大研究計劃立項的前期思考和頂層設計工作就開始了?!痹撝卮笱芯坑媱澲笇<医M組長鄭南寧提到,但由于科學家們最初并沒有形成基本的共識,因此歷經9年艱辛的研究積累和多次探討,在自然科學基金委和專家們的共同努力下,才終于在2008年正式啟動了這一重大研究計劃,“這是我國在人工智能基礎研究領域發(fā)展的里程碑之一,標志著中國人工智能科學研究‘國家隊的正式組建”。
“本重大研究計劃在立項伊始,人工智能技術還未形成當今席卷全球范圍的研究熱潮,足以體現(xiàn)出自然科學基金委與相關專家的學術洞察力和戰(zhàn)略前瞻眼光?!被厥淄拢嵞蠈幮牢康卣f。通過這一重大研究計劃的資助,我國在人工智能領域從理論、方法、技術到應用都得到了蓬勃發(fā)展。
讓基礎研究走出實驗室
立項之初,為確保國家安全與公共安全、推動信息服務及相關產業(yè)發(fā)展以及提高國民生活和健康水平,研究人員確定了“視聽覺信息的認知計算”重大研究計劃的目標,即研究并構建新的計算模型與計算方法,提高計算機對非結構化視聽覺感知信息的理解能力和海量異構信息的處理效率,克服圖像、語音和文本(語言)信息處理所面臨的瓶頸困難。
如何才能實現(xiàn)這一目標?在鄭南寧看來,這需要從人類的視聽覺認知機理出發(fā)。“圍繞認知過程的‘表達與‘計算這一基本科學問題,我們重點開展了‘感知特征的提取、表達與整合‘感知數據的機器學習與理解和‘多模態(tài)信息協(xié)同計算三個核心科學問題的研究?!?/p>
“計算機對感知信息不能有效處理,根本原因則是不能對真實場景的基本特征進行可靠提取,缺乏對真實場景基本特征的一般表達方式以及對不同模態(tài)下信息特征有效整合的理論?!彼赋?,雖然機器學習和人工神經網絡等方法近年來在高維數據可視化、特征提取、數據聚類與特征子空間分析等方面取得了重要進展,但非結構化數據本質維數的確定仍然是一個公開的難題;現(xiàn)有的信息處理方法主要是針對單模態(tài)的,對多模態(tài)信息的處理還基本上停留在將各種單模態(tài)信息的處理結果在決策層面上進行融合?!罢且驗檫@些基本問題沒有得到解決,計算機才只能處理比較理想狀態(tài)下的一些簡單問題,很難處理現(xiàn)實世界中的復雜問題?!?/p>
通過對上述三個核心科學問題的研究,十年來,該重大研究計劃在認知機理和模型、視聽覺信息處理、自然語言(漢語)理解等方面取得了一系列標志性成果。
例如在視覺認知機理方面,研究人員提出了知覺物體的拓撲學定義和注意瞬脫的拓撲學解釋等基礎理論和模型;在視聽覺信息處理與計算方面,建立了視覺注意力統(tǒng)計學習計算模型和顯著性目標檢測新理論;在漢語自然語言理解方面,創(chuàng)建了一種新的語義計算理論框架,成功研發(fā)了一系列面向公共安全的語言交互系統(tǒng)。
據不完全統(tǒng)計,截至2018年9月,該重大研究計劃共發(fā)表學術論文2255篇,申請國家發(fā)明專利532項。其中,在認知和信息科學相關領域的國際權威期刊上發(fā)表論文163篇,包括在影響因子5.0以上期刊發(fā)表論文50余篇。
“特別值得一提的是,為了進一步推動研究工作走出實驗室、產生原創(chuàng)性重大成果,本重大研究計劃創(chuàng)建了兩個比賽平臺,即‘中國智能車未來挑戰(zhàn)賽和‘中國腦-機接口比賽,并組織了10屆‘中國智能車未來挑戰(zhàn)賽和2屆‘中國腦-機接口比賽?!编嵞蠈幗榻B道,通過在真實的物理環(huán)境中驗證理論成果,解決實際環(huán)境中復雜認知和智能行為決策等問題,改變了簡單的論文匯總或實驗室成果演示的傳統(tǒng)模式,促進了應用基礎研究與物理可實現(xiàn)系統(tǒng)的結合。
而這也為我國培養(yǎng)和造就了一大批計算機視覺、腦機接口、無人駕駛技術和人工智能等方面的優(yōu)秀中青年人才。鄭南寧說:“尤其是‘中國智能車未來挑戰(zhàn)賽,歷經10年的摸索和實踐,業(yè)已成為中國無人車研發(fā)的重要品牌。
加強學科交叉共融
人類視聽覺認知機理研究是認知科學的重要組成部分,而人類視聽覺信息的機器理解與計算一直是人工智能領域主要的研究內容。可以說,自立項之日起,“視聽覺信息的認知計算”重大研究計劃就帶有明顯的學科交叉屬性,比如信息科學、神經科學、認知心理學、數理科學等學科的交叉。
“我們所談的科學問題普遍性越強,它所牽涉的交叉性就越強。要解決基礎科學問題,必須走學科交叉這條路?!编嵞蠈幗榻B說,該重大研究計劃以“認知計算和腦機接口”和“無人駕駛與智能測試”兩方面為切入點,共部署了5個集成項目,根據承擔集成項目的10個項目組的不完全統(tǒng)計,論文分別發(fā)表在信息科學、認知科學、心理學、神經科學、物理學、生命科學等領域的國際核心學術刊物上,充分體現(xiàn)了多學科交叉的特點和我們研究工作的學術水平。
比如,視覺注意機制是生物視覺的一個重要特性,早期的研究主要集中在心理學、認知科學和神經生理學等領域,上世紀80年代后,這一課題引起了計算機視覺、人工智能等領域學者的重視。該重大研究計劃針對自主式車輛視覺導航的需要,多個課題組對此問題開展了深入的研究,在計算視覺與生物視覺結合方面開展了深入的多學科交叉。
不過,在鄭南寧看來,研究者的學科交叉還有待進一步深入?!耙环矫妫瑢W科交叉取決于學者的熱情,這是根本因素。同時,也要有自上而下的組織。”不過他指出,從實際情況來看,這兩方面都有所不足,“研究者應該更多地去主動思考科學問題背后的學科交叉需求,對于研究中存在的一些急功近利,也需要去改變”。
實際上,不僅解決科學問題需要學科交叉,應對人工智能所帶來的深刻的社會問題,也同樣需要學科交叉?!耙驗槿斯ぶ悄苣:宋锢憩F(xiàn)實、數據和個人的界限,延伸出復雜的倫理、法律和安全問題。人工智能的逐漸普及和深度應用一定會給人們帶來心理的影響,進而產生社會人文風險,這已不是傳統(tǒng)的工程安全方法能夠解決的問題了?!编嵞蠈幷f。
(本文根據鄭南寧院士的公開演講整理而成,未經本人確認。)