謝更好
自人工智能誕生以來,機器學習作為實現(xiàn)人工智能的途徑,其主要宗旨是:通過研究使用計算機模擬或實現(xiàn)人類學習活動。經(jīng)過幾十年的創(chuàng)新發(fā)展,機器學習不僅在基于知識的系統(tǒng)中得到應用,而且在自然語言理解、非單調(diào)推理、機器視覺、模式識別等許多領域也得到了廣泛應用,越來越受到產(chǎn)業(yè)界的高度重視。隨著大數(shù)據(jù)智能時代到來,2017年國務院印發(fā)了《新一代人工智能發(fā)展規(guī)劃》,明確將機器學習研究布局作為新一代人工智能前沿基礎理論研究主題之一,新一輪智能產(chǎn)業(yè)變革的核心驅動力,重構生產(chǎn)、分配、交換、消費等經(jīng)濟活動各環(huán)節(jié),形成從宏觀到微觀各領域的智能化新技術。在這一背景下,如何探索大數(shù)據(jù)機器學習理論,突破多模態(tài)龐大異構數(shù)據(jù)深度理解瓶頸,更高效地從雜亂無章數(shù)據(jù)中自動生成高價值知識,成為當前機器學習領域研究的前沿主題。
為解決這一問題,中國科學院自動化研究所王軍平研究員經(jīng)過長期研究,基于系統(tǒng)運籌優(yōu)化、物理啟發(fā)式計算和超圖理論,提出了大數(shù)據(jù)機器自動學習理論與方法。其本質(zhì)從海量多模態(tài)高速數(shù)據(jù)流中,自動構建特征工程、自動選擇模型函數(shù)、超參數(shù)自優(yōu)化、模型進化結構搜索和自評估等機器自動學習方法體系,成功彌補現(xiàn)有大數(shù)據(jù)平臺“有海量數(shù)據(jù),無行業(yè)知識,無決策模型”的局面。他完美刻畫了多模態(tài)海量數(shù)據(jù)中蘊含的復雜系統(tǒng)運行演化規(guī)律,構建了系統(tǒng)動力學模型,如非線性、涌現(xiàn)、自發(fā)秩序、適應性以及反饋回路等。他還利用已知運行規(guī)律模型以更加簡潔、富有洞察力的方式自動涌現(xiàn)出新數(shù)據(jù)蘊藏知識,開辟了數(shù)據(jù)驅動復雜系統(tǒng)腦網(wǎng)絡認知學習新思路。通過多年對該領域的不懈探索,將已取得研究成果廣泛應用于石油化工生產(chǎn)指揮、汽車傳動系統(tǒng)管控、水電開發(fā)電站調(diào)度等復雜系統(tǒng)描述、綜合診斷、科學決策過程中。在科學研究中,王軍平始終堅持將自己的科學研究成果扎根于社會所需、人民所需,服務于國家前沿戰(zhàn)略技術落地。
興趣啟蒙,展開顛覆性的理論探索
1980年,在美國的卡內(nèi)基梅隆大學(CMU)召開的第一屆機器學習國際研討會上,西蒙(Simon)等20多位人工智能專家創(chuàng)辦了國際性雜志《機器學習》(Machine Learning),標志著機器學習研究已在全世界興起。王軍平在美國斯坦福大學留學期間,有幸加入了克里斯托弗·曼寧(Christopher Manning)研究團隊,參與了多語種自然語言處理項目開發(fā)和理論研究,從此與機器學習結下了不解之緣。他意識到計算機的優(yōu)勢就在于通過數(shù)學來描繪美好世界,機器學習是打開人類與機器交互的一把金鑰匙。在他看來,當全球已開啟人工智能2.0時代,機器學習特別是大數(shù)據(jù)機器學習作為人工智能領域重要基石,已成為智能產(chǎn)業(yè)蓬勃發(fā)展的新引擎。
2010年,王軍平通過系統(tǒng)科學論證,認為將圖模型知識表示優(yōu)勢和強化學習類人決策優(yōu)勢相結合,特別適合大數(shù)據(jù)環(huán)境中各類復雜任務感知與理解,形成了事理演化圖表示、多主體元級協(xié)同管控方法、博弈推斷分析等大數(shù)據(jù)機器學習理論體系,并廣泛應用于復雜網(wǎng)絡空間描述、建模和預測分析,如拓撲結構表征學習、多粒度關聯(lián)超參數(shù)優(yōu)化、小世界網(wǎng)絡演變模型構造、網(wǎng)絡非線性動力學擴張等。
2012年,王軍平作為課題負責人,參與了科技部“863計劃”項目“復雜網(wǎng)絡群體交互自動建模關鍵技術研究”,將分布式強化表示學習新理論創(chuàng)新應用到數(shù)億級網(wǎng)絡用戶動態(tài)交互龐大復雜系統(tǒng)自動建模、預測模型自動選擇、群體交互結構自動搜索和參數(shù)自動優(yōu)化、高維刻畫應用當中,精確標注電話通信網(wǎng)絡交互拓撲結構,用戶分布、交互頻率等主題。隨著我國電信網(wǎng)絡詐騙事件愈演愈烈,其與高利貸、網(wǎng)絡傳銷和非法集資等惡性犯罪事件交織在一起,嚴重危害公共安全體系。王軍平將自己的研究成果率先應用到國家有關部門網(wǎng)絡電話反詐騙系統(tǒng),主動預測準確率92%左右,并在2017年“砥礪奮進的五年”大型成就展展出。2018年,王軍平提出了“面向電信用戶群體交互大數(shù)據(jù)的事件線索在線涌現(xiàn)與預判研究”理論方法,獲得了國家自然基金委面上項目資助,逐步形成了大數(shù)據(jù)事理演化自動表示、線索結構自動搜索和風險主動預判模型為核心的大數(shù)據(jù)機器自動學習方法體系。
步履不停,助力中國制造產(chǎn)業(yè)智能化發(fā)展
科研人一直在探索的道路上,永不止息。在王軍平看來,科學研究從不受時間、環(huán)境以及地域的限制,而發(fā)自心底的熱愛,就是支撐他在科學研究領域篤行無悔的初心和動力。
2014年2月,王軍平來到了中國科學院自動化研究所這一平臺從事科研工作。在“人工智能與實體經(jīng)濟深度融合”的背景下,他受邀請參與到國家工業(yè)智能戰(zhàn)略技術研究組,探索現(xiàn)有智能制造模式,人工智能如何解決當前制造產(chǎn)業(yè)升級轉型過程提質(zhì)增效、降本等問題。為響應習總書記提出的“廣大科技工作者要把論文寫在祖國的大地上,把科技成果應用在實現(xiàn)現(xiàn)代化的偉大事業(yè)中”號召,王軍平系統(tǒng)調(diào)研了中石油、中海油、一汽大眾、北汽福田等知名制造企業(yè),認為智能制造是由若干人-機器-企業(yè)之間相互關聯(lián)和相互作用而形成的具有特定功能的巨系統(tǒng)。如何將人-機器-企業(yè)在有規(guī)則或不確定動態(tài)環(huán)境中相互作用產(chǎn)生的大數(shù)據(jù)高效自動轉化成科學決策知識,即全生命周期知識自動化、系統(tǒng)決策優(yōu)化,已成為制造行業(yè)智能化發(fā)展的最大技術瓶頸。
以深度學習為代表的機器學習的發(fā)展方興未艾,尤其是在圖像分類、語音識別等特定領域研究,取得了很大的突破,被廣泛應用到產(chǎn)品缺陷檢測、工業(yè)視覺檢測等環(huán)節(jié)。但現(xiàn)有的深度神經(jīng)網(wǎng)絡技術僅是對生物神經(jīng)系統(tǒng)的初級模擬,功能大多局限于感知與理解層面,難以在復雜時變、不確定動態(tài)大數(shù)據(jù)環(huán)境中高效地獲取知識。大數(shù)據(jù)機器自動學習,被王軍平研究團隊認為是可以實現(xiàn)數(shù)據(jù)驅動制造全過程自動化顛覆式變革發(fā)展的方法理論。在他們看來,未來制造企業(yè)的重要任務不僅要在物理世界、人類社會空間中完成,更重要的工作都是在虛擬信息空間中完成。不容忽略,構建基于大數(shù)據(jù)機器自動學習的三元空間“感知-決策-執(zhí)行”閉環(huán)管控大腦成為未來奮斗方向。
結合之前的研究經(jīng)驗,2019年,王軍平團隊先后跟中海油服務股份有限公司、龍蟒佰利聯(lián)集團股份有限公司等單位聯(lián)合承擔了“工業(yè)互聯(lián)網(wǎng)網(wǎng)絡化能耗管理平臺”“面向海上油氣勘探生產(chǎn)的工業(yè)互聯(lián)網(wǎng)網(wǎng)絡化應用創(chuàng)新平臺建設”,全力推進大數(shù)據(jù)機器自動學習技術賦能制造企業(yè)的工藝數(shù)字化、預測性制造、節(jié)能減排和精益管理等方法體系智能化升級轉型,打造三元空間“感知-決策-執(zhí)行”閉環(huán)管控工業(yè)大腦系統(tǒng)。如今,國家的制造產(chǎn)業(yè)仍然有成本高、利潤低、生產(chǎn)效率周期長導致交付無保障、決策沒依據(jù)的困境。王軍平還將與團隊成員們?nèi)ν七M相關標準的制定,幫助制造企業(yè)的軟件開發(fā)商來突破現(xiàn)有的技術瓶頸,以提升企業(yè)產(chǎn)品的經(jīng)濟及社會效益。
科研之路漫漫。在王軍平看來,未來的人工智能領域還有一個需要攀越的點,那就是——知識自動化表示。而目前的知識圖譜表示大多都是靜態(tài)的,需要依賴專家經(jīng)驗指導,然而復雜系統(tǒng)觀測數(shù)據(jù)是由不確定環(huán)境動態(tài)演化的,由于不確定性,復雜動態(tài)系統(tǒng)中一般含有各種反饋回路,其觀測數(shù)據(jù)的性質(zhì)往往是由復雜非線性動力學方程所決定的,因此它們遠不滿足獨立性與平穩(wěn)性等經(jīng)典統(tǒng)計假設。“在大數(shù)據(jù)機器自動學習研究中,我們無法回避基于這類復雜數(shù)據(jù)的算法分析和反饋利用。”王軍平說。
前路任重而道遠。王軍平表示,未來他和研究團隊還將時刻保持著對科研方向的初心,在這一領域中繼續(xù)奮斗。哪怕當前自己所處的研究領域是個“冷灶”,也要用自己的專注和熱情將其燒成“熱灶”。
為國為社會而研,王軍平仍將在科研道路上不遺余力。