付征南
尊敬的委員會主席、資深委員先生以及委員會各位委員,感謝您能邀請我參加今天的聽證會。
我們生活在一個令人眼花繚亂的技術變革時代。發(fā)軔于數(shù)十年前的信息革命,如今正以多種令人驚嘆的方式繼續(xù)向前深入推進。美國是信息技術的第一個推動者。借助上世紀70年代至80年代發(fā)軔的微處理器革命,美國在個人電腦、互聯(lián)網(wǎng)、全球定位系統(tǒng)以及其他基于信息的技術開發(fā)領域,領先了整個世界。如今,信息技術已經(jīng)延伸到了我們生活的每個角落,也擴散到了全世界。盡管美國在信息技術方面仍處于全球領先地位,但其他國家也日益成為我們的重要競爭對手,特別是中國已成為信息技術領域一個快速發(fā)展的主要競爭對手。
作為實力僅次于美國和歐盟的全球第三大經(jīng)濟體,中國擁有許多結構性優(yōu)勢,能夠在信息技術領域成為一個主要競爭對手,特別是中國的人口是這一優(yōu)勢的主要來源,因為人口是人類行為和基因數(shù)據(jù)的潛在源頭,再加上數(shù)據(jù)保護和個人隱私的本土文化態(tài)度,這些數(shù)據(jù)有助于中國加快人工智能與合成生物技術的發(fā)展。
信息革命出現(xiàn)了三大總體發(fā)展趨勢:一是全球數(shù)據(jù)化的日趨明顯;二是網(wǎng)絡化和互聯(lián)互通能力的日益提升;三是機器智能化水平的不斷提高。這些趨勢正以多種強有力的方式,相互交織、相互促進,了解這些趨勢有助于我們理解中國的結構性優(yōu)勢。
一是全球數(shù)據(jù)化的日趨明顯?,F(xiàn)代信息經(jīng)濟每天生產(chǎn)2.5安字節(jié)(Exabyte,譯者注:一個安字節(jié)相當于260字節(jié))的數(shù)據(jù)。過去幾年,信息革命所產(chǎn)生的數(shù)據(jù)超過了人類5000年歷史的數(shù)據(jù)總和。這種數(shù)據(jù)以多種形式出現(xiàn):一是地圖數(shù)據(jù),顯示人類活動的模式和人們活動的地點和內(nèi)容;二是通信數(shù)據(jù),顯示人們活動的網(wǎng)絡和互動的內(nèi)容;三是搜索、購物和娛樂數(shù)據(jù),顯示人們的喜好和興趣;四是日益廉價的基因測序技術,使人類基因數(shù)據(jù)的數(shù)字化日益成為現(xiàn)實。全球數(shù)據(jù)化的趨勢,使我們周圍的世界、我們的生活、我們的身體、我們的喜好正變得日益量化和數(shù)字化。大多數(shù)的數(shù)據(jù)都處于無結構、未標記的狀態(tài),進而形成了一個蘊藏巨大潛在信息的數(shù)據(jù)海洋,因此若能對這些數(shù)據(jù)進行有效分類和組織,就會產(chǎn)生有益的觀點。
美國智庫新美國安全中心主任保羅·斯查瑞。
美國總統(tǒng)特朗普會見中國阿里巴巴集團董事長馬云
二是網(wǎng)絡化與互聯(lián)互通能力。全球網(wǎng)絡化程度正日益提升,使人類有可能傳輸和分享這個由數(shù)字數(shù)據(jù)構成的全新海洋。2017年,全球互聯(lián)網(wǎng)用戶激增到了38億,超過全球人口總和的一半。移動電話用戶數(shù)量接近50億,約占全球人口的三分之二。社會媒體用戶數(shù)量接近30億。全球互聯(lián)互通能力繼續(xù)飛速提升。社會媒體每天新增的用戶數(shù)量,超過100萬。聯(lián)網(wǎng)上線的人越來越多,他們的數(shù)據(jù)也隨之上線入網(wǎng)。他們變得越來越數(shù)字化。人們和公司也通過網(wǎng)絡傳輸來分享這一數(shù)據(jù),而且網(wǎng)絡的數(shù)據(jù)規(guī)模和流量帶寬也在持續(xù)增長。聯(lián)網(wǎng)設施數(shù)量的增長速度,超過了互聯(lián)網(wǎng)用戶。據(jù)估計,2018年全球聯(lián)網(wǎng)設施的數(shù)量就高達200億。物聯(lián)網(wǎng)(IoT)設施包括智能化的電表、醫(yī)療設施、家電和工業(yè)用具,正以最快速度增長,其數(shù)量到2021年預計將超過所有聯(lián)網(wǎng)設施的一半。這些設施產(chǎn)生的數(shù)據(jù),可以通過互聯(lián)網(wǎng)實現(xiàn)共享,僅2018年的每月數(shù)據(jù)流量就高達150艾比特。全球互聯(lián)網(wǎng)數(shù)據(jù)流量以每年24%的速度快速增長,超出了聯(lián)網(wǎng)用戶的增速。隨著數(shù)據(jù)流量的增長,寬帶速度也快速提升,預計未來5年將會增加一倍。不僅只是聯(lián)網(wǎng)人數(shù)、聯(lián)網(wǎng)設施、聯(lián)網(wǎng)數(shù)據(jù)增長迅速,而且流量和流速也在飛速提升。
三是機器智能化水平提升。計算機處理能力的指數(shù)化增長速度,為那些體積更小、性能更強的計算機、平板電腦、智能手機等相關設施提供了有力支撐,使這些趨勢成為現(xiàn)實。過去50年,這一趨勢已經(jīng)形成了一個以計算機之父戈登·摩爾命名的法則——“摩爾定律”,也就是計算機芯片性能大約每兩年增長一倍。近年來,CPU性能的增長速度已經(jīng)有所放緩。盡管仍在以指數(shù)化的速度提升,但是計算機芯片已經(jīng)接近納米級的水平,其增速已經(jīng)大幅放緩。與此同時,過去幾年,機器深度學習技術出現(xiàn)了爆炸式的增長,不僅為人工智能創(chuàng)造了有利條件,也讓目標識別、自然語言處理等人工智能所面臨的長期難題,取得了重大進展。機器深度學習技術是以大量平行計算機處理系統(tǒng)(parallel computer processing)為依托。“平行計算機處理系統(tǒng)”之所以成為現(xiàn)實,就是因為圖形處理器技術(簡稱GPU)在博彩業(yè)和大數(shù)據(jù)的推動下取得了重大進步。在機器深度學習方面,深度神經(jīng)網(wǎng)絡以數(shù)百萬條數(shù)據(jù)為依托,學習如何識別目標、翻譯語言,或者執(zhí)行許多其他認知任務。深度學習系統(tǒng)甚至可以從未標記的數(shù)據(jù)進行學習,這個流程稱之為無監(jiān)督學習。因此,計算機處理器性能日益強大,使我們可以制造一種能夠搜集海量數(shù)據(jù)的巨量設施(myriaddevice),這種設施反過來又可幫助學習機處理和利用海量數(shù)據(jù)。
計算機之父——戈登·摩爾
IBM公司研制的藍色基因/P大規(guī)模平行超級計算機
DARPA的“深綠”系統(tǒng)結構想象圖
信息革命時代,中國人口是一個巨大的結構性優(yōu)勢,因為它可以形成大量數(shù)據(jù)。中國互聯(lián)網(wǎng)用戶已達7.3億,而且隨著國家城市化和網(wǎng)絡化的日益提升,這一數(shù)字還會進一步提升。與西方人相比,中國人更愿意分享自己的數(shù)據(jù),而相關公司則可利用這些數(shù)據(jù),制定更加先進的算法,從而有效了解人類行為。
中國也把充滿活力的私企部門與那些負責計劃和執(zhí)行長遠戰(zhàn)略的政府機構融為一體,以提升中國在核心技術領域的競爭力。近年來,中國依托這種模式執(zhí)行了多項計劃,在人工智能、合成生物學、量子計算等領域取得了重大進步,所有核心技術都與信息革命緊密相關。
中國在人工智能領域已經(jīng)成為全球領導者,實力僅次于美國。百度、騰訊、阿里等中國公司都已經(jīng)成為全球頂級人工智能企業(yè),中國已經(jīng)拉開了人工智能加速發(fā)展的序幕。自2014年以來,在人工智能的重要分支——深度學習領域,中國出版物的數(shù)量和引用率已經(jīng)超過美國。美國在人工智能專利方面仍然處于世界領先地位,但是中國的發(fā)展速度更快。盡管出版物的數(shù)量不一定代表質(zhì)量,但是中國人工智能研究人員在國際競爭方面的表現(xiàn)非常出色。過去2年,中國隊“獨攬”了“圖網(wǎng)”(ImageNet)視覺圖像識別大賽的各項大獎,中國一家創(chuàng)業(yè)公司贏得了美國情報高級計劃局(IARPA)舉辦的“面部識別挑戰(zhàn)獎”??偟膩砜?,中國人工智能研究人員雖然沒有美國同行經(jīng)驗豐富,但是他們也在不斷進步。2017年美國人工智能發(fā)展協(xié)會(AAAI)大會上,中國入選論文的數(shù)量與美國基本齊平。
2017年7月,中國發(fā)布了一份國家人工智能戰(zhàn)略——《新一代人工智能發(fā)展計劃》。按照這一計劃,中國要在2030年左右成為“首要全球人工智能創(chuàng)新中心”。為實現(xiàn)這一目標,中國制定的計劃,是通過重點培養(yǎng)和招募頂級人工智能人才,來彌補人力資本等薄弱領域的短板。
舉一個例子,中國出生、美國受教的人工智能研究人員陸奇最近辭去微軟公司執(zhí)行副總裁的職位,轉(zhuǎn)而出任百度公司的首席執(zhí)行官(現(xiàn)已卸任,但仍任百度副董事長)。新聞報道暗示中國公司將特朗普政府的反移民政策視為吸引美國頂級技術人才的重大機遇,因為移民開辦的創(chuàng)業(yè)公司占美國創(chuàng)業(yè)公司的四分之一。
基于軍民融合模式,中國私企部門人工智能創(chuàng)新成果在國家安全應用領域的轉(zhuǎn)化,也擁有重大優(yōu)勢。在與非傳統(tǒng)軍工企業(yè)合作方面,美國國防部已經(jīng)努力打破了許多自我設置的障礙,此前這些障礙使國防部無法獲取硅谷等地的重大創(chuàng)新成果。而中國政府與私企部門建立了更為緊密的聯(lián)系,更容易依托軍民融合戰(zhàn)略來“孵化”私企部門的創(chuàng)新成果,并將其轉(zhuǎn)為軍用。這意味著中國不僅在人工智能領域已成為一個重要的全球競爭對手,計劃到2030年成為全球領導者,而且中國在私企部門創(chuàng)新成果的國家安全應用轉(zhuǎn)化方面,也具有重大優(yōu)勢。
由成都準星云學公司研制的人工智能“AI-MATHS”參加了我國高考的數(shù)學部分。試驗顯示它比考生更快“做完卷子”,但是成績低于當年的平均分。
信息革命也為生物技術創(chuàng)造了新的機遇,因為計算機使得基因排序測定的成本越來越可接受。人類基因排序測定的成本已呈指數(shù)化的下降趨勢,其速度甚至快于“摩爾定律”。反過來講,人類基因大數(shù)據(jù)集,也具有重大研究潛力,因為這些數(shù)據(jù)集的價值可以通過數(shù)據(jù)分析和人工智能進行充分挖掘,以揭示基因和健康結果之間的相互關系。一家名為“北京基因?qū)W研究所”的中國公司(應為中科院北京基因組研究所),已經(jīng)成為全球最大的基因研究中心。該研究所在美國的坎布里奇也建立了一個研究中心,并對數(shù)百萬美國人的基因排序進行了測定。該研究所得到了中國政府的強力支持,并與軍事醫(yī)學科學院等中國軍方研究機構建立了伙伴關系。
中科院北京基因組研究所。
山東大學生殖醫(yī)學研究中心陳子江教授團隊與中國科學院北京基因組研究所劉江教授團隊等合作研究成果——人類早期胚胎發(fā)育過程中染色質(zhì)開放性的調(diào)控圖譜。
在國家層面,中國政府積極發(fā)展生物技術產(chǎn)業(yè),已經(jīng)制定了多項國家級的生物技術發(fā)展計劃。中國發(fā)展生物技術產(chǎn)業(yè)的戰(zhàn)略之一,就是依托“走出去、請進來”的模式,通過投資外國公司來引進國外創(chuàng)新成果。例如,2013年,北京基因組研究所就通過購買美國公司——“完整基因”的創(chuàng)新成果,獲得了下一代基因排序測定技術。
隨著基因排序測定成本的持續(xù)下降,基因的重要性可能會繼續(xù)增加,而且人類基因數(shù)據(jù)集的不斷擴大,也使人類基因的全面分析日益成為可能。由于基因技術的最終目標是改善生命自身,所以合成生物學與基因技術的長遠潛力,怎么說都不過分。隨著這一領域的日漸成熟,中國非常有可能成為全球領導者。
量子計算是信息相關技術的另一大重要領域,也是中國取得突破性進展的關鍵領域。與目前計算模式相比,量子計算是一種截然不同的計算方法,而且主要是依托量子物理的非常規(guī)特性。量子技術在密碼破譯、遠程傳感、安全通信等國家安全應用領域具有許多潛在價值。中國研究人員近期在量子技術方面已經(jīng)取得重大進步。2017年中國對外展示了一個10-量子比特量子處理器和一個量子通信衛(wèi)星。中國加大國家投入,推進量子技術領域的發(fā)展。近期,中國啟動了“晉安計劃”(Jinan Project),構建安全的量子計算機網(wǎng)絡,并投入100億美元建立國家量子信息科學實驗室。
量子通信具有保密性好的特點,若與現(xiàn)代光傳導技術結合,將大大提升無線電通信技術的性能。圖為我國“墨子”號量子通信試驗衛(wèi)星在軌想象圖。
作為全球第三大經(jīng)濟體和人口最多的國家,中國在高科技競爭領域,具有許多內(nèi)在的結構性優(yōu)勢。中國不僅擁有充滿活力的私企部門,既包括大型企業(yè),也包括創(chuàng)業(yè)公司,而且也有一個大規(guī)模的潛在人才庫可以依托。中國也通過從國外聘請頂尖人才,積極努力改進人力資本質(zhì)量等短板薄弱領域。中國人口網(wǎng)絡化和數(shù)據(jù)化程度的日益提升,已經(jīng)成為潛在數(shù)據(jù)的重要來源,這是信息輔助倉《新的關鍵資源。
與美國相比,中國最大的優(yōu)勢之一就是政府愿意依托關鍵技術領域大規(guī)模、長遠期的投資計劃,實現(xiàn)自身發(fā)展、緊跟時代潮流。中國也在多個技術領域反復對外展現(xiàn)他們能夠通過投資外國公司來獲得外國技術,而后再利用這些技術提升中國本土產(chǎn)業(yè)能力。我們不能低估中國執(zhí)行長遠技術發(fā)展戰(zhàn)略的實力,而且對于中國計劃成為人工智能等關鍵技術領域的全球領導者,我們也不能掉以輕心。