耄耋之年的他,說話邏輯清晰、思維敏捷,輸出觀點快而密。說不到兩句,你就能感受到從他身上彌漫過來的強大自信。他就是張鈸,中國人工智能領(lǐng)域的奠基人之一,他的四代學(xué)生組成了中國最具代表性的一支AI隊伍——“清華代表隊”,其中一些人已成為國內(nèi)大模型建設(shè)的重要力量。
1978年,清華大學(xué)進行部分院系調(diào)整,張鈸所在的電子系(原自動控制系)改為計算機技術(shù)與應(yīng)用系,系中原來從事自動控制研究的老師面臨兩個選擇:待在計算機系,或去新成立的自動化系。他選擇了前者。
很多老師勸他:國家未來要大力發(fā)展工業(yè),自動化是最有前景的方向之一。張鈸回憶,“有人說,你把已有的知識都丟掉了,還剩什么?我說,還剩一個腦袋?!?/p>
帶著“唯一的腦袋”留在計算機系,張鈸遇到的第一個任務(wù)是尋找有潛力的新方向。他翻閱國外學(xué)術(shù)期刊,發(fā)現(xiàn)美國很多大學(xué)的計算機系里都有一個方向:人工智能。
“當時,對于人工智能是什么,我也不是特別清楚,但它對我有極強的吸引力,因為這個領(lǐng)域里充滿了大量的未知。AI在國際上剛發(fā)展了約20年,很多原理都說不清,這恰恰是我的用武之地,如果問題都解決了,還需要我干什么?”張鈸說。
數(shù)學(xué)是張鈸最拿手的學(xué)科。閱讀大量人工智能文獻后,他敏銳地發(fā)現(xiàn):多數(shù)AI研究中沒有使用任何數(shù)學(xué)工具,這意味著,很多還未解決的問題有機會用數(shù)學(xué)辦法解決。
1980年,作為改革開放后的首批出國訪問學(xué)者之一,張鈸來到美國伊利諾伊大學(xué)香檳分校進修。從1978年暑期起,他就開始研究機器人運動規(guī)律,他出國第二年,就與在安徽大學(xué)任教的弟弟張鈴?fù)冻鲋袊鳤I領(lǐng)域的第一篇論文。此時,距離他決心轉(zhuǎn)戰(zhàn)AI還不到三年。
張鈸成為國際上第一批提出用數(shù)學(xué)模型解決AI問題的學(xué)者之一。
2002年,袁進輝還在西安電子科技大學(xué)計算機系讀大三,成績年級第一,想申請清華直博,當時,張鈸是清華計算機系唯一的中國科學(xué)院院士。
此前,袁進輝已讀過張鈸和張鈴共同撰寫的一本關(guān)于人工神經(jīng)網(wǎng)絡(luò)的專著。該書出版于20世紀90年代,那時人工神經(jīng)網(wǎng)絡(luò)是AI里很小眾的領(lǐng)域。
早期的人工神經(jīng)網(wǎng)絡(luò)只是淺層神經(jīng)網(wǎng)絡(luò),難以解決稍微復(fù)雜的現(xiàn)實問題。于是,連接主義起步不久就陷入低谷,只有少數(shù)人認定這條路是正確的,其中就包括張鈸。
2012年,以深度神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的深度學(xué)習(xí)徹底出圈。與早期的神經(jīng)網(wǎng)絡(luò)相比,深度神經(jīng)網(wǎng)絡(luò)“把深度加深了”,即中間的網(wǎng)絡(luò)層數(shù)變多之后,性能發(fā)生了重大變化,只需輸入大量的原始數(shù)據(jù),就可以“自學(xué)成才”。張鈸最初感到興奮,但隨后開始思考:深度學(xué)習(xí)的邊界在哪兒?
清華大學(xué)計算機科學(xué)與技術(shù)系教授、人工智能研究院副院長朱軍是張鈸的學(xué)生?!?013年前后,正是深度學(xué)習(xí)最熱的時候,很多激進的觀點認為,AI三五年內(nèi)就可能在自動駕駛等復(fù)雜場景量產(chǎn),但張鈸是國內(nèi)最早公開談?wù)撋疃壬窠?jīng)網(wǎng)絡(luò)存在缺陷的專家之一?!敝燔娬f,此時,張鈸快80歲了。
深度學(xué)習(xí)的一個關(guān)鍵弱點是容易被欺騙。張鈸團隊發(fā)現(xiàn),深度神經(jīng)網(wǎng)絡(luò)的圖像識別很脆弱。一張以雪山為背景的圖片,只要加入一點“噪聲”,“自學(xué)”之后的AI就會將其識別成一條狗。這一問題絕非“雪山還是狗”這么簡單,而是指向一個困擾張鈸多年的更大難題:深度學(xué)習(xí)往何處去?
2022年11月30日,ChatGPT正式亮相。此前,人們根本無法想象AI模型可以變得如此強大。“絕大多數(shù)AI研究者感到非常震驚?!睆堚撜f。
袁進輝指出,ChatGPT的誕生讓人工智能進入截然不同的發(fā)展階段。模型變大后,人們突然發(fā)現(xiàn),過去多少年解決不了的問題可以用統(tǒng)一的方法搞定?!斑@是一次工業(yè)革命級的技術(shù)革命。”
張鈸說,多數(shù)人理解ChatGPT就是“大數(shù)據(jù)+深度學(xué)習(xí)”,其實它真正的突破,首先在自然語言文本上。ChatGPT不是像第二代AI那樣,簡單地把文本作為數(shù)據(jù)來處理,而是把文本當成知識(內(nèi)容)來處理?!爸挥挟敊C器可以從大量的數(shù)據(jù)中獲取到知識,真正的轉(zhuǎn)變才會發(fā)生。所以,ChatGPT能力的強大源自兩點:一是大模型;二是大文本?!?/p>
可以說,ChatGPT是張鈸預(yù)測中的第三代人工智能的雛形,但還遠遠不夠。
迄今為止,人類一直通過模擬的方式讓機器的行為與人類相似,但大模型還是一個“黑匣子”,這正是張鈸認為AI理論下一步可能突破的地方。
在張鈸的倡議下,2018年,清華大學(xué)成立人工智能研究院基礎(chǔ)理論研究中心,朱軍為研究中心主任。
在張鈸看來,中國學(xué)生解決問題的能力很強,但提出問題的能力不足。因此,在培養(yǎng)學(xué)生時,張鈸格外重視訓(xùn)練學(xué)生“提出問題的能力”。
袁進輝2003年起跟隨張鈸讀博,不像有的導(dǎo)師會出于“更容易出成果”或“項目有需要”等原因給學(xué)生指定博士選題,張鈸總是讓學(xué)生自己找題,鼓勵大家自主探索無人區(qū)。
AI領(lǐng)域最激烈的變化就集中在短短十幾年內(nèi),這一切都發(fā)生在張鈸77歲之后。朱軍說,張鈸自我要求極高,有強烈的好奇心與求知欲,快90歲時每天還在看國外最新的論文?!八俏乙娺^的學(xué)習(xí)能力最不可思議的人之一。最前沿的模型,他玩得比我們還溜?!?/p>
(摘自《中國新聞周刊》)