付于洋
谷歌云首席科學(xué)家、谷歌AI中國(guó)中心負(fù)責(zé)人李飛飛在理工學(xué)科浸淫了20多年,人們習(xí)慣把她當(dāng)作科研人員,往往忽略了她還是個(gè)感性的女人。
這位人工智能領(lǐng)域的頂級(jí)女科學(xué)家卻說(shuō),作為搞技術(shù)的人,要記住love才是最強(qiáng)大的力量一樣。
1
李飛飛一直在從事提高 STEM(科學(xué)、技術(shù)、工程和數(shù)學(xué))領(lǐng)域女性占比的活動(dòng),比如發(fā)起針對(duì)高中女生的科學(xué)夏令營(yíng);在TED演講時(shí)用三歲兒子的照片做圖像識(shí)別的例子,“他的T恤是他最喜歡的,他爸爸從悉尼出差帶回來(lái)的;面前的蛋糕是復(fù)活節(jié)特制……”,會(huì)說(shuō),“想像我的兒子會(huì)生活在一個(gè)什么樣的世界”;還能在CV(計(jì)算機(jī)視覺(jué))界盛會(huì)上當(dāng)著眾人跟老公深情熱吻。
她老公Silvio Savarese也是斯坦福大學(xué)計(jì)算機(jī)科學(xué)系副教授,最近全職加入了林元慶的創(chuàng)業(yè)項(xiàng)目Aibee。
林元慶、余凱和張潼都是ImageNet 2010年的優(yōu)勝者,李飛飛是ImageNet的發(fā)起人。
ImageNet是目前世界上圖像識(shí)別最大的數(shù)據(jù)庫(kù)。每年舉辦的ImageNet競(jìng)賽是CV領(lǐng)域的重磅賽事。
2007年初,李飛飛啟動(dòng)該項(xiàng)目,給每個(gè)單詞配以多個(gè)圖片,從而構(gòu)建一個(gè)龐大的數(shù)據(jù)集。2009年,數(shù)據(jù)集完成,包含1400多萬(wàn)張圖片,1000個(gè)類別,比如“哺乳動(dòng)物”“機(jī)車”和“家具”等。
2
去年1月,李飛飛在北京參加未來(lái)論壇2017年會(huì)時(shí),跟ImageNet的另一個(gè)發(fā)起人普林斯頓大學(xué)講席教授李凱同臺(tái)。
品玩作者跟了李飛飛一天,在《人工智能明星科學(xué)家李飛飛在北京的一天》一文里記錄了兩個(gè)很有意思的細(xì)節(jié)。
一個(gè)細(xì)節(jié)是她忙得都沒(méi)時(shí)間吃最愛(ài)的川菜剁椒魚(yú)頭。
誠(chéng)然剁椒魚(yú)頭該是湘菜,但出生在北京的李飛飛確實(shí)是在四川長(zhǎng)大的,就讀過(guò)成都七中。
這個(gè)學(xué)校出過(guò)不少創(chuàng)業(yè)人才,騰訊COO任宇昕、B站董事長(zhǎng)陳睿、好大夫在線聯(lián)合創(chuàng)始人羅丹……現(xiàn)在風(fēng)頭正勁的是李飛飛小兩級(jí)的學(xué)弟,搜狗的王小川。
王小川后來(lái)保送清華,做了20多年五道口守門(mén)員?,F(xiàn)在搜狗講起AI故事,不知道他是不是要更認(rèn)真地守好清華的門(mén)了,畢竟現(xiàn)在國(guó)內(nèi)AI領(lǐng)域,校招人才首出清華無(wú)二。
清華相關(guān)專業(yè)畢業(yè)生每年百余人,企業(yè)們搶人難。
去年年底,谷歌正式宣布在北京成立谷歌AI中國(guó)中心,表示在中國(guó)地區(qū)招聘AI人才數(shù)量不設(shè)限,該中心由李飛飛和李佳領(lǐng)導(dǎo),16歲移民美國(guó)的李飛飛說(shuō):“我的心一直牽掛著這里?!?/p>
回到去年年初,在2017 年 1 月 3 日起正式擔(dān)任 Google Cloud 首席科學(xué)家的10天后,李飛飛就來(lái)到了北京。
那天的另一個(gè)細(xì)節(jié)是,公開(kāi)演講結(jié)束后她被團(tuán)團(tuán)圍住,人們爭(zhēng)相與之合影、加微信、換名片,因?yàn)樘^(guò)擁擠,有工作人員、觀眾和顯示器連帶被擠倒。
這樣火熱又混亂的場(chǎng)面讓作者在文章開(kāi)頭用紅字加粗感嘆:“李飛飛”三個(gè)字必然會(huì)在接下來(lái)一段時(shí)間頻繁地出現(xiàn)在中國(guó)的媒體和網(wǎng)絡(luò)上,這段時(shí)間的長(zhǎng)短,取決于人工智能在中國(guó)能火多久。
3
知乎上有用戶說(shuō),沒(méi)有Hinton(Geoffrey Hinton,杰弗里·辛頓)和李飛飛就沒(méi)有今天的深度學(xué)習(xí)。
這個(gè)說(shuō)法立馬引起評(píng)論里一片爭(zhēng)議,學(xué)術(shù)界的口水比娛樂(lè)圈少不了多少,質(zhì)疑李飛飛的有,質(zhì)疑辛頓的,沒(méi)有。
2009年,李飛飛和團(tuán)隊(duì)發(fā)布ImageNet的論文和數(shù)據(jù)集后,并沒(méi)有在外界引起太大反響,那時(shí)候深度學(xué)習(xí)在AI界還處于相對(duì)邊緣的位置。
到2012年,多倫多大學(xué)的杰弗里·辛頓和他的學(xué)生使用了一種深度卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)(簡(jiǎn)稱“CNN”),成績(jī)比第二名高出41%。
至此,深度學(xué)習(xí)名聲大噪,重獲生機(jī),整個(gè)AI領(lǐng)域都為之側(cè)目。一直到2014年,所有競(jìng)賽高分者的研究領(lǐng)域都是深度神經(jīng)網(wǎng)絡(luò)。
辛頓在2012年奪冠時(shí)已經(jīng)65歲,從60年代還是高中生時(shí),他就對(duì)腦科學(xué)產(chǎn)生興趣,在愛(ài)丁堡大學(xué)讀研時(shí),他把AI作為自己的博士研究方向。
那是1970年,神經(jīng)網(wǎng)絡(luò)的第一個(gè)寒冬。
1969年,是年圖靈獎(jiǎng)得主馬文·明斯基(Marvin Minsky)和西蒙·派珀特(Seymour Papert)出版新書(shū)《感知器:計(jì)算幾何簡(jiǎn)介》,指出神經(jīng)網(wǎng)絡(luò)技術(shù)的局限性,這是明斯基與感知器模型提出者康內(nèi)爾大學(xué)教授弗蘭克·羅森布拉特(Frank Rosenblatt)長(zhǎng)期論戰(zhàn)的一部分,后者是神經(jīng)網(wǎng)絡(luò)的忠實(shí)擁堵。這本書(shū)直接導(dǎo)致了該研究將近二十年的低潮。
選擇不被看好的領(lǐng)域讓辛頓備受質(zhì)疑,有朋友認(rèn)為他是把時(shí)間花在無(wú)用之物上,他沒(méi)有在畢業(yè)后找到全職的學(xué)術(shù)工作。
1986年,辛頓和大衛(wèi)·魯姆哈特(David Rumelhart)發(fā)表了關(guān)于反向傳播算法的論文,使用了該算法的神經(jīng)網(wǎng)絡(luò),避免了傳統(tǒng)感知器帶來(lái)的龐大計(jì)算量問(wèn)題,在做簡(jiǎn)單工作時(shí),效率比之大幅提升。
80年代末的算力也隨著摩爾定律爬升,神經(jīng)網(wǎng)絡(luò)短暫回春。
辛頓的博士后楊立昆(Yann Lecun)1989年發(fā)表論文,后又把一種卷積神經(jīng)網(wǎng)絡(luò)用于讀取銀行支票上的手寫(xiě)數(shù)字,這個(gè)支票識(shí)別系統(tǒng)在九十年代末占據(jù)了美國(guó)接近 20%的市場(chǎng)。
而楊立昆在貝爾實(shí)驗(yàn)室的同事弗拉基米爾·萬(wàn)普尼克(Vladmir Vapnik),是支持向量機(jī) (SVM) 算法的提出者。這種分類算法在90年代不斷進(jìn)步,其表現(xiàn)遠(yuǎn)超同期的傳統(tǒng)神經(jīng)網(wǎng)絡(luò)算法,備受學(xué)界關(guān)注。
隨著SVM的上升,90年代末,神經(jīng)網(wǎng)絡(luò)再次進(jìn)入寒冬。只要論文中出現(xiàn)“神經(jīng)網(wǎng)絡(luò)”這個(gè)邊緣研究的字眼,被拒就成了家常便飯。
2006年,辛頓等人發(fā)表論文,A fast learning algorithm for deep belief nets,這個(gè)人工神經(jīng)網(wǎng)絡(luò)被冠以新名稱——深度學(xué)習(xí)。
等到2012年,團(tuán)隊(duì)在ImageNet挑戰(zhàn)賽奪冠,證明了基于大量數(shù)據(jù)學(xué)習(xí)的深度學(xué)習(xí)能帶來(lái)超越以往的圖片識(shí)別準(zhǔn)確度;2016年,AlphaGo與李世石一戰(zhàn)后,深度學(xué)習(xí)不再是流行于學(xué)術(shù)界的詞匯,在全球變得人盡皆知。
90年代末深度學(xué)習(xí)的低谷期,辛頓、楊立昆和約書(shū)亞·本吉奧(Yoshua Bengio)——現(xiàn)在國(guó)內(nèi)媒體口中的“深度學(xué)習(xí)三巨頭”密謀神經(jīng)網(wǎng)絡(luò)的復(fù)興,2004年,Hinton創(chuàng)立了NCAP(神經(jīng)計(jì)算和自適應(yīng)感知)項(xiàng)目。
楊立昆現(xiàn)在是Facebook人工智能實(shí)驗(yàn)室負(fù)責(zé)人;NCAP成員Terry Sejnowski幫助奧巴馬實(shí)施他斥資1億美元的“腦計(jì)劃”;斯坦福大學(xué)教授吳恩達(dá)在2011年參與創(chuàng)建了谷歌大腦,其最知名的貓臉識(shí)別“Google Cat”項(xiàng)目,是和辛頓團(tuán)隊(duì)共同研究的成果。在1.6萬(wàn)個(gè)CPU核心上利用深度學(xué)習(xí)算法學(xué)習(xí)到的10億參數(shù)的神經(jīng)網(wǎng)絡(luò),能夠在沒(méi)有任何先驗(yàn)知識(shí)的情況下,僅僅通過(guò)觀看無(wú)標(biāo)注的YouTube的視頻學(xué)習(xí)到識(shí)別高級(jí)別的概念;2013年,辛頓團(tuán)隊(duì)加入谷歌。
吳恩達(dá)2014年被挖到了百度,去年3月離職創(chuàng)業(yè),在創(chuàng)業(yè)項(xiàng)目 Deeplearning.ai的深度學(xué)習(xí)系列課程里,他還跟老朋友辛頓做了場(chǎng)對(duì)話。
當(dāng)李飛飛在未來(lái)論壇2017年會(huì)上跟李凱、沈向洋、張鈸做圓桌對(duì)話時(shí),吳恩達(dá)坐在她后面當(dāng)聽(tīng)眾。中國(guó)是吳恩達(dá)暫時(shí)撤離的戰(zhàn)場(chǎng),現(xiàn)在輪到他在斯坦福和谷歌的前同事李飛飛了。