付于洋
谷歌云首席科學家、谷歌AI中國中心負責人李飛飛在理工學科浸淫了20多年,人們習慣把她當作科研人員,往往忽略了她還是個感性的女人。
這位人工智能領(lǐng)域的頂級女科學家卻說,作為搞技術(shù)的人,要記住love才是最強大的力量一樣。
1
李飛飛一直在從事提高 STEM(科學、技術(shù)、工程和數(shù)學)領(lǐng)域女性占比的活動,比如發(fā)起針對高中女生的科學夏令營;在TED演講時用三歲兒子的照片做圖像識別的例子,“他的T恤是他最喜歡的,他爸爸從悉尼出差帶回來的;面前的蛋糕是復活節(jié)特制……”,會說,“想像我的兒子會生活在一個什么樣的世界”;還能在CV(計算機視覺)界盛會上當著眾人跟老公深情熱吻。
她老公Silvio Savarese也是斯坦福大學計算機科學系副教授,最近全職加入了林元慶的創(chuàng)業(yè)項目Aibee。
林元慶、余凱和張潼都是ImageNet 2010年的優(yōu)勝者,李飛飛是ImageNet的發(fā)起人。
ImageNet是目前世界上圖像識別最大的數(shù)據(jù)庫。每年舉辦的ImageNet競賽是CV領(lǐng)域的重磅賽事。
2007年初,李飛飛啟動該項目,給每個單詞配以多個圖片,從而構(gòu)建一個龐大的數(shù)據(jù)集。2009年,數(shù)據(jù)集完成,包含1400多萬張圖片,1000個類別,比如“哺乳動物”“機車”和“家具”等。
2
去年1月,李飛飛在北京參加未來論壇2017年會時,跟ImageNet的另一個發(fā)起人普林斯頓大學講席教授李凱同臺。
品玩作者跟了李飛飛一天,在《人工智能明星科學家李飛飛在北京的一天》一文里記錄了兩個很有意思的細節(jié)。
一個細節(jié)是她忙得都沒時間吃最愛的川菜剁椒魚頭。
誠然剁椒魚頭該是湘菜,但出生在北京的李飛飛確實是在四川長大的,就讀過成都七中。
這個學校出過不少創(chuàng)業(yè)人才,騰訊COO任宇昕、B站董事長陳睿、好大夫在線聯(lián)合創(chuàng)始人羅丹……現(xiàn)在風頭正勁的是李飛飛小兩級的學弟,搜狗的王小川。
王小川后來保送清華,做了20多年五道口守門員。現(xiàn)在搜狗講起AI故事,不知道他是不是要更認真地守好清華的門了,畢竟現(xiàn)在國內(nèi)AI領(lǐng)域,校招人才首出清華無二。
清華相關(guān)專業(yè)畢業(yè)生每年百余人,企業(yè)們搶人難。
去年年底,谷歌正式宣布在北京成立谷歌AI中國中心,表示在中國地區(qū)招聘AI人才數(shù)量不設限,該中心由李飛飛和李佳領(lǐng)導,16歲移民美國的李飛飛說:“我的心一直牽掛著這里?!?/p>
回到去年年初,在2017 年 1 月 3 日起正式擔任 Google Cloud 首席科學家的10天后,李飛飛就來到了北京。
那天的另一個細節(jié)是,公開演講結(jié)束后她被團團圍住,人們爭相與之合影、加微信、換名片,因為太過擁擠,有工作人員、觀眾和顯示器連帶被擠倒。
這樣火熱又混亂的場面讓作者在文章開頭用紅字加粗感嘆:“李飛飛”三個字必然會在接下來一段時間頻繁地出現(xiàn)在中國的媒體和網(wǎng)絡上,這段時間的長短,取決于人工智能在中國能火多久。
3
知乎上有用戶說,沒有Hinton(Geoffrey Hinton,杰弗里·辛頓)和李飛飛就沒有今天的深度學習。
這個說法立馬引起評論里一片爭議,學術(shù)界的口水比娛樂圈少不了多少,質(zhì)疑李飛飛的有,質(zhì)疑辛頓的,沒有。
2009年,李飛飛和團隊發(fā)布ImageNet的論文和數(shù)據(jù)集后,并沒有在外界引起太大反響,那時候深度學習在AI界還處于相對邊緣的位置。
到2012年,多倫多大學的杰弗里·辛頓和他的學生使用了一種深度卷積神經(jīng)網(wǎng)絡結(jié)構(gòu)(簡稱“CNN”),成績比第二名高出41%。
至此,深度學習名聲大噪,重獲生機,整個AI領(lǐng)域都為之側(cè)目。一直到2014年,所有競賽高分者的研究領(lǐng)域都是深度神經(jīng)網(wǎng)絡。
辛頓在2012年奪冠時已經(jīng)65歲,從60年代還是高中生時,他就對腦科學產(chǎn)生興趣,在愛丁堡大學讀研時,他把AI作為自己的博士研究方向。
那是1970年,神經(jīng)網(wǎng)絡的第一個寒冬。
1969年,是年圖靈獎得主馬文·明斯基(Marvin Minsky)和西蒙·派珀特(Seymour Papert)出版新書《感知器:計算幾何簡介》,指出神經(jīng)網(wǎng)絡技術(shù)的局限性,這是明斯基與感知器模型提出者康內(nèi)爾大學教授弗蘭克·羅森布拉特(Frank Rosenblatt)長期論戰(zhàn)的一部分,后者是神經(jīng)網(wǎng)絡的忠實擁堵。這本書直接導致了該研究將近二十年的低潮。
選擇不被看好的領(lǐng)域讓辛頓備受質(zhì)疑,有朋友認為他是把時間花在無用之物上,他沒有在畢業(yè)后找到全職的學術(shù)工作。
1986年,辛頓和大衛(wèi)·魯姆哈特(David Rumelhart)發(fā)表了關(guān)于反向傳播算法的論文,使用了該算法的神經(jīng)網(wǎng)絡,避免了傳統(tǒng)感知器帶來的龐大計算量問題,在做簡單工作時,效率比之大幅提升。
80年代末的算力也隨著摩爾定律爬升,神經(jīng)網(wǎng)絡短暫回春。
辛頓的博士后楊立昆(Yann Lecun)1989年發(fā)表論文,后又把一種卷積神經(jīng)網(wǎng)絡用于讀取銀行支票上的手寫數(shù)字,這個支票識別系統(tǒng)在九十年代末占據(jù)了美國接近 20%的市場。
而楊立昆在貝爾實驗室的同事弗拉基米爾·萬普尼克(Vladmir Vapnik),是支持向量機 (SVM) 算法的提出者。這種分類算法在90年代不斷進步,其表現(xiàn)遠超同期的傳統(tǒng)神經(jīng)網(wǎng)絡算法,備受學界關(guān)注。
隨著SVM的上升,90年代末,神經(jīng)網(wǎng)絡再次進入寒冬。只要論文中出現(xiàn)“神經(jīng)網(wǎng)絡”這個邊緣研究的字眼,被拒就成了家常便飯。
2006年,辛頓等人發(fā)表論文,A fast learning algorithm for deep belief nets,這個人工神經(jīng)網(wǎng)絡被冠以新名稱——深度學習。
等到2012年,團隊在ImageNet挑戰(zhàn)賽奪冠,證明了基于大量數(shù)據(jù)學習的深度學習能帶來超越以往的圖片識別準確度;2016年,AlphaGo與李世石一戰(zhàn)后,深度學習不再是流行于學術(shù)界的詞匯,在全球變得人盡皆知。
90年代末深度學習的低谷期,辛頓、楊立昆和約書亞·本吉奧(Yoshua Bengio)——現(xiàn)在國內(nèi)媒體口中的“深度學習三巨頭”密謀神經(jīng)網(wǎng)絡的復興,2004年,Hinton創(chuàng)立了NCAP(神經(jīng)計算和自適應感知)項目。
楊立昆現(xiàn)在是Facebook人工智能實驗室負責人;NCAP成員Terry Sejnowski幫助奧巴馬實施他斥資1億美元的“腦計劃”;斯坦福大學教授吳恩達在2011年參與創(chuàng)建了谷歌大腦,其最知名的貓臉識別“Google Cat”項目,是和辛頓團隊共同研究的成果。在1.6萬個CPU核心上利用深度學習算法學習到的10億參數(shù)的神經(jīng)網(wǎng)絡,能夠在沒有任何先驗知識的情況下,僅僅通過觀看無標注的YouTube的視頻學習到識別高級別的概念;2013年,辛頓團隊加入谷歌。
吳恩達2014年被挖到了百度,去年3月離職創(chuàng)業(yè),在創(chuàng)業(yè)項目 Deeplearning.ai的深度學習系列課程里,他還跟老朋友辛頓做了場對話。
當李飛飛在未來論壇2017年會上跟李凱、沈向洋、張鈸做圓桌對話時,吳恩達坐在她后面當聽眾。中國是吳恩達暫時撤離的戰(zhàn)場,現(xiàn)在輪到他在斯坦福和谷歌的前同事李飛飛了。