• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      為神經(jīng)網(wǎng)絡(luò)的通用理論建造基石

      2019-04-29 07:59:48編譯韓真
      世界科學(xué) 2019年4期
      關(guān)鍵詞:羅爾尼克線段

      編譯 韓真

      神經(jīng)網(wǎng)絡(luò)既強大又不可預(yù)測?,F(xiàn)在,數(shù)學(xué)家開始揭示神經(jīng)網(wǎng)絡(luò)的形態(tài)如何影響其功能。

      當(dāng)我們建造摩天大樓時,我們預(yù)期它會按照設(shè)計規(guī)格發(fā)揮功能:能夠支撐這么多的重量,能夠承受一定強度的地震。

      但是,面對當(dāng)今世界最重要的技術(shù)之一時,我們基本上是在盲目行事:嘗試不同的設(shè)計,修補不同的初始設(shè)定,但是,直到我們開始試運行時,我們并不知道它能做什么,也不知道它會在哪失敗。

      這一技術(shù)就是神經(jīng)網(wǎng)絡(luò),其支撐了當(dāng)前最先進的人工智能系統(tǒng),并且開始逐漸進入社會生活的核心:通過社交網(wǎng)絡(luò)信息決定我們從世界中了解什么,幫助醫(yī)生診斷病癥,甚至可以影響法官決定罪犯是否需要在獄中服刑。

      然而,“對于神經(jīng)網(wǎng)絡(luò)如何工作?真正的神經(jīng)網(wǎng)絡(luò)理論是什么?我們幾乎一無所知?!滨U里斯·哈寧(Boris Hanin)說道。他是德克薩斯A & M大學(xué)的數(shù)學(xué)家,也是臉書人工智能實驗室的訪問科學(xué)家,研究神經(jīng)網(wǎng)絡(luò)。

      他把這種情形比作另一項革命性技術(shù)(蒸汽機)的發(fā)展。起初,蒸汽機只是用于抽水。后來,蒸汽機可以驅(qū)動火車,這相當(dāng)于復(fù)雜神經(jīng)網(wǎng)絡(luò)所達到的水平。后來科學(xué)家和數(shù)學(xué)家發(fā)展了熱力學(xué)理論,使得他們可以理解任何發(fā)動機的內(nèi)部原理。最終,這些知識幫助我們登上月球。

      “首先,你擁有偉大的工程設(shè)計,你擁有一些偉大的火車,然后你需要一些理論基礎(chǔ),你才能進入火箭飛船?!惫幷f。

      在龐大的神經(jīng)網(wǎng)絡(luò)研究群體中,有一小群具有數(shù)學(xué)思維的研究者,他們在嘗試構(gòu)建神經(jīng)網(wǎng)絡(luò)的理論。這樣的理論能夠解釋神經(jīng)網(wǎng)絡(luò)如何工作,確保按照規(guī)定方式建造的神經(jīng)網(wǎng)絡(luò)完成指定任務(wù)。

      這項工作尚處極早階段,但是,2018年,研究者發(fā)表若干文章,詳細闡述神經(jīng)網(wǎng)絡(luò)的形態(tài)和功能之間的關(guān)系。研究表明:在驗證神經(jīng)網(wǎng)絡(luò)能夠駕駛汽車之前,你先得證明神經(jīng)網(wǎng)絡(luò)能夠做乘法。

      梅特拉·拉古,谷歌大腦的一員,一直在研究可解釋神經(jīng)網(wǎng)絡(luò)運作的原理

      模擬大腦的最佳方法

      神經(jīng)網(wǎng)絡(luò)的目的是模擬人的大腦,關(guān)于大腦的工作方式之一是:它把較小的抽象合并為更大的抽象。從這個視角來說,思考的復(fù)雜度要用兩點來衡量:一是你可以利用的小型抽象的范圍,二是你能夠把低層抽象合并為高層抽象的次數(shù)。這就像我們學(xué)會區(qū)別狗和鳥。

      康奈爾大學(xué)計算機科學(xué)的博士生、谷歌大腦的成員梅特拉·拉古(Maithra Raghu)說:“對人來說,要學(xué)會如何識別狗,先得學(xué)會識別四只腿,我們希望神經(jīng)網(wǎng)絡(luò)也能做同樣的事。”

      人類大腦的抽象能力是自然獲得的,神經(jīng)網(wǎng)絡(luò)則需要通過工作而獲得。與大腦一樣,神經(jīng)網(wǎng)絡(luò)是由稱為“神經(jīng)元”的基礎(chǔ)組件組成,神經(jīng)元以各種方式互相連接(神經(jīng)網(wǎng)絡(luò)的神經(jīng)元受到大腦神經(jīng)元啟發(fā),但前者并不是直接模仿后者)。每個神經(jīng)元可能代表了一個屬性或一組屬性,網(wǎng)絡(luò)用以表征抽象的各個層級。

      當(dāng)把這些神經(jīng)元連接到一起的時候,工程師可以有多種選擇。他們必須決定網(wǎng)絡(luò)有多少層次的神經(jīng)元(有多“深”)。比如,考慮神經(jīng)網(wǎng)絡(luò)來識別圖像中的物體,圖像在第一層進入系統(tǒng);在下一層,網(wǎng)絡(luò)上有些神經(jīng)元用以識別圖像的邊緣;再下一層,把邊緣合并為線段來識別曲線;再下一層,把曲線合并為形狀和紋理;最后的層處理這些形狀和紋理并得到結(jié)論:它看到了什么?毛茸茸的猛犸獸!

      賓州大學(xué)的數(shù)學(xué)家大衛(wèi)·羅爾尼克(David Rolnick)說:“思路就是每一層把前一層的許多方面合并在一起。圓就是把很多地方的曲線合并在一起,曲線就是把很多地方的線段合并在一起?!?/p>

      工程師還得決定每一層的“寬度”,即對應(yīng)于網(wǎng)絡(luò)中每一層所考慮的不同特征的數(shù)量。在這個圖像識別的例子中,層級的寬度就是每一層所考慮的線段、曲線或形狀的種類的數(shù)量。

      除了網(wǎng)絡(luò)的深度和寬度之外,還需要選擇:在層內(nèi)和層與層之間,如何連接神經(jīng)元;給予每個連接多大的權(quán)重。

      所以,如果你心中有具體的任務(wù),你如何知道選擇哪種神經(jīng)網(wǎng)絡(luò)架構(gòu)來實現(xiàn)它最好呢?對此,有若干寬泛的經(jīng)驗法則:對于圖像相關(guān)的任務(wù)來說,工程師一般使用“卷積”神經(jīng)網(wǎng)絡(luò),重復(fù)使用層與層之間的相同連接架構(gòu)。對于自然語言處理(比如語音識別或語言生成)來說,工程師發(fā)現(xiàn)“循環(huán)”神經(jīng)網(wǎng)絡(luò)功用最佳。在這種網(wǎng)絡(luò)中,神經(jīng)元可以連接到非鄰近層。

      然而,除了這些一般的準則,工程師基本上要依靠實驗證據(jù):他們運行1 000種不同的神經(jīng)網(wǎng)絡(luò),觀察其中哪些能完成任務(wù)。

      哈寧說:“這些選擇基本上通過試錯法,這很困難,因為選擇是無限的,而且人們真的不知道什么是最好的?!?/p>

      更好的辦法應(yīng)當(dāng)包括:采用更少的試錯,更深入理解神經(jīng)網(wǎng)絡(luò)架構(gòu)能夠帶來什么。最近的一些文章正把整個領(lǐng)域向此方向推進。

      “此工作嘗試開發(fā)設(shè)計正確網(wǎng)絡(luò)結(jié)構(gòu)的手冊(類似食譜)。如果你知道自己想要從網(wǎng)絡(luò)結(jié)構(gòu)中獲得什么,那么這就是你需要的秘方?!绷_爾尼克說。

      大衛(wèi)·羅爾尼克,賓州大學(xué)的數(shù)學(xué)家,證明了更深的網(wǎng)絡(luò)可以比更淺的網(wǎng)絡(luò)使用更少的神經(jīng)元來完成相同的任務(wù)

      圈出紅色的羊

      最早的一項關(guān)于神經(jīng)網(wǎng)絡(luò)架構(gòu)的理論保證之一來自30年前。1989年,計算機科學(xué)家證明:如果神經(jīng)網(wǎng)絡(luò)只有一個計算層,且允許此層擁有無限的神經(jīng)元,允許神經(jīng)元之間有無限的連接,那么,這個神經(jīng)網(wǎng)絡(luò)就能完成你所要求的任何任務(wù)。

      這是過分籠統(tǒng)的觀點,結(jié)果非常直觀卻沒啥用。這好像是說:如果你能識別圖像中無限的線段,你就可以用一層網(wǎng)絡(luò)來區(qū)別所有物體。這可能在原理上是對的,但是,在實踐中就需要好運。

      今天的研究者把這種很寬很平的網(wǎng)絡(luò)稱為“表達性”(expressive)的,是說它們理論上能捕捉在可能輸入(比如圖像)和可能輸出(比如對于圖像的描述)之間的豐富聯(lián)系。然而這種網(wǎng)絡(luò)卻是非常難以訓(xùn)練,幾乎不可能教會它們?nèi)绾握嬲a(chǎn)生相關(guān)輸出,其所需的計算也超過了任何計算機的能力。

      最近,研究者開始嘗試把神經(jīng)網(wǎng)絡(luò)推向另一個方向,把它變得更窄(每層更少的神經(jīng)元)、更深(擁有更多層次)。所以,很可能你只要挑出100條不同的線段,然后用連接把這100條線段變成50條曲線,再合并成10個不同的形狀,這樣,你就獲得了需要的所有基礎(chǔ)組件,可以用來識別大多數(shù)物體。

      在2018年完成的一篇文章中,羅爾尼克和麻省理工學(xué)院的邁克斯·泰格馬克(Max Tegmark)證明:通過增加深度、減少寬度,你可以使用很少的神經(jīng)元來完成相同的功能。他們表明,如果你的模型有100個輸入變量,可以用一層2100的神經(jīng)元或兩層210的神經(jīng)元來達成相同的可靠度。羅爾尼克說:“神經(jīng)網(wǎng)絡(luò)的深度概念和如下的觀念有關(guān),即把復(fù)雜的事情分解為很多簡單事情,就像流水線?!?/p>

      羅爾尼克和泰格馬克證明了深度網(wǎng)絡(luò)的效用,即通過要求網(wǎng)絡(luò)執(zhí)行簡單任務(wù):把多項式函數(shù)相乘。他們通過方程式和解的例子來訓(xùn)練神經(jīng)網(wǎng)絡(luò)。然后要求網(wǎng)絡(luò)計算之前從未見過的方程式的解。深的網(wǎng)絡(luò)比淺的網(wǎng)絡(luò)做這件事情用更少的神經(jīng)元。

      盡管乘法不是讓世人震驚的任務(wù),羅爾尼克說這篇文章提出了重要觀點:“如果淺的網(wǎng)絡(luò)連乘法都不能做,我們不能信任它們可以做別的事?!?/p>

      其他研究者一直在探索可用的單層最小寬度。2018年9月底,杰西·約翰遜(Jesse Johnson)證明:在特定的點,再深的深度也無法彌補寬度不足。約翰遜是賽諾菲制藥公司的研究人員,以前是俄克拉荷馬州立大學(xué)的數(shù)學(xué)家。

      要理解他的研究成果,我們可以想象田里的羊,羊毛染上幾種不同的顏色。你的神經(jīng)網(wǎng)絡(luò)的任務(wù)就是要把所有相同顏色的羊圈在一起。就實質(zhì)來說,這個任務(wù)和圖像分類相似,網(wǎng)絡(luò)有一組圖像,然后要把相似的圖像分組。

      如何設(shè)計一個神經(jīng)網(wǎng)絡(luò)

      神經(jīng)網(wǎng)絡(luò)把輸入(如一幅圖像)通過很多層的數(shù)字神經(jīng)元進行傳輸處理,每一層網(wǎng)絡(luò)都揭示關(guān)于該輸入的更多特征。數(shù)學(xué)家正在揭示神經(jīng)網(wǎng)絡(luò)的架構(gòu)(關(guān)于該網(wǎng)絡(luò)有多少節(jié)點和多少層級,節(jié)點和層級間如何連接在一起)如何決定該神經(jīng)網(wǎng)絡(luò)所擅長的任務(wù)。

      當(dāng)數(shù)據(jù)被喂入網(wǎng)絡(luò)時,每個響應(yīng)的人工神經(jīng)元(用“1”作為標記)把信號傳遞到下一層的特定神經(jīng)元,而下層的神經(jīng)元如果收到多個信號,就更容易響應(yīng)。這個過程揭示了關(guān)于輸入的抽象信息。

      淺網(wǎng)絡(luò)只有較少的層次,但是每層擁有很多神經(jīng)元。這些“表達性”網(wǎng)絡(luò)在計算量上是很繁重的。

      深網(wǎng)絡(luò)有很多的層次,每層擁有相對少的神經(jīng)元。它可以用相對較少的神經(jīng)元到達很高的抽象能力。

      鮑里斯·哈寧,德克薩斯A & M大學(xué)數(shù)學(xué)家,研究神經(jīng)網(wǎng)絡(luò)的深度和寬度之間的權(quán)衡關(guān)系

      約翰遜證明:如果網(wǎng)絡(luò)的單層寬度少于或等于輸入的數(shù)量,就無法完成這樣的任務(wù)。以羊為例,每只羊可以用兩個輸入x和y坐標來確定它在田地的位置。神經(jīng)網(wǎng)絡(luò)把每只羊標記一個顏色,然后在具備相同顏色的羊周圍畫邊界。在這種情況下,你需要每層3個或更多神經(jīng)元的網(wǎng)絡(luò)來解決畫界問題。

      更具體地說,約翰遜表示:如果網(wǎng)絡(luò)單層寬度與輸入變量數(shù)的比不合適,那么神經(jīng)網(wǎng)絡(luò)就沒法畫封閉的圈(畫圈就表明,把在草場中間的紅色羊聚在一起)?!叭绻窠?jīng)元的寬度不能超過輸入維度的數(shù)目,那么,無論使用多少層次,有些形狀網(wǎng)絡(luò)就永遠不能生成?!?約翰遜說。

      像約翰遜這樣的文章正在構(gòu)建神經(jīng)網(wǎng)絡(luò)理論的基礎(chǔ)部分。在當(dāng)下,研究者只能對網(wǎng)絡(luò)架構(gòu)和功能之間的關(guān)系得出很基本的推論;比起神經(jīng)網(wǎng)絡(luò)正在執(zhí)行的大量任務(wù)而言,這些推論占很小的比例。

      所以,盡管神經(jīng)網(wǎng)絡(luò)的理論不能很快改變?nèi)藗兘ㄔ煜到y(tǒng)的方法;但是,正在繪制關(guān)于計算機如何學(xué)習(xí)的新理論的藍圖。這一理論將使人類達成比登月更偉大的成就。

      猜你喜歡
      羅爾尼克線段
      畫出線段圖來比較
      一只叫尼克的狗
      怎樣畫線段圖
      我們一起數(shù)線段
      數(shù)線段
      尼克·楊的時尚生活
      NBA特刊(2018年7期)2018-06-08 05:48:23
      鯊魚尼克
      羅爾的秘密行動
      羅爾的秘密行動
      故事大王(2014年2期)2014-02-20 01:48:37
      使命
      幸福家庭(2013年7期)2013-04-29 00:44:03
      朝阳县| 当阳市| 红安县| 伊春市| 南开区| 顺义区| 长宁县| 新干县| 方城县| 天津市| 凌海市| 三河市| 长兴县| 称多县| 土默特左旗| 嫩江县| 通辽市| 许昌市| 波密县| 康乐县| 福鼎市| 罗田县| 巨野县| 精河县| 雅安市| 都江堰市| 资兴市| 敦煌市| 怀来县| 鹿泉市| 比如县| 金秀| 申扎县| 衡东县| 建宁县| 股票| 社会| 盐津县| 汉阴县| 巴里| 房产|