唐智杰
1958年,計(jì)算科學(xué)家Rosenblatt提出了由兩層神經(jīng)元組成的神經(jīng)網(wǎng)絡(luò)。他給它起了一個(gè)名字--“感知器”(Perceptron),感知器是當(dāng)時(shí)首個(gè)可以學(xué)習(xí)的人工神經(jīng)網(wǎng)絡(luò)。Rosenblatt現(xiàn)場演示了其學(xué)習(xí)識(shí)別簡單圖像的過程,在當(dāng)時(shí)的社會(huì)引起了轟動(dòng)。
人們認(rèn)為已經(jīng)發(fā)現(xiàn)了智能的奧秘,許多學(xué)者和科研機(jī)構(gòu)紛紛投入到神經(jīng)網(wǎng)絡(luò)的研究中。美國軍方大力資助了神經(jīng)網(wǎng)絡(luò)的研究,并認(rèn)為神經(jīng)網(wǎng)絡(luò)比“原子彈工程”更重要。這段時(shí)間直到1969年才結(jié)束,這個(gè)時(shí)期可以看作神經(jīng)網(wǎng)絡(luò)的第一次高潮。
時(shí)至今日,大數(shù)據(jù)技術(shù)已進(jìn)入人們地生活,作為一項(xiàng)發(fā)展前景廣闊地技術(shù),其實(shí)還有很多作用有待挖掘,比如為人們地生活帶來方便,為企業(yè)帶來更多利益等。在大數(shù)據(jù)的時(shí)代背景下,數(shù)據(jù)的處理與分析就成了一個(gè)被提上日程的問題,而大數(shù)據(jù)與人工智能的緊密相關(guān)性決定了數(shù)據(jù)的發(fā)展模式必定是大數(shù)據(jù)+人工智能的模式。因?yàn)槿斯ぶ悄芩惴ǖ挠?xùn)練與調(diào)優(yōu)離不開大量數(shù)據(jù)員,就需要使用大數(shù)據(jù)分析技術(shù)來對(duì)數(shù)據(jù)源做出歸類與過濾,以提供優(yōu)質(zhì)的數(shù)據(jù)。人工智能的出現(xiàn)于發(fā)展具有重大的意義。
生物神經(jīng)網(wǎng)絡(luò)主要是指人腦的神經(jīng)網(wǎng)絡(luò),它是人工神經(jīng)網(wǎng)絡(luò)的技術(shù)原型。人腦是人類思維的物質(zhì)基礎(chǔ),思維的功能定位在大腦皮層,后者含有大約1011個(gè)神經(jīng)元,每個(gè)神經(jīng)元又通過神經(jīng)突觸與大約103個(gè)其它神經(jīng)元相連,形成一個(gè)高度復(fù)雜高度靈活的動(dòng)態(tài)網(wǎng)絡(luò)。作為一門學(xué)科,生物神經(jīng)網(wǎng)絡(luò)主要研究人腦神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)、功能及其工作機(jī)制,意在探索人腦思維和智能活動(dòng)的規(guī)律。
人工神經(jīng)網(wǎng)絡(luò)是生物神經(jīng)網(wǎng)絡(luò)在某種簡化意義下的技術(shù)復(fù)現(xiàn),作為一門學(xué)科,它的主要任務(wù)是根據(jù)生物神經(jīng)網(wǎng)絡(luò)的原理和實(shí)際應(yīng)用的需要建造實(shí)用的人工神經(jīng)網(wǎng)絡(luò)模型,設(shè)計(jì)相應(yīng)的學(xué)習(xí)算法,模擬人腦的某種智能活動(dòng),然后在技術(shù)上實(shí)現(xiàn)出來用以解決實(shí)際問題。因此,生物神經(jīng)網(wǎng)絡(luò)主要研究智能的機(jī)理;人工神經(jīng)網(wǎng)絡(luò)主要研究智能機(jī)理的實(shí)現(xiàn),兩者相輔相成。
多少年以來,人們從醫(yī)學(xué)、生物學(xué)、生理學(xué)、哲學(xué)、信息學(xué)、計(jì)算機(jī)科學(xué)、認(rèn)知學(xué)、組織協(xié)同學(xué)等各個(gè)角度企圖認(rèn)識(shí)并解答上述問題。在尋找上述問題答案的研究過程中,逐漸形成了一個(gè)新興的多學(xué)科交叉技術(shù)領(lǐng)域,稱之為“神經(jīng)網(wǎng)絡(luò)”。神經(jīng)網(wǎng)絡(luò)的研究涉及眾多學(xué)科領(lǐng)域,這些領(lǐng)域互相結(jié)合、相互滲透并相互推動(dòng)。不同領(lǐng)域的科學(xué)家又從各自學(xué)科的興趣與特色出發(fā),提出不同的問題,從不同的角度進(jìn)行研究
當(dāng)人類首次發(fā)明計(jì)算機(jī)時(shí),就已經(jīng)開始思考如何讓計(jì)算機(jī)變得智能。如今,人工智能(artificial intelligence)已經(jīng)成為一個(gè)非?;馃岬念I(lǐng)域,并且具有眾多活躍的研究課題以及惠及生活方方面面的實(shí)際應(yīng)用。這個(gè)領(lǐng)域目前正在以幾何倍的速度增長著,并且未來也將持續(xù)健康發(fā)展。人們希望可以借助人工智能自動(dòng)地處理一些主觀的,非規(guī)范性的事物,如識(shí)別圖像等。
在人工智能發(fā)展初期,計(jì)算機(jī)很容易處理一些人類很難甚至是無法解決的問題,這些問題可以用一種形式化的數(shù)學(xué)規(guī)律來描述。人工智能真正面臨的任務(wù)是那些很難用形式化符號(hào)描述的任務(wù),當(dāng)然對(duì)于人類來說很容易執(zhí)行。舉個(gè)例子,人們能夠輕松識(shí)別對(duì)方說的話,也能夠輕易識(shí)別圖像中的物體。對(duì)于這類問題,計(jì)算機(jī)卻無法給出自己的判斷。
計(jì)算機(jī)很擅長助理抽象和形式化的任務(wù),但是人類卻覺得這是很困難的腦力勞動(dòng)。早在上個(gè)世紀(jì),計(jì)算機(jī)就在國際象棋方面戰(zhàn)勝了人類選手。但一直到最近幾年,計(jì)算機(jī)才在語音和圖像識(shí)別任務(wù)中達(dá)到人類一般水平。通常一個(gè)人的思維發(fā)育需要海量有關(guān)外界的知識(shí)。相當(dāng)一部分領(lǐng)域的知識(shí)是主觀的,并且很難用形式化的結(jié)構(gòu)表示清楚。同人類一樣,計(jì)算機(jī)也要獲得同樣數(shù)量級(jí)的知識(shí)才能表現(xiàn)得智能化。因此,對(duì)于研究人工智能領(lǐng)域的學(xué)者來說,關(guān)鍵的挑戰(zhàn)就是如何將這些主觀的、非形式化的知識(shí)教會(huì)計(jì)算機(jī)來學(xué)習(xí)。
早期的研究項(xiàng)目有一些基于知識(shí)庫方法,這種方法用近似于窮舉的方式將知識(shí)用結(jié)構(gòu)化的符號(hào)進(jìn)行存儲(chǔ),然后設(shè)計(jì)相應(yīng)的邏輯規(guī)則讓計(jì)算機(jī)來理解這些符號(hào)的聲明。可想而知,這樣的工程耗時(shí)又費(fèi)力,失敗也是意料之中的。究其原因,這些結(jié)構(gòu)化符號(hào)和聲明是由人類主觀選取的,人類尚無法構(gòu)造出可以精確地描述世界的算法規(guī)則。
人工神經(jīng)網(wǎng)絡(luò)為人工智能的研究帶來了前所未有的期望。人工神經(jīng)網(wǎng)絡(luò)并不是近代的產(chǎn)物,上世紀(jì)50年代就驗(yàn)證了其可行性,為什么直到最近幾年才被普遍接受?這也是研究深度網(wǎng)絡(luò)算法的意義之所在。首先日俱增的數(shù)據(jù)量得以存儲(chǔ),出現(xiàn)了很多專門用于研究神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)集,這些數(shù)據(jù)集越來越大并且質(zhì)量都很高,如圖1-1所示。人們迫切希望有一種算法能從海量數(shù)據(jù)中發(fā)現(xiàn)事物的本質(zhì)。其次是大規(guī)模的模型已經(jīng)出現(xiàn),經(jīng)過近幾十年的發(fā)展,模型中神經(jīng)元的連接數(shù)已經(jīng)達(dá)到了數(shù)十億級(jí),逐漸接近人類大腦的連接數(shù)??茖W(xué)家預(yù)計(jì)這種增長勢頭將穩(wěn)定持續(xù)到未來若干年。最后人工神經(jīng)網(wǎng)絡(luò)模型做決策的能力一直在提高,各大數(shù)據(jù)集上的準(zhǔn)確率不斷被刷新。深度學(xué)習(xí)發(fā)展迅速,但仍然很年輕,還有很多未知領(lǐng)域的研究和實(shí)際應(yīng)用等著人類去發(fā)掘。