余殷博
摘 要 機(jī)器學(xué)習(xí)作為最近三十年新興起的科研學(xué)科之一,已經(jīng)在現(xiàn)代信息生活尤其是互聯(lián)網(wǎng)生活中實(shí)現(xiàn)了較為廣泛的應(yīng)用。機(jī)器學(xué)習(xí)是在基于嚴(yán)格數(shù)學(xué)理論經(jīng)眾多學(xué)科交叉而成,包括信息控制理論、邏輯科學(xué)、數(shù)理統(tǒng)計(jì)學(xué)、神經(jīng)科學(xué)、計(jì)算科學(xué)等。目前,機(jī)器學(xué)習(xí)已經(jīng)衍生出了眾多分支,如數(shù)據(jù)挖掘、深度學(xué)習(xí)、語音識(shí)別、生物信息學(xué)、模式識(shí)別、機(jī)器人的智能控制、遙感信息安全等。綜上所述,機(jī)器學(xué)習(xí)已經(jīng)取得了較大發(fā)展,并且將在未來的信息社會(huì)取得更為矚目的成就。
【關(guān)鍵詞】機(jī)器學(xué)習(xí) 多學(xué)科交叉 數(shù)理統(tǒng)計(jì) 人工智能 深度學(xué)習(xí)
機(jī)器學(xué)習(xí)是人工智能領(lǐng)域發(fā)展最快的一個(gè)分支之一。機(jī)器人學(xué)習(xí)的本質(zhì)是通過利用計(jì)算機(jī)系統(tǒng)強(qiáng)大的運(yùn)算及數(shù)據(jù)處理能力,借助大量的數(shù)據(jù)訓(xùn)練,使計(jì)算機(jī)具有自發(fā)模擬人類學(xué)習(xí)行為,通過學(xué)習(xí)獲取知識(shí)和技能,在不斷改善自身性能的同時(shí),實(shí)現(xiàn)人工智能的一種思想。在信息時(shí)代,特別是隨著互聯(lián)網(wǎng)技術(shù)的爆發(fā)式發(fā)展,信息爆炸現(xiàn)象表現(xiàn)的尤為明顯。現(xiàn)代社會(huì)互聯(lián)網(wǎng)中每天都會(huì)產(chǎn)生的海量數(shù)字化數(shù)據(jù),如數(shù)字化的微博數(shù)據(jù),數(shù)字化的聊天記錄、數(shù)字化的網(wǎng)頁瀏覽數(shù)據(jù)等。針對以上海量數(shù)據(jù),大數(shù)據(jù)(BigData)處理必然成為當(dāng)今社會(huì)研究的一個(gè)熱點(diǎn)問題。在這種大的氛圍下,如何對海量數(shù)據(jù)進(jìn)行分析并根據(jù)嚴(yán)格的數(shù)學(xué)定理提取有價(jià)值的規(guī)律信息,機(jī)器學(xué)習(xí)在以后的學(xué)科發(fā)展中必將占有一席之地。
1 機(jī)器學(xué)習(xí)的發(fā)展歷史
1.1 機(jī)器學(xué)習(xí)“萌芽”階段
上世紀(jì)五、六十年代,機(jī)器學(xué)習(xí)技術(shù)研究正處于“萌芽”階段,人們試圖給機(jī)器例如大型計(jì)算機(jī)通過編程手段使其最終具備邏輯推理能力,進(jìn)而使機(jī)器具有一定的智能思考和自我優(yōu)化的能力。這一階段的代表性工作主要是由A.Newell和H.Simon完成的。所做工作包含各種“邏輯”程序以及之后的“求解”程序等,這些進(jìn)展在當(dāng)時(shí)令人振奮。A.Newell和H.Simon也因此獲得了1975年圖靈獎(jiǎng)。然而,進(jìn)一步的研究證明只具有邏輯并不能使機(jī)器具有智能“”。E.A.Feigenbaum等人認(rèn)為,智能存在的前提還必須具有先驗(yàn)“知識(shí)”。
1.2 機(jī)器學(xué)習(xí)“發(fā)展”階段
上世紀(jì)七、八十年代被稱為機(jī)器學(xué)習(xí)的“發(fā)展”階段。在這一時(shí)期的主流為“專家系統(tǒng)”?!爸R(shí)工程”之父E.A.Feigenbaum憑此在1994年摘取了圖靈獎(jiǎng)?wù)隆5?,所謂“專家系統(tǒng)”也要面臨“知識(shí)困境”,簡單地說,對近乎無限的信息人類很難通過自身思維提取規(guī)則并賦予計(jì)算設(shè)備。機(jī)器自主學(xué)習(xí)的設(shè)想浮出水面。機(jī)器學(xué)習(xí)相關(guān)工作在上個(gè)世紀(jì)五十年代就已經(jīng)展開,主要進(jìn)行的基于神經(jīng)網(wǎng)絡(luò)的訓(xùn)練學(xué)習(xí)方面的研究。
在二十世紀(jì)六七十年代,多種學(xué)習(xí)技術(shù)層出不窮,例如基于決策理論的統(tǒng)計(jì)學(xué)習(xí)技術(shù)以及強(qiáng)化學(xué)習(xí)技術(shù)等,代表作品為“跳棋程序”以及“學(xué)習(xí)機(jī)器”等,統(tǒng)計(jì)學(xué)習(xí)理論和符號學(xué)習(xí)技術(shù)開始萌芽。
1980年,人工智能領(lǐng)域TopJournal《策略分析與信息系統(tǒng)》專門以“機(jī)器學(xué)習(xí)”為主題連續(xù)開辟三期專欄;1983年,Tioga出版社出版了R.S.Michalski、J.G.Carbonell和T.M.Mitchell等頂尖專家聯(lián)合主編的圖書教材《機(jī)器學(xué)習(xí):一種人工智能途徑》面世,書中匯集了超過20位學(xué)者撰寫的16篇高影響因子文章,對當(dāng)時(shí)多年機(jī)器學(xué)習(xí)領(lǐng)域的研究工作進(jìn)行了系統(tǒng)的總結(jié)和闡述,引領(lǐng)了學(xué)術(shù)方向,有較大影響。
1.3 機(jī)器學(xué)習(xí)“繁榮”階段
從二十世紀(jì)八十年代至今,機(jī)器學(xué)習(xí)成為一個(gè)獨(dú)立的學(xué)科領(lǐng)域并開始爆發(fā)式發(fā)展、各種機(jī)器學(xué)習(xí)技術(shù)不斷涌現(xiàn),機(jī)器學(xué)習(xí)算法呈現(xiàn)多樣化。機(jī)器學(xué)習(xí)研究進(jìn)入“繁榮”階段,機(jī)器學(xué)習(xí)研究在這一時(shí)期也被科學(xué)的劃分成“實(shí)例學(xué)習(xí)”、“求解規(guī)劃學(xué)習(xí)”、“觀察發(fā)現(xiàn)學(xué)習(xí)”、“指令學(xué)習(xí)”等多種范疇;而E.A.Feigenbaum等專家合著的經(jīng)典圖書《人工智能手冊》中,則把機(jī)器學(xué)習(xí)技術(shù)從另一個(gè)角度重新劃分為四大范疇,包含“機(jī)械學(xué)習(xí)”、“示教學(xué)習(xí)”、“類比學(xué)習(xí)”、“歸納學(xué)習(xí)”四種。直到今天,機(jī)器學(xué)習(xí)繼續(xù)蓬勃發(fā)展并演化出了眾多分支,例如數(shù)據(jù)挖掘、深度學(xué)習(xí)、語音識(shí)別、生物信息學(xué)、模式識(shí)別等。大量機(jī)器學(xué)習(xí)算法被廣泛應(yīng)用到信息處理特別是互聯(lián)網(wǎng)海量數(shù)據(jù)的分析處理當(dāng)中。
2 機(jī)器學(xué)習(xí)的發(fā)展趨勢
從當(dāng)前研究的發(fā)展趨勢看,機(jī)器學(xué)習(xí)今后將有如下幾個(gè)熱點(diǎn)的研究方向:
(1)從人類自身出發(fā)找出大腦本身生物學(xué)習(xí)機(jī)制,通過嚴(yán)格數(shù)學(xué)化應(yīng)用于機(jī)器學(xué)習(xí)。
(2)在已有的人工智能方法的基礎(chǔ)上不斷優(yōu)化發(fā)展和改良現(xiàn)有學(xué)習(xí)算法,同時(shí)展開新的研究算法的開發(fā)工作。
(3)令眾多的機(jī)器學(xué)習(xí)算法走出“象牙塔”,建立實(shí)用的機(jī)器學(xué)習(xí)的算法應(yīng)用系統(tǒng),特別是在互聯(lián)網(wǎng)領(lǐng)域開展多種學(xué)習(xí)方法集成化的研究。
(4)多種機(jī)器學(xué)習(xí)算法的同步協(xié)調(diào)使用,利用多種算法是優(yōu)勢規(guī)避其中的不足,改善學(xué)習(xí)系統(tǒng)性能。
3 結(jié)語
現(xiàn)有的計(jì)算機(jī)系統(tǒng)和人工智能系統(tǒng)從其硬件結(jié)構(gòu)和實(shí)現(xiàn)原理上不具備自主學(xué)習(xí)能力,至多也只是具有非常低級的“被動(dòng)”學(xué)習(xí)能力,因而不能滿足科技和生產(chǎn)提出的新要求。對機(jī)器學(xué)習(xí)進(jìn)行比較系統(tǒng)化的討論和和方向把握,對以后學(xué)習(xí)機(jī)器學(xué)習(xí)方面的知識(shí)和進(jìn)行相應(yīng)的科研工作有方向性作用。學(xué)習(xí)機(jī)器學(xué)習(xí)本質(zhì)是把控研究機(jī)器學(xué)習(xí)算法的內(nèi)在數(shù)學(xué)原理、建立通過數(shù)據(jù)訓(xùn)練使現(xiàn)代計(jì)算機(jī)系統(tǒng)具備不斷學(xué)習(xí)并自動(dòng)提高自身水平。近年來機(jī)器學(xué)習(xí)理論在諸多領(lǐng)域例如天氣預(yù)報(bào)、互聯(lián)網(wǎng)、軍事等取得成功,已成為計(jì)算機(jī)科學(xué)的基礎(chǔ)研究熱點(diǎn)之一。
參考文獻(xiàn)
[1]楊樹仁,沈洪遠(yuǎn).基于相關(guān)向量機(jī)的機(jī)器學(xué)習(xí)算法研究與應(yīng)用[J].計(jì)算技術(shù)與自動(dòng)化,2010,29(01):43-47.
[2] 何清,李寧,羅文娟,等.大數(shù)據(jù)下的機(jī)器學(xué)習(xí)算法綜述[C]//中國計(jì)算機(jī)學(xué)會(huì)人工智能會(huì)議.2013.
[3]劉魯,劉志明.基于機(jī)器學(xué)習(xí)的中文微博情感分類實(shí)證研究[J].計(jì)算機(jī)工程與應(yīng)用,2012,48(01):1-4.
[4]李凡長,錢旭陪,謝琳,等.機(jī)器學(xué)習(xí)理論及應(yīng)用[J].計(jì)算機(jī)工程與科學(xué),2012,34(09):F0003-F0003.
[5]王昊,嚴(yán)明,蘇新寧.基于機(jī)器學(xué)習(xí)的中文書目自動(dòng)分類研究[J].中國圖書館學(xué)報(bào),2010,36(06):28-39.
作者單位
武漢市外國語中學(xué)高二(3)班 湖北省武漢市 430050