趙晨陽
(德州市第一中學(xué),德州 253000)
人工智能的主要三大驅(qū)動力:大數(shù)據(jù)、機(jī)器學(xué)習(xí)、硬件GPU,本文主要從人工智能的算法üü機(jī)器學(xué)習(xí)方面來展開論述。機(jī)器學(xué)習(xí)(Machine Learning)的本質(zhì)是基于互聯(lián)網(wǎng)的海量數(shù)據(jù)以及系統(tǒng)強(qiáng)大的并行運算能力,讓機(jī)器自主模擬人類學(xué)習(xí)的過程,通過不斷 學(xué)習(xí) 數(shù)據(jù)來做出智能決策行為。
機(jī)器學(xué)習(xí)屬于人工智能中一個較為年輕的分支,可以大致分為以下三個發(fā)展歷程:
第一階段:20世紀(jì)50年代中期ü60年代中期,這一時期處于萌芽時期。人們試圖通過軟件編程來操控計算機(jī)完成一系列的邏輯推理功能,進(jìn)而使計算機(jī)具有一定程度上類似人類一樣的智能思考能力。然而這時期計算機(jī)所推理的結(jié)果遠(yuǎn)遠(yuǎn)沒有達(dá)到人們對機(jī)器學(xué)習(xí)的期望。通過進(jìn)一步研究發(fā)現(xiàn),只具有邏輯推理能力并不能使機(jī)器智能。研究者們認(rèn)為,使得機(jī)器擁有人工智能的前提,還必須是擁有大量的先驗知識[1]。
第二階段:20世紀(jì)60年代中期ü80年代中期,這一時期處于發(fā)展時期。人們試圖利用自身思維提取出來的規(guī)則來教會計算機(jī)執(zhí)行決策行為,主流之力便是各式各樣的 專家系統(tǒng) ,然而這些系統(tǒng)總會面臨 知識稀疏 的問題,即面對無窮無盡的知識與信息,人們無法總結(jié)出萬無一失的規(guī)律。因此,讓機(jī)器自主學(xué)習(xí)的設(shè)想自然地浮出水面?;?0世紀(jì)50年代對于神經(jīng)網(wǎng)絡(luò)的研究,人們開始研究如何讓機(jī)器自主學(xué)習(xí)。
第三階段:20世紀(jì)80年代ü至今,機(jī)器學(xué)習(xí)達(dá)到了一個繁榮時期。由于這一時期互聯(lián)網(wǎng)大數(shù)據(jù)以及硬件GPU的出現(xiàn),使得機(jī)器學(xué)習(xí)脫離了瓶頸期。機(jī)器學(xué)習(xí)開始爆炸式發(fā)展,開始成為了一門獨立熱門學(xué)科并且被應(yīng)用到各個領(lǐng)域。各種機(jī)器學(xué)習(xí)算法不斷涌現(xiàn),而利用深層次神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)也得到進(jìn)一步發(fā)展。同時,機(jī)器學(xué)習(xí)的蓬勃發(fā)展還促進(jìn)了其他分支的出現(xiàn),例如模式識別,數(shù)據(jù)挖掘,生物信息學(xué)和自動駕駛等等。
2.2.1 監(jiān)督學(xué)習(xí)
監(jiān)督學(xué)習(xí)表示機(jī)器學(xué)習(xí)的數(shù)據(jù)是帶標(biāo)記的,這些標(biāo)記可以包括數(shù)據(jù)類別,數(shù)據(jù)屬性以及特征點位置等。這些標(biāo)記作為預(yù)期效果,不斷來修正機(jī)器的預(yù)測結(jié)果。具體首先過程是:通過大量帶有標(biāo)記的數(shù)據(jù)來訓(xùn)練機(jī)器,機(jī)器將預(yù)測結(jié)果與期望結(jié)果進(jìn)行比對;之后根據(jù)比對結(jié)果來修改模型中的參數(shù),再一次輸出預(yù)測結(jié)果;再將預(yù)測結(jié)果與期望結(jié)果進(jìn)行比對
重復(fù)多次直至收斂,最終生成具有一定魯棒性的模型來達(dá)到智能決策的能力。
常見的監(jiān)督學(xué)習(xí)有分類、回歸。分類(classification)是將一些實例數(shù)據(jù)分到合適的類別中,它的預(yù)測結(jié)果是離散的?;貧w(regression)是將數(shù)據(jù)歸到一條線上,即為離散數(shù)據(jù)生產(chǎn)擬合曲線,因此其預(yù)測結(jié)果是連續(xù)的。
2.2.2 無監(jiān)督學(xué)習(xí)
無監(jiān)督學(xué)習(xí)表示機(jī)器學(xué)習(xí)的數(shù)據(jù)是沒有標(biāo)記的。機(jī)器從無標(biāo)記的數(shù)據(jù)中探索并推斷出潛在的聯(lián)系。常見的無監(jiān)督學(xué)習(xí)有聚類,降維。
在聚類(clustering)工作中,由于事先不知道數(shù)據(jù)類別,因此只能通過分析數(shù)據(jù)樣本在特征空間中的分布,例如基于密度或是基于統(tǒng)計學(xué)概率模型等等,從而將不同數(shù)據(jù)分開,把相似數(shù)據(jù)聚為一類。
降維(dimensionality reduction)是將數(shù)據(jù)的維度降低。例如描述一個西瓜,若只考慮外皮色澤、根蒂、敲聲、紋理、密度以及含糖率這6個屬性,這6個屬性代表了西瓜數(shù)據(jù)的維度為6。進(jìn)一步考慮降維的工作,由于數(shù)據(jù)本身具有龐大的數(shù)量和各種屬性特征,若對全部數(shù)據(jù)信息進(jìn)行分析,將會增加訓(xùn)練的負(fù)擔(dān)和存儲空間。因此可以通過主成分分析等其他方法,考慮主要影響因素,舍棄次要因素,來平衡準(zhǔn)確度與效率。
2.2.3 強(qiáng)化學(xué)習(xí)
強(qiáng)化學(xué)習(xí)是帶激勵的,具體來說就是,如果機(jī)器行動正確,將施與一定的 正激勵 ;如果行動錯誤,也同樣會給出一個懲罰(也可稱為 負(fù)激勵 )。因此在這種情況下,機(jī)器將會考慮如何在一個環(huán)境中行動才能達(dá)到激勵的最大化,具有一定的動態(tài)規(guī)劃思想[2]。例如在貪吃蛇游戲中,貪吃蛇需要不斷吃到 食物 來加分。為了不斷提高分?jǐn)?shù),貪吃蛇需要考慮在自身位置上如何轉(zhuǎn)向才能吃到 食物 ,這種學(xué)習(xí)過程便可理解為是一種強(qiáng)化學(xué)習(xí)。
強(qiáng)化學(xué)習(xí)最為火熱的一個應(yīng)用便是谷歌AlphaGo的升級品üüAlphaGo Zero。相較于AlphaGo,AlphaGo Zero舍棄了先驗知識。不再需要人為設(shè)計特征,直接將棋盤上黑白棋子的擺放情況作為原始數(shù)據(jù)輸入到模型中,機(jī)器使用強(qiáng)化學(xué)習(xí)來自我博弈,不斷提升自己最終出色完成下棋。AlphaGo Zero的成功證明了在沒有人類的經(jīng)驗和指導(dǎo)下,深度強(qiáng)化學(xué)習(xí)依然能夠出色完成指定任務(wù)。
由于近20年科技的迅速發(fā)展,機(jī)器學(xué)習(xí)已經(jīng)成為了一門活躍并且充滿生命力的學(xué)科。機(jī)器學(xué)習(xí)具備了一定的解決實際生活問題的能力,通過把機(jī)器學(xué)習(xí)當(dāng)作是一種基礎(chǔ)與服務(wù)技術(shù),和不同領(lǐng)域進(jìn)行結(jié)合碰撞出火花[3]。我們首先通過幾個具體的例子來進(jìn)一步了解機(jī)器學(xué)習(xí)的優(yōu)勢。
(1)標(biāo)注問題。標(biāo)注問題就是為數(shù)據(jù)標(biāo)記類別,這些數(shù)據(jù)可以包括圖片,聲音,文字等等。例如下面這張圖片中,包含的動物有貓和狗兩種,因此可以利用多標(biāo)注將圖片標(biāo)注為 有貓并且有狗 。現(xiàn)實情況中,需要標(biāo)注的數(shù)據(jù)往往以百萬萬甚至以億計數(shù),人力標(biāo)注就顯得很吃力了。例如在有監(jiān)督學(xué)習(xí)中,大量的數(shù)據(jù)是需要標(biāo)注的。因此通過機(jī)器學(xué)習(xí)的自動標(biāo)注可以節(jié)省大量時間成本,提高工作效率。
(2)搜索與排序。搜索與排序研究的是如何將一堆對象進(jìn)行排序。例如在檢索信息時,我們常常關(guān)注如何把一堆對象按照檢索目的相關(guān)性進(jìn)行排序。在互聯(lián)網(wǎng)時代,由于各種搜索引擎的流行,我們將目光聚集在如何對網(wǎng)頁進(jìn)行相關(guān)性排序?;跈C(jī)器學(xué)習(xí)的網(wǎng)頁排序,可以根據(jù)用戶喜好智能并且個性化呈現(xiàn)出搜索結(jié)果。
(3)推薦系統(tǒng)。推薦系統(tǒng)與排序問題緊密相連,并被廣泛應(yīng)用于新聞網(wǎng)站,購物網(wǎng)站以及搜索引擎上。推薦系統(tǒng)的目標(biāo)是將不同用戶各自感興趣的內(nèi)容推薦給他們[4]。例如Comcast公司(美國一家做寬帶網(wǎng)絡(luò),有線電視及IP電話服務(wù)供應(yīng)商的公司),利用機(jī)器學(xué)習(xí)技術(shù)分析了大量用戶的歷史記錄,對每一個用戶輸出對應(yīng)的品味描述,并根據(jù)品味描述把顧客分成不同類別。對于不同類別的顧客,Comcast都能實時跟蹤并推薦相關(guān)的最流行的節(jié)目內(nèi)容?;跈C(jī)器學(xué)習(xí)生成了更好的推薦系統(tǒng),達(dá)到了更高的利用率,促進(jìn)了更高的顧客滿意度。
[1] 吳康寧.基于人工智能下的機(jī)器學(xué)習(xí)歷史及展望研究[J].科技尚品,2017(6):187.
[2] 高陽,陳世福,陸鑫.強(qiáng)化學(xué)習(xí)研究綜述[J].自動化學(xué)報,2004,30(1):86-100.
[3] 陳春霞.淺析機(jī)器學(xué)習(xí)的發(fā)展與應(yīng)用[J].信息系統(tǒng)工程,2017(8):99-100.
[4] 劉忠寶.機(jī)器學(xué)習(xí)方法在個性化推薦系統(tǒng)中的應(yīng)用[J].情報探索,2016(4):80-82.