陳強
摘 要:隨著科技和經濟的持續(xù)進步,人工只能技術已經逐漸變成目前我們國家十分重視的對象之一?,F(xiàn)如今我們國家已經進入了信息化時代,每個人在日常生活中都將接觸到大量的信息資訊。早期的信息處理主要通過人工的方式,顯然這一模式現(xiàn)如今已經顯得十分過時,無法滿足人們的正常需要。基于這一情況,大數(shù)據(jù)就此誕生,其能夠直接從海量的數(shù)據(jù)資料中提取人們需要的內容,不僅高效,而且精確度高。而大數(shù)據(jù)本身有何機器學習之間有著非常重要的聯(lián)系。為此,相關工作人員理應對于其模型設計方面提高重視。本篇文章將闡述機器學習模型的設計種類,并低于具體分類方面提出一些合理的見解。
關鍵詞:大數(shù)據(jù) 機器學習 設計方法
引 言
從現(xiàn)階段發(fā)展而言,機器學習一直都屬于人工智能技術中的一類,主要是指讓電腦能夠像人體的思維模式一樣自主展開知識學習,以此提升數(shù)據(jù)的處理速度。這種方式能夠有效幫助大數(shù)據(jù)平臺完成分析的工作,并且提升計算的精確性和速率。
一、支持向量機
早在上世紀90年代,科學研究者便創(chuàng)建了支持向量機,又被稱作SVM,其主要是一種全新的機器學習模型,具有很強的學習能力,能夠自主完成知識分析和提取。當該模型剛一誕生,便立刻在智能科技領域中掀起了巨大的浪潮,引起了全球媒體的關注。這一模型主要是在VC維理論的基礎上創(chuàng)建,并將結構風險最小原理融入其中。在實際操作的時候,將樣本提供的數(shù)據(jù)作為基礎點,以此可以在模型本身的復雜性特點以及學習能力之間能夠找出其中存在的平衡點位置,進而確保其效果能夠充分展現(xiàn)出來。由于當時還沒有大數(shù)據(jù)存在,因此該模型往往能夠在小樣本、分線性以及高維模式中得以應用,以此完成識別、檢測以及翻譯的工作[1]。
目前來看,SVM可以算是全世界應用率最高的學習模型。例如在愛進行線性可分的問題處理時,其可以將其中間隔最大的一個平面提取出來,以此將兩種完全不同的樣本分開。該平面本身具有很強的泛化能力。線性不可分一直都是一種十分普遍的情況,因此經常由于對偶的問題導致目標函數(shù)難以確定。為了處理這一問題,通常需要采取兩種方法,分別是軟間隔優(yōu)化以及核技巧。軟間隔優(yōu)化主要是依靠對于輸入空間采取一定限制的方式,以此將一些簡單的錯誤全部忽略。但是,如果有線性不可分的問題出現(xiàn),這種方法的效果便無法發(fā)揮。而核技巧主要是通過尋找核函數(shù)的方式,以此促使原本的低維空間全部轉變成高位空間,從而使得原來的數(shù)據(jù)全部能可分。這種方法的應用范圍同樣有限,因此在實際操作的時候,通常需要將這兩種方法結合在一起共同使用。
二、人工神經網絡
所謂人工神經網絡,也就是ANN,其主要是指對于人體大腦實際運行的方式進行學習,通常也會被簡稱為神經網絡。這種方式與數(shù)學概念中的統(tǒng)計學十分相似[2]。
一般而言,此類模型主要具備三方面優(yōu)勢。其一,其能夠自主完成學習任務。例如,人工神經網絡通過人臉識別的方式,可以將無數(shù)個臉部信息輸入到模型機器之中,此時網絡本身便能夠有效掌握這一方面的技能。通常情況下,此類技能在預測工作中有著非常好的應用效果,以此完成災難預測以及風險預測。其二,其本身具有聯(lián)想存儲的效果,主要依靠內部的反饋系統(tǒng),以此完成信息的獲取與分析,進而實現(xiàn)信息反饋。其三,能夠迅速找出具體問題所在,并提出有效的處理措施。如果采取人為的方式,在尋找最佳方案的時候,往往需要將所有方式全部都嘗試一次,顯然十分浪費時間。然而,計算機模型具有很強運能力行和計算速度,促使原本十分復雜的內容逐步簡單化,進而提升工作效率[3]。
相比于支持向量機,人工神經網絡本身具有自己獨有的優(yōu)勢。主要體現(xiàn)在對于非線性問題的處理方面,其效果更加,且擁有良好的適應能力,以此對早期模式在模擬、識別以及信息處理方面的缺陷,擴大具體的應用范圍。如果將神經網絡和其他多種不同的模型結合在一起,可以有效提升信息處理的效率,促使其向人工智能層們的發(fā)展更進一步?,F(xiàn)如今信息技術的發(fā)展速度越來越快,人工神經網絡也找到自身的發(fā)展方向,其實際運行的模式越來越人性化。例如,近些年出現(xiàn)的模糊系統(tǒng)、遺傳算法以及進化機制等,這些都是未來繼續(xù)研究的主要方向。一旦有所突破,數(shù)據(jù)分析的效率將會進一步加快。但是,人工神經網絡同樣有著自身缺陷,因此理應將其和其他技術形式結合在一起,提取其內部凈化,將糟粕全部提出,進而提升具體應用的效果。
三、機器學習模型的分類
在大數(shù)據(jù)背景下,機器學習模型的種類有很多。目前來看,最為常見的便是支持向量機以及人工神經網絡。從算法的角度思考,模型通??梢苑殖扇N。其一是監(jiān)督學習,主要是依靠計算機從大數(shù)據(jù)之中將相關信息內容全部提取出來,并對其具體結果展開驗證。這種方式能夠有效增強模型的學習能力,從而使其更好地完成后續(xù)的工作。其二是無監(jiān)督學習,主要是指計算機本身基于大數(shù)據(jù)背景,將相關信息全部截取下來。這種方式的目標往往具有一定的不確定性特點。其三是強化學習,主要是基于沒有大數(shù)據(jù)驗證的前提下,以此促使計算機完成自主評估工作。
四、結束語
綜上所述,在大數(shù)據(jù)背景下,越來越多的機器學習模型不斷出現(xiàn)。為此,相關人員理應對其優(yōu)勢和特點展開分析,并將其結合在一起,以此應用到不同的領域之中,進而改變人們的生活。
參考文獻:
[1] 焦嘉烽,李云,JIAOJiafeng,等.大數(shù)據(jù)下的典型機器學習平臺綜述[J].計算機應用,2017,37(11):3039-3047.
[2] 菅保霞,姜強,趙蔚,等.大數(shù)據(jù)背景下自適應學習個性特征模型研究——基于元分析視角[J].遠程教育雜志,2017,35(4):87-96.
[3] 孫存一,龔六堂,馬達鉿,盧友明等.大數(shù)據(jù)思維下的利率定價研究——以機器學習為視角的實證分析[J].金融理論與實踐,2017(7):1-5.