保定職業(yè)技術(shù)學(xué)院 李曉敏
現(xiàn)在我們的生活中,許多事物的發(fā)展都與大數(shù)據(jù)分析息息相關(guān)。2020年經(jīng)濟發(fā)展中的各項數(shù)據(jù)為2021年經(jīng)濟發(fā)展指明了方向,也為在前一年經(jīng)濟發(fā)展中容易觸發(fā)的經(jīng)濟發(fā)展問題提供了更加穩(wěn)妥的發(fā)展途徑。在2020年各行各業(yè)發(fā)展的巨大變化的大數(shù)據(jù)分析中,許多在2021年從事創(chuàng)新創(chuàng)業(yè)工作的人選擇了更加穩(wěn)妥和抗擊風(fēng)險性強的創(chuàng)業(yè)領(lǐng)域。從以上例子中我們可以看出,大數(shù)據(jù)時代下,每一個數(shù)據(jù)分析成果都是決定我們生活和未來發(fā)展的風(fēng)向標,而在大數(shù)據(jù)分析過程中人工智能技術(shù)的發(fā)展又需要依托于數(shù)據(jù)分析支撐,大數(shù)據(jù)分析已經(jīng)成為新一代科學(xué)技術(shù)發(fā)展產(chǎn)物不斷優(yōu)化所必須掌握的一項分析方法。
從20世紀五十年代開始,“人工智能”這個概念第一次被提出,到現(xiàn)今人工智能技術(shù)的快速發(fā)展引領(lǐng)科技潮流,不過短短幾十年間人工智能技術(shù)的發(fā)展就成為人類生活不可或缺的一項技術(shù)。機器也能有思維,機器也能與人對話。這一觀念的不斷發(fā)展,成為現(xiàn)今人工智能技術(shù)發(fā)展的基礎(chǔ)思想。20世紀九十年代人工智能技術(shù)在經(jīng)歷了科學(xué)發(fā)展低谷期后,在大數(shù)據(jù)分析技術(shù)的誕生后又煥發(fā)出新的活力,國內(nèi)國外的人工智能技術(shù)不斷取得創(chuàng)新突破。阿里巴巴、騰訊、小米等互聯(lián)網(wǎng)公司在人工智能技術(shù)的研究上不斷取得較好的成績,隨著我國經(jīng)濟發(fā)展不斷加快,人民生活水平的不斷提高,人工智能技術(shù)已經(jīng)進入到千家萬戶,人工智能進入了新的發(fā)展時期。
“語音控制”“遠程遙控”“智能對話”已經(jīng)成為現(xiàn)在許多電子產(chǎn)品和智能管理系統(tǒng)的標準配置,人工智能技術(shù)不僅在辦公場所、商業(yè)場所中得到應(yīng)用,更進入許多家庭,“智能家居”成為現(xiàn)代裝修的首選??梢娙斯ぶ悄艿陌l(fā)展正處在新發(fā)展階段,在不斷發(fā)展的過程中已經(jīng)取得了較好的成績。
大數(shù)據(jù)分析這一技術(shù),誕生于2005年,從這一時期開始大數(shù)據(jù)分析技術(shù)就成為許多科技產(chǎn)業(yè)和商業(yè)化科技產(chǎn)業(yè)的重要發(fā)展技術(shù)。從我國的幾個發(fā)展較為快速的商業(yè)產(chǎn)業(yè)來說,阿里巴巴、騰訊、小米等互聯(lián)網(wǎng)公司的發(fā)展依托于大數(shù)據(jù)分析技術(shù)不斷適應(yīng)用戶口味,制造出符合市場需求的新興產(chǎn)品,快速打開數(shù)碼市場,消費增長速度持續(xù)上升。我國在十三五重點規(guī)劃項目中已經(jīng)將大數(shù)據(jù)作為一項重點項目,可見大數(shù)據(jù)的應(yīng)用對國家發(fā)展、社會發(fā)展以及經(jīng)濟發(fā)展具有重要的作用。
大數(shù)據(jù)分析,也就是在科學(xué)技術(shù)的發(fā)展過程中對大量的信息數(shù)據(jù)進行分析,在分析這些數(shù)據(jù)的過程中將這些數(shù)據(jù)中蘊藏的信息進行提煉、分類、總結(jié),在這些信息中尋找有價值的信息內(nèi)容從而再獲得極大價值的一個分析過程。大數(shù)據(jù)分析對于國家發(fā)展及社會進步具有重要價值,對于現(xiàn)今各行各業(yè)的發(fā)展具有不可忽視的作用。
數(shù)據(jù)的可視化,就是將數(shù)據(jù)從簡單的數(shù)字形式的呈現(xiàn)方式轉(zhuǎn)變?yōu)榭梢暬膱D表或者圖形、立體化圖案等可視化的直觀呈現(xiàn)方式,人們在閱讀可視化圖表或者觀察可視化數(shù)據(jù)圖案時,能夠清晰地感受到數(shù)據(jù)之間的差異,快速定位數(shù)據(jù)中需要的內(nèi)容,在直觀地分析過程中理解數(shù)據(jù)內(nèi)容,實現(xiàn)快速運用的作用。數(shù)據(jù)的可視化不僅包括數(shù)據(jù)信息的符號表達技術(shù),還包括數(shù)據(jù)的可視化交互技術(shù)、數(shù)據(jù)可視化模型技術(shù)等,這些可視化技術(shù)成為數(shù)據(jù)表示的形象基礎(chǔ)建設(shè)技術(shù)。隨著我國科學(xué)技術(shù)的發(fā)展與教育水平的要求不斷提升,現(xiàn)代化教育方式要求科學(xué)技術(shù)與教育相融合,大數(shù)據(jù)分析技術(shù)也與教育逐漸融合,成為現(xiàn)今教育工作開展中將教育效果有效提升、教育方法增加的重要方式。在大數(shù)據(jù)分析的支持下,對不同地區(qū)學(xué)生的教學(xué)數(shù)據(jù)進行分析,我們可以直觀地看出學(xué)生在不同地區(qū)所學(xué)知識的差別和對知識的理解程度存在的差異性,這些數(shù)據(jù)又可以通過數(shù)據(jù)的可視化表現(xiàn)出來,讓負責(zé)教育工作的人員以更加直觀的效果感受數(shù)據(jù)之間存在的差異性。對于教育工作來說,通過數(shù)據(jù)分析及時找到不同地區(qū)學(xué)生之間學(xué)習(xí)水平存在差異的原因,找到阻礙教育質(zhì)量提升的問題之所在,最后再整改和優(yōu)化教育方法和教育內(nèi)容后再對后期數(shù)據(jù)進行分析,在大數(shù)據(jù)支持下又可以直觀的了解教育工作整改的效果,這是大數(shù)據(jù)分析以及數(shù)據(jù)可視化帶給教育領(lǐng)域工作的一項便利。
對于學(xué)生來說,許多地區(qū)受到自然環(huán)境或者教學(xué)條件的限制,對于一些教學(xué)內(nèi)容不能完全理解,這樣的現(xiàn)象廣泛存在于我國偏遠地區(qū)的教育工作中。使用互聯(lián)網(wǎng)的遠程教學(xué)能夠讓學(xué)生遠程學(xué)習(xí)來自優(yōu)質(zhì)教學(xué)資源的課程,但是對于一些需要親眼看到或者了解的內(nèi)容卻始終難以做到讓學(xué)生感受。數(shù)據(jù)的可視化將學(xué)生的課程體驗提升了一個層次,在教學(xué)中讓學(xué)生以數(shù)據(jù)可視化的形式了解了更多與所學(xué)知識相關(guān)的數(shù)據(jù),提升了教學(xué)興趣。
人工智能技術(shù)的大數(shù)據(jù)分析方法應(yīng)用中,首先要先進行大數(shù)據(jù)的聚集,將海量的數(shù)據(jù)收集到一個數(shù)據(jù)收集算法的數(shù)據(jù)庫中,再將這些數(shù)據(jù)通過各種計算方法實現(xiàn)下一步的分類、篩選等步驟。大數(shù)據(jù)的聚集現(xiàn)今主要運用的技術(shù)有兩種,分別是MapReduce算法、K-means算法,這兩種算法都在實際應(yīng)用中具有一定的應(yīng)用效果。MapReduce算法能夠大幅度的提升算法的聚集效果,在計算的過程中能夠有效降低計算機計算的復(fù)雜程度,使得計算過程盡量簡單。MapReduce算法在不斷的發(fā)展中逐漸適應(yīng)學(xué)習(xí)深度,在提取數(shù)據(jù)特征的過程中優(yōu)化算法,使得計算過程越來越被更多使用者接受。K-means算法作為另外一種典型的聚集算法,在使用中主要將研究方向指向提升大數(shù)據(jù)處理速度以及這種算法的應(yīng)用性能上。K-means算法的優(yōu)化過程中,不斷改進迭代計算的不穩(wěn)定性,在計算過程中減小計算誤差,也具有較為廣泛的應(yīng)用面。大數(shù)據(jù)的聚集過程應(yīng)用上述兩種算法使得數(shù)據(jù)收集更加便捷和快速,大數(shù)據(jù)分析邁出了第一步。
大數(shù)據(jù)的關(guān)聯(lián)分析是對大數(shù)據(jù)聚集的各種數(shù)據(jù)進行關(guān)聯(lián)以及分析的過程,在這一過程中大數(shù)據(jù)分析將找到更多有價值的信息。Apriori算法是一種常用的大數(shù)據(jù)關(guān)聯(lián)分析挖掘計算算法,在這一算法的計算過程中,主要的計算原理是先設(shè)定一個支持度閾值,在數(shù)據(jù)算法運行的過程中符合這一支持度閾值的數(shù)據(jù)將被標記關(guān)聯(lián)。但Apriori算法有兩點不足之處,由于Apriori算法的時間成本較大,所耗費的時間較長,對于快速發(fā)展的數(shù)據(jù)時代具有一定的發(fā)展局限性,二是Apriori算法在計算的廣度上有所欠缺,難以將計算出的數(shù)據(jù)的關(guān)聯(lián)性加強。FP-Growth算法的關(guān)聯(lián)分析過程,是將數(shù)據(jù)構(gòu)建成一個數(shù)據(jù)樹,F(xiàn)P-Growth算法的計算過程通過兩次的分析能夠?qū)?shù)據(jù)中存在的關(guān)聯(lián)項分析并標記,大量節(jié)約了時間成本,對于大型數(shù)據(jù)庫的關(guān)聯(lián)分析計算,F(xiàn)P-Growth算法具有較高的應(yīng)用價值。
大數(shù)據(jù)關(guān)聯(lián)計算后,經(jīng)過數(shù)據(jù)分析得出已經(jīng)關(guān)聯(lián)的數(shù)據(jù)進入了一個數(shù)據(jù)庫中,在這數(shù)據(jù)庫中通過并行化的算法處理將其引入數(shù)據(jù)平臺。大數(shù)據(jù)關(guān)聯(lián)的應(yīng)用直接與大數(shù)據(jù)預(yù)測緊密聯(lián)系,大數(shù)據(jù)平臺中的數(shù)據(jù)經(jīng)過分析后,可以直接對所需要的行業(yè)數(shù)據(jù)進行對比分析,找到需要的數(shù)據(jù)內(nèi)容。將大數(shù)據(jù)平臺中的數(shù)據(jù)內(nèi)容分析后得出的結(jié)論,對于指導(dǎo)行業(yè)發(fā)展具有較高的數(shù)據(jù)支撐作用,引導(dǎo)未來經(jīng)濟走向。在智能網(wǎng)絡(luò)的應(yīng)用中,數(shù)據(jù)的檢索以及數(shù)據(jù)的分析都需要利用到大數(shù)據(jù)關(guān)聯(lián)分析,在分析的過程中直接檢索出與檢索內(nèi)容相關(guān)的數(shù)據(jù),直觀的展現(xiàn)出數(shù)據(jù)內(nèi)容。在現(xiàn)今快速發(fā)展的人工智能語音等科技產(chǎn)品種,大數(shù)據(jù)關(guān)聯(lián)應(yīng)用直接與人工智能的后臺連接,當(dāng)使用者說出語音指令,大數(shù)據(jù)關(guān)聯(lián)直接索引到一系列關(guān)鍵詞,在使用的過程中起到提升使用快感,提高產(chǎn)品性價比的作用。
在人工智能技術(shù)的大數(shù)據(jù)分析方法使用中,需要對大數(shù)據(jù)分析方法進行嚴謹試驗,保證大數(shù)據(jù)分析中使用的算法與實際需求相匹配,減少使用中出現(xiàn)的卡頓問題。大數(shù)據(jù)時代下,信息更新速度快,信息產(chǎn)生時間短,在這些信息特質(zhì)下需要大數(shù)據(jù)分析方法中的各種算法具有較高的計算準確性,計算速度。例如在選擇大數(shù)據(jù)關(guān)聯(lián)分析的算法時,選擇FP-Growth算法對于未來人工智能技術(shù)的快速發(fā)展來說,更具有前瞻性。對于商業(yè)領(lǐng)域來說,由于投入生產(chǎn)的人工智能產(chǎn)品受到使用年限以及使用次數(shù)的限制,生產(chǎn)者在選擇算法時更應(yīng)該選擇計算性能較為優(yōu)越的算法,算法應(yīng)該在計算過程中具有較為穩(wěn)定的模型,具有計算深度和計算廣度,為未來科學(xué)技術(shù)發(fā)展做好準備,實現(xiàn)人工智能技術(shù)的優(yōu)化。
21世紀科學(xué)技術(shù)的快速發(fā)展背景下,人工智能技術(shù)的應(yīng)用使人們的生活更便捷化,對于現(xiàn)今社會發(fā)展來說具有不可替代的重要作用。從現(xiàn)在人工智能技術(shù)的發(fā)展速度來看,未來十年甚至只在未來五年內(nèi),人工智能技術(shù)的發(fā)展都會發(fā)生較大的變化。為了適應(yīng)快速發(fā)展的人工智能技術(shù),大數(shù)據(jù)分析方法的使用需要緊跟時代腳步,根據(jù)現(xiàn)有的技術(shù)手段以及算法模型,不斷優(yōu)化與提升技術(shù),使得人工智能技術(shù)的大數(shù)據(jù)分析方法有更多的發(fā)展空間,提升使用實用性。