阿不都艾尼·阿不都肉素力
摘要:現(xiàn)代信息技術(shù)發(fā)展過程中,與現(xiàn)代統(tǒng)計學知識高度融合,從而衍生出計算機數(shù)據(jù)挖掘技術(shù)。計算機數(shù)據(jù)挖掘技術(shù),和大數(shù)據(jù)技術(shù)、云存儲技術(shù)共同發(fā)展,為社會生產(chǎn)與生活提供較多便利。該文注重開發(fā)計算機數(shù)據(jù)挖掘技術(shù),同時提出科學化處理對策,僅供參考。
關(guān)鍵詞:計算機數(shù)據(jù)挖掘技術(shù);開發(fā);應(yīng)用
中圖分類號:TP391? ? ? 文獻標識碼:A
文章編號:1009-3044(2022)03-0027-03
開放科學(資源服務(wù))標識碼(OSID):
在大數(shù)據(jù)時代下,數(shù)據(jù)信息量非常大,但由于數(shù)據(jù)完整性不足,所以既存在價值數(shù)據(jù),也存在垃圾數(shù)據(jù)。海量數(shù)據(jù)具備特殊意義,且數(shù)據(jù)背后隱藏重要知識信息,因此具備不完整性、隨機性、模糊性特點。在噪聲數(shù)據(jù)中,注重挖掘價值信息。數(shù)據(jù)挖掘,通過分析海量數(shù)據(jù),可以實現(xiàn)自動化分析,做好歸納整理,提取價值信息。利用上述信息,能夠為應(yīng)用對象提供便利性。企業(yè)、個體用戶可以有效評估市場,明確實施方案,按照市場政策變化,降低投資風險,效益顯著。同時,幫助行業(yè)應(yīng)對政策變化,提供最佳營銷手段與策略。當企業(yè)面臨資金、管理危機事件時,可以貢獻較多力量。
1 計算機數(shù)據(jù)挖掘技術(shù)過程概述
1.1明確數(shù)據(jù)庫與數(shù)據(jù)挖掘目的
數(shù)據(jù)挖掘技術(shù)功能較多,需要合理應(yīng)用技術(shù)措施,明確數(shù)據(jù)挖掘目的,按照目的選擇數(shù)據(jù)庫。由于計算機數(shù)據(jù)挖掘技術(shù),涉及多種數(shù)據(jù)挖掘方法,且不同數(shù)據(jù)挖掘目的、挖掘方法不同,所以選擇適宜挖掘方法,能夠保障數(shù)據(jù)挖掘結(jié)果準確性。此外,明確數(shù)據(jù)挖掘目的、數(shù)據(jù)庫,可以發(fā)揮出數(shù)據(jù)挖掘技術(shù)優(yōu)勢。
1.2數(shù)據(jù)選擇與預(yù)處理
明確數(shù)據(jù)挖掘目的與數(shù)據(jù)庫后,需要在數(shù)據(jù)庫內(nèi)提取目標數(shù)據(jù)。值得一提的是,維護目標數(shù)據(jù)內(nèi)信息,同時將目標數(shù)據(jù)作為數(shù)據(jù)挖掘范圍,即數(shù)據(jù)選擇。明確目標數(shù)據(jù)后,科學處理目標數(shù)據(jù),刪除錯誤信息、無用信息,留下有用信息。上述過程為預(yù)處理流程,能夠精簡目標數(shù)據(jù)。
1.3數(shù)據(jù)挖掘
第一,按照數(shù)據(jù)挖掘目的,明確數(shù)據(jù)挖掘技術(shù)類型、應(yīng)用算法。算法屬于數(shù)據(jù)挖掘精髓,通過科學算法,能夠提升數(shù)據(jù)挖掘結(jié)果可靠性,借鑒價值強。第二,數(shù)據(jù)挖掘算法是一種數(shù)學模型,按照數(shù)據(jù)挖掘算法,建立標準化數(shù)學模型。利用數(shù)據(jù)挖掘算法,準確處理目標數(shù)據(jù)。第三,在計算機系統(tǒng)中,通過算法挖掘數(shù)據(jù)信息,能夠獲得相關(guān)結(jié)果。
1.4評估結(jié)果
評估結(jié)果環(huán)節(jié),主要分析數(shù)據(jù)挖掘結(jié)果,做好科學化評估。通過數(shù)據(jù)挖掘技術(shù)獲取結(jié)果,但是要驗證結(jié)果正確性。當結(jié)果不滿足數(shù)據(jù)信息要求時,則重新選擇數(shù)據(jù)挖掘算法、數(shù)學模型。當結(jié)果滿足應(yīng)用要求時,將數(shù)據(jù)結(jié)果應(yīng)用到實踐操作中,指導(dǎo)后續(xù)工作,全面提升工作效率。
2 計算機數(shù)據(jù)挖掘技術(shù)開發(fā)
2.1傳統(tǒng)統(tǒng)計方法
在日常生活中,頻繁使用統(tǒng)計方法,將統(tǒng)計學知識落實到各領(lǐng)域。對于傳統(tǒng)統(tǒng)計學方法涉及內(nèi)容比較多,包含多元統(tǒng)計技術(shù)、統(tǒng)計預(yù)測技術(shù)、抽樣技術(shù)。其中,抽樣技術(shù)為重要統(tǒng)計方法,可以應(yīng)用到生活實踐中。在海量數(shù)據(jù)中,提取價值數(shù)據(jù),將其作為樣本信息??茖W分析樣本信息,展示數(shù)據(jù)信息,合理應(yīng)用抽樣技術(shù),減少統(tǒng)計量、數(shù)據(jù)分析量。統(tǒng)計預(yù)測技術(shù),包括序列分析、回歸分析等。多元統(tǒng)計分析,需要復(fù)雜數(shù)據(jù)結(jié)構(gòu),例如因子統(tǒng)計、數(shù)據(jù)統(tǒng)計等。
2.2可視化技術(shù)
在統(tǒng)計數(shù)據(jù)時,借助數(shù)據(jù)挖掘技術(shù)可以提升數(shù)據(jù)統(tǒng)計效率,同時確保數(shù)據(jù)統(tǒng)計結(jié)果滿足要求。但是,數(shù)據(jù)統(tǒng)計結(jié)果通常包含隱晦特征,為了掌握相關(guān)特征,需要利用圖表、散點圖方式,表達數(shù)據(jù)統(tǒng)計結(jié)果特征,使人們正確理解數(shù)據(jù)統(tǒng)計結(jié)果?;趯嵱媒嵌确治?,可視化技術(shù)無法實現(xiàn)高維數(shù)據(jù)可視化,高維數(shù)據(jù)在圖表中呈現(xiàn)難度大,但是能夠指導(dǎo)可視化技術(shù)發(fā)展,技術(shù)創(chuàng)新性強。
2.3決策樹
通過決策樹,能夠分類預(yù)測海量數(shù)據(jù),是一種新型數(shù)據(jù)挖掘技術(shù)。遵循標準化規(guī)則,建設(shè)科學的數(shù)據(jù)體系。決策樹計算方法較多,例如SPRINT、SLIQ等。通過上述算法,可以將訓練集歸納為決策樹,對分類屬性、連續(xù)屬性予以處理。
2.4遺傳算法
基于生物科學角度分析,計算機所具備的智能學習能力,必須注重數(shù)據(jù)結(jié)合、數(shù)據(jù)突變過程整合。處理數(shù)據(jù)信息時,淘汰不合理數(shù)據(jù),留存優(yōu)質(zhì)數(shù)據(jù)信息,使其成為新數(shù)據(jù)組合。數(shù)據(jù)優(yōu)化處理后,能夠提升數(shù)據(jù)信息適應(yīng)度。遺傳算法理論,可以支持數(shù)據(jù)挖掘技術(shù)開發(fā),屬于標準化處理方法。準確定位數(shù)據(jù)挖掘技術(shù),以決策數(shù)據(jù)為核心技術(shù),擴大技術(shù)開發(fā)應(yīng)用范圍,對決策者知識儲備要求低,既可以展示出數(shù)據(jù)挖掘優(yōu)勢,還可以研發(fā)全新的技術(shù)措施。
2.5聯(lián)機分析處理
基于本質(zhì)分析可知,聯(lián)機分析處理可以通過多計算機系統(tǒng),對某個具體問題進行分析。計算機連接性,采用多數(shù)據(jù)節(jié)點方式分析數(shù)據(jù)信息。針對應(yīng)用對象,注重聯(lián)機分析處理,即多維數(shù)據(jù)。聯(lián)機分析處理程序,可以劃分為主計算機任務(wù)、其他聯(lián)機計算機任務(wù),圍繞主計算機提出科學分配方案,準確計算數(shù)據(jù)并進行統(tǒng)計分析。
2.6計算機神經(jīng)網(wǎng)絡(luò)
基于計算機神經(jīng)網(wǎng)絡(luò),獲取計算機網(wǎng)絡(luò)研究成果,模擬人體神經(jīng)網(wǎng)絡(luò),生成輸入單元、處理單元、輸出單元。在數(shù)據(jù)處理中應(yīng)用計算機網(wǎng)絡(luò),能夠調(diào)整計算數(shù)據(jù)信息,歸納整理計算結(jié)果。
2.7粗糙集
當缺少數(shù)據(jù)知識時,粗糙集能夠?qū)?shù)據(jù)分類能力進行考察,分析和處理不確定數(shù)據(jù)、模糊數(shù)據(jù)。在數(shù)據(jù)庫體系中,合理應(yīng)用粗糙集,能夠發(fā)現(xiàn)分類規(guī)則,同時將數(shù)據(jù)庫屬性劃分為條件屬性、結(jié)論屬性。針對數(shù)據(jù)庫內(nèi)部元組,按照不同屬性值劃分為對應(yīng)子集,合理劃分條件屬性、結(jié)論屬性,從而生成判定規(guī)則。因此,具備相似對象集合,可以稱為初等集合,將其作為知識組成成分。對于初等集合并集,可以納入精確集合,同時整理為粗糙集。不同粗糙集擁有不同邊界元素,但是不能劃分為集合元素,也不能作為集合元素的補充元素。在數(shù)據(jù)挖掘分類中,可以應(yīng)用粗糙集理論,能夠及時發(fā)現(xiàn)噪聲數(shù)據(jù)、異常數(shù)據(jù)內(nèi)部結(jié)構(gòu)。
2.8支持向量機
隨著統(tǒng)計學習理論的發(fā)展,逐漸出現(xiàn)支持向量機,屬于新型機器學習方法?;诮Y(jié)構(gòu)風險最小化原則,加強學習泛化能力,推廣性能、分類精確性能顯著,可以處理學習問題,形成訓練多層感知器、多項式神經(jīng)元網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò)等。同時,支持向量法屬于凸優(yōu)化問題,局部最優(yōu)解為全局最優(yōu)解,上述特點為神經(jīng)元網(wǎng)絡(luò)算法無法企及的優(yōu)勢。在數(shù)據(jù)挖掘分類、回歸、未知事物探索中,合理應(yīng)用支持向量機。
2.9關(guān)聯(lián)規(guī)則
關(guān)聯(lián)規(guī)則屬于實用性分析規(guī)則,可以描述事物屬性、模式與規(guī)律,屬于數(shù)據(jù)挖掘中的成熟技術(shù)。在數(shù)據(jù)挖掘領(lǐng)域,應(yīng)用關(guān)聯(lián)規(guī)則的價值顯著,能夠掌握數(shù)據(jù)規(guī)律,不會受到單一因變量限制。大部分關(guān)聯(lián)規(guī)則挖掘算法,可以發(fā)現(xiàn)隱藏挖掘數(shù)據(jù)的關(guān)聯(lián)性,但并非所有關(guān)聯(lián)屬性都具備應(yīng)用價值,必須做好科學化評價,篩選高價值關(guān)聯(lián)規(guī)則。
3 計算機數(shù)據(jù)挖掘技術(shù)的應(yīng)用實踐
3.1市場營銷中的應(yīng)用
在現(xiàn)代生活發(fā)展中,多數(shù)消費者購物都傾向于刷卡操作,在此操作中,銷售商可以采集到消費者信息。消費者數(shù)量持續(xù)增加,銷售商可以采集到價值信息,便于開展市場營銷活動。不同銷售商、生產(chǎn)廠家,根據(jù)價值信息采集,對消費者實際需求、購物習慣進行分析,掌握消費者消費時間,對消費者下步消費行為進行推斷。例如,企業(yè)收集消費者信用卡使用數(shù)據(jù),掌握商品銷售情況,同時,通過促銷活動掌握消費意向。開展上述工作,比較依賴數(shù)據(jù)挖掘技術(shù)。企業(yè)通過數(shù)據(jù)挖掘技術(shù),可以掌握消費群體需求,同時為企業(yè)決策制定提供數(shù)據(jù)依據(jù),加強企業(yè)市場競爭力?;诳傮w分析可知,將數(shù)據(jù)挖掘技術(shù)應(yīng)用到市場營銷中,可以應(yīng)用數(shù)據(jù)庫營銷、貨籃分析方式。數(shù)據(jù)庫營銷,通過模型預(yù)測、交互式查詢方式,篩選企業(yè)潛在客戶,同時針對性推銷產(chǎn)品。
3.2金融投資中的應(yīng)用
在金融分析中,股票教育預(yù)測、投資評估,屬于重要內(nèi)容。通過模型預(yù)測法、統(tǒng)計回歸技術(shù)法開展。與其他行業(yè)相比,金融投資風險大,投資前必須做好數(shù)據(jù)分析,既可以規(guī)避投資風險,還可以明確投資方向。事物發(fā)展過程中,會呈現(xiàn)出增長趨勢,所以要做好科學預(yù)測,將其與交易市場預(yù)測、投資評估放在同等重要地位。在研究分析時,通過計算機數(shù)據(jù)分析推理相關(guān)內(nèi)容。在現(xiàn)有數(shù)據(jù)處理中,按照存在關(guān)系,挖掘深層次數(shù)據(jù),并根據(jù)數(shù)據(jù)模型進行預(yù)測。同時,在商業(yè)銀行機構(gòu)中,也開始廣泛應(yīng)用數(shù)據(jù)挖掘技術(shù)。銀行經(jīng)營管理時常出現(xiàn)詐騙、惡意投資行為,增加經(jīng)濟損失,所以必須準確預(yù)測和鑒別欺詐行為。按照筆者研究可知,銀行機構(gòu)在鑒別詐騙行為時,主要采用對比正常行為、詐騙行為方式,以此獲取詐騙行為特征。審核人員預(yù)警特征人員,加大審查力度,拒絕提供服務(wù)。在商業(yè)銀行體系中,合理應(yīng)用計算機數(shù)據(jù)挖掘技術(shù),借助銀行業(yè)系統(tǒng)調(diào)取客戶信息,例如流水、資金、存款與信貸等。深入分析相關(guān)數(shù)據(jù)信息,可以掌握抵押物、償債能力,評估交易風險,推理詐騙行為。將審查結(jié)果提交至技術(shù)人員審核,通過此種方式,可以降低商業(yè)銀行詐騙行為。
3.3電子商務(wù)網(wǎng)站中的應(yīng)用
隨著互聯(lián)網(wǎng)技術(shù)快速發(fā)展,電子商務(wù)網(wǎng)站成為企業(yè)、商家必爭方式,電子商務(wù)網(wǎng)站在線交易會產(chǎn)生海量登記表、記錄文件。將計算機數(shù)據(jù)挖掘技術(shù)應(yīng)用到電子商務(wù)中,可以深度分析數(shù)據(jù)信息,確保商家掌握消費者購買喜好、模式等,滿足不同層次消費需求,也可以為企業(yè)、商家提供擴大市場份額的機會。合理應(yīng)用計算機數(shù)據(jù)挖掘技術(shù),深度挖掘消費者背景信息、瀏覽者點擊量??蛻舻怯洷頌槿ケ尘靶畔?,點擊量則是考察客戶行為的重要方式。然而,客戶不會在登記表中填寫所有信息,致使數(shù)據(jù)挖掘與分析難度比較大?;跒g覽者多項表現(xiàn)數(shù)據(jù),可以準確推測和應(yīng)用背景信息。
3.4在半導(dǎo)體領(lǐng)域中的應(yīng)用
在半導(dǎo)體領(lǐng)域中,合理應(yīng)用計算機數(shù)據(jù)挖掘技術(shù),可以有效作用到軟件檢測中。在生產(chǎn)半導(dǎo)體元件時,利用元件信息采集,可以準確分析和檢測元件信息,確保元件性能質(zhì)量達標后,
再應(yīng)用到半導(dǎo)體中。因此,借助計算機數(shù)據(jù)挖掘技術(shù),能夠判斷元件合格準確率,以免應(yīng)用到不合格商品。此外,在金融投資中,合理應(yīng)用計算機數(shù)據(jù)挖掘技術(shù),可以為金融投資提供參考。將計算機數(shù)據(jù)挖掘技術(shù)應(yīng)用到電子商業(yè)中,既可以推斷消費者喜好,還可以為消費者提供目標產(chǎn)品,減少消費時間浪費,實現(xiàn)快速銷售目的。例如,京東、淘寶等購物網(wǎng)站,都應(yīng)用了計算機數(shù)據(jù)挖掘技術(shù)。
4 結(jié)束語
綜上所述,現(xiàn)代經(jīng)濟快速發(fā)展背景下,各行業(yè)對數(shù)據(jù)信息的依賴度加強,有助于提升數(shù)據(jù)挖掘技術(shù)開發(fā)與應(yīng)用價值。大數(shù)據(jù)挖掘技術(shù),可以影響多行業(yè)領(lǐng)域發(fā)展,比如市場營銷、金融投資、電子商務(wù)網(wǎng)站、半導(dǎo)體領(lǐng)域等,在不同領(lǐng)域中的應(yīng)用,均可以掌握行業(yè)發(fā)展規(guī)律,提出科學化發(fā)展策略與建議,以此展示出計算機數(shù)據(jù)挖掘技術(shù)的應(yīng)用價值。
參考文獻:
[1] 段冬,張嫻.大數(shù)據(jù)背景下人工智能在計算機網(wǎng)絡(luò)技術(shù)中的應(yīng)用研究[J].電腦知識與技術(shù),2021,17(9):179-180,190.
[2] 徐夢馨,高德立,柳景.大數(shù)據(jù)背景下數(shù)據(jù)挖掘技術(shù)在檔案管理系統(tǒng)中的運用[J].信息與電腦(理論版),2021,33(2):28-30.
[3] 趙云.基于大數(shù)據(jù)的計算機數(shù)據(jù)挖掘技術(shù)在檔案管理系統(tǒng)中的應(yīng)用[J].中國新通信,2020,22(22):113-114.
[4] 黃毅能,吳旭東,多曉偉.數(shù)據(jù)挖掘技術(shù)在電商平臺中的應(yīng)用——以陶瓷餐具的電商營銷為例[J].現(xiàn)代營銷(經(jīng)營版),2020(10):112-113.
[5] 范海峰.數(shù)據(jù)挖掘技術(shù)在計算機網(wǎng)絡(luò)病毒防御系統(tǒng)開發(fā)中的應(yīng)用[J].電子技術(shù)與軟件工程,2020(17):236-237.
[6] 車全偉,雷成,李玉如,等.基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘模型在吸能裝置上的應(yīng)用[J].西南交通大學學報,2021,56(5):995-1001.
[7] 徐承俊,朱國賓.數(shù)據(jù)挖掘在全國計算機等級考試(NCRE)成績分析中的研究及應(yīng)用[J].計算機應(yīng)用與軟件,2020,37(8):64-67,73.
[8] 劉各巧.數(shù)據(jù)挖掘技術(shù)研究以及在檔案計算機管理系統(tǒng)中的應(yīng)用[J].太原城市職業(yè)技術(shù)學院學報,2020(7):199-201.
[9] 姜齊艷,王魯平.基于數(shù)據(jù)挖掘與神經(jīng)網(wǎng)絡(luò)的財務(wù)異常數(shù)據(jù)監(jiān)測分析算法[J].電子設(shè)計工程,2020,28(11):14-17,22.
[10] 夏天維. 計算機數(shù)據(jù)挖掘技術(shù)的開發(fā)及其應(yīng)用探究[C]//“決策論壇——管理科學與工程研究學術(shù)研討會”論文集(下).《決策與信息》雜志社、北京大學經(jīng)濟管理學院:《科技與企業(yè)》編輯部,2016:241.
【通聯(lián)編輯:唐一東】