浙江安遠(yuǎn)檢測技術(shù)有限公司 朱賦陽
隨著我國社會的發(fā)展,我國互聯(lián)網(wǎng)行業(yè)又有了顯著的提升,今天我們主要討論在計算機軟件工程中的數(shù)據(jù)挖掘技術(shù)的各項應(yīng)用。數(shù)據(jù)挖掘簡單看就是在強大的數(shù)據(jù)庫中,可以快速且準(zhǔn)確到提取到需要的信息,可以更方便地為我們進(jìn)行軟件的開發(fā)以及管理。為了使人們有很好的體驗,就需要我們在數(shù)據(jù)軟件開發(fā)的階段進(jìn)行相應(yīng)的管理,使得對一些復(fù)雜的數(shù)據(jù)能夠進(jìn)行更深層次的挖掘,就是在實際的軟件工程當(dāng)中,數(shù)據(jù)挖掘的時間并不長,在相應(yīng)的理論分析和結(jié)果表明,數(shù)據(jù)挖掘技術(shù)在軟件工程上起著十分顯著的作用。具體來看,無論是銀行、保險或者數(shù)據(jù)領(lǐng)域都有著一定的推進(jìn)作用,甚至在醫(yī)遼、教育方面數(shù)據(jù)挖掘技術(shù)也有著很重要的運用。數(shù)據(jù)挖掘技術(shù)應(yīng)用在多個方面,比如說在開發(fā)軟件運行過程當(dāng)中,我們可以利用數(shù)據(jù)挖掘技術(shù)對軟件的質(zhì)量進(jìn)行相應(yīng)的分析,從而制定更合理的數(shù)據(jù)資源,避免我們在以后的工作中有錯誤產(chǎn)生?;诖?,本篇文章對計算機軟件工程中的數(shù)據(jù)挖掘技術(shù)的應(yīng)用進(jìn)行研究,以供參考。
數(shù)據(jù)挖掘是一個新的概念,主要是從低密度元數(shù)據(jù)中選擇具有相對價值的信息數(shù)據(jù),從而大大提高了數(shù)據(jù)的使用。因此,將數(shù)據(jù)挖掘科學(xué)應(yīng)用于計算機軟件工程可以確保元數(shù)據(jù)處理的質(zhì)量和效率,從而優(yōu)化重要數(shù)據(jù)的使用[1]。因此,如何將數(shù)據(jù)勘探科學(xué)應(yīng)用于計算機軟件工程的問題需要由技術(shù)人員加以研究和解決。
數(shù)據(jù)挖掘技術(shù),顧名思義就是在一個龐大的數(shù)據(jù)環(huán)境之下,我們能夠有效的對我們所需要的數(shù)據(jù)信息進(jìn)行相應(yīng)的提取,可以對這些信息進(jìn)行相應(yīng)的分類和分析,使得這些信息更明確。在數(shù)據(jù)信息無處不在的網(wǎng)絡(luò)世界,相應(yīng)的軟件工程所擁有的信息是雜亂且龐大的,而數(shù)據(jù)信息的存在是直接影響軟件開發(fā)的,為了提高軟件開發(fā)的工作速率,我們會利用數(shù)據(jù)挖掘技術(shù),對信息處理有一個質(zhì)的提升,而且還能有效地對信息進(jìn)行篩選,能夠及時的實現(xiàn)數(shù)據(jù)傳輸,使我們獲得的信息是簡單且有利的。一般來說,我們主要將數(shù)據(jù)挖掘工作分為3 個層次:(1)交互式可視數(shù)據(jù)探查;(2)自動模式提取;(3)模型構(gòu)建。三個層次互相協(xié)作,相互遞進(jìn),能夠使我們大量的數(shù)據(jù)信息進(jìn)行合理的分類。在實際的應(yīng)用過程中,數(shù)據(jù)挖掘技術(shù)能夠合理的將數(shù)據(jù)進(jìn)行分析和分類,能夠幫助我們在日后工作中對于各類數(shù)據(jù)的運用。
隨著技術(shù)的發(fā)展,數(shù)據(jù)挖掘有著很多的方法,最常用的有算法種類、軸線型數(shù)據(jù)挖掘法以及環(huán)形數(shù)據(jù)挖掘法。
(1)算法種類:算法種類一般用于大數(shù)據(jù)之中,在數(shù)據(jù)加工時有著明確的要求,我們在對算法類型進(jìn)行分析時,首先會使用分類算法以及回歸算法作為首要方法,在本質(zhì)視角來看,在進(jìn)行大數(shù)據(jù)分析時,我們會結(jié)合不同的算法方式來進(jìn)行數(shù)據(jù)挖掘工作,使我們的工作能夠順利進(jìn)行,而且這種方法能夠?qū)?shù)據(jù)挖掘利用抽象的形式表現(xiàn)出來,這種方法相對來說在數(shù)據(jù)中的適應(yīng)能力比較強,對于一般的數(shù)據(jù)挖掘來說,它有著更顯著的可復(fù)制性以及適用性,深受人們信賴。
(2)軸線型數(shù)據(jù)挖掘法:這種方法主要是利用軸線,軸線的始終點作為數(shù)據(jù)挖掘的兩個重要代表,這種方法相對來說具有明顯的操作性,而且更方便人們修改。但是軸線型數(shù)據(jù)挖掘方法也存在一些不足,相對其他范圍來說,這種方法的挖掘速度較慢,就是總體來說這種方法還是在數(shù)據(jù)挖掘工作時比較常見的一種方法。
(3)環(huán)形數(shù)據(jù)挖掘法:環(huán)形數(shù)據(jù)挖掘法就是將數(shù)據(jù)布局在一個環(huán)節(jié)當(dāng)中,使得數(shù)據(jù)在輸入和輸出時對于數(shù)據(jù)分析有一個充分的體現(xiàn),使人們更加直觀的可以了解到各類數(shù)據(jù)信息,更方便于人們對數(shù)據(jù)的獲取。而且每次數(shù)據(jù)挖掘的結(jié)果可以有效的和后續(xù)挖掘到的數(shù)據(jù)循環(huán)結(jié)合在一起,能夠使數(shù)據(jù)有一個往復(fù)的狀態(tài),經(jīng)過大量實驗表明這種方法可以明顯的看出數(shù)據(jù)利用率較高,且挖掘速度比較快,由于是環(huán)形數(shù)據(jù)信息,它能夠持續(xù)的進(jìn)行挖掘工作,但是它的流程比較復(fù)雜,在實際操作時有一定難度[2]。
隨著我國的網(wǎng)絡(luò)不斷發(fā)展,相應(yīng)的信息技術(shù)也有了顯著地提高,而我們所運用數(shù)據(jù)挖掘技術(shù)在各行各業(yè)都有了廣泛的應(yīng)用,同樣的也是因為數(shù)據(jù)挖掘技術(shù)可以為人們提供很多便利,它可以保障信息的基本安全。數(shù)據(jù)挖掘技術(shù)在使用的時候它的特點尤為明顯,就比如說精準(zhǔn)、高效還有很強的預(yù)見性。在使用之前,會將我們所涉及的數(shù)據(jù)信息進(jìn)行一個大量的收集,在經(jīng)過自身對其分析運用,它本身的病毒監(jiān)測以及信息提取能夠進(jìn)行各種網(wǎng)絡(luò)風(fēng)險預(yù)估,這樣就會使得我們的計算機在使用時更加安全有效。雖然說數(shù)據(jù)挖掘技術(shù)能夠及時發(fā)現(xiàn)計算機的病毒,但是在實際的運用過程中也有一定的缺陷。就比如說數(shù)據(jù)挖掘技術(shù)在使用的時候,由于數(shù)據(jù)源形式多樣,很容易在運用中導(dǎo)致數(shù)據(jù)缺失等,再加上網(wǎng)絡(luò)的分布情況以及環(huán)境數(shù)據(jù)挖掘技術(shù)并不完善,這也在一定程度上影響整個數(shù)據(jù)挖掘技術(shù)的使用感受,所以說就要求我們的相關(guān)部門加強對數(shù)據(jù)挖掘技術(shù)的研究,及時對數(shù)據(jù)挖掘技術(shù)進(jìn)行優(yōu)化和改善,以此來提高我們數(shù)據(jù)挖掘技術(shù)的使用效率。
隨著我國網(wǎng)絡(luò)技術(shù)的發(fā)展,以及數(shù)據(jù)挖掘技術(shù)的創(chuàng)新,為了使軟件在執(zhí)行過程中所涉及的各項數(shù)據(jù)能夠及時分析以及挖掘,我們的技術(shù)人員通過在處理程序的基礎(chǔ)上,建立了全方位的分析處理,能夠使得軟件在運行的過程中更加準(zhǔn)確,所以說在進(jìn)行分析和挖掘時所記錄的數(shù)據(jù),需要我們提前確定好安裝路徑,還可以采用逆向建模的方法,將我們所需要的數(shù)據(jù)信息分析到實處,防止我們在以后的工作過程中所需要[3]。除此之外,我們的技術(shù)人員還應(yīng)該及時關(guān)注軟件在實際的運行過程中可能出現(xiàn)的漏洞或者其他問題,并且要及時作出解決方法,以此來確保我們軟件本身的性能問題。我們更要對程序本身所具有的規(guī)則有深刻的了解,而且程序的各項規(guī)約挖掘都是通過對執(zhí)行跟蹤的各項相關(guān)程序所進(jìn)行全方位的分析,并且能夠及時發(fā)現(xiàn)和解決由程序代碼所涉及的各項協(xié)議。除此之外,我們還要在跟蹤信息時,保證信息的準(zhǔn)確度。主要挖掘類型流程如下:首先我們會采用初步桶裝的形式,對系統(tǒng)有一個全方位的分析,緊接著收集和整理我們涉及軟件所對應(yīng)的API 接口,保障我們的信息能夠及時過濾以及跟蹤,使其形成一個規(guī)約模式,保障我們相關(guān)系統(tǒng)功能有序進(jìn)行。
在實際的運行過程當(dāng)中,我們的軟件難免會出現(xiàn)一些故障,我們?yōu)榱四軌蚣皶r發(fā)現(xiàn)故障,特意安裝了準(zhǔn)確定位裝置,對于挖掘技術(shù),我們利用了信息定位的方式,能夠在一定程度上幫助我們理解程序,能夠使我們更方便的將工作落到實處。就目前來看,我們原有的自動化以及挖掘形式,大多體現(xiàn)在軟件工程當(dāng)中。通常情況下,規(guī)則挖掘主要是利用程序,再經(jīng)過時態(tài)與邏輯的相互配合,這樣可以確保我們數(shù)據(jù)信息的安全準(zhǔn)確性;對于自動化挖掘來說,我們通常使用API 規(guī)則挖掘法,主要原因是這種方法的成熟度比較高,在工作中使用起來更加方便,但是操作過程比較難,定位系統(tǒng)也沒有很強的準(zhǔn)確性。隨著我國的發(fā)展,我們的技術(shù)水平不斷提高,特別是在描述程序運行軌跡方面,程序譜的存在為我們的工作提供了更多的便利,我們將正常軟件和故障軟件進(jìn)行了對比,結(jié)果表明在我們接受了新的挖掘技術(shù)之后,更容易發(fā)現(xiàn)故障問題,而且能夠準(zhǔn)確無誤的發(fā)現(xiàn)故障源,為我們制定解決措施提供了更多的選擇[4]。
在進(jìn)行軟件開發(fā)的過程中,由于數(shù)據(jù)信息的不同,我們就需要對不同的信息類型進(jìn)行相應(yīng)的信息挖掘。我們先進(jìn)的軟件工程可以對數(shù)據(jù)信息進(jìn)行全方位的管控工作,加上軟件工程的應(yīng)用范圍也非常廣,軟件工程可以合理的對數(shù)據(jù)信息進(jìn)行有效的管理,確保軟件在開發(fā)的同時能夠?qū)⒏黜椯Y源進(jìn)行合理的更新,以此來保證軟件開發(fā)的質(zhì)量以及在開發(fā)過程中的工作效率,促進(jìn)我們的項目順利進(jìn)行[5]。在數(shù)據(jù)挖掘的過程中,經(jīng)過軟件開發(fā)所更替的數(shù)據(jù),我們的技術(shù)人員可以通過相應(yīng)的程序及時的反應(yīng)到軟件的各種內(nèi)部結(jié)構(gòu),而且還可以利用數(shù)據(jù)挖掘所在的優(yōu)勢,能夠及時察覺到軟件內(nèi)部的各項困難,并且能夠及時作出應(yīng)對方式,對軟件開發(fā)有一定的推進(jìn)作用。
軟件版本信息挖掘,它在軟件工程領(lǐng)域當(dāng)中可以說是最廣泛的技術(shù)之一。它在進(jìn)行工作時,我們的開發(fā)人員會在軟件開發(fā)的過程中利用版本控制軟件對相應(yīng)的信息進(jìn)行統(tǒng)一管理。這樣的目的是確保在軟件開發(fā)的過程中使所有的數(shù)據(jù)軟件工程在更新時能保持一致,確保軟件在更新時的質(zhì)量,同樣的開發(fā)軟件項目是軟件工程的一種重要方式。在軟件工程系統(tǒng)版本信息控制技術(shù)當(dāng)中,數(shù)據(jù)挖掘技術(shù)可以說是最廣泛的應(yīng)用,它主要是重點研究軟件開發(fā)在變更信息當(dāng)中的各項數(shù)據(jù)挖掘,它不僅會在同一個軟件平臺下用不同的應(yīng)用效果進(jìn)行相應(yīng)的分析和探索,尋找各個模塊之間的關(guān)系,或者是說存在的差異,而且能夠在一定程度上為我們分析和預(yù)測軟件工程系統(tǒng)模塊在工作中存在的各項指標(biāo),為以后的軟件工程開發(fā)進(jìn)行相應(yīng)的分析[6]。
在數(shù)據(jù)挖掘時,一般軟件程序的開發(fā)是整個軟件工程的難點,對于整個軟件的質(zhì)量起著關(guān)鍵性的作用,所以說在進(jìn)行開發(fā)時,我們必須要保證軟件程序在開發(fā)時的質(zhì)量,對相應(yīng)的克隆代碼進(jìn)行檢測,確保我們所使用的程序代碼具有一定的準(zhǔn)確性,這也是值得我們深入思考的。
在執(zhí)行軟件工程方法時,我們首先為相應(yīng)的分析模型建立一種方法,即根據(jù)相關(guān)規(guī)則和流程提前輸入相應(yīng)的數(shù)據(jù)信息,然后對其進(jìn)行分類,以方便后續(xù)的分析模型。當(dāng)前,我國現(xiàn)有數(shù)據(jù)挖掘技術(shù)在軟件工程中最常用的方法有:判斷書法、神經(jīng)網(wǎng)絡(luò)分類、樹判斷法等。其中判斷樹法主要依靠貪婪算法作為英雄過程中的核心算法,將構(gòu)建自上而下的決策樹框架。一般來說,框架上有很多節(jié)點,不同的節(jié)點對應(yīng)不同的軟件類別符號,有助于我們在應(yīng)用程序中進(jìn)行判斷。
在進(jìn)行關(guān)聯(lián)法過程中,關(guān)聯(lián)法具有一定的嚴(yán)謹(jǐn)度,它的規(guī)則本身就是將各類數(shù)據(jù)關(guān)聯(lián),所以就要求我們的工作人員在進(jìn)行關(guān)聯(lián)法時將各類有關(guān)聯(lián)的數(shù)據(jù)進(jìn)行分類。關(guān)聯(lián)法的主要特點就是具有良好的支持度以及可信度,總體來說關(guān)聯(lián)法在進(jìn)行數(shù)據(jù)關(guān)聯(lián)處理時是一項十分重要的方法。
在進(jìn)行聚類法的過程中,一般情況下我們的技術(shù)人員首先會對數(shù)據(jù)進(jìn)行分類,以此來防止數(shù)據(jù)的相似,從而在工作中產(chǎn)生不必要的麻煩,同樣的,不同類型的數(shù)據(jù)自身擁有不同的特點,作用效果也不同,一般情況下我們將聚類法主要分為3 類:劃分法、模型法以及網(wǎng)絡(luò)法。
一般在軟件項目立項以后,起初我們會借助一些相應(yīng)的數(shù)據(jù)挖掘技術(shù)對我們的項目進(jìn)行相應(yīng)的分析總結(jié)。首先會根據(jù)數(shù)據(jù)挖掘系統(tǒng)中的一些組成成分來獲取框架中的各種信息,為我們的技術(shù)人員提供更多的研究方向,與此同時,我們的項目關(guān)工作人員也會進(jìn)行相應(yīng)的數(shù)據(jù)整合并加以利用。就比如說在進(jìn)行項目的研發(fā)過程中,首先我們要利用崗位之間的團結(jié)協(xié)作,時時交流,相互配合,為我們的數(shù)據(jù)挖掘技術(shù)更有序的順利進(jìn)行。除此之外,良好的數(shù)據(jù)挖掘技術(shù)可以有選擇性的對人群之間的關(guān)系和層次進(jìn)行清理,總體來說,這對軟件項目的整體發(fā)展有了一定的提升作用。除此之外,數(shù)據(jù)挖掘技術(shù)也可以很方便的查看軟件的版本信息,這是因為軟件在使用的過程中會儲存大量的數(shù)據(jù),我們應(yīng)該及時對這些數(shù)據(jù)進(jìn)行相應(yīng)的分析和完善,對于軟件的更新有著積極的作用[7]。而且有了數(shù)據(jù)挖掘技術(shù)的存在,它能夠及時地對軟件系統(tǒng)進(jìn)行維護(hù),不但為我們節(jié)約了時間還控制了成本。但是在數(shù)據(jù)挖掘過程中也存在一些漏洞,這些漏洞還需要我們相應(yīng)的技術(shù)人員不斷完善系統(tǒng),使軟件項目能夠合理的進(jìn)行。
新時期我國更加重視互聯(lián)網(wǎng)經(jīng)濟產(chǎn)業(yè)的發(fā)展,尤其是5G 技術(shù)、人工智能和VR 技術(shù)等高科技技術(shù)必須促進(jìn)相關(guān)軟件的改造。應(yīng)用數(shù)據(jù)提取技術(shù)可以大大提高軟件工程的開發(fā)質(zhì)量,提高整個軟件開發(fā)工程的質(zhì)量。
引用
[1] 龍艷.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用[J].信息與電腦(理論版),2019,31(23):122-123+126.
[2] 韓建友.數(shù)據(jù)挖掘技術(shù)在軟件工程中應(yīng)用研究[J].網(wǎng)絡(luò)安全和信息化,2022(6):67-69.
[3] 劉園園.計算機軟件技術(shù)在大數(shù)據(jù)時代的應(yīng)用試析[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2022(5):61-62.
[4] 張立鑒.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用研究[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2019(06):47-48.
[5] 吳文慶.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用[J].科技資訊,2019,17(13):7-8.
[6] 章立.大數(shù)據(jù)時代計算機軟件技術(shù)應(yīng)用[J].智庫時代,2019(20): 32-33.
[7] 郄彬.計算機軟件技術(shù)在大數(shù)據(jù)時代的應(yīng)用分析[J].科技資訊,2022,20(17):1-4.