朱通 崔鉉 趙凱
摘要:隨著現(xiàn)代科學(xué)信息技術(shù)的不斷地發(fā)展和進(jìn)步,人們通過(guò)互聯(lián)網(wǎng)絡(luò)直接獲取的數(shù)據(jù)和信息也越來(lái)越多,各樣資料,處理數(shù)據(jù)和信息的程序也越來(lái)越多,程序任務(wù)也更加繁重。怎樣有效利用先進(jìn)的信息挖掘技術(shù)對(duì)復(fù)雜的信息和數(shù)據(jù)進(jìn)行綜合處理,從中快速地找出對(duì)于人們有用的數(shù)據(jù)和信息是一項(xiàng)十分重要的工程。而先進(jìn)的數(shù)據(jù)挖掘技術(shù)很好地解決了這些技術(shù)難題,人們也對(duì)數(shù)據(jù)挖掘技術(shù)的應(yīng)用提出了更高的技術(shù)要求。本文筆者簡(jiǎn)單地介紹了我國(guó)的數(shù)據(jù)挖掘技術(shù)的應(yīng)用發(fā)展現(xiàn)狀,具體分析了我國(guó)的數(shù)據(jù)挖掘技術(shù)在計(jì)算軟件和信息工程方面的廣泛使用發(fā)展情況。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);軟件工程;重要性;應(yīng)用;發(fā)展前景
前言:
在這個(gè)信息量爆炸的大數(shù)據(jù)時(shí)代,每天都有海量的信息和數(shù)據(jù)需要我們對(duì)其高效地進(jìn)行收集和處理,僅僅是依靠人力顯然無(wú)法很好地做到這一點(diǎn),于是就出現(xiàn)了最新的各種數(shù)據(jù)挖掘相關(guān)技術(shù),用來(lái)收集數(shù)據(jù)和幫助人們高效地處理海量信息。目前與軟件開(kāi)發(fā)工程相關(guān)的行業(yè)依靠著先進(jìn)的信息技術(shù)和數(shù)據(jù)分析技術(shù),當(dāng)我們將最新的數(shù)據(jù)挖掘相關(guān)技術(shù)更廣泛地應(yīng)用到了軟件工程的研究當(dāng)中,能夠極大地提高了工作效率,促進(jìn)了軟件工程等相關(guān)行業(yè)的持續(xù)快速發(fā)展升級(jí)步伐。
1數(shù)據(jù)挖掘技術(shù)的作用
在現(xiàn)代化信息時(shí)代的生活中,人們大量的上網(wǎng)數(shù)據(jù)每天在網(wǎng)絡(luò)上都會(huì)自動(dòng)產(chǎn)生大量的信息,對(duì)于這些數(shù)據(jù)信息進(jìn)行有效收集和處理,成為了目前最迫切需求和解決的信息技術(shù)問(wèn)題。通過(guò)采用網(wǎng)絡(luò)數(shù)據(jù)挖掘的技術(shù),能夠?qū)Υ祟惖膯?wèn)題進(jìn)行根本性的分析和解決,對(duì)于數(shù)據(jù)的收集整理、儲(chǔ)存,顯示出了網(wǎng)絡(luò)數(shù)據(jù)挖掘技術(shù)的巨大應(yīng)用價(jià)值。
1.1縮短處理時(shí)間
我們能夠利用數(shù)據(jù)挖掘技術(shù),針對(duì)雜亂的信息和數(shù)據(jù)進(jìn)行分類和處理,使雜亂的信息和數(shù)據(jù)在系統(tǒng)中能夠及時(shí)進(jìn)行科學(xué)的處理和調(diào)用。在系統(tǒng)中采用了數(shù)據(jù)挖掘的技術(shù),能夠?qū)⒒靵y的數(shù)據(jù)信息進(jìn)行科學(xué)排列,清理重復(fù)的資料,使所獲得的資料信息能夠更好地為人所用。利用數(shù)據(jù)挖掘技術(shù)能夠全方面、多角度地對(duì)數(shù)據(jù)進(jìn)行考慮,對(duì)于信息和數(shù)據(jù)的準(zhǔn)確性進(jìn)行反復(fù)的分析和核對(duì),確保了信息數(shù)據(jù)的準(zhǔn)確真實(shí)性,并且對(duì)數(shù)據(jù)進(jìn)行了整合,讓雜亂的信息和數(shù)據(jù)整合分析成為了一種可讀的數(shù)據(jù)和模式,有助于把整合分析的信息和結(jié)果及時(shí)提供出來(lái)傳遞給了管理人員,提供了參考的依據(jù)和價(jià)值。在軟件工程中我們采用了數(shù)據(jù)挖掘技術(shù),能夠?qū)π畔⒑蛿?shù)據(jù)的分析質(zhì)量進(jìn)行提高,減少了分析時(shí)間上的復(fù)雜性和浪費(fèi),提高了分析的效率。
1.2對(duì)多樣化的信息數(shù)據(jù)充分了解
數(shù)據(jù)挖掘技術(shù)能夠?qū)Y料進(jìn)行目標(biāo)化搜集,在意不同類型進(jìn)行分類,最后進(jìn)行整理和存儲(chǔ)。以這樣的對(duì)信息進(jìn)行數(shù)據(jù)處理與搜集方式,涉及到的信息范圍比較廣泛,為企業(yè)信息管理數(shù)據(jù)的收集查閱使用以及工作管理提供了方便與快捷。在信息管理軟件的開(kāi)發(fā)工程中采用了數(shù)據(jù)挖掘的技術(shù),對(duì)于信息管理數(shù)據(jù)的重要性進(jìn)行了整合,為企業(yè)對(duì)信息管理數(shù)據(jù)的重要性進(jìn)行了一個(gè)全方位的深入了解與有效掌握。
1.3確保信息數(shù)據(jù)的準(zhǔn)確率
傳統(tǒng)的數(shù)據(jù)信息系統(tǒng),對(duì)于信息完整性和數(shù)據(jù)的準(zhǔn)確性進(jìn)行運(yùn)算時(shí),不僅數(shù)據(jù)處理需要對(duì)系統(tǒng)花費(fèi)大量的精力和時(shí)間,還需要投入大量的資金成本,同時(shí)信息準(zhǔn)確性和數(shù)據(jù)的完整性不能得到很好的保證。而系統(tǒng)如果采用分布式數(shù)據(jù)挖掘的技術(shù),就不會(huì)直接出現(xiàn)以上這些的問(wèn)題,主要原因是對(duì)于傳統(tǒng)的數(shù)據(jù)功能進(jìn)行了技術(shù)性的優(yōu)化,能夠在最短的信息時(shí)間內(nèi)對(duì)于信息數(shù)據(jù)進(jìn)行了運(yùn)算與數(shù)據(jù)處理,避免了數(shù)據(jù)信息出現(xiàn)混亂或數(shù)據(jù)丟失的情況,提高了系統(tǒng)信息完整性和數(shù)據(jù)的準(zhǔn)確性。在大量的信息數(shù)據(jù)中,有些數(shù)據(jù)沒(méi)有得到合理利用的,長(zhǎng)期保持在信息系統(tǒng)中會(huì)嚴(yán)重影響到了系統(tǒng)的整體可靠性與運(yùn)行的效率,但是系統(tǒng)如果采用分布式數(shù)據(jù)挖掘的技術(shù),能夠把系統(tǒng)中無(wú)關(guān)價(jià)值的所有信息源和數(shù)據(jù)都進(jìn)行了剔除,最終有效的信息數(shù)據(jù)錄入處理到了系統(tǒng)中,確保了系統(tǒng)的信息完整性和數(shù)據(jù)的準(zhǔn)確性。
2技術(shù)應(yīng)用流程簡(jiǎn)介
2.1數(shù)據(jù)預(yù)處理
所謂數(shù)據(jù)的預(yù)處理就是從一個(gè)海量的任務(wù)數(shù)據(jù)庫(kù)中快速的獲取與實(shí)際的任務(wù)需求之間存在緊密相互關(guān)聯(lián)的海量數(shù)據(jù)和信息。而數(shù)據(jù)信息轉(zhuǎn)換的一個(gè)實(shí)質(zhì)意義就是通過(guò)快速切換所需要數(shù)據(jù)的類型和格式,提高所需要的數(shù)據(jù)和信息的質(zhì)量和適用性,最大限度地滿足用戶的需求。
2.2數(shù)據(jù)挖掘
首要的工作步驟之一的也就是需要制定合理的網(wǎng)絡(luò)數(shù)據(jù)挖掘工作計(jì)劃和研究任務(wù),具體的計(jì)劃內(nèi)容主要包括海量數(shù)據(jù)挖掘的分類歸納、數(shù)據(jù)統(tǒng)計(jì)分析量和評(píng)價(jià)結(jié)果總結(jié)等,然后再通過(guò)分析研究確定恰當(dāng)?shù)耐诰蛴?jì)劃和任務(wù),結(jié)合用戶的需求進(jìn)行合理的數(shù)據(jù)運(yùn)算,將符合需求的數(shù)據(jù)信息進(jìn)行整理和分類,以此提升數(shù)據(jù)的處理效率。
2.3模式評(píng)估與知識(shí)表示
模式的實(shí)際工作用途主要在于準(zhǔn)確地表達(dá)數(shù)據(jù)分析挖掘的成果,以用戶興趣度作為其度量的標(biāo)準(zhǔn),構(gòu)建一個(gè)具有識(shí)別和分析能力的完整表達(dá)數(shù)據(jù)挖掘模式。
3數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用路徑
3.1數(shù)據(jù)挖掘技術(shù)在軟件項(xiàng)目管理中的應(yīng)用
軟件的管理對(duì)于提高各個(gè)軟件的開(kāi)發(fā)質(zhì)量和效率都具有非常重要的作用和影響,為此必須制定和加強(qiáng)對(duì)各個(gè)軟件項(xiàng)目管理的組織關(guān)系科學(xué)研究。通過(guò)分析和數(shù)據(jù)挖掘的技術(shù)能夠來(lái)分析和控制各個(gè)環(huán)節(jié)的軟件開(kāi)發(fā)工作質(zhì)量,最終有效的保證軟件開(kāi)發(fā)的質(zhì)量,實(shí)現(xiàn)預(yù)期的目標(biāo)。在分析和數(shù)據(jù)挖掘的技術(shù)研究和應(yīng)用的過(guò)程中,能夠加強(qiáng)對(duì)軟件開(kāi)發(fā)人員組織關(guān)系的管理和分析,促進(jìn)了人力資源之間的高效和協(xié)調(diào),降低了人力資源的成本,保證了軟件開(kāi)發(fā)的質(zhì)量和效率不斷提高和增強(qiáng)。在軟件的工程研究和開(kāi)發(fā)的過(guò)程中通過(guò)分析和數(shù)據(jù)挖掘的技術(shù)能夠針對(duì)版本控制相關(guān)信息的版本變化和內(nèi)容能夠進(jìn)行全面的記錄。
3.2數(shù)據(jù)挖掘技術(shù)在開(kāi)源軟件設(shè)計(jì)中的應(yīng)用
開(kāi)源軟件對(duì)大多數(shù)的客戶都提供了免費(fèi)的服務(wù),能夠有效保障和提高客戶信息和數(shù)據(jù)資源的開(kāi)放性和利用效率。由于具有開(kāi)源軟件的數(shù)據(jù)開(kāi)放性特點(diǎn),所以對(duì)數(shù)據(jù)信息資源利用和管理的研究難度非常大。運(yùn)用分布式數(shù)據(jù)挖掘的技術(shù)是能夠有效提高數(shù)據(jù)和軟件開(kāi)發(fā)的質(zhì)量分布式進(jìn)行數(shù)據(jù)挖掘的系統(tǒng)。通過(guò)運(yùn)用大規(guī)模的客戶信息和數(shù)據(jù)挖掘技術(shù)可以實(shí)現(xiàn)對(duì)軟件開(kāi)發(fā)人員和軟件正常使用的人員信息進(jìn)行的跟蹤和管理,保證了軟件的正常使用和效率。
3.3數(shù)據(jù)挖掘在軟件工程開(kāi)發(fā)中的應(yīng)用
軟件程序開(kāi)發(fā)的技術(shù)作為整個(gè)軟件工程的整個(gè)技術(shù)核心,對(duì)于保證軟件的產(chǎn)品質(zhì)量與技術(shù)具有非常決定性的意義和作用,為此必須注意的是要能夠保證公司軟件程序開(kāi)發(fā)的產(chǎn)品質(zhì)量與技術(shù)水平。通過(guò)利用數(shù)據(jù)挖掘的技術(shù)能夠同時(shí)實(shí)現(xiàn)多種數(shù)據(jù)挖掘方式共同進(jìn)行挖掘,提高挖掘數(shù)據(jù)可靠性和挖掘的準(zhǔn)確性和效率。此外還需要我們能夠針對(duì)公司軟件程序開(kāi)發(fā)的克隆代碼進(jìn)行記錄與數(shù)據(jù)搜索。
3.4數(shù)據(jù)挖掘在軟件故障檢測(cè)中的應(yīng)用
數(shù)據(jù)挖掘的技術(shù)使我們能夠有效的通過(guò)針對(duì)軟件的運(yùn)行情況和故障的分析,通過(guò)對(duì)數(shù)據(jù)進(jìn)行了分析,保證快速、準(zhǔn)確的故障定位。首先是數(shù)據(jù)的挖掘技術(shù)我們能夠通過(guò)基于規(guī)則的數(shù)據(jù)挖掘的方式。其次則我們可以通過(guò)自動(dòng)化的數(shù)據(jù)挖掘處理方式對(duì)軟件進(jìn)行了挖掘,這兩種數(shù)據(jù)挖掘方法都是能夠及時(shí)的快速發(fā)現(xiàn)和排除軟件的故障。
4數(shù)據(jù)挖掘技術(shù)在軟件工程中的發(fā)展形勢(shì)
目前,軟件行業(yè)的工程師在運(yùn)用軟件和數(shù)據(jù)挖掘相關(guān)技術(shù)時(shí),所用的軟件和數(shù)據(jù)庫(kù)本身就具有獨(dú)特的基本特質(zhì),所以在實(shí)際的運(yùn)用中可能會(huì)對(duì)其他數(shù)據(jù)庫(kù)造成一定的干擾和影響,面臨一定的困難和技術(shù)挑戰(zhàn)。軟件工程開(kāi)發(fā)中的數(shù)據(jù)挖掘技術(shù)的最終功能和目的之一就是將分析和設(shè)計(jì)好的數(shù)據(jù)通過(guò)軟件工程提交給我們的客戶進(jìn)行使用,但是真正的處理軟件開(kāi)發(fā)工程里的復(fù)雜性數(shù)據(jù)并不簡(jiǎn)單,在運(yùn)用軟件的工程中我們所運(yùn)用的數(shù)據(jù)挖掘的技術(shù)一般都會(huì)對(duì)軟件工程產(chǎn)生的分析結(jié)果和數(shù)據(jù)進(jìn)行系統(tǒng)的評(píng)價(jià),在一些比較成熟的軟件開(kāi)發(fā)項(xiàng)目里這些的評(píng)價(jià)相對(duì)比較成熟,而一些剛開(kāi)始發(fā)展起來(lái)的軟件工程項(xiàng)目的數(shù)據(jù)評(píng)價(jià)處理系統(tǒng)就不是很完整,所以在軟件的工程系統(tǒng)開(kāi)發(fā)中的各個(gè)方面所需要正確處理的復(fù)雜性數(shù)據(jù)工程系統(tǒng)信息非常復(fù)雜?,F(xiàn)在我們處于一個(gè)數(shù)據(jù)信息技術(shù)發(fā)展的關(guān)鍵時(shí)代,如何正確處理這些數(shù)據(jù)中的信息是一個(gè)很大的難題,這也給我們運(yùn)用數(shù)據(jù)信息挖掘的技術(shù)也是提出了一個(gè)新的挑戰(zhàn)和考驗(yàn)。
結(jié)束語(yǔ):
綜上所述,將先進(jìn)的數(shù)據(jù)挖掘技術(shù)合理的應(yīng)用到軟件工程項(xiàng)目中,能夠結(jié)合現(xiàn)階段的實(shí)際應(yīng)用和發(fā)展概況,并有效促進(jìn)數(shù)據(jù)挖掘技術(shù)以及軟件工程行業(yè)的良好健康發(fā)展。
參考文獻(xiàn):
[1]?李紅蘭. 試論數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用綜述[J]. 電腦知識(shí)與技術(shù),2016(34):104-105.
[2]?段彬,魏巍. 數(shù)據(jù)挖掘在軟件工程領(lǐng)域中的應(yīng)用淺析[J]. 信息系統(tǒng)工程,2018,000(004):89.
[3]?孫云鵬. 數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用綜述[J]. 中國(guó)新通信,2015(15):131.
[4]?劉練. 探討數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用研究[J]. 商情,2016(20).
[5]?劉玉峰. 數(shù)據(jù)挖掘技術(shù)在軟件知識(shí)庫(kù)中的應(yīng)用研究[D]. 廣西師范大學(xué).
(作者單位:遼寧工業(yè)大學(xué))