皮煒杰
摘 要 在軟件系統(tǒng)規(guī)模不斷擴(kuò)大的環(huán)境下,數(shù)據(jù)挖掘技術(shù)作為一種新型的網(wǎng)絡(luò)技術(shù),在軟件工程的大數(shù)據(jù)分析中占據(jù)核心地位,有利于提高數(shù)據(jù)的可靠性與安全性?;诖?,本文首先闡述了數(shù)據(jù)挖掘技術(shù)的相關(guān)內(nèi)容,并對其軟件工程中的具體應(yīng)用進(jìn)行分析,也許能稍有借鑒意義。
【關(guān)鍵詞】數(shù)據(jù)挖掘技術(shù) 軟件工程 應(yīng)用
1 引言
目前,社會發(fā)展的信息化水平在不斷提高,越來越多的信息資源被相應(yīng)的數(shù)據(jù)所替代,而實(shí)現(xiàn)這些信息資源充分利用的前提即是對其相應(yīng)的數(shù)據(jù)進(jìn)行管理與分析。對于軟件工程項(xiàng)目來說,其具體的實(shí)施過程中涉及了大量數(shù)據(jù)信息的使用,而數(shù)據(jù)挖掘技術(shù)對提升軟件工程應(yīng)用效益具有重要作用,可將軟件工程中數(shù)據(jù)信息的作用和效果充分發(fā)揮出來,因此,加強(qiáng)對數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用分析是極為必要的。
2 數(shù)據(jù)挖掘技術(shù)的概述
所謂的數(shù)據(jù)挖掘技術(shù)即是指在大量復(fù)雜、混亂的數(shù)據(jù)資源中找到自己所需的信息數(shù)據(jù),并使其能為自身工作做出應(yīng)有的貢獻(xiàn),以將數(shù)據(jù)信息的價值充分發(fā)揮出來。數(shù)據(jù)挖掘技術(shù)所涉及的內(nèi)容主要包括以下方面:
2.1 專用數(shù)據(jù)挖掘系統(tǒng)
不同的信息資源處理需要不同的數(shù)據(jù)挖掘系統(tǒng),且一個完善的數(shù)據(jù)挖掘系統(tǒng)可在不同的數(shù)據(jù)庫下工作。
2.2 確保挖掘數(shù)據(jù)的準(zhǔn)確性
所挖掘出的數(shù)據(jù)應(yīng)滿足用戶的使用需求,及時呈現(xiàn)出有效數(shù)據(jù),抑制無效數(shù)據(jù)的顯示,相近數(shù)據(jù)可提示顯示。
2.3 可視化的挖掘結(jié)果
所挖掘的數(shù)據(jù)應(yīng)在不使用解碼方式的情況下進(jìn)行處理,數(shù)據(jù)挖掘的結(jié)果可通過可視化處理將其展現(xiàn)出來。
2.4 多層次數(shù)據(jù)挖掘
數(shù)據(jù)在數(shù)據(jù)庫中多處于動態(tài)變化或者是以交互的形式存在,這在一定程度上要求挖掘系統(tǒng)具有多層次性。
3 數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用
軟件工程中所涉及的資料一般會存放在軟件代碼庫中,將這些資料信息充分利用起來,可大大提高軟件系統(tǒng)開發(fā)人員的工作效率,使系統(tǒng)工作人員能進(jìn)一步的了解系統(tǒng)框架。軟件工程每一次的RUP循環(huán)(統(tǒng)一軟件的開發(fā)過程,是一個面向?qū)ο笄一诰W(wǎng)絡(luò)程序開發(fā)的方法論)均會產(chǎn)生大量數(shù)據(jù),這些數(shù)據(jù)就是軟件系統(tǒng)開發(fā)所需挖掘的數(shù)據(jù),而數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用價值具體體現(xiàn)在以下方面(圖1)。
3.1 開源軟件開發(fā)中的應(yīng)用
開源軟件即是源代碼,在開發(fā)源代碼的過程中,會涉及大量的數(shù)據(jù)信息,這種情況下,若能將軟件開發(fā)所需數(shù)據(jù)充分挖掘出來,可大大降低開源軟件開發(fā)的難度,提升其開發(fā)效率和質(zhì)量。
3.2 軟件工程管理中的應(yīng)用
軟件工程管理的內(nèi)容主要包括組織人員及軟件版本中存在的問題,在整個管理過程中,通常會涉及大量的數(shù)據(jù)信息處理和使用,因此,實(shí)現(xiàn)數(shù)據(jù)挖掘技術(shù)的合理應(yīng)用是極為重要的。對于整個軟件工程項(xiàng)目中的組織管理人員來說,對人力資源進(jìn)行分析與調(diào)配實(shí)質(zhì)上就是一種對數(shù)據(jù)進(jìn)行管理的過程,特別是針對一些大規(guī)模的軟件工程項(xiàng)目而言,其人員組織構(gòu)成相對復(fù)雜,更需要數(shù)據(jù)挖掘技術(shù)對相關(guān)信息進(jìn)行挖掘和處理,以節(jié)省人力成本。
3.3 軟件故障檢測中的應(yīng)用
檢測軟件故障是數(shù)據(jù)挖掘系統(tǒng)的重要環(huán)節(jié),需要檢測的對象及任務(wù)主要包括:軟件測試的具體項(xiàng)目,對軟件系統(tǒng)故障庫數(shù)據(jù)信息的收集、轉(zhuǎn)換和清理;信息系統(tǒng)數(shù)據(jù)的采集與抽取,選擇合適的軟件系統(tǒng)數(shù)據(jù)挖掘信息,并對其進(jìn)行整合與分析;對軟件數(shù)據(jù)系統(tǒng)中存在的故障及漏洞進(jìn)行整體定位與具體描述,避免其應(yīng)用到各項(xiàng)工程活動中。軟件故障檢測的主要目的在于及時發(fā)現(xiàn)軟件系統(tǒng)在開發(fā)或應(yīng)用階段所存在的問題、漏洞及故障,并采取有效措施對其進(jìn)行矯正與處理,從而為軟件系統(tǒng)的有效運(yùn)行提供安全的環(huán)境。
3.4 建立數(shù)據(jù)信息軟件
數(shù)據(jù)倉庫主要是有效數(shù)據(jù)的集合,通過構(gòu)建數(shù)據(jù)倉庫系統(tǒng)來實(shí)現(xiàn)軟件系統(tǒng)的開發(fā)與應(yīng)用,這一過程包括的內(nèi)容主要體現(xiàn)在以下方面:
(1)源數(shù)據(jù)的獲取,主要收集歷史數(shù)據(jù)、當(dāng)前數(shù)據(jù)和綜合數(shù)據(jù);
(2)源數(shù)據(jù)處理,主要包括關(guān)系數(shù)據(jù)庫、軟件數(shù)據(jù)文檔等;
(3)倉庫管理,主要包括倉庫管理工具、轉(zhuǎn)載、元數(shù)據(jù)庫和數(shù)據(jù)建模工具;
(4)具備豐富的軟件領(lǐng)域知識,明確對軟件系統(tǒng)質(zhì)量造成影響的因素。
數(shù)據(jù)庫建模主要是將現(xiàn)有數(shù)據(jù)統(tǒng)一起來,建立一個合理、安全的數(shù)據(jù)資源庫,該資源庫所涉及的信息包括用戶需求信息、用戶評估信息、軟件系統(tǒng)信息、可行性研究報(bào)告等,其具體內(nèi)容主要是指:
(1)將用戶需要的信息進(jìn)行匯總,以便為系統(tǒng)功能、界面及數(shù)據(jù)等方面的確定奠定基礎(chǔ);
(2)用戶評估信息主要是應(yīng)用軟件測試來獲得相應(yīng)的評估信息,并將其與用戶信息進(jìn)行匯總,明確對軟件質(zhì)量產(chǎn)生影響的因素,并采取措施進(jìn)行處理;
(3)軟件系統(tǒng)信息是軟件應(yīng)用的基礎(chǔ),主要包括系統(tǒng)建立的規(guī)模、性質(zhì)及范圍等。
4 結(jié)語
綜上所述,數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用具有較強(qiáng)的實(shí)用價值,加強(qiáng)數(shù)據(jù)挖掘技術(shù)的研究對促進(jìn)軟件工程項(xiàng)目的發(fā)展具有重要意義,因此,相關(guān)工作人員應(yīng)加大探索力度,使數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用更加成熟與可靠,以促使其在其它領(lǐng)域也能獲得良好的應(yīng)用效果。
參考文獻(xiàn)
[1]王曉妍.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用探微[J].建材發(fā)展導(dǎo)向上,2015,13(12):326-327.
[2]童凌.軟件工程數(shù)據(jù)挖掘研究進(jìn)展[J].中國新通信,2016,18(09):14-14.
[3]郁抒思,周水庚,關(guān)佶紅.軟件工程數(shù)據(jù)挖掘研究進(jìn)展[J].計(jì)算機(jī)科學(xué)與探索,2012,06(01):1-31.
作者單位
長沙市第一中學(xué) 湖南省長沙市 410000