中航金網(wǎng)(北京)電子商務(wù)有限公司 周弘
隨著信息技術(shù)的迅速發(fā)展,計算機網(wǎng)絡(luò)極大的便利了人們的日常生活和工作,特別是在數(shù)據(jù)挖掘技術(shù),它在計算機軟件工程中得到了廣泛的應(yīng)用,并得到了很好的應(yīng)用效果?;诖?,本文從數(shù)據(jù)挖掘技術(shù)的概念和應(yīng)用意義出發(fā),對數(shù)據(jù)挖掘技術(shù)在計算機軟件工程中的應(yīng)用進行了分析。
數(shù)據(jù)挖掘是一個全新的概念,它的作用就是從大量的數(shù)據(jù)中篩選出有價值的數(shù)據(jù),從而提高了數(shù)據(jù)的利用率。因此,在計算機軟件工程中運用數(shù)據(jù)挖掘技術(shù),可以確保數(shù)據(jù)的質(zhì)量和效率,使重要數(shù)據(jù)得到有效使用。因此,如何在計算機軟件工程中運用數(shù)據(jù)挖掘技術(shù),是廣大科技工作者所要考慮和研究的課題。
數(shù)據(jù)挖掘技術(shù)作為一種新興的、先進的信息處理技術(shù),因其自身的優(yōu)勢而被廣泛地應(yīng)用于各個領(lǐng)域。在傳統(tǒng)的計算機軟件工程中,數(shù)據(jù)處理的效率無法得到很好的保證。數(shù)據(jù)挖掘技術(shù)各功能之間常常存在著某種關(guān)聯(lián),從而最大程度確保了最后的評價結(jié)果的正確性。綜上所述,這一技術(shù)在數(shù)據(jù)挖掘中的應(yīng)用優(yōu)勢在于將數(shù)據(jù)處理的效率最大化,并且從根源解決了數(shù)據(jù)易損失的問題,對企業(yè)的持續(xù)健康發(fā)展,具有重大的技術(shù)支撐作用。
(1)它具備了傳統(tǒng)的信息處理技術(shù)的全部功能,即對各種數(shù)據(jù)進行收集和歸類。相對來說,這種收集方式的范圍更大,可以進行特征性的分析,可以從大量的數(shù)據(jù)中,構(gòu)建出一套精確的信息管理體系。將各個部門的信息資源進行整合,使得各公司對各方面的信息有了更完整的認識。
(2)一般的數(shù)據(jù)信息系統(tǒng)在計算過程中會花費大量的時間,因為數(shù)據(jù)太多,造成計算系統(tǒng)崩潰;而數(shù)據(jù)挖掘技術(shù)具有很強的計算能力,在這一點上,數(shù)據(jù)挖掘技術(shù)并不難,計算時間很短。而且,在處理過程中,不會出現(xiàn)任何的數(shù)據(jù)丟失和錯誤,從而有效地保證了數(shù)據(jù)的完整性。這些數(shù)據(jù)中,有一些是無用的,卻會影響到整個系統(tǒng)的運行速度,數(shù)據(jù)挖掘技術(shù)能夠?qū)?shù)據(jù)庫中的數(shù)據(jù)進行有效的分析,然后將其清除,然后再將正確數(shù)據(jù)輸入到數(shù)據(jù)系統(tǒng)中。
在計算機軟件工程中,利用數(shù)據(jù)挖掘技術(shù)能夠全方位、多角度地對數(shù)據(jù)信息進行控制;由于軟件工程范圍很大,因此所涉及的數(shù)據(jù)信息類型也很復(fù)雜。而應(yīng)用計算機軟件工程可以實現(xiàn)對有關(guān)信息數(shù)據(jù)進行統(tǒng)一管理、集中化管理,使相關(guān)的軟件在實際的開發(fā)過程中,可以對數(shù)據(jù)資源進行實時的更新與處理,使軟件的開發(fā)質(zhì)量得到最大程度地改善,達到預(yù)期的目的。另外,數(shù)據(jù)挖掘中含有大量的數(shù)據(jù),以保證技術(shù)人員能科學(xué)地分析并正確區(qū)分軟件的內(nèi)部結(jié)構(gòu),因此,充分利用數(shù)據(jù)挖掘技術(shù)的優(yōu)點,為后期運行人員提供了快捷分析問題與解決方案的作用,保證了軟件開發(fā)工作的順利進行[1]。要對員工的關(guān)系進行深入的剖析與挖掘,就必須針對軟件開發(fā)的要求,注重對人力資源進行科學(xué)的統(tǒng)籌與配置,同時,在軟件模塊化的基礎(chǔ)上,嚴格按照軟件的模塊化設(shè)計原理,實現(xiàn)了大規(guī)模的軟件開發(fā)。經(jīng)常有數(shù)以千計的人參加了軟件系統(tǒng)的建設(shè),參加會議的人經(jīng)常會談?wù)撐募鬟f、電子郵件發(fā)送等,在這個時候,必須要對各部分的關(guān)系進行深入的剖析與發(fā)掘,以便在以后的工作中進行科學(xué)的分工和分配。此外,在軟件企業(yè)中,所有的人員與軟件使用者都必須建立一個穩(wěn)定的、可靠的關(guān)系網(wǎng)絡(luò),在網(wǎng)絡(luò)復(fù)雜性日益增加的今天,正確地分析和挖掘網(wǎng)絡(luò)內(nèi)部的關(guān)系,保證了軟件工程的正常、有序、順利地進行。比如:在挖掘人事關(guān)系的過程中,要運用版本管理系統(tǒng),統(tǒng)一和有序地修改相關(guān)流程,深入地分析和挖掘軟件變更后的歷史數(shù)據(jù),并在此基礎(chǔ)上,根據(jù)各個程序模塊之間的關(guān)系,對其進行了邏輯上的依賴,該系統(tǒng)的內(nèi)部結(jié)構(gòu)能夠直觀、高效地顯示出系統(tǒng)的開發(fā)組織。
在數(shù)據(jù)挖掘技術(shù)的實際應(yīng)用中,要對軟件執(zhí)行過程中的數(shù)據(jù)進行全面的分析與挖掘,對軟件的操作性能進行全面的分析與處理,使其能夠充分滿足所期望的判斷標準。因此,在對運行記錄進行深度分析與挖掘時,必須對已設(shè)定的安裝路徑進行全面的查找,并通過反向建模來實現(xiàn)對數(shù)據(jù)結(jié)構(gòu)的分析,為以后的軟件維護提供了便利。同時,技術(shù)人員也應(yīng)該及時地發(fā)現(xiàn)和處理這些問題,以確保系統(tǒng)的工作性能。同時,要對其進行深入的分析和挖掘。程序規(guī)約挖掘就是對與其相關(guān)的程序進行綜合分析,以使其能在最短的時間內(nèi)找到并處理相應(yīng)的程序代碼。此外,為保證跟蹤信息的執(zhí)行效果,我們還采用逆向模型對相關(guān)的流程進行全面的分析、驗證和維護。該類型的挖掘過程是:通過初步的桶裝,對有關(guān)的系統(tǒng)進行綜合分析,然后,將所有與該軟件相匹配的API 界面進行綜合整理,同時,對所跟蹤的信息進行充分的篩選與處理,形成了一個規(guī)范模型,能夠?qū)τ嘘P(guān)的系統(tǒng)進行有效的描述[2]。如圖1所示顯示了程序規(guī)約挖掘的基本流程。
圖1 程序規(guī)約挖掘流程Fig.1 Procedure for mining of program specifications
在計算機軟件工程中,軟件缺陷檢測是一項非常重要的工作,它不僅能夠有效地提高軟件的開發(fā)速度,而且能夠保證系統(tǒng)的穩(wěn)定、可靠、安全,為后期的安全問題及時地發(fā)現(xiàn)和處理打下了堅實的基礎(chǔ)。通過對軟件的缺陷進行徹底的修復(fù),可以提高用戶的安全性。根據(jù)數(shù)據(jù)挖掘技術(shù)的發(fā)展趨勢,在實現(xiàn)軟件缺陷檢測時,應(yīng)根據(jù)其內(nèi)在的測試內(nèi)容,對其進行針對性的分析和測試;此外,還需要對涉及軟件缺陷的項目進行全面的測試,使其符合相應(yīng)的軟件開發(fā)規(guī)范和需求。數(shù)據(jù)挖掘技術(shù)在實際運用過程中,需要對已有的數(shù)據(jù)進行綜合的分析,并對最后的分析結(jié)果作綜合分析加以完善。然后,通過選擇適當?shù)臏y試方式,使測試工作得以實施,使之能夠更好地適應(yīng)軟件工程的發(fā)展需要。另外,在數(shù)據(jù)的處理過程中,還需要利用數(shù)據(jù)挖掘技術(shù)對數(shù)據(jù)進行分析、抽取,通過數(shù)據(jù)的形式,使輔助數(shù)據(jù)內(nèi)容更形象、更直觀地呈現(xiàn)給使用者。另外,為保證數(shù)據(jù)挖掘技術(shù)在計算機軟件工程中的科學(xué)合理應(yīng)用,為了更好地運用于實踐,還需要合理地選取合適的數(shù)據(jù)模型,然后,利用合適的數(shù)據(jù)挖掘模型,對測驗集進行科學(xué)的測量和處理。在實際的測試中,要對軟件的錯誤進行科學(xué)化、規(guī)范化的分類,并對數(shù)據(jù)庫中的相關(guān)數(shù)據(jù)進行科學(xué)地更新與優(yōu)化[3]。如圖2所示展示了檢測軟件漏洞的流程。
圖2 軟件漏洞檢測流程Fig.2 Software vulnerability detection process
數(shù)據(jù)挖掘技術(shù)能夠探測到軟件在運行過程中的各種數(shù)據(jù)的運行規(guī)律,在軟件發(fā)生故障的時候,能夠按照原來的數(shù)據(jù)運行方式進行自動修復(fù)。隨著軟件的應(yīng)用越來越多,問題也越來越多,一些問題不是人力可以解決的。有些軟件,在經(jīng)過一段時間之后,有時會在其內(nèi)部傳輸數(shù)據(jù)時出現(xiàn)問題,在這種情況下,通過數(shù)據(jù)挖掘技術(shù)的記錄功能,可以在系統(tǒng)發(fā)生故障時,自動進行修復(fù)和升級。
一種通常用于研究兩件不同的東西之間的關(guān)系的一般方法。結(jié)合數(shù)據(jù)挖掘技術(shù)的實際應(yīng)用,關(guān)聯(lián)方法提出了一種高效的數(shù)據(jù)處理與收集的方法。此外,在運用關(guān)聯(lián)法的過程中,應(yīng)嚴格遵守興趣關(guān)聯(lián)原理,充分利用數(shù)據(jù)挖掘技術(shù)和計算機軟件工程相結(jié)合,二者的關(guān)聯(lián)特征包括:支持程度和可信度,在實際運行過程中,還需要將支持度的屬性與交易集合相結(jié)合。
在數(shù)據(jù)挖掘技術(shù)的具體應(yīng)用中,要利用分類標志對相關(guān)的行為進行科學(xué)的分析與預(yù)測。在此基礎(chǔ)上,根據(jù)其分類特點,建立了相關(guān)分析模型。此外,在實際建模時,要盡可能地強調(diào)它的實用性,所以,技術(shù)人員要多留意有關(guān)的資料類別。當前,在數(shù)據(jù)挖掘技術(shù)中,通常使用正確的判別樹方法,而判別樹方法則是以神經(jīng)網(wǎng)絡(luò)分類和最接近分類為基礎(chǔ)。在運用分類法時,相關(guān)技術(shù)人員應(yīng)當充分理解和分析分類的種類,選擇適當?shù)姆椒ǎ页鲞m合的應(yīng)用區(qū)域,并盡量采用最小的費用,以確保最后的處理結(jié)果。
在軟件工程實際使用過程中,聚類算法要嚴格遵循設(shè)定的分類準則,對與科研工作有關(guān)的數(shù)據(jù)對象進行歸類處理,并將其分為幾種不同的類型。在此基礎(chǔ)上,盡可能保證同類資料物件與同類資料物件之間的相似。而在實際操作中,不同類型之間的數(shù)據(jù)差異很小。同時,利用聚類技術(shù)對相關(guān)數(shù)據(jù)進行科學(xué)的歸類,確保了聚類算法在數(shù)據(jù)信息處理中的科學(xué)性和有效性,因此,該方法能更好地用于實際的應(yīng)用[4]。
在實際的軟件開發(fā)和應(yīng)用中,開源軟件是一個很有意義的研究課題。其中,克隆碼的檢測是一個十分關(guān)鍵的工作,它在開源軟件的開發(fā)中得到了廣泛的應(yīng)用,可以有效地完成數(shù)據(jù)的復(fù)制和粘貼。在信息化、一體化的社會背景下,軟件工程的生產(chǎn)必須要進行變革,以適應(yīng)市場的要求和實際情況。由于傳統(tǒng)的軟件工程項目具有一些歷史問題,使得其與社會的需要難以溝通。在當今社會,隨著數(shù)據(jù)的快速發(fā)展,人們對信息的需求已經(jīng)轉(zhuǎn)化成了大量的數(shù)據(jù),利用數(shù)據(jù)技術(shù)對這些數(shù)據(jù)進行篩選、修正,從而減少了企業(yè)的經(jīng)營管理風(fēng)險。
從當前計算機軟件工程的發(fā)展狀況來看,軟件項目管理工作的發(fā)展趨勢是系統(tǒng)化和復(fù)雜化。在軟件工程中,數(shù)據(jù)挖掘技術(shù)起著舉足輕重的作用,在軟件工程中,挖掘執(zhí)行記錄也是挖掘技術(shù)的一部分。通過對軟件系統(tǒng)的路徑進行分析,可以使軟件工程中各系統(tǒng)的工作代碼之間的聯(lián)系更加清晰。隨著科技的進步,人們的經(jīng)濟狀況也在發(fā)生著變化,因此,軟件工程的管理就變得越來越困難。過去的軟件工程管理已不能滿足現(xiàn)代高技術(shù)軟件工程的要求,這些都會影響到整個軟件項目的各個方面,從而導(dǎo)致軟件項目的進度和進度的下降。因此,必須充分利用數(shù)據(jù)挖掘技術(shù)在軟件工程中的作用,保證軟件項目的工作效率[5]。
在這個資訊大爆炸的年代,我們每天都要處理大量的資訊,光靠人力是遠遠不夠的。在信息技術(shù)飛速發(fā)展的今天,人們對各種新技術(shù)進行了大量的研究,而數(shù)據(jù)挖掘技術(shù)正是其中的一種。軟件工程是當前信息技術(shù)領(lǐng)域的一個重要組成部分,所以,對軟件工程進行優(yōu)化,可以方便地進行信息的整理和歸類,同時也能防止由于大量的數(shù)據(jù)而造成系統(tǒng)的混亂、崩潰。隨著數(shù)據(jù)挖掘技術(shù)的迅速發(fā)展和普及,技術(shù)工作者必須樹立與時俱進的思想,以推動軟件工程的健康、持續(xù)發(fā)展。在此基礎(chǔ)上,將數(shù)據(jù)挖掘技術(shù)和軟件管理相結(jié)合,以保證在軟件工程中的應(yīng)用,將信息挖掘技術(shù)運用于軟件工程,可以有效地對信息進行分類,將數(shù)據(jù)挖掘技術(shù)引入到軟件工程領(lǐng)域,大大提升工作效率,推動整個軟件產(chǎn)業(yè)的發(fā)展。