林浩
(長春世界雕塑園 吉林 長春 130022)
近年來,隨著時(shí)代的進(jìn)步,科學(xué)技術(shù)水平提高,計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)日趨成熟,成為計(jì)算機(jī)科學(xué)的關(guān)鍵構(gòu)成部分,在各行各業(yè)均得到實(shí)際應(yīng)用,推動著社會發(fā)展。在此背景下,積極探索計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的開發(fā)及其應(yīng)用意義重大,值得深思。
遺傳算法屬于隨機(jī)搜索算法之一,其主要是在遺傳機(jī)理、生物自然選擇基礎(chǔ)上發(fā)展而來的。遺傳算法不僅可實(shí)現(xiàn)與其他模型性質(zhì)有機(jī)結(jié)合,而且其還能夠?qū)Α斑z傳性”產(chǎn)生決定性作用[1]。與此同時(shí),遺傳算法在數(shù)據(jù)挖掘中還表現(xiàn)了隱含并行性的獨(dú)特優(yōu)勢,得到了廣泛的應(yīng)用。Sunil在數(shù)據(jù)挖掘工具的研究中,將遺傳算法作為基礎(chǔ)和核心,實(shí)現(xiàn)對飛機(jī)失事真實(shí)數(shù)據(jù)的分析,與之相適應(yīng)數(shù)據(jù)挖掘試驗(yàn)的完成,更能夠彰顯遺傳算法的獨(dú)特性,其進(jìn)而為數(shù)據(jù)挖掘的實(shí)現(xiàn)提供強(qiáng)大的動力。遺傳算法在數(shù)據(jù)挖掘統(tǒng)計(jì)中的應(yīng)用,需要注重將其和有關(guān)技術(shù)有機(jī)結(jié)合起來,以便發(fā)揮更大的效用。如,可和粗糙集結(jié)合、與神經(jīng)網(wǎng)絡(luò)融合等,有助于達(dá)到意想不到的應(yīng)用效果。在遺傳算法的支撐下,還有利于進(jìn)一步優(yōu)化神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),實(shí)現(xiàn)對多余連接的刪除。同時(shí),若是與bp算法結(jié)合,還能夠訓(xùn)練神經(jīng)網(wǎng)絡(luò)。雖然遺傳算法優(yōu)點(diǎn)眾多,但在具體應(yīng)用時(shí),也表現(xiàn)了結(jié)構(gòu)復(fù)雜的缺陷,有待改進(jìn)。
神經(jīng)網(wǎng)絡(luò)具有獨(dú)特的優(yōu)勢,不僅呈現(xiàn)了魯棒性、高度容錯(cuò)的特征,而且還具備較強(qiáng)的存儲能力、組織適應(yīng)能力與處理能力,將其運(yùn)用到數(shù)據(jù)挖掘當(dāng)中,能夠達(dá)到良好的應(yīng)用效果。在神經(jīng)網(wǎng)絡(luò)的支撐下,可高效的對數(shù)據(jù)信息進(jìn)行分類與識別,在實(shí)際應(yīng)用中,可構(gòu)建前饋式神經(jīng)網(wǎng)絡(luò)模型。例如,建立基于hopfield網(wǎng)絡(luò)結(jié)構(gòu)的連續(xù)模型、基于hopfield網(wǎng)絡(luò)結(jié)構(gòu)的離散模型,在此基礎(chǔ)上有助于實(shí)現(xiàn)優(yōu)化計(jì)算、聯(lián)想記憶[2]。針對于koholon模型,或者是art模型,其通常情況應(yīng)用在聚類自組織映射方法。在對神經(jīng)網(wǎng)絡(luò)技術(shù)的使用過程中,應(yīng)該明確其所存在的缺陷即“黑箱”性,由于難以對學(xué)習(xí)與決策的過程進(jìn)行了解,所以不可避免的會增加執(zhí)行阻礙。
決策樹顧名思義為一種樹形結(jié)構(gòu),屬于預(yù)測模型算法的一種,即便是面對海量的數(shù)據(jù),決策樹也可對其進(jìn)行有效分類,并且能夠從多種多樣的數(shù)據(jù)中,挖掘有價(jià)值的數(shù)據(jù)與信息。為此,將其應(yīng)用在計(jì)算機(jī)數(shù)據(jù)挖掘中是必要的,不但描述簡單,而且還大幅提升了分類效率。尤其是在對大規(guī)模數(shù)據(jù)處理時(shí),更需要重視決策樹的應(yīng)用。Quinlan所提出的決策樹,將信息熵的id3算法作為重要的基礎(chǔ)。相對來說,id3決策樹在應(yīng)用中,存在抗噪性不足的問題,并且在表達(dá)復(fù)雜概念層面存在一定的難度,上述問題的存在給id3決策樹的應(yīng)用帶來了負(fù)面影響。面對此現(xiàn)象,在id3模型算法上進(jìn)行了升級和優(yōu)化,促使ible、id4 等算法應(yīng)運(yùn)而生[3]。
在科技環(huán)境下,計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)含量增加,促使其日益普及,應(yīng)用效果顯著。在金融領(lǐng)域亦是如此,提升了金融管理效率和質(zhì)量。金融在公司發(fā)展中起到了強(qiáng)大的支撐作用,金融管理和分析成果影響著公司的規(guī)模。例如,在做好數(shù)據(jù)處理和分析工作的基礎(chǔ)上,能夠?qū)竟善边M(jìn)行有效的預(yù)測,有助于及時(shí)規(guī)避投資所帶來的風(fēng)險(xiǎn)。在此方面,融入計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù),可建立相應(yīng)的股票模型,通過其生命周期中的數(shù)據(jù),有助于了解日后可能出現(xiàn)的風(fēng)險(xiǎn),可避免公司領(lǐng)導(dǎo)層做錯(cuò)誤的抉擇,進(jìn)行錯(cuò)誤的投資[4]。在金融方面,計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的應(yīng)用還體現(xiàn)在對工作環(huán)境的預(yù)測和分析上,針對于有著較高危險(xiǎn)系數(shù)的行業(yè),能夠依托此技術(shù)建立模型,強(qiáng)化對周圍環(huán)境的分析,開展相關(guān)危險(xiǎn)系數(shù)語境算法的設(shè)計(jì),如一旦存在危險(xiǎn)的跡象,能夠及時(shí)拉響報(bào)警,可將負(fù)面影響降至最低。
在市場運(yùn)行與發(fā)展中,市場營銷所發(fā)揮的作用不可替代。之所以要進(jìn)行市場營銷,主要是為了滿足大眾需求。在計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)應(yīng)用中,能夠?qū)⑿畔⒐芾砼c條形碼技術(shù)融合在一起,在此基礎(chǔ)上,可有效對用戶的日常數(shù)據(jù)進(jìn)行收集,以強(qiáng)化對大眾心理的了解,增強(qiáng)市場營銷針對性。在數(shù)據(jù)收集中,由于存在數(shù)據(jù)種類多、數(shù)據(jù)量大的特征,無法實(shí)現(xiàn)人為管理,加大了數(shù)據(jù)收集與整合的難度。要想攻克該問題,需要充分發(fā)揮大數(shù)據(jù)挖掘技術(shù)的作用,可提高數(shù)據(jù)收集效率和質(zhì)量,進(jìn)而實(shí)現(xiàn)消費(fèi)者心理習(xí)慣、日常生活軌跡等相關(guān)數(shù)據(jù)的分析,為市場營銷管理提供依據(jù),使其結(jié)合準(zhǔn)確的數(shù)據(jù),制定切實(shí)可行的營銷方案,對市場營銷效果的提升具有重要意義[5]。
總而言之,計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)對人們的影響力不斷擴(kuò)大,各行各業(yè)也表現(xiàn)了對此技術(shù)的依賴性。因此,應(yīng)該加大計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)開發(fā)力度,并發(fā)揮其作用,強(qiáng)化該技術(shù)的應(yīng)用,使其能夠成為推動社會進(jìn)步的助推器。