薛瑞峰,彭墩陸
(1.上海金融學(xué)院,上海 201209;2.上海理工大學(xué),上海 200000)
隨著擴(kuò)招政策的延伸,高校的畢業(yè)生每年都在大量增加,就業(yè)形勢(shì)也變得十分嚴(yán)峻,鑒于此種形勢(shì),高校的畢業(yè)生職業(yè)指導(dǎo)工作引入了數(shù)據(jù)挖掘技術(shù),旨在對(duì)畢業(yè)生就業(yè)數(shù)據(jù)信息進(jìn)行分析比對(duì),構(gòu)建高校職業(yè)指導(dǎo)服務(wù)體系,指導(dǎo)學(xué)生盡快實(shí)現(xiàn)就業(yè)。
(1)數(shù)據(jù)挖掘技術(shù)概況。數(shù)據(jù)信息管理系統(tǒng)的應(yīng)用,為用戶節(jié)省了大量的時(shí)間,提高了數(shù)據(jù)信息的管理效率。數(shù)據(jù)挖掘技術(shù)是基于數(shù)據(jù)信息管理系統(tǒng)產(chǎn)生的新式的數(shù)據(jù)管理方式,最早起源于早期數(shù)據(jù)信息管理系統(tǒng)中。目前我國(guó)的數(shù)據(jù)信息管理系統(tǒng)也進(jìn)入了大范圍的使用階段,如何對(duì)數(shù)據(jù)實(shí)現(xiàn)有效利用成為了一個(gè)課題。當(dāng)前高校的數(shù)據(jù)信息管理系統(tǒng)趨于完善,對(duì)信息實(shí)行了分類歸檔的作法,由此也產(chǎn)生了冗余信息。對(duì)于數(shù)據(jù)信息的高速膨脹,必須采取新方法進(jìn)行管理。數(shù)據(jù)挖掘技術(shù)就是在這種形勢(shì)下誕生的。數(shù)據(jù)挖掘技術(shù)的優(yōu)勢(shì)在于能夠從數(shù)據(jù)信息管理系統(tǒng)的數(shù)據(jù)庫(kù)中抽取有價(jià)值信息,并將這些有規(guī)律的信息歸納整理,對(duì)原有的數(shù)據(jù)庫(kù)中的數(shù)據(jù)重新進(jìn)行分析比對(duì)和挖掘,將有益的信息挖掘出來(lái)。數(shù)據(jù)挖掘技術(shù)屬于對(duì)數(shù)據(jù)信息的二次加工,滿足了用戶數(shù)據(jù)管理的需要,使數(shù)據(jù)庫(kù)中的冗余數(shù)據(jù)繼續(xù)發(fā)揮作用,實(shí)現(xiàn)對(duì)數(shù)據(jù)庫(kù)信息的全面利用。
(2)數(shù)據(jù)挖掘技術(shù)的概念。數(shù)據(jù)挖掘技術(shù)是基于數(shù)據(jù)庫(kù)的一種信息管理新技術(shù),是數(shù)據(jù)庫(kù)信息管理中開(kāi)發(fā)的一個(gè)新方式。數(shù)據(jù)挖掘技術(shù)是一個(gè)綜合的技術(shù),采用了數(shù)據(jù)庫(kù)管理技術(shù)、數(shù)理統(tǒng)計(jì)技術(shù)、數(shù)學(xué)應(yīng)用技術(shù)等等,是多個(gè)技術(shù)的融合和歸納。數(shù)據(jù)挖掘技術(shù)從發(fā)明以來(lái),已經(jīng)在實(shí)際數(shù)據(jù)管理中運(yùn)用了十幾年的時(shí)間。數(shù)據(jù)挖掘技術(shù)有效的吸取了相關(guān)學(xué)科的優(yōu)點(diǎn),集多個(gè)學(xué)科的優(yōu)點(diǎn)于一身,逐漸形成了與眾不同的具有自己特色的數(shù)據(jù)管理方式。數(shù)據(jù)挖掘從定義上面分為廣義數(shù)據(jù)挖掘技術(shù)和狹義數(shù)據(jù)挖掘技術(shù),廣義數(shù)據(jù)挖掘主要是指從數(shù)據(jù)庫(kù)中獲取特定的、未知的知識(shí),并且該知識(shí)對(duì)管理決策起決定作用。狹義數(shù)據(jù)挖掘主要是指從固定的數(shù)據(jù)體系中選擇有規(guī)律的知識(shí)的過(guò)程。不管數(shù)據(jù)挖掘如何定義,其優(yōu)勢(shì)作用正越來(lái)越被人們所重視,正逐漸應(yīng)用在數(shù)據(jù)管理領(lǐng)域。
(1)目前高校職業(yè)指導(dǎo)體系概述。目前的高校職業(yè)指導(dǎo)體系,由于數(shù)據(jù)量越來(lái)越大,數(shù)據(jù)信息種類越來(lái)越多,依靠傳統(tǒng)的人工管理方法已經(jīng)不能適應(yīng)形勢(shì)的需要,基于這種現(xiàn)狀,在高校職業(yè)指導(dǎo)體系中已經(jīng)大范圍的應(yīng)用了數(shù)據(jù)管理系統(tǒng)。高校的職業(yè)指導(dǎo)體系的作用是對(duì)畢業(yè)生就業(yè)進(jìn)行政策性指導(dǎo),并將畢業(yè)生的所有信息錄入到高校數(shù)據(jù)庫(kù)中,供日后進(jìn)行分析比對(duì)。雖然多數(shù)高校都實(shí)現(xiàn)了數(shù)據(jù)管理系統(tǒng),但是在對(duì)畢業(yè)生信息的利用上,目前的利用率還不高。數(shù)據(jù)發(fā)掘技術(shù)的出現(xiàn),有效的改變了高校職業(yè)指導(dǎo)體系對(duì)數(shù)據(jù)信息的利用模式,使高校職業(yè)指導(dǎo)體系中的冗余信息得到了發(fā)掘和運(yùn)用,使畢業(yè)生的信息真正實(shí)現(xiàn)全方位、立體的綜合運(yùn)用。
目前數(shù)據(jù)挖掘技術(shù)已經(jīng)開(kāi)始在高校職業(yè)指導(dǎo)體系中大范圍運(yùn)用,由于數(shù)據(jù)挖掘技術(shù)的特點(diǎn),數(shù)據(jù)挖掘技術(shù)能夠整合數(shù)據(jù)庫(kù)資源,對(duì)高校畢業(yè)生數(shù)據(jù)庫(kù)內(nèi)的信息進(jìn)行分類細(xì)分,將有用信息挖掘出來(lái)進(jìn)行利用,將瑣碎信息予以剔除,保證了高校畢業(yè)生數(shù)據(jù)庫(kù)信息的完全利用。
(2)利用數(shù)據(jù)挖掘技術(shù)的算法選擇。目前高校職業(yè)指導(dǎo)體系的構(gòu)建,需要借助數(shù)據(jù)挖掘技術(shù)。運(yùn)用數(shù)據(jù)挖掘技術(shù)首先就要確定算法。目前基于數(shù)據(jù)挖掘技術(shù)構(gòu)建的高校職業(yè)指導(dǎo)服務(wù)體系的首選算法為ID3算法,ID3算法是目前應(yīng)用最廣泛的決策樹(shù)實(shí)現(xiàn)算法,最早出現(xiàn)在1977年。ID3算法的主導(dǎo)思想是用信息增益作為決策屬性分類判別能力的度量,進(jìn)行決策節(jié)點(diǎn)屬性的選擇。ID3算法的重點(diǎn)在于選擇正確的決策節(jié)點(diǎn),用以形成決策樹(shù)。選擇完決策節(jié)點(diǎn)之后,就要根據(jù)決策節(jié)點(diǎn)生成決策分支。一般我們會(huì)選取具有代表性質(zhì)樣本進(jìn)行數(shù)據(jù)采集,用以分析樣本數(shù)據(jù)的分類特征。ID3算法的決策節(jié)點(diǎn)是依據(jù)信息論中的相關(guān)定義來(lái)選擇,具有一定的代表性,能夠體現(xiàn)數(shù)據(jù)挖掘的主要特征,把握好這個(gè)原則,就可以利用數(shù)據(jù)挖掘技術(shù)構(gòu)建出優(yōu)良的信息管理體系。因此,構(gòu)建高校職業(yè)指導(dǎo)服務(wù)體系,數(shù)據(jù)挖掘技術(shù)的算法選擇是關(guān)鍵。
(3)數(shù)據(jù)挖掘技術(shù)在高校職業(yè)指導(dǎo)服務(wù)體系中的運(yùn)用。目前由于國(guó)家實(shí)行了高校擴(kuò)招的招生政策,高校的畢業(yè)生的數(shù)量也出現(xiàn)了大幅度的增長(zhǎng)。為了對(duì)畢業(yè)生的信息實(shí)行有效規(guī)范的管理,高校紛紛建立自己的數(shù)據(jù)信息管理系統(tǒng)。為了實(shí)現(xiàn)對(duì)畢業(yè)生的信息系統(tǒng)化、規(guī)范化的管理,高校開(kāi)始采用數(shù)據(jù)挖掘技術(shù)來(lái)構(gòu)建自己的職業(yè)指導(dǎo)服務(wù)體系。由于高校的畢業(yè)生信息數(shù)據(jù)庫(kù)的信息量龐大,這就為數(shù)據(jù)挖掘技術(shù)的應(yīng)用提供了有力條件。在高校畢業(yè)生數(shù)據(jù)庫(kù)中,數(shù)據(jù)挖掘技術(shù)運(yùn)用了ID3算法,在畢業(yè)生的數(shù)據(jù)庫(kù)中挖掘出有價(jià)值的數(shù)據(jù)信息,并將這些信息進(jìn)行分類,為指導(dǎo)學(xué)生就業(yè)提供有益的參考。這些有價(jià)值的數(shù)據(jù)信息包括:學(xué)生的各個(gè)科目的成績(jī)、是否在社團(tuán)擔(dān)任職務(wù)、是否具有一定的特長(zhǎng)、是否具備第二學(xué)位。是否具備國(guó)家考試的資格證件等等。數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)了將畢業(yè)生基本信息、就業(yè)信息和成績(jī)信息有效的融合,并從中挖掘出有價(jià)值的信息和線索,指導(dǎo)畢業(yè)生就業(yè)。因此,數(shù)據(jù)挖掘技術(shù)在高校職業(yè)指導(dǎo)服務(wù)體系的構(gòu)建中,發(fā)揮了重要的作用。
構(gòu)建高校職業(yè)指導(dǎo)服務(wù)體系需要采用創(chuàng)新方法,數(shù)據(jù)挖掘技術(shù)本身具有的對(duì)數(shù)據(jù)分類分析和挖掘管理的優(yōu)勢(shì),正符合構(gòu)建高校職業(yè)指導(dǎo)服務(wù)體系的要求。鑒于高校畢業(yè)生信息庫(kù)具有大量數(shù)據(jù)信息和數(shù)據(jù)挖掘技術(shù)的特點(diǎn),數(shù)據(jù)挖掘技術(shù)被應(yīng)用于高校畢業(yè)生職業(yè)指導(dǎo)工作中。數(shù)據(jù)挖掘技術(shù)的應(yīng)用,促進(jìn)了高校職業(yè)指導(dǎo)服務(wù)體系的發(fā)展,提高了高校職業(yè)指導(dǎo)的工作效率,使高校的就業(yè)指導(dǎo)工作能夠適應(yīng)社會(huì)形勢(shì)的需要,能夠?yàn)閺V大畢業(yè)生提供優(yōu)質(zhì)的就業(yè)指導(dǎo)服務(wù)。由于畢業(yè)生就業(yè)涉及的信息較多,應(yīng)用數(shù)據(jù)挖掘技術(shù)可以為畢業(yè)生提供就業(yè)的關(guān)鍵信息,可以挖掘出有價(jià)值的就業(yè)線索。所以,在構(gòu)建高校的職業(yè)指導(dǎo)服務(wù)體系必須應(yīng)用數(shù)據(jù)挖掘技術(shù)。
[1]毛國(guó)君,段立娟.數(shù)據(jù)挖掘原理與算法[M].北京:清華大學(xué)出版社,2005.
[2]武森,高學(xué)東,[德]M.巴斯蒂安.數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘[M].北京:冶金工業(yè)出版社,2003.