呂亞娟 吳英 杜秋
【摘要】? ? 本論文的研究視角是當前比較熱門的高校專業(yè)技術(shù)人員考核問題,針對高校這一特殊的群體,提出了基于apriori算法的關(guān)聯(lián)規(guī)則在專業(yè)技術(shù)人員考核中應(yīng)用方法,為高校校長和決策機構(gòu)、機關(guān),提供科學的決策依據(jù)。
【關(guān)鍵字】? ? apriori算法? ? 高校專業(yè)技術(shù)人員? ? 考核
引言
高校專業(yè)技術(shù)人員考核系統(tǒng),主要包括對專業(yè)技術(shù)人員進行年度和任期考核??己耸橇私庹莆諏I(yè)技術(shù)人員情況的一個重要手段,同時也是正確實施獎懲和選拔使用專業(yè)技術(shù)人員的必要前提。各個高校每年都要進行專業(yè)技術(shù)人員考核工作,該工作的組織與實施是由學校人事部門來完成。專業(yè)技術(shù)人員考核的實施可以對專業(yè)技術(shù)人員的教育、管理工作起到了良好的推進作用,同時也為人事部門提拔使用專業(yè)技術(shù)人員提供了科學的依據(jù)。從人事干部數(shù)據(jù)庫和職稱考核數(shù)據(jù)庫中進行數(shù)據(jù)挖掘,找出專業(yè)技術(shù)人員工作績效與其職稱、學歷、年齡、學緣結(jié)構(gòu)、任職經(jīng)歷、工作經(jīng)歷等方面的關(guān)聯(lián)。找到專業(yè)技術(shù)人員成長進步和人員整體素質(zhì)的關(guān)系,從而做到合理安排專業(yè)技術(shù)人員,使其始終保持積極向上的工作狀態(tài),為高校校長和決策機構(gòu)、機關(guān)提供科學的決策依據(jù)。
一、apriori關(guān)聯(lián)規(guī)則算法
在算法的選擇方面,因為我們要從人事干部數(shù)據(jù)庫和職稱考核數(shù)據(jù)庫中挖掘出專業(yè)技術(shù)人員工作績效與干部屬性的關(guān)聯(lián)性,所以應(yīng)該選用關(guān)聯(lián)規(guī)則算法。典型的關(guān)聯(lián)規(guī)則挖掘算法是R.Agralwal等人提出的apriori算法,它有效解決了傳統(tǒng)關(guān)聯(lián)規(guī)則算法中候選項目集大、計算量大等問題,現(xiàn)行的關(guān)聯(lián)規(guī)則算法大多是以apriori為核心,或是其變體,或是其擴展[1]。但是,因為apriori算法在挖掘過程中需要多次掃描數(shù)據(jù)庫,還是會產(chǎn)生大量的候選項目集,針對專業(yè)技術(shù)人員考核的特殊性,提出apriori算法在專業(yè)技術(shù)人員考核中應(yīng)用的改進算法。
二、apriori關(guān)聯(lián)規(guī)則算法及其在人員考核系統(tǒng)中的改進
Apriori關(guān)聯(lián)規(guī)則算法采用apriori-gen函數(shù)產(chǎn)生候選集的方法大大減少了候選項目集的數(shù)量,減少了關(guān)聯(lián)規(guī)則挖掘的計算量,極大地提高了數(shù)據(jù)挖掘的效率,但是對于海量的挖掘數(shù)據(jù)來說,apriori關(guān)聯(lián)規(guī)則算法所帶來的計算量也是驚人的,特別是當事務(wù)和候選項集的數(shù)目非常大時,這種計算方法還是非常昂貴的,例如:假設(shè)算法得到的1項頻繁集的數(shù)量是104,則根據(jù)apriori算法將會產(chǎn)生107個2項候選集,由于2項候選集沒有剪枝,所以所有這些候選集都需要校驗,由此帶來的計算量是驚人的。Apriori算法在大量候選集產(chǎn)生的情況下基本很難運行。
將apriori關(guān)聯(lián)規(guī)則算法應(yīng)用到高校專業(yè)技術(shù)人員考核系統(tǒng)中的目標是找出專業(yè)技術(shù)人員工作績效與人員的職稱、學歷、年齡、學緣結(jié)構(gòu)、任職經(jīng)歷等方面的關(guān)聯(lián)。如果將apriori算法簡單地應(yīng)用到這些關(guān)聯(lián)規(guī)則的挖掘上面,不僅給挖掘工作帶來了驚人的計算量,并且將會產(chǎn)生很多我們不想關(guān)注的關(guān)聯(lián)規(guī)則,例如:
三、結(jié)論
改進后的apriori算法之所以能夠大大減少關(guān)聯(lián)規(guī)則挖掘的計算量,在于它極大地減少了候選頻繁項集的數(shù)量,也就是將大量我們并不想關(guān)注的頻繁項集忽略掉,而只考慮我們關(guān)注的頻繁項集。因為我們要找出專業(yè)技術(shù)人員工作績效與人員的職稱、學歷、年齡、學緣結(jié)構(gòu)、任職經(jīng)歷等方面的關(guān)聯(lián),所以在候選集以及頻繁項集的生成過程中將考核成績項it作為所有頻繁項集和候選集(除1-項集以外)的子集。下面我們將結(jié)合人員管理數(shù)據(jù)庫使用apriori關(guān)聯(lián)規(guī)則的改進算法對高校專業(yè)技術(shù)人員考核系統(tǒng)進行關(guān)聯(lián)規(guī)則分析。
參? 考? 文? 獻
[1] (美)Olivia Parr Rud著.朱楊勇等譯.數(shù)據(jù)挖掘?qū)嵺`[M].北京:機械工業(yè)出版社,2003.
[2] 蔣孝明. 基于LINQ的人事檔案管理系統(tǒng)的設(shè)計與實現(xiàn)[J]. 計算機與現(xiàn)代化. 2014(03)
[3] 邱瑾,吳丹.協(xié)同信息檢索用戶行為研究方法綜述[J].信息資源管理學報,2012,(01): 74-81,97.
[4]王培吉,趙玉琳,呂劍峰.基Apriori算法的關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘研究[J]. 統(tǒng)計與決策. 2011(23)