夏 宇, 劉天華
(沈陽師范大學(xué) 科信軟件學(xué)院, 沈陽 110034)
?
基于聚類分析的教職工檔案管理
夏 宇, 劉天華
(沈陽師范大學(xué) 科信軟件學(xué)院, 沈陽 110034)
提出了基于聚類分析的教職工檔案管理系統(tǒng)的設(shè)計(jì)思路。首先采用B/S架構(gòu)、SQL Server 2012數(shù)據(jù)庫以及Visual Studio 2013開發(fā)平臺(tái)搭建教職工檔案管理系統(tǒng),完成教師檔案的查詢、添加、更新、刪除操作;其次將聚類分析技術(shù)運(yùn)用到檔案管理系統(tǒng)中,著重解決了教師檔案的應(yīng)用要求,掌握教師檔案數(shù)據(jù)的各項(xiàng)數(shù)據(jù)特征,從復(fù)雜的數(shù)據(jù)源信息中挖掘出潛在規(guī)律以及關(guān)鍵屬性,找出各個(gè)簇中最具代表的核心數(shù)值,經(jīng)過正確的聚類分析方法處理,最終得出令人滿意的教師評估結(jié)果,幫助有關(guān)部門決策。通過聚類分析方法與檔案管理系統(tǒng)的融合,有效的提高了檔案管理工作的效率、便于學(xué)校有關(guān)部門對教師做出合理評估,實(shí)現(xiàn)教職工檔案信息的有序化管理。
聚類分析; B/S架構(gòu); Visual Studio 2013; SQL Server 2012
近年來,教職工檔案信息[1]的管理呈現(xiàn)多樣化、復(fù)雜化的特點(diǎn),這就使得教職工檔案信息的管理計(jì)算機(jī)化成為必然的發(fā)展趨勢。目前,聚類分析技術(shù)[2]發(fā)展迅速,不僅在教育技術(shù)領(lǐng)域得到廣泛應(yīng)用,而且在檔案信息整理方面也卓有成效。聚類分析技術(shù)結(jié)合計(jì)算機(jī)來完成教職工檔案信息[3]的管理工作,確保學(xué)校管理教師檔案信息的工作人員的工作準(zhǔn)確無誤,同時(shí)還可以運(yùn)用本系統(tǒng)的記錄信息來統(tǒng)計(jì)學(xué)校要求的海量信息,系統(tǒng)會(huì)根據(jù)用戶的需求自動(dòng)彈出所需要的信息,這將使檔案管理員從繁重的任務(wù)量中擺脫出去,節(jié)省工作時(shí)間、增強(qiáng)工作效率,使學(xué)校相關(guān)工作能夠及時(shí)、正確的進(jìn)行。因此研發(fā)、設(shè)計(jì)并實(shí)現(xiàn)中小學(xué)教職工檔案管理[4]系統(tǒng)顯得格外有意義。
聚類分析[5]指將不同的研究對象分為相同性質(zhì)的群組的分析過程,其特點(diǎn)為自動(dòng)決定最佳分類數(shù)、能夠及時(shí)處理大量繁瑣數(shù)據(jù)、對象各自彼此獨(dú)立等。聚類分析與因特網(wǎng)的結(jié)合主要是用來進(jìn)行文檔歸類修復(fù),主要步驟如下:
1) 數(shù)據(jù)預(yù)處理:主要包括選擇物體的個(gè)數(shù)、體貌特征等,特征要尤其突出、足以體現(xiàn)物體的本質(zhì),轉(zhuǎn)化為一個(gè)新的顯著特征,然后獲取一個(gè)準(zhǔn)確的特征集進(jìn)行聚類,若出現(xiàn)孤立點(diǎn),則會(huì)導(dǎo)致聚類結(jié)果出現(xiàn)偏差,所以需將孤立點(diǎn)移出。
2) 衡量相似度、距離:數(shù)據(jù)的類似性是某一個(gè)類的基礎(chǔ),那么衡量不同數(shù)據(jù)在同一個(gè)特征空間的相似度就成為重中之重,從而衡量不同數(shù)據(jù)間的相異性。
3) 聚類或分組[6]:聚類主要分為2種方法,分別是劃分方法和層次方法。將數(shù)據(jù)信息如何最優(yōu)劃分到不同的類中是十分重要的環(huán)節(jié),數(shù)據(jù)根據(jù)不同的聚類標(biāo)準(zhǔn)[7]被劃分到不同的類中。
4) 評估輸出:評估聚類結(jié)果是另一個(gè)重要環(huán)節(jié),沒有具體的標(biāo)準(zhǔn)評價(jià)聚類質(zhì)量,通過一個(gè)類有效索引評價(jià),通常來講,各類之間的分離與各類內(nèi)部的耦合,都將用來評價(jià)聚類結(jié)果的質(zhì)量,類有效索引的最佳值將從正確的類數(shù)目中獲取。
教職工的檔案信息包括教師的校區(qū)信息、教師項(xiàng)目信息、教師發(fā)明專利、教師獲獎(jiǎng)信息、教師處分信息、教師職稱管理、教師人事檔案、教師人事調(diào)動(dòng)、教師繼續(xù)教育、教師論文信息、教師著作信息、教師指導(dǎo)學(xué)生與教師其他文件等。
2.1 系統(tǒng)總體功能結(jié)構(gòu)圖
教職工檔案管理系統(tǒng)[8]的主要功能有添加、刪除、編輯、顯示檔案信息。采用B/S架構(gòu)[9],研發(fā)客戶端與管理端,分別為Service[10]與WebService[11],Service主要負(fù)責(zé)連接數(shù)據(jù)庫,而WebService則負(fù)責(zé)與前臺(tái)連接,具體功能結(jié)構(gòu)見圖1。
圖1 系統(tǒng)總體功能結(jié)構(gòu)圖
2.2 功能模塊設(shè)計(jì)
本系統(tǒng)共分為2個(gè)模塊,分別為用戶、后臺(tái)管理以及聚類分析,每個(gè)模塊又分為小模塊實(shí)現(xiàn)其相應(yīng)功能,功能設(shè)計(jì)如下:
1) 用戶管理包括信息注冊、登錄以及個(gè)人信息的查看與修改。通過填寫姓名、身份證號等相關(guān)信息,完成注冊,用戶登錄后,可以完成個(gè)人信息的查看與修改;后臺(tái)管理教職工檔案[12]的海量信息,實(shí)現(xiàn)檔案信息的添加、刪除、編輯以及顯示功能,同時(shí)管理員還需要定期的進(jìn)行系統(tǒng)維護(hù)、及時(shí)的安裝補(bǔ)丁升級。
2) 采用K-means聚類的方法[13]對教師檔案進(jìn)行分析,首先要確定K-means聚類的目標(biāo):給定一個(gè)包含n個(gè)a維檔案數(shù)據(jù)集X={x1,x2,…,xi,…,xn},其中xi∈Ra,確定要生成的檔案數(shù)據(jù)子集的數(shù)目K,K-Means聚類算法將各教師檔案進(jìn)行分類,進(jìn)行K個(gè)劃分C={ck,i=1,2,…,k},每個(gè)劃分都代表一個(gè)檔案類ck,每個(gè)類ck均有一個(gè)類別核心值ui,ui為這個(gè)類最具代表的數(shù)值,即核心值成績。運(yùn)用歐式距離作為判斷相似度的準(zhǔn)則,通過計(jì)算類中各點(diǎn)到ui的距離平方和,判斷該點(diǎn)與核心數(shù)值的相似性,距離平方和為
(1)
(2)
其中:aki=1(xi∈ci)或者aki=0(xi?ci)。顯然,聚類中心uk應(yīng)該取為類別ck類各檔案數(shù)據(jù)點(diǎn)的平均值。
本文,K-means聚類算法從一個(gè)初始的K類別劃分開始,然后將各檔案數(shù)據(jù)點(diǎn)指派到各個(gè)類別中,目的是減小總的距離平方和。K-means聚類算法中總的距離平方和隨著類別個(gè)數(shù)K的增加而趨向于減小(當(dāng)K=n時(shí),J(C)=0)。因此,總的距離平方和只能在某個(gè)確定的類別個(gè)數(shù)K下,取得最小值。
K-means將檔案數(shù)據(jù)集劃分到K個(gè)分類中,算法的流程描述如下:
1) 從檔案數(shù)據(jù)集中隨機(jī)選擇 K個(gè)初始聚類中心;
2) 對檔案數(shù)據(jù)集中的每個(gè)數(shù)據(jù)對象,計(jì)算其與所有聚類中心的距離,并按照最近鄰原則將其劃分到距離最近的類中;
3) 重新計(jì)算各個(gè)新形成聚類的聚類中心,計(jì)算所有檔案的距離平方和;
4) 判斷聚類中心J(C)值是否改變,若是,重復(fù)執(zhí)行2 、3兩步操作直到聚類中心不再發(fā)生變化則算法結(jié)束;若不是,算法直接結(jié)束。
運(yùn)用相似度的方法去研究教師檔案信息之間的關(guān)系,這里用1和-1表示,若2份教師檔案信息的相似度極高,那么相似系數(shù)則趨近1或-1,反之趨近0,相似度較高的則分為一類。
設(shè)Ai,j為教師檔案Mi與Mj之間的相似度,那么有
1) Ai,j=±1 <=> Mi=kMj(k為常數(shù),且k≠0);
2) |Ai,j|≦1(i,j為任意數(shù));
3) Ai,j=Aj,i(i,j為任意數(shù))。
利用聚類分析方法去挖掘、評價(jià)教師綜合表現(xiàn)、為其打分,這樣各個(gè)劃分都成為一個(gè)成績集合群,處于簇中心的值、最具代表的值就是核心值成績,那么核心值成績就是教師評價(jià)的有效指標(biāo)。因此,通過聚類分析方法得到的成績是相對的,而不是絕對的,這樣就可以根據(jù)不同的角度對教師檔案進(jìn)行具體評估。
2.3 數(shù)據(jù)庫設(shè)計(jì)
數(shù)據(jù)庫[14-15]可以高效的存儲(chǔ)與管理數(shù)據(jù)信息。初級階段需要建立E-R圖模型,E-R圖模型可以表達(dá)出實(shí)體之間的關(guān)系、數(shù)據(jù)對象與實(shí)體的關(guān)系以及數(shù)據(jù)的屬性信息等,足以呈現(xiàn)本系統(tǒng)的需求設(shè)計(jì),本系統(tǒng)的E-R圖見圖2。
3.1 系統(tǒng)的實(shí)現(xiàn)
開始由用戶發(fā)起登錄操作,用戶名和密碼匹配成功,則完成系統(tǒng)登錄操作,顯示當(dāng)前默認(rèn)檔案信息。然后點(diǎn)擊添加、查詢、更新、刪除按鈕實(shí)現(xiàn)相對應(yīng)的功能操作。若數(shù)據(jù)庫中沒有與之相匹配的結(jié)果則顯示相應(yīng)的錯(cuò)誤信息,返回并提示繼續(xù)添加、查詢、更新、刪除操作,如果需要導(dǎo)出并打印,則可以點(diǎn)擊屏幕下方導(dǎo)出、打印按鈕,結(jié)束。
圖2 數(shù)據(jù)庫E-R圖
3.2 聚類分析的實(shí)現(xiàn)
表1 字段屬性
目前,學(xué)校十分重視教師的各項(xiàng)技能以及綜合素質(zhì)情況,而在教師的綜合評價(jià)體系中,學(xué)校要考慮老師的各種業(yè)務(wù)能力與在校的日常表現(xiàn),如教師發(fā)表論文數(shù)量、教師獲獎(jiǎng)情況等。假設(shè)我們從系統(tǒng)中采集的教師檔案信息為教師的著作數(shù)量、論文數(shù)量、獲獎(jiǎng)數(shù)量、職稱情況,具體分析見表1。
1) 傳統(tǒng)教師評價(jià)
大多采用絕對數(shù)量的評價(jià),如教師的論文數(shù)量達(dá)到10篇以上即為優(yōu)秀教師,雖然處理方式簡單統(tǒng)一,但是若很多教師沒有達(dá)到10篇論文的標(biāo)準(zhǔn),按照傳統(tǒng)評價(jià)體系評價(jià)教師就不合理。
2) 聚類分析教師評價(jià)
聚類分析方法則按照顯著特征選取若干個(gè)準(zhǔn)確的特征集簇,將數(shù)據(jù)放于簇中,在此過程中會(huì)出現(xiàn)若干孤立的點(diǎn),防止出現(xiàn)偏差將孤立點(diǎn)移出,然后衡量不同數(shù)據(jù)在同一個(gè)特征空間的相似度,從而得出不同數(shù)據(jù)間的相異性。同時(shí)不同的簇也將相應(yīng)地對各個(gè)成績?nèi)哼M(jìn)行劃分,給出相應(yīng)成績?nèi)旱暮诵某煽?。若著作的?shù)量很多時(shí),自然用在寫論文的數(shù)量上就會(huì)大大減少,從而對本身的綜合評價(jià)帶來影響。著作數(shù)量、論文數(shù)量、獲獎(jiǎng)數(shù)量都很少時(shí),那么可以挖掘出老師的工作狀態(tài)不是很積極、綜合能力沒有體現(xiàn),再評職稱的時(shí)候就會(huì)處于劣勢。只有合理安排自己的學(xué)習(xí)時(shí)間、努力工作,將各個(gè)方面都做到最好,才會(huì)促進(jìn)教師各方面的綜合發(fā)展。
以下是某專業(yè)2014學(xué)年度對5位教師綜合評價(jià)的數(shù)據(jù),進(jìn)行聚類分析。評價(jià)項(xiàng)目及分?jǐn)?shù)情況見表2。評價(jià)得分情況見表3。
表2 評價(jià)項(xiàng)目及分值情況
表3 評價(jià)得分情況
聚類結(jié)果為:{4}、{1,2}、{3,5},根據(jù)以上結(jié)果,將教師分為3類,其等級分別為A、B、C。
通過以上對傳統(tǒng)方式與聚類分析方式教師評價(jià)的對比上看,傳統(tǒng)方式比較死板,不能全面衡量教師的工作情況,而通過聚類分析的方法則可以補(bǔ)充傳統(tǒng)方法的不足,挖掘出老師的各方面信息。
結(jié)合聚類分析、運(yùn)用計(jì)算機(jī)管理教職工檔案,可以顯現(xiàn)出以往管理模式所無法達(dá)到的優(yōu)勢,聚類分析能夠從樣本數(shù)據(jù)出發(fā),自動(dòng)進(jìn)行分類、綜合評價(jià)教師檔案,全面衡量教師的各種工作狀態(tài),若所采用方法不同,那么得到的結(jié)論也會(huì)不同;而計(jì)算機(jī)的優(yōu)點(diǎn)則可以高效的完成教師檔案的查詢、添加、更新、刪除操作,實(shí)現(xiàn)教師檔案信息管理的系統(tǒng)化、有序化、科學(xué)化。本文做出詳細(xì)的需求分析、數(shù)據(jù)庫設(shè)計(jì)、總體功能模塊設(shè)計(jì)等,采用聚類分析方法,研發(fā)出教職工檔案管理系統(tǒng),完善教務(wù)管理體制、有效地提高了教務(wù)工作效率,具有重要的作用和意義。
[ 1 ]張成文. 基于Web的中小學(xué)綜合教學(xué)管理平臺(tái)的研究與實(shí)現(xiàn)[D]. 蘭州:蘭州大學(xué), 2013.
[ 2 ]張千,時(shí)念云,張瓊聲. 基礎(chǔ)模糊聚類分析的教師評價(jià)模型[J]. 計(jì)算機(jī)系統(tǒng)應(yīng)用, 2012(12):168-172.
[ 3 ]高飛. 中學(xué)教務(wù)管理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J]. 教育教學(xué)論壇, 2013(42):16-17.
[ 4 ]林凱. 民辦高校教務(wù)管理工作的現(xiàn)狀與對策[J]. 民營科技, 2014(1):111.
[ 5 ]孫吉貴,劉杰,趙連宇. 聚類算法研究[J]. 軟件學(xué)報(bào), 2008,19(1):9-10.
[ 6 ]王縱虎,劉志鏡,陳東輝. 基于統(tǒng)計(jì)學(xué)習(xí)的自適應(yīng)文本聚類研究[J]. 四川大學(xué)學(xué)報(bào)(工程科學(xué)版), 2012,44(1):106-111.
[ 7 ]陳旭,馮嶺,劉斌,等. 基于技術(shù)功效矩陣的專利聚類分析[J]. 小型微型計(jì)算機(jī)系統(tǒng), 2014,35(3):526-531.
[ 8 ]熊開盛. 檔案查詢系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J]. 武漢科技學(xué)院學(xué)報(bào), 2006(12):45-48.
[ 9 ]朱濤. 淺談B/S模式下的學(xué)生信息管理系統(tǒng)的研究[J]. 教育管理與評價(jià), 2010,28(20):38-39.
[10]HOFMANN A,APFEL B,BARTHU,et al. The Building of Education Management System based on Web 2.0[J]. Int E Edu Res, 2014(1):7-9.
[11]鐘文祥. 基于Web的教務(wù)管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J]. 信息與電腦, 2013(1):221-223.
[12]于勇強(qiáng). 人才中心檔案管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 北京:北京郵電大學(xué), 2011.
[13]王千,王成,馮振元,等. K-means聚類算法研究綜述[J]. 電子設(shè)計(jì)工程, 2012,20(7):21-24.
[14]田君. 基于ASP.NET的數(shù)據(jù)庫訪問技術(shù)[J]. 數(shù)字技術(shù)與應(yīng)用, 2013(1):30-44.
[15]XIANG Caifeng, ZHANG Yueheng. Design and implementation of enterprise purchase sale storage management information system based on ASP.NET[J]. China Manage Inf, 2011,14(3):35-36.
Received date: 2015-12-06.
Supported: Project supported by Department of Education of Liaoning Province (L2010514).
Biography: CHENG Congdian(1960-),male, was born in Shenyang city of Liaoning province, professor of Shenyang Normal University, master.
文章編號: 1673-5862(2016)02-0201-05
理論與應(yīng)用研究
Abstract: The problem whether a iterative process of nonexpansive mappingTin real Banach Spaces converges to its fixed point(IPNMCFP)has be extensively studied. Particularly, in 2004, Xu H K constructed a kind of extended Mann iterative process for nonexpansive mapping T, and by the so called viscosity approximation methods, he proved that the iterative process converges strongly to a fixed point of Tunder the uniformly smooth Banach Spaces. In 2007, Zhang S S developed the work of Xu H K. This paper further studies the problem IPNMCFP. By replacing constants with operators, the Ishikawa iterative process is generalized as a class of extended Ishikowa iterative process. Under some conditions, the strong convergence of the iterative process is proved in the viscosity approximation methods, using the theory of duality mapping and variational inequality. And in a special case the iterative process converges strongly to a fixed point ofTis also proved. For the introduced iterative process involves many kinds of Mann and Ishikawa iterative processes, the main conclusion of the present work extends and generalizes some recent results of this research area.
Key words: nonexpansive mapping; fixed point; sequence; Mann iterative process; Ishikawa iterative process
doi: 10.3969/ j.issn.1673-5862.2016.02.016
Offiles management of teaching and administrative staff based on cluster analysis
XIAYu,LIUTianhua
(Software College, Shenyang Normal University, Shenyang 110034, China)
In this paper, we propose a stratage to design a file management system for teaching and administrative staff based on cluster analysis. Firstly a platform was developed with B/S structure, database of SQL Server 2012 and Visual Studio 2013, and a staff files management system was builted to complete the operations of querying, adding, updating and deleting. Secondly the cluster analysis technique was applied to the files management system. It focus on solving the application requirements of teacher files and grasping the characteristics of the teacher files data, diging out the potential law and the key attributes from the complex data source information and finding out the most representative of the core values. After cluster analysis process correctly,finally, the satisfactory evaluation results are obtained, which will help school authorities for decision making. With the integration of clustering analysis and files management system, the efficiency of files management is improved, which provides a reasonable assessment of teacher for school authorities, and realize ordering management on files information.
cluster analysis; B/S architecture; Studio Visual 2013; Server SQL 2012
Aclass of extended ishikawa iterative processes in Banachspaces for nonexpansive mappings
CHENGCongdian,GUANHongyan
(School of Mathematics and Systems Science, Shenyang Normal University, Shenyang, 110034, China)
O177 Document code: A
2015-12-13。
遼寧省教育廳教育教學(xué)研究項(xiàng)目(ZK2015052)。
夏 宇(1991-),男,遼寧丹東人,沈陽師范大學(xué)碩士研究生; 通信作者: 劉天華(1966-),男,遼寧沈陽人,沈陽師范大學(xué)教授,博士。
1673-5862(2016)02-0196-05
TP391.1
A
10.3969/ j.issn.1673-5862.2016.02.015