薛云霞 ,陳宓宓 ,韓 茜
(1.江蘇科技大學(xué) 信息化建設(shè)與管理中心,江蘇 鎮(zhèn)江 212003;2.江蘇科技大學(xué) 經(jīng)濟管理學(xué)院,江蘇 鎮(zhèn)江 212003)
高校的發(fā)展關(guān)鍵在于人才隊伍建設(shè)和優(yōu)化,而如何利用信息化為高校人才隊伍的建設(shè)和管理服務(wù)是目前非常值得關(guān)注的課題。大多數(shù)高校內(nèi)部業(yè)務(wù)系統(tǒng)積累了人才的大量數(shù)據(jù),但這些數(shù)據(jù)呈現(xiàn)出碎片化和零散性的特征,這些碎片化的數(shù)據(jù)只能直接或間接反映人才的某一或某些屬性。只有將這些數(shù)據(jù)進行有效整合,才能完美地抽象出一個人才的信息全貌。目前有些學(xué)者對大數(shù)據(jù)下人才的服務(wù)和管理進行了研究,比如李曉東[1]分析研究了大數(shù)據(jù)對高校人才評價、人才引進和人才培養(yǎng)等人才隊伍建設(shè)課題的積極作用,并對人才管理的政策方面提出了建議。李藝全[2]闡述了大數(shù)據(jù)時代下高校人才管理面臨的機遇和挑戰(zhàn),并在人才引進、人才服務(wù)、人才培訓(xùn)和人才評價等方面提出了建設(shè)性意見。石緯林[3]等介紹了目前高校師資管理遇到的問題和挑戰(zhàn),并在大數(shù)據(jù)框架下提出了幾個高校師資管理的應(yīng)用方面。方丹丹[4]基于大數(shù)據(jù)構(gòu)建了高校教師職業(yè)生涯發(fā)展框架,為高校留住人才、發(fā)展人才、評價人才提供了參考思路。
但是目前鮮有基于大數(shù)據(jù)框架下的高校人才服務(wù)平臺架構(gòu)研究,本文將通過整合這些業(yè)務(wù)系統(tǒng)的人才數(shù)據(jù)和互聯(lián)網(wǎng)數(shù)據(jù),消除高校各個職能部門“人才數(shù)據(jù)孤島”,并且對這些數(shù)據(jù)進行深度挖掘和統(tǒng)計分析,尋找其中有價值的關(guān)系和規(guī)律,構(gòu)建人才服務(wù)平臺,通過平臺實現(xiàn)高校人才挖掘、人才推送、人才評價、人才管理和人才服務(wù),提高各個職能部門管理效率,給人才的學(xué)術(shù)研究和課程教學(xué)提供人性化的服務(wù)。
前期各個學(xué)校積累的數(shù)據(jù)既有人事系統(tǒng)、科研系統(tǒng)、教務(wù)系統(tǒng)、圖書借閱系統(tǒng)[5]、一卡通消費系統(tǒng)、一卡通門禁系統(tǒng)和人才個人主頁管理型業(yè)務(wù)產(chǎn)生的結(jié)構(gòu)化數(shù)據(jù),又有視頻、音頻、圖像等教學(xué)資源非結(jié)構(gòu)化數(shù)據(jù);另外還有CNKI、IEEE收錄的論文數(shù)據(jù)和科研論壇數(shù)據(jù)等。本文基于大數(shù)據(jù)構(gòu)建高校人才服務(wù)平臺,通過應(yīng)用支撐層的工具將這些系統(tǒng)進行集成,解決“數(shù)據(jù)孤島”,實現(xiàn)應(yīng)用集成和人才信息的深度互聯(lián)。同時通過人才數(shù)據(jù)和互聯(lián)網(wǎng)數(shù)據(jù)進行重構(gòu)和集成[6],對高校領(lǐng)導(dǎo)者和各職能部門提供人才挖掘、人才推送、人才評價、人才管理和人才服務(wù)的功能。因此高校人才服務(wù)平臺的總體架構(gòu)從下到上由網(wǎng)絡(luò)基礎(chǔ)設(shè)施層、數(shù)據(jù)中心層、應(yīng)用支撐層、應(yīng)用層和用戶層組成,如圖1所示。
圖1 高校人才服務(wù)平臺總體架構(gòu)
(1)網(wǎng)絡(luò)基礎(chǔ)設(shè)施層
由大學(xué)機房虛擬平臺提供系統(tǒng)運行所需要的基礎(chǔ)設(shè)施,包括應(yīng)用系統(tǒng)運行基礎(chǔ)支撐環(huán)境,包含主機、存儲、網(wǎng)絡(luò)、系統(tǒng)軟件,以及考慮到平臺的訪問量可能很大,單個服務(wù)器節(jié)點可能無法滿足要求,因此要使用負載均衡[7]等。
(2)數(shù)據(jù)中心層
數(shù)據(jù)中心層是以云存儲為核心,為獲取的龐大數(shù)據(jù)提供存儲環(huán)境,構(gòu)建大數(shù)據(jù)。由于獲取到的數(shù)據(jù)涉及到人才數(shù)據(jù)的方方面面,因此要構(gòu)建多類型、多維度的數(shù)據(jù)庫。數(shù)據(jù)中心層不僅包括為應(yīng)用系統(tǒng)層提供數(shù)據(jù)來源,還包括數(shù)據(jù)治理和結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)存儲的數(shù)據(jù)庫。對于本文系統(tǒng)的文件,選擇Hadoop分布式文件系統(tǒng)(HDFS)[8]進行存儲。
(3)應(yīng)用支撐層
應(yīng)用支撐層是數(shù)據(jù)中心層和應(yīng)用層的橋接層,主要包括企業(yè)服務(wù)總線ESB、推薦算法、挖掘算法、BI工具、模型工具、自定義表單等等。應(yīng)用支撐層一方面應(yīng)用了先進的數(shù)據(jù)庫技術(shù),另一方面封裝了應(yīng)用軟件系統(tǒng)各子系統(tǒng)都會用到的通用組件。
(4)應(yīng)用層
應(yīng)用層主要為用戶提供各種應(yīng)用,比如人才挖掘、人才推送、人才信息瀏覽、人才評價、人才個性化推薦和綜合分析,同時應(yīng)用層還包括為其他異構(gòu)異地系統(tǒng)定制開發(fā)服務(wù)接口。將接口封裝在本層,使得數(shù)據(jù)不直接被暴露給用戶,一定程度上提高安全性。
(5)用戶層
用戶層主要負責直接跟用戶進行交互,一般是指用戶通過賬戶登錄到系統(tǒng)看到的系統(tǒng)界面,用于數(shù)據(jù)錄入、數(shù)據(jù)展示等。為了便于應(yīng)用軟件系統(tǒng)的使用,為用戶提供風格一致、操作方式統(tǒng)一的操作界面。平臺用戶包括人才、高校管理者、高校各職能部門、平臺維護人員和平臺操作人員。
標準規(guī)范體系、運行管理體系和安全保障體系為高校人才服務(wù)平臺的各個層面提供可靠的保障;運行管理體系負責各個層次中系統(tǒng)的運行管理工作,是保障高校人才服務(wù)平臺安全正常運行必不可少的運行保障體系;信息安全體系以具體應(yīng)用與實際效果為主導(dǎo),以安全管理與安全技術(shù)為手段,建立綜合防范機制,保障信息平臺安全、高效、可靠的運行[9],保障高校人才服務(wù)平臺總體架構(gòu)五個層次的整體安全。
高校人才服務(wù)平臺為不同用戶提供人才挖掘、人才推送、人才評價等服務(wù),為高校人才提供人才信息瀏覽、個性化推薦服務(wù),以及為高校職能部門和高校校級決策者提供多維度的統(tǒng)計分析功能。
運用網(wǎng)絡(luò)爬蟲工具從互聯(lián)網(wǎng)上自動抓取知網(wǎng)空間以及IEEE收錄的論文數(shù)據(jù),作為挖掘分析進而“發(fā)現(xiàn)人才”的基礎(chǔ)數(shù)據(jù)。設(shè)計網(wǎng)頁解析模塊從抓取的網(wǎng)頁中提取數(shù)據(jù),數(shù)據(jù)預(yù)處理模塊用于統(tǒng)一數(shù)據(jù)格式,過濾無效數(shù)據(jù),為進一步分析打好基礎(chǔ),運用數(shù)據(jù)并行挖掘算法實現(xiàn)人才數(shù)據(jù)的挖掘。
通過人才挖掘的結(jié)果,用戶提前設(shè)計好推送的條件,根據(jù)用戶查詢的話題找出相關(guān)領(lǐng)域的權(quán)威專家。系統(tǒng)自動從文獻庫中發(fā)現(xiàn)作者的論文信息,并從論文信息中抽取出文章標題、摘要、作者單位、文章分類號等信息。通過構(gòu)建包括作者發(fā)表的論文、論文發(fā)表的期刊、作者的合作者以及作者社交關(guān)系等信息在內(nèi)的異構(gòu)信息網(wǎng),綜合考慮論文標題、發(fā)表期刊、分類號等信息,科學(xué)設(shè)計權(quán)重算法,給用戶返回所關(guān)心領(lǐng)域的作者列表。
由于高校教師人數(shù)比較多,因此每年的人才評價工作對于高校人事部門和各個學(xué)院來說工作繁瑣、任務(wù)繁重。本文設(shè)計的人才評價系統(tǒng)融合了高校人事、科研和教學(xué)信息,高校人事部門人員只需要定義評價指標和評價權(quán)重,全面通過集成教學(xué)量、科研成果以及師德評分等結(jié)構(gòu)化數(shù)據(jù)和情感以及以往的行為記錄等非結(jié)構(gòu)化數(shù)據(jù),在進行人才績效評價時,根據(jù)人才的ID,系統(tǒng)可以從標簽數(shù)據(jù)庫中直接抽取評價指標數(shù)據(jù),輸入評價指標的權(quán)重,人事管理人員只要一點擊,就能得到全校人才的綜合得分和排名,可以實現(xiàn)對全校人才的綜合評價,從而節(jié)約人事等職能部門和學(xué)院行政人員的工作時間。
以往人才的個人信息都存儲在不同的系統(tǒng)中,即使通過統(tǒng)一身份認證和系統(tǒng)集成,用戶仍需要點擊每個系統(tǒng)查看自己的信息。通過本平臺數(shù)據(jù)的集成和融合,可以以列表的形式全面展示人才的各類信息。如人才職稱、學(xué)歷等基本信息,學(xué)習和工作經(jīng)歷,教學(xué)課程數(shù)據(jù),科研成果和專利數(shù)據(jù),項目情況信息、資產(chǎn)數(shù)據(jù),工資數(shù)據(jù)、一卡通消費數(shù)據(jù)等等。人才登錄到服務(wù)門戶中,可以隨時查看自己的完整信息以及數(shù)據(jù),無需跨系統(tǒng)操作。
(1)圖書推薦
對讀者和資源按照讀者和資源的基礎(chǔ)屬性對它們進行分類和聚類分析,分析讀者和資源的匹配,便于給讀者推薦書籍。其中根據(jù)讀者的性別、年齡、出生年、籍貫、民族、教育程度等基本屬性形成讀者畫像[10],并按照基本屬性進行聚類,資源則是根據(jù)學(xué)科、專業(yè)、媒體類型、資源庫、資源類型、出版社和資源標簽等形成資源畫像,并按照資源的基本屬性進行聚類,然后根據(jù)相關(guān)行為特征使用關(guān)聯(lián)分析找出讀者與資源互聯(lián)的規(guī)律,給讀者推薦圖書。
(2)科研圈推薦
通過提取研究人員科研方向、以往完成的項目信息、發(fā)表論文、申請專利的關(guān)鍵字,分析不同學(xué)科的相似研究主題,發(fā)掘交叉學(xué)科的研究方向,建立不同學(xué)科、不同學(xué)院之間研究相似主題的教師的學(xué)術(shù)交流圈子,通過建立科研圈,向科研人員提供科研圈和交叉方向科研人員的推薦,幫助學(xué)校的研究人員碰撞出更多的研究方向和研究成果。
(3)研究熱點推薦
研究熱點發(fā)現(xiàn)需要綜合考慮兩個方面的因素,以年度數(shù)據(jù)為分析周期,根據(jù)分類號統(tǒng)計出各研究領(lǐng)域發(fā)表文章數(shù)量的變化趨勢,同時提取所有文章標題的關(guān)鍵字,統(tǒng)計各關(guān)鍵字的詞頻,根據(jù)詞頻與研究領(lǐng)域?qū)?yīng)文章數(shù)量綜合評定研究熱點,人才可以根據(jù)自身的研究方向選擇分類號,系統(tǒng)根據(jù)研究分類號給用戶自動推送研究熱點,幫助用戶了解研究的前沿方向。
(1)相關(guān)性分析
通過教職工職稱與科研成果、教職工年齡與科研成果、教職工來校年份與科研成果、教職工引入人才方式與科研成果、教職工教學(xué)任務(wù)量與科研產(chǎn)出和科研投入與科研產(chǎn)出[11]等變量的相關(guān)性分析等發(fā)掘影響科研產(chǎn)出的因素。通過發(fā)掘影響高??蒲谐晒囊蛩?,為提高科研產(chǎn)出提供精準的決策依據(jù)。
(2)趨勢分析
通過分析以往年份學(xué)校總體科研情況、不同學(xué)科、不同學(xué)院成果情況,預(yù)測未來幾年學(xué)校、不同學(xué)科、不同學(xué)院的科研產(chǎn)出情況等。
(3)基本信息統(tǒng)計分析
本文對教職工基本信息進行多維度的統(tǒng)計分析,為校級領(lǐng)導(dǎo)、學(xué)院領(lǐng)導(dǎo)以及各職能部門提供決策依據(jù),基本信息的統(tǒng)計分析主要包括以下幾個部分:①分析不同學(xué)院、不同學(xué)科的教職工職稱、教職工年齡、性別等基本情況信息,整體掌握學(xué)院、學(xué)科的人員質(zhì)量和數(shù)量,便于及時補充人才,提高人才隊伍。②按照年度統(tǒng)計分析不同學(xué)院、不同學(xué)科人員招聘、離職的人數(shù)、職稱、性別等基本情況信息,便于預(yù)測下年度不同學(xué)院、不同學(xué)科的人員招聘情況。③利用大數(shù)據(jù)可以嘗試分析不同屬性教師的教學(xué)質(zhì)量,從而為學(xué)校教師招聘決策服務(wù)。
通過在大數(shù)據(jù)環(huán)境下構(gòu)建高校人才服務(wù)平臺,集成人才各個維度的數(shù)據(jù),可以大大提高工作效率和管理效益,主要體現(xiàn)在以下幾個方面:
平臺提供了各個維度以及跨維度的統(tǒng)計分析功能以及人才評價功能,各職能部門不需要像以往一樣用傳統(tǒng)的分析工具以及通過統(tǒng)計軟件進行統(tǒng)計分析,只需要按照自己的需要在平臺上設(shè)置條件,系統(tǒng)自動出現(xiàn)統(tǒng)計結(jié)果以及評價結(jié)果,節(jié)約了辦公時間,提高了辦公效率。另外平臺提供了人才實時信息瀏覽功能,不需要像以往一樣登錄到各個系統(tǒng)查閱信息,可以直接登錄到平臺進行信息查閱,另外平臺提供了搜索功能,可通過關(guān)鍵字、日期等條件搜索出自身想要的數(shù)據(jù)。
通過高校人才服務(wù)平臺的實施,大量的人才數(shù)據(jù)集成在平臺數(shù)據(jù)庫上,數(shù)據(jù)能夠充分進行共享,打破了系統(tǒng)之間的信息壁壘,消除了“數(shù)據(jù)孤島”,并且通過提供人才管理和人才服務(wù)等功能,可以充分利用高校和互聯(lián)網(wǎng)上人才的數(shù)據(jù),幫助高校挖掘人才、留住人才以及更好地服務(wù)人才。
該平臺集成了人才各個維度的數(shù)據(jù),校級領(lǐng)導(dǎo)、學(xué)院領(lǐng)導(dǎo)及各職能部門只需要登錄平臺,就可以查閱人才各個維度的數(shù)據(jù),而不像以往一樣需要登錄各個系統(tǒng)查閱數(shù)據(jù),提高了管理效率。平臺提供了各個維度以及跨維度的數(shù)據(jù)統(tǒng)計功能,領(lǐng)導(dǎo)做決策時,只需要登錄到平臺查看統(tǒng)計結(jié)果,而不需要像以往一樣在各個部門搜集數(shù)據(jù)進行統(tǒng)計分析,省去了繁瑣的環(huán)節(jié),提高了管理效率。另外系統(tǒng)是直接從業(yè)務(wù)系統(tǒng)抽取和運用爬蟲技術(shù)從互聯(lián)網(wǎng)上得到的一手數(shù)據(jù),更加準確和實時,提高了決策依據(jù)的精確性。
本文在大數(shù)據(jù)環(huán)境中高校人才服務(wù)平臺架構(gòu)下分析了各個模塊的功能,規(guī)劃了平臺的總體架構(gòu)。采用網(wǎng)絡(luò)爬蟲技術(shù)獲取人才互聯(lián)網(wǎng)上的數(shù)據(jù),運用大數(shù)據(jù)技術(shù)融合互聯(lián)網(wǎng)上和高校業(yè)務(wù)系統(tǒng)的人才數(shù)據(jù),集成人才的論文、基本信息、圖書館借閱信息、一卡通消費信息和科研論壇上的信息,不僅有效地解決了高校各職能部門的“人才數(shù)據(jù)孤島”問題,降低信息化建設(shè)成本,而且實現(xiàn)了信息的集成和應(yīng)用,可以提高決策和管理的效率。