昝棟
摘 要 人才隊(duì)伍建設(shè)作為高校工作的永恒主題,在科研教學(xué)、學(xué)科發(fā)展等諸多方面發(fā)揮著至關(guān)重要的作用。本文從人才引進(jìn)的角度入手,設(shè)計(jì)了一種基于“百家姓”姓氏篩選方法,可用于學(xué)者信息的數(shù)據(jù)處理和分析。
關(guān)鍵詞 人才分析;中文姓氏;學(xué)科建設(shè)
1 高校人才隊(duì)伍建設(shè)的重要性
2015年我國(guó)提出了加快建成一批世界一流大學(xué)和一流學(xué)科的長(zhǎng)遠(yuǎn)目標(biāo),在高校開展的實(shí)踐和探索過程中,高層次人才的引進(jìn)不但帶來了嶄新的思維方式,為學(xué)校的師資隊(duì)伍注入了新的活力,也成為高校人力資源引進(jìn)的重點(diǎn)工作方向[1]。
2 高校人才引進(jìn)工作的現(xiàn)狀
人才引進(jìn)工作必須與學(xué)校教學(xué)科研需求相適應(yīng),目前高校在人才的引進(jìn)仍面臨著一些困難:
一是在信息發(fā)布方式,人事部門通過網(wǎng)絡(luò)、現(xiàn)場(chǎng)招聘等渠道發(fā)布需求信息。這種方式消息發(fā)布周期短、關(guān)注度低,在獲取備選人員方面存在很大的局限性。
二是在學(xué)科匹配度方面,雖然人事部門會(huì)與用人院系進(jìn)行溝通,在人員研究方向上提出建議或推薦人選,但人事部門對(duì)學(xué)科領(lǐng)域內(nèi)的人才分布總體情況缺乏掌握,難以保證選拔工作的科學(xué)性。
圖書館作為高校的信息資源服務(wù)中心,基于電子資源的深層次服務(wù),開展了通過情報(bào)服務(wù)提升自身核心競(jìng)爭(zhēng)力的探索實(shí)踐[2],可將事實(shí)數(shù)據(jù)與情報(bào)分析方法進(jìn)行有機(jī)結(jié)合,切實(shí)為學(xué)校的教學(xué)科研、學(xué)科建設(shè)提供多元化的信息參考。如果將圖書館現(xiàn)有學(xué)科服務(wù)與情報(bào)分析的工作經(jīng)驗(yàn)應(yīng)用到人才引進(jìn)的數(shù)據(jù)分析領(lǐng)域,將有效的緩解現(xiàn)有高校在人才引進(jìn)工作方面面臨的困境,為學(xué)科人才的遴選與引進(jìn)提供好的信息參考和借鑒。
3 基于中文姓氏規(guī)律的學(xué)科人才分析方法介紹
3.1 學(xué)科人才選拔的需求分析
各個(gè)學(xué)校在人才選拔方面都有自己的特殊要求,需兼顧國(guó)籍、年齡、研究領(lǐng)域、學(xué)術(shù)成就等多方面因素,特別是目前國(guó)內(nèi)高校的人才引進(jìn)多以華人學(xué)者為主。開展具體工作時(shí),可針對(duì)學(xué)校人才選拔條件,以學(xué)科領(lǐng)域的專業(yè)期刊為基礎(chǔ),結(jié)合地域分布、合作機(jī)構(gòu)等信息,對(duì)華人科研人員的數(shù)據(jù)進(jìn)行整理分析,綜合學(xué)者的論文產(chǎn)出及規(guī)范化影響力等多種因素進(jìn)行人才綜合評(píng)價(jià)[3],為本校學(xué)科人才引進(jìn)提供情報(bào)參考。
3.2 中文姓氏作者篩選方法的比較
以往開展的人才分析,在對(duì)中文姓氏的作者甄別方面,往往采用人工擇取的方式,數(shù)據(jù)整理周期長(zhǎng)、效率低。在整理WOS平臺(tái)導(dǎo)出的學(xué)者字段時(shí),通過在國(guó)家或地區(qū)字段選擇China Mainland,也可以較為便利的將絕大多數(shù)的中文作者信息篩選出來,但是這種方法對(duì)于論文信息中沒有標(biāo)注機(jī)構(gòu)名稱或國(guó)家地區(qū)等字段信息缺失的學(xué)者往往會(huì)被忽略掉;同時(shí)對(duì)于在海外發(fā)展的華人科學(xué)家的信息無(wú)法進(jìn)行有效的甄別,因此,如何快速地將華人作者的信息從檢索結(jié)果中快速篩選出來是在開展人才分析時(shí),是一個(gè)需要重點(diǎn)解決的問題。
本項(xiàng)目利用我國(guó)傳統(tǒng)《百家姓》中的姓氏,進(jìn)行音序轉(zhuǎn)化,同時(shí)結(jié)合 InCites 平臺(tái)收錄數(shù)據(jù)中,作者姓名信息的錄入規(guī)律,進(jìn)行姓氏分離,通過姓氏音節(jié)的對(duì)比,實(shí)現(xiàn)了中文姓氏科研人員的數(shù)據(jù)篩選工作。
3.3 百家姓篩選方法介紹
該方法以中國(guó)傳統(tǒng)蒙學(xué)讀物《百家姓》中收錄的中國(guó)姓氏為基礎(chǔ),在此基礎(chǔ)上通過對(duì)比樣本庫(kù),差異化增補(bǔ)的方式,形成了中文特征姓氏的對(duì)比基礎(chǔ)數(shù)據(jù)集。百家姓中原收集姓氏411個(gè),后增補(bǔ)到504個(gè),其中單姓444個(gè),復(fù)姓60個(gè),另外通過樣本增補(bǔ)的方式補(bǔ)充部分姓氏,最后達(dá)到了接近330個(gè)不同音序姓氏的基礎(chǔ)數(shù)據(jù)集。將該數(shù)據(jù)集以姓氏音序轉(zhuǎn)化為拼音后,作為源數(shù)據(jù)集備用。
Wos平臺(tái)中中文作者的表達(dá)形式存在著一定的規(guī)律,即姓氏在前,名字在后,中間用逗號(hào)分隔,例如:李明表述為L(zhǎng)i,Ming;也有部分名字后半部分僅保留了首字母的縮寫,例如:王玲玲,翻譯為Wang,LL。但是總體而言,姓氏部分的音節(jié)保存相對(duì)完整,基本符合漢語(yǔ)拼音的拼讀規(guī)則。利用這一特征,可以和華人以外的姓名進(jìn)行快速的區(qū)分。
3.4 方法使用效果驗(yàn)證
筆者對(duì)2014-2018年5年間JCR中Fisheries學(xué)科Q1和Q2區(qū)發(fā)表Article和Review論文的學(xué)者進(jìn)行篩選,符合條件的作者共計(jì)8034人。直接按照國(guó)家地區(qū)進(jìn)行篩選,得到中國(guó)地區(qū)作者為2009人。通過百家姓篩選法對(duì)8034位學(xué)者進(jìn)行篩選,符合中文姓氏規(guī)律的作者2528人,其中包含大陸地區(qū)以外542人,同時(shí)在中國(guó)地區(qū)內(nèi)的作者有23人并不符合中文形式規(guī)律,應(yīng)該屬于在大陸工作的外籍學(xué)者。
通過上述方法對(duì)比可以看出,“百家姓”篩選的方法可以更加有效的解決中文姓氏規(guī)律學(xué)者的篩選問題,比通過國(guó)家地區(qū)的方法效率更高,準(zhǔn)確性也更勝一籌。尤其在針對(duì)中國(guó)大陸地區(qū)以外的其他國(guó)家地區(qū)的華裔學(xué)者開展分析時(shí),通過該方法可以快速將具有中文姓氏特征的學(xué)者篩選出來,從而快速進(jìn)入身份信息梳理工作環(huán)節(jié)。
4 結(jié)束語(yǔ)
本文介紹的“百家姓”音序數(shù)據(jù)集可不斷進(jìn)行增補(bǔ)和完善,以提升數(shù)據(jù)篩選的準(zhǔn)確性,該方法主要用于對(duì)學(xué)者信息的初步篩選,可快速分離出符合中文姓氏規(guī)律的學(xué)者信息,有效縮小初選數(shù)據(jù)集規(guī)模,提升篩選的工作效率,以便在此基礎(chǔ)上順利開展學(xué)者研究領(lǐng)域判別和身份信息梳理等深層次的分析工作。
參考文獻(xiàn)
[1] 許日華,樂傳永.“雙一流”建設(shè)中地方高水平大學(xué)高層次人才引進(jìn)的困境與突圍[J]. 教育發(fā)展研究,2017,37(21):46-51.
[2] 楊新涯,王瑩,尹偉宏.數(shù)據(jù)驅(qū)動(dòng)的新型情報(bào)服務(wù)研究[J].文獻(xiàn)與數(shù)據(jù)學(xué)報(bào),2019,1(1):32-41,117.
[3] 龐弘燊,王超,胡正銀.“雙一流”大學(xué)建設(shè)中人才引進(jìn)評(píng)價(jià)指標(biāo)庫(kù)及指標(biāo)體系構(gòu)建[J].情報(bào)雜志,2019,38(3):67-74.