劉 欣,岳曉磊,靖 超,王亞林
(河北北方學院附屬第一醫(yī)院,河北張家口 075000)
隨著人工智能技術的發(fā)展,醫(yī)院的智能化進程也在快速推進,這體現(xiàn)在管理智能化及醫(yī)療設備自動化兩方面。作為管理智能化的重要組成部分,人力資源智能化管理被越來越多的醫(yī)療機構所重視。人力資源合理化管理對醫(yī)院高效培養(yǎng)醫(yī)療領域人才、完善醫(yī)院管理模式和提高醫(yī)院整體資源利用率均有極大的幫助,在有效加強醫(yī)院整體性的同時也可以更優(yōu)的發(fā)揮醫(yī)院經濟價值與社會價值。因此,對醫(yī)院進行高效率、智能化的人力資源管理尤為重要[1-2]。
然而智能化時代的顯著特征即是數(shù)據(jù)的爆炸式增長,由此帶來的是傳統(tǒng)人力資源管理方式已無法滿足海量的數(shù)據(jù)處理需求。簡單的人力資源管理系統(tǒng)也無法對醫(yī)院的人力數(shù)據(jù)做出準確的分析與調配,同時也浪費了醫(yī)院各類信息系統(tǒng)收集的大量數(shù)據(jù)。這不僅流失了醫(yī)院的信息化資源,也拖累了醫(yī)院的智能信息化進程。因此,有必要將先進的人工智能算法應用于醫(yī)院人力資源配置系統(tǒng),可以大幅提高醫(yī)院人力資源數(shù)據(jù)的處理能力。
從根本而言,對數(shù)據(jù)的處理即是數(shù)據(jù)挖掘。數(shù)據(jù)挖掘指的是使用軟件系統(tǒng)對數(shù)據(jù)包含的有用信息進行合理提取,傳統(tǒng)數(shù)據(jù)挖掘方法大多是使用統(tǒng)計學的方法。統(tǒng)計學方法在數(shù)據(jù)內容較少的情況下可以使用,但若有海量數(shù)據(jù),統(tǒng)計學方法則較為無法適應需求。機器學習是目前使用廣泛的數(shù)據(jù)挖掘方法,其可以對海量數(shù)據(jù)進行訓練,并提取數(shù)據(jù)隱藏的特征。然后不斷地學習這些特征,可以準確地進行數(shù)據(jù)信息提取。文中使用了機器學習的方法對人力資源數(shù)據(jù)進行處理,進而提高人力資源數(shù)據(jù)處理能力[3-5]。
根據(jù)傳統(tǒng)人力資源配置理論,規(guī)劃人力資源主要是對單位的人事結構進行分析,并詳細梳理崗位需求與人員能力之間的關聯(lián)性。人員能力包括多種要素,對這些要素進行加權求和,判斷人員的素質得分[6-8]。
傳統(tǒng)的人力資源評分過程,如圖1 所示。
圖1 人力資源評分流程
首先,對接收到的數(shù)據(jù)進行分組分析,數(shù)據(jù)分組包括人員評價矩陣和人員能力矩陣這兩組。其中最常用的是建立職工能力評價矩陣,該矩陣可能考慮到多方面的因素,如自我評價、上下級評價、患者評價等。人員能力矩陣包括員工績效、出勤率、職稱等信息。在得到人員評價矩陣值與人員能力矩陣值后,可以得到關鍵指標人崗匹配度,如式(1)所示:
其中,n1~n4為對應評價參數(shù)。
設另一變量為Xij,有:
因此,可以由人崗匹配度模型對人員進行優(yōu)化,如下式所示:
上述算法簡單、有效,可以對人力資源進行較好的配置,但這僅適用于人力數(shù)據(jù)較少的情況下。隨著醫(yī)院體制的增加,人力數(shù)據(jù)也在增多,問題也變得復雜化。這種方法計算效率低,不能較好地對數(shù)據(jù)進行挖掘,無法對人力資源進行有效的管理。
從上文可知,人力資源調度模型本質是對人力資源數(shù)據(jù)進行分析,計算人崗匹配度。然后根據(jù)人崗匹配度分數(shù)進行人員的調度,這在本質上可以抽象成為推薦模型。推薦模型在眾多領域內均有分析和驗證,目前主流的推薦模型使用循環(huán)神經網絡作為數(shù)據(jù)處理模塊。
循環(huán)神經網絡最主要的特征是使用循環(huán)卷積進行數(shù)據(jù)訓練運算[9-10]。循環(huán)卷積網絡模型可以看作一種層次化的數(shù)據(jù)模型,卷積網絡的輸入為原始的人力資源數(shù)據(jù)。經過循環(huán)卷積運算、池化、激活函數(shù)等過程,將數(shù)據(jù)之間的抽象特征提取出來,其過程表達式如下:
其中,xL為L層的數(shù)據(jù)輸入,ω為L層的參數(shù)權重值,z為模型選擇的損失函數(shù),y為模型的標定值,函數(shù)f為模型的最終計算參數(shù)。
文中將基礎神經網絡進行改進,使用混合循環(huán)神經網絡模型,并利用全局模型和局部模型相結合的方式,將模型層次化運算后的數(shù)據(jù)特征作為網絡輸出,進而實現(xiàn)數(shù)據(jù)的處理。然后使用層次化的模型結構進行網絡搭建,進而實現(xiàn)人崗匹配推薦[11-13]?;旌涎h(huán)網絡模型,如圖2 所示。
圖2 混合循環(huán)網絡模型
在模型搭建過程中,文中選取交叉熵作為判斷損失函數(shù)。該損失函數(shù)可以對數(shù)據(jù)實際值和數(shù)據(jù)期望值進行比較,進而確定數(shù)據(jù)的接近程度,損失函數(shù)如下:
同時,在訓練時使用梯度優(yōu)化算法對參數(shù)進行優(yōu)化。這樣參數(shù)傳遞可以盡量準確,模型參數(shù)的具體更新過程為:
1)對神經網絡的學習率、迭代次數(shù)進行更新,如下式所示:
其中,β1、β2為循環(huán)神經網絡的超參數(shù),gt為模型的計算梯度,t為模型的迭代次數(shù)。
2)對一階估計值和二階估計值進行優(yōu)化定向,有:
3)由上文得到的結果對模型的參數(shù)進行更新:
文中1.2 節(jié)提到,使用的總體算法即為人崗匹配推薦算法。推薦算法的流程設計也要針對不同的應用場景和數(shù)據(jù)特征。當前使用的人力資源領域的算法通常均是統(tǒng)計算法,未考慮到數(shù)據(jù)隱藏的特征,僅依靠簡單的打分和專家評判機制,這容易導致信息匱乏問題的出現(xiàn)。
文中將循環(huán)卷積神經網絡和傳統(tǒng)人力資源配置算法相結合,設計了適用于人力資源領域的人崗匹配推薦算法。該算法不但改善了傳統(tǒng)算法數(shù)據(jù)訓練質量較低的問題,而且通過采用循環(huán)神經網絡有效提高了數(shù)據(jù)計算效率。算法的核心思想是:首先對數(shù)據(jù)中的原始特征進行提取,原始特征和傳統(tǒng)人力資源所需特征一致,包括人員評價矩陣和人員能力矩陣。數(shù)據(jù)提取進入編碼器進行編碼,然后將編碼特征作為數(shù)據(jù)輸入項輸入到循環(huán)神經網絡的數(shù)據(jù)輸入層。使用循環(huán)卷積層對數(shù)據(jù)進行處理,進而得到人崗匹配結果,算法流程如圖3 所示。
圖3 算法流程
首先,進行數(shù)據(jù)采集,其使用分布流式采集方法對數(shù)據(jù)進行選擇,分組為人員評價矩陣和人員能力矩陣。然后將數(shù)據(jù)抽象化,對數(shù)據(jù)進行預處理,使用編碼器對數(shù)據(jù)進行編碼且保存到數(shù)據(jù)倉庫;使用提升特征算法對數(shù)據(jù)特征進一步加強后,輸入至循環(huán)卷積網絡。最終輸出人崗匹配分數(shù),人力資源推薦過程完成。
算法流程中的步驟說明如下:
1)數(shù)據(jù)采集。使用分布流式的數(shù)據(jù)采集方法,由于不同醫(yī)院人力數(shù)據(jù)不同,格式也存在差異。因此必須對人力數(shù)據(jù)進行統(tǒng)一格式處理,處理方式包括數(shù)據(jù)舍棄、轉換等操作。
2)對原始的數(shù)據(jù)進行預處理。對數(shù)據(jù)進行分組,從而對人力資源模型特征進行更加全面的了解。同時將數(shù)據(jù)保存至數(shù)據(jù)倉庫中,這樣可以對后續(xù)的數(shù)據(jù)模型訓練進行支撐。
3)進行特征增強。從數(shù)據(jù)倉庫中獲取數(shù)據(jù),并對數(shù)據(jù)分組結果進行學習。將融合后的數(shù)據(jù)結果作為神經網絡數(shù)據(jù)輸入,進行網絡訓練。
4)推薦結果輸出。將人崗匹配度結果進行排序,然后參考分數(shù)進行合理的崗位分配。
對算法進行評價,一般通過一定數(shù)量的指標進行,文中的人力資源推薦算法評價指標采用準確度評價指標[14-16]。
在評價體系中,準確率和召回率越高,代表算法越優(yōu)。但在一些場景下,準確率和召回率可能是矛盾的,所以為了綜合這兩個指標,文中使用F1 值進行綜合,公式為:
文中數(shù)據(jù)對醫(yī)院人力資源數(shù)據(jù)進行分類整理,數(shù)據(jù)包含人員自身信息、人員評價矩陣值及人員能力矩陣值3 種。該次數(shù)據(jù)共采集到醫(yī)院職工4 560名,醫(yī)院崗位1 233 個,樣本數(shù)量為134 540 個。該次實驗的環(huán)境,如表1 所示。
表1 實驗設置環(huán)境說明
文中將樣本分為訓練樣本集和測試樣本集。神經網絡測試過程偽代碼如下:
輸入:特征D。
輸出:混合循環(huán)神經模型。
1)初始化超參數(shù),參數(shù)包括迭代次數(shù)t,學習率L,循環(huán)神經網絡的超參數(shù)β1、β2,模型的計算梯度gt;
2)i從1 到t循環(huán);
3)j從1 到t循環(huán);
4)計算各個通道的特征值,代入函數(shù)f;
5)若j=t,則終止循環(huán),執(zhí)行步驟6);若j<t,則返回步驟3);
6)提取卷積特征,得到F;
7)將F值和局部模型特征值結合,得到概率值;
8)得到當前的人崗匹配值;
9)排序,輸出最終結果;
10)若i<t,則返回步驟2),循環(huán)執(zhí)行i過程;
11)若i=t,結束。
然后對文中算法的可行性進行對比實驗,使用文中算法、卷積神經網絡算法、傳統(tǒng)統(tǒng)計學方法進行模型訓練以及實驗分析,分析評價指標為準確率、召回率和F1 值。實驗結果如表2 所示。
表2 對比實驗結果
由表2 可以看出,文中算法的F1 值和其他兩項算法相比均有明顯提升,傳統(tǒng)統(tǒng)計學方法效果最差。在數(shù)據(jù)量較多的情況下F1 值為0.678,普通卷積神經網絡算法F1 值有所提升,為0.766;文中算法表現(xiàn)最優(yōu),F(xiàn)1 值為0.823。這說明直接使用循環(huán)卷積網絡并不能真正提升數(shù)據(jù)的訓練特征,而文中使用全局網絡加局部網絡的方法,可以有效提升數(shù)據(jù)的隱層特征,進而提升數(shù)據(jù)的訓練質量,提高算法的匹配度和推薦精度。
人力資源調度模型本質是對人力資源數(shù)據(jù)進行分析,計算人崗匹配度。然后根據(jù)人崗匹配度分數(shù)進行人員的調度,這在本質上可以抽象成為推薦模型。文中對基礎神經網絡進行改進,使用混合循環(huán)神經網絡模型、全局模型和局部模型相結合的方式,將模型層次化運算后的數(shù)據(jù)特征作為網絡輸出,進而實現(xiàn)數(shù)據(jù)的處理。通過采用層次化的模型結構進行網絡搭建,最終實現(xiàn)高精確度的人崗匹配與推薦。