陳陽(yáng)
摘 要:為了彌補(bǔ)部分心里咨詢從業(yè)人員對(duì)心理投射技術(shù)經(jīng)驗(yàn)水平的不足,使心理投射測(cè)驗(yàn)更好地在心理咨詢行業(yè)和人格特征分析中得到應(yīng)用,文中提出一種基于Bert詞嵌入、Bi-GRU和羅夏墨跡測(cè)驗(yàn)的人格特征檢測(cè)方法。實(shí)驗(yàn)結(jié)果表明,多個(gè)模型在驗(yàn)證集上的平均準(zhǔn)確率平均可以達(dá)到89.20%,具有較好的準(zhǔn)確性。
關(guān)鍵詞:心理投射測(cè)驗(yàn);羅夏墨跡測(cè)驗(yàn);深度學(xué)習(xí);自然語(yǔ)言處理;Bert;心理咨詢
中圖分類號(hào):TP279文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):2095-1302(2020)05-0-03
0 引 言
隨著生活水平的提高和社會(huì)的發(fā)展,人們對(duì)人格特征的探索與應(yīng)用需求逐漸增多。人格特征應(yīng)用的好壞可以決定一個(gè)企業(yè)中員工的工作氛圍、效率,甚至可以決定人身和財(cái)產(chǎn)的安全性。如果人格特征的檢測(cè)手段在入職(學(xué))和人員安排(分配)方面得到普及,如“空姐乘坐滴滴順風(fēng)車遇害案”“復(fù)旦大學(xué)生投毒案”等性質(zhì)的悲劇將有可能大量被減少。
對(duì)一個(gè)人進(jìn)行人格分析,主要有自陳量表和投射測(cè)驗(yàn)兩種方法。投射測(cè)驗(yàn)法相對(duì)于自陳量表法有減少受測(cè)者的主動(dòng)偽裝和可以檢查出受測(cè)者潛在心理問題的特點(diǎn),但是相對(duì)于自陳量表法,其耗時(shí)更長(zhǎng)、對(duì)施測(cè)者技術(shù)水平要求更高。
面對(duì)各行對(duì)人格特征分析的迫切需求,心理咨詢行業(yè)的“三缺”問題(缺乏全國(guó)統(tǒng)一的從業(yè)人員考核認(rèn)證管理制度、缺乏從業(yè)人員和機(jī)構(gòu)評(píng)價(jià)等系列標(biāo)準(zhǔn)、缺乏機(jī)構(gòu)監(jiān)督、考核等系列規(guī)范)卻限制了行業(yè)的發(fā)展,導(dǎo)致行業(yè)從業(yè)人員技術(shù)水平的參差不齊[1]。為了彌補(bǔ)部分從業(yè)人員對(duì)心理投射技術(shù)經(jīng)驗(yàn)水平的不足,使心理投射測(cè)驗(yàn)更好地在心理咨詢行業(yè)和人格特征分析中得到應(yīng)用,本文提出了使用自然語(yǔ)言處理技術(shù)和有“心理投射測(cè)驗(yàn)之王”之稱的羅夏墨跡測(cè)驗(yàn)對(duì)受測(cè)者人格特征進(jìn)行評(píng)估的方法。
1 系統(tǒng)中的羅夏墨跡測(cè)驗(yàn)
1.1 羅夏墨跡測(cè)驗(yàn)簡(jiǎn)介
羅夏墨跡測(cè)驗(yàn)是瑞士精神病學(xué)家赫爾曼·羅夏發(fā)明的,用于分析人格特征的一種測(cè)驗(yàn)方法[2]。這種測(cè)驗(yàn)方法通過觀察和記錄受測(cè)者對(duì)十張帶有不同墨跡圖案的圖卡的反應(yīng),來(lái)預(yù)測(cè)和推斷受測(cè)者的人格特征。測(cè)驗(yàn)過程主要分為提問、回答內(nèi)容、結(jié)果分析三部分。在提問部分:施測(cè)者依次向受測(cè)者出示10張不同的羅夏墨跡圖卡,并詢問受測(cè)者,圖卡中的圖案看起來(lái)像什么,然后根據(jù)受測(cè)者的回答進(jìn)行一些非引導(dǎo)性的鼓勵(lì),讓受測(cè)者說出更加具體的描述。在回答內(nèi)容部分,施測(cè)者應(yīng)該盡可能詳細(xì)地記錄受測(cè)者對(duì)每一張圖卡的描述和態(tài)度,并根據(jù)反應(yīng)的多少,給與適當(dāng)?shù)母深A(yù),避免記錄冗長(zhǎng)或過短。在結(jié)果分析部分,施測(cè)者需要對(duì)受測(cè)者對(duì)每一張圖卡反應(yīng)的記錄內(nèi)容按照一定規(guī)則進(jìn)行編碼,然后將編碼進(jìn)行統(tǒng)計(jì),制成結(jié)構(gòu)化表,展示受測(cè)者的各項(xiàng)心理特征。羅夏墨跡測(cè)驗(yàn)圖片如圖1所示,結(jié)構(gòu)化表(樣例)如圖2所示[3]
1.2 系統(tǒng)中進(jìn)行的羅夏墨跡測(cè)驗(yàn)
系統(tǒng)中的羅夏墨跡測(cè)驗(yàn)與簡(jiǎn)介中描述的流程相同,只是將測(cè)驗(yàn)中記錄和結(jié)果分析的過程由計(jì)算機(jī)完成。測(cè)驗(yàn)的記錄過程由語(yǔ)言轉(zhuǎn)文本技術(shù),將受測(cè)者的語(yǔ)音轉(zhuǎn)化為文本,記錄在文件中。結(jié)果分析過程中使用分詞技術(shù)、單詞向量化技術(shù)、深度學(xué)習(xí)技術(shù),對(duì)文本進(jìn)行編碼,然后通過統(tǒng)計(jì)產(chǎn)生結(jié)構(gòu)化表,供施測(cè)者和受測(cè)者參考。
2 研究方法
2.1 數(shù)據(jù)集來(lái)源
本文在西南民族大學(xué)的校園中對(duì)大學(xué)生隨機(jī)抽取同學(xué)進(jìn)行了羅夏墨跡測(cè)驗(yàn),并收集了在多個(gè)出版物中羅夏墨跡測(cè)驗(yàn)的記錄。整理成一個(gè)XLSX文件,并對(duì)編碼進(jìn)行標(biāo)注。數(shù)據(jù)集樣例如圖3所示。
2.2 數(shù)據(jù)預(yù)處理
獲取數(shù)據(jù)集后,本文首先通過Python結(jié)巴(Jieba)分詞庫(kù)將每個(gè)句子進(jìn)行分詞處理。然后通過bert-as-service使用chinese_L-12_H-768_A-12模型對(duì)每個(gè)單詞進(jìn)行Bert編碼,使每個(gè)詞的維度數(shù)變成了768維。然后將句子的矩陣進(jìn)行Padding處理,因?yàn)閿?shù)據(jù)集中95%的單詞數(shù)量都在50個(gè)以內(nèi),所以,對(duì)于分詞后超過50個(gè)詞的句子,去掉末尾的向量,對(duì)于單句不足50詞的句子進(jìn)行了填充768的全零矩陣操作,使得到的每個(gè)句子的向量形態(tài)為50×768。結(jié)巴分詞結(jié)果樣例見表1所列。
2.3 Bi-GRU介紹
GRU(Gate Recurrent Unit)與LSTM(Long-Short Term?Memory)類似,是循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network, RNN)的一種[4],其是為解決長(zhǎng)期記憶和反向傳播中的梯度爆炸和梯度消失等問題而設(shè)計(jì)的[5]。GRU與LSTM在多數(shù)情況下表現(xiàn)十分相似,但是計(jì)算卻更加容易。本文也使用了Bi-LSTM訓(xùn)練了數(shù)據(jù),但Bi-GRU在準(zhǔn)確率只以微弱的優(yōu)勢(shì)勝出,所以,綜合效率與準(zhǔn)確率,本文以Bi-GRU為例介紹。GRU的輸入/輸出結(jié)構(gòu)如圖4所示。
如圖4所示,上一個(gè)GRU傳輸?shù)膆t-1和xt作為GRU單元的輸入,GRU將根據(jù)ht-1和xt生成兩個(gè)門控狀態(tài)r和z。r為重置門控,z為更新門控,其中:
得到門控信號(hào)r,z后,首先使用重置門控將ht-1進(jìn)行處理,(ht-1)'=ht-1⊙r,再將(ht-1)'與輸入xt進(jìn)行拼接,再通過一個(gè)余弦正切函數(shù)將數(shù)據(jù)放縮到-1~1的范圍內(nèi),得到h':
進(jìn)而可以計(jì)算出ht和yt:
綜上來(lái)看,前一時(shí)刻的狀態(tài)信息帶入的多少與更新門控z的大小成正比[6]。前一時(shí)刻狀態(tài)信息被忽略的程度則由重置門控r的值決定,r的值越小,狀態(tài)信息被忽略的越多[7]。
在單向的網(wǎng)絡(luò)結(jié)構(gòu)中,數(shù)據(jù)總是單向順序地從前向后傳遞[8]。如果狀態(tài)能夠由前一時(shí)刻和后一時(shí)刻共同傳遞,那么這將更有助于對(duì)文本深層次的特征進(jìn)行提取。Bi-GRU是由兩個(gè)方向相反的GRU單元共同組成的,輸出狀態(tài)由兩個(gè)GRU共同決定的雙向網(wǎng)絡(luò)結(jié)構(gòu)。在每一時(shí)刻,輸入會(huì)同時(shí)提供兩個(gè)方向相反的GRU,而輸出則由這兩個(gè)單向GRU共同決定[8]。Bi-GRU的結(jié)構(gòu)模型如圖5所示。
2.4 識(shí)別模型
本文的識(shí)別模型將接收句子的向量矩陣(50×726)作為輸入,首先輸入到Bi-GRU中,然后將Bi-GRU的output作為Dense的input,最后由Dense輸入結(jié)果One-Hot矩陣。識(shí)別模型如圖6所示。
圖6 識(shí)別模型圖
2.5 結(jié)果
本文作者訓(xùn)練了多個(gè)分類模型,并記錄了不同世代的測(cè)試集準(zhǔn)確率,數(shù)據(jù)表明在訓(xùn)練20個(gè)Epoch世代時(shí),準(zhǔn)確率基本穩(wěn)定,見表2所列。
3 結(jié) 語(yǔ)
本文介紹了使用Bert和Bi-GRU模型對(duì)羅夏墨跡測(cè)驗(yàn)的編碼進(jìn)行分類識(shí)別的方法。經(jīng)過驗(yàn)證,多個(gè)模型在驗(yàn)證集上的平均準(zhǔn)確率可以達(dá)到89.20%,具有較好的準(zhǔn)確性。羅夏墨跡測(cè)驗(yàn)在現(xiàn)有的人格分析領(lǐng)域有較好的應(yīng)用,而且在職業(yè)規(guī)劃、學(xué)業(yè)規(guī)劃以及人員組織安排等方面有巨大的應(yīng)用潛力。綜合來(lái)看,本文所述方法可為羅夏墨跡測(cè)驗(yàn)在多個(gè)行業(yè)的應(yīng)用提供支持。
參考文獻(xiàn)
[1]謝斌.心理咨詢行業(yè)在中國(guó)的困局與出路[J].心理學(xué)通訊,2018,(3):175-176.
[2]馬春玲.羅夏墨跡測(cè)驗(yàn)在中國(guó)發(fā)展?fàn)顩r研究[J].哈爾濱學(xué)院學(xué)報(bào),2016,37(5):133-135.
[4]張紅陽(yáng).神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯中未登錄詞處理方法研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2017.
[5]楊麗,吳雨茜,王俊麗,等.循環(huán)神經(jīng)網(wǎng)絡(luò)研究綜述[J].計(jì)算機(jī)應(yīng)
用,2018,38(z2):1-6.
[6]孟樂樂.融合時(shí)空網(wǎng)絡(luò)與注意力機(jī)制的人體行為識(shí)別研究[D].北京:北京交通大學(xué),2018.
[7]桑海峰,陳紫珍.基于雙向門控循環(huán)單元的3D人體運(yùn)動(dòng)預(yù)測(cè)[J].電子與信息學(xué)報(bào),2019,41(9):2256-2263.
[8]王偉,孫玉霞,齊慶杰,等.基于Bi-GRU-attention神經(jīng)網(wǎng)絡(luò)的文本情感分類模型[J].計(jì)算機(jī)應(yīng)用研究,2019,36(12):3558-3564.
[9]王郁.基于HO-DINA模型的學(xué)生心理多級(jí)評(píng)分認(rèn)知診斷模型研究[J].現(xiàn)代電子技術(shù),2018,41(2):53-55.
[10]田西柱.基于從眾心理的元胞自動(dòng)機(jī)模型[J].物聯(lián)網(wǎng)技術(shù),2014,4(4):83-87.