溫迎 付玉 黃貝萱
摘要:在心理測評的領(lǐng)域中,互聯(lián)網(wǎng)的快速發(fā)展使得基于計算機的游戲測評迅速發(fā)展。與傳統(tǒng)的心理測評相比,電子游戲測評有著其獨特的優(yōu)勢,但同時也有其避免不了的劣勢。該文根據(jù)已有的文獻(xiàn)資料,將電子游戲測評所測得能力分為認(rèn)知和非認(rèn)知能力,并介紹這種測評的優(yōu)勢和劣勢,以及其發(fā)展展望。
關(guān)鍵詞:電子游戲測評;認(rèn)知能力;非認(rèn)知能力;人機交互
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2019)08-0178-03
1引言
自從黨的十一屆三中全會以來,心理學(xué)重新得到重視,其中心理測評迅速發(fā)展,并得到醫(yī)學(xué)界、心理學(xué)界、教育界、組織人事部門等領(lǐng)域重視,且積極應(yīng)用在人才的培養(yǎng)或選拔等方面。心理測評是對人類心理活動的一種測量、量化和描述的技術(shù)(蔡明燕,2010)。傳統(tǒng)的關(guān)于能力的心理測評越來越不適應(yīng)當(dāng)代的要求。所以近幾年來出現(xiàn)了一個新的領(lǐng)域:游戲測評(game-based assessment, GBA),它指的是通過游戲或游戲化的活動,來對某一對象某些能力進(jìn)行測評(Heinzen, Landrum,Gurung,&Dunn, 2015;孫鑫,黎堅,&符植煜,2018)。在這個概念里提及的游戲沒有限制,可以是傳統(tǒng)的游戲,像是下棋,過家家等線下游戲,也可以是以電子產(chǎn)品為平臺所呈現(xiàn)的像連連看、推箱子等電子游戲。電子游戲(Electronic Games),又稱視頻游戲(Video Games)或者電玩游戲(簡稱電玩),是指所有依托于電子設(shè)備平臺而運行的交互游戲。GBA具有一定的趣味性、隱蔽性和真實性。GBA是建立在游戲的基礎(chǔ)上展開的,相比于傳統(tǒng)的心理測量,有一定的可玩性(孫鑫,黎堅,&符植煜, 2018)。也正是有游戲這件“隱形衣”做保護(hù),參與者是很難意識到實驗人員的真正目的,進(jìn)而也減少了參與者的社會稱許性作答,使得參與者更容易真實作答(Heinzen et al.,2015;Shute,Ventura,2013)。目前,隨著互聯(lián)網(wǎng)的迅速發(fā)展,已經(jīng)有許多研究者開始將心理測驗與計算機結(jié)合起來,將傳統(tǒng)的心理測驗轉(zhuǎn)換為計算機上的游戲,或者是利用現(xiàn)有的電子游戲去測量參與者的某些能力。國外有研究者把利用電腦技術(shù)對解決復(fù)雜問題的能力的評估稱為“微觀世界”(microworlds),研究者通過“微觀世界”來了解被參與者解決問題的過程(Wirth &Funke, 2005)??傊?,這種基于計算機的游戲心理測評在將來一段時間仍是研究的熱點。
2電子游戲測評的類型
認(rèn)知能力和非認(rèn)知能力作為能力的一體兩面,對個人的社會發(fā)展起到重要作用(王子涵,王小軍,2016)。關(guān)于這兩者的界定,目前學(xué)界有比較一致的觀點。認(rèn)知能力主要是從課堂教學(xué)學(xué)到的,如學(xué)科知識、記憶力、思維能力等。所以這類能力的測量主要體現(xiàn)在學(xué)業(yè)成績上。而非認(rèn)知能力相對來說比較復(fù)雜和多樣,包括像毅力、專注力、情感能力、社會適應(yīng)能力、團(tuán)隊合作能力等。對于非認(rèn)知能力的測量方法主要是使用量表,像是大五人格量表;內(nèi)外控制點量表;自尊量表等(陳雨露,秦雪征,2018;余繼,閔維方,2018)。綜上,在本文中,將電子游戲測評的所測內(nèi)容主要分為兩大類,分別為認(rèn)知能力和非認(rèn)知能力。
2.1認(rèn)知能力的電子游戲測評
認(rèn)知能力是指人腦加工、儲存和提取信息的能力。知覺、記憶、注意、思維和想象的能力都被認(rèn)為是認(rèn)知能力。目前,使用率較高的游戲是倫敦塔游戲(the Tower of London,TOL),它是在臨床上和實驗神經(jīng)心理學(xué)上用來評估計劃能力常用的工具。所以有大量的研究者通過線下或線上的倫敦塔游戲來評估個體解決復(fù)雜問題的能力。K?stering等人利用倫敦塔游戲作為技術(shù)媒介,發(fā)現(xiàn)可以通過測量人們計劃能力來評估認(rèn)知障礙的程度(K?stering et al., 2015),也有許多研究發(fā)現(xiàn)TOL可以預(yù)測患者的認(rèn)知功能狀態(tài)(Masson et al., 2010)。 Li, Zhang, Du, Zhu和Li (2015)發(fā)現(xiàn)推箱子和倫敦塔兩個游戲的計劃時間和玩游戲花費的總時間的比與學(xué)業(yè)成績有顯著相關(guān),所以認(rèn)為時間比可以成為元認(rèn)知計劃的線上測量指標(biāo)(Li et al., 2015)。孫鑫等人也發(fā)現(xiàn)利用線上的推箱子的游戲可以預(yù)測學(xué)生推理能力和數(shù)學(xué)成績(孫鑫等人,2018)。Sonnleitner等研究者發(fā)現(xiàn)利用基因?qū)嶒炇遥℅enetics Lap)游戲得到的解決復(fù)雜問題能力的評估結(jié)果與學(xué)生的學(xué)業(yè)成績有顯著的相關(guān)性,且學(xué)生對GL的接受度很高(Sonnleitner et al., 2012)。
2.2非認(rèn)知能力的電子游戲測評
寬泛地說,如果將一個人的認(rèn)知能力可以視為其“智商”,那么可以把非認(rèn)知能力視為其“情商”。由此可見,非認(rèn)知能力對一個人來說也是十分重要的。Ventura和 Shute提供了游戲牛頓游樂場(Newtons Playground,NP)是可以有效評估個體堅持性的證據(jù),這一電子游戲的評估要優(yōu)于個體的自我報告(Ventura &Shute, 2013)。在Baumert, Schl?sser和Schmitt的研究中,利用獨裁者、最后通牒和三人博弈的游戲來預(yù)測個體潛在的公平性和利他性(Baumert, Schl?sser, & Schmitt,2014;孫鑫,黎堅,&符植煜,2018)。
3電子游戲測評的優(yōu)勢
電子游戲除了在引言中提到的優(yōu)勢,還有以下五點比較突出的優(yōu)勢。第一,國外的研究者認(rèn)為人們生來喜歡被測評,因為測評的時候會涉及社會比較(social comparision),社會比較指的是在游戲過程中,通過把自己的積分、排行榜和徽章等和他人進(jìn)行比較,這種視覺反饋可能比老師勸說學(xué)生努力學(xué)習(xí)要更有激勵作用,更能激發(fā)學(xué)生的積極性(Heinzen et al., 2015)。所以更容易獲得真實有效的數(shù)據(jù)。第二,游戲測評可以即時反饋有效信息。參與者一旦做完游戲,就可以得知自己的排名等反饋數(shù)據(jù)。第三,游戲測評是一個連續(xù)的過程。利用游戲,研究者可以得到參與者每一步過程的數(shù)據(jù),而不是僅僅只有最后的結(jié)果,從而可以推導(dǎo)出參與者在解題過程中的心理過程。第四,游戲測評可以最大地激發(fā)參與者的積極性。一個設(shè)計良好的游戲是基于科學(xué)的心理學(xué)知識來制定的,本身的科學(xué)性、交互性、合理性都是可信的。第五,人人都害怕失敗。準(zhǔn)確地來說不是害怕失敗本身,而是失敗后所帶來的后果。正是出于對失敗的恐懼,所以很多學(xué)生難以在學(xué)習(xí)上表現(xiàn)優(yōu)秀(Klassen&Kuzuci, 2009)。電子游戲測評不僅注重參與者成功的一面,更關(guān)注其失敗的信息,關(guān)注失敗的原因是什么,而不是失敗本身。
4電子游戲測評的劣勢
首先,電子游戲測評也避免不了傳統(tǒng)心理測評的問題,就是測量對象群體的差異化。年齡差異是比較突出的問題。兒童期是在成長過程中身心發(fā)展比較迅速的時期,各種能力在這一期間也會有較大的發(fā)展。對于這個時期年齡段的劃分要比其他年齡層的劃分更為細(xì)致,那到底以幾年或幾個月為一階段合適呢?這個需要經(jīng)過前期大量的實驗數(shù)據(jù)的收集才能確定。第二,游戲測評要優(yōu)于傳統(tǒng)心理測評一個突出的點是其生動性,尤其是針對兒童。所以需要這就考慮人機的交互性。除了游戲本體的設(shè)計,在游戲界面的設(shè)計也需要花費大量的心思。既不能分散兒童的注意力,又要有一定的吸引力。第三,目前,學(xué)界常用的計算機過程數(shù)據(jù)追蹤技術(shù)——log-file來收集數(shù)據(jù)。log-file指的是受測者所有活動足跡的日志文件,它可以收集到比較全面的數(shù)據(jù),取代了傳統(tǒng)的人工收集數(shù)據(jù),且在收集數(shù)據(jù)過程中不影響受測者(孫鑫等人,2018;Moharil et al., 2014)。但同時也會出現(xiàn)一個問題:log-file可以收集較多的數(shù)據(jù),所以實驗者在數(shù)據(jù)的篩選、確定和分析等方面需要明確知道自己的所需,不同的游戲有不同的數(shù)據(jù)指標(biāo),即使是相同的游戲也可能存在不同的數(shù)據(jù)指標(biāo),哪些數(shù)據(jù)可以代表因變量等一系列問題需要實驗者思考。
5未來研究展望
5.1施測對象
目前,游戲測評這一領(lǐng)域迅速發(fā)展,且多用在教育、醫(yī)療等領(lǐng)域,而其施測對象多為中青年。但事實上,最需要游戲測評的人群是兒童和老人。
對兒童來說,游戲更具有吸引力,且比較容易學(xué)會。相比于傳統(tǒng)的心理測試,游戲測評還有一個比較大的優(yōu)勢在于不容易受到干擾,因為有的兒童達(dá)不到某些心理測驗所需要的理解能力,這時成年人在旁邊過多解釋或指導(dǎo),會影響到兒童真實的反應(yīng)。因為成年人的語言幫助或多或少帶有主觀想法。
認(rèn)知功能障礙(cognitive impairment, CI)是指介于正常衰老和癡呆之間的一種人中功能損傷。研究資料顯示,每年大約有8%-25%的CI患者進(jìn)一步發(fā)展成為癡呆(Hughes et al., 2013)。游戲測評一個突出的作用在于可以預(yù)測潛在的有認(rèn)知障礙的老人。目前,已有研究者通過手機上的七款小游戲的成績能夠綜合預(yù)測可能存在認(rèn)知障礙的老人(Bonnechère et al., 2018)。但這七款游戲?qū)先颂魬?zhàn)難度比較大,使得得分普遍不高。所以在今后的研究中,如何設(shè)計合適難度的游戲?qū)⑷詴且粋€較大的問題。一些游戲測評是可以發(fā)展成幫助老人訓(xùn)練和認(rèn)知康復(fù)。這也將會是一個未來主攻的方向。
5.2觀察指標(biāo)
普通的測評小游戲,像是找不同、看圖分類等可以收集準(zhǔn)確率或反應(yīng)時的數(shù)據(jù)。但像是推箱子等復(fù)雜的游戲觀察指標(biāo)的選取有待商榷。像是孫鑫等人選取完成箱子的比例、第一部計劃的時間與總時間的比值、完成推箱子所要的步數(shù)等作為觀察指標(biāo),然后利用機器學(xué)習(xí)技術(shù),對log-file所收集到的數(shù)據(jù)進(jìn)行分析,得到比較理想的結(jié)果(孫鑫等人,2018)。但Li, Zhang, Du,Zhu 和 Li (2015)通過推箱子游戲測量被試的元認(rèn)知計劃, 只使用第一步時間與總時間的比值(Li et al., 2015)。針對不同的研究目的就有不同的選取,但選取哪一個或一些觀察指標(biāo)最優(yōu)呢?因為電子游戲測評是較新的一個領(lǐng)域,目前相關(guān)的文獻(xiàn)有限,學(xué)界也沒有統(tǒng)一的說法。
5.3人機交互界面
人機交互(Human-Computer Interaction, 簡寫HCI)是指人與計算機之間使用某種對話語言,以一定的交互方式,為完成確定任務(wù)的人與計算機之間的信息交換過程。簡單來說,就是開發(fā)者更加注重產(chǎn)品的“用戶友好性”。而GBA中比較熱門的領(lǐng)域是利用電子游戲進(jìn)行測評。所以說如何讓電子游戲測評更具有“人性化”是目前需要關(guān)注的問題。目前,有許多研究者已著手研究兒童教育軟件的交互界面,并卓有成效。但是針對其他年齡段人群的相關(guān)研究還需進(jìn)一步發(fā)展。
參考文獻(xiàn):
[1]蔡明燕.兒童心理測驗方法的介紹和發(fā)展趨勢[J].中醫(yī)藥臨床雜志, 2010,22(10):930-932.
[2]HeinzenTE, LandrumRE, GurungRA, DunnDS. Game-based assessment: The mash-up weve been waiting for[M]. In Gamification in education and business,Springer, Cham, 2015: 201-217.
[3]孫鑫,黎堅,符植煜.利用游戲log-file預(yù)測學(xué)生推理能力和數(shù)學(xué)成績——機器學(xué)習(xí)的應(yīng)用[J].心理學(xué)報,2018,50(07):73-82.
[4]ShuteVJ, VenturaM. Stealth assessment: Measuring and supporting learning in video games[M].MIT Press, 2013.
[5]WirthJ, FunkeJ. DynamischesProbleml?sen: Entwicklung und Evaluation einesneuenMessverfahrenszumSteuernkomplexerSysteme [Dynamic problem solving: Development and evaluation of a new assessment to control complex systems]. In E. Klieme, D. Leutner, & J. Wirth (Eds.), Probleml?sekompetenz von Schülerinnen und Schülern (pp. 55-72). Wiesbaden, Germany: VS, 2005.
[6]王子涵,王小軍.包含認(rèn)知能力的教育回報率估計-基于chip2007年數(shù)據(jù)的實證研究[J].教育與經(jīng)濟(jì),2016(1):39-46.
[7] 陳雨露,秦雪征.相貌對個人認(rèn)知能力與非認(rèn)知能力的影響——基于中國家庭追蹤調(diào)查(CFPS)數(shù)據(jù)的研究[J].勞動經(jīng)濟(jì)研究,2018(04):71-96.
[8]余繼,閔維方.學(xué)習(xí)空間對大學(xué)生認(rèn)知和非認(rèn)知能力的影響 ——基于學(xué)生學(xué)習(xí)視角的實證研究[J].現(xiàn)代遠(yuǎn)程教育研究,2018(6):79-88.
[9]K?SteringL, SchmidtCSM, EggerK, et al. Assessment of planning performance in clinical samples: reliability and validity of the tower of London task (tol-f)[J]. Neuropsychologia, 2015,75: 646-655.
[10]MassonJD, DagnanD, EvansJ. Adaptation and validation of the tower of london test of planning and problem solving in people with intellectual disabilities[J].J Intellect Disabil Res, 2010,54(5):457-467.
[11] LiJ, ZhangB, DuH, et al. Metacognitive planning: Development and validation of an online measure[J].Psychological assessment, 2015,27(1):260.
[12]SonnleitnerP, BrunnerM, GreiffS,et al. The Genetics Lab. Acceptance and psychometric characteristics of a computer-based microworld to assess complex problem solving[J].Psychological Test and Assessment Modeling, 2012,54:54-72.
[13]BaumertA, Schl?sserT, SchmittM. Economic games: a performance-based assessment of fairness and altruism[J].European Journal of Psychological Assessment, 2014,30(3):178-192.
[14]KuzucuE, KuzucuE. Academic procrastination and motivation of adolescents in turkey[J].Educational Psychology, 2009,29(1):69-81.
[15]MoharilB, GokhaleC, GhadgeV, et al. Real time generalized log file management and analysis using pattern matching and dynamic clustering[J].International Journal of Computer Applications, 2014,91(16).
[16] HughesTF, FlattJD, FuB, et al. Engagement in social activities and progression from mild to severe cognitive impairment: the myhatstudy[J].International Psychogeriatrics, 2013,25(4), 587-595.
[17]BonnechèreB, VanVM, BierJC, et al. The use of mobile games to assess cognitive function of elderly with and without cognitive impairment[J].Journal of Alzheimers Disease Jad,2018,64(4):1-9.
【通聯(lián)編輯:代影】