陳念劬
(南通大學(xué)教育科學(xué)學(xué)院,江蘇 南通 226000)
好奇,尤其是知識好奇(epistemic curiosity)在人們的日常學(xué)習(xí)和生活中扮演著重要的角色。在過去的幾十年里,大量的實證研究已經(jīng)證實好奇可以促進學(xué)習(xí)、改善認知、激發(fā)創(chuàng)造,甚至緩解焦慮(Baer et al.,2012;Hardy et al.,2017;Hagtvedt et al.,2019;Harrison &Dossinger,2017;Gruber et al.,2019;Kashdan &Roberts,2006)。從理論探討到問卷調(diào)查,從行為實驗到神經(jīng)生理研究,有些研究者關(guān)注好奇的特質(zhì)性,有些研究者強調(diào)好奇狀態(tài)性(Berlyne,1954;Cervera et al.,2020;Kashdan &Ficham,2004;Litman &Silvia,2006;Loewenstein,1994;Murayama et al.,2019)。但經(jīng)常被研究者們忽視的一點是——好奇是在變化發(fā)展的,它會隨著經(jīng)驗的積累和腦的發(fā)育不斷變化和發(fā)展。因此,本文將從動態(tài)發(fā)展的視角看待好奇,以反饋循環(huán)模型為框架,探討從好奇發(fā)生到好奇滿足的神經(jīng)生理機制。首先對好奇的概念進行辨析和界定。隨后,對構(gòu)成好奇反饋循環(huán)模型的各個階段進行闡述。接著,對好奇在個體生命周期中的變化與發(fā)展進行總結(jié)。最后,對基于該模型的未來研究提出建議。
構(gòu)建一個關(guān)于好奇的整合模型遇到的第一個問題就是以往文獻對好奇的概念界定并不清晰。19 世紀末,James (1891)認為好奇是為了適應(yīng)生存而演化出來的主動探索環(huán)境的本能。半個多世紀后,Berlyne (1954)用驅(qū)力減少理論(drive reduction theory)來解釋好奇,認為好奇是一種對信息的渴望,就像饑餓一樣,需要被滿足。驅(qū)力減少理論最早由Hull (1943)提出,他認為驅(qū)力是一種動機結(jié)構(gòu),通過給機體力量或能量引發(fā)行為,以滿足需求,進而減弱驅(qū)力。Berlyne (1957)認為好奇是一種令人厭惡的狀態(tài),新異性和不確定性會引起好奇。而信息尋求行為的目的就是解決不確定性,從而解除這種令人厭惡的狀態(tài)。此外,Berlyne(1954)還把好奇分成了知識好奇(epistemic curiosity)和知覺好奇(perceptual curiosity)。其中,知識好奇是對知識信息的渴望,主要適用于成年人類;知覺好奇是對新異性感官刺激的渴望,除成年人類外,在動物和人類嬰兒中也有所表現(xiàn)。正是這種渴望,驅(qū)動著個體的一系列探索行為。在提出好奇的驅(qū)力減少理論后,Berlyne (1970)又指出好奇遵循最佳喚醒原則,刺激新異度太高會導(dǎo)致焦慮,太低會導(dǎo)致無聊,只有新異度居中時好奇水平最高,愉悅度也最高。這似乎與他先前的描述相矛盾,一是按照“驅(qū)力減少理論”,驅(qū)力應(yīng)該隨著刺激的新異程度增加而單調(diào)遞增,進而驅(qū)動更多的信息尋求行為;二是新異刺激造成的驅(qū)力增加對應(yīng)的是厭惡情緒,那么愉悅情緒從何而來。若從動態(tài)過程角度看待好奇,這兩個矛盾似乎就迎刃而解了。首先,好奇的發(fā)生是有條件的,當刺激引起的喚醒度太高或太低時誘發(fā)的便不是好奇,或者說不單純是好奇,其它動機的產(chǎn)生會削弱信息尋求行為。另外,新異性和不確定性促使驅(qū)力增加而引起厭惡情緒,這和隨著新異性和不確定性降低促使驅(qū)力減少而帶來愉悅情緒,兩種情緒發(fā)生的時間節(jié)點不同,并不存在沖突。
到了1994 年,Loewenstein (1994)提出了“信息缺口”理論(information-gap theory),認為信息缺口會引發(fā)好奇。例如不確定性、新異性、復(fù)雜性、意外性等,這些能引發(fā)好奇的特性,本質(zhì)上都與先驗知識的局限性有關(guān),會使個體產(chǎn)生信息缺口。Loewenstein (1994)認為好奇是感知到信息缺口而形成的認知剝奪。與驅(qū)力理論一樣,信息缺口理論認為好奇為信息尋求提供動力,目的是消除信息缺口帶來的厭惡狀態(tài)。Loewenstein (1994)還指出,信息本身的價值就足以驅(qū)動個體的信息尋求行為,哪怕這些信息并不服務(wù)于其它的即時目標。
于是,Oudeyer 等人(2016)明確將好奇歸到內(nèi)部動機的概念框架之下,認為好奇是一種內(nèi)部動機。Ryan 和Deci (2000)將內(nèi)部動機定義為“驅(qū)動個體為了樂趣或挑戰(zhàn)而非外在物品、壓力或獎勵而產(chǎn)生行為的動力。個體為了內(nèi)在的滿足而做一件事,享受的是活動本身而不是它的工具價值?!迸c內(nèi)部動機不同,“外部動機驅(qū)動的活動具有明顯的目的性,為的是獲得活動之外的工具性結(jié)果?!眱烧叩膮^(qū)別在于是否具有工具性目的。好奇符合內(nèi)部動機的特點,目標信息本身的價值就足夠產(chǎn)生信息尋求,而無須附加其它的工具性價值(Bennett et al.,2016;Lau et al.,2020;Marvin &Shohamy,2016;Oosterwijk et al.,2020)。
以上關(guān)于好奇的定義更多是把好奇當作暫時的狀態(tài)來理解,是個體針對環(huán)境特征所表達的瞬間體驗,即具有狀態(tài)性。也有一些研究者認為好奇還是一種會持續(xù)對新知識或新經(jīng)驗產(chǎn)生渴望的性格傾向,即具有特質(zhì)性(Kashdan &Ficham,2004;Litman &Silvia,2006),并據(jù)此開發(fā)了一系列關(guān)于好奇的測量工具,包括《興趣/剝奪型知識好奇量表》(I/D type Epistemic Curiosity Scale;Litman,2008)、《好奇和探索清單Ⅱ》(Curiosity and Exploration Inventory Ⅱ,CEI -Ⅱ;Kashdan et al.,2009)、《五維度好奇量表》(Five-Dimensional Curiosity Scale,5DC;Kashdan et al.,2018)等。這些測量工具通常涉及三個方面的問題:對信息的渴望程度(動機)、信息尋求行為發(fā)生的強度(行為)以及信息尋求時的情緒狀態(tài)(情緒)。
可以看到的是,在這些對好奇的界定中,涉及到動機、行為和情緒——如減少不確定性的動機,尋求信息的行為,對信息缺口的厭惡或是面對新異刺激的愉悅等,它們似乎都反映了好奇。
但問題是,好奇的本質(zhì)是什么?想要深入探討好奇,必須有一個更為清晰的界定。雖然表達有所不同,但大多數(shù)研究者都認為好奇能為信息尋求提供動力(Berlyne,1954;Loewenstein,1994;Oudeyer et al.,2016),即好奇的本質(zhì)是動機,而且是以獲得信息本身而非其它附加價值為目標的內(nèi)部動機。結(jié)合Loewenstein 的信息缺口理論,本文想要探討的好奇是個體感知到信息缺口后產(chǎn)生的內(nèi)部動機。好奇作為信息尋求的其中一個驅(qū)動力而存在。情緒伴隨著好奇的產(chǎn)生而產(chǎn)生,隨著行為和行為結(jié)果的變化而變化。正如從扳機扣動到射中目標是一個過程,行為(信息尋求等)和情緒(厭惡、愉悅、無聊等)就是好奇這個扳機扣動后引發(fā)的一系列可能的狀態(tài)和結(jié)果。想象一下,在日常生活中,當你表達“我很好奇”的時候,更多想要傳達的可能是“我想知道”這樣一種狀態(tài),而“想知道”反映的是動機。而動機發(fā)生就必然存在動機的滿足或不滿足,從好奇發(fā)生到好奇滿足,究竟會經(jīng)歷一個怎樣的過程,本文將在下一部分進行闡述。
雖然好奇本質(zhì)上是動機,但好奇動機是一系列好奇相關(guān)事件的開端,這個開端又會受到后續(xù)事件結(jié)果的影響,也就是說,從好奇發(fā)生到好奇滿足構(gòu)成了一個反饋回路(feedback loop)。這個反饋回路主要包括“感知信息缺口-好奇發(fā)生-控制的價值評估-信息尋求-好奇滿足-信息整合”六個階段,該結(jié)構(gòu)與Murayama 等人(2019)的知識獲取的獎勵性學(xué)習(xí)框架(reward-learning framework of knowledge acquisition)基本一致。Murayama 認為可持續(xù)的知識獲取從意識到知識缺口開始,之后個體會發(fā)起信息尋求行為,直到獲取相應(yīng)知識感受到獎勵,進一步強化了信息尋求行為,同時知識庫擴增使得人們更容易探測到知識缺口。另外,Gruber 和Ranganath (2019)的預(yù)測、評價、好奇、探索(prediction,appraisal,curiosity,and exploration,PACE)模型認為好奇始于預(yù)測偏差,接著個體對該偏差指向的未來信息進行價值評估,進而引發(fā)好奇和探索行為,并最終促進學(xué)習(xí)和記憶。獎勵性學(xué)習(xí)框架關(guān)注的是知識獲取的過程,認為“好奇”、“興趣”、“吃驚”等只是人們對知識獲取過程中產(chǎn)生的各種體驗的事后解釋。PACE 模型認為好奇是信息價值評估的結(jié)果,強調(diào)好奇對記憶的影響。本文認為好奇的本質(zhì)是知識獲取行為發(fā)生的主要動力,關(guān)注的是好奇的動態(tài)變化性。
無論具體表達如何,以上模型本質(zhì)上均源于強化學(xué)習(xí)(reinforcement learning,RL)模型(Rescorla,1972;Sutton &Barto,1998)。所謂RL,研究的是自然和人工系統(tǒng)如何在環(huán)境中學(xué)習(xí)預(yù)測結(jié)果,并進行行為優(yōu)化的過程。RL 的關(guān)鍵是通過強化物改變行為和動機。該理論脫胎于心理學(xué),目前被廣泛用于經(jīng)濟學(xué)、機器學(xué)習(xí)等領(lǐng)域(Sutton &Barto,2018)。與一般RL 相比,好奇誘發(fā)信息尋求最重要的特點在于強化物是滿足好奇的信息本身。
本文在闡述好奇的反饋循環(huán)模型時,將重點放在了每個階段的神經(jīng)生理機制上。模型將好奇定位在內(nèi)部動機上,把信息尋求行為作為好奇的誘發(fā)結(jié)果、情緒作為好奇的伴生產(chǎn)物,強調(diào)好奇的動態(tài)變化性(見圖1a)。根據(jù)Loewenstein (1994)的信息缺口理論,個體感知到信息缺口產(chǎn)生厭惡感,為緩解這種情緒,個體對信息(獎勵)產(chǎn)生渴望,即產(chǎn)生好奇動機?;诋斍碍h(huán)境、過往經(jīng)驗,個體根據(jù)當前活動狀態(tài)或潛在行為(如信息尋求)的預(yù)期結(jié)果進行控制的價值(value of control)評估,即評估接下來的行為需要施加多少控制和如何施加控制,以決定是否發(fā)起信息尋求。信息尋求對應(yīng)不同的結(jié)果:信息獲取成功,好奇滿足;信息獲取失敗,好奇未滿足。此階段也會伴隨各種情緒的產(chǎn)生(di Leo et al.,2019;Vogl et al.,2019)。由于有新信息的輸入,個體的狀態(tài)會發(fā)生改變,并成為控制價值評估的線索,進而影響新一輪的信息尋求行為。好奇滿足意味著信息獎勵獲得,往往會增加個體對新信息的期望價值和行為有效性的估計,進而強化信息尋求行為。而信息的進一步整合帶來先驗知識的擴展,擴展的先驗知識使個體更易于意識到新的信息缺口,激發(fā)新的信息尋求行為。此過程形成了一個正反饋循環(huán),有助于可持續(xù)的知識獲取。反之,信息獲取失敗,正反饋循環(huán)就此打斷。需要注意的是,我們?nèi)菀装押闷鏉M足簡單地理解為好奇任務(wù)中目標信息的呈現(xiàn)。事實上,在真實情境中,信息尋求過程是動態(tài)的,尋求結(jié)果也是動態(tài)的,所有縮小或擴大信息缺口的信息都會引發(fā)個體狀態(tài)的改變,導(dǎo)致好奇的滿足或不滿足。
本文與獎勵性學(xué)習(xí)模型(Murayama et al.,2019)最大的區(qū)別在于融入了Shenhav 等人(2013,2016)的“控制的期望價值”(expected value of control,EVC)模型。之所以做此融合,是因為從好奇動機的產(chǎn)生到信息尋求行為的發(fā)生,符合一般行為決策的規(guī)律,遵循神經(jīng)經(jīng)濟學(xué)(neuroeconomics;Rangel et al.,2008)原理,即信息尋求行為的發(fā)生及策略的選擇取決于一系列神經(jīng)生物學(xué)的價值計算結(jié)果(Platt &Plassmann,2014)。EVC 模型對這種基于動機和獎勵的行為決策過程進行了概括(圖1b)。需要說明的是,EVC 模型中的控制,也叫認知控制(cognitive control),指的是在一些非“自動化”的、需要花費時間并付出努力才能完成的任務(wù)中,協(xié)調(diào)行為使其和目標一致的能力。主動發(fā)起的信息尋求就是一種需要施加控制的行為。在EVC 模型中,背側(cè)扣帶回(dorsal anterior cingulate cortex,dACC)連接著狀態(tài)評估和行為調(diào)節(jié)。具體來說就是,系統(tǒng)將反映當前活動狀態(tài)或潛在行為預(yù)期結(jié)果的信號傳遞給dACC,dACC 綜合預(yù)期獎勵和努力成本等信息,計算得到EVC,決定如何分配控制資源,并將計算結(jié)果輸出給調(diào)節(jié)系統(tǒng)進行控制執(zhí)行(Shenhav et al.,2013;Shenhav et al.,2016)。
另外,在整個RL 過程中,多巴胺(dopamine,DA)系統(tǒng)扮演著重要的角色。投射向不同腦區(qū)的DA,可能具有不同的作用(圖1c)。其中,主要由腹側(cè)被蓋(ventral tegmental area,VTA)和黑質(zhì)(substantia nigra,SN)腹中側(cè)發(fā)出,投射向伏隔核(nucleus accumbens,NAcc;位于腹側(cè)紋狀體,ventral striatum,VS)和前扣帶回(anterior cingulate cortex,ACC)的多巴胺能神經(jīng)元(dopaminergic neurons,DAN),對強化物的效價進行反應(yīng);而主要從 SN 背外側(cè)和外側(cè)發(fā)出,投射向前額葉(prefrontal cortex,PFC)的DAN,則對強化物的突顯性進行反應(yīng)(Dayan &Niv,2008;Matsumoto &Hikosaka,2009;Ott &Nieder,2019)。因此,有研究者認為與效價有關(guān)的DA 可被用來更新價值表征,實現(xiàn)RL;而與突顯性有關(guān)的DA 則預(yù)示著刺激需要獲得的注意量,參與調(diào)節(jié)認知控制(Ott &Nieder,2019;Sutton &Barto,2018)。
圖1 好奇的反饋循環(huán)模型及其神經(jīng)生理機制。(a)好奇的反饋循環(huán)過程。個體感知到信息缺口形成認知剝奪,引發(fā)厭惡情緒,從而產(chǎn)生對信息的渴求,即好奇動機。系統(tǒng)對當前狀態(tài)(包括好奇動機)進行評估,得到EVC,以決定是否值得發(fā)起信息尋求行為。若認知控制的收益大于代價則發(fā)起控制,進行信息尋求。信息尋求成功,好奇滿足。好奇滿足產(chǎn)生的體驗重新成為輸入信息,改變當前狀態(tài),進而影響之后的好奇動機產(chǎn)生及信息尋求發(fā)起。最后,獲得的信息與先驗知識發(fā)生整合,先驗知識得到擴展,個體更容易意識到新的信息缺口,激發(fā)新的信息尋求行為。此過程形成了一個正反饋循環(huán),有助于可持續(xù)的知識獲取。(b)基于動機和獎勵的行為決策過程,此圖參考Shenhav 等人(2016)的EVC 模型。反映當前活動狀態(tài)或潛在行為預(yù)期結(jié)果的信號傳遞給dACC,dACC 計算EVC,決定控制資源如何使用,并將計算結(jié)果輸出給調(diào)節(jié)系統(tǒng)進行認知控制。(c)中腦DA 系統(tǒng)。SN/VTA 位于中腦,是DA 釋放的起源(Ballard et al.,2011;Cervera et al.,2020;Frankle et al.,2006)。其中,從中腦發(fā)出投射至NAcc (屬于VS 區(qū))、ACC、MFC 等區(qū)域的DA 通常反映了實際接收到的獎勵和預(yù)期獎勵之間的差異,即RPE。DAN 的活動與效價有關(guān)(獎勵使DAN 活動性增加,懲罰使DAN 活動性降低),且變化快速,因此可被用來更新價值表征,實現(xiàn)RL。而從中腦投射向PFC 的DA 與效價無關(guān),傳遞的是刺激突顯性信號,預(yù)示著刺激需要獲得更多注意,因此對認知控制有促進作用。(d)海馬-VTA/SN功能回路。海馬與中腦VTA/SN 的DAN 構(gòu)成了一個功能回路。DA 在海馬內(nèi)釋放,會增強LTP,有助于記憶鞏固。縮寫:EVC-控制的期望價值(expected value of control);OFC-眶額皮質(zhì)(orbitofrontal cortex);dACC-背側(cè)前扣帶回(dorsal anterior cingulate cortex);LPFC-外側(cè)前額葉皮質(zhì)(lateral prefrontal cortex);MC-運動皮質(zhì)(motor cortex);LC-藍斑核(locus coeruleus);DA-多巴胺(dopamine system);VTA-腹側(cè)被蓋(ventral tegmental area);SN-黑質(zhì)(substantia nigra);NAcc-伏隔核(nucleus accumbens);VS-腹側(cè)紋狀體(ventral striatum);MFC-內(nèi)側(cè)前額葉皮質(zhì)(medial prefrontal cortex);ACC-前扣帶回(anterior cingulate cortex);PFC-前額葉皮質(zhì)(prefrontal cortex);RPE-獎勵預(yù)測偏差(reward prediction error);RL-強化學(xué)習(xí)(reinforcement learning)
而好奇的一個重要作用——促進學(xué)習(xí)和記憶(Gruber et al.,2014;Kang et al.,2009;Marvin &Shohamy,2016),也與DA 系統(tǒng)密切相關(guān)。因為,參與學(xué)習(xí)和記憶的關(guān)鍵腦區(qū)海馬(hippocampus)與中腦VTA/SN 的DAN 之間存在一個功能回路(圖1d;Lisman &Grace,2005)。DA 在海馬內(nèi)釋放,會增強長時程增強(long-term potentiation,LTP),而LTP 是記憶鞏固的關(guān)鍵步驟(Lisman &Grace,2005)。
總之,靜態(tài)地觀察好奇本身存在一定的局限性,把從好奇發(fā)生開始的一系列事件聯(lián)系在一起才能更好地理解好奇的本質(zhì)和作用。接下來,本文將分別對該模型的各個階段及各階段的神經(jīng)生理機制進行具體闡述。
Loewenstein (1994)的信息缺口理論認為,好奇的作用與其他驅(qū)動力類似,如饑餓促使人們進食,而好奇促使人們填補“信息缺口”。少量信息或沖突信息都可以成為一劑啟動劑,驅(qū)動信息尋求行為。通常情況下,信息缺口與個體的先驗知識有關(guān),當前信息與先驗知識的差異決定了缺口的大小。當探知到知識缺口時,人們就會主動發(fā)起信息尋求行為,以獲取知識。
也就是說,信息缺口可以引起好奇,先驗知識決定了信息缺口。那么多大的信息缺口是合適的呢?Berlyne,Hebb 等人(Berlyne,1970;Hebb,1955)指出存在一個最佳的信息不一致水平,并稱其為“最佳喚醒”水平。他們認為,不太熟悉也不太新奇的刺激才會誘發(fā)好奇,極度的不一致導(dǎo)致的是恐懼反應(yīng)而不是探索行為。Kidd 等人(2012)的研究也發(fā)現(xiàn),對于信息含量很低(高度可預(yù)測)或信息含量很高(高度令人驚訝)的事件,嬰兒移開視線的可能性最大。嬰兒傾向于將注意維持在具有中等信息量的事件上。Kang 等人(2009)在成人身上也發(fā)現(xiàn)了類似的結(jié)果,個體對冷知識問題答案的好奇與對答案的信心之間的關(guān)系是一條倒U型曲線,即當被試對答案一無所知或極度自信時,好奇最弱;而當被試對答案模棱兩可時,好奇最強。更強的好奇動機意味著會啟動更多的注意資源投入。這種對中度不確定性產(chǎn)生最大好奇、投入最多注意的策略可以有效防止人們在過于可預(yù)測或過于復(fù)雜的事件上浪費認知資源,從而幫助他們最大限度地發(fā)揮學(xué)習(xí)潛能。
參與信息缺口探測的腦區(qū)主要有兩個——海馬和ACC (黃騏 等,2021)。海馬在新記憶形成時參與了新信息的聯(lián)結(jié),在長時記憶提取時參與了對已存儲信息的索引,而且海馬與情景記憶的建立關(guān)系密切(Squire et al.,2007;Eichenbaum &Cohen,2014)。因此,海馬對新的或意外的環(huán)境信息極為敏感。這些信息可以通過激活海馬引導(dǎo)接下來的視覺探索(Liu et al.,2017;Voss et al.,2017)。除了新異環(huán)境,認知沖突也是信息缺口的一個重要體現(xiàn)。對認知沖突的監(jiān)控則與ACC 有關(guān)。有研究者認為存在一個沖突監(jiān)控系統(tǒng),用來監(jiān)控信息處理中的沖突發(fā)生,目的是基于沖突大小計算需要施加的控制,并將此信息傳遞給負責(zé)控制的中心,其中負責(zé)沖突監(jiān)控的腦區(qū)正是ACC(Botvinick et al.,2001;Shenhav et al.,2016)。研究發(fā)現(xiàn),當給被試呈現(xiàn)模糊圖片(誘發(fā)好奇的材料)時,ACC 的活動確實有所增強(Jepma et al.,2012)。
另外,好奇作為動機,具有趨避兩面性,好奇動機“趨”的是信息(獎勵),“避”的是信息缺口帶來的負性情緒。Berlyne (1957)就曾指出好奇是一種令人厭惡的狀態(tài)。Loewenstein (1994)認為意識到信息缺口會帶來一種剝奪感。Litman (2008)提出的剝奪型好奇(deprivation type curiosity)表明好奇有可能是不被滿足的需求狀態(tài)。可見,好奇與厭惡情緒相生相伴。最近的實證研究證實了這一負性情緒的存在,van Lieshout,de Lange 等人(2021)用抽獎任務(wù)對呈現(xiàn)信息的不確定性進行了定量操作,結(jié)果發(fā)現(xiàn)不確定性越強,產(chǎn)生的好奇水平越高,但愉悅度卻降低了。Jepma 等人(2012)用模糊圖片誘發(fā)好奇,激活了前島葉皮層(anterior insular cortex,AIC)。而AIC 與個體的消極喚醒有關(guān)(如疼痛、厭惡等;Shackman et al.,2011;Singer et al.,2009),說明好奇發(fā)生涉及一種類似厭惡的情緒狀態(tài)。
首先,需要說明的是,信息尋求被認為是典型好奇誘發(fā)行為。當人們感到好奇,即在好奇動機的驅(qū)使下,會去探索、提問和操縱有趣的物體(Kidd &Hayden,2015),這些均被視作信息尋求。但好奇誘發(fā)的行為不只是信息尋求。例如,當一個人回避劇透(Rosenbaum &Johnson,2015)時,這種回避信息的行為也部分始于好奇動機。此外,信息尋求也并不意味著總是伴隨外顯行為(Murayama et al.,2019)。例如,在課堂教育情境下,知識可能是由外部提供的,學(xué)生只是被動接受者。不過,即便在這種情況下,學(xué)生對信息的理解依然取決于他對信息的主動處理程度。也就是說,學(xué)生仍然在心理上進行信息搜尋,且該過程需要認知控制。
2.2.1 信息尋求行為的決策過程
從好奇發(fā)生到信息尋求具有一般行為決策的特點和內(nèi)在機制(圖1b)。信息尋求行為是否發(fā)出、怎樣發(fā)出是一系列價值計算的結(jié)果(Platt &Plassmann,2014;Rangel et al.,2008)。Shenhav 等人(2013,2016)將這種價值描述為EVC,在需要認知控制的任務(wù)中,EVC 整合了以下信息:控制過程的預(yù)期收益,實現(xiàn)該收益需要投入的控制量,以及認知努力需要付出的成本。所以,EVC 代表著控制的凈價值,用于決定在接下來的行為中控制如何分配。EVC 的估計發(fā)生在dACC 中,dACC接收來自杏仁核、AIC、OFC、中腦等結(jié)構(gòu)的信號輸入,這些信號反映了生物體的當前狀態(tài)(如當前任務(wù)需求、處理能力、動機狀態(tài)等)和潛在行為結(jié)果的價值(同時考慮結(jié)果發(fā)生的可能性和預(yù)期價值)。上文提到的認知沖突只是dACC 處理的眾多信號之一(Shenhav et al.,2016)。
在好奇相關(guān)的研究中,研究者發(fā)現(xiàn)OFC 可能是對信息價值進行編碼的腦區(qū)。在一個好奇交易任務(wù)(curiosity tradeoff task)中,研究者發(fā)現(xiàn)OFC既編碼了賭博的賭注,也編碼了滿足好奇的信息價值,這些代表價值高低的信號被送往了中腦DA 系統(tǒng)(Blanchard et al.,2015;Charpentier et al.,2018)。但對信息價值的編碼是否與自然獎勵物的編碼一致,研究者們在觀點上仍有分歧(Cervera et al.,2020)。一項關(guān)于物品選擇任務(wù)的研究可以很好地反映OFC 和ACC 在價值編碼上的區(qū)別(Shenhav &Buckner,2014)。當兩個物品都具有高價值,被試必須要選擇其中之一的時候,相較于兩個低價值物品或價值一高一低的兩個物品,被試的焦慮水平最高。ACC 的反應(yīng)與焦慮水平一致,沖突越大,激活越強。而OFC 的反應(yīng)只與即將選到的物品價值有關(guān),價值越高,激活越強??梢?OFC 編碼的是預(yù)期的報酬或獎勵,而ACC 反映的是任務(wù)需要施加的控制。
當dACC 計算出控制資源的分配方案后,計算結(jié)果會輸出給調(diào)節(jié)系統(tǒng)進行控制的具體執(zhí)行。負責(zé)接收來自dACC 輸出信號的腦區(qū)主要有LPFC、運動皮質(zhì)、紋狀體、LC 等(Shenhav et al.,2016)。
研究表明,信息缺口激活A(yù)CC 后會將信號傳遞給 LPFC,并由 LPFC 決定是否發(fā)起探索行為(Gruber &Ranganath,2019;Gruber &Fandakova,2021)。一項使用冷知識問題范式的神經(jīng)成像研究發(fā)現(xiàn),與低好奇相比,高好奇相關(guān)的冷知識問題對LPFC 的激活更強,這可能與高好奇問題擁有更高的EVC 有關(guān)(Kang,et al.,2009;Gruber et al.,2014;Ligneul et al.,2018)。其他好奇研究也顯示,當面對高不確定性圖片時,LPFC 活動更強(Jepma et al.,2012)。去甲腎上腺素能系統(tǒng)(noradrenergic system)中合成去甲腎上腺素(norepinephrine,NE)的部位——LC 也參與了好奇的響應(yīng)(Gompf et al.,2010)。面對不可預(yù)測的、不確定的刺激時表現(xiàn)出的瞳孔擴張反映的就是LC 的活動(Joshi et al.,2016;Payzan-LeNestour et al.,2013)。
值得注意的是,信息尋求行為通常始于好奇,但好奇并不必然會引起信息尋求行為,好奇只是信息尋求的動機之一。有時候“想知道”不意味著人們會采取行動“去知道”。從EVC 模型可以看出,發(fā)出一個行為是一系列成本-收益分析的結(jié)果。鑒于好奇的內(nèi)部動機特性,滿足好奇的信息本身就具有獎勵性質(zhì),無須附加其它工具性價值就對信息尋求有驅(qū)動作用。眾多研究也都支持了這一觀點,為了獲得滿足好奇動機的信息,人們甚至愿意付出一些代價(如貨幣成本、時間成本、電擊等;Bennett et al.,2016;Lau et al.,2020;Marvin &Shohamy,2016)。但這些信息除了滿足好奇外,可能還具有其它的附加價值。例如,信息可能擁有不同的情緒效價,對信息情緒效價的預(yù)期也會影響信息尋求行為(Hertwig &Engel,2016)。Charpentier等人(2018)的研究表明,當被試可能獲得的信息為負性(有金錢損失)時,他們的信息尋求行為會減少。不過,也有研究指出為了滿足好奇,即便是恐怖圖片依然具有獎勵性質(zhì),可引起信息尋求行為(Oosterwijk et al.,2020)。
除了信息本身會影響信息尋求行為的價值估計外,獲得信息的可能性也是一個重要的影響因素。人們發(fā)起信息尋求行為的決定不僅取決于信息攜帶的價值,還取決于獲得信息所要付出的代價。上文提到,人們愿意為了獲得滿足好奇的信息而付出一些代價,但當代價變大時,信息尋求的可能性便有所降低(Bennett et al.,2016)。研究表明,對行為有效性的評估是影響行為選擇與執(zhí)行的一個重要因素。同樣是為了解決不確定性,當認為行為策略有效時,會表現(xiàn)出更多的探索行為(Ja?ko et al.,2015;Sankaran et al.,2017)。如果一個人不相信自己有足夠的能力獲得信息或者行為成本太高,他/她就會放棄信息尋求行為(Noordewier&van Dijk,2016;Silvia,2005)。而如果一個人在探索后沒有獲得滿足好奇動機的有效信息,那么他/她對自己獲得目標信息的信念就會降低,最終導(dǎo)致沒有動力再次啟動新的信息尋求行為(Tanaka &Murayama,2014)。同時,當他/她通過探索獲得有效信息并轉(zhuǎn)化成知識時,伴隨知識獲得,他/她的主觀能力和技能也在提高。因此,知識和主觀能力隨著時間的推移會共同發(fā)展,二者在我們的學(xué)習(xí)系統(tǒng)中可能無法區(qū)分。
2.2.2 多巴胺在好奇驅(qū)動的強化學(xué)習(xí)中的作用
除了ACC,DA 系統(tǒng)被認為在動機和認知控制之間的相互作用中發(fā)揮關(guān)鍵作用(Ballard et al.,2011;Berke,2018;Bromberg-Martin et al.,2010)。從SN/VTA 發(fā)出的DAN 投射向不同的腦區(qū),并且表現(xiàn)出一些功能上的差異(圖1c)。主要從VTA 和SN 腹中側(cè)發(fā)出,投射向NAcc 和ACC 的DAN,對強化物的效價進行反應(yīng);而主要從SN 背外側(cè)發(fā)出,投射向PFC 的DAN,則對強化物的突顯程度進行反應(yīng)(Dayan &Niv,2008;Matsumoto &Hikosaka,2009;Ott &Nieder,2019)。因此,有研究者認為與效價有關(guān)的DA 主要被用來更新價值表征,實現(xiàn)RL;而與突顯性有關(guān)的DA 則預(yù)示著刺激需要獲得的注意量,參與調(diào)節(jié)認知控制(Ott&Nieder,2019;Sutton &Barto,2018)。
Schultz 等人(1997)最先提出DA 在RL 中有重要作用。Schultz 認為DAN 的放電活動反映的是實際獲得獎勵和預(yù)期獎勵之差,即獎勵預(yù)測偏差(reward prediction error,RPE),而不是反映獎勵本身的大小。研究發(fā)現(xiàn),DAN 的反應(yīng)會隨著學(xué)習(xí)的展開而發(fā)生變化,RPE 也隨之快速變化,這使得RPE 信號可用于實時更新當前狀態(tài)和潛在行為結(jié)果的價值表征,進而影響后續(xù)的行為決策(Berke,2018;Dayan &Niv,2008;Hamid et al.,2016)。
關(guān)于好奇會激活中腦DA 系統(tǒng)的證據(jù)有很多。幾項功能磁共振成像研究報道了在好奇誘發(fā)后的預(yù)期形成階段(滿足好奇的信息呈現(xiàn)之前的等待階段),紋狀體區(qū)域(striatum)的活動有所增強,這些區(qū)域的激活受到SN/VTA 釋放的DA 的影響(Gruber et al.,2014;Kang et al.,2009;Lau et al.,2020;Oosterwijk et al.,2020)。在冷知識問題任務(wù)中,高好奇的冷知識問題會引起更強的中腦DAN活動(Gruber et al.,2014;Kang et al.,2009)。而另一項與好奇相關(guān)的研究顯示,當可能獲得的未來信息更為有利時,被試對這些信息的渴望越強,SN/VTA 和VS 的激活也更強(Charpentier et al.,2018)??梢?雖然與一級獎勵(水或食物等)不同,信息是一種間接的獎勵,但DA 對它們的反應(yīng)卻是類似的。說明DA 反映的是獎勵背后更為抽象的東西,比如獎勵物提供的價值(Berke,2018;Matsumoto &Hikosaka,2009)。也就是說,對于皮層下的獎勵結(jié)構(gòu)來說,信息的價值與其他事物的價值并無本質(zhì)區(qū)別。
另外,DA 還參與了另外一個重要的過程——認知控制(Ott &Nieder,2019;Sutton &Barto,2018)。Ott 和Nieder (2019)總結(jié)了DA 在認知控制中的三個主要作用:(1)控制感覺輸入,使得與潛在行為相關(guān)的刺激得到加工;(2)維持和操縱工作記憶內(nèi)容;(3)將這些信息傳遞到準備行為反應(yīng)的運動前區(qū)。一些研究者認為,動機和認知控制之間的相互作用與從VTA 到LPFC 的DAN 投射有關(guān)。例如,研究發(fā)現(xiàn),LPFC 中的DA 水平與認知控制和注意有關(guān)(Anderson,2016;Durstewitz &Seamans,2008)。不過,也有證據(jù)顯示,LPFC 通過影響 VTA 對預(yù)期獎勵的活動來啟動動機行為(Ballard et al.,2011)。即,認為LPFC 通過影響ACC 和VTA 來形成動機性的認知控制。Hippmann等人(2021)的動態(tài)因果模型(dynamic causal modeling)分析更支持前一種觀點。研究中,當對控制的需求較高時,VTA 對PFC 產(chǎn)生因果性影響。想要確定DA 如何參與認知控制,仍需要更多證據(jù)加以證實。另外,雖然好奇驅(qū)動的信息尋求行為也需要認知控制的參與,需要DA 的投入,但尚無以好奇為背景的相關(guān)研究。
2.2.3 好奇對學(xué)習(xí)與記憶的促進
在驅(qū)動信息尋求之外,好奇最重要的一個作用是能促進個體的學(xué)習(xí)和記憶。長期來看,特質(zhì)性好奇與學(xué)業(yè)成就之間有顯著的正相關(guān),這個關(guān)系適用于從學(xué)前到青年的所有階段(Froiland et al.,2015;Shah et al.,2018;Tucker-Drob et al.,2016;Oudeyer et al.,2016)。就狀態(tài)好奇而言,與高好奇相關(guān)的信息在實驗后的一天和至少兩周內(nèi)仍能被更好地記住(Gruber et al.,2014;Kang et al.,2009;Marvin &Shohamy,2016)??梢?好奇引起的記憶增強不會在短時間內(nèi)消退。并且,好奇的這一記憶增強效應(yīng)對兒童、青少年、年輕人和老年人都適用(Fastrich et al.,2018;McGillivray et al.,2015)。此外,好奇狀態(tài)除了對滿足好奇的目標信息有增強效果,對該狀態(tài)下遇到的其它偶然性信息也有增強效果。Gruber 等人(2014)以成年人為被試,在冷知識問題后的答案預(yù)期階段(尤其是該階段的早期)插入中性面孔,高好奇被試對這些偶然出現(xiàn)的面孔也會表現(xiàn)出更好的記憶效果。兒童和青少年也會表現(xiàn)出對好奇狀態(tài)下非目標信息的記憶增強(Fandakova1 &Gruber,2021)。
好奇為什么能夠促進學(xué)習(xí)與記憶?這可能與海馬的活動增強有關(guān)。Gruber 和Ranganath (2019)的PACE 模型認為好奇通過刺激DAN 增強了海馬依賴的記憶編碼和記憶鞏固。海馬是學(xué)習(xí)、記憶發(fā)生的關(guān)鍵腦區(qū),海馬中的LTP 過程是記憶鞏固的關(guān)鍵步驟。研究者在動物研究中發(fā)現(xiàn),暴露于新環(huán)境有利于LTP 的增強,而該過程是由DA 和NE 系統(tǒng)介導(dǎo)的(Li et al.,2003;Li et al.,2013)。另外,NE(Straube et al.,2003)和DA 活動(Moncada &Viola,2007;Lisman et al.,2011)還促進了從早期LTP 到持續(xù)LTP 的過渡。
該過程在人類研究中也得到了證實。有關(guān)外部動機和記憶關(guān)系的文獻表明,動機狀態(tài)本身可以促進學(xué)習(xí)和記憶(Shohamy &Adcock,2010)。因為,NAcc 和SN/VTA 復(fù)合體與海馬構(gòu)成了一個功能性回路(Lisman &Grace,2005)。研究者看到,在預(yù)示高獎勵(外部獎勵,如金錢)的線索出現(xiàn)時,NAcc 和SN/VTA 以及海馬的激活都增加了,對相關(guān)事件的記憶也得到了增強(Lisman &Grace,2005;Lisman et al.,2011;Shohamy &Adcock,2010)。高獎勵條件下SN/VTA 和海馬功能聯(lián)結(jié)的增強,不僅發(fā)生在記憶編碼階段(Murty &Adcock,2014;Wolosin et al.,2012),還發(fā)生在學(xué)習(xí)后的記憶鞏固階段(Gruber et al.,2016)。Gruber 等人(2016)發(fā)現(xiàn),在學(xué)習(xí)后的休息期間,高獎勵情境對應(yīng)的海馬表征會優(yōu)先被再次激活,這意味著在高獎勵情境中學(xué)習(xí)的項目會優(yōu)先得到鞏固。
以上是外部動機強化學(xué)習(xí)的作用機制,好奇作為內(nèi)部動機的作用機制與其相似,只不過獎勵換成了信息本身。研究發(fā)現(xiàn),呈現(xiàn)高好奇問題和低好奇問題時右側(cè)海馬體和雙側(cè)NAcc 的激活差異預(yù)測了高好奇問題答案和低好奇問題答案的記憶差別(Gruber et al.,2014)。而答案呈現(xiàn)時這些腦區(qū)的活動卻不能對好奇相關(guān)信息的記憶進行預(yù)測。這一結(jié)果表明在高好奇狀態(tài)下,對未來信息產(chǎn)生預(yù)期時分泌的DA 刺激了NAcc 和海馬,進而促進了對即將到來信息的學(xué)習(xí)。研究還發(fā)現(xiàn)如果學(xué)習(xí)是被好奇驅(qū)動的,額外再附加外部動機是不必要且無效的。這也是為什么在一些情況下,其它外部獎勵反而會降低好奇帶來的促進作用(Murayama et al.,2010)。
除了SN/VTA-海馬功能聯(lián)結(jié)能增強學(xué)習(xí)過程,好奇還會通過影響學(xué)習(xí)過程中的注意促進學(xué)習(xí)。研究表明,DA 會引導(dǎo)個體對指向過去或未來獎勵的刺激產(chǎn)生即時的注意偏向(Anderson,2016)。一項眼動研究發(fā)現(xiàn)在好奇情境中出現(xiàn)了類似的注意偏向,高好奇狀態(tài)下,被試對即將呈現(xiàn)冷知識問題答案的位置會投以更多關(guān)注,即產(chǎn)生預(yù)期注視(Baranes et al.,2015)。而高好奇對注意力的改變與注意網(wǎng)絡(luò)的激活有關(guān),好奇或者說好奇引起的DAN 的活動改變了額葉和頂葉區(qū)域(與注意有關(guān))的激活狀態(tài)(Jepma et al.,2012)。
另一個與學(xué)習(xí)增強有關(guān)的系統(tǒng)是NE 系統(tǒng)。瞳孔大小的改變反映了NE 系統(tǒng)的活動情況,而對好奇對象的瞳孔擴大程度可以正向預(yù)測學(xué)習(xí)效率(Nassar et al.,2012)。另外,LC 活動與個體的情緒喚起狀態(tài)有關(guān),它對調(diào)節(jié)海馬功能、影響學(xué)習(xí)過程也有作用(Mather et al.,2016;Sakaki et al.,2014)。
總之,好奇狀態(tài)下,在DA 和NE 系統(tǒng)的影響下,海馬的活動性增加,這不僅幫助人們記住了他們感到好奇的事情,還幫助他們記住了該狀態(tài)下(好奇發(fā)生后)出現(xiàn)的其它信息。
在日常生活中個體采取的每一個行動都有其潛在的結(jié)果,要么是積極的,要么是消極的。這些結(jié)果在很大程度上塑造了我們未來的行為,并激發(fā)出個體為獲得積極結(jié)果而做出決定的動機。好奇驅(qū)動的信息尋求行為也是如此,需要一個積極的結(jié)果——好奇滿足,作為反饋以鞏固這些行為和動機。好奇滿足才能使好奇動機驅(qū)動的RL 得以完成。
在廣義的RL 模型中,智能體(agent)的學(xué)習(xí)過程極度依賴其自身經(jīng)歷(圖2a)。智能體發(fā)出一個動作作用于環(huán)境,環(huán)境狀態(tài)發(fā)生改變的同時,產(chǎn)生了一個強化信號(獎勵或懲罰)反饋給智能體,智能體根據(jù)當前的環(huán)境狀態(tài)和反饋的強化信號決定下一個動作的發(fā)出策略,原則是使獎勵最大化。選擇的動作又會影響下一時刻的狀態(tài)和強化信號,如此往復(fù)(Sutton &Barto,2018)。按照Gershman 和Uchida (2019)的解讀,生物體的RL是貝葉斯式的,涉及三個關(guān)鍵成分: 狀態(tài)(state)、價值(value)和策略(policy)。首先,狀態(tài)指生物體當前占有的環(huán)境狀態(tài),如時間、地點、面對的對象等。從感知角度講“生物體并不能獲得當前所處狀態(tài)的完整信息,而是只能接收感官數(shù)據(jù)提供的關(guān)于當前狀態(tài)的模糊信息?!鄙矬w實際獲得的是基于貝葉斯規(guī)則得到的信念狀態(tài)(belief state),即利用感官數(shù)據(jù)的概率分布(P(x))、潛在真實狀態(tài)的先驗概率(P(s))以及似然估計值(真實環(huán)境狀態(tài)中得到當前感官數(shù)據(jù)的條件概率P(x|s))計算得到的后驗概率(P(s|x)),是對過去所有觀察歷史的最優(yōu)估計。其次,價值是根據(jù)當前狀態(tài)計算出來的未來獎勵預(yù)期。事實上,信念狀態(tài)才是獎勵預(yù)測的關(guān)鍵自變量,也就是說價值是一個關(guān)于信念狀態(tài)的函數(shù)。“關(guān)于獎勵獲得的價值函數(shù)的參數(shù)是通過感受不同狀態(tài)下的獎勵經(jīng)驗逐漸確定的”(圖2b)。第三,策略是在當前狀態(tài)下采取何種行動的決定?!按嬖谝粋€從狀態(tài)到策略的映射,該映射受到習(xí)得價值的調(diào)節(jié)。”由于最優(yōu)策略通常是未知的,生物體必須在“利用”獎勵確定的行為和“探索”可能有更好獎勵的行為之間進行權(quán)衡。Gershman 和Uchida (2019)認為“這三種不同形式的不確定性(與狀態(tài)、價值和策略相關(guān))在DA 的調(diào)節(jié)和被調(diào)節(jié)中扮演著核心角色?!痹谪惾~斯RL 框架下,“狀態(tài)不確定性通過信念狀態(tài)的概率分布影響DA 系統(tǒng)”,信念狀態(tài)的計算可能發(fā)生在內(nèi)側(cè)前額葉(medial prefrontal cortex,MPFC)?!皟r值不確定性通過價值函數(shù)參數(shù)的概率分布影響DA 系統(tǒng),DA 通過報告RPE 又反過來推動價值函數(shù)參數(shù)的更新”。價值函數(shù)形成主要涉及的腦區(qū)是紋狀體。一篇關(guān)于RL 的元分析研究也指出,VS 是參與眾多RL 的關(guān)鍵皮層下結(jié)構(gòu)(Garrison et al.,2013)。最后,“策略不確定性通過生物體行為的概率分布影響DA 系統(tǒng)”。單核苷酸多態(tài)性研究發(fā)現(xiàn),兩個調(diào)控DA 水平的蛋白質(zhì)COMT 和DARPP-32 參與了定向探索和隨機探索(Frank et al.,2009;Humphries et al.,2012)。貝葉斯RL 框架極大地豐富了傳統(tǒng)RPE 對DA 的解釋。
圖2 強化學(xué)習(xí)模型。(a)廣義的強化學(xué)習(xí)過程。智能體發(fā)出動作改變環(huán)境,環(huán)境一方面改變了對智能體的狀態(tài)輸入,一方面給智能體提供一個強化信號(獎勵或懲罰),影響智能體接下來的動作。如此循環(huán),在獎勵最大化的原則下不斷調(diào)整智能體的行動策略。(b)貝葉斯框架下的強化學(xué)習(xí)(此圖參考Gershman &Uchida,2019)。由于不確定性的存在,生物體實際獲得的是基于貝葉斯規(guī)則得到的信念狀態(tài),即利用感官數(shù)據(jù)的概率分布(P(x))、潛在真實狀態(tài)的先驗概率(P(s))以及似然估計值(真實環(huán)境狀態(tài)中得到當前感官數(shù)據(jù)的條件概率(P(x|s))計算得到的后驗概率(P(s|x))?;谛拍顮顟B(tài)形成的關(guān)于未來獎勵的價值函數(shù)在RPE 的變化中不斷調(diào)整函數(shù)的參數(shù)。
該模型同樣適用于從好奇發(fā)生到好奇滿足的RL 過程。以與目標信息的距離為例,個體感知到的與目標信息的距離,即信念狀態(tài),是基于當前掌握信息和過往經(jīng)驗形成的估計,并不完全等同于當前環(huán)境與目標信息的真實距離。該估計值決定著目標信息預(yù)期價值。個體感知的與目標信息的距離隨著信息尋求的展開不斷變化,目標信息的預(yù)期價值也隨之動態(tài)改變。當實際獲得的信息價值高于其預(yù)期價值,即RPE 為正時,預(yù)示著可以對行為的預(yù)期價值進行上調(diào),從而增加后續(xù)好奇發(fā)生和信息尋求的可能性。Litman 等人(2005)就發(fā)現(xiàn),越是接近答案(feeling of knowing)被試就越是好奇,VS 激活也越強。
Jepma 等人(2012)的知覺好奇和Ligneul 等人(2018)的知識好奇研究都表明,在好奇滿足階段(分別對應(yīng)圖片模糊性消除和冷知識問題解答)VS會產(chǎn)生更強的神經(jīng)活動。這一結(jié)果與Gruber 等人(2014)發(fā)現(xiàn)的答案預(yù)期階段而非好奇滿足階段出現(xiàn)紋狀體激活相矛盾。之所以出現(xiàn)這樣的差異,與不同研究間的任務(wù)設(shè)計差異有關(guān)(Gruber et al.,2019)。Jepma 等人(2012)和Ligneul 等人(2018)的研究中,滿足好奇的信息并不一定每次都出現(xiàn),由于常常得不到滿足,對目標信息的預(yù)期價值估計就會降低,而當意外獲得目標信息時,就會出現(xiàn)一個明顯正向的RPE。而Gruber 等人(2014)的冷知識問題的答案總是會出現(xiàn),加上冷知識問題本身比較枯燥,使得冷知識問題答案提供的實際價值和答案的預(yù)期價值都比較穩(wěn)定,導(dǎo)致答案呈現(xiàn)時的RPE 不會有太大的變化,而這可能會削弱好奇動機。
可見,對于信息尋求行為的強化來說,簡單的好奇滿足可能還不夠,超出預(yù)期價值的信息也很重要。Marvin 和Shohamy (2016)用“信息預(yù)測偏差”(information prediction errors)表示新信息的實際回報價值與新信息的期望回報價值之差。如果獲得的信息是意外的,則信息預(yù)測偏差為正,個體會調(diào)高未來新信息的預(yù)期回報價值。有研究表明,當新知識與期望不一致時,信息尋求行為會增加(Vogl et al.,2019)。另一方面,如果新信息沒有超出預(yù)期,人們往往感到失望,信息價值會被調(diào)低。
前文提到,一些研究者認為信息缺口引起厭惡情緒,即好奇發(fā)生伴隨著一個負性情緒(Berlyne,1957;Loewenstein,1994)。也有一些研究者認為好奇可能伴隨著積極的情緒(Grossnickle,2016;Litman,2008)。這種理解上的差異很可能是因為研究者們關(guān)注的不是同一個情緒過程。當以過程觀看待好奇的發(fā)生發(fā)展時,就會發(fā)現(xiàn)不同階段引發(fā)的情緒是在不斷變化的。好奇發(fā)生時產(chǎn)生情緒,好奇滿足后也會伴隨情緒。在好奇滿足階段,可能會產(chǎn)生諸如愉悅(好奇滿足)、吃驚(目標信息價值超出預(yù)期)、失望(目標信息價值達不到預(yù)期)、無助(信息尋求失敗)等情緒(di Leo et al.,2019;Vogl et al.,2019)。由于研究中對好奇的界定不清晰,情緒評估的階段不統(tǒng)一,才會出現(xiàn)對好奇情緒認識的分歧。
至此,好奇的反饋循環(huán)還未真正結(jié)束。目標信息獲得后,還需要對它進行進一步的加工。如果它最終被納入原有的知識結(jié)構(gòu),就會更新先驗知識庫。信息缺口的形成,直接源于當前信息和先驗知識的差距。而先驗知識庫的更新,會更容易產(chǎn)生新問題、形成新的信息缺口,誘發(fā)出新的好奇,進而啟動新一輪的循環(huán)。Lydon-Staley 等人(2021)發(fā)現(xiàn)高剝奪型好奇者構(gòu)建的知識網(wǎng)絡(luò)更加緊密,在信息尋求中會更多的返回之前查看過的主題信息。
Murayama (2019)總結(jié)了知識獲得促進進一步信息尋求的三條路徑: 首先,如上所述,知識獲得使個體更能意識到先前意識不到的“信息缺口”。這是因為擴充的知識網(wǎng)絡(luò)使更多的知識擴展空間顯露了出來(Loewenstein,1994)。意識到知識缺口就能促進好奇發(fā)生并進一步引導(dǎo)知識獲取行為。其次,獲得信息的獎勵感會增加新信息的預(yù)期獎勵價值,累積的知識還會讓個體意識到相關(guān)主題的重要性,這都會讓個體在評估階段給新信息賦予更高的價值。最后,除了主題相關(guān)信息的價值會被上調(diào)外,個體對獲取信息的能力感知也會提高,從而增加對信息尋求行為的價值估計。
不過,在知識獲得后,無論在實驗研究還是在真實學(xué)習(xí)情境中,都可能出現(xiàn)對新信息缺口感知的鈍化。即個體沒能發(fā)現(xiàn)更多的信息缺口,甚至終止學(xué)習(xí)任務(wù),因為他們主觀上覺得自己已經(jīng)對該主題有了完全的了解。實驗中出現(xiàn)這種情況多半是因為誘發(fā)材料(如冷知識)通常與先驗知識沒有太多關(guān)聯(lián),實用性太低,在答案獲取過程中容易引起被試的饜足情緒(Marvin &Shohamy,2016;Murayama et al.,2019)。真實學(xué)習(xí)環(huán)境中的問題往往是,學(xué)生常常錯誤地認為自己已經(jīng)掌握學(xué)習(xí)內(nèi)容,但實際上并沒有。如前文所述,個體的感知狀態(tài)和真實狀態(tài)之間是有差距的(Gershman&Uchida,2019)。相關(guān)研究表明,學(xué)習(xí)者對自己掌握的學(xué)習(xí)材料的判斷常是不準確且過度樂觀的,他們經(jīng)常過早地終止了自己的學(xué)習(xí)行為(Murayama et al.,2016)。
總的來說,知識的獲取與整合會增強未來的好奇動機,驅(qū)動更多的信息尋求行為,進而使知識獲取過程具有可持續(xù)性。在獎勵系統(tǒng)的作用下,從好奇發(fā)生到好奇滿足,到真正的信息整合,再回到新一輪的好奇發(fā)生,形成了一個正反饋循環(huán)。而穩(wěn)定的好奇特質(zhì)正是這種短暫好奇體驗重復(fù)發(fā)生并最終固化的結(jié)果(Fayn et al.,2019;Lydon-Staley et al.,2021)。
好奇反饋循環(huán)模型中從好奇發(fā)生到好奇滿足,展現(xiàn)的是短暫性的好奇變化發(fā)展的一個小循環(huán)。事實上,好奇的變化發(fā)展嵌入在一個更大的動態(tài)過程,即個體的出生、成長和衰老中。
大量研究表明,嬰幼兒會通過系統(tǒng)性地探索環(huán)境以減少不確定性并填補信息缺口,可見在好奇的發(fā)生和表現(xiàn)上嬰幼兒與成人并無顯著區(qū)別(Begus et al.,2016;Leckey et al.,2020)。
但引發(fā)好奇的刺激和好奇產(chǎn)生的影響會隨年齡的增長而變化。引起不同年齡個體好奇的事物是不同的,嬰兒喜歡探索視覺上更新奇的物體,而年幼的兒童更喜歡探索功能上不清楚的事物(Kidd &Hayden,2015;Schulz,2012)。2021 年,Fandakova 和 Gruber 用冷知識范式,研究了在10~14 歲被試中,好奇是如何影響記憶的。結(jié)果發(fā)現(xiàn),個體越是好奇,對知識的記憶也就越好。而相比于10~12 歲的兒童,12~14 歲的青少年對冷知識答案表現(xiàn)出更好的記憶力,這一結(jié)果很大程度上與青少年對目標信息的價值預(yù)期有關(guān),他們覺得冷知識問題比預(yù)期的更有趣(Fandakova &Gruber,2021)。也有可能是因為青少年的先驗知識更多,更容易與新信息建立聯(lián)結(jié)。
好奇的這些年齡特點可能與腦的發(fā)育有關(guān)。與沖突監(jiān)測相關(guān)的ACC 在好奇發(fā)生中扮演著重要角色,從嬰兒到青春期,ACC 都在持續(xù)的發(fā)育成熟。具體表現(xiàn)有,與認知沖突監(jiān)測和處理相關(guān)的腦電成分——錯誤相關(guān)負波(ERN)的振幅在成年之前一直都在隨著年齡的增長而增加。Fandakova等人(2018)還發(fā)現(xiàn),12 歲的兒童在面對不確定性的記憶信息時會激活A(yù)CC 和AIC。但只有10~12歲的孩子會在報告不確定性時激活LPFC。進一步分析表明,10 歲時與認知沖突相關(guān)的腦區(qū)激活更強的孩子(尤其是AIC),在1.5 年后的不確定性評估中 PFC 的激活會更大。據(jù)此,Gruber 和Fandakova(2021)假設(shè),隨著年齡的增長,個體不斷經(jīng)歷各種認知沖突導(dǎo)致的信息缺口,基于ACC的沖突處理能力不斷提高,而ACC 激活上的差異,進一步導(dǎo)致基于PFC 的評估系統(tǒng)差異化地發(fā)展,最終使兒童和青少年表現(xiàn)出差異化的好奇和好奇驅(qū)動的探索行為。另一項縱向研究結(jié)果也顯示,7~15 歲兒童PFC 的結(jié)構(gòu)變化與評估過程的發(fā)展有關(guān)(Fandakova et al.,2017)。Fandakova 等人(2017,2018,2021)傾向于將LPFC 理解為評估系統(tǒng),但在EVC 框架中LPFC 更多體現(xiàn)的是控制的執(zhí)行(Shenhav et al.,2016)。就好奇相關(guān)研究來說,兩種觀點似乎都可以解釋現(xiàn)有的研究結(jié)果,至于哪一種更合理仍需進一步探討。另外,PFC 是一個比較模糊的腦區(qū)定位,它涉及很多亞區(qū),不同亞區(qū)在功能上也是存在差異的(Reverberi,Lavaroni,et al.,2005),有必要對其進行更細致的區(qū)分。
總的來說,年幼兒童更依賴于ACC 和AI 的功能,對簡單的信息預(yù)測偏差產(chǎn)生反應(yīng),從而表現(xiàn)出不加區(qū)分的高好奇。隨著額葉系統(tǒng)的成熟,LPFC 開始對包括信息預(yù)測偏差及以外的其它相關(guān)因素進行綜合評估(Fandakova et al.,2017,2018;Fandakova &Gruber,2021),又或者具有更強的控制能力使注意能聚焦于當前任務(wù)(Reverberi,Toraldo,et al.,2005;Shimamura,2000)。這都可能是年齡較小的孩子對不同領(lǐng)域表現(xiàn)出廣泛的興趣,而年齡較大的孩子的興趣領(lǐng)域開始減少和分化的原因(Frenzel et al.,2012)。一旦好奇被誘發(fā),LPFC 還會通過刺激中腦邊緣系統(tǒng)多巴胺能通路來調(diào)節(jié)海馬依賴的學(xué)習(xí)(Gruber et al.,2014;Lau et al.,2020)??赡苷前l(fā)展了的PFC 與海馬依賴性學(xué)習(xí)的多巴胺能神經(jīng)調(diào)節(jié)之間的交互作用,讓我們看到上文提到的現(xiàn)象,即信息預(yù)測偏差引發(fā)的好奇對青少年的記憶增強作用要強于兒童(Fandakova &Gruber,2021)。
好奇除了會隨年齡增長表現(xiàn)出不斷的分化外,還會隨著個體的衰老而出現(xiàn)衰退。大量調(diào)查研究發(fā)現(xiàn),從成年早期到成年晚期,個體的知識好奇、人際好奇和自我好奇等都會隨年齡的增長而下降(Robinson et al.,2017)。與好奇相關(guān)的開放性(openness to experience;Costa et al.,2000;Ziegler et al.,2015)、感覺尋求(sensation seeking;Giambra et al.,1992)、探索行為(exploratory behaviors;Kashdan et al.,2009;Kashdan et al.,2004)都表現(xiàn)出相應(yīng)的降低。
好奇及其相關(guān)行為的衰退主要與兩個系統(tǒng)——DA系統(tǒng)和NE 系統(tǒng)的退化有關(guān)。DA 系統(tǒng)和NE 系統(tǒng)很容易受到衰老的影響。老年人大腦中這些對好奇至關(guān)重要的腦區(qū)的功能削弱和結(jié)構(gòu)受損,可能是導(dǎo)致前面提到的主觀好奇及其相關(guān)行為下降的一個重要原因(Chowdhury et al.,2013;Eppinger et al.,2013;Sakaki et al.,2018)。
不過,也正因為好奇能激活上述兩個系統(tǒng),使好奇成為抗衰老的一劑保護劑。海馬會隨著年齡增長出現(xiàn)功能障礙(Mitchell et al.,2000;Raz et al.,2010),而好奇可以通過DA 系統(tǒng)和NE 系統(tǒng)刺激海馬,以減緩記憶功能的退化(Lisman &Grace,2005)。短暫的好奇激發(fā),或形成長期的好奇特質(zhì)對衰老有很好的抵抗作用。一項縱向研究發(fā)現(xiàn),保持好奇可以讓個體終身受益,尤其是在影響海馬促進記憶上(Martin et al.,2007)。除了記憶保護,好奇對其它認知功能也有改善作用,這可能與DA 系統(tǒng)和NE 系統(tǒng)對PFC 的刺激有關(guān)(Sakaki et al.,2018)。
綜上所述,好奇的反饋循環(huán)模型從動態(tài)過程的視角看待好奇的發(fā)生發(fā)展,把一次好奇事件分解成以下6 個過程,即: 感知信息缺口、好奇發(fā)生、控制的價值評估、信息尋求、好奇滿足、信息整合。作為一個動態(tài)變化的過程,以上每一個環(huán)節(jié)都會受到當前信息輸入和上一環(huán)節(jié)反饋輸出的影響。模型確立了好奇的內(nèi)部動機本質(zhì),將好奇誘發(fā)的情緒和行為分離出來,具體分析了每個階段發(fā)生的條件、過程及影響。該模型以RL 模型為原型,區(qū)別在于好奇情境中最重要的強化物是滿足好奇的信息本身,而非其它外部獎勵。因此,在好奇反饋循環(huán)中,不斷地誘發(fā)、滿足好奇,并獲得超出預(yù)期的目標信息才是可持續(xù)性知識獲取的關(guān)鍵。
另外,好奇的這種動態(tài)循環(huán)嵌入在個體的終生發(fā)展過程中,一方面它受到生命發(fā)展中各種生理性變化的影響和限制;但另一方面,好奇循環(huán)的反復(fù)鞏固也會引起生理上的變化,這種改變又反過來影響我們的生命進程??偟膩碇v,好奇相關(guān)的兩個系統(tǒng)——DA 系統(tǒng)和NE 系統(tǒng)——對短期的注意、記憶和信息尋求行為有促進作用,對長期的認知功能維持與改善也大有益處。然而,即便好奇對從出生到年老的個體發(fā)展意義重大,但對好奇發(fā)展的特點及其背后的神經(jīng)生理機制研究才剛剛起步,我們?nèi)孕枰嗟难芯繑?shù)據(jù)才能對其形成一個更完整的認知。
好奇研究越來越具有跨學(xué)科性和多領(lǐng)域交叉性,這就需要有一個統(tǒng)一的概念和框架作為進一步科學(xué)討論的基礎(chǔ)。關(guān)于未來好奇的研究,可以加強對以下幾個方面的關(guān)注。
以往研究更多關(guān)心好奇誘發(fā)所帶來的各種好處,卻忽視了好奇滿足才是這些好處存在的關(guān)鍵。事實上,好奇得不到滿足才是日常生活中的常態(tài),它往往會帶來一系列負性影響。例如,有研究發(fā)現(xiàn),知識好奇不被滿足帶來的認知空虛會使個體產(chǎn)生更多的非理性消費,個體會用物質(zhì)滿足替代知識滿足(Wiggin et al.,2019)。因此,后續(xù)研究有必要對好奇滿足予以更多的關(guān)注。
關(guān)于好奇的研究,一類是把好奇作為穩(wěn)定特質(zhì)的調(diào)查研究,另一類是針對短暫的好奇狀態(tài)的實驗研究。短暫的好奇狀態(tài)的研究常用的研究范式包括引發(fā)知覺好奇的模糊圖片范式(Jepma et al.,2012;Wiggin et al.,2019)和引發(fā)知識好奇的冷知識問題范式(Kang et al.,2009;Ligneul et al.,2018;Marvin &Shohamy,2016)。魔術(shù)(Lau et al.,2020)或抽獎任務(wù)范式(Kobayashi &Hsu,2019;van Lieshout,de Lange,et al.,2021,van Lieshout,Traast,et al.,2021)也常被用于誘發(fā)好奇,但在誘發(fā)的好奇類型上較為模糊。
這些好奇研究范式在解決一些特定問題上是存在局限的。例如,(1)好奇滿足信息要么直接呈現(xiàn),要么用代價(等待時間、代幣或經(jīng)歷厭惡刺激)換取,無法反映被試的主動信息尋求行為。(2)各范式基本都會呈現(xiàn)答案,因此在試次間形成了對好奇滿足的穩(wěn)定期待;即便關(guān)注好奇滿足,也只是在試次間(有些試次滿足好奇,有些試次不滿足好奇)進行比較,無法得知持續(xù)的好奇不滿足會對被試造成什么樣的影響。(3)誘發(fā)好奇的材料缺乏生態(tài)效度和實用價值,冷知識問題往往因其不成體系難以被整合。學(xué)習(xí)一個簡短的、獨立的冷知識問題的答案可能不足以激發(fā)人們進一步探索這個話題的興趣。因此,這類范式很難探知知識積累對主題價值感知的影響。(4)當前研究范式更關(guān)注那些短暫好奇對信息尋求的影響(好奇滿足信息在幾秒鐘后就呈現(xiàn)),雖然有利于刻畫信息尋求的微觀機制,但對整個知識獲取過程缺乏整體把握。因此,未來有必要對好奇的研究范式進行充實和改進,以便對更現(xiàn)實、具體的好奇問題進行探討。
好奇誘發(fā)的學(xué)習(xí)和外部獎勵(extrinsic rewards)誘發(fā)的學(xué)習(xí)本質(zhì)上都是基于獎勵的學(xué)習(xí),二者的區(qū)別在于好奇是內(nèi)部動機,滿足好奇的信息是內(nèi)部獎勵(intrinsic rewards)。很多針對好奇的研究,往往在研究過程中既包含外部獎勵,又包含內(nèi)部獎勵,混淆的變量會影響對好奇的理解和解釋。
更重要的是,缺乏對內(nèi)部動機和外部動機驅(qū)動的學(xué)習(xí)過程的比較研究。從 Festinger 和Carlsmith (1959)提出認知失調(diào)后,研究者們就意識到了外部獎勵不足時,人們會自己生成獎勵以使行為合理化。之后,研究者們陸續(xù)發(fā)現(xiàn),外部動機有時會削弱內(nèi)部動機,從而減少個體對任務(wù)的投入(Deci et al.,1999;Eisenberger et al.,1999)。這提示教育者必須非常小心地使用外部獎勵,避免適得其反。因此,后續(xù)研究有必要對內(nèi)部獎勵、外部獎勵的編碼過程、使用時機和使用情境進行探討,盡量保證學(xué)習(xí)過程是一個自我驅(qū)動的自增長過程。
從狀態(tài)到特質(zhì),從動物到人,從嬰兒到老年,好奇都有其重要的生存意義。但在對好奇的研究中,大多數(shù)研究者關(guān)心的只是它對青少年及成人的認知促進,忽略了它的在個體發(fā)展中的變化規(guī)律。例如,迄今為止幾乎沒有研究直接對兒童的好奇進行測量。好奇如何從小循環(huán)進入大循環(huán),在更長的時間尺度上發(fā)生發(fā)展是今后需要重視的一個課題。