李丹陽 李 鵬 李 紅
?
反饋負(fù)波及其近10年理論解釋*
李丹陽 李 鵬 李 紅
(深圳大學(xué)心理與社會(huì)學(xué)院, 深圳 518060)
個(gè)體決策后的反饋對(duì)隨后的結(jié)果監(jiān)控和行為調(diào)整起著至關(guān)重要的作用。事件相關(guān)腦電位研究發(fā)現(xiàn), 反饋負(fù)波(feedback-related negativity, FRN)是與決策后反饋加工過程緊密相關(guān)的腦電成分。近10年來關(guān)于FRN的理論解釋, 在最初經(jīng)典的強(qiáng)化學(xué)習(xí)理論和情緒動(dòng)機(jī)假說的基礎(chǔ)上又提出了反應(yīng)?結(jié)果的預(yù)測(cè)模型、獎(jiǎng)賞正波理論以及積極情緒啟動(dòng)模型。未來的研究應(yīng)該立足于大樣本, 采用互補(bǔ)的研究手段和多樣的分析技術(shù)來探討FRN的心理意義; 同時(shí)考慮將FRN作為獎(jiǎng)賞加工的腦電指標(biāo), 研究社會(huì)互動(dòng)情境下的人類行為。
反饋負(fù)波; 強(qiáng)化學(xué)習(xí); 前扣帶回; 獎(jiǎng)賞正波; 獎(jiǎng)賞預(yù)測(cè)誤差
決策后的反饋是指?jìng)€(gè)體做出決策行為之后所認(rèn)識(shí)到的事件或行為結(jié)果, 它不僅能夠幫助個(gè)體對(duì)行為結(jié)果進(jìn)行評(píng)估和監(jiān)察, 也能促進(jìn)個(gè)體調(diào)整和修正下一步行為(Luft, 2014)。研究者利用事件相關(guān)電位技術(shù)(event related potentials, ERPs), 記錄決策后呈現(xiàn)反饋結(jié)果時(shí)大腦皮層的腦電活動(dòng), 發(fā)現(xiàn)FRN這一腦電成分與反饋刺激的加工過程緊密相關(guān)。其中FRN指的是, 在負(fù)性反饋刺激呈現(xiàn)后的200~350 ms的時(shí)間窗口出現(xiàn)的一個(gè)相對(duì)負(fù)向偏轉(zhuǎn)的腦電波成分(Miltner, Braun, & Coles, 1997; 李鵬, 李紅, 2008), 它反映的是一種強(qiáng)化學(xué)習(xí)信號(hào), 這種信號(hào)在大腦中的傳遞能夠幫助行動(dòng)者進(jìn)行認(rèn)知上的學(xué)習(xí)和行為決策上的調(diào)整(Sch?nberg, Daw, Joel, & O’Doherty, 2007)。
反饋加工過程是一個(gè)復(fù)雜的認(rèn)知過程, 而個(gè)體對(duì)反饋的學(xué)習(xí)容易受到多方面因素的影響, 因此需要不斷探索和嘗試新的技術(shù)和方法進(jìn)行研究和解釋。當(dāng)前研究中關(guān)于FRN的分析方式主要有兩種:一種是原始波形的分析, 即計(jì)算不同類型的反饋刺激所誘發(fā)的腦電波疊加之后的平均波幅(Sambrook & Goslin, 2015); 另一種是差異波的分析, 即計(jì)算和分析正性反饋和負(fù)性反饋之間的差異波, 得到與獎(jiǎng)賞加工相關(guān)的特異性FRN成分(Holroyd & Krigolson, 2007; Bress & Hajcak, 2013)。近年來也有一些研究者通過新的方法, 比如在腦電原始波的基礎(chǔ)上利用主成分分析和獨(dú)立成分分析法排除其他成分對(duì)FRN的干擾, 得到更精確和穩(wěn)定的FRN成分。Marco-Pallares, Cucurell, Münte, Strien和Rodriguez-Fornells (2011)對(duì)于獲得有效的FRN成分所需最少的疊加次數(shù)進(jìn)行了探討, 結(jié)果發(fā)現(xiàn)在正常人群中, 健康青年被試至少需要20個(gè)試次, 而健康老年被試至少需要50個(gè)試次; 其次, 穩(wěn)定和有效的反饋負(fù)波獲得主要取決于信號(hào)記錄過程中的信噪比以及樣本特征, 例如對(duì)于認(rèn)知受損或者臨床疾病的人群來說, 由于自身認(rèn)知功能的下降等因素導(dǎo)致實(shí)驗(yàn)的信噪比較低, 可能需要更多的試次數(shù)量。
另外, 關(guān)于FRN的發(fā)生源, 不同的學(xué)者采用了不同的技術(shù)進(jìn)行研究。大部分研究通過傳統(tǒng)的偶極子溯源定位技術(shù)發(fā)現(xiàn)FRN可能產(chǎn)生于前扣帶回皮層區(qū)域(anterior cingulate cortex, ACC)。前扣帶回皮層位于前額葉區(qū)域, 與行為決策和認(rèn)知控制有關(guān), 因此這與FRN的理論解釋相符合, 即FRN成分反映了個(gè)體對(duì)于結(jié)果評(píng)價(jià)的學(xué)習(xí)和決策過程(Holroyd & Coles, 2002; Nieuwenhuis, Holroyd, Mol, & Coles, 2004; Holroyd & Yeung, 2012)。然而, 也有研究者提出了一些相反證據(jù)。例如, Foti, Weinberg, Dien和Hajack (2011) 采用主成分分析法(principle components analysis, PCA), 提出FRN的發(fā)生源可能在于紋狀體的殼核部分; 除此之外一些學(xué)者利用功能性磁共振成像與ERP技術(shù)相結(jié)合的方式, 采用獨(dú)立成分分析法(independent components analysis, ICA), 證實(shí)了FRN還與大腦的多巴胺獎(jiǎng)賞回路有關(guān):可能也存在背側(cè)和腹側(cè)紋狀體的激活(Becker, Nitsch, Miltner, & Straube, 2014)。綜上可見, 受制于ERP技術(shù)本身空間定位不精確這一缺陷, FRN的溯源定位僅供參考, 相比而言, FRN前中部的頭皮分布是一個(gè)來識(shí)別FRN成分的更加穩(wěn)定的特質(zhì)。
從Miltner等人(1997)首次報(bào)告FRN這一腦電成分以來, 早期關(guān)于FRN的理論解釋主要有兩種競(jìng)爭(zhēng)性理論:強(qiáng)化學(xué)習(xí)理論和情緒動(dòng)機(jī)假說。前者認(rèn)為, FRN反映了對(duì)于獎(jiǎng)賞預(yù)期錯(cuò)誤的認(rèn)知加工過程; 后者則認(rèn)為其反映了反饋刺激所帶來的情緒、動(dòng)機(jī)意義的評(píng)價(jià)過程(李鵬, 李紅, 2008)。在最近10年左右的研究中, 關(guān)于FRN的理論解釋又有了新發(fā)展和進(jìn)步。本文將在2008年李鵬和李紅《反饋負(fù)波及其理論解釋》這一綜述的基礎(chǔ)上, 簡(jiǎn)述強(qiáng)化學(xué)習(xí)理論和情緒動(dòng)機(jī)假說兩種早期理論的最新發(fā)展, 并重點(diǎn)介紹近幾年關(guān)于反饋負(fù)波的一些最新的理論模型的發(fā)展, 并提出一些新的研究方向。
強(qiáng)化學(xué)習(xí)理論認(rèn)為, 人們通過不斷的學(xué)習(xí)來調(diào)整行為, 從而選擇最優(yōu)化的決策。最初Holroyd和Coles (2002)采用概率獎(jiǎng)賞學(xué)習(xí)任務(wù), 即給被試呈現(xiàn)多個(gè)選項(xiàng), 每個(gè)選項(xiàng)背后代表的獎(jiǎng)賞或者懲罰的概率不同, 被試根據(jù)按鍵選擇后呈現(xiàn)的反饋結(jié)果學(xué)習(xí)刺激和反應(yīng)之間的聯(lián)結(jié), 從而調(diào)整自己的行為以期獲得更多的獎(jiǎng)賞。他們通過分析在概率學(xué)習(xí)任務(wù)中反饋刺激呈現(xiàn)后被試的腦電變化, 發(fā)現(xiàn)在長(zhǎng)時(shí)間的反饋學(xué)習(xí)過程中, 正性反饋(即金錢獎(jiǎng)賞)和負(fù)性反饋(即金錢損失)所誘發(fā)的腦電波差異主要來自于負(fù)性反饋:相較于正性反饋來 說, 負(fù)性反饋會(huì)誘發(fā)一個(gè)更加負(fù)向偏轉(zhuǎn)的腦電波(Bellebaum & Daum, 2008)。因此, 首先該理論認(rèn)為在反饋過程中人們會(huì)在行為?結(jié)果之間形成一個(gè)穩(wěn)定的預(yù)測(cè), 即類似于刺激?反應(yīng)之間的聯(lián)結(jié)信號(hào), 也稱作強(qiáng)化學(xué)習(xí)信號(hào)。根據(jù)這一信號(hào)的傳遞和監(jiān)控, 行動(dòng)者不斷調(diào)整自身的行為選擇, 從而習(xí)得最優(yōu)化行為(Padrón, Fernández-Rey, Acu?a, & Pardo- Vazquez, 2016)。其次, 該理論提出FRN這一成分是對(duì)于獎(jiǎng)賞預(yù)測(cè)誤差的一種表征, 即預(yù)期獎(jiǎng)賞與實(shí)際獎(jiǎng)賞的差異(reward prediction error, RPE)的表征。具體來說, 當(dāng)呈現(xiàn)正性反饋結(jié)果即實(shí)際獎(jiǎng)賞大于預(yù)期獎(jiǎng)賞時(shí), 會(huì)誘發(fā)一個(gè)正性的獎(jiǎng)賞預(yù)測(cè)誤差(positive reward prediction error, +RPE)信號(hào), 個(gè)體根據(jù)這一反饋維持或者增加自身的行為表現(xiàn); 但是當(dāng)呈現(xiàn)負(fù)性結(jié)果即實(shí)際獎(jiǎng)賞小于預(yù)期獎(jiǎng)賞的情況時(shí), 會(huì)誘發(fā)一個(gè)負(fù)性的獎(jiǎng)賞預(yù)測(cè)誤差(negative reward prediction error, ?RPE)信號(hào), 個(gè)體根據(jù)這一反饋調(diào)整或者減少自身的行為表現(xiàn)。有研究表明負(fù)性反饋相較于正性反饋會(huì)誘發(fā)一個(gè)更加負(fù)性的獎(jiǎng)賞預(yù)測(cè)誤差信號(hào), 個(gè)體根據(jù)這一信號(hào)的傳遞做出目標(biāo)指向性行為, 從而實(shí)現(xiàn)利益最大化。這一神經(jīng)信號(hào)的加工過程主要是?RPE信號(hào)會(huì)導(dǎo)致中腦多巴胺神經(jīng)元活動(dòng)的相位下降, 繼而引發(fā)ACC神經(jīng)元的去抑制活動(dòng)增強(qiáng), 從而產(chǎn)生較大波幅的FRN (Holroyd & Coles, 2002; Maia & Frank, 2011)。
雖然該理論在一定程度上能夠很好地解釋早期反饋結(jié)果好壞維度上的二元評(píng)價(jià)(即比預(yù)期結(jié)果好, 或者比預(yù)期壞), 但是在近幾年的研究中該理論也受到了一些挑戰(zhàn)。首先, 該理論通過偶極子溯源定位分析, 認(rèn)為FRN可能產(chǎn)生于ACC。然而, 有研究采用簡(jiǎn)單賭博任務(wù)范式, 即通過給被試呈現(xiàn)兩個(gè)選項(xiàng), 例如兩個(gè)關(guān)著的門, 被試需要選擇打開其中的一扇門, 被試做出決策后程序隨機(jī)呈現(xiàn)反饋結(jié)果(贏或者輸), 在反饋呈現(xiàn)階段觀察被試的腦電變化以及大腦激活水平的變化, 通過ERP和fMRI技術(shù)的結(jié)合發(fā)現(xiàn)FRN也可能源于背側(cè)和腹側(cè)紋狀體(Carlson, Foti, Mujica-Parodi, Harmon-Jones, & Hajcak, 2011), 而這兩個(gè)區(qū)域主要與金錢獎(jiǎng)賞加工功能有關(guān)。第二, 該理論認(rèn)為, 錯(cuò)誤相關(guān)負(fù)波<①(error related negativity, ERN)和FRN反映的是一種類似的強(qiáng)化學(xué)習(xí)信號(hào), 但是很多研究都表明這兩個(gè)腦電波成分表現(xiàn)出了實(shí)驗(yàn)性分離, 二者反映了不同的認(rèn)知階段(Schulreich, 2016), 其中Gehring, Goss, Coles, Meyer和Donchin (1993)早期通過簡(jiǎn)單的按鍵反應(yīng)任務(wù)(被試進(jìn)行按鍵時(shí)就已經(jīng)知道反應(yīng)結(jié)果的正確與錯(cuò)誤), 發(fā)現(xiàn)了ERN這一腦電成分。隨后研究者通過建立刺激?反應(yīng)之間的聯(lián)結(jié)過程進(jìn)一步分離個(gè)體的按鍵決策反應(yīng)過程和隨后的反饋結(jié)果呈現(xiàn)過程, 結(jié)果發(fā)現(xiàn):在負(fù)性反饋呈現(xiàn)之后, 個(gè)體的腦電波出現(xiàn)了一個(gè)負(fù)性的偏轉(zhuǎn)。所以, 大多數(shù)研究認(rèn)為ERN反映了早期的錯(cuò)誤檢測(cè)的認(rèn)知過程, 而FRN則反映了后期的反饋加工的認(rèn)知學(xué)習(xí)過程(Schulreich, 2016)。第三, 該理論認(rèn)為負(fù)性的獎(jiǎng)賞預(yù)測(cè)誤差會(huì)誘發(fā)較大波幅的FRN, 但是有研究者采用反轉(zhuǎn)學(xué)習(xí)任務(wù), 即通過在簡(jiǎn)單的賭博任務(wù)中不斷改變刺激?結(jié)果之間的關(guān)系, 讓被試在觀察他人做出決策行為時(shí)報(bào)告自己的結(jié)果預(yù)期, 通過預(yù)期與反饋結(jié)果的對(duì)比, 分離預(yù)期因素和效價(jià)因素, 發(fā)現(xiàn)FRN僅對(duì)結(jié)果效價(jià)敏感, 而與預(yù)期因素?zé)o關(guān)(Von Borries, Verkes, Bulten, Cools, & de Brujin, 2013)。
情緒動(dòng)機(jī)假說最早由Gehring和Willoughby (2002)提出。他們的研究操縱了金錢得失和行為正誤兩個(gè)變量, 發(fā)現(xiàn)FRN只對(duì)金錢得失敏感, 同時(shí)還發(fā)現(xiàn)FRN溯源定位于與情緒加工有關(guān)的ACC的前部, 從而認(rèn)為FRN表征的是反饋刺激帶來的情緒動(dòng)機(jī)意義。該理論假說的提出挑戰(zhàn)了強(qiáng)化學(xué)習(xí)理論的觀點(diǎn)(Gehring & Willoughby, 2002)。隨后, FRN領(lǐng)域早期的大量研究探討了這兩種理論的爭(zhēng)論(例如:Gehring & Willoughby, 2002; Nieuwenhuis et al., 2004; 李鵬, 李紅, 2008)。近10年來經(jīng)典強(qiáng)化學(xué)習(xí)理論有了新的發(fā)展, 然而對(duì)于情緒動(dòng)機(jī)假說的討論減少, 討論二者合理性的文獻(xiàn)也越來越少。究其原因, 可能是研究者越來越意識(shí)到兩者未必相互排斥:情緒動(dòng)機(jī)假說不能脫離認(rèn)知過程談更高級(jí)的情緒(Yeung, 2004), 而強(qiáng)化學(xué)習(xí)理論只強(qiáng)調(diào)獎(jiǎng)賞預(yù)期錯(cuò)誤加工的認(rèn)知過程, 也無法擺脫情緒動(dòng)機(jī)對(duì)該認(rèn)知過程自上而下的影響(Walsh & Anderson, 2012; Bismark, Hajack, Whitworth, & Allen, 2013)。此外, 研究者還發(fā)現(xiàn)即使是相同的強(qiáng)化學(xué)習(xí)過程在特定的社會(huì)交互情境中也會(huì)誘發(fā)不同大小的FRN成分(Li et al., 2010; Chen, Wu, Tong, Guan, & Zhou, 2012; Ma et al., 2011; Hu, Xu, & Mai, 2017), 說明動(dòng)機(jī)因素調(diào)節(jié)了反饋加工過程。
實(shí)際上, 早期強(qiáng)化學(xué)習(xí)理論的提出者Holroyd近年來更新了自己的理論, 提出了多層次的強(qiáng)化學(xué)習(xí)模型(Holroyd & Yeung, 2012)。在該理論中, Holroyd等人提出FRN (又被稱為Reward Positivity)反映的不是前扣帶回皮層監(jiān)控個(gè)體執(zhí)行每一個(gè)具體動(dòng)作的功能, 而是在不同的任務(wù)中做選擇并且保持努力直到完成某個(gè)任務(wù)的功能(Holroyd & Umemoto, 2016)。這個(gè)觀點(diǎn)實(shí)際上與早期的情緒動(dòng)機(jī)假說部分吻合。
早期經(jīng)典的強(qiáng)化學(xué)習(xí)理論認(rèn)為, 表示行為錯(cuò)誤或者失去獎(jiǎng)賞的負(fù)性反饋刺激會(huì)誘發(fā)一個(gè)較大負(fù)向偏轉(zhuǎn)的FRN。然而, Oliveira, McDonald和Goodman (2007)通過在時(shí)間估計(jì)任務(wù)中讓被試在估計(jì)一秒鐘的時(shí)間后, 接著報(bào)告自身的結(jié)果預(yù)期(預(yù)期自己反應(yīng)正確或者錯(cuò)誤), 隨后呈現(xiàn)反饋結(jié)果來分離預(yù)期因素和效價(jià)因素的影響, 發(fā)現(xiàn)預(yù)期之外的反饋相較于預(yù)期之中會(huì)產(chǎn)生較大波幅的FRN, 這一結(jié)果和早期經(jīng)典的強(qiáng)化學(xué)習(xí)理論的觀點(diǎn)不符。Alexander和Brown (2011)針對(duì)FRN的效價(jià)獨(dú)立性提出了反應(yīng)?結(jié)果的預(yù)測(cè)模型。該模型認(rèn)為FRN對(duì)結(jié)果反饋預(yù)期敏感, 主要編碼突顯的預(yù)測(cè)誤差, 而不是RPE (Talmi, Atkinson, & El-Deredy, 2013; Kobza, Thoma, Daum, & Bellebaum, 2011)。由于以往的研究中主要關(guān)注獎(jiǎng)賞條件下的反饋, 因此Talmi等(2013)研究者加入了厭惡刺激設(shè)計(jì)。他們?cè)O(shè)置了兩種條件:獎(jiǎng)賞條件和厭惡條件, 并通過操作獎(jiǎng)賞條件下獲得獎(jiǎng)賞的概率(25%, 75%)以及懲罰條件下無電擊的概率(25%, 75%)來定義預(yù)期因素(低概率事件發(fā)生的結(jié)果對(duì)被試來說是一個(gè)預(yù)期之外的反饋:例如25%的獎(jiǎng)賞, 25%的無電擊)以及反饋效價(jià)因素(獎(jiǎng)賞還是電擊), 被試需要根據(jù)每個(gè)試次的概率線索做出選擇。結(jié)果發(fā)現(xiàn)預(yù)期之外的“無獎(jiǎng)賞” (負(fù)性結(jié)果), 以及預(yù)期之外的“無電擊” (正性結(jié)果)都會(huì)誘發(fā)一個(gè)較大波幅的FRN。因此, 該模型提出產(chǎn)生于前扣帶回皮層的FRN編碼類似于絕對(duì)的獎(jiǎng)賞預(yù)測(cè)誤差信號(hào)(absolute reward predicted errors):不管反饋的結(jié)果效價(jià)如何, 只要反饋結(jié)果和被試的預(yù)期不符合都會(huì)誘發(fā)一個(gè)較大的FRN波幅(Ferdinand, Mecklinger, Kray, & Gehring, 2012)。該研究也存在一定的不足, 比如說兩種條件下的動(dòng)機(jī)差異:獎(jiǎng)賞條件下獲得獎(jiǎng)賞的次級(jí)強(qiáng)化物和厭惡條件下保護(hù)自己的初級(jí)強(qiáng)化物。由于動(dòng)機(jī)的不一致, 直接對(duì)比兩種條件下的差異可能存在問題。
但是, 該模型也存在一些爭(zhēng)議。Sambrook和Goslin (2015)通過元分析發(fā)現(xiàn), FRN可能受反饋效價(jià)以及獎(jiǎng)賞數(shù)量的影響, 而預(yù)期這一因素僅反映在后期的P300成分上。該研究團(tuán)隊(duì)通過主成分分析的方法, 除了提取出編碼+RPE的FRN成分之外, 還提取出了許多編碼突顯信息的成分, 但是沒有提取出編碼?RPE的成分(Sambrook & Goslin, 2016)。此外, 由于P300成分和FRN成分在時(shí)間窗口上存在一定的重疊, 導(dǎo)致某些研究在一定程度上混合了兩個(gè)成分, 而P300也被認(rèn)為和預(yù)期因素有緊密關(guān)系(Nieuwenhuis, Aston-Jones, & Cohen, 2005; Zheng, Li, Wang, Wu, & Liu, 2015; Balconi, Finocchiaro, & Canavesio, 2015), 因此, 該理論的合理性還需要進(jìn)一步研究。
根據(jù)近幾年來對(duì)FRN差異波的分析, 研究者發(fā)現(xiàn)正性反饋條件下的FRN變化較大, 而負(fù)性反饋的差異波變化較小或者基本不變化, 因此FRN可能對(duì)于正性結(jié)果更加敏感(Walsh & Anderson, 2012)。實(shí)際上, Holroyd等人早在2008年就提出了“獎(jiǎng)賞正波”這一概念, 這是對(duì)經(jīng)典的強(qiáng)化學(xué)習(xí)理論的補(bǔ)充和修正。他們認(rèn)為在時(shí)間估計(jì)任務(wù)和簡(jiǎn)單賭博任務(wù)中, 正性和負(fù)性反饋刺激呈現(xiàn)后的250 ms左右都會(huì)誘發(fā)一個(gè)相對(duì)正走向的差異波即RewP, 而且預(yù)期之外的正負(fù)反饋之間的差異值變化大于預(yù)期之內(nèi)(Holroyd, Pakzad-Vaezi, & Krigolson, 2008)。此外, 該理論認(rèn)為FRN是反饋效價(jià)和反饋預(yù)期相互作用的產(chǎn)物, 它代表了一種存在正負(fù)之分的獎(jiǎng)賞預(yù)測(cè)誤差(signed reward prediction errors, sRPEs), 這和經(jīng)典的強(qiáng)化學(xué)習(xí)理論相一致。后來該團(tuán)隊(duì)針對(duì)PRO模型提出的反饋負(fù)波編碼突顯的預(yù)測(cè)誤差信號(hào)進(jìn)行研究。他們采用虛擬的T迷宮實(shí)驗(yàn)(即在迷宮的每一條路的拐角處, 都有相應(yīng)的兩個(gè)選項(xiàng), 被試需要作出決策, 隨后出現(xiàn)反饋結(jié)果), 設(shè)置了兩種條件(獎(jiǎng)賞以及懲罰), 從而產(chǎn)生了4種反饋結(jié)果, 金錢獎(jiǎng)賞/無獎(jiǎng)賞, 電擊懲罰/無電擊; 其中對(duì)于被試來說, 金錢獎(jiǎng)賞和無電擊結(jié)果是正性反饋, 無獎(jiǎng)賞和電擊是負(fù)性反饋。研究發(fā)現(xiàn)在獎(jiǎng)賞條件下反饋刺激誘發(fā)了獎(jiǎng)賞正波, 而在懲罰條件下誘發(fā)了一個(gè)延遲的獎(jiǎng)賞正波(Heydari & Holroyd, 2016), 并且在懲罰條件下, 無電擊相較于電擊的波幅更正, 因此他們認(rèn)為RewP反映的不是一種突顯的預(yù)測(cè)誤差, 而是一種獎(jiǎng)賞預(yù)測(cè)誤差。
一系列的研究表明這一現(xiàn)象的出現(xiàn)可能是由于預(yù)期之外的事件誘發(fā)了一個(gè)對(duì)新異刺激敏感的N200成分, 該成分主要和實(shí)驗(yàn)任務(wù)特征相關(guān)(Angus, Kemkes, Schutter, & Harmon-Jones,2015), 依賴于實(shí)驗(yàn)背景的操作(Baker & Holroyd, 2011; Shahnazian & Holroyd, 2017), 反映了刺激的新穎性。它反映在大腦活動(dòng)上主要是正性反饋誘發(fā)的多巴胺活動(dòng)的階段性增加抵消了N200的活動(dòng)從而產(chǎn)生了一個(gè)正偏向的RewP, (Hewig et al., 2010); 而負(fù)性反饋誘發(fā)的多巴胺活動(dòng)階段性下降則不能抵消N200的波幅, 最終導(dǎo)致負(fù)反饋相較正反饋誘發(fā)了較大的FRN原始波(Holroyd, Krigolson, & Lee, 2011)。因此, 潛在的RewP成分不能在腦電原始波上直接觀察, 但是通過差異波減去N200成分或者通過PCA②處理后可以觀察并分析這一成分(Foti et al., 2011)。
近幾年的一些研究數(shù)據(jù), 除了支持效價(jià)獨(dú)立性的強(qiáng)化學(xué)習(xí)模型之外, 也有數(shù)據(jù)表明在獎(jiǎng)賞背景下或者獎(jiǎng)賞概率較高的條件下FRN會(huì)出現(xiàn)一個(gè)相對(duì)正走向的偏轉(zhuǎn)波(San Martín, Manes, Hurtado, Isla, & Iba?ez, 2010)。因此, 有研究者采用概率獎(jiǎng)賞任務(wù)范式分析先前試次的反饋結(jié)果對(duì)于當(dāng)前反饋結(jié)果的腦電活動(dòng)影響時(shí)發(fā)現(xiàn):在隨機(jī)呈現(xiàn)反饋結(jié)果的情況下, 前一次結(jié)果是贏相較于前一次是輸?shù)臈l件, 本試次中正反饋誘發(fā)的FRN波幅更正, 而當(dāng)前試次中負(fù)反饋誘發(fā)的波幅差異不顯著(Mushtaq, Stoet, Bland, & Schaefer, 2013)。因此, Mushtaq, Wilkie, Mon-Williams和Schaefer (2016)學(xué)者提出了積極情緒啟動(dòng)模型。該模型認(rèn)為, FRN可能對(duì)于積極背景因素敏感。例如前一試次中FRN的獎(jiǎng)賞背景可能提前啟動(dòng)了一個(gè)積極情緒從而導(dǎo)致當(dāng)前試次的FRN波幅呈現(xiàn)一個(gè)相對(duì)正向的偏轉(zhuǎn), 但是負(fù)性情緒條件下差異不顯著, 因此這也可能作為未來測(cè)量積極情緒狀態(tài)的一個(gè)客觀的生理指標(biāo)。
這一反饋加工過程表現(xiàn)在個(gè)體的神經(jīng)活動(dòng)上主要是, 積極情緒會(huì)誘發(fā)更多的中腦多巴胺神經(jīng)元活動(dòng), 從而促使大腦在隨后的行為表現(xiàn)中對(duì)與獎(jiǎng)賞相關(guān)的刺激會(huì)更加敏感, 導(dǎo)致FRN產(chǎn)生一個(gè)更加正向的偏轉(zhuǎn)波(Mushtaq et al., 2016)。但是該模型由于過分強(qiáng)調(diào)短時(shí)情緒效應(yīng)對(duì)于反饋加工過程的影響, 而忽視了長(zhǎng)時(shí)間的強(qiáng)化學(xué)習(xí)過程; 其次該模型只能解釋反應(yīng)?結(jié)果的聯(lián)結(jié)不存在或者較弱的條件, 而不能解釋反應(yīng)?結(jié)果之間形成穩(wěn)定的聯(lián)結(jié)預(yù)測(cè)這一學(xué)習(xí)過程; 最后, 積極情緒啟動(dòng)模型是一個(gè)數(shù)據(jù)驅(qū)動(dòng)模型, 研究者仍然需要將其與其他心理學(xué)理論相結(jié)合來解釋復(fù)雜的反饋加工過程。
上述關(guān)于反饋負(fù)波的5種功能性意義的解釋, 分別從不同的方面、不同的技術(shù)出發(fā)解釋了人們是如何根據(jù)從環(huán)境中獲得的反饋進(jìn)行學(xué)習(xí), 調(diào)整自身的行為, 從而做出最優(yōu)化的決策。其中情緒動(dòng)機(jī)假說與另外4種理論的不同主要體現(xiàn)在反饋負(fù)波所代表的是反饋刺激的認(rèn)知加工過程還是其背后的情緒動(dòng)機(jī)意義, 這個(gè)問題需要更深層次的研究。關(guān)于另外的4種理論的區(qū)別主要體現(xiàn)在:首先, 經(jīng)典的強(qiáng)化學(xué)習(xí)理論和反應(yīng)?結(jié)果的預(yù)期模型是理論驅(qū)動(dòng)下的模型, 有自身的理論依據(jù), 而獎(jiǎng)賞正波模型和積極情緒驅(qū)動(dòng)模型是數(shù)據(jù)驅(qū)動(dòng)下的模型(Mushtaq et al., 2016), 理論和數(shù)據(jù)二者進(jìn)一步地結(jié)合分析才能夠更加完善地解釋FRN這一成分。其次, 前三種理論對(duì)于FRN到底是與負(fù)性RPE, 正性RPE還是RPE的絕對(duì)值變化有關(guān)進(jìn)行了爭(zhēng)論, 而第四種理論與前三種的區(qū)別在于FRN反映的到底是長(zhǎng)期學(xué)習(xí)的影響還是短期情緒的影響。具體來說, 經(jīng)典的強(qiáng)化學(xué)習(xí)理論模型認(rèn)為人們對(duì)于?RPE敏感, 反饋加工的認(rèn)知過程反映了錯(cuò)誤的檢測(cè)過程和認(rèn)知評(píng)價(jià)過程; 反應(yīng)?結(jié)果的預(yù)期模型認(rèn)為人們對(duì)于顯著的意料之外的預(yù)測(cè)誤差敏感(RPE的絕對(duì)值), 反饋加工的認(rèn)知過程反映了一種沖突監(jiān)控的認(rèn)知過程; 而獎(jiǎng)賞正波理論的支持者通過正負(fù)反饋差異波或PCA等數(shù)據(jù)處理方式對(duì)腦電數(shù)據(jù)進(jìn)行分析, 發(fā)現(xiàn)反饋負(fù)波對(duì)于正性的反饋結(jié)果更加敏感從而提出了獎(jiǎng)賞正波模型。最后, 其他研究者發(fā)現(xiàn)在短時(shí)期的學(xué)習(xí)過程中, 積極的背景啟動(dòng)會(huì)使反饋負(fù)波對(duì)于正性的反饋結(jié)果更加敏感, 從而提出了積極情緒啟動(dòng)模型。
目前關(guān)于FRN的理論解釋還不完善, 但是隨著未來研究的深入, 有望形成一個(gè)較為統(tǒng)一的FRN理論。當(dāng)前研究者采用不同的實(shí)驗(yàn)任務(wù), 以及不同類型的反饋刺激形式, 如積極反饋、消極反饋和模糊反饋(Gu et al., 2017; Ernst & Steinhauser, 2015), 并基于這些任務(wù)背景或者特定的分析方法得出了不同的結(jié)論(Zheng et al., 2015, 2017; Umemoto, Hajihosseini, Yates, & Holroyd, 2017; Schaefer, Buratto, Goto, & Brotherhood, 2016), 支持了不同的理論假設(shè)。而由于腦電波很容易受到其他因素的干擾, 從而導(dǎo)致研究者在提取和分析FRN成分上存在問題, 這對(duì)于FRN理論的整合也存在一定的影響。未來關(guān)于FRN的理論探索可以從以下幾個(gè)方面進(jìn)行深入:
第一, 進(jìn)一步改進(jìn)FRN的獲得方式和分析方法。由于決策后的反饋學(xué)習(xí)過程是一個(gè)復(fù)雜的心理過程, 不僅包含反饋加工過程, 還包含獎(jiǎng)賞預(yù)期, 結(jié)果評(píng)價(jià)等過程, 現(xiàn)有的研究范式和數(shù)據(jù)分析方法不能有效地剔除和分離其他腦電成分對(duì)于FRN的影響。因此, 將來的研究一方面可以從數(shù)據(jù)處理著手, 考慮采用主成分分析法(PCA)、獨(dú)立成分分析法(ICA)與時(shí)頻分析方法相結(jié)合的方法(Bernat, Nelson, & Baskin-Sommers, 2015; Cohen, Wilmes, & van de Vijver, 2011), 從而較為有效地分離FRN、P300以及其他無關(guān)的腦電成分(Sambrook & Goslin, 2015)。另外, 也可以嘗試從樣本量入手, 提高統(tǒng)計(jì)檢驗(yàn)力和實(shí)驗(yàn)效度, 采用大數(shù)據(jù)、大樣本的思路, 縮小實(shí)驗(yàn)誤差, 從而得到可靠和有效的FRN, 為相關(guān)的理論完善提供堅(jiān)實(shí)的數(shù)據(jù)支持(Sambrook & Goslin, 2016)。除此之外, 還應(yīng)充分發(fā)揮不同技術(shù)的優(yōu)勢(shì), 取長(zhǎng)補(bǔ)短, 更加深入地研究FRN。例如, 有高空間分辨率的fMRI和有高時(shí)間分辨率的ERP的結(jié)合能夠提供更加精確的空間定位和時(shí)間進(jìn)程的變化, 進(jìn)一步加深對(duì)強(qiáng)化學(xué)習(xí)進(jìn)程的認(rèn)識(shí)(Becker et al., 2014)。另外, 也可以將無損傷的腦刺激技術(shù)和ERP技術(shù)相結(jié)合, 通過微弱電流/磁場(chǎng)來刺激反饋加工的相關(guān)腦區(qū), 從而分析FRN相關(guān)腦區(qū)的作用。
第二, 關(guān)于FRN在大腦中的起源地, 學(xué)者們存在不同的認(rèn)識(shí), 主要存在兩種觀點(diǎn):FRN可能源于具有認(rèn)知控制功能的前扣帶回皮層, 也可能源于負(fù)責(zé)獎(jiǎng)賞加工的紋狀體區(qū)域。未來的研究可以從被試的選取角度來探討FRN發(fā)生地。例如以往的研究主要選取健康的成年被試, 未來的研究可以選取前扣帶回皮層受損或者紋狀體受損的被試進(jìn)行研究, 通過分析這兩類被試的行為表現(xiàn), 對(duì)比特殊被試與正常被試的反饋加工的行為學(xué)習(xí)過程和腦電差異, 來驗(yàn)證或者探索FRN的發(fā)生源。
第三, 關(guān)于FRN的理論解釋, 應(yīng)該從具體的情境出發(fā), 具體分析個(gè)體在不同的環(huán)境中對(duì)于不同刺激物的學(xué)習(xí)和加工過程。目前FRN的研究大多局限于實(shí)驗(yàn)室環(huán)境, 未來的研究可以借助新興的儀器或者技術(shù)來研究真實(shí)社會(huì)情境下的FRN的變化以及所反映的心理過程。比如說, 利用近紅外設(shè)備和ERP技術(shù)的結(jié)合, 研究真實(shí)情境中雙人或者多人的合作或競(jìng)爭(zhēng)等, 觀察個(gè)體在合作或競(jìng)爭(zhēng)條件下學(xué)習(xí)過程中的腦電變化, 探索在社會(huì)認(rèn)知領(lǐng)域中一般人群的強(qiáng)化學(xué)習(xí)過程, 將FRN與社會(huì)認(rèn)知過程相聯(lián)系, 從而提供更為完善的心理解釋機(jī)制。國(guó)內(nèi)研究者Leng和Zhou (2010)主要關(guān)注結(jié)果評(píng)價(jià)過程中個(gè)體社會(huì)認(rèn)知活動(dòng)中的腦電變化, 他們發(fā)現(xiàn)結(jié)果評(píng)價(jià)的早期過程中FRN可能在行為正誤以及自我利益的激活上扮演著重要作用。近幾年來越來越多的學(xué)者將FRN研究應(yīng)用于高級(jí)社會(huì)認(rèn)知加工過程當(dāng)中, 例如責(zé)任感(Li et al., 2010; Beyer, Sidarus, Bonicalzi, & Haggard, 2017), 社會(huì)合作(Kimura & Katayama, 2016), 自我歸因(Li, Han, Lei, Holroyd, & Li, 2011), 社會(huì)從眾(Chen et al., 2012; Shestakova et al., 2013), 移情機(jī)制(Ma et al., 2011; Thoma, Norra, Juckel, Suchan, & Bellebaum, 2015), 社會(huì)比較效應(yīng)(Wu, Zhang, Elieson, & Zhou, 2012)等。未來的研究也可以進(jìn)一步探討特殊人群的強(qiáng)化學(xué)習(xí)過程, 例如, 焦慮障礙, 強(qiáng)迫癥, 阿茲海默癥等(Gu, Huang, & Luo, 2010; Gu, Ge, Jiang, & Luo, 2010; Takács et al., 2015; Do?amayor, Dinani, R?misch, Ye, & Münte, 2014; Mensen et al., 2015), 在臨床上提供客觀的生理指標(biāo)。但是, 在實(shí)驗(yàn)中社會(huì)情境本身的生態(tài)效度以及腦電實(shí)驗(yàn)特有的多試次重復(fù)等都是未來研究中需要慎重考慮的問題。
李鵬, 李紅. (2008). 反饋負(fù)波及其理論解釋.(5), 705?711.
Alexander, W. H., & Brown, J. W. (2011). Medial prefrontal cortex as an action-outcome predictor.(10), 1338?1344.
Angus, D. J., Kemkes, K., Schutter, D. J. L. G., & Harmon- Jones, E. (2015). Anger is associated with reward-related electrocortical activity: Evidence from the reward positivity.52(10), 1271–1280.
Baker, T. E., & Holroyd, C. B. (2011). Dissociated roles of the anterior cingulate cortex in reward and conflict processing as revealed by the feedback error-related negativity and N200.(1), 25?34.
Balconi, M., Finocchiaro, R., & Canavesio, Y. (2015). Reward sensitivity (behavioral activation system), cognitive, and metacognitive control in gambling behavior: Evidences from behavioral, feedback-related negativity, and p300 effect.(3), 219?227.
Becker, M. P. I., Nitsch, A. M., Miltner, W. H., & Straube, T. (2014). A single-trial estimation of the feedback-related negativity and its relation to bold responses in a time- estimation task.(8), 3005? 3012.
Bellebaum, C., & Daum, I. (2008). Learning-related changes in reward expectancy are reflected in the feedback-related negativity.(7), 1823?1835.
Bernat, E. M., Nelson, L. D., & Baskin-Sommers, A. R. (2015). Time-frequency theta and delta measures index separable components of feedback processing in a gambling task.(5), 626–637.
Beyer, F., Sidarus, N., Bonicalzi, S., & Haggard, P. (2017). Beyond self-serving bias: Diffusion of responsibility reduces sense of agency and outcome monitoring.(1), 138?145.
Bismark, A. W., Hajcak, G., Whitworth, N. M., & Allen, J. J. B. (2013). The role of outcome expectations in the generation of the feedback-related negativity.(2), 125–133.
Bress, J. N., & Hajcak, G. (2013). Self-report and behavioral measures of reward sensitivity predict the feedback negativity.(7), 610–616.
Carlson, J. M., Foti, D., Mujica-Parodi, L. R., Harmon-Jones, E., & Hajcak, G. (2011). Ventral striatal and medial prefrontal BOLD activation is correlated with reward- related electrocortical activity: A combined ERP and FMRI study.(4), 1608?1616.
Chen, J., Wu, Y., Tong, G. Y., Guan, X. M., & Zhou, X. L. (2012). ERP correlates of social conformity in a line judgment task.(1), 43.
Cohen, M. X., Wilmes, K. A., & van de Vijver, I. (2011). Cortical electrophysiological network dynamics of feedback learning.(12), 558?566.
Do?amayor, N., Dinani, J., R?misch, M., Ye, Z., & Münte, T. F. (2014). Performance monitoring during associative learning and its relation to obsessive-compulsive characteristics., 73?87.
Ernst, B., & Steinhauser, M. (2015). Effects of invalid feedback on learning and feedback-related brain activity in decision-making., 78?86.
Ferdinand, N. K., Mecklinger, A., Kray, J., & Gehring, W. J. (2012). The processing of unexpected positive response outcomes in the mediofrontal cortex.(35), 12087?12092.
Foti, D., Weinberg, A., Dien, J., & Hajcak, G. (2011). Event-related potential activity in the basal ganglia differentiates rewards from nonrewards: Temporospatial principal components analysis and source localization of the feedback negativity.(12), 2207–2216.
Gehring, W. J., Goss, B., Coles, M. G. H., Meyer, D. E., & Donchin, E. (1993). A neural system for error detection and compensation.(6), 385–390.
Gehring, W. J., & Willoughby, A. R. (2002). The medial frontal cortex and the rapid processing of monetary gains and losses.(5563), 2279?2282.
Gu, R. L., Feng, X., Broster, L. S., Yuan, L., Xu, P. F., & Luo, Y. J. (2017). Valence and magnitude ambiguity in feedback processing.(5), e00672.
Gu, R. L., Huang, Y. X., & Luo, Y. J. (2010). Anxiety and feedback negativity.(5), 961?967.
Gu, R. L., Ge, Y., Jiang, Y., & Luo, Y. J. (2010). Anxiety and outcome evaluation: The good, the bad and the ambiguous.(2), 200?206.
Hewig, J., Kretschmer, N., Trippe, R. H., Hecht, H., Coles, M. G. H., Holroyd, C. B., & Miltner, W. H. R. (2010). Hypersensitivity to reward in problem gamblers.(8), 781?783.
Heydari, S., & Holroyd, C. B. (2016). Reward positivity: Reward prediction error or salience prediction error?.(8), 1185?1192.
Holroyd, C. B., & Coles, M. G. (2002). The neural basis of human error processing: Reinforcement learning, dopamine, and the error-related negativity.(4), 679?709.
Holroyd, C. B., & Krigolson, O. E. (2007). Reward prediction error signals associated with a modified time estimation task.(6), 913?917.
Holroyd, C. B., Krigolson, O. E., & Lee, S. (2011). Reward positivity elicited by predictive cues.(5), 249?252.
Holroyd, C. B., Pakzad-Vaezi, K. L., & Krigolson, O. E. (2008). The feedback correct-related positivity: Sensitivity of the event-related brain potential to unexpected positive feedback.(5), 688–697.
Holroyd, C. B., & Umemoto, A. (2016). The research domain criteria framework: The case for anterior cingulate cortex., 418?443.
Holroyd, C. B., & Yeung, A. N. (2012). Motivation of extended behaviors by anterior cingulate cortex.(2), 122?128.
Hu, X. M., Xu, Z. H., & Mai, X. Q. (2017). Social value orientation modulates the processing of outcome evaluationinvolving others.(11), 1730?1739.
Kimura, K., & Katayama, J. (2016). Cooperative context is a determinant of the social influence on outcome evaluation: An electrophysiological study., 28?35.
Kobza, S., Thoma, P., Daum, I., & Bellebaum, C. (2011). The feedback-related negativity is modulated by feedback probability in observational learning.(2), 396?404.
Leng, Y., & Zhou, X. L. (2010). Modulation of the brain activity in outcome evaluation by interpersonal relationship: An ERP study.(2), 448?455.
Li, P., Han, C. H., Lei, Y., Holroyd, C. B., & Li, H. (2011). Responsibility modulates neural mechanisms of outcome processing: An ERP study.48(8), 1129?1133.
Li, P., Jia, S. W., Feng, T. Y., Liu, Q., Suo, T., & Li, H. (2010). The influence of the diffusion of responsibility effect on outcome evaluations: Electrophysiological evidence from an ERP study.(4), 1727? 1733.
Luft, C. D. B. (2014). Learning from feedback: The neural mechanisms of feedback processing facilitating better performance.(6), 356? 368.
Ma, Q. G., Shen, Q., Xu, Q., Li, D. D., Shu, L. C., & Weber, B. (2011). Empathic responses to others' gains and losses: An electrophysiological investigation.(3), 2472?2480.
Maia, T. V., & Frank, M. J. (2011). From reinforcement learning models to psychiatric and neurological disorders.(2), 154?162.
Marco-Pallares, J., Cucurell, D., Münte, T. F., Strien, N., & Rodriguez-Fornells, A. (2011). On the number of trials needed for a stable feedback-related negativity.(6), 852–860.
Mensen, A., Poryazova, R., Huegli, G., Baumann, C. R., Schwartz, S., & Khatami, R. (2015). The roles of dopamine and hypocretin in reward: A electroencephalographic study.(11), e0142432.
Miltner, W. H. R., Braun, C. H., & Coles, M. G. H. (1997). Event-related brain potentials following incorrect feedback in a time-estimation task: Evidence for a "generic" neural system for error detection.(6), 788?798.
Mushtaq, F., Stoet, G., Bland, A. R., & Schaefer, A. (2013). Relative changes from prior reward contingencies can constrain brain correlates of outcome monitoring.(6), e66350.
Mushtaq, F., Wilkie, R. M., Mon-Williams, M. A., & Schaefer, A. (2016). Randomised prior feedback modulates neural signals of outcome monitoring., 868?879.
Nieuwenhuis, S., Aston-Jones, G., & Cohen, J. D. (2005). Decision making, the P3, and the locus coeruleus- norepinephrine system., 510? 532.
Nieuwenhuis, S., Holroyd, C. B., Mol, N., & Coles, M. G. H. (2004). Reinforcement-related brain potentials from medial frontal cortex: Origins and functional significance.(4), 441?448.
Oliveira, F. T. P., McDonald, J. J., & Goodman, D. (2007). Performance monitoring in the anterior cingulate is not all error related: Expectancy deviation and the representation of action-outcome associations.(12), 1994?2004.
Padrón, I., Fernández-Rey, J., Acu?a, C., & Pardo-Vazquez, J. L. (2016). Representing the consequences of our actions trial by trial: Complex and flexible encoding of feedback valence and magnitude., 264?276.
Sambrook, T. D., & Goslin, J. (2015). A neural reward prediction error revealed by a meta-analysis of ERPs using great grand averages.(1), 213?235.
Sambrook, T. D., & Goslin, J. (2016). Principal components analysis of reward prediction errors in a reinforcement learning task., 276?286.
San Martín, R., Manes, F., Hurtado, E., Isla, P., & Iba?ez, A. (2010). Size and probability of rewards modulate the feedback error-related negativity associated with wins but not losses in a monetarily rewarded gambling task.(3), 1194?1204.
Schaefer, A., Buratto, L. G., Goto, N., & Brotherhood, E. V. (2016). The feedback-related negativity and the p300 brain potential are sensitive to price expectation violations in a virtual shopping task.(9), e0163150.
Sch?nberg, T., Daw, N. D., Joel, D., & O'Doherty, J. P. (2007). Reinforcement learning signals in the human striatum distinguish learners from nonlearners during reward-based decision making.(47), 12860?12867.
Schulreich, S. (2016). Altered performance monitoring in psychopathy: A review of studies on action selection, error, and feedback processing.(1), 19?27.
Shahnazian, D., & Holroyd, C. B. (2017). Distributed representations of action sequences in anterior cingulate cortex: A recurrent neural network approach., doi: 10.3758/s13423-017-1280-1
Shestakova, A., Rieskamp, J., Tugin, S., Ossadtchi, A., Krutitskaya, J., & Klucharev, V. (2013). Electrophysiological precursors of social conformity.(7), 756?763.
Takács, á., Kóbor, A., Janacsek, K., Honbolygó, F., Csépe, V., & Németh, D. (2015). High trait anxiety is associated with attenuated feedback-related negativity in risky decision making.600, 188?192.
Talmi, D., Atkinson, R., & El-Deredy, W. (2013). The feedback-related negativity signals salience prediction errors, not reward prediction errors.(19), 8264?8269.
Thoma, P., Norra, C., Juckel, G., Suchan, B., & Bellebaum, C. (2015). Performance monitoring and empathy during active and observational learning in patients with major depression., 222?231.
Umemoto, A., Hajihosseini, A., Yates, M. E., & Holroyd, C. B. (2017). Reward-based contextual learning supported by anterior cingulate cortex.(3), 642?651.
Von Borries, A. K. L., Verkes, R. J., Bulten, B. H., Cools, R., & de Bruijn, E. R. A. (2013). Feedback-related negativity codes outcome valence, but not outcome expectancy, during reversal learning.(4), 737?746.
Walsh, M. M., & Anderson, J. R. (2012). Learning from experience: Event-related potential correlates of reward processing, neural adaptation, and behavioral choice.(8), 1870? 1884.
Wu, Y., Zhang, D. X., Elieson, B., & Zhou, X. L. (2012). Brain potentials in outcome evaluation: When social comparison takes effect.(2), 145?152.
Yeung, N. (2004). Relating cognitive and affective theories of the error-related negativity. In(pp. 63?70).Leipzig.
Zheng, Y., Li, Q., Wang, K., Wu, H. Y., & Liu, X. (2015). Contextual valence modulates the neural dynamics of risk processing.(7), 895–904.
Zheng, Y., Li, Q., Zhang, Y. Y., Li, Q., Shen, H. J., Gao, Q. H., & Zhou, S. Y. (2017). Reward processing in gain versus loss context: An ERP study.(7), 1040?1053.
①ERN主要出現(xiàn)在錯(cuò)誤反應(yīng)呈現(xiàn)后的80 ms, 是一種刺激鎖定的ERP成分, 是一個(gè)對(duì)于早期的反應(yīng)錯(cuò)誤的自動(dòng)化覺察過程。
② PCA是一種數(shù)據(jù)驅(qū)動(dòng)下的分析技術(shù), 主要用于提取事件的主要成分, 剔除事件中的其它重疊成分, 是一種降維的方法。
The updated theories of feedback-related negativity in the last decade
LI Danyang; LI Peng; LI Hong
(College of psychology and sociology, Shenzhen University, Shenzhen 518060, China)
External feedback plays a vital role in ongoing outcome monitoring and future behavioral adjustments. Previous event-related potentials (ERPs) studies have consistently associated the feedback- related negativity (FRN) component with feedback processing after decision making. Until now, several theoretical interpretations of FRN were proposed and continuously updated in the last decade, including the classical reinforcement learning theory, affective-motivational hypothesis, reward positivity (RewP) theory, Predicted response-outcome model (PRO model) and Positive affective model. Whereas different models emphasized on different aspects, no unified theory has yet been proposed to integrate all of the existing experimental evidences. Based on these literature reviews, we argued that big-sample data, multiple and complementary technologies are highly necessary in future FRN studies. Moreover, we proposed that FRN should be considered as an electrophysiological index of reward system to investigate human behaviors in complex social interaction contexts.
feedback-related negativity; reinforcement learning; anterior cingulate cortex; reward positivity; reward prediction error
B845
2017-07-21
* 國(guó)家自然科學(xué)基金項(xiàng)目(31671158和31671150)、廣東省普通高校創(chuàng)新團(tuán)隊(duì)建設(shè)項(xiàng)目(2015KCXTD009和2015WTSCX094)、深圳市基礎(chǔ)學(xué)科布局項(xiàng)目(JCYJ20150729104249783)、深圳大學(xué)青年教師科研啟動(dòng)項(xiàng)目(2017074), 深圳大學(xué)人文社科青年扶持項(xiàng)目(16QNFC51)。
李鵬, E-mail: peng@szu.edu.cn
10.3724/SP.J.1042.2018.01642