摘 要:作為言語(yǔ)行為的人機(jī)情感對(duì)話中包含語(yǔ)義、語(yǔ)用及心靈三重意向,但現(xiàn)行情感計(jì)算領(lǐng)域所有基于向量語(yǔ)義學(xué)的神經(jīng)網(wǎng)絡(luò)模型,包括chatGPT的處理方式,仍只是形式層面,而不是真正的語(yǔ)義計(jì)算,其既未能實(shí)現(xiàn)人類基于自然語(yǔ)言理解基礎(chǔ)之上的意義意向,也未能實(shí)現(xiàn)心靈的賦義意向。要想實(shí)現(xiàn)真正的意義理解,情感計(jì)算應(yīng)從根本上轉(zhuǎn)變哲學(xué)預(yù)設(shè),嘗試一種自頂向下的解決思路,從身體和世界出發(fā)追溯意義的來(lái)源,設(shè)計(jì)一種能實(shí)現(xiàn)意向弧的具身智能,以首先解決心靈的意向問題,進(jìn)而解決由其派生的語(yǔ)言意向問題。
關(guān)鍵詞:情感計(jì)算;言語(yǔ)行為;意向性;語(yǔ)義;自頂向下
中圖分類號(hào):H030"""" 文獻(xiàn)標(biāo)識(shí)碼:A""" 文章編號(hào):1001-4225(2024)03-0068-07
引" 言
情感史研究專家雷迪(Reddy)認(rèn)為,自20世紀(jì)70年代人文社會(huì)多個(gè)學(xué)科的“情感轉(zhuǎn)向”發(fā)生以來(lái),情感研究已經(jīng)在各個(gè)學(xué)科領(lǐng)域引發(fā)了三場(chǎng)革命:1)心理學(xué)基于實(shí)驗(yàn)技術(shù)對(duì)情感與認(rèn)知的研究;2)人類學(xué)基于新的田野方法和理論工具對(duì)情感文化維度的研究;3)歷史學(xué)和文學(xué)批評(píng)對(duì)情感的歷史性研究[1]。這些學(xué)科的研究主要是基于“生物決定-社會(huì)文化建構(gòu)”二元論模式關(guān)注情感的體驗(yàn)和表達(dá)兩個(gè)方面?!吧餂Q定論”主要將情感還原為個(gè)體的生理、心理和身體層面,強(qiáng)調(diào)情感的身體維度;“社會(huì)文化建構(gòu)論”則認(rèn)為情感是社會(huì)性的,受個(gè)體所在的特定社會(huì)文化塑造,強(qiáng)調(diào)語(yǔ)言和話語(yǔ)的作用[2]。人文社會(huì)科學(xué)研究中這種“情感轉(zhuǎn)向”同樣擴(kuò)展到自然科學(xué)如計(jì)算機(jī)和人工智能領(lǐng)域。1997年,麻省理工學(xué)院的Picard教授首次提出并定義了情感計(jì)算(affective computing):“關(guān)于情感、由情感引發(fā)及意圖影響情感的計(jì)算”[3]。情感計(jì)算是通過(guò)計(jì)算機(jī)模擬來(lái)實(shí)現(xiàn)對(duì)人類情感的感知(sensing)、識(shí)別(recognition)、模擬(simulation)及在人機(jī)對(duì)話中對(duì)人類情感產(chǎn)生影響(influence),從而達(dá)到與人類更和諧友好的交互。
一、情感的定義及計(jì)算類型
(一)什么是情感
與情感相關(guān)的幾個(gè)語(yǔ)詞的使用包括:1)emotion一詞在情緒心理學(xué)中一般譯為情緒,其拉丁詞源e(外)和movere(動(dòng)),意思是從一個(gè)地方向外移動(dòng)到另一個(gè)地方。后用于描述個(gè)體精神狀態(tài)的激烈擾動(dòng)及其運(yùn)動(dòng)過(guò)程。2)feelings一詞經(jīng)常用來(lái)描述社會(huì)性高級(jí)情感,如描述對(duì)祖國(guó)的熱愛,對(duì)美的欣賞,對(duì)他人的羨慕與嫉妒、羞愧或負(fù)疚;3)affection一詞常作傾心、喜愛類的情感,但在情感計(jì)算領(lǐng)域卻一直采用此詞,如Picard的著作就名為“Affective Computing”。此外,還有sentiment、passion等詞,在日常用法中,這些詞被譯為“情感、感情、情緒、感受、感覺”,有時(shí)也會(huì)不加區(qū)分地使用。盡管多年來(lái)各個(gè)學(xué)科對(duì)情感研究的成果不斷推陳出新,但對(duì)于情感理論的一些最基本問題如“什么是情感?”“什么引起情感?”“為什么我們會(huì)有情感?”研究者們卻意見紛爭(zhēng),莫衷一是。以至于K·T·斯托曼在《情緒心理學(xué)》中也不得不承認(rèn):任何情緒理論或任何情緒研究只能在這個(gè)術(shù)語(yǔ)的很廣的意義中從事某些部分的工作,理論家之中一些人強(qiáng)調(diào)心理因素,一些人強(qiáng)調(diào)行為,一些人強(qiáng)調(diào)主觀感受……由于各種觀點(diǎn)往往大相徑庭,以至于難以對(duì)它進(jìn)行最簡(jiǎn)單的歸納和概括[4]。
(二)情感的計(jì)算類型
沿著情感轉(zhuǎn)向中的“生物決定-社會(huì)建構(gòu)”二元論框架,情感計(jì)算領(lǐng)域也大致分為兩類研究:一類是基于情感的身體維度進(jìn)行的情感感知和模式識(shí)別,即計(jì)算機(jī)通過(guò)各類接觸或非接觸式傳感器(sensor)實(shí)現(xiàn)對(duì)人類的聲音、表情、肢體語(yǔ)言、皮膚電導(dǎo)水平、腦血流量、生物電信號(hào)等各類生物信息的“感知”,以及在完成信息感知的基礎(chǔ)上,借助各類情感識(shí)別模型,通過(guò)各種算法進(jìn)行模型訓(xùn)練,最終完成各種類型的情感識(shí)別。另一類研究則是重視情感的社會(huì)維度,將情感計(jì)算與自然語(yǔ)言處理相結(jié)合,認(rèn)為計(jì)算機(jī)想要真正達(dá)到人機(jī)情感交互,對(duì)人類情感產(chǎn)生影響,關(guān)鍵在于計(jì)算機(jī)如何能通過(guò)理解人類語(yǔ)言來(lái)理解人類情感,并在理解之上生成機(jī)器語(yǔ)言作出情感反饋。
(三)作為言語(yǔ)行為的情感
從情感的社會(huì)維度,雷迪將情感表達(dá)視為一種言語(yǔ)行為,認(rèn)為情感的語(yǔ)言表達(dá)既具有描述性又表達(dá)了一種建立關(guān)系的意愿?!罢?wù)撘粋€(gè)人的感受,常常表現(xiàn)為一種含蓄的給予或贈(zèng)送,表現(xiàn)為一種協(xié)商、拒絕、開始或終止一項(xiàng)計(jì)劃,建立一種連接或關(guān)系的期待。”[5]通過(guò)情感的語(yǔ)言表達(dá),人們向他人發(fā)出呼吁,表達(dá)意圖,期待建構(gòu)與他人的關(guān)系。
盡管情感的本體論界定并不清晰,但情感在社會(huì)交往和人際互動(dòng)中的功能卻必不可少。Byron Reeves和Clifford Nass[6]曾對(duì)人-人與人-機(jī)情感交互進(jìn)行過(guò)大量對(duì)比實(shí)驗(yàn)。其實(shí)驗(yàn)設(shè)計(jì)為先測(cè)試人A與人B面對(duì)面交談之后由A對(duì)B進(jìn)行打分評(píng)價(jià);隨后又將人B換成計(jì)算機(jī)B,在計(jì)算機(jī)B進(jìn)行一段簡(jiǎn)短陳述后,再由人A面對(duì)面地對(duì)計(jì)算機(jī)B的表現(xiàn)進(jìn)行評(píng)價(jià)。實(shí)驗(yàn)結(jié)果表明,人-機(jī)交互依然能保持人-人面對(duì)面時(shí)所作較高評(píng)價(jià)的趨勢(shì),甚至當(dāng)實(shí)驗(yàn)對(duì)象是計(jì)算機(jī)專業(yè)的學(xué)生時(shí),即使他們知道計(jì)算機(jī)是沒有情感的,實(shí)驗(yàn)結(jié)論依然成立。兩位研究者由此認(rèn)為:人-機(jī)交互的這種自然性和社交性說(shuō)明了人類傾向于同等對(duì)待計(jì)算機(jī)。但實(shí)際上,如果仔細(xì)分析一下這種同等對(duì)待,卻恰恰會(huì)發(fā)現(xiàn)人-機(jī)情感交互中的“主體際”差異及人類對(duì)人-人交互的偏愛。人類之所以會(huì)對(duì)人-機(jī)情感交互作出無(wú)差異評(píng)價(jià),只是因?yàn)閷⑷?人交互中的情感隱喻性地映射到了人-機(jī)交互之中。在人-機(jī)交互中,人類首先已經(jīng)將機(jī)器“看作”是情感“主體”,且認(rèn)為能從機(jī)器的語(yǔ)言之中(無(wú)論是以機(jī)械的毫無(wú)人聲特征的聲音,還是模擬人類語(yǔ)音合成的語(yǔ)聲說(shuō)出)捕捉和理解到這些情感。但反過(guò)來(lái),機(jī)器是否能“理解”人類語(yǔ)言中的情感,其能“理解”的情感包含的是一些什么向度,以及在此“理解”的基礎(chǔ)上何以能模擬生成類人的、攜帶情感的語(yǔ)言來(lái)實(shí)現(xiàn)平等的人-機(jī)情感對(duì)話,這些問題始終是情感計(jì)算需要面對(duì)的核心課題。
1. 言語(yǔ)行為中的意向性
如果將情感的表達(dá)視為一種言語(yǔ)行為,則人機(jī)交互中最重要的就是計(jì)算機(jī)對(duì)情感意向性的理解。按照語(yǔ)言哲學(xué),情感語(yǔ)句最重要的特征就是其意向性。P·M·丘奇蘭德在《物質(zhì)與意識(shí)》一書中認(rèn)為:情緒狀態(tài)與其它的心理狀態(tài)如相信、希望等一樣,都有其特定的命題態(tài)度,即這些狀態(tài)都有意向性:指向心理狀態(tài)之外的東西[7]271。R·戈登在對(duì)情緒的分析中指出情緒的兩條重要特征:其一是情緒的關(guān)于性或意向性,即情緒是一種心理狀態(tài),與其它心理狀態(tài)一樣,都有一個(gè)指向世界的特征,其二是情感的語(yǔ)句性,即情緒語(yǔ)詞都帶有句子的特征。如果要描述一個(gè)人的某種情感,就需要說(shuō)出一個(gè)句子,這個(gè)句子通常由一個(gè)情感主體、一個(gè)情感語(yǔ)詞加一個(gè)that從句構(gòu)成[7]253。塞爾在《意向性——論心靈哲學(xué)》中也指出:意向性是為許多心智狀態(tài)和事件所具有的這樣一種性質(zhì),即這些心智狀態(tài)或事件通過(guò)它而指向(direct at)或關(guān)于(about)或涉及(of)世界上的對(duì)象和事態(tài)。對(duì)于情感意向來(lái)說(shuō),假如我在生氣,必定是對(duì)某人或某事生氣,假如我有某種悔恨,則必定是對(duì)于某種事物的悔恨。與情感相關(guān)的動(dòng)詞,如快樂、憤怒、喜愛、厭惡、憂傷、悲痛、羞愧、恐懼、驕傲、憂慮等都是如此,或者在本質(zhì)上有所指向,或者至少能夠有所指向[8]5。因此,與情感相關(guān)的意向可表示為形如S(r)的一個(gè)情感動(dòng)詞加一個(gè)從句的形式,如:
(1)我真高興,春天來(lái)了。
(2)我非常慚愧,我一點(diǎn)都不讓你省心。
亦即表示為一種類似命題態(tài)度的形式。其中“高興”“慚愧”表示情感的意向狀態(tài)(或心理模式),其后的“春天來(lái)了”和“我一點(diǎn)都不讓你省心”表示其意向內(nèi)容(或表征內(nèi)容)。需要注意的是,這種形為S(r)的表示與言語(yǔ)行為理論中的F(p)表示(F表示行事語(yǔ)力,p表示命題內(nèi)容)在外形上非常相似,本質(zhì)卻完全不同,S(r)僅是用于“表征”一種意向狀態(tài)的邏輯結(jié)構(gòu)特征。此處的“表征”用法并不是福多式的外部世界被感知的事物在頭腦中被“腦語(yǔ)言”表征,而是意取塞爾所說(shuō)的“表征”:用語(yǔ)句形式表達(dá)意向的邏輯結(jié)構(gòu),這種邏輯結(jié)構(gòu)能夠顯示出此種意向的適應(yīng)指向和滿足條件,如一個(gè)意向語(yǔ)句“我渴望人人都溫柔善良”,其中“渴望”表達(dá)世界對(duì)心靈或語(yǔ)詞的適應(yīng)指向(direction of fit),命題內(nèi)容“人人都溫柔善良”決定其滿足條件,塞爾的“表征”在腦中沒有相應(yīng)的存在,只是起一種描述的功能。
2. 言語(yǔ)行為中的復(fù)雜情感意向
在情感交互中,作為表征的情感意向語(yǔ)句必須要以言語(yǔ)行為的方式施行到人機(jī)對(duì)話之中才能完成以言表意、以言行事及以言取效等功能。在一個(gè)情感語(yǔ)句被施行為言語(yǔ)行為的過(guò)程中,會(huì)出現(xiàn)多種復(fù)雜的意向類型。
(1)言語(yǔ)行為中的三重意向" 當(dāng)說(shuō)出語(yǔ)句“我非常慚愧,我一點(diǎn)都不讓你省心”時(shí),說(shuō)話人首要的意向是以此句話向聽話人表達(dá)一種意義:因?yàn)槟呈?,我有某種情感態(tài)度或體驗(yàn);其次的意向是說(shuō)話人用說(shuō)出這句話表示他此時(shí)在對(duì)他“慚愧”的心理狀態(tài)作出一種陳述;第三意向是說(shuō)話人通過(guò)說(shuō)這句話,試圖對(duì)聽話人的感情、思想或行動(dòng)產(chǎn)生影響,如試圖取得聽話人的回應(yīng)“沒關(guān)系,我已經(jīng)原諒你了”。
(2)以言行事(illocutionary act)時(shí)的伴生意向" 塞爾認(rèn)為,每當(dāng)實(shí)施一種具有命題內(nèi)容的以言行事行為時(shí),都會(huì)同時(shí)表達(dá)出一種具有那種命題內(nèi)容的特定的意向狀態(tài),而這種意向狀態(tài)就是那種類型的言語(yǔ)行為的真誠(chéng)條件。如:如果我作出了一個(gè)陳述“我一點(diǎn)都不讓你省心”,我就同時(shí)表達(dá)了一個(gè)信念:我相信“我一點(diǎn)都不讓你省心”;如果我因“我一點(diǎn)都不讓你省心”而表達(dá)歉意,那我就因“我一點(diǎn)都不讓你省心”這件事而難過(guò)。也就是說(shuō),只要作出以言行事行為,就必然伴生某種意向狀態(tài)。以言行事就等于同時(shí)表達(dá)了相應(yīng)的伴生意向狀態(tài),如果作出以言行事行為又否認(rèn)相應(yīng)意向狀態(tài)的存在,就如摩爾悖論(Moore’s paradox)一樣,不可能說(shuō)“祝賀你比賽取得了第一名,但我并不因?yàn)槟愕昧说谝幻械礁吲d?!彪m然這樣兩句話在邏輯上并不沖突,可以同時(shí)為真,但這樣的話聽起來(lái)卻非常怪異。
(3)對(duì)符號(hào)和言語(yǔ)行為進(jìn)行賦義的心靈意向" 要想施行一種言語(yǔ)行為,必須繼續(xù)向上追溯到一種更高層次的意向性,即能夠使得一種言語(yǔ)行為成為一種言語(yǔ)行為的意向,塞爾將其稱為意義意向。即當(dāng)施行一種言語(yǔ)行為時(shí),首先必須通過(guò)嘴發(fā)出聲音或在紙上作出記號(hào),這些聲音和記號(hào)作為物理實(shí)體,本身并不具有任何意向。而想要達(dá)到表意、行事或取效,就必須考慮如何從物理層面進(jìn)行到語(yǔ)義學(xué)問題。用心靈哲學(xué)的表述即是:心靈如何將意向性賦予那些并非本質(zhì)上具有意向性的實(shí)體。言語(yǔ)行為中的各種意向來(lái)源于何處,這是一個(gè)更底層的問題,正是對(duì)這個(gè)更底層問題的追問,才能為整個(gè)言語(yǔ)行為理論建立起一套整體的、融貫的意向性解釋方案,如果不回答這個(gè)問題,整個(gè)言語(yǔ)行為理論就是不徹底、不完整的。也正是在這個(gè)意義上,塞爾認(rèn)為語(yǔ)言哲學(xué)是心靈哲學(xué)的一個(gè)分支。
三、聯(lián)結(jié)主義方案能否實(shí)現(xiàn)
情感意向性
由于言語(yǔ)行為的意向只是一種派生意向,必須繼續(xù)向上追溯到一種最原初的內(nèi)在意向,追問心靈如何能對(duì)作為物理實(shí)體的聲音或文字符號(hào)進(jìn)行意向性賦予,所以對(duì)人機(jī)情感交互的討論最終還是會(huì)回到人類語(yǔ)言的意向性與語(yǔ)義性上來(lái),回到討論有沒有任何一種情感算法能夠使計(jì)算機(jī)真正理解人類言語(yǔ)行為中的意向,理解語(yǔ)言意義,從而實(shí)現(xiàn)與人類平等的情感交互上來(lái)。
隨著自然語(yǔ)言處理技術(shù)的不斷進(jìn)步,當(dāng)前有一種聲音認(rèn)為,聯(lián)結(jié)主義方案的各種神經(jīng)網(wǎng)絡(luò)如前饋神經(jīng)網(wǎng)絡(luò)(FNN, Feed-forward Neural Network)、卷積神經(jīng)網(wǎng)絡(luò)(CNN, Convolutional Neural Network)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN, Recurrent Neural Network)、BERT(Bidirectional Encoder Representation from Transformers)、GPT(Generative Pre-trained Transformer)等現(xiàn)已可以通過(guò)學(xué)習(xí)表現(xiàn)出人類意向性的部分特征,如自主性、關(guān)聯(lián)性、隨機(jī)應(yīng)變性等。尤其是chatGPT在自然語(yǔ)言生成上的優(yōu)異表現(xiàn),更是引發(fā)了人工智能行業(yè)空前的信心,認(rèn)為計(jì)算機(jī)在理解人類語(yǔ)言方面取得了重大突破,破解人類語(yǔ)言秘密的希望近在咫尺。針對(duì)這些論調(diào),我們需要仔細(xì)區(qū)分兩點(diǎn):1)聯(lián)結(jié)主義的神經(jīng)網(wǎng)絡(luò)表現(xiàn)出來(lái)的意向性是否是真正的人類心靈意義上的那種內(nèi)在的意向性;2)聯(lián)結(jié)主義處理自然語(yǔ)言的底層邏輯是否是人類理解自然語(yǔ)言,理解言語(yǔ)行為中的意向性的那種處理方式。
對(duì)第一個(gè)問題,支持者們認(rèn)為深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)可以通過(guò)訓(xùn)練學(xué)習(xí),不斷修正各個(gè)節(jié)點(diǎn)的權(quán)重,調(diào)整參數(shù),由此而表現(xiàn)出所謂的自主性、隨機(jī)應(yīng)變性等。但是實(shí)際上,權(quán)重修正和參數(shù)調(diào)整的規(guī)則,卻都是由使用者根據(jù)具體使用場(chǎng)景以及想要實(shí)現(xiàn)某種特定目的,事先進(jìn)行規(guī)定或設(shè)置的。同樣一種神經(jīng)網(wǎng)絡(luò),可以用于處理語(yǔ)音文本,也可以用于處理文字文本或圖像;可以用于機(jī)器翻譯,也可以用于文本分類、特征提取、語(yǔ)音生成。權(quán)重的調(diào)整規(guī)則可以自定義為:wij(t+1)=wij(t)+η f (xi),也可以定義為wij(t+1)=wij(t)+η f (xi-yj)。其中,wij(t+1)表示t+1時(shí)刻神經(jīng)元i和j之間的權(quán)重,wij(t)表示t時(shí)刻神經(jīng)元i和j之間的權(quán)重,η表示學(xué)習(xí)率,f (g)表示學(xué)習(xí)規(guī)則。兩個(gè)權(quán)重更新的不同之處在于前一個(gè)公式的學(xué)習(xí)規(guī)則由第i個(gè)神經(jīng)元的值xi決定,而后一個(gè)公式學(xué)習(xí)規(guī)則由第i個(gè)神經(jīng)元的值xi和第j個(gè)神經(jīng)元的值yj共同決定。所有這些規(guī)則,都是由使用者事先設(shè)計(jì),表現(xiàn)的是使用者的意向,而不是神經(jīng)網(wǎng)絡(luò)的意向。那種看起來(lái)是神經(jīng)網(wǎng)絡(luò)所具有的意向性,只是存在于神經(jīng)網(wǎng)絡(luò)的使用者,和對(duì)神經(jīng)網(wǎng)絡(luò)功能實(shí)現(xiàn)進(jìn)行編程的程序人員心里。無(wú)論哪一種神經(jīng)網(wǎng)絡(luò),無(wú)論其內(nèi)部聯(lián)結(jié)如何復(fù)雜,訓(xùn)練數(shù)據(jù)集、參數(shù)多么巨大,本質(zhì)都是通過(guò)模擬人類大腦的神經(jīng)元結(jié)構(gòu)來(lái)處理任務(wù),但是正如塞爾指出的,它們模擬的僅僅是突觸上神經(jīng)激發(fā)序列的形式結(jié)構(gòu),卻模擬不了大腦的因果特性:大腦產(chǎn)生意向性的能力。形式特性不能充分說(shuō)明因果性[9]。如果非要說(shuō)神經(jīng)網(wǎng)絡(luò)具有某種意向,也只能算是人類心靈的一種派生意向。
對(duì)第二個(gè)問題,以塞爾為代表的心靈哲學(xué)的支持者早已以“中文屋”論證讓我們看到,人類與計(jì)算機(jī)對(duì)于語(yǔ)言的處理是兩種完全不同的方式。一方面,中文屋中的“我”完全不懂中文,只能對(duì)輸入的中文符號(hào)按照給定的操作規(guī)則完成符號(hào)匹配并產(chǎn)生輸出,并不能真正理解這些中文符號(hào),理解由中文母語(yǔ)者的心靈賦予符號(hào)之上的意向與語(yǔ)義。相對(duì)地,遞入小屋中的操作手冊(cè)是英語(yǔ)編寫的,而“我”作為英語(yǔ)母語(yǔ)者,對(duì)操作規(guī)則卻是真正理解的。塞爾通過(guò)這種對(duì)比想要強(qiáng)調(diào)的是:計(jì)算機(jī)對(duì)符號(hào)所作的形式處理沒有任何意向性,因其處理語(yǔ)言的方式與意義全然無(wú)關(guān),他們甚至不是符號(hào)處理,因?yàn)檫@些符號(hào)什么都不代表。用語(yǔ)言學(xué)的行話來(lái)說(shuō),它們只有句法,沒有語(yǔ)義。計(jì)算機(jī)只能是句法機(jī),不是語(yǔ)義機(jī),甚至連句法機(jī)都算不上,因?yàn)橛?jì)算機(jī)內(nèi)部發(fā)生的是電脈沖的轉(zhuǎn)換,而并沒有句法轉(zhuǎn)換,句法轉(zhuǎn)換只是人類為了解釋計(jì)算機(jī)的行為而歸屬給它的[10]。
或許塞爾對(duì)此論證的語(yǔ)氣稍顯激烈,但毫無(wú)疑問,其觀點(diǎn)直接命中了計(jì)算機(jī)對(duì)自然語(yǔ)言處理方式的要害。自然語(yǔ)言處理從20世紀(jì)50年代至今,已經(jīng)歷了四代范式的變更[11]。從上世紀(jì)50-90年代基于規(guī)則(dictionary/lexicon+rule),到90年代至2012年基于統(tǒng)計(jì)(statistical models),到流行于2012-2018年間基于各種神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)模型(deep learning models),再到2018年之后出現(xiàn)的基于轉(zhuǎn)換器(transformer)的預(yù)訓(xùn)練加微調(diào)(pre-training+fine-tuning)模型,無(wú)論是哪一代范式,其處理方案背后的原理與機(jī)制,都只不過(guò)實(shí)現(xiàn)了塞爾所說(shuō)的按照規(guī)則操作實(shí)現(xiàn)從輸入到輸出的過(guò)程,而并未實(shí)現(xiàn)對(duì)語(yǔ)言符號(hào),或者對(duì)言語(yǔ)行為中的意向性和意義的理解。
考察一下最近的第三代和第四代范式使用的各種神經(jīng)網(wǎng)絡(luò),其工作流程都是待處理文本首先經(jīng)輸入層編碼為詞向量,這些詞向量通過(guò)隱藏層的加工,形成計(jì)算機(jī)能夠理解的特征代表,經(jīng)過(guò)多次加工后,計(jì)算機(jī)提取出向量在不同維度的特征,最后再經(jīng)輸出層將處理好的向量轉(zhuǎn)化為目標(biāo)語(yǔ)言。[12]其實(shí)質(zhì)是一個(gè)概率分布模型,對(duì)于語(yǔ)言里每一個(gè)字符串S給出一個(gè)概率P(S)來(lái)預(yù)測(cè)上下文單詞:
P(S)=P(w1w2L" wn)
=P(wnw1w2L" wn-1)P(w1w2L" wn-1)
=P(wnw1w2L" wn-1)
P(wn-1w1w2L" wn-2)P(w1w2L" wn-2)
=P(w1)P(wiw1w2L" wi-1)
以RNN對(duì)一個(gè)自然語(yǔ)言文本的處理為例,給定前n-1個(gè)單詞,求第n個(gè)單詞的概率。其工作原理示意如圖1:首先將“the”“students”“l(fā)oved”“their”四個(gè)單詞表示為獨(dú)熱向量,因獨(dú)熱向量維數(shù)過(guò)高,且無(wú)法表達(dá)單詞間的依賴關(guān)系,因此需要進(jìn)一步處理為詞嵌入向量,之后詞嵌入向量作為輸入,通過(guò)神經(jīng)網(wǎng)絡(luò)各層加權(quán)運(yùn)算之后,得到的輸出為一系列單詞的概率分布,其中,teacher和school的概率最高,由此可以預(yù)測(cè)the students loved their后面最有可能緊跟的就是這兩個(gè)詞。
聯(lián)結(jié)主義的神經(jīng)網(wǎng)絡(luò)對(duì)自然語(yǔ)言處理中的兩個(gè)關(guān)鍵技術(shù),一個(gè)是詞向量,一個(gè)是預(yù)測(cè)。詞向量意味著,神經(jīng)網(wǎng)絡(luò)在對(duì)自然語(yǔ)言處理的過(guò)程中,不是將詞作為離散的語(yǔ)言符號(hào),更不用理解附于這些符號(hào)之上的意向性或意義,而是通過(guò)在大型語(yǔ)料庫(kù)中計(jì)算一個(gè)詞語(yǔ)和另一個(gè)詞語(yǔ)共現(xiàn)的概率,將經(jīng)常出現(xiàn)在文本相似位置的詞直接轉(zhuǎn)換成一些實(shí)數(shù)值映射到N維空間中,如從“我喜歡小貓”和“我喜歡小狗”得到“小貓”和“小狗”語(yǔ)義相似,在向量空間中兩詞就會(huì)映射為較為接近的兩個(gè)點(diǎn)(如圖2所示)。而預(yù)測(cè)的意思則是,對(duì)于語(yǔ)言理解和生成,同樣不需要對(duì)語(yǔ)句經(jīng)過(guò)任何理解和意義轉(zhuǎn)換,只需給定一個(gè)詞或幾個(gè)詞,通過(guò)計(jì)算概率來(lái)預(yù)測(cè)它們可能的相鄰詞。預(yù)測(cè)的一種方法是通過(guò)連續(xù)詞袋模型(Continuous Bag of Words, CBOW)給出上文如“學(xué)生愛”來(lái)預(yù)測(cè)“老師”,另一種方法是通過(guò)連續(xù)跳元模型(skip-gram)給出“老師”來(lái)反向預(yù)測(cè)“學(xué)生愛”。
經(jīng)過(guò)上述分析可以看出,作為聯(lián)結(jié)主義根基的這種向量語(yǔ)義學(xué),是在語(yǔ)言內(nèi)部進(jìn)行形式操作,充其量只能表示語(yǔ)言內(nèi)部符號(hào)與符號(hào)間的共現(xiàn)關(guān)系,這種語(yǔ)義性只能算作語(yǔ)言內(nèi)部的一種形式意義,而完全無(wú)關(guān)語(yǔ)言的意向性意義。如果我們將語(yǔ)言的意義看成是包含形式與意向二者的一種二元關(guān)系,(其中,形式可定義為語(yǔ)言的符號(hào),但交流意向則應(yīng)被定義為語(yǔ)言之外的,以說(shuō)話者和聽話者交流雙方共同居住的外部世界為基礎(chǔ)。)用數(shù)學(xué)式表示為M?哿E×I,其中,E為自然語(yǔ)言表達(dá)式的集合,I為交流意向的集合,那么,聯(lián)結(jié)主義的向量語(yǔ)義學(xué)方案,無(wú)論是對(duì)語(yǔ)言的理解還是生成,都只是在E之內(nèi)按概率分布規(guī)則進(jìn)行句法操作,進(jìn)行單詞的排列組合,而根本不考慮與外部世界聯(lián)系的I。
四、意向性實(shí)現(xiàn):
自底向上還是自頂而下
對(duì)情感計(jì)算的語(yǔ)言處理工作原理進(jìn)行具體分析之后可以看出,情感意向在目前聯(lián)結(jié)主義的各種神經(jīng)網(wǎng)絡(luò)算法中既未實(shí)現(xiàn)第一二層言語(yǔ)行為及言語(yǔ)行為的伴生意向,更未能實(shí)現(xiàn)三重意向中最頂層的心靈意向。情感計(jì)算在語(yǔ)義與語(yǔ)用上的這些困境,可能會(huì)迫使我們思考最終只有走先解決心靈意向,進(jìn)而解決語(yǔ)義語(yǔ)用問題這一條自頂向下的道路,通過(guò)進(jìn)一步研究人類意向性的內(nèi)在機(jī)理,研究人類大腦實(shí)現(xiàn)意向性的過(guò)程與條件,探索是否還有其他可能的建模方式能實(shí)現(xiàn)內(nèi)在意向的指向性與關(guān)于性。2020年國(guó)際計(jì)算語(yǔ)言學(xué)協(xié)會(huì)(ACL, Association for Computational Linguistics)最佳主題論文《邁向自然語(yǔ)言理解:數(shù)據(jù)時(shí)代的意義、形式和理解》[13]明確質(zhì)疑目前的自然語(yǔ)言處理方案不是行進(jìn)在一條正確的道路上,認(rèn)為目前NLP各個(gè)領(lǐng)域雖然每年都在通過(guò)不斷改進(jìn)語(yǔ)言訓(xùn)練模型來(lái)飛速提升處理能力,但這些聯(lián)結(jié)主義方案的處理系統(tǒng)即使能通過(guò)圖靈測(cè)試,卻依然不是能夠從語(yǔ)言學(xué)意義上實(shí)現(xiàn)對(duì)各種語(yǔ)言理解的系統(tǒng),其根源就在于其理論構(gòu)建是自底向上的,他們提出應(yīng)該走一條相反的自頂向下的路子。
早在著名的技術(shù)現(xiàn)象學(xué)學(xué)者德雷福斯對(duì)人工智能的批判中就提出,人工智能應(yīng)該改變自己理性主義的哲學(xué)預(yù)設(shè),轉(zhuǎn)向海德格爾、梅洛·龐蒂的生存論現(xiàn)象學(xué),發(fā)展一種存在論處境中的具身智能,這種智能體以身體和世界的耦合關(guān)系為基礎(chǔ),通過(guò)身體在世界中存在,直接接受來(lái)自世界的邀請(qǐng),并對(duì)有意義的事物作出回應(yīng)。在智能體和世界問答的過(guò)程中,形成自己的初級(jí)意向弧,以擁有獨(dú)立的意向性結(jié)構(gòu)。[14]而在應(yīng)用工程領(lǐng)域,另一位反對(duì)現(xiàn)行聯(lián)結(jié)主義方案的人工智能專家霍金斯也曾嘗試提出一種自頂向下的建模方案,認(rèn)為人有意向性或者說(shuō)有語(yǔ)義理解能力,根本原因是人類有一個(gè)分層的記憶存儲(chǔ)系統(tǒng),這個(gè)系統(tǒng)為我們建起了一個(gè)關(guān)于世界的模型,使得我們可以思考自己的世界、與之交互并預(yù)測(cè)未來(lái)?;艚鹚固岢鼋⒁环N基于大腦皮層工作原理的記憶-預(yù)測(cè)模型,希望智能機(jī)器觀察周圍的世界來(lái)進(jìn)行學(xué)習(xí),經(jīng)過(guò)反復(fù)訓(xùn)練后通過(guò)感官構(gòu)建起一個(gè)它自己關(guān)于世界的模型。在此過(guò)程中,不需要去編寫程序、建立規(guī)則來(lái)描寫這個(gè)世界,也不需要任何當(dāng)前人工智能領(lǐng)域最頭痛的數(shù)據(jù)庫(kù)、知識(shí)庫(kù)或其它高級(jí)概念。一旦建立起一個(gè)關(guān)于世界的模型,就能依據(jù)過(guò)去的經(jīng)歷作出類推,從而對(duì)未來(lái)事件作出預(yù)測(cè)。[15]這兩種來(lái)自學(xué)界和工程界的聲音不謀而合,二者都提出自頂向下的方案,認(rèn)為如果先解決了最頂層的心靈意向問題,隨后的各種派生意向問題都自然能隨之解決,二者也都在試圖向外轉(zhuǎn),因?yàn)闊o(wú)論想實(shí)現(xiàn)哪一個(gè)層次的意向性,都離不開與外部世界的關(guān)聯(lián)。
參考文獻(xiàn)
[1]REDDY W M. The Navigation of Feeling: A Framework for the History of Emotions[M]. Cambridge: Cambridge University Press, 2001, Preface x.
[2]袁光鋒.情的力量——公共生活中的情感政治[M].南京:江蘇人民出版社,2022:34.
[3]PICARD R W. Affective Computing[M]. Cambridge, MA: MIT Press. 1997: 186.
[4]K·T·斯托曼.情緒心理學(xué)[M].張燕云譯,孟昭蘭審校.沈陽(yáng):遼寧人民出版社,1986:2.
[5]威廉·雷迪.情感研究指南——情感史的框架[M].周娜譯.上海:華東師范大學(xué)出版社,2020:132-133.
[6]BYRON R, CLIFFORD N. The Media Equation: How People Treat Computers, Televisions and New Media as Real People and Places[M]. Cambridge: Cambridge University Press, 1996: 123.
[7]高新民.現(xiàn)代西方心靈哲學(xué)[M].上海:華中師范大學(xué)出版社,2010.
[8]塞爾.意向性——論心靈哲學(xué)[M].劉葉濤、馮立榮譯.上海:上海人民出版社,2019.
[9]塞爾.心靈、大腦與程序[C]//瑪格麗特·博登.人工智能格學(xué).劉西瑞譯,上海:上海譯文出版社,2019:182.
[10]高新民.意向性理論的當(dāng)代發(fā)展[M].北京:中國(guó)社會(huì)科學(xué)出版社,2008:834.
[11]馮志偉.神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)與自然語(yǔ)言處理[J].上海師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2021,50(2):110-122.
[12]馮志偉.生成詞向量的三種方法[J].外語(yǔ)電化教學(xué),2021(1):18-26.
[13]EMILY M, BENDE R, ALLEXANDER K. Climbing towards NLU: On Meaning, Form, and Understanding in the Age of Data[C]. Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics. 2020(7).
[14]德雷福斯.計(jì)算機(jī)不能做什么[M].北京:三聯(lián)書店,1986:306.
[15]霍金斯、布拉克斯莉.人工智能的未來(lái)[M].賀俊杰等譯.西安:陜西科技出版社,2006:21.