伍京華,王佳瑩,張富娟,韓佳麗,葉慧慧+
(1.中國(guó)礦業(yè)大學(xué)(北京)管理學(xué)院,北京 100083;2.中國(guó)聯(lián)合網(wǎng)絡(luò)通信有限公司北京市分公司,北京 100052)
隨著全球經(jīng)濟(jì)和互聯(lián)網(wǎng)的快速發(fā)展,人類(lèi)商務(wù)活動(dòng)變得越來(lái)越頻繁,談判作為其中必不可少的商務(wù)活動(dòng),正日益受到重視?;谥悄荏w(Agent)的情感勸說(shuō)作為商務(wù)智能中的新型自動(dòng)談判模式,將Agent模擬人的情感和勸說(shuō)的人工智能優(yōu)勢(shì)相結(jié)合,以模擬人類(lèi)商務(wù)談判,不僅能較好地解決其中的遠(yuǎn)程異地談判問(wèn)題,還能較大地節(jié)約談判成本,提高談判效率,并能使談判結(jié)果與人類(lèi)商務(wù)談判擬合程度得到有效提高,已經(jīng)成為該領(lǐng)域研究重點(diǎn)[1-2]。但作為人工智能中的重要代表,Agent還具有另一項(xiàng)重要的優(yōu)勢(shì),即模擬人的信任,這對(duì)促進(jìn)基于Agent的情感勸說(shuō)更好地完成,使其決策與人類(lèi)商務(wù)談判擬合程度更高,都具有至關(guān)重要的作用,因此研究基于Agent的信任的情感勸說(shuō)決策模型,意義更加重大。
在基于Agent的信任決策方面,曹慕昆等[3]將信任引入基于Agent的自動(dòng)談判,并在信任評(píng)價(jià)機(jī)制中加入候選對(duì)象與競(jìng)爭(zhēng)者的交互記錄,以使Agent能更好地決策。劉義春等[4-5]根據(jù)直接交互經(jīng)驗(yàn)和推薦者的評(píng)價(jià)相似度,計(jì)算Agent的信任值,并建立了信任更新和獎(jiǎng)懲機(jī)制。楊興燚[6]將信任引入基于Agent的自動(dòng)談判,提出了新的信任獲取模型,對(duì)供應(yīng)商進(jìn)行選擇,并建立了基于Agent的信任的談判模型,即當(dāng)談判完成后要對(duì)對(duì)方Agent進(jìn)行評(píng)分,并存入數(shù)據(jù)庫(kù)中,以備接下來(lái)的評(píng)價(jià)更新,從而構(gòu)建了較為系統(tǒng)的基于Agent的信任的談判和評(píng)價(jià)模型。以上研究均考慮了交互過(guò)程對(duì)基于Agent的信任的影響和反饋,并提出了信任更新方法,但沒(méi)有考慮Agent的情感及勸說(shuō)對(duì)決策的影響。
在基于Agent的情感決策方面,郭尚波等[7-8]指出Agent的情感影響因素主要包括性格、外界刺激和情感衰減等,提出了由Agent的基本情感到擴(kuò)展情感的結(jié)構(gòu)模型,系統(tǒng)構(gòu)建了基于Agent的情感測(cè)量和決策模型。江道平等[9-10]以Agent的情感對(duì)決策的影響為出發(fā)點(diǎn),將Agent的外部刺激與內(nèi)部狀態(tài)相結(jié)合,構(gòu)建了基于Agent的情感決策模型。代凱峰[11]、Rincon等[12]提出一種多層情感認(rèn)知模型,構(gòu)建了具有理性和感性的擬人Agent,研究了基于Agent的情感決策過(guò)程。李靜等[13-14]通過(guò)Agent模擬人的不完全理性行為,引入前景理論和后悔理論,構(gòu)建了基于Agent的情感決策模型。以上研究均以Agent的情感對(duì)決策的影響為主線,研究了基于Agent的情感決策過(guò)程,但較少考慮信任及勸說(shuō)對(duì)決策的影響,因此還有待進(jìn)一步完善。
在基于Agent的信任的情感勸說(shuō)決策方面,Salgado等[15]針對(duì)如何測(cè)量Agent的情緒狀態(tài)方面存在的不足,綜合考慮Agent的情感、交互和學(xué)習(xí)過(guò)程,結(jié)合馬爾可夫博弈,提出了基于Agent的適應(yīng)性情緒框架模型。Ghusoon等[16-17]將信任與證據(jù)信息相結(jié)合,引入基于Agent的決策,通過(guò)仿真進(jìn)行了驗(yàn)證。楊件等[18-20]采用支持向量機(jī)的方法,對(duì)候選Agent在以往交易過(guò)程中的偏好、個(gè)性和情感等進(jìn)行學(xué)習(xí),建立了基于Agent的信任模型,最后綜合預(yù)期收益和信任度進(jìn)行決策。汪礦[21]將Agent的情感分為正面情感、負(fù)面情感和中性情感,通過(guò)隸屬度表示情感強(qiáng)度,將情感分析與信任評(píng)價(jià)相結(jié)合。提出了相應(yīng)模型。以上研究雖然都提出了一定模型,但采用的方法難以對(duì)Agent的情感、勸說(shuō)及信任綜合起來(lái)進(jìn)行有效量化,因此更無(wú)法體現(xiàn)其對(duì)基于Agent的情感勸說(shuō)決策的有效性。
因此,本文計(jì)劃在已有研究的基礎(chǔ)上,結(jié)合情感相關(guān)理論如大五性格、OCC(ortony,clore,collins)情感模型、情感強(qiáng)度第一定律等,以及信任和評(píng)價(jià)相關(guān)方法如語(yǔ)言評(píng)價(jià)法、將模糊數(shù)轉(zhuǎn)換為具體分?jǐn)?shù)(Converting Fuzzy data into Crisp Scores,CFCS)算法、信任更新因子、交互式多準(zhǔn)則決策(TOmada de Decisao Interativa e Multicritévio,TODIM)法等,進(jìn)一步深入研究信任和情感對(duì)決策的影響,構(gòu)建基于Agent的信任的情感勸說(shuō)決策模型。
在基于Agent的信任的情感勸說(shuō)中,Agent的決策主要受其自身情感強(qiáng)度變化(簡(jiǎn)稱(chēng)Agent的情感強(qiáng)度)和候選Agent的交易質(zhì)量,以及相應(yīng)的信任更新影響[18,22]。從已有研究來(lái)看,目前較有代表性的是文獻(xiàn)[23-25]。其中,文獻(xiàn)[23]對(duì)候選對(duì)象的信任度進(jìn)行了一定研究,提出了相應(yīng)的合作對(duì)象篩選方法。文獻(xiàn)[24-25]對(duì)模擬談判雙方的Agent的情感勸說(shuō)過(guò)程進(jìn)行了研究,提出了相應(yīng)的模型,并進(jìn)行了驗(yàn)證。因此,本文擬在這些研究的基礎(chǔ)上,分別針對(duì)情感強(qiáng)度、交易質(zhì)量、信任更新構(gòu)建相應(yīng)算法,并最終構(gòu)建出基于Agent的信任的情感勸說(shuō)決策模型。
在基于Agent的信任的情感勸說(shuō)中,Agent的情感強(qiáng)度變化主要來(lái)自于自身和外界兩方面。從自身來(lái)看,其性格和情感衰減是主要影響因素;而從外界來(lái)看,對(duì)方Agent的提議則是主要影響因素[7,22]因此本文對(duì)Agent的情感強(qiáng)度的算法建立在Agent自身性格、情感衰減以及外界刺激這3個(gè)變量基礎(chǔ)上。
1.1.1 基于Agent的自身性格的情感強(qiáng)度
大五OCEAN(openness(開(kāi)放性),conscientiousness(謹(jǐn)慎性),extraversion(外向性),agreeableness(宜人性),neuroticism(神經(jīng)質(zhì)))性格模型是目前心理學(xué)界最被認(rèn)可的性格模型,該模型認(rèn)為人的性格通過(guò)五個(gè)維度來(lái)體現(xiàn):開(kāi)放性、謹(jǐn)慎性、外向性、宜人性、神經(jīng)質(zhì)性[26]。因此,Agent的性格可以通過(guò)五元組Ocean=(Oo,Oc,Oe,Oa,On)表示。其中,Oo,Oc,Oe,Oa,On分別表示其中的五個(gè)特質(zhì)取值,且一般情況下Oo,Oc,Oe,Oa,On∈[0,1]。
心情空間模型目前應(yīng)用最廣泛的是Mehrabian提出的PAD(Pleasure(愉悅度)、Arousal(激活度)、Dominance(優(yōu)勢(shì)度))心情空間,包含愉悅度、喚醒度和支配度3個(gè)特質(zhì),三者相互獨(dú)立,構(gòu)成三維心情空間,以此描述心情[27]。因此,Agent的心情狀態(tài)可以通過(guò)三元組Pad=(Pp,Pa,Pd)表示。其中,Pp,Pa,Pd分別表示其中的3個(gè)特質(zhì)取值,且一般情況下Pp,Pa,Pd∈[-1,1]。
因此,Agent的個(gè)性與心情之間的映射關(guān)系可通過(guò)式(1)表示[27]:
結(jié)合以上研究及著名的OCC情感模型[28],可將Agent的情感分為24種狀態(tài),且每一種情感都有與之對(duì)應(yīng)的PAD心情空間值,如表1所示[29]。
表中Agent的PAD心情空間與OCC情感之間的映射關(guān)系通過(guò)式(2)表示[7-8]:
式中:VOCC=[V1,V2,…,V24]表示Agent的24種情感強(qiáng)度,表示其PAD心情到OCC情感的轉(zhuǎn)化矩陣,即表1中的量化關(guān)系。
表1 Agent的OCC情感對(duì)應(yīng)的PAD值
經(jīng)典的Ekman分類(lèi)將人的基本情感分為喜悅、悲傷、憤怒、驚奇、恐懼、厭惡6類(lèi)[30],本文依據(jù)該分類(lèi),將Agent的OCC 情感映射到這6 類(lèi)基本情感[31]中,得到基本的情感強(qiáng)度向量:I=[Ijoy,Isadness,Ianger,Isurperise,Ifear,Idigust]。其中:
綜上所述,本文進(jìn)一步將Agent的6種基本情感分為正向情感和負(fù)向情感,如表2所示。
表2 Agent的正向情感和負(fù)向情感
由此可得Agent的正、負(fù)向情感強(qiáng)度的計(jì)算分別為:
綜上可得基于Agent的自身性格的情感強(qiáng)度為Ipersonality=I正-I負(fù)。
1.1.2 基于Agent的情感衰減的情感強(qiáng)度
研究表明,情感具有瞬時(shí)性,隨著時(shí)間的推移,情感的衰減程度非常明顯,與指數(shù)形式y(tǒng)=e-x較為接近[7]。另外,根據(jù)馬爾科夫理論,在計(jì)算t時(shí)刻的情感強(qiáng)度時(shí),只需考慮前一時(shí)刻(t-1時(shí)刻)衰減后的情感強(qiáng)度值,t-2時(shí)刻及更早之前的情感衰減到t時(shí)刻的情感強(qiáng)度值與t-1時(shí)刻衰減到t時(shí)刻的情感強(qiáng)度值相比可以忽略不計(jì)[7]。由此可得基于Agent的情感衰減的情感強(qiáng)度為
式中:ψ(It)表示前一時(shí)刻情感衰減到當(dāng)前時(shí)刻的情感強(qiáng)度值,It-1表示前一時(shí)刻的情感強(qiáng)度值,Δt為時(shí)間間隔。
1.1.3 基于Agent的外界刺激的情感強(qiáng)度
情感強(qiáng)度第一定律表明,情感是事物價(jià)值率高差在人腦的主觀反應(yīng)[32],即
式中:Ie表示情感強(qiáng)度,km表示強(qiáng)度系數(shù),Δp表示價(jià)值率的高差。
在基于Agent的信任的情感勸說(shuō)中,外界刺激主要來(lái)源于與對(duì)方Agent談判成功時(shí)的議題值,因此價(jià)值率
式中:xm為Agent與對(duì)方Agent的談判成功議題值,xm∈[xmin,xmax];xmax,xmin分別為Agent所能接受的議題最大值和最小值;xexp為Agent對(duì)議題的期望值,xexp=(xmin+xmax)/2,x,xmin,xmax∈[0,10]。
綜上可得基于Agent的信任的情感勸說(shuō)中,Agent的情感強(qiáng)度算法為:
交易質(zhì)量是對(duì)談判以及合同執(zhí)行過(guò)程質(zhì)量好壞的綜合衡量。目前來(lái)看,還沒(méi)有較好的方法對(duì)其進(jìn)行合理表達(dá)和量化。例如,文獻(xiàn)[33]提出的評(píng)價(jià)方法對(duì)于定性指標(biāo)而言很難直接合理量化;文獻(xiàn)[34-35]采用的直覺(jué)語(yǔ)言評(píng)價(jià)法需要同時(shí)給出語(yǔ)言變量及其隸屬度和非隸屬度,但(非)隸屬度沒(méi)有統(tǒng)一的衡量標(biāo)準(zhǔn),難以判斷合理性;文獻(xiàn)[36]雖然考慮到采用語(yǔ)言變量對(duì)指標(biāo)進(jìn)行評(píng)價(jià),并通過(guò)三角模糊數(shù)量化,但沒(méi)有進(jìn)一步深入研究相應(yīng)的去模糊化過(guò)程。
因此,本文采用較有代表性的語(yǔ)言評(píng)價(jià),對(duì)其進(jìn)行合理表達(dá),如“好”、“較好”等[37],隨后采用三角模糊數(shù),將語(yǔ)言變量與數(shù)值對(duì)應(yīng),從而將其合理量化[38]。最后,為保證將該三角模糊數(shù)轉(zhuǎn)化為確定值的同時(shí),還能保證去模糊化過(guò)程信息丟失較少,采用CFCS算法對(duì)其進(jìn)行去模糊化處理[39],從而構(gòu)建出相應(yīng)的Agent的交易質(zhì)量算法,具體如下:
首先,構(gòu)建Rg={r0,r1,…,rg}為有序語(yǔ)言評(píng)價(jià)集,相應(yīng)的三角模糊數(shù)為[38]:
式中rk∈Rg為該集合中的第k+1個(gè)語(yǔ)言變量,且k∈{0,1,…,g},g為有限偶數(shù)。
其次,假設(shè)共有m個(gè)候選對(duì)象Agent、p個(gè)關(guān)于交易質(zhì)量的評(píng)價(jià)指標(biāo)、Agent邀請(qǐng)D名專(zhuān)家Agent、第d個(gè)專(zhuān)家采用語(yǔ)言評(píng)價(jià)集對(duì)第i個(gè)候選對(duì)象Agent的第q個(gè)指標(biāo)進(jìn)行評(píng)價(jià)。通過(guò)式(9)計(jì)算得出相應(yīng)的三角模糊數(shù),表示為
再次,采用CFCS算法[39]對(duì)該三角模糊數(shù)進(jìn)行去模糊化處理,具體步驟如下:
(1)三角模糊邊界值的規(guī)范化處理。
(3)指標(biāo)值的去模糊化處理。
(4)指標(biāo)值的確定。
式中viq為第i個(gè)候選對(duì)象Agent在第q個(gè)指標(biāo)下的評(píng)價(jià)值。
綜上可得基于Agent的信任的情感勸說(shuō)中,Agent對(duì)各候選對(duì)象Agent的交易質(zhì)量評(píng)價(jià)值為:
式中:Qi表示第i個(gè)候選對(duì)象Agent的交易質(zhì)量評(píng)價(jià)值;wq為第q個(gè)交易質(zhì)量評(píng)價(jià)指標(biāo)的權(quán)重,由較有代表性的專(zhuān)家打分法獲得。
基于Agent的信任的情感勸說(shuō)中,交易質(zhì)量的好壞也會(huì)使Agent對(duì)各個(gè)候選對(duì)象Agent的信任度產(chǎn)生一定反饋,進(jìn)而對(duì)后續(xù)的情感勸說(shuō)產(chǎn)生一定影響。因此,本文首先假設(shè)Agent對(duì)各個(gè)候選對(duì)象Agent的信任度為T(mén)i(i=1,2,…,m),且Ti∈[0,1];其次在文獻(xiàn)[4]中提出的信任更新因子算法的基礎(chǔ)上,以Qi/Ti大小為依據(jù),分Qi/Ti<0.5、0.5≤Qi/Ti<1、Qi/Ti≥1這3種情況建立信任更新因子,并引入對(duì)數(shù)函數(shù),具體如下:
(1)若Qi/Ti<0.5,則候選對(duì)象Agent的信任度迅速降低至原來(lái)的0.1倍,即若候選對(duì)象Agent在此次交易中表現(xiàn)很差,將嚴(yán)重影響自身的信任度,因此候選對(duì)象Agent在交易中會(huì)做出盡可能好的表現(xiàn)。
(2)若0.5≤Qi/Ti<1,則候選對(duì)象Agent的信任度會(huì)有一定程度降低,Agent在此次交易中表現(xiàn)越好,信任度降低越少,反之則降低越多。
(3)若Qi/Ti≥1,則候選對(duì)象Agent的信任度會(huì)有所提高,提高值隨著Qi/Ti的增加而緩慢增長(zhǎng),但能避免候選對(duì)象Agent僅在一次交易中表現(xiàn)很好而使其信任度得到過(guò)分提高。
從而給出相應(yīng)的信任更新因子ρ的算法如下:
最后,給出基于Agent的信任的情感勸說(shuō)中Agent的信任更新算法,即第i個(gè)候選對(duì)象Agent更新后的信任度為:
TODIM 法考慮了人類(lèi)的損失規(guī)避心理行為,能輔助不同心理偏好的決策者調(diào)整參數(shù),從而作出符合自身心理特征的決策,具有較強(qiáng)的靈活性[40-41]。熵權(quán)法通過(guò)信息熵原理確定權(quán)重,能獲得較為客觀的權(quán)重結(jié)果,避免人為確定的主觀性[42]。因此,本文在構(gòu)建以上算法的基礎(chǔ)上,采用TODIM法建立基于Agent的信任的情感勸說(shuō)決策模型,并采用熵權(quán)法對(duì)模型中的屬性權(quán)重進(jìn)行設(shè)定,具體步驟如下:
(1)建立Agent的情感強(qiáng)度、交易質(zhì)量及更新后的信任度的綜合評(píng)價(jià)矩陣為:
(2)對(duì)各個(gè)屬性值進(jìn)行標(biāo)準(zhǔn)化處理:
(3)得到新的標(biāo)準(zhǔn)化矩陣:
(4)對(duì)Z進(jìn)行歸一化處理:
(5)計(jì)算第j個(gè)屬性的信息熵:
(6)計(jì)算第j個(gè)屬性的權(quán)重為:
(7)計(jì)算屬性的相對(duì)權(quán)重:
假設(shè)Agent的情感強(qiáng)度、交易質(zhì)量和更新后的信任度的權(quán)重分別為w1,w2,w3,w*=max{w1,w2,w3}為參照權(quán)重,則Cj相對(duì)于參照屬性C*的相對(duì)權(quán)重為:
(8)計(jì)算屬性Cj下候選對(duì)象si相對(duì)于候選對(duì)象sk的優(yōu)勢(shì)度:
式中:i,k=1,2,…,m;j=1,2,3;θ為損失規(guī)避因子,表示Agent對(duì)待損失的心態(tài),θ越小,Agent對(duì)損失的規(guī)避程度越大,即Agent對(duì)損失越敏感[43]。
(9)計(jì)算候選對(duì)象si相對(duì)于其他候選對(duì)象的總體優(yōu)勢(shì)度:
(10)將總體優(yōu)勢(shì)度按以下公式規(guī)范化,并根據(jù)D(si)值對(duì)候選對(duì)象進(jìn)行排序:
為更好地闡述以上模型,假設(shè)煤炭行業(yè)供應(yīng)鏈管理中的采購(gòu)商Agentα和5個(gè)供應(yīng)商Agents1、Agents2、Agents3、Agents4、Agents5正在就無(wú)煙煤的交易進(jìn)行自動(dòng)談判,為節(jié)約談判成本和得到更好的談判結(jié)果,雙方采用基于Agent的信任的情感勸說(shuō)模式進(jìn)行,并假設(shè)這5個(gè)供應(yīng)商的信任度初始值及談判成功議題值如表3所示,Agentα上一時(shí)刻的情感強(qiáng)度為It-1=0.1,距當(dāng)前時(shí)間間隔為Δt=5。
表3 候選對(duì)象Agent的信任度以及與Agentα的談判成功議題值
首先,參考網(wǎng)址http://www.apesk.com/bigfive/index.asp?language=cn的測(cè)試方法,對(duì)Agentα進(jìn)行性格測(cè)試,得到Agentα的大五OCEAN 性格測(cè)試結(jié)果為Ocean=(22,15,20,24,10),將所得測(cè)試值除以30,得到標(biāo)準(zhǔn)值Ocean=(0.733,0.5,0.667,0.8,0.333),再分別由相應(yīng)算法,可得Ipersonality=-0.085 9、ψ(It)=0.000 7、=(-0.063 5,0.052 8,-0.041 4,0.055 9,-0.067 6),i=1,2,…,5,綜合可得Agentα 的情感強(qiáng)度為IAgentsi=(-0.148 7,-0.032 4,-0.126 5,-0.029 3,-0.152 8),i=1,2,…,5。
其次,假設(shè)Agentα邀請(qǐng)3名專(zhuān)家Agent對(duì)這5個(gè)候選對(duì)象Agent的交易質(zhì)量進(jìn)行評(píng)價(jià),指標(biāo)為勸說(shuō)過(guò)程愉悅度[23]、合同執(zhí)行度[44]、信息共享度[44]和勸說(shuō)溝通度[45],取語(yǔ)言評(píng)價(jià)集為R8={r0=極差,r1=很差,r2=差,r3=較差,r4=一般,r5=較好,r6=好,r7=很好,r8=極好},并將相應(yīng)的語(yǔ)言評(píng)價(jià)轉(zhuǎn)化為三角模糊數(shù),最后采用CFCS算法進(jìn)行去模糊化處理,得到這5個(gè)候選對(duì)象Agent的指標(biāo)評(píng)價(jià)值,具體如表4所示。
表4 3名專(zhuān)家Agent對(duì)這5個(gè)候選對(duì)象Agent的指標(biāo)評(píng)價(jià)
則相應(yīng)的交易質(zhì)量評(píng)價(jià)值為:Qi=(0.663 0,0.724 1,0.642 6,0.632 4,0.693 5),i=1,2,…,5,更新后的信任度值為T(mén)'i=(0.831 1,0.830 3,0.897 2,0.851 0,0.837 3),i=1,2,…,5。
綜上可得Agentα的情感強(qiáng)度、交易質(zhì)量及更新后的信任度的綜合評(píng)價(jià)矩陣為:
將該矩陣標(biāo)準(zhǔn)化后為:
計(jì)算各屬性權(quán)重,可得w1=0.326 2,w2=0.241 2,w3=0.432 6。其中w3最大,因此為參照權(quán)重,屬性Cj(j=1,2,3)相對(duì)于參照屬性C3的權(quán)重分別為:w'1=0.754 2,w'2=0.557 6,w'3=1。
假設(shè)Agentα屬于風(fēng)險(xiǎn)中立者,即對(duì)損失的規(guī)避程度一般,θ=1,可分別得到3個(gè)屬性下,這5個(gè)候選對(duì)象Agent兩兩比較之后的優(yōu)勢(shì)度矩陣,具體如下:
最后,可得這5個(gè)候選對(duì)象Agent的總體優(yōu)勢(shì)度為T(mén)(s1)=-9.113 2,T(s2)=-0.040 2,T(s3)=-4.330 6,T(s4)=-4.066 2,T(s5)=-6.444 1,進(jìn)行規(guī)范化處理后可得D(s1)=0,D(s2)=1,D(s3)=0.527 1,D(s4)=0.556 3,D(s5)=0.294 2,因此候選對(duì)象Agent的最終排序?yàn)锳gents2>Agents4>Agents3>Agents5>Agents1,Agents2即為Agentα選出的最優(yōu)對(duì)象。
損失規(guī)避因子θ是模型中最重要的參數(shù),如圖1所示為θ取不同值的決策結(jié)果。
(1)Agentα的損失規(guī)避程度與θ成反比。θ越小,候選對(duì)象Agent的優(yōu)勢(shì)度越低,反之則越高。例如,θ=0.5的Agentα要比θ=0.75的Agentα對(duì)損失更敏感,即損失規(guī)避程度更強(qiáng),因此θ=0.5的Agentα對(duì)5個(gè)候選對(duì)象Agent的優(yōu)勢(shì)度評(píng)價(jià)更低。
(2)當(dāng)Agentα的損失規(guī)避程度很強(qiáng)時(shí),候選對(duì)象Agent的優(yōu)勢(shì)度可能均為負(fù)值。隨著損失規(guī)避程度的減弱,候選對(duì)象Agent的優(yōu)勢(shì)度可能出現(xiàn)正值,故隨著損失規(guī)避心理行為的減弱,Agentα可能更關(guān)注候選對(duì)象Agent帶來(lái)的收益。
(3)θ取不同值時(shí),各候選對(duì)象Agent的優(yōu)勢(shì)度不同,導(dǎo)致最后排序可能也不同。例如,當(dāng)θ≤1.5時(shí),5個(gè)候選對(duì)象Agent的優(yōu)勢(shì)度排序?yàn)閟2>s4>s3>s5>s1,而當(dāng)θ≥2時(shí),5個(gè)候選對(duì)象Agent的排序變?yōu)閟2>s3>s4>s5>s1,此時(shí)Agents3和Agents4的順序發(fā)生了變化。
(4)損失規(guī)避因子θ越小,即Agentα對(duì)損失越敏感,各候選對(duì)象Agent的優(yōu)勢(shì)度差距越明顯,越有利于Agentα進(jìn)行比較,從而越有利于Agentα確定最優(yōu)候選對(duì)象Agent。
談判議題權(quán)重km也是模型中較為重要的參數(shù),如表5所示為km取不同值的決策結(jié)果。
表5 km取不同值的決策結(jié)果
(1)當(dāng)km取不同值時(shí),候選對(duì)象Agent的優(yōu)勢(shì)度和排序也不同。這是由于談判議題的重要性改變時(shí),刺激影響下Agent的情感強(qiáng)度也會(huì)變化,進(jìn)而影響最后的結(jié)果。
(2)當(dāng)km取不同值時(shí),Agents2的優(yōu)勢(shì)度也不同,但因?yàn)槠渌蜻x對(duì)象Agent與它差距較大,所以Agents2始終屬于最優(yōu)候選對(duì)象,其排序不受影響。
交易質(zhì)量的評(píng)價(jià)指標(biāo)權(quán)重wq也是模型中的重要參數(shù),如表6所示為wq取不同值的決策結(jié)果。
表6 wq取不同值的決策結(jié)果
(1)當(dāng)wq取不同值時(shí),候選對(duì)象Agent的優(yōu)勢(shì)度和排序也會(huì)隨之變化。這是由于指標(biāo)權(quán)重的改變導(dǎo)致交易質(zhì)量綜合評(píng)價(jià)值的變化,進(jìn)而對(duì)信任的反饋及最后結(jié)果都有影響。
(2)當(dāng)wq取不同值時(shí),Agents2的優(yōu)勢(shì)度也不同,但因?yàn)槠渌蜻x對(duì)象Agent與它差距較大,所以Agents2始終屬于最優(yōu)候選對(duì)象,其排序不受影響。
將不考慮Agentα對(duì)候選對(duì)象Agent的情感所得到的決策結(jié)果與考慮情感時(shí)的決策結(jié)果比較,結(jié)果如表7所示。
表7 不考慮情感與考慮情感的決策結(jié)果比較
(1)候選對(duì)象Agent的優(yōu)勢(shì)度和排序發(fā)生了變化。這是由于在不考慮情感的情況下,Agentα僅對(duì)交易議題價(jià)值率進(jìn)行比較,而未考慮其對(duì)Agent α的刺激所產(chǎn)生的情感并進(jìn)行比較,因此兩種情況下候選對(duì)象Agent的優(yōu)勢(shì)度和排序會(huì)有所不同。
(2)情感作為人類(lèi)思想的重要組成部分,對(duì)決策具有重要影響,因此利用Agent來(lái)模擬人類(lèi)情感,能使其更好地模仿人類(lèi)決策行為,從而做出更符合人類(lèi)行為的決策,更進(jìn)一步發(fā)揮其在人工智能方面的優(yōu)勢(shì)。
將本文提出的模型與熵權(quán)-TOPSIS 決策模型[42]進(jìn)行比較,可得結(jié)果如表8所示。
(1)當(dāng)θ<1和θ=1時(shí),分別表示Agentα厭惡風(fēng)險(xiǎn)和中立態(tài)度,本文提出的模型與熵權(quán)-TOPSIS決策模型的排序結(jié)果相同。而實(shí)際情況下,決策者面臨風(fēng)險(xiǎn)時(shí)大多采取損失規(guī)避或中立的態(tài)度,因此本文所提出的模型與實(shí)際相符。
表8 本文模型與熵權(quán)-TOPSIS決策模型的比較
(2)當(dāng)θ>1時(shí),表示Agentα偏好風(fēng)險(xiǎn),更關(guān)注獲得較大收益,本文提出的模型會(huì)出現(xiàn)兩種排序結(jié)果:
1)1<θ<1.67時(shí),Agentα對(duì)風(fēng)險(xiǎn)的偏好程度較小,候選對(duì)象Agent的排序?yàn)閟2>s4>s3>s5>s1,與θ≤1時(shí)的排序結(jié)果相同。
2)θ≥1.67時(shí),Agentα對(duì)風(fēng)險(xiǎn)的偏好程度較大,候選對(duì)象Agent的排序?yàn)閟2>s3>s4>s5>s1,與θ≤1時(shí)的排序結(jié)果不同。
(3)熵權(quán)-TOPSIS決策模型是完全理性下的決策模型,任何風(fēng)險(xiǎn)態(tài)度的Agentα通過(guò)該模型進(jìn)行決策,都會(huì)獲得相同的決策結(jié)果。而本文提出的模型可以使Agentα根據(jù)不同心理狀態(tài)調(diào)整參數(shù)θ,從而獲得不同決策結(jié)果,靈活性和適用性更強(qiáng)。
經(jīng)過(guò)歸納和梳理,與本文相關(guān)的代表性文獻(xiàn)有文獻(xiàn)[15-25]。與這些研究相比,本文做出的改進(jìn)和得出的結(jié)論總結(jié)如下:
(1)通過(guò)大五OCEAN 性格-PAD心情-OCC情感的映射,構(gòu)建了基于Agent的情感勸說(shuō)中,Agent模擬人具有的性格及其所產(chǎn)生的情感強(qiáng)度及相應(yīng)算法,進(jìn)一步發(fā)揮了Agent的人工智能優(yōu)勢(shì)。相比之下,文獻(xiàn)[23]雖然對(duì)基于Agent的信任的情感勸說(shuō)進(jìn)行了研究,但并沒(méi)有涉及到Agent的性格,也沒(méi)有在這方面構(gòu)建有效模型。
(2)考慮到Agent在上一時(shí)刻的情感會(huì)隨時(shí)間逐漸衰減,從而對(duì)當(dāng)前時(shí)刻Agent的情感產(chǎn)生影響,結(jié)合指數(shù)形式構(gòu)建情感衰減函數(shù),對(duì)該因素對(duì)Agent的情感強(qiáng)度影響進(jìn)行了更好的量化和計(jì)算。相比之下,文獻(xiàn)[24-25]雖然對(duì)Agent的決策進(jìn)行了建模,但僅考慮了Agent在當(dāng)前時(shí)刻的情感,沒(méi)有進(jìn)一步考慮情感隨時(shí)間逐漸衰減對(duì)Agent的情感強(qiáng)度的影響。
(3)引入心理學(xué)中的情感強(qiáng)度第一定律,對(duì)外界刺激影響下的Agent的情感強(qiáng)度進(jìn)行合理量化和計(jì)算,從而更進(jìn)一步發(fā)揮了Agent的人工智能優(yōu)勢(shì)。相比之下,文獻(xiàn)[15]雖然通過(guò)馬爾科夫模型計(jì)算外界刺激影響下兩個(gè)Agent之間的情感距離,但側(cè)重于對(duì)情感親密程度的研究,沒(méi)有進(jìn)一步考慮適合本研究的由外界刺激引起的Agent的情感強(qiáng)度變化。
(4)綜合運(yùn)用語(yǔ)言評(píng)價(jià)、三角模糊數(shù)和CFCS算法,對(duì)Agent的交易質(zhì)量進(jìn)行評(píng)價(jià)。既對(duì)其中的各項(xiàng)指標(biāo)進(jìn)行了合理表述和量化,又使其過(guò)程和結(jié)果與人類(lèi)談判思維擬合程度更高。相比之下,文獻(xiàn)[22]雖然運(yùn)用了模糊綜合評(píng)價(jià)法,但對(duì)評(píng)語(yǔ)等級(jí)劃分不夠詳細(xì),不利于模糊評(píng)價(jià)的充分發(fā)揮,也沒(méi)有結(jié)合有效算法,沒(méi)有對(duì)這些算法進(jìn)行較好的去模糊化處理。
(5)考慮到交易質(zhì)量對(duì)信任的反饋,對(duì)文獻(xiàn)[4]中提出的信任更新因子進(jìn)行改進(jìn),并引入對(duì)數(shù)函數(shù),給出更適合本研究的Agent的信任更新因子及算法。相比之下,文獻(xiàn)[16-17]僅對(duì)其中的信任進(jìn)行了靜態(tài)評(píng)價(jià),沒(méi)有從動(dòng)態(tài)角度建立信任更新算法,文獻(xiàn)[18-20]雖然通過(guò)機(jī)器學(xué)習(xí)模擬了信任更新過(guò)程,但沒(méi)有考慮交易質(zhì)量對(duì)信任的反饋。
(6)將Agent的情感強(qiáng)度、交易質(zhì)量和信任更新有效聚合,并運(yùn)用TODIM 法進(jìn)行比較,使Agent能根據(jù)自身的損失規(guī)避心理行為進(jìn)行參數(shù)調(diào)整,做出科學(xué)決策,因而更具靈活性和適用性。相比之下,文獻(xiàn)[21,23-25]僅對(duì)其中一個(gè)或兩個(gè)屬性進(jìn)行了相關(guān)研究,且模型中對(duì)Agent人工智能特性的發(fā)揮不夠,未考慮Agent模仿人類(lèi)的心理行為。
本文雖然構(gòu)建了基于Agent的信任的情感勸說(shuō)決策模型,豐富了該領(lǐng)域各項(xiàng)理論,但仍然存在一定的不足之處,將其和下一步研究方向歸納如下:
(1)Agent的情感影響因素有很多,本文雖然對(duì)3個(gè)較重要的因素——Agent的自身性格、情感衰減和外界刺激進(jìn)行了初步探索,但對(duì)于其他影響因素尚未考慮。因此,下一步計(jì)劃考慮更多的Agent的情感影響因素,進(jìn)一步豐富該領(lǐng)域相關(guān)理論。
(2)雖然進(jìn)行了算例分析,對(duì)其實(shí)際應(yīng)用領(lǐng)域進(jìn)行了探索,但由于研究重點(diǎn)在于模型的構(gòu)建,采用的數(shù)據(jù)以假設(shè)為主,且還沒(méi)有開(kāi)發(fā)相應(yīng)的仿真系統(tǒng)。因此,下一步計(jì)劃在進(jìn)一步完善該模型的基礎(chǔ)上,采用實(shí)際數(shù)據(jù),并進(jìn)行更深入和徹底的仿真系統(tǒng)開(kāi)發(fā)及分析。