伍京華,吳學(xué)橋
1.中國礦業(yè)大學(xué)(北京)管理學(xué)院,北京100083
2.北京交通大學(xué) 經(jīng)濟管理學(xué)院,北京100044
基于Agent的自動談判[1-2]利用Agent的人工智能優(yōu)勢,采用計算機模擬人們談判,既能解決實際談判中的異地問題,還能在節(jié)約談判人工和時間等成本的基礎(chǔ)上,有效提高談判效率和效果,因此處于商務(wù)智能中自動談判研究前沿。
實際商務(wù)談判往往是多屬性的,但由于談判屬性性質(zhì)不同,評價模型也不同,導(dǎo)致基于Agent的自動談判中的多屬性評價問題一直未能很好解決[3],進一步導(dǎo)致基于Agent的自動談判發(fā)揮Agent的人工智能優(yōu)勢不夠充分,因此使得對其中多屬性評價的研究具有重要的理論意義和實際價值。目前,該領(lǐng)域研究主要集中于基于Agent的自動談判研究[4]、基于Agent的多屬性研究[4]、基于Agent的多屬性評價研究三個方面[4]。
在基于Agent的自動談判方面,Radu[4]建立了捕捉對手行為要素的談判模型,并提出基于遺傳算法的策略設(shè)計方法以提高Agent的表現(xiàn),但沒有考慮讓步或妥協(xié)等對談判結(jié)果的影響。Vahidov等[5]研究了基于Agent的自動談判策略與任務(wù)復(fù)雜性的相互作用,以及對Agent的評價產(chǎn)生的影響,該研究僅以問題數(shù)量表示談判任務(wù)的復(fù)雜性,較為片面。Mell等[6]提出在線交互式人機談判平臺LAGO,考慮人的意識影響,加強Agent與人的交互,但是沒能對Agent模擬人的情感深入研究。Haleema等[7]提出了基于Agent的靈活談判策略及模型,考慮保留值和上一輪談判提議,并能快速將提議縮小至雙方期望值,也對Agent模擬人的情感研究不夠。Franciscoa等[8]提出了基于Agent的分布式模糊預(yù)測控制模型,在合作博弈算法中引入模糊推理機制,使談判過程更平穩(wěn),但應(yīng)用的模糊規(guī)則對成員函數(shù)的精確度影響較大。
在基于Agent的多屬性方面,Nassiri-Mofakham等[9]提出基于Agent的多屬性競價策略,綜合考慮了競買人的個性、多單位交易項目集、偏好以及市場情況,但只考慮數(shù)量和價格,屬性較為單一。曹慕昆等[10]基于多目標優(yōu)化遺傳算法得出pareto邊界的出價組合,并通過修正得到雙方滿意值,研究了基于Agent的多屬性決策模型,但模型中的談判策略還有豐富的機會。在此基礎(chǔ)上,張奇志[11]提出了基于Agent及遺傳算法的談判模型,Agent可以動態(tài)選擇合適策略來應(yīng)對談判對方Agent發(fā)出的提議,但該研究過多關(guān)注雙方效用的約束關(guān)系,沒有考慮情感對談判屬性值的動態(tài)影響。
在基于Agent的多屬性評價方面,伍京華等[12]運用多屬性效用函數(shù),建立了以Agent為主體的提議評價模型,并運用模糊隸屬度函數(shù)建立了相應(yīng)的Agent主體信度評價模型,最后結(jié)合情感強度計算構(gòu)建了基于Agent的合作主體選擇模型,該研究將情感分類為積極、消極和中性三類,較為簡單,存在一定局限。此后,伍京華等[13]重新定義基于Agent的情感勸說的決策過程,結(jié)合多屬性效用評價定義了引入情感因子的情感觸發(fā)函數(shù),并建立Agent基本情感與勸說目標的映射關(guān)系和相應(yīng)的決策模型,但研究的屬性都是量化型屬性。曹慕昆等[14]研究了適用于基于Agent的自動談判的多屬性談判的固定策略和學(xué)習(xí)策略,通過學(xué)習(xí)對手策略進行微小讓步,形成組合策略,提高Agent的談判靈活性,他們的研究同樣對基于Agent的情感涉及不多。
綜上,本文首先結(jié)合猶豫模糊理論,構(gòu)建基于多屬性的方案;其次,將屬性分為等級屬性和數(shù)量屬性,采用語言術(shù)語集對等級屬性進行區(qū)間數(shù)轉(zhuǎn)換,并給出將數(shù)量屬性轉(zhuǎn)換成區(qū)間數(shù)的方法;再次,綜合以上研究,引入總體貢獻率,對理想貼近度模型進行改進,提出基于總體貢獻率的相對貼近度模型,從而提出基于Agent的改進貼近度的多屬性評價模型,并對模型步驟及流程圖進進行了歸納和梳理;最后,以北京市碳排放權(quán)交易為背景擬定算例和數(shù)據(jù),通過計算和對比分析驗證了該模型的合理性和有效性。
基于Agent的自動談判中,Agent能模擬人的各種心理和行為,從而對談判結(jié)果產(chǎn)生影響[15]。因此,為了使談判結(jié)果更符合實際,需要對Agent模擬人的這些心理和行為對其在談判中的多屬性影響進行描述,即構(gòu)建基于多屬性的方案。
猶豫模糊理論運用不確定性數(shù)據(jù)對事物的不確定性判斷進行描述,能較好表達評價過程中存在的猶豫傾向,從而使不易被評價的信息被準確量化后易于評價[16],因此適于用來構(gòu)建本文研究的基于多屬性的方案。具體如下:
通過定義非空集合H為模糊區(qū)間集,給出該方案為公式(1)[17]:
其中,Tj代表各屬性,h(Tj)是屬性Tj的隸屬度區(qū)間。
簡化后為公式(2):
該公式的含義為,屬性T1的隸屬度是區(qū)間[α1,β1]之間的數(shù),其余以此類推。
文獻[12]將屬性分為成本型屬性和效益型屬性,文獻[18]將成本型屬性全部轉(zhuǎn)化為效益型屬性,文獻[19]在將屬性分為成本型屬性和效益型屬性的同時,分別按照評價值類型對屬性進行數(shù)值型評價和隨機變量型評價的劃分處理。
以上分類都是從成本效益的角度做出的,而很多既不屬于成本也不屬于效益的屬性往往也是評價的重要參考因素,因此不適合本文的研究。
為彌補以上缺陷,本文在這些研究的基礎(chǔ)上,將基于Agent的自動談判中的屬性分為等級屬性和數(shù)量屬性,以更適合本文研究。
(1)等級屬性
該屬性是指評價值以等級形式給出的屬性,例如企業(yè)信用、產(chǎn)品質(zhì)量等,其值是諸如“信用較差”“質(zhì)量高”之類的等級式評價語言。
(2)數(shù)量屬性
該屬性是指評價值都是具體數(shù)值的屬性,例如產(chǎn)品0價格、購買數(shù)量等,其值是諸如“價格100元”“數(shù)量20,級區(qū)個”之類的準確性數(shù)據(jù)。
由于等級屬性值和數(shù)量屬性值的類型不同,因此為更適合展開進一步研究,本文采用語言術(shù)語集將等屬性值轉(zhuǎn)換成區(qū)間數(shù),并給出將數(shù)量屬性值也轉(zhuǎn)換成間數(shù)的方法,從而對這兩種屬性值進行統(tǒng)一,供下節(jié)構(gòu)建評價模型使用。
語言術(shù)語集是有限個連續(xù)的模糊性評價語言集合,能包含針對某一屬性的所有評價信息,能較好表述談判屬性的不確定性和猶豫性[20],因此適于用來進行等級屬性值的區(qū)間數(shù)轉(zhuǎn)換。
例如,假設(shè)對某方案的某等級屬性值為S={S0=低,S1=較低,S2=中,S3=較高,S4=高},對應(yīng)區(qū)間數(shù)為S0=[0,0.2],S1=[0.2,0.4],S2=[0.4,0.6],S3=[0.6,0.8],S4=[0.8,1],采用語言術(shù)語集可將其轉(zhuǎn)化成相應(yīng)的區(qū)間數(shù),則區(qū)間[0,0.2]代表屬性值“低”,其余以此類推。
在基于Agent的自動談判中,數(shù)量屬性值存在一定的談判區(qū)間。因此,本文給出以下公式,將數(shù)量屬性值轉(zhuǎn)換成相應(yīng)的區(qū)間數(shù):
其中,[Yaccmin,Yaccmax]分別表示談判中的買方Agent所能接受的數(shù)量屬性最低值和最高值,[Ymin,Ymax]則分別表示談判中的賣方Agent所能接受的數(shù)量屬性最低值和最高值。
例如,假設(shè)某賣方Agent的某產(chǎn)品議價區(qū)間為[43,45]元,而買方Agent對該產(chǎn)品的價格的接收區(qū)間是[39,49]元,通過公式(3)轉(zhuǎn)換后可得賣方Agent的產(chǎn)品議價區(qū)間數(shù)為[0.4,0.6]。
結(jié)合以上研究,為構(gòu)建該模型,首先需要設(shè)定正負理想方案X+和X-作為方案評價的標準;其次要在對各備選方案進行區(qū)間化處理的基礎(chǔ)上構(gòu)建合適的距離測度方法,用于方案評價的排序;最后設(shè)定相應(yīng)的步驟和流程對模型進行描述。
在基于Agent的自動談判中,首先設(shè)定正負理想方案,作為Agent進行方案評價時的最優(yōu)和最差標準,分別以公式(4)和(5)表示:其中,X+、X-分別表示正負理想方案。
首先,為對備選方案與正負理想方案進行評價,需要計算方案之間的距離?,F(xiàn)有的距離測度模型如海明距離、曼哈頓距離等都無法保證對兩區(qū)間的絕對距離測度足夠精確[21-23],而經(jīng)典的Euclidean Distance距離測度模型則能做到[24-26]。因此,本文采用該模型,通過公式(6)計算方案之間的距離:12
其中,α1、β1是區(qū)間h的左右端點,α2、β2是區(qū)間h的左右端點。
其次,需要計算每個方案與正負理想方案之間的距離,具體如公式(7)和公式(8):其中,j∈N*,L+(Xi,X+)和L-(Xi,X-)分別表示方案Xi與正負理想方案X+、X-之間的距離,wj表示方案的各屬性權(quán)重,以向量W=(w1,w2,…,wn)t表示,αj、βj是某方案的第j個屬性的區(qū)間左右端點,αj+、βj+是最優(yōu)方案的第j個屬性的區(qū)間左右端點,αj-、βj-同理。
L+(Xi,X+)越小,離正理想方案距離越近,表明此方案越優(yōu);L-(Xi,X-)越大,離負理想方案距離越遠,方案也越優(yōu)。
再次,由于以上計算并不能保證與正理想方案距離最近的方案同時與負理想方案之間的距離最遠,因此需要尋找一種更加合理有效的模型來有效解決該問題。
Hadi-Vencheh和Mirjaberi[27]提出的理想貼近度模型通過引入劣比來表示最優(yōu)尺度,反映正理想方案最近距離與負理想方案最遠距離之間的平衡,其值越接近零,方案越優(yōu)。但在備選方案較多、需要做大量篩選的情況下,該模型對各個方案的計算都是分開進行,彼此獨立,這會導(dǎo)致出現(xiàn)方案貼近度過于接近或相等,從而導(dǎo)致不利于Agent進一步選擇及增加談判時間等缺點??傮w貢獻率將所有備選方案視為整體進行考量,每個方案都互相影響,方案不同而貢獻率不同,能較好解決這些問題。因此,本文在對文獻[27]提出的理想貼近度模型進行改進的基礎(chǔ)上,結(jié)合總體貢獻率思想,提出基于總體貢獻率的相對貼近度模型,用于方案評價的排序,具體以公式(9)表示:示備選方案各屬性與正理想方案
綜合以上研究,可得模型的具體步驟為:
步驟1為Agent設(shè)定正負理想方案和各屬性權(quán)重,并由Agent確定備選方案。
步驟2Agent將方案中的屬性識別劃分為等級屬性和數(shù)量屬性,并將值分別轉(zhuǎn)換為對應(yīng)的區(qū)間數(shù)形式。
步驟3Agent計算各方案與正負理想方案的距離。
步驟4Agent計算各方案的相對貼近度并進行排序,做出決策。
首先,假設(shè)在北京市碳交易市場中,代表企業(yè)的Agent就碳排放權(quán)交易展開自動談判,談判屬性為價格、額度、信用和活躍度。再假設(shè)買方Agent設(shè)定價格接受區(qū)間為19~28元,需要的額度為420~500 t,對企業(yè)信用等級的評價主要為{差、較差、一般、良好、優(yōu)秀},對企業(yè)交易活躍度的評價主要有{低、較低、中等、較高、高},屬性權(quán)重向量為W=(0.38,0.32,0.19,0.11),備選方案及正負理想方案如下:
方案1議價區(qū)間為[23.95,25.3],額度為[420,440],信用較差,活躍度較低。
方案2議價區(qū)間為[22.15,23.5],額度為[460,468],信用較差,活躍度低。
方案3議價區(qū)間為[21.7,24.4],額度為[444,448],信用一般,活躍度較高。
方案4議價區(qū)間為[24.4,26.65],額度為[456,464],信用良好,活躍度中等。
方案5議價區(qū)間為[19,22.15],額度為[432,448],信用一般,活躍度中等。
方案6議價區(qū)間為[22.6,23.95],額度為[452,464],信用較差,活躍度較低。
方案7議價區(qū)間為[22.6,24.85],額度為[436,452],信用一般,活躍度較高。
方案8議價區(qū)間為[24.4,26.2],額度為[468,472],信用優(yōu)秀,活躍度中等。
方案9議價區(qū)間為[22.6,24.85],額度為[444,464],信用一般,活躍度較低。
方案10議價區(qū)間為[22.6,23.5],額度為[456,468],信用一般,活躍度較低。
方案11議價區(qū)間為[23.05,24.4],額度為[436,452],信用一般,活躍度較高。
方案12議價區(qū)間為[24.85,26.2],額度為[452,464],信用良好,活躍度中等。
正理想方案議價區(qū)間為[22.6,24.4],額度為[448,472],信用良好,活躍度較高。
負理想方案議價區(qū)間為[25.75,28.00],額度為[476,500],信用較差,活躍度較低。
其次,將上述備選方案轉(zhuǎn)換成區(qū)間數(shù)形式,構(gòu)造方案屬性值矩陣如表1。
表1 備選方案屬性值矩陣
并將正負理想方案也轉(zhuǎn)化成區(qū)間數(shù)形式:
再次,分別采用文獻[27]提出的理想貼近度模型和本文提出的相對貼近度模型進行計算,并根據(jù)結(jié)果對備選方案排序,具體如下:
(1)采用文獻[27]提出的模型
各備選方案理想貼近度為:
備選方案排序為X11=X7>X3>X12>X4>X8>X5>X10>X9>X2>X6>X1,最佳備選方案為方案7或方案11。
(2)采用本文提出的模型
各備選方案相對貼近度為:
備選方案排序為X11>X7>X3>X8>X12>X4>X5>X1>X10>X2>X9>X6,最優(yōu)備選方案為方案11。
圖1 是采用兩種模型計算得到的貼近度對比圖,由圖1可知:
(1)與采用文獻[27]提出的模型相比,采用本文提出的模型能幫助Agent更進一步選擇。例如,采用文獻[27]提出的模型,備選方案7和11的貼近度均為?0.8,Agent無法進一步選擇。而采用本文提出的模型,備選方案7的貼近度為75.4,備選方案11的貼近度為75.57,能幫助Agent更進一步選擇更優(yōu)方案,即方案11。
(2)采用文獻[27]提出的模型計算得到的各方案貼近度相差不大,表現(xiàn)為圖中的曲線平穩(wěn)。而采用本文提出的模型計算得到的各方案貼近度相差較大,表現(xiàn)為圖中的曲線更曲折。這不僅更有利于Agent在更多備選方案中做出快速選擇,而且能在節(jié)約談判時間的基礎(chǔ)上保證談判效果。
(3)采用文獻[27]提出的模型計算的貼近度相互獨立,如果方案增多,將會給Agent選擇增加復(fù)雜度,采用本文提出的模型則能較好解決該問題。
圖1 采用兩種模型計算得到的貼近度對比圖
本文結(jié)合猶豫模糊理論構(gòu)建基于多屬性的方案,并將屬性分為等級屬性和數(shù)量屬性,給出將這兩種屬性轉(zhuǎn)換成區(qū)間數(shù)的方法后引入總體貢獻率,對理想貼近度模型進行改進,提出基于總體貢獻率的相對貼近度模型,從而提出基于Agent的改進貼近度的多屬性評價模型。設(shè)計的算例及分析表明,本文提出的模型能降低復(fù)雜度,有助于Agent在更多備選方案中做出快速選擇,節(jié)約談判時間,同時還能幫助Agent更進一步選擇更優(yōu)方案。