吳 磊
(合肥市食品藥品檢驗中心,安徽 合肥230088)
互聯(lián)網(wǎng)的普及使得消費者與企業(yè)或企業(yè)與企業(yè)間利用電子商務(wù)進(jìn)行協(xié)商交易已成必然,通過代理人就可以自動快速、無距離限制完成交易。代理人協(xié)商是兩個或多個軟件代理人之間,通過不斷重復(fù)地提出提議值,達(dá)成相互可接受協(xié)議的過程,要求代理人具有智慧學(xué)習(xí)能力,可學(xué)習(xí)動態(tài)協(xié)商戰(zhàn)略。假設(shè)代理人在協(xié)商前已經(jīng)擁有與其他使用時間依賴策略(Timedependent Tactic,TDT)[1]為協(xié)商戰(zhàn)略的代理人的協(xié)商經(jīng)驗,進(jìn)而建立規(guī)則庫幫助協(xié)商,根據(jù)其中的規(guī)則猜測對方的態(tài)度,再配合修正的TDT來建構(gòu)一種協(xié)商模式。選擇判定樹來建立規(guī)則庫,判定樹是人工智能領(lǐng)域里的分類和預(yù)測工具,是以樹形圖為基礎(chǔ)的最簡單明了的歸納式學(xué)習(xí)方法,通過分類已知的某些例子來建構(gòu)判定樹,從中可歸納出某些規(guī)律性。產(chǎn)生出來的判定樹,也能應(yīng)用來對未知的結(jié)果做預(yù)測。相較其他方法,判定樹具備良好的解釋能力,可以幫助用戶建立其專業(yè)知識。并且以協(xié)商次數(shù)、聯(lián)合效用與效率作為績效指標(biāo),發(fā)現(xiàn)所提的協(xié)商戰(zhàn)略能有效地改善協(xié)商結(jié)果。
常用的協(xié)商決策函數(shù)[2]包括時間依賴策略(TDT)、資源依賴策略與行為依賴策略。在此以TDT為協(xié)商雙方使用的策略。在協(xié)商過程中,TDT依協(xié)商時間調(diào)整提議值,該策略行為主要受態(tài)度參數(shù)β的影響。時間依賴的提議值為式(1)、式(2)。其中xja→b(tn)為代理人α對代理人b在時間tn對議題j的提議值,tmax表代理人的協(xié)商期限,因此t0≤t≤tmax,而αaj(tn)為隨時間變動的函數(shù),其中kja為常數(shù),表示代理人a對議題j提出的初始值。
β值是影響收斂速度的主要因素,根據(jù)β的大小,TDT可分為兩類函數(shù),分別是Boulware(B)和Conceder(C)[3],兩類函數(shù)在讓步程度上存在差異。當(dāng)β<1時,為Boulware策略,代理人將會盡力保持初始值,直到接近協(xié)商期限時,才會開始大幅收斂。當(dāng)β>1時,提議值會很快逼近保留值。式(3)與式(4)為代理人的評分函數(shù),其功能為評估自身與對方代理人所提的提議值,給1個分?jǐn)?shù),然后利用方程式(5)來判斷是否接受對方代理人的提議值。
可通過很多績效指標(biāo)來測量協(xié)商結(jié)果的公平性與合理性。如協(xié)商次數(shù)、效率與公平性等[4]。各績效指標(biāo)如圖1所示。在此采用協(xié)商次數(shù)、聯(lián)合效用與效率作為評估協(xié)商結(jié)果的協(xié)商指標(biāo)。
(2)聯(lián)合效用:此績效指標(biāo)測量雙方的社會福利。以協(xié)商雙方的效用和作為計算式,見公式(6),其中x為協(xié)商的協(xié)議;Ua(x)與Ub(x)為代理人a與b的效用:
(3)效率:效率在圖1中表示為曲線“效率協(xié)議”。當(dāng)協(xié)議越靠近該曲線,表示越有效率。而在該曲線上必定會有一個以上的點相對于其他的點聯(lián)合效用最大,此點稱為“柏拉圖最佳解”。
圖1 效率、聯(lián)合效用與公平性
因協(xié)商空間龐大,特設(shè)定以下假設(shè)條件:
(1)協(xié)商議題為價格與數(shù)量,價格議題的協(xié)商區(qū)間固定為60,數(shù)量議題的協(xié)商區(qū)間固定為100。
(2)Boulware策略以β=0.3代表,Conceder策略以β=3.0代表。
(3)協(xié)商期限固定為50。
(4)賣方先出價。
表1為建立推測模型學(xué)習(xí)例的雙方的實驗參數(shù)組合,議題以間隔10為一個實驗條件,權(quán)重以間隔0.4為1個實驗條件,策略有Boulware和Conceder兩種選擇。雙方以TDT為協(xié)商戰(zhàn)略,共進(jìn)行20 736組實驗,如果協(xié)商次數(shù)在50次前結(jié)束的實驗則不列入實驗數(shù)據(jù),因此實驗數(shù)據(jù)共有20 731組數(shù)據(jù)。根據(jù)方程式(7),選取每組協(xié)商時間t為9、19、29、39與49時,雙方的提議值加上計算雙方提議值在整個協(xié)商區(qū)間的比例R(tn)。t*為t9、t19、t29、t39、與t49。因此判定樹的輸入屬性為賣方的β值、R(t9)、R(t19)、R(t29)、R(t39)與R(t49),輸出屬性則為買方的β值。
表1 建立推測模型學(xué)習(xí)例的實驗參數(shù)組合
在協(xié)商過程中,一旦賣方代理人猜測出買方代理人的態(tài)度(β值),為了保持出值過程的單調(diào)性,如果賣方代理人須改變自己的態(tài)度(β值),賣方代理人的協(xié)商戰(zhàn)略即從方程式(2)修正為MTDT,如方程式(8)。
在此設(shè)計的協(xié)商架構(gòu)如圖2所示,實線表示每回合都進(jìn)行的動作,而虛線表示不是每回合都有回傳值。相較于買方,賣方有兩種出價戰(zhàn)略,一為TDT,二為MTDT。每回合中,買賣雙方都會通過TDT提出提議值,但賣方同時會將協(xié)商的數(shù)據(jù)傳入推測模型,期望能猜出對手的態(tài)度,一旦猜出對手的態(tài)度,則賣方可選擇使用TDT或MTDT。協(xié)商流程如圖3所示,賣方先提出提議值后,買方使用方程式(4)與方程式(5)計算雙方的評分值,再使用方程式(6)判斷是否接受對方的提議值。如果接受對手的提議值,則代表買方代理人協(xié)商成功,則此次協(xié)商會立刻結(jié)束,反之則會繼續(xù)協(xié)商。賣方在接收到買方所提出的反提議值后,也會判斷是否接受買方所提的提議值。當(dāng)雙方都不滿意對方的提議值時,就會一直進(jìn)行協(xié)商,如此反復(fù)協(xié)商直到有一方接受協(xié)商,或是超出協(xié)商時間,才會結(jié)束本次協(xié)商。然而賣方與買方不同的是賣方有猜測對方協(xié)商態(tài)度的機制與MTDT,賣方會在每回合根據(jù)推測模型里的規(guī)則猜測對方的協(xié)商態(tài)度,假設(shè)已符合某規(guī)則,則賣方會決定協(xié)商戰(zhàn)略是否變更,直到協(xié)商結(jié)束。
圖2 協(xié)商架構(gòu)
圖3 協(xié)商流程
為了驗證在賣方猜出買方的態(tài)度后,是否愿意改變自身態(tài)度,將協(xié)商決策函數(shù)(NDF)與之前提出的協(xié)商模式進(jìn)行比較,并以(I)賣方態(tài)度為Boulware,買方態(tài)度為Boulware;(II)賣方態(tài)度為Boulware,買方態(tài)度為Conceder;(III)賣方態(tài)度為Conceder,買方態(tài)度為Boulware;(IV)賣方態(tài)度為Conceder,買方態(tài)度為Conceder為實驗,試圖找出賣方較好的決策。表2為協(xié)商條件,得出的結(jié)果如表3所示。
表2 協(xié)商實驗條件
表3 協(xié)商結(jié)果
所有戰(zhàn)略組合的協(xié)商結(jié)果見表3,粗體字為賣方在改變自身的態(tài)度與否的情況比較下較佳的結(jié)果。在實驗(I)與實驗(IV)中,也就是買方態(tài)度為Boulware戰(zhàn)略時,賣方改變自身的態(tài)度會得到較短的協(xié)商次數(shù)與較佳的效率,而聯(lián)合效用不變。在實驗(IV)中,因為雙方都使用Conceder戰(zhàn)略,因此協(xié)商在賣方尚未判斷出買方的態(tài)度即協(xié)商結(jié)束,在此情形下賣方只能采取TDT。在實驗(II)使用TDT會得到較佳的聯(lián)合效用與效率,但若使用判定樹則是可以縮短協(xié)商時間。由上述實驗可得賣方的最適協(xié)商態(tài)度與戰(zhàn)略。
電子商務(wù)代理人協(xié)商模型的構(gòu)建具有重要的應(yīng)用價值,假設(shè)賣方代理人在協(xié)商前擁有與其他使用TDT為協(xié)商戰(zhàn)略的買方代理人的協(xié)商經(jīng)驗,以此經(jīng)驗建立推測買方態(tài)度的判定樹,進(jìn)而利用此判定樹建立推測買方態(tài)度的推測模型,準(zhǔn)確推測到買方的協(xié)商態(tài)度,賣方可根據(jù)買方的態(tài)度決定是否變更自己的態(tài)度與戰(zhàn)略,以期達(dá)到較佳的協(xié)商結(jié)果。實驗結(jié)果發(fā)現(xiàn),不論買方的態(tài)度為何,使用判定樹與所對應(yīng)的最適協(xié)商態(tài)度與戰(zhàn)略,都可在維持原有聯(lián)合效用不變下,顯著降低協(xié)商次數(shù)。