蔡淑琴,王 旸,王藝興,秦志勇,竇聰穎
(1.華中科技大學(xué)管理學(xué)院,湖北 武漢 430074;2.深圳證券交易所,廣東 深圳 518038;3.華中科技大學(xué)新聞與信息傳播學(xué)院,湖北 武漢 430074)
隨著Web技術(shù)的快速發(fā)展和廣泛應(yīng)用,社會(huì)化媒體正以驚人的速度滲透到社會(huì)的各個(gè)方面,不僅為用戶提供了獲取信息的渠道,還為用戶構(gòu)建了發(fā)布內(nèi)容和建立關(guān)系的平臺(tái)。用戶參與、用戶主導(dǎo)、用戶創(chuàng)造已經(jīng)成為社會(huì)化媒體吸引用戶、增強(qiáng)競(jìng)爭(zhēng)力、提高企業(yè)價(jià)值的有力工具,生成了大量有商業(yè)價(jià)值的用戶創(chuàng)造內(nèi)容(User Generated Content,簡(jiǎn)稱 “UGC”)。作為UGC的一種獨(dú)特形式,在線負(fù)面口碑(Online Negative Word-of-Mouth,簡(jiǎn)稱“ONWOM”)是消費(fèi)者在互聯(lián)網(wǎng)中對(duì)企業(yè)表達(dá)的負(fù)面觀點(diǎn)和評(píng)論[1],具有數(shù)據(jù)大、傳播速度快、破壞力強(qiáng)[2]、拒絕解釋[3]等特點(diǎn),相比企業(yè)發(fā)出的信息,負(fù)面口碑更容易得到他人信任[4]。如果企業(yè)未能及時(shí)響應(yīng)處理,會(huì)引發(fā)大面積的消費(fèi)者不滿,進(jìn)而造成企業(yè)聲譽(yù)受損,品牌價(jià)值降低等嚴(yán)重后果[5]。然而,由于ONWOM有數(shù)量大、傳播速度快等特點(diǎn),企業(yè)單純依靠傳統(tǒng)人工處理方法會(huì)面臨成本高、反應(yīng)速度慢和資源短缺的困境。
社會(huì)化媒體為用戶提供了交流互動(dòng)的平臺(tái),用戶可以在其中搜索信息、發(fā)布內(nèi)容和建立關(guān)系,隨著用戶數(shù)量增加和用戶間互動(dòng)增強(qiáng),少量擁有更多知識(shí)的用戶逐漸凸顯,成為專家用戶。Riahi等[6]實(shí)驗(yàn)發(fā)現(xiàn)少量專家用戶為網(wǎng)絡(luò)社區(qū)提供了大部分知識(shí),他們?cè)跒樗私鉀Q問(wèn)題和分享知識(shí)過(guò)程中建立了個(gè)人權(quán)威,這不僅實(shí)現(xiàn)了其個(gè)人價(jià)值,也為所在平臺(tái)提供了更多資源,使其成為社會(huì)化媒體高質(zhì)量知識(shí)的重要外部來(lái)源。負(fù)面口碑處理中,企業(yè)過(guò)度參與可能會(huì)被懷疑而導(dǎo)致喪失自身公信力[7],若客戶不滿意企業(yè)對(duì)負(fù)面口碑直接做出的反饋將會(huì)帶來(lái)更強(qiáng)烈的負(fù)面情緒[3]。因此,將UGC中的專家用戶看作ONWOM處理資源進(jìn)行ONWOM處理,可為企業(yè)提供ONWOM處理的新途徑。如果能夠識(shí)別出這些專家,并給予適當(dāng)引導(dǎo),企業(yè)可以依賴他們擴(kuò)充自身知識(shí)庫(kù),擴(kuò)展可調(diào)動(dòng)資源范圍,借助專家知識(shí)面廣、知識(shí)成本低、容易與其他用戶溝通等優(yōu)勢(shì)優(yōu)化服務(wù)流程、提高服務(wù)質(zhì)量、改善服務(wù)體驗(yàn),進(jìn)而提高整體服務(wù)水平。但是隨機(jī)選擇用戶作為服務(wù)方很難達(dá)到滿意的處理效果[8],因此如何提前識(shí)別合適的用戶形成服務(wù)方專家?guī)?專家識(shí)別)是需要解決的關(guān)鍵問(wèn)題。
現(xiàn)有相關(guān)研究已有若干成果。閆強(qiáng)和孟躍[9]研究證明擁有較為極端的情感傾向和較長(zhǎng)的正文的評(píng)論會(huì)正面影響在線評(píng)論的感知有用性。Archak等[10]通過(guò)實(shí)驗(yàn)證明可以從在線評(píng)論數(shù)據(jù)中提取可操作的信息資源,更好地理解客戶的偏好和行動(dòng)。Pfeffer等[11]討論了負(fù)面口碑網(wǎng)絡(luò)傳播風(fēng)暴的后果,并提供了網(wǎng)絡(luò)負(fù)面口碑危機(jī)的行動(dòng)指導(dǎo)。Surachartkumtonkun等[12]基于需求理論,用實(shí)證方法進(jìn)行研究認(rèn)為消費(fèi)者抱怨是為了尋求相應(yīng)的經(jīng)濟(jì)補(bǔ)償和自尊補(bǔ)償。蔡淑琴等[13]提出了RFMS模型來(lái)測(cè)量在線口碑發(fā)布者的影響力,應(yīng)用人工神經(jīng)網(wǎng)絡(luò)識(shí)別出意見(jiàn)領(lǐng)袖。Yang等[14]以學(xué)術(shù)研究社區(qū)為背景,認(rèn)為除了個(gè)人之間的鏈接關(guān)系,還需考慮研究者所在機(jī)構(gòu)間的連接強(qiáng)度信息對(duì)專家識(shí)別的作用,通過(guò)整合關(guān)聯(lián)信息、個(gè)人社交網(wǎng)絡(luò)信息給專家建立多層次的人物畫像,并驗(yàn)證了方法的有效性。
由以上綜述可知,現(xiàn)有研究存在以下局限:首先,現(xiàn)有研究大多是針對(duì)問(wèn)答或?qū)W者推薦的專家識(shí)別,少有專門針對(duì)ONWOM處理的專家識(shí)別研究,本文針對(duì)ONWOM處理特殊情境的具體要求,需識(shí)別適合此情境的相關(guān)專家;其次,現(xiàn)有研究大多只考慮用戶的知識(shí)能力并未將專家用戶看作ONWOM處理資源進(jìn)行識(shí)別,然而本文研究中,ONWOM發(fā)布方有尋求知識(shí)解決方案和情感撫慰?jī)煞矫嫘枨螅琌NWOM處理的特殊性使得僅從知識(shí)能力出發(fā)的專家專家識(shí)別性能不夠,不能滿足ONWOM發(fā)布方所有需求導(dǎo)致ONWOM處理失敗甚至引發(fā)更強(qiáng)烈的抱怨;最后,基于鏈接的識(shí)別方法大多從用戶權(quán)威角度出發(fā),沒(méi)有明確相應(yīng)專家的能力結(jié)構(gòu),推薦的專家不具有針對(duì)性,面對(duì)ONWOM處理的特殊需求時(shí),難以達(dá)到好的效果,不方便企業(yè)實(shí)際應(yīng)用。
針對(duì)以上問(wèn)題,本文研究社會(huì)化媒體中ONWOM處理的專家識(shí)別問(wèn)題,認(rèn)為用戶屬性、用戶發(fā)布內(nèi)容等UGC資源是用戶隱性知識(shí)的顯性表示,可以利用這些資源進(jìn)行專家識(shí)別。設(shè)計(jì)的ONWOM處理專家識(shí)別方法中,將專家用戶看作ONWOM處理資源,從資源視角出發(fā),建立專家識(shí)別資源映射框架,專家識(shí)別過(guò)程除了考慮體現(xiàn)用戶專業(yè)水平的知識(shí)能力,還融入了專家參與ONWOM處理的情感撫慰能力,并將用戶互動(dòng)程度引入到用戶能力特征空間,以此構(gòu)建ONWOM處理的專家能力得分計(jì)算模型,實(shí)現(xiàn)專家識(shí)別并顯著提高了識(shí)別性能。
原始UGC資源有非結(jié)構(gòu)化、碎片化、去中心化等特點(diǎn),無(wú)法直接用于ONWOM處理,需要經(jīng)過(guò)處理加工轉(zhuǎn)換為合適的形式,才能最大限度的提高ONWOM處理成功率。為清晰理解專家識(shí)別中資源的形式和轉(zhuǎn)換規(guī)律,本節(jié)從資源視角出發(fā),分析專家識(shí)別過(guò)程中資源的轉(zhuǎn)換過(guò)程,或稱為“資源映射”過(guò)程。
本文專家識(shí)別的資源映射過(guò)程涉及UGC資源、顯性資源和隱性資源三種狀態(tài)。其中,顯性資源是對(duì)原始信息資源的結(jié)構(gòu)化表示,描述了資源構(gòu)成要素,剔除了無(wú)關(guān)或作用較小的噪音信息,并從集合層面對(duì)資源進(jìn)行聚合,降低了UGC資源的碎片性。隱性資源也源自原始信息資源,但是以顯性資源為基礎(chǔ),通過(guò)相關(guān)計(jì)算方法得到滿足需求的知識(shí)或能力測(cè)量,是資源價(jià)值的量化表示。相對(duì)應(yīng),根據(jù)資源形式的不斷轉(zhuǎn)換,將資源映射過(guò)程分為顯性資源映射和隱性資源映射兩個(gè)階段,以此提出面向ONWOM處理的專家識(shí)別資源映射框架如圖1。
圖1 面向ONWOM處理的專家識(shí)別資源映射框架
圖1的框架中虛線左側(cè)部分表示專家識(shí)別中由用戶UGC資源集得到用戶專家得分的過(guò)程,虛線右側(cè)大方框部分是從資源視角理解的與獲得用戶專家得分過(guò)程對(duì)應(yīng)的資源映射過(guò)程,虛線表示兩個(gè)過(guò)程中資源的對(duì)應(yīng)關(guān)系。
框架左側(cè)部分包括兩個(gè)階段,第一階段完成了從用戶UGC資源集向用戶特征表示的轉(zhuǎn)換,此部分對(duì)應(yīng)資源視角的顯性資源映射,第二階段完成了從用戶特征表示向用戶專家得分的轉(zhuǎn)換,此部分對(duì)應(yīng)資源映射視角的隱性資源映射。在第一階段中,確定用戶特征表示包含的特征元素是其中的關(guān)鍵,隨意選擇特征不僅無(wú)法識(shí)別出合適的專家用戶,甚至可能導(dǎo)致ONWOM處理失敗。為此,如框架左側(cè)上方的兩個(gè)圓角方框所示,本文從ONWOM處理的問(wèn)題背景出發(fā),以O(shè)NWOM發(fā)布方的價(jià)值需求為起點(diǎn),可以確定成功實(shí)現(xiàn)ONWOM處理的需求,這些需求一方面是資源需求體現(xiàn),另一方面是專家能力結(jié)構(gòu)體現(xiàn)。專家識(shí)別中,在通過(guò)以上分析過(guò)程獲得專家需要具有的能力結(jié)構(gòu)后,將其與用戶UGC資源集的真實(shí)數(shù)據(jù)集合,可得到體現(xiàn)用戶能力結(jié)構(gòu)的用戶特征表示,實(shí)際上這是一個(gè)從用戶創(chuàng)造的數(shù)據(jù)中挖掘體現(xiàn)其能力結(jié)構(gòu)的顯性表示的過(guò)程。在第二階段中,由于前一階段得到的用戶能力結(jié)構(gòu)只是對(duì)用戶具有相關(guān)能力的特征描述集合,而專家識(shí)別中需要能體現(xiàn)用戶能力的單一量化指標(biāo),即專家得分,此得分是用戶能力和價(jià)值的量化表示,根據(jù)得分對(duì)用戶進(jìn)行降序排序,獲得分?jǐn)?shù)靠前的用戶即是專家用戶??梢栽O(shè)計(jì)或選擇合適的計(jì)算方法實(shí)現(xiàn)從用戶特征表示到專家得分的轉(zhuǎn)換。
框架右側(cè)部分是從資源視角對(duì)左側(cè)專家識(shí)別相關(guān)過(guò)程的理解,包括顯性資源映射和隱性資源映射兩個(gè)映射階段。其中,顯性資源映射是從UGC資源向顯性資源的轉(zhuǎn)換,隱性資源映射是從顯性資源向隱性資源的轉(zhuǎn)換。
與傳統(tǒng)專家識(shí)別不同,本文專家識(shí)別過(guò)程中不僅考慮了直接體現(xiàn)用戶專業(yè)水平的知識(shí)能力,還考慮了專家參與ONWOM處理的情感撫慰能力,并借助情緒感染機(jī)制獲得情感能力的量化指標(biāo)。此外,本文將用戶互動(dòng)程度也引入到用戶能力特征空間,以此構(gòu)建人工神經(jīng)網(wǎng)絡(luò)模型,實(shí)現(xiàn)專家識(shí)別。
本文研究中,ONWOM發(fā)布方有尋求知識(shí)解決方案和情感撫慰?jī)煞矫嫘枨?,相?duì)應(yīng),如果要成功處理ONWOM,作為服務(wù)方的專家需要具有滿足這兩方面需求的能力。即可認(rèn)為知識(shí)方案提供能力(簡(jiǎn)稱“知識(shí)能力”)和情感撫慰能力(簡(jiǎn)稱“情感能力”)是專家能力的組成部分。其中,知識(shí)能力是專家滿足ONWOM發(fā)布方尋求知識(shí)解決方案需求的能力,情感能力是專家滿足ONWOM發(fā)布方尋求情感撫慰需求的能力。每個(gè)用戶的時(shí)間和精力是有限的,在特定情境下,有處理能力的用戶并不一定都愿意參與ONWOM處理,而有參與意愿的用戶也不一定有足夠的處理能力。因此,專家需具有參與ONWOM處理的意愿,只有處理能力而不愿參與ONWOM處理的用戶不是本文所指的專家,只有參與意愿而沒(méi)有足夠處理能力的用戶也不是本文所指的專家。因此,為保證價(jià)值共創(chuàng)過(guò)程的實(shí)現(xiàn),互動(dòng)階段對(duì)服務(wù)方專家有互動(dòng)能力的要求,即服務(wù)方除了具有上述知識(shí)方案提供能力和情感撫慰能力外,還需具有較高的參與價(jià)值共創(chuàng)互動(dòng)的程度,簡(jiǎn)稱“互動(dòng)程度”。
由上述分析可知,ONWOM處理的服務(wù)方專家能力包括知識(shí)能力、情感能力和互動(dòng)程度三方面,其中互動(dòng)程度是發(fā)揮專家能力的前提條件,知識(shí)能力和情感能力是實(shí)現(xiàn)ONWOM處理的能力體現(xiàn),用戶參與ONWOM處理的意愿各不相同,具有的知識(shí)能力和情感能力也往往參差不齊,而且人數(shù)眾多[8],要想保證ONWOM處理的成功率,需要從以上三方面特征出發(fā),識(shí)別用戶中的專家。因此,可將用戶特征表示形式化如式(1):
U=(KC,EC,DI)
(1)
其中U表示用戶,KC表示知識(shí)能力,是Knowledge Capability的縮寫。EC表示情感能力,是Emotional Capability的縮寫。DI表示互動(dòng)程度,是Degree of Interaction 的縮寫。由用戶的UGC資源得到式(1)的形式化表示,對(duì)應(yīng)圖1的顯性資源映射過(guò)程。
為使設(shè)計(jì)能落到數(shù)據(jù)層面,下面分析以問(wèn)答社區(qū)為現(xiàn)實(shí)環(huán)境,認(rèn)為在此環(huán)境中進(jìn)行ONWOM處理,分別對(duì)知識(shí)能力、情感能力和互動(dòng)程度三個(gè)特征維度中涉及的細(xì)化指標(biāo)進(jìn)行分析,并給出具體的測(cè)量方法,假設(shè)UGC資源均以文本形式出現(xiàn)。
3.1.1 知識(shí)能力特征
粉絲數(shù)經(jīng)常被用來(lái)說(shuō)明用戶的權(quán)威性[15],這在社交網(wǎng)絡(luò)較強(qiáng)的社會(huì)化媒體中效果較好,高粉絲數(shù)對(duì)用戶等級(jí)有很大提升作用,但在知識(shí)為導(dǎo)向的問(wèn)答社區(qū)中,通過(guò)粉絲關(guān)系很難獲得提問(wèn)者的認(rèn)同,得到其他用戶直接求助才是對(duì)其知識(shí)能力的最直接認(rèn)可。文本長(zhǎng)度是體現(xiàn)文本質(zhì)量的重要指標(biāo),較長(zhǎng)的文本意味著更詳細(xì)的解釋,相比短文本更容易被接受[16]。同時(shí),較長(zhǎng)的文本能包含更生動(dòng)的內(nèi)容,面對(duì)內(nèi)容接收者時(shí)更有說(shuō)服力[17],在ONWOM處理中,發(fā)布者就更容易接受服務(wù)方提供的服務(wù)。每個(gè)提問(wèn)者會(huì)根據(jù)自身情境提出問(wèn)題,而每個(gè)人所處的情境大多不同,答案被最了解問(wèn)題情境的提問(wèn)者采納是對(duì)回答者問(wèn)題解決能力的認(rèn)可,被采納的答案越多說(shuō)明回答者的知識(shí)能力越高。提問(wèn)者和回答者之外的其他用戶同樣可表達(dá)對(duì)回答的看法,如果他們贊同回答者提供的答案,說(shuō)明這些用戶認(rèn)為回答者提供了提問(wèn)者需要的知識(shí)。作為第三方平臺(tái),問(wèn)答社區(qū)常對(duì)質(zhì)量符合一定規(guī)范的高質(zhì)量答案給予標(biāo)記,如有些答案被標(biāo)記為精華答案標(biāo)簽,這是對(duì)回答者知識(shí)能力的社區(qū)認(rèn)可。
根據(jù)以上分析,本文選擇以下指標(biāo)為描述用戶知識(shí)能力的特征,包括滿意答案數(shù)、采納率、收到求助數(shù)、贊同數(shù)、精華答案數(shù)、答案平均長(zhǎng)度。其中滿意答案數(shù)為提問(wèn)者接納用戶答案為滿意答案的總數(shù),收到求助數(shù)是提問(wèn)者指定此特定用戶為回答者的次數(shù),答案平均長(zhǎng)度指用戶提供的所有答案的文本長(zhǎng)度的平均值。
3.1.2 情感能力特征
在心理學(xué)領(lǐng)域,情緒感染指?jìng)€(gè)體之間感知捕獲環(huán)境中其他人的情緒變化,包括無(wú)意識(shí)、不自覺(jué)的的情緒模仿或趨同,或者有意識(shí)、主動(dòng)的情緒認(rèn)知和控制下,實(shí)現(xiàn)的不同個(gè)體間的情緒交互和聚合過(guò)程[18]。發(fā)布方的負(fù)面情緒在服務(wù)方正面情緒的影響下得到緩解是一個(gè)情緒感染過(guò)程。因此,本文假設(shè)用戶情感撫慰過(guò)程是一個(gè)情緒感染過(guò)程,服務(wù)方相對(duì)發(fā)布方的情感越正面,其能成功進(jìn)行正面情緒感染的可能性越大,進(jìn)而實(shí)現(xiàn)情感撫慰的可能性就越大。杜建剛和范秀成[19]采用環(huán)境刺激方法,實(shí)證研究了在服務(wù)失敗和服務(wù)補(bǔ)救中服務(wù)者對(duì)消費(fèi)者的情緒感染。發(fā)現(xiàn)服務(wù)失敗過(guò)程中,服務(wù)者的負(fù)面情感越強(qiáng)烈,消費(fèi)者的負(fù)面情緒增加就越多,在服務(wù)補(bǔ)救中,服務(wù)者的正面情感越強(qiáng)烈,消費(fèi)者由負(fù)面情感向正面情感轉(zhuǎn)化幅度越大。本文并不研究社會(huì)化媒體中不同媒介與情緒感染的關(guān)系,而是認(rèn)為專家通過(guò)文本對(duì)ONWOM發(fā)布方實(shí)現(xiàn)情緒感染,達(dá)到情感撫慰的目的,以此說(shuō)明專家能力需包括情感能力特征。
根據(jù)以上分析,本文選擇以下指標(biāo)為描述用戶情感能力的特征,包括答案平均情感得分,答案情感相對(duì)正面率。
本文在計(jì)算問(wèn)題和回答文本d的情感極性和強(qiáng)度時(shí),首先對(duì)文本d進(jìn)行分詞、去停用詞處理得到其結(jié)構(gòu)化表示,然后將得到的每個(gè)詞與情感詞典中的詞進(jìn)行匹配,匹配到的正面、負(fù)面和中性詞極性分別記為1、-1和0,將d中包含的所有情感詞的極性與強(qiáng)度乘積和作為其情感得分,形式化如式(2):
(2)
其中SSd表示文本d的情感得分,|d|表示d中包含的情感詞數(shù),SPi表示第i個(gè)情感詞的極性值,SIi表示第i個(gè)情感詞的情感強(qiáng)度,且1≤i≤|d|。SS、SP、SI分別是Sentiment Score、Sentiment Polarity和Sentiment Intensity的縮寫。
由(2)計(jì)算得到用戶提供的所有答案的情感得分后,可用用這些答案情感得分的平均值作為用戶的答案平均情感得分。統(tǒng)計(jì)用戶回答的所有問(wèn)題中答案情感得分比問(wèn)題情感得分高的問(wèn)答對(duì)個(gè)數(shù),可得答案情感相對(duì)正面數(shù),形式化如式(3)和(4):
(3)
(4)
其中P={p1,p2,…,p|P|}表示某單個(gè)用戶提供的所有答案所在的問(wèn)答對(duì)集,|P|是此集合包含的問(wèn)答對(duì)個(gè)數(shù),其中第j個(gè)問(wèn)答對(duì)pj=(qj,aj)包含一個(gè)問(wèn)題qj和一個(gè)答案aj,PLN表示問(wèn)答對(duì)集P對(duì)應(yīng)用戶的答案情感相對(duì)正面數(shù)。此時(shí),可計(jì)算用戶的答案情感相對(duì)正面率,如式(5):
(5)
其中PLP表示用戶的答案情感相對(duì)正面率。
3.1.3 互動(dòng)程度特征
ONWOM處理的專家識(shí)別中,雖然用戶的知識(shí)能力和情感能力是其專家能力的直接體現(xiàn),然而,知識(shí)能力和情感能力傳播的廣度和深度卻決定了用戶能力展現(xiàn)的程度,廣泛而深入的交互是擴(kuò)大傳播廣度和深度的必要手段,具有良好互動(dòng)能力,互動(dòng)程度高的用戶,更有可能成為ONWOM處理專家,因此,用戶互動(dòng)程度是體現(xiàn)其專家能力的特征。
Chae等[20]研究信息質(zhì)量和影響力,強(qiáng)調(diào)了交互質(zhì)量在信息影響力中的關(guān)鍵作用,進(jìn)一步則說(shuō)明交互在表示為UGC資源集的用戶影響力中的重要作用?;?dòng)程度的一個(gè)重要指標(biāo)是交互頻率,體現(xiàn)了用戶參與解決問(wèn)題的次數(shù)。用戶提問(wèn)次數(shù)同樣可顯示用戶主動(dòng)創(chuàng)造交互激活的特點(diǎn),是其互動(dòng)程度的一種體現(xiàn)[21],但在本章識(shí)別的專家是答案提供者,是信息的提供方,專家互動(dòng)程度應(yīng)該反映信息提供中的互動(dòng)程度,而提問(wèn)數(shù)反映的是用戶獲取信息的互動(dòng)程度,因此此時(shí)不考慮用戶提問(wèn)數(shù)。Liao Hui[22]認(rèn)為對(duì)客戶抱怨的快速回應(yīng)對(duì)抱怨處理有積極作用。及時(shí)對(duì)相應(yīng)問(wèn)題進(jìn)行處理能減少客戶需求無(wú)法得到及時(shí)滿足而進(jìn)一步擴(kuò)大傳播面積的可能性,及時(shí)性可以通過(guò)用戶回答問(wèn)題與提問(wèn)的時(shí)間差來(lái)描述。問(wèn)答社區(qū)為調(diào)動(dòng)用戶參與問(wèn)答的積極性,常組織一些線上社區(qū)活動(dòng),參加此類活動(dòng)的用戶可以得到一些社區(qū)榮譽(yù),也即用戶獲得此類榮譽(yù)的數(shù)量從側(cè)面反映了其參與社區(qū)互動(dòng)的程度,可作為用戶互動(dòng)程度的特征。
根據(jù)以上分析,本文選擇以下指標(biāo)為描述用戶互動(dòng)程度的特征,包括回答數(shù)、平均回答時(shí)差、社區(qū)活動(dòng)榮譽(yù)數(shù)。
其中平均回答時(shí)差指用戶提供答案的所有問(wèn)答對(duì)中回答時(shí)間與提問(wèn)時(shí)間的差值的平均值,表示為如式(6):
(6)
其中AATI表示某用戶的平均回答時(shí)差,atj表示問(wèn)答對(duì)集P第j個(gè)問(wèn)答對(duì)中回答發(fā)布的時(shí)間,qtj表示問(wèn)答對(duì)集P第j個(gè)問(wèn)答對(duì)中問(wèn)題發(fā)布的時(shí)間。
基于價(jià)值共創(chuàng)的負(fù)面口碑處理中,服務(wù)方專家識(shí)別的指標(biāo)體系如表1。
表1 ONWOM處理的專家識(shí)別指標(biāo)體系
人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,簡(jiǎn)稱“ANN”或“神經(jīng)網(wǎng)絡(luò)”)通過(guò)利用計(jì)算機(jī)程序和電子線路對(duì)人類神經(jīng)系統(tǒng)的抽象和模擬,是計(jì)算智能的核心內(nèi)容之一,其特有的非線性、自適應(yīng)信息處理能力,適于處理多變量之間的復(fù)雜關(guān)系,并且已經(jīng)在智能領(lǐng)域取得很好效果。本文的ONWOM處理中涉及知識(shí)能力KC、情感能力EC和互動(dòng)程度DI三個(gè)維度,他們又分別細(xì)分為11個(gè)二級(jí)指標(biāo)。這些指標(biāo)涉及到對(duì)不確定的隱性知識(shí)、人類情感和用戶行為的描述,而且之間關(guān)系錯(cuò)綜復(fù)雜,很難用線性的、學(xué)習(xí)能力較弱的模型準(zhǔn)確描述。神經(jīng)網(wǎng)絡(luò)作為非線性的自適應(yīng)模型,通過(guò)多層神經(jīng)元之間的權(quán)值調(diào)整可描述多指標(biāo)間的復(fù)雜關(guān)系,實(shí)現(xiàn)對(duì)專家得分的計(jì)算。
本文專家得分計(jì)算的BP神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)如圖2所示:
圖2 專家得分計(jì)算BP神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)
設(shè)神經(jīng)網(wǎng)絡(luò)的輸入層一個(gè)樣本X對(duì)應(yīng)的特征向量為(x1,x2,…,xn),n是輸入層的特征維度;隱藏層向量表示為H=(h1,h2,…,hm),m是隱藏層的神經(jīng)元個(gè)數(shù);輸出層輸出向量表示為Y=(y1),輸出真實(shí)值表示為D=(d1),因?yàn)橛?jì)算的專家得分是一個(gè)數(shù)值,所有將輸出層表示為只有一個(gè)維度的向量;輸出層和隱藏層之間的權(quán)值表示為V=(V1,V2,…,Vm),其中Vj=(v1j,v2j,…,vnj)是輸入層的所有n個(gè)節(jié)點(diǎn)與隱藏層神經(jīng)元hj的連接權(quán)值;隱藏層與輸出層之間的權(quán)值表示為W=(W1),W1=(w11,w21,…,wm1)是隱藏層的每個(gè)神經(jīng)元與輸出層神經(jīng)元的連接權(quán)值。
BP神經(jīng)網(wǎng)絡(luò)的在訓(xùn)練前需要初始化,根據(jù)系統(tǒng)設(shè)計(jì)確定網(wǎng)絡(luò)輸入層節(jié)點(diǎn)數(shù)n,隱藏層節(jié)點(diǎn)數(shù)m和輸出層節(jié)點(diǎn)數(shù)1,初始化權(quán)值矩陣V和W,初始化隱藏層閾值a和輸出層閾值b,給定學(xué)習(xí)速率η,確定網(wǎng)絡(luò)的最大訓(xùn)練循環(huán)次數(shù)M和學(xué)習(xí)精度ε,隱藏層激活函數(shù)φ(Zj)通常選擇logistic函數(shù),定義如式(7):
(7)
(8)
其中Zj是第j個(gè)隱藏層神經(jīng)元的輸入,aj是相應(yīng)閾值。輸出層激活函數(shù)選擇線性函數(shù),表示如式(9):
(9)
其中O=(O1)為輸出層的輸出,b1為相應(yīng)閾值。根據(jù)網(wǎng)絡(luò)輸出值O和輸出真實(shí)值D可以計(jì)算網(wǎng)絡(luò)預(yù)測(cè)誤差,表示如式(10):
e1=y1-d1
(10)
誤差向量為e=(e1)。判斷迭代次數(shù)是否達(dá)到最大次數(shù)要求,以及誤差是否符合精度要求,如果不符合,需根據(jù)誤差反向傳播對(duì)網(wǎng)絡(luò)進(jìn)行調(diào)整,更新網(wǎng)絡(luò)權(quán)值的表示如式(11)和(12):
vij=vij+ηφ(Zj)(1-φ(Zj))xiwj1e1
(11)
wj1=wj1+ηφ(Zj)e1
(12)
其中η是學(xué)習(xí)率。根據(jù)誤差對(duì)網(wǎng)絡(luò)節(jié)點(diǎn)閾值的調(diào)整如式(13)和(14):
aj=aj+μφ(Zj)(1-φ(Zj))wj1e1
(13)
b1=b1+e1
(14)
對(duì)網(wǎng)絡(luò)權(quán)值和閾值調(diào)整完后,繼續(xù)計(jì)算在調(diào)整后輸出層的輸出,直至收斂。
實(shí)驗(yàn)使用的數(shù)據(jù)采集自搜狗問(wèn)問(wèn),搜狗問(wèn)問(wèn)是搜狗旗下最大的互動(dòng)問(wèn)答社區(qū),用戶可以在社區(qū)中提出問(wèn)題、解決問(wèn)題、或者搜索其他用戶沉淀的歷史內(nèi)容。
數(shù)據(jù)收集過(guò)程如下:從搜狗問(wèn)問(wèn)專家欄目“電腦/數(shù)碼”領(lǐng)域的所有249位用戶中隨機(jī)抽取150位用戶,爬取內(nèi)容涉及三部分,包括用戶社區(qū)統(tǒng)計(jì)數(shù)據(jù)、用戶回答所在問(wèn)答對(duì)內(nèi)容數(shù)據(jù)和用戶回答所在問(wèn)答對(duì)屬性數(shù)據(jù)。因?yàn)榭赡艹霈F(xiàn)一人用多賬號(hào)違規(guī)行為,首先刪除姓名和個(gè)人信息有大量重復(fù)或交叉的共7個(gè)用戶。然后因?yàn)榫W(wǎng)頁(yè)差異,導(dǎo)致數(shù)據(jù)爬取過(guò)程中有些用戶數(shù)據(jù)相比其真實(shí)數(shù)量少,為避免因數(shù)據(jù)不完整對(duì)實(shí)驗(yàn)結(jié)果的影響,剔除爬取的問(wèn)答對(duì)數(shù)量低于30,且比率小于50%的9個(gè)用戶,最終獲得有效用戶134人。對(duì)134個(gè)用戶包含的數(shù)據(jù),其中由于網(wǎng)頁(yè)格式差異導(dǎo)致部分?jǐn)?shù)據(jù)爬取失敗,刪除屬性缺失和異常的數(shù)據(jù),同時(shí),由于本文模型和算法都是在文本數(shù)據(jù)的前提下進(jìn)行設(shè)計(jì),雖然其他形式的數(shù)據(jù)可以轉(zhuǎn)化為類似的表達(dá)形式,但為了使敘述更為一致,實(shí)驗(yàn)部分將問(wèn)答中涉及大量圖片等非文本形式的數(shù)據(jù)刪除,剩余有效問(wèn)答321910條。每個(gè)用戶由以下部分組成:采納率、收到求助數(shù)、贊同數(shù)、精華答案數(shù)、答案數(shù)、勛章數(shù)、用戶回答所在問(wèn)答對(duì)應(yīng)文本內(nèi)容、用戶回答所在問(wèn)答對(duì)應(yīng)的提問(wèn)和回答時(shí)間。
本章采用3層BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),包括有輸入層、隱藏層和輸出層。輸入層有11個(gè)節(jié)點(diǎn),對(duì)應(yīng)用戶的11個(gè)特征,分別為每個(gè)用戶的滿意答案數(shù)、采納率、收到求助數(shù)、贊同數(shù)、精華答案數(shù)、答案平均長(zhǎng)度、答案平均情感得分、答案情感相對(duì)正面率、回答數(shù)、平均回答時(shí)差和社區(qū)活動(dòng)榮譽(yù)數(shù)。隱藏層節(jié)點(diǎn)數(shù)的選擇目前沒(méi)有統(tǒng)一的方法。這里利用已有的經(jīng)驗(yàn)公式,首先借助公式確定節(jié)點(diǎn)數(shù)的大致范圍,然后用試湊法確定最佳節(jié)點(diǎn)數(shù)。選擇經(jīng)驗(yàn)公式為(15):
(15)
其中l(wèi)為隱藏層節(jié)點(diǎn)數(shù),m為輸出層節(jié)點(diǎn)數(shù),n為輸入層節(jié)點(diǎn)數(shù),a為0到10之間的常數(shù)。不拘泥于經(jīng)驗(yàn)公式,本章選擇的隱藏層節(jié)點(diǎn)數(shù)試湊范圍是從5到25個(gè),共試湊21次,其中當(dāng)節(jié)點(diǎn)數(shù)為15時(shí),誤差較小,且訓(xùn)練時(shí)間在接受范圍。因此,選擇的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為11-15-1,神經(jīng)網(wǎng)絡(luò)的相關(guān)參數(shù)設(shè)定如表(2):
表2 神經(jīng)網(wǎng)絡(luò)參數(shù)
本文從134名用戶隨機(jī)抽取80%作為訓(xùn)練集,共107人,對(duì)神經(jīng)網(wǎng)絡(luò)模型中的參數(shù)進(jìn)行訓(xùn)練。將剩下的20%共27人作為測(cè)試集,評(píng)估模型的效果。在模型訓(xùn)練過(guò)程中,將107名用戶的11個(gè)特征作為網(wǎng)絡(luò)輸入,將社區(qū)賦予用戶的經(jīng)驗(yàn)值作為每個(gè)用戶的輸出,此時(shí)選擇3位專家對(duì)原經(jīng)驗(yàn)值進(jìn)行了人工調(diào)整,增大了解決負(fù)面情緒問(wèn)題的權(quán)重,以使識(shí)別出的專家更適合負(fù)面口碑處理。
為避免量綱不同對(duì)模型的影響,需對(duì)所有的指標(biāo)進(jìn)行歸一化,如式(16):
(16)
其中NVxi表示某指標(biāo)的測(cè)量值xi歸一化后的對(duì)應(yīng)值,xmin表示所有樣本在此指標(biāo)測(cè)量中的最小值,xmax表示所有樣本在此指標(biāo)測(cè)量中的最大值。
測(cè)試集包括27個(gè)用戶,將此27個(gè)用戶的歸一化特征值輸入到訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型中,可以預(yù)測(cè)每個(gè)用戶的經(jīng)驗(yàn)值,經(jīng)驗(yàn)值代表了用戶專家能力的得分。為說(shuō)明本文方法的有效性,這里構(gòu)造另外4個(gè)模型進(jìn)行對(duì)比,分別是只考慮知識(shí)能力和情感能力8個(gè)特征的神經(jīng)網(wǎng)絡(luò)模型ANN_KS,只考慮知識(shí)能力和互動(dòng)程度9個(gè)特征的神經(jīng)網(wǎng)絡(luò)模型ANN_KI,只考慮知識(shí)能力6個(gè)特征的神經(jīng)網(wǎng)絡(luò)模型ANN_K。同時(shí),選擇均值模型作為基線模型參與比較。
本文選擇MSE(mean squared error)來(lái)對(duì)比模型間的預(yù)測(cè)性能,而均值模型的MSE值,可作為鑒別模型的基本標(biāo)準(zhǔn),MSE的計(jì)算公式如(17):
(17)
根據(jù)待比較的幾個(gè)模型的特征結(jié)構(gòu),分別構(gòu)建相應(yīng)結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò),并利用數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練,由訓(xùn)練好的模型對(duì)測(cè)試集計(jì)算得到MSE值如表3:
表3 模型MSE值對(duì)比表
表3顯示,同時(shí)考慮知識(shí)能力、情感能力和互動(dòng)程度特征的神經(jīng)網(wǎng)絡(luò)模型ANN_KSI的MSE值最小,說(shuō)明其性能最優(yōu)。4個(gè)神經(jīng)網(wǎng)絡(luò)模型的MSE值比均值模型都要小,說(shuō)明相比均值模型,基于本文特征結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)較好的模擬了特征與專家能力之間的關(guān)系。ANN_KSI相比ANN_KS模型在性能上提升23.69%,表明在知識(shí)能力和情感能力的基礎(chǔ)上考慮用戶互動(dòng)程度,有助于提高專家識(shí)別準(zhǔn)確率。ANN_KSI相比ANN_KI模型在性能上提升26.45%,說(shuō)明在考慮知識(shí)能力和互動(dòng)程度的基礎(chǔ)上加上情感能力,能更好的識(shí)別專家。ANN_KSI相比ANN_K模型又更大程度的性能提升29.99%,進(jìn)一步說(shuō)明了,ONWOM處理的專家識(shí)別中,除了考慮知識(shí)能力,融入情感撫慰能力和互動(dòng)能力的模型能顯著提高識(shí)別性能。
現(xiàn)有專家識(shí)別方法大多只考慮專家解決問(wèn)題的知識(shí)能力,而在ONWOM處理背景中,單考慮知識(shí)能力的傳統(tǒng)方法無(wú)法滿足發(fā)布方尋求情感撫慰的需求,更無(wú)法達(dá)到ONWOM處理的互動(dòng)性要求,容易導(dǎo)致處理失敗。
針對(duì)以上問(wèn)題,本文將UGC中的專家用戶看作ONWOM處理資源,從資源視角出發(fā)建立專家識(shí)別對(duì)應(yīng)的資源映射框架,并將此過(guò)程分為顯性資源映射和隱性資源映射,顯性資源映射是原始UGC資源到結(jié)構(gòu)化用戶特征空間的映射,實(shí)現(xiàn)用戶信息資源的結(jié)構(gòu)化表示,隱性資源映射是從用戶特征空間到用戶價(jià)值的映射,實(shí)現(xiàn)用戶價(jià)值的量化,用專家得分表示。與傳統(tǒng)專家識(shí)別不同,本文專家識(shí)別過(guò)程中不僅考慮了直接體現(xiàn)用戶專業(yè)水平的知識(shí)能力,還考慮了專家參與負(fù)面口碑處理的情感撫慰能力,并借助情緒感染機(jī)制獲得情感能力的量化指標(biāo)。此外,互動(dòng)作為資源整合的條件和情緒感染的前提,本文也將用戶互動(dòng)程度引入到用戶能力特征空間,以此構(gòu)建人工神經(jīng)網(wǎng)絡(luò)模型,實(shí)現(xiàn)專家識(shí)別。實(shí)驗(yàn)證明本文方法能更好的識(shí)別負(fù)面口碑處理的專家。提出的資源映射框架為專家識(shí)別提供一種新的指導(dǎo)方法,構(gòu)建的模型為理解負(fù)面口碑處理專家能力結(jié)構(gòu)提供一種新思路。