耿秀麗,楊 珍
(上海理工大學(xué) 管理學(xué)院,上海 200093)
隨著市場(chǎng)競(jìng)爭(zhēng)愈加激烈,迅速發(fā)展的企業(yè)日益增多,顧客對(duì)產(chǎn)品或服務(wù)的要求也更加多元化、個(gè)性化。由于信息不對(duì)稱、專業(yè)知識(shí)欠缺等原因,顧客難以在眾多企業(yè)提供的多個(gè)方案中選擇適合自己的方案,方案的個(gè)性推薦成為增強(qiáng)企業(yè)競(jìng)爭(zhēng)力的關(guān)鍵因素。針對(duì)產(chǎn)品方案推薦的研究較少,但商品/服務(wù)的推薦已有了一定的研究。例如,文獻(xiàn)[1-3]利用協(xié)同過濾、隱語(yǔ)義模型和線性回歸技術(shù)將Web服務(wù)推薦給目標(biāo)用戶;文獻(xiàn)[4-5]分別采用貝葉斯網(wǎng)絡(luò)和用戶偏好方法實(shí)現(xiàn)對(duì)用戶的商品推薦。協(xié)同過濾作為推薦技術(shù)的常用方法,被廣泛應(yīng)用于各類推薦系統(tǒng),如圖書推薦系統(tǒng)、電子商務(wù)和社交網(wǎng)絡(luò)等推薦系統(tǒng)。而常用的協(xié)同過濾算法存在數(shù)據(jù)稀疏性、冷啟動(dòng)和用戶偏好不一等問題,已有文獻(xiàn)針對(duì)其中的某一問題給予了解決方案。如文獻(xiàn)[6]為減輕稀疏性對(duì)推薦結(jié)果的影響,采用矩陣聚類降維技術(shù),引入偏好方差找出用戶最近鄰并推薦;文獻(xiàn)[7]針對(duì)冷啟動(dòng)問題,提出采用時(shí)間權(quán)重計(jì)算的方式約束用戶對(duì)項(xiàng)目的偏愛程度,并利用用戶—項(xiàng)目—屬性三部圖關(guān)系,為新用戶推薦目標(biāo)項(xiàng)目;文獻(xiàn)[8]針對(duì)電子商務(wù)中推薦算法對(duì)目標(biāo)用戶定位不準(zhǔn)確等問題,提出利用用戶興趣偏好性挖掘相似目標(biāo)用戶,準(zhǔn)確定位并推薦。文獻(xiàn)[6-8]中的方法考慮了3類問題中的其中一類問題,不能有效地實(shí)現(xiàn)產(chǎn)品/服務(wù)的推薦。
本文綜合考慮上述文獻(xiàn)中的推薦問題,提出了采用灰色關(guān)聯(lián)與信任云結(jié)合的混合推薦算法。信任云是在云模型基礎(chǔ)上融入了用戶信任度,增加方案推薦的可信度。而實(shí)際上云模型不僅適用于方案推薦過程,在方案評(píng)價(jià)中也得到廣泛的應(yīng)用,如文獻(xiàn)[9-10]都采用云模型定量化方案評(píng)價(jià)信息,通過云優(yōu)化的算法對(duì)方案進(jìn)行分析;文獻(xiàn)[11]針對(duì)方案評(píng)價(jià)方法未考慮定性指標(biāo)中不定因素,提出利用云模型彌補(bǔ)層次分析法,通過云發(fā)生器實(shí)現(xiàn)指標(biāo)的有效量化,再對(duì)方案進(jìn)行評(píng)價(jià)以及優(yōu)選。綜上所述,云模型在方案評(píng)價(jià)中,將信息指標(biāo)量化轉(zhuǎn)換為數(shù)值,可以增加方案的可行性。
針對(duì)某些用戶對(duì)產(chǎn)品或服務(wù)的評(píng)分較少而導(dǎo)致的數(shù)據(jù)稀疏性問題,已有研究采用余弦、皮爾森相似度將數(shù)據(jù)聚類,并預(yù)測(cè)填充空缺數(shù)據(jù),減輕稀疏性對(duì)推薦結(jié)果的影響。但是個(gè)性化推薦算法中,余弦、皮爾森相似度因數(shù)據(jù)量劇增難以對(duì)數(shù)據(jù)快速聚類,而灰色關(guān)聯(lián)度既不受限于數(shù)據(jù)量的影響,又能考慮用戶項(xiàng)目評(píng)分的不定因素,在不減少非近鄰數(shù)據(jù)的損失的情況下,能夠計(jì)算項(xiàng)目評(píng)分的相似性,預(yù)測(cè)空缺的評(píng)分?jǐn)?shù)據(jù),彌補(bǔ)稀疏性。因此,本文提出采用灰色關(guān)聯(lián)度代替?zhèn)鹘y(tǒng)推薦算法中的相似度,用于預(yù)測(cè)方案評(píng)分?jǐn)?shù)據(jù),彌補(bǔ)稀疏性。
針對(duì)新用戶在數(shù)據(jù)庫(kù)中無(wú)記錄,難以推薦合適項(xiàng)目的問題,即冷啟動(dòng)問題,文獻(xiàn)[12]引入用戶—標(biāo)簽以及項(xiàng)目—標(biāo)簽的加權(quán)相似度,對(duì)目標(biāo)新用戶相應(yīng)的項(xiàng)目評(píng)分進(jìn)行預(yù)測(cè)以及推薦;文獻(xiàn)[13]提出運(yùn)用粒來描述用戶和產(chǎn)品,構(gòu)建粒關(guān)聯(lián)規(guī)則的指標(biāo),挖掘出用戶和產(chǎn)品間的關(guān)聯(lián)規(guī)則,并對(duì)新用戶進(jìn)行推薦;文獻(xiàn)[14]提出采用動(dòng)態(tài)潛在因素模型與用戶屬性相結(jié)合的方法,并隨用戶和推薦者間的交互關(guān)系,模型自動(dòng)調(diào)整其系數(shù)并合理地推薦;文獻(xiàn)[15]通過用戶項(xiàng)目間的評(píng)分相似度,利用最近鄰預(yù)測(cè)新用戶的評(píng)分,解決冷啟動(dòng)問題。上述關(guān)于冷啟動(dòng)的解決方案,都是基于已有項(xiàng)目、標(biāo)簽、用戶間相似度的改進(jìn),來預(yù)測(cè)最近鄰集并給予推薦,在一定程度上可以減輕冷啟動(dòng)問題,但未考慮到用戶主觀信任的模糊性和不確定性問題。因此,本文提出將信任度引入云模型中,構(gòu)建信任云,利用信任云相似度與用戶特征相似度的綜合值,來預(yù)測(cè)目標(biāo)方案評(píng)分,減輕冷啟動(dòng)問題。
信任模型是為解決用戶、項(xiàng)目間關(guān)系的信任模糊性和不確定性提出的,信任模型因應(yīng)用范圍的不同,構(gòu)建方式有所不同。如文獻(xiàn)[16]通過改進(jìn)推薦屬性的相似度,與服務(wù)推薦構(gòu)建行為構(gòu)成可信聯(lián)盟;文獻(xiàn)[17]通過信任模型篩選惡意評(píng)價(jià)的用戶,得到信任度高的用戶集以及候選服務(wù)集。由于云模型本身的不確定性和模糊性,學(xué)者們提出信任云模型,如文獻(xiàn)[18]著重研究一維主觀信任云,文獻(xiàn)[19]提出多維信任云的模型,既能解決主觀信任云的不確定性,又能提供更準(zhǔn)確的信任數(shù)據(jù)??紤]到信任云能夠解決用戶主觀不確性問題,本文提出建立信任云模型,得到方案推薦信任度,來處理用戶主觀性問題??紤]方案匹配過程中,用戶興趣不一問題,引入新舊用戶興趣特征相似度,既能減輕新用戶引起的冷啟動(dòng)問題,又能解決興趣相異的問題,如文獻(xiàn)[19]利用興趣信任度有效地解決面向新用戶的冷啟動(dòng)問題。
綜上所述,本文將方案推薦過程分為3個(gè)部分:①主要通過灰色關(guān)聯(lián)相似度預(yù)測(cè)空缺的評(píng)分?jǐn)?shù)據(jù),彌補(bǔ)數(shù)據(jù)稀疏性;②通過建立信任云,求出用戶間的信任相似度;③根據(jù)用戶興趣特征的相似度,與信任相似度加權(quán)得到綜合相似度,獲取最近鄰集并匹配最優(yōu)方案推薦給目標(biāo)用戶。
灰色關(guān)聯(lián)分析是灰色系統(tǒng)理論的重要組成部分,主要研究系統(tǒng)內(nèi)部因素間的關(guān)聯(lián)程度[14]?;疑P(guān)聯(lián)分析不同于傳統(tǒng)的推薦方法,可以減少非近鄰數(shù)據(jù)的信息損失,彌補(bǔ)稀疏性,提高預(yù)測(cè)精度。考慮數(shù)據(jù)稀疏性導(dǎo)致推薦不準(zhǔn)確的問題,提出采用灰色關(guān)聯(lián)預(yù)測(cè)空缺數(shù)據(jù),彌補(bǔ)稀疏性?;疑P(guān)聯(lián)分析利用少量的已知信息或者隱含信息,融入系統(tǒng)的不定因素,挖掘系統(tǒng)間各因素的特征,建立因素之間的關(guān)系模型。本文基于用戶項(xiàng)目的協(xié)同過濾算法,利用灰色關(guān)聯(lián)分析計(jì)算用戶—項(xiàng)目間評(píng)分的關(guān)聯(lián)度,得到項(xiàng)目間的灰色關(guān)聯(lián)度,并用來預(yù)測(cè)用戶對(duì)其他項(xiàng)目的評(píng)分。本文采用的灰色關(guān)聯(lián)度計(jì)算過程如下。
將每個(gè)用戶i對(duì)方案S={s1,s2,s3,…,sn}的評(píng)分rij表示為一個(gè)序列,則待估矩陣如下所示:
X0(i)={X0(1),X0(2),X0(3),…,
X0(m)},i=1,2,3,…,m。
(1)
為了計(jì)算各序列的關(guān)聯(lián)度,首先將序列值進(jìn)行標(biāo)準(zhǔn)化,即將每個(gè)序列值除以該序列值總和,從而得到數(shù)據(jù)標(biāo)準(zhǔn)值。
(2)
式中:X0(i)表示第i個(gè)用戶所評(píng)分項(xiàng)目的評(píng)分均值,counti表示第i個(gè)用戶已經(jīng)評(píng)分的項(xiàng)目數(shù)量,A表示第i個(gè)用戶已評(píng)分的項(xiàng)目編號(hào)。被比較的序列值表示如式(3)所示:
Xj(i)=(Xj(1),Xj(2),…,Xj(m))。
(3)
式中:X0(k)和Xj(k)都是表示對(duì)應(yīng)向量的第k個(gè)元素的值,則兩者間的灰色關(guān)聯(lián)系數(shù)表示為:
ξj(k)=
(4)
(5)
本文在給用戶推薦方案之前,考慮數(shù)據(jù)稀疏性對(duì)推薦結(jié)果的影響,基于已有數(shù)據(jù)采用灰色關(guān)聯(lián)算法來預(yù)測(cè)并填充空缺數(shù)據(jù)。在協(xié)同過濾推薦算法中,評(píng)分矩陣R=(rij)m×n,評(píng)分項(xiàng)目對(duì)應(yīng)的灰色關(guān)聯(lián)度為:
τ=(γ1,γ2,…,γj),j=1,2,3,…,n。
(6)
根據(jù)評(píng)分項(xiàng)目s的近鄰集合N(s),預(yù)測(cè)目標(biāo)用戶i對(duì)s的評(píng)分,計(jì)算公式如下所示:
pred(i,s)=X0(i)+γj×(rij-X0(i))。
(7)
通過灰色關(guān)聯(lián)度以及預(yù)測(cè)公式對(duì)數(shù)據(jù)稀疏性的彌補(bǔ),得到完整的用戶方案評(píng)分?jǐn)?shù)據(jù)。但在推薦方案的過程中,由于人為主觀性因素等影響,比如有些用戶偏好某種方案,就會(huì)將分值打高,而有些用戶對(duì)某種方案有偏見,就會(huì)將分打的特別低,這樣會(huì)對(duì)最終的相似性方案匹配結(jié)果,與實(shí)際推薦結(jié)果偏差較大。因此,本文綜合考慮多方面的因素,比如,方案推薦的信任度,方案推薦的頻率,用戶興趣度等來約束推薦結(jié)果的精度。以下是云模型相關(guān)定義,信任云的構(gòu)建過程,以及與用戶信任云與用戶興趣的綜合方案匹配過程的描述。
云模型是李德毅院士[20]提出的處理定性描述和定量概念間不確定性的轉(zhuǎn)換模型,通過結(jié)合自然語(yǔ)言中的模糊性和隨機(jī)性,實(shí)現(xiàn)定性語(yǔ)言與定量數(shù)值間的轉(zhuǎn)換,為研究數(shù)據(jù)挖掘過程中不確定信息的處理提供了新方法。本文考慮到用戶方案評(píng)分信息的主觀性和模糊性,提出采用云模型實(shí)現(xiàn)定性定量數(shù)據(jù)的轉(zhuǎn)換,云模型相關(guān)定義如下。
定義1[18]設(shè)U是一個(gè)用數(shù)值表示的定量論域,C是U上的定性概念。若定量值x∈U是定性概念C上的一次隨機(jī)實(shí)現(xiàn),x對(duì)C的確定度μ(x)∈[0,1],是有穩(wěn)定傾向的隨機(jī)數(shù):μ:U→[0,1],?x∈U:x→μ(x),則x在論域U上的分布稱為云(Cloud),記為云C(x);每個(gè)x稱為一個(gè)云滴(Drop)。
(8)
(9)
(10)
輸入:表示定性概念的三個(gè)特征值(Ex,En,He);
輸出:云滴Drop(x1,μ(x1)),Drop(x2,μ(x2)),…,Drop(xN,μ(xN))。
“情然而心為之擇謂之慮。心慮而能為之動(dòng)謂之偽。慮積焉,能習(xí)焉而后成謂之偽。”欲之滿足的必然通過心活動(dòng),經(jīng)由思慮而非單純的欲的活動(dòng)即為“偽”?!皞巍苯?jīng)由實(shí)踐而積累的“正利”“正義”的經(jīng)驗(yàn)就成為了荀子所稱道的“禮”。因“好利而惡害”為桀、紂所同然之性,故心的思慮活動(dòng)就成為禮之制作的關(guān)鍵,而圣人(君子)之心的思慮又在其中處于中心地位。
步驟4帶有確定度μ(xc)的xc稱為數(shù)域中的一個(gè)云滴。
步驟5重復(fù)步驟1~步驟4,直到產(chǎn)生要求的N個(gè)云滴(xc,μ(xc))(c=1,2,3,…,N)。
論域U可以是一維或者多維的形式,云是在隸屬度μ(x)的任意一次實(shí)現(xiàn)的隨機(jī)變量,由無(wú)次序性的云滴組成,實(shí)現(xiàn)了定性概念在數(shù)量上的轉(zhuǎn)變,反映了概念特征。云滴不是簡(jiǎn)單的模糊或隨機(jī),而是具有隸屬度約束的隨機(jī)變量,隸屬度表示云滴能夠代表定性概念的程度,云滴出現(xiàn)概率與云滴確定度成正比,符合人們的主觀理解。而云模型的核心處理過程主要分兩種,正向云發(fā)生器和逆向云發(fā)生器。本文采用正向云算法,將定性描述的整體向量C(Ex,En,He),轉(zhuǎn)換為描述個(gè)體定量數(shù)值的云滴。以云(0.5,0.05,0.01)的3個(gè)特征值及n=1 000為輸入值,通過正向云發(fā)生器輸出云圖,如圖1所示。
圖1中:期望Ex表示云滴在論域空間分布的期望值,即最能代表定性概念的點(diǎn);熵En表示定性概念的不確定量,反映云的離散程度;超熵He是熵的熵,描述云的厚度。
信任關(guān)系主要分為直接信任和間接信任,由主觀經(jīng)驗(yàn)可以分成若干個(gè)等級(jí)的信任度,具有模糊性和隨機(jī)性。而云模型中的云可以將定性和定量之間的關(guān)系進(jìn)行轉(zhuǎn)換,提出采用云模型將用戶方案的定量數(shù)據(jù)轉(zhuǎn)換成云滴,形成信任云。下面介紹方案的信任度及信任云的相關(guān)概念。
定義3[18]信任是指對(duì)推薦者的誠(chéng)信,能力以及可靠性的認(rèn)可程度,表現(xiàn)出主觀概念,具有模糊隨機(jī)性。由于信任程度不同,將其劃分為幾個(gè)等級(jí),即信任等級(jí)。每個(gè)信任等級(jí)可以賦予不同的實(shí)數(shù)值q(q∈[0,1]),如0代表不信任,1代表信任,q稱為信任度。
定義4信任度空間是等級(jí)的集合,每個(gè)等級(jí)表示為一個(gè)信任度,將等級(jí)映射到信任空間上。信任空間上的模型可以設(shè)置為如下分段函數(shù):
(11)
定義5信任云是用云模型將若干個(gè)定性概念轉(zhuǎn)換為若干個(gè)云滴,將信任度空間為T=[0,1]表示為云的定量論域,x∈T是指定性概念上的一次定量信任評(píng)價(jià),x是由論域上的隸屬度μ(x)決定的具有穩(wěn)定傾向的隨機(jī)數(shù)。信任云的定性表示是由3個(gè)數(shù)字特征構(gòu)成的元組C(Ex,En,He),Ex表示信任云在空間上分布的期望,En是信任云的熵,反映了信任概念的云滴的離散程度,He表示超熵,即熵的熵,由熵的隨機(jī)模型性決定。
以某用戶為例,與其他用戶的方案信任云相似度分別為φ1,φ2,φ3,…,φs,將這些相似度的平均值作為某用戶最終的相似度x,而x在f(x)中的某個(gè)區(qū)間內(nèi),該區(qū)間的信任度對(duì)應(yīng)的權(quán)重可以用該區(qū)間的中間值作為權(quán)重。
為用戶推薦方案前,方案選擇不僅考慮信任云推薦的相似度,還會(huì)考慮用戶興趣等原因。如果某個(gè)用戶偏好某項(xiàng)方案,導(dǎo)致推薦結(jié)果與實(shí)際情況偏差太多,則推薦結(jié)果不精確??紤]到上述問題,在方案匹配前引入用戶興趣度,約束用戶方案的推薦效率。用戶興趣值的獲取是以用戶需求、興趣或者偏好為基礎(chǔ),得到評(píng)分值。因此,在用戶興趣的方案匹配之前,需要建立用戶興趣模型。對(duì)于新用戶,主要通過用戶的咨詢情況得到興趣度,對(duì)于舊用戶,主要通過實(shí)際反饋的信息,并將其轉(zhuǎn)化用戶的興趣分值。根據(jù)專家的評(píng)分,將用戶興趣相似度以及對(duì)應(yīng)的權(quán)重定義如表1所示。
表1 用戶興趣度表
對(duì)于某一方案,用戶A在內(nèi)容上對(duì)用戶B感興趣的方案信息相似,則推斷用戶A對(duì)此方案也感興趣。本文的用戶興趣特征用f={f1,f2,f3,…,fq}表示,其中fk,k=1,2,3,…,q是一種特征值,每個(gè)用戶U={u1,u2,u3,…,up},其中ut表示用戶,t=1,2,3,…,p,用戶對(duì)特征評(píng)分用rtk表示。針對(duì)余弦相似性未考慮用戶評(píng)分標(biāo)準(zhǔn)的不同,即用戶偏向打高分還是低分的問題,修正的余弦相似性通過減去用戶對(duì)項(xiàng)目的評(píng)分均值來改善余弦相似性存在的缺陷,提出采用修正的余弦相似度給予解決,對(duì)用戶興趣特征的相關(guān)性進(jìn)行計(jì)算,如公式(12)所示:
(12)
sim′=(1-w)θφ+w×sim(u,v)。
(13)
式中:w表示為表1中對(duì)應(yīng)的相似度權(quán)重,sim′表示信任云與用戶興趣特征的綜合相似度。為了避免用戶評(píng)分的主觀性,本文引入了用戶興趣特征值,即將用戶對(duì)方案特征的偏好程度,根據(jù)專家給的評(píng)分等級(jí)進(jìn)行量化,并給予不同的權(quán)重值,用戶方案匹配以及推薦的步驟:
步驟1建立用戶—興趣特征,用戶—方案間的關(guān)系矩陣,針對(duì)用戶評(píng)分的稀疏性,采用灰色關(guān)聯(lián)度進(jìn)行預(yù)測(cè)并填充空缺數(shù)據(jù)。
步驟2對(duì)用戶推薦方案的方式,一方面考慮舊用戶的推薦,即在新用戶和舊用戶之間產(chǎn)生信任關(guān)系,通過信任云的相似度進(jìn)行方案匹配;另一方面,考慮新用戶的興趣特征相似度,找尋最近鄰用戶的方案。
步驟3將基于信任云的用戶相似度與用戶特征相似度加權(quán)求和,得到綜合相似度。通過相似度進(jìn)行方案匹配并排序,選擇相似性大的用戶對(duì)應(yīng)方案給予推薦。
某汽車企業(yè)想要提高銷售效率,希望給用戶推薦相關(guān)產(chǎn)品的購(gòu)買方案。通過整理以往顧客購(gòu)買產(chǎn)品歷史記錄信息,本文用戶對(duì)象是各種企業(yè),企業(yè)里人群種類的不同,購(gòu)買產(chǎn)品的需求也就不一樣。本文選取10個(gè)用戶U={u1,u2,u3,…,u10},以及相關(guān)產(chǎn)品類型分為轎車(s1),SUV(s2),MPV(s3),跑車(s4),皮卡(s5),集卡(s6),微面(s7)7類;用戶對(duì)產(chǎn)品的興趣特征,其實(shí)是產(chǎn)品功能以及非功能特征,包括變速箱(f1),制動(dòng)性能(f2),燃油經(jīng)濟(jì)性(f3),安全性(f4),輪胎性能(f5),汽車通過性(f6),售后服務(wù)(f7),動(dòng)力性(f8),汽車噪音(f8)。如表2所示為已有用戶對(duì)汽車的評(píng)分,表中1~6分別表示對(duì)方案的滿意度,依次是非常差、差、一般、還行、好、非常好;表3是汽車特征以及對(duì)應(yīng)的量化分值;表4是用戶對(duì)興趣特征的評(píng)分,其中u11表示新用戶。
表2 用戶對(duì)汽車的評(píng)分(填充前)
表3 汽車特征表
表4 用戶的興趣特征的評(píng)分
續(xù)表4
首先,采用灰色關(guān)聯(lián)度,預(yù)測(cè)表2和表4的空缺數(shù)據(jù),以式(4)和式(5)來計(jì)算相似度。如表2中用戶u5對(duì)汽車s3的評(píng)分可以用式(4)計(jì)算相關(guān)系數(shù),其中ρ=0.5,u2和u1的灰色關(guān)聯(lián)系數(shù)ξ1=1或0.47,根據(jù)式(5)得到關(guān)聯(lián)度γ1≈0.73。同理可得,u2和u3的灰色關(guān)聯(lián)度γ2≈0.78,依次類推,u2與u4,u5,u6,u7,u8,u9的關(guān)聯(lián)度為γ3≈0.67,γ4≈0.78,γ5≈0.67,γ6≈0.78,γ7≈0.75,γ8≈0.83,γ9≈0.78。因此,選取用戶u9對(duì)產(chǎn)品s的評(píng)分相關(guān)度,根據(jù)式(7)得到預(yù)測(cè)的分值,pred(u2,s5)≈4.58。同理,u5對(duì)s3的預(yù)測(cè)評(píng)分,通過式(4)和(5)計(jì)算,得到u9與u5的關(guān)聯(lián)度最大為0.83,預(yù)測(cè)值pred(u5,s3)≈3.85;u9對(duì)s2的預(yù)測(cè)評(píng)分,利用式(4)和(5)計(jì)算得到,u8與u9的關(guān)聯(lián)度最大為0.83,預(yù)測(cè)值pred(u9,s2)≈4.81,將表2數(shù)據(jù)填充完整后的結(jié)果如表5所示。
表5 用戶對(duì)汽車的評(píng)分(填充后)
表4的數(shù)據(jù)填充方式,也是采用式(4)~式(6)進(jìn)行計(jì)算,得到u5和u2的灰色關(guān)聯(lián)度為0.83,pred(u2,f5)≈3.46,同理,得到u6與u4的灰色關(guān)聯(lián)度為0.83,pred(u4,f7)≈2.93,表3的填充后的數(shù)據(jù)如表6所示。
表6 用戶的興趣特征的評(píng)分(填充后)
其次,根據(jù)專家打分建立方案信任云,如圖2所示。本文將云的方案信任云與圖2中的信任云進(jìn)行匹配,得出相似度φ,相似度的大小決定信任依賴度θ所屬區(qū)間。為了求出與信任云的相似度,需要將表5的方案評(píng)分縮小10倍,得到表7的單位化的結(jié)果,利用云模型的正向云發(fā)生器,每個(gè)用戶對(duì)應(yīng)的信任云特征值C(Ex,En,He),與信任云的相似度,信任度如下表8所示。
表7 用戶對(duì)汽車的評(píng)分(單位化)
表8 信任云特征值
為約束方案信任云以及用戶評(píng)分的主觀性,以及解決冷啟動(dòng)問題,即對(duì)新用戶難以推薦方案的情況下,本文基于用戶興趣評(píng)分,如表6所示,即根據(jù)調(diào)查新用戶的興趣特征,與已有的舊用戶興趣特征相匹配,得到興趣相似度,如表9所示,根據(jù)與表8的信任云相似度加權(quán)綜合,得到新相似度并推薦。
表9 用戶特征相似度
以新用戶u11為例,采用公式(13)計(jì)算與其他用戶的綜合相似度,并進(jìn)行匹配,其中的權(quán)重值參考表1,求得u11與用戶的相似度如表10所示。
表10 新用戶相似度
由表10可以看出u11和用戶的綜合相似度,明顯與u5和u9以及u10的相似度最高,因此,將用戶u5、u9和u10對(duì)應(yīng)方案給予推薦。
本文采用灰色關(guān)聯(lián)度與信任云的混合算法,為企業(yè)用戶推薦合適的汽車方案。首先利用灰色關(guān)聯(lián)度,對(duì)稀疏的評(píng)分?jǐn)?shù)據(jù)進(jìn)行預(yù)測(cè)填充,彌補(bǔ)稀疏性;其次根據(jù)已有方案評(píng)分?jǐn)?shù)據(jù),計(jì)算用戶的信任云相似度;獲取用戶興趣值,計(jì)算用戶興趣特征的相似度;最后采用信任云與用戶興趣的綜合相似度,匹配與新用戶合適的方案并給予推薦。由于本文整體方法執(zhí)行過程比較繁瑣,未將其與其他推薦算法進(jìn)行比較。在同等數(shù)量用戶的評(píng)分?jǐn)?shù)據(jù)中,采用所提方法的第2個(gè)步驟,即方案匹配算法,與其他推薦算法進(jìn)行比較。其中,方案匹配算法考慮用戶特征各異,與傳統(tǒng)信任云的計(jì)算方式不同,輸入用戶特征相似度和信任度的加權(quán)綜合值,輸出方案推薦結(jié)果。本文通過比較不同算法的執(zhí)行時(shí)間,來突出方案匹配算法的優(yōu)勢(shì)。在配置Win10系統(tǒng),RAM 2 GB,Inter CORE i5,MATLAB 9.0平臺(tái)下,將本文采用的方案匹配算法與基于灰色關(guān)聯(lián)的協(xié)調(diào)過濾推薦方法,以及基于項(xiàng)目的協(xié)同過濾方案匹配推薦算法以及基于信任云的方案匹配推薦方法進(jìn)行對(duì)比,結(jié)果如圖3所示。
如圖3可知,基于同等數(shù)量的用戶對(duì)應(yīng)的評(píng)分?jǐn)?shù)據(jù)中,本文采用的方案匹配算法與其他推薦算法相比,方案匹配算法的執(zhí)行時(shí)間最低,效率最高?;诨疑P(guān)聯(lián)的推薦效率僅次于方案匹配算法,而信任云在匹配前的相似度計(jì)算比較繁瑣,因此基于信任云的推薦算法執(zhí)行時(shí)間較長(zhǎng)。由此得出,上述4種算法相對(duì)比中,本文采用的方案匹配算法執(zhí)行速度最快,推薦效率明顯最高。
產(chǎn)品或服務(wù)都是當(dāng)今制造業(yè)重點(diǎn)研究方向,甚至產(chǎn)品與服務(wù)的結(jié)合也是制造業(yè)的發(fā)展趨勢(shì)。因此,要想提供好的產(chǎn)品或服務(wù),就要配置出滿足顧客需求的產(chǎn)品或服務(wù)方案,推薦給新客戶,從而提高企業(yè)效益。如何準(zhǔn)確定位用戶需求,將合適的配置方案推薦給新用戶,推薦方法顯得尤為重要。而傳統(tǒng)推薦方法存在的數(shù)據(jù)稀疏,冷啟動(dòng)等問題,造成推薦結(jié)果不準(zhǔn)確。因此,本文提出灰色關(guān)聯(lián)預(yù)測(cè)與信任云的綜合算法,對(duì)海量產(chǎn)品數(shù)據(jù)進(jìn)行挖掘并推薦方案。即通過灰色關(guān)聯(lián)預(yù)測(cè)空缺數(shù)據(jù),減輕數(shù)據(jù)稀疏性,通過信任云和用戶興趣特征的綜合相似度解決冷啟動(dòng)以及推薦效率等問題,其主要特點(diǎn)如下:
(1)考慮到評(píng)分?jǐn)?shù)據(jù)稀疏性以及基于余弦,皮爾森相似度的聚類會(huì)隨著數(shù)據(jù)量變化影響推薦結(jié)果的精確性,提出采用灰色關(guān)聯(lián)預(yù)測(cè),計(jì)算方案評(píng)分的相似度,以填充空缺數(shù)據(jù)。相對(duì)于傳統(tǒng)推薦算法而言,灰色關(guān)聯(lián)預(yù)測(cè)減少了非近鄰的信息損失,減輕稀疏性。
(2)考慮冷啟動(dòng)問題,本文考慮用戶興趣特征相似度和基于信任云的用戶相似度,計(jì)算加權(quán)的綜合相似度,進(jìn)行方案匹配并推薦給新用戶。
最后,通過汽車方案推薦的案例,驗(yàn)證了所提方法的有效性。但是本文灰色關(guān)聯(lián)相似度并未進(jìn)行優(yōu)化,因此,下一步考慮對(duì)灰色關(guān)聯(lián)度進(jìn)行改進(jìn),并用于方案推薦。