林 群 閻瑞霞
(上海工程技術(shù)大學(xué)管理學(xué)院 上海 201620)
基于變精度雙論域粗糙集的個(gè)性化推薦方法
林 群 閻瑞霞
(上海工程技術(shù)大學(xué)管理學(xué)院 上海 201620)
針對(duì)用戶不確定性決策問題,提出基于變精度雙論域粗糙集的個(gè)性化推薦方法。首先,基于置信度的含義提出一種新的知識(shí)庫構(gòu)建方法,并利用SQL語言實(shí)現(xiàn)。在此基礎(chǔ)上構(gòu)建基于變精度雙論域粗糙集的個(gè)性化推薦模型,并將該模型應(yīng)用到男士襯衫的個(gè)性化推薦中。最后通過推薦方法比較分析,實(shí)驗(yàn)結(jié)果說明了基于變精度雙論域粗糙集的個(gè)性化推薦模型的有效性。
變精度粗糙集 雙論域 個(gè)性化推薦 關(guān)聯(lián)規(guī)則 非確定性決策
“互聯(lián)網(wǎng)+”行動(dòng)計(jì)劃不斷加快電子商務(wù)企業(yè)發(fā)展,越來越多的商家進(jìn)入電子商務(wù)行業(yè)。據(jù)統(tǒng)計(jì),截至2015年12月,中國網(wǎng)民增長率為6.1%,網(wǎng)民規(guī)模達(dá)6.88億[1],在線銷售變得紛繁復(fù)雜。盡管推薦系統(tǒng)早已產(chǎn)生,但面對(duì)海量的不確定性用戶信息,商家往往只根據(jù)熱度高的商品或者用戶以往買過的相似商品覆蓋率進(jìn)行推薦,商家推薦商品的精準(zhǔn)性大幅度下降。同時(shí),隨著用戶生活節(jié)奏逐漸增強(qiáng),用戶購物時(shí)間緊迫,用戶要求商家在短時(shí)間內(nèi)做出精準(zhǔn)推薦。商家在不確定性用戶信息與實(shí)時(shí)性決策環(huán)境下推薦的商品,往往會(huì)使用戶對(duì)實(shí)際貨物與購物心理預(yù)期形成落差,大大提高了網(wǎng)購?fù)藫Q貨率,退換貨必然會(huì)影響購物體驗(yàn),降低用戶忠誠度。為了提高商家推薦準(zhǔn)確性與實(shí)時(shí)性,提高用戶回頭率,準(zhǔn)確性高的個(gè)性化推薦系統(tǒng)對(duì)商家而言尤為重要。
個(gè)性化推薦系統(tǒng)[2-4]是建立在海量數(shù)據(jù)挖掘基礎(chǔ)上的智能推薦平臺(tái),以幫助電子商務(wù)網(wǎng)站為用戶提供個(gè)性化購買決策支持與信息服務(wù)。商家針對(duì)不同的用戶,根據(jù)偏好與個(gè)性化需求給出更加精確的推薦。近年來,電子商務(wù)個(gè)性化推薦受到了國內(nèi)外諸多學(xué)者的密切關(guān)注,產(chǎn)生許多研究成果。個(gè)性化推薦算法主要分為3種:基于內(nèi)容、協(xié)同過濾與混合推薦。文獻(xiàn)[5] 在計(jì)算微博用戶與微話題的相似性的基礎(chǔ)上,提出了基于內(nèi)容的熱門微話題推薦方法,該方法可解釋性強(qiáng),用戶易理解,也不存在冷啟動(dòng)問題,但是在推薦多樣性上存在不足,難以發(fā)掘用戶的潛在偏好。文獻(xiàn)[6] 根據(jù)用戶的發(fā)帖、回帖和閱讀等記錄,計(jì)算用戶帖子的評(píng)分矩陣,認(rèn)為對(duì)于任意帖子評(píng)分相同的用戶具有相同的偏好,提出基于協(xié)同過濾的網(wǎng)絡(luò)論壇個(gè)性化推薦算法,該方法很好應(yīng)用于復(fù)雜推薦對(duì)象,但存在冷啟動(dòng)問題。文獻(xiàn)[8] 提出基于商品屬性與用戶聚類的個(gè)性化服裝混合推薦方法,通過用戶個(gè)人信息與對(duì)商品的評(píng)價(jià),計(jì)算用戶之間的相似性,進(jìn)行聚類分析,通過計(jì)算商品相似性,得到top-N相似列表,并結(jié)合兩者的權(quán)重值,實(shí)現(xiàn)用戶個(gè)性化推薦。文獻(xiàn)[9] 改進(jìn)傳統(tǒng)基于內(nèi)容推薦得到的用戶現(xiàn)有興趣,通過協(xié)同過濾得到用戶潛在興趣,并加以結(jié)合,構(gòu)建基于內(nèi)容與協(xié)同過濾的混合推薦方法下的用戶興趣模型?;旌贤扑]方法兼顧推薦多樣性和個(gè)性化需求的同時(shí),有效避免推薦時(shí)間上的滯后性,但存在冷啟動(dòng)問題,并未考慮推薦環(huán)境的不確定性。
用戶屬性特征的不確定性決定了網(wǎng)絡(luò)購物環(huán)境的不確定性,用戶購物行為復(fù)雜多變,比如,用戶年齡是不斷增長的,過去購買行為并不能說明現(xiàn)狀;用戶身份為銷售人員時(shí)其工資發(fā)放性質(zhì)決定其收入的不穩(wěn)定性和購物行為不定性等。粗糙集是一種處理不確定性知識(shí)的數(shù)學(xué)工具,是人工智能中的一種重要推理技術(shù)。針對(duì)以往推薦系統(tǒng)并不能很好地解決推薦環(huán)境不確定性問題,本文提出基于變精度雙論域粗糙集的個(gè)性化推薦方法,其主要思想是在粗糙集的基礎(chǔ)上,將粗糙集模型推廣到兩個(gè)不同但相關(guān)的論域,同時(shí)在模型中引入分類精度,使模型具有一定的容錯(cuò)性,增強(qiáng)模型抗噪聲能力。目前關(guān)于變精度雙論域粗糙集的研究主要集中在模型的構(gòu)建、屬性約簡和規(guī)則提取等方面[10-12],很少有學(xué)者研究知識(shí)庫的構(gòu)建。本文結(jié)合關(guān)聯(lián)規(guī)則的原理,將置信度引入到知識(shí)庫的構(gòu)建中,并利用SQL語言實(shí)現(xiàn);在此基礎(chǔ)上構(gòu)建基于變精度雙論域粗糙集的個(gè)性化推薦模型;最后,本文將該模型應(yīng)用到服裝的個(gè)性化推薦中,并通過比較說明了模型的有效性。
1.1 變精度雙論域粗糙集
經(jīng)典Pawlak粗糙集研究的是在同一個(gè)論域上的對(duì)象,同時(shí)要求所處理對(duì)象完全已知的且分類是完全精確的,得到的規(guī)則也只適用于該對(duì)象。然而在許多實(shí)際管理決策問題中,常常涉及兩個(gè)不同論域,往往只是將所求的樣本結(jié)論推測總體對(duì)象,數(shù)據(jù)具有不精確性。因此,相對(duì)于經(jīng)典粗糙集而言,變精度雙論域粗糙集的理論思想和模型是解決實(shí)際管理決策問題的有效工具。
1.1.1 分類正確率與參數(shù)的確定
基于上述問題,變精度雙論域粗糙集在引入雙論域的基礎(chǔ)上,還引入分類正確率與參數(shù)α、β,加強(qiáng)定義雙論域粗糙集上、下近似算子,放松粗糙集嚴(yán)格的邊界定義,使模型更適用于現(xiàn)實(shí)數(shù)據(jù)的不精確性問題,同時(shí),雙參數(shù)的設(shè)定使模型對(duì)數(shù)據(jù)不一致性有一定的容忍度,提高數(shù)據(jù)分析的適應(yīng)能力。
定義1 (分類正確率) 設(shè)X、Y分別是有限論域U、V的子集,令:
(1)
其中,|R(x)∩Y|表示集合X關(guān)于Y的相對(duì)分類正確率,即集合Y基于X的條件概率。
在雙參數(shù)變精度雙論域粗糙集模型中,正確確定參數(shù)α和β的范圍能減少數(shù)據(jù)噪聲,增強(qiáng)分析的準(zhǔn)確性。Y的雙論域近似區(qū)域與閾值α和β取值緊密相關(guān),并隨α和β的取值變化而變化,因此,α和β取值能夠體現(xiàn)雙論域近似空間的精確度,決策者對(duì)參數(shù)確定也顯得尤為重要。本文研究主要利用Aijun提出的0.5<β≤α≤1的分類正確率來研究電子商務(wù)服裝個(gè)性化推薦模型[ 13]。
1.1.2 雙參數(shù)變精度雙論域粗糙上、下近似計(jì)算
定義2 (雙論域上、下近似) 在信息系統(tǒng)(U,V,R),U={x1,x2,…,xm},V={y1,y2,…,yn},?Y?V,0.5<β≤α≤1,Y在關(guān)系R下的α雙論域下近似集和雙論域β上近似集定義如下:
(2)
(3)
分別表示Y的雙論域α下近似和β雙論域上近似[14]。
1.1.3 決策規(guī)則提取
在信息系統(tǒng)(U,V,R)中,U={x1,x2,…,xm},V={y1,y2,…,yn},?Y?V,規(guī)定:
由此可以提取規(guī)則:兩條確定性規(guī)則,分別根據(jù)雙論域正域和負(fù)域提??;以及兩條可能性規(guī)則,分別根據(jù)雙論域可能域和邊界域提取,為商家個(gè)性化推薦提供有力的依據(jù)。
1.2 關(guān)聯(lián)規(guī)則
定義3 (關(guān)聯(lián)規(guī)則) 關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘的核心技術(shù)之一,可描述如下:設(shè)I={i1,i2,…,im}是個(gè)不同項(xiàng)目組成的集合,其中的元素i稱為項(xiàng)目(item)。記D={t1,t2,…,tn}為事務(wù)數(shù)據(jù)庫,T為D的事務(wù)集,每個(gè)事務(wù)ti(i=1,2,…,n)都對(duì)應(yīng)I上的一個(gè)子集。我們用關(guān)聯(lián)規(guī)則分析形如X→Y的蘊(yùn)涵式,X?I,Y?I,且X∩Y=?。X是關(guān)聯(lián)規(guī)則的前件,Y是關(guān)聯(lián)規(guī)則的后件,關(guān)聯(lián)規(guī)則挖掘就是要找到所有滿足給定的最低支持度和最低置信度的蘊(yùn)含式。
因此,關(guān)聯(lián)規(guī)則分析的基本算法步驟:
(1) 選出滿足支持度最小閾值的頻繁項(xiàng)集;
(2) 從頻繁項(xiàng)集中找出滿足最小置信度的所有規(guī)則。
變精度雙論域粗糙集是在知識(shí)庫基礎(chǔ)上進(jìn)行推理判斷的。傳統(tǒng)知識(shí)庫的建立主要有三種方法:(1)簡單使用SPSS軟件分析各屬性之間的相關(guān)性并構(gòu)建關(guān)系矩陣;(2)將關(guān)系數(shù)據(jù)庫中的多值屬性進(jìn)行布爾轉(zhuǎn)換,再利用布爾型關(guān)聯(lián)規(guī)則建立關(guān)系矩陣。在屬性較多的情況下,這兩種方法在實(shí)現(xiàn)上較復(fù)雜且消耗大量時(shí)間,甚至?xí)G失部分有用信息;(3)利用關(guān)系數(shù)據(jù)庫系統(tǒng)中的SQL語句來執(zhí)行。該方法目前只是對(duì)經(jīng)典關(guān)聯(lián)規(guī)則算法進(jìn)行擴(kuò)展,影響了挖掘效率。
同時(shí),關(guān)系數(shù)據(jù)庫往往是由成千上萬不同類型和值域空間的屬性組成的,這決定了獲取的關(guān)聯(lián)規(guī)則具有明顯的特點(diǎn):(1)離散化的多值型關(guān)聯(lián)規(guī)則。關(guān)系數(shù)據(jù)庫往往含有大量的數(shù)值屬性和類別屬性,在關(guān)聯(lián)規(guī)則分析之前需要對(duì)其進(jìn)行數(shù)值屬性或多值屬性的離散化;(2)多屬性型關(guān)聯(lián)規(guī)則,包括兩個(gè)及以上不同屬性之間關(guān)系的關(guān)聯(lián)規(guī)則。
因此,針對(duì)上述問題,本文主要是在關(guān)聯(lián)規(guī)則分析關(guān)系數(shù)據(jù)庫的基礎(chǔ)上,通過執(zhí)行SQL語句提出數(shù)據(jù)庫中多值、多屬性型關(guān)聯(lián)規(guī)則算法[15-19]。該方法操作簡單快速且高效,適用于各種數(shù)據(jù)類型。挖掘算法描述如下[20]:
輸入:挖掘數(shù)據(jù)源(db)、最小支持度閾值(minsup)、最小可信度閾值(minconf)
k=1
ACk=generate-attribute-combination(k)
// 產(chǎn)生db中所有1組合屬性集
Lk=generate-frequent-attribute-value-sets (ACk)
// 產(chǎn)生db中頻繁1項(xiàng)集
DowhileLk≠?andk≤AttributeCount
//AttributeCount為db中屬性的個(gè)數(shù)
k=k+1
ACk=generate-attribute-combination(k)
// 產(chǎn)生db中可能具有頻繁值集的所有k組合屬性集
Lk=generate-frequent-attribute-value-sets(ACk)
// 產(chǎn)生db中頻繁k項(xiàng)集
End do
AR=generate-association-rules(Lk)
// 產(chǎn)生db中所有強(qiáng)關(guān)聯(lián)規(guī)則。
例如,在收集的數(shù)據(jù)表(db)中計(jì)算年齡(A)、收入(C)、檔次(I)這三個(gè)屬性滿足的最小支持度(minsup)的頻繁屬性值集,可用“selectA,C,I,count(*)fromdbgroupbyA,C,Ihavingcount(*)≥minsup”執(zhí)行。通過借鑒Apriori算法“連接”與“剪枝”的思想產(chǎn)生屬性組合集,減少SQL執(zhí)行次數(shù)。
根據(jù)上述分析研究,針對(duì)目前電子商務(wù)個(gè)性化推薦中存在的問題,提出基于雙參數(shù)變精度雙論域粗糙集的方法。商家通過提取影響用戶購物行為的商品屬性特征以及用戶本身屬性特征,運(yùn)用關(guān)聯(lián)規(guī)則建立知識(shí)庫,在此基礎(chǔ)上構(gòu)建變精度雙論域粗糙集的個(gè)性化推薦模型[10-13],計(jì)算并提取決策規(guī)則。根據(jù)變精度雙論域粗糙集特點(diǎn),提取到兩條確定性規(guī)則(基于α正域、基于β負(fù)域)和兩條可能性規(guī)則(基于α可能域、基于α、β邊界域),并依據(jù)上述四條規(guī)則對(duì)用戶進(jìn)行個(gè)性化推薦。
基于雙參數(shù)變精度雙論域粗糙集推薦模型步驟如圖1所示。
(1) 將SQL語句引入到關(guān)聯(lián)規(guī)則中,建立關(guān)系知識(shí)庫,從而構(gòu)建雙參數(shù)變精度雙論域粗糙集關(guān)系矩陣MR;
(3) 計(jì)算雙參數(shù)變精度雙論域粗糙集的正域、負(fù)域、邊界域和可能域;
(4) 提取決策規(guī)則。
為了方便分析,以男士襯衫個(gè)性化推薦為例,利用雙論域變精度雙論域粗糙集方法,針對(duì)用戶對(duì)男士襯衫的個(gè)性化需求,商家對(duì)男士襯衫進(jìn)行個(gè)性化推薦,縮短用戶消耗時(shí)間,提高用戶信賴與忠誠度,減少退換貨率。
4.1 數(shù)據(jù)來源
本文主要通過設(shè)計(jì)調(diào)查問卷,從受訪者的年齡、身高、收入、購買時(shí)間、穿著習(xí)慣等基本信息,以及受訪者對(duì)襯衫的尺碼、顏色、材質(zhì)、檔次、風(fēng)格、版型、厚薄等個(gè)性化要求進(jìn)行調(diào)查,將收集到的數(shù)據(jù)進(jìn)行預(yù)處理,進(jìn)而對(duì)問題進(jìn)行研究。此次共發(fā)放問卷350份,扣去未收回和缺失值過多的無效問卷,最后得有效問卷310份,有效率達(dá)到88.6%。
4.2 用戶和男士襯衫屬性類型
根據(jù)結(jié)合天貓網(wǎng)站用戶和男士襯衫屬性劃分方法,本文主要利用用戶5種屬性(年齡、身高、收入、購買時(shí)間、穿著習(xí)慣)以及男士襯衫7種特征(尺碼、顏色、材質(zhì)、檔次、風(fēng)格、版型、厚薄)來分析男士襯衫的個(gè)性化推薦情況,但是從問卷調(diào)查中收集到的數(shù)據(jù)都是連續(xù)性的,因此,需要先對(duì)收集到的數(shù)據(jù)進(jìn)行離散化。本文采用自然劃分分段的方法,將連續(xù)的屬性值劃分成若干個(gè)范圍,并在每個(gè)范圍中給出一個(gè)標(biāo)準(zhǔn)值,這樣就使連續(xù)的屬性值達(dá)到了離散化。具體分類及離散化后的決策如表1和表2所示。
表1 用戶特征屬性值
表2 男士襯衫屬性值
由上述表1可以得到離散的數(shù)據(jù)如表3所示。
表3 離散的數(shù)據(jù)表
續(xù)表3
4.3 關(guān)系矩陣
根據(jù)信息系統(tǒng)(U,V,R)中,U={x1,x2,…,xm},V={y1,y2,…,yn},?Y?V。其中U={x1,x2,…,x23}表示男士襯衫的屬性特征,V={y1,y2,…,y21}表示用戶屬性特征。
圖2 相關(guān)分析圖
4.4 結(jié)果分析
假設(shè)下近似閾值為α=0.6,上近似閾值為β=0.55,并且上述的知識(shí)庫為完備知識(shí)庫。為了充分驗(yàn)證雙參數(shù)變精度雙論域粗糙集推薦方法能很好地處理冷啟動(dòng)問題,假設(shè)新用戶屬性集合為Y={y2,y6,y11,y16,y19},可以得到:
由此可以看出,如果新的用戶屬性為年齡:25~35,身高:170~175,收入:5 000~7 000,購買時(shí)間:秋季,穿著習(xí)慣:合體,可以得到:
(1) 兩條確定性規(guī)則
①y2∩y6∩y11∩y16∩y19?x3∩x12∩x17∩x21,則必須向其推薦的男士襯衫應(yīng)該同時(shí)具有:尺碼:L,檔次:中檔,版型:直筒,厚?。汉?。
②y2∩y6∩y11∩y16∩y19?(x1∩x2∩x4∩x5∩x7∩x8∩x10∩x11∩x13∩x14∩x16∩x18∩x19∩x20∩x22),則不要向其推薦的男士襯衫具有 :尺碼:S,尺碼:M,尺碼:XL,尺碼:2XL,顏色:深色系,檔次:低檔,檔次:高檔,風(fēng)格:休閑,版型:修身,版型:寬松,厚?。撼R?guī),厚?。罕?,厚?。杭雍?。
(2) 兩條可能性規(guī)則
①y2∩y6∩y11∩y16∩y19?x3∩x6∩x9∩x12∩x15∩x17∩x21,則可以考慮向其推薦的男士襯衫具有:尺碼:L,顏色:淺顏色,材質(zhì):棉質(zhì),檔次:中檔,風(fēng)格:正式,版型:直筒,厚?。汉裰腥我馓卣鞯哪惺恳r衫。
②y2∩y6∩y11∩y16∩y19?x6∩x9∩x15,則可以考慮向其推薦的男士襯衫具有:顏色:淺顏色,材質(zhì):棉質(zhì),風(fēng)格:正式中任意特征的男士襯衫。
4.5 評(píng) 估
由于每個(gè)推薦系統(tǒng)的評(píng)估標(biāo)準(zhǔn)不一樣,本文主要采用綜合指標(biāo)F-Measure和整體多樣性來評(píng)估推薦系統(tǒng)的好壞,其中綜合指標(biāo)F-Measure是由分類準(zhǔn)確率中準(zhǔn)確率(precision)與召回率(recall)兩個(gè)評(píng)估指標(biāo)調(diào)和加權(quán)平均所得[7-10]。推薦結(jié)果統(tǒng)計(jì)如表4所示。
表4 推薦結(jié)果統(tǒng)計(jì)表
通過設(shè)置不同的推薦服裝數(shù)N,得到不同推薦方法在不同推薦服裝數(shù)下的F1的值,N-F1曲線如圖3所示。
圖3 推薦服裝數(shù)N-F1曲線
由圖3可以看出,基于變精度雙論域粗糙集隨著推薦服裝數(shù)N的變動(dòng),綜合評(píng)價(jià)指標(biāo)F1的值在排除偶然因素的情況下,一直穩(wěn)定在0.4~0.6之間,具有良好的穩(wěn)定性與持久性。同時(shí),變精度雙論域粗糙集方法在性能上與混合算法相比雖然只有稍微提高,但與協(xié)同過濾和基于內(nèi)容的推薦方法相比有了明顯提高。
設(shè)s(i,j)ε[0,1]表示服裝屬性i和j的余弦相似度,單用戶u推薦列表R(u)的多樣性計(jì)算公式為:
(4)
推薦系統(tǒng)整體多樣性計(jì)算如下式所示:
(5)
如圖4所示,不同推薦服裝數(shù)N下的Diversity值,可以看出變精度雙論域粗糙集方法在多樣性上,與混合方法、協(xié)同過濾推薦算法基本相當(dāng),但比基于內(nèi)容的推薦方法有了明顯提高。
圖4 不同推薦算法Diversity比較
圖3、圖4表明雙論域粗糙集在性能上與混合推薦方法差別不大,但由于混合推薦方法易產(chǎn)生冷啟動(dòng)的問題,而變精度雙論域粗糙集能很好的針對(duì)新用戶進(jìn)行推薦,不存在冷啟動(dòng)問題,因此雙論域粗糙集方法優(yōu)于其他方法。
基于變精度雙論域粗糙集的個(gè)性化推薦系統(tǒng),將雙論域粗糙集應(yīng)用到電子商務(wù)多對(duì)多雙邊匹配的多屬性決策問題中去,是解決實(shí)際管理決策問題的有效工具。將SQL語句引入到關(guān)聯(lián)規(guī)則中,用于構(gòu)建關(guān)系矩陣,高效且方便的數(shù)據(jù)關(guān)系挖掘方法大大縮短系統(tǒng)的推薦時(shí)間,節(jié)約了用戶時(shí)間成本。同時(shí),在保證性能良好與整體多樣性的基礎(chǔ)上,基于變精度雙論域粗糙集不依賴于用戶以往行為,不僅能夠很好地解決目前推薦系統(tǒng)中存在的冷啟動(dòng)問題,更能實(shí)現(xiàn)用戶不確定性環(huán)境下的個(gè)性化需求,提高了推薦的準(zhǔn)確性以及用戶的購物體驗(yàn)與忠誠度,減少退換貨率。
[1]CNNIC報(bào)告. 移動(dòng)互聯(lián)網(wǎng)或引領(lǐng)文化發(fā)展新布局[J].計(jì)算機(jī)與網(wǎng)絡(luò), 2016, 42(5):6.
[2]WengSS,LinBS,ChenWJ.Usingcontextualinformationandmultidimensionalapproachforrecommendation[J].ExpertSystemwithApplications, 2009,36(2):1268-1279.
[3]ZuoY,GongMG,ZengJL,etal.PersonalizedRecommendationBasedonEvolutionaryMulti-ObjectiveOptimization[J].IEEEcomputationalintelligencemagazine, 2016,10(1):52-62.
[4] 王國霞, 劉賀平.個(gè)性化推薦系統(tǒng)綜述[J].計(jì)算機(jī)工程與應(yīng)用, 2012,48(7):66-76.
[5] 安悅,李兵,楊瑞泰,等. 基于內(nèi)容的熱門微話題個(gè)性化推薦研究[J].情報(bào)雜志,2014,33(2):155-160.
[6] 張新猛,蔣盛益. 基于協(xié)同過濾的網(wǎng)絡(luò)論壇個(gè)性化推薦算法[J]. 計(jì)算機(jī)工程,2012,38(5):67-69.
[7]MarcoDegemmis,PasqualeLops,GiovanniSemeraro.Acontent-collaborativerecommenderthatexploitsWordNet-baseduserprofilesforneighborhoodformation[J].UserModelingandUser-AdaptedInteraction, 2007, 17(3):217-255.
[8] 艾黎. 基于商品屬性與用戶聚類的個(gè)性化服裝推薦研究[J]. 現(xiàn)代情報(bào),2015,35(9):165-170.
[9] 楊武,唐瑞,盧玲. 基于內(nèi)容的推薦與協(xié)同過濾融合的新聞推薦方法[J].計(jì)算機(jī)應(yīng)用,2016,36(2):414-418.
[10]WuZhong,YanRuixia.Variableprecisionroughsetoverdual-universesingeneralincompleteinformationsystem[J].InternationalJournalofAdvancementsinComputingTechnology, 2012, 4(19):299-306.
[11] 庾慧英,劉尚. 雙論域上的變精度粗糙集模型[J].科學(xué)技術(shù)與工程,2007,7(1):4-7.
[12] 張海東. 基于一般關(guān)系下的雙論域變精度粗糙集模型[J]. 寧夏師范學(xué)院學(xué)報(bào),2011,32(6):18-21.
[13] 趙煥煥,劉勇,劉思峰,等. 基于灰色相似關(guān)聯(lián)關(guān)系的灰色變精度粗糙集模型及應(yīng)用[J]. 系統(tǒng)工程,2015,33(2):146-151.
[14] 閻瑞霞,鄭建國,翟育明. 雙論域粗糙集的不確定性度量[J]. 上海交通大學(xué)學(xué)報(bào),2011,45(12):1841-1845.
[15] 李少陽,李巧艷,宋衛(wèi)妮. 粗糙集上下近似的矩陣刻畫及應(yīng)用[J]. 計(jì)算機(jī)工程與應(yīng)用,2015, 51(20):107-110,152.
[16]ChunguangBai,JosephSarkis.Evaluatingsupplierdevelopmentprogramswithagreybasedroughsetmethodology[J].ExpertSystemswithApplications, 2011, 38(11):13505-13517.
[17] 肖輝輝,段艷明. 關(guān)系數(shù)據(jù)庫SQL語句的設(shè)計(jì)優(yōu)化研究[J]. 軟件導(dǎo)刊,2010,9(12):177-179.
[18] 李杰,徐勇,王云峰,等. 面向個(gè)性化推薦的強(qiáng)關(guān)聯(lián)規(guī)則挖掘[J]. 系統(tǒng)工程理論與實(shí)踐,2009,29(8):144-152.
[19] 錢慎一,王歡歡,楊鐵松. 改進(jìn)關(guān)聯(lián)規(guī)則算法在煙草物流銷售規(guī)律中的應(yīng)用[J]. 計(jì)算機(jī)系統(tǒng)應(yīng)用,2016,25(3):204-208.
[20] 王芳,王萬森. 關(guān)系數(shù)據(jù)庫中關(guān)聯(lián)規(guī)則挖掘的一種高效算法[J].微機(jī)發(fā)展,2004,(14)9:20-22.
A PERSONALIZED RECOMMENDATION METHOD BASED ON VARIABLE PRECISION DUAL-UNIVERSE ROUGH SET
Lin Qun Yan Ruixia
(SchoolofManagement,ShanghaiUniversityofEngineeringScience,Shanghai201620,China)
Aiming at the problem of user uncertainty decision, a personalized recommendation method based on variable precision dual-universe rough set is proposed. First, a new knowledge base construction method is proposed based on the meaning of confidence, and implemented by SQL language. Based on this, a personalized recommendation model based on variable-precision dual-domain rough set is proposed, and the model is applied to the personalized recommendation of men’s shirts. Finally, the effectiveness of the personalized recommendation model based on variable precision dual-universe rough sets is illustrated by the comparative analysis of experimental results.
Variable precision rough set Dual-universe Personalized recommendation Association rule Uncertainty decision-making
2016-04-28。國家自然科學(xué)基金項(xiàng)目(71301100);上海市教委科研創(chuàng)新項(xiàng)目(14YZ140);上海市教委青年教師計(jì)劃項(xiàng)目(ZZGJD12036);上海市自然科學(xué)基金項(xiàng)目(16ZR1414000);上海工程技術(shù)大學(xué)研究生科研創(chuàng)新項(xiàng)目(15KY0354)。林群,碩士生,主研領(lǐng)域:個(gè)性化推薦技術(shù)。閻瑞霞,副教授。
TP713
A
10.3969/j.issn.1000-386x.2017.06.045