趙彥輝 劉樹春
[摘要]構建基于分布式平臺及大量借閱數(shù)據(jù)的圖書推薦算法。是實現(xiàn)圖書館個性化信息推送服務的關鍵環(huán)節(jié)。本文從搭建Hadoup分布式平臺和運用Mahout的MapReduce實現(xiàn)算法入手,針對讀者借閱記錄的分類號進行頻數(shù)統(tǒng)計和借閱時間統(tǒng)計,依據(jù)借閱次數(shù)和借閱時間獲得偏好值。并使用Mahout基于圖書的推薦器,測試偽分布式單節(jié)點模式和完全分布式MapReduce計算框架下的推薦效果。測試表明:在MapReauce運算中增加DataNode的數(shù)量同時優(yōu)化BlockSize參數(shù)能顯著縮短運算時間,是實現(xiàn)個性化薦書服務自動推送的可行方法。endprint
[摘要]構建基于分布式平臺及大量借閱數(shù)據(jù)的圖書推薦算法。是實現(xiàn)圖書館個性化信息推送服務的關鍵環(huán)節(jié)。本文從搭建Hadoup分布式平臺和運用Mahout的MapReduce實現(xiàn)算法入手,針對讀者借閱記錄的分類號進行頻數(shù)統(tǒng)計和借閱時間統(tǒng)計,依據(jù)借閱次數(shù)和借閱時間獲得偏好值。并使用Mahout基于圖書的推薦器,測試偽分布式單節(jié)點模式和完全分布式MapReduce計算框架下的推薦效果。測試表明:在MapReauce運算中增加DataNode的數(shù)量同時優(yōu)化BlockSize參數(shù)能顯著縮短運算時間,是實現(xiàn)個性化薦書服務自動推送的可行方法。endprint
[摘要]構建基于分布式平臺及大量借閱數(shù)據(jù)的圖書推薦算法。是實現(xiàn)圖書館個性化信息推送服務的關鍵環(huán)節(jié)。本文從搭建Hadoup分布式平臺和運用Mahout的MapReduce實現(xiàn)算法入手,針對讀者借閱記錄的分類號進行頻數(shù)統(tǒng)計和借閱時間統(tǒng)計,依據(jù)借閱次數(shù)和借閱時間獲得偏好值。并使用Mahout基于圖書的推薦器,測試偽分布式單節(jié)點模式和完全分布式MapReduce計算框架下的推薦效果。測試表明:在MapReauce運算中增加DataNode的數(shù)量同時優(yōu)化BlockSize參數(shù)能顯著縮短運算時間,是實現(xiàn)個性化薦書服務自動推送的可行方法。endprint