• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于社會標簽的視頻推薦系統(tǒng)的研究

      2021-06-16 05:29:24劉天成
      電子制作 2021年4期
      關鍵詞:瀏覽量權值標簽

      劉天成

      (上海市川沙中學,上海,201299)

      0 引言

      在這個信息流動迅速的時代,視頻作為人們快速獲取信息和娛樂的渠道,被人們所喜愛。隨著大量的視頻網(wǎng)站的發(fā)展,每天用戶都有大量的視頻可以觀看,而其中有些不符合他們的興趣,有些則是質量偏低。同時,推薦系統(tǒng)的日臻完善,使得幫助用戶找到自己想要的視頻變得簡單,而不需要自己花費大量時間去尋找。

      網(wǎng)絡的社會化趨勢產(chǎn)生了越來越多的社會化標注系統(tǒng)[1],當用戶給視頻添加過標簽后,便可以匹配相似標簽來匹配,但其系統(tǒng)還存在可信度低,準確度低等問題?;谕ㄓ脴撕灱捌渖系奶囟撕灥耐扑]系統(tǒng)便是本文研究的主要系統(tǒng),而解決系統(tǒng)的問題及對其提出創(chuàng)新便是本文的研究意義。

      推薦系統(tǒng)是指對用戶的興趣進行研究后,對其進行個性化推薦,個性化推薦技術,指的是系統(tǒng)智能獲取用戶的行為數(shù)據(jù),進而主動給用戶推薦他們感興趣的信息[2]。這種技術的想法最早出現(xiàn)在1992年,發(fā)展至現(xiàn)在,主要的推薦系統(tǒng)有:協(xié)同過濾推薦系統(tǒng),基于內容的推薦系統(tǒng)等。

      推薦系統(tǒng)能幫助用戶找到自己想看的視頻,而本文研究的方法便是基于社會標簽的推薦系統(tǒng),當下的社會標簽主要由用戶和作者及專家群體來提供,通過匹配標簽便能實現(xiàn)推薦,

      但其系統(tǒng)也存在明顯的缺陷,因為標簽是由用戶創(chuàng)造和添加的,導致用戶可以寫出他想表示的標簽而非真正符合視頻的標簽,有些標簽甚至會誤導視頻所包含的真正內容,造成了可信度低,標簽數(shù)量龐大,不方便匹配等問題,最終會導致系統(tǒng)承受巨大的負擔,且會經(jīng)常出現(xiàn)錯誤推薦。

      1 視頻推薦系統(tǒng)概述

      ■1.1 協(xié)同過濾視頻推薦系統(tǒng)

      協(xié)同過濾推薦系統(tǒng)分為基于用戶和基于物品,基于用戶的協(xié)同過濾推薦(UserCF)研究的是用戶間的關系,其在視頻推薦系統(tǒng)中的作用是匹配興趣相似的用戶,給當前用戶推薦他沒有見過但另一用戶見過的視頻?;谖锲返膮f(xié)同過濾推薦(ItemCF)是根據(jù)用戶給物品的評分來匹配物品間的相似度而進行匹配的,其在視頻推薦系統(tǒng)中是匹配視頻的相似度來進行推薦的,其主要缺點為對于數(shù)據(jù)量有十分高的要求,缺少數(shù)據(jù)就會導致推薦不精確。

      ■1.2 基于社交網(wǎng)絡的視頻推薦系統(tǒng)

      基于社交網(wǎng)絡的推薦的核心是把握用戶之間的信任關系的度量,起因是學者發(fā)現(xiàn)好友的推薦往往會被重視,通過研究人的重要性,人與人之間的交往關系,匹配其相似度來進行推薦。個性化的好友推薦是基于兩個特征來研究的:用戶間共同好友和用戶間的相似性[3]。2017 年,胡云等人提出了一種綜合評分和信任關系的社會化推薦算法,解決了用戶特征向量的精準構建及信任傳遞問題[4]。

      ■1.3 基于標簽的視頻推薦系統(tǒng)

      此系統(tǒng)的基礎是社會標簽,來源于用戶為物品所給出的標簽,本文定義該標簽為通用標簽,其劣勢主要為:不精確,較為混亂。在這種標簽之上,還有一些特定標簽,其來源于專家或作者所給出的標簽,這類標簽相比通用標簽精確度更高,但它也存在一定缺點,比如專家及作者只考慮專業(yè)方面卻忽視了用戶對其的看法,導致標簽并不適應大眾。

      2 基于通用標簽的視頻推薦系統(tǒng)

      ■2.1 通用標簽的作用

      視頻因其內容難以由系統(tǒng)概括而在推薦的時候顯得尤為困難,系統(tǒng)不能自主判斷視頻的分類,因此,需要其他人來幫忙給出標簽,本章主要研究由用戶給出的標簽,而此舉動包含了兩個部分,其一是用戶添加標簽的行為,另一是對于一個視頻的標簽,這兩方面分別對于用戶自身的興趣研究以及視頻的信息概述都有很大的幫助。

      ■2.2 標簽關于自身興趣的興趣預測

      用戶添加標簽,可以反應自身的興趣,用戶添加標簽的這個舉動,表現(xiàn)的是用戶對于此視頻很關注,也對于視頻中的內容很清楚,繼而可以推斷其對于同一類的視頻都會有一定的興趣,那么繼續(xù)匹配具有相似標簽的視頻,便可以形成推薦,大大降低了推薦的難度。進一步根據(jù)該行為進行推薦的方法是,根據(jù)用戶給出的標簽進行匹配,匹配相似標簽,具體方法如下:

      該算法用來計算該標簽與用戶的關聯(lián)性,其中,u表示用戶,a表示一個特定標簽,times 表示被使用的次數(shù),r表示任意標簽,all 表示用戶所標注過的全部標簽,relation的值越大,就說明用戶與這個標簽的關聯(lián)性越大,那么就可以籍此繼續(xù)推薦類似的標簽,可以用協(xié)同過濾系統(tǒng)進行進一步的匹配,把有相似標簽的視頻推薦給該用戶。

      該系統(tǒng)在遇到興趣面較為廣泛卻很少添加標簽的用戶時會顯得較為短板,因為此類用戶幾乎沒有自身關于標簽的關聯(lián)性,這也就導致了無法利用上述算法,從而導致推薦無法進行,解決方法是利用后文中的系統(tǒng)互補,兩者分情況進行交替使用,便可以解決不同用戶的差異所造成的問題。

      ■2.3 標簽關于視頻分類的作用

      用戶給視頻添加的標簽,可以對于視頻的分類產(chǎn)生幫助,當后來看到該視頻的用戶想添加同樣的標簽時,那么此標簽就基本可以認定為準確的標簽,把同一類的標簽集合起來,再去根據(jù)用戶的興趣推薦,形成的一個循環(huán),就是另一個通用標簽的作用。這個是主要的標簽系統(tǒng)的作用,在一個視頻下有足夠的通用標簽后,這個視頻就可以進行分類,分類后,系統(tǒng)就只需要匹配標簽之間的關系就可以成功地給用戶進行推薦。

      這個系統(tǒng)的主要兩個問題為:第一個問題,需要大量的數(shù)據(jù)量和瀏覽量,若是沒有這些瀏覽量,視頻的分類就極為不清晰,會導致無效推薦,而本文提出的解決方法就是與前文的系統(tǒng)結合,對于不流行,瀏覽量小的視頻主要利用前一個系統(tǒng)進行對于用戶本身興趣的研究并給他推薦視頻,對于瀏覽量多的視頻,就主要使用后者,這樣的好處不僅僅可以互補兩個系統(tǒng),同時,因為被分類的視頻主要是一些較為流行的視頻,也可以有一定的質量保證。第二個問題,用戶的標簽過于隨意,不夠準確,或是太過于繁雜,這個問題普遍存在于標簽系統(tǒng)中,而主要的解決方法是利用下文中將提到的特定標簽系統(tǒng),該系統(tǒng)有過濾掉大量的無用標簽作用。

      3 基于特定標簽的視頻推薦系統(tǒng)

      ■3.1 標簽群體的區(qū)別

      此類標簽主要由專家或是作者本人來給出,在給出標簽之前,系統(tǒng)將把類似的標簽集合起來,由專家或作者提出一個簡潔明了的標簽或是舍棄該標簽,例如“搞笑”和“惡搞”最終合并成“娛樂”,這樣可以合并大量的類似標簽,將最終標簽的數(shù)量降至10個以內,這10個中有通用標簽,也有特定標簽,此類標簽因為主要由官方提供,所以精確度比較高,但是也存在特定標簽也會不夠精確的情況,關于標簽精確度的問題,可以使用以下算法進行計算:

      其中a 表示該標簽,i表示該系統(tǒng)下的全部標簽,最終的值應在1以內,這個值代表著特定標簽所占的百分比,若是特定標簽被人們所認可,那么之后便不會再添加更多的通用標簽,也就使得特定標簽所占的百分比上升,相反,百分比越低,那么就代表著該特定標簽的準確度越低,若是這個值低于0.5,基本可以確定該特定標簽是有問題的,此時應該降低該標簽的權值或是直接對提出標簽的那一方提議修改,重新給出一個新的標簽。這個值也可以一定程度反應一個標簽的權值,但是不夠精確,推薦視頻的時候,會根據(jù)兩種標簽所占的權值來決定優(yōu)先級,隨后進行推薦。

      ■3.2 標簽優(yōu)先級問題

      此系統(tǒng)屬于混合推薦系統(tǒng),而混合推薦主要有這幾個類型:加權型,分級型混合推薦系統(tǒng),合并型,瀑布型[5]。本文主要利用加權型來解決優(yōu)先級問題。權的值取決于兩種標簽的數(shù)量,在把通用標簽聚集成集合的時候,對于每類相同標簽的數(shù)量進行計算,列出一個矩陣,其縱坐標為各個標簽的種類,橫坐標為數(shù)量,權值,再利用如下算法:

      ■3.3 視頻質量推薦優(yōu)化

      在根據(jù)上文的系統(tǒng)進行加權推薦后,會出現(xiàn)質量參差不齊的問題,有些低質量的視頻依然有很高的權值,導致在推薦的時候會推薦一些低質量的視頻。主要解決方法是通過瀏覽量和對于作者進行評估兩種方法,第一種方法可以與第三章中的系統(tǒng)合用,從而通過推薦瀏覽量多或評分高的視頻來一定程度上解決視頻的質量問題。第二種方法是通過對于一個作者的以往的視頻的質量進行評估,可以參考的數(shù)據(jù)有:瀏覽量,評分,收藏量等,在瀏覽量一定的情況下,若是收藏量和評分都較高,那么該作者的評估就很高,在推薦他的視頻的時候,就可以適當?shù)脑黾铀曨l的權值來使得該作者的視頻更容易被推薦,同時,也能帶動該作者的知名率,從而使得優(yōu)質視頻得以宣傳,形成良性循環(huán),反之,低質視頻就會被不斷的篩選,降低其權值,使其更不容易被推薦,從而降低其瀏覽量。

      4 總結與展望

      本文對基于標簽的視頻推薦系統(tǒng)的現(xiàn)狀進行了概述,對于幾個基于標簽的推薦系統(tǒng)進行了分析,提出了基于標簽的推薦系統(tǒng),有效解決了視頻質量較低的問題。此次研究雖然完善了基于標簽的推薦系統(tǒng)的一些缺點,但仍有一些問題仍未解決,例如如何確定三個系統(tǒng)的運行優(yōu)先級。下一步研究工作本文作者將致力于研究如何推薦給用戶高質量的視頻以及使得該系統(tǒng)運行更穩(wěn)定。

      猜你喜歡
      瀏覽量權值標簽
      一種融合時間權值和用戶行為序列的電影推薦模型
      CONTENTS
      游記表述與游客關注度的關系研究
      市場周刊(2018年8期)2018-11-09 12:04:26
      無懼標簽 Alfa Romeo Giulia 200HP
      車迷(2018年11期)2018-08-30 03:20:32
      不害怕撕掉標簽的人,都活出了真正的漂亮
      海峽姐妹(2018年3期)2018-05-09 08:21:02
      基于權值動量的RBM加速學習算法研究
      自動化學報(2017年7期)2017-04-18 13:41:02
      標簽化傷害了誰
      基于多進制查詢樹的多標簽識別方法
      計算機工程(2015年8期)2015-07-03 12:20:27
      《江南Style》瀏覽量超20億
      CNZZ報告顯示中國網(wǎng)民地域分布差異明顯
      丰台区| 商都县| 福清市| 廉江市| 高陵县| 伊川县| 基隆市| 临猗县| 乌兰县| 平昌县| 武夷山市| 鲜城| 盐亭县| 闽侯县| 郴州市| 苍南县| 安顺市| 万山特区| 囊谦县| 阜康市| 清徐县| 宜宾市| 肇庆市| 遂宁市| 邵阳市| 长阳| 呈贡县| 昌黎县| 莱州市| 揭东县| 金堂县| 遂平县| 惠水县| 资兴市| 雷州市| 衡阳市| 山阳县| 永平县| 静乐县| 靖边县| 南昌县|