• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于在線評論和集成獨立子空間的移動應(yīng)用采用預(yù)測研究

      2023-08-14 16:02:06沈旺時倩如李賀孫曉琦
      現(xiàn)代情報 2023年8期
      關(guān)鍵詞:在線評論移動應(yīng)用預(yù)測

      沈旺 時倩如 李賀 孫曉琦

      摘 要: [目的/ 意義] 對現(xiàn)有移動應(yīng)用用戶采用預(yù)測方法進行優(yōu)化, 為移動應(yīng)用開發(fā)商和發(fā)行商提供決策依據(jù)。[方法/ 過程] 從應(yīng)用商店采集在線評論, 抽取移動應(yīng)用產(chǎn)品信息特征, 利用獨立子空間方法進行特征采樣和特征重要性評估, 然后結(jié)合MLR、CART、ANN 和SVR 算法對移動應(yīng)用的用戶采用趨勢進行預(yù)測。[結(jié)果/結(jié)論] 本文提出的基于獨立子空間的集成方法在評估輸入特征的重要性上表現(xiàn)更佳, 且能夠準(zhǔn)確地預(yù)測移動應(yīng)用用戶采用趨勢。研究結(jié)論能夠為移動應(yīng)用開發(fā)商、發(fā)行商和應(yīng)用商店運營人員提供決策依據(jù)。

      關(guān)鍵詞: 移動應(yīng)用; 預(yù)測; 在線評論; 獨立子空間

      DOI:10.3969 / j.issn.1008-0821.2023.08.010

      〔中圖分類號〕G254 9 〔文獻標(biāo)識碼〕A 〔文章編號〕1008-0821 (2023) 08-0102-12

      移動互聯(lián)網(wǎng)時代, 移動應(yīng)用程序(Mobile Ap?plication, 簡稱APP)成為用戶獲取互聯(lián)網(wǎng)服務(wù)的重要載體, 滲透到人們生活的方方面面。根據(jù)中國互聯(lián)網(wǎng)絡(luò)信息中心發(fā)布的第49 次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》, 截至2021 年12 月, 我國手機網(wǎng)民規(guī)模達10 29 億, 網(wǎng)民使用手機上網(wǎng)的比例為99 7%, 國內(nèi)市場上監(jiān)測到的APP 數(shù)量為252萬款[1] 。

      應(yīng)用寶、華為應(yīng)用商店和小米應(yīng)用商店等應(yīng)用商店是移動應(yīng)用的主要分發(fā)渠道。隨著競爭加劇,市場的飽和程度不斷提高, 人口紅利消耗殆盡, 移動應(yīng)用用戶增長速度已經(jīng)放緩。如何在激烈的競爭中挖掘和獲取用戶, 提高自身的競爭力, 并為用戶提供最契合其需求的服務(wù), 成為開發(fā)者和應(yīng)用商店共同面臨的迫在眉睫的問題。預(yù)測用戶的采用趨勢能夠幫助開發(fā)商改進產(chǎn)品、掌握其產(chǎn)品生命周期演化過程以及做出運營決策。同時, 還有助于應(yīng)用商店優(yōu)化產(chǎn)品推薦、產(chǎn)品管理和挖掘潛在商機。

      現(xiàn)有的針對應(yīng)用程序的研究主要包括發(fā)展現(xiàn)狀分析[2] 、創(chuàng)新挖掘[3] 和用戶使用意愿分析[4] 等, 對應(yīng)用程序用戶采用趨勢的分析與預(yù)測較少。軟件產(chǎn)品屬于體驗型商品, 消費者很難事先獲知其真實質(zhì)量。應(yīng)用商店可以讓用戶搜索、購買和安裝移動應(yīng)用, 并且以評論和評分的形式提供反饋。在線評論在解決消費者決策過程中的信息不對稱問題上發(fā)揮了重要的作用[5] , 對于用戶、開發(fā)商和應(yīng)用商店運營人員都具有重要的意義。因此, 本文以移動應(yīng)用用戶采用趨勢為研究對象, 挖掘用戶在線評論觀點, 引入獨立子空間特征評價算法, 優(yōu)化現(xiàn)有的移動應(yīng)用用戶采用預(yù)測方法, 為服務(wù)提供商提供決策依據(jù)。

      1 文獻綜述

      1 1 在線評論對用戶決策的影響相關(guān)研究

      在線評論是消費者獲取產(chǎn)品信息和輔助購買、采納等決策的重要信息來源。國內(nèi)外研究者集中探討了評論數(shù)量和效價對用戶決策的影響。首先, 評論數(shù)量顯示了產(chǎn)品受歡迎的程度, 對產(chǎn)品銷售有顯著影響[6] 。Cui G 等[7] 考察了在線評論對電子產(chǎn)品和視頻游戲銷售的影響, 發(fā)現(xiàn)評論數(shù)量對新產(chǎn)品的早期銷售影響較大; 其次, 在線評論效價反映用戶對產(chǎn)品的態(tài)度傾向[8] , 通常以用戶評分的平均值形式來表現(xiàn), 可以分為積極、消極和中立3 種類型[8] 。關(guān)于在線評論效價與用戶采納之間的關(guān)系, 現(xiàn)有的研究存在不一致的結(jié)論。部分學(xué)者認為在線評論用戶評分正面影響用戶采納[9] , 也有學(xué)者認為兩者沒有顯著關(guān)系, 因為用戶評分不能完全代表用戶的情感[10]。

      除了對在線評論數(shù)量和效價等基本特征的研究外, 還有學(xué)者聚焦在線評論中具體的產(chǎn)品屬性。如,手機的屬性有屏幕分辨率、存儲和電池等。Kang Y等[11] 提出了一種基于規(guī)則的方法, 從消費者在線評論中識別不同類型的特征, 以幫助優(yōu)化產(chǎn)品的個性化推薦和營銷。Mirtalaie M A 等[12] 提出針對目標(biāo)特征的情感聚合框架SA-TF, 使用在線數(shù)據(jù)評估客戶對產(chǎn)品的接受程度。沈超等[13] 利用時間序列分析模型預(yù)測了客戶對13 個汽車產(chǎn)品屬性的關(guān)注度和情感傾向的趨勢變化。

      應(yīng)用商店在線評論中包含了用戶對移動應(yīng)用的功能、玩法、交互等屬性的評價和期許, 為軟件開發(fā)者和應(yīng)用商店提供了真實、優(yōu)質(zhì)的反饋信息。因此, 本文嘗試通過應(yīng)用商店在線評論來預(yù)測移動應(yīng)用用戶的未來采用趨勢。

      1 2 移動應(yīng)用用戶采用預(yù)測相關(guān)研究

      由于APP 的使用人數(shù)并非公開數(shù)據(jù), 難以獲取, 移動應(yīng)用用戶采用趨勢預(yù)測的研究一般使用下載量、排名等具體的指標(biāo)作為采用人數(shù)的替代指標(biāo)。Pagano D 等[14] 發(fā)現(xiàn), 應(yīng)用商店中的評論對移動應(yīng)用下載量有顯著影響。Wang Y 等[15] 考慮隨著時間演變的產(chǎn)品之間的多層次競爭關(guān)系, 提出了進化層次競爭模型EHCM, 來預(yù)測應(yīng)用下載數(shù)據(jù)。Zhu HS 等[16] 利用應(yīng)用商店中移動應(yīng)用排行榜、用戶評分和評論數(shù)據(jù), 提出了一種基于流行度的隱馬爾可夫模型(PHMM), 對移動應(yīng)用的流行度信息進行建模。通過統(tǒng)計分析Blackberry 應(yīng)用商店的數(shù)據(jù),Finkelstein A 等[17] 發(fā)現(xiàn), 應(yīng)用商店評分和應(yīng)用的下載排名之間存在很強的相關(guān)性, 并且應(yīng)用價格和評分存在相關(guān)性。黃競瑤[18] 使用應(yīng)用商城的每日下載量, 建立了ARIMA 模型, 預(yù)測移動應(yīng)用的未來下載趨勢。張藝璇等[19] 引入注意力機制, 解釋時間層級、局部特征和全局特征層級的特征相關(guān)性,提出深度神經(jīng)網(wǎng)絡(luò)模型DeePOP, 預(yù)測移動應(yīng)用的動態(tài)流行度。

      現(xiàn)有針對應(yīng)用采用趨勢的研究未能充分利用在線評論中用戶對產(chǎn)品不同屬性的態(tài)度等有用信息。此外, 常用的預(yù)測方法分為基于統(tǒng)計學(xué)習(xí)的方法和基于機器學(xué)習(xí)的方法??偟膩碚f, 基于機器學(xué)習(xí)的預(yù)測方法預(yù)測性能更好, 但其“黑箱” 的性質(zhì)使其無法評估輸入特征的重要性。如何在保證預(yù)測性能的前提下, 對輸入特征進行評價, 仍然需要進一步的研究。為解決上述問題, 本研究嘗試提出一種基于在線評論和集成獨立子空間的移動應(yīng)用采用預(yù)測方法。

      2 基于在線評論和集成獨立子空間的移動應(yīng)用采用預(yù)測方法

      本研究提出的預(yù)測方法總體流程如圖1 所示。首先從應(yīng)用商店采集移動應(yīng)用在線評論和產(chǎn)品信息,從產(chǎn)品聯(lián)運方獲取產(chǎn)品評級信息。在數(shù)據(jù)預(yù)處理后,抽取在線評論基本特征、產(chǎn)品屬性特征和產(chǎn)品特征,然后使用獨立子空間方法和隨機子空間方法進行特征重要性評價。最后結(jié)合MLR、CART、ANN 和SVR算法進行移動應(yīng)用采用趨勢預(yù)測。根據(jù)報告[1] , 游戲類APP 占我國全部APP 比重的28 2%, 位列第因此, 在本文選用游戲類APP 作為分析對象。

      2 1 移動應(yīng)用采用預(yù)測特征指標(biāo)抽取

      2 1 1 在線評論基本特征

      1) 基本特征指標(biāo)。用戶在線評論通常包括評分和評論內(nèi)容。評分反映了用戶對產(chǎn)品的整體滿意程度, 評論內(nèi)容則更為完整地表達用戶對產(chǎn)品的情感、態(tài)度和感受。本文將應(yīng)用商店中用戶評分和評論內(nèi)容的情感作為在線評論基本特征, 其中評論情感使用積極、中立和消極的評論數(shù)量和評論率來衡量, 如表1 所示(p=0,1,2,3)。

      2) 基本特征抽取。文本情感識別方法主要有基于詞典的方法、基于機器學(xué)習(xí)的方法和混合方法。長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)模型[20] 是循環(huán)神經(jīng)網(wǎng)絡(luò)RNN 的變體, 能更好地解決梯度消失問題,在文本情感分析領(lǐng)域得到了廣泛的應(yīng)用[21-22] 。本文使用基于LSTM 的情感分類模型, 將在線評論分為積極、中立和消極3 類。過程如下:

      ①預(yù)處理: 對采集到的在線評論進行分句, 然后進行去重、刪除不完整數(shù)據(jù)、去除無意義的符號與表情、去停用詞等數(shù)據(jù)清洗工作。

      ②分詞: 使用結(jié)巴分詞來對文本進行分詞處理。

      ③詞向量訓(xùn)練: 本文選取了維基百科中文語料庫來進行詞向量的訓(xùn)練, 將語料庫進行化繁為簡和分詞等處理后, 利用Word2vec 進行詞向量訓(xùn)練。

      ④LSTM 情感分類: 使用詞向量模型構(gòu)建句向量, 將句向量輸入LSTM 訓(xùn)練獲得LSTM 情感分類模型。最后, 利用該模型對應(yīng)用商店在線評論文本進行情感分類。

      2 1 2 在線評論產(chǎn)品屬性特征

      1) 在線評論產(chǎn)品屬性特征識別。識別評論文本中的產(chǎn)品屬性, 可以幫助開發(fā)者和應(yīng)用商店了解用戶的關(guān)注點和相應(yīng)的情感傾向。潛在狄利克雷分布(LDA)[23] 是經(jīng)典的主題挖掘模型, 已經(jīng)應(yīng)用于各種文本挖掘任務(wù)[24-26] 。因此, 本研究使用LDA識別應(yīng)用商店在線評論中用戶關(guān)注的產(chǎn)品屬性。

      在對評論文本進行挖掘之前, 需要確定主題的數(shù)量。主題數(shù)量過少會使結(jié)果缺少解釋性, 而主題數(shù)量過多則會導(dǎo)致主題分布過于分散。一般而言,當(dāng)困惑度—主題曲線趨于平緩時, 說明主題數(shù)的邊際效應(yīng)減少, 以拐點作為相應(yīng)的主題數(shù)目最為合適。困惑度—主題數(shù)量曲線如圖2 所示, 當(dāng)主題數(shù)為9時, 曲線趨于平緩。因此, 將應(yīng)用商店在線評論產(chǎn)品屬性主題數(shù)設(shè)置為9, 相應(yīng)關(guān)鍵詞如表2 所示。

      表2 的9 個主題中, 主題1、主題7 和主題9的關(guān)鍵詞主要與游戲的玩法有關(guān), 主題2 和主題4的關(guān)鍵詞主要與游戲的美術(shù)有關(guān), 主題5 主要與游戲的配音有關(guān), 主題3 和主題8 的關(guān)鍵詞主要與游戲的付費情況有關(guān), 而主題6 的關(guān)鍵詞主要與手機的運行流暢程度有關(guān)。將玩法、美術(shù)、配音和付費作為游戲的產(chǎn)品屬性特征。由于手機的運行流暢程度并非移動應(yīng)用本身特質(zhì), 因此不納入本研究分析。

      2) 在線評論產(chǎn)品屬性特征量化。為了量化產(chǎn)品屬性特征, 將搜集到的應(yīng)用商店在線評論數(shù)據(jù)進行分類處理。產(chǎn)品屬性特征測量與描述如表3 所示。具體過程如下:

      ①將每款游戲應(yīng)用的在線評論分為4 類: 玩法類、美術(shù)類、配音類和付費類。

      ②識別評論的情感傾向: 積極、中立、消極。

      ③當(dāng)游戲的某類產(chǎn)品屬性評論中, 積極評論超過50%, 表明用戶對該特征滿意, 賦值為1, 否則賦值為0。

      2 1 3 移動應(yīng)用產(chǎn)品特征

      除了移動應(yīng)用在線評論基本特征和產(chǎn)品屬性特征, 移動應(yīng)用本身的產(chǎn)品特征也可能影響用戶下載量。首先, 有研究表明出品方對產(chǎn)品的銷量有顯著的影響[27-28] , 因此選擇手機游戲的研發(fā)商和發(fā)行商作為出品方特征。游戲在發(fā)行之前, 發(fā)行商會根據(jù)游戲的研發(fā)費用和研發(fā)團隊等因素來對游戲進行評級, 分為SS、S、A、B、C 5 個等級。游戲的評級能在一定程度上反映該產(chǎn)品的質(zhì)量, 從而影響用戶的決策。此外, 如果游戲是由動漫、漫畫或者小說等改編而來(也稱該游戲有IP), 很大程度上能夠吸引動漫、漫畫的觀眾或小說的讀者, 從而提升游戲的銷量。最后, 產(chǎn)品代言人或參演人能提高產(chǎn)品知名度、品牌認可度和收益。綜上, 將研發(fā)商、發(fā)行商、產(chǎn)品評級、IP 和代言人作為移動應(yīng)用的產(chǎn)品特征。表4 為移動應(yīng)用產(chǎn)品特征的測量與描述。

      2 2 基于獨立子空間的用戶采用預(yù)測方法

      2 2 1 特征重要性評價方法

      為了在保持高預(yù)測性能的同時彌補基于機器學(xué)習(xí)的預(yù)測方法無法評估輸入特征重要性的缺陷, 本文引入獨立子空間方法進行特征重要性評價, 結(jié)合常用的預(yù)測算法, 構(gòu)成集成預(yù)測模型來進行特征重要性評價和用戶采用趨勢預(yù)測。

      獨立子空間(Independent Subspace Method, ISM)是在獨立分量分析(Independent Component Analy?sis)的基礎(chǔ)上發(fā)展而來的機器學(xué)習(xí)算法, 是一種無監(jiān)督特征學(xué)習(xí)方法。術(shù)語“獨立” 表示在選擇特征時盡可能選線性無關(guān)的特征[29] 。從結(jié)構(gòu)上看,ISM 可以被看作是一個兩層網(wǎng)絡(luò), 模型的第一層學(xué)習(xí)線性變換的權(quán)重, 第二層將同一子空間的元素合并, 執(zhí)行固定的非線性變化, 得到對相位變化相應(yīng)不變的特征。獨立子空間方法能夠識別非線性模型中各個特征的重要性, 并且當(dāng)特征之間存在相關(guān)性時, 該方法也能保持準(zhǔn)確性。圖3 為獨立子空間算法的詳細過程。

      2 2 2 移動應(yīng)用用戶采用預(yù)測模型

      根據(jù)Kim T 等[30] 的研究, 越早地做出預(yù)測, 模型就越有價值, 為了保持預(yù)測的有效性, 預(yù)測應(yīng)該在發(fā)行后兩周內(nèi)進行。本文收集3 個不同時間段的數(shù)據(jù)用于移動應(yīng)用用戶采用預(yù)測。如圖4 所示, 模型W1、W2、W3 所使用的數(shù)據(jù)分別為截至發(fā)行后第一周、第二周和第三周的數(shù)據(jù)。與之前的研究相比,該模型對多個時段的用戶評論數(shù)據(jù)進行分析, 能夠更客觀地反映用戶對游戲應(yīng)用的采用趨勢, 并且能夠?qū)Ρ扔螒虬l(fā)行后一段時間內(nèi)的用戶評論的差異。

      最后, 使用基于ISM 的集成方法對移動應(yīng)用用戶下載量進行預(yù)測, 預(yù)測過程如圖5 所示。首先通過ISM 進行特征采樣, 然后使用多元線性回歸、分類回歸樹、人工神經(jīng)網(wǎng)絡(luò)與支持向量回歸這4 種常用的預(yù)測方法進行預(yù)測。

      3 實驗及結(jié)果分析

      3 1 數(shù)據(jù)集

      本研究使用Python 語言編寫爬蟲, 從小米游戲中心采集移動應(yīng)用在線評論數(shù)據(jù)和產(chǎn)品基本信息。產(chǎn)品評級信息由產(chǎn)品聯(lián)運方(小米游戲中心運營部門)提供。采集范圍為2020 年6 月—8 月發(fā)布的60 款手機游戲應(yīng)用的在線評論與產(chǎn)品信息, 其中, 共采集到由用戶于2020 年6 月—10 月發(fā)布的在線評論57 627條。首先對采集到的數(shù)據(jù)進行去重、去停用詞、去除無意義的表情和顏文字等數(shù)據(jù)清洗工作。接著使用Jieba 分詞對數(shù)據(jù)進行預(yù)處理。本研究根據(jù)時間序列構(gòu)建了3 個不同的模型, 因此需要將采集到的在線口碑?dāng)?shù)據(jù)分為3 個不同時期的數(shù)據(jù)集, 產(chǎn)品發(fā)布后第一周的數(shù)據(jù)記為W1, 以此類推, 得到本研究的實驗數(shù)據(jù)集。將實驗數(shù)據(jù)集劃分為90%的訓(xùn)練集和10%的測試集。

      3 2 特征抽取結(jié)果

      在對數(shù)據(jù)進行預(yù)處理后, 使用LSTM 模型對在線評論數(shù)據(jù)進行情感分類(見3 1), 部分應(yīng)用的評論情感分類結(jié)果如表5 所示。對于大多數(shù)產(chǎn)品來說, 積極評論和中立評論占多數(shù), 消極評論不超過20%。此外, 在游戲發(fā)行的初期, 用戶給出的在線評論較少, 隨著時間的增加, 在線評論數(shù)量出現(xiàn)急劇的增長。

      接著使用LDA 主題模型對在線評論進行主題聚類, 抽取產(chǎn)品屬性特征。玩法、美術(shù)、配音和付費四大類主題及關(guān)鍵詞如表6 所示。

      然后根據(jù)各主題在線評論的情感分類結(jié)果來判斷用戶對該產(chǎn)品的玩法、美術(shù)、配音和付費方面是否滿意。部分?jǐn)?shù)據(jù)處理結(jié)果如表7 所示。大多數(shù)游戲的玩法類的評論數(shù)量最多, 其次是美術(shù)類, 說明用戶對游戲的玩法和美術(shù)較為關(guān)注。此外, 用戶對產(chǎn)品的玩法類和美術(shù)類積極評論率較高, 大部分超過了50%, 而用戶的付費類評論積極評論率較低,超過70%的產(chǎn)品的付費類積極評論率低于50%,表明用戶對這些游戲的付費體驗存在較多不滿。

      3 3 特征重要性評估結(jié)果

      3 3 1 基于ISM 的特征重要性評估有效性驗證

      以非集成方法和基于隨機子空間方法(RandomSubspace Method, RSM)的集成方法作為基線, 在MLR、CART、ANN 和SVR 4 種算法下驗證基于ISM 的集成方法的有效性。其中, 隨機子空間方法(Random Subspace Method, RSM)[31] 常被用于評價非線性模型中特征的重要性。該方法從所有的M個輸入特征中選擇m 個特征的子集, 然后利用一個簡化的特征空間建立學(xué)習(xí)模型。隨機選擇特征和應(yīng)用學(xué)習(xí)模型步驟重復(fù)B 次, 稱為引導(dǎo)。在驗證階段, 向具有相應(yīng)選擇特征的B 模型提供一個新的數(shù)據(jù)集, 并通過聚合模型中的每個輸出來估計隨機子空間的輸出。為了評估每個特征的重要性,RSM 通過置換預(yù)測模型中的各個特征來計算每個引導(dǎo)程序中驗證錯誤的增加情況, 然后根據(jù)這些權(quán)重的相關(guān)性進行組合和排序, 其重要性對應(yīng)特征在預(yù)測模型中的有用性。

      以往研究在驗證ISM 的有效性時, 通常通過生成一個包含相關(guān)特征的人工數(shù)據(jù)集, 測試模型能否正確地找到重要特征且忽略相關(guān)特征[32] 。本研究采用同樣的策略, 對模型W1 添加人工特征Y1,對模型W2 添加人工特征Y2 作為分析特征, 預(yù)測模型需將該特征識別為重要特征。同時還添加了相關(guān)特征, 分別是(-Yi ), Y2i、(-Y2i)以及log(Yi )(i =1,2 分別對應(yīng)模型W1 和W2)。如果預(yù)測模型能將上述人工生成的特征識別為重要的特征, 模型就具有魯棒性。

      表8 總結(jié)了W1 模型中使用4 種算法和3 種方法計算的每個特征的重要性測量值和相應(yīng)的排名(例如36 75, 2/21 表示特征的重要性測量值為36 75, 在輸入的21 個特征中, 其重要性排名第2)。特征的排名越小, 表示該特征越重要。

      1) 在非集成方法中, MLR 算法下的5 個人工生成的特征的平均排名為6 4。CART、ANN 和SVR算法下人工生成特征的平均排名都高于9 0, 特別是ANN 算法的人工生成特征的平均排名為13 60。

      由此可見, 非集成方法在檢測這些相關(guān)特征的重要性上表現(xiàn)不佳。

      2) 類似的結(jié)果也出現(xiàn)在基于RSM 的集成方法中。MLR 算法下人工生成特征的平均排名為5 80,表現(xiàn)尚可, CART、ANN 和SVR 算法都不能很好地評估特征的重要性。

      3) 在基于ISM 的集成方法中, MLR、CART、ANN 和SVR 4 種算法下的5 個人工生成特征的平均排名都小于5 0。

      模型W2 中也出現(xiàn)了類似的結(jié)果, 如表9 所示。由此可知, ISM 方法在評估特征重要性任務(wù)上表現(xiàn)較好。

      3 3 2 特征重要性分析

      驗證了ISM 能夠有效地評估輸入特征的重要性后, 分別對W1、W2 和W3 這3 個模型中的各特征進行重要性評估, 結(jié)果分別如表10、表11 和表12所示。其中星號(???、??、?)分別表示特征重要性在0 05、0 1 和0 2 顯著性水平上大于0, 合計表示特征變量個數(shù)。由表中數(shù)據(jù)可知:

      1) 在應(yīng)用發(fā)行后的第一周(模型W1 ), 在線評論評分、研發(fā)商、發(fā)行商、美術(shù)、IP 和代言人這幾項因素對用戶采用預(yù)測有著較為顯著的影響。此外, 大部分與在線評論有關(guān)的特征在這階段的預(yù)測模型中重要性不高??梢娫谟螒驊?yīng)用發(fā)布的最初期, 用戶會根據(jù)一些最直觀的因素來判斷是否使用該應(yīng)用, 比如代言人和IP。

      2) 應(yīng)用發(fā)行一段時間后(模型W2 和W3), 在線評論評分、研發(fā)商、發(fā)行商和美術(shù)等直觀因素仍然重要, 但重要性已經(jīng)逐漸降低。而此時玩法和付費的重要性已經(jīng)十分顯著。由此可見, 此時除了直觀的因素, 用戶還會根據(jù)游戲的玩法和付費這些內(nèi)在因素來做出采用應(yīng)用的決策。

      3) 對比W1、W2 和W3 這3 個模型可以發(fā)現(xiàn),隨著發(fā)行時間的增加, 在線評論情感因素的重要性逐漸提升, 特別是積極評論數(shù)與消極評論數(shù)在游戲發(fā)行后第二周變得重要起來。

      3 4 移動應(yīng)用用戶采用預(yù)測結(jié)果

      本文采用均方根誤差(RMSE)和平均絕對百分比誤差(MAPE) 作為模型的評價指標(biāo), RMSE 與MAPE 的計算公式如式(1)、式(2):

      其中yi 為實際的移動應(yīng)用采用人數(shù), ^yi 為預(yù)測的移動應(yīng)用采用人數(shù)。

      MLR 算法常用于預(yù)測任務(wù), 具有較強的可解釋性, 本文將MLR 算法作為基線模型, 評估基于ISM 的集成方法的預(yù)測性能。移動應(yīng)用用戶采用預(yù)測結(jié)果如表13 所示。由表中數(shù)據(jù)可知, 與基線MLR預(yù)測方法相比, 集成獨立子空間的MLR 預(yù)測方法性能有輕微的降低, 這可能是由于MLR 算法自身就能夠較好地評估特征的重要性, 這與ISM 方法的作用重復(fù), 兩者結(jié)合導(dǎo)致了預(yù)測性能的輕微降低。而集成獨立子空間的CART、ANN 和SVR 預(yù)測方法的性能都比基線方法有較大的提升, 特別是對于ANN 算法而言, RMSE 和MAPE 都大幅減小, 預(yù)測性能最佳。總體來說, 本文提出的基于ISM 的移動應(yīng)用用戶采用預(yù)測方法能夠顯著提升預(yù)測方法的可解釋性, 并提升模型的預(yù)測性能。

      4 結(jié) 論

      本研究分析了60 款游戲移動應(yīng)用的在線評論數(shù)據(jù)和產(chǎn)品數(shù)據(jù), 引入獨立子空間算法評估特征重要性, 顯著地提升了用戶采用預(yù)測方法的性能。研究結(jié)果能夠給移動應(yīng)用開發(fā)商、發(fā)行商和應(yīng)用商店運營人員提供決策依據(jù)。

      本研究在移動應(yīng)用用戶采用預(yù)測方法上取得了一些具有創(chuàng)新性和重要意義的研究成果, 但仍然存在一些不足。第一, 本研究選取的實驗數(shù)據(jù)主要來源于小米游戲中心, 游戲應(yīng)用的娛樂性較強, 與其他類型的移動應(yīng)用可能存在一定的差別。第二, 參照以往研究, 本研究使用應(yīng)用的下載量來判斷用戶對移動應(yīng)用的采用情況, 但用戶下載該應(yīng)用可能無法完全代表用戶使用了該應(yīng)用。對用戶的持續(xù)使用數(shù)據(jù)進行分析可能可以解決這個問題。這些不足需要在未來的研究中完善, 也為后續(xù)的研究指出了新的思路和方向。

      參考文獻

      [1] 中國互聯(lián)網(wǎng)絡(luò)信息中心. 第49 次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告[ EB/ OL]. http: / / www. cnnic. net. cn/ NMediaFile/ old_at?tach/ P020220721404263787858.pdf, 2021-02-02.

      [2] 田丹. 我國移動圖書館APP 應(yīng)用現(xiàn)狀分析[ J]. 國家圖書館學(xué)刊, 2015, 24 (5): 74-80.

      [3] 王金鳳, 王孟琪, 馮立杰, 等. 需求驅(qū)動下移動互聯(lián)網(wǎng)產(chǎn)品創(chuàng)新機會識別路徑研究———以網(wǎng)易云音樂為例[ J]. 情報理論與實踐, 2020, 43 (12): 96-102, 95.

      [4] Patil P, Tamilmani K, Rana N P, et al. Understanding Consum?er Adoption of Mobile Payment in India: Extending Meta-UTAUTModel with Personal Innovativeness, Anxiety, Trust, and Griev?ance Redressal [ J]. International Journal of Information Manage?ment, 2020, 54: 102144.

      [5] Chen Y, Xie J. Online Consumer Review: Word-of-Mouth as aNew Element of Marketing Communication Mix [ J]. ManagementScience, 2008, 54 (3): 477-491.

      [6] 馮嬌, 姚忠. 基于社會學(xué)習(xí)理論的在線評論信息對購買決策的影響研究[J]. 中國管理科學(xué), 2016, 24 (9): 106-114.

      [7] Cui G, Lui H K, Guo X. The Effect of Online Consumer Reviewson New Product Sales [J]. International Journal of Electronic Com?merce, 2012, 17 (1): 39-58.

      [8] 吳卿毅, 黃斐. 在線評論對消費者行為意愿的影響———基于數(shù)值型在線評論的效價[J]. 技術(shù)經(jīng)濟與管理研究, 2019, 11:60-65.

      [9] Sun M. How Does the Variance of Product Ratings Matter? [ J].Management Science, 2012<26aa><717, 58 (4): 696-707.

      [10] Duan W, Gu B, Whinston A B. Do Online Reviews Matter?—An Empirical Investigation of Panel Data [ J]. Decision SupportSystems, 2008, 45 (4): 1007-1016.

      [11] Kang Y, Zhou L. RubE: Rule - based Methods for ExtractingProduct Features from Online Consumer Reviews [ J]. Information& Management, 2017, 54 (2): 166-176.

      [12] Mirtalaie M A, Hussain O K. Sentiment Aggregation of TargetedFeatures By Capturing Their Dependencies: Making Sense from Cus?tomer Reviews [ J]. International Journal of Information Manage?ment, 2020, 53: 102097.

      [13] 沈超, 王安寧, 方釗, 等. 基于在線評論數(shù)據(jù)的產(chǎn)品需求趨勢挖掘[J]. 中國管理科學(xué), 2021, 29 (5): 211-220.

      [14] Pagano D, Maalej W. User Feedback in the Appstore: An Em?pirical Study [ C] / /2013 21st IEEE International RequirementsEngineering Conference (RE). IEEE, 2013: 125-134.

      [15] Wang Y, Yuan N J, Sun Y, et, al. App Download Forecas?ting: An Evolutionary Hierarchical Competition Approach [C] / /Proceedings of the Twenty-Sixth International Joint Conference onArtificial Intelligence. California: International Joint Conferenceson Artificial Intelligence Organization, 2017: 2978-2984.

      [16] Zhu H S, Liu C R, Ge Y, et, al. Popularity Modeling for Mo?bile Apps: A Sequential Approach [J]. IEEE Transactions on Cy?bernetics, 2015, 45 (7): 1303-1314.

      [17] Finkelstein A, Harman M, Jia Y, et, al. Investigating the Rela?tionship Between Price, Rating, and Popularity in the BlackberryWorld App Store [J]. Information and Software Technology, 2017,87: 119-139.

      [18] 黃競瑤. APP 下載量趨勢預(yù)測及其模型評價[ D]. 蘇州: 蘇州大學(xué). 2018.

      [19] 張藝璇, 郭斌, 劉佳琪, 等. 基于多級注意力機制網(wǎng)絡(luò)的App流行度預(yù)測[ J]. 計算機研究與發(fā)展, 2020, 57 (5): 984-995.

      [20] Hochreiter S, Schmidhuber J. Long-Short Term Memory [ J].Neural Computation, 1997, 9 (8): 1735-1780.

      [21] 國佳, 郭勇, 沈旺, 等. 基于在線評論的網(wǎng)絡(luò)社區(qū)信息可信度評價方法研究[J]. 圖書情報工作, 2019, 63 (17): 137-144.

      [22] 陳凌, 宋衍欣. 基于公眾情緒上下文的LSTM 情感分析研究———以臺風(fēng)“利奇馬” 為例[J]. 現(xiàn)代情報, 2020, 40 (6): 98-105.

      [23] Blei D M, Ng A Y, Jordan M I. Latent Dirichlet Allocation [J].Journal of Machine Learning Research, 2003, 3 (4-5): 993-1022.

      [24] 王欣研, 張向先, 張莉曼. 學(xué)術(shù)APP 用戶在線評論主題語義關(guān)聯(lián)研究[J]. 情報科學(xué), 2020, 38 (6): 25-31.

      [25] 王曰芬, 許杜娟, 楊振怡, 等. 輿情評論與新聞報道的話題識別及其主題關(guān)聯(lián)分析[J]. 現(xiàn)代情報, 2018, 38 (6): 3-10.

      [26] 張濤, 馬海群. 一種基于LDA 主題模型的政策文本聚類方法研究[J]. 數(shù)據(jù)分析與知識發(fā)現(xiàn), 2018, 2 (9): 59-65.

      [27] Hur M, Kang P, Cho S. Box-office Forecasting Based on Senti?ments of Movie Reviews and Independent Subspace Method [ J].Information Sciences, 2016, 372: 608-624.

      [28] Bhave A, Kulkarni H, Biramane V, et, al. Role of DifferentFactors in Predicting Movie Success [ C] / /2015 InternationalConference on Pervasive Computing (ICPC). IEEE, 2015: 1-4.

      [29] Rodgers J L, Nicewander W A, Toothaker L. Linearly Independ?ent, Orthogonal, and Uncorrelated Variables [ J]. The AmericanStatistician, 1984, 38 (2): 133-134.

      [30] Kim T, Hong J, Kang P. Box Office Forecasting Using MachineLearning Algorithms Based on SNS data [ J]. International Journalof Forecasting, 2015, 31 (2): 364-390.

      [31] Lai C, Reinders M J T, Wessels L. Random Subspace Methodfor Multivariate Feature Selection [ J]. Pattern Recognition Let?ters, 2006, 27 (10): 1067-1076.

      [32] Goia A, May C, Fusai G. Functional Clustering and Linear Re?gression for Peak Load Forecasting [ J]. International Journal ofForecasting, 2010, 26 (4): 700-711.

      (責(zé)任編輯: 郭沫含)

      猜你喜歡
      在線評論移動應(yīng)用預(yù)測
      無可預(yù)測
      黃河之聲(2022年10期)2022-09-27 13:59:46
      選修2-2期中考試預(yù)測卷(A卷)
      選修2-2期中考試預(yù)測卷(B卷)
      不必預(yù)測未來,只需把握現(xiàn)在
      T學(xué)校公共設(shè)施便捷報修平臺的移動應(yīng)用研究
      東方教育(2016年18期)2017-01-16 16:42:44
      在線評論情感屬性的動態(tài)變化
      預(yù)測(2016年5期)2016-12-26 17:16:57
      云計算環(huán)境下的微課移動云平臺設(shè)計
      大數(shù)據(jù)時代下免費手機軟件盈利模式探討
      在線評論對電子商務(wù)商品銷量的影響研究
      中文信息(2016年10期)2016-12-12 11:01:20
      在線評論對消費者購買意圖的影響研究
      商(2016年10期)2016-04-25 10:03:58
      五家渠市| 舒兰市| 全州县| 嫩江县| 绩溪县| 平武县| 浦县| 平乡县| 灵寿县| 上杭县| 三明市| 绍兴县| 弋阳县| 海阳市| 新乡县| 三台县| 滨海县| 乌拉特后旗| 扶余县| 隆林| 喜德县| 聊城市| 华阴市| 教育| 高州市| 额济纳旗| 鹰潭市| 克什克腾旗| 土默特右旗| 镇安县| 东乡族自治县| 炎陵县| 尉犁县| 玛沁县| 常德市| 延川县| 平塘县| 辉县市| 屯门区| 郁南县| 会昌县|