【摘要】以蘋果和安卓兩大移動操作系統(tǒng)的應用市場為數(shù)據(jù)源,通過網(wǎng)絡爬蟲工具,將四種主流在線教育APP的用戶反饋進行采集整理,并采用詞頻分析的方法對采集到的數(shù)據(jù)進行多維度的分析、探討,從而得到當前用戶體驗設計中的優(yōu)勢與不足,進一步為在線教育APP的運營提供新的思路和建議。
【關鍵詞】APP;在線教育;詞頻分析;用戶體驗
1. 研究背景
一份由中國互聯(lián)網(wǎng)絡信息中心(CNNIC)發(fā)布的報告顯示:“截止2019年6月,我國網(wǎng)民規(guī)模達8.54億,較2018年底增長2598萬”,其中手機網(wǎng)民使用在線教育課程類APP(手機互聯(lián)網(wǎng)應用)的用戶規(guī)模達1.99億,占手機網(wǎng)民的23.6%。從這份報告可以看出,技術的迭代升級使移動設備逐漸凸顯現(xiàn)出其在互聯(lián)網(wǎng)中的重要作用。
人因工程領域著名學者唐·諾曼(DonaldNorman)曾指出“以用戶為中心”(User-centered)的設計思路,就是利用一系列認知科學的理論和方法,來減少人機交互的鴻溝,以需求推動設計,以靈感驅動技術。作為UGC(用戶生成內容)模式的APP商店評論區(qū),這里有用戶對APP最直觀的感受和反應,因此將這些數(shù)據(jù)加以分析,可以得出一些隱藏的用戶信息和邏輯關系。
2. 研究對象和方法
2.1 研究對象
如表1所示,研究對象為四種主流APP,安卓的廠牌較多,因此遴選了APP下載量排行前三的應用市場作為數(shù)據(jù)源,通過網(wǎng)絡爬蟲工具(一種基于特定規(guī)則進行網(wǎng)絡數(shù)據(jù)采集的腳本),對表中的數(shù)據(jù)源進行采集。整理國內50所高校的收假時間,經(jīng)折中后將采集區(qū)間定于2020年2月25日和3月25日之間,以時間倒序的方式采集條目。
采集的內容分為三個維度——“評論內容(C)”、“星級(R)”以及“發(fā)表時間(T)”。其中“C”的采集標準為:每個條目不得低于2個漢字并跳過某一特定漢字連貫率高于4次的條目;“R”的采集標準為:提取圖標HTML內部鏈接后僅保留與評級相關的1個阿拉伯數(shù)字并跳過未進行評級的條目;“T”的采集標準為:時間格式為“年-月-日”。
2.2 研究方法
本文所采用的研究方法為詞頻分析法,是一種將定性數(shù)據(jù)進行量化分析的方法,通過文本挖掘,可以獲取特定范圍內的熱點及其變化趨勢。用戶反饋是一種用戶在不受干預的情況下生成的語言材料,但由于文本不正式,需要通過特定的方法將這些數(shù)據(jù)進行加工,才能對整個運營情況進行判定。
3. 詞頻統(tǒng)計與用戶體驗分析
詞頻統(tǒng)計和情感分析分別采用了ROST ContentMining和Gooseeker自然語言處理工具,并利用Excel的篩選工具統(tǒng)計評級情況,分析總條數(shù)達12000條,共計373004個字符,切分為8401個詞語。如表2所示,由于統(tǒng)計數(shù)據(jù)數(shù)量龐大,此處僅展示權重排行前100位的詞語。
分別對表2的高頻詞進行語言材料溯源,平均每個詞條追溯15個不同的語言材料,從語言材料即用戶反饋中提取出典型、突出的用戶體驗問題,并進一步分析和歸納。
3.1. 較多高頻詞含有負面情感
“軟件”一詞是權重排名最高的詞語,頻率高達2604次。在對應的15個不同的語言材料中,10條被標記為負面情感,5條為中性情感。其中負面情感里,負面詞有2個,分別為“垃圾”和“無語”,出現(xiàn)頻率分別為10次和1次,如此高的頻率導致“垃圾”一詞排在了表單的第8位。一星、崩潰、氣死等詞匯,也都很直觀地反映出了用戶對平臺的不滿。
3.2.疫情是促成網(wǎng)課高峰期的原因之一
疫情一詞出現(xiàn)頻率為246次,相關語言材料共計235條,正面傾向111條,中性傾向95條,負面傾向29條。抽取的15個樣本中,正面情感傾向8條,中性情感傾向7條。其中標記為正面詞的有:重要、希望、方便等。多數(shù)用戶的反饋中表達了疫情是其使用遠程教育平臺的原因。
3.3 UGC模式下衍生出了一種特殊的表達方式
表單中排第6位的詞語“分期”,就是在UGC模式下衍生出的新詞新語,很多用戶在反饋時會提交“分期付款”、“分期給”等看似毫無關聯(lián)的語句,實際上是一種用戶使用感受的特殊反饋,通過語料分析可知:用戶之所以如此評價,是因為用戶把“分期”這種購買行為套用在了APP評價中,下次評級用戶可能會為APP增加分數(shù)。有研究表明,流行語之所以能被大眾接受,是情感驅動所致——“某種表達方式短時期內被很多人廣泛使用,源于某種群體情緒的發(fā)泄,換言之,群體情緒的發(fā)泄促成了爭相使用流行語這一群體行為?!庇纱丝梢?,用戶反饋專區(qū)猶如小型的社交網(wǎng)絡,某些群體的共識,可能會影響到其他用戶的看法,從而導致某些表達方式會由小范圍傳播到大范圍,這是一個值得重視的模塊,因為語言是不斷發(fā)展的,算法必須跟上時代的變化。
3.4 整體用戶體驗情況不太樂觀
如表3所示,如果將差評定義為1-2星,中評為3星,好評為4-5星,那么按照好評率計算四種APP,由高到低依次為:釘釘(26.2%)、騰訊課堂(20.5%)、騰訊會議(18.1%)、超星學習通(9.8%)。由此可見,釘釘?shù)挠脩趔w驗相對出色,但從整體的評級來看,“一星”的占比明顯較大,這說明疫情帶來了前所未有的網(wǎng)課高峰期,然而很多平臺沒有做好充足的準備。
4. 總結
在互聯(lián)網(wǎng)高度發(fā)達的今天,除了技術性的研發(fā),許多開發(fā)者開始將注意力聚焦到用戶體驗上來,就在線學習平臺而言,有研究表明“學習平臺在基礎功能上具有同質化傾向……在戰(zhàn)略層上具有同質性,功能目標相近,業(yè)務模塊趨同”,因此用戶體驗的研究顯得尤為重要,因為這是使產(chǎn)品保持用戶粘度的關鍵因素。通過詞頻分析研究用戶反饋,將數(shù)據(jù)進行量化處理,可迅速掌握當前產(chǎn)品存在的優(yōu)勢和不足,當然,通過詞頻分析的方法不能夠徹底對用戶行為進行研究,還需要在此基礎上研究出新的方法或數(shù)據(jù)挖掘的算法以保證數(shù)據(jù)的全面、精準與可靠。
參考文獻:
[1]中國互聯(lián)網(wǎng)絡信息中心.第44次《中國互聯(lián)網(wǎng)絡發(fā)展狀況統(tǒng)計報告》[EB/OL].http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201908/P020190830356787490958.pdf,2019-8-30.
[2]Donald A. Norman,Stephen W. Draper.User Centered System Design; New Perspectives on Human-Computer Interaction[M].L. Erlbaum Associates Inc.:USA,1986:31-61.
[3]石晶,崔麗娟.群體行為驅動:流行語的社會心理分析[J].當代修辭學,2011(06):22-27.
[4]劉述.用戶視角下在線學習平臺體驗研究[J].電化教育研究,2019,40(10):47-52.
作者簡介:方瑞,男,上海理工大學出版印刷與藝術設計學院在讀研究生,研究方向:數(shù)字出版、用戶體驗設計。