冀翠萍,馬 亮
(1.山東省委黨校 公共管理教研部,山東 濟(jì)南 250000;2.中國(guó)人民大學(xué) 公共管理學(xué)院,北京 100872)
移動(dòng)政務(wù)是電子政務(wù)和數(shù)字政府的前沿領(lǐng)域,各地正如火如荼地建設(shè)實(shí)踐,形成了政務(wù)微博、政務(wù)微信、政務(wù)小程序和政務(wù)客戶端(App)等構(gòu)成的移動(dòng)政務(wù)服務(wù)體系,有效解決了政務(wù)服務(wù)的最后一公里,政務(wù)服務(wù)效率和質(zhì)量得到顯著提升。[1](p99-111)特別是政務(wù)App 作為一種獨(dú)立運(yùn)行的移動(dòng)端應(yīng)用程序,面向公眾和企業(yè)辦事需求提供多對(duì)象、多流程的復(fù)雜業(yè)務(wù)功能,成為政府提供政務(wù)服務(wù)的主渠道和主陣地。[2](p31-38)因此,對(duì)政務(wù)App發(fā)展績(jī)效進(jìn)行研究有重要意義。
移動(dòng)政務(wù)是政務(wù)服務(wù)創(chuàng)新的重要手段,是溝通公眾與政府的重要橋梁,是影響公眾政府信任和公眾滿意度的重要載體,如果移動(dòng)政務(wù)服務(wù)績(jī)效欠佳,就會(huì)顯著負(fù)向影響用戶的使用意愿和體驗(yàn)。[3](p198-207)當(dāng)前,各政務(wù)App績(jī)效表現(xiàn)怎樣,又如何去評(píng)價(jià)和測(cè)量發(fā)展績(jī)效?現(xiàn)有研究認(rèn)為技術(shù)質(zhì)量、服務(wù)質(zhì)量、安全性能等是衡量電子政務(wù)服務(wù)質(zhì)量與滿意度的重要指標(biāo),[4](p60-64)提出可通過政務(wù)App的系統(tǒng)兼容度、穩(wěn)定度、便捷度、流暢度等過程化指標(biāo)進(jìn)行衡量。[3](p198-207)但是,當(dāng)前的研究實(shí)踐較多采用問卷調(diào)查、訪談等方式獲取數(shù)據(jù),問卷和訪談屬于小樣本研究,樣本范圍受到抽樣條件等限制,并且都是封閉式的、高度結(jié)構(gòu)化的設(shè)計(jì),其指向性、主觀性較強(qiáng),調(diào)研過程易受到外部因素的干擾,數(shù)據(jù)的客觀真實(shí)性難以得到有效保證。盡管有部分研究實(shí)踐采用了體驗(yàn)團(tuán)、體驗(yàn)官等形式,[3](p198-207)然而,政務(wù)App 要面向海量用戶群,他們的手機(jī)型號(hào)、操作系統(tǒng)、使用環(huán)境、網(wǎng)絡(luò)速度、年齡差異、數(shù)字素養(yǎng)等均不一致,僅靠數(shù)量較少的體驗(yàn)團(tuán)、體驗(yàn)官難以完整、準(zhǔn)確、全面獲得真實(shí)評(píng)測(cè)結(jié)果。
政務(wù)服務(wù)的對(duì)象是公眾和企業(yè),政務(wù)服務(wù)績(jī)效的優(yōu)劣也應(yīng)該由公眾和企業(yè)來評(píng)價(jià)。2019 年國(guó)務(wù)院政府工作報(bào)告提出建立政務(wù)服務(wù)“好差評(píng)”制度,就是要采集和歸集公眾和企業(yè)對(duì)各類政務(wù)服務(wù)的真實(shí)評(píng)價(jià)信息,[5](p51-58)然而在實(shí)際推行中卻遭遇數(shù)據(jù)收集困難的尷尬。[6](p14-22)移動(dòng)互聯(lián)網(wǎng)的發(fā)展創(chuàng)新了收集公眾真實(shí)意見的方法,比如,用戶評(píng)論就是評(píng)價(jià)移動(dòng)服務(wù)質(zhì)量的重要數(shù)據(jù),但是對(duì)其開發(fā)和利用得還較少。[7](p71-85)政務(wù)App 在手機(jī)應(yīng)用商店上架推廣,用戶可對(duì)應(yīng)用商店中的政務(wù)App 發(fā)表評(píng)論,這些評(píng)論數(shù)據(jù)內(nèi)容豐富、更新及時(shí)、易于獲取,并且只有那些留下深刻印象的應(yīng)用才會(huì)促使用戶有動(dòng)力去發(fā)表評(píng)論,因此這些評(píng)論數(shù)據(jù)能夠真實(shí)表達(dá)用戶最為關(guān)心的內(nèi)容。[8](p43-53)
當(dāng)前,31 個(gè)省、直轄市和自治區(qū)以及新疆生產(chǎn)建設(shè)兵團(tuán)均推出了基于App的移動(dòng)政務(wù)服務(wù),積累了大量用戶評(píng)論數(shù)據(jù)。這些數(shù)據(jù)是從用戶體驗(yàn)出發(fā)對(duì)政務(wù)App 服務(wù)效能的檢視,可以測(cè)量政務(wù)App服務(wù)質(zhì)量,可以用于完善移動(dòng)政務(wù)的績(jī)效評(píng)估。本研究采集各省級(jí)政務(wù)App的用戶評(píng)論數(shù)據(jù),分析這些數(shù)據(jù)在不同手機(jī)平臺(tái)上的表現(xiàn),以此探求將用戶評(píng)論數(shù)據(jù)引入政務(wù)App績(jī)效評(píng)估的可行性。
近年來我國(guó)政務(wù)App 發(fā)展迅速,應(yīng)用數(shù)量、服務(wù)模式不斷增長(zhǎng)創(chuàng)新,但卻并沒有相應(yīng)提升公眾的使用率和參與度,某些時(shí)候?qū)φ?wù)App服務(wù)質(zhì)量的評(píng)價(jià)甚至有所下降。[1](p99-111)研究發(fā)現(xiàn),政務(wù)App 存在更新維護(hù)不及時(shí)、運(yùn)行不順暢等技術(shù)問題,[9](p83-91)這類基礎(chǔ)問題的存在,導(dǎo)致用戶對(duì)政務(wù)App 無感,難以形成“用戶黏性”,無法發(fā)揮出其作為政務(wù)服務(wù)提供和政民互動(dòng)渠道的價(jià)值和作用,[10](p76-81)這可能與政府較多關(guān)注政務(wù)App 的建設(shè)而忽視后期維護(hù)和完善有關(guān)。[11](p74-84)政務(wù)App建設(shè)發(fā)展特別需要發(fā)揮績(jī)效評(píng)價(jià)的“指揮棒”作用,引導(dǎo)各級(jí)政府部門重視建設(shè)和發(fā)展中的薄弱環(huán)節(jié)和關(guān)鍵問題,對(duì)癥下藥地進(jìn)行整改。[1](p99-111)
學(xué)界已經(jīng)關(guān)注到政務(wù)App 績(jī)效問題的研究。首先,研究關(guān)注到政務(wù)App 績(jī)效評(píng)價(jià)體系的構(gòu)建。朱春奎等對(duì)電子政務(wù)研究的梳理總結(jié)發(fā)現(xiàn),電子政務(wù)服務(wù)質(zhì)量與滿意度的評(píng)價(jià)主要包含信息質(zhì)量、服務(wù)質(zhì)量、組織表現(xiàn)、技術(shù)質(zhì)量、安全性能、滿意度六個(gè)方面。[4](p60-64)徐緒堪等構(gòu)建了政務(wù)App 服務(wù)效能的評(píng)價(jià)指標(biāo)體系,還組建了評(píng)估團(tuán)隊(duì),對(duì)樣本App進(jìn)行了參與式體驗(yàn)和評(píng)價(jià)。[3](p198-207)其次,研究關(guān)注到要從用戶感知出發(fā)評(píng)估政務(wù)App 發(fā)展績(jī)效。Hung 指出,移動(dòng)政務(wù)帶有強(qiáng)制性使用色彩,感知有用性和感知易用性可以顯著影響用戶的滿意度。[12](p33-44)王法碩等研究發(fā)現(xiàn)系統(tǒng)質(zhì)量是顯著影響政務(wù)App用戶滿意度的重要因素,政務(wù)App系統(tǒng)能否正常訪問、運(yùn)行是否穩(wěn)定、設(shè)計(jì)與功能是否合理直接決定了用戶的使用意愿。[13](p65-74)最后,學(xué)界和業(yè)界積極探索政務(wù)App 績(jī)效評(píng)估的實(shí)踐。復(fù)旦大學(xué)數(shù)字與移動(dòng)治理實(shí)驗(yàn)室構(gòu)建“掌上好辦”指標(biāo)體系,從可得性、有用性、易用性、滿意度、安全度五個(gè)方面,對(duì)省級(jí)移動(dòng)政務(wù)App 發(fā)展情況進(jìn)行評(píng)測(cè),同時(shí)關(guān)注到技術(shù)和用戶的重要作用,設(shè)立“技術(shù)性體驗(yàn)”和“用戶體驗(yàn)評(píng)價(jià)”指標(biāo)并占有一定權(quán)重。[14]
綜上所述,研究已經(jīng)關(guān)注到政務(wù)App服務(wù)質(zhì)量的重要性,以及用戶感知的重要作用。但是,已有研究多是從政務(wù)服務(wù)供給側(cè)出發(fā),站在政務(wù)App的外部對(duì)可獲得的功能模塊進(jìn)行評(píng)測(cè),考察政務(wù)App有什么,比如有哪些信息、服務(wù)、渠道和方式。[7](p71-85)但是,政務(wù)App 服務(wù)的對(duì)象是公眾和企業(yè),公眾和企業(yè)自有對(duì)政務(wù)服務(wù)的主觀感知和評(píng)測(cè),也就是用戶的使用效果,這是從需求側(cè)出發(fā)對(duì)政務(wù)App服務(wù)質(zhì)量的真實(shí)評(píng)價(jià),如果用戶側(cè)評(píng)價(jià)指標(biāo)缺失將導(dǎo)致評(píng)估的完整性和全面性受到挑戰(zhàn)。既有研究發(fā)現(xiàn),公眾與政府的“合供”可以很好地幫助政府提升服務(wù)質(zhì)量,對(duì)于電子政務(wù)發(fā)展具有顯著推動(dòng)作用。[15](p68-89)政務(wù)App發(fā)展有賴于用戶提供的反饋,用戶的積極參與對(duì)于提升其質(zhì)量和績(jī)效至關(guān)重要。
實(shí)際上,大數(shù)據(jù)時(shí)代的到來,為政府更好感知公眾、與公眾互動(dòng)提供了可能。美國(guó)聯(lián)邦政府實(shí)施了一項(xiàng)數(shù)字分析計(jì)劃(DAP),對(duì)政府提供的移動(dòng)政務(wù)建立數(shù)據(jù)跟蹤,實(shí)時(shí)獲取政務(wù)App 下載量、平臺(tái)商店用戶評(píng)論等,并以此作為移動(dòng)政務(wù)績(jī)效評(píng)估和服務(wù)優(yōu)化改進(jìn)的支點(diǎn)。[16](p97-107)公眾的政務(wù)服務(wù)使用行為、使用頻率、在線評(píng)論等反映了公眾的問題、需求、態(tài)度和意愿,這些海量數(shù)據(jù)可以幫助政府發(fā)現(xiàn)公共服務(wù)中存在的問題,決定如何提供更好的公共服務(wù),[17](p1011–1026)實(shí)現(xiàn)“以評(píng)促建”“以評(píng)促改”,發(fā)揮績(jī)效評(píng)估的積極作用。
私營(yíng)部門較早注意到用戶評(píng)論對(duì)商品或服務(wù)發(fā)展的重要作用,認(rèn)為用戶的體驗(yàn)和使用反饋是商品優(yōu)化改進(jìn)的支點(diǎn),用戶的吐槽和意見建議是App迭代更新的重要指南,因此私營(yíng)部門會(huì)將各個(gè)渠道的用戶評(píng)論視為“富礦”。有研究對(duì)攜程酒店、豆瓣影評(píng)、美團(tuán)等用戶評(píng)論數(shù)據(jù)和評(píng)論行為進(jìn)行挖掘,為商家精準(zhǔn)營(yíng)銷提供決策依據(jù)。[18](p99-104)[19](p99-104)[20](p85-93)
現(xiàn)有研究還關(guān)注公共服務(wù)中用戶評(píng)論數(shù)據(jù)的應(yīng)用。Herbst 等利用Yelp 中美國(guó)40 個(gè)城市消費(fèi)者的評(píng)論數(shù)據(jù),使用自然語(yǔ)言處理技術(shù)分析評(píng)論中的情感和心理狀態(tài),探討群體收入、環(huán)境安全、環(huán)境質(zhì)量、孩子與老師之間的互動(dòng)等影響父母選擇托育機(jī)構(gòu)的因素。[21](p288-306)張文亮爬取了39所省級(jí)公共圖書館在大眾點(diǎn)評(píng)App上的評(píng)分和用戶評(píng)論,揭示用戶評(píng)論的傾向性,分析公共圖書館評(píng)價(jià)要素之間的關(guān)系。[22](p51-60)第三方應(yīng)用市場(chǎng)上的評(píng)論數(shù)據(jù)也開始得到重視和利用。[23](p53-61)范建軍以移動(dòng)知識(shí)付費(fèi)平臺(tái)“得到”為例,對(duì)用戶在App Store上的評(píng)論和評(píng)分進(jìn)行分析,發(fā)現(xiàn)用戶最為關(guān)注的是內(nèi)容和功能,也較為接受付費(fèi)內(nèi)容的價(jià)格。[24](p67-70)張莉曼等以學(xué)術(shù)知識(shí)類App“丁香園”的用戶評(píng)論為樣本,進(jìn)行主題識(shí)別分析和語(yǔ)義關(guān)聯(lián)分析,為App運(yùn)營(yíng)者完善平臺(tái)功能提供借鑒。[25](p155-162)
與私營(yíng)部門廣泛使用用戶評(píng)論的現(xiàn)狀相比,公共部門卻少有效仿。僅有網(wǎng)絡(luò)輿情、網(wǎng)絡(luò)問政的應(yīng)用相對(duì)充分些,分析網(wǎng)民評(píng)論中的情感極性、[26](p37-42)評(píng)論主題語(yǔ)義網(wǎng)絡(luò),[27](p77-90)幫助政府部門理解網(wǎng)民觀點(diǎn)、情感的變化,為輿情處置提供參考。令人欣慰的是,已經(jīng)有研究者開始關(guān)注到政務(wù)服務(wù)中的用戶評(píng)論數(shù)據(jù)。比如,劉桂琴獲取武漢市政務(wù)公開數(shù)據(jù)網(wǎng)上的用戶評(píng)論數(shù)據(jù),分析定位用戶痛點(diǎn)、用戶關(guān)注以及政府工作中存在的問題。[28](p18-23)公眾的在線評(píng)論資源豐富也很有見地,提供了關(guān)于公共服務(wù)的各方面意見建議,是傳統(tǒng)統(tǒng)計(jì)調(diào)查方法難以代表和覆蓋的,基于對(duì)在線評(píng)論數(shù)據(jù)的有效挖掘,可以聚合公眾意見,將公眾反饋有效納入公共服務(wù)的改革范疇。[29](p1011–1026)
利用應(yīng)用商店中各政務(wù)App的評(píng)分評(píng)論數(shù)據(jù),可以觀測(cè)各地區(qū)移動(dòng)政務(wù)服務(wù)質(zhì)量。但是,各手機(jī)平臺(tái)面向用戶群不同、使用習(xí)慣有差異,加上用戶生產(chǎn)內(nèi)容過程中傳統(tǒng)意義上的“把關(guān)人”缺失,用戶評(píng)論質(zhì)量參差不齊,各手機(jī)平臺(tái)上的用戶評(píng)論是否都值得花力氣去挖掘?如果這些數(shù)據(jù)價(jià)值密度低,無法有效反映用戶意愿和需求,那就很難為政務(wù)App運(yùn)維者提供有用可信的反饋信息。[30](p55-63)因此,本研究需要去衡量和評(píng)價(jià)承載用戶評(píng)論的信息來源(手機(jī)平臺(tái))質(zhì)量,最終篩選出較高質(zhì)量的平臺(tái),從而對(duì)高質(zhì)量平臺(tái)上的用戶評(píng)論數(shù)據(jù)進(jìn)行挖掘分析。
于文軒和馬亮建構(gòu)了一個(gè)對(duì)第三方評(píng)估進(jìn)行再評(píng)估的分析框架,認(rèn)為可以從獨(dú)立性、相關(guān)性、效度、信度、易懂性、功能性等六個(gè)方面對(duì)第三方評(píng)估進(jìn)行評(píng)估,[31](p144-171)并對(duì)中國(guó)兩個(gè)大型公共服務(wù)績(jī)效測(cè)評(píng)項(xiàng)目進(jìn)行比較。本研究中各手機(jī)平臺(tái)形成的用戶評(píng)論可看作是對(duì)政務(wù)App的第三方評(píng)估,當(dāng)前就需要對(duì)這些手機(jī)平臺(tái)進(jìn)行再評(píng)估,因此本研究可借鑒其分析框架。
信度和效度是評(píng)價(jià)績(jī)效的兩個(gè)重要標(biāo)準(zhǔn)。信度指可靠性,即不同測(cè)量者使用不同測(cè)量方法測(cè)量的結(jié)果應(yīng)該具有很高的一致性。如果測(cè)量的信度不高,那就說明測(cè)量的結(jié)果是不可靠的、不穩(wěn)定的,被評(píng)價(jià)對(duì)象就會(huì)接收到差別較大的“績(jī)效信號(hào)”,他們?cè)卺葆濯q豫中不知道該選擇和相信誰(shuí),測(cè)量的效用就會(huì)大打折扣,甚至?xí)绊懕辉u(píng)價(jià)對(duì)象對(duì)于評(píng)價(jià)主體的印象和態(tài)度。效度是評(píng)測(cè)程序、指標(biāo)、方法等是否科學(xué),能在多大程度上客觀地反映現(xiàn)實(shí),可以通過觀測(cè)評(píng)價(jià)原數(shù)據(jù)是否公開、統(tǒng)計(jì)技術(shù)是否科學(xué)、樣本量是否充足等,獲得對(duì)效度的度量。
基于信度和效度的度量標(biāo)準(zhǔn),我們構(gòu)建本研究的評(píng)價(jià)模型(如圖1)。我們認(rèn)為手機(jī)平臺(tái)上政務(wù)App 的用戶群越廣泛、用戶評(píng)論越積極、樣本量越大、數(shù)據(jù)內(nèi)容越豐富、用戶評(píng)論越客觀、用戶評(píng)論可持續(xù)性越好,用戶評(píng)論信息來源的質(zhì)量就越高,就越適合用于移動(dòng)政務(wù)服務(wù)績(jī)效的評(píng)估。
圖1 信息來源質(zhì)量評(píng)價(jià)模型
滲透性。下載量是評(píng)判一個(gè)App 運(yùn)維質(zhì)量的關(guān)鍵指標(biāo),高下載量也是信度與效度的重要保障。消費(fèi)者在消費(fèi)過程中會(huì)表現(xiàn)出馬太效應(yīng),用戶受到應(yīng)用程序下載量的影響,通常選擇高下載量的應(yīng)用程序使用。[32](p742-749)因此,App 運(yùn)營(yíng)者非常看重App下載量指標(biāo),也較多采用市場(chǎng)推廣的手段提高下載量。本研究以省份為行政區(qū)劃的政務(wù)App,其用戶群有較強(qiáng)的地域性,省份與省份之間、省份與各直轄市之間的人口基數(shù)差異較大,因此不能單純考察用戶下載量這一絕對(duì)值指標(biāo),應(yīng)該體現(xiàn)出不同人口基數(shù)下的下載量差異,用滲透性表征更恰當(dāng),滲透性能夠有效地測(cè)量政務(wù)App 在本地用戶群中的普及和流行程度。
活躍度。評(píng)論數(shù)量是用戶就某一產(chǎn)品或服務(wù)發(fā)表的評(píng)論數(shù)的總量,是用戶人數(shù)的直接體現(xiàn),也是產(chǎn)品或服務(wù)信息量的間接體現(xiàn)。Duan 等對(duì)電影的在線評(píng)論研究發(fā)現(xiàn),電影評(píng)論的數(shù)量和電影票房之間有相互影響關(guān)系。[33](p233-242)Chen 等發(fā)現(xiàn)評(píng)論數(shù)量能造成一種積極的觀察學(xué)習(xí)效應(yīng),評(píng)論數(shù)量越多,越促使更多的用戶有意愿去知曉和了解該App。[34](p238-254)評(píng)論數(shù)量顯示了用戶對(duì)該產(chǎn)品或服務(wù)的關(guān)注程度,可以作為其影響力的重要指標(biāo)。[35](p162-171)對(duì)于政務(wù)App來說,評(píng)論數(shù)量同前述的下載量一樣,還要與地區(qū)實(shí)際相結(jié)合,考察政務(wù)App的影響力實(shí)際就是考察有多少用戶積極進(jìn)行評(píng)論,即用戶的活躍度?;钴S度越高,代表用戶越積極發(fā)表評(píng)論,越能為政務(wù)App績(jī)效評(píng)測(cè)提供數(shù)據(jù)資源。
客觀性。政務(wù)App績(jī)效受地區(qū)經(jīng)濟(jì)發(fā)展水平、互聯(lián)網(wǎng)普及程度、地方數(shù)字治理能力等影響,在客觀上是不均衡的,《省級(jí)政府和重點(diǎn)城市一體化政務(wù)服務(wù)能力(政務(wù)服務(wù)“好差評(píng)”)調(diào)查評(píng)估報(bào)告(2021)》《2021 年省級(jí)移動(dòng)政務(wù)服務(wù)能力調(diào)查評(píng)估報(bào)告》均顯示當(dāng)前省級(jí)政務(wù)發(fā)展績(jī)效有“好”“中等”“差”,總體呈現(xiàn)倒U 形的正態(tài)分布。Sussman 等認(rèn)為,信息的客觀屬性是體現(xiàn)信息質(zhì)量的重要指標(biāo)。[36](p47-65)因此,我們預(yù)測(cè)不同手機(jī)平臺(tái)上的各個(gè)省級(jí)政務(wù)App評(píng)價(jià)也應(yīng)該服從正態(tài)分布,意味著測(cè)量指標(biāo)能夠真實(shí)有效地度量出每個(gè)樣本的績(jī)效。
極端性。對(duì)Yelp旅游類產(chǎn)品的研究發(fā)現(xiàn),用戶更喜歡極端評(píng)價(jià),極端評(píng)價(jià)能夠表達(dá)評(píng)論者觀點(diǎn)的鮮明方向,比中立評(píng)價(jià)更能影響后續(xù)用戶的選擇。[37](p67-83)對(duì)亞馬遜網(wǎng)站手機(jī)產(chǎn)品的研究發(fā)現(xiàn),極端評(píng)價(jià)對(duì)評(píng)論有用性有積極的正向影響。[38](p16-27)我們認(rèn)為,對(duì)政務(wù)App使用無感的用戶一般不參與評(píng)價(jià),而那些對(duì)政務(wù)App使用感觸較深(糟糕或愉快)的用戶會(huì)參與評(píng)價(jià),通過極端評(píng)價(jià)反映用戶態(tài)度,極端評(píng)價(jià)的評(píng)論中往往會(huì)深入對(duì)問題、需求和痛點(diǎn)的描述。因此,極端性的評(píng)論有更多的特征點(diǎn)可以給后續(xù)用戶或者App運(yùn)營(yíng)者參考,更能有效地體現(xiàn)評(píng)論的價(jià)值。
有用性。由于網(wǎng)絡(luò)的開放性,用戶發(fā)布在線評(píng)論的成本很低,導(dǎo)致部分虛假、無效信息充斥于在線評(píng)論,甚至部分評(píng)論數(shù)量多、噪音大,無益于其他用戶的決策和運(yùn)營(yíng)者服務(wù)的改善,反而增加評(píng)論的無序性,降低評(píng)論的可信性。因此,評(píng)價(jià)用戶的評(píng)論文本是否有用,是否真正表達(dá)用戶體驗(yàn),開發(fā)運(yùn)營(yíng)者能否從評(píng)論文本中提煉出優(yōu)化完善的建議點(diǎn),這是觀測(cè)用戶評(píng)論效度的重要手段,也是測(cè)量信息來源質(zhì)量的重要指標(biāo)。
可持續(xù)性。應(yīng)用商店在提供服務(wù)的同時(shí),負(fù)有網(wǎng)絡(luò)生態(tài)治理的平臺(tái)主體責(zé)任,因此應(yīng)用商店設(shè)置刪除評(píng)論的功能,對(duì)產(chǎn)生的攻擊性言論、反黨反社會(huì)言論等進(jìn)行必要的清理。但是,部分應(yīng)用商店將這種功能進(jìn)行市場(chǎng)化運(yùn)作,受利益等因素的驅(qū)動(dòng),將刪除用戶評(píng)分評(píng)論的權(quán)力泛化、擴(kuò)大化,這就影響評(píng)分?jǐn)?shù)、評(píng)論內(nèi)容等數(shù)據(jù)的抓取和分析,也影響用戶對(duì)該平臺(tái)的認(rèn)可度。因此,將用戶評(píng)論在平臺(tái)上的存活情況視為評(píng)論利用的可持續(xù)性,這是應(yīng)用商店信度的重要保證,是測(cè)量信息來源質(zhì)量的重要指標(biāo)。
隨著各地政府加快推進(jìn)移動(dòng)政務(wù)服務(wù)的集約化建設(shè),省級(jí)移動(dòng)政務(wù)客戶端日益取代市縣鄉(xiāng)和職能部門單獨(dú)開發(fā)的App,而成為地方移動(dòng)政務(wù)的主入口。因此,我們對(duì)省級(jí)移動(dòng)政務(wù)服務(wù)App進(jìn)行研究,來考察用戶評(píng)論數(shù)據(jù)如何用于“好差評(píng)”制度實(shí)施。
數(shù)據(jù)采集面向App Store和Android平臺(tái)(華為、小米、VIVO、OPPO),獲取應(yīng)用商店中31個(gè)?。ㄗ灾螀^(qū)、直轄市)和新疆生產(chǎn)建設(shè)兵團(tuán)(不含港澳臺(tái))開發(fā)和運(yùn)營(yíng)的移動(dòng)政務(wù)App 中的相關(guān)數(shù)據(jù),政務(wù)App以國(guó)家政務(wù)服務(wù)平臺(tái)中的地方移動(dòng)政務(wù)和各省份政務(wù)服務(wù)官網(wǎng)提供的鏈接為準(zhǔn)(如表1),采集App評(píng)分、用戶評(píng)分?jǐn)?shù)、用戶評(píng)論數(shù)據(jù)、App下載量、App評(píng)分等級(jí)分布等數(shù)據(jù),數(shù)據(jù)采集截至2021 年8 月7日。因樣本數(shù)據(jù)類型較多、數(shù)據(jù)更新頻率高,所以在采集期內(nèi)樣本數(shù)據(jù)會(huì)略有波動(dòng),但是不影響本文的主要研究發(fā)現(xiàn)。七麥數(shù)據(jù)平臺(tái)匯聚了移動(dòng)客戶端的各類用戶評(píng)論數(shù)據(jù),為本研究提供了主要數(shù)據(jù)來源。在本研究中,我們主要關(guān)注如下數(shù)據(jù)。
表1 政務(wù)App樣本一覽表
App評(píng)分。App評(píng)分是用戶群體對(duì)該應(yīng)用的綜合定量評(píng)價(jià),可以體現(xiàn)用戶對(duì)App 的認(rèn)可程度,同時(shí)也是應(yīng)用商店對(duì)App 進(jìn)行推廣排名的參考指標(biāo)。[39](p193-200)App 評(píng)分取值1~5 之間,是連續(xù)數(shù)值型變量。
用戶評(píng)分?jǐn)?shù)。用戶對(duì)政務(wù)App 的星級(jí)評(píng)定會(huì)計(jì)入用戶評(píng)分?jǐn)?shù)。評(píng)分?jǐn)?shù)過少,App 評(píng)分就缺乏客觀性和精準(zhǔn)性。因此,本研究剔除少于20個(gè)用戶評(píng)分?jǐn)?shù)的App評(píng)分,用戶評(píng)分?jǐn)?shù)以次為計(jì)量單位。
App下載量。App下載量是用戶下載該App的實(shí)際次數(shù),用戶每下載一次,App 下載量數(shù)據(jù)增長(zhǎng)一個(gè),下載量數(shù)據(jù)以萬(wàn)次為計(jì)量單位。
用戶評(píng)論數(shù)據(jù)。用戶自主發(fā)表的對(duì)App 應(yīng)用的評(píng)論。評(píng)論數(shù)據(jù)由中文字符、英文字符、標(biāo)點(diǎn)符號(hào)與表情符號(hào)等組成,鑒于直接抓取的用戶評(píng)論數(shù)據(jù)噪音較大,本研究需要對(duì)用戶評(píng)論數(shù)據(jù)進(jìn)行清洗,剔除廣告評(píng)論、無效評(píng)論、純表情符號(hào)、開發(fā)者回復(fù)。特別說明的是,iOS 平臺(tái)提供了開發(fā)者與用戶的互動(dòng)渠道,以便開發(fā)者對(duì)用戶提出的問題和建議進(jìn)行反饋,也就是“開發(fā)者回復(fù)”,這部分?jǐn)?shù)據(jù)不屬于用戶產(chǎn)生數(shù)據(jù),無益于本研究的分析,因此剔除開發(fā)者回復(fù)評(píng)論數(shù)據(jù)。用戶評(píng)論數(shù)據(jù)是非結(jié)構(gòu)化文本數(shù)據(jù),對(duì)評(píng)論數(shù)據(jù)的采集處理,同時(shí)可以獲得用戶評(píng)論數(shù)。
評(píng)分等級(jí)分布。應(yīng)用商店通常設(shè)定1星到5星五個(gè)評(píng)定等級(jí),用戶評(píng)分時(shí)選擇不同星級(jí),應(yīng)用商店根據(jù)各用戶評(píng)分星級(jí)生成App總體評(píng)分,通過對(duì)各應(yīng)用商店的數(shù)據(jù)計(jì)量發(fā)現(xiàn),App總體評(píng)分值=(5*5 星評(píng)分?jǐn)?shù)+4*4 星評(píng)分?jǐn)?shù)+3*3 星評(píng)分?jǐn)?shù)+2*2 星評(píng)分?jǐn)?shù)+1*1星評(píng)分?jǐn)?shù))/當(dāng)前總評(píng)分?jǐn)?shù),該測(cè)量辦法既體現(xiàn)了不同星級(jí)的權(quán)重,也充分考慮星級(jí)間的差異性,評(píng)分等級(jí)分布顯示了五個(gè)評(píng)定等級(jí)各自的評(píng)分?jǐn)?shù)據(jù)。需說明的是,小米應(yīng)用商店設(shè)定“差評(píng)”和“好評(píng)”兩個(gè)等級(jí),無法獲取本研究的研究特征,因此,我們未采集和分析小米應(yīng)用商店。
其他數(shù)據(jù)。本研究涉及的地區(qū)人口數(shù)據(jù)來源于國(guó)家統(tǒng)計(jì)局網(wǎng)站,以各地區(qū)2020 年末常住人口(萬(wàn)人/單位)為來源數(shù)據(jù);省級(jí)電子政務(wù)發(fā)展水平數(shù)據(jù)來源于中央黨校(國(guó)家行政學(xué)院)電子政務(wù)中心發(fā)布的《省級(jí)政府和重點(diǎn)城市一體化政務(wù)服務(wù)能力(政務(wù)服務(wù)“好差評(píng)”)調(diào)查評(píng)估報(bào)告(2021)》中的省級(jí)政府調(diào)查評(píng)估總體指數(shù)。這些數(shù)據(jù)均為政府統(tǒng)計(jì)數(shù)據(jù)或政府委托的權(quán)威調(diào)查報(bào)告,具有較強(qiáng)的可靠性和穩(wěn)定性。
本研究中用i代表手機(jī)平臺(tái)的編號(hào),用j 代表樣本App 的編號(hào),五個(gè)手機(jī)平臺(tái)各自都有對(duì)樣本App的評(píng)分,用Si,j表示每個(gè)App在一個(gè)手機(jī)平臺(tái)上的評(píng)分,下載量用Di,j表示,評(píng)分?jǐn)?shù)用SDi,j表示,評(píng)論數(shù)用RDi,j表示,地區(qū)人口總數(shù)用Totalj表示。
滲透性(Penetration)。手機(jī)平臺(tái)在本地區(qū)用戶中的普及和占有情況,取值為:政務(wù)App 下載量與本地區(qū)人口總數(shù)的比值,具體數(shù)值化是Pi,j=Di,j/Totalj。滲透性越高,代表該平臺(tái)輻射和覆蓋的用戶面越大,對(duì)用戶的影響也就越大。滲透性計(jì)量單位為百分比。
活躍度(Activity)。手機(jī)平臺(tái)用戶參與政務(wù)App 評(píng)價(jià)的情況,取值為:政務(wù)App 評(píng)分?jǐn)?shù)與政務(wù)App下載量的比值,具體數(shù)值化是Ai,j=SDi,j/Di,j,指的是已經(jīng)下載App的用戶群中有多少用戶參與App使用的反饋評(píng)價(jià)?;钴S度計(jì)量單位為萬(wàn)人。
客觀性(Objectivity)。手機(jī)平臺(tái)各政務(wù)App 評(píng)分分布情況,用評(píng)分?jǐn)?shù)據(jù)是否服從正態(tài)分布來表征,客觀性的考察以Shapiro-Wilk檢驗(yàn)結(jié)果SWi,j為依據(jù),SWi,j>0.05,說明評(píng)分?jǐn)?shù)據(jù)服從正態(tài)分布,否則不服從正態(tài)分布。
極端性(Polarization)。政務(wù)App評(píng)分內(nèi)部極端評(píng)分的占比情況。5 個(gè)評(píng)定等級(jí)中,1 星為極差,5星為極好,統(tǒng)計(jì)每個(gè)App評(píng)分中的1星、5星評(píng)分的總數(shù)為極端評(píng)分?jǐn)?shù)SEi,j,看極端評(píng)分?jǐn)?shù)在總體評(píng)分?jǐn)?shù)中的占比情況,具體數(shù)值化Pi,j=SEi,j/SDi,j。極端性計(jì)量單位為百分比。
有用性(Usefulness)。評(píng)論文本有多種度量指標(biāo),包括評(píng)論發(fā)表時(shí)間、評(píng)論字符串長(zhǎng)度、評(píng)論文本語(yǔ)義特征、評(píng)論情感特征等。Mudambi 等嘗試過用評(píng)論字?jǐn)?shù)來衡量評(píng)論質(zhì)量,結(jié)果發(fā)現(xiàn),評(píng)論的篇幅越長(zhǎng),涉及商品的介紹便越多,消費(fèi)者也會(huì)獲得更多的有用信息,正向影響評(píng)論有效性和購(gòu)買決策。[40](p185-200)還有學(xué)者對(duì)評(píng)論文本長(zhǎng)度與評(píng)論有用性的關(guān)系進(jìn)行了深入研究,證明評(píng)論的文本長(zhǎng)度與評(píng)論有用性呈顯著的正相關(guān)關(guān)系。[41](p598-612)Huang等學(xué)者發(fā)現(xiàn),文本長(zhǎng)度對(duì)評(píng)論有用性的影響有一個(gè)臨界值(144 詞),閾值內(nèi)為正向影響,超過這一閾值,其影響就會(huì)顯著減弱或幾乎不存在。[42](p17-27)本研究對(duì)每個(gè)手機(jī)平臺(tái)上的政務(wù)App 評(píng)論文本進(jìn)行文本長(zhǎng)度的計(jì)量,并取均值為L(zhǎng)i,j,當(dāng)Li,j<144 時(shí),Li,j越大說明評(píng)論文本的有用性越強(qiáng)。有用性以詞為計(jì)量單位。
可持續(xù)性(Sustainability)。用戶評(píng)分?jǐn)?shù)不同于評(píng)論數(shù),是因?yàn)橛脩粼谠u(píng)分時(shí)可以選擇既評(píng)分也評(píng)論,也可選擇只評(píng)分不評(píng)論,所以App 的評(píng)分?jǐn)?shù)通常意義上要大于或者等于評(píng)論數(shù)。如果出現(xiàn)評(píng)分?jǐn)?shù)小于評(píng)論數(shù)的情況,通常就是應(yīng)用商店刪除用戶評(píng)分導(dǎo)致的。因此本研究用評(píng)分?jǐn)?shù)與評(píng)論數(shù)的差值就能顯示是否存在刪除評(píng)分的情況,用差值在評(píng)分?jǐn)?shù)中的占比就能顯示刪除評(píng)分的程度,也就是用戶評(píng)分評(píng)論的存活程度,具體數(shù)值化是SSi,j=(SDi,j-RDi,j)/SDi,j??沙掷m(xù)性以百分比為計(jì)量單位。
各手機(jī)平臺(tái)對(duì)政務(wù)App 的評(píng)價(jià)情況與官方的評(píng)估報(bào)告之間是怎樣的關(guān)系,這是能否將政務(wù)App評(píng)分納入政務(wù)服務(wù)“好差評(píng)”的重要因素。要兼顧各個(gè)手機(jī)平臺(tái)的評(píng)分貢獻(xiàn),得到每個(gè)樣本App的總評(píng)分Scorej,本研究認(rèn)為下載量是用戶需求和認(rèn)可的表現(xiàn),在計(jì)算總評(píng)分時(shí)需要充分考慮下載量所占的比重,并將其作為評(píng)分值的系數(shù)。下載量Di,j與地區(qū)總?cè)丝跀?shù)Totalj比值為加權(quán)系數(shù)Wi,j,樣本App在應(yīng)用商店中的總體評(píng)分就可以通過以下公式獲得:Scorej=
《省級(jí)政府和重點(diǎn)城市一體化政務(wù)服務(wù)能力(政務(wù)服務(wù)“好差評(píng)”)調(diào)查評(píng)估報(bào)告2021》中關(guān)于省級(jí)政府調(diào)查評(píng)估的總體指數(shù)是連續(xù)數(shù)值型變量,將樣本評(píng)分Scorej與省級(jí)政府調(diào)查評(píng)估的總體指數(shù)進(jìn)行相關(guān)性分析,發(fā)現(xiàn)兩者在1%水平上顯著,相關(guān)系數(shù)為0.708,表現(xiàn)為強(qiáng)相關(guān)。也就是說公眾對(duì)政務(wù)App 的總體評(píng)價(jià)與權(quán)威調(diào)查報(bào)告的趨勢(shì)基本一致。因此,公眾的評(píng)價(jià)可以用于衡量政務(wù)App發(fā)展的績(jī)效,對(duì)移動(dòng)政務(wù)“好差評(píng)”評(píng)價(jià)有可用性。
依據(jù)前述的信息來源質(zhì)量評(píng)價(jià)模型,我們對(duì)樣本數(shù)據(jù)進(jìn)行六個(gè)方面的分析。
1.滲透率分析。
樣本缺失iOS 版本、Android 版本、小米數(shù)據(jù)、VIVO數(shù)據(jù)等,會(huì)帶來樣本個(gè)數(shù)的變化,因此樣本的個(gè)案數(shù)量不一致。描述性統(tǒng)計(jì)分析(如表2)顯示,華為平臺(tái)滲透率均值58.75%,是所有手機(jī)平臺(tái)中最高的;iOS 平臺(tái)滲透率均值5.79%,是所有手機(jī)平臺(tái)中最低的。
表2 主要變量的描述性統(tǒng)計(jì)分析
數(shù)據(jù)顯示有多個(gè)地區(qū)的滲透率大于100%,這可能有幾個(gè)方面原因:一是用戶存在反復(fù)下載的情況。有調(diào)查顯示,用戶人均安裝App 數(shù)量約40 個(gè)。政務(wù)App具有低頻特點(diǎn),公眾需要辦理政務(wù)事項(xiàng)的時(shí)候下載并使用,使用完畢后為了減輕手機(jī)運(yùn)行負(fù)擔(dān)又進(jìn)行卸載,直到下一次有需求時(shí)再次下載安裝。所以,這會(huì)造成同一個(gè)用戶多次下載,而高下載量也從側(cè)面反映了公眾的需求以及政務(wù)服務(wù)能夠滿足公眾需求的能力。二是地區(qū)外用戶因?yàn)榭缡∞k理、跨地區(qū)辦理等原因,也需要安裝本行政區(qū)域外的政務(wù)App。本研究中的滲透率將本行政區(qū)域內(nèi)的常住人口界定為測(cè)量基數(shù),但是隨著人口的頻繁流動(dòng),跨地區(qū)跨區(qū)域辦理需求旺盛,政務(wù)App的便捷性可以滿足這種需求??绲貐^(qū)用戶也會(huì)帶來一定的下載量,說明本地區(qū)有比較高的移動(dòng)政務(wù)服務(wù)能力。三是開發(fā)運(yùn)營(yíng)者組織的測(cè)試、研究者的測(cè)試等也會(huì)帶來一定下載量,導(dǎo)致滲透率的提高。
2.活躍度分析。
前述已說明,當(dāng)評(píng)分?jǐn)?shù)SDi,j<20 時(shí),評(píng)分?jǐn)?shù)、評(píng)分值兩項(xiàng)都將設(shè)置為缺失項(xiàng)。實(shí)際情況是有多個(gè)地區(qū)如黑龍江、陜西、青海等地的評(píng)分?jǐn)?shù)都是個(gè)位數(shù),所以描述性統(tǒng)計(jì)里的個(gè)案數(shù)較低。從各平臺(tái)的活躍度來看(如表2),iOS 平臺(tái)的活躍度均值為16.19,也即每萬(wàn)次下載量中有16.19個(gè)評(píng)分?jǐn)?shù),明顯高于其他四個(gè)平臺(tái),說明其用戶較愿意表達(dá)自己的態(tài)度和觀點(diǎn)。華為平臺(tái)的活躍度最低,均值為0.09,且標(biāo)準(zhǔn)差較小,也即各政務(wù)App在華為平臺(tái)的用戶參與度和活躍度不足。相較于其他三個(gè)平臺(tái),VIVO 平臺(tái)的活躍度有一定優(yōu)勢(shì),體現(xiàn)出其用戶比較愿意參與政務(wù)App的評(píng)分評(píng)價(jià)。
需要說明的是,我們發(fā)現(xiàn)華為應(yīng)用商店存在明顯的刪除評(píng)論現(xiàn)象,每日的評(píng)分?jǐn)?shù)據(jù)波動(dòng)較大。對(duì)被刪除的評(píng)論進(jìn)行數(shù)據(jù)抓取發(fā)現(xiàn),歷史評(píng)論數(shù)并不低,說明華為平臺(tái)的用戶參與也很積極活躍。至于應(yīng)用商店刪除評(píng)論的原因,則有待未來探查。
3.客觀性分析。
因樣本量小于2000,采用Shapiro-Wilk 檢驗(yàn)數(shù)據(jù)分布的正態(tài)性。結(jié)果顯示(如表2),iOS 平臺(tái)(p=0.156)、華為平臺(tái)(p=0.110)、小米平臺(tái)(p=0.168)評(píng)分均服從正態(tài)分布,而VIVO 平臺(tái)和OPPO 平臺(tái)評(píng)分不服從正態(tài)分布。從各平臺(tái)的均值上看,iOS 平臺(tái)、華為平臺(tái)、VIVO平臺(tái)均值相當(dāng)。
對(duì)五組數(shù)據(jù)進(jìn)行方差分析發(fā)現(xiàn),僅有小米平臺(tái)與OPPO平臺(tái)(p=0.011)在5%的水平上存在顯著差異。從描述性分析中可以看到,小米平臺(tái)的評(píng)分均值為3.35 分,顯著高于其他平臺(tái)。OPPO 平臺(tái)均值則顯著低于其他平臺(tái)。其他平臺(tái)間不存在顯著組間差異。
此外,研究發(fā)現(xiàn)“隨申辦”“愛山東”“粵商通”在小米平臺(tái)上收獲了滿分5.0 分的贊譽(yù),但同時(shí)三個(gè)省份的政務(wù)App 在其他平臺(tái)的評(píng)分趨勢(shì)卻不甚相同。尤其是“愛山東”在其他四個(gè)平臺(tái)的評(píng)分分別為2.7分、1.9分、2.9分和2.7分,其標(biāo)準(zhǔn)差達(dá)1.16,與小米平臺(tái)的評(píng)分顯著不同。因此,本研究希望探求小米平臺(tái)為什么給予滿分的評(píng)價(jià),是否存在其他因素。
對(duì)三個(gè)政務(wù)App 小米平臺(tái)上的評(píng)論文本做內(nèi)容分析,將評(píng)論文本清洗后輸入ROST CM6,通過社會(huì)網(wǎng)絡(luò)分析提取高頻詞,通過情感分析生成情感極性和得分(如表3)。結(jié)果發(fā)現(xiàn),三個(gè)政務(wù)App 評(píng)價(jià)內(nèi)容均跨越了多個(gè)版本,“隨申辦”的372個(gè)評(píng)論數(shù)就跨越了24個(gè)版本,評(píng)論數(shù)相對(duì)均衡;但“愛山東”僅2.3.7 版本就有1986 條評(píng)論,而且時(shí)間段相對(duì)集中,出現(xiàn)一定程度的失衡。三個(gè)政務(wù)App情感得分均為正面積極,高頻詞多聚焦于“實(shí)用”“體驗(yàn)”“功能”等,缺乏對(duì)每個(gè)政務(wù)App特征點(diǎn)的具體描述,評(píng)論的豐富性和有用性略顯不足。
表3 小米平臺(tái)滿分政務(wù)App內(nèi)容分析
4.極端性分析。
五個(gè)平臺(tái)均存在極端評(píng)分情況(如表2),極端占比均高于80%,并且標(biāo)準(zhǔn)差較小,說明各個(gè)政務(wù)App 在極端評(píng)分上的表現(xiàn)趨同;VIVO 平臺(tái)和OPPO平臺(tái)的極端評(píng)分占比為92%和93%,說明用戶在給政務(wù)App打分時(shí)很少選擇中立評(píng)分,一般選擇極端評(píng)分來表達(dá)自己的態(tài)度。其中,“全省事”在華為、VIVO、OPPO 平臺(tái)上的評(píng)分量不太充足,卻全部都給予“極好”和“極差”評(píng)分,未見中立評(píng)分。用戶都希望通過極端評(píng)分來表達(dá)態(tài)度,希望引起App開發(fā)運(yùn)營(yíng)者的關(guān)注和反饋。
5.有用性分析。
五個(gè)平臺(tái)的有用性存在顯著區(qū)別(如表2),iOS平臺(tái)文本長(zhǎng)度均值為35.28詞,高于其他四個(gè)平臺(tái),最大的文本長(zhǎng)度為92.34 詞低于閾值144 詞。閾值范圍內(nèi)文本長(zhǎng)度越長(zhǎng),文本的有用性就越高,說明iOS平臺(tái)評(píng)論的有用性最好。華為平臺(tái)文本長(zhǎng)度適中,標(biāo)準(zhǔn)差較小,說明文本長(zhǎng)度分布比較均衡。VI?VO平臺(tái)的評(píng)論文本長(zhǎng)度最短,僅有15個(gè)左右的詞,很難表達(dá)有特征性的觀點(diǎn)和看法,說明其評(píng)論的有用性較差。
6.可持續(xù)性分析。
五個(gè)平臺(tái)的可持續(xù)性存在顯著差異(如表2),iOS 平臺(tái)可持續(xù)性最好,僅有一個(gè)為負(fù)值,其余全為正值,均值為0.51,說明評(píng)分?jǐn)?shù)與評(píng)論數(shù)之間的差距較小,較少存在刪除評(píng)分情況,標(biāo)準(zhǔn)差為0.3,說明整體比較均勻,iOS 應(yīng)用商店中用戶的評(píng)分和評(píng)論數(shù)據(jù)存活性好,可持續(xù)利用狀態(tài)好。華為平臺(tái)的可持續(xù)性最差,僅有一個(gè)樣本是評(píng)分?jǐn)?shù)與評(píng)論數(shù)持平,其他均是評(píng)分?jǐn)?shù)少于評(píng)論數(shù),最高的達(dá)到-40.81。查看原始數(shù)據(jù)發(fā)現(xiàn),該政務(wù)App 當(dāng)前僅有26個(gè)評(píng)分?jǐn)?shù),但歷史數(shù)據(jù)中有1087個(gè)評(píng)論數(shù),均值也為負(fù)值,這說明華為平臺(tái)存在普遍的刪除評(píng)分情況,用戶評(píng)分評(píng)論被大量刪除會(huì)帶來數(shù)據(jù)的不穩(wěn)定,也帶來信息來源的不可靠。此外,小米平臺(tái)、OPPO平臺(tái)也存在不同程度的刪除評(píng)分情況,而VI?VO 平臺(tái)的情況則要好一些,均值為正值且標(biāo)準(zhǔn)差較小。查看原始數(shù)據(jù)發(fā)現(xiàn),VIVO 平臺(tái)僅有一個(gè)政務(wù)App的存活占比為負(fù)值,其他均為正值。
綜上所述(如表4),我們認(rèn)為在這5 個(gè)主流平臺(tái)中,“好差評(píng)”制度應(yīng)主要使用iOS 平臺(tái)的評(píng)分和評(píng)論數(shù)據(jù),可以參考運(yùn)用部分Android 平臺(tái)的評(píng)論數(shù)據(jù)。
手機(jī)應(yīng)用商店中積累了大量的用戶評(píng)分評(píng)論數(shù)據(jù),用戶評(píng)論大量指向了政務(wù)App 運(yùn)維問題,是移動(dòng)政務(wù)服務(wù)供給能力、技術(shù)服務(wù)能力的重要表現(xiàn),可以進(jìn)行數(shù)據(jù)挖掘分析,用于完善移動(dòng)政務(wù)績(jī)效評(píng)估體系。但是,目前這方面的研究還比較稀缺。本研究以5 個(gè)主流手機(jī)平臺(tái)上的32 個(gè)省級(jí)政務(wù)App為研究對(duì)象,收集和分析不同平臺(tái)用戶的評(píng)分評(píng)論情況。
首先,研究發(fā)現(xiàn)用戶評(píng)論是衡量政務(wù)App服務(wù)質(zhì)量的有益補(bǔ)充。研究發(fā)現(xiàn),只有對(duì)政務(wù)App使用有比較深刻感悟的用戶才參與政務(wù)App評(píng)價(jià),通過打分來表達(dá)自己使用的(不)滿意;更進(jìn)一步,公眾是在自主空間內(nèi)根據(jù)自己的切身感受給出的分值,沒有外界因素的干擾,打分更具真實(shí)性和客觀性。用戶評(píng)論也不是簡(jiǎn)單的褒獎(jiǎng)或發(fā)泄,特別是一些看似負(fù)面的評(píng)論信息,實(shí)際是將用戶的需求和痛點(diǎn)展現(xiàn)出來。
有研究發(fā)現(xiàn),用戶評(píng)論強(qiáng)烈的負(fù)面消極情緒會(huì)降低評(píng)論的有效性,而中等程度的負(fù)面消極情緒則可以提高評(píng)論的有用性。[43](p79-86)部分負(fù)面情緒的評(píng)論文本包含使用體驗(yàn)、功能需求、錯(cuò)誤反饋和優(yōu)化建議等信息,而部分語(yǔ)氣溫和的評(píng)論則缺少具體的評(píng)價(jià)特征點(diǎn),具體的問題和優(yōu)勢(shì)指向都不明確。也就是說,適度表達(dá)情感極性的用戶評(píng)論更有助于運(yùn)營(yíng)者發(fā)現(xiàn)問題。政務(wù)服務(wù)的開發(fā)運(yùn)營(yíng)者應(yīng)該包容這種情緒的存在,積極挖掘和吸納用戶建設(shè)性的意見建議。
其次,研究發(fā)現(xiàn)用戶評(píng)論的信息來源質(zhì)量表現(xiàn)出一定差異(如表4)。本文構(gòu)建了政務(wù)App用戶評(píng)論信息來源質(zhì)量評(píng)價(jià)模型,在滲透性、活躍度、客觀性、極端性、有用性和可持續(xù)性六個(gè)維度進(jìn)行了數(shù)據(jù)比較分析。結(jié)果顯示,iOS 平臺(tái)的活躍性表現(xiàn)極好,在客觀性、極端性、有用性、可持續(xù)性上表現(xiàn)最好,但是其滲透性還比較低,用戶群的覆蓋面還不足。這表明iOS 平臺(tái)上的評(píng)分評(píng)論數(shù)據(jù)有用、管用且易用,但是iOS平臺(tái)的用戶群代表性略顯不足。
表4 各平臺(tái)在政務(wù)App評(píng)論可靠性維度的表現(xiàn)
華為平臺(tái)在滲透性、客觀性、極端性上表現(xiàn)較好,在有用性上表現(xiàn)適中,但是華為平臺(tái)的活躍性與可持續(xù)性不足(與應(yīng)用商店刪除評(píng)分評(píng)論有關(guān))。這表明其評(píng)分評(píng)論數(shù)據(jù)客觀、有用,需要達(dá)到一定規(guī)模才能發(fā)揮作用。但是,其對(duì)評(píng)分評(píng)論的管控機(jī)制又限制了其長(zhǎng)效發(fā)展。
小米平臺(tái)的總體評(píng)分偏高,因其只有“好評(píng)”和“差評(píng)”的打分機(jī)制使得其客觀性減弱,也使得最低分和最高分并存??傮w來看,小米平臺(tái)在滲透性、可持續(xù)性方面表現(xiàn)還不足,活躍性、客觀性、有用性表現(xiàn)中規(guī)中矩。
VIVO和OPPO平臺(tái)在極端性方面表現(xiàn)突出,表明用戶群希望通過極端表達(dá)引發(fā)關(guān)注。但是,二者在滲透性、活躍性、客觀性、有用性等方面表現(xiàn)較差,說明評(píng)分和評(píng)論數(shù)據(jù)很難說明真實(shí)問題。最后,VIVO平臺(tái)相較于OPPO平臺(tái)在可持續(xù)性方面表現(xiàn)較好。
我們認(rèn)為,不同手機(jī)平臺(tái)的表現(xiàn)可能與用戶群有關(guān)。Bertrand 的研究發(fā)現(xiàn),iPhone 是最常見的財(cái)富象征,“擁有一部iPhone”給了研究者68.1%的概率可以正確地推斷其擁有者屬于“高收入”群體。[44]然而,國(guó)內(nèi)第三方數(shù)據(jù)服務(wù)平臺(tái)Mob Data 發(fā)布的《2018 年第三季度中國(guó)智能手機(jī)市場(chǎng)調(diào)研報(bào)告》顯示,一部分iPhone用戶的月收入低于3000元;華為手機(jī)的用戶群收入較高,以中老年用戶為主;小米手機(jī)用戶群主要是中產(chǎn)階層和年輕群體,OP?PO和VIVO的用戶畫像偏重更為年輕群體。[45]
iPhone 群體受到手機(jī)開放生態(tài)和應(yīng)用習(xí)慣的影響,更愿意發(fā)表自己的觀點(diǎn)。但是,受價(jià)格、經(jīng)濟(jì)貿(mào)易等多重因素的影響,iPhone 在用戶普及率和滲透性方面很難有大的提升;華為手機(jī)用戶由于年齡、工作以及應(yīng)用習(xí)慣等影響,較多默默接受和使用,而不善于去發(fā)表自己的意見建議。小米、VI?VO、OPPO 等年輕群體相對(duì)活躍,但是表達(dá)的客觀性和有用性還有待提高。因此,從政務(wù)App服務(wù)質(zhì)量評(píng)價(jià)的角度來看,iOS 平臺(tái)的評(píng)分?jǐn)?shù)據(jù)更具客觀性,可以考慮引入,或者引入政務(wù)App 總評(píng)分作為評(píng)價(jià)服務(wù)情況的一個(gè)側(cè)面;從用戶評(píng)論挖掘的角度來看,在對(duì)政務(wù)APP 進(jìn)行評(píng)價(jià)時(shí)應(yīng)重點(diǎn)挖掘iOS 平臺(tái)和華為平臺(tái)的用戶評(píng)論,同時(shí)兼顧考察其他平臺(tái)上的用戶反饋。
最后,研究發(fā)現(xiàn)政務(wù)App可得性問題是影響用戶評(píng)論的重要因素。用戶要使用App,首先要順暢便捷地登錄到App中,但是研究發(fā)現(xiàn)大量用戶評(píng)論指向了登錄問題,特別是在1 星評(píng)論中“注冊(cè)”“認(rèn)證”“登錄”等成為高頻詞,而評(píng)論原內(nèi)容顯示“注冊(cè)不上”“認(rèn)證通不過”“人臉識(shí)別沒用”等是反饋較多的問題。
政務(wù)App可得性是首先應(yīng)該得到保證,也是較容易得到保證的。但是,總體來說省級(jí)政務(wù)App可得性做得還不夠,這可能涉及運(yùn)營(yíng)者的測(cè)試范圍、測(cè)試機(jī)型、測(cè)試網(wǎng)絡(luò)等局限。規(guī)模以上的用戶群提供了天然的測(cè)試環(huán)境,用戶在政務(wù)App評(píng)論中提出的這些訴求是App改進(jìn)和完善的方向。但是,部分App 并沒有很好吸納用戶反饋,即使經(jīng)過了長(zhǎng)時(shí)間的迭代更新,問題依然沒有徹底解決。
從組織角度出發(fā),政務(wù)App可得性還有一個(gè)推廣問題,而這是公共部門不太擅長(zhǎng)的事情。1 星評(píng)論中大量出現(xiàn)“推廣”“強(qiáng)制”等高頻詞,說明App管理運(yùn)營(yíng)與公眾間存在認(rèn)知偏差,強(qiáng)制使用的做法拉開了公眾與政府間的距離。公眾認(rèn)為好的政務(wù)App 不需要推廣,這也賦予了政務(wù)App“不好用”的刻板印象。但是,App 運(yùn)營(yíng)者重視用戶評(píng)論就容易得到用戶的肯定?!霸粕腺F州多彩寶”對(duì)iOS 平臺(tái)上的負(fù)面評(píng)論(1 星)進(jìn)行了“開發(fā)者回復(fù)”,開發(fā)者回復(fù)會(huì)發(fā)送到用戶的郵箱。這種一對(duì)一的跟蹤回復(fù),是把用戶的感受和評(píng)價(jià)擺在至關(guān)重要的位置,也必然提升用戶對(duì)于政務(wù)App的好感和滿意度。
本文還存在一些不足,未來研究需要予以深化和發(fā)展。首先,我們構(gòu)建了用戶評(píng)論信息來源質(zhì)量的評(píng)價(jià)維度,這些維度僅是從能夠抓取到的用戶評(píng)分、評(píng)價(jià)、下載量角度,是否就能夠全面刻畫App用戶評(píng)論的質(zhì)量,能否用于App 服務(wù)績(jī)效的評(píng)價(jià),甚至輔助“好差評(píng)”制度的實(shí)踐,還需要深入研究和探討。其次,我們對(duì)采集到的政務(wù)App評(píng)價(jià)數(shù)據(jù)進(jìn)行了初步的描述性統(tǒng)計(jì),但是還缺乏深度利用。比如,利用一段時(shí)間的用戶評(píng)論數(shù)據(jù)去探求用戶評(píng)論與軟件版本升級(jí)之間有沒有關(guān)系,或者對(duì)用戶評(píng)論數(shù)據(jù)進(jìn)行挖掘,分析滿意和不滿意背后的因素,發(fā)現(xiàn)究竟哪些因素真正能提升政務(wù)App 績(jī)效,等等。最后,我們構(gòu)建了政務(wù)App 總評(píng)分的計(jì)算方法,目前是將用戶滲透率作為系數(shù),與政務(wù)App評(píng)分加權(quán)而得。本研究發(fā)現(xiàn),五個(gè)平臺(tái)的可靠性是有區(qū)別的,僅僅用滲透率作為加權(quán)系數(shù)是否科學(xué),是不是可以考慮適當(dāng)提高iOS 和華為平臺(tái)的權(quán)重,適當(dāng)降低其他平臺(tái)的權(quán)重,這些問題都需要在未來進(jìn)一步探索。