趙蒨 毛通 王佳華
摘 要:公眾對社會信用體系建設的關注程度是公眾信用意識最直觀有效的體現。本文依托百度指數和互聯網大數據手段,以301個社會信用熱點關鍵詞為統計依據,以浙江省11個地市為實證研究對象,通過對2014-2020年間浙江網民2.34億次網絡搜索行為特征的分析對比,動態(tài)刻畫公眾對社會信用體系建設網絡關注度的時空變化規(guī)律。
關鍵詞:誠信建設;網絡關注度;百度指數
中圖分類號:F27 文獻標識碼:A doi:10.19311/j.cnki.1672-3198.2021.30.016
1 引言與文獻評述
2014年,國務院印發(fā)《社會信用體系建設規(guī)劃綱要(2014—2020年)》(下簡稱“綱要”),正式明確我國社會信用體系建設的頂層設計架構,并全面啟動長達7年的社會信用體系建設周期。2021年,我們再次站在了新一輪建設的起點,面向國家提出的高質量社會信用體系建設新目標,有必要對上一輪建設進行科學評估,以更好的規(guī)劃未來。
目前,從整體社會信用環(huán)境評價,到社會信用體系建設評價,到政務、商務、社會和司法等重點領域誠信評價,以及政府、企業(yè)、個人等重點主體誠信評價,應該說,學術界關于社會信用評價的研究成果已經十分豐富。但對文獻梳理來看,從社會公眾的角度,關于社會信用體系建設關注度的評價方法研究和實證分析并不多。公眾對社會信用體系建設的關注程度是公眾信用意識最直觀有效的體現,提高公眾誠信意識和全社會信用水平是社會信用體系建設的重要內容和重要目標。如何客觀評估公眾對社會信用體系建設的關注度,據此反映我國社會信用體系建設的成效和不足,成為研究的當務之急。
網絡行為數據是公眾對事務關注度、認知程度和意見態(tài)度的一種體現。運用基于需求搜索數據對公共關注度進行測量的相關研究已取得不少成果。例如,Ginsberg等人(2009) 提出利用谷歌搜索數據開展流行病預測,Ripberge等人(2011)運用與流行病學相關的谷歌詞匯搜索數據追蹤傳染病的擴散。國內也有不少學者運用百度指數用于經濟問題和社會熱點議題的趨勢預測與時空分析。例如,孟天廣、趙娟(2019)基于百度搜索數據采集了2011-2017年26個政策議題的 2 億余條關鍵詞指數,對公眾的搜索行為與公共(政策)關注度進行研究。毛通、謝朝德(2019,2020)等人基于百度搜索指數,運用信用關聯關鍵詞來編制信用輿情指數、信用治理滿意度指數,來動態(tài)跟蹤評估網絡公眾的社會信用輿情變化態(tài)勢。
文章正是在上述相關研究成果基礎上,進一步提出運用互聯網大數據,通過分析網絡公眾對社會信用體系建設相關的重大問題、熱點話題的網絡檢索、評論、轉發(fā)、點評、關注等網絡行為,達到公眾網絡關注度評估的目的。文章的主要創(chuàng)新點在于依托百度指數和互聯網大數據手段,以301個社會信用熱點關鍵詞為統計依據,以浙江省11個地市為實證研究對象,通過對2014-2020年間各領域各地區(qū)網民網絡行為特征的縱向和橫向比較,從而較為客觀真實的還原公眾對社會信用體系建設網絡關注度的時空變化規(guī)律。
2 基于百度搜索指數的誠信建設網絡關注度度量原理
百度搜索指數是一種以網民在百度的搜索量為數據基礎,以關鍵詞為統計對象,通過計算出各個關鍵詞在百度網頁搜索中搜索頻次的加權,用以分析互聯網用戶對鍵詞搜索關注程度及持續(xù)變化情況的工具。文章以《綱要》為誠信建設關鍵詞的基礎語料庫,圍繞誠信建設的重點領域和重點人群,從政務、司法、生產、流通、金融、互聯網金融、電商、稅務、價格、交通運輸、醫(yī)療衛(wèi)生、社會保障、勞動用工、教育科研、節(jié)能環(huán)保、知識產權、互聯網、旅游18個領域,公職人員、社會公眾和從業(yè)人員3類群體,初選誠信核心關鍵詞,然后以其為基礎,通過百度指數需求圖譜關鍵詞推薦功能,關聯出與核心關鍵詞存在高度相關性且搜索熱度最高的關聯關鍵詞,剔除掉搜索熱度低、關聯度不達標的關鍵詞。然后運用爬蟲軟件在百度指數中爬取每個關鍵詞PC端和移動端的日搜索值,加總得到年搜索指數。通過將上述關鍵詞搜索指數按照領域分類,得到不同領域、不同時間、不同地區(qū)的分類搜索指數,最后將全部關鍵詞加總得到搜索總指數,并以此作為評估各地誠信建設網絡關注度的依據。
3 浙江省2014-2020年誠信建設網絡關注度測算結果
3.1 數據說明
文章最終甄選了301個誠信建設關鍵詞,以浙江省為實證研究對象,通過浙江省11個地市2014-2020年間當地網民在百度搜索引擎中對全部誠信建設關鍵詞的搜索量分析,對浙江及11個地市誠信建設網絡關注度的動態(tài)變化過程進行分析,實證數據采集詳細流程圖如圖1所示。
3.2 關鍵詞統計
對關鍵詞統計結果看,2014—2020年間,浙江省網民通過PC和移動端在百度搜索引擎中對301個關鍵詞的總搜索量為2.34億頻次,日均9.14萬頻次,七年間平均每個詞搜索77.24萬頻次,其中最多一個關鍵詞搜索量達669.38萬頻次,最小一個關鍵詞搜索量為0.96萬頻次。
4 浙江省2014-2020年誠信建設網絡關注度實證分析
4.1 搜索總指數趨勢分析
從對浙江省2014-2020年間全部301個關鍵詞百度搜索總指數統計結果分析來看(見圖2):2014-2018年搜索總量呈逐年上升趨勢,2018年達到峰值,2019年和2020年呈下降趨勢。從中可以看出,網民對誠信建設網絡關注度顯著高于建設初期的2014年。至于2019年和2020年搜索總指數下降的原因,文章認為有兩個可能性:第一,社會信用體系建設已經從快速發(fā)展期進入成熟期,公眾早期基于認知需求的網絡搜索行為態(tài)度和偏好開始發(fā)生轉變;第二,受到短期干擾因素的影響,例如“問題疫苗”“集資詐騙”“債務違約”“學歷造假”“陰陽合同”等事件型關鍵詞的短期波動,此外,2020年疫情對經濟活躍度的干擾。上述兩點中文章更傾向于前者是主因。