程冬玲 聶燕敏 韓素芬
摘? ?要:《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》是鞏固當(dāng)前脫貧攻堅(jiān)站的重要指導(dǎo)綱要,脫貧大數(shù)據(jù)的建立是進(jìn)一步提升脫貧成效的基礎(chǔ)和前提,但依靠傳統(tǒng)的問(wèn)卷調(diào)研和深度訪談等形式獲得的數(shù)據(jù)可靠性略低,可能會(huì)導(dǎo)致基于調(diào)研數(shù)據(jù)的分析結(jié)果失真。因此,文章通過(guò)對(duì)貧困人口的行為痕跡數(shù)據(jù)進(jìn)行搜集、整理、分析,形成貧困對(duì)象大數(shù)據(jù)畫(huà)像,為提升脫貧成效提供數(shù)據(jù)支撐。
關(guān)鍵詞:大數(shù)據(jù);精準(zhǔn)扶貧;用戶畫(huà)像
隨著信息化水平的提高和大數(shù)據(jù)技術(shù)的發(fā)展,大數(shù)據(jù)在精準(zhǔn)扶貧領(lǐng)域的作用越來(lái)越凸顯,通過(guò)數(shù)據(jù)分析可有效辨別是否貧困以及貧困原因,從而進(jìn)行精準(zhǔn)扶貧,鞏固和提升扶貧成果。傳統(tǒng)數(shù)據(jù)收集是通過(guò)問(wèn)卷調(diào)查和走訪等形式完成的,在調(diào)查和走訪貧困人口過(guò)程中,走訪對(duì)象因自身利益可能會(huì)表述不真實(shí)的數(shù)據(jù),導(dǎo)致基礎(chǔ)數(shù)據(jù)失真,進(jìn)而影響后續(xù)數(shù)據(jù)分析的準(zhǔn)確性。另外,走訪和問(wèn)卷調(diào)查方式需要大量的人力,工作量大、任務(wù)繁重且易出錯(cuò),所形成的數(shù)據(jù)不足以構(gòu)成事實(shí)上的大數(shù)據(jù),導(dǎo)致數(shù)據(jù)分析結(jié)果不完備[1]。
當(dāng)前,數(shù)字化已經(jīng)深入到每個(gè)人的社會(huì)生活中,任何社會(huì)行為都會(huì)產(chǎn)生數(shù)字痕跡。因此,可利用網(wǎng)絡(luò)技術(shù)獲取貧困人口的實(shí)時(shí)行為大數(shù)據(jù),建立高效、準(zhǔn)確、豐富的大數(shù)據(jù)樣本,進(jìn)而抽象出貧困對(duì)象的特征標(biāo)簽。用標(biāo)簽描繪出貧困對(duì)象的精準(zhǔn)“用戶畫(huà)像”,對(duì)比調(diào)研數(shù)據(jù),更加準(zhǔn)確地篩選出有效數(shù)據(jù),進(jìn)而進(jìn)行較完整的數(shù)據(jù)分析,為精準(zhǔn)扶貧、鞏固提升扶貧效果建立基礎(chǔ)[2]。
1? ? “用戶畫(huà)像”源數(shù)據(jù)采集
數(shù)據(jù)采集是大數(shù)據(jù)用戶畫(huà)像建立的第一步,數(shù)據(jù)質(zhì)量直接決定用戶畫(huà)像的精準(zhǔn)度。傳統(tǒng)的問(wèn)卷調(diào)查、走訪等數(shù)據(jù)收集方式雖存在弊端,但在數(shù)據(jù)收集過(guò)程中,收集人員可直接與貧困對(duì)象面對(duì)面的接觸,建立數(shù)據(jù)之外的信息,因此,這種方式是不可取代的。通過(guò)傳統(tǒng)方式也可獲得原始數(shù)據(jù),這些數(shù)據(jù)構(gòu)成靜態(tài)的數(shù)據(jù)信息,如姓名、年齡、住址等。在建立用戶畫(huà)像過(guò)程中,需對(duì)數(shù)據(jù)進(jìn)一步處理,生成用戶標(biāo)簽,如高齡、無(wú)固定居所等,描繪貧困對(duì)象的固有屬性?!坝脩舢?huà)像”建立示意如圖1所示。
只建立“用戶畫(huà)像”的固有屬性是不完備的,還需通過(guò)動(dòng)態(tài)數(shù)據(jù)的采集形成用戶的動(dòng)態(tài)屬性,如收入變化、住院情況等。動(dòng)態(tài)數(shù)據(jù)采集可通過(guò)網(wǎng)絡(luò)技術(shù)和系統(tǒng)接口調(diào)用等方式實(shí)現(xiàn),如建立與醫(yī)保系統(tǒng)的數(shù)據(jù)接口,獲取對(duì)象的住院信息,了解其實(shí)際醫(yī)療的支出情況;與租房或售房系統(tǒng)進(jìn)行對(duì)接,掌握對(duì)象的房屋信息;有條件的情況下,與金融消費(fèi)系統(tǒng)對(duì)接,了解收入和支出的情況[3]。
2? ? “用戶畫(huà)像”標(biāo)簽生成
通過(guò)源數(shù)據(jù)采集獲得的數(shù)據(jù)并不能直接進(jìn)行分析處理,存在一些冗余度較高、包含大量非結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù)、不同系統(tǒng)獲取的數(shù)據(jù)不一致等問(wèn)題,進(jìn)一步進(jìn)行去冗降噪、結(jié)構(gòu)轉(zhuǎn)化、數(shù)據(jù)比對(duì)、數(shù)據(jù)清洗后方可使用。處理后的數(shù)據(jù)相對(duì)準(zhǔn)確,大部分貧困信息系統(tǒng)、數(shù)據(jù)庫(kù)等開(kāi)發(fā)到此階段就基本結(jié)束,但實(shí)際上這些數(shù)據(jù)還不能為扶貧人員提供貧困對(duì)象更富有語(yǔ)義的信息。所以,需在數(shù)據(jù)之上進(jìn)行挖掘,生成用戶標(biāo)簽,為建立貧困對(duì)象精準(zhǔn)的“用戶畫(huà)像”做準(zhǔn)備[4]。
建立用戶標(biāo)簽就是從用戶數(shù)據(jù)信息中,抽取出高度精煉、能準(zhǔn)確概括用戶某種明顯特征或?qū)傩缘臉?biāo)簽,標(biāo)簽可更便捷的被計(jì)算機(jī)識(shí)別、處理,是“用戶畫(huà)像”最直接的構(gòu)成要素。用戶標(biāo)簽需具備兩要素:一是語(yǔ)義化,工作人員能快速理解每個(gè)標(biāo)簽含義;二是簡(jiǎn)潔凝練,每個(gè)標(biāo)簽只能表達(dá)一種含義,不能有歧義,這樣建立的“用戶畫(huà)像”才能精準(zhǔn)。
標(biāo)簽的建立需大量扶貧工作人員的參與,初始建立的標(biāo)簽通過(guò)工作人員交流溝通,在咨詢相關(guān)專家后人工生成。隨著數(shù)據(jù)量的增加,標(biāo)簽的樣本庫(kù)會(huì)越來(lái)越豐富,通過(guò)對(duì)數(shù)據(jù)聚類分析可實(shí)現(xiàn)標(biāo)簽自動(dòng)生成。初始自動(dòng)生成的標(biāo)簽可能存在誤差,可不斷抽取高頻標(biāo)簽,對(duì)標(biāo)簽樣本進(jìn)行糾錯(cuò)調(diào)整,使標(biāo)簽生成算法越來(lái)越準(zhǔn)確。
3? ? 基于“用戶畫(huà)像”精準(zhǔn)扶貧作用
基于大數(shù)據(jù)建立的扶貧對(duì)象“用戶畫(huà)像”為工作人員提供了更加精煉、具有豐富語(yǔ)義的貧困人口信息,可在掌握貧困對(duì)象靜態(tài)信息的基礎(chǔ)上,了解對(duì)象動(dòng)態(tài)信息的變化,達(dá)到精準(zhǔn)扶貧、對(duì)口幫扶、鞏固扶貧、提質(zhì)增速的良好扶貧效果,具體如下:
(1)識(shí)別虛假信息,掌握貧困動(dòng)態(tài)。通過(guò)調(diào)查走訪等形式采集的數(shù)據(jù)因個(gè)人利益原因,導(dǎo)致數(shù)據(jù)不準(zhǔn)確,甚至可能出現(xiàn)弄虛作假的情況。在建立貧困人口大數(shù)據(jù)“用戶畫(huà)像”的過(guò)程中,不僅對(duì)靜態(tài)數(shù)據(jù)進(jìn)行整理、分析,還需采集其他系統(tǒng)中相關(guān)人員的動(dòng)態(tài)數(shù)據(jù)進(jìn)行比對(duì)、分析,讓虛假數(shù)據(jù)無(wú)處遁形,避免國(guó)家不必要的損失。對(duì)已建卡的貧困人口,通過(guò)動(dòng)態(tài)數(shù)據(jù)的分析,實(shí)時(shí)掌握貧困動(dòng)態(tài);對(duì)已脫貧的用戶,要及時(shí)停止相關(guān)補(bǔ)貼,把扶貧款用到更需要的人手里。另外,通過(guò)與其他系統(tǒng)對(duì)接,把因病致貧、因教育致貧等新增貧困對(duì)象及時(shí)納入到貧困大數(shù)據(jù)系統(tǒng)中,實(shí)現(xiàn)早期干預(yù)、精準(zhǔn)扶貧,避免其陷入長(zhǎng)期貧困。
(2)區(qū)分貧困類型,實(shí)現(xiàn)精準(zhǔn)扶貧。建立貧困人口大數(shù)據(jù)“用戶畫(huà)像”的最大優(yōu)勢(shì)是實(shí)現(xiàn)了貧困對(duì)象的精準(zhǔn)信息化的描述。傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)建立的貧困人口信息系統(tǒng)所采用的貧困分類方式比較粗糙,只能提供基本的用戶信息,大量實(shí)際情況的信息一般由工作人員自己掌握,無(wú)法實(shí)現(xiàn)大數(shù)據(jù)的分析處理,也不利于工作交接。而建立了貧困對(duì)象“用戶畫(huà)像”后,計(jì)算機(jī)處理的信息維度更廣、分類更細(xì)且富有語(yǔ)義,可充分發(fā)揮大數(shù)據(jù)在數(shù)據(jù)分析上的優(yōu)勢(shì),為扶貧人員提供更加精準(zhǔn)的幫扶信息和幫扶建議,實(shí)現(xiàn)基于“用戶畫(huà)像”因人而異的精準(zhǔn)扶貧。另外,建立全省或全國(guó)的貧困大數(shù)據(jù)“用戶畫(huà)像”,使工作人員能通過(guò)“用戶畫(huà)像”快速掌握貧困人口情況,有效提高扶貧工作效率。
(3)鞏固脫貧成效,提升扶貧質(zhì)量。鞏固脫貧成效是脫貧攻堅(jiān)戰(zhàn)的重要內(nèi)容,對(duì)已實(shí)現(xiàn)脫貧對(duì)象、已建立的大數(shù)據(jù)標(biāo)簽進(jìn)行調(diào)整,對(duì)應(yīng)的“用戶畫(huà)像”由算法調(diào)整后重新生成,相關(guān)政策也應(yīng)有一定的延續(xù)性。在大數(shù)據(jù)系統(tǒng)內(nèi)建立長(zhǎng)期的動(dòng)態(tài)跟蹤機(jī)制,防止其再次返貧,保障脫貧工作的穩(wěn)定性。
在提高脫貧工作穩(wěn)定性的基礎(chǔ)上應(yīng)進(jìn)一步提高脫貧質(zhì)量,脫貧不僅是經(jīng)濟(jì)上的脫貧,更是觀念、思想的脫貧,讓脫貧對(duì)象能更有尊嚴(yán)、更幸福的生活才是根本目標(biāo)。通過(guò)基于“用戶畫(huà)像”建立的貧困對(duì)象大數(shù)據(jù)分析,在服務(wù)精準(zhǔn)經(jīng)濟(jì)扶貧的同時(shí),服務(wù)教育扶貧、思想扶貧,向貧困人口推薦有意義的方針政策,宣傳教育意義,讓貧困人口脫貧后真正的擁有幸福感、獲得感。
4? ? 結(jié)語(yǔ)
本文提出一種建立貧困人口大數(shù)據(jù)“用戶畫(huà)像”的方法,數(shù)據(jù)源獲取的方式在原有傳統(tǒng)數(shù)據(jù)收集的靜態(tài)數(shù)據(jù)之外,提出通過(guò)網(wǎng)絡(luò)技術(shù)、系統(tǒng)對(duì)接等方法獲取貧困人口的動(dòng)態(tài)數(shù)據(jù),對(duì)數(shù)據(jù)源進(jìn)行預(yù)處理的基礎(chǔ)上生成用戶標(biāo)簽,進(jìn)而實(shí)現(xiàn)對(duì)貧困對(duì)象“用戶畫(huà)像”的描繪。
“用戶畫(huà)像”的建立可幫助扶貧工作人員去偽存真,實(shí)時(shí)掌握貧困動(dòng)態(tài)信息,建立更加細(xì)致的貧困人員分類情況,進(jìn)行精準(zhǔn)扶貧,鞏固扶貧成果,為進(jìn)一步提升扶貧成效完成國(guó)家扶貧攻堅(jiān)工作提供數(shù)據(jù)支撐。
[參考文獻(xiàn)]
[1]莫光輝,張玉雪.大數(shù)據(jù)背景下的精準(zhǔn)扶貧模式創(chuàng)新路徑—精準(zhǔn)扶貧績(jī)效提升機(jī)制系列研究之十[J].理論與改革,2017(1):119-124.
[2]呂元媛,蔣春花.大數(shù)據(jù)支持下的精準(zhǔn)扶貧路徑選擇與模式創(chuàng)新[J].經(jīng)濟(jì)研究導(dǎo)刊,2017(29):32-33.
[3]劉海鷗,劉旭,姚蘇梅,等.基于大數(shù)據(jù)深度畫(huà)像的個(gè)性化學(xué)習(xí)精準(zhǔn)服務(wù)研究[J].圖書(shū)館學(xué)研究,2019(15):68-74.
[4]葛曉鳴.基于“用戶畫(huà)像”模型構(gòu)建的精準(zhǔn)營(yíng)銷策略[J].遼東學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版),2019(4):50-57.