李望月 劉瑾等
隨著國家大數(shù)據(jù)戰(zhàn)略的實施推進(jìn),大數(shù)據(jù)技術(shù)蓬勃發(fā)展,正加速成為發(fā)現(xiàn)新知識、創(chuàng)造新價值的新一代生產(chǎn)力,其應(yīng)用已滲入經(jīng)濟(jì)社會的各個微觀單元,并逐漸成為各行各業(yè)尋求突破、創(chuàng)新發(fā)展的關(guān)鍵力量。
大數(shù)據(jù)技術(shù)同樣已經(jīng)滲入鄉(xiāng)村發(fā)展的某些領(lǐng)域,其中,應(yīng)用比較廣泛的是農(nóng)業(yè)領(lǐng)域。通過對氣候、土壤、農(nóng)作物基因庫、農(nóng)業(yè)傳感器返回的數(shù)據(jù)等農(nóng)業(yè)大數(shù)據(jù)進(jìn)行挖掘、分析發(fā)現(xiàn),大數(shù)據(jù)技術(shù)在推動精準(zhǔn)農(nóng)業(yè)實施建設(shè)方面做出了重要貢獻(xiàn),在農(nóng)業(yè)產(chǎn)量預(yù)測、農(nóng)業(yè)自然災(zāi)害的監(jiān)測預(yù)警、農(nóng)產(chǎn)品價格預(yù)測、農(nóng)產(chǎn)品營銷等方面的應(yīng)用也取得了良好的效果。但到目前為止,無論是理論層面,還是實踐層面,尚未有文獻(xiàn)對大數(shù)據(jù)技術(shù)在鄉(xiāng)村層面的系統(tǒng)性應(yīng)用進(jìn)行研究。
鄉(xiāng)村大數(shù)據(jù)源
鄉(xiāng)村大數(shù)據(jù)源是大數(shù)據(jù)技術(shù)開展鄉(xiāng)村畫像的基礎(chǔ)。在對現(xiàn)有文獻(xiàn)進(jìn)行檢索研究時,并未發(fā)現(xiàn)有關(guān)“鄉(xiāng)村大數(shù)據(jù)”“農(nóng)村大數(shù)據(jù)”的研究,但近兩年關(guān)于“農(nóng)業(yè)大數(shù)據(jù)”的研究逐漸增加,有學(xué)者從數(shù)據(jù)來源上梳理了國內(nèi)外在農(nóng)業(yè)科技活動中長期積累和整編的海量科學(xué)數(shù)據(jù),即農(nóng)業(yè)科學(xué)大數(shù)據(jù),通過對其列出的數(shù)據(jù)源進(jìn)行梳理發(fā)現(xiàn),數(shù)量上匯集了12個國外數(shù)據(jù)源和30個國內(nèi)數(shù)據(jù)源(包括6個地方政府門戶開放數(shù)據(jù)),內(nèi)容上大致可分為4類:自然條件與資源數(shù)據(jù),如氣象數(shù)據(jù)、地質(zhì)數(shù)據(jù)、再生資源數(shù)據(jù)、空間數(shù)據(jù)等;農(nóng)業(yè)經(jīng)濟(jì)數(shù)據(jù),如宏觀農(nóng)業(yè)數(shù)據(jù)、生態(tài)農(nóng)業(yè)、中國飼料數(shù)據(jù)庫等;生命科學(xué)數(shù)據(jù),如生物信息數(shù)據(jù)、細(xì)胞數(shù)據(jù)、微生物病毒數(shù)據(jù)、基因數(shù)據(jù)等;農(nóng)業(yè)行政機(jī)構(gòu)數(shù)據(jù),主要來自于政府部門開放門戶。
也有學(xué)者從農(nóng)業(yè)大數(shù)據(jù)產(chǎn)生的角度,提出了農(nóng)業(yè)物聯(lián)網(wǎng)數(shù)據(jù)、農(nóng)業(yè)遙感和農(nóng)業(yè)無人機(jī)數(shù)據(jù)、農(nóng)業(yè)網(wǎng)絡(luò)數(shù)據(jù)、科研及農(nóng)戶生產(chǎn)經(jīng)驗數(shù)據(jù)4類農(nóng)業(yè)大數(shù)據(jù),設(shè)計了農(nóng)業(yè)大數(shù)據(jù)平臺整體架構(gòu),并對農(nóng)業(yè)大數(shù)據(jù)的應(yīng)用方向進(jìn)行了論述。
農(nóng)業(yè)大數(shù)據(jù)是鄉(xiāng)村大數(shù)據(jù)的一部分。其中,省、市級別的鄉(xiāng)村數(shù)據(jù)可在《中國農(nóng)村統(tǒng)計年鑒》《中國農(nóng)業(yè)機(jī)械工業(yè)年鑒》《中國環(huán)境統(tǒng)計年鑒》等公開年鑒中獲取,而微觀數(shù)據(jù)由各部門保存,一般不對外公開,外部組織機(jī)構(gòu)也無法通過網(wǎng)絡(luò)爬取獲得。在國家或地方各部門擁有的鄉(xiāng)村數(shù)據(jù)中,以農(nóng)業(yè)普查數(shù)據(jù)中包含的農(nóng)村信息最為全面,普查表中的行政村綜合表和鄉(xiāng)鎮(zhèn)綜合表囊括了鄉(xiāng)村基本信息和特征信息;普查表中的農(nóng)戶基層表包括了村內(nèi)農(nóng)戶生活、生產(chǎn)經(jīng)營活動的方方面面,進(jìn)一步豐富了鄉(xiāng)村數(shù)據(jù)。農(nóng)業(yè)普查數(shù)據(jù)可提供全面的鄉(xiāng)村數(shù)據(jù)信息,局限性為每十年開展一次,最近一次是2016年開展的第三次全國農(nóng)業(yè)普查。但隨著近兩年地方鄉(xiāng)村振興戰(zhàn)略統(tǒng)計工作的開展,鄉(xiāng)村振興戰(zhàn)略統(tǒng)計的調(diào)查指標(biāo)與普查指標(biāo)具有較高的相似度,可對相同的指標(biāo)進(jìn)行不同年度的連續(xù)分析。除農(nóng)業(yè)普查數(shù)據(jù)外,鄉(xiāng)村層面還存在著數(shù)量可觀的非傳統(tǒng)數(shù)據(jù)。
大數(shù)據(jù)畫像技術(shù)
大數(shù)據(jù)畫像技術(shù)是大數(shù)據(jù)鄉(xiāng)村畫像的核心技術(shù)手段。大數(shù)據(jù)畫像的概念來源于用戶畫像,用戶畫像的英文概念“user persona”最早由艾倫·庫珀提出,其認(rèn)為user persona是真實用戶的虛擬代表,根據(jù)用戶行為、動機(jī)等將用戶分為不同的類型,從中抽取每類用戶的社會屬性、生活習(xí)慣、消費行為和興趣偏好等信息的共同特征,并設(shè)定名字、照片、場景等要素對其進(jìn)行描述。
用戶畫像又稱為人群畫像,是根據(jù)用戶信息抽象出的一個標(biāo)簽化的用戶模型,即用高度精練的特征描述一類人,例如年齡、性別、職業(yè)、興趣偏好等。
大數(shù)據(jù)畫像技術(shù)是用戶畫像在大數(shù)據(jù)環(huán)境下的延伸和發(fā)展,是基于大量傳統(tǒng)數(shù)據(jù)和非傳統(tǒng)數(shù)據(jù)、靜態(tài)數(shù)據(jù)和動態(tài)數(shù)據(jù)、結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),使用統(tǒng)計分析、機(jī)器學(xué)習(xí)和人工智能等算法,構(gòu)建模型、挖掘數(shù)據(jù)、提取特征并進(jìn)行動態(tài)可視化展示的一門數(shù)據(jù)分析與展示技術(shù)。
在中國知網(wǎng)文獻(xiàn)數(shù)據(jù)庫中,以“大數(shù)據(jù)畫像”“鄉(xiāng)村畫像”“畫像”等關(guān)鍵詞進(jìn)行檢索,對現(xiàn)有文獻(xiàn)從畫像對象、畫像技術(shù)方法兩個方面進(jìn)行歸納總結(jié)。從畫像對象來看,當(dāng)前文獻(xiàn)庫中可檢索到以“用戶畫像”“產(chǎn)品畫像”“企業(yè)畫像”“城市畫像”為標(biāo)題的研究,其中,“用戶畫像”作為畫像技術(shù)的初始應(yīng)用領(lǐng)域,研究的文獻(xiàn)最多,應(yīng)用也最為廣泛,尤其是在互聯(lián)網(wǎng)電商等,主要的大數(shù)據(jù)關(guān)聯(lián)規(guī)則方法有APRORI算法、FPGrowth關(guān)聯(lián)規(guī)則算法,這些方法主要應(yīng)用于電商、金融等行業(yè)的用戶畫像。雖然當(dāng)前關(guān)于特征值提取的方法很多,但是特征值挖掘和提取的準(zhǔn)確性仍是要持續(xù)攻克的難點。
鄉(xiāng)村振興領(lǐng)域研究
鄉(xiāng)村振興領(lǐng)域的熱點、重點及難點問題是大數(shù)據(jù)鄉(xiāng)村畫像的重要應(yīng)用方向。學(xué)術(shù)界關(guān)于鄉(xiāng)村振興領(lǐng)域研究的熱點、重點及難點問題的研究大多圍繞著鄉(xiāng)村振興發(fā)展而開展,或是聚焦鄉(xiāng)村振興發(fā)展的產(chǎn)業(yè)興旺、生態(tài)宜居、鄉(xiāng)村文明、治理有效、生活富裕5個維度整體,或是聚焦某一個局部展開研究。
通過對鄉(xiāng)村領(lǐng)域相關(guān)文獻(xiàn)進(jìn)行研究和分析,可以總結(jié)為:鄉(xiāng)村振興領(lǐng)域研究的熱點是鄉(xiāng)村振興實施效果評價,文獻(xiàn)以鄉(xiāng)村振興評價指標(biāo)體系構(gòu)建為主,部分文獻(xiàn)選取對象進(jìn)行實證分析;鄉(xiāng)村振興領(lǐng)域研究的重點是鄉(xiāng)村振興實施路徑,當(dāng)前文獻(xiàn)大多對鄉(xiāng)村振興的某一方面進(jìn)行重點研究,從問題導(dǎo)向給出鄉(xiāng)村振興的實施路徑;鄉(xiāng)村振興領(lǐng)域研究的難點是鄉(xiāng)村振興差異化的前期規(guī)劃,如黃祖輝提出要從區(qū)域新型城鎮(zhèn)化戰(zhàn)略和鄉(xiāng)村差異化發(fā)展的實際出發(fā),落實鄉(xiāng)村振興戰(zhàn)略。其中,除鄉(xiāng)村振興的實施效果可以進(jìn)行定量分析外,其他研究大多為定性分析。
大數(shù)據(jù)鄉(xiāng)村畫像系統(tǒng)的成果可以為鄉(xiāng)村振興領(lǐng)域熱點、重點及難點問題的研究提供科學(xué)有力的支撐,在實際應(yīng)用過程中,大數(shù)據(jù)鄉(xiāng)村畫像系統(tǒng)主要有三大作用。第一,充分了解鄉(xiāng)村全貌。傳統(tǒng)的鄉(xiāng)村發(fā)展評價模型一般使用年鑒數(shù)據(jù)和調(diào)查數(shù)據(jù),對互聯(lián)網(wǎng)上大量可用數(shù)據(jù)的利用率不高,維度通常也局限于年鑒數(shù)據(jù)提供的信息,無法全面刻畫鄉(xiāng)村面貌。大數(shù)據(jù)鄉(xiāng)村畫像系統(tǒng)可以充分利用年鑒數(shù)據(jù)、政府網(wǎng)站公開數(shù)據(jù)等結(jié)構(gòu)化數(shù)據(jù),同時也可以利用地理位置信息、氣候信息、政策文件信息等非結(jié)構(gòu)化數(shù)據(jù),多維度、全方位、立體化地對鄉(xiāng)村發(fā)展情況進(jìn)行描述,幫助政府根據(jù)鄉(xiāng)村存在的現(xiàn)實問題,有針對性地制定政策。第二,尋找差異,為因地制宜發(fā)展鄉(xiāng)村振興提供理論支持。利用大數(shù)據(jù)鄉(xiāng)村畫像系統(tǒng),可以對省份層面、地市層面、縣域?qū)用?、鄉(xiāng)鎮(zhèn)層面以及行政村層面等各級行政區(qū)劃的鄉(xiāng)村振興發(fā)展情況進(jìn)行分析,應(yīng)用范圍廣泛。通過對比,可以發(fā)現(xiàn)研究主體的優(yōu)勢和劣勢,幫助當(dāng)?shù)卣虻刂埔?,開展“千村千面”個性化、特色化規(guī)劃,解決規(guī)劃的同質(zhì)性和落地難等問題。同時,大數(shù)據(jù)鄉(xiāng)村畫像系統(tǒng)可智能化匹配生產(chǎn)條件、自然條件或者社會條件相似的標(biāo)桿性鄉(xiāng)村,幫助落后鄉(xiāng)村找到適合當(dāng)?shù)氐泥l(xiāng)村振興發(fā)展路徑和實施路徑。第三,監(jiān)測鄉(xiāng)村振興政策實施效果。大數(shù)據(jù)鄉(xiāng)村畫像系統(tǒng)可以對鄉(xiāng)村振興發(fā)展情況進(jìn)行連續(xù)時間的監(jiān)測,通過對多年的數(shù)據(jù)和信息進(jìn)行對比,系統(tǒng)可使用標(biāo)簽對分析結(jié)果進(jìn)行展示,例如,某省份人均農(nóng)林牧漁產(chǎn)值連續(xù)5年增加,鄉(xiāng)村畫像標(biāo)簽可展示為“連續(xù)5年人均農(nóng)林牧漁產(chǎn)值增加”。
同時,大數(shù)據(jù)鄉(xiāng)村畫像系統(tǒng)也可設(shè)置預(yù)警機(jī)制,在指標(biāo)值出現(xiàn)異常波動或者下降趨勢時(針對正向指標(biāo)),發(fā)出預(yù)警信號,幫助政府部門及時做出應(yīng)對。