摘 要:本文利用深度學(xué)習(xí)算法DBN (Deep Belief Network)實(shí)現(xiàn)農(nóng)村電商跨平臺(tái)、多模態(tài)數(shù)據(jù)的有效融合;建立多源電商平臺(tái)的異構(gòu)數(shù)據(jù)的采集、整合、識(shí)別、清洗、特征提取、分類(lèi)和分析等信息處理過(guò)程;構(gòu)建農(nóng)村電商產(chǎn)品類(lèi)型、品牌、產(chǎn)地、溯源等特征庫(kù),實(shí)現(xiàn)農(nóng)村電商多平臺(tái)異構(gòu)數(shù)據(jù)的特征提取、實(shí)時(shí)處理和監(jiān)測(cè)分析;形成較高精度無(wú)損異構(gòu)數(shù)據(jù)融合、信息分析與可視化、管理與決策一體化系統(tǒng)。研究改善了大數(shù)據(jù)背景下跨平臺(tái)農(nóng)村電商數(shù)據(jù)收集和信息處理的能力,提升了政府對(duì)農(nóng)村電商發(fā)展現(xiàn)狀和趨勢(shì)的實(shí)時(shí)感知能力,為政府對(duì)農(nóng)村電商的管理和政策決策提供可靠的信息保障。
關(guān)鍵詞:農(nóng)村電商;深度學(xué)習(xí);異構(gòu)數(shù)據(jù);多模態(tài)數(shù)據(jù)融合
中圖分類(lèi)號(hào):C935;N99 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1673-1794(2023)02-0052-10
作者簡(jiǎn)介:孟凡會(huì),滁州學(xué)院經(jīng)濟(jì)與管理學(xué)院副教授,研究方向:市場(chǎng)營(yíng)銷(xiāo)、消費(fèi)者行為等;王玉亮,滁州學(xué)院計(jì)算機(jī)與信息工程學(xué)院副教授,博士(安徽 滁州 239000);汪雷,安徽財(cái)經(jīng)大學(xué)農(nóng)村經(jīng)濟(jì)社會(huì)發(fā)展研究院教授(安徽 蚌埠 233030)。
基金項(xiàng)目:安徽省高校人文社會(huì)科學(xué)重點(diǎn)項(xiàng)目“江淮分水嶺特色農(nóng)產(chǎn)品推廣策略研究”(SK2020A0517);2021年度安徽省社會(huì)科學(xué)創(chuàng)新發(fā)展研究項(xiàng)目“鄉(xiāng)村振興背景下安徽特色農(nóng)產(chǎn)品推廣研究”(2021CX521)
收稿日期:2022-07-22
鄉(xiāng)村振興戰(zhàn)略是新時(shí)代農(nóng)業(yè)農(nóng)村工作的總抓手,是建設(shè)現(xiàn)代化經(jīng)濟(jì)體系和健全社會(huì)治理格局的有效途徑。數(shù)字鄉(xiāng)村建設(shè)是鄉(xiāng)村振興戰(zhàn)略的重要內(nèi)容和戰(zhàn)略方向,是帶動(dòng)和提升農(nóng)業(yè)農(nóng)村現(xiàn)代化發(fā)展,實(shí)現(xiàn)農(nóng)業(yè)農(nóng)村數(shù)字經(jīng)濟(jì)新業(yè)態(tài)和數(shù)字鄉(xiāng)村可持續(xù)發(fā)展的總動(dòng)力[1]。農(nóng)村電子商務(wù)(簡(jiǎn)稱(chēng)農(nóng)村電商)是實(shí)現(xiàn)數(shù)字鄉(xiāng)村戰(zhàn)略中“互聯(lián)網(wǎng)+農(nóng)業(yè)”的具體體現(xiàn)。農(nóng)村電商的快速發(fā)展促進(jìn)了農(nóng)產(chǎn)品在生產(chǎn)、流通和銷(xiāo)售等產(chǎn)業(yè)鏈和供應(yīng)鏈方面的構(gòu)建,形成了農(nóng)產(chǎn)品供銷(xiāo)大數(shù)據(jù)[2-3]。2019年全國(guó)農(nóng)村電商合作社數(shù)量突破2000個(gè),全國(guó)農(nóng)村電商網(wǎng)絡(luò)零售額高達(dá)2693.1億元,較2018年同比增長(zhǎng)28.5%;其中,823個(gè)國(guó)家級(jí)貧困縣農(nóng)村電商網(wǎng)絡(luò)零售額達(dá)到1076.1億元,同比增長(zhǎng)了31.2%。電商銷(xiāo)售的農(nóng)產(chǎn)品涵蓋了植物大類(lèi)農(nóng)產(chǎn)品(如糧油、酒、茶、植物類(lèi)生鮮等)、動(dòng)物大類(lèi)農(nóng)產(chǎn)品(如動(dòng)物類(lèi)生鮮、動(dòng)物類(lèi)中藥材、動(dòng)物類(lèi)加工食品等)和農(nóng)資大類(lèi)產(chǎn)品(如農(nóng)藥、化肥、種子、飼料等)[4],形成知名農(nóng)產(chǎn)品品牌多達(dá)59個(gè),涵蓋了生鮮食品、休閑食品和糧油調(diào)味等。農(nóng)村電商發(fā)展模式逐步形成為“農(nóng)戶(hù)+合作社+電商平臺(tái)”模式,并在數(shù)字鄉(xiāng)村建設(shè)過(guò)程中規(guī)模不斷擴(kuò)大,結(jié)構(gòu)不斷得到優(yōu)化[5]。
全國(guó)有110個(gè)縣組織開(kāi)展“互聯(lián)網(wǎng)+”農(nóng)產(chǎn)品出村進(jìn)城工程試點(diǎn),眾多電商平臺(tái)快速布局農(nóng)村地區(qū),構(gòu)建了多板塊電商服務(wù)模式,如阿里巴巴集團(tuán)將淘寶、天貓、菜鳥(niǎo)物流、淘寶直播、螞蟻金服和聚劃算等業(yè)務(wù)模塊下沉到農(nóng)村電商,開(kāi)展了“基地直采”模式。其他知名電商企業(yè)也實(shí)施了農(nóng)村電商服務(wù)模式,包括京東的“3F戰(zhàn)略”模式,拼多多的“拼模式”模式,美團(tuán)的“生鮮電商”模式,餓了么的“社區(qū)化服務(wù)”模式,樂(lè)村淘、本來(lái)生活、美菜網(wǎng)等的“源頭直采”模式等。眾多電商的參與,加快了農(nóng)村電商的服務(wù)質(zhì)量、農(nóng)產(chǎn)品流和數(shù)據(jù)流的提升,農(nóng)村電商大數(shù)據(jù)時(shí)代撲面而來(lái)。但由于眾多電商采用的電商平臺(tái)異構(gòu)且發(fā)展不平衡,導(dǎo)致電商平臺(tái)數(shù)據(jù)多源、多模態(tài)、跨平臺(tái),這為對(duì)農(nóng)村電商發(fā)展現(xiàn)狀的實(shí)時(shí)把握構(gòu)成了挑戰(zhàn),對(duì)獲取全面的農(nóng)村電商數(shù)據(jù)和現(xiàn)狀分析造成了困難,最終將直接影響政府的決策和農(nóng)村數(shù)字化進(jìn)程。
本文以農(nóng)村電商數(shù)據(jù)為數(shù)據(jù)源,以及時(shí)準(zhǔn)確地把握農(nóng)村電商發(fā)展?fàn)顟B(tài)和趨勢(shì)信息為目標(biāo),利用深度壓縮算法和深度學(xué)習(xí)算法DBN(Deep Belief Network)實(shí)現(xiàn)農(nóng)村電商跨平臺(tái)異構(gòu)、多模態(tài)數(shù)據(jù)的有效融合;構(gòu)建農(nóng)村電商產(chǎn)品類(lèi)型、品牌、產(chǎn)地、溯源等特征庫(kù),實(shí)現(xiàn)多源電商平臺(tái)異構(gòu)數(shù)據(jù)的采集、整合、識(shí)別、清洗、特征提取、分類(lèi)和分析等信息處理過(guò)程;改善了大數(shù)據(jù)背景下跨平臺(tái)農(nóng)村電商數(shù)據(jù)收集和信息處理的能力,提升了政府對(duì)農(nóng)村電商發(fā)展現(xiàn)狀和趨勢(shì)的實(shí)時(shí)感知能力和情報(bào)收集能力,為政務(wù)對(duì)農(nóng)村電商的管理和政策決策提供可靠的信息保障。
1 相關(guān)研究
1.1 概念界定
1.1.1 農(nóng)村電商大數(shù)據(jù)
大數(shù)據(jù)(Big Data)具有海量的數(shù)據(jù)存儲(chǔ)規(guī)模,快速的數(shù)據(jù)流通,多元的數(shù)據(jù)類(lèi)型及低價(jià)值密度的數(shù)據(jù)挖掘等特點(diǎn),起源于分布式文件系統(tǒng),分布式計(jì)算框架和數(shù)據(jù)庫(kù)系統(tǒng)[6]。大數(shù)據(jù)技術(shù)為用戶(hù)在數(shù)據(jù)管理、交互處理、特征提取和應(yīng)用可視化分析等方面提供了不可缺少的工具。按照大數(shù)據(jù)應(yīng)用場(chǎng)景將數(shù)據(jù)進(jìn)行分類(lèi)管理,構(gòu)建以需求為導(dǎo)向的大數(shù)據(jù)挖掘,滿(mǎn)足現(xiàn)實(shí)場(chǎng)景應(yīng)用的數(shù)據(jù)獲取、清洗、特征提取和分析,及時(shí)把握應(yīng)用場(chǎng)景的現(xiàn)狀和趨勢(shì)。農(nóng)村電商大數(shù)據(jù)是隨著農(nóng)村電商快速發(fā)展而構(gòu)建的以農(nóng)產(chǎn)品產(chǎn)業(yè)鏈良性循環(huán)為背景的大數(shù)據(jù)應(yīng)用新場(chǎng)景。農(nóng)村電商大數(shù)據(jù)的應(yīng)用可提升農(nóng)產(chǎn)品精準(zhǔn)生產(chǎn)和營(yíng)銷(xiāo)的產(chǎn)業(yè)水平,改善農(nóng)產(chǎn)品產(chǎn)業(yè)鏈結(jié)構(gòu),提高農(nóng)民增收,實(shí)現(xiàn)精準(zhǔn)扶貧。
當(dāng)前農(nóng)村電商大數(shù)據(jù)發(fā)展?fàn)顩r呈現(xiàn)以下特點(diǎn):
(1)農(nóng)村數(shù)字化進(jìn)程推動(dòng)了農(nóng)村電商規(guī)??焖僭鲩L(zhǎng)。隨著鄉(xiāng)村信息基礎(chǔ)設(shè)施建設(shè)的不斷完善,農(nóng)村光纖和4G覆蓋率超過(guò)98%,提高了“三區(qū)三州”等深度貧困地區(qū)的網(wǎng)絡(luò)覆蓋率,2020年農(nóng)村寬帶接入戶(hù)數(shù)達(dá)到1.39億戶(hù),比2019年增加了488萬(wàn)戶(hù),同比增加了8%;鄉(xiāng)村智慧物流實(shí)施不斷加強(qiáng),2020年全國(guó)開(kāi)展了江蘇、安徽、河北等6個(gè)省15個(gè)市(州)“快遞進(jìn)村”全國(guó)試點(diǎn),鄉(xiāng)鎮(zhèn)快遞網(wǎng)點(diǎn)覆蓋率超過(guò)97%。農(nóng)村數(shù)字化進(jìn)程大力推進(jìn)了農(nóng)村電商的快速發(fā)展,初步形成了農(nóng)業(yè)農(nóng)村電商大數(shù)據(jù),涵蓋了農(nóng)產(chǎn)品單品種全產(chǎn)業(yè)鏈大數(shù)據(jù),為農(nóng)村電商狀態(tài)數(shù)據(jù)的有效挖掘和掌握構(gòu)成了挑戰(zhàn)。
(2)多平臺(tái)、數(shù)據(jù)多元化和異構(gòu)性。農(nóng)村電商平臺(tái)經(jīng)過(guò)近幾年的快速發(fā)展,根據(jù)中國(guó)電商平臺(tái)監(jiān)測(cè)數(shù)據(jù)和國(guó)家統(tǒng)計(jì)局、農(nóng)業(yè)農(nóng)村部及商務(wù)部發(fā)布數(shù)據(jù)顯示,當(dāng)前主流的農(nóng)村電商平臺(tái)有40多家,涵蓋了天貓、淘寶、京東、蘇寧和拼多多等大企業(yè)平臺(tái)[4],除此之外,農(nóng)業(yè)合作社、個(gè)體農(nóng)戶(hù)利用融媒體開(kāi)展多種渠道的電子商務(wù),增加了農(nóng)村電商的多元性發(fā)展。2019年我國(guó)農(nóng)產(chǎn)品電商銷(xiāo)售平臺(tái)已經(jīng)突破了5000家,不同的電商平臺(tái)在數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)類(lèi)型和數(shù)據(jù)接口等存在差異,數(shù)據(jù)組織形式的差異導(dǎo)致數(shù)據(jù)冗余度增大[7];并且各平臺(tái)發(fā)展不平衡,增加了數(shù)據(jù)不真實(shí)不全面的風(fēng)險(xiǎn)。多平臺(tái)的農(nóng)村電商數(shù)據(jù)構(gòu)成了在信息空間和物理空間的數(shù)據(jù)異同[7],對(duì)有效數(shù)據(jù)的收集、抽取、清洗、融合、建模和分析構(gòu)成了挑戰(zhàn)。
(3)農(nóng)村電商數(shù)據(jù)多屬性、多形態(tài),同步融合困難。農(nóng)村電商不僅采用了傳統(tǒng)電商的網(wǎng)絡(luò)營(yíng)銷(xiāo)和經(jīng)營(yíng)方式,而且采用了多形態(tài)的經(jīng)營(yíng)方式,數(shù)據(jù)形式多樣化,主要的數(shù)據(jù)類(lèi)型包括文本、圖片、影音、混合數(shù)據(jù)等。新的農(nóng)村電商營(yíng)銷(xiāo)模式(如直播帶貨)推動(dòng)了農(nóng)村電商大數(shù)據(jù)的多屬性、多形態(tài),增加了數(shù)據(jù)收集和處理的難度,對(duì)準(zhǔn)確把握農(nóng)村電商發(fā)展?fàn)顩r構(gòu)成了挑戰(zhàn)。
1.1.2 多源農(nóng)村電商數(shù)據(jù)
多源農(nóng)村電商數(shù)據(jù)是指電商數(shù)據(jù)的來(lái)源并非來(lái)自同一個(gè)農(nóng)村電商信息平臺(tái),由于各電商平臺(tái)在構(gòu)建過(guò)程中存在技術(shù)差異和業(yè)務(wù)范圍的差距,導(dǎo)致各電商平臺(tái)產(chǎn)生的業(yè)務(wù)數(shù)據(jù)在存儲(chǔ)方式、數(shù)據(jù)類(lèi)型、數(shù)據(jù)管理系統(tǒng)等方面存在差異,這就構(gòu)成了農(nóng)村電商多源異構(gòu)數(shù)據(jù)。農(nóng)村電商的多源異構(gòu)數(shù)據(jù)是農(nóng)村電商平臺(tái)呈多元化和發(fā)展不平衡的必然結(jié)果。多源數(shù)據(jù)產(chǎn)生來(lái)自對(duì)現(xiàn)實(shí)物理世界感知描述,按照一定的數(shù)字邏輯結(jié)構(gòu)和存儲(chǔ)方式構(gòu)成的物理世界的數(shù)字表達(dá),將這些數(shù)據(jù)通過(guò)各自數(shù)據(jù)傳輸途徑進(jìn)行收集和數(shù)據(jù)整理,建立數(shù)據(jù)抽取和整合,利用多源數(shù)據(jù)融合技術(shù)達(dá)到數(shù)據(jù)的信息化處理和分析[8]。多源農(nóng)村電商數(shù)據(jù)是農(nóng)村電子商務(wù)運(yùn)行狀況在數(shù)字空間的集中表達(dá),為農(nóng)村電商大數(shù)據(jù)的進(jìn)一步信息化分析提供了基礎(chǔ)數(shù)據(jù)源。
1.1.3 多模態(tài)農(nóng)村電商數(shù)據(jù)
多模態(tài)(Multimodal data)指人類(lèi)通過(guò)感官所感知的多種模態(tài)形式,如聽(tīng)覺(jué)感知到的聽(tīng)模態(tài),視覺(jué)感知看模態(tài),觸覺(jué)感知模態(tài)等,多個(gè)模態(tài)相互組合構(gòu)成了人的多模態(tài)感知。將多模態(tài)概念引入到數(shù)據(jù)領(lǐng)域中是指從不同領(lǐng)域或視角獲取同一對(duì)象的數(shù)據(jù),這些數(shù)據(jù)具有不同表現(xiàn)形式或數(shù)據(jù)格式。將不同領(lǐng)域或視角的數(shù)據(jù)通過(guò)數(shù)據(jù)融合技術(shù)得到描述對(duì)象的全面信息,多模態(tài)農(nóng)村電商數(shù)據(jù)主要表現(xiàn)形式有文本、音頻、圖片、視頻和混合數(shù)據(jù)等,按照數(shù)據(jù)屬性標(biāo)記建立數(shù)據(jù)聯(lián)系,提取數(shù)據(jù)特征,最終實(shí)現(xiàn)多模態(tài)數(shù)據(jù)的集成描述和融合表達(dá)[9]。多模態(tài)農(nóng)村電商數(shù)據(jù)主要的獲取渠道是各平臺(tái)后臺(tái)數(shù)據(jù),這些數(shù)據(jù)由于平臺(tái)技術(shù)發(fā)展不平衡、平臺(tái)數(shù)據(jù)破碎化嚴(yán)重,將多源分布式多模態(tài)農(nóng)村電商破碎化數(shù)據(jù)進(jìn)行整合、建模、分析,可克服單一來(lái)源單模態(tài)數(shù)據(jù)的片面性和不準(zhǔn)確性。
1.2 數(shù)據(jù)融合技術(shù)
數(shù)據(jù)融合技術(shù)是將來(lái)自單一或多源的數(shù)據(jù)或信息建立聯(lián)系達(dá)到對(duì)數(shù)據(jù)或信息的重新認(rèn)知、特征提取和判斷,實(shí)現(xiàn)基于多源數(shù)據(jù)為基礎(chǔ)的信息綜合感知描述和決策分析[10]。數(shù)據(jù)融合技術(shù)可將多源、異質(zhì)、不完整數(shù)據(jù)或信息建立綜合的數(shù)據(jù)屬性,實(shí)現(xiàn)跨平臺(tái)多源數(shù)據(jù)的互補(bǔ)性,提高數(shù)據(jù)或信息的完整度和準(zhǔn)確性,為精準(zhǔn)決策分析提供依據(jù)。多源數(shù)據(jù)融合技術(shù)在解決實(shí)際應(yīng)用問(wèn)題過(guò)程中提出了多種數(shù)據(jù)融合功能模型,實(shí)現(xiàn)對(duì)多源數(shù)據(jù)的分級(jí)處理,這些模型主要包括:JDL模型,UK情報(bào)環(huán)模型,Boyd模型以及混合模型[11]。
多源數(shù)據(jù)融合算法按照算法屬性可以分為基于估算理論的融合算法,基于不確定推理的融合算法和基于人工智能的融合算法[12]。其中基于估算的融合算法主要包括加權(quán)平均數(shù)法、最小二乘法、卡爾曼濾波法(包括適用于線(xiàn)性和非線(xiàn)性隨機(jī)系統(tǒng)的卡爾曼濾波器)、最大似然估計(jì)法[13];基于不確定性推理融合算法將多源數(shù)據(jù)源的不確定、不完整、模糊信息建立識(shí)別、加工、推理達(dá)到關(guān)切信息識(shí)別和屬性信息融合的目的,主要包括經(jīng)典推理、主觀貝葉斯推理、支持向量機(jī)理論(SVM)、D-S證據(jù)推理、DSMT方法、模糊數(shù)學(xué)理論及可能性推理[14];基于人工智能的算法是建立在模擬人對(duì)自然信息獲取和加工處理方式基礎(chǔ)上,建立樣本空間,通過(guò)大量樣本訓(xùn)練、學(xué)習(xí)建立信息識(shí)別和提取,主要算法包括粗糙集理論、遺傳算法、人工神經(jīng)網(wǎng)絡(luò)、知識(shí)系統(tǒng)等[15]?;谌斯ぶ悄艿娜诤纤惴ɡ孟闰?yàn)知識(shí)的學(xué)習(xí),達(dá)到信息和知識(shí)簡(jiǎn)約,從海量數(shù)據(jù)中檢索屬于關(guān)切內(nèi)容的基本規(guī)則,建立最小規(guī)則解決方案?;谌斯ぶ悄苋诤纤惴ň哂休^高的算法精度、良好的魯棒性、快速的并行運(yùn)算能力,尤其在多源數(shù)據(jù)融合中表現(xiàn)的優(yōu)勢(shì)越來(lái)越受到廣大學(xué)者的關(guān)注。隨著深度學(xué)習(xí)算法應(yīng)用領(lǐng)域的拓展,深度學(xué)習(xí)算法在多源異構(gòu)數(shù)據(jù)融合應(yīng)用中得到業(yè)界偏好[16]。
1.3 基于深度學(xué)習(xí)算法的多模態(tài)數(shù)據(jù)融合
基于深度學(xué)習(xí)算法的多模態(tài)數(shù)據(jù)融合與傳統(tǒng)深度學(xué)習(xí)數(shù)據(jù)融合機(jī)制相同,都是通過(guò)樣本庫(kù)構(gòu)建、特征學(xué)習(xí)和訓(xùn)練、特征提取等過(guò)程,但面向的數(shù)據(jù)集對(duì)象不同。前者處理的對(duì)象是多源多模態(tài)數(shù)據(jù)集(跨平臺(tái)、多種數(shù)據(jù)類(lèi)型)或多模態(tài)交叉數(shù)據(jù)集。如J.Ngiam利用一種深度自動(dòng)編碼算法實(shí)現(xiàn)了兩種模態(tài)(音頻和視頻)特征表示?;谏疃葘W(xué)習(xí)算法的多模態(tài)數(shù)據(jù)融合模式可分為基于規(guī)則的方法和基于分類(lèi)的方法[17]?;谝?guī)則的方法是按照不同模態(tài)分類(lèi)器中的權(quán)重得分、投票、先驗(yàn)知識(shí)自定義規(guī)則執(zhí)行決策層的數(shù)據(jù)融合;基于分類(lèi)器方法的融合是利用特征向量構(gòu)建分類(lèi)器,一般分類(lèi)器由多模態(tài)特征向量組成,采用常用的分類(lèi)算法(如支持向量機(jī)或神經(jīng)網(wǎng)絡(luò))構(gòu)建分類(lèi)器,如貝葉斯網(wǎng)絡(luò)按照多位特征向量學(xué)習(xí)。分類(lèi)器可以根據(jù)需要構(gòu)建多層分類(lèi)器,將不同模態(tài)數(shù)據(jù)融合到異構(gòu)向量中,實(shí)現(xiàn)多模態(tài)數(shù)據(jù)的融合?;谏疃葘W(xué)習(xí)算法的多模態(tài)數(shù)據(jù)融合性能受到模型的選擇和參數(shù)配置等因素的影響。
多源數(shù)據(jù)融合技術(shù)可對(duì)用戶(hù)產(chǎn)生的多渠道、多方位的數(shù)據(jù)建立多種感知方法,通過(guò)對(duì)數(shù)據(jù)的收集,多元交叉互補(bǔ),有效消除噪聲信息,減少信息冗余,達(dá)到對(duì)數(shù)據(jù)把握的系統(tǒng)性、準(zhǔn)確性和完整性,為數(shù)據(jù)的分析和進(jìn)一步處理奠定了質(zhì)量基礎(chǔ),為準(zhǔn)確的信息產(chǎn)生、分析和決策提供可靠的依據(jù)[10]?;谏疃葘W(xué)習(xí)的多源數(shù)據(jù)融合技術(shù)通過(guò)算法的改進(jìn)和升級(jí)可實(shí)現(xiàn)多源多模態(tài)農(nóng)村電商數(shù)據(jù)的融合。本文在深度信任網(wǎng)絡(luò)算法DBN(Deep Belief Networks)基礎(chǔ)上,引入深度數(shù)據(jù)壓縮算法,建立共享數(shù)據(jù)權(quán)重,實(shí)現(xiàn)多源多模態(tài)數(shù)據(jù)的無(wú)損壓縮和冗余清洗;根據(jù)農(nóng)村電商數(shù)據(jù)特點(diǎn)和類(lèi)型,構(gòu)建農(nóng)村電商產(chǎn)品類(lèi)型、品牌、產(chǎn)地、溯源等特征庫(kù),實(shí)現(xiàn)多源多模態(tài)異構(gòu)電商數(shù)據(jù)的特征提取、分類(lèi)和分析,實(shí)現(xiàn)了全面掌握農(nóng)村電商發(fā)展現(xiàn)狀,為政府的政策決策提供技術(shù)支持。
2 農(nóng)村電商多源多模態(tài)數(shù)據(jù)融合
2.1 多源多模態(tài)數(shù)據(jù)融合機(jī)制
多源多模態(tài)數(shù)據(jù)融合機(jī)制主要包括五個(gè)層次(如圖1所示):多源多模態(tài)數(shù)據(jù)源、數(shù)據(jù)的收集與分類(lèi)、數(shù)據(jù)清洗與特征提取、數(shù)據(jù)融合過(guò)程以及信息處理和輸出。其中,多源多模態(tài)數(shù)據(jù)為數(shù)據(jù)源,特點(diǎn)表現(xiàn)為跨平臺(tái)、異構(gòu)性、混合性、冗余度高、多數(shù)據(jù)類(lèi)型和多種數(shù)據(jù)格式,有些數(shù)據(jù)不能直接作為統(tǒng)計(jì)數(shù)據(jù)使用,需要數(shù)據(jù)格式轉(zhuǎn)變和特征提取。由于農(nóng)村電商平臺(tái)發(fā)展不平衡,且電商存在多樣性和復(fù)雜性,導(dǎo)致收集的數(shù)據(jù)混淆度較大,存在部分平臺(tái)數(shù)據(jù)的缺失,對(duì)全面了解電商的發(fā)展詳情構(gòu)成了挑戰(zhàn)。但多源多模態(tài)數(shù)據(jù)從不同角度刻畫(huà)了電商現(xiàn)狀,克服了單一來(lái)源數(shù)據(jù)、單模態(tài)數(shù)據(jù)的局限性,提高了數(shù)據(jù)的全面性和準(zhǔn)度。數(shù)據(jù)收集和分類(lèi)是將多平臺(tái)多模態(tài)的數(shù)據(jù)建立多渠道收集方式,并將收集的數(shù)據(jù)按照數(shù)據(jù)類(lèi)型和電商信息特征進(jìn)行分類(lèi);數(shù)據(jù)清洗與特征提取主要完成分類(lèi)后數(shù)據(jù)的冗余壓縮和低價(jià)值數(shù)據(jù)的清洗,通過(guò)不同類(lèi)型的數(shù)據(jù)建立樣本數(shù)據(jù),為特征學(xué)習(xí)和訓(xùn)練提供基礎(chǔ);數(shù)據(jù)融合層根據(jù)數(shù)據(jù)的特征,建立特征庫(kù),將屬性相同的特征劃分為同一類(lèi),按照分類(lèi)器閾值,提取滿(mǎn)足要求的特征值,實(shí)現(xiàn)多源多模態(tài)數(shù)據(jù)中共同特征的有效提取和表達(dá);信息處理和結(jié)果輸出層是根據(jù)決策需求,建立按需求的信息分析,分析結(jié)果為決策提供可靠的依據(jù)。
2.2 農(nóng)村電商數(shù)據(jù)深度壓縮和權(quán)重共享
深度壓縮(Deep compression)算法[18]是對(duì)大量數(shù)據(jù)或網(wǎng)絡(luò)的一種優(yōu)化方法,以達(dá)到降低數(shù)據(jù)冗余和數(shù)據(jù)或網(wǎng)絡(luò)復(fù)雜度,從而降低存儲(chǔ)和能量消耗,提高數(shù)據(jù)的運(yùn)算效率。深度壓縮算法通過(guò)三個(gè)步驟達(dá)到數(shù)據(jù)壓縮的目的:
(1)網(wǎng)絡(luò)修剪(Network pruning),將收集的多源多模態(tài)數(shù)據(jù)建立訓(xùn)練網(wǎng)絡(luò),對(duì)網(wǎng)絡(luò)中各數(shù)據(jù)節(jié)點(diǎn)連接按照數(shù)據(jù)的類(lèi)型和重要性賦予不同初始權(quán)值,建立網(wǎng)絡(luò)修剪閾值,將權(quán)重小的連接(一般是權(quán)值為0的連接)按照閾值進(jìn)行修剪,通過(guò)訓(xùn)練將修剪后的網(wǎng)絡(luò)建立稀疏連接和索引,將權(quán)重按照索引進(jìn)行存儲(chǔ)。
(2)權(quán)重共享和量化(Weight shared and quantization),將上述網(wǎng)絡(luò)中具有共同特點(diǎn)的權(quán)重建立共享權(quán)值,減少數(shù)據(jù)和權(quán)值存儲(chǔ)量。采用K-means聚類(lèi)算法,建立類(lèi)內(nèi)索引元素到聚類(lèi)中心距離的優(yōu)化確定聚類(lèi)結(jié)果。定義網(wǎng)絡(luò)存在m權(quán)重連接Wd={wd1,wd2,,…,wdm},將這些連接劃分為δ各聚類(lèi)中心,這些聚類(lèi)中心集合可表達(dá)為:ε={p1,p2,…,pδ}(δlt;lt;m),其中pδ是δ個(gè)聚類(lèi)中心,則聚類(lèi)的最小平方和可表達(dá)為:
通過(guò)聚類(lèi)算法的前向反饋和后向傳播將權(quán)值利用聚類(lèi)中心代替,利用類(lèi)內(nèi)的權(quán)值梯度降低更新聚類(lèi)權(quán)重,實(shí)現(xiàn)權(quán)重的共享和更新。其中,δ聚類(lèi)需要=log2δbit作為索引編碼,δ聚類(lèi)中有m個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)連接權(quán)重共享一個(gè)權(quán)值,每一個(gè)連接權(quán)值在編碼中占n bit,則原有網(wǎng)絡(luò)經(jīng)過(guò)權(quán)重共享和量化后的壓縮率為:
其中,Ccr為壓縮率,用于表示共享權(quán)重對(duì)網(wǎng)絡(luò)連接壓縮的性能。權(quán)重共享和量化過(guò)程將有效壓縮網(wǎng)絡(luò)連接數(shù)量,優(yōu)化存儲(chǔ)和檢索速度。
(3)哈夫曼編碼(Huffman Coding),利用哈夫曼編碼解決編碼長(zhǎng)度不一帶來(lái)的冗余問(wèn)題。通常在卷積層采用8bit編碼,全連接層采用5bit編碼。通過(guò)統(tǒng)一的熵編碼減少數(shù)據(jù)的冗余。深度壓縮三個(gè)步驟完成了數(shù)據(jù)存儲(chǔ)量的壓縮和運(yùn)算復(fù)雜度的降低。
2.3 深度信任網(wǎng)絡(luò)DBN(Deep belief networks)
DBN是一個(gè)建立在觀察資料和標(biāo)簽之間的聯(lián)合分布概率生成模型[19]。該模型由多層的受限玻爾茲曼機(jī)RBMs(Restricted Boltzmann Machines)構(gòu)成的神經(jīng)網(wǎng)絡(luò),包括顯示層(Visible layer)和隱藏層(Hidden layer)兩個(gè)單元,其中顯示層為數(shù)據(jù)的輸入端和數(shù)據(jù)訓(xùn)練,隱藏層為數(shù)據(jù)的特征檢測(cè)單元。數(shù)據(jù)的訓(xùn)練和特征檢測(cè)過(guò)程是逐層遞進(jìn),隱藏層和顯示層通過(guò)不同的權(quán)重連接,可實(shí)現(xiàn)雙向連接,構(gòu)成了權(quán)重矩陣。當(dāng)顯示層活動(dòng)數(shù)據(jù)后,RBM按照權(quán)重優(yōu)先級(jí)決定隱藏層的開(kāi)或關(guān),采用S形函數(shù)將每個(gè)隱藏單元的激勵(lì)值計(jì)算出來(lái),S形函數(shù)采用了Logistic函數(shù):
RBM訓(xùn)練是求解一個(gè)訓(xùn)練樣本的概率分布,產(chǎn)生訓(xùn)練樣本的概率最大,而顯示層和隱藏層的連接權(quán)重直接影響RBM的訓(xùn)練結(jié)果。
DBM是由多層的RBM采用非監(jiān)督貪婪逐層訓(xùn)練得到最優(yōu)權(quán)值,訓(xùn)練過(guò)程如下:
1)建立一個(gè)初始的RBM訓(xùn)練;2)生產(chǎn)固定的RBM權(quán)重和偏移量,并作為下個(gè)RBM訓(xùn)練的輸入向量;3)根據(jù)第一個(gè)RBM訓(xùn)練的結(jié)果,充分訓(xùn)練第二個(gè)RBM,并將結(jié)果堆疊在第一個(gè)RBM上方;4)重復(fù)1)~3)步驟,直至找到最大概率分布;5)通過(guò)Fine-tune監(jiān)督訓(xùn)練過(guò)程,對(duì)DBN 網(wǎng)絡(luò)中的所有參數(shù)進(jìn)行監(jiān)督訓(xùn)練,采用梯度下降方法尋找最佳的權(quán)重,使得Average函數(shù)隨權(quán)重的變化趨于最小值。DBN通過(guò)多層RBM訓(xùn)練對(duì)輸入數(shù)據(jù)建立特征提取,并利用分類(lèi)器完成數(shù)據(jù)按照特征的分類(lèi)。
本文中將多源多模態(tài)數(shù)據(jù)經(jīng)過(guò)深度壓縮后的數(shù)據(jù),作為DBN的數(shù)據(jù)輸入。通過(guò)深度壓縮后的數(shù)據(jù),降低了數(shù)據(jù)的冗余,提高了數(shù)據(jù)的運(yùn)算速度,并建立分類(lèi),為DBN深度學(xué)習(xí)訓(xùn)練樣本提供了有效的數(shù)據(jù)源。采用基于深度壓縮的DBN深度學(xué)習(xí)過(guò)程,如圖3所示。
2.4 基于深度學(xué)習(xí)的多源多模態(tài)農(nóng)村電商數(shù)據(jù)融合總體模型
在深度壓縮和深度學(xué)習(xí)基礎(chǔ)上,構(gòu)建基于深度學(xué)習(xí)的多源多模態(tài)農(nóng)村電商數(shù)據(jù)融合總體模型(如圖4所示)。模型構(gòu)建了多源多模態(tài)農(nóng)村電商數(shù)據(jù)的收集、分類(lèi)、信息融合、特征提取、信息分析和應(yīng)用決策全信息化過(guò)程,整體上包括了六個(gè)層次,四個(gè)過(guò)程。其中六個(gè)層次主要包括數(shù)據(jù)平臺(tái)層、數(shù)據(jù)采集層、數(shù)據(jù)類(lèi)型層、深度學(xué)習(xí)訓(xùn)練層、知識(shí)層和應(yīng)用層。各過(guò)程的詳細(xì)描述如下:
(1)數(shù)據(jù)到有效信息的挖掘過(guò)程
由于農(nóng)村電商平臺(tái)的多樣性、破碎化、分散性和數(shù)據(jù)的復(fù)雜性,有效挖掘農(nóng)村電商有效數(shù)據(jù)是信息分析和決策的基礎(chǔ)。根據(jù)研究需求所包含的情報(bào)內(nèi)容和目標(biāo),建立按照數(shù)據(jù)類(lèi)型和模態(tài)為規(guī)則的分類(lèi),將農(nóng)村電商平臺(tái)數(shù)據(jù)劃分為六個(gè)數(shù)據(jù)集,分別為字符模態(tài)、數(shù)值模態(tài)、混合文本模態(tài)、音頻模態(tài)、視頻模態(tài)和圖像模態(tài),建立各模態(tài)數(shù)據(jù)集對(duì)應(yīng)的向量X={x1,x2,x3,…xn},通過(guò)深度數(shù)據(jù)壓縮K-means聚類(lèi)分析和哈夫曼編碼得到低冗余的數(shù)據(jù)集向量X′={x′1,x′2,x′3,…x′n},構(gòu)建樣本的特征向量X′=x′1,x′2,x′3,…x′n,作為DBN數(shù)據(jù)顯示層的輸入,通過(guò)RBM隱藏層的特征檢測(cè),學(xué)習(xí)和訓(xùn)練樣本,得到特征樣本庫(kù),建立各模態(tài)的樣本數(shù)據(jù)庫(kù),通過(guò)分類(lèi)器和閾值建立多模態(tài)數(shù)據(jù)的信息分類(lèi),實(shí)現(xiàn)多源多模態(tài)農(nóng)村電商數(shù)據(jù)的信息化處理和特征提取。
(2)多源多模態(tài)數(shù)據(jù)壓縮過(guò)程
多源多模態(tài)農(nóng)村電商數(shù)據(jù)存在較高的數(shù)據(jù)冗余度,增加了數(shù)據(jù)檢索和分類(lèi)等運(yùn)算的時(shí)間和空間復(fù)雜度。深度壓縮算法利用網(wǎng)絡(luò)修剪、權(quán)重共享與量化、哈夫曼編碼三個(gè)步驟完成多模態(tài)數(shù)據(jù)的過(guò)濾。本研究為降低在數(shù)據(jù)壓縮過(guò)程中數(shù)據(jù)的損失,采用基于熵值的修剪方法。在構(gòu)建的輸入網(wǎng)絡(luò)中將特征映射轉(zhuǎn)化為長(zhǎng)度為f的向量(f的數(shù)量等于過(guò)濾器的個(gè)數(shù)),將網(wǎng)絡(luò)中的n個(gè)數(shù)據(jù)單元轉(zhuǎn)為為n*f的向量,對(duì)于每個(gè)過(guò)濾器分成m個(gè)二進(jìn)制單元,并統(tǒng)計(jì)每個(gè)二進(jìn)制單元概率p,通過(guò)熵值運(yùn)算判斷過(guò)濾器的權(quán)重,刪去權(quán)重小的過(guò)濾器單元,其熵值計(jì)算如下:
Kk=-sum(p*log(p)) """(4)
其中,Hk為第k個(gè)特征向量對(duì)應(yīng)的熵值。基于熵值的網(wǎng)絡(luò)修剪通過(guò)迭代回復(fù)整體性能,使模型達(dá)到全局最優(yōu)。
權(quán)重共享是將網(wǎng)絡(luò)中每一層所有權(quán)值進(jìn)行聚類(lèi),將同類(lèi)的網(wǎng)絡(luò)連接權(quán)重采用聚類(lèi)中心權(quán)值,最終將網(wǎng)絡(luò)中的每一層權(quán)值都替換為聚類(lèi)中心權(quán)值,δ聚類(lèi)需要τ=log2δbit作為索引編碼,δ聚類(lèi)中有m個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)連接權(quán)重共享一個(gè)權(quán)值,每一個(gè)連接權(quán)值在編碼中占n bit,計(jì)算壓縮率Ccr。經(jīng)過(guò)量化后,需要對(duì)網(wǎng)絡(luò)進(jìn)行微調(diào)優(yōu)化,確保權(quán)值的更新僅作用于聚類(lèi)中心,表達(dá)式如下:
其中,Ck表示第k個(gè)聚類(lèi)中心,Ii,j表示wi,j的聚類(lèi)中心的索引,類(lèi)內(nèi)權(quán)重的梯度求和可得到聚類(lèi)中心更新值。
哈夫曼編碼按照字符出現(xiàn)的概率進(jìn)行編碼,如圖2列舉的哈夫曼編號(hào)實(shí)例。權(quán)重編碼后可再次壓縮數(shù)據(jù)存儲(chǔ)量。哈夫曼編碼過(guò)程是構(gòu)建一個(gè)帶權(quán)路徑長(zhǎng)度WPL最小二叉樹(shù)(最優(yōu)二叉樹(shù)):
其中n為二叉樹(shù)中葉子結(jié)點(diǎn)個(gè)數(shù),wi為第i個(gè)葉子結(jié)點(diǎn)的權(quán)值,li為根節(jié)點(diǎn)到第i個(gè)葉子節(jié)點(diǎn)的距離。
大數(shù)據(jù)背景下多源多模態(tài)農(nóng)村電商數(shù)據(jù)的深度壓縮對(duì)有效數(shù)據(jù)的挖掘具有重要的意義,在降低數(shù)據(jù)冗余的同時(shí),建立了數(shù)據(jù)新的存儲(chǔ)結(jié)構(gòu),有利于數(shù)據(jù)的信息特征提取、分類(lèi)和分析。
(3)多模態(tài)數(shù)據(jù)的深度學(xué)習(xí)、訓(xùn)練和特征提取過(guò)程
多模態(tài)數(shù)據(jù)的特征提取采用了DBN深度學(xué)習(xí)算法,本次采用了基于樣本庫(kù)監(jiān)督學(xué)習(xí)建立特征學(xué)習(xí)過(guò)程。DBN利用標(biāo)簽數(shù)據(jù)和觀察數(shù)據(jù)之間的概率分布建立概率生產(chǎn)模型,一個(gè)DBN有多個(gè)RBM構(gòu)成,每個(gè)RBM包含了兩個(gè)神經(jīng)元:顯示層(V)和隱藏層(H)分別用于數(shù)據(jù)的訓(xùn)練和特征檢測(cè)。每層用一個(gè)向量表示,每一維表示一個(gè)神經(jīng)元。顯示層的概率表達(dá)式為:
隱藏層的概率表達(dá)式為:
對(duì)一個(gè)新的樣本X=(x1,x2,x3,…xn)每個(gè)隱藏層開(kāi)啟狀況的概率取值為:
RBM訓(xùn)練最終要產(chǎn)生訓(xùn)練樣本的概率分布,其決定因素為連接權(quán)值w,訓(xùn)練過(guò)程中目標(biāo)是尋找最佳的權(quán)值。
DBN深度學(xué)習(xí)建立農(nóng)村電商特征庫(kù),按照農(nóng)村電商產(chǎn)品類(lèi)型、品牌、產(chǎn)地、溯源等特征,整合特征屬性,建立特征屬性數(shù)據(jù)庫(kù),為農(nóng)村電商信息的進(jìn)一步分析和應(yīng)用提供基礎(chǔ)。
(4)信息分析和應(yīng)用決策過(guò)程
農(nóng)村電商數(shù)據(jù)信息的開(kāi)發(fā)和應(yīng)用是全面把握農(nóng)村電商發(fā)展現(xiàn)狀和趨勢(shì)的必要途徑。農(nóng)村電商數(shù)據(jù)的應(yīng)用要建立在計(jì)算機(jī)科學(xué)與信息管理的深度融合基礎(chǔ)上,通過(guò)對(duì)離散數(shù)據(jù)的深度挖掘,提取所需信息的特征數(shù)據(jù),按照數(shù)據(jù)的信息化描述,信息單元的空間表達(dá),知識(shí)要素的構(gòu)建和有效數(shù)據(jù)的關(guān)聯(lián),建立多源多模態(tài)數(shù)據(jù)的有序化知識(shí)庫(kù),實(shí)現(xiàn)信息的較寬泛表達(dá),精細(xì)化描述農(nóng)村電商現(xiàn)狀。多模態(tài)數(shù)據(jù)較單模態(tài)數(shù)據(jù)具有信息的完整性、交互性和包容性,能夠細(xì)顆粒的描述電商的發(fā)展情況。這些信息的可視化將直接有助于分析農(nóng)村電商發(fā)展現(xiàn)狀,為政府對(duì)進(jìn)一步改善農(nóng)村電商環(huán)境和發(fā)展政策提供強(qiáng)有力的依據(jù)。
2.5 基于深度學(xué)習(xí)的多源多模態(tài)農(nóng)村電商數(shù)據(jù)融合案例分析
本研究數(shù)據(jù)來(lái)源于包括拼多多、美團(tuán)、快手等在內(nèi)的35個(gè)電商平臺(tái),數(shù)據(jù)類(lèi)型涵蓋了字符、數(shù)值、視頻、圖片、混合文本等6種,以2019年全國(guó)熱銷(xiāo)農(nóng)產(chǎn)品為例,建立農(nóng)產(chǎn)品銷(xiāo)售數(shù)據(jù)庫(kù),按照農(nóng)產(chǎn)品三級(jí)品類(lèi)進(jìn)行數(shù)據(jù)收集,主要包括水果、食用油、園林/農(nóng)耕、大米、休閑食品、海鮮水產(chǎn)、蔬菜、雜糧、紅茶、綠茶、干貨、禽肉蛋品、花卉綠植、花草茶/花果茶等。按照銷(xiāo)量排名,選取了19個(gè)銷(xiāo)量排名靠前的農(nóng)產(chǎn)品(將紅茶、綠茶、白茶等茶類(lèi)合并統(tǒng)稱(chēng)茶類(lèi)),其中銷(xiāo)量排名前三的農(nóng)產(chǎn)品為休閑食品、茶類(lèi)和水果,農(nóng)村電商銷(xiāo)量排名前三的省份為浙江省、江蘇省、福建省,19個(gè)農(nóng)產(chǎn)品銷(xiāo)量占全電商平臺(tái)銷(xiāo)售總量的25.69%。從19個(gè)品類(lèi)銷(xiāo)售情況可發(fā)現(xiàn)浙江省農(nóng)村電商發(fā)展較快,規(guī)模全國(guó)最高,占全國(guó)農(nóng)村電商銷(xiāo)售的8.64%,覆蓋了19個(gè)品類(lèi)的7個(gè)品類(lèi)。全國(guó)農(nóng)產(chǎn)品農(nóng)村電商19個(gè)品類(lèi)產(chǎn)品排名見(jiàn)表1。
圖5和圖6分別展示了所選19個(gè)品類(lèi)農(nóng)產(chǎn)品農(nóng)村電商平臺(tái)在省級(jí)和市縣(區(qū))級(jí)全國(guó)銷(xiāo)量占比情況(2019年)。從圖5所示內(nèi)容中,所選的19個(gè)品類(lèi)中銷(xiāo)量最高的兩個(gè)省份是浙江省和江蘇省。而從市縣(區(qū))銷(xiāo)量占比情況來(lái)看,浙江省的蕭山區(qū)、福建省的安溪縣和江蘇省的沭陽(yáng)縣農(nóng)村電商銷(xiāo)售占比排名為前三。兩個(gè)圖的分析都說(shuō)明了農(nóng)村電商發(fā)展較發(fā)達(dá)的區(qū)域在浙江、江蘇、福建等中國(guó)東南部,從農(nóng)產(chǎn)品電商銷(xiāo)量來(lái)看,休閑食品和茶類(lèi)是農(nóng)村電商熱銷(xiāo)產(chǎn)品。而農(nóng)資(飼料)、園林/農(nóng)耕等銷(xiāo)售潛力有待發(fā)掘。特色農(nóng)產(chǎn)品銷(xiāo)售拉動(dòng)農(nóng)村電商銷(xiāo)售動(dòng)力巨大,如內(nèi)蒙古自治區(qū)和林格爾縣的液態(tài)奶產(chǎn)品,寧夏回族自治區(qū)中寧縣的枸杞和浙江省桐鄉(xiāng)市的粽子產(chǎn)品,啟發(fā)了農(nóng)產(chǎn)品在銷(xiāo)售過(guò)程中應(yīng)走特色之路。
3 農(nóng)村電商發(fā)展評(píng)價(jià)與決策
通過(guò)農(nóng)村電商平臺(tái)多模態(tài)數(shù)據(jù)深度學(xué)習(xí)融合技術(shù),將分散性強(qiáng)、技術(shù)發(fā)展不平衡的平臺(tái)異構(gòu)數(shù)據(jù)深度挖掘,按照農(nóng)產(chǎn)品屬性的可視化分析要求,完成了數(shù)據(jù)的有效信息提取、信息識(shí)別、信息界定、信息篩選、信息整合、信息分類(lèi)和信息分析,為全面把握農(nóng)村電商發(fā)展現(xiàn)狀提供了可靠的信息支持。從信息分析結(jié)果可知,我國(guó)農(nóng)村電商發(fā)展存在的主要問(wèn)題包括如下幾個(gè)方面:
(1)我國(guó)現(xiàn)階段農(nóng)村電商地區(qū)發(fā)展不平衡,呈現(xiàn)西北、東北落后于華東的區(qū)域格局。從2019年農(nóng)村電商大數(shù)據(jù)分析可知,我國(guó)西北和東北地區(qū)農(nóng)村電商發(fā)展滯后。2019年西北和東北地區(qū)農(nóng)村電商農(nóng)產(chǎn)品銷(xiāo)售占比為1.8%,而華東地區(qū)農(nóng)產(chǎn)品電商銷(xiāo)售占比為60.4%。中西部地區(qū)農(nóng)村電商發(fā)展迅速,而增速較快的區(qū)域主要在西南和西北地區(qū),2019年分別同比增長(zhǎng)了66.7%和62.7%。這說(shuō)明了我國(guó)農(nóng)村電商進(jìn)入了快速發(fā)展的階段,呈現(xiàn)了東部帶動(dòng)西部,中部快速崛起的積極局面。另外,農(nóng)村電商的發(fā)展與區(qū)域的基礎(chǔ)設(shè)施建設(shè)有密切的關(guān)系,基礎(chǔ)設(shè)施較完備的區(qū)域農(nóng)商電商發(fā)展速度高于基礎(chǔ)設(shè)施薄弱的地區(qū)。
(2)電商平臺(tái)下沉農(nóng)村,促進(jìn)農(nóng)業(yè)發(fā)展。從產(chǎn)品端到生產(chǎn)端不斷拓展,但在現(xiàn)代農(nóng)業(yè)生產(chǎn)、產(chǎn)品深加工、產(chǎn)品服務(wù)升級(jí)和農(nóng)產(chǎn)品產(chǎn)業(yè)鏈重塑等方面潛力較大。農(nóng)村電商不能直接照搬照抄成功的城市電商經(jīng)驗(yàn),由于農(nóng)村電商涉及面廣,傳統(tǒng)生產(chǎn)、加工、銷(xiāo)售對(duì)農(nóng)村電商影響較大。農(nóng)村農(nóng)產(chǎn)品市場(chǎng)沒(méi)有充分挖掘,市場(chǎng)潛力有待開(kāi)發(fā);農(nóng)產(chǎn)品服務(wù)質(zhì)量有待提升,農(nóng)產(chǎn)品溯源事業(yè)還有很長(zhǎng)的路要走。
(3)農(nóng)產(chǎn)品品牌在農(nóng)村電商銷(xiāo)售中發(fā)揮著重要作用,但全國(guó)80%的電商經(jīng)營(yíng)者沒(méi)有自主品牌,且品牌意識(shí)淡薄,已有品牌的電商經(jīng)營(yíng)者也不重視品牌維護(hù),最終導(dǎo)致銷(xiāo)量低迷,阻礙了農(nóng)村電商高質(zhì)量發(fā)展。從農(nóng)村電商大數(shù)據(jù)可知,品牌效應(yīng)是推薦農(nóng)產(chǎn)品消費(fèi)升級(jí)的直接動(dòng)力,如2019年“三只松鼠”在休閑食品電商銷(xiāo)售量占比為14.3%,消費(fèi)者黏度高;而“金龍魚(yú)”“福臨門(mén)”“魯花”在糧油電商銷(xiāo)售占比分別為5.13%、3.38%、2.57%。老品牌在電商銷(xiāo)售中依然具有一定的優(yōu)勢(shì)。大部分農(nóng)產(chǎn)品停留在低價(jià)銷(xiāo)售初級(jí)農(nóng)產(chǎn)品,缺乏產(chǎn)品的深加工、附加產(chǎn)值和高質(zhì)量服務(wù),已有的大部分品牌缺乏宣傳力度,公眾認(rèn)知度低。
根據(jù)農(nóng)村電商現(xiàn)狀,結(jié)合我國(guó)電商發(fā)展趨勢(shì)和國(guó)家對(duì)農(nóng)村數(shù)字化發(fā)展規(guī)劃,提出了農(nóng)村電商發(fā)展規(guī)劃如下:
(1)以“數(shù)字鄉(xiāng)村建設(shè)”和“鄉(xiāng)村振興”為發(fā)展契機(jī),加快完善中西部地區(qū)電商基礎(chǔ)設(shè)施建設(shè),全面推進(jìn)信息進(jìn)村入戶(hù)工程,縮小城鄉(xiāng)“數(shù)字鴻溝”,促進(jìn)東西部協(xié)調(diào)發(fā)展,完善農(nóng)村電商全網(wǎng)服務(wù)體系構(gòu)建;加強(qiáng)對(duì)貧困地區(qū)和交通欠發(fā)達(dá)地區(qū)的快遞物流體系建設(shè),推進(jìn)農(nóng)產(chǎn)品產(chǎn)業(yè)鏈的高質(zhì)量發(fā)展,提高農(nóng)產(chǎn)品在國(guó)內(nèi)外市場(chǎng)流通能力。推動(dòng)農(nóng)產(chǎn)品冷鏈流通體系構(gòu)建,創(chuàng)新、高質(zhì)量推進(jìn)農(nóng)產(chǎn)品冷鏈流通模型改革,打通農(nóng)產(chǎn)品在銷(xiāo)售和流通的“最后一公里”。同時(shí)地方政府應(yīng)在《數(shù)字鄉(xiāng)村發(fā)展戰(zhàn)略綱要》《數(shù)字農(nóng)業(yè)農(nóng)村發(fā)展規(guī)劃(2019—2025年)》文件指導(dǎo)下,大力發(fā)展農(nóng)村電商服務(wù),為農(nóng)村電商的發(fā)展?fàn)I造良好的政策體系和管理機(jī)制環(huán)境,加快數(shù)字鄉(xiāng)村發(fā)展。
(2)加強(qiáng)電商平臺(tái)發(fā)展引導(dǎo),實(shí)現(xiàn)農(nóng)村電商在農(nóng)村數(shù)字化建設(shè)中供給側(cè)結(jié)構(gòu)性改革。改變傳統(tǒng)的產(chǎn)業(yè)鏈供銷(xiāo)模式,必須從農(nóng)產(chǎn)品的生產(chǎn)端開(kāi)始,將現(xiàn)代農(nóng)業(yè)生產(chǎn)模式快速滲透到農(nóng)產(chǎn)品的生產(chǎn)過(guò)程中,充分利用電商平臺(tái)優(yōu)勢(shì)資源加快實(shí)現(xiàn)農(nóng)產(chǎn)品生產(chǎn)標(biāo)注化、現(xiàn)代化、產(chǎn)業(yè)化,重點(diǎn)解決農(nóng)產(chǎn)品在深加工、品牌打造、產(chǎn)銷(xiāo)一體化、調(diào)度智能化發(fā)展,利用物聯(lián)網(wǎng)、大數(shù)據(jù)、區(qū)塊鏈和人工智能等信息技術(shù),實(shí)現(xiàn)農(nóng)商平臺(tái)信息化管理、農(nóng)業(yè)生產(chǎn)的全數(shù)字化管理和農(nóng)產(chǎn)品全過(guò)程的可視化溯源。
(3)樹(shù)立農(nóng)產(chǎn)品名牌意識(shí),加強(qiáng)現(xiàn)有品牌的宣傳和質(zhì)量提升,地方政府應(yīng)加快實(shí)施“一村一品”建設(shè),推進(jìn)品牌提升行動(dòng),構(gòu)建中國(guó)農(nóng)產(chǎn)品品牌目錄,改善地理標(biāo)識(shí)農(nóng)產(chǎn)品認(rèn)證體系和加強(qiáng)品牌農(nóng)產(chǎn)品的推廣。發(fā)掘地方特色農(nóng)產(chǎn)品與地方特色文化的關(guān)聯(lián),提升特色農(nóng)產(chǎn)品文化和地域內(nèi)涵;提高農(nóng)產(chǎn)品品牌的附加值,完善品控管理體系,提高我國(guó)農(nóng)產(chǎn)品品牌的認(rèn)可度,不斷提升中國(guó)農(nóng)產(chǎn)品品牌在國(guó)內(nèi)外市場(chǎng)的競(jìng)爭(zhēng)力和影響力。
4 結(jié)語(yǔ)
農(nóng)村電商快速發(fā)展對(duì)改善農(nóng)產(chǎn)品產(chǎn)業(yè)結(jié)構(gòu),構(gòu)建農(nóng)產(chǎn)品現(xiàn)代化產(chǎn)業(yè)鏈具有重要的現(xiàn)實(shí)意義。全面把握農(nóng)村電商發(fā)展?fàn)顩r是政府引導(dǎo)和制定農(nóng)村電商發(fā)展政策的必要條件。為克服農(nóng)村電商數(shù)據(jù)破碎化、平臺(tái)分散化、發(fā)展不平衡等問(wèn)題,通過(guò)構(gòu)建深度壓縮和深度學(xué)習(xí)模型,完成農(nóng)村電商多源多模態(tài)大數(shù)據(jù)的采集、整合、識(shí)別、清洗、特征提取、分類(lèi)和分析等信息處理,實(shí)現(xiàn)農(nóng)村電商多平臺(tái)異構(gòu)數(shù)據(jù)的特征提取、實(shí)時(shí)處理和監(jiān)測(cè)分析,構(gòu)建農(nóng)村電商產(chǎn)品類(lèi)型、品牌、產(chǎn)地、溯源等特征庫(kù),實(shí)現(xiàn)了農(nóng)村電商大數(shù)據(jù)的深度分析和可視化;模型改善了大數(shù)據(jù)背景下跨平臺(tái)農(nóng)村電商數(shù)據(jù)收集和信息處理的能力,提升了政府對(duì)農(nóng)村電商發(fā)展現(xiàn)狀和趨勢(shì)的實(shí)時(shí)感知能力。
[參 考 文 獻(xiàn)]
[1] 農(nóng)業(yè)農(nóng)村部新聞辦公室.中國(guó)數(shù)字鄉(xiāng)村發(fā)展報(bào)告(2020年)[EB/OL].[2020-11-28].http://www.moa.gov.cn/xw/zwdt/202011/t20201128_6357205.htm.
[2] 方迎君.數(shù)字鄉(xiāng)村評(píng)價(jià)指標(biāo)體系構(gòu)建與分析[J].山西農(nóng)經(jīng),2020 (11):21-23.
[3] 文英.農(nóng)產(chǎn)品全產(chǎn)業(yè)鏈大數(shù)據(jù)建設(shè)與農(nóng)村電商的有效融合研究[J].農(nóng)業(yè)經(jīng)濟(jì),2020(9):129-131.
[4] 農(nóng)業(yè)農(nóng)村部信息中心,中國(guó)國(guó)際電子商務(wù)中心研究院.2020全國(guó)縣域數(shù)字農(nóng)業(yè)農(nóng)村電子商務(wù)發(fā)展報(bào)告[EB/OL].[2020-04-30].http://www.moa.gov.cn/xw/bmdt/202004/P020200430664543232916.pdf.
[5] 艾媒新零售產(chǎn)業(yè)研究中心.2019年中國(guó)電商半年度發(fā)展全景報(bào)告[EB/OL].[2019-08-14].https://www.iimedia.cn/c400/65720.html.
[6] 胡昌平,呂美嬌.大數(shù)據(jù)與智能環(huán)境下的情報(bào)學(xué)理論發(fā)展[J].情報(bào)理論與實(shí)踐,2020,43(10):1-6.
[7] DAHER J B,BRUN A,BOYER A.A review on heterogeneous multi-source and multi-dimensional data mining [EB/OL]. [2020-02-28]. https://hal-lirmm.ccsd.cnrs.fr/INRIA/
hal-01811232vl.
[8] 巴志超,李綱,安璐,等.國(guó)家安全大數(shù)據(jù)綜合信息集成:應(yīng)用架構(gòu)與實(shí)現(xiàn)路徑[J].中國(guó)軟科學(xué),2018(7):9-20.
[9] LAHAT D,TLAY ADAL,JUTTEN C.Multimodal Data Fusion: An Overview of Methods, Challenges and Prospects[J].Proceedings of the IEEE,2015,103(9):1449-1477.
[10] 孟凡會(huì),王玉亮,汪雷.信息碎片化下用戶(hù)痛點(diǎn)多源信息融合分析研究[J].情報(bào)理論與實(shí)踐,2020,43(7):103-108.
[11] 余輝,梁鎮(zhèn)濤,鄢宇晨.多來(lái)源多模態(tài)數(shù)據(jù)融合與集成研究進(jìn)展[J].情報(bào)理論與實(shí)踐, 2020,322(11):173-182.
[12] 元晶.多源信息融合技術(shù)及應(yīng)用發(fā)展現(xiàn)狀[J].工業(yè)經(jīng)濟(jì)論壇,2017(5):42-47.
[13] 彭冬亮,文成林,薛安克.多傳感器多源信息融合理論及應(yīng)用[M].北京:科技出版,2010:1-20.
[14] 潘泉.多源信息融合理論及應(yīng)用[M].北京:清華大學(xué)出版社,2013:15-25.
[15] 祁友杰,王琦.多源數(shù)據(jù)融合算法綜述[J].航天電子對(duì)抗,2017,33(6):37-41.
[16] 付丹,潘正軍.深度學(xué)習(xí)模型在多源異構(gòu)大數(shù)據(jù)特征學(xué)習(xí)中的應(yīng)用研究[J].電腦知識(shí)與技術(shù),2019,15(26):14-16.
[17] ATREY P K,HOSSAIN M A,EL SADDIK A,et al.Multimodal fusion form multimedia analysis:a survey[J].Multimedia Systems,2010,16(6):345-379.
[18] HAN S,MAO H,DALLY W J.Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding[J].Computer Science,2015:3-7.
[19] HINTON G E.To recognize shapes, first learn to generate images[J].Progress in Brain Research, 2007,165(6):535-547.
Multi-source and Multi-modal Data Fusion of Rural
E-commerce Based on Deep Learning
Meng Fanhui, Wang Yuliang, Wang Lei
Abstract: Deep learning algorithm DBN (Deep Belief Network) is used to realize the effective fusion of heterogeneous and multi-modal data of rural e-commerce across platforms. The information processing process has been established, in term of heterogeneous data collection, integration, recognition, cleansing, feature extraction, classification and analysis on multi-source e-commerce platform. A multi-type characteristic database has been built on the rural e-commerce products types, brand, place of origin, and tracing. The database is used for feature extraction, real-time processing, monitoring and analysis of heterogeneous data of rural e-commerce platforms. And an integration system of the nondestructive heterogeneous data fusion, information analysis and visualization, management and decision-making is formed. It improves data collection and information processing ability under the background of rural electricity cross-platform and promotes real-time perception of rural electricity business development status and trend for government affairs management and security policy decisions.
Key words:rural e-commerce; deep learning; heterogeneous data; multimodal data fusion
責(zé)任編輯:李應(yīng)青