邢城祎
在訂外賣的人群中,不同的人群所訂外賣的數(shù)量有著很大差別。本文把外賣垃圾數(shù)量一人群特點的關(guān)系和某地區(qū)月平均降水量一該地氣候類型的分類方式相類比,通過實地采集,得到外賣垃圾數(shù)量的第一手資料,并且查詢所需位置的降水量數(shù)據(jù),經(jīng)過數(shù)據(jù)清洗后,得到較為充分準(zhǔn)確的數(shù)據(jù)。同時,在分類方法上進(jìn)行深入研究,采用深層神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練對應(yīng)的降水量一氣候類型數(shù)據(jù)。通過不斷的模型設(shè)計與超參數(shù)調(diào)節(jié),使模型在降水量一氣候類型和外賣數(shù)量一人群種類兩個數(shù)據(jù)集上均達(dá)到較高的分類正確率。保存訓(xùn)練后的模型作為之后的預(yù)測,達(dá)到使用時無需訓(xùn)練,僅需輸入該地外賣垃圾數(shù)量,就能夠以較高的正確率推測該地人群特點的目的。此模型在實際應(yīng)用上可以通過外賣數(shù)量推測人群特點,從而研究更有效、更有針對性的垃圾處理方案。
一、問題背景
2016年,全國生活垃圾年清運量已經(jīng)高達(dá)20362萬噸,而其中外賣垃圾所占的比例正逐年上升。根據(jù)外賣類平臺“餓了嗎”發(fā)布的數(shù)據(jù),外賣服務(wù)業(yè)每天至少會產(chǎn)生2000萬份廢棄的一次性包裝盒、塑料袋和一次性餐具。垃圾已嚴(yán)重影響環(huán)境和人民的生活。
二、分類標(biāo)準(zhǔn)
通過調(diào)查得出以下帶有一定普適性的分類標(biāo)準(zhǔn):
1.外賣固體廢棄物
2.人群種類與所處區(qū)域
三、外賣固體廢棄物數(shù)據(jù)采集
1.采集方式
為了獲取準(zhǔn)確的第一手資料,收集數(shù)據(jù)采用寞地采集的方法。因為在垃圾收集處,外賣垃圾與其他各種垃圾混合在一起,很難準(zhǔn)確測量出僅屬于外賣的垃圾質(zhì)量。所以,我們采用單位騎手的外賣垃圾質(zhì)量乘以外賣騎手?jǐn)?shù)量作為外賣質(zhì)量的估計值。對于單位騎手外賣垃圾質(zhì)量,我們將通過模擬預(yù)定外賣來測量每位騎手所帶來的外賣垃圾質(zhì)量。
2.各人群種類所在地區(qū)外賣固體廢棄物采集方法
通過網(wǎng)絡(luò)及竇地調(diào)查,選取有代表性的人群種類所在地區(qū),確定所在地區(qū)能使外賣騎手進(jìn)入的大門數(shù)量,記錄7:30-19: 30每一個小時內(nèi)各門外賣騎手的進(jìn)入數(shù)量,準(zhǔn)確測得數(shù)據(jù)后進(jìn)行統(tǒng)一的數(shù)據(jù)匯總。
四、假設(shè)
1.假設(shè)外賣固體廢棄物僅分為如上類別,忽略其余垃圾種類。
2.假設(shè)人群種類僅分為如上類別,忽略其他人群種類。
3.假設(shè)所采集數(shù)據(jù)的地方具有強代表性,可以代表其他類似場所。
4.假設(shè)所調(diào)查的地方每日所產(chǎn)生的外賣固體廢棄物質(zhì)量相同。
5.假設(shè)模擬預(yù)定的外賣固體廢棄物質(zhì)量經(jīng)過平均計算,可以代表每位騎手所帶來的外賣固體廢棄物質(zhì)量。
五、估算每位騎手所帶來的外賣固體廢棄物質(zhì)量
為估計每位騎手所帶來的外賣垃圾質(zhì)量,我們訂了不同種類的外賣,分別稱量種類不同的固體廢棄物的質(zhì)量,經(jīng)多次稱量,得出如下數(shù)據(jù)(單位:g):
六、基于相似性的外賣一人群深層神經(jīng)網(wǎng)絡(luò)分類模型建立
1.數(shù)據(jù)采集
通過既定的方法,選取中國人民解放軍沈陽軍區(qū)總醫(yī)院、中國科學(xué)院金屬研究所、沈陽市華潤大廈、豐澤花園與某補課班實地采集數(shù)據(jù)如下(單位:輛):
2.模型建立思路
實地采集各地外賣騎手?jǐn)?shù)量,發(fā)現(xiàn)各區(qū)域的每小時外賣騎手?jǐn)?shù)量分布特點與一些氣候類型所對應(yīng)的每月平均降水量分布特點極為相似,故以相似為基礎(chǔ),將各個人群特點所處區(qū)域一一映射至如下的氣候類型:
選取典型氣候類型地區(qū):新加坡、哈爾濱、南京、烏魯木齊、新德里。收集歷史平均月降水量數(shù)據(jù)如下(單位:mm):
由此可見,區(qū)域外賣騎手?jǐn)?shù)量分布與與其相對應(yīng)的地區(qū)降水量分布十分相似,故以此為基礎(chǔ)建立模型。
3.模型目的
通過訓(xùn)練,模型能夠接受一組從7:30-19: 30每隔一小時的外賣騎手?jǐn)?shù)量,輸出五種人群特點的可信度。
4.數(shù)據(jù)收集及前期處理
(1)數(shù)據(jù)收集
從GHCN數(shù)據(jù)庫、環(huán)境云和Global Weather Data for SWAT上收集上述地區(qū)歷年的降水量數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),選取一小部分?jǐn)?shù)據(jù)作為降水量一氣候類型驗證數(shù)據(jù),將區(qū)域外賣騎手?jǐn)?shù)量作為外賣騎手?jǐn)?shù)量一人群特點驗證數(shù)據(jù)。
(2)數(shù)據(jù)前期處理
由于降水量數(shù)據(jù)與外賣騎手?jǐn)?shù)量量級并不相同。對于人眼,在觀測折線統(tǒng)計圖時,主要觀測的是數(shù)據(jù)之間的相對大小關(guān)系以及數(shù)據(jù)(y)隨時間或者月份(x)的變化趨勢。因此,為統(tǒng)一數(shù)據(jù)量級,防止深層神經(jīng)網(wǎng)絡(luò)模型出現(xiàn)學(xué)習(xí)方向的錯誤,將每個數(shù)據(jù)除以12個單位時間或者月份(x),五種氣候類型或者人群特點的總共60個數(shù)據(jù)的和,使降水量數(shù)據(jù)與騎手?jǐn)?shù)據(jù)量級相似使大部分?jǐn)?shù)據(jù)在0-1之間。
5.模型建立
此模型總共有六層,分別是:批規(guī)范層(Batch Normalization),全連接層,丟棄層(Dropout),全連接層,全連接層,批規(guī)范層。
6.模型訓(xùn)練
(1)訓(xùn)練參數(shù)
經(jīng)過多次實驗比對,此模型采用全部數(shù)據(jù)以每10個為一批(Batch)輸入至網(wǎng)絡(luò),訓(xùn)練時將全部數(shù)據(jù)完整地訓(xùn)練100次(epoch=100)的方法。將模型誤差、降水量驗證結(jié)果與外賣騎手?jǐn)?shù)量驗證結(jié)果輸出。
(2)訓(xùn)練結(jié)果
訓(xùn)練后,保存訓(xùn)練日志。使用可視化工具TensorBoard查看模型誤差,并且使用TensorBoard畫出降水量驗證結(jié)果與外賣騎手?jǐn)?shù)量驗證結(jié)果折線圖。
降水量分類正確率如下(Smoothing=0):
外賣騎手?jǐn)?shù)量分類正確率如下(Smoothing=0.9):
從圖像中得出,經(jīng)過100輪(epoch)的訓(xùn)練,降水量模型的訓(xùn)練誤差在O和02之間,降水量的分類正確率幾乎達(dá)到了100%,外賣騎手?jǐn)?shù)量的分類正確率在75%到80%之間。
(7)模型結(jié)論
基于所處地人群特點與氣候類型,所處地12個小時外賣數(shù)量與特定氣候類型月平均降水量的相似性,建立深層神經(jīng)網(wǎng)絡(luò)模型,通過不斷調(diào)整超參數(shù),得出較為完善的模型,并進(jìn)行訓(xùn)練,使得此模型滿足模型目的,即,輸入12個小時的外賣騎手?jǐn)?shù)量,可以得出一個正確率在75%到80%的人群特點。