張雷 劉昌華 石林峰 張鷹
(1.河南理工大學(xué)測(cè)繪與國(guó)土信息工程學(xué)院,河南 焦作 454000;2.自然資源部第一大地測(cè)量隊(duì),陜西 西安 710054;3.河南省現(xiàn)代農(nóng)業(yè)大數(shù)據(jù)產(chǎn)業(yè)技術(shù)研究院,河南 鄭州 450046)
煙草的種植信息在我國(guó)的生產(chǎn)管理過(guò)程中有著十分重要的作用,可以為我國(guó)的煙葉種植以及收購(gòu)提供重要的決策支持[1,2]。我國(guó)煙草的生產(chǎn)和消費(fèi)在世界上占有重要地位,但由于我國(guó)地域面積廣闊,不同地區(qū)的地形條件各不相同。傳統(tǒng)的煙草面積提取常采用人工實(shí)地調(diào)查的方法進(jìn)行,這樣不僅耗時(shí)費(fèi)力,而且人為產(chǎn)生的因素可能增大測(cè)量的誤差[3],很難實(shí)現(xiàn)對(duì)煙草進(jìn)行實(shí)時(shí)監(jiān)測(cè)。
在本原性錯(cuò)誤中,近20%的錯(cuò)誤為概念理解性錯(cuò)誤,近80%的錯(cuò)誤為數(shù)學(xué)推理錯(cuò)誤.就數(shù)學(xué)推理錯(cuò)誤進(jìn)行了訪談,結(jié)果發(fā)現(xiàn):職前教師之所以認(rèn)為昆明空氣質(zhì)量好,是因?yàn)橹饔^上認(rèn)為昆明是全國(guó)有名的空氣質(zhì)量好城市,加之計(jì)算平均數(shù)時(shí)發(fā)現(xiàn)兩者之間差異不大,所以就忽略這種差異,于是“想當(dāng)然”地推理出“心中的答案”.
隨著遙感技術(shù)的發(fā)展,因其監(jiān)測(cè)范圍大、快速成像和多波段的特點(diǎn),被廣泛應(yīng)用于作物監(jiān)測(cè)中[4-6]。相比傳統(tǒng)的依靠人工實(shí)地測(cè)量的方法,運(yùn)用遙感技術(shù)可以大大節(jié)省人力,并且可以提高其準(zhǔn)確性[7]。劉蕓等[8]采用面向?qū)ο蠓椒?,根?jù)烤煙的NDVI、光譜、紋理以及形狀等特征,提取烤煙種植信息,總體精度達(dá)91%;雷春苗等[9]利用隨機(jī)森林、支持向量機(jī)、BP神經(jīng)網(wǎng)絡(luò)、SoftMax和最大似然分類器對(duì)柴達(dá)木地區(qū)的枸杞進(jìn)行提取,幾種分類器都有著不錯(cuò)的分類精度。
近年來(lái)深度學(xué)習(xí)興起,大量學(xué)者通過(guò)深度學(xué)習(xí)的方法進(jìn)行作物分類和識(shí)別。Kussul等[10]利用深度學(xué)習(xí)方法對(duì)不同的數(shù)據(jù)進(jìn)行農(nóng)作物分類,取得了較高的準(zhǔn)確率;董秀春等[11]利用開(kāi)放的Google Earth影像結(jié)合U-net網(wǎng)絡(luò)模型,對(duì)云南省隴川縣甘蔗種植區(qū)進(jìn)行提取,總體精度達(dá)92%,面積精度為94%;陳妮等[12]利用U-Net深度學(xué)習(xí)網(wǎng)絡(luò)模型對(duì)新昌縣土地利用進(jìn)行分類,取得了較高的精度;宋曉倩等[13]利用遷移學(xué)習(xí)方法提取葡萄種植信息,較傳統(tǒng)深度學(xué)習(xí)方法準(zhǔn)確率提高了7%;李濤等[14]在imageNet數(shù)據(jù)集的基礎(chǔ)上,將模型進(jìn)行微調(diào),對(duì)玉米雄穗進(jìn)行識(shí)別,證明深度學(xué)習(xí)方法在作物特征識(shí)別中的良好表現(xiàn)。
洛寧縣具有良好的生態(tài)環(huán)境,非常適合煙草的生長(zhǎng),煙草的種植一直處于洛陽(yáng)市前列,成為當(dāng)?shù)氐闹е援a(chǎn)業(yè),也是當(dāng)?shù)厝嗣衩撠氈赂坏闹匾窘?jīng)之一??焖贉?zhǔn)確地掌握煙草的種植分布和面積等情況是政府決策部門的當(dāng)務(wù)之急[15]。
實(shí)驗(yàn)的硬件CPU為英特爾Xeon E5-1620v4@3.20GHz,GPU為NVIDIA Quadro M2000。TensorFlow后端的Keras深度學(xué)習(xí)框架實(shí)現(xiàn)U-net模型的搭建與實(shí)驗(yàn)行每一個(gè)特征點(diǎn)的分類。Keras自帶的生成器不支持多波段,所以自己編寫(xiě)實(shí)現(xiàn),并對(duì)U-net網(wǎng)絡(luò)添加BN層和Dropout 層,優(yōu)化器選用Adam,損失函數(shù)為交叉嫡函數(shù)。
高分二號(hào)(GF-2)衛(wèi)星是我國(guó)自主研制的首顆空間分辨率優(yōu)于1m(星下點(diǎn)全色分辨率0.8m)的民用光學(xué)遙感衛(wèi)星,在作物識(shí)別、建筑物識(shí)別、礦山遙感監(jiān)測(cè)、林業(yè)監(jiān)測(cè)等方面有著廣泛的應(yīng)用[17]。
研究區(qū)位于河南省洛陽(yáng)市洛寧縣,全縣面積2306km2,位于E111°08′~111°49′,N34°05′~34°38′。地形地貌總體呈“七山二塬一分川”,生態(tài)環(huán)境良好,全縣耕地面積約8.67萬(wàn)hm2,適宜種煙面積達(dá)3.73萬(wàn)hm2。本研究實(shí)驗(yàn)區(qū)選擇洛寧縣小界鄉(xiāng),該鄉(xiāng)連續(xù)7a被洛寧縣政府評(píng)為“煙葉生產(chǎn)先進(jìn)鄉(xiāng)鎮(zhèn)”,連續(xù)4a被洛陽(yáng)市政府評(píng)為“煙葉生產(chǎn)先進(jìn)鄉(xiāng)鎮(zhèn)”[16]。
U-net是一個(gè)優(yōu)秀的語(yǔ)義分割模型,如圖1所示。U-net網(wǎng)絡(luò)主要分為上采樣和下采樣部分,下采樣也就是主干特征提取網(wǎng)絡(luò),利用主干部分,獲得5個(gè)初步有效特征層;在加強(qiáng)特征提取網(wǎng)絡(luò)部分,對(duì)獲得的特征層進(jìn)行上采樣,并進(jìn)行特征融合,進(jìn)而得到一個(gè)融合所有特征的有效特征層;利用預(yù)測(cè)網(wǎng)絡(luò),對(duì)獲得的融合所有特征的有效特征層進(jìn)行每一個(gè)特征點(diǎn)的分類。
結(jié)合當(dāng)?shù)馗黝愖魑锏奈锖颍?月左右煙草與其它作物最易區(qū)分,因此本研究使用高分二號(hào)衛(wèi)星PMS傳感器在2020年7月7日的洛寧縣區(qū)域的5景遙感影像,數(shù)據(jù)來(lái)源于中國(guó)資源衛(wèi)星應(yīng)用中心(www.cresda.com/CN/)[18]。其中,4景用來(lái)制作深度學(xué)習(xí)訓(xùn)練樣本,1景用來(lái)煙草信息的提取。另外,利用無(wú)人機(jī)拍攝的小范圍高分辨率影像,集思寶實(shí)地調(diào)查記錄煙草地塊空間位置信息數(shù)據(jù),輔助后期樣本標(biāo)簽的制作。
利用ENVI 5.3對(duì)原始影像進(jìn)行輻射定標(biāo)、大氣校正、正射校正和影像融合等預(yù)處理操作。并通過(guò)Arcgis軟件結(jié)合無(wú)人機(jī)、集思寶數(shù)據(jù)對(duì)煙草地塊進(jìn)行標(biāo)注。用于制作深度學(xué)習(xí)訓(xùn)練標(biāo)簽。
通過(guò)ENVI 5.3對(duì)高分二號(hào)原始影像進(jìn)行數(shù)據(jù)預(yù)處理,將包含較多煙草的區(qū)域剪切出來(lái),并利用ARCGIS進(jìn)行煙草樣本的標(biāo)注,如果直接將圖像輸入到深度學(xué)習(xí)網(wǎng)絡(luò)中,會(huì)導(dǎo)致內(nèi)存溢出,因此需要將影像剪切成合適的小塊,本研究通過(guò)python腳本對(duì)影像和標(biāo)簽圖像進(jìn)行隨機(jī)裁剪,生成大小均為256×256的衛(wèi)星圖像和標(biāo)簽圖像。因樣本數(shù)量有限,為了避免訓(xùn)練過(guò)程中出現(xiàn)過(guò)擬合現(xiàn)象,需要對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù)增強(qiáng)[19]。將裁剪處理后的原始影像和標(biāo)簽圖像進(jìn)行水平翻轉(zhuǎn)、豎直翻轉(zhuǎn)以及對(duì)角翻轉(zhuǎn),樣本擴(kuò)充到2000張。按照7∶3的比例將樣本分類訓(xùn)練集和驗(yàn)證集。
由表2可以看出,大學(xué)生之所以選擇貸款,絕大部分原因是為了補(bǔ)貼生活費(fèi).提前消費(fèi)是選擇貸款的一個(gè)主要推動(dòng)力,消費(fèi)欲望則是選擇貸款的另一大推動(dòng)力.隱藏在校園貸中的一個(gè)主要問(wèn)題是大學(xué)生盲目消費(fèi),不能合理支配資金.在調(diào)查的520個(gè)學(xué)生中,有123個(gè)大學(xué)生使用過(guò)校園貸.在使用過(guò)校園貸的學(xué)生中,有56.10%的大學(xué)生貸款金額在1 000元以內(nèi),貸款金額1 001~5 000元的占20.32%,5 001~10 000元的占10.57%,有13.01%的大學(xué)生竟貸款達(dá)到了1萬(wàn)元以上,遠(yuǎn)遠(yuǎn)超過(guò)了他們的承擔(dān)能力.這表明當(dāng)代大學(xué)生存在很多不考慮自身情況及后果的個(gè)體,缺少前瞻性.
在模型訓(xùn)練時(shí),為控制網(wǎng)絡(luò)的穩(wěn)定性,初始學(xué)習(xí)率設(shè)置為1×10-4,通過(guò)Adam優(yōu)化器計(jì)算損失值相對(duì)于網(wǎng)絡(luò)參數(shù)的梯度,將參數(shù)進(jìn)行反向傳播,進(jìn)而降低損失值[21]。設(shè)置迭代次數(shù)50次,給訓(xùn)練模型設(shè)置回調(diào)函數(shù),在val_loss連續(xù)10輪不下降則訓(xùn)練停止,當(dāng)3個(gè)epoch過(guò)去而val_loss不下降,學(xué)習(xí)率減半。訓(xùn)練后繪制的loss和acc曲線如圖2、圖3所示,可以看出,訓(xùn)練集和驗(yàn)證集有很好的擬合效果。在進(jìn)行40個(gè)epoch的時(shí)候,曲線開(kāi)始趨于穩(wěn)定,損失值在0.02左右波動(dòng)。說(shuō)明學(xué)習(xí)率設(shè)置較為合理,損失函數(shù)實(shí)現(xiàn)快速收斂,可見(jiàn)U-net網(wǎng)絡(luò)對(duì)煙草數(shù)據(jù)集進(jìn)行了有效的學(xué)習(xí)。
圖1 U-net網(wǎng)絡(luò)模型
為了評(píng)價(jià)模型在煙草提取中的性能,本研究對(duì)測(cè)試結(jié)果進(jìn)行準(zhǔn)確率(P)、召回率(R)和F1值等評(píng)價(jià)[20]。計(jì)算公式:
(1)
(2)
(3)
從目前的大學(xué)生就業(yè)形勢(shì)來(lái)看,就業(yè)形勢(shì)嚴(yán)峻并不是工作崗位少,而是工作崗位的匹配度不高,市場(chǎng)上所需的人員和職業(yè),市場(chǎng)營(yíng)銷占據(jù)了大多數(shù)。但大學(xué)生的就業(yè)觀念還是停留在傳統(tǒng)的觀念上,認(rèn)為政府機(jī)關(guān)、國(guó)企、銀行、大公司、外資企業(yè)的職業(yè)是金飯碗,希望到這類地方就業(yè),可是,大學(xué)生喜歡的就業(yè)部門都存在不同程度的減員增效和機(jī)構(gòu)合并,崗位十分有限,相比之下就顯得就業(yè)難度較大。此外,由于大學(xué)生剛出校門,沒(méi)有技術(shù)經(jīng)驗(yàn)和資金積累,要想進(jìn)行創(chuàng)業(yè)就要突破許多障礙,但難度較大,成功率較低。即使成功后,由于門檻低、技術(shù)性不強(qiáng)等原因也會(huì)被市場(chǎng)淘汰。
當(dāng)前建筑企業(yè)管理在工作開(kāi)展過(guò)程中并沒(méi)有嚴(yán)格按照《企業(yè)會(huì)計(jì)準(zhǔn)則》等相關(guān)文件的指導(dǎo)來(lái)開(kāi)展壞賬準(zhǔn)備工作。建筑企業(yè)過(guò)度追求產(chǎn)品銷售的利益,在進(jìn)行賒銷銷售款收回過(guò)程中,其清算工作并沒(méi)有按時(shí)開(kāi)展,對(duì)應(yīng)的資金收回工作也受到影響。同時(shí),工作人員并沒(méi)有及時(shí)與供貨方取得聯(lián)系,隨著時(shí)間的推移,建筑企業(yè)收回資金的可能性逐漸下降。在這種情況下,購(gòu)貨單位對(duì)還款工作的重視程度也會(huì)逐漸下降,不斷地延遲還款,導(dǎo)致建筑企業(yè)的壞賬率逐漸提高。
(2)35歲(含 35歲)以下護(hù)理人員,調(diào)查中顯示來(lái)自學(xué)習(xí)方面的壓力很少,說(shuō)明這一年齡段的人員希通過(guò)學(xué)習(xí)來(lái)提高自己,針對(duì)這個(gè)特點(diǎn),工會(huì)可結(jié)合自身的“一活動(dòng) 一工程”等活動(dòng)開(kāi)展一系列的職工技能競(jìng)賽和培訓(xùn);
因?yàn)榫W(wǎng)絡(luò)上并沒(méi)有公開(kāi)的煙草數(shù)據(jù)集,本研究使用自己制作的數(shù)據(jù)集對(duì)初始網(wǎng)絡(luò)進(jìn)行訓(xùn)練,輸入的圖像大小為256×256尺寸,將數(shù)據(jù)集按7∶3劃分為訓(xùn)練集和驗(yàn)證集輸入到訓(xùn)練網(wǎng)絡(luò)中。
式中,TP表示樣本的真實(shí)類別是正類,并且模型識(shí)別的結(jié)果也是正類的數(shù)量;FP表示樣本的真實(shí)類別是負(fù)類,但是模型將其識(shí)別為正類的數(shù)量;FN表示樣本的真實(shí)類別是正類,模型將其預(yù)測(cè)為負(fù)類的數(shù)量。
進(jìn)行基層區(qū)隊(duì)腐敗治理的過(guò)程當(dāng)中,還需要做好第四步的工作,凸顯出論劍的效果。不斷健全相應(yīng)的監(jiān)督管理制度,以達(dá)到應(yīng)有的目的。具體而言,第一,應(yīng)該對(duì)企業(yè)員工工資與獎(jiǎng)金的分配流程予以優(yōu)化和嚴(yán)格管控,通過(guò)組織開(kāi)展相應(yīng)的會(huì)議,同時(shí)將會(huì)議的內(nèi)容予以公開(kāi),形成規(guī)范化的審批模式,要求員工親自在工資表上簽字,維護(hù)好職工的利益。第二,注重基層區(qū)隊(duì)文書(shū)的管控。依靠構(gòu)建相應(yīng)的業(yè)績(jī)考察、溝通互動(dòng)以及腐敗治理等相關(guān)機(jī)制,達(dá)到一定的約束與管控的效果[4]。
圖2 U-net訓(xùn)練集和驗(yàn)證集loss曲線
圖3 U-net訓(xùn)練集和驗(yàn)證集acc曲線
利用訓(xùn)練好的模型對(duì)待分類影像進(jìn)行預(yù)測(cè),在預(yù)測(cè)過(guò)程中,如果直接將影像輸入到模型中會(huì)造成內(nèi)存的溢出。所以,一般將圖像裁剪成較小的圖像分別輸入到模型中進(jìn)行預(yù)測(cè),然后再將預(yù)測(cè)結(jié)果按順序拼接起來(lái)。如果采用常規(guī)的規(guī)則網(wǎng)格裁剪,最后預(yù)測(cè)拼接的效果并不是很好,會(huì)有明顯的拼接痕跡。因此,采用忽略邊緣預(yù)測(cè),有重疊地裁剪影像,在拼接時(shí)再采用忽略邊緣的方法進(jìn)行拼接。
將預(yù)測(cè)結(jié)果與標(biāo)注后的真實(shí)煙草標(biāo)簽圖像進(jìn)行精度評(píng)價(jià),原始圖像和人工目視標(biāo)注的標(biāo)簽圖像以及預(yù)測(cè)結(jié)果圖像如圖4~6所示,將預(yù)測(cè)結(jié)果與實(shí)際標(biāo)注的結(jié)果進(jìn)行精度評(píng)價(jià),取得了90.68%的精確率和92.87%的召回率。綜合評(píng)價(jià)指標(biāo)F1值為91.76%。
圖4 原始圖像
為了進(jìn)一步驗(yàn)證本文所使用的U-net網(wǎng)絡(luò)模型的有效性,使用其它常用的分類模型進(jìn)行煙草提取并進(jìn)行精度對(duì)比。從圖7可以看出,KNN、Decision Tree和Random Forset模型的準(zhǔn)確率分別為87.68%、83.65%和89.21%,相比之下,U-net網(wǎng)絡(luò)模型的準(zhǔn)確率比其它模型平均高出3.8%。
圖5 人工目視標(biāo)簽圖像
圖6 U-net網(wǎng)絡(luò)預(yù)測(cè)圖像
圖7 各分類模型煙草提取準(zhǔn)確率
以上結(jié)果表明,U-net神經(jīng)網(wǎng)絡(luò)模型在少量訓(xùn)練樣本的時(shí)候,依舊可以取得很好的信息提取效果。
本研究使用U-net神經(jīng)網(wǎng)絡(luò)模型,實(shí)現(xiàn)了對(duì)煙草種植的提取,對(duì)于沒(méi)有公開(kāi)的煙草數(shù)據(jù)集的情況,通過(guò)實(shí)地調(diào)查結(jié)合目視解譯制作深度學(xué)習(xí)訓(xùn)練標(biāo)簽。通過(guò)與其它常用分類模型進(jìn)行精度對(duì)比,U-net在少量數(shù)據(jù)集的情況下,表現(xiàn)出良好的性能。
相關(guān)研究還有待深入,需解決面積漏分的問(wèn)題,需進(jìn)一步提高訓(xùn)練樣本的多樣性和優(yōu)化網(wǎng)絡(luò)模型;不同煙葉種植地區(qū)地形各不相同,本文只對(duì)洛寧縣山區(qū)進(jìn)行煙草面積提取,后續(xù)可在擴(kuò)大數(shù)據(jù)集的基礎(chǔ)上,開(kāi)展不同地形情況下煙草種植面積提取研究,并進(jìn)一步探究U-net網(wǎng)絡(luò)模型的普適性。